?

停止接收非電子檔案:單套制數字檔案館

2020-10-21 08:21范志強趙屹
蘭臺世界 2020年2期
關鍵詞:應用系統數字檔案館

范志強 趙屹

摘 要?2017年8月,美國國家檔案館宣布2022年底前將停止接收各聯邦機構移交的非電子檔案。未來的美國國家檔案館將演變為單套制數字檔案館。其數字檔案館核心系統ERA建設內容包括兩個中心、三個實例、四大功能,2015年啟動的ERA 2.0使用便捷方法開發三個主要模塊。ERA提高了聯邦政府文件處理與歸檔效率,改進了檔案管理,簡化了檔案利用,提升了電子檔案保存支持。ERA給予我們的啟示是單套歸檔,檔案館將不再接收紙質檔案等非電子檔案,這是人類社會檔案存史方式的重大改變。單套制的數字檔案館是一套復雜的系統,集成了多樣化的檔案管理功能與系統運行支持功能。系統必須不斷升級、與時俱進。

關鍵詞 數字檔案館 單套制 應用系統 敏捷方法 ERA

中圖分類號 G270.7/G271 文獻標識碼 A 收稿日期 2019-09-28

★作者簡介:范志強,大連市檔案館檔案技術保護部副部長,檔案學本科,研究方向為檔案信息化;趙屹,國防大學政治學院教授,管理學博士,研究方向為檔案信息化、檔案法規標準。

Abstract In August 2017, the National Archives of the United States announced that it would stop receiving non-electronic records handed over by federal agencies by the end of 2022. The future US National Archives will evolve into a single-set digital archives. ERA, the core system of the single-set digital archives, consists of two centers, three examples and four functions. ERA 2.0 launched in 2015 uses agile methods to develop three main modules. ERA improves the processing and archiving efficiency of federal government documents, enhances archives management, simplifies archives utilization, and promotes the storage support of electronic archives. The enlightenment that ERA gives us is the single-set archives. The archives will no longer accept non-electronic records such as paper records, which is a major change in the way of keeping human social archives history. The single-set digital archives is a complex system that integrates a variety of archives management functions and system operation support functions. The system must be constantly upgraded and kept up to date.

Keyword digital archives; single-set system; application system; agile methods; ERA

2017年8月,美國國家檔案館宣布2022年底前將停止接收各聯邦機構移交的非電子檔案[1]。一石激起千層浪,這個極富“進取性”的檔案管理戰略引發廣泛關注。事實上,該戰略的實現離不開配套的技術與政策的實施,其中重要的實現措施就是ERA(Electronic Records Archives,電子檔案館)項目的建設。從本質上看,ERA就是一個完成電子檔案歸檔和管理的單套制數字檔案館。

一、ERA項目的建設背景

美國國家檔案館與檔案局(National Archives and Records Administration,簡稱NARA)在20世紀末發現他們面臨電子檔案管理的挑戰。其挑戰主要表現在以下三方面。一是歸檔電子文件數量急劇增長。美國國家檔案館自1970年接收第一批簡易數據庫和ASCⅡ碼檔案開始接收電子文件進館,預計到2022年,進館電子文件總量將達35萬TB。二是電子檔案種類繁多,格式復雜。不僅有傳統檔案的電子化形式文件,還有電子郵件、CAD圖形文件、網頁文件、計算機數據文件、數字式錄音文件、數字式視頻文件等。三是傳統檔案管理政策不能適用于電子檔案管理。例如在一場涉及美國總統電子郵件刪除案中,NARA作為被告之一被法院裁決為“允許了聯邦機關對文件進行不適當的銷毀。法官要求NARA要立即采取行動,……制訂一個管理電子郵件的新準則”[2]。與之類似,眾多電子檔案管理準則的制訂被提上議事日程。

在此背景下,NARA自1998年起,開始投入啟動資金研究電子檔案的保存與管理問題。2000年,ERA項目管理辦公室成立。2002年,提出ERA系統需求。2005年,正式宣布由美國洛克希德·馬丁公司承擔ERA系統的開發。投資預算為3.08億美元,預計開發時間為六年。2008年,ERA系統開始接收和存儲來自白宮、國會和聯邦政府機構的電子檔案。2011年9月,ERA系統投入實際使用。2015年,NARA認為ERA系統“在可靠性、可擴展性、可用性和成本方面存在諸多問題”[3],于是啟動ERA 2.0進行系統升級。ERA 2.0于2020年全面實施。

二、ERA項目的內容

ERA項目基于開放檔案信息系統(Open Archival Information Systems,簡稱OAIS)的功能模型進行總體設計,其工作內容如圖1[4]所示,可概括為兩個中心、三個實例、四大功能。此外,ERA 2.0還要建設三個模塊。

1.兩個中心。ERA項目建設了“兩個中心”,即數據中心(Data Center)和系統運營中心(Systems Operation Center)。數據中心主要實現圖1中的存儲。系統運營中心提供圖1中的移交工作平臺和利用工作平臺。

2.三個實例。ERA項目部署了三個實例(Instance)。ERA目標是針對不同類型檔案保存其流程與檔案。為此,針對在不同規則下管理的各類檔案,ERA通過單獨的實例來實現某種類型檔案的保存。ERA部署的三個實例分別是:聯邦檔案實例(Federal Records Instance,簡稱Base Instance),主要負責處理和保存從聯邦政府機構獲取的電子檔案;總統行政辦公室實例(Executive Office of the President Instance,簡稱EOP Instance),主要負責檢索和訪問從美國總統行政辦公室獲取的電子檔案;國會檔案實例(Congressional Records Instance,簡稱CRI Instance),主要負責保存從國會(包括眾議院和參議院)獲取的電子檔案。由圖1可見,三個實例分別對應聯邦機構、總統、國會三類檔案形成者。目前,對于捐贈的電子檔案還沒有相應實例進行接收和管理。

3.四大功能。ERA項目實現四大功能[5]。一是元數據功能。用于記錄檔案的歷史價值、責任者、創建原因、處理過程。二是移交功能。政府機構使用該功能向ERA移交檔案和元數據。該功能對應于圖1移交工作平臺的內容,包括讀取數字介質、接收在線移交、驗證移交、描述檔案、轉變檔案格式。三是存儲功能。實現檔案的保存與復查。該功能對應于圖1存儲的內容,包括存儲館藏數據,存儲電子檔案初始格式并保持電子檔案的持續存儲。四是利用功能。社會公眾使用該功能利用和訪問非受控的檔案信息。該功能對應于圖1利用工作平臺的內容,包括查找檔案、呈現檔案、生成特定版本、鑒定敏感內容、編纂敏感檔案等。對于受控檔案,有單獨的、非公開的利用功能。

4.ERA 2.0的三個模塊。在兩個中心、三個實例、四大功能的基礎上,ERA 2.0的愿景是使用敏捷方法(Agile Methods)開發三個主要模塊(Modules)重構和增強已有的ERA系統。ERA 2.0的三個主要模塊如下。

數字處理環境(Digital Processing Environment,簡稱DPE)模塊。它更新了原有的工作流管理,是可擴展且靈活的環境,支持上傳所有類型的數字資料,具有各種可擴展的用于驗證和處理的軟件工具,提供創建和編輯元數據的功能。NARA檔案管理員可選擇不同的軟件工具處理各種數字檔案,將處理過的數字檔案包提交給DOR(參見下文)保存,并通過NARA的國家檔案目錄(National Archives Catalog,簡稱NAC)訪問。

數字對象存儲庫(Digital Object Repository,簡稱DOR)模塊。它是可擴展且安全的存儲庫,用于對ERA系統中存儲的數字對象實現長期保存和訪問。DOR支持從DPE獲取處理過的數字檔案,對其進行安全的檔案存儲,提供高級查找和發現功能,也可以向DPE提供數字檔案以進一步處理。

業務對象管理(Business Object Management,簡稱BOM)模塊。它是一個安全、靈活的應用程序,用于管理業務對象的保管期限表、移交、保管等主要流程[6]。

上述三個模塊的功能通過集成多種微應用實現。三個模塊相互獨立,其中任何一個模塊更新不會影響ERA的整體功能。由此,ERA具有可拓展性。

三、ERA項目實現的數字檔案館功能

1.提高了聯邦政府文件處理與歸檔效率。ERA為聯邦機構提供在線工具,用以創建新的檔案保管期限表并將其提交給NARA。經NARA在線審核后,根據審核通過的保管期限表向NARA所轄檔案館移交永久的電子檔案。ERA改進了向檔案館移交永久檔案的過程和記錄,填寫移交目錄、移交文據審核、電子檔案移交均可通過BOM模塊在線完成,由此提高了聯邦政府機構文件處理與歸檔的效率。

2.改進了檔案管理。ERA的檔案管理功能允許處理權限、被該處理權限所涵蓋的檔案移交要求、實際移交檔案之間自動鏈接。這意味著電子檔案會根據來自檔案保管期限表的一個預置移交信息,與一組豐富的、自動關聯的起源元數據共同歸檔。由此,在數字環境下實現了檔案根據保管期限表進行歸檔,實現了檔案與元數據的關聯,從而改進了檔案管理。

3.簡化了檔案利用。目前,這部分功能主要體現在總統檔案利用部分??偨y行政辦公室實例的檔案管理組件支持對受限內容和受限編纂的審查功能。檔案館對通過審查的總統電子檔案可以根據《信息自由法案》在達到開放條件時向公眾發布。

4.提升了電子檔案保存支持。ERA支持檔案長期保存。檔案館當前政策是以移交時的格式保存檔案。除此之外,也以遷移操作創建的新版本的格式保存檔案。

ERA支持檔案相關信息保存。ERA將一個標準的基本XML元數據目錄與PREMIS(Preservation Metadata: Implementation Strategies,保存元數據:實施戰略)保存元數據體系的元素結合在一起,用于保存元數據。

基于以上四項功能,ERA的目標是獲取美國聯邦政府機關、總統、國會產生的各種類型和格式的電子文件,將其以單套制形式作為電子檔案永久保存,并為將來保存新類型檔案做準備??朔r空障礙為具有合法利用權限的政府部門及社會公眾提供利用,確保在軟硬件過時的條件下仍可以對電子檔案進行持續訪問和驗證。ERA 2.0最終將為電子檔案提供端到端的生命周期覆蓋。當前ERA已積累了500 TB的電子檔案[7]。就其功能可以看出,ERA在數字環境下保存美國聯邦機構的歷史,就是一套單套制數字檔案館的應用系統。

四、ERA項目的啟示

1.單套歸檔。單套歸檔是指ERA完全實現電子檔案的歸檔而不必同時歸檔對應的紙質檔案。而且,由于ERA的實施,美國國家檔案館2022年底前將停止接收紙質檔案等非電子檔案。這是檔案管理的巨大變革,也意味著人類社會檔案存史方式的重大改變。這一點向我們展示了數字檔案館未來的一種發展趨向。當前,我國電子文件歸檔實施“雙套制”管理策略,即只要歸檔電子文件,必須同時歸檔對應紙質文件,其中紙質檔案發揮憑證價值,電子文件發揮參考價值。雙套制在從紙質時代向數字時代的過渡階段有其積極的意義,它最大限度地保證了檔案的憑證價值的留存。但ERA也讓我們看到了數字時代檔案工作未來發展的趨向之一。

技術給信息記錄帶來的根本性變化會不斷改變檔案工作。2016年11月17日,上海浦東新區召開上海自貿試驗區電子文件歸檔和電子檔案“單套制”管理復制推廣會,上海自貿試驗區在全國率先施行電子檔案“單套制”。同年,國家檔案局聯合國家發展改革委遴選33家單位開展企業電子文件歸檔和電子檔案管理試點工作,試行電子文件單套制歸檔管理。2018年12月,《電子公文歸檔管理暫行辦法》進行修訂,將第七條由“電子公文形成單位必須將具有永久和長期保存價值的電子公文,制成紙質公文與原電子公文的存儲載體一同歸檔,并使兩者建立互聯”,修訂為“符合國家有關規定要求的電子公文可以僅以電子形式歸檔。電子公文歸檔應當符合電子文件歸檔和電子檔案管理的要求”,從法規上為單套制的施行提供了可能。由此可見,電子文件的單套歸檔是檔案管理隨時代發展的趨勢之一。

2.系統復雜。系統復雜是指ERA提醒我們,單套制數字檔案館是一套復雜的系統。ERA最初設計是完成一個可以做所有事情的大系統。但進行到現在,ERA成為一個“系統之系統”,集眾多系統于一體。如前所述,針對不同檔案類型,ERA部署了聯邦檔案實例、總統行政辦公室實例、國會檔案實例三個實例,其收管的檔案各自具有獨特需求和專用存儲格式。除此之外,利用不同的檔案也需要使用不同的檢索訪問系統。例如,總統行政辦公室實例中包括檢索功能,可以查找和訪問從美國總統行政辦公室獲取的電子檔案。但要檢索和訪問聯邦政府的檔案,需要分別使用在線公共利用(Online Public Access,簡稱OPA)系統和涉密ERA(Classified ERA,簡稱CERA)系統分別檢索開放和涉密檔案。

ERA項目系統復雜的特點提示我們,在建設數字檔案館時,若要實施單套制管理,一定要將數字檔案館管理對象調研全面。在當前,檔案管理還是傳統文件檔案處理方式的延續,不同的檔案有可能需要不同的系統來管理。筆者認為,如果數字檔案館能通過一個系統解決所有問題,那表明其建設已經達到相當高的層次。

3.功能集成。因為ERA系統復雜,因此集成了多樣化的檔案管理功能與系統運行支持功能。ERA的初始設計具有超過1400項復雜的功能和監管要求[8]。然而,在2011年系統實施時,只實現了系統65%的功能[9],與前端系統對接、格式自動識別、數據遷移等功能未能完全落實。ERA最初的功能設想是單一系統解決方案,到ERA 2.0則改為模塊化的微應用和工具組件。這些微應用與工具組件可以是內部開發的,也可以是商業化的或開源的。它們既相對獨立、可復用,在技術快速變化、出現新的業務需求、處理新型檔案格式時又可被取代。微應用和工具組件還必須與NARA的其他工具和系統互操作,通過API(Application Programming Interface,應用程序接口)交換元數據和數據[10]。

由此,ERA通過前文所述的敏捷方法,結合微應用技術架構集成與整合多樣化的功能,實現各種功能的模塊化、組件化。其所有功能被分解為多個獨立設計、開發、運行、升級的微應用和工具組件,它們之間通過API進行交互并實現集成。

ERA項目功能集成的模式給我們數字檔案館建設提供了一種新的思路。目前,我國的數字檔案館建設多數是單一系統解決方案,ERA的敏捷方法與微應用技術架構更快捷、更靈活,相對降低成本,而且具有更好的可擴展性。

4.與時俱進。與時俱進是指ERA的建設并沒有一次性地“畢其功于一役”,而是不斷地升級改造。2005年,當NARA宣布由洛克希德·馬丁公司承擔ERA系統的開發時,設想的就是花3.08億美元、用六年的時間開發一個滿足1400余項功能的系統。然而,到了2015年,NARA不得不啟動ERA 2.0對系統進一步升級。ERA的花費也大大超出預算。在2011年系統實施時,花費已經飆升到4.33億美元[11]。

ERA系統的升級并不是NARA主動作為的結果,而是因為電子文件單套制歸檔的復雜度遠遠超出預期,同時技術還在不斷發展。NARA為了適應改變并滿足新需求、利用新技術而被迫自我修正。ERA 2.0的與時俱進主要體現為更新功能、采用敏捷方法以及基于云架構。更新功能與采用敏捷方法前文均有所述,在此主要闡述基于云架構。

ERA 2.0基于云架構主要源于兩點原因。一是外因。2010年云計算概念剛剛開始興起,美國聯邦政府就推出“云優先”戰略。NARA及時響應并發布標準《云計算環境下檔案管理指南》[12],開始將檔案存儲向云端遷移。二是內因。在線歸檔的便捷性導致檔案館接收電子檔案的體量迅猛擴大,本地存儲能力不斷告急,云存儲從經濟性、災備能力方面考慮是不錯的選擇。ERA 2.0的存儲構想是對聯邦機關已經存儲在云中的電子文件直接在云端進行歸檔移交。

NARA啟動ERA 2.0的關鍵驅動因素之一是認識到電子檔案管理系統必須具備靈活性,從而在面對發展和變化時,具備足夠的可變方法去支持對各種電子檔案的管理和保存[13]。這啟示我們,在數字檔案館建設過程中應用系統必須包含靈活簡便的自動化處理,并包容未來可能的管理需求,具備良好的可拓展能力。

參考文獻

[1]郭彩虹. 美國國家檔案館強勢推進檔案“無紙化工程”[EB/OL].[2019-09-16].https://www.zgdazxw.com.cn/news/2017-10/18content_207859.htm.

[2]傅華.美國電子文件管理的十年官司及啟示[J].中國檔案,2000(6).

[3][6]Office of Inspector General & National Archives. NARAs Electronic Records Archives 2.0 Project[EB/OL].[2019-09-10].https://www.archives.gov/files/oig/reports/audit-report-17-AUD-15.pdf.

[4]Thibodeau Kenneth. A Dynamic Solution for Electronic Records: The National Archives and Records Administration's Electronic Records Archives[EB/OL].[2019-09-16].http://ecommons.library.cornell.edu/bitstream/1813/3699/1/Ken_Thibodeau-NARA.pdf.

[5]NARA. ERA Status and Accomplishments[EB/OL].[2019-09-16]. https://www.archives.gov/era/about/status-accomplishments.html.

[7]NARA. About ERA[EB/OL].[2019-09-16].https://www.archives.gov/era/about.

[8][10][13]Leslie Johnston.ERA2.0: The National Archives New Framework for Electronic Records Preservation[J].Proceedings of the Association for Information Science and Technology,2017 (1):197.

[9][11]Anonymous. More Problems for NARA's ERA[J].Information Management,2011 (3):17.

[12]NARA標準.Guidance on Managing Records in Cloud Computing Environments [S].NARA bulletin 2010-05,2010.

猜你喜歡
應用系統數字檔案館
數字檔案館建設對檔案管理體制的影響分析
淺議企業數字檔案館建設
企業計算機應用系統可靠性測試技術探討
臺灣數位典藏計劃對內地數字檔案發展的啟示
VB應用技術下電教管理系統
高職學院信息化建設中面臨的問題和思考
基于微信公眾平臺的應用系統開發模式研究
企業云平臺建設研究
基于Enterprise Library的數字檔案管理系統設計
鄭州市網格化管理信息保障模式研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合