?

國外數字資源長期保存發展歷程

2010-07-12 08:08賀姝祎中國科學院上海天文臺圖書館上海200030
圖書館理論與實踐 2010年6期
關鍵詞:數字信息出版商數字化

●賀姝祎 (中國科學院 上海天文臺圖書館,上海 200030)

1 數字信息資源長期保存問題得到關注

1991年,5個北歐國家的檔案館(瑞士、挪威、丹麥、芬蘭、冰島)就電子文件的保護與存取問題進行了調研,并在此基礎上出版了《電子文件的存取與保護》一書。1994年歐洲保存與獲取委員會(ECPAEuropeanCommissiononPreservationandAccess) 成立,它是研究數字信息長期保存與獲取的最大跨國協會,旨在共同研究各種類型文獻的檢索能力以及信息保護問題。目前加入該組織的國家共有41個,其成員為歐洲大學、圖書館、檔案館及出版界等部門的著名學者、專家。[1]

1992年3月,澳大利亞國家圖書館主辦了“澳大利亞已記錄的文化遺產的存取”的全國會議。這次會議對電子格式文獻長期存取進行了研討與回顧。1993年12月,澳大利亞檔案館、澳大利亞圖書服務信息委員會、澳大利亞國家保護辦公室與澳大利亞電影錄音檔案館共同組建保護數字信息存取工作組PADI,其主要目標是指導電子文本的保護與管理,保護數字信息存取和國家數字信息的調研,制定信息存取與保護的原則、策略等。

1994年12月,美國保護與存取委員會(CPACommission on Preservation&Access)與美國研究圖書館組織(RLG)共同組建了數字歸檔特別工作組,其主要任務是負責對以數字格式存貯的信息的長期存取問題進行調研,并對其保護措施提出建設性意見。特別工作組的人員來自產業部門、博物館、檔案館、圖書館、出版界、學術界與政府等部門。主要有:國家農業圖書館、國會圖書館、密歇根大學圖書館、研究圖書館小組、國家檔案館、密歇根大學信息學院、加利福尼亞大學、哥倫比亞大學、耶魯大學、約翰·霍布金斯大學、CyberVillage有限公司、IBM研究中心、美國物理協會、貝爾實驗室、版權許可中心、OCLC等單位。

2 數字信息資源長期保存標準和規范的制定

隨著數字資源長期保存引起各國廣泛關注而不斷開展相關標準和規范的制定也取得了成果。

1990年,隸屬于NASA(美國國家航空航天局)的 CCSDS (Consultative Committee for Space Data Systems)空間數據系統咨詢委員會應ISO的要求,承擔起了制訂長期保存數字數據檔案標準的任務。1997年,NASA最先提出OAIS Open Archive Information System“空間數據的開放檔案信息系統概念模型”的理論模型。1999年5月,CCSDS發布了OAIS參考模型草案《Reference Modelfor an Open Archival Information System(OAIS)》,它被作為ISO國際標準的一個草案被寫進了1999年7月的新版本中,2002年1月,出版在了ISO藍皮書CCSDS 650.0-B-1版本中,現已正式成為ISO標準ISO 14721:2003。[2]這個標準可應用于任何檔案館或者圖書館適用于所有文獻類型。

此參考模型定義了一個數據保存的總體框架,包括應具備的功能、統一的概念和術語等等。此框架適用于所有致力于長期保存數字資源并提供利用的系統和組織從而為很多組織包括政府部門和數字圖書館采用。2003年,OAIS最終成為ISO標準并頒布。標準的研制,對開展數字資源長期保存實踐起到了很好的規范和引導作用。

3 數字資源長期保存實踐性項目

近年來,數字資源長期保存領域經歷了理論研究到個體實驗再到最佳實踐、機構聯合的發展歷程,研究內容不斷拓展和深入,吸引了國際上越來越多的機構參與。較為成熟的數字資源長期保存項目已有l0多種(見表1),可概括為三種主要組織模式:機構獨立保存模式、第三方委托保存模式、合作保存模式,見表2。

表1 國際數字資源長期保存項目一覽表

表2 數字資源長期保存三種模式之比較

3.1 機構獨立保存模式

機構獨立保存是由保存機構在擁有對被保存資源的使用權的條件下,獲得相關權利人(如出版商)許可后進行長期保存,被保存資源的服務范圍也大都限定在保存機構內的原有用戶。[3]

(1)大英圖書館。1993年,大英圖書館提出了建立數字化圖書館的目標,其內容包括:增加數字形式出版物的保存;為讀者提供網絡和數字化服務;利用數字化技術保存和修復館藏等。1999年,大英圖書館成立專門團隊,旨在保存一切數字資源,2000年9月和IBM公司將共同建立全國性的數字化圖書館,并提供數字資料的保護和訪問。大英圖書館主要將傳統館藏數字化,同時還以開發珍貴館藏資源為重點。最著名的項目之一便是將已有1000年歷史的著名史詩《貝奧武夫》的原稿進行了數字化處理。該稿在遭受天災人禍之后已經有點模糊,后經特制的高分辨率數碼相機使其以數碼形式再現,為各種資料的數字化奠定了基礎。這點為我國公共圖書館進行館藏數字化提供了寶貴的經驗。該數字圖書館的藏品包括根據館藏資料制成的文字、聲音和圖像的數字化文件。[4]

(2) 加利福尼亞大學 DPR項目。DPR(Digital Preservation Repository) 是加利福尼亞大學數字保存倉儲項目,它是加利福尼亞大學圖書館數字保存計劃的重要組成部分。DPR是支持對數字對象長久保存的一系列服務,它將在授權用戶和可信賴的、長期存儲系統之間提供受控的、有序的保存和利用機制。[5]目前,DPR的數據存儲量是925GB,大約有15萬個數據對象。加利福尼亞大學圖書館數字保存計劃的目標是:保持能夠對所選擇的研究和教學過程中產生的數字信息長期存取。為達到這一目標,該計劃已經著手開發由DPR和其他工具組成的基于公認標準的基礎結構體系,以支持學術信息的識別、獲取、描述、組織和持久管理等。

(3) e-Depot數字存檔系統。KB(KoninklijkeBibliotheek)是荷蘭國家圖書館的e-Depot數字存檔系統,由荷蘭國家圖書館與IBM公司合作開發,它是一套完全自動化的數字資源保存系統,長期穩定地存儲著國際上主要出版商的電子期刊。該系統于1993啟動,其戰略目標是:確保國際性電子期刊的長期使用,降低數據永久性丟失的風險,在服務被中斷后可以作為后備服務,及時提供資源中不再有商業價值的期刊的訪問權,防止數字資源格式過時,保存沒有后續出版機構的期刊。1995與Elsevier、荷蘭出版商協會開始項目合作,2002與Elsevier出版社簽署存檔協議,目前該系統主要保存世界范圍內8個著名出版商的資源。[6]

3.2 合作保存模式

基于保存規模、相關技術、管理機制、法律權限等多方面因素的考慮,一些文獻機構較傾向于合作保存模式,即由多家機構共同承擔長期保存任務,各成員通過合作實現保存風險和保存成本的分擔。

(1) LOCKSS項目。LOCKSS(Lots of Copies Keeps StuffSafe) 多備份資源保存項目,由美國Stanford大學圖書館于1999年發起并組織實施,得到美國國家自然基金、Sun Microsystems Inc以及AndrewW.Mellon基金支持,主要致力于解決數字資源的永久保存與利用問題。LOCKSS系統最初創建運行在斯坦福大學一個由低端計算機組成的網絡上。它通過建立出版商與圖書館、圖書館與圖書館之間的協作平臺,提出了從電子資源出版、發布到永久性保存與利用等一整套解決方案。[7]圖書館獲得出版商授權后,可以利用LOCKSS工具在本地創建一個低費用、永久保存的數字化信息緩存站點,實現對訂購電子信息的采集、本地存儲、管理以及用戶服務等功能。LOCKSS還包括圖書館之間的協作,即建立聯盟圖書館間資源共享與協作機制,實現本地資源的動態更新、損壞修復、丟失補遺等功能,保證資源的完整性及永久有效性。[8]通過該項目,用戶可對多種格式的數字化資源,如PDF、HTML、JPEG、TIF等格式,進行可靠、穩定、長期地保存和利用。

LOCKSS系統保存的數字資源主要是內容具有權威性的連續電子出版物,包括電子期刊、報紙、政府文件等類型的資源。2004年Springer與LOCKSS建立了合作關系,牛津大學出版社等一批著名學術出版社相繼成為LOCKSS聯盟的成員。2005年英國皇家物理學會(IOP)的第一本可長期保存的期刊《NewJournal ofPhysics》通過LOCKSS系統發布。目前已經有20多個國家的157家機構在使用LOCKSS的BOXES軟件,8個出版商正式加入LOCKSS聯盟。目前我國加入該聯盟的機構主要有中國科學院文獻情報中心、清華大學、香港大學、香港中文大學、香港理工大學。

(2)NDIIPP項目。2000年12月美國國會通過法案(PublicLaw106-554),決定由國會圖書館領導實施國家數字信息基礎設施和保存計劃(NDIIPP National Digital Information Infrastructure and Preservation Program)。國會圖書館承擔主要管理職責,并與美國重要政府部門及相關數字內容收藏機構合作,同時鼓勵廣大民營機構參與。這些機構包括:商務部、白宮科技政策辦公室、國家檔案和記錄管理中心、OCLC等。NDIIPP的戰略目標是:建立一個由權責明確的合作伙伴聯合組成的國家網絡,以保障對豐富數字內容的長期獲取。目前,NDIIPP保存的數字信息類型為:地理空間數據 (Geospatial data)、網站信息 (Web sites)、電視節目信息(Television)、社會科學數據(Social science datasets)、電子雜志(E-Journals)、歷史資料(Historicalmaterials)。截至2008年底,NDIIPP建立的數字保存合作網絡已經吸引了來自全國各地130余個伙伴成員加入。NDIIPP試圖有選擇地保存電子圖書、電子期刊、數字電視、數字錄像、網站等6種媒體類型的信息,其所關注的有關數字保存的關鍵性問題主要包括知識產權、數字信息的采集與選擇、數字信息保存計劃的經濟可持續性以及數字保存的技術結構等。[9]

(3) EMANI:為數學出版物的長期電子存儲提供支持的合作項目。2002年2月“數學文獻電子文檔網絡”EMANI(Electronic Mathematics Archiving Network Initiative)研發的國際合作項目正式啟動,該項目由德國發起,得到美國康奈爾大學圖書館、德國哥廷根大學圖書館、法國MathDoc聯盟、中國清華大學圖書館、德國主要的數學學會、Springer-Verlag出版社等機構的共同參與。該項目旨在為成員館和內容提供商建立一個合作性的框架,以管理不斷增長的數字備份文件和數學類電子出版物,推動世界范圍內數學領域的出版物數字化,建立一個統一的數學資料存儲和發布平臺,以滿足高校圖書館和學術性團體的需要,不僅要確保數字資源得到長期的、穩定的保存,還要支持全球用戶檢索及全文瀏覽。資料來源主要為Springer-Verlag、 Birkhaeuser Verlag、 Teu-bner Verlag、ViewegVerlag和theELibMinEMIS出版物。[10]

3.3 第三方委托存儲

由于長期保存在技術和操作方面的復雜性,任何一個圖書館所配備的人力、物力、財力都無法維持數字資源的長期保存,基于這種需求第三方保存應運而生,它是由資源提供方(如出版商) 與資源采購方(如圖書館)以外的第三方機構承擔委托保存職責的模式,通常由大型數據中心或商業機構或大型圖書館提供第三方保存服務,[11]目的是共同承擔經費開支,共同發展市場,合作行動,從而提供更廣泛的數字資源服務。

(1)Portico電子存儲項目。第三方委托存儲模式中最具代表性的是Portico。該項目由JSTOR過刊數據庫和The LibraryofCongress共同主持,獲得安德魯·梅隴基金會(The AndrewW.Mellon Foundation) 的資助,同時也通過向參與項目的數據庫出版商和圖書館收取年費的形式獲得經費。Portico主要致力于運用第三方委托存儲模式為商業化的數字學術資源提供長期存儲服務。通過直接與出版商、圖書館簽訂保存許可協議,Portico一方面從出版商那里獲取源文件,把不同的文件轉換成標準的、可長期使用的存儲格式;另一方面Portico為圖書館保存其所采購的數字資源并在突發條件下為其提供數字資源的訪問權。到目前為止已有44個數據庫商,9個國家的377個圖書館加入了Portico項目,保存文章數目達到13619643篇(截止到2009年9月17日)。Elsevier2008年與Portico達成合作協議,即Portico協助Elsevier在線STM平臺Science Direct處理其電子圖書保存問題。此協議將確保Science Direct電子圖書內容未來的長期保存。Portico是唯一一個同時保存Elsevier電子圖書和全部期刊回溯文檔的存儲庫。由于數字資源的提供和使用存在許多不可預知性,當圖書館無法從數據庫商和其他地方獲得信息時,Portico為所有提供存儲支持的圖書館開放內網的訪問權。[12]

(2) AHDS項目。英國的藝術人文數據服務AHDS(Art s and Humanities Data Service) 成立于1996年,為JISCJoint Information Systems Committee、AHRBArts and Humanities Research Board兩個機構共同成立,致力于藝術人文領域數字資源的搜集、保存及推廣,從而促進數字資源教育研究。[13]由AHDS聯合相關機構進行的數字保存研究,從數字信息生命周期的角度提出了數字保存綱要(Guidelines for Digital Preservation:DraftDataPolicyFramework)。AHDS下面還有一個視覺藝術資料服務中心(The Visual Arts Data Service,VADS)。VADS通過互聯網提供視覺藝術數字資源的研究、學習及教育,并且使得這些資源能夠長久保存。[14]它的任務包括:①對其下屬的學科子項目制定技術標準;②提供檢索途徑并負責妥善保管;③促使高校在科研、教學活動中有效地利用這些學術性檔案資源。[15]

4 國內研究進展及其對策

我國數字資源長期保存的研究開始于20世紀末,各種研究著眼于數字資源長期保存過程中所涉及的政策、法律、技術、管理等多種因素。同時,部分文獻機構,尤其是高校開展了數字資源長期保存的嘗試,最具代表性的有:中國國家圖書館的網絡信息資源保存試驗項目,CALIS的學位論文持久保存實踐,清華大學圖書館參與的數字資源長期保存系統的研究與開發項目以及“大學數字博物館建設工程”等項目,都從不同方面對數字資源長期保存加以實踐。

然而,我國數字資源長期保存起步較晚,在相關技術、法律權限、運作機制、經費投入機制、人才培養機制等諸多方面尚待探索和完善,因此多數文獻機構對于數字資源長期保存還存在顧慮,并持觀望態度。文獻機構需借鑒國外的成熟經驗和成果,針對國內實際情況,可從以下幾方面入手:

(1)制定完善的公共投入機制,明確數字資源長期保存所需經費來源。

(2)制定相應人才培養機制,確定培訓對象,包括:對圖書館現有工作人員和大學相關專業學生進行系統的教育和培訓;將數字資源長期保存納入大學教育;制定相應的學位培養模式,培養專業人才,不斷提高圖書館人的信息素質。

(3)建立相對健全、統一的法律授權、管理策略、技術標準、保存政策、資源保存的選取標準。

(4)加強文獻機構間的協調、合作,建立統一的戰略聯盟,通力合作,可以避免重復建設,降低成本,共同解決數字資源長期保存所帶來的挑戰,規避單獨建設所面臨的高投入和高風險。

[1]http://www.knaw.nl/ecpa/.[2009-09-10].

[2]胡星火.基于OAIS的數字信息長期保存研究[D].南京:南京航空航天大學,2008.

[3]王松林.一個基于OAIS和DC的保存元數據方案[J].圖書館學刊,2005(1):1-3.

[4]張玫,等.中國圖書館數字文獻資源長期保存現狀調查[J].圖書情報知識,2009(3):47-51,59.

[5]張月萍編譯.大英圖書館的開創性入網工程——發展電子圖書館項目[J].江蘇圖書館學報,1998(2):51-52.

[6]http://www.bl.uk/aboutus/stratpolprog/ccare/introduction/digital/digpresstrat.pdf.[2009-09-10].

[7]國外數字圖書館如何用開源 [EB/OL].[2009-05].http://www.media.edu.cn/.

[8]http://www.kb.nl/hrd/dd/index.html.[2009-10-10].

[9]吳振新,等.LOCKSS數字資源長期保存策略[J].現代圖書情報技術,2006(2):35-39.

[10]賓鋒.電子期刊長期保存模式LOCKSS和Portico比較研究[J].情報探索,2009(5):63-65.

[11]http://catalog.loc.gov/cgi-bin/Pwebrecon.cgi.[2009-10-10].

[12]http://www.digitalpreservation.gov/news/events/ndiipp_meetings/ndiipp09/index.html.[2009-09-12].

[13]http://conference.las.ac.cn/Sino-German/2004/pdf/cn/26.pdf.[2009-09-12].

[14]http://www.portico.org/.[2009-09-17].

[15]http://en.wikipedia.org/wiki/Arts_and_Humanities_Data_Service.[2009-12-14].

[16]任平編譯.數字資源長期保存研究在英國[J].現代圖書情報技術,2005(3):66-69.

[17]王浩.牛津文檔中心開展AHDS計劃的實踐對我國語言類高校檔案數字化的啟示[J].檔案與建設,2008(6):26-28,25.

猜你喜歡
數字信息出版商數字化
家紡業亟待數字化賦能
基于BIM的企業數字信息歸檔與利用模式研究
北京尚水數字信息產品介紹
高中數學“一對一”數字化學習實踐探索
數字有形狀嗎?數字信息精確性和品牌標識形狀的匹配效應*
高中數學“一對一”數字化學習實踐探索
數字化制勝
數字信息時代圖書館職業權利缺失與回歸路徑
各行各業
2006年國際消費類雜志調查
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合