?

關于我國數字信息資源長期保存問題研究

2014-04-10 12:41張于軍郝春梅
山東商業職業技術學院學報 2014年5期
關鍵詞:數字信息數字資源

張于軍 郝春梅

( 山東社會科學院文獻信息中心,山東 濟南 250014 )

圖書檔案工作

關于我國數字信息資源長期保存問題研究

張于軍 郝春梅

( 山東社會科學院文獻信息中心,山東 濟南 250014 )

數字信息資源長期保存是近幾年國內外關注的熱點問題。本文結合國內外研究現狀與進展,客觀地分析了我國數字信息資源長期保存所存在的問題,提出了我國數字信息資源長期保存需要采取政策推進、完善管理體系、構建技術支撐體系等發展策略,對我國數字信息資源長期保存的實踐具有重要的現實指導意義。

數字信息資源;長期保存;對策

計算機技術和網絡技術的迅速發展,改變了紙質文獻信息資源的單一性,帶來了數字信息資源的海量涌入,人們把數據數字信息資源定義為“未來的新石油”。在這一背景下,如何正確有效的保存和開發數字信息資源已引起各國的關注。本文擬通過在對數字信息資源長期保存的前期研究成果進行梳理的基礎上,結合國際上數字信息資源長期保存的研究現狀,了解數字信息資源長期保存的理論知識、技術支撐以及實踐經驗,對其關鍵問題進行思考,發現我國數字信息資源長期保存存在的不足,找到其長期保存的正確路徑,為保留更多有用的文化遺產做出貢獻。

一、國內外對數字信息資源長期保存的研究現狀及措施

(一)目前國外學者對數字信息資源長期保存的研究現狀

數字信息資源長期保存是隨著數字信息資源積累到一定程度而發展起來的。早在20世紀80年代已被提出,但是90年代才引起人們的普遍關注。數字信息資源長期保存研究經歷了從認識不足到重視、從基礎理論研究到和實踐相結合的發展過程,研討內容不斷深入和拓展,吸引了國際上越來越多的機構與專家參與。

國外數字信息資源長期保存問題研究起步較早。早在1996年5月,RLG(Research Library Group,研究圖書館小組)和CLIR (Council on Library and Information Resources ,圖書館與信息資源委員會)等機構就發布了“保存數字信息:最終報告建議”。該建議全面闡述了數字時代數字信息資源保存所存在的問題與挑戰,并從多角度提出了對數字信息資源保存[1]的建設性建議。隨后專門討論數字信息資源保存問題的《國際數字保存雜志》(The International Journal of Digital Curation)的發行和有關國際討論會召開,數字信息資源長期保存研究受到各機構和學者的參與和關注。一些研究機構對數字信息資源長期保存標準、可信任數字信息資源存儲庫的屬性規范、數字保存元數據、機構存儲的理念等,進行了廣泛探討并通過制定數字信息資源長期保存政策、指南與規范,有力地推動世界范圍內數字信息資源保存活動的開展。

在技術方面獲得長足進步。OAIS 參考模型、數字保存軟件與工具,比如,DSpace、Fedora(the Flexible Extensible Digital Object and Repository Architecture,靈活可擴展的數字對象與存儲架構)、Greenstone 數字圖書館軟件、Digital Library Software、BEP(The Berkeley Electronic Press, 伯克萊電子出版)、DAITSS(The Dark Archive in the Sunshine State,秘密檔案的公開)等,都為各個數字信息資源保存機構結合自身的保存需要與保存對象的特點開展數字信息資源長期保存[2]提供了充足的技術支持。

世界各國對數字信息資源長期保存和開發問題高度重視。一方面積極舉辦國際會議解決數字信息資源長期保存過程中出現的問題。如自2003年由中國科學院和國際圖書館電子信息聯盟倡議并推動“數字資源保存國際會議”(The International Preservation,IPRES)成為一年一度的國際性系列會議。并在不同國家像中國、德國、北美、英國、美國、奧地利、新加坡、加拿大等國家舉辦?,F已舉辦10屆。另一方面,通過國家立項進行研究,美國、英國、德國、澳大利亞等國就數字信息資源長期保存問題給予立項研究。以國家范圍的保存網絡也逐漸興起,同時,少數國家范圍、組織間的保存網絡也向跨國保存網絡不斷發展。[3]

(二)我國對數字信息資源長期保存的研究及采取的措施

我國對數字信息資源長期保存的研究稍晚于國外,始于上世紀末,雖然與國外相比, 我國對數字信息資源長期保存問題的研究仍處于起步階段,但是,隨著數字信息資源的使用日益普遍和在長期使用過程中所產生的矛盾日益突出,數字信息資源長期保存的重要性和必要性在我國也逐漸得到重視,在數字信息資源長期保存的研究中也取得了一定的成績, 現階段主要以跟蹤、吸收、消化國外研究成果為主,自主創新還有待提高。

從理論研究層面,國內學者主要從理論概念、影響因素、技術策略和管理策略這四個方面對數字信息資源長期保存的問題集中開展了理論研究。并對數字信息資源長期保存的定義從不同角度進行了界定, 如:有學者從數字信息資源保存技術、方法和設備等方面來探討概念范疇;還有學者從資源規劃、資源配置和技術使用等方面來界定其內涵。目前對其較為認同的是:數字信息資源長期保存主要涉及兩個方面,一是防止數字信息資源被非法變更與破壞,另一個是維護數字信息資源長期的真實性。即數字信息資源長期保存是指為保證數字信息資源可長期維護以及內容可長期獲取的必要管理活動。許多同仁還從政策、媒體、技術、法律、管理和經濟因素等方面著重對數字信息資源長期保存進行了研究,技術策略和管理策略兩方面是數字信息資源長期保存的主要策略。除此之外,許多專家還從風險管理、成本管理、知識產權、法律標準等方面進行了探討。像臧國全《數字資源遷移風險管理》、曾怡《數字資源長期保存的成本與管理因素分析》、旻蘇等人《數字資源長期保存的標準與法律問題綜述》、宛玲、張曉林《數字資源長期保存過程中的知識產權問題分析》等,為我國數字信息資源長期有效保護起到積極作用。

從技術層面,在實踐上我國相繼啟動了國家圖書館的WICP 項目和北京大學主持的中國Web信息博物館項目。在1995年國家檔案局檔案科學技術研究所,發布的《CAD 電子文件光盤存儲、歸檔與檔案管理要求》和《電子文件歸檔與管理規范》兩個國家標準基礎上,我國采取自主創新和廣泛交流合作兩種途徑,對數字信息資源長期保存技術進行了探索。我國相繼啟動和開展的研究項目有:

國家圖書館的 WICP 網絡信息資源采集與保存試驗項目,即網絡信息資源采集與保存試驗項目 ( WICP) 和網絡數據庫導航項目 ODBN( Online Database Navigation)。[4]北京大學主持開發的 Web 信息博物館項目研究,建立了中國網頁歷史信息存儲與展示系統,包括歷史網頁存儲系統和回放系統兩個部分。

中科院國家科學圖書館進行的數字資源持久保存國際合作試驗項目(CSDL 項目)、數字化科技信息資源長期保存體系與政策機制(NSDL 項目)、網絡信息資源保存的理論與方法研究。[5]還有清華大學圖書館的數字信息資源長期保存系統、CALIS 的學位論文的持久保存實踐等。

在與國際學者與機構交流與合作項目上主要有:2007年國家圖書館加入了IIPC全球互聯網典藏聯盟,獲得支持開展研發和交流活動;中國科學院科學圖書館參與的數字信息資源持久保存國際合作試驗項目 LOCKSS 研究;中德數字信息資源長期保存實踐研究項目。再有組織間的跨國保存網絡也在不斷發展, 如Planets、 Inter PARES及籌建中的 DARIAH等。[6]

二、我國在數字信息資源長期保存中存的問題

(一)對數字信息資源長期保存的認識不足

數字信息資源是近20多年來由于計算機的普及和互聯網的迅速發展而產生的新興事物,由于其發展速度之快,信息資源數量之巨大,使人們應對這突如其來的強大勢頭在思想上還沒有做好充足的準備。

我國對數字信息資源長期保存的研究起步相對較晚,規模較小。雖然世界各國學者早在20世紀90年代就已經涉足對數字信息資源長期保存的研究,而我國21世紀以來才受到理論界的廣泛關注,其關注機構也僅限定在圖書館、情報信息中心等文獻信息服務單位,出版界、軟硬件商乃至數據庫生產商等與其相關的機構則介入甚少, 同時,也沒有完全得到政府的充分重視與支持,這反映了在我國數字信息資源長期保存問題并沒有引起全社會的廣泛關注與重視,在一定意義上,甚至一些隸屬信息管理專業部門也缺乏對數字資源長期保存的意識。

數字信息資源長期保存是一項艱難而又十分必要的系統工程,它涉及政策、經濟、法律、技術等多個方面。與紙質文獻信息資源的特性不同,數字信息資源具有對設備的依賴性、本身的復雜性、載體的非直讀性、安全性、穩定性、數量大、增長快、更新頻繁等特性,數字信息資源長期保存沖擊著傳統的文獻信息資源保存,對保存思路和保存理論都提出了新的挑戰,對保存對象、保存主體、保存方法等都需要進行新的全方位的審視和思考。

(二)數字信息資源長期保存研究重理論,輕實踐

我國數字信息資源長期保存研究雖然經歷了10多年的歷程,在廣大學者的不斷努力下取得了長足的發展,但是縱觀這些研究成果,不難看出理論研究較多,技術實踐研究較少,即紙上談兵多,實際行動少。

據統計1999年至2012年,我國學者在學術期刊上發表的關于數字信息資源長期保存的論文共計219篇,從百度上可以搜到與“數字信息資源長期保存”相關結果約高達300萬個。這些論文大都停留在對數字信息資源長期保存的理論研究上,雖然論文涉及的內容豐富、范圍廣泛,囊括了經濟、政策、法律、標準、安全、知識產權等各個方面的基本理論,但是真正對數字信息資源長期保存中涉及的技術問題、實踐活動等相關問題可謂鳳毛麟角。這不難看出我國學者在對數字信息資源長期保存研究過程中只注重紙上談兵,并沒有結合對數字信息資源長期保存的研究理論有效的和相關技術部門合作,把理論研究轉換為實踐應用活動。

(三)數字信息資源長期保存啟動項目數量少、范圍小

我國現階段尚缺乏對數字信息資源長期保存的戰略規劃,數字信息資源長期保存的公共責任和公共投入機制尚未建立,啟動項目只注重在某個特定范圍內的保存,涉及范圍小,保存數量有限。開展項目的機構,也僅限于國家圖書館、北京大學、清華大學、中國科學院等知名機構,各省、市、自治區到目前為止還沒有啟動任何與數字信息資源長期保存有關的項目,與民間的合作項目也就無從談起。

雖然,我國相繼開展了國家圖書館的WICP項目、清華大學圖書館參與的數字資源長期保存系統、CALIS 的學位論文的持久保存實踐、“大學數字博物館建設工程”、中國科學院科學圖書館學術期刊資源長期保存示范系統等有效的實踐項目。但是這些項目和浩如煙海的數字信息資源相比只能說是滄海一粟,這遠遠解決不了大量的數字信息資源的長期保存。大數據時代對數字信息資源的需求更加迫切,數字信息資源需要連續性、持久性,需要長期保存的支持,全面啟動和開展數字信息資源長期保存項目是大數據時代必須和緊迫的任務。

(四)缺乏關于數字信息資源長期保存的相應政策

經過10多年的努力,我國在數字信息資源長期保存研究中雖然在理論上和實踐上都有著顯著的成績,但這只是圖書界和相關專業人士在做努力,真正納入國家研究體系的更是寥寥無幾。

數字信息資源長期保存需要政治、經濟、法律、管理、安全、技術、標準等相應的政策支持,這些政策需要國家和政府制定與其相應的規范,特別是在當今的大數據時代,國家和政府更需要盡快建立和完善數字信息資源長期保存體系,制定相應的保存政策,為數字信息資源長期保存項目的啟動提供保障,以保證數字信息資源長期保存研究和項目啟動。但至今,我國還沒有關于加強數字信息資源長期保存的相應政策,建立數字信息資源長期保存體系也就無從談起,因此也大大的制約了數字信息資源長期保存的研究和項目啟動。

三、我國數字信息資源長期保存的對策建議

在不斷的試驗、探索、研究和創建過程中,人們認識到, 孤立、封閉的研究和創建方式很難滿足對數字信息資源的長期保存,也不利于開發利用的大量需求,必須對數字信息資源長期保存的發展政策,管理標準,技術保障和安全維護等方面來做深入的探討,為此我們建議:

(一)制定完善的數字信息資源長期保存的政策

在數字信息資源長期保存工作中政府不僅是監督者,更應該是參與者與支持者。數字信息資源長期保存需要國家的政策支持,有關機構應協助政府盡快創建數字信息資源長期保存的責任機制, 制定數字信息資源長期保存的相關政策,為數字信息資源長期保存提供重要依據,并且要加強對數字信息資源長期保存的宣傳力度,提高國人對數字信息資源長期保存的意識, 使人們從思想上認識數字信息資源長期保存的重要性,最主要的還是要在經濟上提供必要的經費支持,來保證數字信息資源長期保存項目的順利進行。同時還要調動各機構團體的積極性,讓整個社會加入到數字文化遺產的保護中來。

完善知識產權保護體系。知識產權保護法為文獻信息資源提供了版權保護制度,有效地保護了文獻信息資源。但對于新興的各種數字信息資源來說, 版權保護也是重中之重。數字信息資源還屬于新興事物,其版權法尚未建立,只是參照紙質文獻版權法執行。而在現實生活中,數字信息資源的版權權屬狀況十分復雜,由于數字信息資源的發布、存貯、傳播、利用的載體與傳統紙質文獻信息資源截然不同,一部作品可能涉及多個版權人,有些甚至是匿名的,有的由于版權已經轉讓,由此知識產權的無形性難以考證,這就給版權處理帶來了更大的難度。版權問題是數字信息資源長期保存過程中面臨的最大法律障礙。因此,應加快步伐創建科學的數字信息資源版權保護機制,制定完善的數字信息資源長期保存的法律法規,使數字信息資源在長期保存和有效利用過程中有法可依。

逐步建立數字信息資源長期保存的規范,制定統一標準政策。數字信息資源長期保存過程中,要確定一個基本的存檔系統功能,必須對其概念、術語和參考框架等制定統一的標準,實現數字信息資源長期保存的統一化、規范化、標準化。確立數字信息資源長期保存的國家標準,制定科學的數字信息資源長期保存規范,才能使數字信息資源在保存過程中對保存內容、保存格式、保存載體等方面做到完整統一。

(二)創建完整的數字信息資源長期保存管理體系

數字信息資源的長期保存要從整體上進行規劃、組織和控制,制定有針對性的網絡采集政策,形成一套完整的管理體系,是數字信息資源長期保存的基礎與保障。

首先,界定“保存什么”的范疇。建立數字信息資源長期保存管理體系的依據是“保存什么”,最好的保存方案就是制定統一的選擇標準。許多專家認為數字信息資源長期保存的基本選擇標準是首先保存那些容易丟失的、與未來生產活動有關聯的、有重要參考價值的、有重要科學數據的數字信息資源,特別是“原始數據”。因此, 容易丟失的、有重要價值的、科學的“原始數據”是重點選擇目標。數字信息資源的長期保存的內容選擇還要從各方面、多角度進行考慮 如:類型、壽命、價值、標準等。還要考慮中國特色,對反映我國政治、經濟、文化等諸方面的重大事件進行長期保存,使中華民族的文化遺產得到應有的妥善保存和保護。

其次確立保護主體?!霸趺幢4妗?、“誰來保存”是數字信息資源長期保存的基礎,數字信息資源長期保存必須起始于數字信息資源生命周期的初始階段,[7]根據不同的需求采用不同的保存策略,各級圖書館要對數字信息資源提供長期獲取的服務, 國家圖書館則必須承擔保存本國數字文化遺產的責任,肩負建立國家數字信息資源存檔庫的重任。[7]圖書館、檔案館、博物館等文獻信息機構雖然擔負著數字信息資源長期保存的責任, 另外,信息內容的制造者、數據生產商、出版商等一些有關的機構甚至一些有特殊作用的個體也應該擔負起保存數字信息資源的責任,進而逐步建立起全國系統的、全方位的數字信息資源長期保存的網絡體系。

再次加強相互聯系與合作。建立數字信息資源長期保存管理體系相互合作是重要的組成部分。數字信息資源長期保存不僅是文獻信息機構的職責,出版商、數字信息內容的制造者等相關機構與個體也應承擔相應的責任。實施有效的數字信息資源的長期保存體系,不僅要有文獻信息機構之間的相互合作,還要有數字信息資源的生產者、提供者、傳播者等之間的相互合作,更要有國與國之間的相互合作。只有通過相互合作才能完成數字信息資源長期保存過程中的選擇、甄別、審核、提交、加工、保存等多個環節。因此,建立不同層次的合作機制, 控制、協調和開發數字信息資源,嚴格按照合作協議完成各自的工作任務。施行統一管理,提高使用效率,確保數字信息資源長期保存和有效利用。

(三)建立數字信息資源長期保存的先進技術支持體系

數字信息資源長期保存最重要的是建立一套完整的數字信息資源長期保存的關鍵技術。因此,注重與相關學科、交叉學科相結合,以圖書館學、情報學、信息科學為理論依據,利用計算機、網絡技術平臺,開發和研制各種先進的數字信息資源長期保存技術,為加強數字信息資源長期保存提供必要的技術保障。

建立通用的數據庫平臺,利用數字信息資源轉換技術,在通用數據庫平臺上,應用通用轉換軟件對不同時期數字信息資源進行轉換,將不同格式、不同類型的各種文件轉換成通用的兼容性強的純文本格式文件, 實現純文本格式轉換,從而達到數字信息資源的通用性和長期保存,以確保數字信息資源的完整、保密和長期保存。

充分運用先進技術,建立云存儲平臺體系。云存儲平臺比較通俗的可以理解為云計算服務商有N多服務器和存儲設備,用信息技術將其整合為一種提供存儲服務的平臺。近幾年云存儲技術正在興起,它是云計算技術的一個延伸,傳統的存儲設備 已經不能滿足大數據時代對數據保存的高性能、高容量、易擴展的需求。而云存儲的服務模式憑借其低成本,大容量、高帶寬的優勢與傳統的存儲設備相比,具有更容易擴容、更易于管理、成本更加低廉、數據更加安全、服務不會中斷的優勢。同時還可以不受時間和空間的限制,在任何時間、任何地方,通過任何可連網的設備連接到云存儲平臺上方便地存取數據。云存儲不僅僅是一個硬件,而是一個網絡設備、存儲設備、服務器、應用軟件、公用訪問接口、接入網、和客戶端程序等多個部分組成的復雜系統。[8]更重要的是云存儲采用的是目前最新技術,能夠滿足大數據時代要求的千金良方,是未來存儲技術的必然趨勢。

(四)完善數字信息資源長期保存的安全維護

數字信息資源由于傳播載體是互聯網, 互聯網又是一個全面開放的大眾系統,無法確保信息環境絕對安全,又由于數字信息資源具有共享和易于擴散等特點,因此在處理、存儲、傳輸和使用過程中很容易被干擾、濫用或出現遺漏和丟失,甚至被竊取、篡改、冒用和破壞,加之受計算機病毒感染之虞無時不在,隨時威脅著網絡環境,這給數字信息資源安全造成很大隱患,完善數字信息資源長期保存的安全維護勢在必行。

首先,數字信息資源在網絡上進行傳輸, 其安全性很難得以保證,必須制定與數字信息資源和網絡安全有關的法律法規,采用法律、法規手段,建立安全管理標準和規則。為數字信息資源長期保存的安全提供法律保障。

其次,制定訪問控制策略,主要包括網絡訪問控制,操作系統訪問控制,應用系統和信息訪問控制。避免信息系統的非授權訪問,數字信息資源安全技術措施中的第一道大門就是用戶認證,其目的是通過認證讓用戶了解其職責和義務,提供訪問控制和不可抵賴的作用。加強管理監視系統訪問和使用,要定期檢測未授權的活動,確保數字信息資源的安全。

再次,信息安全保密措施,利用技術手段建立數字信息資源安全管理體系,對各類網絡數字信息資源進行加密保護。加密是信息安全應用中開展最早的有效手段之一,數字信息資源在通過存取和傳送的過程中使用加密保護可以保證信息內容不被非法查看、篡改和竊取。大數據時代人們在享用現代信息技術帶來的快捷、方便的同時,如何充分防范數字信息資源的損壞和泄露,通過加密手段加強信息保密措施,最終目的就是保護數字信息資源的保密性,真實性和完整性。

總之,在“三分技術,七分數據,得數據者得天下”大數據時代的今天,數字信息資源長期保存直接影響著我國的政治、文化、科技和經濟等各方面。所以完善數字信息資源長期保存與長效利用策略,促進數字信息資源長期保存工作的有效開展,為人類的長遠利益,保留更多的數字文化遺產,對經濟社會快速持續發展具有重要的現實價值。

注釋:

[1][2]閻軍,黃國彬.2007年國外數字資源長期保存研究綜述[J].圖書館建設,2008,(11).

[3][6]吳振新,劉建華, 張玫.數字資源長期保存: 當前進展和最佳實踐- 2007年數字資源長期保存國際會議 ( iPRES2007)綜述[J].現代圖書情報技術,2007,(11).

[4]黃旭,畢強.國內外數字資源長期保存研究現狀與進展[J].圖書館學研究,2009,(1).

[5]李麗云.論數字資源長期保存研究機制[J].北京檔案,2010,(9).

[7]王清飛,劉琳.《數字資源長期保存的策略探討》 《江西圖書館學刊》2008,(3).

[8]張毅.《數字資源長期保存研究進展及發展策略》《內蒙古科技與經濟》 2012,(9)

[1]謝永憲.數字資源長期保存研究[M].上海:世界圖書出版公司,2011.

[2]黃旭,畢強.國內外數字資源長期保存研究現狀與進展[J].圖書館學研究, 2009,(1).

[3]閆軍,黃國彬.2007年國外數字資源長期保存研究述評[J].圖書館建設,2008,(11).

[4]王瑩莉.國內數字資源長期保存研究綜述[J].現代情報,2011,(11).

[5]高建秀.數字資源協作保存網絡研究[J].圖書館學研究,2010,(23).

[6]吳振新,劉建華,張玫.數字資源長期保存: 當前進展和最佳實踐- 2007年數字資源長期保存國際會議 ( iPRES2007)綜述[J].現代圖書情報技術,2007,(11).

[7]王清飛,劉琳.數字資源長期保存的策略探討[J].江西圖書館學刊,2008,(3).

[8]李麗云.數字資源長期保存研究機制[J].北京檔案,2010,(9).

[9]張毅.數字資源長期保存究研進展及發展策略[J].內蒙古科技與經濟,2012,(9).

(責任編輯:孫建華)

Research on Long-Term Preservation of Digital Information Resources in China

ZHANG Yu-jun HAO

( Literature Information Center, Shandong Academy of Social Sciences, Jinan, Shandong 250014, China )

Long-term preservation of digital information resources is regarded as a hot topic in recent years both in China and abroad. This article analyzes the existing problems in long-term preservation of digital information resources in China combining with domestic and foreign researches' results of the present situations and progresses. Moreover, the article states the strategies of long-term preservation of digital information resources in advancing the regulations, developing management systems, establishing technical supporting systems. These strategies are the guidance for the practice of long-term preservation of digital information resources in China.

digital information resources; long-term preservation; solutions

2014-06-10

山東社會科學院2013年自選課題

張于軍(1954- ),女,山東榮成人,副研究館員。

G253.5

A

1671-4385(2014)05-0113-06

猜你喜歡
數字信息數字資源
基礎教育資源展示
一樣的資源,不一樣的收獲
北京尚水數字信息產品介紹
數字有形狀嗎?數字信息精確性和品牌標識形狀的匹配效應*
資源回收
答數字
資源再生 歡迎訂閱
數字看G20
成雙成對
數字信息時代圖書館職業權利缺失與回歸路徑
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合