?

從數字圖書館到數據圖書館

2016-09-29 11:39譚影虹
圖書與情報 2016年3期
關鍵詞:數字圖書館大數據

摘 要:大數據時代的到來,使得“數據”成為了圖書館業務重構的中心和重點,也使得數字圖書館建設面臨著不小的挑戰,在開放存取、語義出版的影響和大數據技術、用戶需求的驅動下實現向數據圖書館的服務范式轉變成為了趨勢。由于數據圖書館還是一個新生的概念而沒有一個權威的定義,但從圖書館用戶的需求發展趨勢來看,數據密集型知識服務系統將是數據圖書館的核心組成,并向用戶提供數據保存、數據挖掘、數據出版、數據管理與數據研究等服務。

關鍵詞:數字圖書館;數據圖書館;大數據;服務范式

中圖分類號: G250 文獻標識碼: A DOI:10.11968/tsyqb.1003-6938.2016055

From Digital Library to Data Library

——The Change of Librarys Service Paradigm in the Era of Big Data

Abstract The arrival of the era of big data, making the “data” becomes a key point of library restructuring, but also making the digital library construction faced with big challenge. With the impact of open access and semantic publishing, and the drive of user requirement, it achieves data library services paradigm transformation has become a trend. Since the data library is still a new concept and there is no authoritative definition, from the point of users requirement, data-intensive knowledge services system will be composed of core data library, and will provide user data storage, data mining, data publishing, data management and data research services.

Key words digital library; data library; big data; service paradigm

近年來,以數字技術處理和存儲各種圖書并茂文獻的數字圖書館在縮小信息鴻溝、加速信息傳遞、促進資源共享等方面做出了積極的貢獻,且隨著國家數字圖書館推廣工程等國家、地方數字圖書館項目的立項,數字圖書館迎來了一個快速發展期。然而,隨著大數據時代的來臨和全社會對數據價值及應用的日益重視,加之出版界、信息界出現的開放存取運動、人工智能研究等熱潮,使得數字圖書館的發展面臨著極大的挑戰。實現從信息時代的數字圖書館到數據時代的數據圖書館服務范式轉變將是當前社會需求及用戶需求驅動的最終結果,因此,在這一服務范式轉變之際,去探討數字圖書館轉型發展的驅動因素、數據圖書館的構建組成及服務內容顯得尤為重要。

1 大數據時代數字圖書館發展面臨諸多挑戰

在信息時代,隨著人們對數字文獻獲取方法方式的日益豐富和對數字文獻內容要求的日益提高,數字圖書館建設過程中存在的標準不規范、文獻數字化水平較低、數字文獻的安全缺乏絕對保障等成為了人們經常討論的問題。開放存取運動的進一步深化發展和以語義、云計算等為代表的信息技術出現,以及大數據時代的到來,則讓數字圖書館面臨著更多的挑戰。

1.1 信息時代遺留的問題未得到解決

數字圖書館在建設過程中,由于受技術所限、資金不足、標準不統一等限制,致使數字圖書館在信息時代就存在著諸如接口不統一、資源元數據描述不夠、檢索能力不足、文獻數據相互關聯性較差、互操作程度較低、資源發現和擴展能力低下等問題,讓數字圖書館成為了人們獲取信息的最后選擇。一份關于大學生對高校圖書館使用情況的調研報告則表明,72%的學生是通過網絡獲得信息,而通過圖書館獲得信息的學生只占18%[1]。另一項調查也顯示大學生訪問圖書館網站(數字圖書館)的只占28%,遠低于使用搜索引擎的使用比例,甚至有25.3%的大學生表示從沒有去訪問過圖書館網站(數字圖書館)[2]。這種現狀也引發了圖書館界的擔憂與思考,正如Rick所指出的一樣,圖書館到了必須給圖書館資助機構更好、更多的說服力來證明圖書館存在的價值時候[3]。然而對數字圖書館來說,雖然經過了持續的技術革新、系統升級和業務延伸后,特別是經過了國家數字圖書館、國家科技圖書文獻中心及其網絡服務系統、國家高等教育數字圖書館、國家科學數字圖書館、中共中央黨校數字圖書館、軍隊院校數字圖書館和中國社會科學院數字圖書館等七大國家級數字圖書館工程項目的建設與推廣,我國數字圖書館的建設在軟硬件設施、數字資源、信息服務、資源共享等方面有了長足的經驗積累,但系統間數據接口及共享、資源統籌采購等問題仍繼續存在,數字圖書館向社會、向民眾、向用戶及政府證明自己存在價值的力度和廣度也還不夠。

1.2 新問題隨著大數據時代的到來而到來

與大數據時代的到來相伴的是大數據操作技術的涌現和用戶思維、習慣與要求的改變,數據的抓取與存儲等問題也就隨之而來,最終使得努力迎合用戶需求的數字圖書館不得不面臨新的挑戰。

(1)多種出版模式為數字圖書館的出版服務帶來了挑戰。眾所周知,利用互聯網讓經過同行評審的學術研究論文得到免費、自由、開放的存放與獲取,提升了科學研究的公共利用程度、保障了科學信息的保存、提高了科學研究的效率的開放存?。∣A)出版模式改變了傳統的出版模式。根據布達佩斯開放存取計劃(Budapest Open Access Initiative,BOAI)于2011年公布的研究報告,認為10年后在世界上的任何國家、任何或地區、任何學科的同行評議學術論文均將實現開放存取[4]。其實,快速增長的不僅是開放存取的倉儲數據、期刊數量和論文數量,注重對開放存取數據質量和服務建設也是OA界最為倚重的。如設立于2003年5月,由瑞典Lund大學圖書館創建和維護、并由OSI、SPARC、EBSCO和瑞典圖書館學會等機構支持或協辦、目前全球收錄數量最大的OA期刊目錄系統DOAJ(Directory of Open Access Journals),不僅從2015年1月1日開始剔除了存在信息更新不及時、數據質量管控不嚴等問題的3300本期刊[5],還于2016年開始收集DOAJ收錄期刊的文章元數據,以滿足DOAJ在2014年3月建立的旨在提高DOAJ的相關性和在開放出版上的重要性更高的檢索標準[6]。這些變革了傳統出版模式的開放存取、數據出版、語義出版等出版模式以及對數據質量監控、資源元數據重視實踐,在讓圖書館的資源建設受益的同時,也對數字圖書館的出版服務、數據質量監管等提出了新的挑戰。

(2)大數據技術為數字圖書館的技術應用帶來了挑戰。大數據技術不但在概率統計、趨勢預測、客戶研究等方面有著出色的應用,也在圖情領域的詞頻可視化、情報分析等方面都有著其它技術所無法比擬的優勢。同時,語義技術、可視化技術等也在信息服務機構的知識庫建設、資源鏈接與描述、用戶分層與服務延伸等方面有著廣泛的應用。但對數字圖書館來說,目前在信息檢索互操作方面也主要有基于圖書館自動化系統的元數據互操作(如聯合目錄+OpenURL)和基于二代圖書館系統的基于系統的互操作(如MetaSearch+OpenURL)兩種方式,而結合了這兩種檢索互操作方式,解決了信息描述、組織與檢索能力不足問題的圖書館知識資源發現系統(如Primo、Summon等)盡管在圖書館已逐漸開始運用,但還是沒有將復雜數據環境(多源數據、多類型數據)下的數據價值發現與圖書館知識服務相結合起來,加之目前還未將能夠處理異構、非結構化數據的Hadoop等大數據技術廣泛應用,數字圖書館還不能為用戶去真正的解答、解決問題。

(3)大數據思維為數字圖書館的用戶維護帶來了挑戰。大數據時代,數據將驅動社會的創新與發展,人們也將因為這種驅動方式的出現而形成有別于傳統思維方式的大數據思維方式。與傳統思維方式強調因果關系不同,大數據思維方式更強調相互關系、相關關系,人們將逐漸拋棄基于假想的易出錯方法,而采用基于數據挖掘的相關關系分析法去預測事件及概率[7]、為信息找人[8]。很顯然,數字圖書館在對組成數字圖書館最基本單元的文獻資源唯一標示、科學引用頻率統計、元數據描述標準統一、相似性關聯及鏈接實現等還都無法做到的情況下,實現這類基于海量數據挖掘的概率預測、為信息找用戶等服務就還需時日。

2 以數據為核心業務成為數字圖書館業務重構方向

ACRL(Association of College & Research Libraries,美國研究圖書館協會)于2012年發布的《2012 top ten trends in academic libraries》[9](2012學術圖書館發展趨勢)報告,就對“數據監管”“數據保存”“新的出版與交流模式”等未來圖書館發展的趨勢進行了研究。在這份報告之后,ACRL研究、計劃與評價委員會于2014年6月發布的《高校圖書館發展大趨勢》[10]雖然把“更深度的合作”概括為當前美國高校圖書館總的發展趨勢,但也把“數據”列為四大關鍵詞之一。由上述兩份報告我們可以發現,在全球圖書館享有較高研究水平聲譽的ACRL已經預見到了“數據”的價值,認為開展關于數據的收集、保存、開發與應用將是未來圖書館發展的趨勢。值得贅述的是,ACRL對于“數據”的追捧并未隨著時間的推移而減弱乃至消失,反而認為將有著明顯的專業化、精深化發展趨勢。在ACRL發布的《2016 top trends in academic libraries》[11](學術圖書館 2016 年 10 大發展趨勢)報告中,認為“研究數據服務”“數據發展政策與管理計劃”“基于館員專業化發展而提供研究數據服務”“數字化學術中心”是學術圖書館2016年發展的幾大趨勢??紤]到業界已經廣泛開展的數據素養教育和圖書館數據館員設置、大數據挖掘應用等實踐,可以說基于數據管理與應用的服務、建設已成為圖書館未來業務增長點,而實現對異構、海量數據的管理、應用與開發重任,無疑宜由現代技術應用最為廣泛的數字圖書館承擔。

3 數據圖書館是數字圖書館的發展方向

由于數據圖書館還是一個新生的圖書館存在形態,故對其科學內涵、服務內容等還沒有一個權威定義。綜合上述對數字圖書館面臨的環境和挑戰分析,不難得出圍繞數據及數據業務去重構、重組數字圖書館的建設與服務,不但有著多環境影響因素,也有著多驅動因素。圍繞數據,就是以數據為核心并進行數據的保存、處理和應用,進而形成具有數據服務、數據出版和數據增值服務的圖書館存在新形態,即數據圖書館形態。結合當前已經形成的數據密集型科研環境和全社會以數據為中心的價值認同,筆者以為數據圖書館的核心組成內容就是數據密集型知識服務系統,數據圖書館的服務就是基于數據挖掘的支撐服務,如決策支撐、發現支撐和融合支撐等。

3.1 數據密集型知識服務系統的框架構成

數據密集型知識服務系統主要由大數據層、計算融合層和用戶服務層構成(見圖1)。其中,大數據層主要承擔文獻大數據(期刊、會議、圖書、學位論文、科技報告、專利等)、用戶大數據(個人數據、生活數據、工作數據、學習數據等)和其它大數據(政府信息數據、社交媒體數據、科技創新數據等)的存儲職能,當然,這些數據并非均儲存于圖書館,而主要以云計算存儲、異地存儲、異構存儲為主;計算融合層主要就是通過構建一體化描述模型來實現對數據的采集、解析、清洗與保存,并通過數據標引、描述、分類與標注來實現基于用戶需求、基于信息發現的用戶服務;用戶服務層則主要是通過計算融合層向用戶提供基礎性數據服務(數據出版、數據管理與數據研究等)和發現性數據服務(態勢解析、追蹤與檢測、未來發現等)等支撐性服務。

3.2 關于數據圖書館的服務

由數據圖書館核心系統的框架構成可以看出,本研究所設計的數據圖書服務主要為支撐性服務,這是因為在大數據環境下,數據圖書館盡管擁有豐富的文獻數據,但用戶數據特別是產生于圖書館交互之外的工作數據、學習數據、生活數據并不易獲得,因此,基于這些非全部數據量和數據類型的數據服務產品還需進一步去辨別和研究;其次,大數據思維要求數據圖書館提供焦點問題發現、為信息找用戶等服務,即數據圖書館不再只是提供基于數據管理職能的數據保存、數據規劃等服務,而是必須從海量文獻數據中去找到可能影響用戶的焦點問題,進而通過數據圖書館的互操作來提示用戶,并將能夠解決用戶問題的數據推送給用戶,實現焦點問題發現與信息找用戶相加的發現性服務。

4 結語

大數據時代的到來已驅動著數字圖書館的轉型與發展,數據圖書館作為數字圖書館發展的未來形態,也必然存在著諸如接口標準制定、數據保存算法設計、數據描述模型完善等研究性課題。本文僅限于對影響數字圖書館轉型發展的驅動因素和影響因素入手,對數據圖書館的核心系統框架進行了簡單設計,諸多存在的不足也還有待于進一步去深入研究。

參考文獻:

[1] 張穎.大學生圖書館使用情況調查與研究——以A校為例[J].青年文學家,2014(6):182.

[2] 關于圖書館利用狀況的調查報告[EB/OL].[2016-03-20].http://www.docin.com/p-570050019.html.

[3] Anderson?Rick. The Crisis in Research Librarianship[J].Journal of Academic Librarianship,2011,37(4):290.

[4] RJ It. Ten years on from the Budapest Open Access Initiative: setting the default to open (BOAI10, 2012) Dieci anni dopo la Budapest Open Access Initiative (BOAI1...0) [J].Jlis It,2012,3(2):20.

[5] 開放獲取期刊目錄DOAJ剔除近3300本期刊[EB/OL].[2016-06-12].http://blog.sina.com.cn/s/blog_12c7d197e0102wocp.html.

[6] DOAJ的開放獲取新進展[EB/OL].[2016-06-12]. http://blog.sciencenet.cn/blog-1035376-898149.html.

[7] 大數據時代,我們應該具有怎樣的思維方式?[EB/OL].[2016-03-20].http://mt.sohu.com/20160303/n439227782.shtml.

[8] 大數據思維的十大核心原理[EB/OL].[2016-06-12]. http://www.raincent.com/content-10-4235-7.html.

[9] ACRL.2012 top ten trends in academic librariesh[EB/OL].[2016-03-20].ttp://crln.acrl.org/content/73/6/311.full.

[10] ACRL.Top trends in academic libraries:A review of the trends and issues affecting academic libraries in higher education[J].College&Research; Libraries News,2014(6):294 -302.

[11] ACRL.2016 top ten trends in academic librariesh[EB/OL].[2016-06-10]. http://crln.acrl.org/content/77/6/274.full.

作者簡介:譚影虹(1978-),女,廣東江門新會景堂圖書館館員。

猜你喜歡
數字圖書館大數據
高校圖書館的未來發展模式芻議
淺析“互聯網+”時代的圖書館管理
基于云計算的數字圖書館建設與服務模式研究
大數據環境下基于移動客戶端的傳統媒體轉型思路
基于大數據背景下的智慧城市建設研究
數據+輿情:南方報業創新轉型提高服務能力的探索
芻議數字圖書館計算機網絡的安全技術及其防護策略
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合