?

大數據技術在數字圖書館管理與服務中的應用

2017-03-08 08:13
蘭臺世界 2017年4期
關鍵詞:可視化資源管理數字

高 群

(江南大學圖書館 無錫 214122)

大數據技術在數字圖書館管理與服務中的應用

高 群

(江南大學圖書館 無錫 214122)

隨著全球信息化的蓬勃發展,信息量的爆炸式增長,海量數據的出現催生了大數據技術的到來。同時,信息數字化的發展趨勢,驅使著現代圖書館的管理與服務模式需要進行轉變。如何高效、安全的存儲圖書館海量的信息,如何快速返回用戶需要的有用信息?利用大數據技術實現數字圖書館的管理與服務必將成為大勢所趨?;诖髷祿夹g的數字圖書館的管理與服務能夠有效實現圖書館的信息資源整合與滿足現代讀者的個性化服務需求。

大數據 大數據技術 數字圖書館 管理服務

隨著信息化時代的到來,信息量的指數級增長、信息技術的飛速發展、讀者閱讀需求的快速轉變,這一切都標志著圖書館大數據時代的到來。圖書館在存儲圖書資料、管理系統、服務用戶的時候,會產生大量類型多樣的數據信息。大數據圖書館管理與服務是當代圖書館所面臨的嚴峻挑戰。

當今時代,信息數字化已是大勢所趨,人們每天都生活在數字化信息的包圍圈中。人們已經由從傳統的書本、報紙上獲取信息轉變為從網絡上獲取數字化信息。圖書館作為人們獲取信息的重要場所,又由于現在的圖書館信息存取大多是以數字化的方式進行,數字圖書館的誕生和繁榮便是順理成章的事了。數字圖書館的產生與計算機技術、網絡通信技術、存儲技術等快速發展是分不開的,數字圖書館轉變了人們讀取信息的方式,加快了讀取信息的速度,使人們獲取知識更加方便快捷、豐富多彩。

數量巨大、結構不一,是當前數字圖書館信息存在的特點。如何更好地生產、存儲、管理、分析、傳播、修改、創新、應用好圖書館中的數字信息,更高效的為人們服務,是人們更加關心和需要解決的問題。于是,大數據技術的應用解決了這個難題。近年來,大數據技術的研究進入了鼎盛時期,國外研究機構紛紛投身其中[1]1。

一、理論背景

1.大數據技術簡介。大數據技術[2]91,就是從不同性質的數據中快速挖掘出有用信息的一門綜合技術。目前,大數據技術已衍生出了許多新穎技術,這些技術在大數據的采集、存儲、處理、呈現等環節提供了強有力的支撐。大數據處理核心技術主要有:大數據采集、大數據預處理、大數據存儲、大數據分析/挖掘、大數據展現及應用。大數據處理核心技術示意圖如圖1所示:

圖1 大數據處理核心示意圖

2.數字圖書館簡介。數字圖書館[3]21(Digital Library)是用數字技術處理、存儲大量各式各樣文獻的圖書館。它利用數字技術存儲了許多不同載體和地理位置的數據資源,有利于針對不同區域、不同對象的網絡檢索與傳播。數字圖書館主要包含了數據資源處理、存儲、查詢、應用這幾個部分。其實,所謂數字圖書館則是虛擬的圖書館,它有別于傳統的圖書館,既是無“圍墻”的圖書館,也是依賴于網絡環境下的可無限擴展的知識庫,還是規模龐大的、分布式的、便捷的、無時空約束的、可用于跨庫無縫對接、智能查詢的信息大中心。

具體而言,“數字圖書館”從概念上理解,主要可以引申為兩層意思:數字化圖書館與數字圖書館系統。它主要包含以下工作內容:將傳統的紙質圖書信息轉化為電子版的虛擬的數字圖書信息;電子版圖書資源的加工、存儲、流通。

3.大數據技術為數字圖書館管理與服務提供機遇。通過對大數據技術以及數字圖書館特征的介紹可知,大數據技術可應用于數字圖書館資源管理、建設、服務等方方面面。一般來說,大數據技術主要用于數據采集、數據存儲、數據處理、數據分析、數據應用這五方面。引入大數據技術的數字圖書館結構圖如圖2所示:

圖2 基于大數據的數字圖書館結構圖

大數據技術應用于數字圖書館,不僅可以提高信息資源的整合度,也可以提升信息服務水平,還可以轉變和改進服務方式,使得數字圖書館的管理與服務更能滿足現代人們的需求[4]86。

(1)提高資源整合度。在當今各個高校中,均能登錄校內網免費下載各種學習資源,而非校內人員以及非校內網則無法下載任何學習資源。由此可見我國數字化圖書館建設比較封閉,數字資源無法共享。這樣的現象容易引起資源浪費、重復建設等問題。大數據技術的到來便可提高資源整合度,實現資源共享,加強各個高校圖書館之間的資源整合和共享。

(2)提升服務水平。在科學技術飛速發展的時代,圖書館建設要適應大眾的各種個性化需求,則需要提升自身服務水平,拓寬服務內容,才能與時代接軌,摸索出自己長久發展之路。大數據技術應用于圖書館建設中,能夠對數字化資源進行處理、應用,打造出各式服務。

(3)轉變服務方式。形成學科服務模式,即針對某一學科范疇,依據一定的信息選定規范對其進行采集、描述,積累具備某些意義的電子信息,進行處理應用后再向用戶提供一些基本服務以及個性化服務[5]75。如定期向用戶提供信息推送服務,即可依據用戶感興趣或近期搜索過的信息進行信息推送。

二、基于大數據的數字圖書館管理與服務內容分析

1.數字圖書館管理與服務資源。所謂巧婦難為無米之炊,資源是管理與服務的基礎。大數據時代信息資源的特征要求我們通過一定的技術手段去挖掘和發現有用的資源。

首先,數字信息資源的主要來源有:(1)數字化的館藏資源。館藏資源主要包括:電子文獻、聲像資源;(2)下載的網絡資源;(3)購進的電子資源;(4)用戶產生的信息資源。用戶產生的信息資源又分為用戶行為信息和用戶需求信息。用戶行為信息產生于用戶注冊登錄網站、瀏覽資源、問卷調查等方式;用戶需求信息則產生于元數據倉資源發現、用戶數據晚間和分析的數字資源發現、大數據決策的信息資源發現[6]76。

2.基于大數據技術的圖書館資源存儲。隨著數據的不斷增長和積累,圖書館數字資源量也呈現指數級增長,且數據結構多樣。怎樣有效存儲海量且結構多樣的信息資源,大數據技術的到來解決了這一難題。大數據諸多技術中,目前被廣泛使用的技術主要有:Map Reduce技術、Hadoop技術[7]86、NoSQL、云計算等?;诖髷祿臄底謭D書館存儲平臺結構圖如圖3所示:

圖3 存儲平臺結構示意圖

3.基于大數據技術的圖書館資源管理。由于數字圖書館信息資源存在著量大、結構復雜的特點,如何對資源進行有效、合理的管理就顯得十分重要。

目前圖書館資源管理存在很多問題,如:資源管理具體操作中的不規范、資源管理的要求不統一、資源管理的方法不合理、資源管理的缺乏標準等。數字圖書館是由多個數據庫、知識庫構成的大型信息系統,如何構建一個標準化平臺將各個不同的數據庫、知識庫中的數據流通是個難題?;诖髷祿馁Y源管理流程圖如圖4所示:

三、基于大數據技術的數字圖書館管理與服務模式

大數據技術大大推動了數字圖書館的發展,包括圖書館提供的信息資源量的增加以及服務模式的改善?;诖髷祿夹g的數字圖書館的管理與服務模式正在發生翻天覆地的變化,不久的將來大數據環境下的圖書館服務模式必將注重信息的集成化服務、數據分析與挖掘、新型資源的收集、服務內容的時效性等[8]47。本文主要從數據、信息、知識、智慧這幾個方面進行闡述數字圖書館的信息服務。

圖4 基于大數據的資源管理流程圖

1.一體化管理與服務模式。在當代信息資源所獨有的大數據特征下,圖書館要全面采集各種信息資源是一項長久工序。因為圖書館的信息資源不僅僅包括已存在的館藏資源,如館藏書目數據庫、電子出版物、網上下載的信息資源,還包括一些虛擬的館藏資源,如網絡動態信息、在線出版物等。如何將這些來源于不同數據庫的信息資源進行整合,更好地服務于大眾?大數據技術很好地解決了這一難題。大數據技術主要采用了MapReduce、NoSQL、云計算等技術對海量信息做提取、分析、處理,達到在類型不一的資源中進行查找,用統一的數據規范顯示查找結果,最終實現多種數據結構的整合。

大數據技術在數字圖書館的建設與服務中的應用主要體現在其對來源不同、結構不同、數量龐大的信息資源進行高效的采集、分析、處理、整合、存儲、應用,最終達到去除冗余數據、存儲有用數據,并使用合適的智能檢索方法為用戶提供一體化的資源管理與服務模式。

2.學科資源管理與服務模式。所謂學科資源管理與服務模式就是針對不同領域的人,根據其需求采集、分析、處理相關學科知識,并提供給客戶相關學科知識的各種服務。完善和創新數字圖書館服務模式的有效方式就是為用戶提供個性化、精準化的信息資源。精準化的信息資源即學科化的信息資源,各個圖書館都應該為客戶提供學科化的信息資源和服務。尤其是針對高校圖書館,更需要滿足老師、學生的學科化服務。高校中的老師、學生從事科研的比例大,他們需要更加精準的學科知識,而高校圖書館則是他們獲取學科知識最主要的渠道。所以,對于高校圖書館而言,提供其面向學科的信息服務是大勢所趨。

怎樣提供其面向學科的信息服務?首先,學科是學科信息服務的基石,通過海量用戶對某一學科的信息資源進行檢索、瀏覽以及下載的頻率進行分析,分析出某段時間內用戶對某學科的哪些方向內容關注度高,再利用數據挖掘或其他智能分析法,預先分析出某一學科研究的熱點以及學科與學科間的關聯內容研究。利用每個圖書館已有的借閱系統,對用戶借閱資源的類型、方向、內容、頻率等指標進行相關統計,挖掘分析出用戶、圖書、信息資源三者間的知識網絡。利用該知識網絡可提供給用戶更滿意的學科知識服務。

3.信息可視化管理與服務模式。隨著科技的發展,人們獲取信息的方式更加豐富多彩,人們對信息的呈現形式要求也更高。人們更加傾向于可視化的信息展現方式,這可以讓人們更加直觀的了解所需信息。所以,數字圖書館的信息服務也應該緊跟時代步伐,努力將其提供的服務走向可視化。

所謂信息可視化是將抽象的信息通過可視化技術處理成為能直接觀看的形式。其中的信息可視化技術是為數據分析,規律發現和決策服務的。

可視化的服務能提高用戶的滿意度、使用速度、反饋速度、查準率等。信息可視化主要體現在:檢索主題可視化、數據庫分布可視化。通過把學科計量學方法與信息可視化技術進行有機結合,形成學科知識地圖,顯示出學科、作者以及著作間的關系,顯示學科知識結構,反映不同領域知識的發展態勢。利用可視化技術把集中的數據以及無法可視化的抽象數據的語義關系表示出來,反饋給用戶。用戶通過信息可視化技術挖掘出這些數據集中有用的潛在規律,為用戶在獲取、分析、處理、使用信息等方面提供捷徑。在大數據環境中,數字圖書館為了更好地滿足用戶的個性化信息需求為用戶提供基于數據應用的信息可視化服務是基于大數據的數字圖書館信息服務的發展趨勢。

4.智慧化管理與服務模式。隨著信息量的爆炸式增長,人們獲取信息渠道的增多,人們獲取信息越發方便快捷。人們希望獲取信息能夠更加智能化,即最短的時間內獲取最感興趣、最準確的信息。數字圖書館則變被動為主動,它通過分析用戶的個人信息、使用信息、瀏覽記錄等信息,對用戶的需求進行分析處理,預測出用戶的需求,并實時提供信息推送服務。智慧化服務流程圖如圖5所示:

圖5 智慧服務流程圖

目前數字圖書館的資源量均十分龐大,要實現信息服務的智慧化,需引入大數據技術對海量數據集進行整合、處理、發現出用戶直接需求以及潛在需求。對于用戶的各種需求提供個性、智慧的信息服務。智慧服務是更加高級的信息服務,它是對對基礎知識服務的升華。

在當今科技日益發達,信息增長快速、信息結構不一、信息分布繁雜的態勢下,數字圖書館的服務內容以及服務方式都在發生著變化。主要體現在信息資源發現,信息資源存儲,信息資源組織,信息資源檢索這幾個方面,本文則主要從這幾方面來闡述了構建基于大數據的數字圖書館管理與服務。數字圖書館存有海量的數字化數據信息,數據結構紛繁復雜,這些帶有大數據特征的數據信息正是大數據技術得以施展的原材料。當前,大數據技術已經發展成熟,將大數據技術應用于數字圖書館的管理與服務中則能更好地為大眾服務,讓圖書館的價值得到體現。

本文僅僅從理論上分析了大數據技術應用于數字圖書館管理與服務的迫切性、必要性以及可行性,而在大數據處理的技術上沒有具體闡述,沒有基于大數據的數字圖書館信息服務的實例。本文存在的不足之處,后續的研究會進行完善和補充。

[1]The White Horse.Big data across the federal government.[EB/O L].http://www.whitehouse.gov/sites/default/files/microsites/ostp/big_dat a_fact_sheet.pdf

[2]來紅梅.大數據時代圖書館信息服務面臨的挑戰與對策[J].圖書館學刊,2014(3).

[3]張春紅,唐勇,肖瓏.我國數字圖書館研究十年發展回顧[J].數字圖書館,2011(4).

[4]馬曉亭.大數據時代圖書館數據整合系統構建研究[J].圖書館建設,2014(6).

[5]陳臣.基于大數據的圖書館個性化智慧服務體系構建[J].情報資料工作,2013(6).

[6]蘇蓉.基于大數據的數字圖書館信息服務研究[D].武漢:華中師范大學,2014.

[7]王玲玲.大數據時代圖書館數字化服務的模式[J].圖書館學刊,2014(4).

[8]趙雪峰.大數據影響下的圖書館應變策略[J].長沙大學學報,2015(1).

10.16565/j.cnki.1006-7744.2017.04.22

高群,江南大學圖書館館員,主要研究方向為圖書館數字資源建設。

G250

A

2016-11-17

猜你喜歡
可視化資源管理數字
基于CiteSpace的足三里穴研究可視化分析
思維可視化
人事檔案管理在人力資源管理中的作用
人力資源管理促進企業績效提升
企業人力資源管理
基于CGAL和OpenGL的海底地形三維可視化
“融評”:黨媒評論的可視化創新
答數字
GIS在森林資源管理中的應用
數字看G20
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合