?

基于CiteSpace的大數據環境下智慧圖書館的思考

2021-10-25 03:43張雙雙
信息記錄材料 2021年10期
關鍵詞:知識庫智慧圖書館

張雙雙

(長春財經學院 吉林 長春 130000)

1 引言

大數據時代最早由全球知名咨詢公司麥肯錫,在2011年5月發表的一篇報告《大數據:創新、競爭和生產力的下一個前沿》中提出,從這一刻起,大數據開始備受各行各業的關注。2012年,美國政府認為大數據已經能夠影響國家經濟結構和產業升級,變得像“石油”等自然資源一樣重要。到了2013年數據已經成為科研活動的核心,如果不能善于利用數據,就會造成大量的資源浪費。智慧圖書館是未來的發展趨勢,針對“大數據”和“智慧圖書館”這兩種新興事物進行研究,對圖書館的發展具有重要意義。本文通過此研究熱點進行分析,從而為智慧圖書館的發展提供幫助。

2 大數據與智慧圖書館的定義

2.1 大數據

麥肯錫公司給出的定義:大數據是一種規模大到在獲取、存儲、管理、分析方面大大超出了傳統數據庫軟件工具能力范圍的數據集合[1]。

目前,大數據沒有統一的定義,本文認為大數據可以簡要概括為海量數據+處理辦法,實際上就是利用先進的處理數據的辦法,將海量數據挖掘出有價值的數據,并將這些有利用價值的數據進行可視化,還能利用一定的技術方法存儲這些海量數據,對數據安全做好防護等一系列的問題。

2.2 智慧圖書館

智慧圖書館是指把智能技術運用到圖書館建設中而形成的一種智能化建筑,是智能建筑與高度自動化管理的數字圖書館的有機結合和創新[2]。智慧圖書館是未來圖書館發展的必然趨勢,是智能圖書館的升級,將云計算、大數據、物聯網與智能設備結合在一起,能像人一樣提供智慧化服務,除此之外更要包含圖書館館員的智慧服務。

3 基于CiteSpace可視化分析

3.1 數據準備

本文利用中國知網數據庫,采用高級檢索方式,設定“主題詞=(大數據and智慧圖書館)”進行檢索,檢索出648條結果,檢索時間為2021年4月12日。由圖1可知,關于“大數據”并含“智慧圖書館”的文章是從2012年開始出現的,2012年出現了1篇,2013年出現了3篇,發文量從2014年開始緩慢上升,一直到2017年,這4年每年發文量都在50篇以內;在2018年至今,發文量增加比較顯著,經中國知網預測2021年這方面文章將達到271篇。我們將這648條數據導出Refworks格式作為此次基于CiteSpace研究的數據來源[1]。

圖1 主題詞“大數據and智慧圖書館”在中國知網中年發文量

3.2 數據分析

此研究利用CiteSpace5.7.R5版本軟件進行知識圖譜的可視化分析,主要分析在大數據環境下智慧圖書館研究熱點。經中國知網檢索出的數據可知,在2012年開始出現這方面的文章,所以時間節點取2012到2021年近10年的詞頻進行分析。將648條Refworks格式的數據存放到input文件夾中,將txt文件改成CiteSpace可以識別的文件名稱,如“download1_converted”,利用CiteSpace軟件先轉化成其可以識別的數據,存儲在data文件夾中,再建立一個project文件夾用來跑數據。數據準備完成后,進行關鍵詞分析,選擇裁剪的算法,時間切片選“1”,以1年為單位進行研究,點擊“go”,最后得到CiteSpace可視化圖譜見圖2。

圖2 基于CiteSpace關于大數據環境下智慧圖書館的主題分布圖

通過這種可視化圖譜,可以將熱點清晰地呈現出來,圖中大圓點代表比較火熱突出的主題詞,主要有智慧圖書館、大數據、圖書館、高校圖書館、智慧服務等。各主題詞的高頻詞分析如下:(1)圍繞智慧圖書館的高頻詞主要有云計算、物聯網、手機圖書館、大數據思維、大數據平臺、智能+智能生態系統、大數據分析技術、數據安全、總分館服務體系、功能拓展、實現路徑、用戶需求、圖書館智慧應用等;(2)圍繞大數據的高頻詞主要有智慧服務體系、關聯主義學習理論、服務模式、Python、圖書館構建、個性化服務、云田智慧云平臺、黨校智慧圖書館、AI、5G、聚類分析、共詞分析、因子分析等;(3)圍繞高校圖書館的高頻詞主要有:智慧校園、智慧閱讀、5G閱讀、Web4.0、圖書館4.0、“雙一流”建設高校、物聯網技術、RFID技術、云計算技術、技術驅動、功能架構等;(4)圍繞圖書館的高頻詞主要有:智慧化服務、個性化智慧服務、智慧圖書館體系、大數據時代、發展趨勢、建設策略、場景化知識推薦、微知識自動問答、圖書館系統、用戶畫像等;(5)圍繞智慧服務的高頻詞主要有:區塊鏈、大數據環境、云技術、智能說、信息融合、nlsp、solomo、信息融合、文獻計量等。

CiteSpace軟件根據本文在中國知網檢索的648條數據,還自動生成了一個關于詞頻高低的排序,見圖3。排在前15位的分別是:智慧圖書館、大數據、智慧服務、高校圖書館、圖書館、人工智能、物聯網、云計算、高校、大數據時代、知識服務、建設、“互聯網+”、智慧化、公共圖書館。通過這些詞頻排行榜,我們可以很容易看出,在大數據環境下智慧圖書館研究的方向所在,為日后學者開展此方向的研究打下良好基礎。

圖3 研究熱點中關鍵詞排行榜

在CiteSpace軟件中,點擊Burstness按鈕,再點擊view,可以生成一個關于大數據環境下智慧圖書館研究的引用次數最多的詞頻排序,見圖4,可以清晰地看出排在前4位的分別是:物聯網、云計算、“互聯網+”、學科服務。而且它們有個共同的特點,這4個詞都是從2012年開始凸顯的,這也是隨著大數據和智慧圖書館的興起而出現的現象。

圖4 關鍵詞強度排行榜

4 大數據的特性

4.1 種類多樣性

數據作為信息、知識的基礎性加工材料,它的種類繁多,來源渠道多,如文本、圖像、視頻、機器數據等,也可以是結構化、半結構化或非結構化的數據,不連貫的語法或者語義。

4.2 價值密度低

數據的數量龐大,其中充斥著有價值和無價值的數據,由于它的種類多樣性,使得它的數量更加龐雜。在數據的海洋中挖掘出有用數據,猶如大海撈針一般,它的價值密度很低。

4.3 增長速度快

全世界各個地區、各行各業每分鐘每秒鐘都會產生海量數據,有的是人為數據,有的是機器數據。機器數據自動會產生海量數據,它的增長速度驚人。

4.4 時效性強

數據是實時產生就可以利用的,不像信息和知識是在數據的基礎上利用人的思維、智慧提取出來的,因此數據的時效性非常強,產生之時即可利用。

5 大數據環境下智慧圖書館的發展啟示

5.1 建立機構知識庫

大數據環境下的智慧圖書館的重點就是大數據的利用,機構知識庫是根據各個機構自身需求建立的存儲數據、信息、知識的地方,可見建立機構知識庫對于大數據環境的重要性。機構知識庫可以針對每個圖書館不同的特點進行有針對性地建設,宗旨就是將一切圖書館中產生的有利用價值的數據全部收錄,當用戶需要某項數據時,通過檢索該圖書館的機構知識庫,可以快速、準確地查找到所需數據的過程。圖書館在建立機構知識庫時需要考慮的問題很多,目前全國有圖書館正在建立機構知識庫,將數據放到機構知識庫中,其難點在于怎么樣對這些數據進行保護,為哪些人提供哪些數據這是值得各個圖書館深思的問題。如果圖書館能將機構知識庫做大做好,也能為地方政府提供數據支撐,還能為政府乃至國家做出重大決定提供預測等,同時也能提升圖書館自身的地位[2]。

5.2 用戶畫像

在大數據環境下,圖書館可以從傳統的“認為用戶需要”轉變為“知道用戶需要”,這是依靠大數據才能提供的精準服務,這種智慧服務比以前人提供的服務還要讓用戶舒服,讓用戶毫無違和感,這就是好的智慧服務[3]。建立用戶畫像的過程實質是通過收集用戶的特征數據、興趣數據、行為數據等,分析用戶的數據信息,將用戶進行分類,再通過數學建模預測用戶喜好和未來的行為。圖書館從一對多變成了一對一類人,隨著用戶畫像技術的提高,甚至可以達到一對一個人的個性化推送服務,這樣能更有針對性、更精準地為各類用戶提供服務。

5.3 提高館員的數據素養

數據素養是在信息素養的基礎上發展起來的,信息素養是快速獲取、利用信息的能力,數據是信息的原材料,因此可見數據素養是信息素養的高級模式,比信息素養更復雜。提高館員的數據素養,才能為智慧圖書館數據管理提供人才,才能更好地將有價值的數據從海量數據中挖掘出來,更好地為用戶提供高質量的數據。智慧館員應加強專業知識學習,可以通過提高學歷、參加慕課、參加行業內的培訓或者利用圖書館豐富資源,培養自己的數據意識,提高自己數據方面的能力,例如數據挖掘、數據分析、數據可視化、數據軟件使用等[4-5]。

6 結語

在大數據環境下,智慧圖書館雖然面臨技術和人才的雙重挑戰,但大數據也給智慧圖書館帶來了新的機遇,通過大數據和智慧圖書館熱點分析,可見在大數據環境下智慧圖書館的研究前景非常廣,為智慧圖書館的發展及用戶服務帶了很多可能性,讓我們圖書館人在大數據環境下砥礪前行。

猜你喜歡
知識庫智慧圖書館
基于TRIZ與知識庫的創新模型構建及在注塑機設計中的應用
圖書館
高速公路信息系統維護知識庫的建立和應用
基于Drupal發布學者知識庫關聯數據的研究
有智慧的羊
去圖書館
智慧派
位置與方向測試題
智慧決定成敗
智慧往前沖,統計百分百(1)
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合