?

基于個性化服務的高效圖書館大數據挖掘與決策分析體系構建研究

2020-11-13 03:38尚玉梅
微型電腦應用 2020年10期
關鍵詞:個性化圖書館

尚玉梅

摘要:為了提高圖書館管理系統在使用過程中的個性化和智能推薦需求,通過分析大數據挖掘實施方案,選擇合適的數據挖掘工具,對圖書信息進行預處理,并結合支持向量機和神經網絡算法建立了個性化圖書信息推薦服務方案,然后進行系統功能需求分析和系統整體架構分析,最后進行了實例展示和分析。研究發現:采用改進的SVM算法來實現圖書館的個性化數據挖掘,支持向量機算法在使用過程中具有監督的、可擴展和非線性的高效特性,能夠實現非線性的多核心數據聚類效果,從而提高數據挖掘的學習能力;利用BP神經網絡對處理后的數據樣本進行適應性訓練,用戶在使用過程中給予一定的正向反饋,該決策分析體系根據反饋結果進行不斷的自主學習并更新和優化樣品數據,實現了一個閉合的良性循環;通過對設計的個性化圖書館推薦服務系統使用體驗調查發現:選A的讀者占比為58%,選B的讀者占35%,說明在使用過程中對于該個性化推薦系統滿意度超過了90%,能夠為讀者用戶提供一定的借閱便利。

關鍵詞:圖書館;大數據挖掘;決策分析;個性化

中圖分類號:TP315

文獻標志碼:A

ResearchonConstructionofEfficientLibraryBigDataMiningand

DecisionAnalysisSystemBasedonPersonalizedService

SHANGYumei

Library,ShanxiVocationalandTechnicalCollege,Xian710038,China

Abstract:Inordertoimprovetheuseoflibrarymanagementsystemintheprocessofpersonalizedandintelligentrecommendedrequirements,thisarticle,throughtheanalysisoflargedataminingplan,selectstheappropriatedataminingtoolstopreprocessthebooksinformation,andcombinessupportvectormachineandneuralnetworkalgorithmtoestablishpersonalizedbookinformationrecommendationserviceplan.Thenthesystemfunctiondemandanalysisandoverallsystemarchitectureanalysisarecompleted.Finallytheinstanceanalysisiscarriedoutanddisplayed.ItisfoundthattheimprovedSVMalgorithmcanbeusedtorealizepersonalizeddatamininginthelibrary,andtheSVMalgorithmhasthecharacteristicsofsupervised,extensibleandnonlinearefficiencyintheprocessofuse,andcanachievethenonlinearmulticoredataclusteringeffect,soastoimprovethelearningabilityofdatamining.Thedecisionanalysissystemcancontinuouslyindependentlylearn,updateandoptimizethesampledataaccordingtothefeedbackresults.Thusitachievesaclosedvirtuouscircle.Throughtheinvestigationontheuserexperienceofthedesignedpersonalizedlibraryrecommendationservicesystem,itisfoundthattheproportionofreaderswhochooseAis58%,andthatofreaderswhochooseBis35%,indicatingthatthesatisfactionofthepersonalizedrecommendationsystemexceeds90%,whichcanprovidecertainborrowingconvenienceforreadersandusers.

Keywords:library;bigdatamining;decisionanalysis;personalization

0引言

移動互聯網和人工智能的發展對于信息的甄別效率有的新的要求,現代社會迫切需要在海量信息沖擊下如何在短時間內獲取自己感興趣或者想要的信息[1]。近年來,智慧校園概念的提出便是智能化推薦和個性化定制需求的一個實踐方向。校園活動過程中,圖書館是學生和教師在工作和生活中必不可少的一個場景,傳統的圖書館管理系統由于信息交互機制較為傳統,學生在海量圖書信息中很難尋找自己感興趣的書籍,因此如何實現在高校圖書館的個性化推薦服務,精確獲取讀者的閱讀行為、構建興趣點數據庫,并以此分析潛在用戶的閱讀需求是具有現實意義的[23]。研究發現,關于個性化服務的圖書館管理系統在國外的研究相對較早,并且具備了一定理論和應用研究基礎,例如美國華盛頓大學的gateway系統[4],康奈爾大學的library系統[5],這些系統通常包含資源推送、定制推薦、學科導覽和文獻傳遞等模板,這些定制化的圖書館管理系統極大了提高了師生的學習效率并在美國高校得到迅速推廣。

然而,不少研究者指出康奈爾大學的Library系統還是存在一定缺陷[68]。例如缺乏主動推薦服務,服務內容較為單一,深度較淺,并且信息資源和服務項目的協同集成效用較低,主動檢索功能缺乏等。針對這一問題,本文提出基于大數據挖掘和決策分析系統,用于構件一個更加智能的個性化高效圖書館管理系統。

1大數據挖掘實施方案

1.1數據挖掘工具選擇

數據挖掘是一種典型的面向應用的數據處理和分析技術,是較為新穎的數據處理方式。目前國際上已經開發出較多大型數據處理技術,從用戶使用角度看,數據挖掘技術可以快速為用戶提供有用的數據信息,現階段開發出的數據挖掘工具較多,例如IBM公司的DB2,SAS公司的SASETS,SPSS公司的SPSSModeler以及Oracle公司的神經網絡等[9]。本文的研究中選取SPSSModer工具進行應用開發,該工具是較為先進的數據挖局技術,能夠把用戶從繁雜的編程作業中解放出來。

1.2數據預處理

數據預處理包括三部分:空白數據預處理、重復數據預處理和關鍵字預處理[1015]。首先,選取圖書館一年內的圖書借閱和查詢數據,進行編碼和歸類,將這些原始數據導出為excel。然后,由于數據挖掘過程中預處理的數據會有一些空白數據,對于數據挖掘的準確性造成影響,因此本文將無法充填的空白數據進行刪除來確保數據的準確性,或者對空白數據進行逐條的補充書籍信息用于補全;對于重復借出的數據同樣保留一條信息和借出次數,用于提高數據挖掘的效率和清晰度,防止數據挖掘過程的重復識別;最后選取不同類型關鍵字段進行數據挖掘,其中讀者用戶的關鍵挖掘字段,如表1所示。

1.3數據挖掘實現

采用改進的SVM算法來實現圖書館的個性化數據挖掘過程,建立面向多維度的圖書館個性化模型,然后轉化為附帶懲罰因子的無限制經驗最小化模型,用于改進支持向量機的算法[1617]。支持向量機算法在使用過程中具有監督的、可擴展和非線性的高效特性,能夠實現非線性的多核心數據聚類效果,從而提高數據挖掘的學習能力。通過分析圖書館數據挖掘的特征,本文設計高效圖書館的懲罰因子為無限制經驗損失最小化原則,其實現函數如式(1)。

f(x,y)=min

[SX(]λ2[SX)]ω2+[SX(]1m[SX)]

[DD(][DD)]l(ω,(x,y))

(1)

式中,f(x,y)代表數據挖掘結果;λ表示迭代周期;ω代表空間唯獨函數,x和y分別為數據挖掘字段。

通過公式(1)映射處理,將多維度下的附帶懲罰因子所帶來的損失降低,從而簡化為一個單一約束條件下的極值問題,然后進一步利用向量機函數將問題平滑問不受約束的優化機制,從而得到本文所需要的訓練樣本。

2決策分析體系構建

為了更進一步獲取用戶真正感興趣的圖書信息,本文引入基于模糊綜合評價法的決策分析體制機制,其具體實施流程,如圖1所示。

實施過程中,首先利用BP神經網絡對處理后的數據樣本進行適應性訓練,深層次結構上形成用戶隱形的興趣輸入層和模糊規程訓練層,然后進行模糊推理獲取模糊值,模糊值經過模糊化結構辨識后輸出實際值推送給用戶隱形決策分析機制中,用戶在使用過程中給予一定的正向反饋,該決策分析體系根據反饋結果進行不斷的自主學習并更新和優化樣品數據,從而獲取了不斷優化和更加個性化的圖書推薦服務。這一決策分析評價體系通過接口輸送至支持向量機的算法中,實現了一個閉合的良性循環。

3個性化推薦服務系統設計

3.1個性化數據挖掘功能需求

通過分析和研究目前高校圖書館在圖書信息使用過程中的問題,認為需要完善一下功能需求:

(1)讀者群體聚類分析,由于高校人數龐雜,專業分工明確,對圖書館的讀者進行聚類分析是非常有必要并且可行的。通過對讀者的專業、興趣愛好等進行聚類,可以將其分成若干讀者大群,便于進行針對性的數據挖掘和個性化推薦。

(2)關聯分析,每一個讀者大群代表著一類具有相同興趣愛好或者專業背景的用戶群體,利用支持向量機的算法進行關聯分析,當群體中讀者對某一本圖書的借閱量較多時,推薦該圖書給群體內的讀者具有很高的準確度。

(3)中圖分類號分析,我國建立了完善的圖書分類編號,引入中圖分類號進行圖書分類,極大提高了圖書的檢索效率,便于尋找同一類型圖書的關聯關系,同時還方便了圖書的整理和排架工作。

3.2系統整體架構設計

系統采用B/S開發環境,能夠最大限度的降低用戶成本,作為實現統一客戶端的服務器管理模式[1820]?;赪eb瀏覽器,本文根據實際圖書管理需要,開發出功能完善三層架構模式,其基礎的體系架構圖,如圖2所示。

用戶界面層:讀者通過賬戶密碼登錄系統后,一方面能夠更新個人基本資料,還能夠通過界面查詢圖書信息,包括歷史閱讀信息、歷史借閱信息等。同時,在使用系統過程中讀者能夠看到相關的圖書關聯推薦,獲取感興趣的圖書資料。

數據處理層:管理員通過后臺進行分析,將讀者的借閱進行進行數據挖掘和關聯分析,分別存入不同的讀者大群,當不同群的讀者登錄后就會根據其所在的身份進行個性化推薦,從而滿足讀者的借閱和搜尋需求,系統中的讀者關聯挖掘一般1一個月進行一次。

數據庫層:是系統最底層結構,本文采用MySQL數據庫,由微軟公司研發,該數據庫在可靠性、穩定性和安全性方面占據主要優勢,同時能夠提供外部各類數據接口并存儲系統類的圖書數據。MySQL數據庫中的DataMinning屬于一類商務數據智能挖掘技術,能夠從當前的圖書數據中獲取個性化推薦和展示。

3.3數據庫設計

(1)數據庫的實體描述

圖書館管理系統的數據庫設計中,首先分析數據字典中的數據存儲進行分析,確定數據庫表,然后分析各數據存儲之間的關聯關系,便于建立圖書管理系統數據庫,通常采用E-R圖進行數據結構分析。圖書館管理系統的E-R圖,如圖3所示。

(2)數據庫表設計

本文所采用的數據庫為MySQL,其作用是存放圖書管理所需要的基本信息,包括管理員信息表、讀者信息表和書籍信息表等等,由于該系統是基于學校圖書館原有系統開發而成,因此基礎數據將定期從圖書館系統更新到推薦系統中。下面對其中比較主要的表結構列舉如下。該信息表用于存放圖書館管理員的基本信息,包括ID、工號,姓名,性別,電話,住址。在已創建的數據庫library中,創建wardon表,添加字段,如表2所示。

該信息表用于存放讀者的基本信息,包括學號,姓名,性別,電話,專業,生效時間,失效時間。在已創建的數據庫library中,創建reader表,添加字段如表3所示。

該信息表用于存儲圖書信息,包括書號,書名,作者,出版社,出版時間,存放位置,簡介,在館狀態,是否被預約借閱。在已創建的數據庫library中,創建book表,添加字段如表4所示。

3.4實例展示與分析

為評價個性化推薦系統的實用效果,設定現在改系統內借閱過圖書的讀者,利用系統的大數據挖掘算法查看推薦結果。從圖3中可以看到,當用戶輸入自己想要的書籍名稱后,首先在搜索框內便會展現該類圖書的歷史搜索結果。那么根據算法其推薦的圖書為《一千零一夜波斯王子與中國公

主》、《一千零一夜天國之夢》和《一千零一夜阿拉丁神燈》等,

系統推薦的圖書與該讀者借閱圖書相似度較高,如圖4所示。

為驗證該圖圖書個性化推薦系統的用戶群體滿意度,本文在某高校圖書館使用該系統后的1年后對該系統運行過程中,針對圖書推薦體驗進行了滿意度問卷調查,問卷調查主要有以下四個選項:

C:系統推薦的圖書大部分不符合我的閱讀興趣,我很少借閱;

D:系統推薦的圖書不知道為什么都不是我感興趣的。

發送調查問卷150人,回收問卷132人,回收率88%,調查結果見圖4.調查發現選A的讀者占比為58%,選B的讀者占35%,說明在使用過程中對于該個性化推薦系統滿意度超過了90%,能夠為讀者用戶提供一定的借閱便利,如圖5所示。

4總結

為解決傳統高效圖書館管理系統在查閱文獻和圖書信

息效率低下,缺乏智能化推薦功能的現象,本文通過分析現有的大數據挖掘工具并融入決策分析體系,建立了圖書館個性化推薦服務系統設計平臺,并進行了實例展示和分析,得出以下結論:

(1)采用改進的SVM算法來實現圖書館的個性化數據挖掘,支持向量機算法在使用過程中具有監督的、可擴展和非線性的高效特性,能夠實現非線性的多核心數據聚類效果,從而提高數據挖掘的學習能力。

(2)利用BP神經網絡對處理后的數據樣本進行適應性訓練,用戶在使用過程中給予一定的正向反饋,該決策分析體系根據反饋結果進行不斷的自主學習并更新和優化樣品數據,這一決策分析評價體系通過接口輸送至支持向量機的算法中,實現了一個閉合的良性循環。

(3)通過對設計的個性化圖書館推薦服務系統使用體驗調查發現:選A的讀者占比為58%,選B的讀者占35%,說明在使用過程中對于該個性化推薦系統滿意度超過了90%,能夠為讀者用戶提供一定的借閱便利。

參考文獻

[1]

趙興華.數據挖掘在高校圖書館個性化推薦服務中的應用[J].電腦知識與技術,2020,16(4):56.

[2]蒲曄芬.基于動態更新的圖書館移動用戶行為模型研究[J].微型電腦應用,2020,36(1):102103.

[3]潘峻.基于雙向LSTM的圖書分類系統的設計與實現[J].信息技術,2020,44(1):6770.

[4]賀海俠.基于VRML的虛擬交互圖書館信息管理系統研究[J].信息技術,2019,43(12):131134.

[5]吳文臣.數據挖掘技術在圖書館推薦系統中的應用研究[J].電腦知識與技術,2019,15(33):241242.

[6]喬雅,吳琳.基于協同過濾推薦算法的圖書館智慧服務模式研究[J].微型電腦應用,2019,35(11):150153.

[7]張永強.基于文本相似度比較的高校圖書館個性化圖書推薦研究與實現[J].青海師范大學學報(自然科學版),2019,35(3):8591.

[8]陳豪.個性化推薦方法在高校圖書館書目推薦中的應用研究[D].貴陽:貴州財經大學,2019.

[9]李賀,侯力鐵,祝琳琳.移動圖書館情景感知信息推薦服務用戶接受行為研究[J].圖書情報工作,2019,63(12):94104.

[10]王振.基于R指數的高校圖書館核心圖書推薦模型研究[D].濟南:山東大學,2019.

[11]李志.基于深度學習的學術論文推薦研究[D].南京:南京航空航天大學,2019.

[12]崔金環,解海.微信的移動圖書館APP自動服務系統設計研究[J].自動化與儀器儀表,2020(2):132134.

[13]王晉月.圖書館電子移動設備借閱信息自適應提取方法[J].自動化與儀器儀表,2019(12):8790.

[14]時冬梅,張藝婕.圖書館書目數據自動采集模型構建[J].自動化與儀器儀表,2019(8):9194.

[15]彭珍.我國公共圖書館智慧服務研究[D].長沙:湘潭大學,2019.

[16]張艷霞.大數據時代高職院校圖書館的服務功能研究[D].石家莊:河北師范大學,2019.

[17]喬蕊.以理工科為主的高校圖書館圖書個性化推薦方法研究[D].北京:北京工業大學,2019.

[18]廖云璐.公共數字文化工程服務質量評價與對策研究[D].南昌:南昌大學,2019.

[19]周秋霞,楊春杰.基于物聯網技術的智慧圖書館監控管理系統設計[J].自動化與儀器儀表,2018(11):8588.

[20]劉淑娟.網絡環境下圖書館學術信息資源數據庫的建設[J].自動化與儀器儀表,2018(6):3536.

(收稿日期:2020.03.27)

猜你喜歡
個性化圖書館
基于OBE的Java程序設計個性化教學研究
個性化護理在老年病患者中的應用效果觀察
為小學英語個性化合作學習單做加法
圖書館
氣味圖書館
歡迎到圖書館做客
同桌寶貝
去圖書館
校本課程開發的個性化問題探討
呼喚雕塑家創作的個性化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合