?

個性化學術論文推薦研究綜述

2024-02-04 09:45張曉娟劉怡均
情報學報 2024年1期
關鍵詞:學術論文個性化論文

張曉娟,劉怡均,劉 杰,陳 卓

(1. 四川大學公共管理學院,成都 610065;2. 西南大學計算機與信息科學學院,重慶 400715)

0 引 言

學術論文是某一領域或學科的研究者在進行科學研究后,以文章的形式對自己的研究內容、方法、實驗結果以及結論等的總結與凝練。學術論文可以幫助研究者了解某個學科或領域的最新研究進展、研究現狀等,激發其科研動機的出現以及學術靈感的涌現。用戶獲取學術論文的最初方法是跟蹤其所感興趣論文中的引文,但該方法將研究人員局限于特定的引用群體,偏向于被大量引用的論文,且只能對所感興趣論文發表之前的論文進行跟蹤。作為該方法的補充,基于關鍵詞的論文搜索方法旨在通過關鍵詞檢索獲取相關論文,但該方法只適合于定向探索,并且用戶總是困擾于如何為查找新文獻形成恰當的查詢,因此,很難為用戶返回新的且有趣的文獻。在此背景下,學術論文推薦技術應運而生,即在用戶不需要提供查詢請求的情況下,主動地為用戶推薦潛在感興趣的論文,滿足用戶對學術論文的多元性與新穎性的需求。由于此技術能有效地化解學術大數據時代下信息過載與用戶獲取論文之間存在的矛盾,近年來引起了學界的廣泛關注與探討。

學界對學術論文推薦給出了不同的定義,一般會根據所指定推薦系統的輸入、推薦結果的目標受眾以及推薦結果類型加以概念界定[1]??v觀已有研究發現,學術論文推薦的輸入主要包括初始論文[2-4]、關鍵詞[[5-7]、用戶[8-9]、用戶與論文[10],或者更加復雜的信息,如用戶構建的知識圖[11]等,所面向的對象是單個用戶[12-16]或者多個用戶[17-19],推薦所返回的結果類型可能是單篇論文[8]或者論文列表[20-21]。本文所探討的推薦是輸入中至少包含了用戶因素的個性化學術論文推薦,最終推薦結果所面向的對象是單個用戶而非多個用戶,且返回的結果是滿足用戶個性化需求的論文列表。需要指出的是,本文所探討的個性化學術論文推薦包括以下兩種主要應用場景[22]:一是通過學習用戶和項目特征,向用戶推薦其潛在感興趣的學術論文,供用戶實現瀏覽、閱讀、收藏等操作;二是在論文撰寫過程中,通過學習作者寫作內容和風格,向其推薦密切相關的引文論文,又被稱為引文推薦。

本文以檢索詞“學術論文推薦”“論文推薦”“學術文獻推薦”“科技論文推薦”“引文推薦”“academic paper recommendation”“scholarly paper recommendation”“scientific paper recommendation”“research paper recommendation”“citation recommen‐dation”等,在Web of Science、Springer、中國知網、維普等數據庫以及Google 學術中,不限時間范圍地進行標題、主題、關鍵詞的逐步擴展檢索,總共獲得相關文獻160 余篇,通篇閱讀每篇文獻,最終篩選出與本文高度相關的121 篇文獻。對這些文獻歸納總結后發現,已有個性化學術論文推薦研究主要注重用戶個性化模型構建以及如何將用戶模型融合到學術論文的推薦排序中。根據已有的對用戶個性化興趣的不同建模方法,本文將個性化學術論文推薦研究主要分為基于協同過濾的方法、基于內容的方法以及基于圖的方法?;诖?,本文對3 類方法進行概括與梳理,在此基礎上對其數據集、評價方法和評價指標進行總結。最后,對個性化學術論文推薦的未來發展方向進行展望。當前已有相關文獻[1,23-25]對學術論文推薦的相關工作進行了綜述,相對于已有文獻,本文的不同之處在于:①本文只探討個性化學術論文推薦的相關技術,且重點探討已有研究如何對用戶個性化信息建模以及將其融入論文推薦模型中;②從不同視角對已有研究進行歸納與總結。

1 基于協同過濾的個性化學術論文推薦

任何協同過濾算法的有效性均基于人類偏好是相關的這一基本假設[26]。作為個性化學術文獻推薦領域常用的實現方法,基于協同過濾的方法是基于群體智慧,在利用用戶群體偏好所暗含關聯的基礎上建立用戶模型,實現個性化推薦。根據對用戶個性化信息的不同建模方法,此類方法的實現主要有基于用戶的協同過濾與基于模型的協同過濾。

1.1 基于用戶的協同過濾方法

作為一種矩陣內預測方法(in-matrix predic‐tion),基于用戶的協同過濾方法的目標是為用戶推薦其并未交互過但是至少被其他一個用戶交互過的文獻,這也是傳統協同過濾探討的問題。如圖1a 所示,在為用戶1 推薦相關論文時,候選論文只能是出現在評分矩陣中的論文,即應是被用戶2、3、4、5 曾交互過的論文。具體而言,該方法根據用戶的一些人工顯式標注數據或一些隱式用戶行為數據,如引用行為、下載行為、閱讀行為、查閱行為等,來構建表征用戶興趣的用戶-論文矩陣,再利用余弦相似度或者皮爾遜系數等計算用戶相似度,最后將與目標用戶相似度高的其他用戶所喜歡的且目標用戶并未交互過的論文推薦給目標用戶。

圖1 兩類協同推薦方法的示例

因在實際場景中用戶對論文進行顯式評價的參與度很低,故已有研究中主要是基于用戶隱式評價信息構建用戶-論文相似性矩陣。根據在構建此類矩陣時所考慮的隱式數據,此類研究主要歸為以下兩種方法。

(1)基于簡單隱式數據的方法

作為學術論文推薦的早期方法,基于簡單隱式數據的方法主要采用用戶閱讀文獻的頁數[27]、用戶下載論文次數[26]、用戶對文獻資源的學習次數[28]、用戶對文獻的引用次數[29-31]等隱式評分來構建用戶-論文矩陣,實現個性化推薦。此方法簡單、容易實現,但只采用了少量可以表明用戶偏好的可觀測數據,容易為推薦過程帶來數據稀疏或冷啟動的問題。

(2)融合用戶之間信任關系的方法

考慮到協同過濾中用戶之間并非完全獨立,而存在一定關聯關系,有些學者嘗試在計算用戶相似度時,除考慮用戶評分相似性之外,也融合用戶之間的信任關系,以此來融合具有間接鄰居的排序信息。例如,Liu 等[32]構建了基于序列的信任模型,并將該模型融合到協同過濾推薦系統中;Jamali等[33]提出在用戶信任網絡中的游走方法,該方法不僅考慮目標項目的評級,還考慮類似項目的評級,最終實現基于信任和基于項目的協同過濾;李默等[34]在協同過濾中融合相似性評價、信任度與社會網絡的方式,并采用AHP (anlytic hierarchy pro‐cess)方法分析了3 種推薦策略對不同類型用戶的相對重要性權重。

從整體來看,基于用戶的協同過濾在無需知道待推薦論文內容的情況下就可實現推薦,并且考慮了用戶對項目的真實質量評估信息,推薦結果也具有一定新穎性。但此類方法存在如下問題:①需利用所有的用戶數據來進行計算,當數據量大時存在計算復雜度大的問題,也會使推薦系統面臨嚴重的模型可擴展性低的問題;②存在著冷啟動問題,即難以為新入門學術用戶或者對新發表論文實現推薦,如圖1b 中的文獻4 和文獻5 并未出現在用戶評分矩陣中,即未被任何用戶評分過,若采用傳統協同過濾方法,則難以將這兩篇文獻推薦給用戶。

1.2 基于模型的協同過濾方法

為了解決基于用戶協同過濾模型中的問題,例如,將圖1b 中的文獻4 和文獻5 向用戶進行有效推薦,學者們提出了基于模型協同過濾方法,借助用戶與論文之間的部分評分數據,預測用戶對論文的偏好[35-40]。該方法是一種矩陣外預測(out-matrix prediction)方法,即為用戶推薦并未出現在用戶的評分矩陣中的文檔,以此來解決新發表論文的冷啟動問題。其中,常用的矩陣分解方法主要有基于隱因子矩陣分解的方法、基于概率矩陣分解的方法以及基于神經矩陣分解的方法。

1.2.1 基于隱因子矩陣分解的方法

隱因子矩陣分解的實現原理如圖2 所示。其中,R表示用戶對論文的評分矩陣,U和V分別表示矩陣分解模型后得到的用戶和論文的隱式特征因子。具體而言,在矩陣分解中,首先將用戶和論文表示為一個共享的低維隱式的K維向量,ui表示用戶i的向量,vj表示文獻j的隱式向量。用戶i對論文j的偏好主要是通過計算兩個向量的內積進行預測,即

圖2 隱因子矩陣分解的原理

論文推薦系統中全部用戶和項目的隱式向量組成了隱式特征矩陣U與V,故用戶的評分預測矩陣為

此類模型的求解就是如何利用已知的用戶評分數據R?訓練出用戶和項目隱式因子特征矩陣U和V。即先初始化向量U和V中的值,再最小化給定的損失誤差函數,目標是將訓練集中預測評分和實際評分之間的均方誤差最小化。

基于此方法的主要研究如下。戴大文[35]構建了包含用戶瀏覽信息的用戶-偏好矩陣、包含引用關系的論文-論文引用矩陣、包含論文摘要信息的論文-論文相似度矩陣,并進行矩陣分解同時優化求解,獲得用戶潛在特征矩陣、論文潛在特征矩陣、論文因子矩陣,再對這3 類矩陣進行優化求解得到基于用戶偏好的學術論文排序??紤]到學術論文領域每年大量新文獻產生了協同過濾中用戶排序數據稀疏的問題,Mohamed 等[36]采用層級注意力模型(hierarchical attention network),通過對論文中的標題和摘要進行嵌入式表示來實現標簽預測,然后將標簽感知的文檔表示合并到矩陣分解框架中,以此為用戶獲得文檔排序。馬慧芳等[37]在經典矩陣分解算法的基礎上,融合作者與文獻影響力來實現推薦。吳燎原等[38]進一步通過科研社交網站中的好友列表生成用戶矩陣,再根據論文的主題分布得到論文之間的相似矩陣,然后分別以用戶和論文正則化項的形式融合到改進后的like-wise 方法中實現個性化推薦。Zhao 等[39]首先利用用戶的歷史行為(收藏夾記錄)構建用戶-文獻評分矩陣,并對該矩陣進行分解得到用戶和文獻的初始潛在特征向量,再將傳統隱式因素模型與雙向門遞歸神經網絡結合,深入挖掘文本非結構化內容中的潛在語義,生成新的文獻潛在語義向量,并用于替換從最初用戶評分矩陣中分解得到的初始的文獻潛在特征向量,生成一個新的評分矩陣,最后根據用戶的隱式因子變量生成推薦列表。李志[40]利用深度學習中的BiLSTM(bidirectional long short-term memory)網絡學習論文中的文本信息,獲得論文項目隱表式,然后結合隱因子矩陣分解模型擬合用戶評分矩陣,提升用戶對論文隱式反饋評分預測的準確度。吳俊超等[41]提出基于卷積協同過濾的學術論文推薦,即在矩陣分解的基礎上,利用三維卷積神經網絡學習用戶與論文不同特征的高階交互關系來實現推薦。Ren 等[42]利用張量和矩陣對論文鏈接關系以及研究者之間的社交網絡多重關系建模,并在此基礎上提出了一種聯合多種關系的因子分解算法,以此來預測用戶對新發表文獻的偏好。

與傳統的協同過濾方法相比,基于隱因子矩陣分解的方法能融入更多的用戶和文獻的特征,提升最終推薦的準確度。但該方法存在如下缺陷:在該方法中獲得的用戶隱因子與論文隱因子中每個維度并不能與任何一個可解釋的語義關聯,因此,該模型是一個黑箱模型,相對于傳統協同過濾方法,此方法的預測結果缺乏可解釋性。

1.2.2 基于概率矩陣分解的方法

概率矩陣分解的原理如圖3 所示。該模型將協同過濾過程建模為概率模型,假設用戶潛在特征矩陣和項目潛在特征矩陣均服從某一分布,從概率生成角度解釋用戶和論文隱式因子。其中,Ui表示用戶i的隱式特征向量,Vj表示項目j的特征向量,Rij表示用戶i對項目j的評分值,σU和σV是Ui和Vj對應的參數。

圖3 基于概率矩陣分解的模型圖

根據在模型中所融合的信息類別,此類方法主要分為兩類。

(1)融合深度挖掘的文獻內容的方法。該方法中的常用模型是Wang 等[20]提出的協同主題回歸模型(collaborative topic regression,CTR),即利用潛在主題空間將協同過濾和主題模型融合到一個概率模型中,獲得用戶和項目的可解釋的潛在結構,并以此實現對已有以及新發表文獻的推薦。為了在此模型中進一步融入用戶對研究熱點的偏好,李冉等[43]提出一種基于頻繁主題集偏好的協同主題回歸模型,即利用LDA(latent Dirichlet allocation)主題模型,從用戶閱讀文獻挖掘出論文-主題概率矩陣,并篩選論文中概率較高的主題,進而得到主題-頻繁主題概率矩陣;利用基于頻繁主題集偏好的主題回歸模型預測未知評分時,對包含頻繁主題的論文給予偏重,以此實現推薦。Purushotham 等[44]利用社交矩陣分解方法將用戶之間的社交網絡信息融合到CTR 模型中。Wang 等[45]對其進行擴展,提出了關系協同主題回歸模型(relational collaborative topic regression),即將用戶-項目之間反饋、論文內容和網絡結構信息合并到一個分層貝葉斯模型中,且該模型包含的一系列關系概率函數可用于模擬論文之間的關系;實驗證明,該模型在預測精確度以及計算成本方面均優于CTR 模型。劉智超[46]根據研究人員收藏的論文信息提出一個主題模型ACTOT(au‐thor conference topic over time),先計算其興趣主題特征,再將用戶的主題向量和論文的主題向量與概率矩陣分解模型中用戶隱式因子向量和論文的隱式因子向量結合,最后實現論文推薦??紤]到以上拓展的CTR 模型均難以為評分數據較少的用戶進行預測,也無法生成與特定任務相關的推薦,黃澤明[47]根據用已讀論文的評分來獲得用戶對不同主題的需要程度,并以主題的評分構建用戶特征,提升推薦結果的驚喜度。除了以上基于CTR 及其拓展模型的相關研究外,有學者嘗試利用深度學習方法挖掘文本內容,并將其融合到概率分解模型中。例如,Alfarhood 等[48]利用聯合概念矩陣分解時綜合考慮了文獻的內容信息,并且提出利用協同注意力自動解碼器(collaborative attentive autoencoder) 學習文獻中的隱式因素;屈冰洋等[49]首先利用堆疊自動編碼機(stacked denoising autoencoder,SDA)模型提取用戶特征,再融合注意力機制的BiLSTM 網絡提取文獻特征,最后在概率矩陣分解中,融合用戶特征矩陣和文獻特征矩陣,從而實現預測學者的學術文獻偏好。

(2)融合文獻外部信息的模型。除了文獻主題外,有些學者嘗試將文獻信息(如研究員標簽信息、社交信息等)融合到概率協同過濾模型中。例如,吳磊等[50]根據科研人員標簽與未讀論文之間的相似度抽取添加負例數據,然后融合論文相似度以及科研人員標簽信息進行聯合概率矩陣分解,在概率矩陣分解階段融合科研人員-標簽關聯矩陣以及論文相似度信息進行約束,以緩解數據稀疏對最終結果的不利影響;Wang 等[51]提出了將朋友關系信息融合到協同過濾方法中,以解決由于數據稀疏而導致的推薦精度低的問題,改進的協同過濾方法在3 個階段實現——研究者文章-矩陣形成、社交朋友-矩陣形成和統一概率矩陣分解,最終實現個性化推薦;吳燎原等[52]認為,科研社交網絡中存在大量興趣愛好相同且研究領域相似的群組,在聯合概率矩陣分解的基礎上,融入了用戶給論文所添加的標簽信息以及用戶加入的科研群組信息,提出一種科研社交網絡中基于聯合概率矩陣分解的論文推薦方法。

總之,概率矩陣分解方法是當前個性化學術文獻推薦的主流矩陣分解方法。相對于隱因子矩陣分解方法,概率矩陣分解方法能夠處理更大規模且失衡的數據集,還能更容易地應對評價信息較少的用戶。但概率矩陣分解模型存在如下問題:①該模型的內部工作原理難以理解,推薦結果缺乏可解釋性,仍是一個黑盒模型;②概率矩陣分解模型的執行通常以假設用戶的評分數據服從正態分布為前提,然而實際所獲取的數據并不完全滿足此前提條件,因而影響著模型的最終推薦準確度。

1.2.3 基于神經矩陣分解的方法

神經矩陣分解的方法是將傳統矩陣分解中的內積操作與神經網絡結構結合,可以進一步捕捉非線性特征和更多特征組合。該方法的基本原理如圖4所示。其中該模型每層的輸出層均可以作為下一層的輸入層,最開始的輸入層分別是由表示用戶和項目(文獻)的向量組成;用戶與文獻之間的交互關系體現在神經協同過濾層。目前,此方法在學術文獻推薦中的應用還不夠廣泛,有限的相關研究主要有:陳雨民等[53]通過預訓練BERT 模型獲得論文標題摘要中的向量表示,并且提出標題摘要注意力機制捕捉標題摘要之間的語義關系,最后結合改進的神經協同過濾模型處理用戶-論文隱反饋信息實現推薦;馬驍烊等[54]提出了基于標簽卷積神經網絡的推薦模型,結合神經網絡和協同過濾技術的同時,將標簽加入神經網絡的設計中,以此輔助特征提取,從而實現用戶對論文偏好的預測。

圖4 神經矩陣分解的基本原理

雖然神經矩陣分解方法在當前個性學術文獻推薦領域應用較少,但因其在融合海量的多模態數據(如文本數據、圖片數據)、高階復雜的交互關系、時序建模等方面所體現出的優勢,將會是未來個性化學術文獻推薦領域考慮的主要協同過濾技術。

2 基于內容的個性化學術文獻推薦

該方法主要根據用戶與系統交互過(如閱讀、引用或者收藏等)的項目內容特征來構建用戶興趣模型,再根據候選學術論文與用戶興趣之間相似度來實現個性化推薦。根據構建用戶興趣模型時采用的不同特征,此類研究又可細分為基于詞向量特征、基于文本語義特征、基于用戶知識背景特征以及基于時態特征的方法。

2.1 基于詞向量特征的用戶模型構建

作為基于內容的最早期方法,此方法主要借助用戶發表或者引用文檔內部或其他外部信息中的詞表征用戶偏好,利用TF-IDF (term frequency-in‐verse document frequency)方法將其表示為向量空間模型(vector space model,VSM),再通過計算用戶與候選論文之間的向量相似度實現個性化推薦。根據個性化信息的不同來源,此類方法又可分為兩類。①基于文檔中詞的方法。通過用戶所發表[55-57]或引用[58]文檔中論文標題、關鍵詞、摘要等信息,構建用戶偽文檔與候選論文的向量,再根據余弦相似度獲得個性化推薦。②融合其他外部數據的方法。為了進一步豐富用戶個性化信息,有些學者嘗試利用多種外部數據,如用戶標簽[59-60]以及其他外部資源[61-62]等來表征用戶偏好向量并實現推薦。

基于詞向量表示的方法能在一定程度上表征用戶和論文特征,但此類方法中單詞通常被視為孤立元素,不能較好地表達用戶興趣和文獻的語義內容,忽略了多義詞以及概念之間關系對推薦結果的影響。

2.2 基于文本語義特征的用戶模型構建

為發現文檔間的潛在語義關聯,并解決一詞多義、異形同義等問題,也有學者嘗試利用主題模型或者深度學習模型,如word2vec、doc2vec 等對用戶偽文檔進行潛在主題(語義)分析,即將文檔高維的詞頻空間映射到低維的主題(語義)空間,以提升個性化推薦的準確度。

2.2.1 基于主題模型的方法

此類方法主要是借助LDA 模型對文獻與表征用戶興趣的文本進行潛在主題分析并實現推薦。根據實現的推薦目的,此類方法又可細分為基于主題相似度的推薦、滿足用戶驚喜(serendipity)的推薦和跨領域的推薦。

(1)基于主題相似度的推薦。此類研究主要探討如何返回與用戶偏好主題相似的學術論文。例如,杜永萍等[63]利用LDA 模型,將候選文獻與用戶所發表文獻表示成潛在主題向量,再利用Apriori算法挖掘出頻繁出現的高效能主題集合,即研究熱點,然后根據候選文獻與用戶所發表文獻中高效能主題的分布相似度來返回用戶感興趣的學術論文;Amami 等[21]利用已發表或合作發表論文中的摘要來構建用戶偽文檔,并利用LDA 模型獲得該文檔中每個主題下的詞的概率分布,進一步將待推薦論文利用語言模型來表示為詞概率分布,通過計算論文中詞概率分布以及偽文檔中主題下詞概率分布的相似性來實現推薦;李曉敏等[64]分別利用TF-IDF 算法、TextRank 算法和LDA 模型得到學術論文和核心作者的特征詞,利用word2vec 對特征詞進行向量化,計算核心作者和學術論文的余弦相似度。以上研究只為學者構建了單一的用戶模型,未考慮學者有多個興趣的情況,于是陳金鵬[57]提出基于頻繁模式的學者興趣模型,利用LDA 處理用戶興趣集,采用FP-growth(frequent pattern - growth)算法從處理結果中挖掘一個頻繁模式集,通過簡化該頻繁模式集來建立相應興趣模型。

(2) 滿足用戶驚喜(serendipity) 的推薦。此類研究在對文獻集進行主題分析基礎上,借助一些主題多樣方法為用戶推薦相關且具有驚喜(出乎其意料之外)的學術論文[65-66],以此提升推薦結果的吸引力與有用性。例如,黃澤明[47]利用CTM(cor‐related topic model)關聯主題模型挖掘不同主題間的關系,根據主題間的關聯程度實現推薦,從而提升推薦結果的驚喜度;為了提高推薦論文中知識的多樣性和驚喜度,李響等[67]提出一種基于潛在語義分析(latent semantic analysis,LSA)和最大邊緣相關性的方法,從學者研究興趣與待推薦文獻的語義相關性、待推薦文獻集合的主題多樣性以及影響力3 個維度為用戶推薦具有驚喜的論文;劉旭暉[68]先獲得特定專家所發表論文的摘要數據,然后利用LDA 模型獲得文獻與用戶興趣之間的主題相關性,并進一步考慮待推薦文獻的主題多樣性以及影響力,最終得到具有驚喜的推薦結果列表。

(3)跨領域的推薦。此研究在對文獻進行主題分析的基礎上,構建不同(學科)領域之間語義關聯性,以此實現為學者推薦不同領域的文獻。例如,Xie 等[69]提出了利用層級監督式生成模型(hi‐erarchical supervised latent Dirichlet allocation) 來學習詞與現有學科分類(領域語義)之間的概率關聯,利用影響函數、相關性指標以及排序機制表示領域之間的語義相關性,最后將待推薦論文內容與用戶興趣表示為目標領域中的概率分布,并實現跨領域的學術論文推薦;Ravi等[70]構建了一個基于用戶正在閱讀的新聞文章內容進行學術論文推薦系統,即利用RNN-LSTM(recurrent neural network - long short-term memory)模型,通過測量推薦論文與輸入文檔之間潛在的語義相似度,向用戶推薦相關論文。

LDA 模型雖然在一定程度上提升了用戶偏好或者論文的特征表示的準確度,并且能實現推薦結果的驚喜度以及跨領域推薦等,但LDA 模型是以忽略了詞序的詞袋數據作為輸入,忽略了詞的上下文信息,故只能發現文本的淺層次語義,影響最終推薦的準確度?;诖?,一些學者在LDA 模型的基礎上,結合學術論文的作者、發表時間、發表期刊、會議等信息提出了諸多拓展的模型,相關模型的具體信息以及在個性化學術文獻推薦中的潛在應用如表1 所示。

表1 基于LDA的拓展模型

2.2.2 基于深度學習模型的方法

為突破主題模型中存在的瓶頸,學者們借助深度學習模型對學術論文的文本序列進行挖掘,融合上下文關系,增強用戶與論文特征的提取。例如,Hassan[77]在構建用戶偽文檔時,綜合利用用戶明確指定的感興趣論文的標題和摘要信息,以及用戶在PubMed Central 查詢時瀏覽的摘要與點擊的全文信息,分別利用遞歸神經網絡(recurrent neural net‐work,RNN)發現論文中連續和潛在語義特征,獲得候選論文和用戶偽文檔向量,最后根據向量相似度實現推薦;王妍等[13]融合深度學習方法,引進了詞向量模型,將論文和用戶轉換為詞向量空間,并利用WMD (word mover distance) 計算兩者相似度,進而實現個性化推薦;Guo 等[8]利用研究者發表的論文構建偽文檔,認為論文標題和摘要之間存在語義關聯,基于此,提出了標題-摘要注意力記憶網絡,該網絡可以從句子級別和單詞級別捕捉摘要與標題之間的語義關聯,并通過連續句子模式對用戶和候選論文進行建模,從而實現個性化推薦;Yang 等[78]提出了基于注意力的編碼器-解碼器(at‐tention-based encoder decoder,AED)模型,實現了局部引文推薦,該模型先建立了一個編碼器,并將引文上下文表示為低維向量空間,然后構建了一個發表論文的期刊(或會議)信息和作者信息的注意力機制,再利用遞歸神經網絡(RNN) 構建解碼器,最后將解碼器的輸出映射到softmax 層,根據給定的引文上下文、作者信息和期刊(或會議)信息等對候選論文進行評分。

總體來說,深度學習強大的語義表征能力為提取用戶和學術論文深層次特征提供了支持,但目前此類方法仍將學術文本視為普通文本,未考慮到學術論文的特殊篇章結構信息。另外,此類方法通常只采用用戶歷史發表文獻信息來表征用戶興趣,如何利用深度學習挖掘更多表征用戶偏好信息(如用戶行為序列、用戶社交關系等) 是后續的研究重點。

2.3 基于用戶知識背景特征的用戶模型構建

與其他資源不同的是,學術論文是用戶獲取知識的目標知識源,因此,學術用戶一般根據其背景(領域)知識即知識儲備來獲取相關文獻[79],于是有些研究者認為用戶背景知識特征也是個性化論文推薦時需要考慮的重要用戶因素。其中,此類研究主要根據用戶研究目標描述、用戶閱讀記錄或者發表論文表征用戶背景知識,利用領域類目體系、本體或者概念網絡形式對用戶領域背景知識與文獻中的知識進行建模,通過計算學術文獻中的新知識與用戶背景知識的關聯程度來實現推薦。例如,Zhao等[80]在實現論文推薦時,為了減少研究者背景知識與研究目標之間的知識鴻溝,先將領域知識表示為概念地圖的形式,從領域語料中抽取核心概念,構建知識之間關聯,再通過分析學習者的閱讀記錄對其領域知識進行建模,且從研究者的研究計劃中抽取目標知識,最后從知識地圖中抽取這兩類知識之間的最短距離,以此實現推薦;劉康[81]先根據用戶閱讀文獻和研究目標的描述,構建包含用戶背景知識和研究目標知識的兩層用戶知識模型,利用LDA和CTM 模型對學術論文進行主題(知識) 分析,并在知識圖譜中加入概率模型形成了不確定知識圖譜,構建知識之間的關聯程度并實現推薦;譚紅葉等[82]提出一種基于知識脈絡的學術文獻推薦,即以論文中的關鍵詞為核心,分別從字形以及語義層面抽取關鍵詞之間的同義關系、上下位關系以及共現關系等,以關鍵詞為節點,并以關鍵詞之間的語義關系構建論文知識脈絡,最后以論文關鍵詞作為用戶興趣的顯著標識,將用戶和論文資源分別表示為關鍵詞向量,借助論文知識網絡計算用戶與論文之間關鍵詞向量的語義相似度,從而實現個性化論文推薦;Kuai 等[79]提出了一種知識驅動的個性化文獻推薦方法,即在深層學術論文語義辨析的基礎上,先利用主題詞聚類和領域標簽實現對文獻的概念分析與知識推理,構建了跨領域知識地圖,再利用深度語義識別算法計算用戶知識需求(利用用戶提交關鍵詞所返回文檔與所構建的知識地圖分析主題信息而獲得)與文檔之間的知識相似性,最后實現個性化推薦。

此類方法能在一定程度上提升用戶對推薦結果的滿意度,但目前研究對文檔的知識抽取主要來源于論文關鍵詞和摘要。摘要和關鍵詞雖然能對文獻高度概括,但并非一定能體現文獻的核心知識。未來研究需通過挖掘文本中句子復雜的語義關聯,構建句子之間的復雜文本語義網絡識別其核心知識,并在此基礎上,通過構建用戶、核心知識與學術文獻之間語義關聯來實現推薦。另外,此類研究對用戶背景知識建模主要停留在單一的歷史行為,后續研究可考慮如何進一步結合學習理論中的建構主義觀以及認知學習理論[83]對用戶知識背景建模。例如,從建構主義觀,考慮如何對用戶已掌握的知識與文獻中的新知識建立邏輯關聯,促進學術用戶進行有意義的學習;從認知學習理論,考慮如何從心理角度對用戶認知需求、認知風格進行測量,以此來豐富用戶知識背景。

2.4 基于時態特征的用戶模型構建

此類方法主要是借助用戶偽文檔中的時態特征(如文獻發表時間、用戶歷史行為發生時間等)實現滿足用戶動態需求的個性化推薦的目的。主要采用的方法有基于時間衰減函數的方法和基于序列模型的方法。

(1)基于時間衰減函數的方法:該方法認為用戶的興趣會隨時間而動態變化,且最近的用戶歷史行為更能體現其當前偏好,故采用時間衰減因子對不同時間段用戶歷史行為進行加權,從而實現個性化推薦。常用的時間衰減函數信息如表2 所示。

表2 個性化學術論文推薦中常用的時間衰減函數

(2) 基于序列模型的方法:根據用戶歷史行為,利用序列模型對序列中項目的相對順序以及時間間隔和持續時間進行建模,預測用戶的未來興趣。例如,Chaudhuri 等[22]為了對用戶的動態意圖建模,先利用由LDA 和word2vec 組成的混合模型為每篇論文確定一個主題,再利用序列LSTM(long short-term memory)模型,根據用戶歷史所交互論文的主題以及用戶連續點擊兩篇論文之間的時間差對用戶的動態意圖進行建模;Wang 等[89]提出了融合嵌入層、耦合輸入與遺忘門的LSTM 模型(inter‐val- and duration-aware LSTM with embedding layer and coupled input and forget gate,IDLSTM-EC),該模型能感知序列行為中的間隔和持續時間,能利用時間間隔和持續信息來準確捕獲用戶的長期和短期偏好,且該模型結合了輸入層中序列的全局上下文信息,可以更好地利用長期記憶;Ma 等[90]為了實現按時間順序的引文推薦,利用多層感知器模型對不同時間片段中用戶引用文獻的概率分布建模來預測用戶對引文的時間偏好,然后利用時間偏好信息對基于內容過濾獲得的初始引文列表進行重排序,從而生成最后的引文推薦列表。

由以上文獻分析可知,已有對學術用戶動態需求建模的研究主要依賴于用戶歷史數據。隨著新技術和新主題的發展,學術用戶可能隨時產生與歷史偏好不同的興趣,僅借助歷史數據難以對用戶新興興趣進行建模。因此,未來研究需考慮如何選取能捕捉用戶新興興趣的外部資源,并建立用戶與其之間的關系,以此對用戶潛在的新興興趣進行探測,并將預測結果融合到推薦模型中。

3 基于圖方法的學術論文個性化推薦

基于圖的方法嘗試利用圖中節點關系和知識關聯,如科研者之間合作關系、引用關系等,來發現學術論文之間以及用戶與學術論文之間的多維關系,提升個性化推薦的準確度。根據圖中捕捉用戶個性化信息所采用的不同方法,此類研究可細分為基于重啟式隨機游走的方法、基于元路徑的方法以及基于圖嵌入式的方法。

3.1 基于重啟式隨機游走的方法

在構建異構網絡圖的基礎上,將用戶信息融合到表示重啟式隨機游走(random walk with restart,RWR)起點來實現個性化推薦。其中,RWR模型的計算公式為

其中,M表示圖中各類實體之間的轉移概率矩陣;q0表示初始矩陣;β表示重啟概率;r(t)表示隨機游走到第t步時訪問節點i的概率。如式(3)所示,迭代應用RWR 模型中的隨機游走器直至收斂,即下一狀態r(t+1)和最后狀態r()t之間的差值小于給定的收斂值閾值,此時達到了收斂的穩態c。最后,對r(c) 中論文節點的穩態值進行降序排列,將排名靠前的論文視為查詢q0返回的推薦結果列表。其中,如何設置轉移概率矩陣M和初始矩陣q0,是此類方法需探討的重點問題。已有文獻對這兩個問題的研究匯總如表3 所示。

表3 基于隨機游走的相關方法

整體來說,隨機游走方法能獲得豐富的交互網絡,并且利于發現用戶與文獻之間的間接聯系。但是,隨機游走方法存在如下缺陷:往往存在對發表年限較長論文賦予過高權重的問題,難以實現對新文獻的推薦;隨機游走在大規模圖中存在效率低的問題,由于需要參數優化推薦流程,會面臨由參數原因導致推薦結果差的問題。

3.2 基于元路徑的方法

元路徑(meta path)是定義在網絡模式TG=(A,R)中的一條路徑表示節點類型Ai和Ai+1之間建立關系R,其中R=R1°R2°…°Rl表示關系上的組合操作。在圖5中,作者與主題的關系,可以通過author →writespaperm→ethodstopic (APT) 以及 au‐兩條路徑鏈接。在異構網絡中兩個對象能夠通過不同類型的屬性類型相互連接,不同的屬性路徑具有不同含義,因此,兩個對象的相似度計算依賴于異構信息網絡的元路徑。異構學術網絡圖示例如圖5所示。

圖5 異構學術網絡圖示例

其中,基于元路徑的個性化學術論文推薦是基于人工在異構網絡中創建一些元路徑(兩個節點之間的不同路徑類型),再根據元路徑中相關信息來實現推薦。根據所采用元路徑不同的信息類別,此類研究的方法主要分為基于元路徑的相似度計算和基于元路徑中特征挖掘的推薦。

(1)基于元路徑的相似度計算。將元路徑中起點設為用戶,終點設為候選論文,再通過計算從用戶到候選論文兩個節點之間的路徑數和源節點的度與目標節點的度計算兩個節點之間的相關性,從而實現個性化推薦[97]。例如,王勤潔等[98]選取了兩條元路徑:author→paper→terms→paper(APTP;與某位作者發表的論文含有相關關鍵詞的論文)與au‐thor→paper→journal→paper (APJP;與某位作者發表的論文在同一個期刊的論文);采用作者偏好為異構信息網絡中的不同元路徑加權,然后利用DPRel(meta-path based relevance measurement)算法計算作者-文獻相關度,結合權重得到加權作者-文獻相關性矩陣,從而實現推薦;朱祥等[99]利用元路徑理論和DPRel 相關性度量算法構建作者-文獻相關性矩陣,依據相關性排名實現學術文獻推薦。

(2)基于元路徑中特征挖掘的推薦。根據元路徑的拓撲或者序列特征挖掘用戶偏好信息,利用隨機游走或者機器學習方法實現個性化推薦。Ma等[100]為了實現對新論文的個性化推薦,首先,構建了研究者、論文、論文發表的期刊或者會議以及主題的異構圖,基于訓練數據選擇前K個最感興趣的元路徑;其次,提出了一種貪婪方法來選擇通過合并元路徑生成的最重要的元圖,該方法可以描述研究人員和論文之間比簡單元路徑更復雜的語義;同時,從網絡中提取元路徑和基于元圖的拓撲特征;最后,在決定研究者的新論文推薦時,使用監督模型來學習與不同拓撲特征相關的最佳權重。Li等[101]提出了利用論文、地點、作者、關鍵詞和用戶實體以及這些實體之間的關系構建異構圖,以網絡中的元路徑來捕捉用戶偏好,并利用基于元路徑的隨機游走方法計算候選論文與目標論文之間的相關性,最后使用貝葉斯個性化排序(Bayesian per‐sonalized ranking,BPR)作為目標函數來學習不同元路徑上的個性化權重。Xiao 等[102]利用多語義路徑融合的異構網絡為研究生實現了個性化論文推薦,即先構建異構教育網絡(heterogenous educa‐tional network,HEN),利用投影子網絡生成不同的語義元路徑,再通過多語義路徑融合提出一種HEN嵌入方法,以此生成豐富的HEN 節點序列,最后通過目標路徑相似性為研究生推薦個性化的論文列表。為了避免太多較長的元路徑可能導致較高的計算成本,并將噪聲信息帶入推薦模型,Xu 等[103]利用信息增益方法篩選有價值的元路徑,然后在每個用戶所包含的元路徑中借助基于正則化的優化方法來學習個性化權重,最終實現個性化推薦。

總之,基于元路徑方法能有效利用圖結構來挖掘用戶與論文之間的高階關系,但此方法需要領域知識定義元路徑類型與數量,人工所定義的簡單元路徑難以捕捉到圖中所有描述研究人員如何發現有趣論文的可能拓撲特征,也難以實現跨領域推薦。

3.3 基于圖嵌入式的方法

作為近年來學者們積極嘗試的方法,圖嵌入原理是使用基于神經網絡的網絡嵌入式方法為圖中節點學習低維向量[104],以此獲取表征用戶興趣或者論文等的低維度潛在向量,再利用向量相似度來獲得個性化推薦。根據采用的嵌入式方法的不同,又可細分為基于隨機游走的嵌入式方法和基于深度學習的嵌入式方法。

(1)基于隨機游走的嵌入式方法。該方法主要應用于研究者只需要采用部分學術異構圖的拓撲圖數據或者圖太大而無法測量其整體的情況,即利用圖上的隨機游走來獲得節點表示的嵌入技術。例如,Cai 等[105]提出了一種基于書目網絡表示的個性化引文推薦方法,該方法結合了書目網絡結構以及不同類型對象(如論文、作者和地點)構建異構網絡,利用有偏的隨機游走(biased random walk)序列學習圖中結構關系,再將圖結構關系以及圖中節點中的文本信息作為神經網絡的輸入,經過訓練為每個節點生成向量,最后,根據節點向量之間的相似度實現個性化推薦;Chen 等[106]在構建學術異構網絡時,在文獻引用關系中考慮了作者引用傾向,設計了一個有偏見的隨機行走程序有效地探索文獻的特征和引用信息,采用skip-gram 模型學習游走序列中節點的鄰域關系,并將節點映射到向量空間,最終通過向量相似度實現個性化推薦。

(2)基于深度學習的嵌入式方法。該方法主要借助深度學習模型(如自動編碼器等)對學術異構圖中的高度非線性結構進行建模,以此來獲得節點嵌入式向量。例如,Cai 等[107]利用生成式對抗網絡(generative adversarial network) 結合異構數據網絡(如論文、作者、論文初稿以及初稿作者)節點內容與網絡結構來實現對不同實體的嵌入式表示,并實現個性化推薦;Ali 等[108]提出了一種異構圖嵌入式模型PR-HNE(paper recommendation based on het‐erogeneous network embedding),該模型將來自6 類信息網絡的信息(作者-作者圖、作者-論文圖、作者-主題圖、論文-論文圖、作者-機構圖、論文-標簽圖)嵌入一個聯合潛在空間中,共同學習研究人員和論文的嵌入式向量,從而生成個性化的論文推薦;Zhu 等[10]提出一種基于異構知識嵌入的注意力RNN 模型來實現論文推薦:先以論文、作者、機構、地點、出版年份為實體,并根據引用、出版關系等構建異構網絡,再采用TransD 將圖中所有實體和關系轉換為便于計算的嵌入式向量,進一步地,利用PV-DM (distributed memory model of paragraph vectors) 模型為每篇論文標題生成文本特征,最后,基于所生成的實體嵌入式向量與論文標題文本特征構建一個注意力雙向RNN,實現能根據用戶身份和查詢文本返回的個性化推薦;李鍇君等[109]利用知識圖譜構建論文與實體之間關系,再利用不同嵌入方法將實體關系以及論文主題文本結構數據進行向量化表示學習,在此基礎上,構建一個基于知識嵌入的編碼-解碼模型,從用戶歷史寫作和引用行為中挖掘研究偏好,并實現個性化推薦;Ali等[110]提出了一種異構網絡嵌入方法,對個性化引文推薦時的動態用戶興趣進行建模,所提出的嵌入模型通過使用與作者、時間、上下文、研究領域、引文和主題相關的語義來聯合學習節點表示;Xi等[111]利用標題、摘要、標簽和引文來構建異構圖,利用基于注意力的雙自動編碼器(attention-based dual-autoencoder),結合協同過濾,充分捕捉論文的特征嵌入,并使用概率矩陣分解更新相關性和論文特征嵌入,從而執行最終推薦任務。

基于圖嵌入式的方法能較好地利用圖結構中多種語義信息來表達用戶興趣,但在整個推薦中需在圖中不斷進行迭代,因此,面對不斷增長的海量學術數據,圖的計算任務是論文推薦中亟待解決的問題。另外,目前主要是基于靜態的異構網絡進行嵌入式表示并實現推薦,而現實中學術網絡中節點之間關系,如作者與文獻之間的引用關系等常常呈現為動態變化,如何對動態異構網絡進行嵌入式表示是未來的一個研究方向。

4 個性化學術論文推薦的結果評價

個性化學術論文推薦的結果評價最關鍵的因素是數據集構建、評價方法以及評價指標的選取。已有研究采用的數據集主要有公開數據集[12,14,36,56]與自創數據集[6,62,98]??紤]到研究方法的復現性,學界積極鼓勵研究者們采用公開數據集,故本文對已有公開數據集的主要特征、應用場景等進行了歸納總結,如表4 所示。當前主流評價方法是顯式人工評價信息的方法和基于隱式用戶交互數據的方法。①基于顯式人工評價信息的方法。通過構建體驗實驗室模擬現實應用場景邀請用戶對推薦結果進行顯式評價,或者通過發問卷形式要求用戶推薦結果的相關性進行評價[4,34,58,112]。此類方法雖然能較為真實地展現用戶對推薦結果的興趣,但是缺點在于人工成本較高,且難以實現對大規模數據進行評價。②基于隱式用戶交互數據的方法。主要借助用戶隱式交互數據,根據為用戶所推薦的論文未來是否被用戶引用[99,112-113]、是否被閱讀[38,43,50-52]、是否被點擊[40,53]等情況,判斷其推薦結果的相關性。相較于人工評價方法,此方法能對大規模數據進行評價,是當前個性化學術論文推薦采用的主流評價方法。

表4 個性化學術論文推薦的主要公開數據集

個性化論文推薦最初的目的是推薦與用戶相關的文獻,因此,判斷結果準確度指標,如recall、precision、MAP(mean average precision)等,常被應用于結果評價中。隨著后期研究工作的深入開展,一些學者嘗試提出如何深入地從用戶興趣、結果質量、多樣性以及驚喜度角度對推薦結果進行評價,相關評價指標的具體信息如表5 所示。

表5 個性化學術論文推薦的主要評價指標

總體來說,目前個性化論文推薦評估已創建了公開數據集,但已有數據集只是記錄了用戶有限的個性化偏好信息,如用戶歷史發表文獻或者閱讀文獻等,從而使得已有公開數據集制約著個性化論文推薦模型的發展。因此,在保護用戶隱私的情況下,如何構建一個記錄用戶全面偏好信息的公開數據集將是后續工作需要探討的重點問題。雖然當前個性化論文推薦評價中除了考慮結果的準確度指標外,也積極提出了針對用戶興趣、結果多樣化以及結果驚喜度的相關評測指標,但是現實中除了以上指標之外,用戶可能還從穩健性、隱私性等方面對推薦系統性能進行評價。因此,如何構建更全面的評價指標也是未來研究需要致力的方向。

5 總結與展望

縱覽國內外相關研究,個性化學術論文推薦研究近年來得到了廣泛關注,并取得了較大進展。根據對用戶興趣的不同建模方法,此研究主要分為基于協同過濾、基于內容與基于圖模型的方法。學界已經創建了用于個性化論文推薦評價的公開數據集,且已經創建了較為成熟的評價方法與評價指標體系。盡管如此,已有研究中存在以下不足:①缺乏對研究者興趣的全方位建模,已有方法主要采用用戶所發表、引用文檔或者部分行為數據,忽略了研究者如情感關系、認知風格等其他重要個性化特征對個性化推薦結果的影響;②缺乏個性化學術論文推薦結果的可解釋研究,限制了用戶對推薦結果的滿意度與可信度;③對面向用戶驚喜的推薦的相關探討不足,已有方法主要停留在借助主題多樣性這個單一特征來實現個性化論文推薦結果的驚喜,限制了最終推薦的效果;④個性化推薦方法中常常需借助用戶的個性化信息,這些信息可能涉及用戶隱私數據,但已有研究中缺乏對用戶隱私保護的相關研究;⑤已有評價指標體系尚不能根據現實用戶的真實需求對論文推薦結果進行評估。針對已有研究中的不足,未來個性化學術論文推薦的研究趨勢可能主要體現在以下5 個方面。

(1)基于多源異構大數據的動態學術用戶畫像構建

個性化推薦系統服務將呈現精細化和智能化的趨勢,如何通過構建動態的、細粒度的用戶畫像來洞察用戶行為需求演化是提升未來推薦系統精準服務的重要方式。為了能精準地捕捉到學術用戶的個性化需求,未來研究可考慮創建基于多模態大數據的動態學術用戶畫像。具體而言,設計一個深度信息融合的模型,以此來集成不同來源、不同結構、不同模式的用戶數據(不僅包括用戶與論文之間的交互數據,還包括用戶的時空列數據、圖像信息、項目數據等)來表征用戶興趣,并且實現從時間維度、情感維度、認知維度和內容維度來勾勒立體化與全方位的學術用戶畫像。其中,畫像可具體描述包括用戶的基本信息、行為、學術人格(認知風格)、學術影響力、情感關系(如學術觀點、合作競爭)、社交關系等不同維度特征。在此基礎上,基于知識圖譜和深度神經網絡的協同學習、多通道模型等擴展了不同維度特征之間的語義關聯,最終實現既能從心理維度精確理解用戶的需求,也能從時間維度感知用戶偏好的動態變化、社會關系變化以及項目特征動態變化等的目標。

(2)個性化論文推薦模型的可解釋性研究

推薦模型的可解釋性是當前推薦系統領域探討的熱點話題。為了提升個性化論文推薦模型的透明度以及實際應用效果,未來研究需要考慮對推薦結果的可解釋性(explainability)進行研究。根據個性化學術論文推薦的特性,未來可解釋性模型研究的主要方向有3 個。①動態可解釋性研究。如上文所述,學術用戶的需求常呈現動態變化趨勢,已有個性化推薦系統的可解釋性模型主要是基于用戶靜態需求的,因此,如何對用戶動態個性化需求建模,將是未來個性化論文推薦模型的可解釋研究中的一個重要研究方向。其中,未來研究可考慮在構建動態知識圖譜的基礎上,結合強化學習技術等,建立不同時間點知識之間的多重依賴關系,并提供研究者與論文之間的多關系推理,實現動態可解釋性研究。②基于多源異構信息的可解釋性研究。未來的學術論文推薦系統將利用異構信息源來對用戶興趣建模,以此提高推薦性能,因此,未來研究需要探討如何對齊兩個或者多個不同類別信息資源的多模態解釋,即在異構信息源上進行遷移學習,以此獲得可解釋推薦,以及如何實現學術論文跨領域推薦的可解釋性。③可解釋性模型的統一框架構建。目前,大多數可解釋性模型都是針對特定的推薦模型而設計的,可擴展性較差。未來研究可考慮如何在個性化論文推薦中構建一個與模型無關的可解釋性模型框架,避免為不同的個性化論文推薦系統構建不同的可解釋模型,從而提升可解釋性模型的可擴展性。

(3)面向用戶驚喜的個性化學術論文推薦

面向用戶驚喜的推薦是近年來推薦系統領域探討的熱點問題,此類推薦方法能有效避免過度個性化論文推薦結果給學術用戶帶來的“信息繭房”以及用戶視野縮小等問題,這也是未來個性化學術論文推薦的關注點,其中值得探討的問題主要有3 個。①多類驚喜特征的挖掘。除了考慮主題多樣性外,未來研究可進一步借助圖結構中節點之間的路徑以及借助遷移學習等技術挖掘更多可能為用戶帶來驚喜的推薦特征,發掘用戶潛在感興趣的論文。②基于用戶好奇心(curiosity)的驚喜推薦。用戶好奇心是驚喜推薦的主要誘因之一[66],且好奇心不同的用戶對推薦結果的驚喜度要求不一樣:好奇心強的用戶更喜歡驚喜推薦,反之,則排斥驚喜的推薦結果。因此,未來研究中需要考慮如何根據用戶歷史信息,借助數學模型對用戶好奇心建模,并將其融合到驚喜推薦結果的排序中。③跨領域的驚喜推薦。未來學術論文推薦的趨勢可從多個學科領域中產生以驚喜為導向的論文推薦。為了實現此目的,未來學者可以考慮將不同領域信息進行融合,實現對實體的多維描述,補全實體信息,以實現跨領域的驚喜推薦。

(4)個性化學術文獻推薦模型的聯邦化研究

已有學術文獻推薦系統的實現主要基于系統對用戶與論文之間的關系信息以及論文內容特征信息等的集中式存儲。然而,海量數據背后存在大量的用戶個人信息以及敏感數據,因此,如何在保證用戶隱私與數據安全的前提下獲得用戶個性化特征信息,將是未來個性化學術文獻探討的熱點問題。其中,聯邦學習作為新興的隱私保護范式,可以協調多個參與方通過模型參數或者梯度等信息共同學習無損的全局共享模型,同時保證所有的原始數據保存在用戶的終端設備,相對于傳統的集中式存儲與訓練模式,實現從根源上保護用戶隱私的目的。因此,如何將聯邦學習融合到個性化學術文獻推薦模型中將是此領域未來重要的研究內容,未來可以嘗試的主要方向有2 個。①基于協同過濾模型的聯邦化。將表征用戶偏好的數據保留在用戶本地,嘗試如何采用數據匿名化、差分隱私技術以及同態加密技術等對用戶特征向量進行處理,并對用戶特征向量和物品特征向量進行梯度計算,然后將物品特征向量的梯度上傳到服務端進行物品特征向量的更新,服務端再推斷出該用戶對這一物品的評分信息。②基于深度學習模型的聯邦化。為解決深度學習模型中論文特征矩陣通常非常龐大,以及大規模的神經網絡會給客戶端的資源存儲帶來負擔的問題,未來研究可以探討如何對客戶端采樣來參與深度學習模型的訓練,同時各個客戶端共享權重參數、模型參數或梯度等中間參數,然后對這些客戶端上傳的模型參數進行安全聚合,以此加速深度模型收斂,從而實現最終的個性化推薦。

(5)個性化論文推薦的性能評測研究

雖然當前已有大量研究對個性化論文推薦的評價方法與評測指標進行了研究,但是已有研究大多未能完全清楚地描述推薦的應用場景(如幫助用戶閱讀、引用或為患者提供治療策略等)以及推薦結果的受眾類型(如資深研究者、初級研究者或學生等)。一般情況下,不同的應用場景以及不同的受眾類型對推薦結果的需求可能不一樣,因此,未來研究需要在對用戶實踐場景以及受眾類型清晰描述的基礎上,實現對推薦結果的準確度、相關性以及用戶滿意度等方面的評價,作為以人為中心的人工智能研究前沿,值得信賴的推薦系統將會是未來學界努力的方向。其中,推薦系統的可信性主要是從系統的公平性、準確性、可解釋性、穩健性和隱私性等方面進行評估。因此,未來個性化學術論文推薦研究還需考慮如何從這些方面構建新的評價指標體系。已有個性化推薦評測方法中常常忽視了系統需要滿足多方利益相關者的需求,不同的利益主體可以有自己的利益需求和衡量方法,未來研究需要建立能權衡多方利益相關者需求的評價方法與評價指標。

猜你喜歡
學術論文個性化論文
學術論文征集啟事
學術論文征集啟事
學術論文征集啟示
學術論文征集啟事
堅持個性化的寫作
新聞的個性化寫作
上汽大通:C2B個性化定制未來
下期論文摘要預登
下期論文摘要預登
下期論文摘要預登
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合