?

一種優化的基于項目評分預測的協同過濾推薦算法

2018-06-07 09:38張華偉
科教導刊·電子版 2018年9期
關鍵詞:協同過濾推薦系統算法

張華偉

摘 要 用戶評分數據極端稀疏的情況之下進行了分析,根據現有的項目進行評分預測的協同過濾推薦算法中,項目與項目之間的相似度量不夠準確以及新的項目冷啟動問題,從而給出一種優化的基于項目評分預測的協同過濾推薦算法,這種算法是在計算項目與項目之間的相似性的時候,不但考慮項目的評分相似度,還會考慮到項目的特性之間的相似性。通過實驗表明,利用優化后的算法會計算出項目與項目之間的相似度更加精準,并且有效地可以解決新項目的推薦問題,這樣讓數據稀疏性對推薦的結果產生的負面影響相對較小,還可以提高系統的推薦質量問題。

關鍵詞 算法 推薦系統 協同過濾 評分相似性

1協同過濾推薦算法技術的闡述

目前最為成功的個性化推薦技術就是協同過濾推薦技術,在協同過濾推薦技術當中,用戶可以利用相互協作的作用來選擇有用的信息,就是可以根據其他用戶對信息作出評價來選擇想要的信息。協同過濾推薦技術方法會向用戶的行為進行合理分析,但并不會關心信息的實際內容,系統會自動的收集用戶對信息評價具有相同興趣愛好的用戶,然后把具有相同興趣愛好的用戶對于信息評價從而產生出推薦結果。

協同過濾推薦技術是有兩種方式的,一種是基于用戶的協同過濾推薦,另一種是基于項目的協同過濾推薦。前面一種是根據評分相似的具有相同興趣愛好的用戶的信息評分來對目標用戶產生推薦結果。因為相同興趣愛好的用戶對于項目的評分與目標用戶是非常接近的,為此目標用戶對于沒有評分項的評分可以通過相同興趣愛好的用戶對項的評分來進行預判。

為了可以找到與目標用戶相同興趣愛好的用戶從而必須推薦度量用戶之間的相似性,然后在通過選擇相似性最高的若干用戶作為目標用的相同興趣愛好的用戶。計算用戶之間相似性的方法有好幾種其中以下兩種較為普遍:

(1)余弦相似性 (cosine)。 用戶評分則是看出n維項目空間上的向量, 若用戶沒有對項目進行評分, 那么用戶對這個項目的評分是0, 用戶之間的相似性可以通過向量間的余弦夾角度量。設立用戶u和用戶v,在n維項目空間上的評分可以分別表示為:

向量u和v, 則用戶u和v之間的相似性sim(u, v)為 :

sim(u, v)=cos(u, v)=u· v/(‖ u‖ ???v‖ ) (1) 式中表示:分子是兩個用戶評分向量的內積;而分母則是兩個向量模的乘積,當夾角越小時,則相似度越高。

(2)關聯的相似性correlation)??梢栽O置用戶u與用戶v共同評分過的項目集合用Iuv表示, 則用戶u和用戶v之間的相似性 sim(u, v)經過pearson有關聯的系數度量: sim(u, v)=[ ∑i∈ Iuv (Ru, i-Ru)(Rv, i-Rv)] / [ ∑i∈ Iuv (Ru, i-Ru)2 ∑i∈ Iuv (Rv, i-Rv)2 ] ,其中(2)式中:Ru,i表示用戶u對項目i的評分;Ru和Rv則分別表示為用戶u和用戶v對項目的平均評分。

2實驗以及結果分析

2.1數據集

該實驗的數據集是來自MovieLens站點,這個站點是是一個Web的上研究型推薦系統,使用該系統必須滿足一個條件,就是注冊用戶必須對他所擁有的電影中的15部進行評價才能夠使用這個系統,至少15部。對此,這個站點每一個注冊用戶都至少對15部電影評價過。當前,這個站點的注冊用戶已經超過了45000人,電影超過6600部被用戶評分過。實驗數據集就從這個站點的數據集中隨機的抽取100000個評價數據,當中有943名用戶對1682部電影進行評價,同時要求每個用戶都要至少對100部電影進行評價;與此同時,還會對這1682部電影的20個特征屬性都給予一定的權值。把這個分為兩部分進行實驗,分別是訓練集和測試集,經過實驗表明訓練集數據是占整個數據集的80%,而測試集是占整個數據集的20%。

2.2評價的標準

評價推薦系統推薦質量的度量標準,采取的是統計度量方法中的平均絕對偏差MAE進行度量。MAE經過計算預測用戶評分與實際用戶評分之間是有偏差的,利用偏差來度量預測的準確性,若是MAE的值越小,那么推薦質量就越高。根據評分數據來預測的評分集合表示為{p1 , p2 , …,pN},而實際的評分集合則表示為成{q1 , q2 , …, qN}, 一般常用的的推薦質量度量方法為MAE=∑ N i=1 piqi /N進行度量。

2.3實驗的結果以及分析

這個實驗所提出的算法都是具有有效性的,采取的基于項目評分以及項目特質屬性相互結合的方法來計算出項目之間的相似之處。在這個基礎之上可以應用本文提出的優化算法計算推薦集。同樣可以把本文的算法與原始的基于項目評分預測的協同過濾算法以及可以提出一種改進的算法,就是基于修正條件概率下的推薦算法進行比較,從而計算出各種的推薦算法的MAE。通過分析計算其實可以知道在鄰居個數不相同的時候,本文提出的優化基于項目評分預測的協同過濾推薦算法有著最小的MAE。對此,用戶可以在評分數據極端稀疏的情況之下進行。

3結語

綜上所述,提出一種優化的基于項目評分預測的協同過濾推薦算法,在此算法之上有充分考慮到計算項目相似性的項目之間的評分相似性和屬性相似性,這樣可以讓數據稀疏性對計算結果的負面影響變小。本文通過優化算法可以在一定程度上提升系統的推薦質量。

參考文獻

[1] 鄧愛林,朱揚勇,施伯樂.基于項目評分預測的協同過濾推薦算法[J].軟件學報,2013(09):1621-1628.

[2] 姚忠,魏佳,吳躍.基于高維稀疏數據聚類的協同過濾推薦算法[J].信息系統學報,2015,2(02):78-96.

[3] 黃創光,印鑒,汪靜,劉玉葆,王甲海.不確定近鄰的協同過濾推薦算法[J]. 計算機學報,2010,33(08):1369-1377.

[4] 賈冬艷,張付志.基于雙重鄰居選取策略的協同過濾推薦算法[J].計算機研究與發展,2013,50(05):1076-1084.

[5] 于金明,孟軍,吳秋峰.基于改進相似性度量的項目協同過濾推薦算法[J]. 計算機應用,2017,37(05):1387-1391+1406.

猜你喜歡
協同過濾推薦系統算法
基于MapReduce的改進Eclat算法
Travellng thg World Full—time for Rree
進位加法的兩種算法
基于用戶偏好的信任網絡隨機游走推薦模型
一種改進的整周模糊度去相關算法
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合