?

基于模糊樹的個性化電子學習推薦系統

2018-05-15 02:19姜書浩金格
軟件工程 2018年3期
關鍵詞:推薦系統模糊集

姜書浩 金格

摘 要:電子學習系統的快速發展為學習者在線學習提供了巨大的機會。然而,在線學習系統中太多的學習活動使個體學習者很難找到合適自己的學習活動,所以在線學習系統必須有能夠提供個性化產品的推薦系統。本研究首先提出了一種模糊樹狀結構學習活動模型,然后結合基于知識和協同過濾推薦算法的優點提出了基于混合學習活動推薦方法的模糊樹匹配方法。

關鍵詞:電子學習;模糊集;推薦系統;樹匹配

中圖分類號:TP3-0 文獻標識碼:A

Abstract:The rapid development of e-learning systems provides learners with vast opportunities to access online learning.However,too many learning activities are emerging in an e-learning system,making it difficult for individual learners to select proper activities,thus it is necessary for such recommender systems as to provide personalized recommendations from products in the e-learning system.This paper first proposes a fuzzy tree-structured learning activity model,a fuzzy tree matching-based hybrid learning activity recommendation approach is then developed,which takes advantage of both the knowledge-based and collaborative filtering-based recommendation approaches.

Keywords:E-learning;fuzzy set;recommender systems;tree matching

1 引言(Introduction)

計算機網絡技術與多媒體技術的發展,對傳統的教育教學模式有了很大的沖擊,遠程教育應運而生[1]。而在信息過載問題越來越嚴重的大數據時代,學習者很難在眾多種類的學習活動中選擇最適合他們學習活動,因此電子學習系統必須能夠自動生成個性化的建議來指導學習者的學習。目前推薦系統已經廣泛應用于商業領域[2],在電子學習中應用很少,因為學習活動不同于電子商務中的商業產品,它具有很大的不確定性,涉及特殊的推薦方法和相似性度量的需求。為了處理電子學習推薦系統的特殊要求,本研究提出了一種基于模糊樹匹配的混合推薦方法[3]。用一種模糊樹形結構數據模型來描述學習者檔案和學習活動,應用模糊集技術處理不確定問題,相似性計算作為推薦方法的核心技術[4]。該混合推薦方法結合基于知識(KB)和協同過濾(CF)的推薦方法的優點,以及考慮學習者之間的語義相似性和協同過濾相似性來生成推薦結果。

2 推薦方法(Recommendation approaches)

目前推薦技術已經備受關注,并且許多推薦方法也已被提出。最常用的兩個推薦方法是:CF(協同過濾)、基于內容的推薦(CB)。CF技術基于其他具有相似興趣的人提出的建議幫助人們做出選擇。它可以進一步分為基于用戶和基于項目的CF推薦方法。CB技術給一個特定的用戶基于他以前喜歡的東西推薦類似的物品。每個方法都有其局限性,如CB的項目內容依賴問題和過度專門問題,CF的冷啟動和稀疏性問題[5]。為了獲得更高的性能和避免傳統推薦算法的缺點,可以在一個混合方法中結合兩個或者更多個推薦方法的優點。

3 電子學習推薦系統(E-Learning recommender systems)

推薦系統已經應用于電子學習領域,Zaiane提出了一種使用數據挖掘技術的方法,利用關聯規則挖掘建模用戶行為和推薦的學習活動,并提出了個性化的電子學習材料推薦系統的框架[6]。我國的個性化推薦技術在電子學習中的應用起步較晚,更多的是對于電子商務中推薦算法的改進,卻并沒有注意到學習資源與傳統電子商務的區別。盡管有很多公司和高校已經開始探索個性化推薦技術在電子學習上的應用,但整體因缺乏國家推動或者別的原因,發展速度比較緩慢。取得效果比較明顯的是上海交通大學開發的系統,該系統采用基于項目的協同過濾算法進行個性化推薦。北京大學也正在進行“共享北大”計劃,也是典型的系統[7]。

4 模糊樹狀結構數據模型和樹匹配方法(Fuzzy tree structured data model and tree matching method)

4.1 模糊樹形結構數據模型

定義1:樹形結構數據模型是一棵樹,以下特性被添加到樹節點。

(1)對于一組屬性A={a1,a2,...,an}。ai∈A代表一個節點的語義含義的一個方面。相應的一組值域D={d1,d2,…,dn}。對于屬性ai,取賦值函數ai:V→di,這樣每個節點可以為它的屬性分配值。

(2)一組相似度量S={S1,S2,…,Sm}定義給節點屬性從不同的角度來評估不同的節點之間的相似性。每個相似性測量如果被定義為一個函數Si:Δ×Δ→Δ[0,1]∈2D根據特定的應用程序可以指定Δ。

(3)一個加權函數w:V→[0,1]為每個節點分配一個權值來表示其對于兄弟姐妹的重要性程度。

定義2:模糊樹形結構的數據模型表示的是一個樹結構數據,它的節點屬性問題,節點之間相似度,或節點的權重都用模糊集表示。

在下面幾節中,樹木和節點使用以下符號表示。假設我們每棵樹有一個編號。讓t[i]是樹T的第i個節點。,T[i]是以t(i)為根節點的子樹,F(i)是從T[i]刪除t[i]獲得的無序森林。讓t[i1],t[i2],...t[ini])為t[i]的孩子。

4.2 樹形結構數據匹配方法

本節基于之前的研究總結樹形結構數據匹配方法[8-10]。構造最大概念相似性樹映射來識別兩棵樹最相似的部分,當比較兩棵樹,一種是兩棵樹的權重都應該考慮,另一個是一個子樹匹配目標樹找出目標樹是否包括子樹,此時子樹的權重應該被主要考慮。因此,樹匹配分為對稱匹配和不對稱匹配。分別定義為SCTsym和SCTasym。

兩棵樹T1[i]和T2[j]比較,它們的概念相似度計算如公式(1)。

正如對樹結構數據定義的討論,樹節點概念之間的相似性度量SC( )如方程(1)所示。wjt和wit分別是t2[jt]和t1[it]的歸一化權重。α是父節點的影響因素。為了從兩個森林的根中找到最對應的節點對,應用了maxi mum weighted bipartite matching(MWBM)。在計算兩棵樹之間概念相似度的過程中,記錄了MWBM的結果。相應的兩棵樹的根是節點對。兩個根的孩子的相應的節點基于兩根的孩子的MWBM被定義。

5 學習活動的模糊樹狀結構(Fuzzy tree structured learning activities)

模糊類別樹和模糊類別相似

(1)模糊類別樹:電子學習系統中介紹了學習活動類別來區分學習活動。本系統中學習活動類別有六個大類,每個大類別分為幾個子類別如圖1所示。

在真實的應用程序中,每個學習活動可能不同程度的屬于幾類,如圖3所示,圖中每個子類下面的數字表示學科對于子類隸屬度。子目錄和相應的隸屬度由學習活動提供者插入到系統時提供。兩個模糊分類樹如圖2所示。

(2)模糊類別相似性:模糊類別的樹都是基于圖1所示的學習活動類別樹。學習活動類別樹的編號用于表示樹節點。讓T1[i]和T2[i]分別代表兩個學習活動a1和a2的模糊類別樹。為了評估兩個模糊類別樹的相似度,所有節點的值都必須考慮。 根據T1[i]和T2[i]的孩子是否為0,公式中給出了四種情況,a1和a2的模糊類別相似計算如公式2所示。

6 學習者檔案模糊樹形結構(Fuzzy tree structured learner profiles)

當一個學習者選擇學習活動時,有許多影響學習者做決定的因素,系統做推薦時這些因素都要被考慮到。每個方面又包括幾個子方面,因此夠構造了學習者檔案模糊樹如圖3所示。

我們的系統定義了一個語言學術語集R={非常低要求(VLR),低要求(LR),中等要求(MR),高要求(HR),非常高要求(VHR)}用于學習者表達他們的要求。運用模糊集技術處理這些術語。這些語言相關的模糊數詳見表1.

6.1 有關模糊要求分類樹的相似性度量

(1)模糊要求類別相似:

Tr1和Tr2分別代表兩個模糊要求類別樹,Tr1和Tr2的模糊要求類別相似性計算如公式(3)。

6.2 模糊類別相似度匹配

Tr是學習者的模糊要求類別樹,Tc是學習活動的模糊類別樹,Tr和Tc的模糊相似性匹配計算如公式(4)。

7 基于混合推薦方法的模糊樹匹配方法(Fuzzy tree matching based on hybrid recommendation approaches)

步驟1:確定推薦方案

從兩個方面確定與習者ut有關的學習類別:ut和其他有相同學習目標的學者已經學過的科目;ut的模糊要求類別樹Tfrc。gt是ut的學習目標。學習目標是gt的學習者構成一個組Ugt。每一個學習者Ui∈Ugt的學習活動為{ai,1,ai,2,...,ai,ni},相應的模糊類別樹為{Ti,1,Ti,2,...,Ti,ni}。結合Ugt中所有用戶的學習類別樹,以gt為學習目標的學習類別樹為Tgt。Tcr=combine({Tfrc,Tgt})。對于任何學習活動a的模糊類別樹為Tca,如果sfc(Tca ,Tcr)>0,則a為預選推薦的活動。

預選學習活動時教育約束條件也要考慮。學習者Ut的檔案樹為Tt,Tt中代表學習活動的子樹計為Tt,l。學習活動為{at,1,at,2,...,at,nt},對習活動a的學習序列和先決約束條件分別進行驗證。對于序列條件,如果?(a→at,i)∈Sprior,1≤i≤nt,則a不適合被推薦。對于前提條件,讓學習活動的前提子樹表示為Ta,p。通過這一步, 選擇一套推薦方案,對于每一個選擇學習活動a,用以下措施來預測其評級。

步驟2:計算學習活動a和學習者要求的匹配度

學習者Ut的模糊要求類別樹為Treq,學習活動的模糊類別樹為Tca。兩者的匹配度計算如公式(5)。

步驟3:計算用戶之間的語義相似性

學過學習活動a的用戶記為Ua={u1,u2,...,um}。對于每個用戶ui∈Ua的檔案樹為Ti。計算ut和ui之間的語義相似性如公式(6)。

在計算Ssem(ut,ui)時,在ut和ui的檔案樹之間構造一個最大概念相似性樹映射。匹配最相似的學習活動,被匹配到的學習活動記在Mt,i,對于(p,q)∈Mt,i,p和q分別為ut和ui學過的學習活動。

步驟4:計算用戶之間的CF相似性

預定義學習活動的相似性閾值為ast,對于任何學習活動對(p,q),Tp和Tq為相應的樹,如果Ssem(p,q)=scTsym(Tp,Tq)小于ast,則p和q無關。Mt,i的子集Mt,i={(p,q):(p,q)∈Mt,Ssem(p,q)>ast},基于Mt,i,ut和ui的CF相似性計算如公式(7)。

步驟5:選擇前n個相同的用戶

基于上兩個步驟計算總相似性如公式(8)。

β∈[0,1]是一個在組合計算中指定相似權重的語義結合系數,ua中的用戶根據總相似性排序,頭n個最相似的用戶被選為鄰居用來預測評級。

步驟6:計算預測評級

用戶ut的學習活動a的預測評級計算如公式(9)。

θ∈[0,1],rmax是評級的最大值,方程包括兩部分。sm(ut,a)×rmax是基于預測評級的要求匹配,如果目標學習活動完全匹配用戶的要求,則達到最高級。ri,aSu(ut,ui)/Su(ut,ui)是傳統的基于項目CF預測評級。θ是一個結合兩個部分的參數。

步驟7:生成的建議

計算ut所有供選擇的學習活動的預測評級并排序。前K名適合推薦給用戶。

8 結論(Conclusion)

本文概述了電子學習系統中基于混合推薦的模糊樹匹配方法的發展。這個方法構建了學習活動和學子這檔案的模糊樹模型。運用模糊樹相似性測量計算學習活動或學習者之間的相似性。在學習活動模糊樹形結構模型中,定義了模糊類別樹指定每個學習活動大致屬于的類別,模糊類別相似性測量來計算學習活動之間的語義相似性。通過分析處理學習序列和建模前提學習活動確定學習活動之間的優先級關系,學習者通過模糊要求類別樹表達他們的需求。推薦方法結合了CF和KB的推薦方法的優點。就尋找相似的學習者來說,這套系統結合了語義相似和CF相似的優點。在計算CF相似時,利用的是被匹配的學習活動的評級,而不是用戶使用的兩個常見完的學習活動,減輕稀疏的問題。

參考文獻(References)

[1] 趙蔚,余延東,張賽男.基于數據挖掘的個性化E-Learning解決方案推薦系統研究[J].現代遠距離教育,2011(4):60-64.

[2] D.Wu,G.Zhang,J.Lu.A fuzzy preference tree-based recommender system for personalized business-to-business e-services[A].2015:29-43.

[3] J.Lu,Q.Shambour,Y.Xu,et al.A web-based personalized business partner recommendation system using fuzzy semantic techniques,Comput[A].Intell,2013:37-69.

[4] Z.Zhang,J.Lu.A hybrid fuzzy-based personalized recommender system for telecom products/services[A].2013:117-129.

[5] 陳潔敏,湯勇,李建國,等.個性化推薦算法研究[J].華南師范大學學報(自然科學版),2014(5):9-13.

[6] O.R.Zaiane.Building a recommender agent for e-learning systems in Proc[A].Int.Conf.Comput Educ.2002:55-59.

[7] 王凱,陳建.支持個性化學習資源推薦的在線輔助學習系統的研究與設計[D].陜西師范大,2014:5-6.

[8] D.Wu,G.Zhang,J.Lu,W.A.Halang.A similarity measure on treestructured business data,inProc[A].23rd Australas.Conf.Inf.Syst.,2012:1-10.

[9] D.Wu,G.Zhang,J.Lu.A fuzzy tree similarity measure and its applicationintelecomproductrecommendationinProc[A].IEEEInt.Conf.Syst.U.K,2013:3483-3488.

[10] D.Wu,G.Zhang,andJ.Lu.A fuzzy tree similarity based recommendation approach for telecom products in Proc[A].Joint IFSA World Congr.NAFIPSAnnu. Meet,Edmonton,Canada,2013:813-818.

作者簡介:

姜書浩(1980-),男,碩士,副教授.研究領域:電子商務.

金 格(1994-),女,本科生.研究領域:電子商務.

猜你喜歡
推薦系統模糊集
基于上下截集的粗糙模糊集的運算性質
復圖片模糊集及其在信號處理中的應用
區間直覺模糊集相似度構造
數據挖掘在選課推薦中的研究
基于用戶偏好的信任網絡隨機游走推薦模型
基于個性化的協同過濾圖書推薦算法研究
個性化推薦系統關鍵算法探討
淺談Mahout在個性化推薦系統中的應用
關于協同過濾推薦算法的研究文獻綜述
基于粗糙模糊集的輸電桿塔塔材實際強度精確計算
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合