學習路徑規劃方法*

2024-01-19 05:55羅中凱張立波

中國科學院大學學報 2024年1期

羅中凱,張立波

(中國科學院軟件研究所智能軟件研究中心, 北京 100190) (2021年10月25日收稿; 2022年6月10日收修改稿)

在傳統學習過程中,呈現給學習者的學習內容及其先后順序,是由專家或教師根據學習內容的難易程度并結合自身實踐經驗進行定義,因此,所有學習者均以相同的順序學習相同的內容[1]。然而不同學習者的學習能力、學習目標和已掌握的背景知識可能存在較大差別,使用這種無差異的教學方式無法達到因材施教的效果。越來越多的學習者渴望通過個性化和智能化的方式來獲取知識[1]。此外,科技的發展和互聯網的廣泛普及促進了在線教育的發展,為學習者打破了學習的時空障礙,學習者可以方便快捷地獲取各種學習資源并進行自主學習。特別是2019年新冠疫情大流行以來,進一步促進了學習方式從傳統課堂向互聯網學習環境轉移。然而互聯網中學習資源數量巨大,海量學習資源給學習者造成了較大的認知負荷[1]。同時,學習者有限的學習時間和無限的學習資源之間存在巨大矛盾,因此如何高效學習顯得尤為重要。學習者高效學習的關鍵在于,能為學習者提供符合其個性化條件(學習偏好、學習能力等)的學習材料,并合理規劃這些材料學習的先后順序。已有研究表明,合理有序的學習資源序列對學習者的學習進程和學習效果具有促進作用：Durand等[2]通過實驗證明,學習材料的呈現順序對學習者快速準確地掌握知識有較大影響;Chen[3]通過研究指出,通過學習當前知識的先驗和后驗知識,有助于學習者理解當前知識。因此,如何快速有效地從海量資源中檢索出滿足學習者需求的學習資源,并將其規劃生成排列有序的學習路徑,成為在線學習過程中需要解決的關鍵問題。

學習路徑規劃方法能夠很好地解決上述問題。學習路徑規劃方法可以針對每個學習者特定的學習需求,為學習者量身定制特定的學習內容,并能適應學習者在學習過程中不斷變化的需求,從而提高學習者的學習表現,優化學習者的學習體驗,幫助學習者在更短的時間內,以更低的成本,更高效地達到學習目標。因此,學習路徑規劃方法具有較高的研究意義與實用價值。

自20世紀60年代末以來,面向學習路徑規劃方法問題,涌現出大量研究成果,包括基于進化算法的學習路徑規劃方法、基于圖的學習路徑規劃方法、基于數據挖掘的學習路徑規劃方法、基于神經網絡的學習路徑規劃方法等。這些成果在一定程度上解決了學習路徑規劃問題。然而,大多數研究成果仍然還局限于理想條件下的研究型項目中,在教育與生活中的實際應用依然具有局限性,該領域的發展存在很大的提升空間。

學習路徑規劃擁有巨大的應用前景,為便于后續研究人員在現有研究工作的基礎上得到更好的研究成果,我們查閱整理了近年來學術界的相關研究成果,對這些研究成果按照使用的算法技術進行分類,對每類算法的優缺點進行分析,并對該領域的數據集、評估方法、主要挑戰以及未來發展方向做了系統性的論述。本文主要內容如圖1所示。

圖1 本文主要內容Fig.1 The main content of this paper

1 學習路徑規劃問題

1.1 學習路徑規劃問題的定義

為實現某個特定的學習目標,需要向學習者提供系統學習的知識,將這些知識由易到難、由簡單到復雜、由部分到整體,編排形成一條有先后學習順序的知識序列,使學習者以較小的代價達到學習目標。這條有先后學習順序的知識序列就稱為一條學習路徑。它強調學習過程中知識之間的相互關聯,通過對學習內容的選擇與組織,建立學習的基本框架,達到學習目標。即學習路徑是一條有先后學習順序的學習資源序列。

學習路徑規劃方法是,為實現學習者特定的學習目標,根據學習者的學習能力、學習偏好、學習節奏、現有知識儲備等個性化特點,為學習者篩選合適的學習資源并規劃生成學習路徑的方法。通過學習路徑規劃方法,可以避免學習者在海量的學習資源中迷失方向,為學習者營造個性化的學習環境,使學習者實現個性化、差異化學習。一般地,學習路徑規劃問題可以看作是一個函數f：U×L×C→S,其中學習者特征U、學習材料特征L、學習者學習目標C為該函數的參數。S表示函數f依據輸入參數生成的學習路徑。學習路徑規劃方法的一般架構如圖2所示。

圖2 學習路徑規劃方法的一般框架Fig.2 General framework of learning path planning method

1.2 學習路徑規劃問題核心要素

如1.1節所述,在學習路徑規劃之前,必須收集學習者的學習目標、學習者個性化參數以及學習材料的描述信息等相關要素[4]。學習者特征U和學習材料特征L是學習路徑規劃問題的核心要素,這些參數描述了學習者與學習材料的特征,是學習路徑規劃方法中的重要組成部分。下面對這些參數進行介紹。

1.2.1 學習者特征參數

學習路徑規劃以學習者為核心開展研究[5],因此,如何定義學習者特征是學習路徑規劃方法中需要研究的重要問題。

學習者特征參數可以分為學習者固有參數和學習者外部參數兩大類別。學習者固有參數是用來表征一個學習者的獨特屬性,與學習者之外的其他因素無關。學習者外部參數是指與學習者所處學習環境或者與知識領域相關的學習者的外在特征。學習者固有參數和學習者外部參數及其描述如表1所示。

表1 學習者特征參數Table 1 Learner characteristic parameters

1.2.2 學習材料特征參數

學習材料是學習內容的最小單元,在一些文獻中,學習材料又稱為學習對象、知識單元或學習資源。在學習路徑規劃過程中,對學習材料進行正確分類與建模是需要考慮的重要問題。學習材料特征參數及其描述如表2所示。

表2 學習材料模型參數Table 2 Learning material model parameters

2 學習路徑規劃方法研究進展

給定學習材料集合,學習路徑規劃方法的主要任務是根據學習者的學習目標和學習偏好等特征,自動生成滿足學習者個性化需求的學習路徑。

為解決學習路徑規劃問題,學術研究領域出現了多種方法。根據使用算法的不同,可將學習路徑規劃方法劃分為基于進化算法的學習路徑規劃、基于數據挖掘的學習路徑規劃、基于圖的學習路徑規劃、基于神經網絡的學習路徑規劃[6]。在工業領域,基于學習路徑規劃方法的電子教學平臺蓬勃發展。本節將分別介紹各個類別的學習路徑規劃算法,并對其優缺點進行分析。

2.1 基于進化算法的學習路徑規劃方法

根據學習者學習目標、學習偏好等特征,從學習材料庫中篩選并生成合理的學習材料序列可以抽象為一個組合與排序問題。由于學習材料的爆炸式增長,這個組合排序問題落在NP-hard問題范圍內。進化算法是NP-hard問題的經典解法。進化算法是一個“算法簇”,它們產生的靈感都來自大自然的生物進化。在學習路徑規劃方法研究的早期,很多研究者使用進化算法來解決學習路徑規劃問題,其中,最廣泛使用的進化算法包括蟻群優化算法[7-14]、遺傳算法[6,15-19]、粒子群優化算法[20-22]等。

2.1.1 基于蟻群優化算法的學習路徑規劃方法

蟻群優化算法是求解組合優化問題的一種元啟發式算法。蟻群優化算法已被成功應用于解決很多難度較大的優化問題,這是研究人員將蟻群優化算法應用于學習路徑規劃問題的主要原因。

隨著學習進程的推進,學習者的學習能力、知識儲備等特征也在不斷變化,蟻群優化算法具有較強的魯棒性和自適應性,能夠較好地適應學習者特征的變化,因此蟻群優化算法在學習路徑規劃中能取得較好的效果。蟻群優化算法也存在其固有的弊端,例如,在使用蟻群優化算法求解過程中,大量的學習材料很難組織成一個有效的螞蟻覓食圖,并且當路徑規劃過程中存在大量約束條件時,算法不能對這些約束條件進行準確表示,蟻群優化算法無法適應學習材料激增的局面。

2.1.2 基于遺傳算法的學習路徑規劃方法

遺傳算法是在達爾文進化論的啟發下提出的一種搜索技術。在遺傳算法中,通過3個步驟進化出一個候選解群體：1)選擇最優的個體作為親本;2)通過重組親本和突變產生新的個體;3)將新的個體插入到種群中。在搜索解的過程中,通常采用替換策略來保持種群大小不變,并使用適度函數對候選解進行評估。

Seki等[6]使用學習材料難度、學習材料之間的關系構建適應度函數,并基于分布式遺傳算法生成最優學習路徑。Samia和Mostafa[17]同時考慮了學習者的個性化特點與學習目標,使用遺傳算法生成學習路徑。Hovakimyan等[19]以達到教學目標所需要的時間最小化為目標,使用遺傳算法為學習者尋找最優學習序列。Dwivedi等[30]開發了基于變長遺傳算法的個性化學習路徑推薦框架。檀曉紅[31]提出基于遺傳算法的個性化課程推薦模型。呂琳和韓永國[32]設計了個性化學習路徑規劃系統,該系統首先通過前測獲取學習者當前的知識水平,然后系統將學習者的知識水平和系統中課件的難度水平進行匹配,同時考慮課件之間的相關關系,使用遺傳算法為學習者生成最佳學習路徑。Salehi等[33]提出“顯式屬性”推薦模塊與“隱式屬性”推薦模塊相混合的推薦方法,并使用遺傳算法進行優化求解。Wu等[34]基于對學習者掌握知識程度的評估,通過動態編程和遺傳算法為學習者生成難度適宜的試卷。Lumbardh和Krenare[35]提出一種新的遺傳算法混合方法,該方法能夠根據課程難度級別、持續時間、評分和學習對象之間的關系程度尋找和生成個性化的學習軌跡。

一些與遺傳算法相似的算法也被應用到學習路徑規劃領域。Memetic算法采用與遺傳算法相似的框架和操作流程,并在此基礎上通過局部鄰域搜索使每個演化代的所有個體都達到局部最優。文獻[1]提出一種基于改進的Memetic算法的學習路徑規劃算法,并以計算機網絡課程為例進行了實驗驗證。輪盤賭算法是一種沒有交叉算子的遺傳算法的簡化算法。Ballera等[36]提出了基于輪盤賭算法的學習路徑規劃方法。

遺傳算法具有易于實現的優點,對解決學習路徑規劃問題是有效的。然而,遺傳算法面臨著參數設置和算子選擇的問題。例如,當交叉、變異、重組等參數設置不合理時,會導致進化過程出現不確定性,甚至失控。

因此，只有隨著認識和實踐的不斷進步，充分估計前進道路上的困難和曲折，正確認識當前甚至今后一個時期高效節水灌溉發展的進展，在辯證唯物主義認識論的指導下，依靠正確的認識論和方法論，才能有力促進高效節水灌溉的發展。必須站在新的歷史高度，在馬克思辯證唯物主義及其認識論的指導下，依靠新的認識指導新的實踐，通過實踐認識再實踐再認識過程不斷開拓進取，充分認識發展高效節水灌溉的艱巨性，增強發展高效節水灌溉的自覺性、支撐力和自信心，創造條件，因地制宜加快推進高效節水灌溉的健康發展。

2.1.3 基于粒子群優化算法的學習路徑規劃方法

粒子群優化算法的靈感來源于鳥群和魚群的社會行為。一個粒子代表一個候選解決方案,每個粒子都保存著關于其目前達到的最佳位置的信息,而群則記錄著全局最佳解決方案。

Gao等[37]構建了一個基于多目標粒子群算法的學習路徑規劃模型,并將構建的模型用于真實的學習系統中,為用戶提供個性化的學習路徑。陳其暉等[38]基于知識空間理論建立學習狀態空間,引入交換子和交換序的概念對粒子群算法進行改進,通過改進的粒子群算法對學習狀態空間中的學習路徑進行最優化控制,并利用死亡懲罰函數把約束最優化學習路徑問題,轉化成無約束的最優化學習路徑控制問題。吳雷和方卿[39]提出一種改進粒子群算法解決在線學習系統中的學習路徑優化問題。系統在尋找最優學習路徑時,采用局部鄰域搜索與禁忌搜索相結合的方式,從而改進了標準粒子群算法的尋優性能。李浩君等[40]提出基于多維信息特征映射模型的在線學習路徑規劃算法,使用雙映射二進制粒子群優化算法對學習路徑規劃算法進行優化求解。

粒子群優化算法具有參數較少的特點,能夠較好地解決復雜度高的問題,目前已被廣泛應用于學習路徑規劃算法中。然而,與遺傳算法相比,粒子群算法容易陷入局部最優,并且缺乏有效的收斂分析方法。

2.1.4 其他算法

除蟻群優化算法、遺傳算法、粒子群算法外,研究人員還使用了DNA計算、和聲搜索算法、免疫算法、蛙跳算法等來解決學習路徑規劃問題。Debbah和Ben[41]使用DNA計算解決學習路徑規劃問題,DNA計算可以進行大規模的并行搜索,具有較高的計算效率。Hnida等[42]提出基于和聲搜索算法的學習路徑規劃方法。Wan和Niu[43]提出基于免疫算法的學習路徑規劃方法,該方法利用抗體適應度和濃度移動候選解方案,同時使用2種局部搜索算法提高算法的性能。Gomez-Gonzalez和Jurado[44]提出一種二值混疊蛙跳算法向學習者推薦合適的課程學習方案,通過比較實驗的方法證明了基于二值混疊蛙跳算法的學習路徑規劃方法要優于部分基于遺傳算法和粒子群算法的學習路徑規劃方法。Wan和Lyu[45]提出基于種群增量學習的學習路徑規劃方法,并證明該方法在運行時間上要優于基于遺傳算法的學習路徑規劃方法。

2.2 基于數據挖掘的學習路徑規劃方法

隨著數據挖掘技術在商品推薦等領域取得成功應用,該技術逐漸被研究人員應用于解決學習路徑規劃問題?；跀祿诰虻膶W習路徑規劃方法[46-50]的主要思路是,以學習者的歷史學習數據為基礎,通過挖掘學習者學習過程的相關信息,為后續的學習材料推薦提供決策支持,生成滿足學習者個性化需求的學習路徑。常用的數據挖掘算法包括聚類、頻繁模式挖掘、協同過濾等。

在真實的教育場景中,相似的學習者具有相似的學習行為、相似的學習路徑?；诖?Chen[3]構建了一個個性化在線學習系統,通過挖掘個體學習者在前測階段和學習過程中的行為數據,為學習者推薦合適的學習路徑。Kla?nja等[51]構建了編程教學系統Protus的一個推薦模塊,該模塊可以自動適應學習者的學習興趣和知識水平并生成學習路徑。首先,該系統根據學習風格對學習者進行聚類處理;然后,利用Apriori All算法挖掘頻繁序列,分析學習者的學習習慣和興趣;最后,根據Protus系統提供的這些頻繁序列的評級,完成學習內容的個性化推薦。Hsieh和Wang[52]開發了基于網絡的在線學習系統,系統首先使用基于Apriori算法的數據挖掘方法發現一些候選課程;然后基于形式概念分析的學習路徑構建方法,使用從一些選定文檔中提取的關鍵字構建概念格,以形成由關鍵字表示的所有概念的關系層次;接著計算文檔之間的相互關系,以決定合適的學習路徑。Hsu[53]、Chen等[54]基于學習者的閱讀行為和閱讀能力,向學習者推薦合適的學習材料。對于公司的業務,通常需要一群人來完成特定的任務。但是,小組成員不具備與任務相關的同等水平的先驗知識,因此,對于在協作商業環境下工作的員工來說,發現一條群體化的學習路徑是非常重要和必要的。針對這個問題,Feng等[55-56]提出一種基于角色的學習路徑發現算法,使一組員工能夠更高效地掌握與某項業務任務相關的新知識。Liu等[57]通過探索學生在線學習過程的大數據,構建了一個在線學習路徑模型,該模型根據學生的學習習慣,為普通學生推薦個性化、相似度高的優秀學習路徑。Ge等[58]在課件推薦模塊中提出一種將內容過濾和協同過濾相結合的算法,該算法能夠根據學習者的學習興趣,為學習者生成個性化的學習路徑。Salehi等[59]提出一種基于順序模式挖掘和多維屬性協同過濾的學習材料推薦系統框架。Fu等[60]提出一種基于二部社區的協同過濾方法,以提高學習材料推薦的準確性和多樣性。AI-Hassan等[61]將基于本體推理的語義相似度和基于項目的協同過濾相結合,提出一種基于混合語義增強的學習路徑規劃方法。Xu等[62]利用社交標簽構建用戶檔案,用于尋找相似的學習者,然后利用貝葉斯公式預測大多數相似學習者下一步要學習的學習材料的概率。針對團隊學習問題,Xie等[63]通過考慮各種與學習相關的因素,提出一種基于輪廓的小組學習路徑發現框架。Li等[64]將基于項目的協同過濾和貝葉斯個性化排名進行結合,用于解決課程推薦問題。

隨著計算機技術的發展,強大的數據挖掘技術能夠挖掘數據中的相似特征,并能構建相應的決策規則和預測模型,這些規則和模型易于在教育數據中使用,且成本較低,具有較強的可移植性和可擴展性,能夠適應更廣泛的學習場景。使用基于數據挖掘算法的學習路徑規劃方法,學習者能夠獲取系統自動推薦的個性化學習材料,不再需要自己組織規劃學習內容。但是基于數據挖掘的學習路徑規劃方法存在諸多缺點：一是使用基于數據挖掘的學習路徑規劃方法通常需要較大規模的學習過程數據集,通過挖掘學習者與學習材料之間的關聯關系生成學習路徑,忽略了學習材料之間的潛在依賴關系;二是基于協同過濾的方法存在較嚴重的冷啟動問題,即不能向新來的學習者推薦合適的內容,也無法將新加入系統的學習材料準確推薦給學習者;三是如果系統中的目標用戶數量巨大,存在較大的計算開銷,并且無法適應學習者、學習材料激增的情況;四是基于數據挖掘的學習路徑規劃方法難以讓教育領域的專家學者信服。

2.3 基于圖結構的學習路徑規劃方法

在一條學習路徑中,當前學習資源與下一個學習資源之間存在先修關系,在現有的學習系統中,學習材料的特征以及學習材料之間的這種依賴關系由課程教師或專家錄入。由于人類固有的偏見性,課程教師或專家對相關概念/課程之間關系的定義可能是不精確的,甚至可能會忽略或混淆相互矛盾的需求,那么,據此得到的學習路徑可能缺乏合理的邏輯推理[65]。因此,研究者提出,使用圖的形式組織學習資源(課程/概念),并對其進行語義分析,提取學習資源之間的依賴關系或約束關系,進而為學習者推薦更匹配的學習路徑。在學習路徑規劃領域,常用的圖結構包括概念圖、本體和知識圖譜。

概念圖是一種組織和表示知識的工具。在概念圖中,概念用圓圈或方框表示,概念間存在的關系用圓圈或方框之間的連接線表示。認知教育心理學家奧蘇貝爾認為,在學習者的概念結構中,當新概念與已有概念相聯系時,就會產生學習過程[28]。陳其暉等[66]發現不同概念之間的先序依賴關系對學習過程有重要影響。Liang等[67]發現,概念之間的前提關系在許多教育應用中都發揮著重要作用,因此,他們研究了如何從課程依賴中恢復概念間的前提關系,并提出一個框架來解決這個問題。Pan等[68]基于大規模開放網絡課程,研究如何提取知識概念之間的潛在前提關系,并提出一種基于表示學習的課程概念的表示學習方法,嘗試利用不同特征捕捉概念之間的先決關系。Pan等[69]提出一種基于圖的傳播算法,根據課程概念的學習表示對概念進行排序。Liu等[70]將不同的在線課程映射到一個通用的概念空間,并預測概念和課程之間潛在的依賴關系。Chu等[71]構建了一個基于概念圖的電子學習系統,該系統根據知識元素之間的依賴關系構建概念圖,并根據概念圖中的關系生成學習路徑。Leung和Li[72]通過動態概念網絡機制,捕捉課程之間的關系以促進學習路徑的動態生成。同時,為滿足不同學習者的個性化需求,構建了一個智能知識庫,幫助了解學生的個性化行為,從而為不同的學習群體呈現個性化的結果。Hung和Hung[73]使用模糊關聯規則挖掘方法找出概念與概念之間的所有先決關系,并構建概念圖,基于此提出自適應教學模型,向學習者推薦合適的學習材料。Steiner和Albert[74]概述了使用概念圖推導學習材料之間的前提關系和組織結構的方法,這些關系和結構可以作為個性化學習規劃的基礎。

概念圖能夠使概念之間的關系更具組織性和適應性,基于概念圖生成的學習路徑能夠呈現出合理的概念學習順序?；诟拍顖D的學習路徑規劃方法雖然考慮了學習材料之間的潛在依賴關系,但是學習材料之間的關系/依賴關系的具體分類仍然缺乏考慮,忽略了知識單元之間的認知關系對學習者學習過程的影響,這對于有效組織在線學習者的學習內容至關重要[75]。因此,研究者提出了使用知識圖譜和本體組織學習材料。

Shi等[75]提出一種基于多維知識圖框架的學習路徑推薦模型。首先設計一個多維知識圖框架來表示和存儲不同的學習對象,然后基于多維知識圖框架設計了滿足不同學習需求的學習路徑推薦模型,從而改善網絡學習者的學習體驗。Shmelev等[76]將學習者模型與學習材料的領域知識本體庫進行匹配結合,通過語義推薦算法實現學習路徑的個性化推薦。Snae和Brückner[77]提出本體驅動的泰語學習系統(O-DEST),該系統用本體建立學習內容的領域模型,并根據學習者的學習風格為學生規劃生成合適的學習路徑。Balik和Jelinek[78]提出一個使用語義表示和本體的自適應在線學習系統模型,該模型包括2種本體：一種是用于為學習者構建個性化學習對象的課程材料本體;另一種是用于評估學習者學習進度的本體,包括作業分數、考試分數和出勤率。Wang等[79]發現,學習系統中學習對象數量龐大,學習者在選擇合適的學習對象時,可能會迷失方向。因此,使用本體來增強在線學習系統的推薦功能,使其更容易、更有效地為學習者推薦合適的學習對象。Min等[80]提出一種使用本體和推理機制的自適應個性化在線學習系統,該系統可以根據學習者不同的學習目標,為其提供合適的學習路徑。Pandit[81]實現了一個基于本體技術的在線電子學習系統,該系統通過本體來介紹和描述學習材料的結構、內容和上下文信息。Ouf等[82]提出基于知識圖譜的智能在線學習生態系統框架。Wei等[83]開發了一種基于知識圖譜的個性化課件推薦系統,為同一組學習者提供相同的課件樹,以提高學習者的學習效率。針對自動化專業知識的學習,劉萌等[84]提出基于知識點網絡的學習路徑推薦方法。該方法首先依據知識點以及知識點之間的關聯關系構建有向知識點網絡,并用鄰接矩陣存儲網絡的拓撲結構信息;然后基于學習者的目標知識,通過可達矩陣與并行拓撲排序算法實現學習路徑的提取與優化,保證學習者“按需所取”知識點;最后針對選取的目標知識點推薦學習路徑。Zhu等[85]考慮到學習者在不同的場景中需要不同的學習路徑,提出基于知識圖譜的多約束學習路徑推薦算法,該算法根據學習者的先驗知識、學習目標以及預設的學習場景,為學習者規劃生成合適的學習路徑。

基于圖結構的學習路徑規劃方法具有下列優點：一是知識圖譜能以精確的方式表達知識,可以明確地對概念、概念的屬性及其之間的關系進行定義,避免學習材料描述中的歧義現象;二是根據不同學習者的需求和偏好,使用知識圖譜能夠進行更多細節方面的檢索,這反過來可以為學習者提供更精確的內容推薦。因此,知識圖譜能使學習過程更具個性化,提高學習者在線學習的效率;三是使用本體可以構建多個學習對象之間的關聯關系,很好地解決冷啟動問題;四是知識圖譜、本體等圖數據結構具有可重用性、可推理和支持推薦的機制,這些機制有助于更精確地向學習者推薦學習內容?；趫D結構的學習路徑規劃也存在一定的缺點,圖結構的設計和維護需要較強專業知識的支撐,并且圖數據的構建具有一定的挑戰性、花費昂貴且比較耗時。

2.4 基于神經網絡的學習路徑規劃方法

神經網絡是由大量交織在一起的神經元或部件組成的,它們協同工作來處理信息并解決問題。神經網絡是一個可以接收信息并分析處理信息的系統,并能產生比其他信息處理范式復雜得多的結果,因此成為模擬人類行為的一種非常有影響力的手段。研究表明,使用基于神經網絡的機器學習、深度學習等人工智能技術進行學習路徑規劃與課程推薦,是將人工智能技術集成到在線學習系統中的一個潛在發展方向[86]。人工智能技術具有開發和模仿人類推理和決策過程的能力,并且具有最大限度地減少人類決策過程中的不確定性的能力。因此,這類方法逐漸得到研究人員的青睞。

在教育領域,機器學習技術可以模擬并跟蹤學習者認知能力的變化過程,從而為學習者推薦合適的學習材料。例如,Hussain等[87]使用支持向量機、邏輯回歸、樸素貝葉斯分類器等機器學習算法,評估學生目前所具備的能力,并預測后續學習內容對學習者當前狀況的難易程度,輔助教師及時調整教學內容。

循環神經網絡是一種專門處理序列數據的神經網絡,其通過添加指向自身的回路,使得神經網絡能夠捕獲并記憶輸入數據中的序列變化信息,并且,循環神經網絡可以處理任意變長的序列數據。學習者的學習路徑可以視為一個時間序列數據,且不同學習者的學習路徑長度可能存在較大差異,因此,可以使用循環神經網絡來建模學習路徑規劃問題。

Saito和Watanobe[88]以一個在線編程系統——AOJ系統為研究對象,提出使用學習者能力圖構建學習路徑推薦系統的方法,并基于循環神經網絡實現了該系統。學習者能力圖能夠直觀反映學習者在各個方面具備的能力分數和期望達到的目標分數。隨著學習過程的推進,學習者能力圖在不斷變化,以跟蹤學習者的能力變化。在實驗過程中,基于學習者能力圖構建學習者特征向量,根據學習者在編程系統中的歷史提交順序,使用循環神經網絡預測下一個適合幫助學習者實現目標的學習內容,并保證推薦的下一個問題能適應學習者當前的能力。

卷積神經網絡的中心思想是捕捉局部特征,其最初在圖像領域取得了巨大成功,隨后在文本領域也得到了廣泛應用。對于文本來說,局部特征就是由若干單詞組成的滑動窗口。卷積神經網絡能夠自動對不同滑動窗口中的特征進行組合和篩選,從而獲得不同抽象層次的語義信息。注意力機制源于對人類視覺的研究,為了合理地利用有限的視覺信息處理資源,需要選擇視覺區域中的特定部分,然后重點關注它。將注意力機制融入卷積神經網絡,可以增強卷積神經網絡的性能,使其可以重點關注重要特征并抑制不必要的特征。

Wang等[89]提出基于注意力卷積神經網絡的個性化學習材料推薦方法。該神經網絡的輸入包括學習者上下文信息、課程上下文信息以及學習者學習活動信息3部分,該神經網絡的輸出是預測學習者在一門課程中的考試分數。通過神經網絡的預測分數與學習者真實考試分數之間的差異來訓練神經網絡。其中,學習者上下文信息包括學習者的性別、年齡、專業、課程注冊信息、課程點擊信息等內容;課程上下文信息包括課程類型、授課教師、課程目標、課程時長等內容;學習者學習活動信息包括學習者的學習偏好、學習者暫停學習次數、學習者學習次數等內容。作者先用獨熱向量對這3部分內容分別進行編碼;然后使用注意力卷積層和全連接層級聯的神經網絡提取學習者特征、課程特征、學習活動特征,以及它們之間的潛在關聯關系,將這3部分特征編碼到一個向量中;最后使用編碼得到的特征向量進行分數預測。訓練好的神經網絡可以協助學生進行課程選擇,為學生推薦其可能得分最高的top-n課程?；谧⒁饬矸e神經網絡的個性化學習材料推薦系統工作流程如圖3所示。

圖3 基于注意力卷積神經網絡的個性化學習材料推薦系統工作流程Fig.3 Workflow of personalized learning material recommendation system based on attention convolutional neural network

目前,在提取歐式空間數據的特征方面,傳統深度學習方法(卷積神經網絡、循環神經網絡等)取得了巨大成功,但是許多實際應用場景中的數據是從非歐式空間產生的,傳統的深度學習方法在處理這類數據時難以產生令人滿意的結果。例如,由于圖數據中節點之間固有的不規則鏈接,使得傳統深度學習方法在處理圖數據時面臨著巨大挑戰,因此,圖神經網絡應運而生。圖神經網絡的核心思想是通過保留圖的網絡拓撲結構和節點內容信息,將圖中的節點表示為低維向量,以便進行分類、回歸等后續處理操作。

Wang等[90]提出一種基于圖神經網絡的top-n個性化課程推薦方法。作者通過研究指出,學習者的學習偏好可以分為“一般偏好”和“近期偏好”2種類型?！耙话闫谩庇糜诜从硨W習者在學習過程中的長期偏好和一般靜態行為,“近期偏好”用于反映隨著學習進程的推進。學習者學習偏好的變化情況,屬于學習者的短期和動態偏好。學習路徑規劃問題應該同時考慮學習者的一般偏好和近期偏好。為此,作者使用在線學習平臺“學堂在線”中的真實數據,構建了“學習者-課程”交互圖,并將該交互圖進一步分解為“學習者-課程”二部圖、“學習者-學習序列”交互圖和“課程-類別”圖3個子圖。在這3個子圖中,運用圖神經網絡和卷積神經網絡提取學習者特征與課程特征,使提取的學習者特征中同時包含“一般偏好”和“近期偏好”,提取的課程特征中既包含課程類別特征,也包含與該課程相關的學習者信息。接著,基于學習者特征和課程特征,使用注意力機制與貝葉斯個性化排序算法,為學習者推薦下一步學習的合適課程。

Kwasnicka等[91]提出一種基于自組織神經網絡的學習路徑生成方法,該方法會基于描述學生和學習材料的元數據進行推理,為學習者生成個性化的學習路徑。Zhang等[92]通過研究發現,現有的在線學習系統不能捕捉學習者不同訪問會話間的復雜關系,并且不能同時考慮學習者對當前課程興趣偏好的變化?；诖?作者提出一種基于會話的課程推薦神經網絡框架STR-SA,STR-SA使用自注意力模塊,能夠推薦學習者感興趣的學習內容。Wu等[93]提出一種新穎的練習題推薦方法,首先利用長短時記憶網絡預測知識概念的覆蓋率,然后利用深度知識追蹤,根據學生的練習答案記錄,預測學生對知識概念的掌握程度,預測結果用于過濾練習題。由此生成練習庫的一個子集。因此,可以通過解決優化問題獲得推薦練習的完整列表。Antony和Arokia[94]提出一種新的學習材料推薦系統,該系統將嵌入式特征選擇方法與基于模糊時態邏輯的決策樹卷積神經網絡分類器相結合,能夠根據學習的理解水平向學習者推薦合適的學習內容。

Choi等[95]指出,現有學習路徑規劃方法存在以下3方面缺陷：1)學習路徑規劃方法的決策機制對于學習者而言是不透明的,即為何要將一個特定的學習材料推薦給學習者,學習者幾乎一無所知,學習者對學習材料的選擇的參與度較低;2)學習者必須完成當前推薦的學習材料后,才能獲得下一個學習材料,學習者沒有機會對當前的學習材料給出及時反饋;3)系統僅基于學習者的歷史學習過程數據向學習者推薦學習材料,并沒有收集和利用學習者對學習材料認知方面的數據。為此,作者提出一個名為Rocket的在線學習系統界面程序,該界面程序是一個類似于社交軟件Tinder的學習界面,該界面可以顯示使用卷積神經網絡提取的學習材料的視覺特征,使學習者能夠快速確定當前推薦的學習材料是否滿足他們的需求。學習者可以通過向左滑動拒絕當前推薦并獲取新的推薦,或者可以輕觸界面,開啟學習。Rocket允許學習者自由選擇是否使用系統當前推薦的學習材料,收集學習者對學習材料認知方面的反饋,從而為個性化學習路徑的生成提供指導信息。

強化學習是機器學習的一個分支,強調智能代理如何在不確定和復雜的環境中行動,以取得最大化的預期利益,實現特定目標。Li等[96]提出基于強化學習的最優分層學習路徑規劃方法,在該方法中,作者假設,在線學習系統中的學習材料固定不變,將學習路徑規劃問題建模為一個馬爾科夫決策過程,其狀態空間是技能屬性,動作空間是系統中所有的學習材料。具體而言,在線學習系統中不同學習材料對應不同的技能,這些技能之間存在先序關系與依賴關系,作者使用經典認知診斷模型評估每個學習者已經掌握的技能和掌握的熟練程度,并為其構建技能層次化模型?；谠搶哟位Ｐ?采用強化學習方法,為其推薦下一步需要學習的材料。當學習者完成系統推薦的學習材料后,會將其新獲取的技能反饋給學習系統,學習系統據此更新學習者的技能層次化模型,并為其推薦后續學習材料?；趶娀瘜W習的最優分層學習路徑規劃方法示意圖如圖4所示。

圖4 基于強化學習的最優分層學習路徑規劃方法示意圖Fig.4 Schematic diagram of optimal hierarchical learning path planning method based on reinforcement learning

El等[97]提出一種基于多智能體和強化學習的自適應電子學習系統。該系統使用Q-learning算法向學習者推薦符合其特征和偏好的學習路徑。該系統側重于3個主要特征,即學習風格、知識水平和學生可能存在的殘疾?？紤]到3種類型的殘疾,即聽力障礙、視力障礙和閱讀障礙。該系統將能夠為學生提供與他們的個人資料相匹配的一系列學習對象,使學生獲得個性化的學習體驗。

基于神經網絡的學習路徑規劃方法可以讓網絡自動學習學習材料間的依賴關系,捕捉學習者與學習材料之間的關聯關系,并構建學習材料推薦模型。構建的模型具有一定的可移植性。但是基于神經網絡的學習路徑規劃方法存在諸多缺點：一是訓練這些神經網絡模型需要大規模的學習過程數據,獲取這些數據的成本較高;二是模型可解釋性差。神經網絡具有黑盒特征,神經網絡學習到的權重通常很難被人類解釋,神經網絡的輸出結果也不具有可解釋性,因此該方法不能被教育領域的專家學者所信服。此外,在前述的top-n課程推薦方法中,由于在線學習系統中課程種類繁多、學習資源數量龐大,向學習者推薦的top-n課程可能是學習者已經學習過的課程(知識)或是已學習過的類似課程(知識)。

3 學習路徑規劃方法的評估標準

3.1 數據集

在學習路徑規劃領域,尚且缺乏標準的驗證數據集,研究者常用到的數據集包括edX、Coursera、XuetangX等在線課程平臺提供的數據集。此外,多數研究人員會使用自組織的數據集評估提出的學習路徑規劃方法,并在論文中提供構建數據集的相關信息。研究者常用的數據集構建方法是將領域知識組織為具有4層結構的層次化知識表示模型,即目標層、子目標層、知識點層、基本素材層[1],層間關系及其描述見圖5所示。其中,目標層是學習者將要學習的某門課程或者目標知識,每個目標均可分解為若干個子目標。子目標層即為知識單元層,知識單元由若干知識單元和知識點組成,屬于同一個知識單元的知識點和知識單元間具有較強的關聯性[1]。這一層的目的是將分散的知識點關聯在一起,使知識點具有較強的層次和結構關系。知識點層是整個知識表示模型的核心層,該層重點描述每個知識點的難度、重要度、所需預備知識集、測試通過閾值等。知識點之間可以存在多種關系,如前驅關系、后繼關系、兄弟關系、包含關系、對立關系等。一個知識點可以與多個基本素材之間存在關聯關系?；舅夭膶訛槲锢砩险鎸嵈嬖诘?、以教學為目的的數字化媒體文件,如文本類、視頻類等。一個基本素材可以與若干知識點存在關聯。

圖5 數據集常用構建方法Fig.5 Common construction methods of datasets

葉露[13]使用八爪魚采集器抓取了在線學習平臺——果殼網MOOC學院中的計算機和數據與統計2個領域的所有課程,共收集到1 246條課程內容,以抓取的課程內容作為學習材料數據,驗證提出方法的有效性。Shi等[75]將機器學習的領域知識進行整理,構建機器學習領域知識圖譜,該數據集包含675個學習對象和1 033種對象間關系,將這個構建的數據集作為學習路徑規劃算法的驗證數據集。周瑩瑩[98]研究初等數學領域知識間的關聯關系,構建了初中數學領域知識圖譜,知識圖譜中共包含知識點實體2 225個,由專業團隊對知識點間的關系進行標注,得到11 274條關系數據,去掉無關關系后,最終得到1 749條有效知識點關系數據,使用該數據集驗證規劃算法的有效性。Menai等[99]收集一所大學在線學習系統中的真實課程數據與學生學習數據,從中隨機挑選2 000名學員的學習數據,來測試學習路徑規劃方法的性能。Agarwal等[100]使用來自匿名開放大學中開設的真實課程數據與10 000名學習者的學習數據,測試他們設計的學習路徑規劃算法的性能。

3.2 評估方法

如何對學習路徑規劃方法進行評估是研究人員需要考慮的重要問題。根據不同的研究目標,可以將評估方法分為兩大類別：一類是內部評估,另一類是外部評估。內部評估試圖證明,研究者提出的學習路徑規劃算法適用于解決學習路徑規劃問題,或者在計算性能方面具有更好的表現;外部評估更關注學習者主觀的學習體驗與學習效果。

3.2.1 內部評估

在內部評估方法中,研究者通常使用信息檢索、機器學習和決策支持系統中常用的評估方法對學習路徑規劃方法進行評估,包括準確率、召回率、靈敏度[101]、均方根誤差、平均絕對誤差、模型運行時間等。Govindarajan等[101]以學習者表現為基礎,通過準確率和靈敏度2個指標評估學習路徑規劃算法的性能。作者將學習者按照其對知識掌握的熟練程度進行劃分,準確率用來度量當課程結束后,在所有注冊課程的學習者中,對課程掌握的程度可以達到“熟練水平”的學習者數量所占的比重。靈敏度用來度量當課程結束時,對課程的掌握程度達到“專家水平”的學習者數量占所有注冊人員的比重。

文獻[51,102-103]使用平均絕對誤差評估學習路徑規劃算法的性能。例如,Kla?nja等[51]將學習者滿意程度和平均絕對誤差相結合,評估學習路徑規劃算法的性能。通過引入學習者滿意程度,使學習者可以明確地決定算法的效用。即學習路徑規劃算法通過學習者的個性化特征為學習者推薦一條學習路徑,并預測學習者對當前推薦的學習路徑的滿意度,記為pi;當學習結束后,會要求學習者對推薦的學習路徑的滿意程度進行評分,記為qi。滿意度評分最低為1,最高為5,評分越高表示學習者對推薦的學習路徑越滿意。記錄學習者對推薦的N條學習路徑的真實評分與預測評分,并使用平均絕對誤差來度量這種偏差,偏差越小,代表學習路徑推薦算法性能越好

(1)

Durand等[2]通過計算算法生成一條學習路徑的平均時間評估算法的性能。Li等[104]通過分析學習路徑規劃算法的執行時間評估學習路徑規劃算法的性能。Garrido等[105]通過評估算法生成的路徑與學習者真實使用的路徑在學習材料內容和數量上的差異評估算法的穩定性,通過統計生成一條學習路徑所花費的時間評估算法的可擴展性。

李浩君等[40]使用相斥度評估算法性能。相斥度定義為學習路徑規劃算法生成的學習路徑與學習者需求之間的符合程度。相斥度越小,表明當前學習路徑越符合當前學習者的個性化需求;反之,則越偏離學習者需求。學習者與學習路徑的相斥度函數由4個子映射函數通過加權系數構建：

(2)

其中：ωi表示權重系數,F(i)表示子映射函數。F(1)表示學習資源難度與學習者能力差異信息映射函數;F(2)表示學習資源間的支出映射函數;F(3)表示學習資源與目標知識點匹配度映射函數;F(4)表示學習者學習風格與學習資源類型匹配度映射函數。

Saito和Watanobe[106]將學習路徑規劃問題抽象為推薦問題,并使用推薦系統中常用的度量指標——輪廓系數衡量算法性能。輪廓系數計算同一簇中學習材料內容的一致性評估學習材料是否被合理分配。輪廓系數介于-1和1之間,接近1表示處于同一簇中的學習材料被正確分配。輪廓系數由下面的數字表達式定義：

(3)

其中：a(i)是簇內每個學習材料之間的平均距離,b(i)是每個學習材料到最近的簇的平均距離。

上述評估方法的優點是容易實現,能夠在花費較少的前提下比較多種學習路徑規劃算法之間的優劣[1]。但是該方法也存在一定的可靠性風險,因為用戶的學習行為或學習偏好在學習過程中可能發生改變,但是上述評估方法沒有考慮這些因素的影響。

3.2.2 外部評估

學習路徑規劃方法的主要目的是提供滿足學習者個性化需求的學習材料,提高學習者的學習效率,針對該目的,研究人員提出了外部評估方法。外部評估方法主要包括對比分析法和用戶調研分析法2種。

對比分析法是目前最廣泛使用的外部評估方法。在該方法中,學習者被分為2組——實驗組和對照組,其中,實驗組的學習者使用學習路徑規劃算法推薦的學習路徑進行課程學習,對照組的學習者則自行完成課程學習或者使用老師制定的學習計劃完成課程學習。通過比較2組學習者對學習內容的完成度、完成同一學習目標所用時間、學習結束后作答同一測試試卷獲得成績的高低等指標評估學習路徑規劃方法的性能。

Kla?nja等[51]通過統計發現,實驗組的學習者完成一門課程需要的時間比對照組用戶少,從而證明學習路徑規劃算法的有效性。Xu等[62]在學習結束后,比較實驗組和對照組學習者編寫的程序的性能,驗證學習路徑規劃方法的有效性。Feng等[56]、Yang等[107]、Colace等[108]通過比較實驗組和對照組學習者作答相同試卷的成績,評估學習路徑規劃算法的有效性。Essalmi等[109]通過計算學習者的滿意度和用戶忠誠度評估學習路徑規劃算法的性能。

對比分析法可靠性較高,但是使用該方法比較耗時,需要統計學習者真實的學習數據,花費成本較高。

另一種比較常用的外部評估方法是用戶調研分析方法。使用該方法需要研究人員收集與學習路徑規劃算法相關的一些定性和定量信息。定性信息主要通過對學習者進行問卷調查的方式來獲取,例如,“你認為當前推薦的學習任務容易完成嗎?”,“你是否有足夠的時間來完成學習路徑規劃算法推薦的學習內容?”等。定量信息可以統計用戶在完成學習路徑規劃算法推薦的學習內容時花費的時間來獲得。Kla?nja等[51]通過非強制性問卷的方式,讓用戶對學習系統的速度、準確性、適應性、便利性4個特征進行評估。Li等[104]設計了一份由5個問題組成的問卷收集學習者真實的評估信息。

用戶調研分析方法可提供一些額外的信息,比如學習者真實滿意度、學習者忠誠度等,但是完成調研工作需要消耗較高的時間和金錢成本。由于用戶調研方法的難度大、成本高,用戶調研通常只能針對少量用戶和特定任務展開。因此,用戶調研的結果不能對所有用戶都具有可信度和概括性。

4 展望

學習路徑規劃方法雖然已經取得了很多重要的研究成果,但是仍然存在很多限制和挑戰。明確這些限制和挑戰可以幫助研究人員在未來的研究中解決當前的缺陷。本文提出以下7個關于學習路徑規劃方法存在的不足及未來的發展方向：

1)學習者參數的特異性

現有的學習路徑規劃算法中,在構建學習者模型時,主要考慮所有學習者均存在的共性參數,例如學習者的學習偏好、知識背景、個人知識儲備等,還存在許多與特定學習者相關的因素會影響學習者的學習進程和學習效率,例如學習者的第一語言、學習者間的文化差異、學習者的政治偏見、學習者的宗教信仰、學習者所處的社會經濟條件等。這些未被考慮的因素為未來的研究提供了機會?，F存的學習路徑規劃算法研究的目標通常是以前述的共性參數為基礎,提出一個普適的學習路徑規劃方法,以適應所有學習者,但是并沒有考慮特定環境中的特定學習者。

2)學習對象的多模態性

現有的學習路徑規劃方法主要針對單模態的學習材料展開研究,一些研究表明,使用多模態學習材料對學習者的學習過程具有積極的影響。未來的學習路徑規劃方法應該考慮不同知識領域中學習材料的多模態性,關注如何對不同模態的學習資源進行準確豐富的表示,并探索不同內容之間更豐富的語義關系,為用戶提供多模態學習材料融合的學習路徑。

3)學習材料參數的生成方式

目前,構建學習材料模型使用的各種參數主要由專家來定義,因此這些參數可能會受專家個人情感、經驗的影響存在一定偏差,另外隨著學習材料規模不斷擴大,這種參數定義方法需要較大的人力開銷。因此,未來需要研究學習材料特征自動捕獲和語義注釋的自動生成技術,從而自動生成學習材料的參數。例如,運用深度學習技術從視頻資料中自動提取學習材料的視覺特征,自動生成學習材料的特征參數,提高學習材料推薦的準確性。

4)學習路徑規劃算法的可擴展性

隨著學習者數量和學習材料的增加,學習路徑規劃算法需要處理的數據量同步增長,因此,需要存儲的學習者與學習材料的交互數據可能是巨大的。學習路徑規劃算法需要盡可能快地為學習者生成符合其特性的學習路徑,因此,在大規模數據量的情況下,如何設計具有高度可擴展性和適應性的學習路徑規劃方法成為一個值得探索的研究方向。

5)學習路徑規劃算法的評估標準

目前,尚缺乏一個統一且全面的評估標準對不同的學習路徑規劃算法進行比較。一個統一的評估標準應該擁有可靠的公共數據集以及一系列可用于評估算法結果的標準度量方法。目前,在學習路徑規劃領域中還沒有公開的可靠公共數據集和測試標準,這為未來的研究人員提供了一個可行的研究方向。

6)學習路徑規劃算法的實際應用

盡管學習路徑規劃算法已經取得了一定的進展,并且很多研究已經表明,學習路徑規劃方法提供的解決方案在提高學習者學習效率方面具有積極的影響,但目前大多數研究成果在教育中的實際影響仍然還局限于研究項目中。因此,還需要做進一步的研究與推廣,以使學習路徑規劃方法在現實場景中得到有效應用。

7)與學習路徑規劃相關的道德倫理問題

目前關于學習路徑規劃的研究中,并沒有提及與此相關的道德倫理問題。學習路徑規劃問題是一個涉及人類與智能技術的問題,因此,隨著科技的進步,道德倫理問題是一個需要被考慮的重要因素。

5 總結

學習路徑規劃方法的相關研究經過漫長發展,在學術界與工業界的均取得了一定的成果。本文從研究現狀、評估方法、未來發展方向幾個方面對學習路徑規劃方法進行綜述,指出學習路徑規劃方法目前存在的問題與面臨的挑戰,這些問題為研究人員揭示了研究機會。這些存在的挑戰必須得到解決,從而為學習者生成更高質量的學習路徑,推動學習路徑規劃方法更廣泛應用于實際學習與生活中。