智慧教育研究現狀與發展趨勢

2019-02-20 03:38鄭慶華錢步月魏筆凡張未展

計算機研究與發展 2019年1期

鄭慶華董博錢步月田鋒魏筆凡張未展劉均

1(西安交通大學電子與信息工程學院西安 710049)2(西安交通大學繼續教育學院西安 710049)3(大數據算法與分析技術國家工程實驗室(西安交通大學) 西安 710049)

教育信息化是信息化時代構建學習型社會和終身學習體系的基本技術途徑，是《國家中長期科學和技術發展規劃綱要(2006—2020)》和《國家中長期教育改革和發展規劃綱要(2010—2020)》的戰略任務之一.回顧國內外教育信息化的發展歷程，主要經歷了數字化、網絡化、智能化3個階段的演進.

在20世紀70,80年代，隨著信息技術，特別是個人電腦(PC)的出現，國內外首先出現了以計算機教育為著眼點的教育信息化熱潮.鄧小平同志在1984年的講話“計算機的普及要從娃娃抓起”深入人心.隨著信息技術發展與PC的進一步普及，教育信息化進入了教育資源數字化、教育管理信息化的時代，各種電化教育手段與電化教育館、廣播電視大學的出現，正式標志著教育信息化進入了數字化時代.

20世紀90年代到本世紀初，隨著互聯網的高速發展，教育信息化逐步進入了網絡化時代.遠程教育、在線教育等網絡化教育手段成為了緩解教育數字鴻溝和教育公平問題的重要途徑.1993年我國建成了中國教育與科研計算機網(Cernet)；在國際上，Internet也在同一階段迅速成長壯大，為開展網絡化教育提供了重要的支撐平臺.進而，隨著智能終端與移動互聯網的迅猛發展，具有4A特性(Anywhere,Anytime,Anyone,Anydevice)的移動學習，成為了網絡化時代教育信息化的主要特征之一.

2010年以后，隨著移動互聯網、人工智能、云計算、大數據等技術的發展，教育信息化進入了一個全新的階段，呈現出智能化、泛在化、個性化、開放化、協同化的趨勢.2011年大規模開放在線課程(massive open online course, MOOC)在全球范圍內推廣，隨之而來的是對教育信息化的智能需求與日俱增.人工智能與教育的深度融合已成為提升教育信息化發展水平和質量的重要手段.2017年國務院印發的《新一代人工智能發展規劃》中，明確指出“利用智能技術加快推動人才培養模式、教學方法改革，構建包含智能學習、交互式學習的新型教育體系.開展智能校園建設，推動人工智能在教學、管理、資源建設等全流程應用”，這標志著教育信息化的智慧教育時代正式拉開序幕.

智慧教育是指融合現代教育理論與大數據分析、人工智能等信息技術的新的教育信息化范式.當前，國內外對智慧教育尚未形成共識，但是從不同角度指出了智慧教育應具有的特點.例如國內學者祝智庭等人分析了“智慧”的內涵，指出智慧教育中的學習時空環境應具有感知、推理、輔助決策等智慧特性[1].楊現民則認為智慧教育是依托新一代信息技術的物聯化、智能化、感知化、泛在化的教育信息生態系統[2].新加坡在iN2015計劃中明確了智慧教育的3個特點，即泛在學習、交互式數字學習資源、適應不同學習風格的智能學習體驗[3].

本文中，我們將智慧教育定義為基于新一代信息技術的教育信息化新范式，旨在通過教學、管理、評估、決策等教育全過程涉及的資源、行為、情境、管理等教育大數據進行挖掘、分析、融合，建立具有智能導學、精準推薦、精細評價等特點的學習生態系統.

本文的貢獻主要有2個方面：

1) 在對國內外智慧教育研究與應用調研分析的基礎上，從3個層次建立了智慧教育的研究框架.最底層是教育大數據分析與挖掘，包括以教學行為等結構化數據為對象的教育大數據分析，以及以非結構化海量知識資源為對象的教育知識圖譜構建，這是構建智慧教育平臺的基礎.中間層是針對教學中導學、推薦、答疑、評價等環節的4項關鍵技術，包括學習路徑生成與導航、學習者畫像與個性化推薦、智能在線答疑以及精細化評測.最上層則是主流的國內外智慧教育平臺.圍繞上述框架，對國內外相關研究進行對比分析，總結了其特點與存在的問題.

2) 總結出當前智慧教育研究4個方面的局限性.①如何應對大規模學習者的在線輔導；②如何對學習者、教師、環境等要素進行精細化、全過程的評測；③如何應對有限認知帶寬問題導致的個體學習局限性；④如何通過分析教育大數據發現影響教學的潛在致因與規律.針對上述局限性，指出了智慧教育后續研究的4個方向，即在線智能學習助手技術、學習者智能評估指標與方法、網絡化群體認知模型以及教育大數據的因果關系發現方法.

1 教育大數據分析挖掘

1.1 結構化教育數據分析

結構化的教育數據主要包括學習行為(如鼠標點擊次數等)、學習效果(是否獲得證書等)以及學習者基本屬性(如年齡、性別等).近年來，國內外學者對大規模在線學習平臺(如Coursera,edX,Udacity等)的海量結構化教育數據已開展了分析研究工作.這些研究有助于揭示人類更深層次的認知機理，挖掘有價值的學習規律與模式.當前對教育數據的分析主要是相關性分析.相關性用于衡量變量間具有線性關系的程度，主要包括假設檢驗、回歸分析等分析手段.

在假設檢驗方面，典型研究工作如：Kizilcec等人[4]采用Fisher精確檢驗對MOOC學習軌跡數據進行了分析，并采用非監督學習方法將學習模式分為Completing,Auditing,Disengaging,Sampling Learner四種類型，為理解在線學習者的學習持續性提供了依據.Coetzee等人[5]也采用Fisher精確檢驗分析了edX平臺上中“軟件工程”課程的行為數據，發現學習者在論壇上的訪問次數與學習成績之間存在正相關性.Wilkowski等人[6]采用T檢驗分析了Google MOOC平臺上的行為數據，發現了不同學習目標下學習行為與課程完成率之間的相關性.

在回歸分析方面，典型研究工作如：Firmin等人[7]對3門MOOC課程進行了邏輯回歸分析，發現學習者及格與否與個人努力程度相關.Coffrin等人[8]根據學習者的交互數據，運用生存回歸方法對社交行為的中心度和課程學習的參與度進行了分析，揭示了能夠預測MOOC學習流失率的顯著性指標.Ramesh等人[9]基于隨機邏輯回歸分析出學習持續性相關的行為特征，用以預測MOOC學習的完成率.He等人[10]采用邏輯回歸方法預測學生是否能完成課程學習，并對邊界學生提供干預.國內蔣卓軒等人[11]結合邏輯回歸方法與相關圖方法分析Coursera上6門課程的學習行為數據，挖掘出學習行為與學習間的相關性.

上述研究得到的相關性大都是類似“學習效果好壞與個人努力程度相關”的結論，對構建當前急需的智能化導學、推薦、評價等機制，還缺乏可操作性.而支撐這類機制的核心是在教育數據中蘊含的因果關系.因果關系是指變量間的作用關系，一個變量的變化是由另一個變量觸發.盡管相關性分析在因果關系挖掘中具有重要作用，但是相關性既非因果關系的必要條件，也非充分條件[12].與因果關系相比，相關性還很難作為決策的依據.

1.2 教育知識圖譜構建

隨著Linking Open Data等項目的全面展開，語義Web數據源的數量激增，大量RDF數據被發布.互聯網正從僅包含網頁和網頁之間超鏈接的文檔萬維網(document Web)轉變成包含大量描述各種實體和實體之間豐富關系的數據萬維網(data Web).知識圖譜(knowledge graph)旨在描述真實世界中存在的各種實體或概念以及它們之間的關聯關系.和傳統的Web頁面網絡相比，知識圖譜中的節點從網頁變成了各種類型的實體，而圖中的邊也由連接網頁的超鏈接(hyperlink)變成豐富的各種語義關系.研究機構及商業公司以知識圖譜為基礎開展大規模知識庫構建，目前Google、百度和搜狗等公司均構建了自己的知識圖譜，分別為Google Knowledge Graph、知心和知立方.知識圖譜不僅可以改進搜索質量，同時也可以直接回答問題.

知識圖譜在檢索領域獲得廣泛應用之后，逐步擴展到教育、醫療等其他領域.教育知識圖譜可將分散、無序、海量的教育信息聚合成結構化、優質的知識，并智能地推薦給用戶，使用戶從海量信息的人工篩選中解脫出來，快速進行認知升級.如百度研制的百度教育知識圖譜主要用于K12教育市場，將題目與知識點進行對應，聚合相關知識點的多態優質資源，能夠支持并完成高效的人機交互.

知識圖譜的構建過程是從原始數據出發，采用一系列自動或半自動的數據挖掘技術，從原始數據中提取出知識主題等節點及節點間語義或認知關系.這是一個迭代更新的過程，每輪迭代包含2個基本階段：信息抽取和知識融合.教育知識圖譜的構建也遵循這2個階段，差別主要是節點及節點間關系類型不同.

信息抽取從各種類型的數據源抽取構建知識圖譜所需的各種候選實體(概念、知識主題)及節點間的關聯關系(包括語義關系、認知關系等)，形成一個個孤立的抽取圖譜(extracted graphs).知識圖譜主要來源于百科類網站和各種垂直站點的結構化數據，這類數據特點是質量較高、更新較慢.比如Google的知識圖譜很大一部分來源于Freebase,Wikipedia和IMDB等網站.而另一方面，知識圖譜通過從各種半結構化數據(如HTML表格)抽取相關實體的“屬性-值”對來豐富實體的描述.通過信息抽取得到的知識數據更大，并能及時發現最新的實體或事實，但其質量相對較差，存在一定的錯誤.Cafarella等人[13-14]開發了WebTables系統，該系統使用分類技術從海量HTML頁面的150億表格中抽取了1.5億條的高質量關系數據.該系統后來被Google收購用于構建Google的知識圖譜.Venetis等人[15]開發了一個用于HTML中海量表格的語義標注系統.該系統首先從Web上抽取得到含有噪音的類標簽及它們之間的關系形成一個數據庫，基于該數據庫及Web上觀察到的實例標注表格的每個列，從而獲得表格的語義.Mintz等人[16]提出一種Distant Supervision的方法從Web抽取各種關系，該方法假定，如果已知2個實體存在特定的語義關系，那么包含實體對的句子在某種程度上就存在表征二者語義關系的作用.這種方法充分利用了現有的知識庫，如Wikipedia、本體或者人工標注的小規模實體對，將這些高質量關系實體對作為種子，從Web中挖掘包含已知實體對的大規模文本，作為自動標注的語料庫，然后使用監督學習解決關系抽取問題.

為了形成一個完整的知識圖譜，還需要通過實體對齊(消歧)、模式層構建、可信性驗證等技術將這些信息孤島集成在一起.Bordes等人[17]基于深度學習技術將不同的符號框架嵌入(embed)到一個連續的向量空間中，從而可以方便地計算實體間語義相似度，進而完成預測及檢索任務.Google創建了名為 Knowledge Vault的知識圖譜[18]，迄今已經收集了16億件事實，其中，2.71億件是“可信的事實”.微軟創建的Probase[19]，從多達16億網頁數據中抽取出270萬條核心概念、2000多萬條概念間關系，是目前概念空間最大的知識庫.

目前還沒有成熟的教育知識圖譜產品，研究機構及商業公司側重于擴展現有知識圖譜技術，并研究基于知識圖譜的個性化資源推薦、導航學習、知識發現等技術.

2 教學環節的智慧教育技術

在線學習中主要包括導學、推薦、答疑、評價等教學環節，以下對各個環節中的學習路徑生成與導航、學習者畫像與個性化推薦、智能答疑、精細化評估等關鍵技術進行綜述.

2.1 學習路徑生成與導航

學習路徑推薦是根據學習者的先驗知識與學習目標，規劃一條由認知關系組成的路徑，其核心問題是如何自動生成高效的學習路徑.目前，針對學習路徑推薦的研究仍然處于探索階段，針對不同的需求和應用背景尚沒有公認的權威經典方法解決這一問題.已有的代表性研究工作可以分為基于學習者特征、基于語義關系、基于認知關系的3類學習路徑生成方法.

基于學習者特征的學習路徑生成方法是通過分析學習者在學習過程中表現出來的學習行為特點來完成學習路徑推薦.典型的研究有：Salehi與 Kamalabadi[20]提出了一種基于序列模式挖掘和多維屬性的協同過濾的新型推薦系統框架；Lin等人[21]開發了基于決策樹的個性化創新學習系統，為學習者提供個性化的學習路徑；Dwivedi等人[22]通過可變長度遺傳算法，綜合考慮學習者的學習風格和知識水平,為學習者提供有效的學習路徑；Basu等人[23]提出了一種基于用戶模型的系統，該系統考慮了學習者的偏好、先前的表現、學分要求以及推薦學習路徑的時間等參數.Bendahmane等人[24]提出了一種基于學習數據、學習者特征、期望和能力的方法CBA，通過對學習者進行聚類和跟蹤，最后給出合適的學習路徑.Salehi等人[25]引入了學習者偏好樹，將學習者所接觸材料的多維屬性、學習者評分、有序模式和順序模式組合到模型中.該模型使用混合、加權和級聯混合方法形成最終推薦的學習路徑.

以上6種方法都是從學習者的角度解決學習路徑推薦問題，大多采用集體智慧或表現優秀學習者的學習行為特征來提高生成的學習路徑的精確度和有效性.但是，這種思路需要花費大量時間構造優秀學習者的先驗知識庫，而且可能會面臨優秀學習者的日志缺失問題；同時由于并未考慮學習者當前的先驗知識到學習目標的必要性，以及不同學習者在學習過程中所表現的不同學習行為特征，因此，所推薦的學習路徑會或多或少地偏離學習者的原本需求，無法為學習者提供有針對性的指導.

基于語義關系的學習路徑生成方法是利用知識元本身的語義信息指導學習路徑的推薦.典型的研究有：Chu等人[26]提出一種基于本體的學習路徑生成方法，該方法首先根據知識元之間的關系建立知識元本體庫，進而根據本體之間的關系指導學習路徑的推薦；Colace等人[27]提出了一種基于貝葉斯網絡生成學習路徑的方法，利用領域本體中的概念關系，將學習路徑推薦問題視為一種排序約束滿足問題；Tam等人[28]提出了明確的語義分析，然后通過概念聚類增強本體分析，并應用優化器來尋找所涉及的概念或模塊的最佳學習路徑.Tseng等人[29]構建了自適應學習的概念圖，并為個體學生提供了知識點推薦.以上方法大多缺失目標知識元學習的必要條件，忽視了知識間認知序關系對認知的影響；此外，本體之間的聯系是多種多樣的，這種聯系不一定是認知角度的學習先后順序，用這些各種各樣的聯系去建立學習路徑并不太合適.

基于認知關系的學習路徑生成方法主要是通過知識圖譜解決大量的異質學習資源導致學習者的知識迷失和認知負載問題.朱艷茹等人[30]在學生能力的引導下，構建了一個能夠自動診斷用戶學習能力的用戶模型，并為不同特征的學習者提供“最佳契合”的個性化學習路徑.趙琴等人[31]提出一種基于改進蟻群優化算法的微學習路徑推薦方法，該方法主要用于檢測學習者的知識水平、知識領域和學習目標的學習遷移；Durand等人[32]提出一種基于圖論的學習路徑推薦系統，用貪心算法求最短路徑的局部最優解.這些學習路徑推薦方法不足之處在于：不能根據學習者的學習過程和學習能力提供多樣化的學習.

2.2 學習者畫像與個性化推薦

精準學習者畫像是現階段個性化教學的核心內容，即如何有效地利用學習者的靜態和動態信息來建立學習者畫像，為個性化教學提供基礎.陳海建等人[33]結合學習者的基本信息、在線學習行為、課堂表現以及腦認知實驗，利用標簽化的形式進行個性歸納和畫像，從而有效地服務于個性化教學.何娟[34]利用用戶借用的圖書詞頻分析結合用戶靜態特征屬性，分別進行單個、群組的用戶畫像的構建，實現圖書的個性化推薦.黃文彬等人[35]采用頻繁模式挖掘、構建概率矩陣、計算熵等方法，從用戶日志中所包含的地理位置信息中構建移動用戶行為畫像，分析移動用戶群體行為及用戶間交互行為.楊捷[36]提出一種結合主題模型和用戶屬性的用戶畫像建模方法，并與因子分解機模型相結合，有效地解決了數據稀疏問題.費鵬[37]提出基于多粒度神經網絡結合多種機器學習模型對文本特征進行特征萃取的多視角融合框架來構建用戶畫像.

在資源推薦方面，典型的推薦策略包括：基于內容的推薦、協同過濾推薦、基于社交網絡的推薦、基于關聯規則的推薦、混合推薦等.

基于內容的推薦方法是應用于資源推薦領域最主要的推薦策略，最早應用于信息獲取領域[38]，主要思想是根據用戶的交互項目，選擇與用戶交互項目相似的項目作為推薦結果.梁婷婷等人[39]提出基于內容過濾PageRank語義相似替換的Top-k學習資源推薦方法.該方法首先基于內容的向量空間濾波建立學習資源過濾推薦模型，然后通過計算資源間匹配方式以取代語義相似性，從而避免多義詞或同義詞的漏檢問題.

協同過濾推薦技術在個性化推薦領域是最成功的策略，適用于存在大量用戶行為數據或者具有大量資源信息時的學習資源推薦.駱金維等人[40]結合課程教學資源數據間的相關性及學習者行為數據給學習者進行教學資源推薦，提高課程教學資源共享效應.

隨著在線教育的發展，基于社交網絡的推薦快速發展，Wan等人[41]在充分挖掘學習社群成員之間社會關系的基礎上，開發了QSIA(questions sharing and interactive assignments)系統用于提升推薦效果和協作水平.賀超波等人[42]設計了一種基于興趣社區的學習資源推薦模式，首先通過構建基于社交網絡的在線學習服務為學習用戶提供交流協作以及學習資源評價環境，然后利用興趣社區挖掘技術發現興趣高度相似的用戶群體，最后基于相似用戶群體對目標用戶進行學習資源推薦.

為實現精準的學習資源推薦，需要整體考慮數據之間的關聯關系，對學習者、資源等進行多維關聯分析，由此產生基于關聯規則的推薦.丁繼紅等人[43]引入張量理論構建“學習者-資源”融合張量，利用高階奇異值分解算法挖掘學習者和資源的關聯關系，實現學習者和資源之間的精準匹配.多維關聯分析方法有利于大數據環境中對個性化學習資源的推薦，提高在線教育和個性化學習的質量.

以上推薦策略都有各自的優缺點，而在實際應用中可以針對具體問題采用推薦策略的組合進行推薦.通過組合不同的推薦策略，主要的混合方式可以分成2種:1)對推薦結果進行組合[44];2)對推薦算法進行組合[45-46].混合推薦模型是對多維度特征推薦的一種有效方法，依賴于大數據的支持[47].

2.3 智能答疑

智能答疑系統是將機器視為一個認知主體的人機交互系統，是人工智能領域的一個重要分支.隨著計算機硬件技術和移動互聯網的迅猛發展，能夠有效處理非精確信息交互的、符合人類自然交互習慣的認知型智能答疑系統受到了越來越多的關注，并在網絡自動答疑、在線學習平臺、智能教師(intelligent tutor)、個性化學習助手等方面得到了廣泛應用.目前，國內外智能問答系統的研究主要涉及問題理解、對話管理、對話生成和對話評測4部分.

1) 問題理解.目前自然語言處理領域主流的對話理解研究多是對問句進行關鍵詞提取和擴充、語法分析、句法分析等，一般包括問題分類(如what,when,who,where,why,how)[48-50]、關鍵詞提取和關鍵詞擴展.通過確定問題的類型，制定關鍵詞和答案抽取的規則，提取出關鍵詞后，依據問題類型等因素對關鍵詞進行適當的擴展，然后將關鍵詞提交到信息檢索模塊來查找相關文檔[51].基于語法、句法分析的問題理解的方法也是一種重要的問題理解方式，這類方法主要是以語義角色標注為代表的基于語義表示模型的分析方法[52-53].國內研究人員根據中文語言的獨有特點也提出了很多中文語義表示模型[54]，例如漢語問句語義組塊[55]、融合事件信息的復雜問句分析方法[56]、基于句法分析樹的查詢語義圖語義理解方法[57]以及基于主題和焦點的問句分析方法[58-60].此外，隨著深度學習的發展，基于詞向量的語義理解也逐漸得到關注[61-63].

2) 對話管理.對話管理通常包括問答知識庫構建、對話策略管理、搜索引擎3個核心功能.建立問答知識庫并從中構建高質量的問答模型是對話管理的核心問題，同時還是人機對話順利進行的必要保證.對知識庫進行建模就是利用已有的大量問題答案對、自由文本等語料構建問題答案之間的匹配模型.目前解決問答匹配的方式主要是問題建模、對答知識建模和答案建模，另一種技術路線則采用了Encoder-Decoder框架，通過構建端到端(end-to-end)的深度學習模型[64-65]，從海量對話數據中自動學習提問和回答之間的語義關聯，達到對于任何用戶提問都能夠自動生成回復的目的.在對話管理策略功能方面，目前應用的模型主要包括有限狀態機、填槽法、Markov決策過程(Markov decision process， MDP)、部分可觀察Markov決策過程(partially observable Markov decision processes，POMDP)、基于實例的、基于規劃的、貝葉斯網絡等近10種方法.而搜索引擎技術是問答系統的重要支撐之一，智能答疑系統中的搜索引擎就是根據從用戶已輸入的自然語言中提取有用信息，使用不同的搜索技術，在已有的數據庫、文本庫、模型庫或是網絡中搜索與用戶問題最為相關的信息，并交給對話生成模塊以構成對用戶問題的回答.

3) 對話生成.在使用智能答疑系統進行人機交互時，生成語句通順流暢的類人(human-like)對話是交互能不斷進行的前提.自然語言生成是根據對話管理部分產生的非語言信息，自動生成面向用戶的自然語言反饋[66].近年來，在智能答疑系統上的對話生成主要涉及檢索式和生成式[67-69]2類技術.檢索式對話生成代表技術是在已有的對話語料庫中通過排序學習技術和深度匹配技術找到適合當前輸入的最佳回復.這種方法的局限是僅能以固定的語言模式進行回復，無法實現詞語的多樣性組合.生成式對話生成代表技術則是從已有的對話中學習語言的組合模式，通過類似機器翻譯中常用的“編碼-解碼”過程去逐字逐詞地生成一個回復，這種回復有可能是從未在語料庫中出現的、自主“創造”的句子.

4) 對話評測.評測一個任務驅動的多輪對話系統，主要涉及評測自然語言理解、對話狀態跟蹤[70-71]和對話策略[72-75]3個部分.自然語言理解是一個典型的分類問題，可以通過準確率、召回率和F-score等指標進行評測.對話狀態跟蹤，作為輔助對話策略的一個中間環節，業界已總結出一系列的評測標準，詳情請參考歷屆DSTC[76]公開評測.而對話策略的質量通常需要通過對話系統的整體效果來體現，其主要評測指標是任務完成率和平均對話輪數.

隨著計算機科學、自然語言處理以及人工智能技術的進步，智能答疑系統也取得了巨大的發展和突破.但是，就目前智能答疑系統的應用和發展來看，當前的智能問答系統仍存在諸多問題，并且大都以“一問一答”的單輪簡單對話形式呈現，多采用基于規則的和數據的信息檢索方式實現，都比較短視，并沒有考慮前后多輪對話之間的連貫性，缺乏有效的知識支撐，在專業領域自然語言理解也存在諸多困難，而交互式多輪對話管理機制缺乏多學科融合和新技術的推動.對此，可以從智能答疑問題的基本定義出發，深入探索所研究問題的背后機理，據此建立其數據與基本算法支撐，聚焦到解決問題的核心算法與數學理論，構建出以知識推理為支撐、深度學習語義驅動的多輪對話系統，以此解決目前智能答疑系統所面臨的挑戰和問題.

2.4 精細化評估

精細化評估指以學習者、教師、教學環境等要素為對象對教學過程進行精準、細粒度、全過程的評估，主要包括過程性評估和終結性評估2方面.以對學習者的評估為例，過程性評估關注學生學習過程中的學習方式，通過對學習方式持續的過程性評估，將學習方式由表層式或成就式引導到深層式的方向上來，從而形成“深層式學習方式—高層次學習結果—深層式學習方式”的良性互動[77].終結性評估關注學生學習的結果，對其最終學習效果作出結論和判斷.

精細化評估一直是教育領域的研究熱點，其應用場景既包括在線教育又包括近年來興起的MOOC.例如國際計算機學會(ACM)規?；瘜W習會議(Learning at Scale，簡稱L@S)每年都設立專門的分組(Session)研討評估技術的進展.

在在線教育場景方面，典型研究工作如：Admiraal等人[78]提出了一種基于語義Web技術的在線教育評估框架，基于學習者動態的學習過程評估學習者的知識水平.劉力紅等人[79]提出一種基于矩陣的二級模糊綜合評估模型，量化評估學習者的學習狀況.Ozkan等人[80]提出一種面向在線教育的六角形評估模型，從內容質量、學習者觀點等六個維度對在線學習環境進行多元回歸分析.

在MOOC場景方面，典型研究工作如：Huisman等人[81]利用分層線性回歸的思想把學習者的終結性評估分為自我評估和同伴評估，并探討了學習者成績與其同伴自身能力水平的關聯性.Gamage等人[82]提出一種IPR(identified peer review)評價框架，通過設置激勵條件和隨機條件，識別出關聯性高的學習者進行同伴評估，對比盲目同伴評審有更好的反饋結果.Alcarria等人[83]設計了一種強化的同伴評分算法，通過檢測并剔除異常反饋來糾正同伴評價偏差，以此提高同伴評估的效果.

上述研究從學習者、教師、教學環境等不同角度進行評估，特別是在MOOC場景下關注同伴評估.但現有研究成果對構建智慧教育的精細化評估還缺乏可操作性.首先，教師與學習者在空間上是分離的，他們之間缺少情感交流和反饋，不利于為學生找到適合自己的教學方式[84]，盡管目前個性化推薦系統豐富多樣，但并未以精細化評估學習者的興趣為基礎.其次，在線上授課系統中，學習者的積極性無法保證，具體體現在學習過程中學習者之間難以形成學習共同體，學習動力不足[85].對此，綜合考慮學習者、教師、教學環境3方面的因素，在考慮學習者隱私的情況下捕獲并分析其學習環境[86-88]，建立學習者與教師間的反饋機制與情感溝通，進而實現精細化評估，是評估技術的一個重要發展方向.

2.5 小結

對在線學習中的導學、推薦、答疑、評價4個教學環節涉及的關鍵技術進行總結，如表1所示:

Table 1 Representative Methods and Their Characteristics in the Four Processes of Teaching表1 教學4個環節的代表性方法與特征

Continued (Table 1)

3 主流的智慧教育平臺及應用

近年來，隨著移動互聯網、物聯網、大數據、云計算等技術的發展，更得益于人工智能的浪潮，新興的教育平臺不斷地朝著更加智慧的方向發展.智慧教育平臺相對于傳統的教育平臺，實現了人工智能技術與教育核心業務的深度融合，體現出智能化個性化學習服務、教育資源智能化組織管理、人機協同智能交互、教學過程與效果智能評測、智能化沉浸式學習環境等諸多鮮明特征.

基于學習者行為的智能分析，提供個性化的學習服務，是智慧教育平臺的基本特征，可顯著提升平臺用戶的學習效率.國際上三大MOOC平臺Coursera[89],edX[90]和Udacity[91]，及國內的主流MOOC平臺，如MOOC中國[92]、學堂在線[93]等，都已經具備不同方式的個性化學習功能，包括通過收集數據分析學生的學習進度和理解情況，提供與個人學習水平相當的作業、測試及分組任務.此外，主流的學習管理系統(LMS)、課程管理系統(CMS)等，也均提供個性化的學習管理服務.例如，世界上最知名的開源學習管理系統Moodle平臺[94]已支持個性化的學習環境.而著名的商用系統Blackboard[95]也能夠提供個性化、基于能力的掌握式學習(mastery study).此外，在混合式教學領域，Edgenuity[96],Fuel Education[97]等均為面向K12混合學習的個性化智慧教育平臺，使學生個性化地合理安排學習時間與內容，顯著提升混合式學習的教學效果.

在教育資源的智能化組織管理領域，為了實現教育資源的有效組織，為個性化導航式學習及智能人機交互提供技術支持，知識圖譜技術已逐步地被采用.Yotta系統[98]側重于實現海量教育資源的有效組織與管理，基于碎片化資源聚合的“知識森林”，為學習者提供方便的學習導航服務.網易云課堂[99]在其最新版本中，實現了基于“學習圖譜”關聯碎片化知識的功能.好未來K12智慧教育產品[100]構建了跨年級的知識網絡，用于個性化學習推薦以及評測.乂學教育的松鼠AI智適應學習系統[101]同樣構建了以細粒度知識點為單位的知識圖譜，以助力自適應學習.在國外，MIT公開課[102]、Khan Academy[103]均構建了相應的知識圖譜.其中，MIT公開課進一步將面向本科教育的課程圖譜可視化.

在人機協同的智能交互領域，隨著自然語言處理等相關技術的發展，AI虛擬教學助手逐步得到應用，為學習者提供互動的教學輔助手段，以提高課程的關注度與完成率.2016年美國佐治亞理工學院Ashok Goel教授使用的智能虛擬助教Jill Waston，實現97%的回答準確率，該虛擬助教基于IBM Watson Assistant[104]平臺技術實現，大幅度減輕教師教學壓力，同時幫助學習者進行在線智能答疑，提高學習效率.在國內，學堂在線也發布了個性化的學習伴侶“小木”，在減輕教師教學負擔的同時，幫助學習者提高學習的積極性.

在教學過程與效果的智能評測領域，一方面，眾多智慧教育平臺及應用具備了面向教學過程的自動化評測，包括智能題庫、閱卷、作業批改等，以減輕教師的教學壓力，并及時反饋評測學生的學習狀態.例如，科大訊飛的智慧教育系列產品[105]實現了面向英語教學的智能評分，能夠完成智能化的英文寫作批改與英語口語評測.Khan Academy開發的練習記錄系統，對學生的學習狀況進行評估測試，與同階段學生比較后進行教學班級的重編.另一方面，基于教育大數據的深度分析，眾多智慧教育平臺及應用同時也為教育管理者提供教學效果的精準分析.例如，Blackboard提供抄襲檢測、電子檔案袋、自動評分和重新分級、交互式評價和風險跟蹤等功能.好未來的智慧教育產品面向教育管理者，可預測學生的學習意愿，為培訓機構的管理運行提供參考.

在智能化沉浸式學習環境的構建領域，Agilix平臺[106]在混合與虛擬現實的沉浸式學習環境中，提供個性化服務.Web Courseworks[107]通過AR,VR等技術，基于3D視頻實現人機協同的智能交互.SkyClass[108]在提供基于Web的實時多媒體交互課堂的基礎上，引入了人臉檢測與增強現實的功能，既可以用于確認學生身份，也可以通過AR提升學習者的興趣與沉浸感.在國外，谷歌的VR,AR教育產品Google Expeditions[109]允許教師引導學生瀏覽360度場景和3D對象，并智能顯示學生的興趣點.

Table 2 Comparative Analysis of Mainstream Intelligence Education Platforms and Applications表2 主流智慧教育平臺及應用對比分析

人工智能與互聯網教育的結合使得智慧教育平臺高速發展，主流智慧教育平臺及應用對比分析如表2所示.然而，現有的智慧教育平臺依然存在諸多不足之處，如老師與學生、學生與學生之間的時空隔離，在線智能學習助手與虛擬導師還無法通過圖靈測試，網絡化群體學習環境下的協同認知機理有待挖掘與利用等.

4 智慧教育的研究展望

4.1 研究方向1：在線智能學習助手

近年來，在線智能學習已經從計算機輔助教學、智能教學系統、智能教室逐漸演化為以學習者為中心，強調普適化、個性化的學習技術.隨著人工智能技術的發展，如何在學習過程中通過學生與在線學習系統的交互，實現個性化的教學和輔導受到研究者們越來越多的關注.

在利用智能學習助手進行學習的過程中，個體具有能力、背景、學習方式、學習目標等各種差異性，即使是個體本身，在學習過程中，知識狀態也在不斷的變化，所以針對每個個體實現個性化的自適應在線智能學習系統是必然發展趨勢.未來的教育必須是個性化的，學生必將從與在線智能學習的交互中受益，但是在線智能學習中的人機交互(human-computer interaction， HCI)不僅僅是簡單的界面交互，而是在學習的過程中學生與機器之間知識的連續傳授與更新[110].目前最新的認知計算技術(cognitive computing, CC)在在線智能學習領域的應用方面具有良好的前景，借助于其教育數據挖掘(educational data mining, EDM)、學習分析(learning analysis, LA)等相關的技術，可以通過分析學習者的學習活動中產生的數據，為學生、教師和管理者提供實現其各自目標的參考，并動態追蹤學習者的學習活動，提供個性化的學習體驗，此類技術有望實現傳統以內容為主的在線學習到以人為主的個性化學習的轉變.此外，在在線智能學習的過程中，如何評估學生的接受程度、學習狀態的變化以及如何更新知識，是個性化自適應在線智能學習實現智能化需要解決的重要問題.隨著深度學習和大規模人工神經網絡的蓬勃發展，人工智能時代的到來使教育具有可追蹤性和可預見性，通過進行學生知識建模，如貝葉斯網絡的學生知識點追蹤模型(Bayesian knowledge tracing, BKT)[111]、基于神經網絡的學生知識點追蹤模型(deep knowledge tracing, DKT)[112]、效果因素分析模型(performance factors analysis model, PFA)[113]等.通過相關的模型分析，可以對學生知識點的變化進行追蹤，實時了解學生知識點的掌握情況，并根據學生的實踐和知識生成相關的問題來評估每個學生的熟練程度，依照每個學生的知識結構、智力與熟練程度來設計個性化的教程.

目前，研究者們在已有研究中對在線智能學習系統的知識建模方法、認知計算技術和生物傳感技術的應用方面已經做了較為深入的探討，但是以人機互適應學習、自主探索學習等核心技術為基礎，以人類智能與機器智能協同互適應學習為目標，個性化、高效的新型在線智能學習系統的構建方式仍需繼續探索.

4.2 研究方向2：學習者智能評估

當前，對于學習者的智能評估，傳統且普遍的方法是通過間接測量比如試卷檢測、問卷調查等來判定學習者的能力、智力發展水平[114-115]，但這種方式模糊且不精確.利用無線傳感、人機交互、虛擬現實等技術，可實現實時監測學習者學習狀態，全方位多維度采集學習者第一、二課堂及生活數據，以機器學習算法為支撐進行全面且高效的學習者能力評估.然而其中還面臨一系列的挑戰：1)數據的來源廣、維度高、規模大[116]，使得評估指標難提??；技術發展的不成熟使得數據采集存儲存在隱私泄露隱患[117].2)思維與能力具有復雜映射關系，且其各自本身具有不同層次，設計有效的測試方案是一大難題，同時，結果的評價存在不可證實性.

圍繞上述難題，需要開展的研究工作包括：1)采用數據降維去噪、多模態融合解決數據的規模大、維度高等問題，同時采用互聯網+云計算、訪問控制等方式進行隱私保護;2)針對不同背景的學習者，采用定量和定性結合、個體與整體結合的方式進行測試，從能力與思維的不同側面全面綜合進行評價方案的設計.

4.3 研究方向3：網絡化群體認知模型

人類個體存在有限認知帶寬問題，表現為獲取、處理、理解信息的能力受生理特點限制，例如：大腦同時處理最多4個概念，理解文本的速度低于60 bps，短期記憶(short-term memory, STM)僅能存儲7±2個信息塊.

網絡化群體智能(networked collective intelli-gence， NCI)是指網絡環境下個體通過以競爭和合作等協同方式在完成特定任務過程中涌現出來的超越個體的智能.利用NCI能夠實現網絡化群體認知，是突破個體認知局限的重要途徑.其難點在于：如何對NCI進行建模與評測、如何發現影響NCI的關鍵因素.

需要開展的研究工作包括4個方面：1)面向群體認知的NCI協同學習模型(synergetics model)；2)群體認知行為對NCI的影響機理與關鍵因素；3)網絡化群體智能的涌現特性分析；4)基于NCI的知識聚合機理.

4.4 研究方向4：教育大數據的因果關系發現

當前對于教育大數據的分析，主要側重于相關性分析，對于因果關系分析的研究還非常薄弱，而后者是構建智能化的導學、推薦、評價機制的重要依據.然而，教育大數據的因果關系還面臨一系列技術難題：

1) 教育大數據包含了學習者、內容、效果、行為等多個維度的變量.挖掘高維變量間的因果關系通常存在較高的復雜度.例如因果圖構建的復雜度與變量個數呈指數函數關系[118].

2) 從高維的教育數據中識別出混淆因子(con-founder variables)和偏倚(selection bias)等隱變量也是一個難題.隱變量是指未能觀察或無法度量的變量[119]，通常是事件的隱性致因，對于簡化因果關系、提升其可解釋性具有重要作用.

圍繞上述難題，需要開展的研究工作主要包括2個方面：1)針對教育數據的海量、高維和稀疏等特性，研究高效的因果圖生成方法，解決圖學習與方向學習中時空開銷大的問題;2)研究教育數據的隱變量識別問題，并基于認知科學分析因變量的可解釋性.

5 結論

當前，教育信息化經歷了以解決教育資源及場景時空受限問題的計算機輔助教學、網絡教育、MOOC等階段，逐步過渡到大數據、人工智能驅動的智慧教育階段.由于具有智能導學、精準推薦、定制輔導、精細評價等特點，智慧教育成為國際上教育信息化發展的趨勢，也成為一個熱點研究方向.本文在對國內外智慧教育研究與應用調研分析的基礎上，從教育大數據分析挖掘、主要教學環節的關鍵技術以及國內外智慧教育平臺3個層次對國內外相關研究進行對比分析，總結了其特點與存在的問題.本文進一步分析了當前智慧教育研究的局限性，總結了在線智能學習助手、學習者智能評估、網絡化群體認知以及教育大數據的因果關系發現4項研究問題，指出了智慧教育未來的研究趨勢.