?

基于大數據群體畫像的個性化學習環境構建的研究

2020-04-22 06:51康琦岳鹍
高教學刊 2020年13期
關鍵詞:學習環境個性化大數據

康琦 岳鹍

摘 ?要:個性化學習環境是網絡學習環境的高端形態,是信息化教學時代學習者對網絡學習環境的新需求,也是未來教育發展的方向。研究構建了一種結合學生線上學習大數據采集、大數據預處理、語義化標簽提取、群體畫像挖掘等相關技術于一體的學習者群體畫像挖掘路徑,深度挖掘學習者畫像與學習資源間的隱性關聯,實現個性化學習環境構建與用戶的精準匹配,達到對學生進行個性化的指導,提升學習效果的目的。

關鍵詞:大數據;群體畫像;個性化;學習環境

中圖分類號:G640 ? ? ?文獻標志碼:A ? ? ? ? 文章編號:2096-000X(2020)13-0052-04

Abstract: Individualized learning environment is the high-end form of the network learning environment, the new demand of learners for the network learning environment in the era of information-based teaching, and the direction of future education development. This research constructs a learner group portraits mining path which combines the technologies of big data acquisition, big data preprocessing, semantic tag extraction, group portraits mining and so on, meanwhile explores the hidden relationship between learner persona and learning resources, thus realizing the precise matching between the construction of personalized learning environment and users, and providing personalized guidance for students so as to improve their learning efficiency.

Keywords: big data; group portrait; personalization; learning environment

隨著網絡信息技術的迅速發展,慕課以其開放共享、資源豐富、互動性強、突破學習時間和空間限制等優勢得到迅速發展。隨著慕課的快速發展,海量冗余課程資源帶來的“數據泛濫”“知識迷航”等問題,嚴重影響了學習者的積極性和學習效率,高輟學率也成為了制約慕課發展的一個重要因素。如何針對學習者的個性特性,為其推送與之能力水平、興趣愛好相適應的學習資源,構建與之匹配的個性化學習環境就成為了研究熱點[1-3]。

用戶畫像是一種基于提取、分析用戶歷史數據,利用數據化、語義化的標簽對用戶行為特征進行刻畫,實現對用戶信息進行全面概括的工具。群體用戶畫像分析是利用聚類分析的方式,將具有共同特征的用戶劃歸到一個族群,進而有效挖掘用戶群體的個性化需求,為其匹配精準化的服務資源。因此,研究提出了基于大數據分析的群體用戶畫像理念,通過構建群體學習者畫像模型,從畫像層面深入挖掘用戶個性化學習的精準需求,實現個性化學習服務的智能化與精準化,為解決大數據環境下個性化學習環境的構建問題提供有效解決辦法[4-6]。

一、基于群體畫像的個性化學習環境構建路徑設計

個性化學習環境的構建離不開對學習者類型及特點的準確識別和分類,慕課學習者群體畫像的形成是基于對學習者海量行為數據如個人學習投入程度、瀏覽類型偏好、互動參與程度及作業完成情況等數據的采集和挖掘,提煉關鍵學情信息,加以標準化和標簽化處理,形成語義化的用戶特征標簽,通過聚類分析將具有相似性偏好的用戶分組而得到的。聚類后的學習者群體,可以根據其相似的學情特征、興趣偏好、學習風格等,將學習者劃分為不同的學習類型,從而有針對性地為學習者提供課程學習資源、布置練習、設置互動環節等,為學習者定制個性化的學習環境。

為了得到一個全面的學習者畫像,研究設計了一個結合大數據采集、數據預處理、標簽提取、畫像挖掘等相關技術的學習者群體畫像挖掘路徑。研究首先對學院慕課平臺上專業課程的學習者學習大數據進行采集,然后對采集到的數據進行整合、清洗、轉化和規約,排除干擾數據,精簡處理數據規模;預處理后,基于預處理完成的數據利用主成分分析和因子分析法提取個性化的標簽;最后利用提煉出來的個性化學習標簽進行聚類分析,使具有相似屬性特征的學習者畫像聚合形成不同類型的學習者群體,挖掘學習者群體畫像與學習資源間的隱性關聯,由此實現個性化學習環境與用戶的精準匹配[7-10]。

二、基于大數據挖掘的學習者群體畫像

(一)個性化學習大數據的獲取

研究以學院慕課平臺中《會計電算化》課程近3學期,分布在3個年級14個班級的學習者為研究對象,學生學習課程期間的活動行為被系統采集并形成數據集,各類數據具體的內容見表1。研究利用慕課平臺具備的數據統計工具將上述數據分別導出為Access數據表文件,為后續的畫像挖掘提供基礎數據。

(二)個性化學習大數據的預處理

1. 數據整合

研究采用Excel 2016中的Power Query插件中數據獲取功能,采用學生線上注冊過程中平臺自動生成的UID值作為標識值,將平臺采集的十四個選項導出的Access數據表進行整合,形成統一的數據表。整合后,每個UID值對一名學生的32項基礎及行為數據。

2. 數據清洗

為了不影響后續的數據挖掘,研究主要采用人工和計算機相結合的清洗方式,通過Excel對缺失、重復、異常及干擾數據進行篩查和清洗,篩選和剔除數據集中存在的無關數據和噪聲數據,補充遺漏數據。

3. 數據標準化

由于數據中各項指標量綱不一,因此為了消除量綱不同對數據分析的影響,研究利用Z-score方法即標準差標準化方法,對清洗后的數據進行標準化處理,變化后每個指標的均值為零,標準差為1。

4. 數據規約

為了集中關注學生學習行為,研究將主要針對反映學生學習動態的指標進行分析,而暫不將靜態指標納入分析范圍。研究采用IBM SPSS Statistics 21.0對標準化后的21項數據進行主成分和因子分析。通過計算得出各指標的累計方差貢獻率和方差貢獻率,得出主成分分析的相關系數矩陣和方差貢獻率表。根據特征值大于1的原則,研究可以提取5個公因子,當提取5個公因子時方差累計貢獻率達75.25%,說明5個公因子基本包括了所選擇的21個變量的大部分信息量,提取該5個因子作為21個變量的公因子是合理的。

(三)語義化標簽的構建

為了使得標簽的命名能夠具有解釋性,采取方差最大法對因子荷載矩陣實施了正交旋轉,正交旋轉之后的結果顯示提取的五個因子都將反映了學生在學習中的某種特征,具體解釋如下。

第一個標簽在課程訪問次數、瀏覽停留時長、文稿瀏覽次數、文稿瀏覽時長、圖片瀏覽次數、圖片瀏覽時長、動畫瀏覽次數、動畫瀏覽時長、視頻瀏覽次數和視頻瀏覽時長等10個變量上具有比較大的載荷。這10個變量主要表現了學生按照教師安排的學習計劃,在線上瀏覽課程各種資源時投入的時間,集中體現了學生對不同類型課程資源學習的投入程度,因此將這一標簽命名為學習偏好標簽。

第二個標簽在周期活躍度1個變量上具有比較大的載荷。這1個變量是學生全學期在線上學習的天數占學期總天數的比例,集中體現了學生學習的持續性和穩定性,因此將這一標簽命名為學習投入標簽。

第三個標簽在作業成績、測試成績、討論成績、問答成績和期末考試成績等5個變量上具有比較大的載荷。這5個變量主要表現了學生按時完成教師線上布置的單元作業、課題隨機測試、話題討論、主觀問答題和參加期末考試取得的成績,集中體現了學生在學習不同階段的學習效果,因此將這一標簽命名為學習效果標簽。

第四個標簽在搜索次數、資源評論次數2個變量上具有比較大的載荷。這2個變量主要表現了學生為了完成學習任務主要進行資源搜索的次數、學習完成后對教師提供的各類學習資源發表學習心得、提出改進意見的情況,因此將這一標簽命名為主動思考標簽。

第五個標簽在參與討論率、提交作業率和參與問答率3個變量上具有比較大的載荷。這3個變量主要表現了學生參與教師發布的開放性討論問題、階段性測試、開放性問答題的積極性程度,因此將這一標簽命名為互動行為標簽。

(四)基于學習大數據的畫像挖掘

在因子分析的基礎上,根據提取出來的學習偏好標簽、學習投入標簽、學習效果標簽、主動思考標簽和互動行為標簽,對學生進行K-means聚類分析。通過標簽聚類, 將412名學生分為6類。通過對聚類后6種類型群體的中心點比較,可以發現這6類群體在學習投入、學習偏好、互動參與、階段測試等方面存在較為明顯的差異,具體畫像結果如下。

1號畫像群體,學生人數21人,占比5.10%。此群體學生學習投入程度較低,各類資源瀏覽率均處于最低水平,僅僅能最低限度地參與教學互動活動;基本沒有主動學習意愿,學習成績處于及格水平。

2號畫像群體,學生人數39人,占比9.47%。此群體學生學習投入程度一般,資源能基本完成瀏覽,能完成基本的教學互動活動;主動進行最基礎的資源檢索,并對課程資源進行簡單評價,學習成績處于中等偏下水平。

3號畫像群體,學生人數88人,占比21.36%。此群體學生屬于視覺型學習者,學習投入程度較高,能根據學習的需要反復瀏覽資源,重點關注文稿、圖片資源;能積極參與教學互動活動,能主動進行資源檢索,并對課程資源進行評價,學習成績處于良好水平。

4號畫像群體,學生人數83人,占比20.15%。此群體學生屬于聽覺型學習者,學習投入程度較高,能根據學習的需要反復瀏覽資源,重點關注視頻、動畫資源;能積極參與教學互動活動,能主動進行資源檢索,并對課程資源進行評價,學習成績處于良好水平。

5號畫像群體,學生人數93人,占比22.57%。此群體學生屬于動覺型學習者,學習投入程度高,能根據學習的需要反復瀏覽資源,基本100%的參與教師發布的討論、作業及問答等互動活動,善于使用搜索功能對資源進行檢索,并積極對教學資源進行評價;學習成績處于良好水平。

6號畫像群體,學生人數88人,占比21.36%。此群體學生學習投入程度最高,能根據學習的需要對任課教師發布的文稿、圖片、動畫及視頻資源反復瀏覽,參與教師發布的討論、作業及問答等互動活動積極性高;為完成學習任務,能主動進行資源檢索,并對相關課程資源進行評價,學習成績處于優秀水平。

三、基于學習者群體畫像的個性化學習環境構建

基于學習者群體畫像的構建,結合課程實施,結合上述6種不同類型學習者學習能力和學習風格,教師為學習者定制了適合其學習特點的學習方案。以個性化資源推送方面為例,課程將推送資源按難度分為了基礎、中等、專業及拓展四類,按類型分為了視覺型、聽覺型和動覺型三類。結合群體畫像,課程結合現有信息化資源,不再是簡單的將課程資源進行羅列,由學習者自行選取,而是將資源進行了有機組合,構建了6類不同的學習資源包,分類推送給相對應的學習者[11-14]。

對于1號畫像學生群體,學生資源瀏覽完成率較低,但對其中的動畫資源表現出了較高的興趣,其次是視頻資源,學生學習這兩類資源的時間占據了全部學習時間的58%左右。針對其特點,課程開發了基礎學習包,在課前重點推薦動畫和視頻資源,輔以課件資源,幫助學生理解和掌握相關知識,完成最基礎知識的學習。

對于2號畫像學生群體,學生在學習過程中的針對性、有效性不強,不能有效把握教師推送學習資源的重點。針對其特點,課程開發了輕型學習包,利用視頻、動畫資源為主,輔以教師對知識點的總結提煉文稿,配套知識點習題,學生在學習完資源后,可閱讀教師總結文稿對學習內容進行內化,內化完成后可通過配套習題檢驗知識點學習效果。

對于3號畫像學生群體,學生屬于典型的視覺型學習者,針對其特點,課程開發了視覺學習包,以知識點的講解文本、圖片類資源為主,輔以教師對知識點中的重點或難點的講解視頻,配套知識點習題,通過組合而成的視覺型學習包可幫助此類型學生獲得較好的學習效果。

對于4號畫像學生群體,學生屬于比較典型的聽覺型學習者,針對其特點,課程開發了聽覺型學習包,以知識點的講解視頻、動畫類資源為主,輔以教師對知識點中的重點或難點的總結文稿,以輔助學生獲得較好的學習效果。

對于5號畫像學生群體,學生屬于比較典型的動覺型學習者,針對其特點,課程開發了動覺型學習包,在提供知識點相關學習資源的同時,為提高學生參與度,教師增設了如作業、討論、問答及案例分析等互動教學環節,促進此類型學生更多主動思考,提升學生學習效果。

對于6號畫像學生群體,由于此類型學生具備較好的學習基礎和學習習慣,課程知識點掌握水平也較好,學生可根據自己學習需要有選擇性的進行資源瀏覽,因此,對于此部分學生不需要做特定的資源推送,但為了滿足這部分學生的提高,教師可將知識點相關資源重新整合,圍繞專業核心就業崗位,整合對接實際的實踐教學項目,提供給學生用以課后提升。

個性化學習包的構建和推送,充分考慮了學習者的學習基礎、學習偏好和認知能力上的差異,在學習資源的提供上給出了多樣化的選擇,使得資源學習更有針對性,有效提高了學習者的效率;同時,將差異化的互動活動、階段性測試融入到了不同學習包,為不同學習水平的學習者提供了與之能力相匹配的互動話題和考核內容,有效地檢查了不同類型學習者的學習效果。

四、結束語

本研究基于大數據分析方法,主要利用了學習者瀏覽行為數據、學習活躍度數據、階段測試數據以及社交互動數據等,通過主成分分析和因子分析,提取有效信息,構建了多維度的個性化學習標簽體系;通過聚類分析,將學習者進行了有效分類,形成了較為精準的學習者群體畫像,從數據上描繪了其個性化學習需求。在此基礎上,將學習者畫像模型與精準資源推送服務應用到個性化學習環境構建上,提出了基于大數據群體畫像的多種類型學習包的建設與推送服務,為當前信息化教學條件下開展大數據精準服務和個性化學習環境構建提供了應用參考。

需要關注的是,由于學習者的學習過程并不是一個簡單線性變化的過程,而是一個動態變化的非延續性過程,因此,在服務各類型學習者時,需要充分考慮到學習者的學習特征和學習能力的變化,對其畫像模型不斷進行動態修正,以此保證學習者的學習路徑與其學習目標、內容和方式的相適應。

參考文獻:

[1]吳玉萍.移動學習環境下基于微助教的翻轉課堂教學模式[J].教育觀察,2019,8(16):9-13.

[2]鄭淼,陳真.信息技術環境下高校學生個性化學習研究[J].信息與電腦(理論版),2019(07):252-253+256.

[3]李雪嬌.基于學習者畫像的在線學習支持服務策略設計研究[D].華東師范大學,2019.

[4]索娜.基于學習風格的個性化學習空間模型構建研究[D].貴州師范大學,2018.

[5]張杜娟.在線學習環境下學習者特征模型研究[D].華中師范大學,2018.

[6]鄭明月.基于學習分析的個性化學習資源推薦研究[D].曲阜師范大學,2018.

[7]國宴華.基于探索性因子分析和聚類分析的機場旅客服務需求研究[D].山東大學,2018.

[8]劉應杰.基于數據挖掘的遠程教育用戶畫像構建研究[D].西安電子科技大學,2018.

[9]陳淼.移動學習環境下學習資源個性化推薦模型研究[D].渤海大學,2017.

[10]孫國章.基于移動終端的個性化學習環境建構[J].呂梁教育學院學報,2019,36(01):41-43.

[11]陳佳艷.基于學習行為特征的學習資源個性化推薦研究

[D].南京郵電大學,2018.

[12]高立,譚業發,蘇正煉,等.SPOC支持下的個性化教學模式研究[J].教育教學論壇,2018(49):69-71.

[13]王文東,武海妮,侯勉,等.泛在學習環境下MOOC資源個性化應用研究[J].無線互聯科技,2018,15(11):83-85.

[14]牟智佳,武法提.教育大數據背景下學習結果預測研究的內容解析與設計取向[J].中國電化教育,2017(07):26-32.

猜你喜歡
學習環境個性化大數據
為小學英語個性化合作學習單做加法
基于大數據背景下的智慧城市建設研究
同桌寶貝
校本課程開發的個性化問題探討
呼喚雕塑家創作的個性化
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合