?

大數據視角下學習者選課之推薦模型

2019-09-10 07:22王宏
陜西廣播電視大學學報 2019年2期
關鍵詞:模型大數據

王宏

[摘要]開放教育選課過程是人才培養方案的重要組成部分,本文提出一種基于大數據分析的學習者選課推薦模型,是以協同過濾推薦算法作為基礎算法。算法通過對學習者群課程偏好行為數據的挖掘,發現學習者的課程偏好,以不同偏好對學習者進行群組劃分并推薦品味相似的課程。

[關鍵詞]大數據;選課;推薦;模型

[中圖分類號] G728 [文獻標識碼]A[文章編號]1008-4649(2019)02-0018-05

Abstract:The course of open education selection is an important part of the talent training program. This paper proposes a learner selection recommendation model based on big data analysis. It is a collaborative filtering recommendation algorithm as the basic algorithm. The algorithm discovers the learner's curriculum preferences by mining the learner group's curriculum preference behavior data, and classifies the learners by different preferences and recommends similar courses.

Key word:Big data; Course selection;Recommendation; Model

開放教育選課是其人才培養模式的重要內容,是依據專業特點和培養目標,結合學習者的時間、空間、興趣和知識面開展的,用以保證學習者自主學習和個性化發展,而實施的內容。這一實施過程,在激發學習者學習興趣、開闊專業視野、提高文化素質、培養創新能力等方面具有不可替代的作用, 是實現“寬口徑、重能力、強素質” 人才培養模式的有效途徑。

一、選課推薦

1.大數據的概念

大數據是近年來在信息化應用中的核心焦點,由于其發展迅速,在定義、特征等方面尚未形成公認的、統一的標準。大數據一般是指數據量巨大,不易用常規方法和傳統軟件處理分析的數據。 對于其特征的認識從最初的“3 V”發展到“4 V”,再到最新的“5 V”, 即數據量( volume)巨大、數據類型( variety)眾多、處理速度( velocity)快、價值( value)密度低、真實性( veracity)強。教育領域的大數據廣義上指的是在教育教學活動中所有參與者的行為數據,最主要是學習者。為了保證采樣數據對母體的完備性,一般要求學習者的采樣數量大于2000人,這些數據除了具有大數據的共性以外,還具有情境性、層次性和時效性,數據采樣主要來源于各類遠程學習平臺、考試平臺、教學管理系統、圖書館管理系統、一卡通平臺、財務管理系統。

大數據不僅意味著數據量的巨大,同時更主要的是其利用數據的視角發生變化,其數據分析對象,趨向于數據母體而非抽樣數據,重視個體數據間的相關性而非因果性,特別是當效率與精確性產生沖突時,可以犧牲一定的精確性,強調以數據分析為本,以數據分析結果驅動決策。

2.選課推薦

大數據的應用使推薦過程更加科學,其核心在于各要素相關性數據挖掘模型的建立。數據挖掘建模過程是著眼于解決推薦應用的過程,源于應用需求,終于應用實踐。盡管用數據挖掘技術建立仿真模解決的問題各有不同,但從整個的應用流程上來看,其操作內容具有計劃性、規范性、可用性。 其中,CRISPDM方法是目前世界上公認的數據挖掘建模的核心方法。

(1)教學理解階段。在這一階段通常從學習者的視角設計建模的要求和目標,并將這些目標與大數據挖掘建模的定義相結合。

(2)數據解讀階段。數據解讀階段的主要內容有:數據的樣本采集;數據的初始化;研判數據屬性;分析數據特征;數據特征統計;數據質量審核;數據補遺。

(3)數據準備階段。數據準備階段涵蓋了從原始數據集構建最終數據集(將作為建模工具的分析對象)的全部工作。數據準備工作將被重復多次,而且其實施順序是無序的。

(4)數據整理。以挖掘目標為基準初步分析數據樣本與其的相關性和可用性,遴選作為模型輸入數據的數據子集,并進一步對這些數據樣本進行清理轉換,構造衍生變量,并根據模型的需求,格式化數據。

(5)建模。在這一階段,研判相關的建模方法,通過構建、評估模型,對模型參數進行校準。

(6)評估。以數據分析的視角對數據進行審讀,在這一階段中,我們已經構建了一個或多個高質量的應用仿真模型。

(7)部署。即將模型輸出的結果轉換為可閱讀的文本形式。

二、基于學習者的協同過濾推薦

基于學習者的協同過濾推薦模型的原理為,以所有學習者對課程興趣的偏好為基礎,挖掘與服務對象偏好相似的“鄰居”學習者群,一般使用計算“ K-鄰居”的算法完成;然后,基于這個“鄰居”學習者群的歷史偏好數據,為服務對象進行推薦。下圖給出了原理圖。

設學習者 A喜歡 A課程, C課程,學習者 B喜歡 B課程,學習者 C喜歡 A課程, C課程和 D課程;從這些學習者的喜好信息中,我們發現學習者 A和學習者 C的喜好是比較類似的,同時學習者 C還喜歡 D課程,那么我們可以推斷學習者 A可能也喜歡 D課程,因此可以將 D課程推薦給學習者 A。

基于學習者的協同過濾推薦機制和基于人口統計學的推薦機制都是計算學習者的相似度,都是以學習者的“鄰近”群體樣本計算推薦的,但它們的核心區別是如何計算學習者的相似度,基于人口統計學處理機制只注重學習者本身的特征,而基于學習者的協同過濾處理機制是在學習者歷史偏好數據的基礎上進行學習者相似度計算的,它的關鍵假設是,喜歡類似課程的學習者可能有相同或者相似的喜好。

(一) 基于學習者(Learner-based)的協同過濾推薦算法

基于學習者的協同過濾推薦算法在同類算法中出現的最早,其原理較為簡單。這一算法于1992年首次提出并用于電子郵件過濾系統,在1994年被GroupLens引入到新聞過濾中。一直到近年,這一算法還是推薦系統領域中的核心的算法。

三、小結

基于協同過濾模型的算法根據學習者不同的屬性特征,按其性別、專業、興趣愛好歸類分群。推薦應用模型可以更加科學與精確的對這些屬性信息建立我們關心的關聯并計算它們的相似度,從而完成推薦。 大數據下的選課模型,為完全學分制下的學習者選課提供了智能化的支持服務,構建了獨立、自主、公平,自由的選課操作,滿足了學習者對課程的特性化需求,激發了學習者的學習主動性。

[參考文獻]

[1]郭清菊,等.基于學習興趣的個性化推薦算法研究[J].軟件,2013,34(9):51-53.

[2]胡健,等.數據挖掘在選課推薦中的研究[J].軟件,2016,37(4):119-121.

[3]王超,等.適合專業選修課的現代教學理論和方法探究[J].學理論,2015(11):202 - 204.

[4]程學旗,等.大數據系統和分析技術綜述[J].軟件學報,2014,25 (9) :1889 - 1908.

[責任編輯張宇龍]

猜你喜歡
模型大數據
自制空間站模型
從勾股定理到“一線三等角”模型
模型小覽(二)
導數中涉及“[ex,l n x]”的模型
圓周運動與解題模型
大數據環境下基于移動客戶端的傳統媒體轉型思路
基于大數據背景下的智慧城市建設研究
數據+輿情:南方報業創新轉型提高服務能力的探索
離散型隨機變量分布列的兩法則和三模型
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合