?

基于數據挖掘的公選課資源共享個性化推薦模型研究
——以廣東省民辦院校為例

2024-01-10 06:59劉麗娜
關鍵詞:資源共享民辦數據挖掘

劉麗娜

(廣州工商學院工學院,廣東 廣州 510850)

0 引言

高校學生對公選課具有一定的自由選擇權,包括選擇課程、任課教師和上課時間。由于傳統的選課制度不利于學生個性拓展、課程資源有限和選課引導不充分等方面因素,影響了學生的學習效果和學校的教學質量。

基于數據挖掘技術對廣東省民辦院校公選課資源共享個性化推薦模型進行研究,利用改進后的KIApriori 算法[1]從以往的選課數據中發現隱藏的、有用的數據規律來指導推薦公選課,從而改進和完善當前高校公選課的選課機制。

1 相關研究

目前,許多學者正在積極探索公選課選課機制的改革;研究較多也較為普遍的當屬課程個性化推薦模型,此類模型有基于大數據或數據挖掘的個性化推薦[2-4],也有基于協同過濾的資源定制[5],以及基于圖譜和圖嵌入的學習資源推薦等等[6]。

本文利用數據挖掘算法構建推薦模型,以SPSS Modeler 為初步分析工具,以廣州工商學院和廣州科技職業技術大學兩所民辦院校應歷屆學生信息數據為研究對象,構建預測模型為在校學生推薦適合的公選課程,既能有效提高教學質量,又能實現跨校資源共享,提高資源利用率。

2 構建公選課資源共享個性化推薦模型

2.1 數據挖掘技術在預測推薦中的作用

數據挖掘技術是通過對歷史數據進行分析,從而發現其中的規律,利用此規律來指導預測未來有可能產生的數據信息[7]。數據挖掘主要包括數據清洗、數據建模、模型數據分析、行為數據分析與結果反饋四個階段。

(1)數據清洗

數據挖掘的前期工作是收集數據,在確定挖掘目標后基于該目標準備數據,并對收集到的結構化與非結構化數據進行整理清洗去除數據中噪聲不一致的數據,以便于后續的分析處理。

(2)構建挖掘模型

數據建模階段可以選擇不同的數據挖掘技術針對數據進行分析建模,從而發現潛在的規律和結構。

(3)模型數據分析

模型數據分析可以將模型應用于實際問題中,構建推薦算法,并對模型效果進行驗證,從而自動地為用戶進行推薦?;跀祿诰蛩惴ǖ耐扑]系統可以實現個性化、精準地推薦,同時也可以不斷優化算法以提高推薦的效果。

(4)行為數據分析與結果反饋

行為數據分析是將得到的推薦結果結合實際行為進行分析,從而為系統提供反饋機制。通過對用戶的反饋進行分析和挖掘,可以發現用戶的意見和需求,從而進一步改進并優化推薦系統。

2.2 利用KIApriori 算法構建推薦模型

Apriori 算法通過分析歷史數據發現其中隱藏的規律,利用規律分析現有數據并找出關聯結果,從而達到推薦的目的[8]。而KIApriori 算法是對Apriori 算法處理多維復雜數據及執行效率的優化,KIApriori 構建推薦模型的過程包括利用改進的算法SK-Means 進行前期復雜數據的多維度分類、精簡,然后利用改進的算法KIApriori 根據支持度和置信度識別強規則,然后使用強規則實現推薦項目,實現模型如圖1 所示。

圖1 KIApriori 算法推薦模型

首先是對收集到的數據Data 進行normalization清洗規范化,然后采用經過多維度改進K-Means 后的SK-Means 算法進行分類,最后再通過掃描數據庫并使用KIApriori 識別頻繁出現的項目來找出所有規則。該算法的工作原理是建立一組候選項集,然后根據最小支持度和置信度對該候選項集進行修剪。一旦確定了最頻繁的項目集(即強規則),則可以利用規則向用戶提出推薦建議。推薦過程識別出往屆學生所選課程與其他數據的關聯規律,再利用該規律為當前還未選課的學生推薦其感興趣的課程。

因此,Apriori 關聯規則可以識別最頻繁的項目集,并使用它們向用戶推薦項目,幫助構建推薦模型,從而提高推薦的準確性,更好地滿足學生的學習需求,提高學生學習效果。

3 實施應用

本文以廣東省兩所民辦院校近十年的學生數據為研究對象,采用線上公選課程為規則后項,具體實施分為六個階段。

(1)數據清洗

確定廣州工商學院和廣州科技職業技術大學往屆學生的特征數據,首先需要確定學生的行為習慣、學生專業與課程等多方面的特征數據,即通過采集學生的多層次的個人數據,在此基礎上進行多維度衡量,然后對結構化和非結構化數據進行統一和去噪處理。例如,由于不同的專業所學習的專業課程不同,因此需將專業課進行聚類,根據成績段進行歸類,如分數在90 到100 之間的同學歸為一類。同時,若同類屬性當中有大量的不同值,如學生成績,則應做概化處理。

概化:即將一些細節的數據抽象為上一層次的概念化的數據,如學生的“大學英語成績”有0~100中的某一個數組成,不利于挖掘,在此可以將成績根據[0,60)、[60,70)、[70,80)、[80,90)、[90,100]分為不及格、及格、中等、良好和優秀五個層次,那么“大學英語成績”就可以概化為不及格、及格、中等、良好和優秀。

屬性剔除:如果屬性當中很多值都未概化處理,且與挖掘主題不相關,沒有上層屬性,則該類屬性應剔除。如“姓名”或“教師編號”等屬性。

(2)設計推薦算法

利用數據挖掘技術,根據學生的需求特征,建立合理的模型,利用關聯分析等技術,確定個性化推薦算法,本文結合實際數據分析確定采用KIApriori 算法對第一階段的數據進行挖掘。

(3)模型實施

在模型構建后,通過運用數據挖掘的技術對資源進行數據處理,本次挖掘設置最小支持度和置信度均為8%,然后根據生成的推薦結果選擇合理規則前項并根據支持度與置信度設置推薦權重值為學生進行公選課程的推薦,部分挖掘結果如表1 所示。

表1 部分挖掘結果

在表1 中,規則{專業=“數字媒體”、平均成績=“良好”、選修=“數字攝影”}可以解釋為大部分數字媒體專業專業課平均成績良好的學生都會選修“數字攝影”課程。然后,推薦算法將向數媒專業平均成績良好的學生推薦“數字攝影”課程,因為它是最頻繁項目集中的一部分。

(4)模型測評

根據第三階段的推薦結果,對規則的合理性進行分析,采集一定量的反饋數據,形成測試數據與目標數據可視化的對比結果,評估公選課資源共享個性化推薦模型的實施效果。

(5)確定穩定模型

根據模型衡量的反饋結果,不斷迭代模型,并加以改進,以提高模型實施的準確性和穩定性。

(6)各層面實施應用

由學生、教師、試點學校和廣東省民辦院校合作四個層面構建公選課個性化推薦模型,如圖2 所示。

圖2 公選課推薦模型

學生層面:分別根據學籍、成績、一卡通和圖書借閱等數據構建挖掘模型,為在校學生推薦適合的公共選修課程,為各種個性特征的學生提供充分的發展機會。

教師層面:通過數據挖掘分析,教師提出公共選修課科目的設置修改建議。

試點學校層面:協調課程、推薦選修,并根據推薦結果調整公選課程的安排,例如剔除選課人數較少的課程。

廣東省民辦院校層面:構建廣東省民辦院??缧9x課資源共用共享及公選課學分互認機制,實現資源高效利用。

4 效果評估

本研究將確定的推薦模型應用于廣州工商學院20 級網絡工程專業2022-2023 學年第一學期的公選課推薦,以問卷的形式對此推薦的滿意度、出勤率和適配度等進行調查,進一步分析模型的應用效果。

通過對廣州工商學院20 級網絡工程專業171名學生進行普查,發放問卷171 份,回收有效問卷167 份,問卷有效率為97.7%。問卷調查中出勤率為98.78%,而滿意度、適配度調查結果如圖3 所示。

圖3 公選課個性化推薦滿意度調查

從圖3 可以看出公選課的個性化推薦的選課范圍較為滿意,推薦結果與預期相比普遍達到滿意或很滿意;而由于個性化推薦與專業或成績等其他因素相關,因此個人偏好與個性化推薦的適配度大部分亦達到滿意或很滿意,但相對于其他項目的滿意度上稍微偏低。在公選課個性化推薦調查結果中可以看出超過80% 的學生對本次的推薦結果整體較為滿意,且出勤率達到98.78%。由此可見,該推薦模型的實施應用,可以有效提升學生的參與度和學習效果,從而改善學校公選課的教學管理和學習質量。

5 結束語

本文以廣東省兩所民辦院校近十年的學生數據為研究對象,構建公選課資源共享個性化推薦模型,在模型應用時實行資源共享學分互認。通過本次公選課推薦模型的實施可見,實行該模型有利于促進學生個性化學習,提升學習質量;有利于管理部門更合理地規劃分配資源,完善選課機制;有利促進師資進修,強化師資隊伍;有利于實現高校公選課資源共享,提高資源利用率。

雖然本次公選課模型的構建及實施取得了一定的成效,但由于數據量有限且公選課設置不一致等問題,對規則生成及支持度、置信度有一定的影響,若能獲取更多的分析數據,且數據更加規范,則公選課資源的推薦及結果適配度將有更好的實施效果,規則的可靠性也將更高。

猜你喜歡
資源共享民辦數據挖掘
民辦本科院校開展文科復合型人才培養的創新與實踐
新時代加強民辦中小學黨建工作的必要性
交通運輸數據資源共享交換體系探究與實現
探討人工智能與數據挖掘發展趨勢
基于學科競賽的民辦本科高校會計實踐教學改革探討
衛康與九天綠資源共享
基于并行計算的大數據挖掘在電網中的應用
教育部第一批“國家級精品資源共享課”公布
民辦少兒英文圖書館工作初探
一種基于Hadoop的大數據挖掘云服務及應用
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合