?

基于機器學習的數學成績預測系統設計

2022-10-18 08:57王博
電腦知識與技術 2022年25期
關鍵詞:自我認知機器學習母語

摘要:數學教育作為基礎教育最重要的環節,是提高學生數學成績的重要方式。從某方面而言,數學成績是反映學生數學學習能力的重要工具,但由于數學成績評價與學生學習能力、現場發揮等方面存在直接關系,其所反映的方面具有較強局限性,根本無法準確反映出學生實際學習情況。尤其是在信息化時代背景下,隨著信息技術應用到教育行業,給數學教育帶來質的突破,出現大量機器學習的數學成績預測系統,來幫助教師更好地掌握學生實際情況,有效提高了中學基礎教育效果。文章通過分析教育數據挖掘技術中的機器人學習預測理論,來探究影響學生數學成績的因素,再根據因素提出有效的解決策略。

關鍵詞:教育數據挖掘;機器學習;數學成績預測;自我認知;母語

中圖分類號:TP311? ? 文獻標識碼:A

文章編號:1009-3044(2022)25-0026-03

開放科學(資源服務) 標識碼(OSID) :

1 前言

在信息化時代背景下,互聯網模式已逐漸普及到各行業,尤其在教育行業應用范圍最廣。慕課教學模式作為目前數學教育最常見的教學模式,已成功突破傳統教學限制,能給數學教學提供豐富的數據資源[1]。同時,隨著線上教育產業數量不斷增加,給互聯網教育帶來巨大的空間,我國政府部門愈發重視教育數據挖掘工作,并加強對現代教育研究的重視程度。給教育數據挖掘帶來較強的推動作用,將教育數據挖掘上升到戰略高度,這給拓展教育數據應用范圍提供了法律支持。目前,由國互聯網教育產業還停留在初級階段,數據分析要加強對線上推銷和精準推送的研究力度,確保商品能具有明顯特征,而不是將立足教育發展作為中心思想,這導致教育數據挖掘作用流于表面,無法發揮其真正作用。并且與國外相比,數據資源多樣化是我國最大優勢,無論是線下數據還是線上數據全部有明顯優勢,但如何將多樣化教育數據轉變為教育動力是目前教育研究者急需考慮的問題[2]。

2 機器學習分類算法

2.1 K-近鄰

K-近鄰算法屬于有監督機器學習算法,其是根據各數據不同特征值間的距離為載體,合理分析數據內容,再利用不同類型數據值來確定正確的數據類型。如果在特征空間內有一個樣本和相鄰K各樣本都屬于同一類型,可確定該樣本同樣屬于該類型,K值會取整數。其數學原理是將不同數據比作多維空間的點,再利用歐氏距離公式[d(x,y)=n1(xi-yi)2]或麥哈頓距離公式[d(x,y)=n1xi-yi]來計算不同測試數據和訓練數據之間的距離,再根據升序方式將數據進行依次排列,再將最高頻率類型作為測試數據的預測分類(如圖1所示) 。

2.2 邏輯回歸

邏輯回歸算法在很多方面與K-近鄰算法存在一定的相似性,都具有監督機器學習算法的功能。經過專業人員分析發現,這兩種算法間具有較大差異性,如在輸出變量類型方面存在差異,通常線性回歸模型輸出值是連續變量,線性回歸預測函數為[y=xθ]。而邏輯回歸輸出值是離散變量,故邏輯回歸并不屬于回歸,是屬于分類。同時,可將邏輯回歸作為線性模型,如圖2所示,[y=g(z)=11+e-z]。

2.3 決策樹

決策樹算法將學生數學成績利用樹狀圖像的方式提供給教育工作者認識,能有效確定概率分布基本情況。目前,國內教學行業決策樹出現頻率較高(如圖3所示) 。該教學方式是利用圓形節點為載體,將不同數據用原點、箭頭、矩形節點、三角節點等方式呈現出來,有利于教師能準確收集這些信息[3]。

2.4 支持向量機

近年來,隨著社會經濟不斷發展,給教學行業帶來較大的發展空間,而數學作為教育行業重要的環節,在學生未來發展之中同樣發揮著極其重要的作用。但從目前數學教學的實際情況而言,還存在很多方面的問題,給教學效率帶來嚴重影響。而由于數學本質上具有較強的趣味性和豐富性。因此,教師可將支持向量機合理利用在學生學習過程中來幫助學生了解數學中真正的魅力。支持向量機算法是能對數據實現二元分類的線性分類器,其算法原理是正確劃分訓練數據集的最大邊距超平面(如圖4所示) 。

2.5 貝葉斯

貝葉斯分類器是以貝葉斯理論為基礎的弱分類器,其都假設樣本每個特征與其他特征無任何聯系。所謂樸素是假設不同特征和判定目標類別的概率分布上是相互獨立存在的。因此,概率公式為[P(cx)=P(cx)PcP(x)],在正常情況下,很容易構建樸素貝葉斯分類器,為此貝葉斯經常被應用在大型數據中。

3 CEPS數據分析預測

3.1 CEPS數據分析預測流程

數學本身是一門非常復雜的學科,在學習過程當中很容易遇到各種問題,如果這時候教師仍然使用傳統的教學方式,很有可能會激發學生抵觸情緒,引發 學生學習困難。針對這種情況,教師可在教學中結合學生日常生活,以日常生活為切入點,為學生構建CEPS數據分析預測流程,來分析學生在日常生活中遇到的難題和心理狀態,來幫助學生找到正確的數學規律,從而提高學生問題意識。CEPS數據分析預測流程是為拉薩數據分析做對比,一方面在程序上來分析各種所需指令;另一方面CEPS數據預測結果給拉薩數據研究提供依據,從而驗證評價機器學習中決策樹、線性支持向量機等模型在成績預測方面的效果,并確保最適合的預測分類模型。同時,CEPS數據分析根據作用不同可分為結果分析、模型訓練、預測流程預處理、模型優化四個環節。其中數據預處理主要包括異常值處理、類型轉換、數據獲取等環節;模型訓練又支持向量機、線性支持向量機、決策樹等十二種模型的訓練,并取得不同模型預測結果;模型優化是對測試模型結果較高的XBG分類模型和邏輯回歸模型參數進行調整[4]。

3.2 數學成績預測系統需求分析

學生用戶畫像系統作為專門服務不同教學階段學生的數據產品,主要是以網絡教育平臺為基礎,從不同方面來分析學生的行為數據,給網絡教育平臺正常運行提供豐富的數據資源。而學生作為整個系統的核心點,系統通過利用大數據技術來分析學生多樣化行為方式,將學生行為動作變成大量的數據記錄。系統在開始階段會利用預處理的方式來記錄學生的日常行為,再將結構化數據利用數據挖掘措施來統計處理后的數據,再將數據完全呈現在用戶眼前,讓教師能進一步掌握學生實際的心理狀態和學習情況,能及時察覺到學生異常情況,針對學生存在的問題提出有效的解決措施,來提高學生的學習成績。同時,學生畫像系統是利用自動化系統,來分析學生的行為數據,給教師提供全方位的功能,將學生在線答題模塊進行對接,幫助工作人員突破數據隔離的限制,在上傳大量學生數據的同時,有效處理各種數據內容,進而滿足教師對于數據的分析要求[5]。本系統最大的優點在于能將數據采集過程標準化,能將各種結構的數據利用自動化方式來進行處理,避免由于人工操作的方式出現失誤影響,降低教育工作者的工作量,讓其能將所有的注意力全部放在教育學生方面。同時,大數據方式能提高系統效率,能讓教育工作者及時查看學生具體情況,避免其在傳統教學中無法掌握學生學習狀態的問題,還能避免信息滯后所引發的問題。

3.3 成績預測系統

成績預測系統在畫像系統中發揮著至關重要的作用,主要體現在掛科預警模塊和成績預測模塊內,模塊共有兩個功能,能合理分析學生期末成績和學生知識點,成績預測是以分類算法為基礎,來準確計算出學生能答對多少道題目。知識點分析是在進行分類功能時,來進一步研究影響性較大的特征,通過分析這些特征,來了解到學生對目前數學知識所掌握的具體情況,來提高各種類型題目的正確率,讓教育工作者能準確掌握學生整體學習情況。在正常情況下,成績預測模塊主要是利用機器學習流程來進行,通過采用Xgboost算法為載體,利用不同數據的特征性,來優化分類目標的各種方法,再提取數據庫中的學生數據周期性,進而提高訓練強度和數據,讓整個模型的表現效果達到預期的效果,使學生成績預測系統能提供更好的幫助。

3.4 數據異常值處理

數據冗余刪除通常是將人工因素和環境條件相結合,來構建全新的數據知識,從而降低數據維度。首先,要刪除特征值缺失超過大量的列數,一旦其缺失值超過一半,則其并不具備研究意義。再根據CEPS調查手冊、教育學心理學有關數據成績因素、Stata變量標簽的研究,要刪除任何和數學成績沒有必然聯系的列數。雖然CEPS數據擁有大量特征,但由于其中大量特征和數據成績關聯性不強,通常是將教育學心理學作為成績影響因素研究成果[6]。

數學是一門極具靈性的課程,能讓學生留下深刻的經驗,給其未來發展具有至關重要的作用。因此,教師要嚴格遵循以學生為核心,服務于學生發展原則,有效提高學生的綜合素質,使得學生的世界觀、人生觀、價值觀沿著數學學習的深入,慢慢地走向正確的方向。隨著數學教學的不斷深入,能進一步發掘學生們的創造性,給學生營造豐富多彩的想象力,提高學生的數學素質,促使學生綜合發展。因此,進而利用數據異常值處理對系統進行分析??砂l現異常值,再通過合理數據可視化特征,來幫助教師分析數學成績標準分數密度曲線,但經過大量實踐證明數學成績標準分數并未全部超過標準值,這與數據正常分布情況具有一定的差異性,會給調查統計的數學成績帶來嚴重影響[7]。經過統計發現,異常值未超過三十個,與總數據相比,其占據較低部分,這對整體數據帶來嚴重影響。

特征轉換是通過合理利用數據分布特點,來實現教育和數據深度融合,從而預測出學生成績及格率,并將數學成績標準分數利用科學方式轉換出來,讓其基本成績能高于平均值判定及格,低于平均值則被判定不及格,并對所有樣本數據進行統計(如圖5所示) 。從層次上而言,數據分布相對比較均勻,未出現數據分布極為不平衡的現象。在大規模數據情況下,不及格數據占據絕大部分,能滿足數據訓練預測要求??衫镁幋a技術將所有對象型數據進行獨熱數字編碼,給后期模型訓練做好準備[8]。同時,應加強學生學習熱情和興趣,如果學生能在實際學習當中具有較高熱情度,那勢必會給教師教學活動帶來較強助力,教師在數學教學過程當中,要注重培養學生學習興趣和學習熱情,并探究學生學習特征,制定多元化教學模式,豐富教學內容,從而激發學生學習積極性,確保讓學生能長期處于愉悅的環境中學習數學,從而提升課堂效率和質量。

4 總結

綜上所述,從分類預測技術層面來看,證實分類器、決策樹、邏輯回歸等分類模型相比在二元分類成績層次預測方面具有較好的效果。從影響數學成績因素而言,可將其分為兩個部分,可將讓學生對數學學習感覺自我認知和成績層次有初步了解,從測試數據來說,學生對數學學習自我認知非常重要,且會成為預測學生學業成績的重要特征。再根據特征相關分析、學生各科成績分析,都充分說明其對學生數學層次劃分的重要性,再結合高中數學教學現狀,應加強對母語文化教學的重視程度,才能讓學生全面發展。

參考文獻:

[1] 孫鑫,黎堅,符植煜.利用游戲log-file預測學生推理能力和數學成績——機器學習的應用[J].心理學報,2018,50(7):761-770.

[2] 金城,崔榮一,趙亞慧.基于機器學習的高考信息與大學程序設計課程成績相關性分析研究[J].延邊大學學報(自然科學版),2020,46(4):366-370.

[3] 劉研,陳勇,邢宇明,等.基于機考機評系統的成績挖掘和個性化分析方案研究[J].教育現代化,2021,8(12):106-108.

[4] 杜佳恒,邱飛岳.機器學習在數學成績預測中的應用研究[J].教育教學論壇,2020(16):101-102.

[5] 王博.基于Logistic Regression的數學成績預測系統的應用研究[D].南昌:南昌大學,2018.

[6] 張瑞,賈虎.基于多變量時間序列及向量自回歸機器學習模型的水驅油藏產量預測方法[J].石油勘探與開發,2021,48(1):175-184.

[7] 張寶一,李曼懿,李偉霞,等.基于機器學習的地球化學采樣下伏基巖類型判別-以青海省察汗烏蘇河地區為例[J].中南大學學報(英文版),2021,28(5):1422-1447.

[8] 邢俊利,豆長江.藏族中學生成就目標對數學成績的影響:自我效能感的調節作用[J].民族教育研究,2021,32(4):129-134.

【通聯編輯:梁書】

猜你喜歡
自我認知機器學習母語
母語
母語
從馬克思主義“意識形態工具”角度看國內外校服的變革
大學生悅納自我心理健康教育實踐探索
前綴字母為特征在維吾爾語文本情感分類中的研究
基于支持向量機的金融數據分析研究
母語寫作的宿命——《圣天門口》未完的話
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合