?

大數據在外語教學中的價值、來源與技術分析

2021-03-07 11:37黃敏
外國語文 2021年3期
關鍵詞:外語學習者分析

黃敏

(西南大學 外國語學院,重慶 400715)

0 前言

全球知名咨詢公司麥肯錫稱:“數據,已經滲透到當今每一個行業和業務職能領域,成為重要的生產因素?!?郭曉科,2013)自2009年維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》問世以來,大數據成了各行各業的流行詞匯。一般認為,大數據具有四大特征,分別為數據體量浩大(Volumn)、數據多元(Variety)、生成快速(Velocity)、價值回報高(Value),俗稱4V特征(Mayer-Schonberger et al., 2013)。根據互聯網數據中心IDC(Internet Data Centre)的定義:至少要有超過100TB可供分析的數據才叫大數據。大數據種類繁多,具有異構和多樣性,包括文本、網絡日志、音頻、視頻、圖片、地理位置信息等。大數據的意義在于對多種類型數據構成的“數據集”進行分析和研究,提取有價值的信息,獲得某種洞見或規律,從而幫助人們在解決問題時作出科學的決策或預測。大數據將給社會帶來的三大變化有:(1)海量數據甚至“全部數據”將使人們不再依賴小樣本的推斷統計; (2)為了獲取更好的洞察力,不再熱衷于追求精確度,但并不是就此放棄;(3)不再熱衷于追求因果關系,而更注重相關關系。這三條將徹底改變我們科研和教學的本體論、認識論和方法論(劉潤清,2014)。

在教育領域,以信息化帶動教育現代化已然上升為國家戰略。隨著教育信息化的深入,對大數據的利用成為學者、教師和管理人員共同面臨的新課題。教育大數據作為大數據的一個子集,是整個教育活動過程中所產生的以及根據教育需要采集到的,一切用于教育發展并可創造巨大潛在價值的數據集合(楊現民 等,2015)。教育大數據從戰略高度被定位為推動教育變革的新型戰略資產、推進教育領域綜合改革的科學力量以及發展智慧教育的基石,其最終價值體現在與教育主流業務的深度融合以及持續推動教育系統的智慧化變革上(楊現民 等,2016)。外語教育作為我國教育體系重要組成部分在大數據時代也同樣面臨著機遇與挑戰。正如劉潤清教授(2014)所言,現在教育經歷“結構性調整”,不僅要更換結構,更重要的是革新理念和生產方式。雖然利用大數據能幫助我們更加清楚地認識外語教育的真實面貌和客觀規律,找準理念和實踐創新的突破口,提升教學效率,但外語教育領域卻十分缺乏基于大數據的學習分析研究。因此,本文試圖回答以下三個問題:(1)外語教學中大數據究竟能產生怎樣的價值?(2)外語教育中的大數據有哪些重要的來源?(3)我們對收集到的大數據又該進行怎樣的技術分析呢?

1 大數據在外語教學中的價值

大數據能為外語教學帶來怎樣的價值呢?總的來說,大數據能優化外語學習過程、助力個性化教學的實現,深化對外語學習者特征的分析,精準反映教學要素之間的互動,簡化外語教學評價方式、克服經驗式評價弊端。

1.1大數據能優化外語學習過程,助力個性化教學的實現

國內外研究表明個性化教學能最大限度發揮學生潛能、提高學生學習動力、維持良好的學習習慣,對提升學習效果具有積極的意義(Creed, 2010;Kalivoda, 2010)。個性化教學一直是我國外語教育領域的不懈追求;從教育部頒布的《大學英語課程教學要求(試行)》(2004年)到《大學英語教學指南》(2017年)都把確立多元教學目標、體現個性化教學理念、提供多種學習選擇作為其核心觀點和任務(王海嘯,2004;蔡基剛,2016)。但受制于傳統教學模式的局限,個性化指導和評價機會有限,個性化教學效果不理想(文秋芳, 2006, 2012)。信息技術新時代,教學模式以學生為中心,使其成為學習過程數據的生產者、使用者和受益者。通過學習過程大數據,可以完善個性化學習者檔案、分析和預測個性化學習行為、進行以數據驅動的教學決策和個性化學習輔導;自適應學習系統能根據學生學習數據預測其性格特點和喜好,推送符合學生興趣愛好和級別的學習材料,構建個性化的知識和能力體系。如在慕課或精品資源公開課中,平臺可以收集學生的所有學習數據,大數據與云計算的結合使教師可以通過對數據的分析掌握學生在教育資源庫上的操作痕跡,如點擊流(Clickstream ),了解學生學習動態需求,了解不同學生的學習風格,提供不同的學習支持,進行及時、有針對性的干預和幫助(Gao, et al., 2019;Deng, et al., 2020)。如姜強等(2018)基于AprioriAll算法,挖掘分析相同或相近學習偏好和知識水平的學習群體的軌跡,并以學習者特征與學習對象媒體類型、理解等級、難度級別的匹配計算為基礎,生成精準化個性學習路徑,為差異化教學提供新思路。陳長勝、孟祥增等(2020)以中國大學MOOC平臺中7967名學習者的學習行為記錄為對象研究了慕課學習者的時間分配,發現慕課學習者在線學習行為時間序列呈現非平穩特征,課程周期內學習者學習時間分配存在三段式節奏,學習者資源交互行為的時間分配存在顯著差異,不同成績等級的學習者群體資源交互行為與學習時間分配存在顯著差異。因此提出了課程運行中及時關注“低訪問頻次低時間投入”和“高訪問頻次低時間投入”學習者的分類教學建議。

1.2大數據能深化對外語學習者特征的分析

根據第二語言習得理論,學生個體差異,如年齡、學習風格、動機、學習目標、元認知等會影響語言學習的成效(Stephen, 1981;Rod, 1997;Dornyei, 2005)。傳統的教學研究只能利用獲取的隨機抽樣數據,用統計手段進行推斷,過程復雜,研究結果存在誤差,影響后續教學干預的準確性。信息網絡技術可以采集微觀的學習過程數據,包括學生的基本信息(姓名、性別、年齡、專業等)、學習行為日志數據信息(如學生在哪段視頻上停留了多少時間、閱讀某篇文章花了多少時間、先后瀏覽順序、作文寫作經歷了怎樣的修改過程等細顆粒度的行為)、興趣偏好信息(語言技能類、文化類、應試類等)、認知行為信息(視覺型、聽覺型、沖動型、穩重型等)、學習結果信息(作業成績、測試成績、自評成績、互評成績等);教學過程由以前不可量化到可量化(Cantabella et al., 2019; Shen et al., 2020)。如劉三女牙等(2016)以哈佛大學和麻省理工學院在edX平臺上的課程學習數據為樣本,從學習者類型、性別、學歷、年齡、課程等五個維度對學習者學習行為進行差異性分析,其研究結果深化了對外語學習者特征的了解。趙慧瓊等(2017)利用多元回歸分析方法判定影響學生學習績效的預警因素,在此基礎上建構了干預模型,并將其應用于教學實踐,對產生的學習數據進行二元Logistic回歸分析,結果表明基于大數據的學習分析能及時發出預警信號并提供個性化干預對策,增強學習動機,培養學習者毅力。喬璐、江豐光(2020)選取“學堂在線”平臺上參與慕課學習的1068名學習者進行研究,以視頻觀看比例、平時作業得分率、期末考試得分率、課程得分率四個變量來表征學習者的學習行為特征,并運用凝聚層次聚類分析、K-Means聚類算法、相關性分析和邏輯回歸分析處理課程數據,研究結果把學習者分成了積極學習者、一般學習者和單純注冊者三類,并討論了四個變量在三類學習者群體之間存在的差異。

1.3大數據能精準反映教學要素之間的互動

互動是外語學習的普遍特征,也一直是國內外研究者和教師關注的熱點(Stoch, 2008; Oxford, 2011; Sato , 2013;徐錦芬 等,2018; 徐錦芬 等, 2019)。大數據時代,以社交媒體為特征的技術能記錄學生與學習內容、環境(包括虛擬環境和AI 機器人)、同伴和教師之間復雜交互過程產生的大量數據。例如在慕課平臺上選擇同一門“跨文化交際”課程的數以萬計的學生可以通過網絡社交平臺進行積極的討論,教師也可加入引導討論的方向和內容,交流的廣度和深度前所未有。其產生的龐大數據可以通過社交分析軟件(如Ucinet、Gephi)、內容分析等精準掌握互動的模式、頻率、范圍、內容等 (Chen et al., 2019; Fang et al., 2019; Lu et al., 2020)。如李艷、張慕華(2015)采用質性研究的方法,利用質性研究分析軟件NVivo 8對收集的231條在線學習日志進行編碼,圍繞學習者、教師、課程、技術、環境五個維度進行內容分析。發現學生在與他人互動方面,相比在線交流,偏好面對面的交流討論,而教師對學習者的指導與鼓勵非常重要,多元評價方式能讓學習者體驗到學習過程比最后得分更為重要。

1.4大數據能簡化外語學習評價方式,克服經驗式評價弊端

在傳統教學中,對學生學習過程情況的收集復雜、低效。而教育技術新時代,學習者在學習平臺上的學習過程數據能被終端記錄并存儲下來,為教師評價提供了最直接、最客觀、最準確的依據。同時,基于大數據建立的考試網絡空間能使學生在虛擬環境中與AI機器人進行對話,系統根據設定的評價指標給出評價分數,改變了以往教師靠經驗和主觀判斷評分的局限性(Engwall et al., 2020; Engwall et al., 2020; Hass, Vogt et al., 2020)。

2 外語教學與科研大數據來源

2013年被媒體稱為中國的大數據元年,從這一年起,國內教育技術領域掀起了基于大數據技術促進教育改革和創新發展相關研究的浪潮,大數據教育應用迅速發展起來。2014年3月,教育部辦公廳印發的《2014年教育信息化工作要點》中指出:加強對動態監控、決策應用、教育預測等相關數據資源的整合與集成,為教育決策提供及時和準確的數據支持,推動教育基礎數據在全國共享。大數據與教育領域的深度融合成為當代教育事業發展的必然趨勢。2016年,教育部印發的《教育信息化“十三五”規劃》中提出要積極利用云計算、大數據等新技術,創新資源平臺、管理平臺的建設、應用模式;要依托網絡學習空間逐步實現對學生日常學習情況的大數據采集和分析,優化教學模式。2018年,教育部印發的《教育信息化2.0行動計劃》指出要利用大數據技術采集、匯聚互聯網上豐富的教學、科研、文化資源,為各級各類學校和全體學習者提供海量、適切的學習資源服務,實現從“專用資源服務”向“大資源服務”的轉變。

Piety等(2014)認為教育大數據可以圍繞教學、學習者、教育機構、基于數據的決策四個方面收集。Cope和Kalantzis (2014) 認為大數據可以來自過程性、場景性和課堂評價,以技術為中介的心理測量,自主學習和其他一些更為復雜的學習表現。為了滿足外語學習者的需求,基于技術增強型的學習方式也是多種多樣,如正式學習與非正式學習,同步學習與異步學習,現實世界、虛擬世界與混合世界的學習,移動學習、無縫化學習和特定場景的學習,常規課堂學習、MOOC學習和開放式課程軟件學習(Lan et al., 2017)?;诖?,我們歸納出外語教學大數據的幾個主要來源:(1)外語真實課堂活動中直接產生的數據,如學生考勤、課堂回答問題頻次、課堂測試、參與討論互動情況等。這些數據的采集可以用問卷、課堂觀察、錄視頻、訪談的方式獲得,也可以通過如QQ學習平臺上的簽到、搶答等功能記錄。(2)外語學習平臺產生的學習數據,如學習進度、正確率、發帖情況、測試成績等。北京外語教學與研究出版社Unipus學習平臺、清華大學大學英語數字化互動教學平臺等,能提供學生每單元每一部分的學習時間、成績以及學生在平臺上參與互動討論等的顯性結構化數據。(3)慕課學習平臺,包括中國外語MOOC平臺、學堂在線、超星慕課平臺、各級精品開放課程平臺等。因為這些平臺是面向公眾開放,數據量都比較龐大,一線教師不容易獲取,需要與慕課運營平臺進行溝通。(4) 移動設備端自主學習數據。例如學生學習詞匯的百詞斬、扇貝單詞、拓詞等能自動記錄學生詞匯記憶的時長和進度情況。(5)教學管理活動中通過數字化校園平臺、智慧校園平臺采集到的數據,如學生基本信息、圖書館借閱書目情況、借閱時間長短、大型考試成績情況等。

3 外語教學大數據分析技術

面對不同來源的大數據,只有對數據進行有效的處理,才能使其變成有價值的信息,為教學決策、教學過程和評價提供有價值的參考。近年來,以云計算、數據挖掘與分析等為基礎的大數據技術為教育研究帶來了數據獲取、存儲、分析和決策等方面的支持。

大數據的發展促進了大數據分析方法的發展,包括機器學習、數據挖掘、預測模型、數據的可視化等。在教育領域,學習分析(Learning analytic)非常重要;學習分析是對“學習者和學習環境的數據測量、收集、分析和匯報”,它能為教師、研究者和政策制定者提供有用的信息,改進教學,改善教學結果。Greller 和Drachsler(2012) 提出了一個系統全面的定義,從六大關鍵維度來定義學習分析。這六大關鍵維度分別是內部限制、外部限制、工具、數據、目標和關益者。內部限制指學生的能力和對相關知識的接受度;外部限制包括平臺的規范及與學生、教師的約定;工具有技術、算法、理論等;數據主要是來自學生的公開數據和隱私數據;目標是反思教育模式和預測學生發展前景;關益者包括機構、教師、學生等。Ferguson 和 Buckingham (2012)歸納了五種學習分析方法:社交網絡分析、話語分析、內容分析、性格分析和情境分析。近年來,隨著人工智能和自然語言處理等領域技術的突破和整合,學習分析工具也更加多樣和先進。如支持對原始帖子進行標注或編碼、交叉引用和簡短評論的工具Nvivo和Atlasti;支持基于詞典的文本分析工具CATPAC和LIWC;智能化內容分析工具VINCA;社會網絡分析工具Ucinet;預測學生學習參與的實時模型工具Solutionpath StREAM;分析計算機輔助合作學習的工具Meerkat-ED;為教師提供學生情況實時反饋的工具LOCO-Analyst;用于系統建模的工具Coordinator;專門的數據挖掘工具,SQL SERVER Analysis Service (SSAS)、Weka、SPSS 等(張濃芳,2010; 魏順平,2013; Romero et al., 2020)。除此之外,還有Degrees of Reading Power(DRP)、DRA1+,Pearson’s Ordinate Technology Coh-Metrix、Point of Originality、OpenEssayist和Asiya等分析工具(甘容輝 等,2016)。大數據的算法也為分析大數據提供了支持,例如運用邏輯斯諦回歸方法和支持向量機算法對成績進行預測(賀超凱 等,2016;呂品 等,2019),利用決策樹算法對學生在線學業成就影響因素或學生教學滿意度進行分析(舒忠梅 等,2014;孫發勤 等,2019),基于Apriori 算法對學習群體行為進行分析(姜強 等,2018),利用adaboost 算法構建預測干預模型(韓梅梅,2018)等。

4 結語

依靠現代教育技術產生的大數據對外語教學價值凸顯,為外語科研人員和教師帶來了機遇,但擁有大數據絕不是取代科研人員和教師的作用(Mayer-Schonberger et al.,2013)。在實踐中,我們仍然需要注意幾個問題。

(1)大數據能提供小數據時代不能想象的海量數據,幾乎能實現“樣本=總體”,是一種新的研究范式,但在數據分析和解釋上仍然需要教師和研究者結合語言習得理論和教學實踐進行判斷、分析、歸納和總結。(2)高效、科學的學習管理數據收集平臺和管理系統(Learning Management System)需要研究人員、教師、編程人員的共同研發。根據知網CNKI的檢索結果,我們注意到,目前研究者的興趣普遍集中在英語寫作教學平臺大數據的收集和分析上,缺乏對語言教學其他技能學習平臺的開發和學習過程的研究。(3)質性研究方法,如訪談、問卷、有聲思維,仍是支撐大數據分析的有效三角驗證方法。(4)大數據分析本身具有數據、計算和系統復雜性的特點,研究人員和教師要充分估計大數據收集、儲存和分析中出現的挑戰,找出應對之策。

猜你喜歡
外語學習者分析
隱蔽失效適航要求符合性驗證分析
你是哪種類型的學習者
十二星座是什么類型的學習者
青年干部要當好新思想的學習者、宣講者、踐行者
電力系統不平衡分析
外語教育:“高大上”+“接地氣”
電力系統及其自動化發展趨勢分析
大山教你學外語
大山教你學外語
高校學習者對慕課認知情況的實證研究
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合