?

游戲化測評在教學中如何應用?
——基于國際研究的系統性文獻綜述

2024-01-16 14:20龔鑫許潔胡若楠喬愛玲
數字教育 2023年6期
關鍵詞:學習者游戲研究

龔鑫 許潔 胡若楠 喬愛玲

(1.首都師范大學 教育學院,北京,100084;2.浙江大學 教育學院,浙江 杭州,310058;3.華東師范大學 教師教育學院,上海,200062)

引言

測評作為教學的有機組成部分,是教育活動的重要載體,也是促進學生知識鞏固和遷移的“助推器”。新技術的迅猛發展,帶來了教學測評和反饋方式的深層次融合,實現1+1 >2 的效果[1]?!坝螒蚧?測評”的創造性結合迅速引起了國內外學者的廣泛關注,其沉浸性、隱身性等特點可以有效地解決傳統測評的不足之處所帶來的信度和效度問題[2]。

目前,游戲化測評雖廣受國內外教育領域人士的關注,但因游戲化本身相對復雜,現有研究結果不盡相同,甚至差異很大[3]。因此,如何運用游戲化策略設計評價以提升學生參與測試的積極性等問題值得系統探討。為獲得更科學、更有說服力的結論,本研究基于近2013—2023 年國際相關實證研究成果展開系統評價,梳理游戲化測評在教學中應用的整體情況,歸納總結游戲化測評的主要設計策略及相關實踐領域,并結合其挑戰提出對應建議,以期為游戲化測評的教學與實踐提供啟示,為“雙減”政策下實施高效測評提供思路。

一、文獻綜述

(一) 游戲化測評

游戲化旨在將游戲元素與機制融入到普通的任務中,以讓被執行的任務流程變得有趣,從而引發人們深層動機、提升學習效果、提高任務收益[4]。其中,游戲化元素作為游戲化的基本成分,類似于工具箱,每個工具都可以用來構成游戲的交互設計并驅動用戶參與。

將游戲化應用于教學測評中,能夠為個體創造一個互動的學習環境,激發學生積極參與測評。根據引入游戲機制目的的不同,可將與游戲相關的測評分為兩類:結構游戲化測評和內容游戲化測評。顧名思義,結構游戲化測評側重于任務流程的游戲化,任務內容本身不具有游戲感,通過游戲元素及內在機制促使學習者在愉快的學習中完成任務[5];而內容游戲化測評側重于任務內容的游戲化,一般可用于收集學習者在游戲過程中的行為表現數據,對學習者的心理特性和行為進行量化測評[2]。

(二) 游戲化測評在教學評價中的應用

游戲化測評豐富了教育教學評價的手段,充實了教育教學評價的方式,拓寬了教育教學評價的范圍。與其他技術支持的評價方式相比,游戲化測評因其沉浸性和趣味性,能夠通過動畫、音效、排行榜、進度條等功能減輕學生壓力。在評價內容方面,游戲化測評不僅對學生的學習效果進行評價,還對學生的高階思維、數字素養等綜合素質進行評價。此外,游戲化測評在人才選拔中的應用也使其發展為未來人才測評的主要形式。有研究指出,將游戲機制和其他游戲組件(元素)納入傳統評估類型的創新方法獲得了不同程度的成功[6]。由此可見,游戲化測評效果如何也一直是專家學者探究的重點。

當前國內對游戲化相關的系統研究主要集中于游戲化教學,在游戲化與教學評價領域的相關研究與實踐還很有限?;谟螒蚧瘻y評在教學評價中的現狀,研究者還需對游戲化測評開展系統的綜述分析,以更好地探索游戲化測評在教學中的應用效果及如何有效實施游戲化測評。因此,結合2013—2023 年國際的相關實證研究成果,本研究確定了如下研究問題:(1)國際游戲化測評實證研究主要呈現出哪些特征(發表期刊、研究對象、研究方法等)?(2)國際游戲化測評實證研究的主要理論依據是什么?(3)國外游戲化測評應用于教育領域的形式具體分為幾類?其設計策略是什么?(4)國際游戲化測評實證研究的主要領域有哪些?(5)游戲化測評應用于教學的效果如何?

二、研究設計

(一) 研究方法

本研究采用系統性文獻綜述法,梳理了2013—2023 年國際關于游戲化測評在教學中的研究現狀、主要研究內容和研究效果等,以期對游戲化測評研究者、一線教師等相關人員有所啟發。

(二) 文獻獲取

本研究所主張的游戲化測評包括結構游戲化測評和內容游戲化測評,兩者以不同的游戲化方式對學習者進行教學過程評價,結構游戲化測評偏向于加入特定的游戲化元素,內容游戲化測評偏向于評價內容的游戲化,最終達到評價的效果。借鑒系統性綜述中的文獻獲取方法,以Web of Science、Scopus 和Springer Link Science Direct 等數據庫為主要數據來源,檢索時間限定為2013—2023 年(截至2023 年5 月15 日),文獻語言為英文。以(Gamif* OR Game-Based)和(Assessment OR Quiz)為檢索式,共得到文獻4 916 篇。其中,在Web of Science 數據庫中檢索到972 篇文獻、在Scopus 數據庫中檢索到3 430 篇文獻,在Springer Link Science Direct 數據庫中檢索到514 篇文獻。

(三) 文獻篩選

本研究遵循系統性文獻綜述方法(Preferred Reporting Items for Systematic Reviews and Meta-Analyses,簡稱PRISMA),通過檢索、篩選、合格和納入4 個階段對游戲化支持教學測評的相關文獻進行篩選,具體PRISMA篩選過程如圖1所示(見下頁)。其中,根據研究問題制定文獻納入和排除標準,文獻剔除的標準為:(1)非英文論文;(2)非實證研究類論文;(3)非期刊論文;(4)全文不可獲??;(5)重復性文獻;(6)國內作者或研究對象;(7)研究沒有明確的研究問題、方法及結論;(8)主題未聚焦于游戲化測評。最終確定有效的實證研究文獻為79 篇。其中,6 篇出自Web of Science,70 篇出自Scopus,3 篇出自Springer Link Science Direct。結合篩選得到的79 項研究,本研究從發表時間、作者、期刊來源、期刊等級、理論基礎、研究問題、學科背景、研究對象、研究方法、樣本大小、研究周期、游戲化測評類型、實驗設計策略、游戲設計策略、研究效果等維度依次編碼分析。

圖1 PRISMA 流程圖

三、研究結果和討論

(一) 游戲化測評應用于教學的研究現狀

1. 所屬期刊種類豐富

從文獻發表數量來看,2013—2023 年國際游戲化測評應用于教學的研究呈現逐漸上升的趨勢,尤其是在2018-2020 年加速上升,之后處于緩慢上升時期。從文獻發表的期刊種類來看,79 項研究分別發表在50種不同的期刊上。按照2021 年SSCI 期刊最新影響因子和排名對期刊等級進行分區,在79 項研究中,有44項研究屬于Q1 區,21 項研究屬于Q2 區,12 項研究屬于Q3 區,2 項研究屬于Q4 區。由此可見,隨著技術的發展和教育教學評價的精準化,游戲化測評相關實證研究逐漸受到研究者和高質量期刊的廣泛關注,正處于熱門研究階段。

2. 研究對象群體多元

在79 項研究中,研究對象群體覆蓋5 個不同的教育階段。其中,7 項研究對象為成人,34 項為大學生,14 項為中學生,10 項為小學生,只有5 項研究針對學齡前兒童,還有9 項研究中包含至少兩個群體(以中小學生居多)。從不同教育階段的文獻數量可以看出,當前游戲化測評的實證研究主要來自高校和部分中小學,關于學齡前兒童和成人的實證研究較少。造成這種情況的原因可歸結為兩方面:一是游戲化測評基本都需要技術支持,而適用于學齡前兒童的技術平臺欠缺;二是對于成人群體而言,學習更多的是一種主觀的積極參與,對游戲化測評的需求較低。另外,分析實證研究所采納研究對象的數量,其中,將100 人以下作為研究對象的有32 項(40.5%),100 ~300 人的有26項(32.9%),超過300 人的有21 項(26.6%)。這表明研究涉及樣本規模差異較大,較大規模的游戲化測評研究仍需加強。

3. 研究方法混合多樣

本研究將79 項實證研究的研究范式分為實驗設計、準實驗設計和非實驗設計3 大類。其中,55 項研究(67.2%)采用實驗設計,20 項研究(28.4%)采用準實驗設計,4 項研究(4.4%)采用非實驗設計。從數據分析方法來看,實驗設計、準實驗設計、非實驗設計3 種研究范式都以定量研究為主。整體來看,大多數研究采用定量研究方法(N=72,91.1%),少數采用混合研究方法(N=7,8.9%)。

(二) 游戲化測評應用于教學的研究內容

1. 游戲化測評的理論基礎

在79 項實證研究中,39 項研究明確標注出依據的理論。其中,游戲化學習理論應用頻數最多(N=12),這與前期的相關綜述研究結果一致[3],體現了當下游戲化學習理論的發展趨勢;其次是以證據為中心的設計理論(Evidence-Centered Design,簡稱ECD,N=6),ECD 涉及概念和計算模型(如能力模型、證據模型和任務模型)的開發,這些模型共同完成有效的評估;心流理論(N=3)也被多次應用,主要指學習者在游戲化環境下,更易被游戲吸引并為贏得獎勵而努力,最后達到忘我的學習狀態。自我決定理論、動機理論、計劃行為理論、社會建構主義理論、體驗式學習理論、自我調節學習理論、協作學習理論等也在其他項研究中出現??梢?,當前的游戲化測評理論基礎比較分散,這可能源于當前在游戲化測評研究方面,尚處于理論探索階段。

2. 游戲化測評的設計策略

依據引入游戲機制的目的差異,將79 項實證研究歸類為結構游戲化測評(N=32)和內容游戲化測評(N=47)。

(1)結構游戲化測評的外在表現主要為題庫型游戲

題庫型游戲將游戲化元素與知識題庫相結合,以游戲情節串聯知識內容,但題庫與游戲情節的聯系并非必然。其中,有13 項是基于課堂交互系統設計的,另外19 項則是將游戲化元素直接嵌入已有的傳統測評中(如多項選擇題)。這些關于結構游戲化測評的研究雖然均為融合游戲化元素與題目設計,但在教學測評視角下,游戲化元素在評估中的應用在類型、數量和復雜性上有所不同。下面以余·尼克(Yee Nick)等人[7]在信息系統領域提出的“成就類—社交類—沉浸類”3 類游戲元素為例,具體分析游戲化元素的應用情況。

成就類游戲化元素是根據學習者的實際情況,給出與之相對應的參數,使學習者的學習情況能夠以可視化形式呈現,并以此激勵學習者持續參與。其中,在表現學習者的成績方面,分數/積分等元素的運用頻率最高,其次為徽章、排行榜等元素。而對學習者游戲時所處關卡、游戲進度、答題速度等提供標記,不僅能夠有效增強其參與動力,還能提高測評完成率。但部分研究者發現,此類元素短期使用有效,長期效果有待考證。

社交類游戲化元素涉及能夠推進學習進程的各類互動交往元素。其中,競爭、反饋和個性化等已獲取諸多學者青睞。如李蘭(Li Lan)[8]設計的尋寶游戲在任務設置時為學習者創造良好的競爭關系,助力學習者激活動機;奧拉夫·達赫利(Olav D?hli)等人[9]以多種交互形式和反饋機制將測試內容呈現在“學習者”游戲中,旨在幫助學習者評估自身知識掌握程度、系統學習進程的同時,改善學習體驗及效果。

敘事和虛擬角色等沉浸類游戲化元素能創建測評情境,提供信息支持(如給玩家提示)與誘導式沉浸體驗。芬蘭研究者在關于小學數學測評的研究中,利用虛擬角色作為敘述的載體,在奧林匹斯山與對手競爭回答數學問題,以獲得丟失金幣的蹤跡,從而激發學習者對分數知識的學習興趣[10]。雖然結構游戲化測評設計的開發難度低且適用于所有學科,但教育性與游戲性的聯系緊密性難以達到理想效果,因而會影響到整體游戲體驗。

(2)內容游戲化測評表現形式為融合型和仿真型游戲

融合型(N=43)和仿真型(N=4)游戲主要將游戲情節融入測評內容或作為引導置于測評場景中,能從測評對象在游戲中的各種行為表現中提取具有潛在應用價值的信息,從而獲得對其能力的測評。設計內容游戲化測評需要重點平衡游戲本身的趣味性與測評結果的準確性,由此,從測評游戲的設計與開發視角,根據現有文獻將其分為游戲策略設計環節、行為數據收集環節和測評目標評估環節,旨在回答現有內容游戲化測評如何設計才能實現測評的結果準確、內容有趣。

游戲策略設計環節旨在創設適當的心流互動體驗,以任務指令提供學習目標引導,以即時反饋方式使學習者處于一種滿足既定目標的環境。例如,有研究者將徽章引入已有的“物理游樂場”游戲評估系統,當學習者獲得正確的測試結果時,為其提供獎勵[11]。

在數據收集環節,伴隨計算機硬件性能的飛速提升,部分測評游戲依托感知交互技術獲取學習者在學習中的多模態行為數據,如學習者操作任務的行為日志數據、反映學生心理狀態的面部表情等。雷切爾·M.弗林(Rachel M. Flynn)等人[12]針對兒童認知能力的游戲測評工具,監測20 個指標,將多模態數據與評估目標進行鏈接,從而評估游戲的堅持性、可靠性和評估潛力。

在測評目標評估環節,為實現測評的準確性,根據游戲后臺收集的數據,采用數據挖掘技術和學習分析推論學生的認知能力及認知過程,有利于及時調整教學進程。具體而言,就是先基于收集的豐富數據對測評目標進行表征,實現特征提取,再采用傳統的機器學習模型(如隨機森林、支持向量機等)預測評估目標,這被證明能夠更有效地提高預測準確率。例如,瓦萊麗·J.舒特(Valerie J. Shute)等人[13]收集了中學生參與“Use Your Brain(使用你的大腦)”的后臺數據,采用貝葉斯網絡等數據挖掘技術測量學習者的問題解決能力。埃琳娜·M.奧爾(Elena M. Auer)等人[14]基于彈性網絡回歸、隨機森林回歸、隨機梯度增強樹和支持向量機4 種有監督功能的機器學習算法,對621名學習者的認知能力和責任心數據進行預測。

盡管內容游戲化測評基于真實問題創設游戲情境,運用新技術記錄并保留學習者作答過程中的數據,但其設計難度較高。并且,人們對其測評結果的信任度還有待提升,只能作為傳統測評的補充驗證手段。因此,還需要利用獲取的大量測驗數據,采用深度神經網絡、貝葉斯網絡、自然語言處理等先進的數據處理方法,提高游戲化測評的適用性?;诖?,游戲化測評在學習與能力評估方面還需要進行更深入的研究。

3. 游戲化測評的實踐領域

游戲化測評在教學中主要應用于教學目標評估(N=50)、認知能力診斷(N=21)、人格特質評估(N=8)。如表1 所示。

表1 游戲化測評的實踐領域

在教學目標評估實踐領域,游戲化測評可用于衡量學習者對知識和技能的掌握程度。在與學科結合方面,研究者以案例敘述的形式,開展了大量系統化的基礎學科研究。例如,阿拉伯語、德語等以字母、單詞、對話為內容的語言類課程,多采用題庫型的結構游戲化測評工具,注重提升學生的學習興趣以及激發學生的學習動機;而數學、物理、化學、地理等強調重復訓練強化記憶和抽象知識具象呈現的基礎性課程,多采用融合型的內容游戲化測評工具,借助游戲“可重復”的特點,助力學習者達到記憶的目的;計算機、辯論技能、運動技能等以程序性知識和具身體驗為主的技能類課程,更側重于情景性及具身性,允許學生在游戲中嘗試、犯錯,以更好地幫助學生理解和思考。

在認知能力診斷實踐領域,游戲化測評以獨立學習環節形式存在,多采用融合型的內容游戲化測評工具評估學習者在重構和應用知識時所需要的能力。針對問題解決能力,克里斯汀·斯托夫勒(Kristin Stoeffler)等人[15]將由12 項多維技能組成的協作問題解決矩陣結構整合到基于游戲的評估“電路運行器”中,通過提取玩家與虛擬角色互動時產生的遙測(日志文件、點擊流、交互)和響應數據測評目標能力。針對閱讀認知能力,魯茲·雷洛(Luz Rello)等人[16]開發了一款西班牙語在線篩查工具,以篩查12 歲及以上的閱讀障礙人群,檢測正確率高達80%以上。

在人格特質評估實踐領域,主要采用融合型的內容游戲化測評,依托其隱蔽性和仿真性等特點為特定困難領域的評估帶來新的解決方案。例如,邁克爾·P.麥克里(Michael P. McCreery)等人[17]以游戲中的行為表現為依據,評估個體的主動性攻擊和反應性攻擊特質;杰森·L.哈曼(Jason L. Harman)等人[18]開發了一款情境豐富的敘事游戲,通過插圖元素提升玩家沉浸感,從而測評其5 大性格特質(情緒穩定性、外向性、開放性、盡責性和親和性)。

(三) 游戲化測評應用于教學的效果研究

游戲化測評應用于教學會產生積極(N=67)、消極(N=4)及多種情況混合(N=8)3 種效果。

1. 積極效應

研究普遍認為,游戲化測評在教學中會產生積極的影響。將游戲作為測評載體,其豐富的故事情節和感官刺激給學習者帶來愉悅體驗。利用游戲化元素(敘事、音樂配樂和積極強化、競爭)隱藏測評目標和測評活動本身,引導學生全身心投入游戲并做出決定,從而有效降低其在測評過程中的焦慮水平、提升考試成績。并通過計算機過程數據追蹤技術建立受測者表現情況的動態變化模型,提高測評的信度和效度[15],最終為學習者提供可靠的預測結果,從而能夠使其更全面、更深刻地理解與預測自身行為。

2. 消極效應

極少的消極結果來自不易量化的高級心理活動,主要是游戲化測評結果受學習者的認知能力影響,與受測者的實際水平存在較大差異[19],不能完全反映受測者的實際表現。此外,學習者的技術自我效能感與其在游戲化測評中獲得的公平感顯著相關,因此,這樣的消極影響也可能是由于游戲化測評設計的科學性不足所造成的。

3. 混合效應

混合效應則代表著游戲化測評既有積極方面,也包含消極方面。比如,有研究發現,用游戲進行教學測評能夠增強學習者動機,但是對于其學習成績卻無顯著提升作用[6];游戲作為形成性評估工具有潛在益處,但其效果弱于計算機評估;因新奇效應,游戲在最開始能夠提高學習者的參與度,但這種效果只能短期維持。

四、游戲化測評應用于教學的挑戰與建議

綜觀2013—2023 年游戲化測評應用于教學的79項實證研究成果,可以發現相關研究多以大學生為研究對象,重視引入游戲化學習、基于證據的設計等相關基礎理論,主要采用實驗研究的方法,從游戲化測評設計策略等要素出發,推進游戲化測評在教學目標、認知能力和人格特質等領域不斷深入,使得其測評結果有效、可信,從而得到進一步推廣和認可。

下面總結游戲化測評應用于教學所面臨的挑戰,并針對性地提出優化建議。

(一) 游戲測評指標動態變化,教學專家與游戲設計開發者應通力合作,以優化分析工具

測評游戲將學習情境隱藏在游戲背后,帶給學習者心流體驗,以激發其學習興趣,然而,這種方法使得教育工作者難以跟蹤和分析學習者在學習過程中的學習進度,無法對學習者的學習行為做出即時反饋并幫助他們實現學習目標。此外,隨著測評實施進程的推進,游戲采集數據量增多,初始定義的指標已無法精準反映學生能力的發展?;诖?,教學專家應基于游戲設計開發者采用的人工智能技術所捕獲的數據,借助機器將其劃分到相應指標中,并根據多輪迭代判斷指標的置信度更新指標體系。與此同時,游戲設計開發者也應在測評游戲中嵌入能夠充分匹配動態游戲環境的具體實時分析工具,如將學習分析技術與可視化結合,以優化分析工具,進而促進決策制定。

(二) 游戲測評目標難以量化,質性與量化應結合運用,以實現評價結果真實、全面

對于認知能力及人格特質類測評目標,游戲測評工具僅能收集到部分外顯行為數據,難以全面評價目標能力的隱形特質。因此,在定量分析收集的外顯行為數據的基礎上,需適當補充訪談、評語等定性分析數據,以彌補定量評價中對學生情感、態度、價值觀的忽略,通過結合定性評價和定量分析的優勢,獲得多元數據,使評價結果更加全面、真實。

(三) 測評游戲設計交互性差,新視域與新技術應高度交融,以創建沉浸體驗

測評游戲的界面、人物形象、操作手法等方面的設計缺乏專業性,與日常接觸的游戲差距較大,從而使受測者產生心理落差,尤其對于幼小階段的學習者來說,較易失去參與動機和學習興趣。而在元宇宙視域下,使用擴展現實技術,將學習者定位在“具體經驗”下,實現其與虛擬對象的高度交互,可以使其在認知真實性的游戲情境中獲得隱性知識,彌補虛擬世界中真實感的缺失。

猜你喜歡
學習者游戲研究
FMS與YBT相關性的實證研究
遼代千人邑研究述論
你是哪種類型的學習者
十二星座是什么類型的學習者
視錯覺在平面設計中的應用與研究
EMA伺服控制系統研究
漢語學習自主學習者特征初探
數獨游戲
瘋狂的游戲
爆笑游戲
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合