?

小學生統計推理能力表現的實證研究

2024-03-06 02:27董瑤瑤
數學教育學報 2024年1期
關鍵詞:不確定性情境指標

董瑤瑤,劉 堅

小學生統計推理能力表現的實證研究

董瑤瑤1,2,劉 堅1,2

(1.北京師范大學 中國基礎教育質量監測協同創新中心,北京 100875;2.北京師范大學 中國教育創新研究院,廣東 珠海 519087)

發展小學生統計推理能力有助于促進學生養成“用數據說話”的理性精神,契合了大數據時代對現代公民的素養要求.對此,采取混合研究方法,以一所普通公辦小學的321名六年級學生為研究對象,基于統計推理能力的評價量規來開展表現性評價,刻畫了學生統計推理的總體表現及典型表現特征.結果顯示:在總體表現上,近九成六年級學生的統計推理能力處于單一結構水平和多元結構水平,其中超過五成的學生處于單一結構水平,少數學生仍處于前結構水平,極少數能達關聯水平.在具體表現特征上:86.0%的六年級學生能推測數據之外的信息;90.1%的六年級能運用數據作為證據來初步解釋推測;32.1%的學生能真正反思到推測的不確定性;在3個指標上,學生存在不同的作答策略和學習迷思.由此,通過實現評價框架、測試題、評分標準的有機統一,構建了統計推理能力的評價體系,為推動學生的統計推理能力發展,以及數據意識和推理意識的培養提供了基礎.

小學;統計推理;量規;測評;SOLO;數據意識;推理意識

1 問題提出

統計推理能力(Statistical Reasoning Ability)強調“用數據說話”,是現代公民需具備的重要素養[1],其核心內涵為運用數據在不確定問題中做出理性判斷和決策.統計推理在經濟、政治和個人生活中發揮著重要作用.例如,在個體日常生活中,彩票購買、炒股、房價預測、市場菜價評估等均需基于數據做出判斷.這種基于數據做出理性判斷已成為新型決策思維方式.在此背景下,培養學生的統計推理能力得到了廣泛關注.如國際經濟合作與發展組織指出:“學生作為未來公民應該熟悉大數據的性質,并能在變化和不確定的情境中做出明智的決策.”[2]中國新出版的《義務教育數學課程標準(2022年版)》將“數據意識”作為小學數學核心素養,提出“會用數據的分析結果解釋和預測不確定現象,形成合理的判斷或決策”[3].可見數據意識的內涵和統計推理緊密相連,充分體現了新課標對小學生統計推理能力的重視.然而,從統計推理教學現狀上看,統計課程本身處在中國小學數學課程中的“弱勢”地位[4],統計推理的教學對小學數學教師而言也更具挑戰性[5].在日常的課堂活動中,“數據”被視為“數”而不是“情境中的數”.統計教學被當作“數與代數”領域的教學[6],統計的教學變成了“確定性的教學”,這同“變”中尋找“不變”的統計推理教學理念背道而馳.盡管中國已有研究探索了小學生數據分析觀念和統計思維的發展水平和表現特征[4-8],也有研究探索了國外統計推理的測評案例[9],但缺乏對中國小學生統計推理表現水平的實證研究.對此,只有明確了小學生的統計推理有哪些具體的行為表現,才有望幫助教師了解統計推理和學生統計推理的進階策略.

已有研究對統計推理內涵、評價指標、水平劃分進行了探索.在統計推理的內涵研究上,第一種觀點基于統計概念來定義統計推理,側重于以知識概念為核心,認為統計推理能解釋統計的過程和結果[10-11];第二種觀點認為統計推理是做出統計推斷的推理過程,突出了統計推斷的核心作用,強調了推理是一種認知過程[12-14];第三種觀點以結論的不確定性為標識,認為統計推理是一種合情推理,強調用歸納的方法來探索和發現新的數據模式[15].不同研究者對統計推理的概念解讀都體現了“對不確定問題做出決策”的內涵.正如PISA 2021所強調的那樣,統計推理是要讓學生在“不確定”的現實情境中挖掘數據模式,發揮統計服務于決策的實際作用[2].相比之下,第二種觀點既體現了推理過程,又充分考慮了統計的不確定性.結合小學生特征,研究從該視角出發,將統計推理的概念界定為:“學生能運用已有數據對統計中的不確定性問題做出合理推測的推理過程.”

關于統計推理的評價指標,在早期研究中,研究者大多基于特定的統計概念或數據處理過程來構建統計推理的評價指標[16-17].隨著國際統計教育研究的發展,研究者越來越關注在中小學領域培養學生的非正式統計推斷能力,出現以推斷為核心的評價框架[12-13,18].如Makar和Rubin將統計推理視為得出推斷的思維過程,提出了三維理論框架: ①概括數據之外信息——對超出數據本身的總體做出推斷,這是一種推測性主張;②把數據作為證據——結合情境,以統計數據作為證據來闡述結論;③運用概率語言——運用概率語言表達和闡明推斷的不確定性.該框架進一步明晰了統計推理的認知要素,強調學生的數據意識,得到許多國際研究者的認可和應用.關于統計推理的水平劃分,部分研究基于SOLO分類理論開發了相關的水平模型或評價量規.如Goss基于SOLO分類理論,針對變異性的運用、情境的運用、確定性和論證這3個維度分別構建了前結構水平、單一結構水平、多元結構水平、關聯水平,由此分析六~八年級學生得出統計推斷的推理過程[19].除了基于SOLO分類理論,其它研究也對學生統計推理的表現水平做了分析[20].縱觀已有研究進展,一些研究者多在課堂研究或設計研究中以前后測的形式來評價學生統計推理能力,但這一類評價工具很難說是真正在考查學生的統計推理能力這一構念.

綜上,研究通過對Makar和Rubin三維理論框架本土化,形成小學生統計推理能力評價指標,而后基于SOLO分類理論為評價指標劃分學生表現水平,開發小學生統計推理能力評價量規.基于此,先從宏觀層面總體描述小學生統計推理能力的表現水平,再從微觀層面深度刻畫不同水平學生的表現案例,以期為教師識別、評價、提升小學生統計推理能力提供借鑒,從而推動小學生數據意識和推理意識的培養.

2 研究設計

2.1 研究對象

以小學教育終端的六年級學生為例,采取方便抽樣和整群抽樣,在中國B市郊區選取了1所中等辦學水平的公辦小學,共9個班級的322名六年級學生參加測試.有效樣本量為321.其中,男生165名(51.4%),女生156名(48.6%).

2.2 研究工具

2.2.1 統計推理能力評價量規

研究開發了由“3個評價指標×4個評價等級”構成的小學生統計推理能力評價量規(見表1),該量規內容也充分體現了對小學生數據意識發展的要求.首先,基于Makar和Rubin的統計推理三維理論框架,經文獻分析、專家訪談后構建了統計推理能力的3個評價指標.其次,結合SOLO分類理論,通過文獻分析,針對統計推理能力的3個評價指標分別初步構建“前結構水平、單一結構水平、多元結構水平、關聯水平”4個評價等級.然后,經過專家訪談、6位學生出聲思維、第一輪小規模預測試、第二輪大規模預測試等多輪迭代,在學生的思維過程證據和專家認可(含統計教育研究領域專家、小學數學教育實踐專家)的基礎上,該套評價量規得以最終確立.

該套評價量規的開發過程充分基于學生實證證據,研究在此基礎上,關注學生的思維過程和建構作答反應,以基于現實情境的統計開放題測驗形式對小學生統計推理能力進行表現性評價.其中,測試題的編制主要以評價量規中的“3個評價指標”為理論指導.單題評分標準的編制以“4個評價等級”為理論指導,等級1“前結構水平”、等級2“單一結構水平”、等級3“多元結構水平”、等級4“關聯水平”分別賦分為1分、2分、3分、4分,等級0(空白作答、無關作答)賦分為0分.同時,對每個等級下的學生作答進行雙位編碼,編碼的第一位表示得分,第二位表示作答類型,如等級2中的編碼“10”表示得“2分”中的“類型0”.由此,該套評價體系較好地實現了評價框架、測試題、評分標準的有機統一.

表1 小學生統計推理能力的評價量規

2.2.2 統計推理能力測試卷

基于研究構建的小學生統計推理能力評價量規,“統計推理能力測試卷”包含推測數據之外信息、運用數據解釋推測、反思推測不確定性3個指標,每個指標含4道題,共12道題(1道畫圖題、2道簡答題、1道填空題和8道解答題).該測試工具綜合參考了國內外大規模測評、中小學統計教育研究和小學數學教材中的相關統計題,兼顧畫圖題、簡答題、填空題、解答題等多種題型的分布,所選取的情境是學生熟悉的且可理解的、有吸引力、公平的但又不至于成為“強干擾”的現實情境.工具的研發先后經歷了出聲思維及訪談、第一輪小規模預測試、專家外審、第二輪大規模預測試等環節來保證試題質量.測試卷的內部一致性系數為0.76,符合測量學的基本要求[21].驗證性因素分析結果為:2/=1.89,=0.053<0.06,=0.048<0.05,=0.93,=0.91,說明該測試工具的結構效度良好[22].

研究綜合考慮課標要求、情境設計、素材呈現、文字表述、設問設計、干擾因素等方面來進行科學命題.圖1呈現了測試題中的一道大題.該題的情境為跑步比賽,題型均為解答題.第(1)小題對應指標2“運用數據解釋推測”,主要考查學生挖掘已有數據尋找盡可能多的證據的意識;第(2)小題對應指標3“反思推測不確定性”,主要考查學生對結論不確定性的反思.該題用統計表的形式呈現數據,是對原始數據的簡單分類統計,涉及的知識點主要包括統計表(能讀取統計表信息)和平均數(能用平均數比較甲乙運動員的比賽成績).

2.3 研究過程

為有效獲得學生表現數據,研究以班級為單位進行團體施測,由該班數學教師或班主任進行監考,研究者進行巡考.測試時長共60分鐘.在測試結束后,由研究者完成所有試卷批閱工作.研究通過評分者內部一致性和評分者間的一致性兩方面確保閱卷的信度.在評分者內部一致性方面,研究者在閱卷過程中,每完成100份試卷評閱者會從中隨機抽取5%的試卷進行復審.在評分者間一致性方面,當閱卷結束后,研究者隨機抽取20%已閱試卷,由3位數學教育領域研究生作為閱卷員對主觀題進行雙獨立評分.每位閱卷員均需經過半小時的閱卷培訓,由研究者向其說明閱卷目的、評分規則和注意事項.閱卷培訓結束后,每位閱卷員將先試評5份試卷,直至評分結果達成一致.閱卷員通過試評后,3位閱卷員對20%的試卷進行核驗,核驗結果顯示每道主觀題與研究者的評分一致性均大于90%.

在數據整理和分析環節,采用Excel2019、SPSS22.0、Mplus8.0軟件錄入、清理和分析數據.其中,運用描述性統計、Rasch分析法對學生統計推理能力的總體表現進行分析,運用案例分析法將每個評價指標上的不同水平學生的典型表現案例進行分析.

3 研究方法

3.1 統計推理能力的總體表現

總體來看,六年級學生統計推理能力測驗的總體得分率為54%.基于Rasch模型,運用期望后驗估計法估計統計推理總分能力值和3個指標上的分維度能力值.學生的統計推理總分能力值的頻數分布如圖2所示.

圖2 六年級學生統計推理測驗的總分能力值分布圖

從學生在各指標上的能力值差異上看(見圖3),六年級學生在推測數據之外信息上的能力值離散程度最大,說明學生在該指標上的能力值差異較大,兩級分化嚴重.相比之下,六年級學生在反思推測不確定性上的能力值差異明顯最小且得分更為集中.六年級學生在統計推理3個指標上的能力值平均水平大體相當,但學生在推測數據之外信息上的平均水平略高于其它兩個指標.

圖3 六年級學生統計推理測驗的各指標能力值分布

六年級學生在統計推理3個指標上的各等級人數分布有所差異(見表2).在指標1“推測數據之外信息”上,仍有14.0%的學生處于前結構水平,和其它兩個指標相差較大.在指標2“運用數據解釋推測”上,有36.4%的學生達到多元結構水平,明顯比其它兩個指標的該水平人數占比要多.對于指標3“反思推測不確定性”而言,有61.1%的學生處于單一結構水平,同指標2在該水平上的人數百分比相差了8.5%.

表2 六年級學生在統計推理能力各指標上的等級分布

注:“( )”內表示該指標對應水平的人數.

3.2 統計推理能力的表現案例

3.2.1 “推測數據之外信息”上的學生表現案例

學生推測數據之外信息的關鍵是把握數據的規律性和隨機性,從而進行統計預測或推斷總體.下面以學生在一道典型題上的4水平表現為例,分析學生的典型表現.

【典型題1】六(2)班共40人,他們開展了“身高調查”的統計活動.笑笑所在小組已經任意調查了全班20位同學,并整理了這20位同學的身高分布情況,如下圖.圖中每個黑圈“”代表已調查的1位同學.(1)請推測該班剩下20位同學的身高情況,用“○”表示,并將“○”繼續添加在圖中黑圈的上方.

六年級學生在“推測數據之外信息”時,處于前結構水平的學生基本忽視已有數據的規律,意識不到數據的隨機性,他們所得推測基本是個人主觀想法或極端判斷.在典型題1中,有24.6%的學生處于前結構水平,這部分學生基本忽視已有數據規律,往往聯系班內同學身高情況,按主觀想法畫該班剩下20位同學的身高分布.

處于單一結構水平的學生僅能把握數據的“規律性”或“隨機性”其中之一,做推測時的思維簡單且直接.有40.8%的學生處于單一結構水平,其中28.0%的學生能意識到已調查的20位同學是“任意選取的”,能夠體會到20人之外的20位同學的身高數據和已調查的不一樣,但他們難以恰當理解已有數據所蘊含的信息.例如,有的學生在推測剩下20人身高時,會將數據過度集中在150、151、152這幾個數值上(見圖4),可見這部分學生能夠體會數據的隨機性,但把握不好數據的規律性.此外,有9.9%的學生直接復制或基本復制已有的20人身高分布,這部分學生能夠體會出數據的規律性,但缺乏隨機意識.

處于“多元結構水平”的學生則大致能把握和兼顧數據“規律性”和“隨機性”,但會忽視小部分因素.在該題中,有26.8%的學生處于多元結構水平,并有19.0%的學生能夠按照已有數據規律來畫并體現了數據的隨機性,他們能在153~156處增加數據,但往往存在一些小缺陷.如圖4(3)的學生案例所示,盡管該學生意識到這20人和已調查20人的身高分布會不相同,且整體分布符合已有數據規律,但他在149 cm、150 cm、152 cm處均畫了3個圓,一定程度上忽視了已有數據在這3個身高點上所蘊含的數據規律.

處于“關聯水平”的學生能較好地把握和協調數據的“規律性”和“隨機性”,能全面地推測數據之外信息.在該題中,僅3.1%的學生處于關聯水平.和“多元結構水平”的學生相比,這部分學生思考問題更加全面,能夠聚焦整體讓數據分布更加完整,會盡可能考慮到一些“小缺陷”.他們意識到,剩下20人的身高可能會分布在153 cm~156 cm之間,并且也能體會到已有數據的規律,即身高數據集中在150 cm~152 cm之間,且151 cm最多(見圖4).

圖4 典型題1的4水平學生表現

3.2.2 “運用數據解釋推測”上的學生表現案例

學生運用數據解釋推測的核心在于“自圓其說”,關鍵是用數據作為證據來“說話”,能從數據的多個角度或運用統計量(如平均數)來解釋推測.下面將以學生在圖1第(1)小題(典型題2)上的表現為例,分析學生在該指標上的典型表現.

處于前結構水平的學生基本不具有數據作為證據的意識,他們通常運用個人喜好、個人經驗或僅基于情境來解釋推測.如在典型題2中,有7.2%的學生處于前結構水平.這一水平的學生往往分成兩類:一類是不具備數據作為證據的意識,運用個人喜好、個人經驗或僅基于情境來解釋推測,如作答“甲和教練關系更好”“甲爆發力強所以跑得快”等;另一類是具有數據作為證據的潛在意識,但毫無邏輯或表述非常不清楚.

處于單一結構水平的學生具有數據作為證據的初步意識,能基于對數據的直觀感受,從數據的單一角度來簡單解釋推測.在該題中,有54.8%的學生處于單一結構水平,這部分學生已然能夠運用數據作為證據來解釋推測,但只能給出1個量化表征以外的理由.他們解釋推測的策略主要包含4種(見表3).①縱向比較成績發展趨勢,如甲發揮得越來越好、甲跑得更穩定等.這一類學生占40.5%,是單一結構水平學生的典型作答.和多元結構水平的學生相比,這一部分學生只能相對直接地描述甲或乙從第1場到第5場的比賽成績的高低變化,但不能進一步說明變化范圍.②橫向比較獲勝次數,即指出甲的獲勝次數比乙更高.③最值角度,即用甲乙最慢或最快的成績進行說理.④就近思想,即用最近一次比賽(第5場)數據進行說理.

表3 “運用數據解釋推測”典型題學生主要作答策略

處于多元結構水平的學生具有數據作為證據的基本意識,大多能從數據的多個角度或統計量的其中一類來解釋推測.該題有31.2%的學生處于多元結構水平,作答策略主要有3種.①19.6%的學生能說出2個量化表征以外的理由,即對單一結構水平中的4種作答策略進行兩兩組合,如甲的獲勝次數多且甲發揮得越來越好.②3.7%的學生能從整體視角出發,運用平均數、成績總數、勝率等量化表征形式來說明數據的整體特征和集中趨勢.③7.8%的學生給出的2個理由中有1個量化表征形式(見圖5),這部分學生相比使用第一種策略的學生具有更好的定量分析意識.

圖5 典型題2的多元結構水平和關聯水平學生表現案例

處于關聯水平學生具有數據作為證據的較強意識,相比多元結構水平學生解釋推測時更加全面、完整和有邏輯性.該題僅有5.6%的學生處于關聯水平,這部分學生能深度挖掘和綜合數據所蘊涵的信息,能給出3個及以上的理由,如“獲勝次數+最近場次+成績發展趨勢”“獲勝次數+成績發展趨勢+平均數比較”等3種及以上數據解讀視角相結合的說理策略(見圖5).

3.2.3 “反思推測不確定性”上的學生表現案例

學生反思推測不確定性的關鍵在于知道要提高推測可靠性以及如何提高,本質上是對統計推理所得結論的反思和精進.下面將以學生在典型題3上的表現為例,分析學生在該指標上的典型表現.

【典型題3】下面呈現了國內某疫情的每月新增病例人數.在“十一黃金周”“五一小長假”以及寒暑假、春節這些相對較長的節假日期間,往往人流量較大.同時,一般情況下,導致該疫情傳播的病毒在低溫狀態下更容易生存.你對所做的預測有多大把握: .如果把握不大,還可以收集哪些數據來更準確地預測未來疫情狀況?具體需要怎么收集?

六年級學生在“反思推測不確定性”時,處于前結構水平的學生對推測不確定性的判斷是一種主觀臆斷,或極端地認為基于已有信息的推測毫無可靠性.典型題3中,有1.9%的學生處于前結構水平,這部分學生往往不能判斷所得預測的不確定性,給出的收集數據建議是圍繞“疫情”情境和已有題干信息的“擦邊球式”作答,如建議收集人流量數據等.

單一結構水平的學生往往囿于手頭上數據難以跳脫出來,即便他們能意識到要提高推測可靠性,也不知道如何提高,提出的改進策略往往同統計情境搭邊但無效.該題有70.4%的學生處于單一結構水平,其中有29.6%的學生表示了對自己所得預測的不確定性,但他們給出的數據收集建議和前結構水平學生雷同,是圍繞“疫情”情境的“擦邊球式”作答.也有24.6%的學生表示了預測的不確定性,但給不出數據收集建議或建議錯誤(見圖6).此外,也有15.0%的學生對所得預測完全確定、相當確定,且所給建議錯誤或部分完整.

處于多元結構水平的學生能清楚地意識到推測是不確定的,大多知道收集哪些數據來提高推測可靠性并嘗試說出改進策略,但往往不知道怎樣收集這些數據,也難以詳細說明具體該如何做.在該題中,有18.4%的學生處于多元結構水平,這部分學生的表現可根據所表達的不確定性語言類型大致分為兩種.①9.3%的學生能用定性語言表示所得預測的不確定性,且給出的數據收集建議部分合理,他們往往能說明收集什么數據來提高疫情預測的可靠性,如收集疫苗接種數據、收集歷年數據等(見圖6).②8.4%學生能用定量語言(如70%)表示所得預測的不確定性,且給出的數據收集建議部分合理(見圖6).

關聯水平的學生對如何提高推測可靠性的認識是深刻、徹底的,他們能夠完整、詳細地說明收集什么數據和怎樣收集數據.在該題中,共有4.7%的學生處于關聯水平,這部分學生能詳細地說出收集什么數據和怎樣收集數據.如:收集前幾年的數據或國外疫情數據,可以從國家數據庫或新聞網站上搜索.同樣,這一水平學生的表現也可分為使用定性語言(人數占比1.9%)或用定量語言(人數占比2.8%)表達預測不確定性這兩種(見圖6).這一水平學生往往能跳脫已有題目情境本身,對和該情境相關的數據進行關聯,由此為該情境下推測可靠性的提高提供進一步的證據.

圖6 典型題3的不同水平學生表現案例

4 結論與討論

(1)總體上,大多數六年級學生的統計推理能力處于單一結構水平和多元結構水平,少數學生仍處于前結構水平,極少數能達關聯水平.

研究通過對B市郊區321名六年級學生的統計推理測驗發現,有86.0%~90.4%的六年級學生在統計推理3個指標上處于單一結構水平和多元結構水平.其中,52.6%~61.1%的學生處于單一結構水平,28.7%~36.4%的學生處于多元結構水平.這一結果說明,超過五成的六年級學生的統計推理能力處于單一結構水平,近九成六年級學生的統計推理能力已然處于單一結構水平和多元結構水平.相比而言,僅有少數學生的統計推理能力仍處于前結構水平這一較低層次,且極少數學生能達關聯水平.該結果可得到已有相關研究的支持,如Callingham和Watson的大規模實證研究結果顯示,澳大利亞六年級學生的統計素養和推理水平大多處于單一結構水平,并逐步向多元結構水平過渡,而在關聯水平和前結構水平的比例則相對較低[23].

六年級學生的統計推理能力水平和該年齡段學生的認知發展特點息息相關.根據皮亞杰的認知發展理論,六年級11~12歲的學生正處于具體運算階段向形式運算的過渡階段,這一階段的學生考試逐漸離開具體事物,根據假設來進行邏輯推演[24].SOLO分類理論中的關聯水平可對應皮亞杰認知發展理論中的形式運算階段[25].這個年齡段的學生能從一個角度或多個角度出發較好地處理問題,但對抽象思維、邏輯思維有更高要求的題目,他們的思維發展水平尚難達到.這也進一步解釋了為何只有少數六年級學生可達關聯水平,而大多學生還是處于單一結構和多元結構水平.

(2)在“推測數據之外信息”上,仍有一定比例學生受困于基于主觀經驗做出推測而處于前結構水平;單一結構水平學生的表現特征和已有研究有所出入,部分學生所做推測能體現出不確定性,但會偏離數據規律.

對數據之外信息的推測在中國小學數學課程標準和課程體系相對被弱化.盡管如此,研究發現,已然有57.3%的學生可以到達單一結構水平,28.7%的學生達到較高層次的多元結構水平.受限于相應學習機會的缺乏,低層次的前結構水平學生得不到相應的教學支持而陷于困境.結果顯示,在“推測數據之外信息”指標上,仍有14.0%的六年級學生處于前結構水平,這一比例和其它兩個指標相差了4.7%~8.1%.結合前結構水平學生在“推測數據之外信息”上的表現特征可發現,這部分學生的關鍵表現特征為基于個人主觀經驗或統計情境做出推測,容易被無關信息所干擾.尤其是面對自己過于熟悉的統計情境時,他們很容易持有一種“先入為主”的偏見或誤解[26],這種偏見或誤解會成為該水平學生思考時的“強干擾”,從而抹滅他們做出推測過程.

具體而言,在“推測數據之外信息”指標上,前結構水平、多元結構水平、關聯水平學生的表現特征可得到相關研究的支持[14,17].然而,研究所得的單一結構水平的學生表現特征同部分研究結果有所差異.如Goss的實證研究發現,單一結構水平的學生很少能體會到數據隨機性,且得到的是確定性結論[19].但研究結果顯示,單一結構水平學生做出的推測除了表現為確定性結論,還有相當一部分學生所做推測是不確定的、隨機的.他們的推測同時也會偏離已有數據所蘊涵的信息和規律.他們可能因為受限于生活經驗和學習經驗,所以往往意識不到不確定性背后會有規律可循.

(3)絕大部分六年級學生能運用數據解釋推測,且相對其它兩個指標,在該指標處于多元結構水平和關聯水平的學生最多;各水平學生的表現特征同已有研究基本一致,但在運用“怎樣的數據”解釋推測上存在差異.

研究結果顯示,90.1%的學生在“運用數據解釋推測”上處于單一結構及以上水平,已然具備運用數據作為證據的初步意識.有37.3%的學生處于多元結構水平和關聯水平,能從數據的多個角度或運用統計量來解釋自己的推論和預測.在統計推理的3個指標中,“運用數據解釋推測”指標上處于高水平的學生最多,絕大部分六年級學生能運用數據解釋推測,這一結論可得到許多研究的支持.如Gil和Ben-Zvi針對以色列六年級學生的實證研究發現,很大一部分六年級學生能用數據進行不同程度的說理或解釋[27].張丹針對中國六年級學生的研究發現,大部分學生已經能基于給出的數據進行合理推斷,并開始從數據整體來解釋和說理,觀察數據的角度也更加完整[4].

具體而言,在“運用數據解釋推測”指標上,研究發現4個水平學生的表現特征同已有研究結果基本一致[17].相比國際上的相關研究,研究還發現了六年級學生在運用“怎樣的數據”解釋推測時的一些特點.例如,English和Watson針對澳大利亞六年級學生的實證研究發現,在基于已有比賽成績選拔運動員時,學生更喜歡運用“最佳成績”和“平均數”來說理[28].在同樣的題目情境和相似設問下,研究以中國六年級學生為研究對象,發現他們更喜歡運用“成績發展趨勢”來說理,但缺乏自發地運用平均數進行說理的意識.盡管中國學生在小學階段已多次接觸和正式學習了平均數,但真正能在題目沒有明確要求和暗示下自覺運用平均數“說話”的學生卻是少數.

(4)在“反思推測不確定性”上,學生能用不確定性語言進行表達并不代表他們能真正意義上反思推測的不確定性,且有較多比例的學生受困于“確定性思維定勢”和對已有數據“缺陷”的認識不足而處于單一結構水平.

研究結果顯示,有61.1%的學生在“反思推測不確定性”指標上處于單一結構水平.同“推測數據之外信息”指標上的表現特征類似,六年級學生在“反思推測不確定性”時,較多處于單一結構水平的學生能意識到所做推測是不確定的.這一結果同已有研究有所出入.如Henriques和Oliveira針對葡萄牙八年級學生的實證研究發現,很少有學生能使用不確定性語言來表達推測不確定性[29].但進一步挖掘單一結構水平學生的思維特征可發現,即便這部分學生能用不確定性語言進行表達,也不代表他們能真正意義上反思推測的不確定性,而其根本原因主要有二.一是他們在做統計推理時受困于“確定性思維”.即便有學生嘗試提出策略,也往往是和已有數據搭邊但無效的策略,依舊難以跳脫已有數據本身去提出提高推測可靠性的策略.在中國小學階段的數學學習過程中,“數與代數”“圖形與幾何”領域的內容占了很大篇幅,小學生在數學學習中往往是追求一個確定的、固定的答案,這樣的確定性思維在學生心中已然是“根深蒂固”.而統計推理本身是研究“不確定性”的學問,這需要學生打破“確定性”的思維定式,這無疑對小學生而言是有挑戰的.二是他們對已有數據“缺陷”的反思不足,本質上是忽視了一定統計情境和統計目的背景下數據收集的需求和必要性.數據作為“情境中的數”[30],最終也應回到數據情境和統計問題之下去思考——為何這樣收集數據以及為何收集這些數據?

相比之下,研究發現處于多元結構水平和關聯水平的學生(占比32.1%)已然能跳脫已有數據本身,用不確定性語言表達推測不確定性,并真正認識到所做推測是不確定的.多元結構水平的學生還能說出收集什么數據,關聯水平的學生還能在此基礎上具體說出怎樣收集數據.這兩個水平學生能真正聯系統計情境和統計目的來思考數據的缺陷和反思所做推測的可靠性,并從不同程度上提出提高推測可靠性的有效策略.

[1] BAKKER A, KENT P, DERRY J, et al. Statistical inference at work: Statistical process control as an example [J]. Statistics Education Research Journal, 2008, 7 (2): 130-145.

[2] OECD. PISA2021 mathematics framework (draft) [M]. Paris: OECD, 2018: 15.

[3] 中華人民共和國教育部.義務教育數學課程標準(2022年版)[M].北京:北京師范大學出版社,2022:6.

[4] 張丹.小學生如何學習數據分析——基于學習過程的實證研究[M].上海:上海教育出版社,2020:148-166.

[5] 董瑤瑤,劉堅.小學數學教師的統計推理信念研究[J].中小學教師培訓,2022(4):50-54.

[6] VISNOVSKA J, COBB P. Supporting shifts in teachers’ views of a classroom statistical activity: Problem context in teaching statistics [J]. Mathematical Thinking and Learning, 2019, 21 (4): 285-305.

[7] 李化俠.學習進階視角下小學生統計思維發展水平研究[J].數學教育學報,2019,28(6):55-60.

[8] 董瑤瑤,杜宵豐,劉堅.基于SOLO分類理論的小學統計開放題評價研究——以D市大規模測試為例[J].數學教育學報,2022,31(6):11-16.

[9] 高翔.澳大利亞RMFII項目中“統計推理”的引介與思考[J].數學教育學報,2022,31(4):62-67.

[10] GARFIELD J. The challenge of developing statistical reasoning [J]. Journal of Statistics Education, 2002, 10 (3): 1-12.

[11] 石文靜.高中生統計推理思維結構的研究[D].北京:北京師范大學,2008:2-4.

[12] ZIEFFLER A, GARFIELD J, DELMAS R, et al. A framework to support research on informal inferential reasoning [J]. Statistics Education Research Journal, 2008, 7 (2): 40-58.

[13] MAKAR K, RUBIN A. A framework for thinking about informal statistical inference [J]. Statistics Education Research Journal, 2009, 8 (1): 82-105.

[14] DE VETTEN A, SCHOONENBOOM J, KEIJZER R, et al. Pre-service primary school teachers’ knowledge of informal statistical inference [J]. Journal of Mathematics Teacher Education, 2019, 3 (22): 639-661.

[15] 李星云.論小學數學核心素養的構建——基于PISA2012的視角[J].課程·教材·教法,2016,36(5):72-78.

[16] WATSON J M, MORITZ J B. The longitudinal development of understanding of average [J]. Mathematical Thinking and Learning, 2000, 2 (1): 9-48.

[17] JONES G A, THORNTON C A, LANGRALL C W, et al. A framework for characterizing children’s statistical thinking [J]. Mathematical Thinking and Learning, 2000, 2 (4): 269-307.

[18] 潘禹辰,李亞瓊,徐文彬,等.國際統計教育研究的議題和趨勢及其啟示——《國際統計教育研究手冊》評述[J].數學教育學報,2022,31(5):82-89.

[19] GOSS J M. A method for assessing and describing the informal inferential reasoning of middle school students [D]. Kalamazoo: Western Michigan University, 2014: 50.

[20] SRI PADMI I. Developing 7th grade students’ informal inferential reasoning [D]. Surabaya: Surabaya State University, 2015: 10.

[21] CORTINA J M. What is coefficient alpha? An examination of theory and applications [J]. Applied Psychology, 1993, 78 (1): 98-104.

[22] 溫忠麟,侯杰泰,馬什赫伯特.結構方程模型檢驗:擬合指數與卡方準則[J].心理學報,2004,36(2):186-194.

[23] CALLINGHAM R, WATSON J. The development of statistical literacy at school [J]. Statistics Education Research Journal, 2017, 16 (1): 181-201.

[24] 皮亞杰.皮亞杰教育論著選[M].盧濬,譯.北京:人民教育出版社,1990:20-35.

[25] 蔡永紅.SOLO分類理論及其在教學中的應用[J].教師教育研究,2006,18(1):34-40.

[26] FRISCHEMEIER D, SCHNELL S. Statistical investigations in primary school: The role of contextual expectations for data analysis [J]. Mathematics Education Research Journal, 2023, 35 (1): 217-242.

[27] GIL E, BEN-ZVI D. Explanations and context in the emergence of students’ informal inferential reasoning [J]. Mathematical Thinking and Learning, 2012, 13 (1): 87-108.

[28] ENGLISH L D, WATSON J M. Modelling with authentic data in sixth grade [J]. ZDM, 2018, 50 (7): 103-115.

[29] HENRIQUES A C, OLIVEIRA H. Students’ expressions of uncertainty in making informal inference when engaged in a statistical investigation using tinkerplots [J]. Statistics Education Research Journal, 2016, 15 (2): 62-80.

[30] COBB G W, MOORE D. Mathematics, statistics, and teaching [J]. American Mathematical Monthly, 1997, 104 (9): 801-823.

An Empirical Study of Primary School Students’ Statistical Reasoning Performance

DONG Yao-yao1, 2, LIU Jian1, 2

(1. Collaborative Innovation Center of Assessment toward Basic Education Quality, Beijing Normal University, Beijing 100875, China;2. China Education Innovation Institute, Beijing Normal University, Guangdong Zhuhai 519087, China)

The development of primary school students’ statistical reasoning ability helps to promote students to develop a rational spirit of “speaking with data”, which is in line with the literacy requirements of modern citizens in the era of big data. In this regard, a mixed research method is adopted. Taking 322 sixth-grade students from an ordinary public primary school as the research participants, the performance assessment is carried out based on the rubric of statistical reasoning ability. The current study depicts the overall performance and typical performance characteristics of students’ statistical reasoning. The results show that: in terms of overall performance, nearly 90% of the sixth-grade students’ statistical reasoning is at the Uni-structural level and Multi-structure level, and more than 50% of the students are at the Uni-structural level; a few students are still at the Pre-structure level, and very few can reach the Relational level. In terms of specific performance characteristics: 86.0 % of sixth graders can infer information beyond the data; 90.1% of sixth graders can use data as evidence to preliminarily explain the inference; 32.1% of them could really reflect on the uncertainty of the inference; and on the three indicators, students have different answering strategies and learning myths. As a result, by realizing the organic unity of the assessment framework, test items, and scoring standards, an assessment system for statistical reasoning ability is constructed, which reveals the reasoning cognitive process in the “statistics” area. The application provides a foundation for promoting the development of students’ statistical reasoning ability and the cultivation of data awareness and reasoning awareness.

primary school; statistical reasoning; rubric; assessment; SOLO; data awareness; reasoning awareness

G625.5

A

1004–9894(2024)01–0036–08

董瑤瑤,劉堅.小學生統計推理能力表現的實證研究[J].數學教育學報,2024,33(1):36-43.

2023–09–25

教育部教育管理與改革專項課題研究項目——德體美勞教育過程性評價框架研究(21JGWT0027);北京師范大學中國基礎教育質量監測協同創新中心——區域教育質量健康體檢項目(110105006)

董瑤瑤(1996—),女,浙江寧波人,博士生,主要從事數學教育、教育評價研究.劉堅為本文通訊作者.

[責任編校:張楠、陳漢君]

猜你喜歡
不確定性情境指標
情境引領追問促深
不同情境中的水
法律的兩種不確定性
一類帶臨界指標的非自治Kirchhoff型方程非平凡解的存在性
英鎊或繼續面臨不確定性風險
最新引用指標
莫讓指標改變初衷
護患情境會話
特定情境,感人至深
具有不可測動態不確定性非線性系統的控制
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合