?

義務教育數學教育質量監測的探索與思考

2018-04-04 00:42王燁暉史寧中宋乃慶
數學教育學報 2018年5期
關鍵詞:監測數學質量

楊 濤,辛 濤,羅 良,王燁暉,史寧中,宋乃慶

?

義務教育數學教育質量監測的探索與思考

楊 濤1,辛 濤1,羅 良1,王燁暉1,史寧中2,宋乃慶3

(1.北京師范大學 中國基礎教育質量監測協同創新中心,北京 100875;2.東北師范大學,吉林 長春 130024;3.西南大學,重慶 400715)

隨著國家“人才強國”戰略的實施,對基礎教育質量內涵愈發關注,迫切需要回答國家數學教育質量的整體狀況.借鑒國際數學教育質量測評經驗,立足中國數學教育發展現狀和需求,國家義務教育數學教育質量監測以提升中國數學教育質量為根本目標,堅持基礎性和發展性結合、數學思維和問題解決導向、數學學業和非學業并重、標準參照、國際可比等基本原則.數學教育質量監測可從以下幾方面進行改進:梳理和完善監測核心內容,深入挖掘監測結果和數據,開展跨年度比較研究,開發計算機測試.

數學教育質量;監測;大規模測評;質量提升

數學是一門研究數量關系和空間形式的科學,是人們生活、工作和學習必不可少的工具,也是一切重大技術發展的基礎[1–2].研究表明,數學能力是個體基本認知能力的組成部分之一[3].數學教育可以使學生獲得全面發展和終身發展的基本能力和素養,促進其思維能力和創新能力的發展,為學生未來生活、工作和學習奠定重要基礎[1].

數學教育在中國基礎教育體系中占有核心和重要的地位.數學課程設置貫穿了小學到高中的所有年級,數學課時在中小學階段的所有課時中占15%左右[4],數學教與學也常常是各類考核評價中關注的重點領域之一.中國數學教育不斷發展,尤其是21世紀初開始的數學課程改革,已經在全國開展了十幾年.但是,迄今為止,中國數學教育發展狀況如何,尤其是從國家層面,中國數學教育質量整體狀況如何?如何有效地測量評價中國數學教育質量狀況?并沒有現存的答案.隨著國家發展,對基礎教育內涵發展提出了迫切需求,這些問題更加受到關注,迫切需要基于相關的理論和實踐來回答.

1 數學教育發展狀況及需要回答的問題

新中國成立以來,隨著基礎教育不斷發展,數學教育的發展也經歷了3個階段.第一階段(1949年至1976年),學習蘇聯經驗,教學五環節、啟發式教學、雙基等開始出現,初步形成中國數學教育的特色;第二階段(1976年至2000年),撥亂反正,引進歐美進步教育觀念,中國數學教育有了自己獨立的思考,但是應試教育愈演愈烈,數學素質教育艱難前行;第三階段(2000年至今),新世紀課改自上而下,數學教育在不斷地辯論、調整中,尋找“中國道路”,數學素質教育和創新教育進入新的時期[5].21世紀初開始的數學課程改革,對中國數學教育的發展,產生了廣泛而深遠的影響.

新課改伊始,明確提出了“培養學生終生學習的愿望和能力”的核心目標[6],整個數學教育界不得不重新審視傳統的注重知識體系的傾向,重新認識學生在數學教育中應該得到怎樣的發展.主要體現在以下3個方面.第一,數學課標頒布和修訂.2001年,《全日制數學課程標準(實驗稿)》發布,代替了使用近40年的數學教學大綱,2011年,修訂后的課標,即《義務教育數學課標(2011年版)》發布,成為數學教育綱領性文件.課標明確指出,數學課程具有基礎性、普及性、發展性;數學課程基本出發點是促進學生全面、持續、和諧地發展;是使學生掌握必備的基礎知識和基本技能(數學基本思想、數學基本經驗)、培養學生的創新意識和實踐能力,促進學生在情感、態度與價值觀等方面的發展,為學生未來生活、工作和學習奠定重要的基礎.以學生為中心的基本理念貫穿始終.第二,與課標對應的教材,同時開始編寫、修訂和發行.不同于以往“一綱一本”的體制,課改后采用了按照課標要求編寫、專家委員會審定的方式,出現了“多版本教材”可供選擇的局面,如2005年通過審定的數學教材小學有6套、初中有9套[7].第三,在對課標認識、教材編寫的基礎上,數學課改真實地走進數學教與學活動中.在課標頒布當年9月,部分實驗地區開始試行,到2005年底已在全國全面推行[8].之后短短幾年內,以學生為中心的探究式、合作式、情境—探究、問題解決等教學方式開始出現,課堂教學方式發生改變.調查表明,數學課堂更活躍,學生學習積極性主動性更高,“面向每一個學生”的觀念,被越來越多的數學教師接受,并在自己的教學實踐中逐漸體現出來[8].

但是,新課改自課標發布起,就開始面對來自數學教育界內外的不同聲音和討論.如“初中平面幾何內容的刪減,推理證明的弱化,是否失去了數學本質的內容?”“‘自主、探究、合作’的引入和推行,是否有矯枉過正,絕對化、片面化的情況?”“增加統計概率等內容雖有合理性,但是學生課業負擔加重,如何減負?”“新課改又如何與中高考銜接?”[9]等,大家從不同的角度提出了看法.但是無論理念如何改,課堂如何變,數學教育歸根結底是要促進學生的發展[10].因此,中國中小學生通過數學學習,到底學到了什么、學了多少,在數學學習上發展狀況如何?數學學習情感態度如何?逐漸成為了數學教育界內外共同關注的核心問題.顯然,以選拔為目的的中高考無法回答這些問題[11].

隨著國家“人才強國”戰略的實施,對基礎教育內涵發展愈發關注,也迫切需要從國家層面摸清中國數學教育的家底.具體而言,中國已做到讓一億多適齡兒童接受9年義務教育,但是,學生數學學習的結果到底如何?有多少學生達到了基本要求?不同地區的學生存在怎樣的差異?可能的原因是什么?在全國范圍,學校數學課時、教師狀況如何?這些因素與學生的數學學習結果有什么樣的關系?等等.這些情況并不完全清楚,也影響了相關政策的制定和完善,以及中國數學教育質量的整體提升.雖然,之前已有北京等地方嘗試教學質量監控,積累了寶貴的經驗,但主要是在區域范圍了解教學相關的情況,無法回答國家關注的問題.因此,從國家層面看,數學教育課改以來,“中國數學教育質量整體狀況如何?”“怎樣了解這些整體狀況?”成了中國數學教育發展過程中面臨的新的、亟需回答的問題.

2 國際數學教育質量測評經驗

20世紀國際教育領域的迅速發展,不僅涉及教育理論、課程、教與學,也涉及到評價等各個方面.隨著教育實證研究的興起,心理實驗和測量技術的研究方法開始受到關注.桑代克在1904年出版的《心理和社會測量理論導論》中,將統計方法引入教育研究中,并編制了許多測量兒童學業的測驗和量表.1915年成立的美國教育研究協會(AERA)明確主張把測量用于教育研究中,通過收集數據來進行描述和評價[12].測驗、調查等方法在教育研究項目中越來越多被使用,從小樣本的學校調查運動,逐漸到大規模的國家或國際評價項目.

1963—1964年,針對美國缺乏全國性學生學業水平評價,美國教育專員費朗西絲凱佩爾(Francis Keppel)呼吁建立全國性學生評價體系,并邀請著名心理學家、教育學家R. W泰勒(Ralph. W. Tyler)共同參與,開始設計美國國家教育進展評估(NAEP),并于1972年開展了美國國家數學教育測評[13].幾乎同時,一些教育心理學、社會學和心理測量學家共同呼吁把教育的結果(知識、態度和參與水平,及有意義的、穩定的影響因素)也納入到教育評價體系中,并于1967年成立國際教育成就協會(IEA),開始探索用測評的方法開展跨國比較項目——數學與科學趨勢國際比較研究(TIMSS)[14].之后,越來越多的國家和國際組織開始探索國家層面的大規模的數學教育質量測評,如歐洲的法國、英國、芬蘭,大洋洲的澳大利亞,亞洲的新西蘭、日本等國家,以及迄今參與國家最多的世界經濟合作組織的國際學生評價項目(PISA)等[15].據2015年聯合國教科文組織統計,已有148個國家和國際組織開展了教育質量測評[16].其中,大多數國家和國際組織把數學作為教育質量測評的首次或重要領域.大規模測評逐漸成為了世界各國和國際組織開展數學教育質量測評的有效方式.

如何開展大規模測評?以上國家和國際組織,幾十年的豐富的發展經驗充分表明,由于社會經濟狀況不同,發展的需求不同,各個國家和國際組織的測評目的、測評理念各不相同,進而影響到其測評的內容、方法等也各具特色.但是,無論如何,這些大規模測評都需要基于測量理論和方法,解決測評中的基本問題,即“測什么”“如何測”“結果如何解釋”,以及“如何用”.

2.1 測什么

測什么是任何測評項目首先要回答的重要問題之一,即測評的整體框架指標.雖然各個國家和國際測評的目的和理念各不相同,對教育質量內涵的理解并不完全相同,但是大家共同認可其核心是學生的學習結果,同時也包含與學生學習相關的環境因素[17].因此,幾乎所有的數學測評框架都包含了兩個基本部分——學生數學學習結果及其環境因素.

NAEP作為美國的國家教育進展評估,為了從國家層面掌握整體狀況及發展趨勢,并對結果進行比較、分析,揭示其背后可能的原因,進而為教育管理、政策制定、研究者提供重要的信息,數學測評框架從一開始就包含數學學業表現、環境因素兩大部分.數學學業表現主要關注學生通過數學學習“知道什么”“能做什么”,是否達到國家的基本要求;環境因素主要包括學生家庭背景、學生學習機會、教師教學和學校特征等相關的環境信息[18].TIMSS作為國際數學教育測評,為了對各個參與國家的數學教育系統分析比較,提供可供參考借鑒的經驗,在大量研究基礎上建立了以課程為核心的測量模型,其測評框架除了獲得課程,即學生數學學習結果外,還包含實施課程(教師教學、班級活動)、期望課程(課標、教材),作為與學生學習結果密切相關的環境因素[19].

2.2 如何測

用什么測評工具才能有效地測量出框架指標?各個國家和國際數學教育測評項目,都有一套基于測試框架的、有效的測評工具.總體來看,這些工具都包含:數學試卷、調查問卷,前者用于測評學生數學學習結果各項指標,后者用于測評環境指標.如TIMSS2015年數學測試,基于數學測試框架,研制了數學試題四年級169道、八年級212道,所有題目按一定規律組合成四年級14個題本、八年級14個題本;問卷有學生問卷、家長問卷、教師問卷和校長問卷[20].PISA2012年數學測試,基于數學素養框架,研制了110多道題目,按一定規律,與科學、閱讀題目一起組成13個題本;問卷有學生問卷、校長問卷[21].

為保證測評工具的質量,提高工具的信效度,這些工具研制都應具備以下基本特點.(1)所有題目與測評指標都有明確的對應關系,學生在題目上的作答反應,可以說明對應該指標的掌握情況;(2)依據測評指標的不同特點,題目有多種類型,通常包括客觀題(選擇題等)、建構題(填空題、解答題等),不同題型按照一定比例分布,如PISA數學測試中約三分之一為解答題;(3)為了對所有學生的可能表現情況(如是否達標等)加以測量,題目難題分布較廣,通常覆蓋整個量尺;(4)為保障題目質量,所有題目既經學科專家判斷審核,也有兩次以上預測試及修訂;(5)考慮到題目的廣泛覆蓋面和測試時間有限,通常采用多題本設計;(6)為實現跨年度趨勢比較,不同年度間工具保持一定的內在連貫性.

2.3 結果如何解釋

測評的評價標準是什么,這是數學教育質量測評面臨的另一個問題.通常情況下,評價標準可以分為絕對標準和相對標準.在數學教育質量測評中,學生數學學業表現通常建立客觀的量尺,該量尺反應了國家對學生數學學習后應達到的不同表現水平(或基準線)的要求,如NAEP數學表現量尺有4個表現水平,由低到高分別為基礎以下、基礎、熟練和卓越[22].PISA數學素養量尺有7個表現水平[23].利用該量尺,可以衡量一個國家的學生數學學習結果狀況,如學生能達到量尺上的哪個具體位置,是否達到了最低要求,達到不同水平的學生比例及其具體知道什么、能做什么的描述和刻畫,并據此進一步對區域或國家間比較、分析等.

部分測試結果也會采用相對標準,選取平均值或某個有一定意義的結果值,與之進行比較分析,如學生數學課時、數學作業時間等,以此說明某地區或國家的學生課業負擔情況.總之,評價標準既有絕對標準也有相對標準,標準的選取要充分考慮測評目的、指標特征以及結果解釋需要等.

2.4 如何使用

測評結果的使用,通常是多角度、多方位的.NAEP通常采用“國家成績報告單”的形式,向社會各界呈現學生數學學業表現情況,主要包括學生在數、代數、幾何等子領域以及不同等級(基礎、熟練、優秀)情況;除了國家整體情況,也詳細報告各個州的測試結果.還以此數據,監控《不讓一個孩子掉隊》法案(No Child Left Behind)的實施情況.如NAEP2003數據表明,在2014年100%的學生能夠達到“熟練掌握”這一目標,看來已是不可實現的了,為此,專門制定了目標和要求,加強對各個州數學、閱讀的指導[24].

TIMSS每次監測之后,除了學生數學測試結果外,另有專門的報告呈現教師準備等課程相關信息[25],許多參與國家正是依據這些信息,改進了本國教師培訓課程(職前和職后),并對需要的地區提供附加資源(比如教師職業發展、支持和評估新教師)[24].

PISA測試結果公布之后,愛爾蘭發布了15歲學生數學成就的教師指南(Shiel and others,2007),在描述學生數學成就同時,附上測試題目以及愛爾蘭教師應該如何教授PISA類型數學題目,給教師提供3種建議.芬蘭則進一步分析本國學生表現的優勢與不足,以及相關資源、政策的需求,分別提供給教育規劃人員、政策制定者以及國家工作專家小組,作為完善改進的重要參考依據[24].

總之,從以上國際數學測評經驗可以看出,各個國家和國際組織通過開展大規模的數學教育質量測評來了解其數學教育質量狀況,都有其主要共同點.第一,作為數學教育質量測評,其測評框架都包含了學生數學學習結果和相關環境因素兩個基本部分,兩者缺一不可;第二,測試工具與測試框架密切相關,除專家判斷外,還采用預測試等方式保證工具良好的質量;第三,測評結果的解釋主要有標準參照和常模參照,學生數學學業表現結果采用標準參照,即建立學生數學學業表現量尺來衡量其水平高低;第四,都很重視測評結果的使用,尤其是發揮結果在政策制定、教學資源配置、數學教學改進等方面的作用,達到提升教育質量的目的;第五,國際數學測評也還在不斷發展完善中.

但是,各個國家和國際測評也有自己明顯的特色,它們的測評目的不同、測評理念不同,具體表現在測評的各個方面,體現出不同的測評導向.

3 中國的數學教育質量監測

如何在學習借鑒國際數學測評理念和技術方法的基礎上,立足于中國數學教育發展現狀,結合中國數學教育發展特點和需要,開展國家層面的數學教育質量測評?受教育部委托,監測中心于2007年正式啟動國家基礎教育質量試點監測,首先開展數學教育質量的試點監測,在全國范圍,組織具有教育政策、教育管理、教育研究與實踐等領域豐富經驗的專家學者共同參與,初步明確了監測指導思想和基本思路,并付諸實踐,在實踐中不斷補充完善.

3.1 數學監測目的

在國家層面開展義務教育數學教育質量監測,首先要滿足國家的需要,體現國家意志.《國家中長期教育改革和發展規劃綱要》明確提出,要“提高義務教育質量,建立國家義務教育質量基本標準和監測制度”.因此,國家層面開展數學教育質量監測,其根本出發點和落腳點是提高國家義務教育數學教育質量.為此,數學教育質量監測的目的可以概括為:把握狀況、分析原因、提出建議、促進提升.

(1)把握狀況.有關教育質量的內涵,盡管當前世界各國的理解各不相同,但都普遍認可以學習者為中心,將學習者的發展結果作為核心的教育質量指標[17].

根據中國教育方針以及數學課標的規定,義務教育階段數學教育總目標是通過數學教育,促進學生在知識技能、數學思維、問題解決和情感態度4個方面的發展.因此,監測通過抽取具有全國代表性的樣本,全面系統地了解中國義務教育階段學生在數學學習中數學知識與技能、數學能力、數學情感態度的整體狀況和發展趨勢.同時,基于國家教育均衡發展的考慮,了解和對比不同區域(例如城鄉、省間、縣間等)、不同群體(例如流動、留守等)學生數學學習的差異狀況.

除學生數學學習結果外,還同時了解來自學生家庭、學校、區域的學生數學學習環境因素的狀況.學生數學學習結果,及其環境因素的狀況,共同刻畫出中國數學教育質量的完整、真實的質量狀況圖.

(2)分析原因.在全面把握數學教育質量基本狀況的基礎上,分析其內在關系和變化規律,尤其是針對主要問題,分析其可能原因,是數學監測的第二個目的.首先,數學教育質量發展變化有其內在規律,“在來自學生家長、教師、學校等方面的眾多環境因素中,起重要作用的因素是哪些?”“其作用的機制和特點是什么?”等,都是實現數學教育質量的提升,值得關注的重要問題.其次,從現階段發展的角度,尤其是結合政策制定和落實,關注數學教育中的重點、難點問題(例如,教育經費投入、數學師資配備、數學課程開設、數學教學資源、數學教學方式、學生學業負擔等對數學教育教學的影響),并深入分析其成因,可以作為數學教育質量改進的突破口.

(3)提出建議.在全面把握狀況、分析原因的基礎上,為國家和地方教育政策制定、教育管理部門、數學教研系統、學校數學教師等,提供客觀準確的數據信息,提出有效建議等.如增加教育經費,最需要投入在哪里、哪些方面;怎樣開設數學課程比較合理;學生負擔主要來自哪些方面,如何對待其多樣性等.一方面,通過監測數據信息,改變長期以來中國教育管理部門制定政策措施缺乏實證依據的狀況,提高教育決策的科學性;另一方面,也使各級管理部門、數學教研系統、學校等,在落實具體改進方法時,更有針對性和時效性.

(4)促進提升.提升數學教育質量是一項需要多部門共同參與,并持續努力的長期工程.在中國現有教育體制下,通過教育督導與管理、數學課程研究、數學教研等系統的共同參與、協作,可以督促各級主管部門,合理配置教學資源、優化數學課程設計、指導學校數學教師,改進數學教學現狀,逐步實現促進學生數學素養的提升,并進一步引導全社會,樹立正確的數學教育觀和數學學習質量觀.

3.2 數學監測研發的基本原則

開展國家數學教育質量測評,不僅要借鑒國際數學教育測評的經驗,更要立足中國數學教育的現實狀況,體現國家數學教育目標,并對中國數學教育發展起到導向的作用.因此,在整個數學監測研發過程中,主要的依據是:國家教育方針政策相關規定,中國《義務教育數學課程標準(2011年版)》的具體內容要求,義務教育中小學十幾套數學教材的深入分析比較結果,通過調研等方式,充分掌握中國數學教育教學發展的實際狀況,尤其是地區差異狀況,以及教育測量評價的基本理論和相關要求.監測研發中的基本原則主要如下.

(1)基礎性與發展性相結合的原則.

數學監測以促進學生適應社會和提升教育質量為根本目的,不同于中考高考,不是為了選拔學生.為此,數學教育質量監測設計面向全體學生,既涵蓋數學的基本要求,也關注學生在社會生存的必備基礎,強調對學生成為合格公民所必備的數學知識和技能的基礎要求;同時,數學教育質量監測還要考慮學生終身發展的需要,關注有利于學生未來發展的核心素養,充分考慮學生數學學習特點和認知發展規律,能引導學校、家長和社會,形成積極的數學教育質量發展觀.

(2)數學思維與問題解決導向的原則.

數學教育質量監測指標要考慮數學學科的特點,體現出數學的本質.因此,數學監測不僅關注學生數學基礎知識和基本技能的掌握,也同樣關注學生抽象能力、推理能力和創新能力的發展;還要反映出社會發展對個體素養的要求,引導學生主動建立數學世界與外部現實世界的聯系,充分發展提出問題、分析問題的能力,以及用數學思想和方法解決現實生活中問題的能力.數學教育質量監測指標既要能體現中國數學教育目標,也要能夠發揮對數學學習和教學的導向作用,有利于貫徹落實素質教育理念.

(3)數學學業與非學業并重的原則.

數學教育質量監測以學生的學習結果為核心,它必然會受到環境因素的影響,是監測不可忽略的方面.學生數學學習結果,不僅包含學生的數學學業表現,還包含學生的數學學習情感態度,積極的情感態度對數學學業表現有積極的作用.值得關注的是,學生數學學習結果,離不開來自家庭、教師、學校等相關環境因素的影響,它們是提升數學學習結果不可缺少的方面.因此,數學教育質量監測既要關注學生數學學業表現,也要關注學生數學學習情感態度;既應關注學生數學學習結果,也應關注與數學學習相關的環境因素.

(4)標準參照的原則.

數學教育質量監測是對中國義務教育階段四、八年級學生整體的數學教育質量的監測,不是對個別學生的評價,不用于學生的甄別、選拔等.在數學學業表現方面,監測強調以學生數學學習的達標程度來衡量學生數學學習質量,也就是要建立相對客觀的評價參照系統,對學生數學學習質量所進行的準確描述和說明.既包括全面而明確的,能客觀反映學生通過數學學習“知道什么,能做什么”的內容標準,也包括符合中國實際情況,界限明晰的,能說明學生能做到“什么程度”的表現水平.在相關因素方面,監測主要依據國家政策的相關規定,如數學課時、學生作業時間等,據此對結果進行分析、解釋和說明.

(5)國際可比的原則.

數學教育質量監測既要充分體現中國數學教育目標和導向,符合中國數學教育實情,也要學習國際數學測評先進理念和設計思路,借鑒其數學測評框架研制的技術和方法,并且吸納國際數學測評相關研究的最新發展成果,使數學監測指標體系既符合中國數學教育實情,有中國特色,又具有國際特點,能夠與國際數學測評發展接軌.

3.3 數學監測的初步成果及其特點

監測作為一項綜合性、系統性的工程,既要以教育理論和相關研究為基礎,更需要在實踐中接受檢驗,并不斷地修正和完善,確保質量,最終實現目的.數學作為國家試點監測和正式監測的第一個領域,從零探索,自2007年啟動以來,主要歷經了兩個階段:2007—2014年試點監測,研發數學監測指標、監測工具,在4次試點監測的基礎上,多輪次修訂完善指標和工具;2015—2017年正式監測,抽取全國樣本,收集數據,劃定標準,完成數學監測的國家、省域和專題等各類報告.

數學監測不斷改進完善,在借鑒國際數學測評經驗基礎上,立足中國數學教育現狀和發展目標,初步形成系列成果,也體現出中國特色,其主要成果及特點如下.

(1)研發制定了中國數學教育質量監測指標體系.監測指標體系是監測的綱領性文件,也是監測工具研發、結果解釋等各個環節的重要依據,它明確并細化了數學教育質量監測“測什么”.數學監測指標體系包含數學學習結果和環境因素兩部分,其中數學學習結果分為數學能力、數學學習情感態度兩個維度,及其具體測查指標;相關環境因素包括學生、家庭、教師、學校4個方面,及其具體測查要點.

數學監測指標建立在對中國數學課標、中小學數學教材的深入分析比較基礎上.因此,它突出體現了中國數學課程標準的核心要求,如數學能力的5個指標,與課標的核心觀念密切相關;它也體現了對中國數學教育的導向作用,如考慮到中國數學教學和評價中,長期以來對數學內容相對熟悉和關注,監測指標則強調對能力的測評,盡可能突出數學教育的核心.相關環境因素指標盡量反應與學生數學學習密切相關的環境因素,突出了對重要因素的測查;也反應了數學教育重點熱點問題、政策需求等,如數學課時、數學作業時間等.

(2)研發形成了數學教育質量監測工具庫.監測工具是監測指標的重要體現,它回答了“如何測”.數學監測工具包括數學試卷、相關因素問卷,其中數學試卷分為多個題本,主要測查學生數學能力,相關因素問卷分為學生、教師、校長問卷,主要用于收集與數學學習相關的來自學生、家庭、教師和學校等環境信息.到目前為止,已經積累了近千道數學測試題目,上千道問卷題目.

數學監測工具是監測指標的具體體現.因此,每道題目都對應著指標中的某個具體的測查點.數學題目突出對中國數學教育中“雙基”的考查.考慮到中國數學教與學的現狀,設計了有針對性、有引導作用的題目.如弱化計算速度,突出算理的題目;問題提出的題目;為鼓勵學生展示思維過程,解答題比例在三分之一以上,并體現對解決生活情境問題、開放問題的能力的考查.問卷題目針對不同指標及其特點,設計了選擇、量表、情境等多類型的題目.無論數學測試題,還是問卷題,除專家多輪次審核外,都經過兩次以上預測試及修訂,確保了所有題目具有良好的測量參數,良好的質量保障.

(3)建成了數學教育質量監測基礎數據庫.數據庫包括學生、教師和校長數據庫.僅2015年數學監測數據庫,就有學生樣本約二十萬、教師樣本兩萬多、校長樣本六千多,共涉及一百多個數學測試變量,三百多個相關因素變量.

這是基于中國全國樣本收集數據,建立的第一個國家數學教育質量數據庫.數據庫既包含學生數學學業表現的變量,同時涵蓋了來自學生、教師、學校等各個方面的相關變量;同一年內變量間具有內在的關聯,部分變量還可以進行跨年度比較.這樣的數據庫不僅有助我們對監測數據的深入挖掘和分析,還是今后持續開展國家數學教育質量監測,追蹤分析中國數學教育質量發展趨勢的重要且必備的基礎.

(4)制定了學生數學學業表現水平標準.學生數學學業表現水平標準是衡量學生數學學業表現水平的量尺,由低到高分為4個水平,水平1最低,水平4最高.在每個水平上,可以對達到該水平的學生知道什么、能做什么及其熟練程度進一步描述和說明.

這是第一次建立的全國義務教育學生數學學業表現標準,它不僅基于中國數學課標要求,也充分考慮了中國數學教學的實際狀況,尤其是地區的差異,并結合了學生實際作答表現結果.表現標準由來自全國各地,六十多位中小學優秀數學教師代表、數學教育研究者和管理者共同參與討論,采用國際通行技術方法劃定.利用該標準,既可以了解中國學生整體的數學能力發展水平,也可清晰刻畫中國不同地區學生的數學能力狀況,得到中國學生數學能力發展水平全景圖.通過等值設計和處理方法,表現標準還可以保持不同年度間的穩定性,可以用于不同年度間發展趨勢的比較.

(5)完成了多種類型數學監測結果報告,并提交教育部及地方教育管理部門.從試點監測到正式監測,根據監測數據結果,先后已撰寫了多類數學監測結果報告,既有國家義務教育數學監測結果報告、省域和縣域監測結果報告,也有專題報告、基礎數據報告等類型,共約幾百份.其中,數學監測結果報告、專題報告已提交教育部及其相關司局,省域和縣域報告結合區域報告解讀說明會,陸續反饋到所有參加測試的32個省份及各樣本縣的教育管理部門.

國家監測結果報告是第一次基于全國樣本的監測數據,對中國數學教育質量狀況的全面、客觀呈現.無論是國家監測結果報告,還是專題報告等,都受到了教育部及相關司局的高度重視,部分專題報告,如有關學校數學課時等重點問題的分析,已成為相關政策完善、規定落實和改進的重要依據.

4 反思與展望

國家數學教育質量監測從試點到全國正式監測,不斷改進完善,積累了寶貴經驗,初步形成具有中國特色的成果,但也還有很多值得進一步思考和不斷改進的方面.

4.1 監測核心內容的梳理和完善

隨著數學課改推進,對數學教育本質及其作用的認識也不斷豐富,數學課程的核心要求經歷了“雙基”“四基”“數學核心素養”的發展.國家數學測試在強調雙基要求的基礎上,如何更好地體現出基本數學思想、數學活動經驗的要求,體現出數學核心素養的幾個方面?如何從概念及其內涵上,梳理、論證清晰以上概念之間的關系?尤其是,針對這些指標,如何才能有效地測量出來?設計出有效的題目?如基本數學思想中的“抽象”,如何測量學生更有效?數學應用中的“提出問題”,如何設計讓學生提問的任務?提出問題后又如何評判?

環境因素指標是國家數學監測中不可缺少的部分.在監測中,除了關注數學教育熱點、難點問題外,學生數學學習有其內在發展規律,受到來自家庭、課堂、學校及社會環境中眾多因素的影響,這些因素之間也可能相互影響,最終對學生數學學習結果起關鍵、核心影響的因素是哪些?怎樣的作用機制?這些問題都還值得進一步分析、提煉,并改進這些指標的測量方法.

4.2 監測結果的使用和數據深入挖掘

數學測評從試點到正式監測,雖然已經撰寫了各類結果報告幾百份,為相關政策制定和修改提供了大量數據信息,但是,有關學生數學學習發展水平及其優劣、教師教學方法等方面的分析還不夠深入,所提供的信息還不能充分滿足地方、學校及教師的實際的需求.作為國家層面的教育質量監測,要完全滿足不同層級需要具有一定的挑戰,需要一個過程,但是可以選擇1~2個主題做一些嘗試和突破(如有關問題解決能力等),設計好測查指標和題目,對結果做出更深入的分析,引導和促進數學教學改進和提升.

另外,無論是試點監測還是正式監測的數據庫,現有的報告對數據庫的利用還非常有限,還有大量的數據信息可以深入分析,如進一步對數據分析和利用,不僅可以幫助研究者得到更多的有意義的結果,還非常有助于基于測試數據進行預研究,為后續的測試設計,如指標篩選、題目編寫等提供重要的依據.

4.3 跨年度比較的設計和處理

作為國家層面的數學教育質量測評,不僅要了解測試當年的實際狀況,還需要掌握質量的變化發展趨勢,對不同年份的測評結果進行分析比較.既包括兩年度之間的變化,也包括兩年以上的變化趨勢.如美國NAEP“國家成績報告單”每次不僅報告學生成績相對上一次的變化,還報告1992年以來國家整體數學學習成績的變化趨勢.PISA每次不僅報告測試國家相對前一次測試的變化,也同時報告參加測試以來歷次成績的變化情況,并與其它指標再進一步分析比較.

如何設計測試指標和工具、如何進行數據分析、如何建立不同年度間關聯是測試中必須考慮的重要問題.如NAEP、TIMSS、PISA等國際數學測試中,大多采用共同題目的方法來實現年度間等值的目標.在中國傳統考試文化背景下,這種方法是否合適?如何修改完善?除了兩年度之間,兩年以上的關聯如何設計?等等,都需要更深入的預研究和精心設計.

4.4 計算機測試的開發

隨著信息技術的迅速發展和在各領域的廣泛應用,計算機化測評發展已經成為必然.計算機測評不僅可以簡化測試組織過程,使數據收集、處理更方便快捷,更為重要的是,可以充分發揮其情境性、動態性、互動性、合作性等特點,設計出傳統紙筆測試中不可能的任務,極大地改進測查內容和過程.

數學教育一直強調培養學生的數學思維能力,關注學生思維過程,但是如何測量更有效?在傳統的紙筆試卷中,讓學生展現不同水平的思維過程,并不是一件容易的事情.計算機技術提供了更多的可能性.如PISA數學計算機測試中,在分析實際情境中的函數關系時,學生可以通過反復的嘗試,尋找變量之間的關系,不同的學生還可以有不同的具體嘗試方式和策略,且學生所有作答過程數據均可實時完整地記錄收集,供評估使用[26].因此,在數學測試中,尤其是有關學生思維過程、思維方法的測試,是否可以有一種新的方式和途徑,值得深入研發和探索.這種新的方式和途徑,有可能成為我們“打開學生思維的一扇窗”.

[1] 中華人民共和國教育部.義務教育數學課程標準(2011年版)[M].北京:北京師范大學出版社,2012:1-2.

[2] 中華人民共和國教育部.全日制義務教育數學課程標準(實驗稿)[M].北京:北京師范大學出版社,2001:1.

[3] 董奇,林崇德.中國兒童青少年發育關鍵指標與測評[M].北京:科學出版社,2011:169-178.

[4] 中華人民共和國教育部.教育部關于印發《義務教育課程設置實驗方案》的通知[EB/OL].(2001-11-19)[2018-07-20].http://old.moe.gov.cn//publicfiles/business/htmlfiles/moe/moe_711/201006/xxgk_88602.html.

[5] 張奠宙,于波.數學教育的“中國道路”[M].上海:上海教育出版社,2013:7-16.

[6] 中華人民共和國教育部.教育部關于印發《基礎教育課程改革綱要(試行)》的通知[EB/OL].(2001-06-08)[2018-07-20].http://www.gov.cn/gongbao/content/2002/content_61386.htm.

[7] 孫曉天.近年來中國數學教育發展述要[J].數學通報,2007,46(6):14-19.

[8] 馬云鵬.義務教育數學課程改革十年回顧與展望[J].基礎教育課程,2011(7—8):38-42.

[9] 張奠宙.中國數學教育在改革與反思中前進[J].人民教育,2008(22):33-37.

[10]史寧中.《數學課程標準》的若干思考[J].數學通報,2007,46(5):1-5.

[11]李希貴,李凌艷.教育質量監測:為了國家教育目標[J].人民教育,2007(13):3-4.

[12]程建坤,陳婧.教育實證研究:歷程、現狀和走向[J].華東師范大學學報(教育科學版),2017(3):150-158.

[13]辛濤,李峰,李凌艷.基礎教育質量監測的國際比較[J].北京師范大學學報(社會科學版),2007(6):5-10.

[14] ?IEA. Brief history of the IEA [EB/OL]. (2018) [2018-07-20]. https://www.iea.nl/brief-history-iea.

[15]楊濤,李曙光,姜宇.國際基礎教育質量監測實踐與經驗[M].北京:北京師范大學出版社,2015:1-6,19-32.

[16]聯合國教科文組織.2000—2015年全民教育:成就與挑戰[M].北京:教育科學出版社,2015:305-311.

[17]教育部基礎教育質量監測中心.定義基礎教育質量——結果和可測評的取向[R].北京:基礎教育質量監測中心,2011:5-8.

[18] ?NAEP. Survey Questionnaires [EB/OL]. (2018-08-06) [2018-08-10]. https://nces.ed.gov/nationsreportcard/experience/ survey_question naires.aspx.

[19] INA V S MULLIS, MICHAEL O MARTIN, TERESA A SMITH, et al. TIMSS assessment frameworks and specifications 2003 [M]. Boston: Boston College, 2003: 3-4, 73.

[20] ?MICHAEL O MARTIN, INA V S MULLIS, MARTIN HOOPER. Methods and procedures in TIMSS 2015 [M]. Boston: Boston College and IEA, 2016: 9-37.

[21] ?OECD. PISA 2012 technical report [M]. Pairs: OECD Publishing, 2014: 29-45.

[22] ?NAEP. The NAEP Mathematics achievement levels by grade [EB/OL]. (2015-10-21) [2018-07-20]. https://nces.ed. gov/nations-reportcard/mathematics/achieve.aspx.

[23] ?OECD. PISA 2012 Results: What students know and can do (Volume I) [M]. Paris: OECD Publishing, 2014: 44-46.

[24]辛濤,李勉,任曉瓊.基礎教育質量監測的報告撰寫與結果應用[M].北京:北京師范大學出版社,2015:45-56,61-80.

[25] ?MULLIS I V S, MARTIN M O, OLSON J F, et al. TIMSS 2007 encyclopedia [M]. Boston: Boston College, 2008: 3-44.

[26] ?OECD. PISA 2012 assessment and analytical framework [M]. Paris: OECD Publishing, 2013: 119-136.

Introduction of the National Assessment of Education Quality-Math

YANG Tao1, XIN Tao1, LUO Liang1, WANG Ye-hui1, SHI Ning-zhong2, SONG Nai-qing3

(1. Collaborative Innovation Center of Assessment toward Basic Education Quality, Beijing Normal University, Beijing 100875, China; 2. Northeast Normal University, Jilin Changchun 130024, China; 3. Southwest Normal University, Chongqing 400715, China)

With the implementation of the national “talent power” strategy, more attention was paid to the quality of basic education. We urgently need to answer the question of education quality of national mathematics. Using the experience of international mathematics education assessment, more based on the development status and needs of China’s mathematics education, the national assessment of education quality-math takes improving the quality of our national mathematics education as the fundamental goal, adheres to basic principles such as the basic and developing, mathematical thinking and problem solving oriented, mathematics academic and non-academic pay equal attention to, standard reference, the international comparable. Since 2007, after the pilot monitoring and formal monitoring, the results of education quality monitoring series with Chinese characteristics have been preliminarily formed. It not only laid a solid foundation for follow-up monitoring, but also began to play an important role in improving the quality of national and local mathematics education.

the quality of mathematics education; assessment; large-scale assessment; quality improvement

2018–09–01

楊濤(1967—),女,四川成都人,副教授,主要從事教育測量與評價研究.

G420

A

1004–9894(2018)05–0001–07

楊濤,辛濤,羅良,等.義務教育數學教育質量監測的探索與思考[J].數學教育學報,2018,27(5):1-7.

[責任編校:陳漢君、陳雋]

猜你喜歡
監測數學質量
“質量”知識鞏固
特色“三四五六”返貧監測幫扶做實做細
質量守恒定律考什么
做夢導致睡眠質量差嗎
網絡安全監測數據分析——2015年12月
網絡安全監測數據分析——2015年11月
我為什么怕數學
數學到底有什么用?
質量投訴超六成
不穿戴也能監測睡眠
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合