?

高一學生化學學科能力性別差異研究

2016-04-20 08:21馬宏佳南京師范大學教師教育學院江蘇南京210097
化學教與學 2016年1期
關鍵詞:性別差異

張 敏 馬宏佳(南京師范大學教師教育學院 江蘇南京 210097)

?

高一學生化學學科能力性別差異研究

張敏馬宏佳*
(南京師范大學教師教育學院江蘇南京210097)

摘要:性別差異是教育中一個不可忽視的重要因素。為發現學生的化學學科能力是否存在和存在怎樣的性別差異,本研究基于項目反應理論和Rasch模型,通過對134名高一學生進行問卷調查,并用Winsteps3.72.0、SPSS17.0和Excel對問卷結果進行量化處理,發現男生和女生在化學學科能力上存在性別差異,尤其在設計和評價與化學有關的科學探究能力上男生明顯高于女生。

關鍵詞:Rasch模型;化學學科能力;性別差異

一、問題的提出

現階段各國中學大多數實行的是班級授課制,它能大規模地面向全體學生進行教學,教學效率高,但是在這樣的班級模式下,教師很容易忽視性別差異。尤其是在我國,長期提倡“時代不同了男女都一樣”,關注教學中性別差異問題更為稀少。而現代教育的基本理念是以人為本,關注學生個性發展。顯然,教學中考慮男女生的性別差異是必要的。因此,高一學生的化學學科能力是否存在和存在怎樣的性別差異,就成為一個值得研究的問題。

二、研究設計

為了測查高一學生化學學習能力的性別差異,我們選擇南京市一所普通高中的134名高一學生為研究對象,以陳功設計的高一學生化學學科能力測試卷作為化學學科能力測試工具[1]。陳功的測試卷基于Rasch模型原理設計,并經由大樣本測試證明了其符合Rasch模型理論預期,具有良好的信度、效度。我們在研究中僅對該測試卷中的少量題目表述做了微調。

學生在規定的時間和有教師在場的情況下獨立完成測試卷,再利用Winsteps3.72.0、SPSS17.0和Excel對試卷進行處理分析,進而得出研究結論。

三、Rasch模型簡介

為了克服傳統測試存在的“工具依賴”(被試成績高低與試題難度有關)和“樣本依賴”(題目難度與被試水平有關)缺陷,上世紀60年代,丹麥數學家喬治·拉希(Georg Rasch)創立了Rasch模型[2]。其數學表達式為其中θn是被試n的能力值,δi是試題i的難度值,Pni是被試n答對試題i的概率,當θn=δi時,可以得出Pni=0.5,即當題目的難度與被試的能力水平相等時,被試答對該題的可能性是50%,被試能力值越大,試題難度值越小,被試通過的概率越接近于1。通過這個數學表達式我們可以看出它同時考慮了被試的能力和項目的難度,所以克服了“樣本依賴”和“工具依賴”的局限性。

在Rasch模型中,被試的能力值和項目的難度值是依據被試答題結果運用最大概率估計法估算出的,估算可通過一定的計算機程序如Winsteps等實現[4]。Rasch模型中的能力值和難度值都是對數型的(分值差1即是差10倍,差2既是差100倍,與分數段無關),從而實現了二者采用同一個等距的量規。

運用Rasch模型時,測試工具和測試對象的反應要滿足模型各理論參數要求,即與理論模型相擬合,如果不擬合,則需要修改測試題目直至擬合。

四、研究過程

(一)測試工具

本研究采用了陳功編制的化學學科能力測試工具,其將化學學科能力分成三個維度:科學的解釋化學現象、設計和評價與化學有關的科學探究、科學的理解實驗資料和事實。題目編制時主要參照了PISA2006中的情境式試題,在情境中考察學生的以上三種能力。筆者對測試工具的修訂主要包括導語的修訂、情境的修訂、題項的修訂和評分標準的修訂等。整套測試卷設計了四個情境:一、玉米燃料和溫室效應;二、自來水安全嗎?三、霧霾和酸雨;四、從燃素說到氧化說。每個情境下設計5-6個小題,共有23個小題。如:

從燃素說到氧化說

1703年,德國醫生兼化學家貝歇爾和他的學生施塔爾共同提出著名的燃素學說來解釋燃燒現象。燃素說學者認為:燃素存在于一切可燃物中,在燃燒過程中釋放出來,同時發光發熱。燃燒是分解過程:

可燃物=灰燼+燃素

金屬=鍛灰+燃素

如果將金屬鍛灰和木炭混合加熱,鍛灰就吸收木炭中的燃素,重新變為金屬,同時木炭失去燃素變為灰燼。木炭、油脂、蠟都是富含燃素的物質,所以燃燒起來非常猛烈,而且燃燒后只剩下很少的灰燼;石頭、草木灰、黃金不能燃燒,是因為它們不含燃素。

后來,拉瓦錫通過精確實驗發現燃素說有其自相矛盾的地方。他認為可燃物質的燃燒或金屬變為鍛灰不是分解過程,而是與氧化合的反應。他的《燃燒概論》系統地闡述了燃燒的氧化學說,其中引用的一個重要實驗是一定量的白磷在空氣中充分燃燒。

請回答以下問題:

1.拉瓦錫想要利用白磷燃燒的實驗證明燃燒是化合而不是分解過程,他需要提供什么證據?并做如何說明?

2.拉瓦錫還需要做如何的實驗設計,才能說明白磷燃燒是與空氣中的氧化合?如何說明?

3.磷的燃燒實驗還可以用來測量空氣中氧氣的含量。但由于燃燒產物P2O5有一定腐蝕性,有人認為該反應不太環保。小明想嘗試使用鎂替代磷,測定空氣中的氧氣含量,裝置圖如下。

(1)請填寫以下實驗步驟:

①按圖裝配儀器,盛裝所需物品。

②_______,關閉止水夾。

③引燃打磨后的鎂條,迅速插入集氣瓶中,等待鎂條燃燒完畢后,________,打開止水夾。

④測量進入集氣瓶中的水的體積和集氣瓶的總體積。

(2)實驗按上述步驟正確操作,但實驗結束時發現,進入集氣瓶中的水的體積大約為集氣瓶總體積的70%,可能的原因是:____________________。

(3)鎂條燃燒產生的固體在水進入集氣瓶后部分溶解,生成白色絮狀沉淀和刺激性氣味的氣體,且在反應后溶液中滴加酚酞出現紅色。試推測溶解過程發生的反應:(用反應方程式表示)

其中第1題旨在考查學生設計和評價與化學有關的科學探究的能力,此題的Rasch賦分方式為:

2分:證據:白磷初始的質量和生成的五氧化二磷(或白煙)的質量(或反應前后磷的質量差);說明:白磷燃燒產物質量比白磷質量要大,表明燃燒并不是白磷中燃素的分解,而是白磷和氧氣的化合反應;

1分:只說明將白磷燃燒,稱量其產物質量,沒有說明質量差;

0分:其他答案或未作答。

(二)資料的收集

本研究調查了南京某高中高一四個班級的學生,共發放問卷134份,回收問卷133份,有效問卷115份。2015年5月上旬測試,測試時間為50min。筆者負責問卷的發放和回收并得到該?;瘜W教研組長的協助。

(三)數據的分析處理

1.整體信效度分析

下表是基于Rasch模型的被試和項目的整體信效度分析。

表1 測試工具整體質量分析

Rasch測量模型將項目的平均難度設置為0,被試能力平均水平隨不同測試對象而有所不同,本測試中被試平均能力水平為-0.82,說明測試卷相對于被測樣本而言偏難。Infit和Outfit的MNSQ值和ZSTD值均接近理想值(MNSQ接近1,ZSTD接近0[5]),說明測試數據與理想模型有很好的擬合。項目分離度4.95(大于2為好[6])和分離可靠性0.96(接近1為好[7])均非常高,體現了項目良好的區分度。對于被試而言分離度和分離可靠性相對較低(但也是可接受的,分離可靠性>0.65[8]),說明被試能力水平層次差異較小,考慮到所測試的樣本量不大,且來源于同一所學校,以上結果還是比較真實的。

2.單維性檢驗

單維性是Rasch模型的基本要求之一,即要求所要測量的是一種(而非多種)心理結構。圖1是標準殘差圖,主要鑒別是否有其它可能的因素影響被試的反應。

圖1 標準殘差圖

圖中大小寫字母代表著各個項目,橫坐標是項目難度,左邊縱坐標是當主要變量或結構被控制后,項目分數與另一潛在變量之間的相關系數,右邊縱坐標是某一相關系數上對應的項目數。若某測試項目的相關系數在-0.4~0.4之間,則認為該測試項目測量的是被試某一種特定的心理結構或能力[9]。由圖可知,大部分項目的相關系數都在可接受范圍之內,可以認為每一道題目測量的是一種能力。

3.試題難度與學生能力匹配度檢驗

Rasch模型通過將原始分轉換為logit分,將被試能力、項目難度放在同一把量尺上進行比較[10],圖2是本測試結果的項目-被試對應圖。

圖2 化學學科能力測試工具懷特圖

圖中間豎線是logit刻度尺(M、S、T分別代表平均水平、1個logit、2個logit),表示所測量變量??潭瘸哂覀仁菧y驗卷中23個項目的分布情況,從下到上題目難度逐漸增大??潭瘸咦髠仁菍W生能力水平分布,每一個“?!贝硪欢〝盗康膶W生,從下到上學生能力逐漸增強。由圖可見,23個項目的難度范圍較廣;被試的能力分布也較為理想,基本呈正態分布。因為測試樣本來自于非重點中學,故學生能力大多分布于項目的下部分,整個測試卷偏難。雖然其中部分題目未捕捉到能力相當的被試,但男女同學用的是同樣的測試卷,該不足因抵消而可被忽略。

4.項目擬合度檢驗

表2 測驗項目擬合、誤差統計

T0305 -0.16 0.12 0.87 -1.20 0.74 -1.60 0.49 T0204 -0.17 0.12 0.37 -7.50 0.44 -4.20 0.44 T0403a2 -0.23 0.12 0.90 -0.90 0.78 -1.40 0.59 T0302 -0.34 0.12 1.23 2.3 1.14 1.00 0..34 T0105 -0.37 0.12 0.66 -4.0 0.62 -3.10 0.57 T0104 -0.47 0.11 0.57 -5.70 0.56 -4.00 0.45 T0403a1 -0.49 0.11 1.16 1.80 1.15 1.20 0.38 T0301a -0.57 0.11 1.25 2.80 1.17 1.40 0.33 T0201 -0.64 0.11 1.36 4.10 1.47 3.80 0.20 T0202 -1.00 0.11 1.19 2.20 1.18 1.60 0.37 T0101 -1.15 0.11 1.46 4.60 1.68 4.60 0.11 T0102b -1.60 0.13 1.08 0.70 0.94 -0.20 0.45 T0103 -1.74 0.13 1.35 2.30 1.57 2.30 0.17

由表可以看出,項目難度在-1.74~2.15之間,除了項目T0403c,其他項目的標準誤差都在0.11~0.30之間。檢驗測試結果與模型預期一致性程度的兩個基本指標是MNSQ(0.7~1.3)[11]和ZSTD(-2~2)[12],其中除了項目T0204、T0105和T0104,其他基本都在理想值范圍之內,同時發現這三個項目的MNSQ均小于0.7,說明被試們在此項目上的反應過于一致,但總體來說項目的擬合度是可以接受的。

五、測試結果與分析

分別算出男女生測試結果的Rasch分,再運用SPSS17.0對相關數據進行分析,得到被試化學學科能力及學生性別的描述性統計如下:

表3 化學學科能力及學生性別的描述性統計

研究結果表明:

從男女生比較看,男生能力A、能力B和能力C的平均水平都高于女生。男生和女生在能力B(設計和評價與化學有關的科學探究能力)上存在顯著性差異(F=8.809;P=0.004);在能力C(科學的理解實驗資料和事實能力)上也存在顯著性差異(F=4.045;P=0.047);在能力A上也有差異,但沒有達到顯著水平。

從男女生群體看,男生是能力B>能力C>能力A,女生是能力A>能力C>能力B。即男生在設計和評價與化學有關的科學探究這個能力上水平最高,而女生此能力水平卻最低。

六、討論與思考

以上結果是有點出乎我們意料的,因為目前女生比男生優秀似乎是很普遍的現象,比如在南師大,不論化學專業本科生還是研究生,都是女生比男生多,其他許多高校也有類似現象。結合對測試答案的具體分析,我們認為產生以上結果的原因可能有以下兩方面:

(1)教育模式的影響。在目前考試選拔方式長期影響下,很多中小學老師傾向于以能出好成績的教學目標引導學生,相對于男生來說女生更傾向于“聽老師的話”,記住老師教的和書本上有的教學內容,探究和質疑的能力相對薄弱。比如在面對“拉瓦錫還需要做怎樣的實驗設計,才能說明白磷燃燒是與空氣中的氧化合?如何說明?”這個問題時,女生的回答普遍是分別將白磷與氧氣和其它氣體反應,比較反應產物。這樣的回答只考慮到了設置對照實驗這一角度;而很多男生的回答則是考慮到了氧氣的體積約為空氣體積的,采用氣壓差法,通過判斷倒吸到瓶中的水的體積約為瓶子總體積的,從而判斷白磷是與氧化合。女生傾向于單純運用書本上的知識,而男生更傾向于將學過的知識聯系到一起去解決這個問題。

(2)思維風格的差異。男生一般傾向于獨立思考問題,對問題的宏觀把握較好,能夠綜合的看待問題,理清問題之間的聯系;女生通常注重細節的把握,但常因注重細節而缺少了對全局的掌握,處理問題缺乏宏觀性。比如題目“用鎂代替磷測定空氣中氧氣含量,但實驗結束時發現,進入集氣瓶中的水的體積大約是集氣瓶總體積的70%,可能原因是?”對這個問題的回答,有12名男生考慮到是Mg還與空氣中的其它氣體反應,比如氮氣、少量CO2。而女生的答案基本上都是Mg與CO2反應。Mg的確會與CO2反應,但是女生卻忽略了CO2在空氣中的含量極少,根本沒法和O2共同占到空氣中70%的體積分數。

因此,在平時的教學中,教師應意識到男女生在思維、情感方面的差異,有針對性采用一些不同的教學方法或策略,比如,多給女生鼓勵和宏觀策略上的指導等。真正性別平等的教育并不是無視男女生的差異,盲目地追求“男女一樣”,而是盡管男女生之間存在著很多差異,但是他們接受教育的權利和機會是平等的。作為一名化學教師,當發現男女生的某些學科能力存在性別差異時,不應該“一視同仁”,而應該針對其性別差異因材施教,促進學生化學學科能力的提高。

本研究發現該校高一學生化學學科能力整體上是女生弱于男生的,但還需要更細致的分析差異產生的原因,另外,生源更好或更差學校的學生是否存在以上差異,也需要更多樣本的研究才能回答。這些也是進一步研究的方向。

參考文獻

[1]陳功.教師自主支持與學生化學學習相關性的研究[D].南京:南京師范大學,2015

[2]羅冠中.Rasch模型及其發展[J].教育研究與實驗,1992,02:40-43

[3]王蕾.Rasch測量原理及在高考命題評價中的實證研究[J].中國考試(研究版),2008,01:32-39

[4][10]王祖浩,楊玉琴.基于Rasch模型的“化學實驗認知能力”測驗工具編制及測評研究[J].化學教育,2012,05,95-104

[5]晏子.心理科學領域內的客觀測量——Rasch模型之特點及發展趨勢[J].心理科學進展,2010,08:1298-1305

[6][7][9]Xiufeng Liu.Using and Developing Measurement Instrument in Science Education:A Rasch modeling Approach.Charlotte[M],North Charlotte:Information Age Publishing,Inc.,2010:206-208

[8]Gavin W.Fulmer;Ling L.Liang;Xiufeng Liu.Applying a Force and Motion Learning Progression over an Extended Time Span using the Force Concept Inventory[J].International Journal of Science Education.2014,Vol.36,No.17,2918-2936

[11]Mok,M.M.C.,Cheong,C.Y.,Moore,P.J.&Kennedy,K.J..The development and validation ofthe Self-directed Learning Scales (SLS)[J].Journal of Applied Measurement,2006,7(4):418-449

[12]SilinWei(1);Xiufeng Liu(2);yuaneJia(3).Using Rasch Measurement to Validate the Instrument of Student’understanding of Models in Science(SUMS)[J].International Journal of Science and Mathematics Education.2014,12:1067-1082

doi:10.3969/j.issn.1008-0546.2016.01.001

文章編號:1008-0546(2016)01-0002-05

中圖分類號:G632.41

文獻標識碼:B

*通訊聯系人:E-mail:mahongjia@njnu.edu.cn

猜你喜歡
性別差異
不同任務類型中性別差異對外語效應影響的實證研究
性別差異研究對英語教學的啟示
家庭背景與教育獲得的性別不平等
消費者網絡購物行為決策影響因素實證分析
同伴交友特征的性別差異
淺談社會語言學視角下性別差異的體現
AdvancedTeachingStrategiesofCollegeEnglishVocabulary
不同性別青年冠心病患者的臨床特征及其性別差異
性別差異對TWA的影響
中國缺血性腦卒中急性期抑郁障礙的性別差異
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合