?

英語閱讀理解題測試效度分析

2009-08-02 06:59楊繼龍張孝香
考試周刊 2009年12期
關鍵詞:效度命題試題

楊繼龍 張孝香

效度作為測試學領域的專門術語,指一項測試能測出預定要測量內容的程度,或能夠引起預報作用的程度。測試的效度可以用多個不同的統計方法來估計。語言測試的效度是指測試作為測量手段,測量出想測量的語言學習者語言能力的程度和水平。Bachman將語言測試的效度分為以下幾種類型: 1.內容效度(content validity),其高低根據測試所包含的具體內容來確定。設計測試的內容之前必須首先思考測量的目的,然后確定具體的測試內容。2.結構效度(construct validity),其高低根據測試項目及其所反映的理論關系決定。比如,交際能力測試和交際能力理論的關系越大,測試的結構效度就越高。3.標準關聯效度(criterion-related validity),其高低源于某一測試在反映學習者水平方面與其他外在評估標準的一致性程度上。例如,學習者在某項測試的表現與其在有關這項語言能力評估中表現的水平應保持一致。4.預測效度(predictive validity),其高低根據測試能否準確地預測學習者將來的學習成績而定。某一單項語言測試應該能夠預測學習者在這一語言能力方面的水平。5.卷面效度(face validity),指測試中根據觀察者的主觀判斷,測試達到預先設想的衡量知識或能力的程度。對語言測試的效度進行類型劃分,將效度這樣一個抽象的專業術語具體化,便于在語言測試的設計及評價過程中更多地追求具體的有關效度的指標,便于在語言測試的研究領域對不同類型的效度展開探索和研究,便于通過實踐操作提高語言測試的效度。本文擬以湖北省2007年高考英語中的閱讀理解試題為例,以對其進行統計的數據為基礎,從卷面效度的視角,分析其測試效度存在的問題,并提出改進意見。

一、2007年湖北高考英語卷閱讀理解試題相關數據統計

(一)閱讀理解題選材分析。

(二)閱讀理解題考點覆蓋情況。

二、2007年湖北高考英語卷閱讀理解試題卷面效度存在的問題

(一)文段過長。

2007年湖北高考英語閱讀理解試題的篇幅過長,有一篇竟然接近600個單詞,整個大題的英文詞數達到2551個,以2007年高考英語考試大綱中對閱讀理解規定的參考時間35分鐘來計算,要求考生的閱讀速度接近73w/pm,相對于全國其它自主命題的省份,這個速度要求比較高。

(二)體裁、題材重復。

C、D的題材都是有關心理的,C篇是有關兒童害怕心理的文章,D篇是有關影響人們幸福因素的文章,這兩篇相同題材的文章,會使考生感到枯燥。再者,高考考生對心理方面的知識接觸不是很多,接連考了兩篇有關心理的文章,其效度肯定會降低。B、C、D三篇在體裁上都是說明文,所以題材和體裁上都出現了重復。

(三)表層理解的考題有余,深層理解的考題不足。

考查細節理解的題目太多,考查作者的意圖、態度等深層理解能力的題目較少。從表2中我們不難看出,考查對文章細節的理解的題目達到11個之多。2007年高考英語考試大綱對閱讀的要求是這樣描述的:“……閱讀,要求考生讀懂熟悉的有關日常生活話題的簡短文字材料,例如公告、說明、廣告及書、報、雜志中關于一般性話題的簡短文章??忌鷳埽海?)理解主旨要義;(2)理解文中具體信息;(3)根據上下文推斷生詞的詞義;(4)作出簡單判斷和推理;(5)理解文章的基本結構;(6)理解作者的意圖和態度?!笨梢?,2007年湖北高考英語試題閱讀理解并未涉及對文章結構的理解,而且出題者對考生的六項閱讀理解能力的要求也沒有分出孰輕孰重。

(四)閱讀材料呈現的方式、閱讀理解題目的題型單一。

閱讀材料單純以文字來描述、呈現,缺乏圖畫、圖表等呈現方式。閱讀題型全都是四選一的多項選擇題,沒有簡答、綜述等效度比較高的題型,而且與生活聯系不太緊,對于公告、說明、廣告等與生活聯系緊密的材料均為涉及,實屬遺憾。

三、對提高卷面效度的思考

通過分析2007年湖北省高考英語閱讀理解題可知其命題存在一些問題,其主要原因在于:1.質量專業標準與監督機制沒有建立。在制定和實施分省命題政策的同時,沒有建立起分省命題的質量專業標準,也沒有形成有效的試題質量監督機制。2.達到專業水準的試題命題者數量不足。分省命題政策總體上比較倉促,各省沒有足夠時間尋找或培養出足夠數量的有專業水準的試題命題人,一些省市往往是倉促形成命題小組,有些大學英語教授本人并沒有接受過試題命制的專業訓練,有些大學教授對新課程理念不是很熟悉。這樣的試題命題人往往只能憑借自己的經驗來命題,難以依據科學的語言測試理論命題。據此,筆者從宏觀和微觀兩個層面對提高英語閱讀理解測試效度提出以下建議:

(一)盡快建立試題質量專業標準和監督機制。

在建立分省命題制度的同時,應該建立各科試題質量專業標準,建立起試題質量的監督機制(即使是事后監督,也可以起到一定的作用),保證各省市命制的試題達到幾乎同樣的水平,從而保證試題質量,確保其效度。

(二)廣泛選拔和培養有足夠專業水準的試題命題者。

有足夠專業水準的試題命題者是確保試題質量、提高試題測試效度的根本?,F在的高等院校中有一些測試專家,或者接受過語言測試訓練的專業人士,應該廣泛選拔命題人員。若人數仍然不足,則應通過短期培訓,盡快培養有足夠專業水準的試題命題者,或者建立3—5人的全國審題專家委員會,對分省命題的高考英語試題進行最后的審定,確保試題質量。

(三)精心構思高考閱讀理解測試的目的。

為了保證高考閱讀理解測試的效度,針對高考考生,高考命題者要明確高考閱讀理解應測量的閱讀能力的層次。具體來講,閱讀測試的目的分為基本的對文章大意和主要信息的理解與較高層次的對寫作態度、隱含意義、閱讀策略等的駕馭。

(四)合理設計高考閱讀測試的內容。

為了保證閱讀測試的效度,根據具體的測試目的,高考命題者應充分考慮閱讀測試的文章來源、文章體裁、文章題材、篇幅長短、題型選擇、題目設計等每一個要素,從而確保與具體測試目標的一致性,確保對閱讀能力測量的有效性。

(五)深入比較閱讀測試題的優劣。

為了保證閱讀測試的效度,高考命題者在高考測試的進行、評分等各項工作結束后,應將試題與同層次其它閱讀試題進行比較。通過這種分析,一方面可以檢測試題和其它閱讀試題所測量的學習者閱讀能力是否保持一致,另一方面也可以查缺補漏、取長補短。

(六)科學吸收閱讀測試的反饋。

為了保證閱讀測試的表面效度,高考命題者在測試結束后,應了解考生的答題情況以及同行對這次測試的評價。根據反饋的信息,高考命題者能夠及時地了解到測試在哪些方面沒有達到對考生閱讀能力測量的目標,在哪些方面與對考生閱讀能力的要求有偏離等重要問題。通過這種從測試的設計到反饋各個階段的細致工作,可以提高閱讀測試效度的保險系數,提高閱讀測試的設計水平,使閱讀測試更好地、真實地反映考生的閱讀能力。

總之,我們必須在分省命題政策下,盡快提高分省命題的試題質量,確保為高等學校選拔合格新生、引導基礎教育健康發展這兩個高考基本目的的實現。

參考文獻:

[1]Bachman,L.F.& Palmer,A.Language Testing in Practice[M].Oxford:Oxford University Press,1996.

[2]魯子問.國家·考試·人[M].武漢:湖北人民出版社,2006.

[3]魯子問,王篤勤.中小學英語評價測試理論與實踐[M].北京:中國電力出版社,2005.

[4]高蘭生.英語測試與試題命制[M].北京:人民教育出版社,2002.

[5]湖北教育考試院.2007年普通高等學校招生全國統一考試(湖北卷)——英語試卷.

猜你喜歡
效度命題試題
2021年高考數學模擬試題(四)
2019年高考數學模擬試題(五)
《陳涉世家》初三復習試題
慈善募捐規制中的國家與社會:兼論《慈善法》的效度和限度
2019屆高考數學模擬試題(二)
被看重感指數在中國大學生中的構念效度
外語形成性評估的效度驗證框架
復雜圖形測驗對區分阿爾茨海默病與非癡呆的診斷效度
2012年“春季擂臺”命題
2011年“冬季擂臺”命題
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合