?

大學英語分級測試垂直量表體系構建的可行性探析

2016-05-14 01:39關寧陳福明
關鍵詞:大學英語

關寧 陳福明

摘 要:文章從垂直量表化的內涵與特點出發,結合當前大學英語分級教學現狀,提出了大學英語分級測試垂直量表體系的構建思路,并分析了其構建的可行性。

關鍵詞:大學英語;垂直量表;分級測試

中圖分類號:G640 文獻標識碼:A 文章編號:1002-4107(2016)06-0054-02

近幾年來,為響應大學英語改革的號召,全國各高校如火如荼地展開大學英語分級教學模式,然而這其中不乏一些鎩羽而歸的高校。究其失敗的原因,很多是因為缺乏一套有效的測試評價體系。針對不同級別、不同水平的學生,如果仍采用傳統的“一刀切”式測試方法,其測量結果的有效性和公平性顯然都是不能令人信服的。針對這樣的問題,引入心理測量學研究領域中的垂直量表化方法,建立垂直量表體系,能夠為解決大學英語分級教學的測試評價問題提供思路。

一、垂直量表化的內涵與特點

垂直量表化,又稱垂直等值或跨級別量表化,是將不同級別的被試者在構念(construct)相同而難度不同的測試中獲得的分數放到一個共同的整體性量表中,由此,在某一特定主題測試中被試者階段性的進步能夠得以追蹤并可供實施測試者進行比較[1]。

Holland和Dorans將兩場測驗中得到的分數進行相互轉換的過程稱作鏈接,而鏈接有三大類:預測(predicting)、數值校正(scale aligning)和等值(equating)。預測是最早的分數鏈接形式,其目的是使來自于其他預測變量的因變量或標準變量的分數預期誤差最小化;數值校正的目的是將不同測試中獲得的分數轉換到一個共同的量表上;等值對需要鏈接的測試要求最為嚴格,其目的是在兩種形式的測試之間建立聯系,使每個測驗中的分數都可以被看作是出自同一測試的分數,以滿足實際應用的需求。其中垂直量表化是歸屬于第二大類數值校正中的[2]。

設計垂直量表體系時,基本做法是使相鄰組之間有共同的測試項目,稱之為錨題,以此為基準建立共同量表。建立共同量表的方法有經典測試理論(CCT)和項目反應理論(IRT)等,若選用IRT方法,第二個要考慮的問題就是量表校準方法的選擇:第一種方法是通過同時校準測試形式的項目和人員參數以及共同項目;第二種方法是單獨校準不同測試形式的參數,然后使用某種數值鏈接方法將它們放到同一個量表上。 其他需要考慮的問題包括:共同項目集合的長度,基準年的選擇和選用的計算機軟件等。

二、大學英語分級教學現狀

2003、2007年我國教育部相繼推出了大學英語教學改革相關文件《大學英語課程教學要求(試行)》和《大學英語課程教學要求》,其中根據學生入學時的不同英語基礎情況,對大學英語教學提出了三個層次的要求,即一般要求、較高要求和更高要求,分類指導和因材施教是改革的核心思想[3]。分級教學正是在這種改革大背景下應運而生的大學英語教學的具體改革措施。

從最早的改革實施至今已過去10年多,按照文件要求,全國大部分學校已經開始實施分級教學模式。但是由于各地情況不同,實施的具體情況也相應地有著各自的特點。當前爭議的焦點主要存在于分級后對學生學習情況進行檢驗的測試評價體系方面。改革初期,很多高校還處于迷茫的狀態,為了方便起見,有的高校在期末測試時,對不同級別的學生仍采用同一測試,這就難免會讓人對測評的公平性產生質疑。實施分級教學比較久了的學校開始針對不同級別設計不同難度的試卷,以提高考試的公平性;但是這也存在相應的問題:不同級別的學生在不同難度的試卷中得出的分數如何進行比較?當前在我國,很多學校的考試分數直接影響到學生的評獎評優、入黨以及未來申請出國讀書等學生的切身利益,因此迫切需要建立起一套客觀、科學和有效的測試評價體系。

三、大學英語分級測試垂直量表體系構建的思路

構建大學英語分級測試垂直量表體系一個總的思路是:在不同級別的試題設計中加入可供鏈接的相同題,即錨題,其次需考慮建立共同量表的方法及選用的計算機軟件等問題。

(一)錨題設計

錨題設計中要考慮的基本問題是,要在哪部分題中設計錨題。當前大多數高校對學生的學習情況測評仍采用筆試形式,而筆試試卷中分為客觀題和主觀題兩種,客觀題通常包括聽力和閱讀,主觀題通常指翻譯和寫作。主觀題,尤其是寫作題,是展現一個語言學習者能力的最佳渠道,對于A級學生來說,寫作題要設計的足夠有深度,以此能看出他們對語言掌握的高度;但若把給A級學生設計的寫作題拿來用作錨題,對于C級學生顯然挑戰過高,同樣,對于A級的學生來說,B級的寫作題目似乎也太過平庸,無法展現出其作為最高級別英語學習者的水平。同時也有研究表明,將客觀題選作錨題,在后期的數值計算過程中誤差明顯小于主觀題[4]。

(二)建立共同量表的方法

前面提到建立共同量表的方法主要包括經典測試理論和項目反應理論兩種。Loyd 和 Hoover 在1980年首次系統的提出在垂直量表體系中使用項目反應理論中的Rasch 模型,許多后期的研究顯示,在數據與模型適合良好的情況下,使用Rasch模型建立起的垂直量表體系比起經典測試理論下的模型,如百分位數等化法等表現更佳。相比于經典測試理論,項目反應理論方法不單單是在理論上具有更優的性質,同時在實際應用上具有更強的功能。

接下來就要考慮校準方法的選擇,項目和人員參數以及共同項目參數,究竟選擇同時校準還是分別校準比較好?Hanson和Beguin發現,正確的指定了模型以后,同時校準通常比分別校準能得出更優的結果,Kim和 Cohen(2002)指出,對于多項分類數據來說,通過同時校準所得到的真正的多元項目反應理論模型參數值恢復比起分別校準加之鏈接項目和能力參數的值恢復更具有連貫性和準確性,盡管這兩者的差別非常細微[5]。

在量表建立的過程中,由于涉及多種計算,不可以有半點疏漏,各種計算機軟件的選用也就顯得尤為重要,這一點有學者做過詳細的論述,如在不同的階段選擇何種軟件,軟件的獲取渠道等都有詳細說明,筆者在此不再贅述[6]。

四、大學英語分級測試垂直量表體系構建的可行性

為評估英語學習者的進步情況而建立相應的垂直量表體系,這種做法在美國是有先例的。2002年美國布什總統簽署了《不讓一個孩子掉隊》法案(No Child Left Behind,簡稱NCLB),其主要目標是縮小幼兒園至12年級(相當于我國的高中)之中各年級學生之間由于擁有參差不齊的教育資源所造成的成績方面的差距,讓每個學生都能享受到高質量的教育。法案中有一項要求各州每年從英語聽、說、讀和寫四個方面對英語學習者的英語語言能力進行測試評估,相應地得出學生的進步情況,并以綜合性報表向聯邦政府匯報。其中最為清晰有效地監測學生進步的方法即是將不同年級的評估結果放到一個共同的量表中進行衡量。

顯然不同年級的學生不可能使用相同形式的測試,應對不同年級或者不同年齡段的孩子設計出適應其各自發展階段的試題。想要將處于不同發展階段、不同年級學生的測試結果放到同一個量表中,最好的辦法就是使用垂直性量表。其具體的操作思路是:首先WIDA(世界級教學和測試公司)將幼兒園至12年級的學生分為五個測試群,然后從聽說讀寫四個方面入手設計試題,遵循不同題型的特點相應地加入錨題。其中建立共同量表的方法選擇的就是項目反應理論方法,相應的校準方法選擇的是同時校準方法。

前面對于垂直量表體系的基本理論、我國大學英語分級教學的基本情況、構建體系的大體操作思路和一個實際應用案例作了簡單介紹。誠然,針對不同的分級教學情況,構建出的體系也不可能是完全相同的,各個高校還是要根據自身的情況,吸取前人經驗,因地制宜,開發出適合自己學校情況的體系。

以筆者所在學校為例,哈爾濱理工大學自2014年秋季學期開始實施大學英語分級教學模式。其基本做法是按照一次分級考試后的成績排名,在各個學院內部,將學生分成A、B和C三個級別進行教學,在教學內容的深度和廣度上區分三個級別的教學。改革過去了一年多,現在各位教學者面臨的最大問題便是如何對學生學習成果進行評價,當前的做法是,期中和期末測試仍采用同一套試題,但適當加大平時分的比例(平時、期中和期末分數比例由1:1:3改為2:1:2),對不同級別的學生,采用不同的平時分計算方法,A級要求最高,B級次之,C級最低,以此來調整期中期末“一刀切”造成的不公平問題。但在實際操作中,教師在給平時分時表現出的主觀性又會對分數的可信度造成一定影響。所以在哈爾濱理工大學要建立的垂直量表體系主要是針對平時分部分的,讓原本可以人為決定的、較為主觀的分數量化成可以計算和衡量的客觀分數,是哈爾濱理工大學要解決的首要問題。

為實現公平性的原則,在大學英語分級測試中構建垂直量表體系是十分必要的,而具體的理論指導思想和前人經典案例又證明了這種做法的可行性。未來需要投入更多研究的部分一是各高校具體測評的方法,二是通過何種途徑,在英語教學領域培養出可以將心理測量學知識和大學英語教學緊密聯系起來的人才。

參考文獻:

[1]Dorans N J,Pommerich M,Holland P W.Linking and

Aligning Scores and Scales[Z].New York,U.S.:

Springer Verlag,2007:17.

[2]Davier A A v.Statistical Models for Test Equat-

ing,Scaling,and Linking[Z].New York,U.S.:Springer,

2011:22.

[3]教育部高等教育司.大學英語課程教學要求[Z].北京:

外語教學與研究出版社,2007:1.

[4]陳麗.垂直量表化對大學英語分級教學測評體系弊端的

解析[J].西安外國語大學學報,2014,(6).

[5]Kenyon D M,MacGregor D,Li D Y,Cook H.G.Issues

in vertical scaling of a K-12 English language

proficiency test[J].Language Testing, 2011,(3).

[6]黎光明,張敏強.IRT測驗等值流程化操作思路的構建

[J].中國考試,2012,(11).

猜你喜歡
大學英語
論朗讀在大學英語學習中的重要性
“慕課”背景下大學英語ESP課堂教學模式改革初探
翻轉課堂在大學英語教學中的應用研究
多元智能理論指導下的大學英語翻譯教學策略探討
大學英語教學中PBL教學模式的實施研究
論大學英語教學改革與實用翻譯人才的培養
大學英語創造性學習共同體模式建構案例研究
校園網絡背景下大學英語大班教學的缺陷探究
情感教學法在大學英語課堂教學中的應用
非英語專業《大學英語》課程中語音教學現狀與重要性簡析
91香蕉高清国产线观看免费-97夜夜澡人人爽人人喊a-99久久久无码国产精品9-国产亚洲日韩欧美综合