摘要:通過實(shí)施四級(jí)機(jī)考與四級(jí)筆試的對(duì)比實(shí)驗(yàn),對(duì)大學(xué)英語四級(jí)機(jī)試的效度進(jìn)行了實(shí)證性的論證,并通過幾所高校進(jìn)行的問卷調(diào)查驗(yàn)證了四級(jí)機(jī)試的反撥效應(yīng)。研究證明四級(jí)機(jī)助考試是一項(xiàng)效度較高的語言測(cè)試,并對(duì)語言教學(xué)產(chǎn)生了積極的反撥作用。
關(guān)鍵詞:四級(jí)改革;機(jī)試;效度
一、研究背景
為順應(yīng)我國近幾年的大學(xué)英語教學(xué)改革進(jìn)程,教育部2007年頒布了大學(xué)英語四、六級(jí)網(wǎng)考作為“高等學(xué)校本科教學(xué)質(zhì)量與教學(xué)改革”項(xiàng)目之一,網(wǎng)考總體目標(biāo)是建立“以試卷為基礎(chǔ)的計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng),盡可能在適當(dāng)時(shí)間、適當(dāng)?shù)攸c(diǎn)為考生提供以聽力測(cè)試為主包含讀寫譯測(cè)試在內(nèi)、重點(diǎn)考查英語學(xué)習(xí)可持續(xù)發(fā)展能力的計(jì)算機(jī)試測(cè)試”(張堯?qū)W 2008)。與傳統(tǒng)紙筆測(cè)試的試卷結(jié)構(gòu)相比,網(wǎng)考加大了聽力在考試中的比例,與聽力相關(guān)的考試內(nèi)容和時(shí)間約占整個(gè)考試的70%,并選用了視頻作為聽力材料,改變了過去單一音頻聽力測(cè)試形式。聽力測(cè)試題型除傳統(tǒng)的多項(xiàng)選擇題外,還包括聽寫、句子跟讀和基于視頻的寫作等綜合性產(chǎn)出試題,并將口語和寫作測(cè)試也融入視聽測(cè)試中。
近年來,語言測(cè)試界的國內(nèi)學(xué)者對(duì)于四級(jí)機(jī)試的測(cè)試效度進(jìn)行了多方面的理論論證,但在效度研究上的實(shí)證研究尚未多見。鑒于大學(xué)英語四級(jí)作為超大規(guī)模的標(biāo)準(zhǔn)化英語測(cè)試在國內(nèi)的影響,本研究將對(duì)四級(jí)機(jī)試效度進(jìn)行實(shí)證性驗(yàn)證。
二、研究設(shè)計(jì)
此次研究的參與對(duì)象為湖南省某高校二年級(jí)本科生,考生抽樣數(shù)量共為85名。實(shí)驗(yàn)參與對(duì)象于2008年12月底先后參加了四級(jí)筆試及機(jī)試考試,考生考前被告知取兩次考試成績(jī)較高者為最終成績(jī),有效減輕了考生的心理壓力。兩次測(cè)試于前后兩天實(shí)施,保證了測(cè)試對(duì)象語言能力的同質(zhì)性。機(jī)試完畢后,馬上對(duì)考生實(shí)施了問卷調(diào)查。
在考試完畢后,筆者對(duì)本省具有四級(jí)機(jī)試試驗(yàn)點(diǎn)的五大本科院校師生也實(shí)施了問卷調(diào)查,共回收有效問卷教師71份,學(xué)生305份,問卷形式以多項(xiàng)選擇題為主,少量為開放式問題。本實(shí)驗(yàn)旨在回答以下研究問題:四級(jí)機(jī)試的測(cè)試效度如何?筆試與機(jī)試兩種測(cè)試形式,是否對(duì)測(cè)試結(jié)果產(chǎn)生顯著影響?機(jī)試對(duì)語言教學(xué)與學(xué)習(xí)產(chǎn)生了哪些反撥作用?
三、數(shù)據(jù)分析及結(jié)果
1.機(jī)試與教師評(píng)價(jià)的相關(guān)分析
參加機(jī)試的本科二年級(jí)3個(gè)班級(jí)的任課教師都連續(xù)教授參加本實(shí)驗(yàn)的考生至少兩個(gè)學(xué)期,對(duì)其英語能力較了解。在四級(jí)考前這3名任課教師完成了有關(guān)四級(jí)機(jī)試的問卷調(diào)查。問卷結(jié)果顯示,將考生的測(cè)試成績(jī)以425分為設(shè)定及格線,在綜合評(píng)估考生英語綜合應(yīng)用能力基礎(chǔ)上,任課教師對(duì)學(xué)生英語水平是否合格的判斷與機(jī)試結(jié)果的相關(guān)達(dá)到了0.628,與筆試考試結(jié)果的相關(guān)達(dá)到了0.684,均為高水平的顯著相關(guān),說明四級(jí)機(jī)試能比較準(zhǔn)確地評(píng)估學(xué)生語言水平。
2.測(cè)試結(jié)果
筆試與機(jī)試,不同的測(cè)試形式是否對(duì)考生能力估計(jì)產(chǎn)生顯著影響,是許多考生、教師及研究者關(guān)注的問題,特別是現(xiàn)在很多高校將大學(xué)英語四級(jí)考試證書與學(xué)生畢業(yè)證書相聯(lián)系,因此本研究以下來驗(yàn)證兩種測(cè)試對(duì)測(cè)試結(jié)果的影響。
分析結(jié)果顯示四級(jí)筆試與機(jī)試結(jié)果有較高相關(guān),兩次測(cè)試結(jié)果具有較高的一致性;t檢驗(yàn)結(jié)果顯示兩次測(cè)試的總分在統(tǒng)計(jì)上沒有顯著性差異(p>.050),說明考生無論是參加機(jī)試還是筆試,兩種測(cè)試對(duì)受試的語言能力的測(cè)評(píng)結(jié)果沒有顯著性差別。
但不同語言水平的考生是否因測(cè)試形式不同,測(cè)試結(jié)果因此受到不同影響,需要進(jìn)一步驗(yàn)證。我們將筆試成績(jī)作為效標(biāo),以425分為分級(jí)點(diǎn),將考生分為高分組(49人)和低分組(36人),驗(yàn)證高分組與低分組考生的筆試與機(jī)試成績(jī)是否存在統(tǒng)計(jì)學(xué)差異。
首先,低分組、高分組考生的機(jī)試與筆試成績(jī)均存在顯著的正相關(guān)關(guān)系(p<.05);表3說明低分組的機(jī)試與筆試成績(jī)存在顯著性差異(p<.05),且機(jī)試分?jǐn)?shù)顯著高于筆試總分;而高分組的機(jī)試與筆試成績(jī)無統(tǒng)計(jì)上的顯著差異(p>.05),說明對(duì)于語言水平較高的考生,無論是參加機(jī)試還是筆試,兩種測(cè)試對(duì)受試的語言能力的測(cè)評(píng)結(jié)果沒有顯著性差別。
對(duì)于低分組考生機(jī)試分?jǐn)?shù)顯著高于筆試總分,本研究認(rèn)為可從以下方面解釋:低分組樣本過小(n=36),抽樣上的誤差有可能造成統(tǒng)計(jì)結(jié)果的誤差;機(jī)試提高了語言測(cè)試任務(wù)的真實(shí)性及多樣性,使其更接近于真實(shí)世界的任務(wù),因紙筆測(cè)試方式無法測(cè)量的語言次能力,從而使得機(jī)試對(duì)于語言能力的區(qū)分更加準(zhǔn)確,能對(duì)低分群體的語言能力進(jìn)行更準(zhǔn)確的測(cè)量。
3.問卷調(diào)查
反撥效應(yīng)是收集效度證據(jù)的重要方面(Weir,2005),我們通過問卷調(diào)查了解機(jī)試測(cè)試對(duì)語言教學(xué)與學(xué)習(xí)產(chǎn)生了哪些反撥作用,是否促進(jìn)了語言教學(xué)的改進(jìn)和學(xué)生語言能力的提高。問卷調(diào)查的結(jié)果經(jīng)統(tǒng)計(jì)分析后,將問卷部分調(diào)查結(jié)果列表如下:
問卷調(diào)查還顯示,半數(shù)以上考生反映對(duì)CET-4機(jī)試不太適應(yīng),有緊張心理(52.8%),導(dǎo)致其緊張的主要因素是聽力比例加重(62.3%),跟讀題型的增加(45.6%),電腦上讀、做題不習(xí)慣(37%)。因此,相對(duì)于筆試考生普遍認(rèn)為機(jī)試整體難度偏難(67.9%),且機(jī)試對(duì)他們沒有利(42.6%)。盡管如此,教師及考生大多數(shù)認(rèn)為機(jī)試內(nèi)容設(shè)計(jì)合理,能反映學(xué)生的實(shí)際英語水平,促進(jìn)學(xué)生語言交際能力的提高,因此對(duì)于機(jī)試改革持支持態(tài)度。
在對(duì)機(jī)試各測(cè)試部分效度的調(diào)查中,大多數(shù)教師及考生認(rèn)為機(jī)試的整體效度比較好,并且對(duì)各分項(xiàng)目效度的評(píng)價(jià)排序也很一致,相對(duì)來說,聽力/視頻被認(rèn)可的效度最高,而語法結(jié)構(gòu)題型的效度不太理想。此外,經(jīng)綜合考生在問卷中就四級(jí)機(jī)試的意見及建議主要概括如下:(1)機(jī)試的難度應(yīng)適當(dāng)降低;(2)減少語法結(jié)構(gòu)的測(cè)試;(3)聽力/視頻的語速應(yīng)稍減慢,短文過長;(4)短句跟讀的句子過長,錄音時(shí)間稍短;(5)降低口語考試分?jǐn)?shù)線。
四、討論及結(jié)語
本文通過大學(xué)英語四級(jí)機(jī)試與筆試對(duì)比試驗(yàn),對(duì)四級(jí)機(jī)試效度進(jìn)行了實(shí)證性的驗(yàn)證?;谝陨戏治?,本研究發(fā)現(xiàn),以筆試作為外在效標(biāo),機(jī)試總分成績(jī)與筆試成績(jī)無統(tǒng)計(jì)上的顯著差異,且兩者間的相關(guān)度較高,測(cè)試結(jié)果一致性較高,說明測(cè)試形式的改革不會(huì)對(duì)考生成績(jī)產(chǎn)生顯著影響。問卷調(diào)查結(jié)果發(fā)現(xiàn),教師對(duì)考生英語水平評(píng)估與機(jī)試測(cè)試結(jié)果相關(guān)較高,說明四級(jí)機(jī)試能較準(zhǔn)確地評(píng)估學(xué)生語言水平;教師及考生普遍認(rèn)為CET-4機(jī)試設(shè)計(jì)合理,新的測(cè)試對(duì)考生聽說綜合應(yīng)用能力的考察,將通過反撥促進(jìn)學(xué)生語言交際能力的提高。
測(cè)試要保持其生命力,就需不斷改革與完善,不僅要跟上語言學(xué)和語言教學(xué)新思想的發(fā)展,而且還要跟上時(shí)代的發(fā)展?;诰W(wǎng)絡(luò)和多媒體技術(shù)的機(jī)試是測(cè)試發(fā)展的必然趨勢(shì),四、六級(jí)機(jī)試順應(yīng)了這一發(fā)展趨勢(shì)。
參考文獻(xiàn):
?。?] Weir C J.Language Testing and Validation[M].Palgrave:Macmillan,2005.
[2] 張堯?qū)W.關(guān)于大學(xué)英語四、六級(jí)考試改革的總體思路[J].外語界,2008,(5):2-4.