袁慧
(上海外國(guó)語(yǔ)大學(xué)研究生部上海200083;上海海洋大學(xué)外國(guó)語(yǔ)學(xué)院上海201306)
大學(xué)英語(yǔ)四級(jí)考試集庫(kù)式完形填空[1]的內(nèi)容效度研究
袁慧
(上海外國(guó)語(yǔ)大學(xué)研究生部上海200083;上海海洋大學(xué)外國(guó)語(yǔ)學(xué)院上海201306)
本文旨在研究大學(xué)英語(yǔ)四級(jí)考試集庫(kù)式完形填空的內(nèi)容效度,即探索它是否能測(cè)量被試在篇章層次上理解和運(yùn)用單詞的能力。被試為上海某高校438名非英語(yǔ)專業(yè)學(xué)生,研究工具為四個(gè)測(cè)驗(yàn)。其中兩篇測(cè)驗(yàn)(整A和整B)取自大學(xué)英語(yǔ)四級(jí)考試歷年真題。另外兩篇測(cè)驗(yàn)(散A和散B),分別改編自整A和整B。隨機(jī)抽取的高低兩個(gè)水平的被試,分別完成了一個(gè)整篇原文測(cè)驗(yàn)和一個(gè)散句改編測(cè)驗(yàn)。結(jié)果顯示,在整篇原文和散句改編測(cè)驗(yàn)中,高水平被試的成績(jī)并沒(méi)有體現(xiàn)顯著差異;低水平被試整篇和散句測(cè)驗(yàn)成績(jī)有顯著差異。研究表明,可通過(guò)提高考點(diǎn)層次、適當(dāng)增加選項(xiàng)的干擾性來(lái)提高大學(xué)英語(yǔ)四級(jí)集庫(kù)式完形填空的內(nèi)容效度。
大學(xué)英語(yǔ)四級(jí)考試 集庫(kù)式完形填空 內(nèi)容效度
2006年大學(xué)英語(yǔ)四級(jí)考試(以下簡(jiǎn)稱CET4)實(shí)行改革,在傳統(tǒng)的分題多項(xiàng)選擇式完形填空之外增加集庫(kù)式完形填空這一新題型,旨在“考核學(xué)生篇章語(yǔ)境中的詞匯理解和運(yùn)用能力”[1]。從2013年12月開(kāi)始,集庫(kù)式完形填空獨(dú)挑大梁,完全取消分題多項(xiàng)選擇式完形填空。對(duì)于集庫(kù)式完形填空的內(nèi)容效度,即在多大程度上能代表它所要測(cè)量的目標(biāo),尚未有充分的證據(jù)?;诖耍狙芯恐饕远康膶?shí)驗(yàn)方法探索該題型的內(nèi)容效度,力求為CET4改革提供更多參考依據(jù)。
已有的集庫(kù)式完形填空效度研究多涉及和其他類型的完形填空對(duì)比。有多種類型對(duì)比,如魏曉紅[2]、史君[3]、劉敬濤[4]對(duì)比集庫(kù)式和多項(xiàng)選擇式、開(kāi)放式完形填空的效度。前兩者的研究表明,集庫(kù)式完形填空和開(kāi)放式完形填空更為相關(guān),在一定程度上測(cè)試受試的閱讀能力;而且集庫(kù)式完形填空的難度和區(qū)分度達(dá)到三者里的最佳值。但劉敬濤的研究結(jié)果略有不同,集庫(kù)式完形填空的難度和區(qū)分度處在三類完形測(cè)試中間。
除了上述的多種類型對(duì)比,還有兩兩對(duì)比研究。何蓮珍[5]運(yùn)用相關(guān)矩陣,對(duì)比集庫(kù)式與分題選擇式完形填空,指出前者比后者在測(cè)量閱讀能力上有更高的效度。彭苗苗[6]對(duì)比CET4的多項(xiàng)選擇式和集庫(kù)式完形填空,也表明集庫(kù)式完形填空和閱讀理解能力更相關(guān),且難度更大、區(qū)分度更高。李麗[7]以25選20的集庫(kù)式完形填空為研究對(duì)象做了類似的研究,結(jié)果一致。
和上述研究不同,陳艷君[8][9]通過(guò)定量與定性相結(jié)合方法,對(duì)集庫(kù)式和分題選擇式完形填空進(jìn)行對(duì)比研究,同樣證明前者的難度和區(qū)分度都大于后者。然而,有聲思維研究結(jié)果顯示受試在答題過(guò)程中較多地使用句內(nèi)層面信息,跨句子語(yǔ)篇層面信息的運(yùn)用則相對(duì)較少。
不涉及對(duì)比,高曉瑩[10]和郭麗[11]的研究是專門(mén)針對(duì)集庫(kù)式完形填空。高曉瑩的研究是唯一運(yùn)用內(nèi)省法和即刻追述法的研究,分析了12名非英語(yǔ)專業(yè)學(xué)生解答該題型的心理過(guò)程。其研究表明閱讀水平高的受試在答題過(guò)程中似乎更偏重對(duì)篇章的理解,而閱讀水平低的受試更依賴于對(duì)單詞的理解。郭麗的研究探索了CET4集庫(kù)式完形填空的內(nèi)容效度,結(jié)果顯示:對(duì)于敘述型文章的完型填空,句與句之間的信息發(fā)揮了較為顯著作用,而高水平組受試最有效地利用了這種篇章層次的線索;而在另一篇百科全書(shū)式文章的測(cè)驗(yàn)中,句子之上的線索沒(méi)有發(fā)揮顯著效應(yīng)。兩項(xiàng)研究表明,被試的水平以及篇章的類型對(duì)被試是否運(yùn)用篇章層次之上的信息有影響。
綜上所述,目前對(duì)集庫(kù)式完形填空的研究多涉及到和其他形式完形填空的對(duì)比,專門(mén)針對(duì)CET4集庫(kù)式完形填空的效度研究并不多。在對(duì)比研究中,集庫(kù)式完形填空多體現(xiàn)出了較高的效度和區(qū)分度,能較好地測(cè)量出被試的綜合能力。但在單獨(dú)針對(duì)CET4集庫(kù)式完形填空的研究中,集庫(kù)式完形填空并沒(méi)有體現(xiàn)較好的內(nèi)容效度。因此,有必要對(duì)集庫(kù)式完形填空的效度開(kāi)展進(jìn)一步研究。
(一)研究問(wèn)題
本研究主要回答以下兩個(gè)問(wèn)題:(1)集庫(kù)式完形填空是否能測(cè)量受試在篇章層次上理解與運(yùn)用詞匯的能力?(2)不同英語(yǔ)水平的受試在篇章層次上理解與運(yùn)用詞匯的能力是否有區(qū)別?
(二)研究對(duì)象
受試為上海某高校2013級(jí)438名新生,分高低兩個(gè)水平,各兩個(gè)班級(jí),共四個(gè)班級(jí)參加本實(shí)驗(yàn)。
(三)實(shí)驗(yàn)工具
研究工具為四個(gè)測(cè)驗(yàn)。其中兩個(gè)集庫(kù)式完形填空測(cè)驗(yàn),選自2009年6月和2010年12月CET4,分別是原文整篇測(cè)驗(yàn)A(以下簡(jiǎn)稱“整A”)和原文整篇測(cè)驗(yàn)B(以下簡(jiǎn)稱“整B”)。整A有260個(gè)單詞,共15句,它陳述了一名教師的教學(xué)想法。整B有236個(gè)單詞,共13句,主要闡述基因是人類很多特性的基礎(chǔ)。
表1:整A和整B考察點(diǎn)比較
從以上的考點(diǎn)分析,可以看出整A和整B基本一致。
另外兩篇測(cè)驗(yàn)分別改編自整A和整B。把整A切分成單獨(dú)句子,再剔除5句不包含題項(xiàng)的句子,然后將句子順序打亂,形成了新的測(cè)驗(yàn)——散句測(cè)驗(yàn)A(以下簡(jiǎn)稱“散A”),由10個(gè)獨(dú)立句子組成,分別編號(hào)。以同樣方法形成散句測(cè)驗(yàn)B(以下簡(jiǎn)稱“散B”)。在供選擇的15個(gè)單詞上,整A和散A,整B和散B是一致的,同樣以字母順序排列,以相同的方式在一個(gè)方框中給出。而且,這四套卷子的題目和詞庫(kù)都在同一頁(yè)打開(kāi),方便測(cè)試對(duì)象。因此整A和散A的區(qū)別在于,前者中的句子是在正常的語(yǔ)篇中出現(xiàn)的,是按原來(lái)的自然順序排列的,而散A中句子的自然順序被完全打亂。整B和散B的區(qū)別與整A和散A的區(qū)別一樣。評(píng)分方法是采用唯一選擇法(only word method)。如果被試在整篇和散句的情況下,成績(jī)沒(méi)有顯著差異,則說(shuō)明整篇的上下文語(yǔ)境對(duì)被試沒(méi)有幫助。
整A和整B兩套試題的難度對(duì)比通過(guò)測(cè)試另外不參加本研究的學(xué)生完成。141名學(xué)生同時(shí)做了整A和整B,配對(duì)樣本T檢驗(yàn)結(jié)果表明二者難度不存在顯著性差異(t=-0.032,P>0.05)。另外56名學(xué)生同時(shí)做了散A和散B,配對(duì)樣本T檢驗(yàn)的結(jié)果表明二者難度也不存在顯著性差異(t=-0.336,P>0.05)。
(四)數(shù)據(jù)收集與分析
1)對(duì)隨機(jī)抽取的高低水平共4個(gè)班級(jí)學(xué)生的入學(xué)考試成績(jī)分別進(jìn)行獨(dú)立樣本T檢驗(yàn),結(jié)果顯示高水平的兩個(gè)班級(jí)之間在語(yǔ)言水平上不存在差異,低水平的兩個(gè)班級(jí)之間的語(yǔ)言水平也不存在差異。這樣排除了測(cè)試對(duì)象在水平能力上的差異,如果實(shí)驗(yàn)結(jié)果有差異,那也就是試題上的差異,也就是完形填空上的差異。
2)在同一個(gè)時(shí)間段,低水平班級(jí)1(簡(jiǎn)稱L1)在課堂上做整A和散B兩篇試題,低水平班級(jí)2(簡(jiǎn)稱L2)做散A和整B兩篇試題。高水平班級(jí)2(簡(jiǎn)稱H1)在課堂上做整A和散B兩篇試題,高水平班級(jí)2(簡(jiǎn)稱H2)在課堂上做散A和整B兩篇試題。每篇試題的做題時(shí)間嚴(yán)格控制在10分鐘之內(nèi)。測(cè)試之前,為了降低學(xué)生的焦慮感,告訴學(xué)生測(cè)試的分?jǐn)?shù)不計(jì)入課程成績(jī)。回收試卷的有效份數(shù)即參加本研究的人數(shù)如表2所示。
3)四套試題分別有10個(gè)空,每個(gè)空1分。據(jù)此評(píng)分標(biāo)準(zhǔn)得出的成績(jī)結(jié)果被輸入SPSS 17.0中,用獨(dú)立樣本T檢驗(yàn)來(lái)檢驗(yàn)整A和散A的成績(jī),整B和散B的成績(jī)是否存在顯著差異。
表2:總體情況列表
(一)低水平兩個(gè)班級(jí)整A和散A成績(jī)對(duì)比結(jié)果
表3:低水平兩個(gè)班級(jí)整A和散A成績(jī)獨(dú)立樣本T檢驗(yàn)結(jié)果如下所示
檢驗(yàn)結(jié)果顯示,低水平學(xué)生的整A和散A的成績(jī)存在顯著性差異(t=-2.942,df=207,P<0.05)。低水平學(xué)生的散A的成績(jī)明顯好于整A的成績(jī)。從兩者的標(biāo)準(zhǔn)差來(lái)看,整A的標(biāo)準(zhǔn)差高于散A的標(biāo)準(zhǔn)差,說(shuō)明整A的區(qū)分度高于散A。
(二)低水平兩個(gè)班級(jí)整B和散B成績(jī)對(duì)比結(jié)果
表4:低水平整B和散B成績(jī)獨(dú)立樣本T檢驗(yàn)結(jié)果如下所示
檢驗(yàn)結(jié)果顯示,低水平學(xué)生的整B和散B的成績(jī)存在顯著性差異(t=-5.690,df=207,P<0.05)。低水平學(xué)生的整B的成績(jī)明顯好于散B的成績(jī)。從兩者的標(biāo)準(zhǔn)差來(lái)看,整B的標(biāo)準(zhǔn)差略高于散B的標(biāo)準(zhǔn)差,說(shuō)明整B的區(qū)分度略高于散B。
(三)高水平兩個(gè)班級(jí)整A和散A成績(jī)對(duì)比結(jié)果
表5:高水平整A和散A成績(jī)獨(dú)立樣本T檢驗(yàn)結(jié)果如下所示
檢驗(yàn)的結(jié)果顯示,高水平被試的整A和散A的成績(jī)不存在顯著性差異(t=1.924,df=227,P〉0.05)。從兩者的標(biāo)準(zhǔn)差來(lái)看,整A的標(biāo)準(zhǔn)差略低于散A的標(biāo)準(zhǔn)差,這說(shuō)明對(duì)于高水平的英語(yǔ)學(xué)習(xí)者來(lái)說(shuō),集庫(kù)式完形填空的區(qū)分度并不是很好。整A和散A的成績(jī)沒(méi)有顯著區(qū)別,說(shuō)明篇章線索并不起作用。
(四)高水平兩個(gè)班級(jí)整B和散B成績(jī)對(duì)比結(jié)果
表6:高水平整B和散B成績(jī)獨(dú)立樣本T檢驗(yàn)結(jié)果如下所示
檢驗(yàn)的結(jié)果顯示,高水平被試的整B和散B的成績(jī)不存在顯著性差異(t=-.826,df=227,P〉0.05)。從兩者的標(biāo)準(zhǔn)差來(lái)看,整B的標(biāo)準(zhǔn)差略高于散B標(biāo)準(zhǔn)差。這樣的結(jié)果,也讓我們質(zhì)疑CET4集庫(kù)式完形填空的效度,是否真正地檢測(cè)到被試在篇章中理解和運(yùn)用詞匯的能力。
對(duì)于整A和散A的測(cè)驗(yàn)成績(jī)來(lái)說(shuō),低水平的被試在散句測(cè)驗(yàn)的情況下,反而成績(jī)優(yōu)于在有上下文語(yǔ)境測(cè)驗(yàn)的情況。這說(shuō)明對(duì)于A測(cè)驗(yàn),低水平被試不需要利用上下文的線索,同樣能解出答案,甚至于做得更好。高水平被試做兩種形式的A測(cè)驗(yàn),成績(jī)并無(wú)顯著差異。綜合兩種情況,可以解釋為被試在做A測(cè)驗(yàn)的過(guò)程中并不需要篇章之內(nèi)、句子層次之上的信息。如果被試沒(méi)有運(yùn)用篇章之內(nèi)、句子層次之上的信息,那么集庫(kù)式完形填空僅僅測(cè)試了學(xué)生詞匯層面的能力。
對(duì)于整B和散B的測(cè)驗(yàn)成績(jī)來(lái)說(shuō),高水平被試做兩種形式的B測(cè)驗(yàn),成績(jī)也并無(wú)顯著差異。但低水平被試在有上下文語(yǔ)境的整B測(cè)試中,成績(jī)明顯優(yōu)于做散B的情況,這和做A類型的測(cè)試情況不一致。在測(cè)試結(jié)束三天之后?,筆者隨機(jī)抽取了低水平10名學(xué)生進(jìn)行訪談,追述答題整A和整B過(guò)程。下面是其中一位受訪者追述答題整B的片段:
“……到最后兩題咯。嗯,我對(duì)eventually和essentially吃不準(zhǔn),詞義我都懂。一個(gè)是‘最終,最后’的意思,另外一個(gè)是‘實(shí)際上,本質(zhì)上’的意思,……好像放進(jìn)去都對(duì),可以說(shuō)‘人最后像一張未……的相片’,也可以說(shuō)‘人本來(lái)就像一張未……的相片’?!?,反正一開(kāi)始瞎選擇啦。后來(lái),反復(fù)看上下文,還是發(fā)現(xiàn)應(yīng)該是‘人本來(lái)就像一張未……的相片’……”
對(duì)比了整A和整B的兩篇文章,二者都考察了3道句外語(yǔ)境推斷題(如表1)。但整A設(shè)置干擾選項(xiàng)的迷惑性明顯不及整B。例如,整A第三道題選項(xiàng)especially的干擾項(xiàng)remarkably和daily,明顯不及整B中的eventually和essentially的相似性帶來(lái)的混淆大。這就解釋上述的受訪者在回憶整B答題過(guò)程中的困惑,由此相應(yīng)地解釋了低水平被試整B成績(jī)好于散B,但散A成績(jī)好于整A。
而且,數(shù)據(jù)結(jié)果顯示對(duì)于低水平被試來(lái)說(shuō),整B的平均分6.1917(見(jiàn)表4)高于整A的平均分5.27(見(jiàn)表3)。同樣地,整B的區(qū)分度2.63236(見(jiàn)表4),也高于整A的區(qū)分度2.270(見(jiàn)表3)。這說(shuō)明,如果干擾項(xiàng)設(shè)置恰當(dāng),不僅能夠“考核學(xué)生篇章語(yǔ)境中的詞匯理解和運(yùn)用能力”。
另外一方面,高水平被試在整篇和散句的成績(jī)對(duì)比中,均無(wú)顯著差異。這也可以從對(duì)高水平學(xué)生的隨機(jī)訪談結(jié)果中得到解釋。下面是一位被試回憶作答整A的片段:
“……在整A的作答中,大多數(shù)情況下,我都是根據(jù)語(yǔ)法,還有詞匯知識(shí)作答?!璭specially這道題,讀起來(lái)很順,自然而然就選了它?……。下面一個(gè)題目,不是元音開(kāi)頭的形容詞都可以全部排除啊。剩下就是emotional和enormous,很明顯單詞mansion前面就只能選擇enormous啦,沒(méi)別的選擇啦?!?/p>
訪談的結(jié)果顯示,高水平被試即使是在整篇的情況下,也大多通過(guò)句內(nèi)信息作答。因此整篇測(cè)驗(yàn)和散句測(cè)驗(yàn)的兩種形式的作答對(duì)他們的答題成績(jī)沒(méi)有影響。
本研究通過(guò)改變?cè)囶}形式,研究集庫(kù)式完形填空的內(nèi)容效度。結(jié)果表明:對(duì)于較高水平被試來(lái)說(shuō),篇章信息不起作用;對(duì)于較低水平被試來(lái)說(shuō),如果設(shè)置的選項(xiàng)干擾性強(qiáng),篇章信息對(duì)成績(jī)有顯著影響。以上的實(shí)驗(yàn)說(shuō)明CET4集庫(kù)式完形填空的內(nèi)容效度還有待于進(jìn)一步提高
未來(lái)的改革中,CET4集庫(kù)式完形填空測(cè)試可考慮適當(dāng)?shù)靥岣呖键c(diǎn)層次,“語(yǔ)篇層次考點(diǎn)的題目,顯然比單詞層次更能測(cè)試出測(cè)試對(duì)象運(yùn)用語(yǔ)言的真正能力。層次越高,意味著考點(diǎn)的效度越高”?[12]。設(shè)置更有迷惑性的干擾項(xiàng)放入詞庫(kù)中供被試選擇,避免被試?yán)谜Z(yǔ)感、猜測(cè)、排除等應(yīng)試技巧。
未來(lái)研究中還需要考查其它變量(如刪詞方式、文本難度等)對(duì)集庫(kù)式完形填空效度的影響。另外,完形填空是一個(gè)復(fù)雜的心理過(guò)程,涉及到一系列的認(rèn)知活動(dòng)。本研究的訪談在測(cè)試三天之后開(kāi)展,有自身的局限性??煽紤]用有聲思維或即刻追述法對(duì)受試答題的心理過(guò)程進(jìn)行定性研究。從而為提高集庫(kù)式完形填空的效度,提供更多真實(shí)的證據(jù)。
[1]全國(guó)大學(xué)英語(yǔ)四、六級(jí)考試委員會(huì).大學(xué)英語(yǔ)四級(jí)考試大綱(2006年修訂版)[M].北京:高等教育出版社,2007.
[2]魏曉紅.多項(xiàng)選擇與開(kāi)放式完形填空的效度對(duì)比研究[D].成都:西南交通大學(xué)碩士學(xué)位論文,2004.
[3]史君.英語(yǔ)閱讀測(cè)試三種完形填空題型的對(duì)比研究[D].清華大學(xué)碩士學(xué)位論文,2005.
[4]劉敬濤.三種完形填空測(cè)量能力的對(duì)比研究[D].北京:首都師范大學(xué)碩士學(xué)位論文,2009.
[5][12]何蓮珍.分題選擇完型填空與集庫(kù)式完型填空的對(duì)比試驗(yàn)[J].浙江大學(xué)學(xué)報(bào),1999(6):97-102.
[6]彭苗苗.英語(yǔ)四級(jí)考試中集庫(kù)式完形填空與選擇式完形填空的效度研究[D].東北師范大學(xué)碩士學(xué)位論文.2009.
[7]李麗.大學(xué)英語(yǔ)測(cè)試中兩種完形填空的效度對(duì)比研究[D].西北大學(xué)碩士學(xué)位論文,2012.
[8]陳艷君.基于答題過(guò)程的分析——集庫(kù)型完形填空與分題選擇型完形填空的對(duì)比研究[D].廣東:廣東外語(yǔ)外貿(mào)大學(xué)碩士學(xué)位論文,2008.
[9]陳艷君.完形填空測(cè)量能力的效度驗(yàn)證——基于答題過(guò)程的分析[J].考試研究,2009(1):79-93.
[10]高曉瑩.集庫(kù)式完型填空答題過(guò)程的內(nèi)省法研究[D].重慶:重慶大學(xué)碩士學(xué)位論文,2008
[11]郭麗.集庫(kù)式完型填空效度研究[J].中國(guó)外語(yǔ),2010,7(4):70-76.
[1]在《大學(xué)英語(yǔ)四級(jí)考試大綱(2006修訂版)》中,集庫(kù)式完形填空被稱為“選詞填空”。但在目前的研究中,該類型的完形填空多被稱為集庫(kù)式完形填空,因此本文沿用此種名稱。
H319
A
1009-8534(2014)05-0124-03
2014-08-25
袁慧,女,上海外國(guó)語(yǔ)大學(xué)博士研究生,上海海洋大學(xué)外國(guó)語(yǔ)學(xué)院教師。