楊繼龍 張孝香
效度作為測(cè)試學(xué)領(lǐng)域的專門(mén)術(shù)語(yǔ),指一項(xiàng)測(cè)試能測(cè)出預(yù)定要測(cè)量?jī)?nèi)容的程度,或能夠引起預(yù)報(bào)作用的程度。測(cè)試的效度可以用多個(gè)不同的統(tǒng)計(jì)方法來(lái)估計(jì)。語(yǔ)言測(cè)試的效度是指測(cè)試作為測(cè)量手段,測(cè)量出想測(cè)量的語(yǔ)言學(xué)習(xí)者語(yǔ)言能力的程度和水平。Bachman將語(yǔ)言測(cè)試的效度分為以下幾種類型: 1.內(nèi)容效度(content validity),其高低根據(jù)測(cè)試所包含的具體內(nèi)容來(lái)確定。設(shè)計(jì)測(cè)試的內(nèi)容之前必須首先思考測(cè)量的目的,然后確定具體的測(cè)試內(nèi)容。2.結(jié)構(gòu)效度(construct validity),其高低根據(jù)測(cè)試項(xiàng)目及其所反映的理論關(guān)系決定。比如,交際能力測(cè)試和交際能力理論的關(guān)系越大,測(cè)試的結(jié)構(gòu)效度就越高。3.標(biāo)準(zhǔn)關(guān)聯(lián)效度(criterion-related validity),其高低源于某一測(cè)試在反映學(xué)習(xí)者水平方面與其他外在評(píng)估標(biāo)準(zhǔn)的一致性程度上。例如,學(xué)習(xí)者在某項(xiàng)測(cè)試的表現(xiàn)與其在有關(guān)這項(xiàng)語(yǔ)言能力評(píng)估中表現(xiàn)的水平應(yīng)保持一致。4.預(yù)測(cè)效度(predictive validity),其高低根據(jù)測(cè)試能否準(zhǔn)確地預(yù)測(cè)學(xué)習(xí)者將來(lái)的學(xué)習(xí)成績(jī)而定。某一單項(xiàng)語(yǔ)言測(cè)試應(yīng)該能夠預(yù)測(cè)學(xué)習(xí)者在這一語(yǔ)言能力方面的水平。5.卷面效度(face validity),指測(cè)試中根據(jù)觀察者的主觀判斷,測(cè)試達(dá)到預(yù)先設(shè)想的衡量知識(shí)或能力的程度。對(duì)語(yǔ)言測(cè)試的效度進(jìn)行類型劃分,將效度這樣一個(gè)抽象的專業(yè)術(shù)語(yǔ)具體化,便于在語(yǔ)言測(cè)試的設(shè)計(jì)及評(píng)價(jià)過(guò)程中更多地追求具體的有關(guān)效度的指標(biāo),便于在語(yǔ)言測(cè)試的研究領(lǐng)域?qū)Σ煌愋偷男Ф日归_(kāi)探索和研究,便于通過(guò)實(shí)踐操作提高語(yǔ)言測(cè)試的效度。本文擬以湖北省2007年高考英語(yǔ)中的閱讀理解試題為例,以對(duì)其進(jìn)行統(tǒng)計(jì)的數(shù)據(jù)為基礎(chǔ),從卷面效度的視角,分析其測(cè)試效度存在的問(wèn)題,并提出改進(jìn)意見(jiàn)。
一、2007年湖北高考英語(yǔ)卷閱讀理解試題相關(guān)數(shù)據(jù)統(tǒng)計(jì)
(一)閱讀理解題選材分析。
(二)閱讀理解題考點(diǎn)覆蓋情況。
二、2007年湖北高考英語(yǔ)卷閱讀理解試題卷面效度存在的問(wèn)題
(一)文段過(guò)長(zhǎng)。
2007年湖北高考英語(yǔ)閱讀理解試題的篇幅過(guò)長(zhǎng),有一篇竟然接近600個(gè)單詞,整個(gè)大題的英文詞數(shù)達(dá)到2551個(gè),以2007年高考英語(yǔ)考試大綱中對(duì)閱讀理解規(guī)定的參考時(shí)間35分鐘來(lái)計(jì)算,要求考生的閱讀速度接近73w/pm,相對(duì)于全國(guó)其它自主命題的省份,這個(gè)速度要求比較高。
(二)體裁、題材重復(fù)。
C、D的題材都是有關(guān)心理的,C篇是有關(guān)兒童害怕心理的文章,D篇是有關(guān)影響人們幸福因素的文章,這兩篇相同題材的文章,會(huì)使考生感到枯燥。再者,高考考生對(duì)心理方面的知識(shí)接觸不是很多,接連考了兩篇有關(guān)心理的文章,其效度肯定會(huì)降低。B、C、D三篇在體裁上都是說(shuō)明文,所以題材和體裁上都出現(xiàn)了重復(fù)。
(三)表層理解的考題有余,深層理解的考題不足。
考查細(xì)節(jié)理解的題目太多,考查作者的意圖、態(tài)度等深層理解能力的題目較少。從表2中我們不難看出,考查對(duì)文章細(xì)節(jié)的理解的題目達(dá)到11個(gè)之多。2007年高考英語(yǔ)考試大綱對(duì)閱讀的要求是這樣描述的:“……閱讀,要求考生讀懂熟悉的有關(guān)日常生活話題的簡(jiǎn)短文字材料,例如公告、說(shuō)明、廣告及書(shū)、報(bào)、雜志中關(guān)于一般性話題的簡(jiǎn)短文章??忌鷳?yīng)能:(1)理解主旨要義;(2)理解文中具體信息;(3)根據(jù)上下文推斷生詞的詞義;(4)作出簡(jiǎn)單判斷和推理;(5)理解文章的基本結(jié)構(gòu);(6)理解作者的意圖和態(tài)度。”可見(jiàn),2007年湖北高考英語(yǔ)試題閱讀理解并未涉及對(duì)文章結(jié)構(gòu)的理解,而且出題者對(duì)考生的六項(xiàng)閱讀理解能力的要求也沒(méi)有分出孰輕孰重。
(四)閱讀材料呈現(xiàn)的方式、閱讀理解題目的題型單一。
閱讀材料單純以文字來(lái)描述、呈現(xiàn),缺乏圖畫(huà)、圖表等呈現(xiàn)方式。閱讀題型全都是四選一的多項(xiàng)選擇題,沒(méi)有簡(jiǎn)答、綜述等效度比較高的題型,而且與生活聯(lián)系不太緊,對(duì)于公告、說(shuō)明、廣告等與生活聯(lián)系緊密的材料均為涉及,實(shí)屬遺憾。
三、對(duì)提高卷面效度的思考
通過(guò)分析2007年湖北省高考英語(yǔ)閱讀理解題可知其命題存在一些問(wèn)題,其主要原因在于:1.質(zhì)量專業(yè)標(biāo)準(zhǔn)與監(jiān)督機(jī)制沒(méi)有建立。在制定和實(shí)施分省命題政策的同時(shí),沒(méi)有建立起分省命題的質(zhì)量專業(yè)標(biāo)準(zhǔn),也沒(méi)有形成有效的試題質(zhì)量監(jiān)督機(jī)制。2.達(dá)到專業(yè)水準(zhǔn)的試題命題者數(shù)量不足。分省命題政策總體上比較倉(cāng)促,各省沒(méi)有足夠時(shí)間尋找或培養(yǎng)出足夠數(shù)量的有專業(yè)水準(zhǔn)的試題命題人,一些省市往往是倉(cāng)促形成命題小組,有些大學(xué)英語(yǔ)教授本人并沒(méi)有接受過(guò)試題命制的專業(yè)訓(xùn)練,有些大學(xué)教授對(duì)新課程理念不是很熟悉。這樣的試題命題人往往只能憑借自己的經(jīng)驗(yàn)來(lái)命題,難以依據(jù)科學(xué)的語(yǔ)言測(cè)試?yán)碚撁}。據(jù)此,筆者從宏觀和微觀兩個(gè)層面對(duì)提高英語(yǔ)閱讀理解測(cè)試效度提出以下建議:
(一)盡快建立試題質(zhì)量專業(yè)標(biāo)準(zhǔn)和監(jiān)督機(jī)制。
在建立分省命題制度的同時(shí),應(yīng)該建立各科試題質(zhì)量專業(yè)標(biāo)準(zhǔn),建立起試題質(zhì)量的監(jiān)督機(jī)制(即使是事后監(jiān)督,也可以起到一定的作用),保證各省市命制的試題達(dá)到幾乎同樣的水平,從而保證試題質(zhì)量,確保其效度。
(二)廣泛選拔和培養(yǎng)有足夠?qū)I(yè)水準(zhǔn)的試題命題者。
有足夠?qū)I(yè)水準(zhǔn)的試題命題者是確保試題質(zhì)量、提高試題測(cè)試效度的根本?,F(xiàn)在的高等院校中有一些測(cè)試專家,或者接受過(guò)語(yǔ)言測(cè)試訓(xùn)練的專業(yè)人士,應(yīng)該廣泛選拔命題人員。若人數(shù)仍然不足,則應(yīng)通過(guò)短期培訓(xùn),盡快培養(yǎng)有足夠?qū)I(yè)水準(zhǔn)的試題命題者,或者建立3—5人的全國(guó)審題專家委員會(huì),對(duì)分省命題的高考英語(yǔ)試題進(jìn)行最后的審定,確保試題質(zhì)量。
(三)精心構(gòu)思高考閱讀理解測(cè)試的目的。
為了保證高考閱讀理解測(cè)試的效度,針對(duì)高考考生,高考命題者要明確高考閱讀理解應(yīng)測(cè)量的閱讀能力的層次。具體來(lái)講,閱讀測(cè)試的目的分為基本的對(duì)文章大意和主要信息的理解與較高層次的對(duì)寫(xiě)作態(tài)度、隱含意義、閱讀策略等的駕馭。
(四)合理設(shè)計(jì)高考閱讀測(cè)試的內(nèi)容。
為了保證閱讀測(cè)試的效度,根據(jù)具體的測(cè)試目的,高考命題者應(yīng)充分考慮閱讀測(cè)試的文章來(lái)源、文章體裁、文章題材、篇幅長(zhǎng)短、題型選擇、題目設(shè)計(jì)等每一個(gè)要素,從而確保與具體測(cè)試目標(biāo)的一致性,確保對(duì)閱讀能力測(cè)量的有效性。
(五)深入比較閱讀測(cè)試題的優(yōu)劣。
為了保證閱讀測(cè)試的效度,高考命題者在高考測(cè)試的進(jìn)行、評(píng)分等各項(xiàng)工作結(jié)束后,應(yīng)將試題與同層次其它閱讀試題進(jìn)行比較。通過(guò)這種分析,一方面可以檢測(cè)試題和其它閱讀試題所測(cè)量的學(xué)習(xí)者閱讀能力是否保持一致,另一方面也可以查缺補(bǔ)漏、取長(zhǎng)補(bǔ)短。
(六)科學(xué)吸收閱讀測(cè)試的反饋。
為了保證閱讀測(cè)試的表面效度,高考命題者在測(cè)試結(jié)束后,應(yīng)了解考生的答題情況以及同行對(duì)這次測(cè)試的評(píng)價(jià)。根據(jù)反饋的信息,高考命題者能夠及時(shí)地了解到測(cè)試在哪些方面沒(méi)有達(dá)到對(duì)考生閱讀能力測(cè)量的目標(biāo),在哪些方面與對(duì)考生閱讀能力的要求有偏離等重要問(wèn)題。通過(guò)這種從測(cè)試的設(shè)計(jì)到反饋各個(gè)階段的細(xì)致工作,可以提高閱讀測(cè)試效度的保險(xiǎn)系數(shù),提高閱讀測(cè)試的設(shè)計(jì)水平,使閱讀測(cè)試更好地、真實(shí)地反映考生的閱讀能力。
總之,我們必須在分省命題政策下,盡快提高分省命題的試題質(zhì)量,確保為高等學(xué)校選拔合格新生、引導(dǎo)基礎(chǔ)教育健康發(fā)展這兩個(gè)高考基本目的的實(shí)現(xiàn)。
參考文獻(xiàn):
[1]Bachman,L.F.& Palmer,A.Language Testing in Practice[M].Oxford:Oxford University Press,1996.
[2]魯子問(wèn).國(guó)家·考試·人[M].武漢:湖北人民出版社,2006.
[3]魯子問(wèn),王篤勤.中小學(xué)英語(yǔ)評(píng)價(jià)測(cè)試?yán)碚撆c實(shí)踐[M].北京:中國(guó)電力出版社,2005.
[4]高蘭生.英語(yǔ)測(cè)試與試題命制[M].北京:人民教育出版社,2002.
[5]湖北教育考試院.2007年普通高等學(xué)校招生全國(guó)統(tǒng)一考試(湖北卷)——英語(yǔ)試卷.