高存+張?jiān)?/p>
摘要:在歷屆高考英語考試改革中,寫作一直是人們關(guān)注的焦點(diǎn)之一。經(jīng)過不斷的改革,高考英語寫作考試的合理性得以提高,但是現(xiàn)有考試設(shè)計(jì)依然存在一些較為突出的問題。本文從考試構(gòu)念的界定、任務(wù)開發(fā)、評分設(shè)計(jì)和促學(xué)作用等四個(gè)方面對高考英語寫作考試改革中應(yīng)該重點(diǎn)關(guān)注的問題進(jìn)行了探討,指出要想真正提高高考英語寫作考試的正面反撥作用,必須在這幾個(gè)方面有所突破。
關(guān)鍵詞:高考英語 寫作考試 考試改革 促學(xué)
回顧我國高考英語改革之路,從上世紀(jì)八十年代末開始啟用書面表達(dá)題,到九十年代中期開始增加短文改錯(cuò)題,再到近年來短文改錯(cuò)題的逐步退出,以及閱讀表達(dá)題和讀寫結(jié)合題的出現(xiàn),高考英語寫作考試任務(wù)設(shè)計(jì)的合理性逐步提高。但是,現(xiàn)有考試仍存在一些較為突出的問題,如沒有明確界定考試構(gòu)念、評分標(biāo)準(zhǔn)中雖然提到了語言運(yùn)用能力,但對于什么是語言運(yùn)用能力并沒有進(jìn)行任何解釋,進(jìn)而“忽略了對學(xué)生知識運(yùn)用、問題分析以及思維創(chuàng)新等能力的考查”[1],這些均證實(shí)了高考英語考試中也存在“主觀題考試結(jié)果可解釋性低,考試總分不能完全表征考生學(xué)科素養(yǎng)等問題”[2]。此外,由于在考試設(shè)計(jì)中未能充分吸收國內(nèi)外二語寫作教學(xué)的優(yōu)秀研究成果,使得考試任務(wù)的設(shè)計(jì)和評分標(biāo)準(zhǔn)的制定與二語寫作教學(xué)的有效途徑相脫離,這一點(diǎn)在很大程度上削弱了中學(xué)英語寫作教學(xué)的正面指引作用。這些問題均應(yīng)在本輪高考改革中得到有效解決。
一、考試構(gòu)念界定
本文所說的構(gòu)念不是指某一語言能力模型的構(gòu)成部分,而是用于統(tǒng)稱一項(xiàng)考試所要測量的多種語言技能或能力,這些技能或能力可能來自某一語言能力模型,也可能出自其他材料,如課程教學(xué)大綱。這樣,考試構(gòu)念便取代測評框架,成為考試說明撰寫的基礎(chǔ)。不論是開發(fā)新的考試形式,還是對一項(xiàng)考試進(jìn)行效度論證,均要明確界定其考試構(gòu)念,即所要考查的能力。然而,對于寫作考試開發(fā)者和研究者來說,構(gòu)念界定是一個(gè)比較棘手的問題。
由于對寫作質(zhì)量缺乏統(tǒng)一認(rèn)識,因此界定寫作考試構(gòu)念較為困難[3]。寫作考試以及對好的作文的斷定在很大程度上受到背景的影響[4]。Cumming認(rèn)為,高利害大規(guī)模國際寫作考試必須為考生提供統(tǒng)一的寫作背景[5]。首先,為了確??忌鷻C(jī)會(huì)均等,構(gòu)念的操作背景要統(tǒng)一,所測構(gòu)念不能對任何特定人群有偏見,也不能給具有某些特定能力或知識的人群帶來優(yōu)勢。其次,高利害考試要確??忌憩F(xiàn)之間的可比性,考生的分?jǐn)?shù)或基于分?jǐn)?shù)的解釋不應(yīng)受到考試地點(diǎn)、考試時(shí)間和試題版本的影響。因此,在界定考試構(gòu)念時(shí)要充分考慮背景因素??傊?,構(gòu)念效度比考試內(nèi)容的相關(guān)性和真實(shí)性更為重要,而要確保構(gòu)念效度,必須對核心構(gòu)念進(jìn)行清楚界定[5]。
考試構(gòu)念的界定不僅會(huì)影響考試任務(wù)開發(fā),而且還會(huì)直接影響到考試后效。Fulcher和Davidson指出,如果沒有關(guān)于考試構(gòu)念的詳細(xì)信息,任課教師只能在課堂活動(dòng)中盲目照搬考試任務(wù)。相反,如果考試構(gòu)念界定得清楚,任課教師便能夠理解考試任務(wù)所期待的考生表現(xiàn),以及在此基礎(chǔ)上所做的關(guān)于考生具體語言能力的判斷,一旦他們擁有了這些概念工具,便能夠創(chuàng)造性地開發(fā)多種課堂教學(xué)活動(dòng)來幫助學(xué)生提高考試所要測量的交際語言能力,這才是考試促學(xué)的關(guān)鍵[6]。
為了確??荚嚨男Ф?,考試構(gòu)念的界定要有一定的依據(jù)。根據(jù)Bachman和Palmer對構(gòu)念界定的描述,界定二語寫作考試構(gòu)念,可以依據(jù)課程大綱、圍繞目標(biāo)語言使用任務(wù)進(jìn)行的需求分析,或者某二語寫作能力理論,也可以將三者結(jié)合起來考慮[7]。具體選擇何種依據(jù),須根據(jù)考試規(guī)模、用途等因素來定。Bachman和Palmer不主張從任務(wù)表現(xiàn)和“技能”角度界定考試構(gòu)念,認(rèn)為這兩種方式會(huì)給評分和分?jǐn)?shù)解釋造成困難,相反,他們提倡借助語言能力的構(gòu)成來界定[7]。采用這種界定方法,不僅須明確有待考查的具體語言知識,而且須決定考試構(gòu)念是否涵蓋策略能力和話題知識。如果涵蓋,則須處理好語言知識和策略能力、寫作能力和話題知識之間的關(guān)系[7]。
國際大規(guī)模外語考試對寫作考試構(gòu)念均有明確的界定。比如,TOEFL 2000寫作考試構(gòu)念是“就多種一般性話題闡明和交流觀點(diǎn),寫出有一定長度且有組織的書面文本以表達(dá)和支撐基于個(gè)人知識和經(jīng)驗(yàn)的個(gè)人觀點(diǎn),并同時(shí)考慮預(yù)期讀者的知識”,以及“連貫組織和準(zhǔn)確表達(dá)學(xué)術(shù)材料的內(nèi)容和結(jié)構(gòu),以展示能夠理解閱讀材料和講座中關(guān)于某一學(xué)術(shù)話題的關(guān)鍵思想以及鏈接文本信息時(shí)所采用的修辭關(guān)系,如論斷/反駁、問題/解決方案和建議/反建議”[8]。相比之下,我國高考英語考試尚缺乏對于寫作考試構(gòu)念的明確界定,僅指出寫作題考的是考生的書面表達(dá)能力,對于什么是書面表達(dá)能力,以及該能力的具體構(gòu)成并沒有明確論述。為了提高寫作考試命題的科學(xué)性以及不同考試任務(wù)之間的一致性,同時(shí)明確寫作能力培養(yǎng)目標(biāo),亟需參照國際大規(guī)模外語考試,從認(rèn)知角度對書面表達(dá)能力進(jìn)行明確界定。
二、考試任務(wù)的開發(fā)
考試任務(wù)是考試構(gòu)念的操作化,是誘發(fā)和收集考生表現(xiàn)的工具。任務(wù)設(shè)計(jì)的合理與否是一項(xiàng)考試成敗的關(guān)鍵。根據(jù)Bachman和Palmer對考試任務(wù)開發(fā)情境的描述,大規(guī)??荚嚾蝿?wù)的開發(fā)一般有兩個(gè)途徑:如果存在目標(biāo)語言使用域,最常見的方法是改編目標(biāo)語言使用任務(wù),即調(diào)整部分任務(wù)特征;否則,則須根據(jù)考生特征和構(gòu)念界定來創(chuàng)造假想的目標(biāo)語言使用域和目標(biāo)語言使用任務(wù),并在此基礎(chǔ)上設(shè)計(jì)考試任務(wù)[7]。無論何種情況,在考試任務(wù)開發(fā)過程中均須考慮考試內(nèi)容的相關(guān)性、取樣的充分性以及考試任務(wù)的真實(shí)性和公平性。
Haladyna和Rodriguez提出了基于論證的試題效度驗(yàn)證方法(an argument-based approach to item validation),并列舉了為驗(yàn)證試題效度進(jìn)行的解釋性論證(interpretive argument for item validation)須回答的16個(gè)問題,這些問題涉及目標(biāo)域的類型、目標(biāo)域的組織方式、概化域的組織方式、概化域和目標(biāo)域的一致性、試題類型的選取、試題開發(fā)方式、評分標(biāo)準(zhǔn)、試題內(nèi)容、每道試題的認(rèn)知需求、試題的編排、試題的時(shí)效性和有效性、試題的公平性以及試測等諸多方面的內(nèi)容[9]。對這16個(gè)問題的回答就是為試題的效度驗(yàn)證收集必要證據(jù)的過程。
與我國高考英語考試不同,國際大規(guī)模外語考試均圍繞考試任務(wù)開發(fā)做了大量研究。比如,為了給TOEFL iBT考試任務(wù)的開發(fā)提供依據(jù),Rosenfeld等人調(diào)查了完成北美大學(xué)學(xué)習(xí)中典型語言使用任務(wù)必須具備的語言能力[10]。Cumming等人則根據(jù)對TOEFL考試任務(wù)類型的批判,從內(nèi)容效度、真實(shí)性和與教育的相關(guān)性等方面對新版TOEFL所考慮的原型任務(wù)(prototype tasks)進(jìn)行了調(diào)查[11]。Uysal結(jié)合專家判斷對IELTS考試任務(wù)和目標(biāo)任務(wù)的匹配程度,以及考試內(nèi)容的相關(guān)性和代表性進(jìn)行了驗(yàn)證[12]。Moore和Morton則通過比較從目標(biāo)域中收集的學(xué)生作文和IELTS考試作文,對IELTS學(xué)術(shù)寫作任務(wù)的真實(shí)性進(jìn)行了論述[13]。這些研究為考試任務(wù)設(shè)計(jì)的合理化論證提供了強(qiáng)有力的支撐。相比之下,國內(nèi)關(guān)于高考英語寫作考試的研究尚停留在對考試試題內(nèi)容和設(shè)計(jì)的討論上,尚未觸及對目標(biāo)語言使用任務(wù)的考查。而一旦缺乏對目標(biāo)語言使用任務(wù)的描述,考試內(nèi)容的相關(guān)性和取樣的充分性便難以保證。
三、考試評分設(shè)計(jì)
Weigle介紹了三種主要的寫作評分方式,其中首要特質(zhì)評分在二語考試中并沒有得到廣泛應(yīng)用,其優(yōu)點(diǎn)是能夠提供關(guān)于考生能力的詳細(xì)信息,缺點(diǎn)是沒有統(tǒng)一的評分標(biāo)準(zhǔn),每一個(gè)寫作任務(wù)均須開發(fā)相應(yīng)的評分標(biāo)準(zhǔn),因此實(shí)行起來耗時(shí)耗力。相比之下,整體評分得到了廣泛的應(yīng)用,它的優(yōu)點(diǎn)是評分快捷,缺點(diǎn)是無法給考生提供有用的診斷信息,同時(shí)分?jǐn)?shù)有時(shí)難以解釋,因?yàn)樵u分員在給出相同分?jǐn)?shù)的時(shí)候所關(guān)注的語言點(diǎn)可能有所不同;分項(xiàng)評分的應(yīng)用也較為廣泛,與整體評分相比,它能夠提供更多有用的診斷信息,評分更為可靠,更加有利于評分員培訓(xùn),更適合評價(jià)二語學(xué)習(xí)者,但其缺點(diǎn)是評分耗時(shí)長,況且如果最終仍然是提供一個(gè)總分,那么分?jǐn)?shù)合并后分項(xiàng)評分提供的大量信息便會(huì)喪失。此外,有經(jīng)驗(yàn)的評分員可能會(huì)首先采用整體評分法給出總分,然后再相應(yīng)地給出分項(xiàng)分[14]。
整體評分和分項(xiàng)評分在大規(guī)模外語考試中均有所應(yīng)用,比如TOEFL iBT采用的是整體評分,而IELTS則采用分項(xiàng)評分。選擇何種評分方式與考試的目的密切相關(guān)。Weigle提倡根據(jù)Bachman和Palmer提出的考試有用性框架[15]來綜合判斷。如果實(shí)用性更為重要,則可選用整體評分;如果信度和構(gòu)念效度更為重要,選用分項(xiàng)評分則更為合適。Bachman和Palmer明確提倡采用分項(xiàng)評分,他們首先從分?jǐn)?shù)的解釋、評分時(shí)的等級分配以及各觀測點(diǎn)之間的比重三個(gè)方面對整體評分的主要問題進(jìn)行了論述,然后指出,設(shè)計(jì)評分標(biāo)準(zhǔn)時(shí)應(yīng)該從考試構(gòu)念出發(fā),為構(gòu)念界定中的每個(gè)語言能力構(gòu)成分別設(shè)計(jì)評分尺度[7]。這樣評分有兩個(gè)優(yōu)勢,一是方便考試開發(fā)者提供對所評語言能力的詳細(xì)描述,使得考試使用者能夠清楚地了解考生的優(yōu)缺點(diǎn),二是有利于了解評分員在評價(jià)語言使用樣本時(shí)的具體行為[7]。
目前,我國高考英語寫作采用的是整體評分法,其中的一個(gè)考慮是,參加高考的人數(shù)眾多,采用整體評分可以提高評分效率。但是采用整體評分難以對評分員的評分過程進(jìn)行監(jiān)控,評分結(jié)果的可解釋性低,無法提供具體的反饋信息。在高考英語考試實(shí)行一年兩考后,如果能夠根據(jù)第一次考試表現(xiàn)給考生及時(shí)提供診斷信息,將在很大程度上提高考試的促學(xué)作用。因此,改變過去一直采用整體評分的做法,設(shè)計(jì)分項(xiàng)評分方式應(yīng)該是高考英語寫作考試開發(fā)中的一項(xiàng)重要工作。
四、考試的促學(xué)作用
Huot認(rèn)為,Messick和Cronbach的效度觀均要求有效的寫作考試程序?qū)懽鹘虒W(xué)和學(xué)習(xí)產(chǎn)生正面影響[16]。然而,任課教師對寫作考試行為常持懷疑態(tài)度,原因是這些考試未能反映一些價(jià)值觀,而這些價(jià)值觀對于理解人們?nèi)绾螌W(xué)習(xí)閱讀和寫作非常重要[16]。因此,有效的寫作考試首先應(yīng)吸納關(guān)于寫作教學(xué)和學(xué)習(xí)的學(xué)術(shù)文獻(xiàn),其次應(yīng)該把考試的使用納入考試效度論證中。如果一項(xiàng)考試的使用目的脫離了相關(guān)寫作教學(xué)理論基礎(chǔ),那么它便是測量寫作能力的無效方式[16]。
Montee和Malone也認(rèn)為,效度論證應(yīng)該拓展到對考生和其他利益相關(guān)者的影響以及如何對考試結(jié)果進(jìn)行解釋,因此,考試開發(fā)者必須開發(fā)分?jǐn)?shù)報(bào)告,以清楚明白地呈現(xiàn)考試結(jié)果[17]。然而,在心理學(xué)和教育測量中,一個(gè)困惑人們已久的問題是如何對考生所知或所能進(jìn)行描述[18],這是對考生或考試結(jié)果使用者提供信息反饋的關(guān)鍵。研究表明,如果診斷性考試能夠使目標(biāo)教學(xué)集中加強(qiáng)對個(gè)體學(xué)生需求和優(yōu)點(diǎn)的關(guān)注,便可以有效地促進(jìn)語言發(fā)展[19],而為了達(dá)到這一目標(biāo),考試反饋內(nèi)容和提供反饋的方式至關(guān)重要。
國際大規(guī)模外語考試均高度關(guān)注考試的促學(xué)作用。ETS明確指出,TOEFL iBT的目標(biāo)使用之一便是給有效的英語教學(xué)和學(xué)習(xí)方法提供支持,比如引入口語考試和綜合考試任務(wù)等歷次改革的出發(fā)點(diǎn)均是為了促進(jìn)創(chuàng)造和使用與交際教學(xué)聯(lián)系更為緊密的備考材料和備考活動(dòng)[20]。ETS還為課程協(xié)調(diào)人、學(xué)術(shù)主管和任課教師提供了專門的指導(dǎo)手冊,手冊中不僅描述了交際英語教學(xué)和TOEFL iBT設(shè)計(jì)之間的關(guān)系,而且還提供了模擬考試任務(wù)和課堂教學(xué)活動(dòng)建議[20]。除此之外,ETS還將考試的設(shè)計(jì)理念和模擬材料與教材出版商進(jìn)行分享,以幫助他們給英語學(xué)習(xí)者提供適當(dāng)?shù)膶W(xué)習(xí)材料[20]。IELTS也編寫了教師手冊,對考試任務(wù)、構(gòu)念、評分標(biāo)準(zhǔn)、分?jǐn)?shù)解釋等內(nèi)容進(jìn)行了詳細(xì)介紹,并明確指出IELTS考試結(jié)果的報(bào)告方式有利于任課教師了解學(xué)生哪些方面的語言技能仍有待提高,以便他們能夠給學(xué)生設(shè)定清楚的學(xué)習(xí)目標(biāo),此外手冊還針對教學(xué)技巧和備考材料的選擇提出了具體的建議(British Council,IDP:IELTS Australia,and Cambridge English Language Assessment 2015)。與TOELF iBT和IELTS相比,我國高考英語考試在促學(xué)方面所做的努力還遠(yuǎn)遠(yuǎn)不夠。
根據(jù)上述分析,高考英語寫作考試開發(fā)的三個(gè)關(guān)鍵環(huán)節(jié)是考試構(gòu)念界定、考試任務(wù)開發(fā)和評分設(shè)計(jì)。如圖1所示,考試構(gòu)念的界定須同時(shí)考慮的因素包括高中英語課程標(biāo)準(zhǔn)、高校英語教學(xué)需求和二語寫作能力理論。而開發(fā)考試任務(wù)時(shí),一方面要重點(diǎn)參照高校低年級寫作教學(xué)中典型的寫作任務(wù),另一方面也要考慮考試所要體現(xiàn)的二語寫作教學(xué)理念,是結(jié)果法(product approach)、過程法(process approach)還是體裁法(genre approach)?這與考試的促學(xué)效果密切相關(guān),同時(shí)還會(huì)影響評分標(biāo)準(zhǔn)的制定。評分設(shè)計(jì)包括評分標(biāo)準(zhǔn)的制定和評分程序的設(shè)計(jì),其中制定評分標(biāo)準(zhǔn)時(shí)既要參考考試任務(wù)特征和考試構(gòu)念,同時(shí)還要依據(jù)專家判斷、評分反饋和師生反饋等因素。除了上面三個(gè)環(huán)節(jié)外,還要考慮如何給考生和任課教師提供反饋信息,這是實(shí)施一年兩考后須重點(diǎn)考慮的問題之一。
作為一項(xiàng)大規(guī)模高利害考試,高考英語考試近年來受到了公眾前所未有的高度關(guān)注,“降低分值”、“退出高考”和“實(shí)行社會(huì)化考試”等呼聲曾一度不絕于耳。這些呼聲充分反應(yīng)出,高考英語考試依然存在一些較為突出的問題,其中最為突出的便是對中學(xué)英語教學(xué)和學(xué)習(xí)的負(fù)面反撥作用。造成這一問題的一個(gè)關(guān)鍵因素是,高考英語考試的開發(fā)主觀性較強(qiáng),尚缺乏科學(xué)的程序指導(dǎo)。實(shí)行“一年兩考”可以在很大程度上降低高考英語考試的利害程度,但是要真正提高高考英語考試的正面反撥作用,還須在考試的開發(fā)上下功夫。為了拋磚引玉,本文討論了高考英語寫作考試任務(wù)開發(fā)中的幾個(gè)關(guān)鍵環(huán)節(jié),這些環(huán)節(jié)對考試的促學(xué)作用均起著重要的影響,然而卻是我國高考英語寫作考試開發(fā)中的薄弱環(huán)節(jié)。
參考文獻(xiàn)
[1]韓守玉.中美大學(xué)入學(xué)考試英文寫作評分標(biāo)準(zhǔn)的對比——基于SAT與中國高考的比較[J].西南農(nóng)業(yè)大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2011(11).
[2] 周群.基于效度的中美大學(xué)入學(xué)考試開發(fā)比較研究[J].中國高教研究,2010(11).
[3] Hamp-Lyons,L.Second language writing:Assessment issues[A].In Kroll,B.(ed).Second Language Writing:Research Insights for the Classroom[C].Cambridge:Cambridge University Press,1990.
[4] Crusan,D.Assessing writing[A].In Kunnan,A.J.(ed).The Companion to Language Assessment [C].West Sussex:Wiley Blackwell,2014.
[5] Cumming,A.Assessing L2 writing:Alternative constructs and ethical dilemmas[J].Assessing Writing,2002(2).
[6] Fulcher,G.& Davidson,F(xiàn).Language Testing and Assessment:An advanced resource book [M].London/New York:Routledge,2007.
[7] Bachman,L.& Palmer,A.Language Assessment in Practice:Developing Language Assessments and Justifying their Use in the Real World[M].Oxford:Oxford University Press,2010.
[8] 韓寶成, 張?jiān)? 高考英語測試目標(biāo)和內(nèi)容設(shè)置框架探討[J]. 外語教學(xué)與研究, 2015(3).
[9] Haladyna, T.M. and Rodriguez, M.C. Developing and Validating Test Items [M]. London/New York: Routledge, 2013.
[10] Rosenfeld,M.,Leung,S.& Oltman,P.K..The Reading,Writing,Speaking,and Listening Tasks Important for Academic Success at the Undergraduate and Graduate Levels.(TOEFL Monograph Series Report No.21).Princeton,NJ:Educational Testing Service,2001.
[11] Cumming,A.,Grant,L.,Mulcahy-Ernt,P.& Power,D.E.A Teacher-Verification Study of Speaking and Writing Prototype Tasks for a New TOEFL?(TOEFL Monograph Series Report No.26).Princeton,NJ:Educational Testing Service,2005.
[12] Uysal,H.A critical review of the IELTS writing test[J].ELT Journal,2010(3).
[13] Moore,T.& Morton,J.Authenticity in the IELTS Academic Module Writing Test:A Comparative Study of Task 2 Items and University Assignments(IELTS Research Reports Vol.2)[M].Canberra:IDP IELTS Australia,1999.
[14] Weigle,S.C.Assessing Writing [M].Cambridge:Cambridge University Press,2002.
[15] Bachman,L.& Palmer,A.Language Testing in Practice. Oxford:Oxford University Press,1996.
[16] Huot,B.Toward a new theory of writing assessment[J].College Composition and Communication,1996(4).
[17] Montee,M.and Malone,M.E.Writing scoring criteria and score reports[A].In Kunnan,A.J.(ed).The Companion to Language Assessment [C].West Sussex: Wiley Blackwell,2014.
[18]Carroll,J.B.Test theory and the behavioral scaling of test performance [A]. In Fredericksen,N.,Mislevy,R.J.and Bejar,I.(eds.).Test theory for a new generation of tests[C].Hillsdale,NJ:Lawrence Erlbaum,1993.
[19] Fox,J.D.Moderating top-down policy impact and supporting EAP curricular renewal: Exploring the potential of diagnostic assessment[J].Journal of English for Academic Purposes,2009(1).
[20] ETS.Validity Evidence Supporting the Interpretation and Use of TOEFL iBTTM Scores(TOEFL iBT Research Insight Series 1,Vol.4)[R]. Princeton,NJ:Educational Testing Service,2011.
[作者:高存(1979-),女,山東鄆城人,天津商業(yè)大學(xué)外國語學(xué)院副教授,博士;張?jiān)剩?977-),男,山東金鄉(xiāng)人,天津商業(yè)大學(xué)外國語學(xué)院教授,北京外國語大學(xué)在讀博士研究生。]
【責(zé)任編輯 王 穎】