国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

大學(xué)英語四級考試寫作測評量表效度研究

2019-07-02 08:20鄒紹艷范勁松
外國語文 2019年3期
關(guān)鍵詞:效度量表問卷

鄒紹艷 范勁松

(1.青島農(nóng)業(yè)大學(xué) 外國語學(xué)院,山東 青島 266109;2.墨爾本大學(xué) 語言測試研究中心,澳大利亞 墨爾本 3010)

0 引言

寫作測試在大規(guī)模外語測試中被廣泛應(yīng)用,但與此同時,寫作測試的評分卻經(jīng)常遭到批判。Weigle (2002)指出,寫作測試的分?jǐn)?shù)不僅體現(xiàn)了考生和測試之間的交互作用,而且涉及其他諸多因素,如測試任務(wù)、寫作文本本身、評分員和評分量表等。這些因素之間的復(fù)雜交互作用導(dǎo)致寫作測試所測量的語言能力構(gòu)念往往不夠清晰,因而影響外界對寫作測試分?jǐn)?shù)的理解 (Cummingetal., 2001),即影響寫作測試的效度。根據(jù)美國三大研究機(jī)構(gòu)即美國教育研究協(xié)會、美國心理學(xué)協(xié)會和全美測量公會聯(lián)合頒布的《教育與心理測試標(biāo)準(zhǔn)》(AERAetal.,2014: 9),“效度是指根據(jù)測試的分?jǐn)?shù)做出恰當(dāng)、有意義、有用的推論”。近年來,隨著考試用戶對考試效度的要求不斷提高,如何提供更加合理、有效的分?jǐn)?shù)解釋,以便鼓勵恰當(dāng)?shù)姆謹(jǐn)?shù)使用成為語言測試開發(fā)者面臨的艱巨任務(wù)之一” (Chapelleetal., 2008)。

在這種背景下,寫作測試的評分量表成為語言測試領(lǐng)域關(guān)注的焦點(diǎn)。研究者們一致認(rèn)為,評分量表能夠體現(xiàn)寫作測試實(shí)際測量的構(gòu)念 (McNamara,1996; Turner,2000; Weigle,2002; Shaw et al., 2007)。但是,Knoch (2009)指出,現(xiàn)有的大規(guī)模外語測試中使用的評分量表往往都存在以下問題:(1)評分量表的制定過程主要基于專家的直覺判斷,因此無法體現(xiàn)寫作文本的真實(shí)特征;(2)評分量表中經(jīng)常使用一些印象化的術(shù)語,容易導(dǎo)致主觀性的解讀;(3)量表并未給每個等級的表現(xiàn)提供準(zhǔn)確、詳細(xì)的描述,不同等級之間的區(qū)分主要是依靠一些相對性的措辭。Knoch (2011)進(jìn)一步指出,目前關(guān)于這些評分量表的開發(fā)過程基本都無從得知,這無疑加劇了學(xué)界對這些量表效度問題的關(guān)注。

以國內(nèi)最大規(guī)模的外語考試——大學(xué)英語四級考試 (以下簡稱CET-4)為例,其寫作部分評分量表的效度近年來引起了不少研究者的關(guān)注 (蔡基剛,2002;費(fèi)茜 等,2008;簡慶閩 等,2005)。費(fèi)茜和趙毓琴 (2008)指出,CET-4寫作測試中采用的評分量表比較籠統(tǒng),評分標(biāo)準(zhǔn)也不夠全面,因此量表的效度值得探討。鑒于此,本文以CET-4寫作測試中目前使用的評分量表為研究對象,調(diào)查評分員對該評分量表的意見,初步論證該量表的效度,抑或發(fā)現(xiàn)影響量表效度的因素,為進(jìn)一步完善或提升CET-4寫作測試評分量表的效度提供依據(jù)。

1 文獻(xiàn)回顧

1.1 CET-4寫作測試及其評分

CET-4寫作測試要求考生根據(jù)所給的題目、提綱、情景、圖片或圖表,在30分鐘內(nèi)寫一篇不少于120詞的作文。自1987年首次施考以來,CET-4寫作測試經(jīng)歷了一系列變革,以適應(yīng)教育部2014年頒布的《大學(xué)英語課程教學(xué)要求》(以下簡稱《教學(xué)要求》) 的變化。變革的內(nèi)容包括:作文的長度、最低及格分的設(shè)置以及寫作順序的調(diào)整等 (辜向東 等,2009)。自2006年1月以來,圍繞CET-4寫作測試實(shí)施的一項(xiàng)重要變革便是其評分系統(tǒng)的變化,CET-4寫作測試的評分由傳統(tǒng)的紙筆評分轉(zhuǎn)變?yōu)榫W(wǎng)上評分。目前已有不少學(xué)者針對CET寫作測試的評分開展了實(shí)證研究 (黃燕,2007;王躍武,2004;王躍武 等,2006;張森 等,2010),結(jié)果表明CET-4寫作測試網(wǎng)上評分的效率和信度均高于比紙筆評分。但值得一提的是,這些研究關(guān)注的焦點(diǎn)基本都是CET-4寫作測試的評分信度。相比之下, CET-4寫作測試評分的效度鮮少被關(guān)注。如前所述,評分量表能夠體現(xiàn)寫作測試實(shí)際測量的構(gòu)念,只有對CET-4寫作測試評分的效度進(jìn)行充分研究,我們才能理解CET-4寫作測試分?jǐn)?shù)的意義。

根據(jù)楊惠中 & Weir (1998)的觀點(diǎn),CET-4作文的評分主要采用整體評分法,評分中關(guān)注的方面包括:內(nèi)容的相關(guān)度、語言的質(zhì)量和語篇的連貫性。在評分過程中,評分員需要綜合考慮這三個方面,然后給出一個總分。根據(jù)這些原則,大學(xué)英語四、六級考試委員會制定了一個包含五個等級的評分量表 (見表1)。

表1 大學(xué)英語寫作評分量表(楊惠中 等,1998:134)

1.2 CET-4寫作評分量表的研究現(xiàn)狀

目前,關(guān)于CET-4寫作測試評分量表的研究主要分為兩大類:(1) 通過與其他大規(guī)模外語寫作測試的評分量表進(jìn)行對比,闡述現(xiàn)有的CET-4寫作評分量表的不足之處。例如,費(fèi)茜、趙毓琴(2008)對比了CET-4寫作和托福寫作的評分量表,認(rèn)為與托福寫作的評分量表相比,CET-4寫作測試的評分量表較為籠統(tǒng),過分關(guān)注語言使用的準(zhǔn)確性,而忽略對寫作內(nèi)容和結(jié)構(gòu)方面的描述,因此認(rèn)為該量表在評分中的效果可能不太理想。(2) 分析評分員的評分過程和結(jié)果,論證評分量表的效度。高懷勇(2011)采用有聲思維法研究評分員的評分過程,發(fā)現(xiàn)評分員在實(shí)際評分中關(guān)注的文本特征略多于現(xiàn)有的CET-4寫作評分標(biāo)準(zhǔn)。例如,語言得體性和句子結(jié)構(gòu)這兩項(xiàng)評分標(biāo)準(zhǔn)在評分中被運(yùn)用的頻次較高,但這兩項(xiàng)標(biāo)準(zhǔn)并未在現(xiàn)有的CET-4寫作整體評分量表中得到體現(xiàn)。李航(2015)通過實(shí)證研究對比了現(xiàn)有的CET寫作整體評分量表和一項(xiàng)自主開發(fā)的分項(xiàng)評分量表在CET-6寫作評分中的作用,指出分項(xiàng)評分量表能幫助評分員更加細(xì)致、準(zhǔn)確地區(qū)分考生的英語寫作能力。盡管該研究初步探索了分項(xiàng)評分量表在CET寫作評分中的應(yīng)用前景,但由于該研究中使用的分項(xiàng)評分量表沒有遵循嚴(yán)格的量表開發(fā)步驟,其效度有待論證。

綜上,我們認(rèn)為上述研究存在以下不足之處:(1) 目前的研究大都是基于主觀論述得出結(jié)論,鮮有研究采用實(shí)證方法檢驗(yàn)量表效度。(2) 現(xiàn)有的研究基本都缺乏相關(guān)理論框架的指導(dǎo),因此即便運(yùn)用了實(shí)證方法,也無法為評分量表的效度提供充分的證據(jù)??紤]到寫作測試在大規(guī)模外語考試中的廣泛應(yīng)用,而且CET屬于高風(fēng)險語言考試,我們認(rèn)為有必要研究目前使用的CET寫作評分量表究竟能否有效地測量考試設(shè)計(jì)者想要考察的語言能力。鑒于此,本研究借鑒Bachman & Palmer (1996)提出的測試有用性理論框架以及Knoch (2009)對評分量表效度指標(biāo)的闡述 (見表2),探討評分員對CET-4寫作評分量表的看法和意見。根據(jù)Bachman & Palmer (1996)的觀點(diǎn),測試有用性一般通過六項(xiàng)指標(biāo)來體現(xiàn):信度、構(gòu)念效度、真實(shí)度、互動性、考試影響和實(shí)用性。Weigle (2002)認(rèn)為,互動性這一指標(biāo)在評分量表的效度中很難體現(xiàn)。Knoch (2009)進(jìn)一步提出了檢驗(yàn)評分量表效度的具體論據(jù),這些論據(jù)成為本文設(shè)計(jì)研究工具的依據(jù)。

表2 評分量表效度指標(biāo) (Knoch,2009:65)

2 研究設(shè)計(jì)

2.1 研究問題

本研究旨在解決以下研究問題:

(1)評分員對現(xiàn)有的CET-4寫作評分量表的總體看法如何?

(2)評分員的評分經(jīng)驗(yàn)在多大程度上影響他們對評分量表的看法?

(3)現(xiàn)有的CET-4寫作評分量表在哪些方面需要進(jìn)一步改進(jìn)?

為解決以上研究問題,本研究采用Creswell & Clark (2011)提出的解釋性混合研究設(shè)計(jì)方案,首先開展定量研究,然后在定量分析的基礎(chǔ)上開展定性分析。混合研究設(shè)計(jì)的優(yōu)勢就在于其能夠?qū)⒍垦芯颗c定性研究有機(jī)地結(jié)合起來,更加全面、深刻地解答研究問題。

2.2 研究工具

(1)調(diào)查問卷

本研究采用的問卷分為兩部分:第一部分主要調(diào)查受訪者的背景信息,如性別、教學(xué)經(jīng)歷、職稱、教育背景和CET-4的寫作評分經(jīng)驗(yàn)。第二部分包括六道題目。根據(jù)Knoch (2009) 的量表效度理論框架,問卷第二部分的六道題目設(shè)計(jì)如表3所示:

六道題目均采用李克特五級量表的形式(0~4),其中“0”代表“完全否定”,“4”代表“完全肯定”。問卷題目的作答形式之所以采用“0”和“4”作為量表的兩個極端,而非傳統(tǒng)的“1”和“5”,是為了促使受訪者做出真正的選擇,防止過多使用中間項(xiàng)“3” (D?rnyei,2003)。問卷調(diào)查首先于2016年6月在11名CET-4寫作評分員中進(jìn)行了試測,根據(jù)試測結(jié)果對問卷內(nèi)容作了微調(diào)。

另外,本研究還設(shè)計(jì)了用于訪談的半結(jié)構(gòu)式訪談大綱,包含兩個問題:(1) 如何看待CET-4寫作評分量表的描述語和等級劃分;(2) CET-4寫作評分量表的哪些方面還需進(jìn)一步改進(jìn)。

表3 問卷的題目以及涉及的效度指標(biāo)

2.3 研究對象

問卷調(diào)查的對象是來自上海、山東、吉林、四川等幾所CET-4閱卷點(diǎn)的179名作文評分員,他們的背景信息如表4所示:

表4 評分員背景信息

問卷數(shù)據(jù)被分析之后,12位評分員受邀參與了后續(xù)訪談,其中六位評分員擁有三次及以上CET-4寫作評分經(jīng)歷,而另外六位評分員參與CET-4寫作評分的次數(shù)不足三次。

2.4 數(shù)據(jù)收集和分析

問卷數(shù)據(jù)于2016年7月四級作文評分期間被收集。為了解決研究問題一,本研究運(yùn)用SPSS軟件對問卷調(diào)查的數(shù)據(jù)進(jìn)行描述統(tǒng)計(jì)分析,了解評分員對現(xiàn)有的CET-4寫作評分量表的總體看法;為了解決研究問題二,本研究運(yùn)用SPSS軟件對問卷調(diào)查的數(shù)據(jù)進(jìn)行獨(dú)立樣本t檢驗(yàn),探討擁有不同評分經(jīng)驗(yàn)的評分員對于CET-4寫作評分量表的看法是否存在顯著性差異。問卷數(shù)據(jù)分析完成后,研究者根據(jù)數(shù)據(jù)分析的結(jié)果邀請12位評分員進(jìn)行了一對一的深入訪談。訪談的內(nèi)容被錄音并轉(zhuǎn)寫成文字,然后利用Given(2008)提出的歸納法對訪談中反復(fù)提到的主題進(jìn)行歸納和分析。

3 研究結(jié)果

3.1 問卷調(diào)查的結(jié)果

3.1.1描述統(tǒng)計(jì)分析

對問卷數(shù)據(jù)進(jìn)行信度分析的結(jié)果表明,六道題目作答數(shù)據(jù)的內(nèi)部一致性系數(shù)為0.781,說明評分員對這些題目的作答都比較可靠(Barrett,2001)。對問卷數(shù)據(jù)的描述統(tǒng)計(jì)分析如表5所示。

表5顯示,問卷中六道題目的得分均值都在2.50~3.18之間。由于問卷設(shè)計(jì)是采用0~4的五級量表,所以這六道題目的得分均值都可視為高于中等水平。這一結(jié)果表明評分員對現(xiàn)有的CET-4寫作評分量表基本上持肯定態(tài)度。但從表5中也可以看出,第4道題目的得分均值(2.50)在所有題目中最低,僅略高于中等水平,說明評分員對于現(xiàn)有的CET-4寫作評分量表為大學(xué)英語教學(xué)提供的反饋信息這一方面的認(rèn)同度略低。而且,從六道題目作答數(shù)據(jù)的標(biāo)準(zhǔn)差來看,第四、五、六道題目的標(biāo)準(zhǔn)差較大,說明評分員在這幾道題目上的意見分歧較大。

表5 問卷題目的描述統(tǒng)計(jì)分析(n = 179)

3.1.2獨(dú)立樣本T檢驗(yàn)

按照評分員在CET-4寫作評分中的經(jīng)歷,179位評分員被分為兩組:資深組(即參與評分三次及以上的評分員,n= 90)和新手組(即參與評分三次以下的評分員,n= 89)。對兩組評分員在六道題目上的作答數(shù)據(jù)進(jìn)行獨(dú)立樣本T檢驗(yàn),結(jié)果如表6所示。

首先,對兩組評分員在六道題目上的作答數(shù)據(jù)進(jìn)行F檢驗(yàn),結(jié)果表明兩組評分員的數(shù)據(jù)差異符合方差齊性假設(shè),因此滿足進(jìn)行獨(dú)立樣本T檢驗(yàn)的前提條件。T檢驗(yàn)的結(jié)果顯示,在看待現(xiàn)有的CET-4寫作評分量表的清晰度(Q1)、完整性(Q2)、可操作性(Q3)、提供的反饋信息(Q4)、樣本作文(Q5)這五個方面時,兩組評分員的意見的Sig值都大于0.05,說明兩組評分員在這些方面沒有顯著性差異。但在看待評分培訓(xùn)的作用上,兩組評分員意見的Sig值為0.00,小于0.01,說明兩組評分員的意見之間存在顯著性差異。具體而言,新手組評分員對評分培訓(xùn)的看法不如資深組評分員肯定。

表6 兩組評分員數(shù)據(jù)的T檢驗(yàn)結(jié)果

3.2 訪談結(jié)果

為了進(jìn)一步理解問卷調(diào)查的結(jié)果,研究者邀請部分評分員進(jìn)行了訪談。研究者反復(fù)閱讀了基于評分員訪談轉(zhuǎn)寫的文本材料,歸納出四個評論最為最多的主題:

第一,量表描述語的清晰度

受訪的12位評分員中,67%的評分員(五位資深評分員、三位新手評分員)認(rèn)為,量表的描述語比較清晰易懂。但也有33%的評分員(三位資深評分員、一位新手評分員)指出,量表描述語的有些措辭比較含糊,容易引起歧義。例如,三位評分員都提到,量表中的“嚴(yán)重語言錯誤”“語言錯誤相當(dāng)多”“少量語言錯誤”之類的描述語有點(diǎn)籠統(tǒng),不太容易理解。資深評分員R2指出:“有相當(dāng)多的人認(rèn)為句法結(jié)構(gòu)錯誤是嚴(yán)重的語言錯誤,有人認(rèn)為不符合英文表達(dá)習(xí)慣的錯誤是嚴(yán)重的語言錯誤,也有人認(rèn)為只有影響語義理解的錯誤才是嚴(yán)重的語言錯誤。我一般都是自己反復(fù)研讀閱卷點(diǎn)提供的樣本作文,理解什么是嚴(yán)重的語言錯誤,什么是少量的語言錯誤?!绷硗?,新手評分員R7認(rèn)為,11分檔和14分檔的作文在“切題”方面沒有做出明確的區(qū)分,而五分檔和八分檔的作文則都是要求“基本切題”,不明白其中有何差異。

訪談中涉及的這一主題與問卷的第一道題目基本吻合。該題目在問卷調(diào)查中的得分均值為3.11,表明總體而言,評分員對于CET-4寫作評分量表的清晰度基本滿意。而對訪談的分析則顯示出,1/3的評分員對量表的清晰度仍有一定的質(zhì)疑,尤其是涉及“語言錯誤”和“切題”方面的描述語不夠具體、清晰。

第二,量表描述語的完整性

50%的評分員(三位資深評分員、三位新手評分員)在訪談時提到了量表描述語的完整性。他們認(rèn)為,量表的描述語不夠完整,不足以涵蓋四級作文的特點(diǎn)。例如,某資深評分員R4指出:“量表中對于內(nèi)容和思想的描述基本就是圍繞切不切題。實(shí)際上,有些作文盡管切題,但是內(nèi)容空洞,缺乏嚴(yán)謹(jǐn)?shù)恼撟C,是不是應(yīng)該考慮增加寫作內(nèi)容方面的描述?”資深評分員R5提到,量表的等級描述中沒有涉及語言使用的得體性,“我在閱卷時發(fā)現(xiàn),有的考生根本沒有讀者意識,比如在給老師寫信時,連稱呼都不得體。我認(rèn)為評分量表應(yīng)該對語言使用的得體性進(jìn)行描述,引導(dǎo)學(xué)生在寫作中樹立讀者意識,注意語言使用的得體性”。此外,新手評分員R11表示:“從11分檔和14分檔的描述語來看,好像這兩個等級的四級作文就是在錯誤數(shù)量上有所區(qū)別。實(shí)際上,14分檔的作文一般用詞上要比11分檔的作文豐富、精準(zhǔn),句型結(jié)構(gòu)也更加豐富,但是CET-4的寫作評分量表并沒有體現(xiàn)這些特點(diǎn)?!?/p>

訪談的這一主題與問卷調(diào)查的第二道題目內(nèi)容基本一致。這道題目在問卷調(diào)查中的得分均值為3.18,表明評分員對量表的完整性比較滿意。而在訪談中,卻有50%的評分員認(rèn)為量表的完整性存在一定的問題。當(dāng)被問及在問卷調(diào)查中是否忠實(shí)地表達(dá)了自己的意見時,評分員R4說:“問卷調(diào)查的時間比較短暫,沒有仔細(xì)思考‘完整性’的含義,所以在問卷中還是選擇了比較肯定的選項(xiàng)?!痹撛u分員的說法在一定程度上能夠解釋這道題目在問卷調(diào)查時得分均值較高的原因。

第三,量表為大學(xué)英語教學(xué)提供的反饋信息

由于受訪的12位評分員都是一線大學(xué)英語教師,他們無一例外地都表示非常關(guān)注CET-4寫作評分量表為大學(xué)英語教學(xué)提供的反饋信息。其中67%的評分員認(rèn)為,目前的量表無法為大學(xué)英語寫作教學(xué)提供充分、有用的信息。例如,資深評分員R3指出:“無論從大學(xué)英語教學(xué)中還是從CET-4評分中都能看出,寫作在大學(xué)生的聽、說、讀、寫四項(xiàng)技能中是最弱的一項(xiàng)。但是不同水平的學(xué)生在寫作中究竟存在哪些問題,有哪些地方還需要改進(jìn)和提高,僅僅依靠課堂教學(xué)中教師反饋的信息是不夠的。如果CET-4寫作的評分量表能夠提供比較詳細(xì)的反饋信息,讓考生明白自己寫作中的問題所在,就能幫助他們有針對性地克服自己的不足,提高寫作水平?!毙率衷u分員R9則提到:“在CET-4寫作正式評分前,培訓(xùn)員對不同水平的樣本作文的特點(diǎn)講解得比較詳細(xì),我在評分過程中也會不時地回顧這些作文的特點(diǎn)。但是,考生和大學(xué)英語教師無從得知不同層次四級作文的具體特征,如果能把這些信息補(bǔ)充到量表中,并在報道考試成績時附帶報道學(xué)生的作文分?jǐn)?shù)和等級,那么教師和學(xué)生都將從中受益?!?/p>

訪談的這一主題與問卷調(diào)查的第四道題目內(nèi)容一致。該題目在問卷調(diào)查的六道題目中得分均值最低(2.50),而訪談的結(jié)果恰好能夠解釋這道題目得分較低的原因。從上述分析可以看出,由于所有評分員都是大學(xué)英語教師,他們迫切希望CET-4寫作評分量表能為大學(xué)英語教學(xué)提供更加具體、詳細(xì)的反饋信息,從而促進(jìn)大學(xué)英語教學(xué)和學(xué)習(xí)。

第四,評分培訓(xùn)的作用

訪談中,有42%的評分員 (三位資深評分員、兩位新手評分員)提到了閱卷點(diǎn)組織的評分培訓(xùn)的作用。其中資深評分員R2提到:“我參加四級寫作評分很多次了,已經(jīng)基本掌握了評分標(biāo)準(zhǔn)。每次我參加評分培訓(xùn)都會重點(diǎn)看一下閱卷點(diǎn)提供的樣本作文,熟悉一下作文的話題。不太需要專門去看評分量表,因?yàn)闃?biāo)準(zhǔn)已經(jīng)記在我心里了?!倍率衷u分員R8指出:“評分培訓(xùn)時,專家對樣本作文的特征和得分點(diǎn)講解得比較仔細(xì)。但一到實(shí)際閱卷時,還是經(jīng)常不明白該怎么評分,因?yàn)樵u閱的作文與樣本作文之間還是有一定的差異。所以,只能時不時找出樣本作文進(jìn)行對比,看看評閱的作文與哪個分?jǐn)?shù)段的樣本作文比較接近,然后再給分。”

從這一訪談結(jié)果不難看出,問卷調(diào)查中資深評分員之所以對評分培訓(xùn)的作用比較肯定,可能主要因?yàn)樗麄円呀?jīng)熟悉、內(nèi)化了CET-4寫作測試的評分標(biāo)準(zhǔn)。而相比之下,新手評分員對評分培訓(xùn)的作用認(rèn)可度偏低則是因?yàn)樵u分培訓(xùn)未能幫助他們快速掌握有效的評分標(biāo)準(zhǔn)。

4 討論

在考試的開發(fā)和效度驗(yàn)證過程中,征求考試?yán)嫦嚓P(guān)者的意見十分必要 (如 AERAetal., 2014; Aldersonetal., 1995; Chun, 2008; Karelitz, 2013; Messick, 1989; Fan, 2014)。參與本研究問卷調(diào)查和訪談的都是大學(xué)英語教師,他們既是評分量表的使用者,也是CET-4考試?yán)娴南嚓P(guān)者,因此他們的意見對于檢驗(yàn)和完善CET-4寫作評分量表的效度而言十分重要。從研究結(jié)果來看,盡管評分員對目前使用的CET-4寫作評分量表總體上持肯定態(tài)度,但是該量表在清晰度、完整性、為大學(xué)英語教學(xué)提供的反饋信息量這幾個方面,仍有待完善和提升。另外,在看待CET-4寫作評分培訓(xùn)的作用時,資深評分員和新手評分員的意見出現(xiàn)了顯著性差異,新手評分員的看法不如資深評分員肯定,說明現(xiàn)有的評分量表在評分培訓(xùn)中的作用也有待于進(jìn)一步加強(qiáng)。根據(jù)Knoch (2009) 提出的評分量表效度框架,這幾個方面是體現(xiàn)量表效度的重要指標(biāo),因此對量表的這幾個方面進(jìn)行修訂或完善有助于提高CET-4寫作評分量表的總體效度。

鄒紹艷、高秀雪 (2015)提到他們在大學(xué)英語教學(xué)過程中發(fā)現(xiàn)學(xué)生的語言表達(dá)空洞,沒有實(shí)質(zhì)性內(nèi)容,思辨缺席現(xiàn)象嚴(yán)重。如果CET-4寫作測試的評分量表能針對不同水平的寫作表現(xiàn)提供詳細(xì)的診斷性信息,必將對大學(xué)英語教學(xué)產(chǎn)生積極的后效,從而促進(jìn)教學(xué)的提高。但由于CET-4寫作測試目前采用的是整體性評分量表,很難克服這種量表自身的桎梏。根據(jù)Weigle (2002)的觀點(diǎn),整體評分量表無法捕捉考生寫作中的具體不足和優(yōu)勢所在,因而影響考官區(qū)分寫作文本在不同方面的特征,例如詞匯的使用、修辭組織、語法結(jié)構(gòu)的控制和準(zhǔn)確性,更無法為考生提供有用的診斷性信息。Leeetal. (2008:1)也強(qiáng)調(diào),整體評分量表的這一缺陷對于二語學(xué)習(xí)者來說尤為明顯,因?yàn)檫@類學(xué)習(xí)者的寫作水平仍在發(fā)展中,他們可能會在寫作的不同方面展現(xiàn)出不均衡的特點(diǎn)。雖然CET-4的考生都是處于大學(xué)階段的外語學(xué)習(xí)者,但他們的寫作能力發(fā)展并不均衡 (劉建達(dá) 等,2011; 唐錦蘭 等,2012)。鑒于此,我們建議運(yùn)用實(shí)證方法為CET-4寫作測試開發(fā)分項(xiàng)評分量表?,F(xiàn)有文獻(xiàn)表明,分項(xiàng)評分量表能夠針對受試者的表現(xiàn),提供診斷性信息,反映受試者的進(jìn)步 (如Hamp-Lyons,1986, 1991; Shaw,2007; Weigle,2002)。而且,分項(xiàng)評分量表在評分員培訓(xùn)中的作用更加明顯,因?yàn)榻?jīng)驗(yàn)不足的評分員更容易理解并應(yīng)用量表中的評分標(biāo)準(zhǔn) (Weigle,2002; Weir,1990)。

5 結(jié)語

金艷 (2005)指出,CET-4的考試目的一方面是客觀地測量大學(xué)生的總體英語水平,另一方面期望對中國的大學(xué)英語教學(xué)產(chǎn)生積極的后效和影響。目前,相關(guān)研究已經(jīng)證明CET-4寫作測試的評分信度比較令人滿意。這說明CET-4寫作測試能夠比較客觀地測量考生的英語寫作水平。但就考試為教學(xué)帶來的后效或產(chǎn)生的影響這一點(diǎn)來說,CET-4寫作測試仍有較大的提升空間。因此,本研究建議進(jìn)一步運(yùn)用實(shí)證方法為CET-4寫作測試開發(fā)分項(xiàng)評分量表,以便為大學(xué)英語教學(xué)提供更加豐富的診斷性信息,確??荚嚹軌?qū)虒W(xué)產(chǎn)生積極的后效和影響。

猜你喜歡
效度量表問卷
《廣東地區(qū)兒童中醫(yī)體質(zhì)辨識量表》的信度和效度研究
慈善募捐規(guī)制中的國家與社會:兼論《慈善法》的效度和限度
胸痹氣虛證療效評價量表探討
問卷網(wǎng)
三種抑郁量表應(yīng)用于精神分裂癥后抑郁的分析
慢性葡萄膜炎患者生存質(zhì)量量表的驗(yàn)證
被看重感指數(shù)在中國大學(xué)生中的構(gòu)念效度
初中生積極心理品質(zhì)量表的編制
問卷大調(diào)查
問卷你做主