(河北經(jīng)貿(mào)大學(xué)050000)
教育公平視域下的英語(yǔ)社會(huì)化考試測(cè)量標(biāo)準(zhǔn)芻議
吉丹丹 王玉秀(河北經(jīng)貿(mào)大學(xué)050000)
考試測(cè)量標(biāo)準(zhǔn)由心理測(cè)試專家和教育工作者制定,以規(guī)范測(cè)試者的行為,提高測(cè)試專業(yè)化水平為目的,涵蓋考試的監(jiān)管、設(shè)計(jì)、評(píng)估和使用整個(gè)過程,為考生及其他利益相關(guān)者提供指導(dǎo)和佐證。本文回顧了國(guó)際上較有影響力的測(cè)試標(biāo)準(zhǔn),基于項(xiàng)目反應(yīng)理論中的等值技術(shù)和測(cè)試方法提出教育公平視域下的考試測(cè)量標(biāo)準(zhǔn)??荚嚇?biāo)準(zhǔn)的制定有助于高考英語(yǔ)社會(huì)化考試的推行,推動(dòng)我國(guó)語(yǔ)言測(cè)試開發(fā)與研究的國(guó)際化,提升我國(guó)自行開發(fā)的英語(yǔ)考試在國(guó)際上的認(rèn)可度,為教育機(jī)構(gòu)及其他利益相關(guān)者提供入學(xué)、就業(yè)等決策依據(jù)。
英語(yǔ)社會(huì)化考試測(cè)試標(biāo)準(zhǔn)教育公平
2013年12月7日,教育部已經(jīng)制定完成了考試招生改革總體方案中的部分細(xì)節(jié):我國(guó)將探索外語(yǔ)考試不再統(tǒng)一高考時(shí)舉行,進(jìn)行社會(huì)化一年多考,2017年正式推廣實(shí)施,到2020年基本形成新的考試招生制度。社會(huì)化考試在形式上和內(nèi)容上不同于以往的統(tǒng)一高考,以往高考英語(yǔ)測(cè)試使用考試大綱指導(dǎo)考試的完成。但是鑒于外語(yǔ)社會(huì)化考試所帶來的后效作用和影響,教育測(cè)試專家應(yīng)該制定更為全面的教育和心理測(cè)量標(biāo)準(zhǔn),以期指導(dǎo)、規(guī)范測(cè)試者的行為,使測(cè)試從設(shè)計(jì)、評(píng)估到使用的整個(gè)過程有章可依,最終的考試結(jié)果公平有效并能夠?yàn)榭忌屠嫦嚓P(guān)者負(fù)責(zé)。國(guó)外在語(yǔ)言測(cè)試標(biāo)準(zhǔn)研究和實(shí)踐方面已經(jīng)取得了許多重要成果,如國(guó)外的考試機(jī)構(gòu)分別頒布了《ETS質(zhì)量和服務(wù)標(biāo)準(zhǔn)》《歐洲語(yǔ)言測(cè)試者協(xié)會(huì)行為準(zhǔn)則》《國(guó)際語(yǔ)言測(cè)試協(xié)會(huì)行為準(zhǔn)則》等,但目前還沒有適合我國(guó)國(guó)情并能指導(dǎo)、規(guī)范考試設(shè)計(jì)者和使用者行為的語(yǔ)言測(cè)試標(biāo)準(zhǔn)。正如楊惠中和桂詩(shī)春教授(2007:372)所指出的,政府機(jī)構(gòu)相關(guān)部門應(yīng)盡快制定適合我國(guó)國(guó)情的測(cè)量標(biāo)準(zhǔn),起到“量同衡”的作用。
國(guó)際上目前有多部具有影響力的考試標(biāo)準(zhǔn),考試標(biāo)準(zhǔn)涵蓋從命題到實(shí)施的各個(gè)階段,本文按照標(biāo)準(zhǔn)的側(cè)重點(diǎn)不同分類介紹。第一類,側(cè)重考試實(shí)施方式的標(biāo)準(zhǔn)。如《教育與心理測(cè)試標(biāo)準(zhǔn)》(1985,1999)規(guī)定了測(cè)試的制作、測(cè)試適用范圍、評(píng)估標(biāo)準(zhǔn)等方面,側(cè)重于考試內(nèi)容的測(cè)試標(biāo)準(zhǔn)為考生備考和教師指導(dǎo)提供了方向,減輕了考試負(fù)擔(dān),同時(shí)標(biāo)準(zhǔn)的制定與公開體現(xiàn)了測(cè)試的公平性;《歐洲語(yǔ)言測(cè)試者協(xié)會(huì)行為準(zhǔn)則》(1994)和《教育領(lǐng)域公平測(cè)試行為準(zhǔn)則》(1984,2004)告知相關(guān)人員考試的開發(fā)過程、施考、評(píng)分細(xì)則、考試成績(jī)的報(bào)道方式和分?jǐn)?shù)如何解釋等信息,透明的評(píng)分過程和分?jǐn)?shù)報(bào)告方式令人信服,確保為參考考生提供公平的競(jìng)爭(zhēng)平臺(tái);《ETS質(zhì)量和公平標(biāo)準(zhǔn)》是專門針對(duì)該考試而制定的標(biāo)準(zhǔn),包括ETS評(píng)估類和非評(píng)估類產(chǎn)品和服務(wù)。第二類,側(cè)重道德標(biāo)準(zhǔn)的規(guī)則?!督逃郎y(cè)量中的專業(yè)責(zé)任準(zhǔn)則》(1995)詳細(xì)規(guī)定了參與教育測(cè)量各個(gè)步驟相關(guān)工作人員(如測(cè)試開發(fā)人員、營(yíng)銷推廣人員、施考人員、評(píng)分員等)的責(zé)任與道德規(guī)范;《考生的權(quán)利和責(zé)任:準(zhǔn)則及期望》(1998)與前者相反側(cè)重了考生在考試全過程中的責(zé)任和權(quán)利;《國(guó)際語(yǔ)言測(cè)試協(xié)會(huì)道德準(zhǔn)則》(2000)規(guī)范了測(cè)試全過程中測(cè)試者的道德準(zhǔn)則。第三類,為使用者制定的責(zé)任。《考試使用者資質(zhì)工作小組報(bào)告》(2000)報(bào)告指出了考試使用者應(yīng)具備的核心知識(shí)和技能以及在特定環(huán)境下考試使用者的資質(zhì);《標(biāo)準(zhǔn)化考試使用者的責(zé)任》(2003)強(qiáng)調(diào)了考試使用者的資質(zhì)、專業(yè)知識(shí)以及在考試選擇、施考、評(píng)分、分?jǐn)?shù)解釋及報(bào)道等方面的責(zé)任。
由于我國(guó)英語(yǔ)教學(xué)層次復(fù)雜、考試種類繁多,目前還沒有適合我國(guó)國(guó)情并能指導(dǎo)、規(guī)范考試設(shè)計(jì)者和使用者行為的語(yǔ)言測(cè)試標(biāo)準(zhǔn),但是近年來關(guān)于制定我國(guó)統(tǒng)一的語(yǔ)言能力等級(jí)量表(韓寶成2006;楊惠中等2012)和語(yǔ)言測(cè)試標(biāo)準(zhǔn)(范勁松、金艷2010)的呼聲越來越高。在一些語(yǔ)言測(cè)試中,由于缺少測(cè)試項(xiàng)目的命題范圍,導(dǎo)致內(nèi)容難度沒有明確的描述,出題者在命題時(shí)題目的類型和內(nèi)容隨意性很大,出現(xiàn)各年題目難易不等的現(xiàn)象,如果調(diào)換出題成員,試題思路和測(cè)試項(xiàng)目也可能變化,增加了考生的復(fù)習(xí)難度和學(xué)習(xí)負(fù)擔(dān)。從教育公平性的角度來看,會(huì)使教育資源匱乏地區(qū)的考生備考更加苦不堪言。劉建達(dá)(2014)提出了我國(guó)英語(yǔ)考試等級(jí)量表的制作思路和步驟并提出利用RASCH模型進(jìn)行等值和錨題的選定。
由此,本文提出運(yùn)用項(xiàng)目反應(yīng)理論中的等值技術(shù)來制定標(biāo)準(zhǔn)框架,目的在于提高語(yǔ)言測(cè)試者的出題質(zhì)量和專業(yè)意識(shí),并向考試的利益相關(guān)群體傳播考試開發(fā)和使用的基本知識(shí)以及考試在各個(gè)階段的實(shí)施做法。
制定測(cè)試標(biāo)準(zhǔn)的目的在于公開考試政策、考試程序、錄取結(jié)果等,力求考試的每一個(gè)環(huán)節(jié)和細(xì)節(jié)都能夠成為共享信息,借鑒國(guó)外其他考試標(biāo)準(zhǔn)的制定框架,我國(guó)外語(yǔ)社會(huì)化考試測(cè)試標(biāo)準(zhǔn)可以分為以下幾個(gè)維度。
(一)道德和法律維度
高考是常模參照的大規(guī)模標(biāo)準(zhǔn)化高風(fēng)險(xiǎn)考試,因牽涉到千萬考生的命運(yùn)而歷來受到國(guó)家和社會(huì)的高度重視,被稱為“中國(guó)第一考”。外語(yǔ)考試改為社會(huì)考試需要制定相對(duì)穩(wěn)定的制度以保持考試的公平公正。考試制度的公平則體現(xiàn)在基本原則公平、技術(shù)公平與社會(huì)公平三個(gè)方面。高考要確保人人都享有平等參與考試的權(quán)利和義務(wù),提供相對(duì)平等的參與考試機(jī)會(huì)和條件,考題資源和考試相關(guān)信息向大眾公開,保證考試結(jié)果和教育效果的相對(duì)均等,即每個(gè)學(xué)生接受同等水平的教育后能達(dá)到一個(gè)最基本的標(biāo)準(zhǔn)。
(二)基于項(xiàng)目反應(yīng)理論的考試大綱和考試內(nèi)容界定
首先,外語(yǔ)測(cè)試標(biāo)準(zhǔn)是實(shí)施標(biāo)準(zhǔn)化考試的前提。標(biāo)準(zhǔn)化考試嚴(yán)格要求測(cè)試方式的客觀性,必須制定統(tǒng)一的測(cè)量標(biāo)準(zhǔn)并采用有效措施來減少和控制測(cè)量的誤差。標(biāo)準(zhǔn)化考試是一個(gè)系統(tǒng)工程,它要求考試在各個(gè)環(huán)節(jié)上都按照已有規(guī)定實(shí)施,包括測(cè)試方式、考試時(shí)間、評(píng)分、分?jǐn)?shù)解釋等。其次,外語(yǔ)考試的構(gòu)念效度在測(cè)試標(biāo)準(zhǔn)中的體現(xiàn)??荚嚨臉?gòu)念是指考試測(cè)量和考察到了什么,測(cè)量能力分為語(yǔ)言技能,社會(huì)交際能力和語(yǔ)言使用能力,根據(jù)測(cè)量能力制定考試細(xì)目表是測(cè)試標(biāo)準(zhǔn)中考試內(nèi)容維度的組成部分。本文提出以項(xiàng)目反應(yīng)理論中等值技術(shù)來制定考試標(biāo)準(zhǔn),其前提條件是要保證在測(cè)量語(yǔ)言能力時(shí),不同的試卷具有相同的構(gòu)念并具有較高的信度。項(xiàng)目反應(yīng)理論克服了考生樣本對(duì)于試題參數(shù)的影響,試題難度的因素主要來自于考生對(duì)題目的認(rèn)知和反應(yīng)過程。題目測(cè)量了目標(biāo)的認(rèn)知層次、知識(shí)含量、心理加工時(shí)間和復(fù)雜程度。以項(xiàng)目反應(yīng)理論為理論基礎(chǔ)的試卷等值后試卷具有分?jǐn)?shù)轉(zhuǎn)化對(duì)稱性,分?jǐn)?shù)不變性和跨樣本一致性等諸多優(yōu)勢(shì),這樣就滿足社會(huì)化考試一年多考分?jǐn)?shù)的可比性要求。
(三)考試實(shí)施維度
考試的實(shí)施包括考試環(huán)境,考試時(shí)間和地點(diǎn),監(jiān)考和參考人員的權(quán)利與責(zé)任等。此外,還應(yīng)該規(guī)定在特定環(huán)境下考試使用者的資質(zhì)等。考試實(shí)施維度的制定確保了考試的可行性??荚嚨膶?shí)施在時(shí)間上可以分為三部分。第一,考試前的備考階段。此階段要選定出題人員,理論上出題人員要包括任課教師,測(cè)試專家和招生方,并對(duì)他們進(jìn)行培訓(xùn)和指導(dǎo);確定考試時(shí)間和考場(chǎng)環(huán)境要求等條件;然后針對(duì)考試內(nèi)容制定考試命題雙向細(xì)目表,細(xì)目表的制作方法可參考李筱菊(2000)的制定方法;此外還要給出評(píng)分標(biāo)準(zhǔn),考試范圍和考試大綱。第二,考試的實(shí)施階段??荚噷?shí)施過程中各類突發(fā)事件的處理和應(yīng)對(duì)方法,考場(chǎng)指令和考試規(guī)則等,還應(yīng)該包含監(jiān)考人員須知和考生須知等實(shí)施細(xì)則,并告知考生遵守考試紀(jì)律以及違反規(guī)定后的懲罰措施。第三,考試結(jié)束后。此階段包括分?jǐn)?shù)的公布,分?jǐn)?shù)解釋和試題信效度檢驗(yàn)等??荚嚭笫占忌徒處煹姆答佇畔?,總結(jié)考試和出題經(jīng)驗(yàn)。
我國(guó)對(duì)于語(yǔ)言考試的公平性研究較少,已有的研究多是基于考試技術(shù)層面上的公平性,即DIF(試題差異性)研究、評(píng)分員或試題的偏頗研究等。測(cè)試的公平性不僅包括測(cè)試的技術(shù)層面還應(yīng)包括考試的社會(huì)層面,以測(cè)試公平為目的的測(cè)試標(biāo)準(zhǔn)則從考試的社會(huì)層面顧及考試的公平性,應(yīng)貫穿和指導(dǎo)考試的各個(gè)階段。測(cè)試標(biāo)準(zhǔn)的開發(fā)與起草,往往取決于命題組或者起草人員的主觀性或者經(jīng)驗(yàn)性的認(rèn)識(shí)與了解,項(xiàng)目反應(yīng)理論中等值技術(shù)可以把測(cè)試題目放置于同一量尺之上,從而實(shí)現(xiàn)試卷等值。同時(shí),該理論還可用于構(gòu)建題庫(kù),設(shè)立錨題,項(xiàng)目分析,裁定評(píng)分標(biāo)準(zhǔn)和評(píng)分員與試題是否擬合,是教育測(cè)量中常常使用的測(cè)試?yán)碚摗5戎导夹g(shù)的實(shí)現(xiàn)條件也是測(cè)試標(biāo)準(zhǔn)必要條件,測(cè)試標(biāo)準(zhǔn)除了告知使用者應(yīng)具備的核心知識(shí)和技能外,更重要的是要為試題等值做好前提準(zhǔn)備。
國(guó)外針對(duì)測(cè)試標(biāo)準(zhǔn)和語(yǔ)言能力的研究成果顯著,尤其是歐共體語(yǔ)言框架(CEFR)的頒布對(duì)語(yǔ)言能力等級(jí)做出了詳盡的描述。很多測(cè)試學(xué)家以該框架為標(biāo)準(zhǔn)比較和銜接本國(guó)的語(yǔ)言能力標(biāo)準(zhǔn),如我國(guó)學(xué)者將HSK漢語(yǔ)考試和CEFR比較和對(duì)接。我國(guó)學(xué)者目前正在積極開展外語(yǔ)語(yǔ)言能力等級(jí)和測(cè)試標(biāo)準(zhǔn)等方面的研究。制定外語(yǔ)能力的測(cè)試標(biāo)準(zhǔn)是測(cè)試實(shí)施的首要任務(wù),是保證測(cè)試公平和有效的唯一途徑,是我國(guó)測(cè)評(píng)體系與國(guó)外測(cè)評(píng)接軌的方式,同時(shí)更是為考生,教師和招生院校服務(wù)的考試實(shí)施方案。
[1]Weir,J.C.et al.Measured Constructs. Cambridge∶Cambridge University Press,2013.
[2]Boyd K&Daviesa.Doctorps orders for language testers:The origin and purpose of ethical codes[J].Language Testing,2002(3).
[3]韓寶成,羅凱洲.語(yǔ)言測(cè)試效度及其驗(yàn)證模式的嬗變[J].外語(yǔ)教學(xué)與研究,2013(3):411-425。
[4]范勁松,金艷.語(yǔ)言測(cè)試標(biāo)準(zhǔn)研究:回顧、反思和啟迪[J].外語(yǔ)界,2010(1):82-91.
[5]金艷,張曉藝.技能綜合對(duì)語(yǔ)言測(cè)試構(gòu)念效度的影響—英語(yǔ)考試與大學(xué)英語(yǔ)六級(jí)網(wǎng)考的對(duì)比研究[J].外語(yǔ)電化教學(xué),2013(6):3-10。
[6]李清華.《語(yǔ)言測(cè)試與效度驗(yàn)證—基于證據(jù)的研究方法》述介[J].現(xiàn)代外語(yǔ),2007(2):214-217.
[7]劉建達(dá).我國(guó)英語(yǔ)能力等級(jí)量表研制的基本思路.中國(guó)考試,2015(1):7-13.
[8]楊惠中,杜詩(shī)春.制定亞洲統(tǒng)一的語(yǔ)言能力等級(jí)量表[J].中國(guó)外語(yǔ),2007(2):33-37.
吉丹丹(1977-),黑龍江人,講師,研究方向:語(yǔ)言測(cè)試。
王玉秀(1972-),黑龍江人,副教授,研究方向:翻譯與外語(yǔ)教學(xué)。
(責(zé)編 張翼翔)
河北省教育廳人文社科招生考試專項(xiàng)課題“項(xiàng)目反應(yīng)理論下的英語(yǔ)社會(huì)化考試測(cè)試標(biāo)準(zhǔn)研究”(項(xiàng)目編號(hào)KSZX201415)結(jié)項(xiàng)文章,本文同時(shí)得到國(guó)家留學(xué)基金委資助。