摘 要 測試公平性是語言測試研究主要議題之一。本文通過分析AUA中貫穿的測試公平性理念及其在英語高考新模式中的體現(xiàn),指出英語高考改革符合AUA框架對語言測試開發(fā)和使用的要求,與AUA對測試公平性的追求是一致的,并基于AUA框架關(guān)于測試公平性的理念,嘗試對英語高考改革中的幾個關(guān)鍵問題提出了解決辦法。
關(guān)鍵詞 AUA 框架 英語高考 新模式 語言測試公平性
2014年7月8日,《2017年高考改革方案》正式頒布,明確規(guī)定“英語文理同卷,實行社會化考試,一年兩考,按五級制評價”,“學生可多次報考,最終以最好成績?yōu)闇省?,?017年以后,英語高考采用“一年兩考,取最高分,分等級計入的社會化考試”模式。那么,英語高考改革是否反應(yīng)了當今世界先進的語言測試理念?是否體現(xiàn)了語言測試的公平性?為了回答這些問題,本文從AUA框架的視角,分析了英語高考改革所體現(xiàn)的公平性,探尋其背后的理論支持與語言測試理念,并對英語高考改革所涉及的幾個關(guān)鍵問題進行了思考和建議。
一、AUA框架與語言測試公平性
2003年,Bachman首次提出測試使用論證框架(Assessment Use Argument,簡稱AUA)。[1]在隨后的幾年中,經(jīng)過90余次的修改,Bachman和Palmer于2010年在《語言評估實踐》一書中正式提出并詳細闡釋了AUA框架(見圖1)。[2]AUA框架是Bachman和Palmer對1996年在《語言測試實踐》中提出的“測試有用性”框架認識的升華,[3]代表了當今語言測試理論發(fā)展的前沿。
AUA規(guī)定了測試研發(fā)者和使用者必須承擔對受測試和決策影響的利益相關(guān)者的責任(見圖2),有力地保證了語言測試的公平性。測試研發(fā)者的主要責任是說服決策制定者及其他利益相關(guān)者測試記錄是一致的,測試的解釋是有意義的、公平的、概括的、相關(guān)的和充足的。測試研發(fā)者還應(yīng)該了解測試使用和所作決策對其他利益相關(guān)者所產(chǎn)生的預(yù)期后果。決策制定者的主要責任是說服其他利益相關(guān)者決策具有價值敏感性和均衡性以及測試使用和決策的后果具有善益性,同時還要意識到測試記錄和解釋中存在的不確定性因素。[2]AUA要求將公平性貫穿測試研發(fā)和使用的全過程,它所有的質(zhì)量屬性都體現(xiàn)了測試的公平性。
首先,后果的善益性要求基于測試使用以及所作決策的后果對于所有的利益相關(guān)者都是有益的,測試成績報告的表述必須清楚明白,所有的利益相關(guān)者都能看得懂,并做到及時和保密。
其次,決策的價值敏感性要求決策制定者在作出決策時應(yīng)考慮現(xiàn)存的教育與社會價值觀體系和法律法規(guī),認真權(quán)衡對考生作出錯誤分類的嚴重后果,及格線的劃定要有利于最大限度地減少因錯誤分類而帶來的不利影響;決策的均衡性要求只能根據(jù)所劃定的及格線和制定的決策方案對所有考生進行分類,而不能受其他因素的影響,所有考生和其他利益相關(guān)者都應(yīng)該清楚決策方案是如何制定與執(zhí)行的。
再次,解釋的有意義性要求對所測語言能力(構(gòu)念)的界定應(yīng)依據(jù)具體的教學大綱或相關(guān)語言能力研究成果和理論,測試任務(wù)要與所定義構(gòu)念相關(guān),施測過程能夠使考生發(fā)揮出最好水平;解釋的公平性要求所有考生都應(yīng)熟悉某測試的答題方式、步驟、所用設(shè)備和考試內(nèi)容,測試任務(wù)中不能包含對某些考生不利的話題和文化內(nèi)容,所有考生都看得懂測試記錄過程的表述,所有考生在展示自己的能力方面機會均等;解釋的概括性要求測試任務(wù)特征應(yīng)與目標語言使用任務(wù)特征一致,用于評估考生測試表現(xiàn)與用于評估目標語言使用任務(wù)表現(xiàn)的標準是相同的;解釋的相關(guān)性要求基于考生測試表現(xiàn)的信息應(yīng)該與所作決策需要的信息一致;解釋的充足性要求基于考生測試表現(xiàn)的信息足以對考生作出決定,不需其他額外信息。
最后,測試記錄的一致性要求測試記錄(分數(shù)和描述)在不同的測試任務(wù)、不同的施測環(huán)節(jié)、不同的評分員以及不同的考生群體中始終保持一致。
另外,AUA框架還明確了測試研發(fā)者和決策制定者的主要責任和次要責任,在一定程度上有助于提高測試的公平性。
二、AUA框架與英語高考改革新模式的公平性
對照AUA框架,英語高考新模式的公平性主要體現(xiàn)在以下三方面。
首先,“一年兩考”意味著考生高中三年有六次機會,大大增加了考生接受高等教育的機會,這也是測試公平性的體現(xiàn),因為該措施在很大程度上保證了“施測過程能夠使考生發(fā)揮出最好水平”和“考生在展示自己的能力方面機會均等”,符合AUA中“解釋有意義性”和“解釋公平性”的測試質(zhì)量屬性要求。
其次,“取最高分”意味著決策者將根據(jù)由考生最好的測試表現(xiàn)所推論出的該考生的語言能力對其作出是否錄取的決定;“分等級計入”能夠使考生再也不會因為英語只差一兩分而無緣高等教育。因此,英語高考的使用后果和決策后果對所有考生來說都是有益的,也是測試公平性的體現(xiàn),符合AUA中“解釋的有意義性和相關(guān)性”、“后果的善益性”以及“決策的均衡性”。
最后,“社會化”考試意味著英語高考試卷的設(shè)計與開發(fā)由專業(yè)的測試機構(gòu)來承擔,該機構(gòu)有大量的專職測試研究人員,應(yīng)該是獨立、非盈利的,同時具備公信力,不能由辦學機構(gòu)、培訓學校主辦,例如美國教育測試服務(wù)中心,擁有幾百名全職的測試研究人員,研究開發(fā)了TOEFL、GRE考試等。英語高考采取社會化考試便于明確測試研發(fā)者和決策者的責任,能較好地保證測試的公平性。
三、關(guān)于英語高考改革的建議
以上分析表明,英語高考“一年兩考、取最高分、分等級計入”的社會化考試模式的改革方向是正確的,但是,英語高考作為大規(guī)模高風險的選拔性測試,關(guān)乎全國每年九百多萬考生的前途和命運,必須全盤考慮和細化其設(shè)計、開發(fā)、實施及使用方案。因此,本文基于測試公平性的理念,以AUA框架為理論指導,對英語高考改革提出幾點建議。
1.所考查語言能力(構(gòu)念)的界定要清楚易懂
根據(jù)Bachman和Palmer對語言能力構(gòu)成要素的論述,英語高考應(yīng)該主要考查學生基本的語法和詞匯的掌握情況,常見文體(如敘述性和描寫性文體)基本的閱讀理解能力,基本的聽力理解能力以及能夠用英語(包括口語和書面語)進行簡單的信息和思想交流的能力等,[2]并嚴格按照《高中英語課程標準》(以下簡稱《課標》)規(guī)定的能力標準和要求以及高校人才選拔要求確定擬測能力,所有這些在考試手冊中都要詳細說明,而且根據(jù)不同的利益相關(guān)者要選擇使用專業(yè)性或非專業(yè)性語言,目的是為了讓所有的利益相關(guān)者(如考生、英語高考的開發(fā)者、使用者和決策制定者)都能明白對所考核能力的描述。[2]endprint
2.考試內(nèi)容、答題方式和題型要科學合理,體現(xiàn)公平
這涉及到如何選擇考試內(nèi)容以及以何種方式和題型對這些內(nèi)容進行考核。首先,考試內(nèi)容的選擇要緊扣《課標》,參考高校人才選拔和培養(yǎng)需求,不能有偏題、怪題,不偏向任何考生。其次,不能出現(xiàn)冒犯考生民族禁忌文化的內(nèi)容和話題。[2]我國有56個民族,應(yīng)該充分考慮民族文化差異,避免出現(xiàn)有違民族禁忌的內(nèi)容。最后,采用所有考生都熟悉的答題方式和題型。我國幅員遼闊,東部沿海地區(qū)和內(nèi)陸欠發(fā)達地區(qū)的英語教育水平存在較大差異,因此,答題方式和題型應(yīng)該是所有考生都熟悉的。
3.考試過程要有利于所有考生
所有考生都熟悉并且會使用考試中使用的設(shè)備,在某些設(shè)備出現(xiàn)故障時,能夠迅速啟用備用設(shè)備;考生應(yīng)該在熟悉而舒適的環(huán)境中有足夠的時間來完成考試任務(wù),這是保證考生能夠發(fā)揮出最高水平的重要條件;[2]監(jiān)考人員要進行培訓,讓他們明白監(jiān)考步驟與要求,做到監(jiān)考過程標準統(tǒng)一,會使用或操作所需設(shè)備并能及時正確地處理突發(fā)情況。
4.評分要具有一致性
首先,評分方案、細則以及評分量表的制定至關(guān)重要,這需要二語習得領(lǐng)域的專家、語言測試專家、高中英語教師以及大學英語教師的密切配合和深入研究,在反復論證的基礎(chǔ)上達成共識。其次,要對評分員進行培訓,讓他們充分理解評分方案、細則和評分量表,加強他們的評分公平性意識。
5.基于英語高考成績的決策應(yīng)考慮考生間的差異
考生間存在著個體差異、城鄉(xiāng)差異以及民族差異,這些差異會對他們的測試表現(xiàn)產(chǎn)生影響,從而影響他們的考試成績。個體差異主要體現(xiàn)在性別和認知風格方面。性別差異會使閱讀理解和寫作中的背景材料(如體育、機械等)可能有利于男生而不利于女生。考生的認知特點不僅影響他們的外語學習,而且影響他們對某一類測試題型的反應(yīng),從而造成與構(gòu)念無關(guān)的系統(tǒng)性偏差。城鄉(xiāng)差異主要表現(xiàn)在考生學習條件和考場環(huán)境的不同以及考試內(nèi)容的城市化傾向會對農(nóng)村考生產(chǎn)生不利影響。民族差異主要表現(xiàn)在考生用于學習英語的時間不同。因此,根據(jù)英語高考成績對考生作出決定時,應(yīng)該充分認識到考生間存在的各方面差異,采用DIF定量分析和定性分析相結(jié)合的方法,嚴格審查試題中是否存在性別、認知風格、城鄉(xiāng)以及民族偏差,如果存在偏差,要對成績進行公平性處理。對于少數(shù)民族考生,更要采取不同的政策與措施,比如降低分數(shù)或?qū)λ麄兊姆謹?shù)進行加權(quán)處理,最大限度地減少民族差異給他們帶來的不利影響。
6.成立教育測試服務(wù)中心,建立公平性審查制度,制定公平性原則和標準
英語高考規(guī)模大,影響面廣,存在許多不確定性因素,很難實現(xiàn)理想的公平,因此,成立一個全職的規(guī)模性的語言測試服務(wù)中心(即第三方力量),建立公平性審查制度,制定公平性原則和標準非常必要,這不僅可以監(jiān)督英語高考的研發(fā)者、使用者和決策制定者承擔各自的責任,還可以使他們明確應(yīng)該遵循的原則和達到的標準,從而有效提高公平性。具體而言,可由語言測試專家和相關(guān)職能部門在充分分析和研究的基礎(chǔ)上,參考美國教育測試服務(wù)中心的做法,利用一到兩年的時間逐步成立我國的教育測試服務(wù)中心,并由該中心負責英語高考公平性審查制度的建立和公平性標準的制定,這是英語高考改革真正實現(xiàn)社會化考試面臨的又一挑戰(zhàn)。盡管困難重重,語言測試專家也對第三方力量介入的可行性提出質(zhì)疑,[4]但是,鑒于我國嚴重缺乏對大規(guī)模高風險測試設(shè)計、開發(fā)與使用質(zhì)量的全面研究和監(jiān)管,應(yīng)該也有必要進行這方面的探索和嘗試,這也是促進英語高考改革健康發(fā)展,早日實現(xiàn)與世界先進語言測試理論和實踐接軌的重要保證。
任何大規(guī)模高風險的選拔性語言測試都承擔著艱巨的社會責任,它會影響甚至決定一個人未來的發(fā)展和命運,我國的英語高考就肩負著這樣的使命,鑒于此,英語高考改革成了近期全社會關(guān)注的熱點,褒貶不一??傮w來看,“一年兩考、取最高分、分等級計入”的社會化考試模式符合AUA框架對語言測試開發(fā)和使用的要求,與AUA框架要求將公平性貫穿測試整個過程的核心理念是一致的。限于篇幅,本文僅就英語高考改革的幾個關(guān)鍵問題給出了大致的解決辦法,主要涉及構(gòu)念的界定、內(nèi)容的選擇、評分的要求、考生間的差異、公平性審查制度和原則及標準的制定等。當然,不管英語高考如何改革,我們都要有國家戰(zhàn)略意識,放眼中國國際化和人才國際化的大趨勢,以人的發(fā)展為第一要義,其最終目標應(yīng)該是促進外語教育觀念的轉(zhuǎn)變,使外語教育真正從學生全面發(fā)展的角度出發(fā),為促進學生發(fā)展核心素養(yǎng)的養(yǎng)成做出應(yīng)有貢獻。
參考文獻
[1] Bachman, L. Constructing an assessment use argument and supporting claims about test taker-assessment task interactions in evidence-centered assessment design[J].Measurement:Interdisciplinary Research and Perspectives,2003(1).
[2] Bachman,L.& A. Palmer.Language Assessment in Practice: Developing Language Assessment and Justifying Their Use in the Real World [M].Oxford: OUP,2010.
[3] Bachman, L. & A. Palmer.Language Testing in Practice [M].Oxford: OUP,1996.
[4] 韓寶成,羅凱洲.語言測試效度及其驗證模式的嬗變[J].外語教學與研究,2013(5)..
[作者:姜秀娟(1974-),女,山東臨沂人,曲阜師范大學副教授,碩士生導師,北京外國語大學博士研究生。]
【責任編輯 劉永慶】endprint