張俊
(四川外國語大學,重慶 400031)
第二屆語言測試與評價國際研討會述評
張俊
(四川外國語大學,重慶 400031)
第二屆語言測試與評價國際研討會是由教育部考試中心和浙江大學共同主辦的高規(guī)格語言測試會議。會上,專家學者圍繞會議主題——“外語考試改革與發(fā)展”進行了深入交流和探討。本文從我國英語能力等級量表研發(fā)、外語考試改革、人工智能在語言測試中的應(yīng)用和各類語言測試與評價研究4個方面對會議進行綜述,旨在及時傳遞國內(nèi)外語言測試領(lǐng)域的最新研究成果、研究動態(tài)和發(fā)展趨勢。最后,本文對我國語言測試研究和發(fā)展現(xiàn)狀進行了簡要評述。
語言測試;外語考試;英語能力等級量表;人工智能
第二屆語言測試與評價國際研討會(The Sec?ond International Conference on Language Testing and Assessment)于2016年11月11日至13日在杭州舉行,會議主題為“外語考試改革與發(fā)展”。本屆研討會由教育部考試中心和浙江大學共同主辦,高等教育出版社、外語教學與研究出版社以及《中國考試》雜志社協(xié)辦。國內(nèi)外高校、科研機構(gòu)以及科技和信息技術(shù)公司的200余位專家學者和技術(shù)人員參加了此次研討會,其中包括美國、英國、加拿大以及新西蘭等國際知名高校和教育機構(gòu)的20余位專家。
在會議開幕式上,教育部副部長林蕙青就我國外語能力測評體系建設(shè)做了重要講話。她指出,我國外語能力測評體系建設(shè)的主要目標是,在建立國家外語測評標準的基礎(chǔ)上,推動考試內(nèi)容和形式的改革,完善開發(fā)系統(tǒng)性的考試項目,推動形成性評價與終結(jié)性評價結(jié)合的研究,到2020年,基本建成標準統(tǒng)一、功能多元的現(xiàn)代化外語測評體系。她還指出,我國外語能力測評體系建設(shè)已取得顯著成果。第一,我國英語能力等級量表主體研制工作已經(jīng)完成,計劃于2017年正式對外公布。第二,國家英語能力等級考試的研發(fā)工作進展順利,并將于2020年前逐步推出。第三,高考外語科目改革不斷深化。2017年高考有26個省份使用全國統(tǒng)一命制的英語試卷,考試內(nèi)容改革不斷深化,將有利于增強高考外語科目的基礎(chǔ)性、綜合性、應(yīng)用性和創(chuàng)新性。
本次研討會包括1場特邀發(fā)言、5場主旨發(fā)言、4場專題研討以及18場分會場報告。專家學者主要從我國英語能力等級量表研發(fā)、外語考試改革、人工智能在語言測試中的應(yīng)用以及各類語言測試與評價研究4個方面進行了深入交流與探討。
中國英語能力等級量表(China’s Standards of English,以下簡稱“CSE”)研發(fā)是外語能力測評體系建設(shè)的重要組成部分,是一個龐大的系統(tǒng)工程,涉及各階段英語教學、學習與測評。專家學者圍繞CSE的宏觀建設(shè)與構(gòu)架、CSE與《歐洲語言共同參考框架》(Common European Framework of Reference for Languages,以下簡稱“CEFR”)的對接以及聽力、口語、閱讀、寫作和翻譯等能力子量表開發(fā)等問題進行了報告與交流。
劉建達教授和何蓮珍教授在題為“中國英語能力等級量表及其應(yīng)用”的主旨發(fā)言中表示,我國目前亟需開發(fā)針對我國英語學習者的英語能力等級量表,該量表有助于實現(xiàn)我國各階段英語考試和教學的銜接與連貫。同時,他們還介紹了CSE的理論基礎(chǔ)、研發(fā)過程以及基于CSE的國家英語測試體系。
劍橋大學英語考試部(Cambridge English Lan?guage Assessment)Nick Saville博士以歐洲語言測試委員會(Association of Language Testers in Europe,簡稱“ALTE”)CEFR的開發(fā)為例,詳細介紹了作為CEFR重要組成部分的《語言測試開發(fā)手冊》(Manual for Language Test Development and Examining)中的語言測試開發(fā)原則,以期為我國外語能力測評體系的開發(fā)與建設(shè)提供參考。
何蓮珍教授主持了題為“中國英語能力等級量表之聽力子量表的開發(fā)”的專題研討。課題組成員主要從以下4個方面對相關(guān)研究進行了報告:第一,聽力子量表的研發(fā)過程;第二,CSE聽力描述語的效度驗證;第三,聽力能力描述語的內(nèi)部結(jié)構(gòu)研究;第四,從學生視角探究師生對聽力能力描述語理解存在顯著差異的潛在原因。聽力能力子量表作為CSE不可或缺的部分,對于我國英語學習者聽力能力描述、相關(guān)考試開發(fā)以及聽力教學具有重要作用。
在英語寫作能力等級子量表研究方面,鄒申教授帶領(lǐng)的團隊作了題為“邁向統(tǒng)一的中國英語寫作能力等級量表:原因、方法與指向”的主題研討。課題組成員分別從寫作策略子量表的開發(fā)和初步效度驗證、系統(tǒng)功能語言學文本類型視角下的樣本寫作活動對英語寫作能力描述語構(gòu)建的作用、CEFR寫作描述語在我國英語專業(yè)學生寫作能力等級子量表構(gòu)建中的適應(yīng)性以及英語寫作能力和英語寫作教學的界面研究等方面進行了報告交流。相關(guān)研究對英語作為外語的寫作能力模型進行了探索,旨在為我國英語學習者的寫作能力描述語構(gòu)建提供理論基礎(chǔ)。
此外,有學者對CSE與CEFR的對接問題進行了探討。他們認為,CSE與CEFR的對接十分必要,同時需要注意三個問題:第一,CSE和CEFR如何關(guān)聯(lián);第二,CEFR在多大程度上適用于我國的具體情況;第三,CSE 9個等級和CEFR 6個等級間的關(guān)系如何確定。還有一些學者對寫作元認知策略能力等級量表、口語能力等級量表以及語言能力描述等問題進行了交流探討。
外語考試改革是本次會議關(guān)注的另一焦點。教育部考試中心以及廣東省、上海市和北京市教育考試院的相關(guān)人員主要探討了中考、高考改革,尤其是高考外語一年兩考的實踐。高校語言測試領(lǐng)域的學者主要圍繞外語考試現(xiàn)狀和改革需求、大學英語四、六級考試和專業(yè)英語四、八級考試等的反撥作用以及考試改革中的教師態(tài)度等問題進行了研討。
教育部考試中心喬輝就高考外語科一年兩考改革的研究與實踐進行了報告。他介紹了高考外語科一年兩考的新題型、考試模式以及在浙江省的首次落地實施,認為高考外語科一年兩考有利于降低考試風險,減輕測試對教學的負面影響。教育部考試中心章建石從技術(shù)角度探討了高考外語科一年兩考如何科學落地,認為在我國高考中應(yīng)用西方現(xiàn)代測評技術(shù),應(yīng)該對其進行創(chuàng)造性改造,不能生搬硬套。廣東省教育考試院黃友文從背景、實踐和成效三個方面總結(jié)了廣東省英語聽說考試改革的經(jīng)驗,以期為其他地區(qū)的考試改革提供借鑒。
張文霞教授帶領(lǐng)的研究團隊作了題為“中國外語測試現(xiàn)狀與改革需求的調(diào)查”的專題報告。該團隊對我國高考英語一年兩考改革的態(tài)度、本科階段外語能力測評現(xiàn)狀與需求、高等職業(yè)教育分類英語考試的必要性進行了調(diào)查,并就碩士研究生招生英語考試改革和國外教育機構(gòu)對中國學生外語能力及其測試需求進行了研究,旨在為國家外語能力評價體系的構(gòu)建奠定基礎(chǔ),同時也為國家外語教學提供指導。此外,還有學者報告了英語專業(yè)八級考試改革中教師態(tài)度的調(diào)查結(jié)果、大學英語四級新聞聽力考試對學生學習的反撥作用以及大學英語A、B級考試對高職英語教學的影響。
人工智能在語言測試中的應(yīng)用是本次會議的一大亮點。有關(guān)專家學者以及科技公司的技術(shù)人員共同參與相關(guān)研討。他們圍繞技術(shù)手段在語言測試中的應(yīng)用和意義、基于手寫識別和語音識別的自動評分以及自適應(yīng)考試等問題開展研討。
美國教育考試服務(wù)中心(Educational Testing Service)的習小明博士作了題為“運用技術(shù)改善語言學習與評價體驗:前景與挑戰(zhàn)”的主旨發(fā)言。她詳細論述了技術(shù)在拓展測試構(gòu)念和改善測試設(shè)計方面的重要作用,并就新技術(shù)如何挑戰(zhàn)傳統(tǒng)語言能力評價方式并促成更具真實性的評價體驗這一問題進行了分析。
英國文化委員會高級研究員Vivien Berry博士就視頻會議和面對面兩種口語測試模式對外語測試構(gòu)念的影響開展了研究,以了解兩種模式在考試結(jié)果、語言產(chǎn)出和考生與考官行為方面的異同。據(jù)此,她作了題為“外語考試在中國的創(chuàng)新:面對面口語測試與視頻會議口語測試的對比研究”的發(fā)言。
科大訊飛股份有限公司汪張龍介紹了中英文語音合成、語音識別、手寫識別和評測技術(shù)在語言測試中的應(yīng)用。海云天科技股份有限公司游忠惠和陳光斌在報告中指出,中國是考試大國,尤其是對大學英語四、六級這種大規(guī)模考試來說,在評分上需要巨大的投入,因而自動評分系統(tǒng)的開發(fā)和應(yīng)用在中國具有廣闊的前景,對教學成果提升也有諸多裨益。上海流利說信息技術(shù)有限公司Lance Knowles介紹了適應(yīng)性和語音識別技術(shù)在分班測試中的應(yīng)用。
加拿大多倫多大學Alister Cumming教授作了題為“連接寫作評價與教學:區(qū)分不同目的”的主旨發(fā)言。他認為,常模測試、診斷測試、形成性評價以及終結(jié)性評價有助于連接寫作測試與教學和學習;這4類測試的常規(guī)評價活動分別是水平測試與課程標準、診斷測試與動態(tài)評估、對學生寫作的反饋、課程期末分數(shù)或終結(jié)性評價。北京師范大學武尊民教授帶領(lǐng)的測試團隊就“高中生英語成長診斷系統(tǒng)”課題的相關(guān)研究進行了專題報告,介紹了該診斷系統(tǒng)的意義和貢獻、效度驗證、后效研究以及在高中英語課堂教學中的應(yīng)用模式。
其他測試與評價研究還有:(1)診斷性測試中的認知診斷模型(Cognitive Diagnostic Model,簡稱“CDM”)研究,例如基于CDM的閱讀測試研究和動態(tài)干預模式構(gòu)建等。還有學者對中國高級英語學習者的接收型詞匯和產(chǎn)出型詞匯的診斷測試進行了研究。(2)形成性評價研究,主要涉及學習過程評價的理論與實踐、我國高中和大學英語形成性評價以及我國大學英語形成性評價系統(tǒng)構(gòu)建等。(3)同伴評價,主要涉及學生對同伴評價的認識與實踐、基于同伴互評的專業(yè)英語演講教學模式構(gòu)建以及學生和教師對改進分數(shù)報告的認識等。(4)課堂評價,主要包括少兒英語課堂評價、自主學習課堂評價、教師主導的課堂評價以及課堂評價模式構(gòu)建等。(5)中國少數(shù)民族漢語水平等級考試(MHK),主要涉及MHK口語考試自動評分的信度、效度以及可行性、MHK考生分數(shù)的歷時分析、題庫建設(shè)和漢語能力與測評研究。(6)專門用途英語(ESP)測試,主要涉及學術(shù)英語和商務(wù)英語測試的信度和效度、與ESP課程相關(guān)的測試以及專門用途英語能力模型。
通過會上各位專家學者的發(fā)言,可以看出我國外語考試與評價研究已經(jīng)進入新的發(fā)展時期。首先,英語能力等級量表的研發(fā)對于促進我國外語教學與測試實現(xiàn)“車同軌,量同衡”具有重要作用[1,2-4],這也是我國首次制定覆蓋各教育階段英語教學、學習與測評的能力標準,有利于解決目前各項英語考試標準各異、教學與測試目標分離、各階段教學目標不連貫等問題,從而實現(xiàn)英語教學“一條龍”和多種學習成果的溝通互認[5]。其次,外語考試體系日趨科學和完善,考試設(shè)置和安排也愈發(fā)系統(tǒng)和合理。高考一年兩考的實施將有助于降低考試風險,減輕原來“一考定終身”的負面效應(yīng)。即將推出的國家英語能力等級考試以及其他類型的英語考試改革都反映出我國外語考試正朝著更加科學和完善的方向發(fā)展。林蕙青指出,國家英語能力等級考試對于增強我國主要教育階段英語考試的科學性、系統(tǒng)性和選擇性具有積極作用,為學生外語能力的發(fā)展提供了一個連貫有序的階梯,避免了目前外語教學和考試的重復性和無同一參考標準的盲目性[5]。再次,人工智能技術(shù)在語言測試中的應(yīng)用對于推動語言測試方法和測試模式的創(chuàng)新具有積極作用,有助于全面提升測試的信度和效度。同時,相關(guān)技術(shù)的應(yīng)用還有助于減少從出題到評分過程中的物質(zhì)和人力資源消耗。劉建達就此也曾指出,現(xiàn)代技術(shù)的發(fā)展使考試內(nèi)容、考試實施以及評卷等方面都發(fā)生了十分重要且積極的變化[6]。最后,對各類型測試和評價活動的探討,尤其是對新的評價模式的研究,有助于提高我國外語教學與學習的質(zhì)量,促進我國外語教學健康發(fā)展。
中國英語能力等級量表和國家英語等級考試的研發(fā)表明,語言測試與評價研究已經(jīng)在我國結(jié)出豐碩果實。但這些成果主要還是在借鑒國外的一些理論基礎(chǔ)上產(chǎn)生的,在形成我國本土化的語言測試理論方面,國內(nèi)語言測試界仍然需要付出更多努力,需要進一步加強語言測試理論的創(chuàng)新。同時,語言測試作為一門跨學科研究,需要多學科的交叉與融合,不僅需要依靠語言學的最新研究成果,還需要融入教育學的理念和借助計算機信息技術(shù)的強有力支持。計算機技術(shù)在語言測試中的應(yīng)用將成為今后語言測試研究的一個重點課題。
[1]林蕙青.深化考試招生制度改革加強國家外語能力測評體系建設(shè)[J].中國考試,2015(1):3-6.
[2]劉建達.我國英語能力等級量表研制的基本思路[J].中國考試,2015(1).
[3]劉建達.基于標準的外語評價探索[J].外語教學與研究,2015(3):417-425.
[4]楊惠中.關(guān)于我國外語能力測評體系建設(shè)的幾點思考[J].中國考試,2015(1):12-15.
[5]林蕙青.建立國家外語測評體系 提升國民語言能力[J].中國考試,2016(12):3-4.
[6]劉建達.現(xiàn)代技術(shù)與語言測試——應(yīng)用、影響及發(fā)展方向[J].外語電化教學,2013(4):46-51.
Review of the Second International Conference on Language Testing and Assessment
ZHANG Jun
(Sichuan International Studies University,Chongqing 400031,China)
The Second International Conference on Language Testing and Assessment is a high-level language testing conference co-sponsored by the National Education Examinations Authority and Zhejiang University.Participating experts and scholars had in-depth exchanges and discussions around the theme of this meeting-“Foreign Language Examination Reform and Development”.This paper reviews the conference from four major aspects:the development of China’s Standards of English,the foreign language examination reform,the application of artificial intelligence in language testing and the research of various kinds of language testing and assessment.The paper also introduces the latest research results,research trends and development trends of language testing and assessment at home and abroad.In the end,this paper makes comments on the current situation of language testing research and development in China.
Language Testing;Foreign Language Test;English Language Ability Scale;Artificial Intelligence
G405
A
1005-8427(2017)08-0066-5
10.19360/j.cnki.11-3303/g4.2017.08.012
張俊(1991—),男,四川外國語大學,在讀碩士。
(責任編輯:陳寧)