李英哲
(夏威夷大學(xué),美國 夏威夷96822)
本文從語文評估和評估目的的關(guān)系說起。評估內(nèi)容一般當然針對評估目的而設(shè)計。一般語文評估有無針對性要看評估內(nèi)容,評估形式,評分方式(discrete/ global),受試對象等方面(李英哲2000)。
本文談到語文評估的幾種主要模式:語文水平,語文進度/成績,和語文混合評估(proficiency vs.a(chǎn)chievement vs.prochievement.Domizio,Hsiu-h(huán)uei Lin 1995 )。本文重心是語文水平評估的內(nèi)容和形式,以及語文水平評估的發(fā)展模式。
通過數(shù)十年參與各地(美/新/中/港/臺)語文評估/測試的經(jīng)驗,我總結(jié)自己得到的觀感是:
(一)一般語文測試缺少考慮受試對象的背景和需要
我們應(yīng)該認識真正公平的評估/測試不管是否和語文有關(guān),最重要的是評估內(nèi)容必需考慮受試者的社會文化背景。美國的托福英文測試,GRE,SAT 等測試在幾十年中受到的批評是:它們對非西方主流文化背景的受試者不公平。
(二)語文測試的科學(xué)性和專業(yè)性有待加強
不但測試內(nèi)容需要繼續(xù)改進,就是測試形式是否能達到測試所宣示的目的都有很多疑問。不少標示考查語文水平的測試,需要檢討它們的內(nèi)容和形式是否能真正考核語文實際運用中的交際/使用功能。這一方面反映需要訓(xùn)練更多的專業(yè)測試人員,另一方面反映我們對語文水平的定義有不同的解讀。
(三)雖然很多語文測試者都認為他們測試目的主要為評估聽、說、讀、寫的各種語文技能,但是各種技能的測試內(nèi)容都可能偏重考核語音,語匯,和語法的準確性。
我們需要理解:雖然考查這些語文單位的準確性可以間接反映受試者的語文水平,但是真正的語文水平不能利用考查這些語文單位的準確性來直接反映受試者的實際交際能力。
(四)最理想的語文測試應(yīng)該針對受試者的母語和社會文化背景
最近十幾年在香港理工大學(xué)(陳瑞端2010,2012,祝新華2010,2012)和其他大學(xué)開發(fā)的普通話水平測試才是真正針對說母語(如粵語)者需要而設(shè)計的測試。在美國開發(fā)的中文能力測驗(李英哲1983,1984,1985,1986,1987,1988),SAT2-中文,和AP-中文也是針對英語母語者設(shè)計的中文測試(姚道中2005)。
(五)網(wǎng)絡(luò)和云端科技的發(fā)展還沒有促使很多語文測試者開發(fā)真正的計算機自適測試computer adaptive test (CAT)(姚道中1995,1998,2001)。
雖然不少語文測試已經(jīng)通過網(wǎng)絡(luò)來讓各地受試者使用,但是每個受試者所看到的內(nèi)容仍然和紙本完全一樣,考試的總時數(shù)也是每人固定的:120 分,150 分等。這不是真正的CAT。
本文依照:1 序言,2 語文評估和評估目的,3 中文評估模式:水平,進度/成績,和混合評估,4 語文水平評估的發(fā)展模式,5 結(jié)語:語文水平評估的重點,進行討論。
語文評估內(nèi)容應(yīng)該依照語文評估目的;這個觀念應(yīng)該說沒有多大爭議性。我們已經(jīng)說了,一般語文評估有無面對評估目的的針對性要看評估內(nèi)容、形式、評分、受試者等方面。我們先討論最基本的評估目的。
討論語文評估內(nèi)容時,先需要討論現(xiàn)在一般語文教學(xué)目標是什么?語文教學(xué)目標就是語文評估目的。我拿個人比較熟悉的美國最近情況來討論。在全球華語熱時期,美國大學(xué)理事會在完成SAT2-中文之后,數(shù)年前又決定推動AP-中文(姚道中2005,AP College Board 2008a/b)。
他們所訂的中學(xué)AP-中文課程和測試內(nèi)容是根據(jù)美國國家外語學(xué)習(xí)目標的5C(使用外語交際communication,體認外語文化cultures,連貫學(xué)習(xí)內(nèi)容connection,比較語言文化comparisons,語文社區(qū)實踐communities)來作一般準則(National Standards in Foreign Language Education 1999)。
美國國家外語學(xué)習(xí)目標對文化內(nèi)容還有三方面要求,叫做外語文化的3P。3P (Perspectives,Practices,Products)其實就是一般人類學(xué)中研究各族群文化內(nèi)容時常常提到的三方面:某族群的文化觀念,文化活動,文化產(chǎn)物等。
美國國家外語學(xué)習(xí)目標中訂定了學(xué)習(xí)某種外語時,需要同時學(xué)習(xí):
(一)外語文化觀念(Perspectives:例如信仰,價值觀,思想,態(tài)度等);
(二)外語文化活動(Practices:例如風(fēng)俗習(xí)慣,傳統(tǒng)節(jié)日,社交禮節(jié)等);
(三)外語文化產(chǎn)物(Products:如文學(xué)作品,書畫,口述故事,舞蹈,儀式,筷子等)。
這三方面的要求涵蓋了一般人所熟知的各種文化內(nèi)容,可是它們對特別是在美國中學(xué)/大學(xué)的華語文化學(xué)習(xí)目標并沒有特殊指針性作用。3P 內(nèi)容失于廣泛籠統(tǒng);僅顯示美國外語教學(xué)對體認文化的重視。
不過,在這里我們也看到了很多語文教學(xué)目標中對實際交際能力和對雙方文化的重視。序言中,我們已經(jīng)提到現(xiàn)在各地開發(fā)的語言測試都有一些共同問題:缺乏社會文化背景針對性,缺乏綜合交際能力針對性,缺乏語文水平內(nèi)容針對性,缺乏測試形式針對性等。我們再討論語文水平等問題。
傳統(tǒng)語言教學(xué)常只注意到學(xué)習(xí)者對語文內(nèi)部的語音、語匯、語法等語言單位的吸收或?qū)φZ言文化內(nèi)容的理解。八十年代語言教學(xué)界開始從語文外部的宏觀視角來觀察和討論一般語言學(xué)習(xí)或者習(xí)得的結(jié)果代表學(xué)習(xí)者獲得了甚么能力。
新的宏觀看法告訴我們:語文學(xué)習(xí)者的實際水平應(yīng)該表現(xiàn)在特定的情境(和內(nèi)容)里。他運用已經(jīng)學(xué)會的各種語言單位,以及利用適當?shù)恼Z體來發(fā)揮某種語言功能時,我們才觀察得到他的真正水平。因此語言功能,語言情境(內(nèi)容),語言技能,語言體裁等經(jīng)過綜合觀察后,才能比較恰當?shù)卦u定一個學(xué)習(xí)者的語文水平。
語文水平顯示在特定溝通情況中,而溝通能力則是適當?shù)墓δ?,情?內(nèi)容),技能,和體裁等的綜合發(fā)揮。溝通能力的發(fā)揮也顯示在學(xué)習(xí)者是否能實際完成某種特定的語言任務(wù)(linguistic task)。
語言功能一方面發(fā)揮在受試者于各種層次的敘述,請求,提問,說明,議論等語言能力,一方面顯示在他是否能適當利用所學(xué)語文的各種語用習(xí)慣(包括稱呼、問候、謝歉、謙辭、褒獎、隱私、禁忌等。(方麗娜2007)。
語言情境則需查考受試者在各種生活和工作環(huán)境里的表達/理解能力;這些能力顯示在他是否能完成不同的諸如購買,交涉,遵循交通指示,閱讀電器使用說明,委婉拒絕某種要求等語文任務(wù)。尤其在高等測試中需要考核不同專業(yè)語文的內(nèi)容。
因此提供學(xué)生不同練習(xí)來完成日常生活中各種任務(wù)的教學(xué)法,在語言學(xué)習(xí)過程中特別重要。對于華語作為第二語言的美國學(xué)生,中文表達方式可能和英語相差很大,所以需要多給他們機會在真實的語境中,多練習(xí)理解和表達比較自然的語言。認識不同情境和文化也是理解華語內(nèi)容的關(guān)鍵。
一般語文學(xué)習(xí)都使用不同教材;在各個學(xué)習(xí)階段會顯示不同進步情況:包括每課課文中所學(xué)到的內(nèi)容,以及不同學(xué)習(xí)階段所學(xué)得的語言單位。傳統(tǒng)語言教學(xué)中考察學(xué)生對語音,語匯,語法等語言單位,在不同階段的學(xué)習(xí)結(jié)果和掌握情況,就是語文進度測試或成績測試。
語文混合評估即是語文水平和語文進度/成績測試在各種程度的混合測試。當前很多標示語文水平測試的內(nèi)容實際都是語文進度和水平的混合測試。初/中級語文學(xué)習(xí)者所顯示的水平程度也是進度和水平的混合(prochievement)。
因為這些學(xué)習(xí)者在初始學(xué)習(xí)階段有實際需要,盡量掌握所學(xué)語文的基本語音,語匯,語法等語言單位,而他的實際語文交際能力仍然十分有限,所以混合評估形式能夠比較合理地測試他的有限語文程度。不過對中/高級語文水平的第二語言學(xué)生,如果要考核他的語文交際/使用能力,就應(yīng)該盡量采取真正語文水平的測試內(nèi)容和形式了。
我們已經(jīng)提到在各種語文水平評估內(nèi)容和形式的設(shè)計及開發(fā)中,各地測試者都在極力改進。本文想建議大家今后盡早朝計算機自適測試(CAT)模式發(fā)展(姚道中1995,1998,2001)。網(wǎng)絡(luò)和云端科技的進步給了我們很大的發(fā)展空間。無論開發(fā)哪種語文測試(水平,進度/成績,混合評估),計算機自適測試模式提供我們很大方便。
(一)它通過網(wǎng)絡(luò)可以超越時空限制,提供給各地受試者使用
(二)它的開發(fā),改進,使用等可以節(jié)省很多人力和物力(包括紙筆等)
(三)它可以讓開發(fā)者隨時隨地修改測試內(nèi)容和增減題庫數(shù)量(題庫數(shù)量越多,就越減少泄露測試內(nèi)容之虞)
(四)它可以完全依照每個受試者程度和需要出題(即使同等級受試者也不會看到完全相同題目)
(五)它可以節(jié)省每個受試者實際考試時間(至少減半)
(六)新開發(fā)的測試可以很快地推廣到世界各地
(七)它可以讓測試開發(fā)者迅速做試測,分析,統(tǒng)計,測量等工作,改進測試的信度和效度。
計算機自適測試的好處實在不勝枚舉。相信今后會有很多人朝這個方向發(fā)展;希望在座各位專家走在別人前面,希望中文測試的云端發(fā)展走在其他語文測試前面。
假如大家同意本文對語文水平的定義,我們就可說真正語文水平評估的重點即是考核下列:
(一)語言水平考核在特定社會文化背景,以及各種實際生活和工作環(huán)境中的交際/使用能力。
(二)語言水平觀察在特定溝通情況中,適當?shù)墓δ?,情?內(nèi)容),技能,和體裁等的綜合發(fā)揮。
(三)語言水平分別考核聽、說、讀、寫等技能的各等各級使用能力。
(四)語文水平考核綜合的大意理解(global understanding),不是細節(jié)的理解,除非細節(jié)理解和大意有關(guān)。
(五)語文水平觀察跨文化交際層次的語用習(xí)慣(包括稱呼、問候、謝歉、謙辭、褒獎、隱私、禁忌等)。這些特別體現(xiàn)中國文化崇尚集體、和諧、關(guān)心、尊重、熱心、謙虛等傳統(tǒng) 觀念(方麗娜2007)。
(六)語文水平考核聽、說、讀、寫技能的等級能力,以初、中、高的不同級別標示,而不以綜合分數(shù)評定等級。一般學(xué)習(xí)者聽、讀理解能力高于說、寫表達能力,說話能力高于寫作能力。
(七)語文水平測試不單獨考核語音,語匯,和語法的準確性。語文水平不能利用考查語文單位的準確性來直接反映實際交際能力。
(八)由于語文水平測試需要直接考查受試者的日常交際/使用能力,因此測試盡量選擇實際生活及工作環(huán)境中可見可聞的真實素材。
(九)語文水平測試盡量避免考查聽寫,朗讀,字詞發(fā)音,詞匯意義,詞匯造句,句型造句,完成造句等項目。
(十)語文水平測試里的測試說明/指令,以及問題和答案選項等盡量使用學(xué)習(xí)者母語。
陳瑞端、祝新華等編:《小學(xué)普通話水平的考試研究》,北京:商務(wù)印書館,2010年。
陳瑞端:《語言政策與普通話教學(xué)及評估》,《中學(xué)普通話水平的考試研究》,北京:商務(wù)印書館,2012年。
陳瑞端主編:《中學(xué)普通話水平的考試研究》,北京:商務(wù)印書館,2012年。
方麗娜:《語言與文化》,《華語文研究與教學(xué)》,2007年,253 -288 頁。
李曉琪主編:《對外漢語文化教學(xué)研究》,北京:商務(wù)印書館,2006年。
李英哲、唐秀玲等:《普通話教師的語文水平要求與教材和課程的設(shè)計》,《香港語文教育學(xué)院》,1993年,178 頁。
李英哲:《美國最近漢語教學(xué)方向與語言使用能力準則的擬定》,《第一屆國際漢語教學(xué)研討會論文集》,北京:世界圖書出版公司,1986年。
李英哲:《最近語文教學(xué)方向與能力測驗的設(shè)計》,《第一屆世界華語文教學(xué)研討會論文集》,1985年。
李英哲:《對外漢語教學(xué)中閱讀理解的一些關(guān)鍵問題》,《語文教學(xué)面面觀》,田小琳等主編,香港:香港文化教育出版社,1994年。
李英哲:《漢語說話測試的設(shè)計》,《第二屆中美語文教學(xué)研討會》,1983年,18 -20 頁。
李英哲:《美國外語教學(xué)學(xué)會對外語使用能力程度的訂定與能力測試的編寫》,《普通話測試論文集》,99 -110 頁,香港中國語文學(xué)會(1985年會議),1988年。
李英哲:《語言測試的針對性》,《語言測試的理論與實踐》,李學(xué)銘主編,香港:香港商務(wù)印書館,2000年。
李英哲:《中文電視理解計算機課程的設(shè)計教學(xué)》,《第4 屆世界華語文教學(xué)研討會論文集》,1995年,臺北。
李英哲:《自學(xué)華語計算機課程內(nèi)容設(shè)計與應(yīng)用》,《教育技術(shù)和媒體(Instructional Technology and Media)》,臺北,1997年。
劉 珣:《試論漢語水平測試》,《語言教學(xué)與研究》,1983年第4 期。
劉英林、郭樹軍、王志芳:《漢語水平考試(HSK)的性質(zhì)和特點》,《世界漢語教學(xué)》,1988年第2 期。
劉英林:《談?wù)剬ν鉂h語教學(xué)的測試問題》,《對外漢語教學(xué)論文選》,中國教育學(xué)會對外漢語教學(xué)研究會編,1983年。
謝錫金:《香港的教育體制、課程與中國語文學(xué)習(xí)領(lǐng)域改革的方向》,《中外母語教材比較研究論集》,江蘇:江蘇教育出版社。
姚道中:《網(wǎng)上計算機自適中文閱讀測試簡介》,《第二屆全球華文網(wǎng)絡(luò)教育研討會論文集》,臺北:華僑委員會,2001年。
姚道中:《由SAT 到中文AP 測試》,《二十一世紀華語機構(gòu)營運策略與教學(xué)國際研討會論文集》,臺北:臺灣師范大學(xué),2005年。
College Board,AP.AP Chinese Language and Culture:Sample Syllabus 1 -4.a(chǎn)pcentral.collegeboard.com.2008b.
College Board,AP.Chinese Language and Culture:Course Description.a(chǎn)pcentral.collegeboard.com.2008a.
Domizio,Hsiu-h(huán)uei Lin.Prochievement in Light of SOPI and OPI:Activities for Advanced Speakers of Chinese.Paper presented at the Annual Meeting of the American Council on the Teaching of Foreign Languages.1995.
LI Yinzhe(李英哲).ACTFL Chinese Proficiency Guidelines (with Albert E.Dien,Shou-h(huán)sin Teng,Ronald Walton,et al).Foreign Language Annals.47l-87.1987.
LI Yinzhe(李英哲).Chinese Proficiency Tests for Listening and Reading.(w/ Shang Ho,Ronald Walton,et al.)Ctr.for Applied Linguistics,D.C.30 pp.(test forms).1984
LI Yinzhe(李英哲).Chinese Proficiency Tests for Speaking (4 parallel forms,w/ S.Ho,R.Walton,et al.)Ctr.for Applied Linguistics,Washington,D.C.40 pp.(test forms).1985.
LI Yinzhe(李英哲).Development,Validation,& Dissemination of a Proficiency-based Test of Speaking in Chinese & an Associated Assessment Model for Other Less Commonly Taught Languages (w/ J.Clark,).ERIC.DC:Ctr.for Applied Ling.1986.
LI Yinzhe(李英哲).Language Proficiency Requirements for Teachers of Putonghua and the Design of Putonghua Courses and Materials for Teachers.Hong Kong:Institute of Language in Education.43 pp.1993.
National Standards in Foreign Language Education.1999.Standards for Foreign Language Learning:Preparing for the 21st Century.Alexandria:American Council on the Teaching of Foreign Languages.
Tseng,M.F.AP Chinese Language and Culture:Teacher’s Guide.New York:The College Board.2007.
Yao,Tao-chung & Yuichi Watanabe Validation of CATRC:A Computer-Adaptive Test for Reading Chinese.Lucy Lower& Haejin E.Koh (eds.)Voices and Visions in Global Perspective:Selected Papers from the Second College - Wide Conference for Students in Languages,Linguistics and Literature.Honolulu:National Foreign Language Resource Ctr.,University of Hawaii 147 -52.1998.
Yao,Tao-chung (姚道中).A Computer-Adaptive Test for Reading Chinese (CATRC):A Preliminary Report.Journal of the Chinese Language Teachers Assoc.0.1:75 -85.1995.