鄺計嘉 蔣慶勝
(四川省瀘州醫(yī)學(xué)院外國語學(xué)院,四川瀘州 646000)
語料庫語言學(xué)是近30年來在國內(nèi)外迅速發(fā)展起來的跨學(xué)科領(lǐng)域,在教學(xué)中引入大型語料庫是當(dāng)今外語教育發(fā)展的新趨勢。現(xiàn)代外語教學(xué)不僅要求教育者具有良好的外語水平和教學(xué)能力,還要具備對語言教育和教學(xué)的研究能力(何安平2004)。 基于語料庫的教學(xué)研究能夠使外語教師們從理性思維的角度出發(fā),運(yùn)用計算機(jī)技術(shù)分析數(shù)據(jù),從而科學(xué)地掌握教學(xué)規(guī)律,進(jìn)行教學(xué)研究,而不僅僅是寫一些個人的教學(xué)總結(jié)體會,或者是生搬硬套國內(nèi)外教學(xué)理論來附會自己的教學(xué)經(jīng)驗。
語料庫語言學(xué)應(yīng)用于英語教學(xué)早已有之。mindt(1996)對LLC(英國口語語料庫)的前12篇以英語為本族語的對話語料庫為參照,發(fā)現(xiàn)德國中學(xué)的英語教學(xué)大綱中的語法排序與本族語中的實際運(yùn)用存在不一致的情況。他(1997)又利用語料庫為教材設(shè)計出some和any的教學(xué)安排方案。而建設(shè)學(xué)習(xí)者中介語語料庫,并使用計算機(jī)檢索工具作為輔助手段,能夠快速準(zhǔn)確地獲取有關(guān)錯誤出現(xiàn)的頻率、種類與語境多方面的信息。Ellis(1994)曾指出對外語學(xué)習(xí)者的語言差錯分析必須基于定義準(zhǔn)確的語料抽樣,才能清楚地回答學(xué)生到底犯了哪些類型的錯誤,在什么樣的情況下犯錯等等問題。國內(nèi)外已經(jīng)建立的學(xué)習(xí)者大型語料庫包括:1990年比利時盧邁大學(xué)英語語料庫研究中心的S.Granger教授開始主持建立的高級英語學(xué)習(xí)者書面語料庫ICLE(internationalcorporaoflearners’english)(Granger1994:25-29)1998年,她又開始主持建設(shè)國際英語學(xué)習(xí)者口語語料庫LINDSEI(Granger2000),匯集來自法國、瑞士等多個國家的高級英語學(xué)習(xí)者的英語對話和獨白語料。在我國,1997年,由廣東外語外貿(mào)大學(xué)的桂詩春和上海交通大學(xué)楊慧中教授聯(lián)合主持建立了超百萬詞次的中國大中學(xué)生英語作文語料庫CLEC(見桂詩春2001),香港大學(xué)建立的TELECStudentCorpus(香港中學(xué)生書面英語語料庫)(Allen1998)。南京大學(xué)外國語學(xué)院和外語教育與研究出版社共同建設(shè)的SWECCL中國學(xué)生英語口筆語語料庫?;谶@些語料庫,研究者們也做出了一些研究成果。如李景泉,蔡金婷(2001)利用CLEC語料庫對中國學(xué)生英語寫作中冠詞錯誤用現(xiàn)象進(jìn)行分類,并解釋出原因。王立非,魯巖(2007)利用WECCL(中國學(xué)習(xí)者英文筆頭作文語料庫)和ICLE(中國學(xué)習(xí)者英文筆頭作文語料庫)以及LOCNESS(國際英語學(xué)習(xí)者語料庫)相類比,對大學(xué)生英語論文中高頻動詞使用進(jìn)行研究。
中介語語料庫已經(jīng)在中國蓬勃開展起來。但是由于中國東西差異較大,沿海和內(nèi)陸差異較大,如CLEC,WECCL等語料庫并不能很好地代表西部高校學(xué)生的水平。要了解本?;蛘呤亲约核虒W(xué)生的作文水平或者語言水平,盲目借鑒CLEC等語料庫的檢索成果是不明智的。所以自建學(xué)生的小型語料庫具有自身的可能性和必要性。
前期準(zhǔn)備工作包括將作文題目布置好后,讓學(xué)生將作文以學(xué)號命名匯總。由于語料庫檢索對語料庫本身就具有嚴(yán)格的要求,如文本格式,字符空格,縮寫詞等等,這些要求事先都告訴學(xué)生,讓學(xué)生養(yǎng)成良好的習(xí)慣,并且在某種意義上,都成為語料庫前期的編輯者。針對教學(xué)重點,讓學(xué)生對自己的作文進(jìn)行賦碼。比如,某次作文練習(xí)講解的是作文功能詞的運(yùn)用,在寫完作文后,教師指導(dǎo)學(xué)生自己將自己的作文的功能詞標(biāo)出并賦碼。一是方便我的檢查,二是考察學(xué)生是否自己能夠識別并運(yùn)用,培養(yǎng)學(xué)生元認(rèn)知的能力。
利用wordsmith中wordlist的一項功能,可以對學(xué)生作文的單詞數(shù),類符數(shù),形符數(shù),類符形符比,平均單詞長度,每一個單詞長度的單詞數(shù)等等進(jìn)行統(tǒng)計,信息一目了然,如圖1。字?jǐn)?shù)不夠,詞匯量過少等等一系列問題能夠迅速根據(jù)相關(guān)數(shù)據(jù)判斷出。
利用antconc對相關(guān)詞語進(jìn)行檢索,比如此次筆者布置的一篇題為NothingSucceedsWithoutaStrongWill的四級作文,題目要求作文對“Quittingsmokingistheeasiestthingintheworld.I’vedoneithundredsoftimes.“進(jìn)行評價。所以在antconc中,以smoking作為關(guān)鍵詞,對concordanceplot進(jìn)行檢索,能夠迅速看出學(xué)生作文是在哪一部分對這句有關(guān)smoking的句子進(jìn)行評價,并且評價了多少次,有沒有漏評。如圖2所示。
舉例來說,用AntConc的N-grams進(jìn)行檢索時,可以對作文的高頻詞匯進(jìn)行排序搭配,從而發(fā)現(xiàn)一些語言過度使用的現(xiàn)象。如本次作文中,筆者發(fā)現(xiàn)peoplethink處于N-grams的前列:80篇作文中Peoplethink共出現(xiàn)了38次。借此,筆者推斷,學(xué)生對peoplethink在學(xué)生作文中有過度使用的傾向。對學(xué)生進(jìn)行逐個訪談,詢問他們?yōu)槭裁聪矚g用這樣的表達(dá),是否有其他表達(dá)方式等等,對這一現(xiàn)象做出原因分析,并提出解決辦法,詳見另文。
外語教學(xué)中,我們常常會面對詞表。教材背后的生詞表,大綱要求的大綱詞表。而在精讀課文講解,閱讀理解練習(xí)、聽力材料的選擇時,我們需要對篇章中的詞匯有所判定,如超綱詞,活用詞。而此種判定需要相應(yīng)的基礎(chǔ)詞表,稱為底表(basewordlist)(梁茂成等2010)。學(xué)生的作文語料庫可以利用range生成總體詞匯分布情況和單獨每個學(xué)生的詞匯分布情況。可以利用總體分布情況按照不同年級的維度進(jìn)行區(qū)分,從而描述不同年級學(xué)生的詞匯總體分布情況,探索學(xué)生的學(xué)習(xí)趨勢和規(guī)律。也可以將單個詞語出現(xiàn)的頻率列出來,發(fā)現(xiàn)學(xué)生具體使用了什么詞,用了多少頻率。與額外制作的教材詞表進(jìn)行對比,可以發(fā)現(xiàn),學(xué)生在多大程度上運(yùn)用了新學(xué)的單詞。對于一些抱怨新學(xué)單詞用不上的同學(xué),可以將語料庫中出現(xiàn)了課文詞匯的例句提出,進(jìn)行示范講解。
語料庫語言學(xué)的研究與統(tǒng)計學(xué)的概率有關(guān),來源于真實的材料和數(shù)據(jù)。當(dāng)代計算機(jī)的普及使得語料庫的研究成為可能。本文總結(jié)的自建學(xué)生作文語料庫的應(yīng)用,是站在巨人肩上,借用前人開發(fā)的語料庫工具,如wordsmith,antconc,range詞表等,得出的數(shù)據(jù)能夠驗證或者提出學(xué)生平時學(xué)習(xí)的問題和自己教學(xué)中發(fā)現(xiàn)的問題。將學(xué)生的作文集結(jié)成庫,利用語料庫工具進(jìn)行檢索考察,獲得客觀的數(shù)據(jù),遠(yuǎn)比自己根據(jù)教學(xué)反思總結(jié)得出來的抽象經(jīng)驗可靠得多。不足之處在于,語料庫檢索工具對語料庫的格式要求比較高。這需要在收集學(xué)生作文時,便和學(xué)生把要求講清楚,并自己再仔細(xì)按照要求進(jìn)行檢查。
何安平(2004).語料庫在外語教育中的應(yīng)用:理論與實踐[M].廣州:廣東高等教育出版社出版。
何安平(2004).語料庫語言學(xué)與英語教學(xué)[M].北京:外語教學(xué)與研究出版社。
梁茂成,李文中,許家金(2010).語料庫應(yīng)用教程[M].外語教學(xué)與研究出版社。
楊惠中,桂詩春(2001).中國學(xué)習(xí)者英語語料庫[M].上海:上海外語教育出版社。