薛紅勤
摘 要: 文章主要介紹了語(yǔ)料庫(kù)的概念及其發(fā)展歷程,就語(yǔ)料庫(kù)在外語(yǔ)教學(xué)與研究中的應(yīng)用進(jìn)行了介紹。語(yǔ)料庫(kù)不僅在技術(shù)層面上豐富了外語(yǔ)教學(xué)的手段,而且使原來(lái)停留在理論和空想中的教學(xué)理念變?yōu)楝F(xiàn)實(shí)。隨著語(yǔ)料庫(kù)研究的不斷發(fā)展,人們已經(jīng)在語(yǔ)言研究、語(yǔ)言教學(xué)、語(yǔ)言測(cè)試、詞典編撰、人工智能等領(lǐng)域應(yīng)用了語(yǔ)料庫(kù)。
關(guān)鍵詞: 語(yǔ)料庫(kù) 語(yǔ)料庫(kù)語(yǔ)言學(xué) 教學(xué)應(yīng)用
1.語(yǔ)料庫(kù)概念及發(fā)展史
語(yǔ)料庫(kù)(Corpus)是一個(gè)由大量在真實(shí)情況下使用的語(yǔ)言信息經(jīng)過(guò)科學(xué)的收集和組織而集成的專供研究使用的資料庫(kù)。語(yǔ)料庫(kù)中的語(yǔ)料是某種語(yǔ)言中自然出現(xiàn)的,可以是書(shū)面的,也可以是口頭的。語(yǔ)料庫(kù)語(yǔ)言學(xué)就是在文本語(yǔ)料的基礎(chǔ)上進(jìn)行語(yǔ)言研究的一門(mén)學(xué)科。語(yǔ)言學(xué)家把這種材料作為研究語(yǔ)言的素材。由于電腦語(yǔ)料庫(kù)容量大,資料真實(shí),信息提取準(zhǔn)確,因此,語(yǔ)言學(xué)家借助語(yǔ)料庫(kù)可以多方面多層次地描寫(xiě)語(yǔ)言并驗(yàn)證各種語(yǔ)言理論和假設(shè),甚至建立新的語(yǔ)言模式和語(yǔ)言觀。
在沒(méi)有出現(xiàn)計(jì)算機(jī)之前,建設(shè)語(yǔ)料庫(kù)是一項(xiàng)十分繁重而成效甚微的工作。Samuel Johnson花了八年時(shí)間(1747—1755)才編成了世界上第一部英語(yǔ)詞典,其中大部分時(shí)間都用在尋找、整理語(yǔ)料與建立語(yǔ)料庫(kù)上。強(qiáng)調(diào)運(yùn)用語(yǔ)料分析和描寫(xiě)語(yǔ)言的美國(guó)結(jié)構(gòu)主義語(yǔ)言學(xué)家Sapir和Baos在上個(gè)世紀(jì)初,為了搜集語(yǔ)料走訪一些印第安部落。但是到了上個(gè)世紀(jì)50年代后期,隨著Chomsky的生成語(yǔ)法學(xué)派的興起,“基于語(yǔ)料”的描寫(xiě)語(yǔ)言學(xué)受到抨擊。因?yàn)镃homsky認(rèn)為語(yǔ)料只不過(guò)是對(duì)語(yǔ)言行為的取樣,不能直接反映存在于人的大腦中的語(yǔ)言能力,因此不能作為語(yǔ)言研究的依據(jù)和材料。上世紀(jì)60年代初,很少有人對(duì)真實(shí)的語(yǔ)言素材進(jìn)行研究。而基于語(yǔ)言學(xué)家的語(yǔ)感和直覺(jué)所得到的“可能的句子”及“不可能的句子”成了語(yǔ)言研究及語(yǔ)法教學(xué)的主要數(shù)據(jù)來(lái)源。
Quirk在1959年宣布建立英語(yǔ)用法調(diào)查語(yǔ)料庫(kù)(SEU),要對(duì)英語(yǔ)語(yǔ)法進(jìn)行全面準(zhǔn)確的描寫(xiě),提出新的語(yǔ)料庫(kù)語(yǔ)言學(xué)研究。隨著計(jì)算機(jī)的出現(xiàn),不久之后,美國(guó)的Francis和Kucera等人利用計(jì)算機(jī)建立了布朗語(yǔ)料庫(kù)。在Quirk提出的語(yǔ)料庫(kù)語(yǔ)言學(xué)中,他強(qiáng)調(diào)研究自然語(yǔ)言材料的重要性,并引用Aldous Huxley的話說(shuō):“我們最精到的理論,我們最細(xì)致的描寫(xiě),都不過(guò)是對(duì)實(shí)際情況極度粗糙而又不講理的簡(jiǎn)化,實(shí)際情況的每個(gè)最簡(jiǎn)單的實(shí)例都是無(wú)比復(fù)雜的。”同時(shí)他指出,實(shí)際情況的這種復(fù)雜性正是語(yǔ)料庫(kù)語(yǔ)言學(xué)所需要研究的。從Quirk建立SEU語(yǔ)料庫(kù)開(kāi)始,五十多年時(shí)間來(lái),語(yǔ)料庫(kù)語(yǔ)言學(xué)的研究范圍不斷擴(kuò)大,并取得很大的研究成果,語(yǔ)料庫(kù)語(yǔ)言學(xué)在語(yǔ)言學(xué)界的地位越來(lái)越重要。近些年借助計(jì)算機(jī)技術(shù)建立的語(yǔ)料庫(kù),規(guī)模大、功能多、檢索方便,使語(yǔ)言研究的手段和方法更豐富,對(duì)語(yǔ)言的理論探索也產(chǎn)生深遠(yuǎn)影響。
2.語(yǔ)料庫(kù)的作用
語(yǔ)料庫(kù)最直接的用途就是為編纂字典提供大量真實(shí)準(zhǔn)確的例句,例如,根據(jù)COBU ILD語(yǔ)料庫(kù)編寫(xiě)的詞典就有七種。除此之外,Leech(1993)還列出語(yǔ)料庫(kù)的十幾種用途,包括語(yǔ)言理論﹑語(yǔ)法﹑語(yǔ)義研究、語(yǔ)篇分析、兒童語(yǔ)言習(xí)得、語(yǔ)言學(xué)習(xí)、語(yǔ)言測(cè)試等。隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,基于網(wǎng)絡(luò)的語(yǔ)料庫(kù)為外語(yǔ)教學(xué)提供了大量新鮮的語(yǔ)言原料, 同時(shí)為編寫(xiě)辭典、語(yǔ)法書(shū)及各種教材的提供了重要語(yǔ)料。事實(shí)上,現(xiàn)在一些對(duì)外語(yǔ)教學(xué)有重要影響的辭典和語(yǔ)法書(shū)都是以基于語(yǔ)料庫(kù)的方式編寫(xiě)的。除此之外,語(yǔ)料庫(kù)在外語(yǔ)教學(xué)的思想、理論、方法、內(nèi)容及手段等方面都起著十分重要的作用。為了更好地說(shuō)明語(yǔ)料庫(kù)在外語(yǔ)教學(xué)和研究中的應(yīng)用,筆者從下面幾個(gè)方面介紹語(yǔ)料庫(kù)的應(yīng)用。
2.1語(yǔ)料庫(kù)與詞匯教學(xué)
在傳統(tǒng)外語(yǔ)教學(xué)中,詞匯教學(xué)往往只是“單”詞的教學(xué),大部分語(yǔ)言教師都把單詞教學(xué)作為首位。但是,語(yǔ)言中的詞與詞之間經(jīng)常存在音、形、義等各方面的聯(lián)系,如果單純地只學(xué)習(xí)一個(gè)詞,則是無(wú)法看到這種聯(lián)系的。現(xiàn)在我們可以通過(guò)計(jì)算機(jī)技術(shù),迅速?gòu)陌锨f(wàn)個(gè)詞的語(yǔ)料庫(kù)中,把某個(gè)在這個(gè)語(yǔ)料庫(kù)中出現(xiàn)的詞或短語(yǔ)全部實(shí)例檢索出來(lái),并同時(shí)統(tǒng)計(jì)出該詞或短語(yǔ)出現(xiàn)的頻率。這樣更準(zhǔn)確更全面地建立詞匯之間的關(guān)系,從而認(rèn)識(shí)到各語(yǔ)言形式在實(shí)際交際中的意義和用法。例如:桂詩(shī)春教授主持的國(guó)家“九五”社科規(guī)劃項(xiàng)目“中國(guó)英語(yǔ)學(xué)習(xí)者語(yǔ)料庫(kù)”項(xiàng)目,她通過(guò)收集5個(gè)組別(中學(xué)﹑大學(xué)英語(yǔ)四級(jí)﹑大學(xué)英語(yǔ)六級(jí)﹑專業(yè)英語(yǔ)低年級(jí)和專業(yè)英語(yǔ)高年級(jí))的學(xué)生作文語(yǔ)料,共計(jì)100多萬(wàn)個(gè)詞,并按詞形﹑動(dòng)詞詞組、名詞詞組、代詞、形容詞詞組、副詞、介詞詞組、連詞、詞匯、搭配和句法制定了一個(gè)有61個(gè)細(xì)目的言語(yǔ)失誤標(biāo)注表,然后對(duì)整個(gè)語(yǔ)料庫(kù)進(jìn)行標(biāo)注。從兩個(gè)方面對(duì)中國(guó)學(xué)生英語(yǔ)進(jìn)行分析:一是對(duì)比其他以英語(yǔ)為母語(yǔ)的語(yǔ)料庫(kù)分析學(xué)習(xí)者的語(yǔ)料特征;二是對(duì)失誤特征進(jìn)行分析。這個(gè)項(xiàng)目屬于國(guó)際上第一部公開(kāi)發(fā)布的學(xué)習(xí)者語(yǔ)料庫(kù),它對(duì)研究中國(guó)學(xué)生的語(yǔ)言應(yīng)用和使用失誤等特征,以及它們與外語(yǔ)學(xué)習(xí)之間的關(guān)系等都具有十分重要的指導(dǎo)作用。
2.2語(yǔ)料庫(kù)與句法研究
句法與在其他方面的研究一樣,越來(lái)越多地依賴語(yǔ)料庫(kù),并成為目前利用語(yǔ)料開(kāi)展研究最多的語(yǔ)言層面。其原因首先是語(yǔ)料標(biāo)和計(jì)算機(jī)檢索手段的發(fā)展,使得對(duì)語(yǔ)言中有代表性的語(yǔ)法現(xiàn)象加以量化分析更容易。其次是通過(guò)量化具備代表性的語(yǔ)法現(xiàn)象檢測(cè)根據(jù)語(yǔ)法理論所提出的假設(shè)。五十年代以來(lái)形成注重理論的理性學(xué)派(rationalistic)與注重實(shí)際語(yǔ)料的經(jīng)驗(yàn)學(xué)派(empirical),從八十年代中期以來(lái)呈現(xiàn)出前所未有的交匯,即很難判斷兩大研究傳統(tǒng)的研究者到底屬于哪個(gè)學(xué)派。他們開(kāi)始用客觀的自然語(yǔ)料庫(kù)檢測(cè)理性的語(yǔ)法理論。而不只是純粹地通過(guò)描寫(xiě)歸納客觀語(yǔ)言現(xiàn)象生成新的語(yǔ)法理論。羅芒( Romaine 1996)以British National Corpus (BNC)為依據(jù),研究了雙重比較級(jí)現(xiàn)象。荷蘭的Njmegen 大學(xué)以J.Aarts為首的研究者,首先根據(jù)語(yǔ)言學(xué)家的內(nèi)省及現(xiàn)有的語(yǔ)法描述設(shè)計(jì)了一套形式語(yǔ)法,將其輸入電腦在語(yǔ)料庫(kù)中運(yùn)行,檢測(cè)該語(yǔ)法對(duì)語(yǔ)料庫(kù)數(shù)據(jù)的解釋程度,其次根據(jù)語(yǔ)料分析結(jié)果修訂語(yǔ)法,通過(guò)這種研究方法,他們認(rèn)為語(yǔ)料庫(kù)使理論得到檢驗(yàn)和進(jìn)一步發(fā)展。
2.3語(yǔ)料庫(kù)與心理語(yǔ)言學(xué)
語(yǔ)料庫(kù)是心理語(yǔ)言學(xué)家對(duì)其收設(shè)進(jìn)行測(cè)試研究的有力工具,尤其在語(yǔ)言病理分析方面能幫助研究人員準(zhǔn)確確定問(wèn)題到底發(fā)生在語(yǔ)言發(fā)展的哪一階段。
2.4語(yǔ)料庫(kù)與語(yǔ)言和語(yǔ)言教學(xué)
迅猛發(fā)展起來(lái)的電腦語(yǔ)料庫(kù)語(yǔ)言學(xué)近年來(lái)出現(xiàn)從純語(yǔ)言研究發(fā)展到語(yǔ)料庫(kù)與語(yǔ)言教學(xué)相結(jié)合研究的新趨勢(shì)。語(yǔ)料庫(kù)在語(yǔ)言教學(xué)方面得到直接或間接的應(yīng)用。學(xué)生可以從語(yǔ)料庫(kù)中得到現(xiàn)實(shí)生活中真正會(huì)碰上的語(yǔ)言材料,并且現(xiàn)有許多專家已經(jīng)開(kāi)始利用語(yǔ)料庫(kù)對(duì)現(xiàn)有教學(xué)材料進(jìn)行批評(píng)性研究。他們把從課本中發(fā)現(xiàn)的問(wèn)題與語(yǔ)料庫(kù)中的真實(shí)語(yǔ)料進(jìn)行比較,以此了解英語(yǔ)本族語(yǔ)的人們是如何表達(dá)這些意義的。另外,一批研究人員已開(kāi)始建立“特定用途英語(yǔ)”語(yǔ)料庫(kù)提供特定領(lǐng)域的語(yǔ)言學(xué)習(xí)材料,如廣州石油英語(yǔ)語(yǔ)料庫(kù)(約411,000個(gè)詞)。語(yǔ)料庫(kù)同時(shí)在歷史語(yǔ)言學(xué)、方言等領(lǐng)域發(fā)揮重要作用,這種作用將隨著計(jì)算機(jī)的不斷發(fā)展而變得更顯著。
3.語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展方向及前景
目前,計(jì)算機(jī)正以驚人的速度向前發(fā)展,語(yǔ)料庫(kù)語(yǔ)言學(xué)研究在國(guó)外開(kāi)展得如火如荼。面對(duì)碩果累累的國(guó)外語(yǔ)料庫(kù)語(yǔ)言學(xué)研究,我們應(yīng)該轉(zhuǎn)換觀念,更新思路,充分認(rèn)識(shí)到語(yǔ)料庫(kù)研究對(duì)我國(guó)語(yǔ)言研究的重要意義,密切注意國(guó)外語(yǔ)料庫(kù)語(yǔ)言學(xué)發(fā)展的最新動(dòng)態(tài),充分利用一切語(yǔ)料庫(kù)資源和語(yǔ)料庫(kù)研究成果,并結(jié)合我國(guó)的語(yǔ)言教學(xué)和研究現(xiàn)狀,進(jìn)行更深入的語(yǔ)言研究和語(yǔ)言應(yīng)用研究。總之,計(jì)算機(jī)的發(fā)展使得用語(yǔ)料庫(kù)開(kāi)展研究的人越來(lái)越多,從而擴(kuò)展到研究的各個(gè)領(lǐng)域,同時(shí)語(yǔ)料庫(kù)中所收內(nèi)容也會(huì)更廣泛、豐富。
參考文獻(xiàn):
[1]陳建生.關(guān)于語(yǔ)料語(yǔ)言學(xué)[J].當(dāng)代語(yǔ)言學(xué),1997(1).
[2]C.J.F illmore(1992).Corpus Linguistics.J.Starvic(ed),1992, Directions in Corpus Linguistics, Berlin: Moutonde Gruyter.
[3]杜秉正,董眉君(1991).大學(xué)英語(yǔ)語(yǔ)法與練習(xí)[M ].上海:上海外語(yǔ)教育出版社;章振邦.(1989)新編英語(yǔ)語(yǔ)法(修訂本)[M]上海:上海譯文出版社.
[4]Johansson, S.Times change,and so do corpora[A].In Ajmer,K.&Altenberg ,B.(eds.)English Corpus Linguistics:Studies in Hon our of Jan Svartvik [C] .London and New York : Longman,1991.
[5]曾國(guó)強(qiáng).語(yǔ)料庫(kù)在外語(yǔ)教學(xué)與研究中的應(yīng)用.福建外語(yǔ),2004(2).
[6]武和平,王秀秀.基于網(wǎng)絡(luò)的語(yǔ)料庫(kù)及其在英語(yǔ)教學(xué)中的應(yīng)用.電化教育學(xué)院,2002(10).