宋艷
【摘要】本文回顧了自20世紀(jì)60年代以來語料庫的發(fā)展:從剛開始庫容為100萬的書面語語料庫,到后來庫容為1億的口筆語語料庫;從起初的靜態(tài)語料庫,到后來每年都在增加詞容的動(dòng)態(tài)語料庫;從發(fā)展初期的一般英語語料庫到后來根據(jù)研究目的不同而建立的特殊用途英語語料庫……語料庫伴隨著語料庫語言學(xué)的發(fā)展不斷為語言教學(xué),教材編寫,語言研究,詞典編撰等提供強(qiáng)有力的支撐。此外,本文界定了名物化,提出并論證了名物化與語篇類型的關(guān)系:語篇的正式程度越高,其名物化特征就越明顯。
【關(guān)鍵詞】語料庫 名物化
語料庫是語料庫語言學(xué)研究的基礎(chǔ)。就英語語料庫而言,語料庫可以分為一般英語語料庫,特殊用途英語語料庫,學(xué)習(xí)者語料庫,國際英語語料庫等。不同類別的語料庫為詞典編撰,語言教學(xué),教材編寫,語言研究等提供了有力的支撐。
一、語料庫的發(fā)展
語料庫(corpus)是應(yīng)用計(jì)算機(jī)技術(shù)對(duì)海量自然語言材料進(jìn)行處理、存儲(chǔ),以供自動(dòng)檢索、索引以及統(tǒng)計(jì)分析的大型資料庫。1959年,Randolph Quirk宣布建成了Survey of English Usage (SEU) 語料庫,該語料庫由200篇篇幅為500字符的文本構(gòu)成,總庫容為一百萬字符,其中有一半為口語語料,一半為書面語語料;1961年,美國Brown大學(xué)創(chuàng)建了Brown Corpus;英國Lancaster大學(xué)與挪威Oslo大學(xué)、Bergen大學(xué)在1978年聯(lián)合創(chuàng)建了LOB語料庫;1975年,以J.Svartvik為首的一批語言學(xué)家開始對(duì)R.Quirk 建立的 SEU(Survey of English Usage)語料庫口語部分做韻律標(biāo)注,建成了London-Lund Corpus of Spoken English。這些語料庫的建設(shè)吸引了大批語言學(xué)家通過語料庫手段對(duì)語言進(jìn)行描寫和研究,推動(dòng)了語料庫語言學(xué)的發(fā)展。1987年,Sinclair 主持完成了COBUILD Corpus 的建設(shè),該語料庫庫容5億詞,是迄今最大的語料庫之一,該庫的建成為詞典編撰,語法研究,教材編寫提供了可靠的語料來源;之后建立的(Birmingham Collection of English Texts)語料庫,庫容達(dá)到730萬詞次,到1987年增至2000萬詞次。1994年,英國國家語料庫BNC(British National Corpus)建成,該語料庫庫容1億詞次,收錄了4000余篇口語和書面語文本,最大限度的記錄了真實(shí)運(yùn)用的語言,是迄今為止最有代表性的當(dāng)代英語語料庫。而BCET再次擴(kuò)大演變成為一個(gè)以2億詞次為起點(diǎn)的開放式英語詞庫(Bank of English),到1996年底已增至3.2億詞次,且其規(guī)模仍在繼續(xù)擴(kuò)大。40年間,語料庫從庫容一百萬到庫容1億詞次,直至現(xiàn)在成為開放的、動(dòng)態(tài)語料庫,語料庫借助計(jì)算機(jī)技術(shù)的發(fā)展,在飛速的發(fā)展,語料庫語言學(xué)也從1950s 時(shí)候的不被看好,到現(xiàn)在蓬勃發(fā)展,滲透到應(yīng)用語言學(xué)研究的各個(gè)領(lǐng)域。
我國語料庫語言學(xué)的發(fā)展興起于20世紀(jì)70年代末至20世紀(jì)80年代初,1982年,楊惠中教授主持建設(shè)了交通大學(xué)科技英語語料庫(JDEST),該語料庫為特殊用途英語(English for Specific Purpose 簡稱 ESP)語料庫,由2000個(gè)采樣單位組成,涉及造船,航空,建筑,數(shù)學(xué),物理,化工等多個(gè)領(lǐng)域。JDEST的建成方便了后來的語言學(xué)習(xí)者對(duì)科技英語進(jìn)行詞匯、句法結(jié)構(gòu)、語義搭配、篇章分析等方面進(jìn)行研究,為提高科技英語教學(xué)質(zhì)量做出了重要貢獻(xiàn)。20世紀(jì)90年代后,隨著國內(nèi)語料庫語言學(xué)研究的發(fā)展,一批學(xué)習(xí)者語料庫先后建立起來,包括中國學(xué)習(xí)者英語語料庫(Chinese Learners English Corpus建成LEC),中國學(xué)習(xí)者英語口語語料庫(College Learners Spoken English Corpus,簡稱COLSEC) 中國學(xué)生英語口語語料庫(Spoken and Written English Corpus of Chinese Learners,簡稱SWECCL),香港科技大學(xué)學(xué)習(xí)者語料庫(HKUST Learner Corpus),等等。
二、名物化的界定
名物化(nominalization)指由其他詞類(通常為動(dòng)詞和形容詞)轉(zhuǎn)化為名詞的語法化過程(Richards et al.,2000:309),如move 和movement;real 和reality等?!冬F(xiàn)代語言學(xué)詞典》(A Dictionary of Linguistic sand Phonetics)( David Crystal,2011)將名物化定義為“從其他某個(gè)詞類形成名詞的過程或指從一個(gè)底層小句得出一個(gè)名詞短語的派生過程。”人們對(duì)名物化的認(rèn)識(shí)不是一蹴而就的,而是在不斷認(rèn)識(shí)的過程中形成的。20世紀(jì)初,語言學(xué)家開始關(guān)注名物化現(xiàn)象。Humboldt和Jespersen很早就注意到名物化現(xiàn)象;Lees,Vendler,Zucchi,Heyvaert 也在不同時(shí)期對(duì)名物化現(xiàn)象進(jìn)行了深入的研究;之后,聚焦名詞化并展開跨語言對(duì)比研究的論著也陸續(xù)推出。國內(nèi),范文芳,劉國輝,朱永生等就語言學(xué)不同流派對(duì)名物化的研究都給予了不同程度的關(guān)注。從形式上來看,名物化大致可以分為四種類型:動(dòng)名詞形式、派生性名詞、不定式和名詞性小句。而人們一般認(rèn)為名物化主要是指動(dòng)詞、形容詞的派生性名詞。
名物化作為一個(gè)語言學(xué)范疇產(chǎn)生與人們交際的需要緊密相關(guān);同時(shí)名物化本身與語篇類型也有著密切的關(guān)系。哈桑指出語類即語篇類型,與語境配置(contextual configuration)中的語場(chǎng)有關(guān)(王晉軍:2003)。而語場(chǎng)在很大程度上決定了交際中詞匯的選擇和語言的語法特征,因而可以說語篇的類型制約了詞匯的選擇。除了語音和語法,詞匯的選擇也對(duì)語篇的正式程度有決定性作用。而就名物化來說,筆者認(rèn)為,語篇的正式程度越高,句子結(jié)構(gòu)越完整,詞匯選擇越講究,名物化特征越明顯。為了驗(yàn)證該說法,筆者整理、對(duì)比了以后綴-ness,-tion,-sion,-ment,-ity,-ee,-ism 結(jié)尾的名物化單詞在JDEST,BNC,和法律英語語料庫(LEC)中所占的比值。這三種語料,就語篇類型的正式性而言,法律英語因涉及國家法律,對(duì)詞語,搭配,句法結(jié)構(gòu)等的選擇最為嚴(yán)謹(jǐn),是三種語料當(dāng)中最為正式的語料;科技英語涉及造船,航空,建筑,數(shù)學(xué),物理,化工等多個(gè)領(lǐng)域中英文版的科學(xué)著作、論文、教科書、科技報(bào)告等,是三種語料當(dāng)中次于法律英語較為正式的語料;BNC語料涉及政治,新聞,小說,信件等書面語料,及政府、商業(yè)談判,電視節(jié)目,脫口秀等口語語料,是一般英語(General English)的代表,其語篇類型的正式性低于法律英語和科技英語。
名物化單詞在三個(gè)語料庫中所占百分比。從上面表格中所呈現(xiàn)的數(shù)據(jù)可以看出,名物化單詞在法律英語語料庫中所占的比例為7.36%,在科技英語語料庫中所占的比例為4.02%,在英國國家語料庫中所占的比例為2.55%。三個(gè)語料庫中名物化現(xiàn)象最明顯的是語篇類型最為正式的法律英語,其次是科技英語,名物化現(xiàn)象最不明顯的是由BNC所代表的一般英語。這些數(shù)據(jù)恰恰證實(shí)了筆者的推斷,即,語篇類型與詞匯選擇有密切關(guān)系,語篇的正式程度越高,句子結(jié)構(gòu)越完整,詞匯選擇越講究,名物化特征就越明顯。
參考文獻(xiàn):
[1]Biber,D.,S.Conrad,et al.Corpus Linguistics.New York, Cambridge University Press.2006.
[2]Chomsky,N.Remarks on nominalization.in Readings in English transformational grammar.Mass,Ginn and Company.1970.
[3]Richatads,J.C.e.al.Longman Dictionary of Language Teaching & Applied Linguistics.London,Longman.2000.
[4]Robins,R.H.A short history of linguistics.Beijing,F(xiàn)oreign Language Teaching and Research Press.2003.
[5]Sinclair,J.Corpus,concordance,collocation.Oxford,Oxford University Press.1991.
[6]Sinclair,J.e.al..The Collins COBUILD English Dictionary.Shanghai,Shanghai Foreign Language Education Press.1995.
[7]戴維·克里斯特爾.現(xiàn)代語言學(xué)詞典[M].商務(wù)印書館.2011.
[8]范文芳,汪明杰.論三大流派對(duì)英語名詞化現(xiàn)象的研究[J].外語研究.2003(3):15-18.
[9]桂詩春,楊惠中.中國學(xué)習(xí)者語料庫[M].上海外語教育出版社.2002.
*上海市高校青年教師培養(yǎng)資助計(jì)劃(ZZssy13008)。