鐘蘭鳳 張璘
摘 要: 語料庫作為一種新方法,在詞典研編領(lǐng)域得到了普遍的認可。雖然這項技術(shù)手段的革新為詞典學(xué)理論與實踐研究提供了新的研究空間,但也提出了新的挑戰(zhàn)。語料庫詞典研編的最大挑戰(zhàn)是如何快速有效地梳理語料庫提供的龐大的具有語境共現(xiàn)的多義詞的義項及釋義。系統(tǒng)功能語言學(xué)是以實際使用中的語言的功能為研究對象,是對語言的各個系統(tǒng)的研究,這些理論研究為應(yīng)對這一新的挑戰(zhàn)提供了內(nèi)部條件。實踐表明,系統(tǒng)功能語言學(xué)對及物系統(tǒng)的研究可以幫助我們快速梳理語料庫中的多義詞的義項,有助于編者完成具象—抽象—具象的釋義過程。
關(guān)鍵詞: 漢英詞典; 語料庫詞典研編; 系統(tǒng)功能語言學(xué)
中圖分類號: H06文獻標(biāo)識碼: A文章編號: 1671-6604(2012)02-0062-05
近年來,隨著計算機應(yīng)用技術(shù)的發(fā)展及語言分析工具的增加,語料庫在詞典編纂與研究領(lǐng)域受到了越來越多研究者的青睞,基于語料庫的詞典編纂也隨之得到了人們的認同。一門新的交叉學(xué)科——語料庫詞典學(xué)也就應(yīng)運而生了。我國詞典學(xué)界對基于語料庫的詞典研編基本上持贊同的態(tài)度,認為它解決了制約傳統(tǒng)詞典發(fā)展的一些“瓶頸”問題;同時,人們也意識到了語料庫詞典研編的局限性。
到目前為止,我國學(xué)者對語料庫詞典學(xué)的討論主要集中在優(yōu)勢與局限的話題范圍,討論基本上停留在經(jīng)驗的層面,缺乏理性的思考。而且,討論的對象大都是單語詞典或外漢詞典。隨著“漢語熱”的升溫,漢外詞典的質(zhì)量直接影響著我國民族文化輸出的質(zhì)量。作為一門新興的交叉學(xué)科,語料庫詞典學(xué)有其共性的一面,但不同類型的語料庫詞典學(xué)也存在個性的一面。不同類型的詞典由于其讀者群不同,編寫的目的不同,其研編的思路及所依據(jù)的理論也應(yīng)有所不同。如面對中國英語學(xué)習(xí)者的漢英詞典的研編就不能完全照搬國外的單語或外漢詞典研究成果。漢英語料庫詞典研編所面臨的挑戰(zhàn)是什么?我們?nèi)绾螒?yīng)對這些挑戰(zhàn)?這些問題還沒有引起學(xué)者們深入系統(tǒng)的探討,我們也沒有看到這方面的專論。本文擬從語料庫詞典學(xué)的興起與發(fā)展、基于語料庫的漢英詞典研編所面臨的機遇與挑戰(zhàn)、應(yīng)對的策略三個方面來談?wù)勎覀兊拇譁\認識。
一、 語料庫詞典學(xué)的興起與發(fā)展
語料庫詞典學(xué)(Corpus Lexicography)[1]這一術(shù)語首次出現(xiàn)在Atkins的著作中。從該詞的結(jié)構(gòu)來看,語料庫詞典學(xué)是語料庫與詞典學(xué)的有機結(jié)合。語料庫是指“用科學(xué)的抽樣原則進行選材,具有一定的目的性,可以用計算機軟件檢索的語言電子文本庫”[2] 247。由此可見,如今的語料庫與傳統(tǒng)的詞典編纂中所使用的“卡片式”的語料庫是存在差別的,那就是計算機應(yīng)用技術(shù)的參與。王馥芳與羅敏莉以是否應(yīng)用計算機技術(shù)為界限,把語料庫詞典學(xué)的發(fā)展分為前計算機時代和計算機化時代[3]。前者指計算機應(yīng)用技術(shù)興起之前的詞典編纂所使用的卡片式資料收集時代。
為了區(qū)別于傳統(tǒng)詞典編纂領(lǐng)域所使用的“卡片式”語料庫方法,不同的學(xué)者使用了不同的術(shù)語。Ooi在其著作中使用的術(shù)語是“計算機語料庫詞典學(xué)”(Computer Corpus Lexicography)[4]1-2。Hartmann和James在《詞典學(xué)詞典》中使用的術(shù)語是“基于語料庫的詞典學(xué)”(corpus瞣riented lexicography)[5]31。我國學(xué)者章宜華和雍和明根據(jù)詞典涉及的媒介和詞典語料來源把當(dāng)代詞典學(xué)分為計算詞典學(xué)(computational lexicography)與語料庫詞典學(xué)(corpus lexicography)[6]411-413。前者研究如何利用計算機技術(shù)輔助詞典學(xué)研究和詞典編纂;后者是指基于語料庫的詞典學(xué)理論研究和詞典編纂的學(xué)問。前者側(cè)重于研究如何為輔助詞典編纂而設(shè)計和開發(fā)各種計算工具和方法;后者綜合并吸取了計算語言學(xué)、計算詞典學(xué)和語料庫語言學(xué)的觀點和方法,主要致力于基于語料庫的詞典編纂原則和實踐方面的研究。
以上對語料庫詞典學(xué)概念的分析表明:現(xiàn)代語料庫詞典學(xué)的興起與發(fā)展得益于計算機存儲及提取技術(shù)的發(fā)展,是技術(shù)革命的結(jié)果,并不僅僅是作為流行語言研究工具的語料庫語言學(xué)與詞典學(xué)結(jié)合的結(jié)果。雖然語料庫詞典學(xué)這一術(shù)語首次出現(xiàn)在上個世紀90年代,但真正意義上的語料庫詞典學(xué)興起于上個世紀80年代初,其標(biāo)志性事件是Sinclair主持的Cobuild語料庫的建立并利用它編寫了系列詞典。Cobuild系列詞典的成功帶動了語料庫詞典學(xué)的發(fā)展。此外,“牛津系列”詞典、“朗文系列”詞典和《劍橋國際英語詞典》的編寫都借助了語料庫,取得了豐碩的成果。
①詳見《外語研究》2006年第2期、《解放軍外語學(xué)院學(xué)報》2006年第3期、《現(xiàn)代外語》2006年第4期的相關(guān)文章介紹。語料庫與詞典編纂結(jié)合所取得的成就及社會效益也引起了我國語言學(xué)界及詞典學(xué)界學(xué)者的關(guān)注。與英語詞典的研編相比,漢語詞典及漢英詞典的研編在理論研究和編纂的技術(shù)手段上都較為落后。直到本世紀,我國第一個基于平行語料庫的漢英雙語詞典編纂系統(tǒng)CpsDict才誕生。它是南京國際關(guān)系學(xué)院李德俊教授在南京大學(xué)雙語詞典中心攻讀博士學(xué)位時獨立開發(fā)的①。CpsDict系統(tǒng)的研發(fā)標(biāo)志著我國語料庫詞典學(xué)在技術(shù)上邁開了一大步,基本解決了基于語料庫的漢英詞典編纂的技術(shù)問題,填補了我國這方面實踐研究的空白。
二、 基于語料庫研編漢英詞典所面臨的挑戰(zhàn)
顧名思義,語料庫詞典學(xué)是以語料庫為手段,以詞典學(xué)研究為目的的學(xué)問,是語料庫語言學(xué)與詞典學(xué)的自然聯(lián)姻。語料庫語言學(xué)是指以語料庫為基礎(chǔ)的語言研究與語言分析。由此可見,語料庫語言學(xué)能為語料庫詞典學(xué)提供借鑒,但能借鑒的主要是語料庫的方法、觀點以及技術(shù)手段。就這一點而言,語料庫語言學(xué)是語料庫詞典學(xué)的基礎(chǔ)。
語料庫詞典學(xué)有自己的特色。根據(jù)李德俊教授的觀察,語料庫詞典學(xué)具有以下特色:(1) 語料庫不是話語的全部,只是話語全域的縮影;(2) 語料庫詞典學(xué)摒棄了傳統(tǒng)詞典學(xué)給詞義定位的本體論觀念,取而代之的是根據(jù)不同語境獲取的用法和意義;(3) 語料庫詞典學(xué)不排斥人工的合理干預(yù)[2]43-44。
技術(shù)手段的革新為理論研究提供了新的空間。綜觀國內(nèi)外有關(guān)語料庫詞典學(xué)的文獻,我們發(fā)現(xiàn)語料庫詞典學(xué)的研究者們主要從事以下三類工作:(1) 有關(guān)語料庫詞典學(xué)的軟件開發(fā)及語料庫建設(shè);(2) 利用語料庫編寫各類詞典;(3) 系統(tǒng)描述基于語料庫的詞典編纂活動。前兩項工作在國內(nèi)外都有不少學(xué)者從事,而最后一項卻鮮有學(xué)者涉足。
語料庫詞典學(xué)的興起使得詞典學(xué)的研究視角得到了極大的拓展,研究者們把視角轉(zhuǎn)向了實際使用中的語言,為詞典學(xué)研究提供了新的機遇。語料庫詞典學(xué)雖然解決了制約傳統(tǒng)詞典發(fā)展的一些“瓶頸”問題,如出版及修訂周期長、資料的收集與存貯、搭配定義的界定、詞頻的統(tǒng)計、義項的科學(xué)排列及新詞的確定難度大、詞目收錄的滯后性、詞義描述的片面性、例證選取上的人工痕跡太強等[7],但也提出了新的挑戰(zhàn),具體表現(xiàn)如下:(1) 既然語料庫不是話語的全域,話語入庫的條件是什么?入選條件的明晰化至關(guān)重要,因為話語的選擇在很大程度上決定了詞目的選擇及其釋義與配例的選擇。(2) 語料庫為我們提供了浩如煙海的文本,挑選什么樣的例句才能算得上是科學(xué)的?如何才能發(fā)揮例證的輔助釋義功能?(3) 語料庫給我們提供的是實際使用中的語言,語義依附于特定的語境,而且話語的篇幅不一定完全符合詞典出版的經(jīng)濟原則,我們?nèi)绾尾拍茏龅郊缺3至嗽捳Z的原語境又能使話語的篇幅符合商業(yè)要求?這就涉及了重新語境化問題。(4) 漢英語言間的差異給我們界定多義詞的義項帶來了很大的困難,我們?nèi)绾卫谜Z料庫提供的豐富話語實踐來探索漢語多義詞義項劃分的理論依據(jù)?(5) 在平行語料庫中,漢英兩種語言實現(xiàn)了零距離接觸。詞典編纂者應(yīng)該具備怎樣的基本素質(zhì)才能保證漢語不受到英語的干擾,保持漢語言文化的獨特性?
以上這些挑戰(zhàn)歸根結(jié)底還是語言學(xué)問題,是技術(shù)發(fā)展所帶來的新問題,單純依賴技術(shù)的進步是無法解決的。語言學(xué)與詞典學(xué)的淵源由來已久。根據(jù)Al-Kasimi、魏向清、王馥芳的研究,英語詞典編纂史上的每一個創(chuàng)新都與英語語言學(xué)理論的發(fā)展密不可分,如社會語言學(xué)、轉(zhuǎn)換生成語言學(xué)、認知語言學(xué)、語料庫語言學(xué)的研究成果都不同程度地促進了詞典學(xué)的發(fā)展與革新,更有甚者促使了新學(xué)科分支的誕生,如認知語言學(xué)與詞典學(xué)的聯(lián)姻誕生了認知詞典學(xué)[8]1-11,[9],[10]3。以上每一個語言學(xué)流派都不同程度地促進了前計算機時代詞典學(xué)的發(fā)展,但卻不能完全滿足語料庫詞典學(xué)的發(fā)展趨勢,我們有必要轉(zhuǎn)向新的語言學(xué)理論,尤其是以語義研究為目的的語言學(xué)理論。據(jù)我們考察,還沒有學(xué)者把系統(tǒng)功能語言學(xué)理論系統(tǒng)地應(yīng)用在詞典學(xué)的研究中。隨著計算機應(yīng)用技術(shù)的發(fā)展,語料庫作為詞典編纂的工具已成必然趨勢,語料庫詞典編纂的理論研究也迫在眉睫。語料庫詞典學(xué)的發(fā)展不能單純依靠技術(shù)的進步,技術(shù)僅是輔助手段,因此,語料庫詞典學(xué)要得到長足的發(fā)展不得不實行技術(shù)開發(fā)與理論研究并行,否則一方發(fā)展的滯后必然影響另一方的發(fā)展。
三、 應(yīng)對的策略
如上所述,基于語料庫的詞典研編有賴于現(xiàn)代語言學(xué)理論研究成果的合理應(yīng)用。系統(tǒng)功能語言學(xué)是以漢、英語言結(jié)構(gòu)為基礎(chǔ)建立的普通語言學(xué)描寫模式,既研究語言的使用,也不忽略語言的結(jié)構(gòu),是“自上而下”的研究模式。以下將從系統(tǒng)功能語言學(xué)理論研究視角來考察基于語料庫的漢英詞典研編的內(nèi)部條件,并結(jié)合具體實例來論證其在漢英詞典研編過程中的獨特作用。
(一) 系統(tǒng)功能語言學(xué)關(guān)照漢英詞典研編的內(nèi)部條件
系統(tǒng)功能語言學(xué)是從歐洲功能主義派生出來的學(xué)派, 它吸收了歐洲功能主義理論,發(fā)展了一個從實體、形式到語義、情景;從潛在的系統(tǒng)到實際的結(jié)構(gòu)(功能) 的語法理論。系統(tǒng)功能語言學(xué)要研究的是“作為社會符號的語言”[11]1-5,采用社會學(xué)研究方法從語言的各個層面來討論語義及語義的體現(xiàn)。這些層面包括語境層和語言層,前者包括文化語境層和情景語境層,兩者之間是“示例”關(guān)系;后者包括語義層、詞匯語法層和音系/字系層,他們之間是“體現(xiàn)”關(guān)系。
語義系統(tǒng)是體現(xiàn)更高層次的體現(xiàn)系統(tǒng),即體現(xiàn)情景語境的系統(tǒng)。這樣我們就可以從情景語境的特征推測出語篇特征。文化語境與語類(genre)有關(guān),情景語境與語域(register)有關(guān)。語言的使用是在人類某一活動領(lǐng)域中單個而具體的話語形式(包括口頭的和書面的話語)中實現(xiàn)的。每一個單個的表述,無疑是個人的,但使用語言的每一個領(lǐng)域卻會形成相對穩(wěn)定的話語類型,即我們所說的語類(genre)。語域是指語言的功能變體。所謂功能變體,就是因情景語境的變化而產(chǎn)生的語言變化形式。情景語境有三個變量:話語范圍、話語基調(diào)和話語方式。話語范圍指的是交談的話題以及場地等情景因素。話語基調(diào)指的是交際雙方的社會角色關(guān)系即個人基調(diào)和話語活動的目的。話語方式指的是語言活動所采取的媒介或渠道,它可能是口頭的,也可能是書面的,或是介于兩者之間的。這三個變量分別對應(yīng)語義系統(tǒng)中的三大元功能系統(tǒng):概念功能、人際功能、謀篇功能。它們共同作用,制約說話者對詞語和語義結(jié)構(gòu)的選擇,即任何一個變量的變化都有可能導(dǎo)致語言變體。
對語類、語域的深度研究為我們構(gòu)建具有代表性的語料庫奠定了基礎(chǔ)。既然語料庫不是話語的全部,只是話語全域的縮影,我們所建立的語料庫理應(yīng)具有代表性,以最大限度地保證不漏選詞目、詞義和析取典型例證,為人工的合理干預(yù)提供依據(jù)。此外,由于系統(tǒng)功能語言學(xué)包羅了語言學(xué)所涉及的各個領(lǐng)域, 形成了一個龐大的理論體系, 我們除了可以進行從文化語境的意識形態(tài)動因分析語篇特征外,還可以進行實體產(chǎn)生的全過程分析,如可以進行主位結(jié)構(gòu)、語氣結(jié)構(gòu)、信息結(jié)構(gòu)、及物性結(jié)構(gòu)分析以及詞素、詞、詞組、小句、句子、段落、章節(jié)等多結(jié)構(gòu)、多層次、多級階的分析。這些分析構(gòu)成了語料庫詞典研編所需要的知識與技能。
(二) 及物系統(tǒng)研究對釋義的關(guān)照
下面我們以“現(xiàn)已”一詞為例,應(yīng)用系統(tǒng)功能語言學(xué)理論中的及物系統(tǒng)來闡述系統(tǒng)功能語言學(xué)對語料庫詞典學(xué)研究的價值。及物系統(tǒng)是功能語言學(xué)中體現(xiàn)經(jīng)驗功能的一個語義系統(tǒng),其作用是把人們在現(xiàn)實生活中的所見所聞、所作所為分成若干種“過程”,即將經(jīng)驗通過語法進行范疇化,并指明參與各種過程的“參與者”與“環(huán)境成分”。韓禮德認為,人們可以通過及物系統(tǒng)把人類的經(jīng)驗分成六種不同的過程:物質(zhì)過程、心理過程、關(guān)系過程、行為過程、言語過程、存在過程[12]106-143。
前面我們已提及漢英詞典的釋義主要是找到英語中的對等表達。問題是并不是所有的漢語詞匯單位在英語中都是通過詞匯手段實現(xiàn)的,有的是通過語法手段實現(xiàn)的,有的是通過語法與詞匯手段共同實現(xiàn)的,如“現(xiàn)已”一詞就屬于這種情況。通過檢索,我們發(fā)現(xiàn)了以下帶有“現(xiàn)已”一詞的話語:(1) 中國的電話普及率現(xiàn)已達到26%。(China餾 telephone penetration rate has reached 26 percent.)(2) 溫柔體貼的愛麗絲,現(xiàn)已白發(fā)蒼蒼,略微發(fā)福。(Gentle Alice has now become gray and heavy. )(3) 結(jié)果現(xiàn)已日見明朗。 (The results are becoming clear.)(4) 電腦屏幕上現(xiàn)已出現(xiàn)了第一個匹配的數(shù)據(jù)。(The screen was already showing the first of the hits now.)(5) 羅斯林教堂現(xiàn)已成為喜歡冒險的獵奇者們朝圣的圣地。(Rosslyn had now become a pilgrimage site for mystery seekers.)(6) 小溪現(xiàn)已變成了奔騰的江河。(The stream has now become a torrent.)
以上含有“現(xiàn)已”的6個英語對等表達均屬于“關(guān)系過程”中的歸屬類關(guān)系小句。關(guān)系過程指的是反映事物處于何種關(guān)系的過程,它又可進一步分為“歸屬”和“識別”兩大類。歸屬類指某個實體具有哪些屬性,或者歸于哪種類型。歸屬類小句有三個共同之處:都含有一個表示“屬性”的成分;都含有屬性的“載體”;都含有表示關(guān)系過程的動詞。從以上6個英語小句可以看出,“現(xiàn)已”一詞在英語中沒有對等的詞匯表達,它是通過語法手段(第1、3、4句)或語法手段與詞匯手段相結(jié)合的方式(第2、5、6句)來實現(xiàn)的。因此我們可以從功能的角度來給“現(xiàn)已”一詞釋義:表示事物(載體)的屬性發(fā)生了或正在發(fā)生變化,主要通過進行時態(tài)或完成時態(tài)來實現(xiàn),有時可以與“already”或者“now”結(jié)合共同實現(xiàn),常與表示“變化”的動詞組合,如become、reach、arrive、show等。這種從功能的角度對在英語中找不到對應(yīng)詞的漢語詞匯單位的功能性釋義有利于培養(yǎng)中國英語學(xué)習(xí)者的目標(biāo)語再生成能力。這種釋義也符合漢語特性:漢語形式特征自身獨立性較弱, 而較多依賴于語言的意義和功能。
針對當(dāng)前基于語料庫的漢英詞典研編所面臨的挑戰(zhàn),我們認為,理論上應(yīng)當(dāng)突破當(dāng)前漢英詞典學(xué)界的語言本體觀,以語言系統(tǒng)研究為中心,從宏觀與微觀兩個層面來考慮語料庫的建立、詞目、配例的選擇、譯義的方法及排序,豐富我國漢英詞典研編相關(guān)的理論研究,解決語料庫漢英詞典研編過程中其他語言學(xué)流派所不能解決的難題,提高漢英詞典編纂質(zhì)量,推動我國漢英詞典編纂實踐的發(fā)展,使?jié)h英詞典滿足我國社會政治、經(jīng)濟、文化發(fā)展的新要求。在方法上要突破當(dāng)前詞典學(xué)界所倚賴的文獻法,把實證的研究方法引入詞典學(xué)研究,以保障語料庫漢英詞典編纂理論研究的實用性。在漢英詞典編纂的目的方面,要一改現(xiàn)存漢英詞典重在解碼的研究傳統(tǒng),以提高中國英語學(xué)習(xí)者的編碼能力為己任,服務(wù)于本民族文化輸出,為中國文化輸出戰(zhàn)略做出應(yīng)有的貢獻。最后,由于詞典編纂中的主體因素?zé)o處不在[13],涉及詞典編纂的各個環(huán)節(jié),我們有必要把詞典學(xué)界一度忽視的詞典編纂者的多重身份建構(gòu)納入研究視野,這對基于語料庫的漢英詞典編纂者的培養(yǎng)具有現(xiàn)實意義。
參考文獻:
[1] Atkins, B. Building a Lexicon: the contribution of lexicography [J]. International Journal of Lexicography,1991(3): 167-204.
[2] 李德俊.平行語料庫與積極型漢英詞典的研編[M].上海:上海譯文出版社,2008.
[3] 王馥芳,羅敏莉.語料庫詞典學(xué)的興起與發(fā)展[J].辭書研究,2004(5):45-53.
[4] Ooi, V. B. Y. Computer Corpus Lexicography[M]. Edinburgh: Edinburgh University Press, 1998.
[5] Hartmann, R. R. K., James, G. Dictionary of Lexicography[M]. Beijing: Foreign Language Teaching and Research Press, 2000.
[6] 章宜華,雍和明.當(dāng)代詞典學(xué)[M].北京:商務(wù)印書館,2007.
[7] 王馥芳,馬蘭梅.語料庫詞典的局限性[J]. 辭書研究,2003(5):20-28.
[8] Al睰asimi, A. M. Linguistics and Bilingual Dictionaries[M]. Leiden: E.J. Brill, 1977.
[9] 魏向清.英語語言學(xué)的發(fā)展與英語詞典[J].解放軍外國語學(xué)院學(xué)報,1998(1):13-18.
[10] 王馥芳.當(dāng)代語言學(xué)與詞典創(chuàng)新[M].上海:上海辭書出版社,2004.
[11] Halliday, M. A. K. Language As Social Semiotic[M]. London: Edward Arnold, 1978.
[12] Halliday, M. A. K. An Introduction to Functional Grammar[M]. 北京:外語教學(xué)與研究出版社, 2000.
[13] 王馥芳,陸谷孫.詞典編纂中的“主體因素”[J].外語界,2006(3):74-79.
(責(zé)任編輯 張向鳳)
Corpus瞓ased Chinese睧nglish Lexicography: Opportunity,
Challenge and Counter瞞easures
Zhong Lanfeng, Zhang Lin
(School of Foreign Languages, Jiangsu University, Zhenjiang 212013, China)
Abstract: The application of corpora as a new method to dictionary making is now generally approved. The technical innovation brings to dictionary making theory and practice challenges as well as new space. The chief challenge is how to comb through the senses and definitions of the contextualized polysemes quickly and efficiently. This challenge can be met with the help of systemic linguistics for it sets as its main task the function and linguistic system of language in use and studies all the systems within language. Our practice in dictionary making suggests that the study of transitivity system by systemic linguists can help dictionary makers handle sense discrimination and defining process: concretization abstraction concretization.
Key words: Chinese睧nglish dictionary; corpus瞓ased lexicography; systemic linguistics
收稿日期: 2012-01-15
基金項目: 國家社會科學(xué)基金項目(07BYY038); 江蘇大學(xué)人才引進項目(10JDG010)
作者簡介: 鐘蘭鳳,副教授、碩士生導(dǎo)師,文學(xué)博士,從事系統(tǒng)功能語言學(xué)、話語分析、雙語詞典研編研究; 張 璘,副教授,碩士生導(dǎo)師,文學(xué)博士,從事翻譯理論研究。