孫文龍++鄒曉玲
摘要在《計算詞典學(xué)與新型詞典》的基礎(chǔ)上,《計算詞典學(xué)》對近十年來國內(nèi)外計算詞典學(xué)領(lǐng)域中的學(xué)術(shù)研究進(jìn)行系統(tǒng)梳理,展示了現(xiàn)代計算機(jī)技術(shù)應(yīng)用于詞典學(xué)研究、辭書編纂和電子詞典出版的新發(fā)展、新理論和新成果?!队嬎阍~典學(xué)》可讀性強(qiáng),在豐富和完善計算詞典學(xué)理論框架上取得了進(jìn)步,對我國辭書現(xiàn)代化有著重要的引領(lǐng)作用。雖然還有疏漏不足之處,但白璧微瑕,仍不失為一部為時代而唱的力作。
關(guān)鍵詞計算詞典學(xué)新型詞典電子詞典辭書現(xiàn)代化啟示
一、引言
二十世紀(jì)六七十年代,計算詞典學(xué)研究在西方國家嶄露頭角,之后經(jīng)過約二十年的發(fā)展,其學(xué)科理論體系的構(gòu)建日趨明朗。20世紀(jì)90年代初,電子詞典猶如雨后春筍般發(fā)展起來,國內(nèi)外市場出現(xiàn)了一波電子詞典出版的高峰。在這種國際學(xué)術(shù)背景下,以章宜華教授為學(xué)術(shù)帶頭人的項目組,以廣東省“‘九五重點理論規(guī)劃項目——90年代新型詞典研究”為契機(jī),以現(xiàn)代詞典學(xué)理論為基礎(chǔ),進(jìn)行新型電子詞典種類、功能特點和構(gòu)造單元,及其對詞典學(xué)編纂理論和實踐影響的研究,取得了以《計算詞典學(xué)與新型詞典》(2004)為代表的標(biāo)志性成果。黃建華教授(2004)贊譽(yù)“他敏銳地把這場‘計算機(jī)給詞典學(xué)帶來的革命(Svensén 1993)的脈搏摸準(zhǔn)了”,為建立計算詞典學(xué)理論框架、促進(jìn)我國詞典學(xué)研究和詞典編纂實踐與現(xiàn)代數(shù)字技術(shù)盡快接軌做出了貢獻(xiàn)。
時至2010年夏秋之交,恰逢上海辭書出版社策劃出版“辭書研究文庫”系列叢書,章宜華教授對《計算詞典學(xué)與新型詞典》(以下簡稱“舊版”)進(jìn)行了全面修訂,于2013年推出了一部學(xué)術(shù)性和前瞻性兼具的新作——《計算詞典學(xué)》(以下簡稱“新版”)。作者以深厚的語言學(xué)和詞典學(xué)理論素養(yǎng),使新版真正成為一部具有縱深度、富于立體感、理論與實踐水乳交融的時代力作。因此,舊版到新版絕非書名的簡單更換,其在理論和實踐上的貢獻(xiàn)值得我國辭書界和廣大辭書研究者關(guān)注,同時也對我國計算詞典學(xué)的發(fā)展具有重要的意義。
二、新版變化特點
較之于舊版,新版最突出的特點之一是寫作資料新,具體體現(xiàn)在文獻(xiàn)新、案例新和數(shù)據(jù)新三個方面;其次是語言精確,進(jìn)一步提高了其可讀性。
1.資料新
首先,以英文文獻(xiàn)為例,舊版中最新英文參考文獻(xiàn)截至2002年,而新版中新增了2003年以來的重要英文文獻(xiàn)18篇,其中包括2010年到2012年的文獻(xiàn)8篇,占新增文獻(xiàn)的44%。這些新文獻(xiàn)反映了近十年來國外計算詞典學(xué)領(lǐng)域理論研究的最新發(fā)展動態(tài),如與計算詞匯學(xué)緊密聯(lián)系的電子詞庫理論、與詞典語料深加工有關(guān)的語料庫模式分析和常態(tài)與拓展理論、框架網(wǎng)標(biāo)注的注釋分層技術(shù)、電子詞典知識信息詞匯層次的詞匯共核理論等。有了這些學(xué)術(shù)前沿文獻(xiàn)的支撐,新版在構(gòu)筑計算詞典學(xué)的理論框架方面更能以“理”服人。
其次,新版對介紹現(xiàn)代計算機(jī)技術(shù)在詞典編纂實踐中的應(yīng)用的內(nèi)容幾乎全部進(jìn)行了置換或重寫,并輔以較新的案例。例如,新版第九章在介紹光盤和芯片詞典時,全部選用有代表性的新案例,分別介紹了《牛津高階英語詞典》光盤版第7版(2005)、《朗文當(dāng)代英語詞典》光盤版第5版(2009)、好易通牛津詞典王CD810、諾亞舟考試王416和卡西歐EW5000L。而舊版中所介紹內(nèi)容多為20世紀(jì)90年代的光盤詞典,內(nèi)容也稍顯龐雜。
最后,計算機(jī)技術(shù)經(jīng)過近十年的發(fā)展,舊版中提供的一些數(shù)據(jù)在今天看來只具有參考價值和歷史意義。新版對數(shù)據(jù)信息的更新非常及時,見表1:
表1
新舊兩版數(shù)據(jù)信息變化示例
舊版新版
例1
語料庫迅速從“十萬級”向“百萬級”、“千萬級”和“億級”發(fā)展,目前COBUILD語料庫的容量已超過5億詞。如果沒有運(yùn)算速度達(dá)到每秒幾億次、幾十億次的芯片和超大容量的存儲介質(zhì),大規(guī)模語料庫的建立和運(yùn)行是不可想象的。(p.9)
語料庫迅速從“百萬級”向“千萬級”和“億級”發(fā)展,目前COBUILD語料庫的容量已超過5億多詞,其中包括一個用于教學(xué)的5600萬詞的子語料庫。美國近年新建立的“當(dāng)代美國英語語料庫”也達(dá)到了4.25億詞,而2010年11月發(fā)布的基于網(wǎng)絡(luò)的英語語料庫達(dá)到了33億詞(1.0版)。(p.15)
例2目前運(yùn)行于網(wǎng)絡(luò)上的詞典很多,很難精確統(tǒng)計。筆者于2003年4月26日利用“google”搜索引擎對“dictionary”進(jìn)行檢索,得到的結(jié)果是1320萬項。(p.319)
目前運(yùn)行于網(wǎng)絡(luò)上的詞典很多,很難精確統(tǒng)計。筆者于2011年9月10日利用“谷歌”搜索引擎對“dictionary”進(jìn)行檢索,得到的匹配數(shù)字是6.77億條。(p.359)
2.語言精準(zhǔn)
新版中,作者在語言上字斟句酌,下足了功夫。試看從書中摘取的幾個例子,見表2:
表2
新舊兩版語言變化示例
舊版新版
例1
人類有著五千多年悠長的文明史,而詞典編纂史若從詞集開始算起也有四千多年了。(p.1)
人類有史可考的文明有五千多年了,詞典編纂史若從詞集開始算起已有四千多年。(p.1—2)
例2多媒體詞典的誕生是當(dāng)代詞典學(xué)的重要標(biāo)志之一。(p.2)
集音頻、視頻和文本材料于一體的多媒體詞典的誕生是當(dāng)代詞典學(xué)的重要標(biāo)志之一。(p.4)
例3計算語言學(xué)實際上就是語言學(xué)的一種研究方法,即以數(shù)理的方法……對語言的各個層面進(jìn)行統(tǒng)計分析和處理。(p.6)
計算語言學(xué)實際上就是凸顯語言學(xué)的一種研究方法,即以數(shù)理模型的方法……對自然語言的各個層面進(jìn)行統(tǒng)計分析和處理。(p.8)
例4
世界上最早的芯片詞典誕生于1983年。(p.356)
世界上最早的芯片詞典誕生于1981年10月,是卡西歐公司在小型計算器和數(shù)碼技術(shù)的基礎(chǔ)上開發(fā)出來的。(p.325)
從表2可以看出:新版中例1的表述更科學(xué),避免了主觀臆斷;例2經(jīng)過重新擴(kuò)充,命題內(nèi)容更有助于讀者加深對“多媒體詞典”的理解;例3通過新增三個詞語,使計算詞典學(xué)的本質(zhì)特征更加明晰;例4通過重新考證,更正了舊版中的事實錯誤,反映出作者一絲不茍的治學(xué)態(tài)度。上述例子在新版中俯拾即是,不勝枚舉。簡言之,同舊版相比,新版的語句用詞更加準(zhǔn)確,意義描述更加清晰,語言表達(dá)也更有說服力。
三、新版在理論上的貢獻(xiàn)
從計算詞典學(xué)形成的理論背景和社會基礎(chǔ)出發(fā),舊版較為系統(tǒng)地闡述了計算詞典學(xué)的研究特色、任務(wù)、目標(biāo)、研究范圍及內(nèi)容,探討了計算詞典學(xué)與計算語言學(xué)、計算詞匯學(xué)和語料庫語言學(xué)等相關(guān)學(xué)科的聯(lián)系,“首次建立了計算詞典學(xué)的理論框架,填補(bǔ)了國內(nèi)相關(guān)研究的空白”(夏立新 2005:154)。在舊版的基礎(chǔ)上,新版從計算詞典學(xué)的定義、產(chǎn)生的內(nèi)外因及研究背景入手,首次明確地論述了計算詞典學(xué)的性質(zhì)特征,提出了計算詞典學(xué)的理論基礎(chǔ)和研究方法,重新評估了計算詞典學(xué)的主要研究任務(wù),從而使計算詞典學(xué)的理論框架更加明晰和系統(tǒng)。
1.明確計算詞典學(xué)的性質(zhì)特征
計算詞典學(xué)作為一門不斷發(fā)展的新興學(xué)科,其理論框架的構(gòu)建和完善離不開對其學(xué)科性質(zhì)特征的明確定位。新舊兩版均在第一章第二節(jié)中從三個方面分別描述了計算詞典學(xué)的學(xué)科性質(zhì)特征,但在結(jié)構(gòu)安排和內(nèi)容側(cè)重上有所不同,如表3所示。
表3新舊兩版對計算詞典學(xué)性質(zhì)特征的論述
舊版新版
第二節(jié)計算詞典學(xué)的研究特色
一、計算詞典學(xué)的特色
二、語料庫詞典學(xué)的特色
三、計算詞典學(xué)與相關(guān)學(xué)科
第二節(jié)計算詞典學(xué)的性質(zhì)特征
一、計算詞典學(xué)的理論特征
二、計算詞典學(xué)的實踐特征
三、計算詞典學(xué)的學(xué)科交叉融合
從表3可以看出,通過對舊版的調(diào)整,新版在結(jié)構(gòu)上更具系統(tǒng)性,內(nèi)容上更有條理性。首先,新版從兩個已被廣泛認(rèn)可的論斷出發(fā),對計算詞典學(xué)的性質(zhì)特征進(jìn)行了較為全面的闡述:其一,依據(jù)“詞典學(xué)是研究詞典編纂理論和實踐的學(xué)科”(章宜華 2013:16)的論斷,新版區(qū)分了計算詞典學(xué)的理論特征和實踐特征;其二,根據(jù)“計算詞典學(xué)是一個綜合性的、跨學(xué)科的、嶄新的研究領(lǐng)域”(章宜華 2004:19)的論斷,新版進(jìn)一步強(qiáng)調(diào)了計算詞典學(xué)的交叉學(xué)科性質(zhì)。
其次,從研究內(nèi)容的角度來看,計算詞典學(xué)、計算語言學(xué)、計算詞匯學(xué)與語料庫語言學(xué)有著密切的關(guān)系,彼此相互交織,難以明確分隔,比如它們研究的主要對象——詞匯及其語言屬性相同,只是研究的角度、方法、重點和目的略有不同,現(xiàn)在沒有可能也沒有必要將它們分開來對待。(章宜華 2013:19;Ooi & Vincent 1998:37—38)由此,新版明確了計算詞典學(xué)的理論特征和實踐特征,前者是基于計算機(jī)技術(shù)的詞典研究和編纂的一種新型研究范式,呈現(xiàn)出不同學(xué)科理論交叉的特點;后者則主要體現(xiàn)在三個方面:即詞典語料庫和數(shù)據(jù)庫、計算機(jī)輔助詞典編纂和電子詞典,它們“分別代表了目前計算詞典學(xué)的三個主要研究方向”(章宜華 2007:4—8),其中,“語料庫是計算詞典學(xué)發(fā)展的原動力”(章宜華 2013:20)。
第三,新版沒有過多地糾纏于“計算詞典學(xué)是否已發(fā)展為一門獨立的學(xué)科”“計算詞典學(xué)作為一門交叉學(xué)科與其他學(xué)科的分野是什么”等理論問題,而是在分析計算詞典學(xué)產(chǎn)生的內(nèi)外因的基礎(chǔ)上,用更多的筆墨凸顯了計算詞典學(xué)的交叉學(xué)科性質(zhì)。在21世紀(jì)的信息社會,傳統(tǒng)詞典等工具書提供信息的方法、手段、內(nèi)容等已經(jīng)滿足不了人們學(xué)習(xí)的需要,這個主要矛盾促使傳統(tǒng)詞典學(xué)必須進(jìn)行研究范式的變革,拓展新的研究領(lǐng)域,這是計算詞典學(xué)產(chǎn)生的內(nèi)在原因;計算機(jī)技術(shù)的不斷發(fā)展,特別是自然語言處理中對擁有超強(qiáng)數(shù)據(jù)處理能力的大型詞庫或電子詞典的迫切需求,是計算詞典學(xué)產(chǎn)生的一個重要外因。正是這些復(fù)雜的內(nèi)外因交織在一起,才使詞庫和語料成為計算機(jī)科學(xué)、語料庫語言學(xué)、詞匯學(xué)、詞典學(xué)、自然語言處理等學(xué)科研究的共同焦點,“計算機(jī)正好是不同學(xué)科融合的一個交叉點”(章宜華 2013:23)。
總之,經(jīng)過幾十年的發(fā)展和完善,計算詞典學(xué)已成長為一個系統(tǒng)的學(xué)科(章宜華 2013:22),計算詞典學(xué)的理論框架在新版中更加明晰。
2.提出計算詞典學(xué)的理論基礎(chǔ)和研究方法
舊版中,作者從與計算詞典學(xué)緊密相連的兩個學(xué)科——計算語言學(xué)和計算詞匯學(xué)入手,較為具體地論述了計算詞典學(xué)產(chǎn)生的理論背景,但沒有明確指出該學(xué)科的理論基礎(chǔ)和研究方法。幾年后,章宜華教授(2007:3)才首次提出計算詞典學(xué)的技術(shù)基礎(chǔ)是計算語言學(xué),理論基礎(chǔ)為計算詞匯學(xué)。新版在此基礎(chǔ)上更進(jìn)一步,將計算語言學(xué)也納入到計算詞典學(xué)的理論基礎(chǔ)中,并辯證地指出“計算詞典學(xué)與計算語言學(xué)密切相關(guān),后者是前者的理論基礎(chǔ),前者是后者的具體實踐”(章宜華 2013:5—6)。新版對計算詞典學(xué)理論基礎(chǔ)的論斷是有充分依據(jù)的:首先,計算詞典學(xué)作為一個交叉學(xué)科,計算語言學(xué)是其與其他學(xué)科聯(lián)系的橋梁,計算語言學(xué)學(xué)科理論的建設(shè)和發(fā)展將會直接帶動計算詞典學(xué)的發(fā)展;其次,出于自然語言處理形式化的需要,20世紀(jì)80年代中期以來詞匯論悄然興起,在語言事實解釋的焦點從“以句法規(guī)則為中心”向“以詞匯描寫為中心”轉(zhuǎn)移的大背景下,詞庫研究由于與計算語言學(xué)的結(jié)合,成為現(xiàn)代詞匯學(xué)的主要研究內(nèi)容,它側(cè)重于“詞庫語法功能和語義結(jié)構(gòu)的分析,與著重于語法功能和語義結(jié)構(gòu)描寫的計算詞典學(xué)相輔相成”(章宜華 2007:3)。因此,計算詞匯學(xué)成為計算詞典學(xué)汲取理論營養(yǎng)的另一個重要來源。
此外,有關(guān)計算詞典學(xué)的研究方法在舊版中也付闕如。新版中則明確指出“計算詞典學(xué)研究的方法有詞典語料庫、數(shù)據(jù)庫、計算機(jī)輔助詞典編纂和電子詞典等”(章宜華 2013:13),它們是實現(xiàn)辭書編纂、出版、發(fā)行和修訂自動化這一計算詞典學(xué)終極研究目標(biāo)的重要保證。其中值得一提的是,新版中作者新增了四個與此相關(guān)的重要內(nèi)容:其一是有關(guān)詞典語料的精加工與數(shù)據(jù)化,主要包括詞匯屬性速描、英語詞匯數(shù)據(jù)庫、語料庫模式分析和框架網(wǎng)詞匯數(shù)據(jù)庫四個方面,提出了國際辭書現(xiàn)代化技術(shù)的新理念;其二,在論述計算機(jī)技術(shù)與詞典編纂創(chuàng)新之間的關(guān)系時,作者介紹了國際上三個比較有代表性的詞典編纂平臺:法國IDM的詞典生成系統(tǒng)DPS、俄羅斯泰比詞典編寫系統(tǒng)和南非TshwaneLex詞典編纂系統(tǒng),為我國計算機(jī)輔助詞典編纂工具及商業(yè)編纂平臺的開發(fā)提供了借鑒;其三,就目前技術(shù)水平而言,作為詞典的主要生成方式——基于數(shù)據(jù)庫的詞典生成,作者從詞典數(shù)據(jù)庫的性質(zhì)特征、理論基礎(chǔ)和數(shù)據(jù)定義三個方面,首次詳盡論述了電子詞典數(shù)據(jù)庫的特點;其四,在開發(fā)供“人機(jī)兩用”電子詞典的原則指導(dǎo)下,作者首次嘗試提出了電子詞典編纂與制作的標(biāo)準(zhǔn)化原則,與傳統(tǒng)詞典編纂原則互相補(bǔ)充,充實和完善了詞典學(xué)理論框架。
3.重估計算詞典學(xué)的研究任務(wù)
從形成歷史的角度出發(fā),新版重新對計算詞典學(xué)的研究任務(wù)進(jìn)行了評估,表4是新舊兩版在此方面的對比。
表4新舊兩版“計算詞典學(xué)研究任務(wù)”對比
舊版新版
研究任務(wù)
計算詞典學(xué)的首要任務(wù)是解決詞典知識內(nèi)容的“電子化”和“機(jī)讀性”問題;其二是研究如何實現(xiàn)詞典編纂自動化;其三是研究如何實現(xiàn)大型詞典的發(fā)行無紙化。(p.14)
計算詞典學(xué)的首要任務(wù)是解決自然語言處理所需的機(jī)讀詞典問題;其二是紙質(zhì)詞典內(nèi)容的“電子化”和“機(jī)讀性”問題;其三是研究如何利用詞典數(shù)據(jù)庫生成詞典;其四是研究如何實現(xiàn)詞典編纂自動化;其五,研究如何實現(xiàn)大型詞典的發(fā)行無紙化。(p.19)
首先,從表4可以看出,從計算詞典學(xué)的發(fā)展歷史來看,將其研究的首要任務(wù)定位為“解決自然語言處理所需的機(jī)讀詞典問題”是符合客觀事實的。因為詞典與計算機(jī)結(jié)合的最初構(gòu)想始于自然語言處理領(lǐng)域?qū)C(jī)器翻譯的研究,而對機(jī)器翻譯系統(tǒng)的開發(fā)直接推動了機(jī)器詞典的發(fā)展。近年來,機(jī)器詞典的研制已成為一種專門學(xué)問,在語言信息的處理中變得越來越重要?!霸谟嬎阏Z言學(xué)界,越來越多的專家把機(jī)器詞典的規(guī)模和質(zhì)量看作是自然語言處理系統(tǒng)的‘瓶頸?!保中庸?1999:156)因此計算詞典學(xué)視角下的用戶不再僅僅是人,編者還要為機(jī)器著想,開發(fā)可以直接或間接地服務(wù)于自然語言處理的機(jī)器詞典,這也是編纂機(jī)讀人用詞典的技術(shù)基礎(chǔ)和前提。
其次,新版中及時補(bǔ)充了目前計算詞典學(xué)的另一個主要研究任務(wù):研究詞典數(shù)據(jù)庫的建設(shè),以及數(shù)據(jù)的統(tǒng)計分析、自動存取、自動識別、自動轉(zhuǎn)換成各類詞典的問題。可以預(yù)見的詞典生成有兩種方法——基于語料庫的詞典生成和基于數(shù)據(jù)庫的詞典生成。前者是指利用語料庫直接生成各類詞典,可以說是計算詞典學(xué)研究的最高境界,也是詞典學(xué)家最美好的夢想,但目前的研究水平還不能讓詞典學(xué)家這個“最美好的夢想”得以實現(xiàn);后者是借助詞典輔助編纂系統(tǒng),按詞典的微觀結(jié)構(gòu)框架構(gòu)建詞典數(shù)據(jù)庫,在數(shù)據(jù)庫的基礎(chǔ)上生成詞典,是目前詞典生成的一個主要手段。(章宜華 2007:10—11)
總的來說,隨著計算機(jī)技術(shù)發(fā)展的日新月異,詞典學(xué)中新理論和新技術(shù)應(yīng)用的不斷深化,除部分基礎(chǔ)理論外,舊版中原來介紹的技術(shù)和描寫的事實已經(jīng)發(fā)生巨大變化或不復(fù)存在了,新版對計算詞典學(xué)的整個框架內(nèi)容進(jìn)行重新評估、研究和重構(gòu),為學(xué)科的發(fā)展奠定了堅實的理論基礎(chǔ)。
四、新版對我國計算詞典學(xué)發(fā)展的啟示
我國從20世紀(jì)70年代末才開始接觸計算詞典學(xué)的相關(guān)研究,起步較晚,在理論研究方面主要以介紹國外理論為主,這種情況在90年代之前尤為明顯,其研究內(nèi)容駁雜,研究成果不成系統(tǒng),散見于各個刊物或論文集中。目前國內(nèi)在計算詞典學(xué)方面的系統(tǒng)研究還處在初級階段,與國外相比還存在很大差距,這一現(xiàn)象值得我國辭書界思考。章宜華教授的新版著作對推動我國辭書現(xiàn)代化進(jìn)程有著重要的啟示。
1.轉(zhuǎn)變研究思路,進(jìn)行理論創(chuàng)新
受語言本體主義研究方法的影響,我國大多數(shù)研究仍將詞典編纂看成是純粹的語言活動,視詞典研究為一個封閉的系統(tǒng),就詞典而論詞典,囿于詞典本體研究范圍內(nèi)。具體表現(xiàn)在:個案孤立分析多,系統(tǒng)研究成果少;隨感經(jīng)驗總結(jié)多,宏觀理論概括少;編纂工藝研究多,學(xué)科理論構(gòu)建少。此外,國內(nèi)辭書研究者對與自然語言處理和計算語言學(xué)相關(guān)的前沿理論研究不多,如廣域短語結(jié)構(gòu)語法、中心詞驅(qū)動短語語法、邏輯數(shù)理語義學(xué)、蒙泰格語義學(xué)、篇章—語義理論、框架語義學(xué)等,這些理論在國外詞典學(xué)界已引起廣泛的討論和研究。(章宜華 2005:6)我國計算詞典學(xué)的發(fā)展離不開現(xiàn)代辭書理論,結(jié)合中國實際,吸收國外先進(jìn)理論并進(jìn)行創(chuàng)新,是加快我國辭書現(xiàn)代化進(jìn)程的必由之路。
2.瞄準(zhǔn)國際辭書現(xiàn)代化技術(shù)的新理念——辭書語料數(shù)據(jù)化
在信息化時代,辭書現(xiàn)代化的關(guān)鍵是計算機(jī)技術(shù)和數(shù)字化技術(shù)的應(yīng)用,其實質(zhì)就是文字處理與傳輸?shù)闹悄芑托畔⒒?。在辭書現(xiàn)代化技術(shù)方面,國內(nèi)辭書界的主要精力仍放在語料庫的建設(shè)和使用上。而實際情況是,由于語料搜集的方便和國際上免費(fèi)大型語料庫的出現(xiàn),語料庫的建立和使用已經(jīng)不存在技術(shù)和資源問題。國際研究重點已轉(zhuǎn)向語料的深加工和數(shù)據(jù)庫建設(shè),因為他們認(rèn)識到,編者要想梳理海量語料并從中找到有用的東西絕對是一件既耗時又費(fèi)力的事情。(章宜華 2012:1—9)因此,我國辭書工作者應(yīng)看清國際學(xué)術(shù)發(fā)展潮流,利用語言學(xué)研究的新成果和數(shù)據(jù)挖掘技術(shù),將研究重心從語料庫建設(shè)逐步轉(zhuǎn)移到詞典數(shù)據(jù)庫建設(shè)上來,從而大大提高語料的精加工能力和詞典編纂的效率。
3.加強(qiáng)電子詞典的開發(fā)
電子詞典是辭書現(xiàn)代化技術(shù)的具體體現(xiàn)。從表面上看,我國電子詞典市場呈現(xiàn)出一片繁榮的景象,各種類型、各種價位的詞典應(yīng)有盡有,但看似繁榮的電子詞典市場背后卻危機(jī)四伏。這與我國電子詞典發(fā)展的策略問題不無關(guān)系。歐美電子詞典的發(fā)展策略定位準(zhǔn)確——以辭書而不是電子為本體來開發(fā)電子詞典,因此他們的電子詞典大多是由著名辭書出版機(jī)構(gòu)在原版紙質(zhì)詞典數(shù)據(jù)的基礎(chǔ)上開發(fā)出來的。我國的情況正好相反:電子詞典的出版是商業(yè)行為占主導(dǎo)地位,很少有專業(yè)辭書出版機(jī)構(gòu)參與。(章宜華 2013:417—420)其結(jié)果是,歐美國家基于現(xiàn)代化技術(shù)和編纂理念開發(fā)出的電子詞典,占據(jù)了世界英語和與英語相關(guān)的雙語詞典的大部分市場(包括我國的辭書市場)。(章宜華 2005:8)為此,國內(nèi)辭書界應(yīng)及時總結(jié)經(jīng)驗教訓(xùn),分析辭書市場和中國英語學(xué)習(xí)者的需求,立足當(dāng)前,著眼未來,為我國電子詞典的長遠(yuǎn)發(fā)展制定出切實可行的規(guī)劃。
五、新版的不足
首先,由于主客觀等多方面的原因,書中出現(xiàn)了一些疏漏之處,見表5:
表5新版中“疏漏之處”示例
例證疏漏之處
例1
人類有史可考的文明有五千多年了,詞典編纂史若從詞集開始算起已有四千多年[1]。(p.1—2)上標(biāo)符號“[1]”所指注釋在文中缺失。
例2正如劉根輝(2005:2)所說……(p.11)新增引文在參考文獻(xiàn)中疏漏未列
例3本章(第九章)主要對歐美國家以及我國臺灣地區(qū)和內(nèi)地的光盤電子詞典做一些探討……(p.327)內(nèi)容概要和下文具體章節(jié)內(nèi)容安排不相符
表5中例1和例2主要是疏忽所致,再版時增補(bǔ)釋文和參考文獻(xiàn)即可;例3和舊版257頁第八章“光盤電子詞典”的內(nèi)容概要完全相同,但新舊兩章的結(jié)構(gòu)及內(nèi)容安排已全然不同,因此新版中第九章的內(nèi)容提要需要置換。
此外,新版第八章雖然明確了電子詞典編纂的一般原則和標(biāo)準(zhǔn)化原則,但并沒有進(jìn)一步就“如何建立起一套電子詞典評估體系”這個問題進(jìn)行探討。計算詞典學(xué)評價和批評理論體系的構(gòu)建也是整個計算詞典學(xué)理論框架的重要組成部分。新版第九章在介紹光盤與芯片電子詞典時,主要以常識描述和知識性介紹為主,缺少對各類詞典的對比分析和優(yōu)劣評判,如可以對《牛津高階英語詞典》《朗文當(dāng)代英語詞典》等英語學(xué)習(xí)詞典的光盤版進(jìn)行橫向或縱向的對比分析,指出其變化發(fā)展特點和優(yōu)缺點及其對我國英漢學(xué)習(xí)詞典光盤版開發(fā)的啟示等。
六、結(jié)語
一部好的學(xué)術(shù)著作必須傾聽時代的足音,把握時代的脈搏,真正做到為時代而唱。章宜華教授以其深厚的學(xué)術(shù)功底、精益求精的治學(xué)態(tài)度和“為時而著”的歷史使命感,把近十年來我國和西方主要國家對現(xiàn)代計算機(jī)技術(shù)在詞典學(xué)理論和實踐中的應(yīng)用進(jìn)行系統(tǒng)的調(diào)查和梳理,為我們描繪了一幅令人向往的圖景。盡管新著中仍存在一些不足,但瑕不掩瑜。正如黃建華教授(2004)所指出的那樣:“當(dāng)然,寫進(jìn)書中的某些內(nèi)容不久也會過時而歸于無用,但始終力求站在當(dāng)代學(xué)科前沿的精神,那是永存的?!?/p>
參考文獻(xiàn)
1.黃建華. 《計算詞典學(xué)與新型詞典》序.∥章宜華. 計算詞典學(xué)與新型詞典. 上海: 上海辭書出版社,2004.
2.林杏光. 詞匯語義與計算語言學(xué). 北京: 語文出版社,1999.
3.夏立新. 一部學(xué)術(shù)性與實用性俱佳的詞典學(xué)力作——《計算詞典學(xué)與新型詞典》評介. 辭書研究,2005 (1).
4.章宜華. 計算詞典學(xué)與新型詞典. 上海: 上海辭書出版社,2004.
5.章宜華. 我國計算詞典學(xué)發(fā)展的問題及對策.∥張紹麒. 辭書與數(shù)字化研究. 上海: 上海辭書出版社,2005.
6.章宜華. 關(guān)于計算詞典學(xué)理論框架的探討. 辭書研究,2007 (6).
7.章宜華. 國際辭書現(xiàn)代化技術(shù)的新理念:辭書語料數(shù)據(jù)化. 辭書研究,2012 (2).
8.章宜華. 計算詞典學(xué). 上海: 上海辭書出版社,2013.
9.Ooi V B Y. Computer Corpus Lexicography. Edinburgh: Edinburgh University Press, 1998.
10.Svensén B. Practical Lexicography: Principles and Methods of DictionaryMaking. Oxford: Oxford University Press, 1993.
(青島理工大學(xué)基礎(chǔ)教學(xué)部臨沂273400)
(責(zé)任編輯李瀟瀟)