張雅 盧華國
[摘 要] 首先介紹網(wǎng)絡(luò)詞典的發(fā)展現(xiàn)狀,然后結(jié)合有道詞典論述版權(quán)購買類、網(wǎng)頁抓取類和維基架構(gòu)類三類詞庫的優(yōu)點和局限,最后從設(shè)計的主體間性入手探討如何發(fā)揮編者、技術(shù)人員和用戶三類設(shè)計主體的優(yōu)勢以實現(xiàn)網(wǎng)絡(luò)詞庫配置的整合和優(yōu)化。
[關(guān)鍵詞] 網(wǎng)絡(luò)詞典 有道詞典 詞庫配置 主體間性
[中圖分類號] G237 [文獻標(biāo)識碼] A [文章編號] 1009-5853 (2014) 05-0087-04
Inter-subjectivity Approach to Lexicon Configuration in Cyber Dictionaries:
with Particular Reference to Youdao Dictionary
Zhang Ya Lu Huaguo
(Department of Languages and Culture,Nanjing University of Information Science and Technology,Nanjing,210044)
[Abstract] Starting from a brief account of the status quo of cyber dictionaries, this paper describes the strengths and weaknesses of three types of lexicons, i.e. copyright-based, webpage-extraction-based and wiki-based ones, which are illustrated by Youdao Dictionary, and then investigates how compilers, technicians and users can take most advantage of their combined expertise to optimize the lexicon configuration of cyber dictionaries.
[Key words] Cyber dictionaries Youdao Dictionary Lexicon configuration Inter-subjectivity
1 引 言
網(wǎng)絡(luò)詞典是電子詞典的一種,又稱在線詞典,是指構(gòu)建在網(wǎng)絡(luò)平臺上,通過使用某種計算機網(wǎng)絡(luò)語言將機器可讀的詞典文本轉(zhuǎn)換為可在網(wǎng)絡(luò)中檢索的辭書,并向用戶提供實時查詢服務(wù)的數(shù)字化參考工具[1]。根據(jù)用戶訪問方式,可以分為網(wǎng)頁版和軟件版兩類。使用前者就像訪問普通網(wǎng)頁一樣,需要輸入相應(yīng)網(wǎng)址,進入詞典主頁后才能進行詞典檢索,檢索結(jié)果以網(wǎng)頁形式呈現(xiàn)給用戶;使用后者就像使用普通軟件一樣,需要用戶首先在本地安裝客戶端軟件,然后打開軟件進入詞典界面進行檢索,軟件從遠程服務(wù)器獲取符合檢索條件的信息并通過詞典軟件界面展示給用戶。
由于以網(wǎng)絡(luò)為數(shù)據(jù)載體,網(wǎng)絡(luò)詞典擁有非常廣泛的用戶。尼爾森網(wǎng)聯(lián)研究2012年發(fā)布的一項針對我國10個城市的調(diào)研數(shù)據(jù)顯示,在16—45歲的網(wǎng)民中有將近九成接觸過網(wǎng)絡(luò)詞典產(chǎn)品,網(wǎng)絡(luò)詞典已經(jīng)達到相當(dāng)高的覆蓋率,并在調(diào)查金山、谷歌等7個品牌之后,發(fā)現(xiàn)有道詞典的覆蓋率達到58%,位居7個被調(diào)查品牌之首,平均每周被使用12次,累計達36分鐘,明顯高于同類其他網(wǎng)絡(luò)詞典[2]。有道詞典之所以能夠在眾多品牌中占據(jù)首位,原因之一在于它的詞庫資源豐富且不同類型的詞庫之間具有一定的互補性。然而,這些詞庫也存在一些問題,給使用者帶來不少困惑。接下來,本文將從詞典設(shè)計主體間性的角度入手探討有道詞典的詞庫配置策略及其對網(wǎng)絡(luò)詞典設(shè)計的啟發(fā)。
2 有道詞典的三類詞庫簡介
有道詞典宣稱集中了中、英、日、韓、法5種語言的詞庫,但是在這5種語言之間資源配置并不均衡,其中英漢詞庫資源最為豐富。本文將主要介紹有道詞典在英語詞庫資源配置方面的特色,僅在討論與英語學(xué)習(xí)相關(guān)時涉及有道詞典所收錄的漢語詞庫資源。從獲取方式和來源看,有道詞典英語方面的詞庫資源主要有以下三類[3]。
第一類是版權(quán)購買類詞庫,包括3本版權(quán)詞典,分別是《21世紀(jì)大英漢詞典》(以下簡稱《21世紀(jì)》)、《新漢英大辭典》(以下簡稱《新漢英》)和《柯林斯英漢雙解大詞典》(以下簡稱《柯林斯》)?!?1世紀(jì)》是一部大型綜合性詞典,由李華駒擔(dān)任主編,中國人民大學(xué)出版社2002年出版,收錄單詞和詞組約40萬條,以語詞條目為主,兼收各科常見術(shù)語專名。《21世紀(jì)》對多義詞釋義尤為詳盡,按使用頻率高低編排義項[4]?!缎聺h英》是一部綜合性漢英辭書,由中國教育出版集團有限公司2008年出版,收錄約15萬詞條,詞典信息主要由漢英基本釋義、例句、短語等構(gòu)成[5]。然而,除有道官網(wǎng)介紹外,筆者從互聯(lián)網(wǎng)上,包括中國教育出版集團有限公司網(wǎng)站上都無法獲得關(guān)于該詞典的更多信息。至于《柯林斯》,有資料宣稱該詞典系哈珀·柯林斯出版集團第一次選擇互聯(lián)網(wǎng)上平臺首發(fā)旗下詞典,在詞匯量上完全覆蓋之前收錄的《柯林斯COBUILD高級英漢雙解詞典》(由張柏然等翻譯,高等教育出版社2006年出版),是柯林斯旗下最大的學(xué)習(xí)型詞典[6]。筆者從網(wǎng)上無法獲得更多關(guān)于該詞典的信息,試查、比較之后也沒有發(fā)現(xiàn)與《柯林斯COBUILD高級英漢雙解詞典》有什么差別。
第二類是網(wǎng)頁抓取類詞庫。該類資源的獲取以有道首創(chuàng)的“網(wǎng)頁萃取”技術(shù)為實現(xiàn)前提。具體講,就是通過搜索引擎獲取海量網(wǎng)頁數(shù)據(jù),然后借助自然語言處理中的數(shù)據(jù)挖掘技術(shù)對其進行分析,從中提取所需要的信息并自動生成一個龐大的、可自動及時更新的“動態(tài)資源庫”。借助網(wǎng)絡(luò)服務(wù)或桌面軟件,用戶可以方便地查詢這一資源庫。通過“網(wǎng)頁萃取”技術(shù)獲取的信息有網(wǎng)絡(luò)釋義、雙語例句、專業(yè)釋義、短語、權(quán)威例句和原聲例句六個類別。筆者使用后發(fā)現(xiàn):前四類信息主要是通過在英文與其中文翻譯之間建立匹配關(guān)系,把存在匹配關(guān)系的單詞或例句提取出來,后兩類信息只需把含有目標(biāo)詞的句子提取出來。具體說來,專業(yè)釋義主要是通過在學(xué)術(shù)論文的中英文摘要和關(guān)鍵詞之間進行匹配,提取目標(biāo)信息,網(wǎng)絡(luò)釋義和雙語例句則是源自整個網(wǎng)絡(luò)上的中英文資料,取材范圍比前者要廣得多。短語不僅需要在中英文之間匹配,而且還要判斷目標(biāo)詞與其他詞是否構(gòu)成共現(xiàn)關(guān)系。權(quán)威例句和原聲例句的提取則相對要容易一些,前者源自英美主要新聞報刊網(wǎng)站,后者則是對英文廣播、影視或公開課資源中含有目標(biāo)詞匯的句子的提取。endprint
第三類是維基(Wiki)架構(gòu)類詞庫。該類資源是對免費網(wǎng)絡(luò)資源互動百科的直接借用。與維基百科和百度百科一樣,互動百科也是建構(gòu)在Wiki技術(shù)之上的免費網(wǎng)絡(luò)百科全書。在傳統(tǒng)的網(wǎng)站集中發(fā)布模式下,普通用戶因為只能瀏覽信息而不能隨意發(fā)布信息,所以處在一種被動接受的位置。Wiki技術(shù)的創(chuàng)生是對這種傳統(tǒng)模式的顛覆。作為一種嶄新的信息發(fā)布方式,Wiki技術(shù)使得任何人都可以對自己在互聯(lián)網(wǎng)上看到的頁面進行編輯,而且編輯結(jié)果在網(wǎng)絡(luò)上同時向他人公開,并允許被再次編輯和修改,從而實現(xiàn)網(wǎng)頁的可擦寫功能。互動百科正是基于以Wiki技術(shù)為核心的合作軟件構(gòu)建的網(wǎng)絡(luò)百科全書。它對用戶沒有任何門檻限制,用戶不僅可以免費使用維基百科,更重要的是可以參與編寫?;影倏撇辉O(shè)專職編輯隊伍,其編輯器風(fēng)格類似office 2007,采用“所見即所得”的編輯模式,頁面操作非常簡單,用戶只要會點鼠標(biāo)、會打字就可以參與百科全書的編寫工作?;影倏凭哂懈叨鹊拈_放性,為熱心網(wǎng)友搭建了展示技能和知識的平臺,使用戶能夠自己動手,體驗分享知識的樂趣[7]。
3 三類詞庫的優(yōu)點和局限
版權(quán)詞典(以紙質(zhì)詞典為主)由辭書專家編寫、知名出版社推出或引進,在詞典信息質(zhì)量方面有保障,有著較高的權(quán)威性。然而,版權(quán)詞典中的信息往往滯后于語言的發(fā)展變化?!?1世紀(jì)》雖然是一本大型綜合性辭書,收錄單詞和短語40萬條,但是該詞典出版已有10年,無法反映語言中的最新變化。實際上,即便是2008年版的《新漢英》和官方所謂的2012年版《柯林斯》也不可能收入時下流行的新詞新義。版權(quán)詞典這方面的局限是由其自身特點所決定的。首先,無論版權(quán)詞典的收詞量有多大,終究受到一定限制[8],所以版權(quán)詞典通常只能選擇性地收錄那些相對穩(wěn)定的新詞新義。此外,版權(quán)詞典還呈現(xiàn)出編纂周期長、更新頻率低的特點,這進一步影響了詞典對新詞新義的收錄。由于編纂周期長,版權(quán)詞典編纂時收入的內(nèi)容無論有多新,出版時這些內(nèi)容已經(jīng)顯得陳舊。再則,版權(quán)詞典一旦出售發(fā)行,編者即失去對位于用戶端的詞典數(shù)據(jù)的直接支配。詞典數(shù)據(jù)因而呈現(xiàn)出封閉性,無法隨時接受更新。另一方面,詞典數(shù)據(jù)的更新往往涉及詞典設(shè)計的方方面面,是一項費時費力的工作。出于對成本的考慮,編者常常將詞典數(shù)據(jù)更新的范圍和頻率限制在可接受的范圍內(nèi),即只有當(dāng)需要更新的語料積累到一定程度之后,編者和出版社才會考慮對詞典數(shù)據(jù)進行全面更新。而使用者只有重新購買版權(quán),才有機會接觸詞典中更新的內(nèi)容,這對電子詞典的開發(fā)者而言又是一筆新費用。因此,有些開發(fā)者不愿購買同一詞典的更新版本,而是走模糊路線,對版權(quán)詞典的出版年限語焉不詳。
網(wǎng)絡(luò)不僅是新詞新義產(chǎn)生的一個重要來源,而且為新詞新義提供了非常重要的傳播渠道。換句話說,新詞新義無論經(jīng)由何種途徑產(chǎn)生,都會在網(wǎng)絡(luò)上留下蹤跡。由于依托搜索引擎,網(wǎng)頁抓取類詞庫可以及時捕捉語言中的新現(xiàn)象,并實時加入“動態(tài)資源庫”,供用戶查詢。這種做法可以很好地彌補版權(quán)詞典在新詞新義收錄方面的短板。例如,筆者嘗試在有道詞典中輸入并查詢在各類媒體上較為常見的兩個詞“吃貨”和“fiscal cliff”。結(jié)果顯示,前述版權(quán)詞典均沒有收錄相關(guān)釋義或翻譯,而網(wǎng)絡(luò)釋義則給出比較滿意的答案(“foodie”和“財政懸崖”)。然而,由于主要依靠計算機技術(shù)并缺少語言專家的判斷和選擇,網(wǎng)頁抓取類詞庫對目標(biāo)信息的匹配和提取有時錯誤百出,讓人啼笑皆非。例如,對于網(wǎng)絡(luò)用語“忽悠”,網(wǎng)絡(luò)釋義給出了四個對應(yīng)詞:hooyoo、flicker、poof和E。其中,排在第一位的是hooyoo,系從70個網(wǎng)頁提取而來。追蹤這些網(wǎng)頁后,筆者發(fā)現(xiàn)hooyoo多被用作網(wǎng)站的名字,與“忽悠”的“欺騙”意義沒有任何關(guān)系。排在第二位的flicker僅與“忽悠”的陳舊義項“飄忽不定”有關(guān),排在第三、第四的poof和E則不知所云。專業(yè)釋義和雙語例句均存在類似錯誤。該類詞庫所提供的某些短語(如please advise)只是偶然出現(xiàn)在一起的組合,根本算不上語言學(xué)意義上的短語。此外,雖然原聲例句和權(quán)威例句的正確性能夠得到保障,但是從辭書的角度看,這些例句只能作為聽力和閱讀的補充材料,在詞匯難度和示范價值方面與版權(quán)詞典中精選的例句相去甚遠。
認知語言學(xué)家認為語言信息和百科信息難以截然分開,對語言的理解和使用都非常重要[9]。這也為學(xué)習(xí)型詞典中百科信息分量的增加所印證。版權(quán)詞典雖然在收詞和釋義方面對百科詞條和百科信息日益重視,但是其容量畢竟有限,只能以語言信息為重,兼顧最基本的百科信息。例如,版權(quán)詞典對歷史人物的介紹就只限于生卒年和主要功績等最主要的信息。此外,由于版權(quán)詞典更新速度慢,其中的百科信息常常顯得陳舊和過時。因此,已經(jīng)過世的歷史人物在某些版權(quán)詞典中可能依然“健在”,這難免會對只依賴一本詞典的用戶產(chǎn)生誤導(dǎo)。維基架構(gòu)類詞庫由于匯集了廣大網(wǎng)民的智慧,在百科信息方面可為版權(quán)詞典提供延伸和補充。與專家式的傳統(tǒng)辭書編纂不同,維基架構(gòu)類詞庫開放、自由的編輯模式被稱為“自下而上式”的編纂模式[10]。由于編者隊伍在理論上可以無限擴展,互動百科擴充和更新的速度讓任何其他傳統(tǒng)辭書及其網(wǎng)絡(luò)版都望塵莫及。然而,高度的開放性也帶來了高度的無序性,這給互動百科實施有效的質(zhì)量控制帶來了無法解決的困難。例如,由于詞條撰寫者對同名人物的編輯操作不夠細心,著名語言學(xué)家王力在互動百科中被赫然標(biāo)注為“海軍少將”,而且介紹中缺乏最基本的生卒年信息[11]。至筆者行文時,相關(guān)錯誤還沒有得到糾正。與維基百科相比,互動百科有一定的審核機制,即只有經(jīng)過審核的詞條方可提交。然而,審核通常限于政治類等敏感信息,專業(yè)且隱蔽的信息只能依賴網(wǎng)友發(fā)現(xiàn)和糾正?;影倏茻o法從根本上做到防患于未然,這是由其開放性、自由性所決定的。
4 詞典設(shè)計的廣義主體觀
現(xiàn)代設(shè)計理論認為,產(chǎn)品設(shè)計需考慮一系列的外部和內(nèi)部因素,是外部因素的內(nèi)在化[12]。作為文化產(chǎn)品的詞典亦不例外,其設(shè)計背后的理據(jù)也是多元和復(fù)合的,大致可分為外部理據(jù)和內(nèi)部理據(jù)兩類。前者包含了很多方面,始終圍繞著“人”這個核心,其中最重要的就是詞典用戶及其需求,代表了詞典設(shè)計的限定性;后者也包含多方面,始終圍繞“物”這一廣義概念,包括詞典設(shè)計的技術(shù)、載體和工藝,代表了詞典設(shè)計的可能性??梢哉f,詞典設(shè)計就是內(nèi)外理據(jù)融合的過程[13],把前述可能性轉(zhuǎn)化為現(xiàn)實,離不開設(shè)計主體創(chuàng)造性的活動。然而,長期以來人們對詞典設(shè)計的理解經(jīng)歷了一個由片面到全面的發(fā)展過程,對詞典設(shè)計主體的認識也經(jīng)歷了同樣的變化。endprint
傳統(tǒng)上,詞典被視為靜態(tài)的文本,是特定的詞典信息類型按照特定的呈現(xiàn)方式進行編排的結(jié)果;詞典文本的設(shè)計是編者就信息類型和呈現(xiàn)方式做出系列選擇的過程。因此,詞典編者才是唯一的詞典設(shè)計主體。由于接受美學(xué)的影響和商業(yè)利益的驅(qū)使,詞典不再被視為靜態(tài)的文本,位于接受端的用戶開始受到重視。為了能夠吸引更多用戶、取得更大的商業(yè)利潤,詞典編者必須設(shè)法了解用戶的檢索需求、技能和使用習(xí)慣,并據(jù)此設(shè)計出符合用戶要求的詞典產(chǎn)品。詞典用戶地位的上升使他們能夠?qū)幷叩脑O(shè)計決策產(chǎn)生不容忽視的影響。正是在這個意義上,我們認為詞典用戶實質(zhì)上成為詞典設(shè)計的另一主體。
對于現(xiàn)代詞典編纂而言,數(shù)據(jù)庫的建設(shè)、語料的提取離不開技術(shù)人員的參與,這直接影響著詞典可呈現(xiàn)的信息類型。負責(zé)排版、印刷和裝訂的技術(shù)人員對于紙質(zhì)詞典產(chǎn)品的最終面貌和功能有著重要的影響。對于電子詞典設(shè)計而言,編程人員同編者之間的有效合作是充分發(fā)揮技術(shù)優(yōu)勢、保證電子詞典質(zhì)量的前提。這里當(dāng)然不排除編者同時又是技術(shù)人員的情況,但是現(xiàn)代社會高度專業(yè)化的分工使得技術(shù)人員已然成為詞典設(shè)計過程中一個不可或缺的獨立群體。
如果我們接受詞典設(shè)計的廣義主體觀的話,那么就會發(fā)現(xiàn)上述三類設(shè)計主體分別與有道詞典的三類詞庫對應(yīng):在版權(quán)購買類詞庫(通常是紙質(zhì)詞典)的編纂過程中,雖然重視用戶需求并使用了現(xiàn)代技術(shù),但是在宏觀層面和微觀層面上對信息的選擇和呈現(xiàn)的過程主要是一個由編者不斷做出決策的過程,在這里編者是設(shè)計主體;網(wǎng)頁抓取類詞庫的形成主要依賴“網(wǎng)頁萃取”技術(shù),詞典或語言專家的影響被最大程度地排除了,在這里技術(shù)人員是設(shè)計主體;在維基架構(gòu)類詞庫中,沒有專家和權(quán)威,任何人都可以編寫新的詞條、編輯和修改已經(jīng)存在的詞條,從而實踐“人人為我、我為人人”的烏托邦理想,在這里用戶才是設(shè)計主體。
5 設(shè)計主體間性視角下的思考
就“人”這一最活躍的要素而言,詞典設(shè)計從本質(zhì)上講是一種交際行為。狹隘的設(shè)計觀將這一過程分為兩個彼此分離的“主—客”片段,即“編者編纂詞典”和“用戶使用詞典”,因而在一定程度上阻礙了編者和用戶兩大設(shè)計主體之間的溝通,影響了詞典設(shè)計創(chuàng)新的力度和方向。而廣義的設(shè)計觀則將詞典設(shè)計置于“主—客—主”框架中,將其視為包括技術(shù)人員在內(nèi)的多極主體圍繞詞典文本展開的對話行為。
一方面,廣義的設(shè)計觀反對將詞典設(shè)計視為編者的獨白,認為詞典設(shè)計不能缺少任何一方的參與,因而倡導(dǎo)多級主體之間的對話;另一方面,該設(shè)計觀堅持編者在詞典設(shè)計中的主體地位,認為編者的作用不是用戶或技術(shù)人員可以替代的。隨著用戶重要性的提升,用戶參與編纂的范圍擴大、直接程度提高,維基技術(shù)的應(yīng)用甚至使得普通詞典用戶能夠打造“屬于自己的”辭書(如互動百科)。這對“唯編者獨尊”的詞典學(xué)舊范式產(chǎn)生了沖擊。同時也應(yīng)該看到,詞典設(shè)計畢竟是一項嚴(yán)肅的專業(yè)性很高的學(xué)術(shù)活動,雙語詞典的設(shè)計則更需要設(shè)計者在語言和跨文化交際等方面擁有深厚的知識儲備,對設(shè)計者的詞典學(xué)素養(yǎng)要求很高。因此,強調(diào)“用戶友好”“用戶至上”并不意味著賦予用戶主導(dǎo)詞典設(shè)計的權(quán)利。此外,廣義設(shè)計觀主張技術(shù)人員根據(jù)需要在不同階段介入詞典設(shè)計,但是反對詞典設(shè)計的“唯技術(shù)論”。沒有詞典專業(yè)人員參與而設(shè)計的詞典要么是披著現(xiàn)代技術(shù)外衣,質(zhì)量卻得不到任何保障,要么是紙質(zhì)詞典內(nèi)容的簡單電子化和網(wǎng)絡(luò)化,并不能真正發(fā)揮現(xiàn)代技術(shù)的優(yōu)勢。因此,“最好的效果很可能來自于專業(yè)編者同信息技術(shù)專家之間持續(xù)、密切的合作”[14]。
回過頭來看有道詞典的詞庫配置,其中的問題便一目了然。從上文可知,三類詞庫既有優(yōu)勢也有局限:雖然版權(quán)購買類詞典的正確性有保障,但是詞典信息的容量和更新頻率均受到限制;網(wǎng)頁抓取類詞典和維基架構(gòu)類詞典雖然能夠彌補版權(quán)購買類詞庫的上述不足,但是所提供信息的正確性難有保障,常常會誤導(dǎo)用戶。有道詞典對三類詞庫的配置使其呈現(xiàn)出一定的互補性,但是不能克服詞庫自身的局限。從根本上講,單一詞庫的局限性源于單一設(shè)計主體的局限性。由于每類設(shè)計主體都存在局限,僅以某類主體作為詞庫設(shè)計主體,無視或排除其他主體的作用,必然導(dǎo)致設(shè)計出的詞庫具有難以克服的局限。有道詞典只是把三類詞庫進行簡單的拼接,并沒有真正實現(xiàn)它們之間的優(yōu)勢互補,本質(zhì)上體現(xiàn)的還是一種“技術(shù)至上”的片面設(shè)計觀。
無可否認的是,網(wǎng)絡(luò)詞典在開發(fā)、維護和更新方面比其他類型的詞典更依賴現(xiàn)代技術(shù)。因此,技術(shù)人員在網(wǎng)絡(luò)詞典設(shè)計中發(fā)揮著非常重要的作用。但是要解決網(wǎng)絡(luò)詞典在詞庫配置方面的問題,就必須克服“技術(shù)至上”的片面設(shè)計觀,通過整合或優(yōu)化詞庫資源之間的配置,使詞典設(shè)計的交際行為在編者、用戶和技術(shù)人員之間得以有效展開。由上文可知,第二類和第三類詞庫提供的詞典信息良莠不齊,因而對網(wǎng)絡(luò)詞典使用者的鑒別力提出了很高要求。然而,對詞典的編者而言,它們都提供了很好的加工素材。網(wǎng)頁抓取類詞庫以“網(wǎng)頁萃取”的現(xiàn)代技術(shù)為基礎(chǔ),對散落在網(wǎng)絡(luò)上的語料進行了初次篩選,所提供的信息大大縮小了編者語料搜集的范圍,從而減少他們的工作量。維基架構(gòu)類詞庫能夠充分發(fā)揮“人多力量大”的優(yōu)勢,在短時間內(nèi)構(gòu)建起辭書的雛形。詞典編者可以發(fā)揮自己的專業(yè)優(yōu)勢,對這兩類詞庫中的信息進行篩選、甄別,最后推出辭書的正式版本,并通過網(wǎng)際互動,了解用戶的需求和辭書的動態(tài)變化,把這些信息反饋給技術(shù)人員,以實現(xiàn)詞典數(shù)據(jù)的維護和實時更新。在這種新型的網(wǎng)絡(luò)詞典設(shè)計模式中,用戶不只是產(chǎn)品的消費者和反饋信息的來源,技術(shù)人員也不再只是被動的參與者,三類主體在網(wǎng)絡(luò)詞典設(shè)計中都能充分發(fā)揮各自的優(yōu)勢,真正實現(xiàn)由編者主導(dǎo)、各方參與的詞典交際行為,如此設(shè)計出的網(wǎng)絡(luò)詞典也能更好地滿足用戶的使用需求。
6 結(jié) 語
網(wǎng)絡(luò)詞典發(fā)展迅速,擁有最廣泛的用戶,其中有道詞典的詞庫配置在同類詞典中具有一定代表性。有道詞典的詞庫主要有版權(quán)購買類、網(wǎng)頁抓取類和維基構(gòu)架類三種,分別對應(yīng)編者、技術(shù)人員和用戶三類設(shè)計主體,各自既有優(yōu)點又有局限。只有充分發(fā)揮三類主體在詞典設(shè)計中的作用,才能整合或優(yōu)化詞庫資源之間的配置,設(shè)計出能夠更好地滿足用戶使用需求的網(wǎng)絡(luò)詞典。endprint
注 釋
[1]魏向清,王東波,耿云冬.中國辭書發(fā)展?fàn)顩r報告(1978—2008)[M].北京:商務(wù)印書館,2014:223
[2]http://www.nielsenccdata.com/marketSecondCh/show.ht?id=117
[3]除了下文即將提到的三種,有道詞典還包含同英英釋義、近義和同根詞三種詞庫,英英釋義是對免費資源WordNet的借用,后兩種來源不明,故本文不做討論。
[4]http://www.crup.com.cn/Item/94240.aspx#
[5]http://www.youdao.com/help/dict/source/
[6]http://cidian.youdao.com/5.0/help/deskdict5beta/features/16.html
[7]盧華國,張雅.移動學(xué)習(xí)時代的移動詞典[J].現(xiàn)代教育技術(shù),2010(6)
[8]姚紅.數(shù)字化時代的詞典出版[J].出版發(fā)行研究,2007(9)
[9]Taylor, J. R. 2003 Linguistic Categorization 3rd [M]. New York: Oxford University Press
[10]de Schryver,Gilles-Maurice. Lexicographers dreams in the electronic-dictionary age [J]. International Journal of Lexicography,2003(2):143-199
[11]http://www.baike.com/wiki/%E7%8E%8B%E5%8A%9B
[12]柳冠中.設(shè)計方法論[M].北京:高等教育出版社,2011:24,37
[13]感謝導(dǎo)師魏向清教授有關(guān)討論對本部分的啟發(fā)。
[14]Svens€閚, B. A Handbook of Lexicography: The Theory and Practice of Dictionary-making[M] New York : Cambridge University Press, 2009:439
(收稿日期:2014-04-18)endprint