李仕春,史梁櫻
(1.西南大學 文學院,重慶400715;2.廣西大學 文學院,廣西 南寧530004)
?
《現(xiàn)6》《牛8》多義詞義項數(shù)目異同研究
李仕春1,史梁櫻2
(1.西南大學 文學院,重慶400715;2.廣西大學 文學院,廣西 南寧530004)
摘要:《現(xiàn)6》、《牛8》多義詞義項數(shù)目的差別,反映了以《現(xiàn)漢》為代表的漢語類中型語文性詞典在常用詞義項方面的編纂水準落后于以《牛8》為代表的同類別英語類詞典,主要表現(xiàn)在《現(xiàn)6》的編纂者忽略了用語料庫技術(shù)豐富并補充現(xiàn)代漢語常用詞義項分布情況的研究。運用語料庫技術(shù)的方法,研究現(xiàn)代漢語中常用詞的義項分布情況,是一項刻不容緩的任務(wù)。
關(guān)鍵詞:《現(xiàn)6》;《牛8》;多義詞
一、引言
李仕春指出《現(xiàn)代漢語詞典》(本文簡稱《現(xiàn)漢》)、《現(xiàn)代漢語學習詞典》、《現(xiàn)代漢語規(guī)范詞典》等漢語類詞典和《牛津高階英語詞典》(本文簡稱《牛津》)、《牛津簡明英語詞典》、《韋氏高階英語詞典》、《郎文高階英語詞典》等英語類詞典都是中型語文性詞典,并統(tǒng)計出:以《牛津》為代表的英語類詞典100核心詞的平均義項比以《現(xiàn)漢》為代表的漢語類詞典要多出5-7個義項,據(jù)此認為:長期以來中國詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學者忽視了現(xiàn)代漢語100核心詞義項分布的研究[1]。
本文用窮盡性的方法統(tǒng)計了《現(xiàn)6》、《牛8》*之所以選取這兩部詞典,是因為《現(xiàn)代漢語詞典》(第6版)(本文簡稱《現(xiàn)6》)是漢語詞典中最有代表性的中型語文性詞典,《牛津高階英語詞典》(第8版)(本文簡稱《牛8》)是英語詞典中最有代表性的中型語文性詞典,并且兩部詞典的編纂體例相差較小。中多義詞義項數(shù)目,發(fā)現(xiàn)兩部詞典中多義詞義項數(shù)目差別很大,這種差別不但印證了上文觀點,而且說明中國學者忽略了用語料庫技術(shù)豐富并補充現(xiàn)代漢語更多常用詞義項分布情況的研究。
二、《現(xiàn)6》《牛8》多義詞義項數(shù)目對比與分析
據(jù)蘇新春(2002)統(tǒng)計,《現(xiàn)漢》(第3版)有12501個多義詞[2]。我們統(tǒng)計《現(xiàn)6》共有13849個多義詞,排除199個表示“姓”的義項后,《現(xiàn)6》共有13650個多義詞(《現(xiàn)6》中一些詞含有兩個義項,一個是該詞的本義另一個表示“姓”,這兩個義項之間沒有引申關(guān)系,我們在統(tǒng)計的時候不把這樣的詞看作多義詞,如:“鮑:名。①軟體動物,貝殼橢圓形,生活在海中。貝殼可入藥,稱石決明。②(Bào)姓?!薄磅U”的義項①和②之間沒有引申關(guān)系,我們把它看作單義詞)。兩者的統(tǒng)計說明《現(xiàn)漢》多義詞義項數(shù)目基本穩(wěn)定。
國內(nèi)少有人運用窮盡性統(tǒng)計的方法統(tǒng)計英語類詞典中多義詞義項數(shù)目,我們統(tǒng)計出《牛8》共有10027個多義詞?!冬F(xiàn)6》和《牛8》多義詞義項數(shù)目具體分布如下表:
《現(xiàn)6》《牛8》多義詞義項數(shù)目對比表*表中《現(xiàn)6》的多義詞區(qū)分為單音多義詞(簡稱單音詞)和復音多義詞(簡稱復音詞),其中復音多義詞義項數(shù)目最多有7個,單音多義詞義項數(shù)目最多有24個,是“點”和“打”。《牛8》中多義詞義項數(shù)目最多的詞是“run”,有50個。
上表顯示,《現(xiàn)6》、《牛8》中多義詞義項數(shù)目具體差別如下:
(一)2個義項的多義詞:《現(xiàn)6》有10253個,占《現(xiàn)6》多義詞總數(shù)的74.08%,其中單音詞1888個,復音詞8365個;《牛8》有4664個,占《牛8》多義詞總數(shù)的46.51%。
(二)3個義項的多義詞:《現(xiàn)6》有1976個,占多義詞總數(shù)的14.48%,其中單音詞738條,復音詞1238條;《牛8》有2177個,占多義詞總數(shù)的21.71%。
(三)4個義項的多義詞:《現(xiàn)6》有632個,占多義詞總數(shù)的4.63%,其中單音詞424條,復音詞108條;《牛8》有1136個,占多義詞總數(shù)的11.33%。
(四)5個義項的多義詞:《現(xiàn)6》有297個,占多義詞總數(shù)的2.18%,其中單音詞233條,復音詞64條;《牛8》有573個,占多義詞總數(shù)的5.71%。
(五)6個義項的多義詞:《現(xiàn)6》有182個,占多義詞總數(shù)的1.33%,其中單音詞167條,復音詞15條;《牛8》有573個,占多義詞總數(shù)的4.07%。
(六)7個義項的多義詞:《現(xiàn)6》有98個,占多義詞總數(shù)的0.72%,其中單音詞91條,復音詞7條;《牛8》有256個,占多義詞總數(shù)的2.55%。
(七)8個及8個以上義項的多義詞:《現(xiàn)6》有216個,占多義詞總數(shù)的1.58%,這些多義詞全部是單音詞;《牛8》有815個占多義詞總數(shù)的8.13%。
由上可見,《現(xiàn)6》共有13650個多義詞,《牛8》共有10027個,《現(xiàn)6》多義詞條目比《牛8》多3623個,但多出的部分主要是2個義項的多義詞,且絕大多數(shù)是復音詞*《現(xiàn)6》中有兩個義項的多義詞的數(shù)目是10253個,《牛8》中有兩個義項的多義詞數(shù)目是4664,前者比后者多5589個。。除此之外,《現(xiàn)6》多義詞義項數(shù)目都比《牛8》少:含有3個義項的多義詞,《現(xiàn)6》比《牛8》少201個;含有4個義項的多義詞,《現(xiàn)6》比《牛8》少504個;含有5個義項的多義詞,《現(xiàn)6》比《牛8》少276個;含有6個義項的多義詞,《現(xiàn)6》比《牛8》少226個;含有7個義項的多義詞,《現(xiàn)6》比《牛8》少391個;含有7個義項的多義詞,《現(xiàn)6》比《牛8》少158個;8個及以上義項的多義詞,《現(xiàn)6》比《牛8》少599個。
三、《現(xiàn)6》《牛8》多義詞義項數(shù)目異同原因分析
盡管《現(xiàn)6》比《牛8》多出3623個多義詞,但是除含有2個義項的多義詞《現(xiàn)6》比《牛8》的數(shù)目多之外,其他都是《現(xiàn)6》義項數(shù)少于《牛8》。兩部詞典多義詞義項數(shù)目的差別主要集中在4個義項到20個義項之間,《牛8》有4個及以上義項的多義詞共有3128個,而《現(xiàn)6》僅有1418個。《現(xiàn)6》和《牛8》義項數(shù)目出現(xiàn)上述差別的主要原因在于《牛8》的編纂者在20世紀八九十年代就已經(jīng)用語料庫技術(shù)發(fā)現(xiàn)英語常用多義詞的新義項了,而《現(xiàn)漢》的編纂者卻沒有。
張志毅指出:“語料庫理念萌生于1959年倫敦大學語言學教授R. Quirk:幾年間建起涵蓋多種語體的上百萬字的‘英語用法語料庫’。1961年美國布朗大學建起第一個機讀的逾百萬字的‘布朗語料庫’。從20世紀80年代起,柯林斯等出版社和伯明翰等大學合作,創(chuàng)建了‘CO-BUILD語料庫’,由此開發(fā)了《柯林斯COBUILD英語詞典》?!杜=蚋唠A英語學習詞典》、《朗文當代高級英語辭典》、《錢伯斯基礎(chǔ)英語詞典》等的最新版本,也都是以語料庫為依托編寫而成。”[3]世界語言學自20世紀五六十年代進入語料庫時代,英語詞典編纂者在20世紀八九十年代就把語料庫技術(shù)廣泛應(yīng)用于英語詞典的編纂與研究中了,他們非常重視用語料庫技術(shù)發(fā)現(xiàn)英語多義詞的新義項,我們的統(tǒng)計顯示《牛津》1至8版中100核心詞的平均義項分別是7.55個、7.91個、7.03個,8.25個、8.47個,10.2個、10.47、10.61。《牛津》(1至3版)分別出版于1948、1963、1974年,這三版中100核心詞的平均義項數(shù)目基本穩(wěn)定,這說明此段時間《牛津》詞典編纂者還沒有利用語料庫技術(shù)把豐富補充常用詞的義項作為重點修訂對象;《牛津》(4至6版)分別出版于1989、1995、2000年,這三版中100核心詞的平均義項數(shù)目有較大的變化,這說明這三版的詞典編纂者已經(jīng)利用語料庫技術(shù)把豐富補充常用詞的義項作為重點修訂對象;《牛津》(6至8版)分別出版于2000、2005、2012年,這三版100核心詞的平均義項數(shù)目基本穩(wěn)定下來,并且從第6版開始《牛津高階英語詞典》常用詞的編纂體例也發(fā)生了很大變化。
目前,占據(jù)英語辭書主要市場的牛津、韋氏、朗文與麥克米倫等英語詞典,都是在語料庫的基礎(chǔ)上編成的。在最新出版的英語類中型語文性詞典中,100核心詞的平均義項分別是:《牛津高階英語詞典》 (第8版)10.61個,《牛津簡明英語詞典》(第10版)12.81個,《麥克米倫高階英語詞典》(第2版)11.68個,《韋氏高階英語詞典》(2009年)11.43個,《郎文當代英語詞典》(第4版)10.35個。與傳統(tǒng)憑借語感編纂的詞典相比,建立在語料庫技術(shù)基礎(chǔ)上的英語類中型語文性詞典在多義詞義項劃分方面更加細化、義項收錄更加全面,在詞典編纂史上實現(xiàn)了里程碑式的跨越發(fā)展。
章宜華早在2010年就指出:“詞典語料庫是西方上世紀70—80年代的產(chǎn)物,而我們直到90年代才有這方面的成果發(fā)表,而至今大多仍只限于紙上談兵,沒有投入商業(yè)運營的大型詞典語料庫;而在西方談?wù)Z料庫的建設(shè)和重要性已經(jīng)是個過時的話題。這些都值得學術(shù)界和出版界注意。”[4]確實,中國自20世紀90年代起就開始相繼建設(shè)了一批漢語語料庫,最有代表性的如北京大學中國語言學研究中心研制的“CCL語料庫”,截止2015年9月18日現(xiàn)代漢語語料庫規(guī)模已達5.81億字,可以說,目前我國的語料庫已經(jīng)初步具備了詞典編纂所需要的規(guī)模。盡管如此,在當今中國,用語料庫技術(shù)發(fā)現(xiàn)漢語常用詞新義項的方法還沒有引起漢語詞典編纂者的足夠重視。例如:我們的統(tǒng)計顯示《現(xiàn)漢》1至6版中100核心詞的平均義項分別是4.85個、5.20個、5.18個、5.18個、5.20個、5.42個,這表明,《現(xiàn)漢》(1至6版)并沒有把豐富補充常用詞的義項作為重點修訂對象,也就是說《現(xiàn)漢》(第6版)對100核心詞義項的劃分還和《現(xiàn)漢》(第1版)基本一致。與《現(xiàn)漢》同類別的其他漢語類詞典:《現(xiàn)代漢語規(guī)范詞典》(第2版)100個核心詞的平均義項是5.68個,《現(xiàn)代漢語學習詞典》(2010版)5.9個,《新華詞典》(最新修訂版)4.33個,這說明漢語類中型語文性詞典中100核心詞乃至更多常用詞義項的劃分并沒有建立在大型語料庫的基礎(chǔ)上進行成規(guī)模地系統(tǒng)修訂,也說明漢語類詞典中常用多義詞的義項至今依然處在20世紀五六十年代靠語感確定義項的編纂水準。因此漢語類詞典中存在常用多義詞義項收錄不全的情況就在所難免了,從而導致漢語類中型語文性詞典義項的劃分比較粗疏、存在義項漏收的情況。
評價一部詞典是否優(yōu)劣的基本參數(shù)有兩個:一是詞典的編纂體例,二是詞典中常用多義詞的釋義,而詞典編纂體例是否完善也最終體現(xiàn)在常用多義詞釋義方面,也即常用多義詞義項的精細度、常用多義詞義項的釋義用語、常用多義詞義項的排列等方面?!冬F(xiàn)漢》從20世紀五六十年代開始編纂,1978年發(fā)行第1版, 2012年發(fā)行第6版,但是半個世紀以來,《現(xiàn)漢》(1-6版)無論在編纂體例方面還是常用詞的釋義方面基本沒有變化,因此,按照上述標準評價以《現(xiàn)漢》為代表的漢語類詞典,我們很容易就會得出《現(xiàn)6》常用詞義項方面的編纂水準至今仍處在20世紀五六十年代的水平,落后于英美國家同類型的詞典。
古今中外語文性詞典的差別主要體現(xiàn)在常用詞的釋義方面,《現(xiàn)漢》與同類別的英語詞典相比落后的主要原因在于《現(xiàn)漢》沒有用語料庫技術(shù)的方法豐富并補充常用詞的義項。用語料庫搜集語料與人工搜集語料相比具有許多優(yōu)越性,最重要的優(yōu)點就是用語料庫搜集語料具有里程碑式的、劃時代的方法論意義,以“黑”為例:用語料庫檢索的方法可以在16毫秒的時間內(nèi)得出“黑”在CCL現(xiàn)代漢語語料庫中有130831條。假設(shè)用人工閱讀的方法查找1條含有“黑”字的語句需要用1個小時(實際上有時候不止1個小時),那么要找130831條“黑”字語料則要用130831小時。經(jīng)過計算可以知道查找同樣多的語料的速度,用語料庫技術(shù)的方法約是人工閱讀的290多億倍,簡直是神速。
我們可以根據(jù)有關(guān)字頻、詞頻的統(tǒng)計材料,確定3000個構(gòu)詞能力強、使用頻率高的常用詞作為主要研究對象,在語料庫基礎(chǔ)上以個案研究和系統(tǒng)研究相結(jié)合的形式著重探討現(xiàn)代漢語中3000常用詞的義項分布:一方面可以詳細描寫出每個常用詞在現(xiàn)代漢語中的義項分布情況,另一方面也可以歸納出同類詞在現(xiàn)代漢語中的義項分布規(guī)律。
如果說李仕春通過統(tǒng)計100核心詞的數(shù)據(jù)說明“長期以來中國詞典的編纂者乃至研究現(xiàn)代漢語詞匯的學者忽視了現(xiàn)代漢語100核心詞乃至更多常用詞義項的研究”[1],那么本文則進一步印證了這一觀點——《現(xiàn)6》的編纂者確實忽略了用語料庫技術(shù)豐富并補充現(xiàn)代漢語常用詞義項分布情況的研究。
四、結(jié)語
《現(xiàn)代漢語詞典》自問世以來,發(fā)行量大、應(yīng)用面廣,世所罕見,特別是進入新世紀以來《現(xiàn)漢》每年的發(fā)行量大概在300萬至500萬冊之間,銷售額度在2—4億,可見其在國民學習生活中的重要作用,堪稱國典,然而卻還存在著落后的一面。李仕春《語料庫視野下的現(xiàn)代漢語“綠”字義項分布研究》[5]、《語料庫視野下的現(xiàn)代漢語“狗”字義項分布研究》[6]等系列文章,就以理論和實踐的形式說明漢語中常用詞的義項數(shù)目一點也不比英語中常用詞的義項數(shù)目少。因此,在漢英詞典的視角下,在已有漢語類詞典釋義的基礎(chǔ)上,運用語料庫技術(shù)的方法,描寫出現(xiàn)代漢語中常用詞的義項分布情況,是一項刻不容緩的任務(wù)。這樣的研究成果有利于《現(xiàn)漢》的編纂水準達到國際先進的水平,是功在當代利在千秋的利國利民的大好事。
[參考文獻]
[1]李仕春.漢英詞典100核心詞釋義對比研究[J].中南大學學報:社會科學版,2013,(6):252-258.
[2]蘇新春.漢語釋義元語言研究[M].上海:上海教育出版社,2005:51.
[3]張志毅.辭書強國——辭書人任重道遠的追求[J].辭書研究,2012,(1):1-9.
[4]章宜華.《辭書研究》與新時期詞典學理論和編纂方法的創(chuàng)新[J].辭書研究,2010,(1):57-69.
[5]李仕春.語料庫視野下的現(xiàn)代漢語“綠”字義項分布研究[J].山西大同大學學報:社會科學版,2013,(5):62-66.
[6]李仕春,李蓓.語料庫視野下的現(xiàn)代漢語“狗”字義項分布研究[J].北華大學學報:社會科學版,2013,(5):9-11.
[責任編輯:康邦顯]
中圖分類號:H06
文獻標識碼:A
文章編號:1001-0238(2016)01-0109-04
[作者簡介]李仕春(1973—),男,山東莒縣人,西南大學文學院教授,主要從事詞匯學、詞典學研究。
[基金項目]國家社會科學基金重點項目“語料庫視野下的現(xiàn)代漢語單音多義詞義項分布研究”(14AYY018);教育部規(guī)劃基金項目“山東方言表體范疇的語法化音變研究”(11YJA740048);西南大學科研基金資助項目“語料庫視野下的現(xiàn)代漢語單音多義詞義項分布研究”(SWU1509502)。
[收稿日期]2015-11-25