趙嬌玥
摘要:本文運用了語料庫的方法,并采用定量研究的方式,對“龜”字在現代漢語中的義項分布情況進行了再次描寫和研究,最終建議在《現代漢語詞典》等詞典釋義的基礎上增收4個義項。
關鍵詞:語料庫;龜;新義項
一、引言
《現代漢語詞典(第6版)》(以下簡稱《現漢》)作為辭書經典,隨著時代的發(fā)展,難免出現義項收錄不完全的現象。由于時代的局限性,其在收詞立項方面也有待補充和完善。“龜”字在《現漢》中只有1個義項,與其他漢語類中型語文性詞典所收“龜”字義項相比大同小異,基本無變化。本文參照了強利苗(2012)推薦的研究方法——定量定性相結合的方法,在使用CCL(北大語料庫語料庫)的基礎上,建立了“龜”字數據庫,并對其逐條標注,研究其在現代漢語中的義項分布情況,發(fā)現了“龜”字在現代漢語中還有4個新義項未被《現漢》收錄。
二、研究方法及步驟
(一)下載不同類別的語料
本文所用的語料庫為北京大學中國語言學研究中心研制的北大語料庫——CCL。該語料庫分為現代漢語語料庫和古代漢語語料庫,現代漢語語料又分為當代語料和現代語料,共19類。我們可以下載語料查找“龜”的新義項。“龜”的選取語料:當代語料有:口語、史傳、應用文、報刊精選、人民日報、作家文摘、市場報、故事會、新聞報、讀書、讀者、文學、電視電影、相聲小品、網絡語料和翻譯,現代語料有:文學,共選取17類語料。
為保證下載的語料全面、真實地反映“龜”字在現代漢語中的分布情況,本文將17類語料全部分類下載。下載方法:第一步:打開CCL語料庫高級查詢頁面建立查詢表達式。第二步,建立查詢表達式,再次點擊CCL現代漢語語料庫頁面的“查找”得出當代語料中“口語”語料25條。用同樣的方法得出其他16類當代語料的下載數目:
當代下面“龜”有3565條語料:
當代|口語 “龜”有25條
當代|史傳 “龜”有28條
當代|應用文 “龜”有534條
當代|報刊|精選 “龜”有147條
當代|報刊|人民日報 “龜”有388條
當代|報刊|作家文摘 “龜”有122條
當代|報刊|市場報 “龜”有88條
當代|報刊|故事會 “龜”有4條
當代|報刊|新聞報 “龜”有639條
當代|報刊|讀書 “龜”有203條
當代|報刊|讀者 “龜”有177條
當代|文學 “龜”有774條
當代|電視電影 “龜”有103條
當代|相聲小品 “龜”有18條
當代|網絡語料 “龜”有133條
當代|翻譯 “龜”有170條
現代下面“龜”有50條語料:
現代|文學 “龜”有50條
由于CCL現代漢語語料庫里“龜”的語料共有3664條,刪除無出處的49條語料,逐類篩選后留下“龜”的語料3615條,其中當代3565條,現代50條,并對其分析。
(二)建立“龜”字數據庫并對“龜”字義項進行標注
1.建立“龜”字數據庫。首先,建立Access數據庫。打開Access數據庫,在【文件】→【獲取外部數據】→【導入】項目下,將準備好的語料導入Access中,建立“龜”字數據庫。接著,對數據庫進行相應的設置,打開“龜”字數據庫,點擊【設計】,在“字段名稱”欄中,把字段名稱依次改為“序號”、“例句”、“義項”、“復字詞”、“備注”、“專名”、“出處”、“文章類別”及“作者”。具體見下表。
2.具體標注方法說明。上表中各欄目具體標注說明如下:(1)《現漢》中已有義項的標注?!冬F漢》里“龜”的義項只有1個:①名爬行動物,身體長圓而扁,有堅硬的殼,四肢短,趾有蹼,頭、尾巴和四肢都能縮入甲殼內,常見的有烏龜。以上義項在數據庫“義項”一欄分別標注為:1。(2)新義項的標注。新義項也標注在“義項”一欄,在標注中發(fā)現“龜”的新義項(指《現漢》沒有的義項)標注為2、3、4、5。(3)專有名詞的標注。數據庫“專名”一欄的標注:“人名”標為1,“地名”標為2,“官職名”標為3,“其他專有名詞”標為4。(4)復字詞的標注。凡語料中第一次出現的復字詞都標注于此欄的對應位置。(5)數據庫中“備注”、“出處”、“文章類別”及“作者”等欄做相應的標注。
三、“龜”字義項的分布情況
(一)“龜”字在《現漢》中已有義項在語料庫中的分布情況
名爬行動物,常見的有烏龜。在所建數據庫中包含該義項的句子共有1912條,約占所建數據庫總數的52.891%。由該義項構成的復字詞有:老龜、海龜等。
(二)“龜”字專有名詞在語料庫中的分布情況
通過對CCL語料庫中篩選得出“龜”字的專有名詞的語料有831條,約占所建數據庫總數的22.988%。
表示人名的語料有224條,約占所建數據庫總數的6.196%,復字詞:陸龜蒙、彭龜年;表示地名的語料有244條,約占所建數據庫總數的6.750%,復字詞:龜城、龜山等;其他專有名詞語料有363條,約占所建數據庫總數的10.041%,復字詞:龜船、金龜巖等。
(三)“龜”字新義項在語料庫中的分布情況
在所建的“龜”字數據庫中,“龜”字在《現漢》中已有的義項共有1912條,約占所有“龜”字語料的52.891%。專有名詞的語料有831條,約占所建數據庫總數的22.988%。除此之外,還有872條新義項語料,占數據庫的24.121%,未被《現漢》所囊括。因此,本文建議《現漢》在再次修訂時能夠增收“龜”的以下4個義項。
1.名留學歸國人員。在所建數據庫中包含該義項的句子共有37條,約占所建數據庫總數的1.024%。由該義項構成的復字詞有:“海[龜]”、洋龜。
例句:也是偶然,參加面試的申請者之中我是唯一一個擁有留洋經歷的“海[龜]”。(當代\網絡語料\網頁\C000022.txt)
2.名罵人的話。在所建數據庫中包含該義項的句子共有604條。約占所建數據庫總數的16.708%。由該義項構成的復字詞有:龜兒子、龜孫子等。
3.名男性生殖器。在所建數據庫中包含該義項的句子共有25條,約占所建數據庫總數的0.692%。由該義項構成的復字詞有:龜頭炎、龜頭。
例句:要注意陰莖[龜]頭部是否有硬結、丘疹、水泡、潰瘍,睪丸是否有腫物、結節(jié)及疼痛……(當代\應用文\健康養(yǎng)生\沈倩生活健康密碼.txt)
4.名方士術數,占卜,星象。在所建語料庫中包含該義項的句子共有34條,約占所建語料庫總數的0.941%。由該義項構成的復字詞有:龜兆、龜蛇、蓍龜。
例句:第四種是蓍[龜],這是中國古代占卜用的兩種主要方法。(當代\應用文\社會科學\中國哲學簡史.txt)
四、結語
綜上所述,本文認為《現漢》“龜”字釋義應調整為:①名爬行動物,身體長圓而扁,背部隆起,有堅硬的殼,四肢短,趾有蹼,頭、尾巴和四肢都能縮入甲殼內。多生活在水邊,吃植物或小動物。種類很多,常見的有烏龜。②名留學歸國人員。③名罵人的話。④名男性生殖器。⑤名方士術數,占卜,星象。
本文認為以上論證和分析一方面證明了《現漢》在收詞方面的不完善之處,另一方面證明了漢語中語文性詞典編纂引進語料庫技術的必要性。
參考文獻:
[1]胡明揚,謝自立.詞典學概論[M].北京:中國人民大學出版社,1982.
[2]張志毅,張慶云.詞匯語義學[M].北京:商務印書館,2010.
[3]黃建華.詞典論(修訂版)[M].上海辭書出版社,2001.
[4]李仕春.漢英詞典中100核心詞義項分布研究[J].北華大學學報,2013,(06).
[5]杜翔.時代性 準確性 系統(tǒng)性——論第5版《現代漢語詞典》釋義的修訂[J].辭書研究,2006,(1).