国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

《年度媒體高頻詞語表》對(duì)辭書編纂的價(jià)值*

2019-07-22 12:03侯瑞芬
辭書研究 2019年4期
關(guān)鍵詞:高頻詞比薩辭書

侯瑞芬

國家語言資源監(jiān)測(cè)與研究中心對(duì)平面、有聲、網(wǎng)絡(luò)三種媒體的語料進(jìn)行監(jiān)測(cè),整理形成當(dāng)年的《年度媒體用字總表》、《年度媒體高頻詞語表》(以下簡(jiǎn)稱《高頻詞表》)和《年度媒體新詞語表》等詞表,在教育部語言文字信息管理司組編的《中國語言生活狀況報(bào)告》中公布,至今已有八年。其中的《高頻詞表》是對(duì)每年的語料進(jìn)行分詞系統(tǒng)切分,將其中覆蓋率達(dá)到95%的詞語去掉時(shí)間表達(dá)式、數(shù)字表達(dá)式、專有名稱后得到的。每年公布的高頻詞語數(shù)量在2.5—2.8萬之間,并有逐年上升趨勢(shì)?!陡哳l詞表》不僅對(duì)于人們了解當(dāng)年的常用詞語狀況很有幫助,對(duì)漢語詞匯研究和辭書編纂來說也是一份珍貴的資料。

我們將在對(duì)《高頻詞表》中詞語的整體面貌進(jìn)行分析的基礎(chǔ)上,對(duì)比《高頻詞表》與《現(xiàn)代漢語詞典》(以下簡(jiǎn)稱《現(xiàn)漢》)第7版中的詞語異同,并進(jìn)一步說明《高頻詞表》對(duì)辭書編纂特別是收詞問題的應(yīng)用價(jià)值。為了對(duì)詞語的發(fā)展變化有一個(gè)相對(duì)完整的了解,我們利用《人民日?qǐng)?bào)》1946創(chuàng)刊到2018年這七十多年的語料對(duì)相關(guān)詞語的使用進(jìn)行分析。

一、 《高頻詞表》反映了當(dāng)今漢語詞匯的基本面貌和發(fā)展趨勢(shì)

《高頻詞表》是當(dāng)年媒體語料中出現(xiàn)頻率最高的詞的集合,我們將2010年—2017年間的《高頻詞表》匯總在一起,除去字母詞外,8年間一共收錄33815個(gè)年度高頻詞,我們稱為《高頻詞表》合收詞,8年中共同收錄的有22203個(gè)詞,我們稱為《高頻詞表》共收詞。這22203個(gè)《高頻詞表》共收詞可以視為近幾年比較穩(wěn)定的高頻詞語的一個(gè)集合,反映了近年來漢語詞匯的基本面貌和發(fā)展趨勢(shì)。我們主要從詞長(zhǎng)和用字兩方面進(jìn)行分析。

(一) 《高頻詞表》中詞語的詞長(zhǎng)分析

我們對(duì)2010年—2017年《高頻詞表》的詞長(zhǎng)做了統(tǒng)計(jì),結(jié)果如下:

表1 《高頻詞表》中詞語的詞長(zhǎng)統(tǒng)計(jì)

可以看到,二字詞是漢語詞匯的主體,占有絕對(duì)優(yōu)勢(shì),其次是三字詞,五字及以上的詞很少。三字詞近年來的快速發(fā)展已經(jīng)引起不少學(xué)者的關(guān)注,在新產(chǎn)生的詞中,三字詞更是取代二字詞成為最主要的類型。一些學(xué)者由此認(rèn)為“漢語將進(jìn)入一個(gè)以三音詞為主的發(fā)展階段”(陶原珂 2003;李海霞 2013等),但是通過對(duì)近8年來《高頻詞表》的分析,我們可以看到,與《高頻詞表》合收詞相比,《高頻詞表》共收詞中的二字詞比例增加,而三字詞比例減少。這表明漢語詞匯系統(tǒng)中穩(wěn)定的詞語仍是二字詞,而三字詞則是相對(duì)不穩(wěn)定的。

(二) 《高頻詞表》中詞語的用字分析

除單字之外的19577個(gè)共收的高頻詞是由3210個(gè)漢字構(gòu)成的,其中構(gòu)詞能力最強(qiáng)的20個(gè)漢字及它們的構(gòu)詞數(shù)量分別是:

表2 《高頻詞表》中前20個(gè)高頻漢字的構(gòu)詞量

應(yīng)該說,漢字的構(gòu)詞能力是相當(dāng)強(qiáng)的,常用漢字尤其如此,前20個(gè)高頻漢字的構(gòu)詞量都在100個(gè)以上?;蛟S這個(gè)數(shù)據(jù)可以促使我們反思現(xiàn)在的基礎(chǔ)教育中是否更應(yīng)注重詞匯教學(xué),擴(kuò)大學(xué)生的詞匯量,對(duì)學(xué)生詞典收字量的確定也有一定的啟發(fā)。

二、 《高頻詞表》與詞典詞目的性質(zhì)同中有異

在《高頻詞表》8年共同收錄的22203個(gè)高頻詞中,有17532個(gè)被《現(xiàn)漢》第7版收錄,占到了79.00%,但仍有4671個(gè)詞沒有被《現(xiàn)漢》第7版收錄。這一方面提醒我們《高頻詞表》與詞典的詞目有很大共性,都是一定時(shí)期內(nèi)社會(huì)群體所使用的比較穩(wěn)定的詞語集合,但也說明它們同中有異,有比較明顯的差異。

首先,《現(xiàn)漢》是為推廣普通話,促進(jìn)漢語規(guī)范化服務(wù)的,它記錄的是現(xiàn)代漢語普通話詞匯的整體面貌?!冬F(xiàn)代漢語詞典編輯計(jì)劃綱要草案》指出:“這部詞典所收的通用的詞是物質(zhì)生活、文化生活和政治、經(jīng)濟(jì)生活中普通的詞,各行各業(yè)的普通的詞,各學(xué)科的普通的詞。”而《高頻詞表》是在媒體語料基礎(chǔ)上完成的,帶有鮮明的媒體語言的特點(diǎn),比如它最高頻的雙字詞是“記者”,排第二位的才是“我們”。一些當(dāng)年的熱點(diǎn)事物也會(huì)出現(xiàn)在當(dāng)年的《高頻詞表》中,如2017年的“氫彈”和“涉臺(tái)”,這都與它選取媒體語料的特點(diǎn)密不可分。

其次,《現(xiàn)漢》中的詞目選擇是面向人的,而《高頻詞表》是機(jī)器分詞的結(jié)果。機(jī)器分詞看中結(jié)構(gòu)的凝固程度和復(fù)現(xiàn)率,而人的分詞考慮“意義的完整性和使用的獨(dú)立性”(蘇新春,顧江萍 2000)。不同的出發(fā)點(diǎn)決定了它們必然呈現(xiàn)出不同的詞匯面貌。

《高頻詞表》的合收詞中未收入《現(xiàn)漢》第7版的4671個(gè)詞語,有相當(dāng)一部分是由于兩種詞表的差異導(dǎo)致的。我們主要從三個(gè)方面對(duì)《高頻詞表》和《現(xiàn)漢》在收詞上的差異進(jìn)行分析。

(一) 收詞單位

《高頻詞表》對(duì)一些高頻組合的詞語會(huì)整體收錄,如“工作委員會(huì)”“本職工作”“不僅如此”都是《高頻詞表》中收錄的詞;而詞典以收詞為主,如果一個(gè)詞匯單位可以分解,而且分解后的單位具有一定的組合能力,詞典通常收錄更小的單位,這樣做的目的是為了以簡(jiǎn)馭繁,體現(xiàn)詞目的層級(jí)性和統(tǒng)轄性。

比如對(duì)“雙音詞+于”的處理,《現(xiàn)漢》通常只收雙音詞,如“有賴、取決、來源”,然后通過括注的方式說明它可以和“于”連用。這樣處理的好處是既可以涵蓋住雙音詞,又可以涵蓋住“雙音詞+于”,收詞效率更高。而《高頻詞表》則或者只收高頻出現(xiàn)的“雙音詞+于”形式,如“有賴于、無愧于、取決于”,或者同時(shí)收“雙音詞”和“雙音詞+于”形式,如“來源/來源于、致力/致力于、相當(dāng)/相當(dāng)于、甚至/甚至于”。

再如對(duì)四字格的處理,《高頻詞表》一般會(huì)整體收錄,而《現(xiàn)漢》則會(huì)選取組合能力較強(qiáng)的構(gòu)成單位進(jìn)行收錄:

表3 《現(xiàn)漢》第7版和《高頻詞表》對(duì)四字格的收錄差異(1)

雙音詞連用的四字組,如果詞義等于兩個(gè)成詞語素之和,詞典一般只出雙音詞而不再出四字組,但《高頻詞表》則主要根據(jù)頻率來取舍。如:

表4 《現(xiàn)漢》第7版和《高頻詞表》對(duì)四字格的收錄差異(2)

《現(xiàn)漢》對(duì)四字格的這兩種處理方式都是為了提高收詞的效率。這類簡(jiǎn)單的組合讀者可以根據(jù)各組成成分的意義,通過組合關(guān)系而自然理解,不必在詞典中整體收錄再做解釋。

(二) 詞匯詞與詞法詞的區(qū)分

《高頻詞表》與詞典詞目的差別也體現(xiàn)在對(duì)詞法詞的態(tài)度上。董秀芳(2004)指出,詞匯詞是需要列入詞庫的詞,詞法詞則是由詞法規(guī)則生成的詞。這種區(qū)分對(duì)詞典收詞非常重要,一方面詞法詞具有能產(chǎn)性,詞典不可能將全部的詞法詞都收入詞典;另一方面,詞典存在的首要目的就是為了解釋人們?cè)陂喿x理解中存在困難的詞,所以必須考慮詞語的釋義價(jià)值,而《高頻詞表》則不需要考慮這種區(qū)分。這種差別在重疊形式、序數(shù)詞、詞綴構(gòu)成的派生詞等的收錄中均有突出的表現(xiàn)。

《高頻詞表》收錄了一些重疊形式,如AA式的“層層、村村”,AABB式的“高高興興、陸陸續(xù)續(xù)”,數(shù)量重疊形式“一步步、一點(diǎn)一點(diǎn)”等。對(duì)于重疊形式的收錄,詞典主要看基式與重疊式的意義有無較大變化和重疊式能否自由推廣。如“高高興興”和“高興”意義差別不大,詞典不會(huì)收錄,但“馬馬虎虎”除了“馬虎”的“不細(xì)心”義,還發(fā)展出“勉強(qiáng);湊合”義,詞典就會(huì)收錄;再如漢語雙音節(jié)動(dòng)詞的重疊形式是ABAB,如“打聽打聽”“了解了解”,這類可以自由推廣的重疊形式詞典不收錄,但“躲躲閃閃”是無法類推的,詞典就會(huì)收錄。

《高頻詞表》著眼于詞的頻率,有些序數(shù)詞和表示序列的詞因?yàn)槌霈F(xiàn)頻率高而出現(xiàn)在《高頻詞表》中,如“第二、第三、第四、第六、第七、第八、第九、第十;第一季度、第二季度、第三季度、第四季度;第一版;大一、大二、大三;二月、三月、六月、七月、八月、九月”,等等。這些詞規(guī)律性很強(qiáng),不可能也沒有必要收入詞典。比如《現(xiàn)漢》一般不會(huì)收錄“星期一”至“星期六”,而是在“星期”下有所交代,但“星期日”由于是不能類推的,詞典就會(huì)收錄。這是詞典對(duì)規(guī)律性強(qiáng)的詞一種簡(jiǎn)便的處理方式,既可以涵蓋有關(guān)的詞目,又可以以簡(jiǎn)馭繁。

《高頻詞表》會(huì)收錄一些帶有詞綴、類詞綴的詞語,比如《高頻詞表》中“性”作為詞綴構(gòu)成的詞有229個(gè),“者”作為詞綴構(gòu)成的詞有113個(gè),“率”作為詞綴構(gòu)成的詞有59個(gè)。但除非意義比較特殊,詞典通常不會(huì)收錄太多這類詞,只在該詞綴中舉例說明。因?yàn)檫@些詞具有能產(chǎn)性,結(jié)構(gòu)上可以類推,語義比較透明,除少數(shù)高頻使用的組合外,詞典多采取在詞綴下處理的辦法,不單獨(dú)出條。

(三) 語音信息

《高頻詞表》與詞典的另一個(gè)重要區(qū)別是《高頻詞表》主要關(guān)注詞的書寫形式,而詞典則涉及個(gè)詞的形、音、義等諸多方面。這主要體現(xiàn)在它們對(duì)兒化詞的收錄上,如《高頻詞表》中的“差點(diǎn)、靠譜、較真、支招、貓膩、沒準(zhǔn)、模特、納悶、年頭、起名、嗓門、玩意、餡餅、心眼、大腕、叫座、拔尖、小道”等詞在《現(xiàn)漢》中均以兒化的形式出現(xiàn),因?yàn)檫@些詞在使用中是必須讀兒化的。兒化形式的有無也是導(dǎo)致二者收詞差異的原因之一。另外,對(duì)于一些可以讀成兒化也可以不讀成兒化的詞語,《現(xiàn)漢》也用括注的形式“(~兒)”來說明,如“開竅、吭聲”等,這樣,詞典就采取不同的處理方式對(duì)必須兒化和可以兒化的詞語做出了區(qū)分。

三、 《高頻詞表》對(duì)辭書編纂的價(jià)值

盡管《高頻詞表》與《現(xiàn)漢》所收的詞目在性質(zhì)上存在不同,但是高頻詞語有著非常重要的價(jià)值,“對(duì)反映語言的真正面貌與使用狀況來說,詞頻反映的信息比詞種數(shù)更為重要。詞頻顯示出一個(gè)詞的社會(huì)使用密度、人們的熟知程度,是一個(gè)詞穩(wěn)定性的重要標(biāo)志”(蘇新春等 2006)。作為一部以記錄現(xiàn)代漢語普通話詞語為己任的規(guī)范型詞典,《現(xiàn)漢》在收詞時(shí)自然應(yīng)該首先注意高頻詞語。王敏(2009)已經(jīng)從辭書編纂的角度分析了媒體字詞頻統(tǒng)計(jì)結(jié)果的應(yīng)用價(jià)值,指出這些統(tǒng)計(jì)結(jié)果“體現(xiàn)了現(xiàn)代漢語的最新發(fā)展情況,其成果值得辭書編纂界關(guān)注”,我們將具體分析《高頻詞表》對(duì)辭書編纂,尤其是詞典收詞方面的價(jià)值。

除去詞表性質(zhì)不同造成的差異,《高頻詞表》未收入《現(xiàn)漢》第7版的4671個(gè)詞非常值得我們?nèi)リP(guān)注,它們是《高頻詞表》對(duì)辭書編纂特別是詞典收詞的主要價(jià)值所在,主要體現(xiàn)在下面三個(gè)方面。

(一) 增補(bǔ)詞目

《高頻詞表》可以為詞典增補(bǔ)詞目提供參考,因?yàn)槭褂妙l率往往是判定一個(gè)新詞是否穩(wěn)定并具有收入詞典資格的重要標(biāo)準(zhǔn)之一。《高頻詞表》中有不少詞是可收入詞典的。它們既有對(duì)新事物進(jìn)行說明的詞,如“代購、試駕、夜店”;也有一些從行業(yè)詞進(jìn)入日常生活中的詞,如“橋段、藍(lán)籌、絕殺”等;還有一些因構(gòu)成語素不自由而合并形成的詞,如“售罄、撰文、殆盡”等。以“售罄”為例,它其實(shí)就是“賣完”的意思,但“賣完”的組成成分都是可獨(dú)立使用的,且語義透明,詞典不會(huì)收錄,而“售罄”的組成成分已經(jīng)不能獨(dú)立使用,“罄”也不常用,語義透明度低,所以詞典可以收錄。我們主要分析《高頻詞表》對(duì)詞典增補(bǔ)漏收詞和增收新詞兩方面的價(jià)值,增收的新詞著重分析詞綴派生詞、詞匯化而來的詞和縮略詞。

1. 增補(bǔ)漏收詞

《現(xiàn)漢》作為一部以反映現(xiàn)代漢語詞匯整體面貌為己任的中型語文詞典,在收詞方面取得了公認(rèn)的成績(jī),但詞匯數(shù)量繁多,早期辭書編纂又主要依靠手工卡片記錄,難免有所遺漏?!陡哳l詞表》正好可以彌補(bǔ)這一缺陷。比如“收緊”“疊加”“練就”這三個(gè)詞《現(xiàn)漢》并未收錄,但它們?cè)?010年—2017年的《高頻詞表》中均有出現(xiàn),相對(duì)穩(wěn)定,也較為常用。

表5 詞典可補(bǔ)收的詞

“收緊”表面上看是一個(gè)普通的動(dòng)補(bǔ)結(jié)構(gòu),如“收緊韁繩”,這種動(dòng)補(bǔ)結(jié)構(gòu)數(shù)量龐大,語義透明度高,詞典是不會(huì)收錄的。但“收緊”還有“嚴(yán)加控制”的意思,如“收緊銀根”,這個(gè)用法在《人民日?qǐng)?bào)》中第一次出現(xiàn)是1957年:

(1) 但美國仍堅(jiān)持它自己的主張,只同意稍稍放寬對(duì)中國的“禁運(yùn)”,……;另外還要收緊對(duì)所謂“例外程序”的運(yùn)用。

(《英國放寬對(duì)華“禁運(yùn)”以后》,《人民日?qǐng)?bào)》1957-06-08)

“疊加”表示兩個(gè)事物在同一位置重疊共存,《人民日?qǐng)?bào)》中第一次出現(xiàn)是1959年:

(2) 因此在米波波段中我們測(cè)到的太陽是扁形的,而且比肉眼看到的要大得多,當(dāng)日面上出現(xiàn)黑子的時(shí)候,太陽的輻射上便疊加著黑子的影響,……

(《射電天文學(xué)——打開宇宙秘密的新鑰匙》,《人民日?qǐng)?bào)》1959-08-22)

“練就”是“練成”的意思,表示“經(jīng)過練習(xí)訓(xùn)練而取得某一成就”,在《人民日?qǐng)?bào)》中第一次出現(xiàn)是1948年:

(3) 戰(zhàn)士劉貴、秦海堂拿出練兵中練就了的本領(lǐng),把手榴彈從碉頂上投進(jìn)去,轟然一聲,把敵人的彈藥引炸了,碉堡里哄隆隆的亂成一團(tuán)。

(《太原南區(qū)敵守碉司令畢樹武被俘記》,《人民日?qǐng)?bào)》1948-11-21)

可以看到,這些詞出現(xiàn)時(shí)間都比較早,現(xiàn)在較為常用,可以考慮收入詞典。

2. 增收詞綴派生詞

通過添加(類)詞綴構(gòu)成新詞是一種很能產(chǎn)的構(gòu)詞方式,比如“式”在《高頻詞表》中有“中式、西式、歐式、日式、美式、意式、英式、法式”等25個(gè)詞,詞典一般不會(huì)將這些詞一一收錄并解釋,而是在“式”下處理,如:

式shì① 樣式: 新~|舊~|西~|男~|女~。

(《現(xiàn)漢》第7版)

但當(dāng)組合后意義發(fā)生變化時(shí),就應(yīng)該收入詞典?!冬F(xiàn)漢》在每一次的修訂中都注意增加這樣的詞語。如《現(xiàn)漢》第5版就新增了“地毯式”“一站式”;《現(xiàn)漢》第6版新增了“捆綁式”“拉網(wǎng)式”“螺旋式”“填鴨式”“投幣式”;《現(xiàn)漢》第7版新增了“斷崖式”。根據(jù)這樣的原則,我們發(fā)現(xiàn)《高頻詞表》中還有一些“X式”可以收錄。比如:“復(fù)式”,它是一種新的建筑形式,它的層高比普通的房屋高,多在內(nèi)部分上下兩層。

“式”不僅僅是一個(gè)單純的詞綴,它常常也是一個(gè)比喻用法的標(biāo)記,它的出現(xiàn)使得與它共現(xiàn)的詞語發(fā)展出一種比喻意義,比如“病毒式”突出的是“像病毒一樣快速傳播和擴(kuò)散”,最常見的組合是“病毒式傳播”。“自殺式”也表示“像自殺一樣的”,最常見的搭配是“自殺式襲擊”,這是一種與敵人同歸于盡的襲擊方式,在傷害敵人的同時(shí)也傷害自己。還有一種“自殺式營銷”,這是指商家用賠本等方式來吸引消費(fèi)者的一種營銷手段?!白詺⑹揭u擊”和“自殺式營銷”所凸顯的都是“自殺”對(duì)自己造成傷害這一特點(diǎn)。近年來常見的“塌方式、跳水式、爆發(fā)式、井噴式”等也都是通過比喻構(gòu)成的詞,可以適當(dāng)考慮收入詞典。

3. 增收詞匯化而來的詞

高頻使用是詞匯化發(fā)生的重要條件之一。董秀芳(2011)指出,“心理的組塊過程中把經(jīng)常相連出現(xiàn)的兩個(gè)分立單位組織在一個(gè)組塊中,這樣二者就有可能逐漸變?yōu)橐粋€(gè)不可再分的單位。”侯瑞芬(2015a,2015b,2017)分析了詞匯化而來的詞在詞典中的處理方式,指出一個(gè)詞匯化而來的語言單位要收入詞典,最重要的一點(diǎn)就是看其組合義是不是已經(jīng)不同于成分義的加合,但也要考慮語言結(jié)構(gòu)組成成分能夠單用及整個(gè)語言結(jié)構(gòu)的使用頻率等多種因素。江藍(lán)生(2013)介紹了《現(xiàn)漢》第6版收錄的一些詞匯化而來的詞,比如“對(duì)了、好了、算了、完了”等與體標(biāo)記“著”連用而詞匯化的詞;“本著”和“隨著”等與體標(biāo)記“著”連用而詞匯化的詞;對(duì)“—于、—乎、—及、—以、—自”等跨層結(jié)構(gòu)合成詞做了增補(bǔ)?!陡哳l詞表》中一些詞匯化的高頻組合也可以考慮收入詞典,如:

表6 詞典可收錄的詞匯化而來的詞

“亟待”是急迫等待的意思,其中“亟”是“急迫”的意思,已經(jīng)不能單用;“與否”是“是(這樣)或者不是(這樣)”的意思,用來表示正反兩方面的意思;“愈發(fā)”是“更加”的意思,表示程度更近一步;“盡可能”其實(shí)就是“盡量”的意思。這些詞的構(gòu)詞成分已經(jīng)不能單用,在長(zhǎng)期的高頻共現(xiàn)中詞匯化成詞,可以考慮收入詞典。

4. 增收縮略詞

縮略也是構(gòu)成新詞的重要方式之一,它是從較長(zhǎng)結(jié)構(gòu)中抽取典型的語素構(gòu)成新詞的一種方法,縮略詞簡(jiǎn)潔明快,更容易通行,但是從字面上看,縮略詞的意義往往不很明確,因此,一些高頻的縮略詞可以考慮收入詞典。如:

表7 詞典可收錄的縮略而來的詞

“防控”是“預(yù)防控制”的縮略,“福彩”是“福利彩票”的縮略,“非遺”是“非物質(zhì)文化遺產(chǎn)”的縮略,它們的使用頻率都很高,可收入詞典。值得注意的是,“福利彩票”和“非物質(zhì)文化遺產(chǎn)”都被《現(xiàn)漢》第7版收錄,它們都是多字詞,在使用中逐漸縮略為二字詞。與全稱相比,縮略的二字詞更為常用,因此,詞典應(yīng)在收錄全稱的同時(shí)也收錄簡(jiǎn)稱。

(二) 同物異名形式的取舍

當(dāng)一種事物具有幾種不同的語言形式時(shí),《高頻詞表》可以幫助我們對(duì)這些同物異名形式進(jìn)行取舍。

比如《現(xiàn)漢》同時(shí)收錄了“冰激凌”和“冰淇淋”,“冰激凌”是主條,“冰淇淋”是副條,用“冰激凌”直注?!陡哳l詞表》也同時(shí)收錄了“冰激凌”和“冰淇淋”,但是“冰淇淋”的頻次明顯高于“冰激凌”。因此,或許我們可以把后者當(dāng)作主條,前者作為副條。

表8 “冰淇淋”與“冰激凌”的頻次

再比如意大利的食品Pizza傳到中國后有幾種不同的翻譯:“匹薩(餅)”“比薩(餅)”“披薩(餅)”和“批薩(餅)”?!冬F(xiàn)漢》第6版收錄了“比薩餅”,第7版同時(shí)收錄了“比薩”和“比薩餅”,并以“比薩”為主條,但我們發(fā)現(xiàn)《高頻詞表》中并未收錄“比薩(餅)”,而只收錄了“披薩”,那么,我們究竟用哪一種形式合適呢?

圖1 “比薩”“披薩”和“匹薩”使用頻次的歷時(shí)變化

《人民日?qǐng)?bào)》中沒有出現(xiàn)過“批薩”一詞,其他三個(gè)詞都有使用?!氨人_”首次出現(xiàn)是在1990年,那一年第一家“必勝客”在北京開業(yè)。1993年,“匹薩”一詞首次出現(xiàn),這一年,“匹薩”被頻繁使用,但之后就用得很少,從2015年開始,“匹薩”沒在《人民日?qǐng)?bào)》中出現(xiàn)過。2013年,“披薩”第一次在《人民日?qǐng)?bào)》中出現(xiàn),使用頻次逐漸增多。

我們可以看到,“比薩”在過去的二三十年中的使用是比較頻繁的,有著絕對(duì)的優(yōu)勢(shì),但是從近幾年和今后的發(fā)展來看,或許“披薩”的使用頻率會(huì)呈現(xiàn)一個(gè)逐漸上升的趨勢(shì),有可能超過“比薩”。一個(gè)原因可能是“披薩”在聲音上與pizza更接近,也就是說,在漢語口語中pizza讀音類似“pīsà”,音譯詞與實(shí)際讀音相一致。除此之外,還有一個(gè)重要的原因是“比薩”這個(gè)中文譯名早已有其他意義。意大利城市“Pisa”的中文譯名是比薩市,那里還有著名的比薩斜塔,在pizza傳到中國之前,《人民日?qǐng)?bào)》中的“比薩”幾乎都是指“比薩市”或“比薩斜塔”,所以表示pizza的“比薩”基本一直都是以“比薩餅”的形式出現(xiàn)的,否則就容易與表示Pisa的“比薩”弄混。而且,“比薩餅”和“比薩市”本來是完全沒有關(guān)系的,使用同一個(gè)譯名很容易讓人們把它們錯(cuò)誤地聯(lián)系在一起?;蛟S正是這個(gè)原因,人們一直試圖尋找更合適的譯名,而“披薩”可能就是個(gè)不錯(cuò)的選擇。因?yàn)槲覀儗?duì)pizza的熟悉已經(jīng)由“比薩餅”完成了,“披薩”在出現(xiàn)之初就是以不帶類名的形式出現(xiàn)的,這也更符合漢語的雙音節(jié)傾向,使得它比“比薩餅”更容易傳播。

(三) 糾正收詞的失誤

詞典收詞是一個(gè)龐大復(fù)雜的工程,加上詞語一直處在不停地變化中,再好的詞典都難免存在個(gè)別詞語失收或收詞不當(dāng)?shù)那闆r。通過《高頻詞表》與《現(xiàn)漢》收詞的對(duì)比,我們可以發(fā)現(xiàn)一些詞典收詞上的失誤,進(jìn)而做出修訂。前面已經(jīng)提到,詞典傾向于收錄具有較強(qiáng)組合能力的較小詞匯單位,《現(xiàn)漢》也一直努力貫徹這一原則,比如《現(xiàn)漢》第6版收“代言人”,第7版改收“代言”,這是因?yàn)樵戎挥小按匀恕保按浴笔遣荒軉为?dú)使用的,隨著“代言人”的高頻使用,“代言”獨(dú)立出來,《現(xiàn)漢》第7版對(duì)這一變化做了及時(shí)調(diào)整。改收“代言”既涵蓋了“代言人”,又反映了語言的發(fā)展實(shí)際。但這一原則在《現(xiàn)漢》中也有執(zhí)行不到位的地方,如:

表9 《高頻詞表》和《現(xiàn)漢》第7版的收詞對(duì)比(1)

這幾組詞在《高頻詞表》中出現(xiàn)的是較短形式,而在《現(xiàn)漢》第7版中出現(xiàn)的是較長(zhǎng)形式,這與詞典收詞的原則相違背,應(yīng)該適時(shí)調(diào)整。但之所以出現(xiàn)這種情況,是因?yàn)檫@些二字詞原先是不能單用的,是在多字詞的高頻使用中逐漸獨(dú)立出來的。詞典對(duì)語言事實(shí)的反應(yīng)總是相對(duì)滯后的,但隨著編纂手段的改進(jìn),這一問題會(huì)有所改善。

漢語中有一些外來詞在開始使用時(shí)往往在譯名后加類名構(gòu)成三字詞,在使用過程中,這些帶有類名的三字外來詞具有逐漸脫落類名成為二字詞的趨勢(shì),不論是從收錄小單位的角度考慮還是從使用頻率的角度考慮,詞典都應(yīng)該首先收錄二字詞,或者同時(shí)收錄但把二字詞作為主條。《現(xiàn)漢》有些詞的處理比較好,比如“桑拿”和“桑拿浴”都收錄,但是以“桑拿”為主條;“摩托”和“摩托車”都收錄,但是以“摩托”為主條;“比薩”和“比薩餅”都收錄,但是以“比薩”為主條。但是也有一些詞條的處理不太合適。

表10 《高頻詞表》和《現(xiàn)漢》第7版的收詞對(duì)比(2)

這些詞中類名的脫落是緩慢的,有些變化不容易發(fā)現(xiàn),《高頻詞表》正好給我們提供了參考,可以幫助我們做出取舍。當(dāng)然“香檳酒、搖滾樂、芭蕾舞”是最早出現(xiàn)的正規(guī)說法,而“香檳、搖滾、芭蕾”是因類名脫落后起的說法,為了體現(xiàn)這一演變過程,也可以處理為將前者作為正條,將后者作為副條,或掛尾處理,總之要對(duì)頻率較高的二字詞有所交代。

四、 結(jié)語

詞頻反映著語言的面貌與使用狀況,是詞匯的重要屬性之一。它對(duì)社會(huì)的發(fā)展變化有直接反應(yīng),受多種因素影響而不斷變化。詞頻的動(dòng)態(tài)變化不僅反映著詞匯的發(fā)展變化,也能幫我們預(yù)測(cè)詞的發(fā)展方向。

高頻使用是常用詞的本質(zhì)屬性,也是一個(gè)詞語從出現(xiàn)到逐漸穩(wěn)定下來需要具備的重要條件。高頻使用能夠促進(jìn)人們加深對(duì)一個(gè)詞語的熟知程度,為詞語的穩(wěn)定性提供重要保證。一個(gè)新詞從出現(xiàn)到成為詞匯系統(tǒng)中穩(wěn)定的一員,需要經(jīng)過高頻詞的階段。

高頻詞是不斷變化的,每年都有一些高頻詞進(jìn)入,也有一些高頻詞退出。所以,高頻詞既包括不同時(shí)期都廣泛使用的比較穩(wěn)定的詞,也包括某個(gè)時(shí)代特定的流行語,而那些相對(duì)穩(wěn)定的高頻詞才是共時(shí)詞典應(yīng)該收錄的主要對(duì)象。2010年—2017年《高頻詞表》的合收詞為我們提供了近幾年比較穩(wěn)定的高頻詞語的集合,反映了近年來漢語詞匯的基本面貌和發(fā)展趨勢(shì),對(duì)詞典收詞有重要的參考價(jià)值。

借助大規(guī)模語料庫和頻率統(tǒng)計(jì)來對(duì)詞語進(jìn)行篩選是辭書編纂的一個(gè)趨勢(shì)和方向,《中國語言生活狀況報(bào)告》在這方面提供了很好的資源,為我們了解媒體語料的用字用語情況提供了重要參考,也對(duì)高頻詞語和新詞語的發(fā)展變化提供了有力證據(jù),對(duì)辭書增補(bǔ)新詞、確定同物異名形式的主副條及糾正收詞的失誤都很有幫助,希望能引起辭書編纂者的關(guān)注,使這一資源得到充分利用。

附 注

[1] 這里的百萬詞頻次=詞語的頻次×1000000/總頻次。因?yàn)槊磕甑拿襟w語料數(shù)量不一樣,當(dāng)語料規(guī)模大的時(shí)候詞語的頻次自然多,為了讓歷年的詞語頻次具有可比性,我們采用了百萬詞頻次來進(jìn)行對(duì)比。下同。

[2] 這里的排名是指在2010年—2017年22203個(gè)《高頻詞語》共收詞中的百萬頻次排行。下同。

猜你喜歡
高頻詞比薩辭書
比薩
30份政府工作報(bào)告中的高頻詞
省級(jí)兩會(huì)上的高頻詞
大型辭書疑難字考釋七則
28份政府工作報(bào)告中的高頻詞
省級(jí)兩會(huì)上的高頻詞
請(qǐng)你吃比薩
比薩,比薩
好吃的比薩
科舉干祿與語文辭書編纂