張永偉
《年度媒體新詞語表》(以下簡稱《新詞語表》)是《中國語言生活狀況報告》年度媒體用字用語調查的重要組成部分,連續(xù)多年由國家語言資源監(jiān)測與研究中心研制并由教育部語言文字信息管理司組織發(fā)布?!缎略~語表》基于大規(guī)模媒體語料庫研制,具有權威性、代表性。《新詞語表》在研制過程中結合新詞語候選集的計算機自動提取和人工排查、確認的方法,得到的新詞語具有典型性、全面性,可視為新詞語在當年使用情況的真實描寫。
蘇新春(2003)指出,新詞語產(chǎn)生后有三種生存可能: 一是問世后不久就無人使用,消退、“夭折”了;二是繼續(xù)不穩(wěn)定地、小范圍地存在;三是被普遍使用、廣泛流傳而逐漸穩(wěn)定,進入民族共同語詞匯系統(tǒng)而成為其中一分子。蘇文參照新詞語的這三種生存可能將新詞語的產(chǎn)生過程劃分為初生、發(fā)展和成熟三個階段。
《新詞語表》研制的目的是如實記錄當年出現(xiàn)的新詞語,即記錄初生后發(fā)展了一段時間的新詞語。而一般辭書[1]在編纂修訂時,除收錄一般詞條外,也需要緊跟時代,增補新詞新義。一般辭書收錄新詞,除了詞“新”之外,還要兼顧穩(wěn)定性、通用性,即更傾向收錄成熟階段的新詞語。
本文在分析新詞語基本面貌和形成特點的基礎上,結合《現(xiàn)代漢語詞典》(以下簡稱《現(xiàn)漢》)第7版對《新詞語表》的收錄情況,總結了新詞語進入成熟階段的靜態(tài)特征。然后根據(jù)新詞語在《中國語言生活狀況報告》每年發(fā)布的《年度媒體高頻詞語表》(以下簡稱《高頻詞表》)及《人民日報》中的收錄、使用情況,對新詞語進入成熟階段的動態(tài)特征進行分析,并進一步說明《新詞語表》對辭書編纂的價值。
《新詞語表》是當年媒體語料中新出現(xiàn)詞語的集合,如實記錄了初生后得到一定程度發(fā)展的新詞語。從新詞語用字看,新詞語分為完全由漢字組成的詞語和包含非漢字符號組成的詞語(以下稱“非完全漢字新詞語”)兩種類型;從詞語“新舊”看,包括“新詞新義”和“舊詞新義”兩種情況。將2010年—2017年的《新詞語表》匯總,得到8年的新詞語總表。本節(jié)基于該總表進行分析,分別從詞長和詞語“新舊”兩個方面闡釋當今漢語新詞語的基本面貌。
8年《新詞語表》的新詞語整體收詞規(guī)模及詞語長度分布情況如表1所示:
表1 《新詞語表》整體收詞規(guī)模及詞語長度分布情況
2010年—2017年共發(fā)布新詞語3601個[2],其中三字新詞語總數(shù)最多,其次是四字和二字新詞語,單字和五字及以上的新詞語總數(shù)最少。具體到每個年度,所有年份的三字新詞語數(shù)量都最多,除2013年以外的大部分年份的四字新詞語數(shù)量都比二字新詞語數(shù)量多,這說明初生、發(fā)展階段的新詞語主要以三、四字為主。
8年中《新詞語表》收錄的“新詞新義”新詞語和“舊詞新義”新詞語的數(shù)量和比例如表2所示:
表2 《新詞語表》“新詞新義”和“舊詞新義”新詞語情況
所有年份的“新詞新義”新詞語比例都超過了96%,平均97.17%,占絕對優(yōu)勢。這說明人們創(chuàng)造新詞語時更傾向于全新造詞,盡量避免給現(xiàn)有詞語賦予新的含義。
《新詞語表》中的新詞語可能經(jīng)過一段時間后就無人使用、逐步消退,可能被持續(xù)使用一段時間但使用范圍受到局限,也可能被普遍接受并常規(guī)使用。為了分析《新詞語表》中新詞語的后續(xù)生存情況及最終是否更傾向于被辭書收錄,需要先對新詞語的形成特點進行分析。本文主要從6個方面進行分析。
《新詞語表》共收錄5個單字詞,分別為“粉、壕、撕、污、尬”,它們可以視為單字新詞語的最典型代表。單字詞均具有相對較高的使用頻次,由于所有單字詞都不涉及全新創(chuàng)造新字形,因此所有單字詞均可視為“舊詞新義”。雖然單字詞的數(shù)量少,但形成模式多樣,包含音譯、縮寫、合寫、脫離聯(lián)綿詞而獨立等多種方式[3],其形成具有很大的偶然性。
《新詞語表》共收錄49個諧音新詞語,包括漢語諧音、英語諧音和日期諧音三種類型。其中,漢語諧音產(chǎn)生的新詞語數(shù)量最多,為39個,比如“神馬、香菇、藍瘦”等。英語諧音新詞語數(shù)量比較少,為8個,比如“U站、UV行動、鬧太套”等。日期諧音新詞語數(shù)量最少,只有2個,分別為“分手節(jié)”9月13日(913諧音為“就要散”)和“1314結婚潮”。諧音新詞語在2010年收錄數(shù)量最多,為20個;在2015年和2017年收錄數(shù)量最少,均只有1個。諧音方式產(chǎn)生的新詞語一般規(guī)范性較差,數(shù)量整體呈現(xiàn)減少的趨勢。
《新詞語表》共收錄音譯新詞語28個,每年收錄2—7個,數(shù)量較少。音譯新詞語主要源自英語,數(shù)量為23個,占比82.1%。比如,“拜客”音譯自“bike”,“慕課”音譯自“MOOC”,“八困”音譯自“Bug Queen”等。除英語外,還有個別音譯來自祖魯語、印尼語、韓語、烏干達語、土耳其語等。比如,“嗚嗚祖拉”來自祖魯語“vuvuzela”,“安代克”來自印尼語“endek”,“辛奇”來自韓語“kimchi”等。
雖然《新詞語表》音譯詞語數(shù)量少,但每年收錄情況相對穩(wěn)定,是新詞語較為穩(wěn)定的來源方式之一。
《新詞語表》共收錄119個非完全漢字新詞語,每年收錄9—26個,占比為1.88%—5.54%,平均占比3.3%,非完全漢字新詞語的構詞形式多樣,具體包括“漢字+字母”“漢字+數(shù)字”“純字母”“漢字+字母+數(shù)字”“漢字+字符”“字母+數(shù)字”“漢字+字符+數(shù)字”“漢字+字母+字符+數(shù)字”“純字符”等9種形式。其中,“漢字+字母“形式數(shù)量最多,高達62個,占比為52.1%;“純字母”或“純字符”的新詞語數(shù)量較少,一共只有17個。這說明包含非漢字字符組成的新詞語中,漢字依然是最常用的組成元素。
《新詞語表》包含大量詞綴、類詞綴參與構成的新詞語,形成詞族效應。以構成二、三字新詞語的單音節(jié)類詞綴為例,本文考察了23個后附加的類詞綴和4個前附加的類詞綴的構詞情況[4]。統(tǒng)計發(fā)現(xiàn),27個類詞綴共構成《新詞語表》中的新詞語480個,占全部二、三字新詞語總數(shù)的21.35%。其中,447個新詞語由后附加類詞綴參與構成,33個新詞語由前附加類詞綴參與構成。此外,由類詞綴構成的新詞語的使用頻率也相對較高。
簡縮本文指簡稱、縮寫或者縮略。統(tǒng)計《新詞語表》釋義發(fā)現(xiàn),約145個新詞語以縮簡的方式構成,占比為4.03%。比如,“超導”是“超級導演”的簡稱,“藥Q”指正確使用藥物的能力(其中“Q”是英文quotient的縮寫),“講懂守”是“講誠信、懂規(guī)矩、守紀律”的縮略。非完全漢字新詞語雖然總數(shù)較少,但通過縮簡方式形成的比例非常高,119個非完全漢字新詞語中縮簡方式構成的新詞語有39個,占比32.77%。
與縮略相對應的是合稱方式構成的新詞語,比如“三房”是“廉租房、經(jīng)濟適用房和限價房”的合稱。《新詞語表》共收錄合稱方式構成的新詞語約40個,占比較少,只有1.11%。
《現(xiàn)漢》以確定詞匯規(guī)范為目的,以推廣普通話、促進漢語規(guī)范化為宗旨,被視為現(xiàn)代漢語的規(guī)范型辭書?!坝捎凇冬F(xiàn)漢》的性質,它對新詞語的收錄往往反映出這些詞語正在進入或已經(jīng)進入了民族共同語,等于給新詞語發(fā)放了一張社會認可證,同時也反映出研究界對新詞語的處理原則與方法?!?蘇新春 2003)規(guī)范型辭書對新詞語的收錄,需要建立統(tǒng)一的原則,區(qū)分新詞語所處的發(fā)展階段,收集初生、發(fā)展階段的新詞語,擇優(yōu)收錄成熟階段的新詞語。本文將以《現(xiàn)漢》第7版為例說明《新詞語表》對辭書編纂的價值。
《新詞語表》為規(guī)范型辭書處理新詞語提供了初生后發(fā)展到一定階段的新詞語候選集合??偨Y規(guī)范型辭書對新詞語處理的原則規(guī)范,可以變相得到新詞語成熟的標記特征,標記特征反過來可以指導規(guī)范型辭書中其他新詞語的收錄?!缎略~語表》對辭書編纂的價值主要體現(xiàn)在以下幾個方面。
規(guī)范型辭書只收錄成熟階段的新詞語,數(shù)量較少,而初生、發(fā)展階段的新詞語數(shù)量較多,結合初生、發(fā)展階段的新詞語特點分析新詞語可以了解哪些特點的新詞語更容易成熟、更應該被辭書收錄,構成一個漸進序列。我們對《現(xiàn)漢》第7版收錄的《新詞語表》中新詞語進行分析以便了解規(guī)范型辭書對新詞語的收錄情況及處理原則。
《現(xiàn)漢》第7版共收錄《新詞語表》中的新詞語30個,分別為:“悲催、給力、吐槽、微信、備胎、創(chuàng)客、逆襲、躺槍、正能量、中國夢、爆表、點贊、光盤行動、女漢子、四風、土豪、細顆粒物、學霸、眾籌、任性、三嚴三實、新常態(tài)、互聯(lián)網(wǎng)+、顏值、一帶一路、雙創(chuàng)、四個全面、工匠精神、私信、五大發(fā)展理念”。這30個新詞語的使用經(jīng)歷了初生、發(fā)展及成熟三個階段,最終被規(guī)范型辭書認可并收錄。
1. “舊詞新義”新詞語更容易成熟
《現(xiàn)漢》第7版收錄的30個表中新詞語中有8個是“舊詞新義”[5],占比為26.67%,遠遠高于《新詞語表》中“舊詞新義”新詞語平均占比2.83%的比例。“舊詞新義”的新詞語一般已經(jīng)比較穩(wěn)定,新義項被普遍接受以后,規(guī)范型辭書也更應該對新義項進行補充。
2. 二字新詞語更容易成熟
《現(xiàn)漢》第7版收錄的30個表中新詞語包含18個二字詞、4個三字詞、6個四字詞及1個六字詞。其中,二字詞的數(shù)量最多,占比高達60%,這與《新詞語表》中三、四字新詞語數(shù)量多、占比高形成了鮮明的對比。這說明二字詞依然是辭書編纂者更容易認可的詞匯形式,使用更穩(wěn)定,也更容易成熟。相比之下,雖然初生的三、四字新詞語數(shù)量比較多,但能存活下來的并且最終適合辭書收錄的比例非常小。
《現(xiàn)漢》第7版未收錄表中的任何單字詞,這與《新詞語表》中的單字詞數(shù)量少密不可分。另一方面也與單字詞形成模式多樣、偶然性強、規(guī)律性較差的特點有關。
3. 合稱新詞語更容易成熟
《新詞語表》中合稱新詞語只有40個,數(shù)量少,占比僅為1.11%。但是《現(xiàn)漢》第7版中收錄的表中新詞語中有5個是合稱新詞語,分別為“四風、三嚴三實、一帶一路、四個全面、五大發(fā)展理念”,占比高達16.67%,這與《新詞語表》中的合稱新詞語占比低亦形成鮮明對比。合稱新詞語往往由數(shù)詞連同依據(jù)不同詞語或句子之間的共性提取得到的關鍵詞組合而成,如果不詳細解釋,僅看詞形難以猜測詞語的具體含義。合稱新詞語的構詞方式符合人們一般認知規(guī)律,一旦達到一定的使用頻率和通用性,就更有可能被規(guī)范型辭書收錄。
4. 反映社會、政治生活的新詞語更容易成熟
“創(chuàng)客、爆表、光盤行動、工匠精神、中國夢、四風、三嚴三實、新常態(tài)、互聯(lián)網(wǎng)+、一帶一路、四個全面、五大發(fā)展理念”是反映社會、政治生活的新詞語?!冬F(xiàn)漢》第7版中收錄了大量反映社會、政治生活的新詞語。這說明反映社會、政治生活的新詞語更容易成熟、更容易被辭書收錄。王利、張珊(2018)對比《現(xiàn)漢》第7版相比《現(xiàn)漢》第6版新增的詞語情況時也發(fā)現(xiàn)新增的詞語中源于社會生活、政治的新詞語數(shù)量最多。“語文辭書作為特定時代編纂的工具書,必然具有時代的烙印;作為文化的載體,必然傳播當時的精神文明成果,也就必然帶有一定的思想性?!?潘雪蓮 2018)反映社會、政治生活的新詞語的收錄正是規(guī)范型辭書思想性在收詞方面的體現(xiàn)。
5. 新詞語其他特征及新詞語成熟難易性
諧音新詞語規(guī)范性普遍較差,數(shù)量也在逐年減少,大多難以發(fā)展到成熟階段,所以規(guī)范型辭書應該慎收諧音新詞語。
雖然《新詞語表》中二、三字新詞語中類詞綴構詞占比很高,但《現(xiàn)漢》第7版只收錄了“創(chuàng)客”“學霸”這兩個類詞綴構成的詞,并且都是二字新詞語,未收錄三字新詞語。此外,“~客”和“~霸”也不是構詞能力最強的類詞綴。我們可以大膽推斷,新詞語是否成熟和是否是類詞綴構詞關系并不大,類詞綴參與構成的新詞語除非特殊需要收錄的,一般都不是規(guī)范型辭書傾向收錄的詞語。
一些科技專有名詞,比如艾欣瞳(指我國科學家自主研發(fā)的全球首個完成臨床試驗的生物工程角膜產(chǎn)品),疑似“愛心的瞳孔”的縮寫和諧音,但難以查找其準確出處。這樣的新詞語因為反映當年科技新進展而具有較高的使用頻次,但隨后如果沒有被持續(xù)普遍使用,也難以成熟。
除《現(xiàn)漢》第7版已經(jīng)收錄的新詞語外,還有許多《新詞語表》中的新詞語可以被收錄。僅僅依據(jù)詞語是否更容易成熟的靜態(tài)特征尚不能從《新詞語表》中挑出成熟的新詞語,還需要能反映詞語是否穩(wěn)定成熟的動態(tài)特征。我們需要用發(fā)展的眼光判斷初生、發(fā)展的新詞語是否在《新詞語表》收錄以后被廣泛接納、普遍使用。我們可以結合《高頻詞表》的數(shù)據(jù)并通過考察它們在《人民日報》語料庫中的使用情況來對新詞語是否可以進入辭書做出判斷。
1. 與《高頻詞表》對比增補新詞語
《新詞語表》中部分詞語也被《高頻詞表》收錄?!陡哳l詞表》記錄當年媒體語料中出現(xiàn)頻率較高的詞語,其研制使用的調查語料與研制《新詞語表》使用的調查語料接近,對比性高。新詞語被《高頻詞表》收錄,說明詞語在當年被高頻使用。因此,將《新詞語表》和歷年《高頻詞表》進行對比,可以最準確、最直接地反映新詞語的動態(tài)使用情況。
以“奇葩”“套路”為例,“奇葩”“套路”分別在2011年和2010年開始被《高頻詞表》收錄,但其使用頻次分別在2013年和2016年迎來大幅增長,在2013年和2016年被《新詞語表》收錄?!捌孑狻薄疤茁贰痹凇陡哳l詞表》中頻次大幅增長的時間剛好與被《新詞語表》收錄的時間吻合。因此,這兩個詞應該是“舊詞新義”的新詞,在賦予新的含義并大量使用后導致頻次發(fā)生了劇烈變化?!捌孑狻薄疤茁贰本嵌衷~、屬于“舊詞新義”,從靜態(tài)特征上看也屬于更容易成熟穩(wěn)定的類型,規(guī)范型辭書可以考慮收錄。類似的詞語還有“風口、慕課、打賞、單獨、區(qū)塊鏈、精準扶貧、兩學一做、四個意識”等。
“奇葩”“套路”在《高頻詞表》中的歷年頻次變化如圖1所示。
圖1 “奇葩”“套路”在《高頻詞表》中歷年頻次變化[6]
有的詞語雖然詞頻符合上述變化趨勢,但由于不滿足易成熟新詞語的靜態(tài)特征,建議暫不收錄,比如“單獨二胎、微電影、校園貸、微信紅包”等。
2. 結合語料庫增補新詞語
《新詞語表》中大部分新詞語并未被《高頻詞表》收錄。為了檢測這部分新詞語的生存情況,可以借助語料庫對它們的使用情況進行分析。蘇新春(2003)認為《人民日報》雖然偏于新聞語體,且屬較正式的書面語,但它覆蓋領域寬廣,涵納內(nèi)容豐富,是其他語料難以相比的,更重要的是這些正好符合規(guī)范性辭書收詞的要求。本文選擇2009年—2018年《人民日報》圖文數(shù)據(jù)庫中的文字部分作為語料進行統(tǒng)計。
我們使用哈工大社會計算與信息檢索研究中心研發(fā)的“語言技術平臺(LTP)”[7]對《人民日報》語料進行分詞,為了更準確地切分新詞語,切分時將《新詞語表》作為分詞工具的用戶自定義詞表。分詞后進行詞頻統(tǒng)計,對《新詞語表》中新詞語在2010年—2018年《人民日報》中出現(xiàn)的總頻次由大到小排序。排序結果顯示,排位前30名的新詞語有11個已經(jīng)被《現(xiàn)漢》第7版收錄[8],剩下的19個新詞語為:“新時代、擔當、高原、小微、十三五、北約、精準扶貧、獲得感、單獨、美麗中國、打電話、新征程、亞投行、飛躍、兩學一做、戰(zhàn)區(qū)、四個意識、數(shù)字經(jīng)濟、雄安新區(qū)”。
對比新詞語在《人民日報》中歷年頻次變化可以獲知新詞語成熟的動態(tài)特征。以頻次最高的“新時代”“擔當”為例。
“新時代”是新詞新義,于2017年被《新詞語表》收錄,標志著其進入初生、發(fā)展階段。圖2也明確印證了這一點,它的使用頻次在2017年急劇增長,隨后在2018年持續(xù)增長。“新時代”雖然是三字詞,但卻是反映政治生活的新詞語,因此可以對其使用情況持續(xù)觀察。如果其使用頻次依然持續(xù)較高,規(guī)范型辭書可以考慮收錄。
“擔當”是舊詞新義,從《現(xiàn)漢》試用本起就被收錄,《現(xiàn)漢》第7版標記其為動詞,含義是“接受并負起責任”,新的含義是名詞,指在某方面承擔、負責,起主要作用的人或物?!皳敗庇?015年被《新詞語表》收錄。從圖2的曲線變化也可以看到“擔當”的頻次在2014年首次迎來較大幅度增長,疑似“擔當”在更早的2014年就已經(jīng)進入“初生”階段,隨后進入長期穩(wěn)定發(fā)展的階段,目前可視為具有一定成熟度的新詞語。最后,鑒于“擔當”在近年《人民日報》語料中使用的總頻次較高,歷年使用頻次趨于穩(wěn)定,也符合更容易成熟的新詞語的靜態(tài)特征,建議規(guī)范型辭書補充“擔當”名詞用法的新義項。
“新時代”“擔當”在《人民日報》中的歷年頻次變化如圖2所示。
圖2 “新時代”“擔當”在《人民日報》中歷年頻次變化
依據(jù)語料庫統(tǒng)計新詞語頻次變化,可以作為詞語成熟的動態(tài)特征,輔助辭書編纂中收錄新詞語。
《新詞語表》記錄當年初生并發(fā)展到一定階段的新詞語,辭書一般收錄某一段時間內(nèi)使用相對成熟的新詞語。雖然《新詞語表》收錄的新詞語不能直接進入辭書,但依然對辭書編纂尤其是增補新詞新義有參考價值,主要體現(xiàn)在以下幾個方面: (1) 《新詞語表》收錄新詞語數(shù)量較多,為整體分析當今新詞語的基本面貌及形成特點提供了數(shù)據(jù)支持;(2) 《新詞語表》可以直接為辭書增補新詞新義提供候選詞;(3) 通過分析《現(xiàn)漢》第7版對《新詞語表》中新詞語的收錄情況,可以結合新詞語的形成特點,了解具備哪些特點的新詞語更容易成熟,即有助于總結規(guī)范型辭書對新詞語的處理原則;(4) 借助《高頻詞表》或者加工處理后的文本語料庫,不僅可以檢測新詞語歷年使用的頻次變化,印證新詞語的生存發(fā)展過程,也為辭書編纂中新詞新義的增補提供了新的思路和方法。
附 注
[1] 一般辭書相對于專門收錄新詞語的詞典而言。
[2] “習馬會”在2013年和2015年均有發(fā)布,釋義分別為“人們猜測、期待中的中國國家主席習近平與中國臺灣地區(qū)領導人馬英九之間的會晤”和“兩岸領導人習近平、馬英九于2015年11月7日在新加坡的會面”。本文將其視為2個不同的新詞語進行處理。此外,2014年發(fā)布的“拼臉”“微拍”也存在類似情況。
[3] 比如,“粉”是“粉絲”的簡稱,而“粉絲”是英語單詞“fans”的音譯;“壕”是“土”和“豪”兩個字的合寫;“尬”原本只用在聯(lián)綿詞“尷尬”中,現(xiàn)已獨立為語素,指比較、比試,也指尷尬。
[4] 23個后附加類詞綴為“~哥、~體、~門、~領、~客、~控、~奴、~族、~姐、~爺、~手、~日、~友、~商、~叔、~者、~熱、~吧、~霸、~東、~齡、~星、~系”,4個前附加的類詞綴為“被~、零~、后~、亞~等”。
[5] 8個“舊詞新義”新詞語分別為“吐槽、備胎、逆襲、爆表、土豪、學霸、任性、工匠精神”,界定依據(jù)為《新詞語表》對新詞語的釋義。
[6] 這里的百萬詞頻次=詞語的頻次×1000000/總頻次,下同。
[7] 語言技術平臺主頁: http: ∥ltp.ai/,本文使用的版本為3.4.0。
[8] 被《現(xiàn)漢》第7版收錄的11個新詞語分別為“一帶一路、中國夢、微信、新常態(tài)、互聯(lián)網(wǎng)+、正能量、四風、四個全面、點贊、三嚴三實、創(chuàng)客”。