国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

由動(dòng)態(tài)語(yǔ)言知識(shí)更新看詞典的動(dòng)詞收錄

2015-05-11 02:21張平蔡意
辭書研究 2014年1期
關(guān)鍵詞:現(xiàn)代漢語(yǔ)詞典

張平 蔡意

摘 要 文章通過(guò)對(duì)國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)的高頻詞表與《現(xiàn)代漢語(yǔ)詞典》第6版的對(duì)比分析,指出該詞典的動(dòng)詞收錄存在新興高頻動(dòng)詞未得到及時(shí)收錄和收詞標(biāo)準(zhǔn)不一兩方面的問(wèn)題。文章逐一考察了高頻詞表標(biāo)注為動(dòng)詞的3239個(gè)語(yǔ)言單位,指出了10個(gè)應(yīng)被收錄的新興高頻派生詞,以及一批由于詞和短語(yǔ)的界定問(wèn)題導(dǎo)致的該收而未收和不該收卻予收錄的動(dòng)詞性結(jié)構(gòu)。

關(guān)鍵詞 動(dòng)詞 詞典收錄 高頻詞表 《現(xiàn)代漢語(yǔ)詞典》

語(yǔ)言知識(shí)的動(dòng)態(tài)更新是客觀存在的語(yǔ)言發(fā)展現(xiàn)象。張普(2000)從控制論的角度,指出更新語(yǔ)言知識(shí)的最好辦法是機(jī)器自動(dòng)回收和專家進(jìn)行評(píng)測(cè)相結(jié)合的協(xié)作性知識(shí)管理。詞典是語(yǔ)言知識(shí)的載體,也是人和計(jì)算機(jī)應(yīng)用語(yǔ)言知識(shí)的指導(dǎo)用書。“隨著電子版的文本、數(shù)字化的媒體、因特網(wǎng)的網(wǎng)站的幾何級(jí)數(shù)的增加,各種新的知識(shí)呈加速度性增長(zhǎng)”,詞典理應(yīng)跟上語(yǔ)言更新的步伐,完成好它指導(dǎo)、規(guī)范語(yǔ)言文字應(yīng)用的使命。

國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)收集報(bào)紙、廣播電視和網(wǎng)絡(luò)新聞中的海量語(yǔ)言信息,為詞典的編纂提供了好的“機(jī)器自動(dòng)回收”?!冬F(xiàn)代漢語(yǔ)詞典》(以下簡(jiǎn)稱《現(xiàn)漢》)第6版于2012年7月正式發(fā)行,新版詞典共收條目6.9萬(wàn)余,增收新詞語(yǔ)和其他詞語(yǔ)近3000條。本文對(duì)比從國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)中統(tǒng)計(jì)獲得的高頻詞表和《現(xiàn)漢》第6版,專門討論詞典的動(dòng)詞收錄問(wèn)題。

一、高頻詞表與《現(xiàn)漢》比較的基礎(chǔ)

(一)高頻詞表的特點(diǎn)

高頻詞表由國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心的三家媒體語(yǔ)料庫(kù)(平面媒體語(yǔ)料庫(kù)、有聲媒體語(yǔ)料庫(kù)和網(wǎng)絡(luò)媒體語(yǔ)料庫(kù))從2005年至2008年四年中共用的帶詞性的高頻詞組成。集中反映了最近幾年通用領(lǐng)域高流通度、高使用度和高穩(wěn)定度的現(xiàn)代漢語(yǔ)詞匯。取詞方式為:

(1)每年三家媒體共用且頻率覆蓋率達(dá)到90%的高頻詞;(2)從各年高頻詞中取2005年至2008年四年共用的部分,排除人名、地名、其他專名和數(shù)字類的詞,最后得到10022條。

(二)比較的基礎(chǔ)和必要性

高頻詞表集中反映了2005年至2008年四年中通用領(lǐng)域高流通度、高使用度和高穩(wěn)定度的現(xiàn)代漢語(yǔ)詞匯?!冬F(xiàn)漢》第5版發(fā)行于2005年,第6版理應(yīng)反映2005年之后漢語(yǔ)詞匯應(yīng)用的實(shí)態(tài)。對(duì)比高頻詞表和《現(xiàn)漢》第6版,可以很好地展示《現(xiàn)漢》編纂的進(jìn)步。

《現(xiàn)漢》的突出特點(diǎn)在于其規(guī)范性。它的編寫目的,是為現(xiàn)代漢語(yǔ)標(biāo)準(zhǔn)語(yǔ)確定詞匯規(guī)范。但在實(shí)際操作中,詞和非詞的劃界存在一定的困難,這使得不少人在使用《現(xiàn)漢》時(shí),經(jīng)常會(huì)對(duì)有些看似短語(yǔ)的單位收進(jìn)了詞典、有些看似詞的單位卻沒(méi)有收錄感到疑惑。例如:《現(xiàn)漢》第6版收錄了三音節(jié)的“來(lái)得及”“來(lái)不及”,卻沒(méi)有收錄結(jié)構(gòu)與之一致的“稱得上”“稱不上”;收錄了雙音節(jié)的“提及”,卻沒(méi)有收錄意義與之相近的“提到”。高頻詞表的詞雖然是機(jī)器切分的結(jié)果,存在一定的分詞錯(cuò)誤,但換個(gè)角度看,無(wú)論它是真正意義上的詞還是短語(yǔ),其高頻使用就證明了作為一個(gè)語(yǔ)言單位,它的內(nèi)部成員已經(jīng)具備了高同現(xiàn)的特征,在語(yǔ)感上向詞靠近。對(duì)比高頻詞表和《現(xiàn)漢》第6版,發(fā)現(xiàn)這些高同現(xiàn),并與《現(xiàn)漢》第6版已收錄的詞類似,但未被收錄的語(yǔ)言單位,能為《現(xiàn)漢》第6版的修訂提供參照性的數(shù)據(jù),對(duì)其規(guī)范起建設(shè)性作用。

二、高頻詞表中的動(dòng)詞在《現(xiàn)漢》第6版中的收錄情況

高頻詞表標(biāo)注為動(dòng)詞的單位有3239個(gè),其中2896個(gè)被《現(xiàn)漢》第6版收錄,收錄率為89.4%。這說(shuō)明《現(xiàn)漢》第6版很好地貫徹了收錄通用詞的原則。未被收錄的有343個(gè),除明顯有分詞錯(cuò)誤的“談?wù)?、有著”?個(gè)外,剩下341個(gè)(以下簡(jiǎn)稱“動(dòng)詞性結(jié)構(gòu)”)是本文討論的重點(diǎn)。

在341個(gè)動(dòng)詞性結(jié)構(gòu)中,雙音節(jié)有307個(gè),三音節(jié)有34個(gè)。它們?cè)诮Y(jié)構(gòu)方式上的分布和百分比情況如下:

這些高頻的動(dòng)詞性結(jié)構(gòu)未被收錄的原因,理論上大致有兩種可能:一是《現(xiàn)漢》認(rèn)為它們不是詞,以其雙音節(jié)或三音節(jié)的特點(diǎn),它們最有可能是短語(yǔ),即機(jī)器自動(dòng)分詞和專家語(yǔ)感在詞和短語(yǔ)上的分歧(劉慶隆 1982);第二種可能,是《現(xiàn)漢》認(rèn)為它們尚不具備高流通度特征,不符合通用詞的條件。

就構(gòu)造方式來(lái)看,13個(gè)附加結(jié)構(gòu)未被收錄的原因必定是后者,因?yàn)樵~根和詞綴組合而成的只能是詞。其他幾種結(jié)構(gòu)未被收錄的原因,既有可能是前者,也有可能是后者。我們進(jìn)一步考察了這328個(gè)非附加結(jié)構(gòu)在2005年以前的使用情況,它們均已具備了通用特征,由此我們推斷,它們未被收錄的原因主要是前者。

從數(shù)量上看,未收錄詞中動(dòng)補(bǔ)結(jié)構(gòu)所占比重最大,這從一個(gè)側(cè)面展示了該結(jié)構(gòu)在詞和短語(yǔ)的劃分上問(wèn)題最多;其次是動(dòng)賓結(jié)構(gòu),再次是狀中結(jié)構(gòu),最后是并列結(jié)構(gòu)和主謂結(jié)構(gòu)。下面,文章以有無(wú)分詞問(wèn)題為綱,對(duì)比高頻詞表和《現(xiàn)漢》第6版,討論這些動(dòng)詞性結(jié)構(gòu)是否應(yīng)該被收錄。

三、無(wú)分詞問(wèn)題的動(dòng)詞——附加結(jié)構(gòu)的比較、分析

高頻詞表中的派生動(dòng)詞,只有一種加后綴“化”的形式,共26個(gè),將它們按詞頻的高低從1 到26 編號(hào),被《現(xiàn)漢》第6版收錄的有16個(gè),未被收錄的有10個(gè),分別是:

未被收錄的10個(gè)派生詞在詞頻上并非都排在已收錄詞之后;雖然它們都是三音節(jié),但已收錄的派生詞中也有三音節(jié)的情況。鑒于與已收錄詞的類同性和高頻的特點(diǎn),我們認(rèn)為,這10個(gè)派生動(dòng)詞,具備了被《現(xiàn)漢》收錄的條件。

四、有分詞問(wèn)題的動(dòng)詞性結(jié)構(gòu)的比較、分析

(一)比較分析——以動(dòng)補(bǔ)結(jié)構(gòu)為例

在分詞問(wèn)題上,動(dòng)補(bǔ)結(jié)構(gòu)最具代表性。以動(dòng)補(bǔ)結(jié)構(gòu)為例,考察未被收錄的176個(gè)單位,從形式標(biāo)記的角度來(lái)看,最為突出的有“V+趨向動(dòng)詞”“V/A+介詞”“V+到”“V+入”四類,共142個(gè),占未收錄動(dòng)補(bǔ)結(jié)構(gòu)的80.7%,它們?cè)诟哳l詞表中的分布和被《現(xiàn)漢》第6版收錄的情況如下:

(二)收錄理?yè)?jù)分析

關(guān)于詞和短語(yǔ)的劃分,呂叔湘(1979)指出:語(yǔ)法原則和詞匯原則有時(shí)候有矛盾。語(yǔ)法原則強(qiáng)調(diào)的是這個(gè)組合不容易拆開,它的組成部分不能隨意擴(kuò)展。詞匯原則強(qiáng)調(diào)的是這個(gè)組合不太長(zhǎng),有比較統(tǒng)一的意義。呂先生認(rèn)為應(yīng)該把這兩個(gè)原則結(jié)合起來(lái)。教學(xué)語(yǔ)法經(jīng)常綜合使用三個(gè)原則:第一,意義上是否等于內(nèi)部成分意義的加合,如果等于,是短語(yǔ);如果不相等,且已經(jīng)具有了特定的意義,是詞。第二,結(jié)構(gòu)上是否固定,即能否被擴(kuò)展,其內(nèi)部成分能否單用,如果能夠擴(kuò)展,內(nèi)部成分能獨(dú)立運(yùn)用,是短語(yǔ);反之是詞。第三,語(yǔ)音上的長(zhǎng)度,雙音節(jié)的多是詞,兩個(gè)音節(jié)以上的多是短語(yǔ)。(陳蒲清 1984)鑒于詞典指導(dǎo)語(yǔ)言文字應(yīng)用的功能,以詞典收詞為目的的詞和短語(yǔ)的劃分,我們認(rèn)為,如果三個(gè)原則有沖突,首先應(yīng)該考慮意義。一個(gè)語(yǔ)言單位的意義不等于內(nèi)部各成分意義的加合,會(huì)給理解帶來(lái)困難,需要詞典注釋。所以,結(jié)構(gòu)原則和語(yǔ)音原則應(yīng)該服從意義原則。其次是語(yǔ)音原則服從于結(jié)構(gòu)原則,語(yǔ)音原則更多表現(xiàn)的是語(yǔ)感層面,結(jié)構(gòu)原則是從語(yǔ)言單位的組合層面做出的理性判斷。endprint

綜合意義、結(jié)構(gòu)和語(yǔ)音上的特點(diǎn),對(duì)比高頻詞表中已被收錄和未被收錄的單位的具體情況,可以看到,《現(xiàn)漢》第6版在相當(dāng)大一部分動(dòng)詞性結(jié)構(gòu)的收錄上很好地遵循了詞和短語(yǔ)的劃分原則。以《現(xiàn)漢》收錄的“V+來(lái)”結(jié)構(gòu)的“到來(lái)”為例,《現(xiàn)漢》第6版對(duì)“到來(lái)”的注釋是“來(lái)到、來(lái)臨”,它不僅可以表示空間上的位移,還可以表示時(shí)間上的臨近,如“新年到來(lái)之際”,其意義已經(jīng)不再是“到”和“來(lái)”的意義的簡(jiǎn)單加合,且其結(jié)構(gòu)不能擴(kuò)展,所以把“到來(lái)”視為詞更合適。

但對(duì)于另一部分動(dòng)詞性結(jié)構(gòu)的收錄,《現(xiàn)漢》第6版表現(xiàn)出了標(biāo)準(zhǔn)的不一和態(tài)度的游移。一方面,有些更像是短語(yǔ)的單位被收進(jìn)了詞典,而有些更像是詞的單位卻沒(méi)有被收進(jìn)去。

例如,在動(dòng)補(bǔ)結(jié)構(gòu)的“V+趨向動(dòng)詞”中,“V+去”收錄了“除去”,《現(xiàn)漢》第6版對(duì)該詞的動(dòng)詞用法注釋為“去掉、除掉”,意義上等于“除”和“去”的結(jié)合——《現(xiàn)漢》第6版對(duì)動(dòng)詞“除”的注釋中有“去掉”義項(xiàng),對(duì)動(dòng)詞“去”的注釋中有“除去、除掉”義項(xiàng),并且結(jié)構(gòu)上可以擴(kuò)展為“除不去”,這些都符合短語(yǔ)的要求,和未被收錄的“免去”等類同。而且,《現(xiàn)漢》第6版收錄了意義和“免去”一致的“免除”,詞典對(duì)“免除”的注釋為“免去、除掉”。詞頻上,“除去”“免除”和“免去”三者中,“免去”的詞頻最高。綜合起來(lái)看,收錄前兩個(gè)卻不收錄“免去”,似不合理。

又如,在動(dòng)賓結(jié)構(gòu)的“停+”中,《現(xiàn)漢》第6版收錄了“停航”“停診”,對(duì)它們的解釋分別是“(飛機(jī)或輪船)等停止航行”“停止門診”,其意義分別是“?!焙汀昂健薄霸\”的加合,其結(jié)構(gòu)可以擴(kuò)展為“停了航”“停了診”,這些特點(diǎn)和高頻的“停產(chǎn)”“停賽”一致,但《現(xiàn)漢》第6版沒(méi)有收錄后兩者。

再如,在狀中結(jié)構(gòu)的“不+”中,《現(xiàn)漢》第6版收錄了“不容”,解釋為“不許、不讓”,其意義等同于“不”和“容”的意義加合,其結(jié)構(gòu)可以擴(kuò)展為“不能容”,如:

(1)你想我舍得把我偷閑做成的“心”放棄掉么,縱然沒(méi)有紅線,也不能容/不容它流落。

而且,其內(nèi)部成分可以獨(dú)立運(yùn)用:

(2)你別急,容我再想想。

“不容”的這些特點(diǎn),使它更像個(gè)短語(yǔ)。這和沒(méi)有被《現(xiàn)漢》第6版收錄的“不準(zhǔn)”“不住”“不知”“不予”“不?!薄安慌隆薄安荒堋薄安幻鳌薄安豢稀薄安环钡阮愅?。

另一方面,有些高頻且在意義上不等于各成分意義加合的動(dòng)詞性結(jié)構(gòu),它們更像是詞,卻未被《現(xiàn)漢》第6版收錄。例如動(dòng)補(bǔ)結(jié)構(gòu)中的“放下”。我們能在語(yǔ)言應(yīng)用中看到“放下”的這樣一些用法:

(3)分手三年了,她顯然還是沒(méi)有放下前男友。

(4)就像兩個(gè)匆忙趕路的人,放下一切煩憂瑣事,靜靜地回顧走過(guò)的旅程。

(5)為了讓村民們放下疑慮,村支書克格介帶頭下山了。

(6)宮本放下臉來(lái)惡狠狠地咬著牙,陰沉地說(shuō):“你到底說(shuō)不說(shuō)?”

“放下”在以上四個(gè)例句中,分別有“忘記”“停止”“拋開”“拉長(zhǎng)”的意思,對(duì)這幾個(gè)“放下”的理解,并不能靠“放”的某一義項(xiàng)與“下”的義項(xiàng)的簡(jiǎn)單加合而獲得。

又如,并列結(jié)構(gòu)中的“負(fù)有”,其意義并非“負(fù)”和“有”的意義的簡(jiǎn)單加合,而是“擔(dān)負(fù)著、承擔(dān)著(責(zé)任、義務(wù)、職能、使命等)”和“享有(盛名等)”的意思,如:

(7)伊格爾伯格表示,美國(guó)和中國(guó)一樣,對(duì)改善和發(fā)展兩國(guó)關(guān)系也負(fù)有責(zé)任和義務(wù)。

(8)該校作為教會(huì)學(xué)校,在本地是負(fù)有盛名的。

這和同為并列的“+有”結(jié)構(gòu)“享有”和“具有”類同,但《現(xiàn)漢》第6版收錄了“享有”和“具有”,卻沒(méi)有收錄“負(fù)有”。

再如,主謂結(jié)構(gòu)中的“身為”,其意義也并非“身”和“為”意義的簡(jiǎn)單相加。從漢語(yǔ)的實(shí)際使用情況來(lái)看,“身為”的意思不能簡(jiǎn)單地理解為“身體作為”“自己作為”等。例如,下句中的“自己作為”就不能用“身為”替換:

(9)

瑞典希望在歐盟擴(kuò)大進(jìn)程中加強(qiáng)自己作為歐洲中小國(guó)家代言人的角色,反對(duì)建立歐洲聯(lián)邦體制。

*瑞典希望在歐盟擴(kuò)大進(jìn)程中加強(qiáng)身為歐洲中小國(guó)家代言人的角色,反對(duì)建立歐洲聯(lián)邦體制。

“身為”有它特定的句法環(huán)境和語(yǔ)義內(nèi)涵。在句法上,“身為”后接表示身份的名詞性成分,主要做人名、人稱代詞等的定語(yǔ),或者作為句首修飾語(yǔ),用“,”與主語(yǔ)分開。這些特征使得它更趨近于介詞的用法:

(10)

身為一個(gè)副團(tuán)職軍官,他是扛著行李步行來(lái)到鄭州市熱力公司的。

(11)5年后,身為校長(zhǎng)的他考取了華東師范大學(xué)教育系。

以上兩例的“身為”不宜分析為動(dòng)詞性結(jié)構(gòu),它已經(jīng)詞化且虛化成了一個(gè)介詞?!吧頌椤钡挠梅ê妥鼋樵~用的“作為”一致。既然與之類同的“作為”被《現(xiàn)漢》第6版收錄,“身為”也理應(yīng)做類似處置。

五、結(jié) 語(yǔ)

本文基于國(guó)家語(yǔ)言資源監(jiān)測(cè)語(yǔ)料庫(kù)的高頻詞表,對(duì)詞典的動(dòng)詞收錄問(wèn)題做了選擇式的考察。相比2005年出版的第5版,第6版《現(xiàn)漢》有明顯的進(jìn)步與提高:新版詞典共收條目6.9萬(wàn)余條,增收新詞語(yǔ)和其他詞語(yǔ)近3000條,在我們考察的高頻詞表中,“工業(yè)化、透過(guò)、趨于、增大、人性化、在家、前來(lái)、提高、進(jìn)入”等35個(gè)第5版沒(méi)有收錄的高頻動(dòng)詞,均被第6版收錄。但相對(duì)于當(dāng)前的語(yǔ)言實(shí)際,第6版在收錄動(dòng)詞時(shí)仍然存在一些問(wèn)題,最為突出的是收詞標(biāo)準(zhǔn)不一。同是在高頻使用和較少造成理解困難的條件下,一方面,按照詞和短語(yǔ)的劃分原則,有些動(dòng)詞性結(jié)構(gòu)更像是短語(yǔ),但其中的一部分被《現(xiàn)漢》第6版收錄,另一部分卻沒(méi)有,這樣的現(xiàn)象破壞了詞典收詞的系統(tǒng)性原則;另一方面,有些動(dòng)詞性結(jié)構(gòu)具備了詞的特征,但《現(xiàn)漢》第6版卻未加收錄,這樣又違背了詞典收詞的通用性原則和詞典對(duì)語(yǔ)言文字應(yīng)用的指導(dǎo)功能。所以,在詞典修訂工作中,有必要關(guān)注這兩類現(xiàn)象,并將考察的視野擴(kuò)大到所有的詞類,綜合考慮詞典規(guī)模和收詞的通用性、平衡性、系統(tǒng)性,做出恰當(dāng)?shù)娜∩?。而且,這一工作有必要借助基于真實(shí)文本的大規(guī)模語(yǔ)料庫(kù)來(lái)實(shí)現(xiàn)。

參考文獻(xiàn)

1.陳蒲清.教學(xué)語(yǔ)法答疑.長(zhǎng)沙:湖南人民出版社,1984.

2.國(guó)家語(yǔ)言資源監(jiān)測(cè)與研究中心.中國(guó)語(yǔ)言生活狀況報(bào)告(2008)·下編.北京:商務(wù)印書館,2009.

3.韓敬體.增新刪舊,調(diào)整平衡——談《現(xiàn)代漢語(yǔ)詞典》第5版的收詞.中國(guó)語(yǔ)文,2006(2).

4.劉慶隆.現(xiàn)代漢語(yǔ)詞典的收詞原則.辭書研究,1982(1).

5.呂叔湘.漢語(yǔ)語(yǔ)法分析問(wèn)題.北京:商務(wù)印書館,1979.

6.張普.信息處理用語(yǔ)言知識(shí)動(dòng)態(tài)更新的總體思考.語(yǔ)言文字應(yīng)用,2000(2).

7.張普.關(guān)于控制論與動(dòng)態(tài)語(yǔ)言知識(shí)更新的思考.語(yǔ)言文字應(yīng)用,2001(4).

8.張普.動(dòng)態(tài)語(yǔ)言知識(shí)更新研究.北京:商務(wù)印書館,2009.

9.中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所詞典編輯室.現(xiàn)代漢語(yǔ)詞典(第5、6版).北京:商務(wù)印書館,2005,2012.

(湖南大學(xué)中國(guó)語(yǔ)言文學(xué)學(xué)院 長(zhǎng)沙 410082)(責(zé)任編輯 李瀟瀟)endprint

猜你喜歡
現(xiàn)代漢語(yǔ)詞典
《現(xiàn)代漢語(yǔ)詞典》第六版新增詞語(yǔ)研究
現(xiàn)代漢語(yǔ)中藝術(shù)類行業(yè)語(yǔ)泛化現(xiàn)象研究
《現(xiàn)代漢語(yǔ)詞典》字母詞收錄與修訂情況分析