徐德寬 何保榮 邱立坤
摘 要:詞典釋義元語言作為一種特殊語言形式,具有重要的研究價值。本文以HSK漢語水平考試大綱中的動詞為母本,選取《現(xiàn)代漢語詞典》(第六版)和《國語辭典》(修訂版)中共有的608個詞條,以其在各自詞典中的釋義作為語料,構(gòu)建字同現(xiàn)網(wǎng)絡(luò),以復(fù)雜網(wǎng)絡(luò)的視角對其進行了多方位的研究,解釋了其在小世界性、無標(biāo)度性、居間中心性、層次性和匹配度等方面的特點,揭示了詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)獨特的復(fù)雜網(wǎng)絡(luò)性質(zhì),拓寬了語言網(wǎng)絡(luò)研究的領(lǐng)域和范圍。
關(guān)鍵詞:動詞;釋義元語言;字同現(xiàn)網(wǎng)絡(luò);復(fù)雜網(wǎng)絡(luò)
中圖分類號:H0-0 文獻標(biāo)識碼:A 文章編號:1003-6822(2016)02-0002-12
1. 引言
網(wǎng)絡(luò)在自然界和人類社會中普遍存在,自然界中的天然星系、神經(jīng)網(wǎng)、食物鏈網(wǎng)絡(luò),人類社會中的社交網(wǎng)絡(luò)、疾病傳播網(wǎng)絡(luò)以及人類創(chuàng)造的通信網(wǎng)絡(luò)、交通網(wǎng)絡(luò)等都屬于復(fù)雜網(wǎng)絡(luò)。作為一門新興科學(xué),復(fù)雜網(wǎng)絡(luò)是對普遍存在的網(wǎng)絡(luò)現(xiàn)象及其復(fù)雜性進行解釋的一門學(xué)科。
近年來,復(fù)雜網(wǎng)絡(luò)研究日益成為學(xué)界研究的熱點,語言網(wǎng)絡(luò)研究的成果更是不斷涌現(xiàn),比如,詞同現(xiàn)網(wǎng)絡(luò)、依存句法網(wǎng)絡(luò)、詞匯聯(lián)想網(wǎng)絡(luò)和辭典網(wǎng)絡(luò)等(Jin and Liu, 2014; Li and Zhou, 2007; Sheng and Li, 2009; Solé, 2001; Solé et al, 2010; 林楓 等,2012; 韓普 等,2014)。其中,對于漢語語言網(wǎng)絡(luò)的研究也不乏其例,如An empirical study of Chinese language networks一文以實驗的方法說明了語言網(wǎng)絡(luò)的小世界效應(yīng)、無標(biāo)度網(wǎng)絡(luò)結(jié)構(gòu)、異配性等特點,得出漢語言網(wǎng)絡(luò)與其他復(fù)雜網(wǎng)絡(luò)在其發(fā)展進程中可能具有共同特點的觀點 (Zhou et al, 2008);(Cong and Liu, 2014)。梁偉等的Modeling the Chinese language as an evolving network 則提出了一個發(fā)展中的語言網(wǎng)絡(luò)模型,并通過模擬共生網(wǎng)絡(luò)發(fā)現(xiàn)了在舊詞中高頻出現(xiàn)的詞語在構(gòu)建新詞時經(jīng)常被重新啟用的現(xiàn)象(Liang et al, 2014)。同現(xiàn)網(wǎng)絡(luò)研究是語言網(wǎng)絡(luò)研究的重要構(gòu)成部分,許多學(xué)者對其進行過深入研究(韓普、王東波、路高飛、蘇新寧,2014;梁偉 等,2012;劉知遠(yuǎn) 等,2008)。
“元語言”這一概念來自哲學(xué)。詞典學(xué)中,元語言是指用來解釋詞典所收詞語的定義語言,有學(xué)者稱之為“釋義元語言”(蘇新春,2006)。詞典學(xué)注重實踐,收詞釋義是詞典的基本內(nèi)容,因此,以解釋詞語為己任的元語言研究就成了一個重要方面。
詞典釋義元語言作為一種特殊語言形式,具有獨特的研究價值(李葆嘉,2002)。許多學(xué)者對漢語詞典釋義元語言進行了孜孜不倦的研究,得出了重要的成果(安華林,2009; 蘇新春,2006)。但這些研究大都是基于直覺和定性研究得出的結(jié)果,但對于詞典釋義元語言的定量對比研究卻鮮有人涉及。本文以HSK漢語水平考試大綱中的動詞為母本,選取《現(xiàn)代漢語詞典》(第六版)(以下簡稱《現(xiàn)漢》)和《國語辭典》(修訂版)(以下簡稱《國辭》)中共有的608個詞條,以其在兩部詞典中的釋義作為語料(參見劉珺、徐德寬等,2014),構(gòu)建了字同現(xiàn)網(wǎng)絡(luò),力求對兩部詞典的釋義用詞在小世界效應(yīng)、無標(biāo)度特征、層次性、居間中心性和匹配度等方面的進行量化的對比,以便更為精確而深入地探求漢語釋義元語言的底層特征及其本質(zhì)。
2. 字同現(xiàn)網(wǎng)絡(luò)
字同現(xiàn)網(wǎng)絡(luò)是一種基于大規(guī)模語料庫的語言網(wǎng)絡(luò)。本質(zhì)上,它可以揭示人類語言的某些特性,是近年來語言研究中的一個非常重要的、新的方向。
字同現(xiàn)網(wǎng)絡(luò)的構(gòu)建:語料中所包含的每一個字對應(yīng)著字同現(xiàn)網(wǎng)絡(luò)中的一個節(jié)點,若兩個字之間在n階馬爾科夫鏈①的條件下存在同現(xiàn)關(guān)系,則認(rèn)為這兩個節(jié)點之間存在一個連接。(Solé, 2001)本文所構(gòu)建的詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)為1階有向同現(xiàn)網(wǎng)絡(luò),即把詞典釋義中緊密相鄰的兩個字符連接起來,構(gòu)成一個網(wǎng)絡(luò)。
例如,《現(xiàn)漢》對于“愛”“喜歡”和“愛好”三個詞條的釋義為:
愛:對人或事物有好感或感興趣。
喜歡:對某種事物具有濃厚的興趣。
愛好:喜歡。
《國辭》對于“愛”“喜歡”和“愛好”三個詞條的釋義為:
愛:喜好、親慕。
喜歡:喜愛。
愛好:喜好。
圖1、圖2(見下頁)是分別是《現(xiàn)漢》和《國辭》對上述三個詞條的釋義所構(gòu)建的字同現(xiàn)網(wǎng)絡(luò)示意圖。
圖1中,首先以“對”為一個節(jié)點,由該節(jié)點發(fā)出的兩條邊連接了它的兩個鄰居節(jié)點“人”和“某”,其中,由“某”發(fā)出的一條邊又連接了節(jié)點“種”,“種”又連接了“事”,按照箭頭方向依此類推,即形成這樣一條字符鏈:“對→某→種→事→物→具→有→濃→厚→的→興→趣”。相應(yīng)地,由“人”這個節(jié)點發(fā)出的邊連接了“或”這個節(jié)點,以此類推形成了字符鏈“對→人→或→事→物→具→有→濃→厚→的→興→趣”。另外,“喜→歡”單獨形成了一條字符鏈。
圖2則是以“喜”為一個節(jié)點,由它發(fā)出兩條邊連接了“愛”和“好”這兩個節(jié)點,另外,“好”這一節(jié)點通過標(biāo)點“、”(本文中的標(biāo)點符號也被包括在同現(xiàn)網(wǎng)絡(luò)中)依此連接起“親”和“慕”兩個節(jié)點。
字同現(xiàn)網(wǎng)絡(luò)中,度(degree)是指與某個節(jié)點連接的其他節(jié)點的數(shù)目,連接某個節(jié)點的邊的數(shù)目就表示該節(jié)點的度。一般而言,一個節(jié)點的度越大則表示該節(jié)點在某種程度上越重要。比如,與“某”這個節(jié)點連接的有兩條邊,那么它的度就是2。本文字同現(xiàn)網(wǎng)絡(luò)采用的是有向圖,有向圖指節(jié)點的度是有向的,包括出度(out-degree)和入度(in-degree)。比如,連接“某”這個節(jié)點的邊是由其發(fā)出的一條邊和指向它的一條邊組成,前者我們稱之為出度,后者則稱之為入度。圖中,箭頭所指的方向限制了節(jié)點之間連接的順序,使其構(gòu)成了一個有向網(wǎng)絡(luò)(directed network)。
3.網(wǎng)絡(luò)的性質(zhì)
在同現(xiàn)網(wǎng)絡(luò)中,小世界效應(yīng)、無標(biāo)度特征、層次性、居間中心性和匹配度等是其幾個主要的特性(Liu et al, 2008; Newman, 2003; Solé, 2001; Yu et al, 2011),因此,本文將從這幾個方面對《現(xiàn)漢》和《國辭》釋義元語言字同現(xiàn)網(wǎng)絡(luò)進行計量研究,并分析出兩者的特征和差異。
3.1 小世界效應(yīng)
何為“小世界效應(yīng)”?簡單來講就是網(wǎng)絡(luò)中的任意某個節(jié)點僅通過為數(shù)不多的幾步就可以達到網(wǎng)絡(luò)中的其他任何一個節(jié)點(郭世澤,2012)。有的網(wǎng)絡(luò)具有很大的尺寸,但是網(wǎng)絡(luò)中任意兩個節(jié)點之間的距離相對較小。此外,這種網(wǎng)絡(luò)還有著較高的集聚系數(shù)。著名的“六度分離理論”就是很好的解釋?!傲确蛛x”源于20世紀(jì)60年代美國哈佛大學(xué)心理學(xué)家米爾格拉姆(Milgram)的實驗假設(shè):在大多數(shù)人中,任意兩個素不相識的人通過朋友(或朋友的朋友),平均最多通過六個人就可以彼此認(rèn)識(瓦茨,2011)。
1998年美國科學(xué)家瓦茨和斯特羅加茨在《自然》雜志上發(fā)表了“‘小世界網(wǎng)絡(luò)的群體動力行為”一文,推廣了“六度分離”假設(shè),提出了小世界網(wǎng)絡(luò)模型(Strogatz, 1998; Watts and Strogatz, 1998)。
網(wǎng)絡(luò)的小世界性與其平均最短路徑長度d和較大的網(wǎng)絡(luò)聚類系數(shù)C有關(guān)。若i和j表示網(wǎng)絡(luò)中的兩個節(jié)點,將dmin(i,j)定義為網(wǎng)絡(luò)中i和j兩個節(jié)點的最短路徑,則節(jié)點i與其他所有詞的平均最短路徑為:
那么,網(wǎng)絡(luò)的平均路徑長度為:
另一個與網(wǎng)絡(luò)的小世界效應(yīng)密切相關(guān)的變量是聚合系數(shù)C,網(wǎng)絡(luò)的聚合系數(shù)指網(wǎng)絡(luò)中某個節(jié)點的任意兩個鄰居節(jié)點互為鄰居節(jié)點的概率。網(wǎng)絡(luò)聚合系數(shù)的公式為:
設(shè)網(wǎng)絡(luò)的平均度為k,那么該網(wǎng)絡(luò)的聚合系數(shù)為Crandom≈k/n,,平均路徑長度為drandom≈lnn/lnk。如果網(wǎng)絡(luò)的平均路徑長度d≈drandom,,聚合系數(shù)C>>Crandom,,則該網(wǎng)絡(luò)具有小世界效應(yīng)。
3.2 無標(biāo)度特征
在有些網(wǎng)絡(luò)中,存在極少數(shù)節(jié)點(關(guān)鍵節(jié)點),這些節(jié)點與數(shù)量眾多的其他節(jié)點相鏈接;而其他的大部分節(jié)點只與少量節(jié)點鏈接。由于包含這類關(guān)鍵節(jié)點的網(wǎng)絡(luò)的度無明顯特征長度,所以被稱為無標(biāo)度網(wǎng)絡(luò)。無標(biāo)度網(wǎng)絡(luò)由大量低度節(jié)點和少量高度節(jié)點構(gòu)成,具有“增長”和“優(yōu)選”兩個特征:增長是指復(fù)雜網(wǎng)絡(luò)是開放的系統(tǒng),隨著新的單元的不斷加入,節(jié)點總數(shù)也在不斷上升;優(yōu)選則是指一個節(jié)點連接新節(jié)點的概率主要依賴于節(jié)點已有的度,且優(yōu)先和度數(shù)比較大的節(jié)點連接。
無標(biāo)度特性是指度為k的節(jié)點在網(wǎng)絡(luò)中出現(xiàn)的概率P(k)要滿足冪律分布(長尾分布)P(k)~k。該公式表明,度k的值越高,度為k的節(jié)點的數(shù)量(P(k))就會越少,節(jié)點出現(xiàn)的次數(shù)(P(k))與該節(jié)點的度的冪(k)成反比關(guān)系(負(fù)號表示反比例)。
3.3 層次模塊性
模塊(module)是指一組連接在一起的、具有相對獨立功能的節(jié)點,許多網(wǎng)絡(luò)中的模塊是按等級組織起來的,這樣就形成了一個等級網(wǎng)絡(luò)(hierarchical network)。網(wǎng)絡(luò)的層次性一般通過平均度k 與網(wǎng)絡(luò)聚合系數(shù)C(k)這兩個參數(shù)來觀察。許多網(wǎng)絡(luò)的平均度-聚合系數(shù)(k-C(k))的分布圖呈冪律分布:C(k)~k ,且≈1。該公式說明,一個網(wǎng)絡(luò)的平均度k值越小,則該網(wǎng)絡(luò)越具有較高的聚合系數(shù),屬于高度連接的模塊;平均度k值越高,則該網(wǎng)絡(luò)越具有較低的聚合系數(shù),屬于低度連接的模塊。一般而言,度較高的節(jié)點具有較低的聚集系數(shù),其作用是將不同的模塊連接起來。在層次模塊性網(wǎng)絡(luò)中,許多內(nèi)部聯(lián)系密切的小規(guī)模節(jié)點組之間松散關(guān)聯(lián),這些聯(lián)系松散的小模塊又構(gòu)成了規(guī)模更大的模塊。
3.4 居間中心性
居間中心性又叫“中介度”,指網(wǎng)絡(luò)中某個節(jié)點連接其他(任意兩個)節(jié)點時的最短路徑的條數(shù),其他任意兩個節(jié)點要產(chǎn)生聯(lián)系,必須經(jīng)過該節(jié)點的連接。居間中心性體現(xiàn)了某些節(jié)點在網(wǎng)絡(luò)連接中的重要作用。我們定義節(jié)點v的居間中心值為g(v),Gv(i, j)表示節(jié)點Si、Sj之間通過節(jié)點v的最短路徑的條數(shù),G(i, j)表示節(jié)點之間所有的最短路徑條數(shù),即G(i,j)=。那么gv (i, j)=Gv (i, j)/G(i, j)可以表示節(jié)點v在節(jié)點i和j的聯(lián)系中的重要性。
3.5 匹配度
匹配度是指網(wǎng)絡(luò)中各節(jié)點在度連接方面的相似性,即是否高連接度的節(jié)點與高連接度的節(jié)點相連。網(wǎng)絡(luò)中,如果高連接度的節(jié)點傾向于同高連接度的節(jié)點相連,則該網(wǎng)絡(luò)具有同配性;反之,高連接度的節(jié)點傾向于同低連接度的節(jié)點相連,則該網(wǎng)絡(luò)具有異配性。網(wǎng)絡(luò)的匹配度可通過匹配系數(shù)Γ來測量:
若Γ>0,網(wǎng)絡(luò)同配;若Γ<0,則網(wǎng)絡(luò)異配。
4. 《現(xiàn)漢》與《國辭》字同現(xiàn)網(wǎng)絡(luò)的對比
本文以HSK漢語水平考試大綱中的動詞為母本,選取《現(xiàn)漢》和《國辭》中共有的608個詞條,將其在各自詞典中的釋義作為構(gòu)建網(wǎng)絡(luò)的基礎(chǔ)語料。我們用自編程序提取2元字串,構(gòu)建了字同現(xiàn)網(wǎng)絡(luò),然后用Cytoscape 2.83②、Network X③和Pajek 4④等開源的復(fù)雜網(wǎng)絡(luò)處理軟件計算了網(wǎng)絡(luò)基本參數(shù),并用Origin 9.1科學(xué)計算與制圖軟件對數(shù)據(jù)進行了擬合,得出了《現(xiàn)漢》和《國辭》常用動詞釋義元語言字同現(xiàn)網(wǎng)絡(luò)的基本數(shù)據(jù)(表1)。
4.1 網(wǎng)絡(luò)基本數(shù)據(jù)對比
從表1可以看出,《現(xiàn)漢》網(wǎng)絡(luò)的節(jié)點總數(shù)為1201,而《國辭》的節(jié)點總數(shù)為1246。即《現(xiàn)漢》中釋義元語言所使用的字種總量為1201個,《國辭》則為1246個?!冬F(xiàn)漢》網(wǎng)絡(luò)的總字頻為9142,《國辭》的總字頻為6083。
兩者的節(jié)點總數(shù)較其總字頻的數(shù)量小很多。釋義元語言的功能是完成對其他詞語的描述和說明,因此,其數(shù)量必須限定在一定數(shù)量范圍之內(nèi)。有限量是元語言形成的一個外部特征,同事又是其內(nèi)在素質(zhì)要求的體現(xiàn)。只有“有限”才能具有“元”語言的資格,才能更好地體現(xiàn)其表意功能(蘇新春,2006)。而用有限量的詞語來描寫大數(shù)量的語義,無疑大大提高了詞語的使用頻率?!秶o》的總字頻比《現(xiàn)漢》少很多。我們知道,《現(xiàn)漢》使用簡體字,而《國辭》使用繁體字(正體字)。繁體字中異體字較多,在漢字的規(guī)范化和簡化過程當(dāng)中,部分異體字被取消使用,許多繁體字被合并成了一個簡體字?;谶@一原因,《現(xiàn)漢》釋義元語言所使用的字種的總量比《國辭》要少是有據(jù)可循的,體現(xiàn)在釋義元語言網(wǎng)絡(luò)上,就是《現(xiàn)漢》的釋義元語言網(wǎng)絡(luò)比《國辭》的節(jié)點要少。這說明在釋義上《國辭》比《現(xiàn)漢》要簡明,而《現(xiàn)漢》比《國辭》更為詳盡。
《現(xiàn)漢》網(wǎng)絡(luò)的邊數(shù)為5120,而《國辭》的邊數(shù)為3868。字同現(xiàn)網(wǎng)在某種程度上可以看作是一種表層組合關(guān)系網(wǎng)絡(luò),《現(xiàn)漢》的邊數(shù)比《國辭》多,則說明《現(xiàn)漢》釋義元語言里的組合關(guān)系的類型比《國辭》的多。
《現(xiàn)漢》網(wǎng)絡(luò)的平均度為8.159867,而《國辭》的平均度為5.94061。如上所述,一個字的度能夠反映該字的組合能力,《現(xiàn)漢》的平均度比《國辭》大,說明《現(xiàn)漢》釋義元語言用字的平均的組合能力比《國辭》要強。這其實是上述三種效應(yīng)綜合作用的結(jié)果:《現(xiàn)漢》網(wǎng)絡(luò)的節(jié)點數(shù)比《國辭》少,而總字頻和邊數(shù)都比《國辭》多,三個方面綜合作用下,形成了《現(xiàn)漢》釋義元語言網(wǎng)絡(luò)的平均度要大于《國辭》。這說明在《現(xiàn)漢》釋義元語言里,字的組合能力要比《國辭》的組合能力強。
通過以上分析,我們可以推測,《現(xiàn)漢》釋義元語言與《國辭》相比,組合類型更為豐富,釋義方式更為多樣化,釋義用語也更為詳盡。而《國辭》的釋義元語言則更為簡潔、凝練。
4.2 網(wǎng)絡(luò)性質(zhì)對比
4.2.1 小世界效應(yīng)
將兩個網(wǎng)絡(luò)的平均路徑長度和聚合系數(shù)與隨機網(wǎng)絡(luò)相比較,我們發(fā)現(xiàn),《現(xiàn)漢》和《國辭》釋義元語言字同現(xiàn)網(wǎng)絡(luò)的平均路徑長度分別為3.034652和3.162426,聚合系數(shù)分別為0.178438和0.179535;而相對應(yīng)的隨機網(wǎng)絡(luò)的平均路徑長度分別為3.377866和4.000251,聚合系數(shù)分別為0.0068和0.004772。對于兩個網(wǎng)絡(luò),均有d≈drandom,C>>Crandom,符合復(fù)雜網(wǎng)絡(luò)小世界效應(yīng)的一般條件:d≈drandom,C>>Crandom。因此,兩部詞典的動詞釋義元語言字同現(xiàn)網(wǎng)絡(luò)均具有小世界效應(yīng)。對于《現(xiàn)漢》來講,其(d/drandom)/( C/Crandom)的值為0.034236396,而《國辭》的值為0.021012825。該比值越小,表示小世界效應(yīng)越大??梢哉J(rèn)為,《國辭》的小世界效應(yīng)比《現(xiàn)漢》大,其釋義元語言更為凝練。
詞典學(xué)要求在語義解釋過程中,應(yīng)盡量使用簡單的意思,對于具有復(fù)雜語義的詞則要努力給出一個簡單易懂的釋義。因此,詞典釋義應(yīng)該用簡潔、精煉的語言對詞語進行解釋。而這種小世界性恰恰保證了詞典釋義過程中一個字能夠以較短的路徑與另一個字相關(guān)聯(lián),從而避免釋義元語言之間距離過大造成的釋義拖沓、繁雜。相較《現(xiàn)漢》,《國辭》釋義元語言網(wǎng)絡(luò)的小世界性更強,主要原因在于《國辭》在收詞、釋義上使用了更多文言詞語。
4.2.2 無標(biāo)度特征
圖5—圖8分別為《現(xiàn)漢》和《國辭》兩部詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)的所有度累積分布曲線圖和分段的所有度累積分布曲線圖。其中,橫坐標(biāo)k表示節(jié)點的度:;縱坐標(biāo)Pc(k)表示節(jié)點的累積頻率。通過觀察,我們不難發(fā)現(xiàn)兩部詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)的度的分布曲線都大致遵循冪律分布。
但對這些累積分布曲線圖進行更細(xì)致的觀察后,我們發(fā)現(xiàn),兩部詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)的度的分布并非一條直線,而是呈現(xiàn)出斜率不同的兩個線段。為了方便觀察,我們將兩部詞典釋義元語言所有度累積分布曲線的分段情況用不同的線型(點線與直線)進行標(biāo)示(圖7、圖8),圖中,所有度的累積分布曲線明顯地被分成了兩個不同斜率的線段(箭頭指向處)。在字同現(xiàn)網(wǎng)絡(luò)中,度被分為兩段不同斜率的線段的現(xiàn)象,就暗示了釋義語言中核心字的存在。任何話語的表達過程中,都會反復(fù)使用某些字,這些有限的、被重復(fù)運用的字就構(gòu)成了人類語言中的核心字典。其中,位于第一段的字的度較低,這類字是釋義時使用的特殊的字,這類字由于使用有限,所以與其他字產(chǎn)生連接的肯能性較小,其度相對也要小很多。而處在第二段度較大的字,其連接性較強,因此被反復(fù)使用,就構(gòu)成了所謂的核心字典。
自然語義元語言論的“還原釋義法”目的是用最基本、最簡單的詞語解釋復(fù)雜的語義現(xiàn)象,即用簡單的詞語表征、解釋復(fù)雜的語義。該方法的目標(biāo)是把語義分析的解釋用語還原為一組數(shù)量最小、解釋力最強且適用性最為廣泛的詞語。因此,正如日常語言的運用,詞典釋義元語言時,為了使使用者能夠以最為省力的方法讀懂字詞的釋義,往往采用一些解釋力很強,連接性很高,但語義相對簡單的字。但為了使釋義完整、準(zhǔn)確,某些低連接度的字的采用也是不可或缺的。
4.2.3 層次性
圖9、圖10分別為《現(xiàn)漢》和《國辭》兩部詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)的總度-聚合系數(shù)圖。橫坐標(biāo)k表示兩個網(wǎng)絡(luò)的總度;縱坐標(biāo)C表示兩個網(wǎng)絡(luò)的聚合系數(shù)。分析結(jié)果顯示,兩部詞典釋義元語言字同現(xiàn)網(wǎng)絡(luò)總度-聚合系擬合指數(shù)γ分別為-1.22322和-0.88527,且兩者都大致遵循冪律分布。兩圖中,總度-聚合系數(shù)的擬合曲線呈明顯下降趨勢,表明該網(wǎng)絡(luò)中不僅存在著很多度雖小但聚合系數(shù)較高的節(jié)點,也存在很多度很高而聚合系數(shù)比較低的節(jié)點。這說明在詞典釋義元語言中不僅存在具有高連接性的模塊,也存在連接性較低的模塊。因此,兩部詞典的釋義用字具有層次性。
在詞典釋義過程中,許多相似或相關(guān)詞語的釋義常常使用相同的元語言來進行描寫,但不同詞語之間所使用的元語言則有較大差別。不同類別的元語言形成了不同規(guī)模的組塊,組塊內(nèi)部聯(lián)系密切,組塊與組塊之間則關(guān)系疏松。因此,釋義元語言網(wǎng)絡(luò)就呈現(xiàn)出一定的模塊性和層次性。
4.2.4 居間中心性
《現(xiàn)漢》和《國辭》釋義元語言字同現(xiàn)網(wǎng)絡(luò)的度—居間中心性關(guān)系圖和居間中心性累積分布圖如圖11-圖14所示。圖11-圖12中,橫坐標(biāo)k表示兩個網(wǎng)絡(luò)的度;縱坐標(biāo)g表示連個網(wǎng)絡(luò)的居間中心性。由圖可知,兩個網(wǎng)絡(luò)中度和居間中心性有著較強的正相關(guān)關(guān)系,即度越高,居間中心性也隨之增大。圖13-圖14中,橫坐標(biāo)g是兩個網(wǎng)絡(luò)的居間中心值:縱坐標(biāo)Pc(g)是兩個網(wǎng)絡(luò)的累積居間中心值。由圖可知,兩個網(wǎng)絡(luò)的居間中心性累積分布曲線呈明顯的兩段分布。表1數(shù)據(jù)顯示,兩個網(wǎng)絡(luò)的居間中心性指數(shù)η分別為-0.16613/-1.00218和-0.21052/-1.26147,雖然《現(xiàn)漢》的釋義元語言字同現(xiàn)網(wǎng)絡(luò)的居間中心性指數(shù)要大于《國辭》的居間中心性指數(shù),但兩者的指數(shù)相對都較低,兩個網(wǎng)絡(luò)中起到連接作用的關(guān)鍵字較少。
詞典釋義元語言重在對詞義進行描寫,多采用具有實際意義的實詞,要求元語言具有精煉、概括的特點。漢語中,具有高度鏈接作用的詞主要是一些功能詞,比如連詞、助詞等虛詞。這些功能詞沒有實際意義,因此詞典釋義時使用較少。
4.2.5 匹配度
圖15—圖16分別為《現(xiàn)漢》和《國辭》釋義元語言字同現(xiàn)網(wǎng)絡(luò)的字頻-總度關(guān)系圖。其中,橫坐標(biāo)表示兩部詞典釋義元語言時所運用的字的頻率f;縱坐標(biāo)則表示兩個網(wǎng)絡(luò)的總的度數(shù)k。計算表明,釋義元語言網(wǎng)絡(luò)的字頻-總度關(guān)系呈冪律分布的關(guān)系:
即f~
其中,總度—字頻的擬合指數(shù)ξ≈1(《現(xiàn)漢》、《國辭》分別為1.0824和1.04158)。通過觀察釋義元語言網(wǎng)絡(luò)字頻-總度的相關(guān)圖表,我們不難發(fā)現(xiàn)該同現(xiàn)網(wǎng)絡(luò)的度與字頻的正相關(guān)關(guān)系,即字頻越高,度也隨之增大。雖然兩個網(wǎng)絡(luò)的系數(shù)差別不大,但相較而言,《現(xiàn)漢》的擬合指數(shù)略高于《國辭》,這說明《現(xiàn)漢》釋義元語言中,字頻較高的字的度也高,即頻率較高的字,與其他字相聯(lián)系的可能性也較大。這可能與《現(xiàn)漢》釋義更為多樣化有關(guān)系。
根據(jù)表1中的數(shù)據(jù),《現(xiàn)漢》和《國辭》釋義元語言字同現(xiàn)網(wǎng)絡(luò)的匹配度系數(shù)Γ分別為-0.20425和-0.13003,Γ<0。這說明兩個網(wǎng)絡(luò)均具有異配性,即網(wǎng)絡(luò)中高連接度的節(jié)點更傾向于與低連接度的節(jié)點相連。在語言網(wǎng)絡(luò)中,高連接度、高頻率的節(jié)點一般為功能詞,比如“的”、“和”、“在”等。高連接性的節(jié)點與低連接性的節(jié)點相連接也符合語言的特點和要求:節(jié)點度比較高、含義比較虛的功能字作為連接成分或粘附成分,大都附加在節(jié)點度比較低、含義比較實在的字詞周圍,符合語言的句法、語義和表達規(guī)律。釋義元語言的主要功能是滿足社會交際需要對該語言的詞語進行一般性的陳述、描繪和再現(xiàn),應(yīng)服務(wù)于語言社會的普通成員。因此,釋義元語言雖然比較特殊,但仍需遵循語言表達的這一總的規(guī)律和要求。
相比較而言,《現(xiàn)漢》匹配度系數(shù)的絕對值高于《國辭》,說明《現(xiàn)漢》中度數(shù)高的字更傾向于與度數(shù)低的字相連接。原因可能在于《現(xiàn)漢》中常用虛字的種類較多,頻率較大,從而使得度數(shù)高的字與一般度數(shù)的字連接的概率較大。
5. 結(jié)論
本文從復(fù)雜網(wǎng)絡(luò)的視角對《現(xiàn)漢》和《國辭》常用動詞的釋義元語言字同現(xiàn)網(wǎng)絡(luò)的特征進行了研究,分析了兩個網(wǎng)絡(luò)的小世界效應(yīng)、無標(biāo)度特征、層次性和居間中心性及匹配度等特性,并從網(wǎng)絡(luò)基本參數(shù)和基本性質(zhì)方面對兩部詞典常用動詞釋義元語言進行了對比,得出以下結(jié)論:
第一,《現(xiàn)漢》網(wǎng)絡(luò)與《國辭》網(wǎng)絡(luò)相較而言,其總字頻、總邊數(shù)、平均度都大于《國辭》,表明《現(xiàn)漢》在釋義上比《國辭》要更精細(xì)、詳盡,釋義元語言的組合關(guān)系更為復(fù)雜。
第二,在小世界性上,兩部詞典均符合復(fù)雜網(wǎng)絡(luò)小世界效應(yīng)的一般條件,均具有小世界性。但《國辭》釋義元語言更加凝練,其小世界性更強。
第三,兩部詞典釋義元語言網(wǎng)絡(luò)的度都遵循冪律分布,因此都具有無標(biāo)度性;但兩個網(wǎng)絡(luò)度的分布的折線型也暗示了詞典釋義元語言的核心字的存在。兩部詞典的釋義元語言不僅存在高連接的模塊,也存在低連接的模塊,表現(xiàn)出了一定的層次性。
第四,在居間中心性上,《現(xiàn)漢》和《國辭》兩個網(wǎng)絡(luò)的居間中心性指數(shù)都比較低,說明兩個網(wǎng)絡(luò)中起到連接作用的關(guān)鍵字較少,這與詞典釋義元語言的精煉特點不無關(guān)系。
第五,匹配度上,兩個網(wǎng)絡(luò)的匹配度系數(shù)都小于零,表明兩個網(wǎng)絡(luò)均具有異配性,高連接度的節(jié)點更傾向于與低連接度的節(jié)點相連。詞典釋義元語言雖較為特殊,但仍遵循漢語語言的表達規(guī)律,即節(jié)點度較高、含義較虛的功能字有著很強的連接能力,比如“的”“和”“在”等。
本文把復(fù)雜網(wǎng)絡(luò)方法引入到漢語釋義元語言研究中,將以往基于感性認(rèn)識和定性描述研究提升到了精確的定量的層次,使元語言研究朝著科學(xué)化的方向邁進。本文的研究也為詞典對比研究提供了一個新的角度,使得詞典對比在一個客觀的可比較的框架內(nèi)進行。同時,本文將元語言這種特殊的語言形式作為研究的對象,也拓寬了語言網(wǎng)絡(luò)的研究視野,這對復(fù)雜網(wǎng)絡(luò)研究的拓展和深化有一定的推動作用。但是由于所用語料規(guī)模較小及研究水平的限制,本文也存在一些不足和缺陷。希望在以后的工作中,能擴大語料庫的規(guī)模和范圍并對其進行更為全面和深入的研究。
參 考 文 獻
Jin Cong, Liu Haitao. Approaching Human Language with Complex Networks [J]. Physics of Life Reviews, 2014, (4): 598-618.
Li Jianyu, Zhou Jie. Chinese Character Structure Analysis Based On Complex Networks [J]. Physica A: Statistical Mechanics and its Applications, 2007: 629-638.
Liang Wei, Shi Yuming, Huang Qiuling. Modeling the Chinese Language as an Evolving Network [J]. Physica A: Statistical Mechanics and its Applications, 2014 : 268-276.
Liu Zhi Yuan, Zheng Ya Bin, Sun Mao Song. Complex Network Properties of Chinese Syntactic Dependency Network [J]. Complex Systems & Complexity Science, 2008.
Newman, M. E. J. The Structure and Function of Complex Networks [J]. SIAM Review, 2003: 167-256.
Sheng Long, Li Chunguang. English and Chinese Languages as Weighted Complex Networks [J]. Physica A: Statistical Mechanics and its Applications, 2009,(12): 2561-2570.
Solé Ramon Ferrer I. Cancho. The Small World of Human Language [J]. Proceedings of the Royal Society of London. Series B: Biological Sciences, 2001,(1482): 2261-2265.
Solé, R. V., Corominas-Murtra Bernat, Valverde Sergi, Steels Luc. Language Networks: Their Structure, Function, and Evolution [J]. Complexity: NA-NA, 2010.
Strogatz, D. J. & S. H. Watts. Collective Dynamics of“Small-World”Networks [J]. Nature, 1998, (6684): 440-442.
Watts D. J., Strogatz S. H. Collective Dynamics of Small-World [Z].1998.
Yu Shuiyuan, Liu Haitao, Xu Chunshan. Statistical Properties of Chinese Phonemic Networks [J]. Physica A: Statistical Mechanics and its Applications, 2011,(7): 1370-1380.
Zhou Shuigeng, Hu Guobiao, Zhang Zhongzhi, Guan Jihong. An Empirical Study of Chinese Language Networks [Z]. 2008.
安華林.漢語釋義元語言理論與應(yīng)用研究[M]. 上海:學(xué)林出版社,2009.
郭世澤.復(fù)雜網(wǎng)絡(luò)基礎(chǔ)理論 [M]. 北京:科學(xué)出版社,2012.
韓 普、王東波、路高飛、蘇新寧.語言網(wǎng)絡(luò)研究進展[J]. 中文信息學(xué)報2014,(1): 9-18.
李葆嘉.漢語元語言系統(tǒng)研究的理論建構(gòu)及應(yīng)用價值[J]. 南京師大學(xué)報(社會科學(xué)版),2002,(4).
梁 偉、史玉明、謝智剛、王艷麗.不同時期漢語散文的字同現(xiàn)網(wǎng)絡(luò)之研究[J]. 中國科學(xué):信息科學(xué),2012,(7): 831-842.
林 楓、劉 云、江鐘立.漢字網(wǎng)絡(luò)的歷時性模式探析[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2012,(3): 50-61.
劉 珺、徐德寬、馬夢佳、陳淑梅.現(xiàn)代漢語常用動詞釋義對比研究——以《現(xiàn)代漢語詞典》(第六版)和《重編國語辭典修訂本》為例[J]. 中文信息學(xué)報,2014,(1) .
劉知遠(yuǎn)、鄭亞斌、孫茂松.漢語依存句法網(wǎng)絡(luò)的復(fù)雜網(wǎng)絡(luò)性質(zhì)[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,(2): 37-45.
蘇新春.漢語釋義元語言研究[M]. 上海:上海教育出版社,2006.
瓦 茨.六度分隔[M]. 北京:中國人民大學(xué)出版社,2011.
Abstract: As a unique language form, the meta-language of dictionary interpretation is of great importance. In this paper, we select 608 entries included both in the modern Chinese Dictionary (the six edition) and Mandarin Dictionary (the revised edition) on the basis of the verbs in the syllabus of Chinese Proficiency Test (HSK) and then built a character co-occurrence network with the interpretations of these verbs in each dictionary. We have taken an all-round research from the perspective of complex network and studied such characteristics as small-worldness, scale-free, betweenness centrality, hierarchy and assortiveness. The unique nature of the character co-occurrence network of meta-language of dictionary interpretation has been revealed and the scope of research on language network has been broadened.
Key words: verb; meta-language of interpretation; character co-occurrence network; complex network
作者簡介:徐德寬,男,博士,魯東大學(xué)文學(xué)院教授、碩士生導(dǎo)師。主要從事語言網(wǎng)絡(luò)、漢語國際教育和計算語言學(xué)等領(lǐng)域的研究;
何保榮,女,魯東大學(xué)文學(xué)院碩士研究生。主要從事語言學(xué)及應(yīng)用語言學(xué)研究;
邱立坤,男,博士,魯東大學(xué)文學(xué)院副教授、碩士生導(dǎo)師。主要從事計算語言學(xué)研究。
通訊地址:山東省煙臺市芝罘區(qū)紅旗中路186#,魯東大學(xué)文學(xué)院,郵編264025
E-mail:xudekuan@tom.com
(責(zé)任編輯:周統(tǒng)權(quán))