楊佳璐
(華中師范大學(xué) 語言與語言教育研究中心,湖北 武漢 430079)
基于詞同現(xiàn)網(wǎng)絡(luò)的“一起”與“一齊”比較分析
楊佳璐
(華中師范大學(xué) 語言與語言教育研究中心,湖北 武漢 430079)
“一起”和“一齊”是兩個(gè)意義相近、容易混淆的詞,學(xué)界已從不同角度對(duì)兩詞進(jìn)行過比較分析。擬以中等規(guī)模的自建語料庫(kù)為基礎(chǔ),借助語言網(wǎng)絡(luò)理論對(duì)兩詞進(jìn)行了考察。研究發(fā)現(xiàn):(1)“一起”“一齊”中心性均不高,位于中間偏后的位置;(2)“一起”的中心性要強(qiáng)于“一齊”。通過比較分析,為“一起”“一齊”的對(duì)比研究提供了更為客觀的統(tǒng)計(jì)數(shù)據(jù)。
一起;一齊;詞同現(xiàn);語言網(wǎng)絡(luò);協(xié)同副詞
“一起”“一齊”是兩個(gè)意義十分相近的詞?!冬F(xiàn)代漢語詞典》(第六版)中對(duì)“一起”的解釋為:“①同一個(gè)處所;②一同;③一共”。其中,①是名詞意義,②③為副詞意義;對(duì)“一齊”的解釋為:“表示同時(shí)”,為副詞意義。兩詞意義相近,一般是指它們用作副詞時(shí)意義相近。
已有研究中,對(duì)“一起”已有較為充分的探討,如王仁法、徐以中(2003),李勝梅(2004),葛婷(2009),石佩璇(2009),邵洪亮(2010),唐昱(2011),等等。對(duì)“一齊”的分析,則多集中在與“一起”或其他詞語的對(duì)比研究中,如從語義角度展開的“一起”“一齊”對(duì)比分析(王兆麟,1979;葉秋生,2007),“一起”“一齊”可替換度的研究(葛婷,2009),關(guān)于兩詞語法化過程的探討(李晨溪,2013),等等。這些研究就“一起”“一齊”的相同點(diǎn)、差異乃至成因都做了較為充分的探討,但同時(shí)也展現(xiàn)出一種明顯的“多列例證,少見客觀系統(tǒng)的數(shù)據(jù)分析”的特點(diǎn)。
語言網(wǎng)絡(luò)具有系統(tǒng)性、復(fù)雜性。復(fù)雜網(wǎng)絡(luò)具備小世界、無標(biāo)度等特征,語言網(wǎng)絡(luò)也是如此。(如Cancho,Sole,2001;劉知遠(yuǎn),孫茂松,2007;劉海濤,2010)這無疑為我們借助客觀數(shù)據(jù)來審視具體的語言現(xiàn)象提供了新的視角與方法。
因此,我們通過大規(guī)模的語料庫(kù),構(gòu)建了表示次前后鄰接同現(xiàn)關(guān)系的有向網(wǎng)絡(luò),在語言網(wǎng)絡(luò)中來進(jìn)一步考察“一起”和“一齊”的特征及差異,為相關(guān)研究提供了更為客觀的統(tǒng)計(jì)數(shù)據(jù)。
研究所用語料均來自于自建語料庫(kù)。語料共計(jì)約1630萬字符,主要來源于現(xiàn)當(dāng)代小說、新聞及現(xiàn)當(dāng)代散文等。
我們首先利用國(guó)家語委開發(fā)的CorpusWordParser軟件對(duì)語料進(jìn)行了自動(dòng)分詞處理,以逗號(hào)、分號(hào)、句號(hào)、問號(hào)等標(biāo)點(diǎn)符號(hào)進(jìn)一步劃分分詞結(jié)果,通過MySQL構(gòu)建了大型語料庫(kù)。再利用WordCooHelper 1.6①對(duì)語料進(jìn)行了語言網(wǎng)絡(luò)的自動(dòng)構(gòu)建,并借助pajek 4.08對(duì)數(shù)據(jù)進(jìn)行了分析。
我們將語料庫(kù)中的語料隨機(jī)分為5個(gè)部分,每組平均326萬字符,分別構(gòu)建為5個(gè)有向網(wǎng)絡(luò),具體參數(shù)如表1所示。
表1
在將語料轉(zhuǎn)化為網(wǎng)絡(luò)后,逗號(hào)、分號(hào)、句號(hào)、問號(hào)、感嘆號(hào)等標(biāo)點(diǎn)符號(hào)不再保留,但仍然保留了一些具有特殊表意作用的符號(hào),如%、℃等。
為了便于分析,在5個(gè)語言網(wǎng)絡(luò)中,均添加了“ROOT”節(jié)點(diǎn),用以標(biāo)識(shí)句子。如:
(1) 原句:“所有人一起驚呼。”
有向網(wǎng)絡(luò)中的表現(xiàn)形式:“ROOT←所有←人←一起←驚呼”
(2) 原句:“和我一起到的還有一隊(duì)運(yùn)送鐵錠的車隊(duì)。”
有向網(wǎng)絡(luò)中的表現(xiàn)形式:“ROOT←和←我←一起←到←的←還有←一←隊(duì)←運(yùn)送←鐵←錠←的←車隊(duì)”
(3) 原句:“兩個(gè)兵一齊向他們說。”
有向網(wǎng)絡(luò)中的表現(xiàn)形式:“ROOT←兩←個(gè)←兵←一齊←向←他們←說”
若以上三例表示成網(wǎng)絡(luò)圖,則如圖1所示:
圖1 簡(jiǎn)單的表示詞前后鄰接同現(xiàn)關(guān)系有向圖
三個(gè)例句在構(gòu)建為一個(gè)詞同現(xiàn)網(wǎng)絡(luò)后,一方面通過“ROOT”節(jié)點(diǎn)標(biāo)識(shí)原句開頭,另一方面也通過該節(jié)點(diǎn)將幾個(gè)句子連接在了同一網(wǎng)絡(luò)之中。
節(jié)點(diǎn)在網(wǎng)絡(luò)中的地位主要取決于其中心性。我們一般從節(jié)點(diǎn)度、接近度和中間度來考察網(wǎng)絡(luò)節(jié)點(diǎn)的中心性。其中,節(jié)點(diǎn)度、接近度還包括輸入,輸出兩種情況的考察。
中間度是用來衡量節(jié)點(diǎn)“中介”性的一個(gè)重要指標(biāo)。由于兩個(gè)非鄰接節(jié)點(diǎn)的相互作用依賴于網(wǎng)絡(luò)中位于兩節(jié)點(diǎn)之間路徑上的那些節(jié)點(diǎn),(Freeman,1977)那么這條路徑上的節(jié)點(diǎn)便起到了一種“中介”作用。因而中間度越高,其“中介”性越好。
同時(shí),我們首先使用自建語料庫(kù)中的語料構(gòu)建了20個(gè)不同規(guī)模的有向網(wǎng)絡(luò),觀察發(fā)現(xiàn),在中間度、節(jié)點(diǎn)度、接近度幾個(gè)特征中,節(jié)點(diǎn)在中間度這一特性上數(shù)值差異大,呈現(xiàn)出明顯的層級(jí)性(如圖2)。雖然接近度也體現(xiàn)出明顯的層級(jí)性(如圖4),但同一節(jié)點(diǎn)在5個(gè)網(wǎng)絡(luò)中排名位置浮動(dòng)很大,穩(wěn)定性不足,不適合作為度量標(biāo)準(zhǔn)。因而我們以中間度為標(biāo)準(zhǔn),將節(jié)點(diǎn)劃分為5個(gè)層級(jí):中心節(jié)點(diǎn),次中心節(jié)點(diǎn),一般節(jié)點(diǎn),次邊緣節(jié)點(diǎn),邊緣節(jié)點(diǎn)。5個(gè)層級(jí)“中介”性依次降低。其中,中心節(jié)點(diǎn)的中間度遠(yuǎn)遠(yuǎn)高于其他節(jié)點(diǎn),一般有且僅有一個(gè),而且往往是“的”;邊緣節(jié)點(diǎn)則是中間度為0的節(jié)點(diǎn)。
圖2 20個(gè)不同規(guī)模的有向網(wǎng)絡(luò)中間度均值及離散度
通過考察五個(gè)網(wǎng)絡(luò)中“一起”“一齊”的中間度,可以發(fā)現(xiàn),“一起”“一齊”均應(yīng)被歸入“一般節(jié)點(diǎn)”之中。但它們的中間度在“一般節(jié)點(diǎn)”中相對(duì)較低,屬于靠近下邊界的節(jié)點(diǎn)。“一起”在5個(gè)網(wǎng)絡(luò)中的中間度平均值為0.0003843,“一齊”則為0.0000715,平均中間度之差為0.0003128。這反映出它們的中間度差異并不大。換言之,在中等規(guī)模的語言網(wǎng)絡(luò)中,“一起”“一齊”的“中介”性均不高。
節(jié)點(diǎn)度即考察與一個(gè)節(jié)點(diǎn)直接相連的其他節(jié)點(diǎn)的個(gè)數(shù),(陳芯瑩,劉海濤,2011)包括“點(diǎn)入度”和“點(diǎn)出度”。在有向圖中,點(diǎn)入度反映的是節(jié)點(diǎn)與其后接(鄰接)節(jié)點(diǎn)的連接情況,點(diǎn)出度反映的是節(jié)點(diǎn)與其前接(鄰接)節(jié)點(diǎn)的連接情況。如圖1所示語言網(wǎng)絡(luò)中,“一齊”的前接節(jié)點(diǎn)為“兵”,計(jì)入點(diǎn)出度;后接節(jié)點(diǎn)為“向”,計(jì)入點(diǎn)入度。
節(jié)點(diǎn)度可以由數(shù)量上的差異來比較直觀地反映節(jié)點(diǎn)中心性差異,但因其并未考慮間接相連的節(jié)點(diǎn),所以這一特征更多地與詞語的使用頻率直接相關(guān),其參考價(jià)值要弱于中間度。
“一起”“一齊”的節(jié)點(diǎn)度排名在整體排名中位置較為靠前,在平均63593.8個(gè)節(jié)點(diǎn)中,“一起”的點(diǎn)入度平均排名為379,點(diǎn)出度平均排名為1640.6;“一齊”的點(diǎn)入度平均排名為303.4,點(diǎn)出度排名為1987.6。它們點(diǎn)入度、點(diǎn)出度的排名差異較大,但總體靠前。
然而從具體數(shù)值上看,“一起”點(diǎn)入度、點(diǎn)出平均值分別為446、674.6,“一齊”點(diǎn)入度、點(diǎn)出度平均值分別為114、115.6 ,它們的節(jié)點(diǎn)度均不是很高。原因主要在于:第一,整個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)度跨度很大,節(jié)點(diǎn)度最高的節(jié)點(diǎn)為“的”(不計(jì)“ROOT”節(jié)點(diǎn)),可達(dá)一萬以上,而節(jié)點(diǎn)度最低的節(jié)點(diǎn),其節(jié)點(diǎn)度為0;第二,排名位于它們之后的節(jié)點(diǎn)中,仍有大量節(jié)點(diǎn)的節(jié)點(diǎn)度與之相近。因而,從這一角度看,它們依然處于整個(gè)網(wǎng)絡(luò)里較后的位置。
接近度考察的是節(jié)點(diǎn)與其他節(jié)點(diǎn)的距離。如果一個(gè)節(jié)點(diǎn)與“其他許多點(diǎn)的距離都很短,這樣的點(diǎn)與網(wǎng)絡(luò)中許多其他點(diǎn)都‘接近’”。(陳芯瑩,劉海濤,2011)接近度也是衡量節(jié)點(diǎn)中心性的重要指標(biāo)之一。
接近度與詞頻之間沒有明顯的聯(lián)系(如圖3),詞頻很高的詞,在網(wǎng)絡(luò)中的接近度也可能會(huì)很低,詞頻極低的詞,在網(wǎng)絡(luò)中的接近度也可能會(huì)很高。按接近度的數(shù)值來看(如圖4),相較于節(jié)點(diǎn)度和中間度而言,其變化也較為平穩(wěn)。
圖3 N1內(nèi)接近度散點(diǎn)圖(按詞頻順序排列) 圖4 N1內(nèi)接近度散點(diǎn)圖(按內(nèi)接近度大小排列)
由于接近度考察的是語言網(wǎng)絡(luò)中節(jié)點(diǎn)與其他節(jié)點(diǎn)間的距離,對(duì)應(yīng)到實(shí)際語言中,反映的是一個(gè)詞語在連接其他詞語時(shí)的能力。即當(dāng)一個(gè)節(jié)點(diǎn)接近度很高時(shí),其他的詞語能夠借助相應(yīng)詞語在很短距離內(nèi)發(fā)生關(guān)聯(lián)。同時(shí)意味著,如果網(wǎng)絡(luò)中某兩個(gè)節(jié)點(diǎn)通過A節(jié)點(diǎn)能夠在S步內(nèi)連系起來,一旦“剔除”掉A節(jié)點(diǎn)后,這兩個(gè)節(jié)點(diǎn)連系步數(shù)可能會(huì)遠(yuǎn)遠(yuǎn)大于S步甚至無法連系。如:N2網(wǎng)絡(luò)中“商販”、“繞過”兩個(gè)節(jié)點(diǎn)可以直接通過“一起”相連(“和←其他←許多←商販←一起←繞過←大路←循著←秦嶺←小路←返回←了←漢中”),而刪除了“一起”之后,“商販”“路徑”之間的最短路徑發(fā)生了如圖5(右)的變化。
圖5 N2網(wǎng)絡(luò)“商販”“繞過”間的最短路徑
左:刪除“一起”前;右:刪除“一起”后
再如,N5網(wǎng)絡(luò)中“老兵←一齊←下蹲”,“老兵”“下蹲”通過“一齊”相連,而當(dāng)“一齊”被刪除之后,“老兵”便完全無法與“下蹲”相連。
表2
“一起”“一齊”的接近度數(shù)值上差異并不大,而且十分穩(wěn)定(見表2),整體來說均位于網(wǎng)絡(luò)的中間位置(最大約0.62,最低0)。因而,它們?cè)陉P(guān)聯(lián)其他詞語的能力上也并不弱。在有限規(guī)模的網(wǎng)絡(luò)中,甚至有一些詞語依賴于它們才得以連系。
在對(duì)“一起”“一齊”中心性進(jìn)行的分析中,也可以反映出兩個(gè)詞之間具有較為明顯的差異。
首先,在中間度方面,雖然“一起”“一齊”的“中介”性均不高,同屬于靠近下邊界的“一般節(jié)點(diǎn)”,但在5個(gè)網(wǎng)絡(luò)中,“一起”的中間度始終高于“一齊”,這依然能夠反映出“一起”的“中介”性強(qiáng)于“一齊”。
通過我們的觀察,一個(gè)詞語在語言網(wǎng)絡(luò)中的“中介”性越好,在具體的語言運(yùn)用中也更容易被使用,換言之,即使用頻率可能越高。(反之并不成立,如我們添加的“ROOT”節(jié)點(diǎn)在詞頻上總是位于第1名的位置,但它的中間度始終是0)那么, “中介”性更強(qiáng)的“一起”在語言中使用的頻率應(yīng)該會(huì)高于“中介”性更弱的“一齊”。實(shí)際的統(tǒng)計(jì)中也印證了這一事實(shí)。在5個(gè)網(wǎng)絡(luò)語料的詞頻及其排序中,“一起”和“一齊”名次差異很大:“一起”平均出現(xiàn)674.6次,平均名次為317.4,最高名次302,最低名次360;“一齊”平均出現(xiàn)115.6次,平均名次2017.4,最高名次1901,最低名次2110。
其次,“一起”“一齊”之間節(jié)點(diǎn)度差異也很明顯。
圖6 “一起”“一齊”的節(jié)點(diǎn)度
一方面,如圖6所示,從總體上看,“一起”的
節(jié)點(diǎn)度均大于“一齊”?!耙黄稹钡狞c(diǎn)入度、點(diǎn)出度平均值分別為446、674.6,明顯高于“一齊”的114、115.6。不過這一點(diǎn)也明顯受到詞語使用頻率的影響。一般而言,在一定規(guī)模的語料中,除去往往單獨(dú)成句的那些詞語外,一個(gè)詞語使用頻率越高,能與之前后搭配的詞語在數(shù)量上相應(yīng)地就越多,反映到詞共現(xiàn)網(wǎng)絡(luò)中,即節(jié)點(diǎn)度相應(yīng)地越高。
另一方面,“一起”點(diǎn)入度、點(diǎn)出度差異很大,而“一齊”點(diǎn)入度、點(diǎn)出度則體現(xiàn)出高度一致性。在5個(gè)網(wǎng)絡(luò)中,“一起”的點(diǎn)出度始終高于點(diǎn)入度,平均值之差高達(dá)228.6;而“一齊”的僅為1.6,且在N3、N4之中的點(diǎn)入度、點(diǎn)出度等值。由于節(jié)點(diǎn)度反映了節(jié)點(diǎn)與其鄰接節(jié)點(diǎn)的連接情況,實(shí)際上即反映了相對(duì)應(yīng)的詞語在語言中鄰接成分的情況。所以,上述差異進(jìn)一步反映出它們?cè)谡Z句中所處的位置偏好:除去位于句中的情況,“一起”更傾向于出現(xiàn)在句末而非句首;“一齊”出現(xiàn)在句首的情況與出現(xiàn)在句末的情況在數(shù)量上差異不大,不過在實(shí)際考察中發(fā)現(xiàn)“一齊”少見于句末,則事實(shí)上它更傾向于出現(xiàn)在句中。
然后,對(duì)于接近度,雖然“一起”“一齊”均位于網(wǎng)絡(luò)的中間位置,有一定的連系其他詞語的能力,差異并不大;但不論是從它們?cè)?個(gè)網(wǎng)絡(luò)中的具體數(shù)值來看(表3),還是從標(biāo)準(zhǔn)差及平均值來看(表2),“一起”的接近度都要略高于“一齊”,而且“一起”名次總體靠前,“一齊”則明顯靠后許多。
表3
而且,接近度在不同網(wǎng)絡(luò)中的排名差異也十分巨大?!耙黄稹薄耙积R”最靠前排名分別為181(N5,外接近度)、2939(N3,內(nèi)接近度),最靠后排名分別為6025(N3,外接近度)、21128(N1,內(nèi)接近度)。
因而,“一起”在語言中連系其他詞語的能力要比“一齊”更強(qiáng)一些。
總體而言,“一起”“一齊”在語言網(wǎng)絡(luò)中的中心性并不高:①雖然它們屬于“一般節(jié)點(diǎn)”,但在中間度數(shù)值上已比較接近“次邊緣節(jié)點(diǎn)”;②即使節(jié)點(diǎn)度排名較前,但在數(shù)值上仍屬于較低值;③接近度在數(shù)值上位于眾節(jié)點(diǎn)的中間位置,對(duì)于連系其他節(jié)點(diǎn)起到了一定的作用。
同時(shí),“一起”的中心性要強(qiáng)于“一齊”:在5個(gè)詞共現(xiàn)有向網(wǎng)絡(luò)中,①“一起”的中間度始終高于“一齊”;②“一起”的節(jié)點(diǎn)度始終大于“一齊”;③“一起”的接近度基本都高于“一齊”。進(jìn)一步而言,這在事實(shí)上也印證了已有研究中的結(jié)論:“一起”替換“一齊”的可替換度要高于“一齊”替換“一起”。(葛婷,2009)即由于兩詞意義相近,而“一起”的中心性,尤其是接近度又強(qiáng)于“一齊”,“一齊”可以使用的地方,“一起”往往也能使用,反之則不然。
最后,我們的分析為“一起”“一齊”的對(duì)比研究提供了更為客觀的統(tǒng)計(jì)數(shù)據(jù),但我們僅僅只是對(duì)“一起”“一齊”在語言網(wǎng)絡(luò)中的地位展開了探討,研究范圍仍然十分有限,實(shí)際上對(duì)于兩詞的對(duì)比還可以從k-鄰接、k-核心、集聚系數(shù)等其他方面展開,這將會(huì)是我們下一步展開的工作。
注釋
① 該軟件由華中師范大學(xué)文學(xué)院肖辛格先生開發(fā)。
[1]Cancho R F I , Sole R V .The Small World of Human Language[J] .Proceedings of the Royal Society of London Series B-Biological Sciences, 2001 .
[2]Freeman L C. A set of measures of centrality based on betweenness[J]. Sociometry, 1977.
[3]陳芯瑩, 劉海濤. 漢語句法網(wǎng)絡(luò)的中心節(jié)點(diǎn)研究[J]. 科學(xué)通報(bào),2011(10) .
[4]葛婷. 協(xié)同副詞“一起、一塊”的虛化與同形異構(gòu)[J]. 棗莊學(xué)院學(xué)報(bào),2009(4).
[5]葛婷. 協(xié)同副詞“一起”與“一齊”可替換度研究[J]. 合肥師范學(xué)院學(xué)報(bào),2009(2).
[6]李晨溪. 協(xié)同副詞“一起”和“一齊”辨析[J]. 現(xiàn)代語文(語言研究版),2013(7).
[7]李勝梅.現(xiàn)代漢語“一起”的義項(xiàng)和語法功能[J].浙江樹人大學(xué)學(xué)報(bào),2004(5).
[8]劉知遠(yuǎn), 孫茂松. 漢語詞同現(xiàn)網(wǎng)絡(luò)的小世界效應(yīng)和無標(biāo)度特性[J]. 中文信息學(xué)報(bào), 2007(6).
[9]劉海濤.語言網(wǎng)絡(luò):隱喻,還是利器?[J]. 浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版), 2010(12).
[10]邵洪亮. “一起”的句法語義功能及其嬗變過程[J]. 對(duì)外漢語研究,2010(00).
[11]石佩璇. 試論“一起”的產(chǎn)生和發(fā)展[J]. 湖北廣播電視大學(xué)學(xué)報(bào),2009(5).
[12]唐昱. “一起”和“共同”的辨析[J]. 長(zhǎng)春理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011(12).
[13]王仁法,徐以中. 副詞“分別”與“一起”的歧義探討[J]. 語言科學(xué),2003(4).
[14]王兆麟. “一齊”和“一起”[J]. 語文學(xué)習(xí),1979(1).
[15]葉秋生. 協(xié)同副詞“一起”、“一齊”語義選擇淺析[J].齊齊哈爾師范高等??茖W(xué)校學(xué)報(bào),2007(2).
Class No.:H146 Document Mark:A
(責(zé)任編輯:蔡雪嵐)
A Comparative Analysis of Chinese Words “一起” and “一齊” Based on Word Co-occurrence Network
Yang Jialu
(Center for Language and Language Education, Huazhong Normal University, Wuhan, Hubei 430079,China)
The Chinese words 一起 and 一齊 are two separate words and easy to confuse the meaning of the two words. People have made a comparative from different angles . Based on the medium - sized self - built corpus, the article examines the two words by means of linguistic network theory. It is found that: (1) The word 一起 and the word 一齊 located in the middle of the posterior position; (2) The centrality of the word 一起is stronger than that of 一齊 . Through comparative analysis, the article provides a more objective statistical data for the further study of the two Chinese words.
Chinese word 一起and 一齊; word co-occurrence; language network; synonyms
楊佳璐,碩士,華中師范大學(xué)語言與語言教育研究中心。
1672-6758(2017)06-0152-5
H146
A