肖 珊,郭婷婷
(1. 中國地質(zhì)大學(xué)(武漢) 國際教育學(xué)院,湖北 武漢 430074;2. 武漢大學(xué) 文學(xué)院,湖北 武漢 430072)
21世紀(jì)的到來是信息化社會全面發(fā)展的時代,網(wǎng)絡(luò)信息作為當(dāng)今社會極其重要的資源之一已滲透到人類生活中的方方面面,可以說人們獲取信息的途徑和手段也越來越依賴機器,借助自動化手段處理海量語言信息的社會需求則日益凸顯,如何更好更快地推動語言信息處理技術(shù)的發(fā)展是計算機和語言文字專家共同關(guān)注的焦點。
語義網(wǎng)是人工智能的體現(xiàn),它的提出是設(shè)想構(gòu)造一種能夠辨認(rèn)、識別和自動處理人類語言的智能網(wǎng)絡(luò),就是為了解決目前計算機不能理解網(wǎng)頁內(nèi)容的語義和網(wǎng)上有用信息查準(zhǔn)率較低的問題。對于我國而言,就是要利用計算機對各種漢語信息進行的一種自動化處理?!爸形男畔⒆詣踊幚砻刻岣咭徊剑o我國的科學(xué)技術(shù)、文化教育、經(jīng)濟建設(shè)、國家安全所帶來的效益,將是無法用金錢的數(shù)額來計算的[1]?!?/p>
迄今為止,雖然中文信息處理取得了不俗的成績,但是要想機器理解自然語言傳遞的信息,一個重要的前提就是要用最經(jīng)濟的模式告訴機器足夠多的語言知識,語言資源建設(shè)尤其是詞匯語義知識庫的建設(shè)應(yīng)運而生。綜觀現(xiàn)有的國內(nèi)外的語義知識庫,例如,Word Net, Frame Net,CCD,HowNet,HNC等[2],它們雖然從不同的角度對概念之間的語義關(guān)系進行了多方位的描寫,但是對于整個概念系統(tǒng)內(nèi)部的獨立的個體即概念的變體的區(qū)別性語義特征挖掘力度還不夠,語義顆粒度不夠精細(xì),因而詞網(wǎng)的結(jié)構(gòu)和應(yīng)用覆蓋面還有待進一步完善和拓寬。同時,詞匯本身的處理技術(shù)的提高也會為句處理帶來突破性的意義,為計算機的自動化“習(xí)得”起到巨大的幫助作用。
言語活動是人們傳遞和交換信息的主要手段之一,映射到詞匯系統(tǒng)上就是以“說”為代表的一系列言說動詞。
早年對言說動詞的研究是將其貫徹于其他動詞研究的過程之中,例如,在研究動詞的價、詞義辨析等時涉及,而那時有的學(xué)者研究的方式和角度很有限: 或僅舉動詞實例來說明什么是言說動詞,或只對言說動詞的上位詞如“說”等下定義;即便是從21世紀(jì)初開始對言說動詞進行專項研究的鐘守滿[3]、劉大為等學(xué)者,也并沒有對言說動詞有一個統(tǒng)一而全面的定義。我們認(rèn)為言說動詞的核心語義成分是圍繞“言說”動作行為而聯(lián)系的,基本的表現(xiàn)形式如圖1所示。
圖1 言說核心語義成分表現(xiàn)示意圖
因此可以定義言說動詞為: 說話主體用有效的語言符號表達(dá)某意圖(顯性或隱性)或向目標(biāo)對象(人或事物)傳遞某信息,從而達(dá)到某目的或某效果的一類動詞。
作為人類言語系統(tǒng)研究的重要組成部分,典型的言說動詞的語義網(wǎng)絡(luò)系統(tǒng)研究有助于從某個側(cè)面或角度來探討自然語言是如何生成和被理解的,幫助語言學(xué)家更準(zhǔn)確地進行語義結(jié)構(gòu)的形式化描寫,也可以幫助計算機學(xué)者對動詞系統(tǒng)乃至整個自然語言系統(tǒng)的計算機模擬起到啟發(fā)和推導(dǎo)作用。
從2004年起,以蕭國政教授為首的武漢大學(xué)語言與信息研究中心師生們臥薪嘗膽,開始了“基于概念特征屬性的漢語詞網(wǎng)建構(gòu)”的艱苦工程及其指向語言處理的理論探索,“詞群—詞位變體”理論[4]就是在實踐研究中探索出的主要理論成果之一。理論的提出是基于人們認(rèn)識事物的基本認(rèn)知規(guī)律之上的。
人們認(rèn)知事物時一般都會存在認(rèn)知原型, 認(rèn)知的原型事物反映到詞匯系統(tǒng)中就構(gòu)成了原型基元詞,這些基元詞所在的位置就是基本詞位(概念本體),其他的詞匯都是以這些基元詞為依托,通過對概念在不同維度上屬性取值的變化而形成的變體,基本詞位(概念本體)及其變體位共同構(gòu)成詞群。在詞群中,詞的概念義是詞群的綱,它是把所有屬于同一概念范疇的詞統(tǒng)合在一起的根本依據(jù);而詞的同一概念義在詞匯系統(tǒng)中又往往表現(xiàn)出不同的詞語形式,這些不同形式的詞語因具有詞群的群義特征而相互聯(lián)系,同時又因具有獨特的個性義而相互區(qū)別。因此“詞群—詞位變體”理論的核心思想就是: 一種語言的詞義系統(tǒng)是以基本詞位(概念本體)及其獨特義的變體構(gòu)成的同義詞群。
通過對基本詞位(概念本體)及其變體構(gòu)成進行義素分析能顯示一義跟他義的語法語義對立及聯(lián)系,進而可以描述詞語之間、詞群之間紛繁復(fù)雜的語義、語法關(guān)系。這種思想方法在很大程度上能滿足自然語言理解中對語義形式描寫的細(xì)致要求,而歸納出細(xì)致準(zhǔn)確的語言規(guī)則、組建大規(guī)模的豐富的語義知識庫能幫助機器像人腦一樣更科學(xué)更快地處理自然語言,實現(xiàn)人機合作人機對話。
“言語性”要素是言說動詞區(qū)別與其他各類動詞的根本,那么根據(jù)語義結(jié)構(gòu)中所凸顯出“言語性”的不同方面,可將言說動詞分為以下四類[5]。
? 問答類: 強調(diào)行為原因或條件。例如,詢問、征詢。
? 交互類: 強調(diào)施動者數(shù)量或形態(tài)。例如,交談、采訪。
? 客事類: 強調(diào)言語行為關(guān)系。按照強調(diào)的關(guān)系不同,又分為強調(diào)傳遞意見看法的“評價類”,例如,點評、評論;強調(diào)傳遞某情感的“情感類”,例如,道喜、唾罵;強調(diào)傳遞某信息的“告知類”,例如,通知、傳達(dá)。
? 祈使類: 強調(diào)為達(dá)到目的行為,例如,請求、勸說。
限于篇幅,本文選取以言說動詞為對象的義合網(wǎng)絡(luò)的構(gòu)建的重要部分之一——“交互類”言說動詞做個案分析。所有語料均源于《現(xiàn)代漢語詞典》[6],詞語釋義同時參考《現(xiàn)代漢語動詞大詞典》[7]。
“交互”類言說動詞是一類反映說話者(主事)與聽話者(客事)之間通過言語內(nèi)容的互動達(dá)到交流信息或交換意見、看法的言語行為動詞。它最顯著的語義特征就是交互的“雙向或多向性”,按照“交互”所指的不同,又可分為五類: (1)以交流信息、意思為目的的“交談類”;(2)以交換意見看法為目的的“討論類”;(3)以達(dá)成共識或解決問題為目的的“商量類”;(4)以側(cè)重批判和揭露對方矛盾為主要目的的“辯論類”;(5)以側(cè)重維護自我為主要目的的“爭吵類”。如表1所示。
表1 “交互”類言說動詞分類表
①這里的下標(biāo)“1、2…”代表這個詞在詞典中的義項義。下文中若有類此情況,解釋相同。
本文只探討“辯論類”言說動詞詞群的“概念本體—變體”類型,期以一斑窺全豹。
同義詞群是由基本詞位(概念本體)及其變體構(gòu)成的?!案拍畋倔w—變體”的語義關(guān)系類型按照邏輯聯(lián)系,又可分為“三種關(guān)系、四個方陣”,即“同位關(guān)系、上下位關(guān)系、鄰位關(guān)系”及關(guān)系中基本詞位及其變體所處的“同位(PS)”“上位(PU)”“下位(PD)”“鄰位(PB)”四個位置(圖2)。
以“辯論類”言說動詞同義詞群來說,它與整個“交互類”言說動詞詞群是上下位關(guān)系,而“辯論類”言說動詞又因語義側(cè)重點的不同可細(xì)分為不同的同義詞群,每一同義詞群內(nèi)部又有其基本詞位(概念本體)和變體,它們都處于或?qū)儆谶@“三種關(guān)系、四個方陣”之中。
1) 同位關(guān)系
同位關(guān)系是指詞的概念本體(X)與其語義變體(X′PS)只有詞語形式上的不同,語義內(nèi)涵完全相同,在不同句法環(huán)境下可以相互替換,概念本體與變體之間的位置不分差別。
圖2 “概念本體—變體”的語義關(guān)系類型圖
例如,“辯論”“論辯”和“辯2”都是“主事”和“客事”之間就同樣的問題或話題,持續(xù)地用一定的、相互對立的理由來說明自己對事物或問題的見解,以揭露對方的矛盾的動作行為。它們的語義解釋幾乎等義,在不同句法環(huán)境下又可互換,唯一的區(qū)別就是由于“辯2”的單音節(jié)局限而導(dǎo)致在句法語用上受到一定的限制,不能單獨使用,必須添加動補成分,例如,
① 大家都為梅森論辯/辯論時所運用的那種高明手法而向他紛紛祝賀。
② 兩個人在那里為了一點意見不統(tǒng)一而辯論/辯個不停,最后竟大打出手,實在不可思議。
圖3 “辯論”類同位變體關(guān)系圖
2) 上下位關(guān)系
上下位關(guān)系是指詞的概念本體(XPU)與其語義變體(X′PD)是處于上下位置的概念,概念本體與變體之間不僅詞語形式不同,而且變體的語義內(nèi)涵蘊含于概念本體中,是在概念本體內(nèi)涵義基礎(chǔ)上通過添加或改變不同的區(qū)別性語義特征而實現(xiàn)的。
3) 鄰位關(guān)系
上下位關(guān)系是指詞的概念本體(XPU)與其語義變體(X′PB)是處于相鄰位置的概念,概念本體與變體的語義成分有一定交叉,但變體同時又包含有其他的基本語義要素,這些語義要素是變體本身不可缺少的。這些交叉有可能是同一類詞群內(nèi)部次詞群之間言說動詞義的交叉,我們稱之為“言語內(nèi)交叉”,也可能是不同類詞群之間言說動詞義的交叉,我們稱之為“言語外交叉”。例如,同義詞群{爭議、爭論、理論2、爭辯、說嘴2}, 它們都包含【+用對立理由】 【+交換看法/意這樣的語義, 這是所有“辯論類”見】言說動詞同義詞群共有的核心語義,是它們屬于“辯論類”言說動詞同義詞群的基本條件,但是我們同時還發(fā)現(xiàn)它們有屬于其他同義詞群的一些基本語義要素,例如,“爭議、爭論”除了含有“辯論”義之外,還含有“爭執(zhí)”義即屬于前述同義詞群{爭持、爭、爭執(zhí)、爭競}中的區(qū)別性語義特征【+相持不讓】,同時還包含“討論”義,這是“討論類”言說動詞的基本語義要素之一,并且這三義并不存在側(cè)重凸顯,三者都是不可或缺、互相糅合的,加之“討論類”也是交互類言說動詞的一種,因此我們說這就屬于“言語內(nèi)交叉”;再如“爭辯”“說嘴2”也不單單是一種“辯論”,而是通過“辯論”的方式來強烈地表達(dá)自己觀點的正確,是為保護自己或他人而進行的“辯護”,含有及強調(diào)【+解釋/說明】的含義,這是“解說類”言說動詞的基本語義要素之一,因此我們說這屬于“言語外交叉”。
圖4 “辯論”類下位變體關(guān)系圖
對應(yīng)到計算機對詞匯語義的處理上,要激活某同義詞詞群中所有成員, 可以找出原型基位詞作為整個Synset的節(jié)點(ontology),其他的非原型基位詞為概念的變體,在基位詞屬性基礎(chǔ)上改變一個或幾個屬性特征即可。對于整個詞匯語義網(wǎng)絡(luò)建構(gòu)來說,首先需要語言學(xué)家確定有限集合的原型基本詞位及限定附屬語義特征,而后再根據(jù)詞匯生成的規(guī)律來告知計算機如何分解、比對及自動增減語義特征而生成不同概念變體,從而實現(xiàn)計算機處理詞語技術(shù)速度和效率上的提升。
比如計算機想要識別基本詞位“辯論”和它的一部分下位變體如“爭執(zhí)”“嚼舌”“論戰(zhàn)”“論難”,就可以在找到及確認(rèn)“辯論”這個節(jié)點之后,通過激活不同指向上的區(qū)別性語義特征,找出它們之間的聯(lián)系,如圖5所示。
本文是以“詞群—詞位”理論為核心來對漢語語義網(wǎng)中交互類言說動詞部分的同義詞群的建構(gòu)進行的一次探索。通過分析,我們可以看到以詞群中的原型基本詞位為核心,以改變各種附屬語義特征的方式,能擴展出相應(yīng)的同位、鄰位和下位變體,語義之間的相關(guān)性是聯(lián)系詞與詞之間的紐帶。這樣方法能彌補目前詞網(wǎng)結(jié)構(gòu)不嚴(yán)謹(jǐn)、語義顆粒粗糙等問題,能更好地幫助計算機對自然語言處理特別是語義識別上的實際需求。
雖然本文只是選擇動詞詞群對漢語詞匯語義網(wǎng)絡(luò)模式的建構(gòu)進行了嘗試,但是對其他詞類如名詞、形容詞甚至是虛詞詞群的語義網(wǎng)絡(luò)模式建構(gòu)有很好的啟發(fā)價值,而整個漢語詞匯語義網(wǎng)絡(luò)就是由各類詞群構(gòu)成的系統(tǒng)性的網(wǎng)絡(luò)整體。
圖5 “辯論”及其部分變體的計算機識別示意圖
[1] 許嘉璐.現(xiàn)狀和設(shè)想——試論中文信息處理與現(xiàn)代漢語研究[J].中國語文,2001(6): 2.
[2] 黃曾陽.HNC(概念層次網(wǎng)絡(luò))理論——計算機理解語言研究的新思路[M].北京: 清華大學(xué)出版社,1998: 1-9.
[3] 鐘守滿.“互向”類言語行為動詞語義認(rèn)知解釋[J].杭州師范學(xué)院學(xué)報(社會科學(xué)版),2005(3): 109-112.
[4] 蕭國政.動詞“打”本義的結(jié)構(gòu)描寫及其同義詞群建構(gòu)——一種人機共享的“詞群一詞位變體”研究初探[C]//蕭國政,姬東鴻,孫茂松主編.中文計算技術(shù)與語言問題研究——第七屆中文信息處理國際會議論文集.北京: 電子工業(yè)出版社,2007: 4-7.
[5] 蔡俊杰.現(xiàn)代漢語言說類動詞考察[D].上海: 上海師范大學(xué)碩士論文,2008.
[6] 中國社會科學(xué)院語言研究所詞典編輯室編.現(xiàn)代漢語詞典(第5版)[Z].北京: 商務(wù)印書館,2005.
[7] 林杏光,王玲玲,孫德金等編著.現(xiàn)代漢語動詞大詞典[Z].北京: 北京語言學(xué)院出版社,1994.
[8] 常穎.漢、俄語言語行為動詞語義對比研究[D].吉林: 黑龍江大學(xué)博士論文,2008.
[9] 胡憚.基于多維特征屬性描寫的現(xiàn)代漢語概念語義網(wǎng)的建構(gòu)研究[D].武漢: 武漢大學(xué)博士論文,2007.