張曉君,林勝強
(四川師范大學(xué) 邏輯與信息研究所, 四川 成都 610066)
自然語言中的歧義問題是自然語言中常見的語言現(xiàn)象,其實質(zhì)是自然語言的語義與句法的不對應(yīng)問題。自然語言中的歧義有多種類型,但最常見、最難消解的是“結(jié)構(gòu)歧義”。結(jié)構(gòu)歧義是自然語言計算機處理的巨大障礙,對其進行深入研究具有重要的意義,因此受到語言學(xué)、邏輯學(xué)、心理學(xué)和計算機科學(xué)等諸多領(lǐng)域的學(xué)者的青睞,學(xué)者們從不同視角進行了探討,并提出了諸多歧義消解方案。
對歧義問題的研究可以追溯到亞里士多德的《工具論·辨謬篇》。國外計算機學(xué)界為了解決英語中的結(jié)構(gòu)歧義,提出了多種解決方法,比如:確定性剖析算法、消移剖析算法、線圖剖析算法、超前分析策略、啟發(fā)式分析策略,等等[1]。國外邏輯學(xué)界的學(xué)者也發(fā)展出了多種自然語言邏輯理論,用于英語結(jié)構(gòu)歧義的消解,比如:蘭貝克演算、范疇類型邏輯、組合范疇語法,等等。
我國學(xué)者從多個視角使用不同方法試圖解決漢語中的不同歧義問題。例如:趙元任就對漢語中的歧義問題進行了探討[2],朱德熙研究了漢語句法里的歧義現(xiàn)象[3],馮志偉研究了中文科技術(shù)語中的結(jié)構(gòu)描述及潛在歧義[4]、探究了自然語言處理中的歧義消解方法[1],孫國俊把認知解釋機制引入了語言各層面的歧義識別和消解過程[5],于澤等探討了書面韻律信息與詞匯偏向在歧義句消解中的作用[6],吳明軍等探究了加工深度對二語代詞消解的影響[7],等等。
雖然國外學(xué)者提出了諸多歧義消解策略,但是由于這些策略基本上是針對英語等外語的歧義問題的,而漢語與英語句式迥異,這些方法不能生搬硬套地用于解決漢語歧義。加之漢語歧義種類繁多,各具特色,國內(nèi)學(xué)者的歧義消解策略還不夠成熟,而且從邏輯推演和計算的角度解讀漢語歧義的文獻更是寥寥無幾,因此有必要把漢語歧義問題的研究深入下去。本文從邏輯學(xué)的視角對現(xiàn)代漢語中常見的兩種結(jié)構(gòu)歧義進行消解。
自然語言中的歧義,可以分為詞匯歧義和結(jié)構(gòu)歧義[1]。常見的詞匯歧義就是英語單詞中的一詞多義和兼類現(xiàn)象。比如:cell,作為名詞理解時,有:“小牢房、細胞、孢子囊、支部、電池、單元、云泡、墳?zāi)埂钡群x;作不及物動詞理解時,有“住牢房”之義;作為及物動詞理解時,有“(蜜蜂)貯……于巢室”之義。不論是英語,還是漢語,結(jié)構(gòu)歧義都有多種。
本文將處理現(xiàn)代漢語中的如下兩種常見的結(jié)構(gòu)歧義句:
(1)形容詞不同管轄范圍產(chǎn)生的歧義。當一個形容詞放在多個名詞之前時,由于形容詞管轄范圍不同,就會產(chǎn)生結(jié)構(gòu)歧義。實例一“這棟樓是新學(xué)生宿舍”,第一種解讀是“這棟樓是新/學(xué)生宿舍”,第二種解讀是“這棟樓是新學(xué)生/宿舍”。
(2)兩個以上名詞構(gòu)成名詞詞組所產(chǎn)生的歧義。這種歧義是對名詞之間的限制關(guān)系的不同而產(chǎn)生的。實例二“張歡加入了東亞語言研究會”,第一種解讀是“張歡加入了東亞/語言研究會”,第二種解讀是“張歡加入了東亞語言/研究會”。
組合范疇語法(Compostional Category Grammar,簡稱CCG)認為,自然語言的毗連生成是一種函項運算,為了揭示這種運算的規(guī)律,就需要對自然語言的表達式進行分類編碼[8]。其中有些類別作為函項,而另一些類別則是函項運算的主目[9]。區(qū)分這些類別的編碼就是范疇,引入兩個毗連算子“”與“/ ”,就可以通過范疇之間的運算來刻畫自然語言的毗連生成[10]?!啊苯凶髯笈B算子,表示其論元范疇在左邊;“/ ”叫作右毗連算子,表示其論元范疇在右邊。例如,“學(xué)生”的范疇為n/n,作為函子范疇。而“宿舍”的范疇為n,作為論元范疇。因此,二者毗連后的“學(xué)生宿舍”的范疇就是n。組合范疇語法滿足“句法和語義的對應(yīng)原則”[11],而且也符合意義組合原則這個邏輯語義學(xué)的基本思想,組合范疇語法因此受到了極大的關(guān)注[12]。
組合范疇語法中的范疇傳達了兩類信息:它們刻畫了一個詞條如何同時從句法和語義兩個方面與另一個詞條進行毗連。根據(jù)組合范疇語法的思想,分析上述三類結(jié)構(gòu)歧義句所需要的詞條范疇的指派可以確立如下的詞庫:
專有名詞(比如:張三、東亞):np
普通名詞(比如:樓、學(xué)生、宿舍、語言、研究會):n
作形容詞的專有名詞(比如:東亞):np/n (CCG一詞多范疇的原則)
作形容詞的名詞(學(xué)生、語言):n/n (CCG一詞多范疇的原則)
及物動詞(比如:加入了):(nps)/np
判斷動詞(比如:是):(nps)/n
形容詞(比如:新):n/n
毗連普通名詞的形容詞(比如:新):(n/n)/n (CCG一詞多范疇的原則)
限定詞(比如:這棟、那個):np/n
需要說明的是:同一詞條在不同語境下,由于其句法作用和語義所指可能不同,則需要根據(jù)具體情況指派不同的范疇。按照組合范疇語法的詞匯主義思路,允許為同一詞條指派多個不同的范疇。本文從詞條角度來挖掘結(jié)構(gòu)歧義句的根源。
進一步說,在組合范疇語法中,可以按照詞條的范疇對應(yīng)邏輯類型,進而給詞條匹配相關(guān)的邏輯表達式以表征其邏輯語義。在上文的詞庫中,給每個詞條指派范疇和對應(yīng)的邏輯表達式,如給“張三”指派“張三′:np”。本文采取漢字右上角加一撇來表示該詞條的邏輯語義,即表征個體的邏輯常項,其他詞條可以類似處理。
下面給出生成構(gòu)造本文兩類結(jié)構(gòu)歧義句所需要的組合范疇語法規(guī)則:
其中,A、B、A/B和BA表示語言表達式的句法范疇;字母f和a表示語言表達式的邏輯語義,f(a)表示f和a的貼合運算。
根據(jù)上文的相關(guān)知識,利用組合范疇語法的推演樹,可以對現(xiàn)代漢語中的結(jié)構(gòu)歧義句進行消解。下面對前面兩個實例的結(jié)構(gòu)歧義進行消解。下文圖中的lex表示詞條。
實例一 “這棟樓是新學(xué)生宿舍”的兩種解讀的完整的推演樹分別如圖1和圖2所示。
圖1 “這棟樓是新學(xué)生宿舍”的第一種解讀“這棟樓是新/學(xué)生宿舍”的推演樹
圖2 “這棟樓是新學(xué)生宿舍”的第二種解讀“這棟樓是新學(xué)生/宿舍”的推演樹
對圖1和圖2進行對比就會發(fā)現(xiàn):(1)由于第一種解讀“這棟樓是新/學(xué)生宿舍”中“學(xué)生”與“宿舍”不是并列關(guān)系,而是修飾關(guān)系,因此“學(xué)生”被指派的是形容詞范疇n/n,而不是普通名詞的范疇n,二者毗連得到“學(xué)生宿舍”的范疇是n,“新”則可指派普通形容詞的范疇n/n;(2)第二種解讀“這棟樓是新學(xué)生/宿舍”中的“新學(xué)生”中“學(xué)生”是普通名詞,其范疇是n,“新”向右毗連“學(xué)生”而得到的“新學(xué)生”是作為形容詞來修飾“宿舍”的,因此“新學(xué)生”的范疇是n/n,故“新”的范疇是(n/n)/n。由此可見,在具體語境中,詞條的范疇是由其句法功能來決定的,即:同一詞條如果在不同語境下的語義和句法功能不同,則需要根據(jù)實際情況指派不同的范疇[注]圖1和圖2中的限定詞“這棟”,其邏輯式是比較長的帶邏輯量詞的表述,這里暫時不展開,簡化表述為:這棟′(樓′)。。
實例二 “張歡加入了東亞語言研究會”的兩種解讀的完整推演樹分別如圖3和圖4所示。
圖3 “張歡加入了東亞語言研究會”的第一種解讀“張歡加入了東亞/語言研究會” 的推演樹
圖4 “張歡加入了東亞語言研究會”的第二種解讀“張歡加入了東亞語言/研究會”的推演樹
對比圖3和圖4可以看出:在圖3中先利用A?規(guī)則對“語言”與“研究會”進行毗連,然后再次利用A?規(guī)則把得到的“語言研究會”與“東亞”進行毗連,從而得到第一種解讀“張歡加入了東亞/語言研究會”;在第一種解讀中,“語言”與“研究會”是修飾關(guān)系,而非并列關(guān)系,因此“語言”的范疇為n/n,二者毗連后得到的“語言研究會”的范疇是n,因此修飾“語言研究會”的“東亞”的范疇是np/n。在圖4中先利用A?規(guī)則對“東亞”與“語言”進行毗連,然后再次利用A?規(guī)則把得到的“東亞語言”與“研究會”進行毗連,從而得到第二種解讀“張歡加入了東亞語言/研究會”;在第二種解讀中,“東亞語言”與“研究會”是修飾關(guān)系,而非并列關(guān)系,因此“東亞語言”的范疇為np/n,而“語言”的范疇是n,故“東亞”的范疇是(np/n)/n。由此可見,同一語句可以根據(jù)實際情況,對同一詞條指派不同的范疇及對詞條進行毗連采取不同的先后順序,即可達到歧義消解的目的。
綜上所述,利用組合范疇語法的推演樹,可以對現(xiàn)代漢語中由形容詞的不同管轄范圍以及兩個以上的名詞組成的名詞短語所產(chǎn)生的這兩種結(jié)構(gòu)歧義句進行消解。結(jié)構(gòu)歧義語句可以通過對同一詞條指派不同范疇以及對推演樹中詞條毗連采取不同的先后順序,來達到歧義消解的目的。從本文結(jié)構(gòu)歧義句的消解實例可以看出:(1)如果一個語句有兩個不同的推演樹,那么此語句就有兩種不同的語義解讀;(2)如果同一詞條在不同語境下的語義和句法功能不同,則需要根據(jù)實際情況指派不同的范疇;(3)同一語句的不同推演樹中指派給同一詞條的范疇不一樣,對詞條毗連的先后順序不一樣,正是這些“不一樣”,使得我們可以對現(xiàn)代漢語中的結(jié)構(gòu)歧義句進行消解。
事實上,現(xiàn)代漢語中的結(jié)構(gòu)歧義句還有很多種,例如,由于連詞“和”的不同管轄范圍也會產(chǎn)生結(jié)構(gòu)歧義[1]。實例如:“我家里有爸爸和媽媽的同學(xué)”,第一種解讀是“我家里有爸爸,還有媽媽的同學(xué)”,連詞“和”管轄“爸爸”及“媽媽的同學(xué)”兩個并列的普通名詞,在這種解讀下,可以得出:我家里至少有兩人;第二種解讀是“我家里有既是爸爸的又是媽媽的同學(xué)”,連詞“和”管轄“爸爸的”及“媽媽的”兩個并列的形容詞,在這種解讀下,可以得出:我家里可能只有一人。利用本文的方法,也可以消解此類結(jié)構(gòu)歧義。
由于漢語語序靈活、語義復(fù)雜、各類歧義句繁多等原因,對漢語進行計算機處理任重而道遠,因此除了需要不同領(lǐng)域的學(xué)者從不同的視角加以潛心深入的研究外,還需要各領(lǐng)域的學(xué)者加強合作與交流。例如:“張三傷心地看著李四親吻自己的妻子”,請問:李四親吻的是李四的妻子呢?還是親吻的是張三的妻子?事實上,這一語句是由反身代詞“自己”指代不明而造成的歧義,對其進行指代消解,也就完成了歧義消解。如何從邏輯推演和計算的角度來消解這類歧義,限于篇幅原因,筆者將另外撰文論述。
致謝:本文得到了鄒崇理研究員悉心指導(dǎo)和耐心多次修改,作者在此致以最真誠的謝意和祝福!