唐 忠, 劉華陽(yáng), 劉珊珊, 李大舟
(沈陽(yáng)化工大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 遼寧 沈陽(yáng) 110142)
謂詞邏輯是一種數(shù)理邏輯方法,用于知識(shí)表示和推理,在計(jì)算機(jī)領(lǐng)域有著廣泛的應(yīng)用.在自然語(yǔ)言中,具有確定真值的陳述句,即命題,可以劃分為主語(yǔ)和謂語(yǔ)部分.謂詞邏輯將命題的主語(yǔ)部分表示為客體,用于表達(dá)事物,謂語(yǔ)部分表示為謂詞,表達(dá)事物的性質(zhì)、狀態(tài)以及事物之間的關(guān)系.謂詞邏輯將句子中的成分進(jìn)行細(xì)化,具有比命題邏輯更精確的表達(dá)能力.
在自然語(yǔ)言處理的語(yǔ)義分析研究過程中,也將自然語(yǔ)言轉(zhuǎn)換為謂詞公式,即轉(zhuǎn)為計(jì)算機(jī)可處理的形式[1].語(yǔ)義分析的目的是理解自然語(yǔ)言所表達(dá)的意義,而謂詞邏輯僅能表達(dá)命題中的主語(yǔ)和謂語(yǔ)部分,不能完整準(zhǔn)確地反映句子的全部語(yǔ)義,這也使得現(xiàn)有的語(yǔ)義分析技術(shù)應(yīng)用領(lǐng)域受限,只能應(yīng)用于簡(jiǎn)單結(jié)構(gòu)的語(yǔ)句中.語(yǔ)義分析技術(shù)要想得到更廣泛的應(yīng)用,謂詞公式必須能夠精確地表達(dá)句子原有的語(yǔ)義,即必須能夠表達(dá)出主語(yǔ)謂語(yǔ)以外的其他語(yǔ)法成分和復(fù)雜的句子結(jié)構(gòu).因此,必須對(duì)傳統(tǒng)的謂詞邏輯進(jìn)行擴(kuò)展.
謂詞邏輯一直保持著客體和謂詞的基本組成結(jié)構(gòu),近年來雖然有一些改進(jìn),如:文獻(xiàn)[2]給出了可以進(jìn)行集合表示和操作的謂詞lambda演算,文獻(xiàn)[3]提出了消去存在量詞及其約束變?cè)腖ambda依存組合語(yǔ)義(lambda dependency based compositional semantics,λ-DCS),但謂詞的基本結(jié)構(gòu)并沒有改變,因此,其表達(dá)能力并沒有本質(zhì)上的變化.
從語(yǔ)句到謂詞的轉(zhuǎn)換通常是基于謂詞的定義、根據(jù)句子中的語(yǔ)法成分進(jìn)行,在轉(zhuǎn)換過程中有一些特定的規(guī)則,如通用名詞一般轉(zhuǎn)換為謂詞,專有名詞一般轉(zhuǎn)換為客體,形容詞一般轉(zhuǎn)換為謂詞,等.比較經(jīng)典的轉(zhuǎn)換方法研究有:TAYAL對(duì)英語(yǔ)句子按語(yǔ)法結(jié)構(gòu)進(jìn)行分類,得出9種類型,然后給出不同類型句子的謂詞轉(zhuǎn)換規(guī)則,用于自然語(yǔ)言處理中的知識(shí)表示[4];MPAGOULI給出了動(dòng)詞、形容詞和名詞分別做謂詞時(shí),英語(yǔ)句子結(jié)構(gòu)和一元、二元謂詞之間的對(duì)應(yīng)關(guān)系[5].
在語(yǔ)義分析中,Liang給出了一種轉(zhuǎn)換的語(yǔ)法規(guī)則,可以比較容易地得到語(yǔ)句的謂詞表示,進(jìn)而利用計(jì)算機(jī)來處理[6].這也是語(yǔ)義分析中謂詞轉(zhuǎn)換的典型方法.但是由于謂詞邏輯本身表達(dá)能力的限制,現(xiàn)有的語(yǔ)義分析技術(shù)通?;赪ebQestion[7]、GeoQuery[8]、Freebase[9]、Yago[10]、Wikipedia[11]等特定的數(shù)據(jù)庫(kù).這些數(shù)據(jù)庫(kù)通常描述(實(shí)體、關(guān)系、類別、實(shí)例)或(實(shí)體、屬性、關(guān)系)等結(jié)構(gòu)化的信息,可以通過結(jié)構(gòu)的對(duì)應(yīng)關(guān)系,將自然語(yǔ)言轉(zhuǎn)換為謂詞表示.其中,實(shí)體轉(zhuǎn)換成客體,關(guān)系、屬性、類別以及實(shí)例分別轉(zhuǎn)換成一元和二元謂詞.另外,組合范疇語(yǔ)法(combinatory categorial grammar,CCG)也可以用來得到句子的邏輯形式,但所使用的謂詞來源于標(biāo)注好的語(yǔ)料庫(kù)或知識(shí)庫(kù),并且需要進(jìn)行有監(jiān)督和無(wú)監(jiān)督的訓(xùn)練,所以,只應(yīng)用于較小的知識(shí)庫(kù)領(lǐng)域.其中:文獻(xiàn)[12]利用依存分析模式給出動(dòng)詞、通用名詞、專有名詞、名詞詞組、介詞短語(yǔ)等語(yǔ)法成分的謂詞表示;類似地,文獻(xiàn)[13]也給出了語(yǔ)句中的動(dòng)詞短語(yǔ)、名詞短語(yǔ)、介詞短語(yǔ)等語(yǔ)法結(jié)構(gòu)與表示實(shí)體屬性與關(guān)系的一元和二元謂詞之間的對(duì)應(yīng)規(guī)則,從而更加準(zhǔn)確地完成從語(yǔ)句到謂詞的轉(zhuǎn)換過程.
在目前語(yǔ)義分析研究過程中,謂詞邏輯所存在的主要問題包括:
(1) 謂詞邏輯不能表示句子的狀語(yǔ)、補(bǔ)語(yǔ)等成分.如“他來了”和“他馬上來了”可以用相同的謂詞P(t)表示,這就造成謂詞所表示語(yǔ)義的不準(zhǔn)確.
(2) 客體和謂詞的轉(zhuǎn)換沒有固定的規(guī)則.例如通用名詞既可以做主語(yǔ)也可以用在謂語(yǔ)部分,因此,可以分別表示為客體和謂詞.如“貓是貓科動(dòng)物”表示為P(c),“貓科動(dòng)物是哺乳動(dòng)物”表示為B(p),“貓科動(dòng)物”在這兩個(gè)句子中分別是客體和謂詞,這會(huì)引起結(jié)構(gòu)和邏輯上的不一致.又如,不同的關(guān)系用相同的謂詞表示:Bornin(person,date)、Bornin(person,location);介詞做謂詞:in(x,UK),這都會(huì)增加謂詞定義的二義性.漢語(yǔ)與英語(yǔ)相比,語(yǔ)法結(jié)構(gòu)更靈活,謂詞和客體的轉(zhuǎn)換更不確定,更加缺乏有效的謂詞轉(zhuǎn)換方法.
(3) 一些語(yǔ)法結(jié)構(gòu)復(fù)雜的句子無(wú)法用謂詞表示.如“老師今天講的內(nèi)容很重要”用P(a)來表示,客體a代表主語(yǔ)“老師今天講的內(nèi)容”,這樣主語(yǔ)中所包含的語(yǔ)義信息細(xì)節(jié)就無(wú)法精確地表達(dá)出來.
傳統(tǒng)謂詞的以上問題,影響了語(yǔ)義表示的完整性和準(zhǔn)確性,所以基于傳統(tǒng)謂詞的語(yǔ)義分析目前只能用于較小的知識(shí)庫(kù)范圍內(nèi)和簡(jiǎn)單結(jié)構(gòu)的句子中.因此,有必要對(duì)傳統(tǒng)謂詞邏輯進(jìn)行改進(jìn)和擴(kuò)展.
本文針對(duì)謂詞邏輯在語(yǔ)義分析中存在的問題進(jìn)行擴(kuò)展.其意義在于使謂詞公式具有與漢語(yǔ)語(yǔ)句完全相同的語(yǔ)義,并提供由語(yǔ)句到謂詞的規(guī)范轉(zhuǎn)換方法,支持語(yǔ)義分析技術(shù)應(yīng)用到更加廣泛的領(lǐng)域中.
自然語(yǔ)言是一種符號(hào)系統(tǒng),用來交流和描述人們所認(rèn)知的現(xiàn)實(shí)世界.在“符號(hào)學(xué)三角形”語(yǔ)義理論中,“所指物”referent(thing)是所認(rèn)知的世界,而“概念”concept(thought)是世界中的事物在頭腦中的反映,“符號(hào)”symbol(word)是用來表達(dá)頭腦中所形成的概念思想的各種標(biāo)記形式[14].因此,語(yǔ)言盡管形式上靈活豐富、多種多樣,但本質(zhì)上是通過頭腦中對(duì)應(yīng)的概念,也就是認(rèn)知概念,來反映現(xiàn)實(shí)世界.謂詞與符號(hào)學(xué)三角形關(guān)系見圖1.
圖1 謂詞與符號(hào)學(xué)三角形Fig.1 Predicate and semiotic triangle
認(rèn)知概念所對(duì)應(yīng)的世界包含各種各樣不同的事物.事物有具體的、抽象的,簡(jiǎn)單的、復(fù)雜的,如事實(shí)、過程和事件等.每個(gè)事物都有各自的性質(zhì)、狀態(tài)、動(dòng)作、行為、類屬、組成等屬性,這些屬性還可以有不同的程度、方式和范圍等.世界中的事物是相互聯(lián)系、相互影響,同時(shí)也是不斷發(fā)展變化的.這也是自然語(yǔ)言所表達(dá)語(yǔ)義的本質(zhì).
謂詞邏輯同樣作為一種符號(hào)系統(tǒng),雖然不可能與自然語(yǔ)言完全一致,但也是要表達(dá)出語(yǔ)言中所包含的真正語(yǔ)義,即抓住語(yǔ)言所表達(dá)的本質(zhì).謂詞邏輯只要能完整準(zhǔn)確地反映現(xiàn)實(shí)世界所對(duì)應(yīng)的認(rèn)知概念,也就能實(shí)現(xiàn)與自然語(yǔ)言語(yǔ)義上的一致.
自然語(yǔ)言的語(yǔ)句是由字、詞這樣的基本符號(hào),按照一定語(yǔ)法規(guī)則組合起來的,用來表達(dá)特定的意義,描述我們對(duì)現(xiàn)實(shí)世界的認(rèn)知.
詞是漢語(yǔ)中最小的獨(dú)立運(yùn)用單位,也是最小的語(yǔ)義單位.漢語(yǔ)中的名詞、數(shù)詞、量詞(數(shù)量詞)和代詞直接或間接表示事物.動(dòng)詞、形容詞則表示事物的行為、動(dòng)作和性質(zhì)、狀態(tài).副詞用于修飾動(dòng)詞和形容詞,表示時(shí)間、范圍、程度、頻率以及肯定或者否定等意義.介詞組成介詞結(jié)構(gòu),用于修飾動(dòng)詞等,表示處所、時(shí)間、狀態(tài)、方式、原因、目的、比較對(duì)象等.其他的連詞、助詞、嘆詞、語(yǔ)氣詞和擬聲詞等分別起相應(yīng)的輔助作用.
事物及其性質(zhì)、狀態(tài)、行為等屬性是世界在我們頭腦中所形成概念中的最基本的元素,詞的作用就是符號(hào)化這些基本的認(rèn)知概念.世界上任何一個(gè)事物以及每個(gè)事物各種屬性的概念在自然語(yǔ)言中都有對(duì)應(yīng)的詞語(yǔ)表示,不同類型的概念用不同的詞類表示.
短語(yǔ)是由詞組合構(gòu)成的語(yǔ)法單位.句子是由詞或短語(yǔ)構(gòu)成的語(yǔ)言的基本運(yùn)用單位,有固定的語(yǔ)法規(guī)則,表達(dá)一個(gè)完整的意思,可以分為單句和復(fù)句.
句子主語(yǔ)表示陳述的對(duì)象.謂語(yǔ)用來陳述主語(yǔ),說明主語(yǔ)的性狀、行為等.賓語(yǔ)是動(dòng)詞性成分所涉及的人或事物.定語(yǔ)是用來修飾、限定、說明人或事物的性狀、數(shù)量、領(lǐng)屬等.狀語(yǔ)用來修飾、限制動(dòng)詞或形容詞,表示狀態(tài)、方式、時(shí)間、處所、條件、對(duì)象、肯定、否定、范圍、程度或語(yǔ)氣等.補(bǔ)語(yǔ)是動(dòng)詞或形容詞后起補(bǔ)充說明作用的成分,補(bǔ)充說明情況、結(jié)果、程度、趨向、情態(tài)、時(shí)間、處所、數(shù)量、性狀等.
句子描述現(xiàn)實(shí)世界中的事物具有什么性質(zhì)、狀態(tài)、類屬、行為等,即表示“什么人”或“什么事物”、“是什么”或“怎么樣”以及“什么程度”等.句子還描述事物之間相互影響、聯(lián)系和事物的發(fā)展、變化及其過程和因果關(guān)系.句子表達(dá)的內(nèi)容和語(yǔ)義是認(rèn)知概念中的事實(shí)、判斷和過程等.
謂詞邏輯中的基本組成元素是客體和謂詞,分別表示認(rèn)知概念中的事物及其性質(zhì)、狀態(tài)和相互關(guān)系.漢語(yǔ)中的名詞、數(shù)詞、量詞(數(shù)量詞)和代詞表示事物,在謂詞邏輯中用客體表示.動(dòng)詞、形容詞表示事物的性質(zhì)、狀態(tài)、動(dòng)作等,可以用謂詞表示.其他的連詞、助詞、語(yǔ)氣詞等詞類可以結(jié)合語(yǔ)法成分、語(yǔ)義進(jìn)行轉(zhuǎn)換.
漢語(yǔ)中修飾動(dòng)詞和形容詞的成分,在傳統(tǒng)謂詞邏輯中沒有對(duì)應(yīng)的表示元素,認(rèn)知概念中所包含的這類語(yǔ)義將無(wú)法用謂詞表示.因此,為謂詞增加“謂詞修飾”元素來表示修飾動(dòng)詞和形容詞的狀語(yǔ)、補(bǔ)語(yǔ)成分,形式如:
αP(m),或P(m)α,或α(s)P(m).
其中:α是所擴(kuò)展的謂詞修飾;α(s)是包含客體的謂詞修飾,如漢語(yǔ)中的介詞短語(yǔ).
現(xiàn)實(shí)世界中,有些事物可能是復(fù)雜的事實(shí)、過程甚至是事件,有些性狀及其修飾也比較復(fù)雜.漢語(yǔ)中復(fù)雜單句的一些語(yǔ)法成分本身就是由短語(yǔ)、小句等構(gòu)成,英語(yǔ)句子中也有多種從句形式.
在謂詞邏輯中,可以擴(kuò)展客體和謂詞的組合方式,用一個(gè)完整的謂詞公式做客體或修飾成分,來表示復(fù)雜的語(yǔ)法成分,這樣就形成了“復(fù)雜謂詞元素”.
(1) 復(fù)雜客體可以表示為
P(S(a)).
(1)
其中謂詞S(a)做主體謂詞P(x)的客體,表示復(fù)雜的主語(yǔ).
例如:
“他這么做真好”表示為βR(αP(t)),αP(t)表示復(fù)雜主語(yǔ)客體“他這么做”;
“我知道他來了”表示為K(w,P(t)),P(t)表示復(fù)雜賓語(yǔ)客體“他來了”.
(2) 復(fù)雜的定語(yǔ)可以擴(kuò)展表示為
P(a)∧Q(a).
(2)
因?yàn)槎ㄕZ(yǔ)一般表示客體的性質(zhì)、狀態(tài)等,所以復(fù)雜定語(yǔ)仍然通過謂詞的形式表示.
如“我知道他讀的書”表示為K(w,b)∧R(t,b),R(t,b)表示定語(yǔ)“他讀的書”.
(3) 復(fù)雜的謂詞修飾可以擴(kuò)展表示為
α(R(s))P(m).
(3)
其中以謂詞R(s)做修飾成分α的客體,表示復(fù)雜的狀語(yǔ).復(fù)雜補(bǔ)語(yǔ)類似.
“我回來的時(shí)候他剛走”表示為α(R(w))βP(t),α(R(w))表示時(shí)間狀語(yǔ)“我回來的時(shí)候”.
“他說得大家都笑了”表示為S(t)α(P(e)),α(P(e))表示復(fù)雜補(bǔ)語(yǔ)“得大家都笑了”.
擴(kuò)展后的謂詞,仍然可以轉(zhuǎn)換成為傳統(tǒng)謂詞公式,與以前的公式兼容.
(1) 復(fù)雜客體的變換.以謂詞做客體的復(fù)雜謂詞,可以轉(zhuǎn)換成傳統(tǒng)謂詞中的客體.
P(Q(x))?P(x′).
(4)
(2) 復(fù)雜定語(yǔ)的變換.復(fù)雜定語(yǔ)可以與所修飾的客體合并,變換公式為
K(a,b)∧R(t,b)?K(a,b′).
(5)
(3) 謂詞修飾的變換.謂詞修飾可以與所修飾的動(dòng)詞形容詞合并,共同作為謂詞.
α(c)P(x)?P′(x).
(6)
在認(rèn)知概念中,事物與其性狀行為等屬性以及修飾成分有固有聯(lián)系.一個(gè)性質(zhì)或動(dòng)作一定有其關(guān)聯(lián)的事物,一個(gè)修飾成分也有其固有的修飾對(duì)象.與之對(duì)應(yīng),在謂詞邏輯中,客體、謂詞和謂詞修飾成分也是以一定規(guī)則相互依存,不能單獨(dú)孤立存在.
自然語(yǔ)言為了避免表達(dá)過于冗余繁瑣,常省略一些人們熟知或次要的成分和內(nèi)容.因此,自然語(yǔ)言轉(zhuǎn)換成謂詞時(shí),需要根據(jù)上下文和認(rèn)知概念中的語(yǔ)義恢復(fù)和補(bǔ)充所省略的內(nèi)容,與認(rèn)知概念保持語(yǔ)義上的一致.
與認(rèn)知概念對(duì)應(yīng),在完整的句子中,名詞,即事物,要有性狀、行為、屬性或與其他事物的聯(lián)系;動(dòng)詞要有動(dòng)作的發(fā)出者、承受者;形容詞、副詞、介詞短語(yǔ)等要確定其修飾對(duì)象.句子的語(yǔ)法成分和復(fù)句分句之間也有固定的組合關(guān)系.在漢語(yǔ)句子里具有固定關(guān)聯(lián)的詞語(yǔ)和成分,如果有省略要先將其補(bǔ)充完整,然后再進(jìn)行轉(zhuǎn)換,這樣才可以準(zhǔn)確地構(gòu)成謂詞公式.
如動(dòng)詞短語(yǔ)做句子語(yǔ)法成分時(shí)要補(bǔ)充對(duì)應(yīng)的主語(yǔ),以構(gòu)成完整的謂詞.“騎車很危險(xiǎn)”的完整語(yǔ)義是“(人)騎車很危險(xiǎn)”,謂詞表示為αD(R(m,b)),其中:αD(x)表示“x很危險(xiǎn)”,R(m,b)表示“人騎車”.不補(bǔ)充“騎車”短語(yǔ)的主語(yǔ),對(duì)應(yīng)的謂詞不適合公式;而如果僅以“騎車”做主語(yǔ),又會(huì)丟失部分語(yǔ)義.
謂詞擴(kuò)展后,漢語(yǔ)語(yǔ)句到謂詞公式的基本轉(zhuǎn)換方法和步驟:
(1) 首先根據(jù)認(rèn)知概念,將漢語(yǔ)詞類轉(zhuǎn)換成對(duì)應(yīng)的謂詞組成元素;
(2) 再根據(jù)句子的語(yǔ)法結(jié)構(gòu)和語(yǔ)義關(guān)系,建立謂詞元素間的組合關(guān)系;
(3) 最后構(gòu)成整個(gè)句子的謂詞公式.
采用的轉(zhuǎn)換方法是將句子的基本語(yǔ)義單位和整體結(jié)構(gòu)對(duì)應(yīng)到謂詞公式,這樣可以保證所得到的謂詞公式語(yǔ)義上的完整性和準(zhǔn)確性.
漢語(yǔ)句子中,每種語(yǔ)法成分都可以由多種詞類和短語(yǔ)構(gòu)成,一種詞類或短語(yǔ)又可以充當(dāng)多種不同的成分,語(yǔ)法成分和詞類之間沒有對(duì)應(yīng)關(guān)系,所以要根據(jù)詞性、語(yǔ)法結(jié)構(gòu)和語(yǔ)義完成對(duì)應(yīng)的轉(zhuǎn)換.
(1) 主語(yǔ)和賓語(yǔ):做主語(yǔ)和賓語(yǔ)的名詞和名詞性詞組(包括名詞性聯(lián)合詞組、偏正詞組、“的”字詞組、“所”字詞組、主謂詞組等)代表事物,代詞、數(shù)詞、數(shù)量偏正詞組間接代表事物,時(shí)間方位名詞是特定的事物:其都可以轉(zhuǎn)換成為謂詞公式中的客體.動(dòng)詞、形容詞及其詞組則要補(bǔ)充隱含的主語(yǔ),然后與小句一樣,轉(zhuǎn)換成為完整的謂詞公式做客體.
賓語(yǔ)包括受事、施事、結(jié)果、工具、處所、目的、原因、存現(xiàn)和說明等類型,轉(zhuǎn)換謂詞時(shí)要根據(jù)語(yǔ)義進(jìn)行變換,否則會(huì)引起語(yǔ)義錯(cuò)誤.如“我們吃食堂”中“食堂”是處所賓語(yǔ),句子的實(shí)際語(yǔ)義是“我們?cè)谑程贸浴?對(duì)應(yīng)的謂詞是:β(s)E(w),“s”(食堂)做謂詞修飾.
(2) 謂語(yǔ):動(dòng)詞和形容詞做謂語(yǔ)時(shí),直接轉(zhuǎn)換成為謂詞.名詞做謂語(yǔ),表示的是主語(yǔ)的屬性值,實(shí)際是一個(gè)判斷句,要根據(jù)語(yǔ)義先變?yōu)榕袛嗑湓俎D(zhuǎn)換.如“今天星期一”的實(shí)際語(yǔ)義是“今天是星期一”.主謂謂語(yǔ)先根據(jù)語(yǔ)義確定大小主語(yǔ)間的領(lǐng)屬和支配關(guān)系之后再轉(zhuǎn)換,如“他身體好”先變換為“他的身體好”.受事關(guān)系的主語(yǔ)謂語(yǔ),即“被動(dòng)句”,要在轉(zhuǎn)換謂詞前先進(jìn)行結(jié)構(gòu)的變換,否則得到的謂詞公式會(huì)有語(yǔ)義錯(cuò)誤,如“玻璃擦干凈了”.
(3) 定語(yǔ):除了副詞以外的所有實(shí)詞和短語(yǔ)都能做定語(yǔ).在轉(zhuǎn)換時(shí),根據(jù)定語(yǔ)所限定的數(shù)量、時(shí)間、處所、領(lǐng)屬等屬性,或描寫的性質(zhì)、狀態(tài)、特征、用途、質(zhì)料、職業(yè)等方面的語(yǔ)義,對(duì)不同詞類的定語(yǔ)進(jìn)行轉(zhuǎn)換.多數(shù)定語(yǔ)轉(zhuǎn)換為謂詞.
(4) 狀語(yǔ):副詞、能愿動(dòng)詞、一般動(dòng)詞、形容詞、代詞、方位詞、時(shí)間名詞、一般名詞、方位詞組、介詞詞組、比況詞組等可以做不必帶“地”的狀語(yǔ),而數(shù)量偏正詞組、偏正、聯(lián)合、動(dòng)賓、主謂、謂補(bǔ)、比況等詞組可做必須帶“地”的狀語(yǔ).狀語(yǔ)也有許多類型,同時(shí)狀語(yǔ)成分在使用時(shí)也有許多省略,在轉(zhuǎn)換時(shí)需要先根據(jù)語(yǔ)義補(bǔ)充缺失了的成分,然后再轉(zhuǎn)換.如“我們北京見”,“北京”做地點(diǎn)狀語(yǔ),實(shí)際是“我們?cè)诒本┮姟?
(5) 補(bǔ)語(yǔ):動(dòng)詞、形容詞、副詞“很”和“極”、介詞結(jié)構(gòu)、動(dòng)量詞組和由動(dòng)詞、形容詞組成的詞組都能做補(bǔ)語(yǔ).漢語(yǔ)的補(bǔ)語(yǔ)成分也非常靈活,在轉(zhuǎn)換時(shí)也要結(jié)合語(yǔ)義進(jìn)行分析.如“人嚇跑了”是動(dòng)詞做補(bǔ)語(yǔ)而非聯(lián)動(dòng)謂語(yǔ),“我們談了十分鐘”是時(shí)間名詞做補(bǔ)語(yǔ)而非賓語(yǔ).
《實(shí)用現(xiàn)代漢語(yǔ)教程》[15]一書全面詳細(xì)地論述和分析了漢語(yǔ)的詞法和語(yǔ)法結(jié)構(gòu),有對(duì)應(yīng)的實(shí)例和練習(xí),包括各種形式的詞類、短語(yǔ)、語(yǔ)法成分和句型,比起一般的知識(shí)庫(kù)或標(biāo)注語(yǔ)料中的句子有更全面的語(yǔ)法覆蓋性.使用該書中的語(yǔ)句作為分析實(shí)例可以更好地驗(yàn)證擴(kuò)展謂詞的表達(dá)能力.假設(shè)給定的漢語(yǔ)句子可以正確地分詞、確定詞性,并可以得出句子正確的語(yǔ)法結(jié)構(gòu)及語(yǔ)義關(guān)系,在這基礎(chǔ)上,根據(jù)語(yǔ)言中所反映的認(rèn)知概念,分別使用傳統(tǒng)的謂詞表示方法和擴(kuò)展謂詞方法,將句子轉(zhuǎn)換成謂詞公式,驗(yàn)證比較其轉(zhuǎn)換能力及語(yǔ)義的完整性和準(zhǔn)確性.
在驗(yàn)證實(shí)驗(yàn)中,首先對(duì)文獻(xiàn)[15]中由各種詞類和語(yǔ)法結(jié)構(gòu)所構(gòu)成的主語(yǔ)、謂語(yǔ)、賓語(yǔ)、定語(yǔ)、狀語(yǔ)、補(bǔ)語(yǔ)例句進(jìn)行謂詞轉(zhuǎn)換,以驗(yàn)證擴(kuò)展后謂詞對(duì)不同語(yǔ)法成分的轉(zhuǎn)換能力.例句的數(shù)量分別為30、48、49、26、58、46個(gè).然后分析了296個(gè)經(jīng)典綜合例句的謂詞轉(zhuǎn)換.
用轉(zhuǎn)換率來評(píng)價(jià)謂詞轉(zhuǎn)換結(jié)果,即:轉(zhuǎn)換率=正確轉(zhuǎn)換的語(yǔ)法成分個(gè)數(shù)/句子中的語(yǔ)法成分總數(shù).
例如:句子“他散步”的語(yǔ)法成分包括主語(yǔ)和謂語(yǔ),用謂詞表示為W(h),詞語(yǔ)和語(yǔ)法成分都轉(zhuǎn)換為對(duì)應(yīng)的謂詞元素,語(yǔ)義保持不變.轉(zhuǎn)換率為100%.
而句子“他在公園散步”,傳統(tǒng)謂詞仍然表示為W(h),狀語(yǔ)成分無(wú)法表示,轉(zhuǎn)換率為2/3=67%.只考慮狀語(yǔ)成分時(shí),轉(zhuǎn)換率為0.而利用擴(kuò)展謂詞可以把句子表示為α(p)W(h),三個(gè)語(yǔ)法成分都可以表示,并保持了原來句子的語(yǔ)義,轉(zhuǎn)換率為100%.
句子“我們吃食堂”,僅考慮語(yǔ)法結(jié)構(gòu)時(shí)謂詞表示為E(w,s).此時(shí)賓語(yǔ)的語(yǔ)義不正確,所以轉(zhuǎn)換率為67%.如果考慮賓語(yǔ)的真實(shí)語(yǔ)義,“食堂”作為處所,謂詞表示為β(s)E(w),則轉(zhuǎn)換率為100%.
通過實(shí)驗(yàn)驗(yàn)證得出:利用傳統(tǒng)謂詞進(jìn)行表示時(shí),不同形式主語(yǔ)、謂語(yǔ)、賓語(yǔ)、定語(yǔ)、狀語(yǔ)和補(bǔ)語(yǔ)的轉(zhuǎn)換率分別為56%、61%、55%、77%、0和0,狀語(yǔ)和補(bǔ)語(yǔ)以及短語(yǔ)、小句充當(dāng)?shù)恼Z(yǔ)法成分無(wú)法表示,語(yǔ)義上也有很多不對(duì)應(yīng)的情況.而利用擴(kuò)展謂詞進(jìn)行表示,當(dāng)僅通過詞性和語(yǔ)法規(guī)則進(jìn)行轉(zhuǎn)換時(shí),總的轉(zhuǎn)換率約為85%,其中不同形式主語(yǔ)、謂語(yǔ)、賓語(yǔ)、定語(yǔ)、狀語(yǔ)和補(bǔ)語(yǔ)的轉(zhuǎn)換率分別為82%、81%、93%、88%、77%和89%.而考慮了語(yǔ)義后總的轉(zhuǎn)換率約為97%,各語(yǔ)法成分的轉(zhuǎn)換率都有明顯的提高,謂語(yǔ)和定語(yǔ)的轉(zhuǎn)換率可以達(dá)到100%,其他成分的轉(zhuǎn)化率也都在95%以上.
通過實(shí)例分析可以看出,傳統(tǒng)謂詞經(jīng)過擴(kuò)展后,語(yǔ)義的表達(dá)能力有了大幅的提高,可以正確表示狀語(yǔ)、補(bǔ)語(yǔ)等語(yǔ)法成分和復(fù)雜句子結(jié)構(gòu),謂詞公式中各種元素的構(gòu)成也比較規(guī)范,解決了前文中提到的傳統(tǒng)謂詞中所存在的問題.
擴(kuò)展后,謂詞邏輯的組成元素與漢語(yǔ)中最基本的語(yǔ)法單位對(duì)應(yīng),其不同的組合方式可以表示漢語(yǔ)所有的語(yǔ)法成分和句型結(jié)構(gòu),并且通過認(rèn)知概念與漢語(yǔ)語(yǔ)義保持一致.所以擴(kuò)展的謂詞邏輯能夠完整準(zhǔn)確地反映漢語(yǔ)句子的內(nèi)在含義,并可以表示復(fù)雜的漢語(yǔ)語(yǔ)句.同時(shí),擴(kuò)展謂詞還可以與傳統(tǒng)的謂詞公式兼容,其轉(zhuǎn)換方法也可以應(yīng)用到英語(yǔ)等其他語(yǔ)言當(dāng)中.
然而與自然語(yǔ)言相比,謂詞的表達(dá)能力畢竟有限,一些復(fù)雜的語(yǔ)言結(jié)構(gòu)還是難以表示,成語(yǔ)、修辭、主觀感覺和情緒都不能準(zhǔn)確表達(dá).例如:“平平淡淡,隨遇而安是一種生活方式”,這句話的主語(yǔ)就難以用謂詞進(jìn)一步細(xì)化表示,只能用一個(gè)客體來表示,在轉(zhuǎn)換后的謂詞公式中就失去了原有的語(yǔ)義.
再有,在轉(zhuǎn)換的過程中,要準(zhǔn)確地確定漢語(yǔ)句子的語(yǔ)法結(jié)構(gòu),僅僅通過分析句子中的詞語(yǔ)和語(yǔ)法規(guī)則是不夠的,還需要借助詞語(yǔ)的語(yǔ)義.
有些語(yǔ)法成分,如賓語(yǔ)和狀語(yǔ),有不同的類型和含義,如“挖坑”是結(jié)果賓語(yǔ),“發(fā)展地看”是方式狀語(yǔ),必須通過語(yǔ)義確定后再進(jìn)行轉(zhuǎn)換.還有些語(yǔ)法結(jié)構(gòu)也需要通過語(yǔ)義才能確定,如“門口有兩個(gè)孩子”和“小李有兩個(gè)孩子”有相同的詞類組合,卻是不同的句型結(jié)構(gòu),對(duì)應(yīng)的謂詞公式也不一樣.因此,在根據(jù)詞語(yǔ)詞性確定語(yǔ)法成分和結(jié)構(gòu)有歧義的情況下,需要通過語(yǔ)義才能確定詞語(yǔ)之間的相互關(guān)系,正確確定句子結(jié)構(gòu),從而最終得到完整準(zhǔn)確的謂詞表示.
針對(duì)謂詞公式有限表達(dá)能力所產(chǎn)生的語(yǔ)義分析研究過程中的問題,依據(jù)“符號(hào)學(xué)三角形”理論,以現(xiàn)實(shí)世界在頭腦中的概念為聯(lián)系的紐帶,基于認(rèn)知概念對(duì)傳統(tǒng)謂詞進(jìn)行擴(kuò)展,實(shí)現(xiàn)了漢語(yǔ)與謂詞邏輯在組成元素和結(jié)構(gòu)上的對(duì)應(yīng)和轉(zhuǎn)換.主要研究成果包括:(1) 在謂詞邏輯中增加了表示狀語(yǔ)和補(bǔ)語(yǔ)的組成元素,增加了能夠表示由短語(yǔ)和小句做語(yǔ)法成分的復(fù)雜元素;(2) 規(guī)范了漢語(yǔ)詞類、語(yǔ)法成分與謂詞表示元素之間的對(duì)應(yīng)關(guān)系.
對(duì)各種語(yǔ)法類型漢語(yǔ)句子的語(yǔ)義分析結(jié)果表明,謂詞公式的語(yǔ)義表達(dá)能力有了大幅度的提高,可以更加完整精確地反映自然語(yǔ)言所表達(dá)的事物及其性狀、行為屬性的概念和事實(shí),保證了與漢語(yǔ)句子語(yǔ)義上的一致性.這就使語(yǔ)義分析的邏輯結(jié)果具有更加全面和準(zhǔn)確的語(yǔ)義,同時(shí)不再局限于較小范圍的結(jié)構(gòu)化知識(shí)庫(kù)和標(biāo)注語(yǔ)料,可以應(yīng)用到更廣泛的領(lǐng)域當(dāng)中,解決了當(dāng)前語(yǔ)義分析面臨的問題.
然而,由于漢語(yǔ)語(yǔ)法的靈活性,為保證漢語(yǔ)語(yǔ)句能夠正確轉(zhuǎn)換為謂詞公式,必須結(jié)合詞語(yǔ)的具體語(yǔ)義來確定句子的語(yǔ)法結(jié)構(gòu)和語(yǔ)義關(guān)系.僅僅通過詞語(yǔ)本身及其詞性,在轉(zhuǎn)換過程中會(huì)產(chǎn)生歧義,得到錯(cuò)誤的謂詞表示.如何利用計(jì)算機(jī)通過詞語(yǔ)的語(yǔ)義知識(shí)和語(yǔ)法規(guī)則,來確定語(yǔ)句的語(yǔ)法結(jié)構(gòu),并用相應(yīng)的謂詞表示它的準(zhǔn)確語(yǔ)義,是下一步在擴(kuò)展謂詞研究基礎(chǔ)上的重要工作.