国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多模態(tài)范疇語法和漢語部分“的”字研究

2016-10-09 06:03:16
關(guān)鍵詞:句法范疇算子

張 璐

?

多模態(tài)范疇語法和漢語部分“的”字研究

張璐

范疇語法是對自然語言信息進行可計算處理的邏輯語義體系。從20世紀70年代的蒙太古語法開始基于句法范疇和語義類型的對應來嘗試處理英語部分語段,到目前多模態(tài)范疇語法對組合范疇語法和范疇類型邏輯的結(jié)合,都是為了能夠取范疇語法體系中具有不同結(jié)構(gòu)性質(zhì)的類型邏輯系統(tǒng)的長處,以便更好地處理自然語言的句法和語義。漢語中獨有的虛化成分“的”的可計算研究正體現(xiàn)了范疇語法的發(fā)展思路。

多模態(tài)范疇語法;混合范疇類型邏輯;漢語虛化成分“的”

20世紀70年代以來,隨著蒙太古“普遍語法”思想的提出,邏輯與語言的交叉研究不斷獲得深入,從句法到語義都得到長足發(fā)展。作為這一交叉研究的基礎(chǔ),范疇語法的重要地位不得不提及。蒙太古對范疇語法與類型語義的探究是采取邏輯手段對自然語言的句法和語義進行形式化研究的起點,蒙太古的“部分語句系統(tǒng)”通過對范疇語法和類型邏輯的結(jié)合,實現(xiàn)了對自然語言句法和語義的對應推演。其后的邏輯學家對這一領(lǐng)域進行了不斷深入的發(fā)掘,作為組合范疇語法和范疇類型邏輯結(jié)合的產(chǎn)物——多模態(tài)范疇語法正是這一研究的新興分支。

“的”則是現(xiàn)代漢語中使用頻率最高的虛詞,其句法和語義表現(xiàn)都較為復雜,許多學者都曾從不同的角度對“的”進行過考察。黎錦熙可說是開現(xiàn)代漢語“的”字研究的先河,他區(qū)分

了4類不同的“的”,分別為:用于將名詞或者名代詞與另外的名詞或名代詞進行組合的特別介詞,如“太陽的光”;用于形容詞或具有形容詞功能的詞后的語尾詞,如“可愛的少女”;用于替代實體詞的連接代名詞,如“做保潔的”;以及位于句末,用于加強肯定語態(tài)的語態(tài)助詞,如“你幾時返家的”*徐陽春:《關(guān)于虛詞“的”及其相關(guān)問題研究》,上海:復旦大學,2003年。。呂叔湘認為“的”可以確認語氣以及起到聯(lián)結(jié)作用*呂叔湘:《中國文法要略》,北京:商務印書館,1942年。。王力將“的”處理為兩類,一類用作修飾語標記,另一類用作語氣標記*王力:《中國現(xiàn)代語法》,北京:商務印書館,1982年。。朱德熙將“的”作為詞語后附成分分為三類,他認為“的”的句法語義功能是隨著其所附著詞語的不同而不同*朱德熙:《說“的”》,《現(xiàn)代漢語語法研究》,北京:商務印書館,1980年,第67~103頁。?!暗摹痹诂F(xiàn)代漢語的口語及書面語中的出現(xiàn)頻率都十分之高,對其句法功能的發(fā)展變化的研究具有重要的意義。據(jù)統(tǒng)計,目前依托賓州漢語樹庫轉(zhuǎn)換的漢語組合范疇語法樹庫,按照現(xiàn)有組合范疇語法的分

析方法,“的”可以有多達181種范疇的指派,當之無愧成為范疇指派的第一名*參見陳鵬《漢語CCGBank構(gòu)建》,2016年5月13日國家社科基金重大項目《自然語言信息處理的邏輯語義學研究》結(jié)項會報告。。對“的”字結(jié)構(gòu)的深入研究無疑能夠更好地服務計算機人工智能處理漢語自然語言信息。本文采用多模態(tài)范疇語法的手段,選取漢語中能夠作為形容詞附加成分使用的一類“的”字成分,試圖保證帶有“的”字的表達式能夠獲得與不帶“的”字的表達式相同的語義分析。

一、多模態(tài)范疇語法的發(fā)展

采用形式化的辦法進行自然語言句法和語義的并行處理始于蒙太古1969年發(fā)表的《作為形式語言的英語》(EnglishasaFormalLanguage)。其中,蒙太古認為計算機人工語言與自然語言并無本質(zhì)差異的“通用語法”思想,啟發(fā)了在他之后的邏輯學家和形式語義學家將組合原則應用到自然語言研究的方方面面,采取運算和推演的方式對自然語言的句法和語義進行形式化的處理*張璐、趙曼:《邏輯語義學中的組合原則》,《重慶理工大學學報》(社會科學版)2014年第9期。。范疇語法借助符號和推演來刻畫自然語言,揭示自然語言的遞歸性,這正是當今時代計算機信息處理的要求。不同語種的語言之間有許多的共性,但也常常在細微之處存在差異,一個成熟的范疇語法理論應該能夠在把握語言共性的同時,準確刻畫不同語言的差異。這一要求啟發(fā)了眾多學者開始對范疇語法進行多模態(tài)擴展的嘗試,比較具有代表性的有斯蒂德曼(M. Steedman)、貝德里奇(J. Baldridge)、黑普(M. Hepple)、莫哈特(M. Moortgat)、莫利爾(G. Morrill)等人。

多模態(tài)范疇語法是以傳統(tǒng)范疇語法為基礎(chǔ)發(fā)展起來的版本,其主要特點是通過將傳統(tǒng)范疇語法發(fā)展的兩個方向——基于詞庫的組合范疇語法和基于規(guī)則的范疇類型邏輯結(jié)合起來,一方面保證了自然語言句法語義推演的精確性,另一方面貫徹了徹底的詞匯主義。通過在范疇類型邏輯系統(tǒng)中模擬組合范疇語法的多模態(tài)思想,為范疇語法的積算子和斜線算子添加模態(tài)下標,從而將范疇語法擴展為前提敏感的邏輯系統(tǒng),這種處理方式有助于以少量的規(guī)則來把握自然語言處理的靈活多樣性。據(jù)此構(gòu)造出的系統(tǒng)是混合的范疇類型邏輯系統(tǒng),我們稱其為多模態(tài)范疇語法。鄒崇理認為,對范疇語法進行邏輯系統(tǒng)的抽象,構(gòu)造可能世界的框架語義解釋,可以獲得多模態(tài)范疇語法。范疇語法是多模態(tài)范疇語法產(chǎn)生的基礎(chǔ)*鄒崇理:《多模態(tài)范疇邏輯研究》,《哲學研究》2006年第9期。。

多模態(tài)范疇語法兼具組合范疇語法與范疇類型邏輯的特征。首先,作為主體內(nèi)容的組合范疇語法體系是英國計算語言學家斯蒂德曼創(chuàng)立的。而在利用組合范疇語法對自然語言表達式進行研究的過程中,貝德里奇觀察到,對于語序靈活的語言來說,組合范疇語法的處理方式不夠理想。有些語言比如漢語,需要靈活的組合規(guī)則刻畫自然語言表達式中成分組合方式的多樣性;但是對于像英語這樣具有較強語法特征的語言,靈活的組合規(guī)則則是不必要的,如果在語法體系中添加這類規(guī)則,反而會造成不合語法的過度生成*Jason Baldridge, Lexically Specified Derivational Control in Combinatory Categorial Grammar, Satland: University of Edinburgh, 2002.。因此,貝德里奇通過對斜線算子增加模態(tài)下標這一方式,限制了語法規(guī)則的使用范圍及其過度的生成力,實現(xiàn)了對組合范疇語法的多模態(tài)擴充。作為范疇語法的分支,多模態(tài)組合范疇語法與范疇類型邏輯在規(guī)則上并沒有太大的差異,區(qū)別僅在于二者關(guān)注的重點不同。多模態(tài)組合范疇語法關(guān)注的是語言學的應用,而范疇類型邏輯關(guān)注的則是邏輯系統(tǒng)自身所具備的種種性質(zhì)。因此,多模態(tài)范疇語法的主體內(nèi)容就是多模態(tài)組合范疇語法。

其次,范疇類型邏輯是一種形式化的工具,以函項運算和邏輯推演的手段,對語言(包括形式語言和自然語言)進行分析。函項運算是取自代數(shù)的概念,推演則是邏輯的根本,所以,就范疇語法中的這一分支來說,在體現(xiàn)出數(shù)學、邏輯學、語言學的跨學科特征的同時,尤為強調(diào)對規(guī)則的刻畫,是一套基于規(guī)則的語言描寫體系。范疇類型邏輯的研究目的是為自然語言的句法和語義提供一套演繹的刻畫系統(tǒng),莫哈特將其中心思想描述為“形式語法即邏輯”(formal grammar is presented as a logic)*M. Moortgat, Categorial Type Logic, eds by J. van Benthem and A. ter Meulen, Handbook of Logic and Language, Amesterdam: Elsevier Science B. V., 1997, p. 96.。在多模態(tài)組合范疇語法研究的基礎(chǔ)上,我們可以向范疇類型邏輯的系統(tǒng)中引入模態(tài)算子,將范疇類型邏輯擴展為前提敏感的混合邏輯體系,獲得受限的結(jié)合公設(shè)與交換公設(shè),同時無需對通用的范疇語法規(guī)則進行增刪,由此獲得的多模態(tài)范疇語法能夠進行不同語種間語言現(xiàn)象的靈活處理,有利于我們從深層角度把握自然語言的特征和規(guī)律。因此,多模態(tài)范疇語法就是多模態(tài)組合范疇語法與范疇類型邏輯結(jié)合的產(chǎn)物。

二、多模態(tài)范疇語法的構(gòu)成

我們知道,范疇類型邏輯系統(tǒng)中包含四種不同的蘭貝克演算。貝德里奇在組合范疇語法系統(tǒng)內(nèi)嘗試以★、◇、× 以及◎作為斜線算子的基本模態(tài)下標,令帶有各種不同下標的斜線算子適用于不同的函子范疇的推演規(guī)則。斜線算子的結(jié)合和交換對應范疇類型邏輯中的系統(tǒng)分別為:帶下標★的斜線算子是最受限的,僅適用于范疇語法中最基本的函項應用規(guī)則,相當于NL系統(tǒng)(非結(jié)合非交換的蘭貝克演算);帶下標◇的斜線算子適用于組合函子B和置換算子S的函項應用規(guī)則,相當于L系統(tǒng)(蘭貝克演算);帶下標×的斜線算子允許推演中規(guī)則跨越表達式的相鄰成分,相當于NLP系統(tǒng)(交換的蘭貝克演算);帶下標◎的斜線算子適用于所有的范疇推演規(guī)則,即對應于LP系統(tǒng)(既結(jié)合又交換的蘭貝克演算)。也就是說,貝德里奇實際上是通過為斜線算子添加模態(tài)下標,將四種類型的蘭貝克演算置于統(tǒng)一的系統(tǒng)當中。

在組合范疇語法恪守詞匯主義的做法中,對函子范疇的斜線算子添加模態(tài)標記就能夠獲得不同的語法體系。那么在范疇類型邏輯恪守規(guī)則主義的做法中,我們可以通過增刪結(jié)構(gòu)公設(shè),對組合范疇語法進行多模態(tài)的模擬范疇,獲得具有不同推演能力的邏輯層級,這種做法實際上是對子結(jié)構(gòu)邏輯的發(fā)展。

傳統(tǒng)范疇類型邏輯的公理系統(tǒng)可以進行如下表述:

Ⅰ.句法部分

F∷ =A|F/F|FF|F·F|

公理和結(jié)構(gòu)公設(shè):

I:A→A等同公理

通常的冗余規(guī)則和傳遞規(guī)則:

(1)A→C/B├ ┤A·B→C├ ┤B→AC

(2)A→B,B→C├ A→C

Ⅱ.語義解釋

系統(tǒng)的框架語義學為三元框架< W, R3>:

原子公式的語義賦值為:v(p) ? W

(1)v(A·B) = {x | ?y?z[Rxyz & yv(A) &zv(B)]}

莫哈特認為多模態(tài)范疇語法系統(tǒng)作為組合范疇語法與范疇類型邏輯結(jié)合的產(chǎn)物,不是將兩種系統(tǒng)的優(yōu)勢簡單結(jié)合,作為一個混合的邏輯體系,它有自己的特點——模態(tài)算子之間的關(guān)聯(lián)(linkage),其相應的結(jié)構(gòu)規(guī)則如下*M. Moortgat, R. Oehrle, Logical Parameters and Linguistic Variation. Lecture Notes on Categorial Grammar, Fifth European Summar School in Logic, Language and Information, Lisbon, 1993.:

關(guān)聯(lián)規(guī)則

A ·jB→A ·iB

關(guān)聯(lián)規(guī)則體現(xiàn)了混合的邏輯系統(tǒng)之中,不同層級的子結(jié)構(gòu)相互之間的關(guān)系。借由這一規(guī)則,蘭貝克演算的模態(tài)算子之間能夠相互轉(zhuǎn)換,增加了推演前提的敏感性,在不增加邏輯系統(tǒng)復雜程度的基礎(chǔ)上,獲得了對邏輯系統(tǒng)的擴展,使得系統(tǒng)具備了更加充分且精確的生成能力、刻畫能力以及解釋能力。不難看出,在范疇類型邏輯中斜線算子的模態(tài)下標j可以指多模態(tài)組合范疇語法的模態(tài)標記★,而i則可以指模態(tài)標記◇。由此,對傳統(tǒng)的范疇類型邏輯通過增刪結(jié)構(gòu)公設(shè),就能夠獲得范疇類型邏輯的不同系統(tǒng),這些系統(tǒng)構(gòu)成子結(jié)構(gòu)邏輯的層級,經(jīng)由關(guān)聯(lián)規(guī)則,我們可以實現(xiàn)不同子結(jié)構(gòu)邏輯層級之間的溝通過渡,獲得更加適合處理自然語言的多模態(tài)范疇語法體系。

毗連算子相關(guān)的結(jié)構(gòu)公設(shè)有兩條:

僅保留傳統(tǒng)范疇類型邏輯公理系統(tǒng)中的等同公理、冗余規(guī)則和傳遞規(guī)則,我們得到NL系統(tǒng)(對應于帶下標★的多模態(tài)組合范疇語法);在保留上述公理和規(guī)則的基礎(chǔ)上,添加ASS規(guī)則,得到L系統(tǒng)(對應于帶下標◇多模態(tài)組合范疇語法);在保留上述公理和規(guī)則的基礎(chǔ)上,添加PER規(guī)則,得到NLP系統(tǒng)(對應于帶下標×多模態(tài)組合范疇語法);在保留上述公理和規(guī)則的基礎(chǔ)上,同時添加ASS規(guī)則和PER規(guī)則,得到LP系統(tǒng)(對應于帶下標◎多模態(tài)組合范疇語法)。

不同的邏輯系統(tǒng)在進行邏輯推演時,對于能夠參與推演的前提所具有的自由程度有不同的要求。據(jù)此,我們對傳統(tǒng)的范疇類型邏輯系統(tǒng)進行擴展,獲得多模態(tài)范疇語法的句法推演規(guī)則和框架語義解釋如下:

Ⅰ.句法部分

F∷ =A|F/iF | FiF | F ·iF | F/jF | FjF | F ·jF |

特別定義i-范疇集CATi:(這里把F/iF和FiF 和部分F ·iF提出來)

上述定義說明:1)由i-斜線算子為主聯(lián)結(jié)詞的函子范疇是i-范疇;2)A和B都是i-范疇且二者不相同,則A ·iB是i-范疇;3)若

A是i-范疇,則A ·iA是i-范疇。

公理和結(jié)構(gòu)公設(shè):

等同公理

M:A ·iAA這里ACATi

合并公設(shè)

S:A ·jBA ·iB

關(guān)聯(lián)公設(shè)

通常的冗余規(guī)則和傳遞規(guī)則:

據(jù)等同公理和冗余規(guī)則可以推出如下定理:

(4)C/iB ·iBC

(5)A·iAiCC

(6)C/jB ·jBC

(7)A·jAjCC

Ⅱ.語義解釋

1.框架限制:

2.語義解釋(對兩類斜線算子和積算子分別定義):

v(A ·iB) = {x |yz[Rixyz & yv(A) & zv(B)]}

v(A/iB) = {y |xz[Rixyz & zv(B)xv(A)]}

v(A ·jB) = {x |yz[Rjxyz & yv(A) & zv(B)]}

v(A/jB) = {y |xz[Rjxyz & zv(B)xv(A)]}

三、漢語形名結(jié)構(gòu)中的虛化成分“的”

鄒崇理等學者在范疇類型邏輯的框架下,對自然語言中的虛化成分進行了探討,“的”與英語中的系動詞be被視為具有同樣句法語義表現(xiàn)的成分*Zou Chongli, Li Kesheng, Zhang Lu, The Categorial Logic of Vacuous Components in Natural Language, eds. by Hans van Ditmarsch etc., Logic, Rationality, and Interaction, Third International Workshop LORIIII Processdings, 2010, pp. 370-381.。在漢語言學界,對“的”的英文翻譯不一而論,有“form word”以及“vacuous component”等。從其對應的翻譯就可以看出,“的”一方面具有助詞(form word)的句法功能,另一方面具備空語義成分(vacuous component)的特征,因此在現(xiàn)代語言學領(lǐng)域,我們常常將其稱為“虛化成分”。虛化成分在語言中普遍存在,比如漢語中的“的”以及一些介詞性的成分,英語中的系動詞等等。對于語言中的介詞詞組,按照傳統(tǒng)的形式化處理方法,我們可進行如下的語義刻畫:

圖1 虛化成分的形式語義解釋

算,我們就能夠得到形名結(jié)構(gòu)的語義。因此,鄒崇理認為,對于這類在句法上占據(jù)一定位置,而語義上沒有表現(xiàn)的語言成分,可以在語義運算之初就構(gòu)造一個三元范疇,令其在語義推演的開始就被消去,不必參與運算。因此,鄒崇理等人采用的做法是引入一個三元的復合范疇[A{B}C],由其中的B代表自然語言表達式中的虛化成分。通過給出其相應的意義公設(shè),能夠構(gòu)建范疇類型邏輯的系統(tǒng)LMP,這一邏輯系統(tǒng)的主要特征表現(xiàn)為一方面允許虛化成分在句法上出現(xiàn),另一方面又不必使其參與語義的推演運算過程。

顯而易見,這種處理方法是上下文自由的,也就是說,對邏輯推演的前提是不敏感的。規(guī)則的增加降低了系統(tǒng)的普遍性,能夠刻畫英語sweetgirl和漢語“可愛少女”的語法體系,卻無法順其自然地處理“可愛的少女”,這顯然不符合人們使用語言的直覺。在自然語言的實際應用中,我們需要對能夠被消去的成分進行考察,并不是所有的“的”都能被處理為虛化成分,因此,為了進一步精確的刻畫漢語中形名修飾結(jié)構(gòu)中的“的”字結(jié)構(gòu),我們需要對范疇語法進行弱上下文敏感的擴張,通過控制能夠參與推演的前提,實現(xiàn)對語言事實更精準的刻畫。

因此,基于多模態(tài)范疇語法,漢語虛化成分“的”可以被處理為恒等函項。據(jù)此能夠使表達式“可愛的”獲得與“可愛”同樣的句法范疇及其語義詞項。以“可愛的少女”作為例子:

(1) a.

也可以運用M規(guī)則直接生成“可愛少女”的推演:

b.

如果嘗試進行英漢對比,不難發(fā)現(xiàn),英語普通形名結(jié)構(gòu)與漢語中不帶“的”字的形名結(jié)構(gòu)的分析相同,比如sweetgirl具有與“可愛少女”相同的推演:

(2)

這表明,多模態(tài)范疇語法能夠揭示英漢形名結(jié)構(gòu)中的相同之處。而僅僅通過將虛化成分“的”處理為恒等函項的方式,我們又能夠揭示漢語中帶“的”的形名結(jié)構(gòu)和英語的差異。本文僅對漢語中一類形名結(jié)構(gòu)中“的”進行了處理,而語言中還有一類對應“類型函項貼合”的形名結(jié)構(gòu),比如“典型的錯誤”,涉及這類形名結(jié)構(gòu)中“的”字的處理,則需要使用多模態(tài)范疇語法中的關(guān)聯(lián)規(guī)則,此處不再過多討論。

四、結(jié) 語

漢語虛化成分“的”能夠被處理為恒等函項而進行消除,原因在于,在某些情況下,帶有“的”的自然語言表達式具有與不帶“的”的自然語言表達式十分類似的句法結(jié)構(gòu)與完全相同的語義解釋。自然語言中存在大量必須使用“的”的場合,這就促使研究者們思索如何能夠使用統(tǒng)一的手段,對句法表現(xiàn)類似的結(jié)構(gòu)進行求同并且存異的充分刻畫,以滿足當前計算機處理自然語言信息的需要。多模態(tài)范疇語法無疑是應運而生的產(chǎn)物。多模態(tài)范疇語法,作為范疇語法的新發(fā)展,將多模態(tài)組合范疇語法的前提敏感特征帶入了范疇類型邏輯,使得我們能夠借助范疇類型邏輯系統(tǒng)對自然語言現(xiàn)象進行更為準確的刻畫,多模態(tài)范疇語法在處理漢語方面有著獨到的優(yōu)勢。

ZHANG Lu, lecturer of School of Foreign Studies, China University of Mining and Technology, Xuzhou, Jiangsu, 221116.

責任編校:余沉

Multi-modal Categorial Grammar and a Study of “de” in Chinese

ZHANG Lu

Categorial Grammar is a logical system which aims at a computable approach toward natural language processing. In the 1970s, Montague Grammar was employed in the analysis of English fragments according to the correspondence between syntactic category and semantic type. From then on, Categorial Grammar has experienced rapid development. Nowadays, Multi-modal Categorial Grammar devours different systems of Categorial Type Logic, aiming at a better combination of these systems in dealing with natural language. The vacuous component “de” in Mandarin Chinese is applied to illustrate the development of Multi-modal Categorial Grammar.

Multi-modal Categorial Grammar; Hybrid Categorial Type Logic; vacuous component “de”

10.13796/j.cnki.1001-5019.2016.05.007

B81

A

1001-5019(2016)05-0048-06

教育部人文社科青年項目(14YJCZH209)

張璐,中國礦業(yè)大學外國語言文化學院講師,邏輯學博士(江蘇 徐州221116)。

猜你喜歡
句法范疇算子
批評話語分析的論辯范疇研究
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結(jié)構(gòu)與英語句法配置
正合范疇中的復形、余撓對及粘合
擬微分算子在Hp(ω)上的有界性
各向異性次Laplace算子和擬p-次Laplace算子的Picone恒等式及其應用
Clean-正合和Clean-導出范疇
一類Markov模算子半群與相應的算子值Dirichlet型刻畫
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯(lián)句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
谷城县| 盘山县| 望城县| 高雄县| 贵溪市| 门源| 公安县| 盘锦市| 拜城县| 钟祥市| 轮台县| 长丰县| 临潭县| 锦州市| 赤水市| 新巴尔虎左旗| 肥西县| 无棣县| 三江| 彩票| 和平区| 元氏县| 满城县| 运城市| 安丘市| 新乡县| 泸州市| 固始县| 霍州市| 策勒县| 老河口市| 慈溪市| 盐山县| 黄龙县| 吴川市| 晋中市| 灵山县| 巍山| 连山| 本溪| 石景山区|