国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

組合范疇語法與范疇類型邏輯的分析與比較*

2015-05-25 00:33:13姚從軍
關(guān)鍵詞:斜線句法范疇

姚從軍

(1.湖南科技學(xué)院思政部,湖南永州425199;2.中國社會(huì)科學(xué)院哲學(xué)所,北京100732)

組合范疇語法與范疇類型邏輯的分析與比較*

姚從軍

(1.湖南科技學(xué)院思政部,湖南永州425199;2.中國社會(huì)科學(xué)院哲學(xué)所,北京100732)

范疇語法的最早形式是AB-演算,目前已發(fā)展成為一系列相互聯(lián)系的形式系統(tǒng),它們把句法分析和語義分析視為基于類型的推理。范疇語法的兩個(gè)最完善的分支是基于邏輯傳統(tǒng)的范疇類型邏輯和基于組合傳統(tǒng)的組合范疇語法,二者聯(lián)系緊密,差異也明顯,前者主要關(guān)心不同邏輯算子對語言的適用性和邏輯系統(tǒng)的證明論性質(zhì),認(rèn)為生成能力不具有主要的理論意義,在計(jì)算應(yīng)用中沒有價(jià)值;后者更多集中在獲得低的自動(dòng)機(jī)理論能力和良好計(jì)算性質(zhì)的語言表達(dá)系統(tǒng)。

范疇語法;范疇類型邏輯;組合范疇語法;計(jì)算;生成能力

一、引 言

范疇語法把自然語言詞類用基本范疇s、np,以及由s和np生成的復(fù)合范疇(函項(xiàng)范疇)表示出來。如果把s和np之外的語言單位都看成是函項(xiàng),把與函項(xiàng)結(jié)合生成新結(jié)構(gòu)的語言單位看成該函項(xiàng)的論元,那么函項(xiàng)的值便是結(jié)合而得的那個(gè)新結(jié)構(gòu)。任何一個(gè)語言單位的語法特征都可以通過這些范疇表示出來。這是一種詞匯主義做法,在計(jì)算語言學(xué)中,詞匯主義的杰出代表是范疇語法。①馮志偉.范疇語法[J].語言文字應(yīng)用,2011,(3).20世紀(jì)50年代,機(jī)器翻譯理論的先驅(qū)Bar-Hillel注意到范疇語法這一邏輯工具,認(rèn)為它可以大大推動(dòng)自然語言的信息化進(jìn)程,并在上世紀(jì)60年代初證明了范疇語法弱等價(jià)于上下文自由文法。然而,Chomsky指出,上下文自由文法不足以刻畫自然語言。如何擴(kuò)展范疇語法,使其能夠處理自然語言中存在的不連續(xù)結(jié)構(gòu)、交叉依存等上下文敏感現(xiàn)象,一直是推動(dòng)范疇理論發(fā)展的一個(gè)內(nèi)在動(dòng)力。

范疇語法的上下文敏感擴(kuò)張大致可分為兩支。一個(gè)是基于推演系統(tǒng)的偏邏輯方向,主要關(guān)注邏輯系統(tǒng)的構(gòu)造和邏輯系統(tǒng)性質(zhì)的討論,以范疇類型邏輯(CTL)為主要代表;另一個(gè)是基于特定規(guī)則的偏語言學(xué)方向,更加關(guān)注語言事實(shí)的需求,對于邏輯理論僅出于一種實(shí)用主義的需要,夠用即可,以組合范疇語法(CCG)為最突出代表。范疇類型邏輯(CTL)注重理論層面的邏輯構(gòu)造、系統(tǒng)完善,組合范疇語法(CCG)強(qiáng)調(diào)語言事實(shí)的形式化和生成。

組合范疇語法的優(yōu)勢在信息處理上:它在句法和語義之間有一個(gè)非常透明的接口,每個(gè)詞條的語義表達(dá)式和句法范疇都存放在詞庫的詞條上;它所表現(xiàn)的現(xiàn)象比詞匯功能語法、中心語驅(qū)動(dòng)語法等要深,可以更快地評(píng)價(jià)語句中的語詞是否有依存關(guān)系、謂詞—論元關(guān)系等;CCG分析器在分析速度和準(zhǔn)確度上都占優(yōu)勢?!?009年在約翰普金斯大學(xué)舉行的夏季研討班上,研究者采用優(yōu)化的句法分析算法,使CCG句法分析在維基百科語料上達(dá)到每秒超過100句的分析速度,且抽樣顯示,其分析精度并沒有明顯損失,說明CCG可以用來進(jìn)行工業(yè)規(guī)模的句法分析?!雹谒螐?黃昌寧,揭春雨.中文CCG樹庫的構(gòu)建[J].中文信息學(xué)報(bào),2012,(3).組合范疇語法目前已成為計(jì)算機(jī)對自然語言進(jìn)行信息處理的理想工具。當(dāng)今,組合范疇語法不斷地發(fā)展并不斷地應(yīng)用于新的自然語言分析中,這必將大大促進(jìn)計(jì)算機(jī)信息處理乃至大數(shù)據(jù)云計(jì)算的發(fā)展。

二、組合范疇語法

組合范疇語法起源于純范疇語法(AB-演算)。AB-演算包括范疇和規(guī)則兩個(gè)組成部分。范疇分為原子范疇和復(fù)合范疇(函項(xiàng)范疇),復(fù)合范疇編碼了運(yùn)算針對的論元范疇、運(yùn)算后的結(jié)果范疇以及運(yùn)算的方向。比如,漢語及物動(dòng)詞范疇(s p)/np表明它在右邊搜索一個(gè)名詞短語(右斜線和范疇np),然后在左邊搜索另一個(gè)名詞短語(左斜線和范疇np),吸收了這兩個(gè)論元后,生成一個(gè)語句(s)。AB-演算使用兩條對于方向敏感的函項(xiàng)應(yīng)用規(guī)則對范疇進(jìn)行組合,第一條規(guī)則是向前應(yīng)用:X/Y Y?X。簡言之,如果一個(gè)范疇為X/Y的詞串ωa直接位于范疇為Y的詞串ωb的左邊,那么詞串ωa+ωb的范疇為X。向后應(yīng)用規(guī)則恰好是向前應(yīng)用規(guī)則的逆規(guī)則:Y XY?X。AB-演算的局限性導(dǎo)致了它的擴(kuò)展,包括基于規(guī)則和基于邏輯的兩種擴(kuò)展方式,組合范疇語法屬于前者。在20世紀(jì)80年代,Ades、Jacobson、Steedman、zabolsci等人提議基于組合邏輯的組合子定義句法規(guī)則。組合子是組合邏輯用來定義λ -演算的算子,包括B、T和S,如(1)所示。三個(gè)組合子投射在句法上就是三種句法規(guī)則:復(fù)合規(guī)則、類型提升規(guī)則和置換規(guī)則,把這些規(guī)則增加到AB-演算上,得到組合范疇語法CCG。

(1)a.Bfg≡λx.f(gx);b.Tx≡λf.fx;c.Sfg≡λx.fx(gx)

CCG為滿足計(jì)算機(jī)對自然語言的信息處理需求而誕生,自然語言中的大量語義照應(yīng)和不連續(xù)現(xiàn)象是各種形式語法面臨的棘手問題。為此,轉(zhuǎn)換語法提出了深層結(jié)構(gòu)和轉(zhuǎn)換等概念,而CCG不假設(shè)語言有表層和深層等多個(gè)層級(jí),把語言看作是一個(gè)只包含表層的單層結(jié)構(gòu)。在CCG中,自然語言的句法毗連和語義組合從詞條出發(fā),在表層同步進(jìn)行,想解決這些難題,只能在詞庫和范疇運(yùn)算規(guī)則上找出路。組合范疇語法CCG側(cè)重于擴(kuò)大詞庫的信息承載量,而范疇類型邏輯CTL側(cè)重于增加范疇運(yùn)算的規(guī)則。比較而言,CTL雖然也把語言看作是一個(gè)只包含表層的單層結(jié)構(gòu),但是在非連續(xù)處引入了假設(shè),使用了假設(shè)推理,說明CTL帶有深層結(jié)構(gòu)的痕跡;CCG沒有假設(shè)推理,更加徹底地堅(jiān)持了語言的單層結(jié)構(gòu)性。

CCG是一種徹底的詞匯主義語法理論,CCG詞庫的詞條記錄了豐富的句法和語義信息,包括自然語言的語音、句法范疇和語義。CCG把自然語言的生成規(guī)則凝縮在詞條的范疇構(gòu)造上,比如,可以通過詞條“愛”的范疇(2)來體現(xiàn)短語結(jié)構(gòu)語法的三條生成規(guī)則(3)的內(nèi)容。從某種意義上說,(2)的根源是(3)。

(2) 愛|-(s p)/np; (3) S→NP VP;VP→TV NP;TV→{愛,喜歡…}

CCG的詞條不僅包括刻畫語詞的句法行為的句法范疇,還包括語詞的形式語義。比如,CCG給主語控制動(dòng)詞“答應(yīng)”指派詞條“((s p)/(s p))/np:λx.λp.λy.答應(yīng)′(p(ana′y)xy)”,給賓語控制動(dòng)詞“說服”指派詞條“((s p)/(s p))/np:λx.λp.λy.說服′(p(ana′x)xy)”,兩種動(dòng)詞的句法范疇相同,無法在句法上加以區(qū)分,CCG使用語義表達(dá)式將兩種動(dòng)詞的含義準(zhǔn)確地區(qū)分開來。再比如,CCG給“喜歡”等及物動(dòng)詞增加了一個(gè)照應(yīng)詞條“(s p)/np:λg.λy.喜歡′(ana′y)y”,用來處理以反身代詞為賓語的語句,從語義上很好處理了反身代詞的照應(yīng)問題。①姚從軍.組合范疇語法CCG|與漢語謂詞缺失現(xiàn)象的處理[J].安徽大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2014,(4).這樣,范疇語法通過擴(kuò)大詞庫的信息量很好地處理了照應(yīng)等問題。相比而言,CTL通過增加照應(yīng)算子、照應(yīng)范疇和一系列有關(guān)照應(yīng)的規(guī)則,并構(gòu)造針對照應(yīng)的LLC②J?ger.G.Anaphora and Type Logical Grammar[M].Netherland:Springer,2005:121~129.等系統(tǒng)來處理照應(yīng)問題。因此,與CTL比較起來,CCG是更加徹底的詞匯主義語法理論。

形式語言學(xué)往往先把一個(gè)句子翻譯成邏輯公式,然后再對其進(jìn)行模型論解釋,組合范疇語法構(gòu)造語義解釋時(shí)舍去了這個(gè)中間層次。組合范疇語法“延續(xù)了范疇類型邏輯關(guān)于句法和語義對應(yīng)的思想。在CCG這里,自然語言的句法和語義之間有一個(gè)透明的、直截了當(dāng)?shù)慕涌?這個(gè)接口體現(xiàn)為:先給自然語言語詞指派一個(gè)由句法范疇和語義詞項(xiàng)構(gòu)成的配對,在推演的出發(fā)點(diǎn)——自然語言的語詞那里,句法范疇和語義詞項(xiàng)同時(shí)出現(xiàn);在隨后的推演中,語詞之間的毗連貼合就轉(zhuǎn)換成句法范疇之間和語義詞項(xiàng)之間兩條線索的并行推演,推演的每一步都是句法范疇和語義詞項(xiàng)分別運(yùn)算的結(jié)果——同時(shí)產(chǎn)生新的句法范疇和新的語義詞項(xiàng)。在CCG的推演中,每時(shí)每刻都體現(xiàn)出句法和語義的對應(yīng),只要句法范疇之間可以運(yùn)算,語義詞項(xiàng)之間也可以組合,反之亦然?!雹倮羁蓜?鄒崇理.基于句法和語義對應(yīng)的漢語CCG研究[J].浙江大學(xué)學(xué)報(bào)(人文社會(huì)科學(xué)版),2012,(6).CCG具有此優(yōu)勢的原因之一是CCG的組合規(guī)則要遵循“組合類型透明性原則”,即“所有的句法組合規(guī)則都是在函項(xiàng)上某個(gè)簡單語義運(yùn)算的類型透明版本”。類型透明指的是一個(gè)規(guī)則約簡的語義類型與它的句法類型相同。目前,基于句法的方法無法處理自然語言中存在的很多語義合理的特殊語句,迫切需要實(shí)現(xiàn)機(jī)器對語義的理解,組合范疇語法的這一特點(diǎn)大快人心。

在某些語境中人們希望阻止某些規(guī)則應(yīng)用到特定范疇上。達(dá)到此目的的方式之一是使用某些條件約束規(guī)則的適用性。另一個(gè)方式是定義一個(gè)能用來創(chuàng)造斜線類型的模式集,使得類型化的斜線對規(guī)則具有選擇性。Baldridge&Kruijff(2003)②Baldridge,Jason and Kruijff.Geert-Jan.Multi-Modal Combinatory Categorial Grammar In Proceedings of EACL[M].Budapest,Hungary,2003.使用了一個(gè)具有下列行為的模式集M={★,◇,×,·}:

a.★非結(jié)合和非交換的;b.◇結(jié)合且非交換的;c.×非結(jié)合且交換的;d.·結(jié)合且交換的

這些模式允許定義如/★和/◇一樣的類型化斜線。這種方式允許規(guī)則的普遍適用性:模態(tài)化了的CCG規(guī)則不因語言的變化而變化,就是“通用語法”;不同語言的差異僅僅體現(xiàn)在語詞的范疇指派上。模態(tài)算子大大增加了斜線的表達(dá)力,突出了CCG的“大詞庫”和“小規(guī)則”的特征,體現(xiàn)了激進(jìn)的詞匯主義思想。相對于這些類型化的斜線定義規(guī)則下:

(4) 函項(xiàng)應(yīng)用 a.X/iY:f Y:a ? X:fa (i∈M) (>)

b.Y:a XiY:f ? X:fa (i∈M) (<)

函項(xiàng)應(yīng)用規(guī)則允許一個(gè)像sinp一樣的范疇與一個(gè)處于其左邊的np論元進(jìn)行組合,得到范疇s。類似地,一個(gè)像“λx.散步(x)”的λ-表達(dá)式應(yīng)用到一個(gè)像“文強(qiáng)”的論元,得到“散步(文強(qiáng))”。在這兩個(gè)視角中,一個(gè)類型為e→t的函子應(yīng)用到一個(gè)類型為e的論元產(chǎn)生一個(gè)類型為t的結(jié)果,體現(xiàn)了組合類型的透明性。

自然語言在某些層面是結(jié)合的。特別地,提取和并列組合(如(5))證明了語法系統(tǒng)一定要能推出與某些非標(biāo)準(zhǔn)成分相對應(yīng)的范疇類型,AB-演算無能為力。

(5) 文強(qiáng)應(yīng)該珍惜并且永遠(yuǎn)愛程程

模態(tài)動(dòng)詞(副詞)的標(biāo)準(zhǔn)分析是將它們看作從不及物動(dòng)詞短語到不及物動(dòng)詞短語的函項(xiàng)。然而,上例并列組合想進(jìn)行下去的話,模態(tài)動(dòng)詞“應(yīng)該”和副詞“永遠(yuǎn)”需分別與及物動(dòng)詞短語“珍惜”和“愛”組合,得到的非標(biāo)準(zhǔn)成分再進(jìn)行并列組合。

(6) 應(yīng)該(s◇np)/◇(s◇np)珍惜(s◇np)/.np

基于組合子B的如下規(guī)則允許模態(tài)動(dòng)詞(副詞)和及物動(dòng)詞直接進(jìn)行組合:

(7) 向前和諧復(fù)合 X/iY:f Y/jZ:g ?BX/jZ:λx.f(gx)(i,j∈{◇,·}) (>B)

與組合子T相對應(yīng)的句法規(guī)則叫類型提升規(guī)則,分為向前和向后兩個(gè)規(guī)則:

(8) 向前類型提升 X:a ?TY/i(YiX):λf.fa (i∈M) (>T)

向前類型提升與向前和諧復(fù)合一起導(dǎo)出了分析漢語的賓語提取小句、右節(jié)點(diǎn)提升等現(xiàn)象所需要的成分。例如,賓語提取小句“文強(qiáng)愛的程程”現(xiàn)在就可以推導(dǎo)了:

向后和諧復(fù)合和類型提升規(guī)則(10)和(11)能使直接賓語和間接賓語進(jìn)行組合。

(10) 向后和諧復(fù)合 YjZ:g XiY:f ?BXjZ:λx.f(gx) (i,j∈{◇,·}) (<B)

(11) 向后類型提升 X:a?TYi(Y/X):λf.fa (i∈M) (<T)

至今討論的規(guī)則都是保序的。當(dāng)某些成分的位置相對于它們的典范位置發(fā)生了改變時(shí),這些規(guī)則無能為力,這需要引入交叉復(fù)合規(guī)則,交叉復(fù)合規(guī)則導(dǎo)出了語法需要的交換性。

(12)向后交叉復(fù)合 Y/jZ:g XiY:f ?BXjZ:λx.f(gx) (i,j∈{×,·}) (<B×)

(13)向前交叉復(fù)合 X/iY:g YjZ:f ?BXjZ:λx.f(gx) (i,j∈{×,·}) (>B×)

組合子S不同于組合子B和T,因?yàn)樗试S一個(gè)語料被兩個(gè)不同的函子使用。處理寄生缺位結(jié)構(gòu)需要這樣的組合子,如在語句“存在的問題此輪巡視只發(fā)現(xiàn)不包括解決”中,一個(gè)語料“存在的問題”作為“發(fā)現(xiàn)”和“不包括解決”的論元。如下規(guī)則可處理此語句:

(14) 向后交叉置換 Y/jZ:g (XiY)/jZ:f?SX/jZ:λx.fx(gx) (i,j∈{×,·}) (<S×)

基于置換組合子還有兩個(gè)和諧置換規(guī)則和一個(gè)向前交叉置換規(guī)則。此處略。

三、范疇類型邏輯

AB-演算的規(guī)則和分離規(guī)則類似,兩者都涉及推理,因此可定義范疇語法的完全邏輯表達(dá)方式。把范疇語法刻畫成邏輯首先由蘭貝克提出,由此范疇語法發(fā)展成范疇類型邏輯(CTL)。CTL是線性邏輯,在線性邏輯中,前提的順序、排列和多樣化至關(guān)重要。證明項(xiàng)Γ├F是CTL運(yùn)算的對象,表示一個(gè)結(jié)構(gòu)Γ具有類型F。Γ是一個(gè)結(jié)構(gòu)前件,包含用來證明公式F(后件)的前提。Γ的元素用結(jié)構(gòu)構(gòu)造子oi連接起來,oi在CTL中指稱組合模式。象CCG一樣,CTL的范疇斜線可以被類型化,每一類型對應(yīng)具有不同邏輯性質(zhì)(結(jié)合性、交換性)的組合模式,這些邏輯性質(zhì)由結(jié)合和交換等結(jié)構(gòu)規(guī)則給出。這里仍使用模式集M={★,◇,×,·}。

CTL的核心叫基礎(chǔ)邏輯,基礎(chǔ)邏輯的斜線消除規(guī)則對應(yīng)了AB-演算的函項(xiàng)應(yīng)用規(guī)則。然而,二者有重要的區(qū)別:斜線消去規(guī)則不需要符號(hào)串的毗連,函項(xiàng)應(yīng)用規(guī)則需要符號(hào)串的毗連;CTL規(guī)則包含結(jié)構(gòu)構(gòu)造子,結(jié)構(gòu)構(gòu)造子可組合前提的前件,CCG規(guī)則沒有此部分。

(15) 斜線消除模式(i∈M)

只有斜線消除規(guī)則的系統(tǒng)是與AB-演算等價(jià)的部分推理系統(tǒng)。但基礎(chǔ)邏輯還支持假設(shè)推理,這樣基礎(chǔ)邏輯還有斜線引入規(guī)則(16);AB-演算沒有假設(shè)推理,故沒有相應(yīng)的規(guī)則。

(16) 斜線引入模式

斜線引入規(guī)則(16)要求假設(shè)處于結(jié)構(gòu)化前件的外圍。假設(shè)推理和斜線引入規(guī)則導(dǎo)致的一個(gè)后果是CCG的類型提升規(guī)則是基礎(chǔ)邏輯的定理(17)。AB-演算沒有與斜線引入規(guī)則相對應(yīng)的規(guī)則,也沒有類型提升規(guī)則,故AB-演算與基礎(chǔ)邏輯不等價(jià)。

基礎(chǔ)邏輯沒有觸及證明項(xiàng)的前件,故其靈活性沒有超過AB-演算。引入結(jié)構(gòu)規(guī)則重構(gòu)證明項(xiàng)的前件可以創(chuàng)造具有不同靈活性的系統(tǒng)。如CTL采用了如下結(jié)構(gòu)規(guī)則用交換的方式重構(gòu)由模式×和·建立的結(jié)構(gòu)化前件:

考慮重塊頭-NP移位語句“丁力娶了程程”。開始的證明如同“娶程程了”的證明一樣,然后使用右交換規(guī)則:

可以證明,CCG的交叉復(fù)合規(guī)則是如此構(gòu)造的CTL的定理:

CTL還可采用左右結(jié)合結(jié)構(gòu)規(guī)則重構(gòu)由模式◇和·建立的結(jié)構(gòu)化前件,如此構(gòu)造的CTL可以推出CCG的和諧復(fù)合規(guī)則,這里略。

這些證明表明,CCG的組合規(guī)則都是CTL的定理;CTL與CCG一樣,都可以使用模態(tài)詞控制一個(gè)有窮規(guī)則集的適用性,因此,CCG和CTL可以相互模擬。但是,CCG有許多非組合規(guī)則,它們不是CTL的定理,這說明了CCG的推演能力強(qiáng)于CTL。CCG和CTL雖然都屬于中度的上下文敏感語法,但是前者比后者更敏感。

四、兩種方法的側(cè)重點(diǎn)、生成能力和計(jì)算應(yīng)用

20世紀(jì)70年代,蒙太格語法與范疇語法的緊密聯(lián)系重新喚起了人們對范疇語法的興趣,進(jìn)而導(dǎo)致了上世界80年代蘭貝克演算的復(fù)興,復(fù)興的頂峰就是范疇類型邏輯。直到2000年早期,邏輯和組合傳統(tǒng)在很大程度上是彼此獨(dú)立的。前者熱心于范疇語法的邏輯理論問題,把范疇語法看成是一個(gè)邏輯系統(tǒng),配備框架語義學(xué),討論系統(tǒng)的可靠性和完全性,以及系統(tǒng)的可判定性;后者關(guān)注自然語言的表達(dá)力問題,基于統(tǒng)計(jì)模型,從語言學(xué)和計(jì)算語言學(xué)角度探討自然語言的自動(dòng)機(jī)處理問題,從而獲得低自動(dòng)機(jī)理論能力和良好計(jì)算性質(zhì)的語言表達(dá)系統(tǒng)。邏輯傳統(tǒng)認(rèn)為組合方法是基于類型推理的不完全的部分系統(tǒng)(因此缺乏意義);組合傳統(tǒng)認(rèn)為邏輯方法對于計(jì)算應(yīng)用是不適用的(因此缺乏意義)。

其實(shí),基于兩種方法的語法系統(tǒng)在很大程度上是相容的。使用從CTL導(dǎo)出的CCG規(guī)則獲得的分析如同使用CTL本身獲得的分析,CCG推演可視為相應(yīng)的CTL推演的縮略版,CTL中的假設(shè)推理和結(jié)構(gòu)重構(gòu)規(guī)則被CCG中的類型提升規(guī)則和復(fù)合規(guī)則所代替。已知前一節(jié)定義的CTL系統(tǒng)和一個(gè)標(biāo)準(zhǔn)的CCG規(guī)則集,在大多數(shù)情況下,它們對于語法的斷定是相同的。CTL提供了一個(gè)顯微鏡,允許我們審視結(jié)合和交換等性質(zhì)的細(xì)節(jié);然后,告訴我們?nèi)绾巫C明CCG的規(guī)則。使用CCG規(guī)則,我們能夠削減CTL推演需要的一些邏輯步驟。這不僅意味著縮短了推演,而且表明使用CCG進(jìn)行語法分析有許多優(yōu)勢。需要指出的是,CTL系統(tǒng)不可有窮公理化,它可提供更多的可能性推演,而不是有窮的CCG規(guī)則集。

AB-演算是上下文無關(guān)的,對于處理某些自然語言來說,它甚至不是弱充分的,比如瑞士德語的交叉依存關(guān)系。CCG的組合規(guī)則增加了AB-演算的力量,使CCG成為能夠刻畫交叉依存關(guān)系的中度的上下文敏感形式系統(tǒng),中度的上下文敏感性是相對于刻畫交叉依存關(guān)系的串語言(弱生成能力)和刻畫合適依存關(guān)系的結(jié)構(gòu)描述(強(qiáng)生成能力)而言的。中度的上下文敏感形式系統(tǒng)具有多項(xiàng)式復(fù)雜性(n6)。生成能力的問題在CCG和CTL之間是一個(gè)歷史性的問題,盡管當(dāng)今不是一個(gè)核心關(guān)切。CTL的研究者通常不重視生成能力問題,而CCG采取了一個(gè)極小生成能力的承諾。對CCG來說,對其生成能力的界定為以它為基礎(chǔ)的理論提供了一個(gè)界限,因而增加了普遍性,向通用語法目標(biāo)邁進(jìn)了一大步;這樣的形式系統(tǒng)處于自然語言復(fù)雜性的下界,它們具有足夠強(qiáng)的表達(dá)力,但不是萬能的。多模態(tài)方法的優(yōu)勢在于它使用語料敏感的方式融合具有不同生成能力的系統(tǒng),以受控的方式引入組合運(yùn)算。

伴隨著范疇語法形式化的進(jìn)步,范疇語法的計(jì)算應(yīng)用研究也有很大的進(jìn)展。范疇語法在這些方面的成功基于它的高度詞匯化和語義透明性。像許多其他適合計(jì)算的框架一樣,存在適宜做檢測分析的語法發(fā)展情景。Grail系統(tǒng)允許定義且檢測CTL結(jié)構(gòu)規(guī)則包和詞庫;①M(fèi)oot,Richard.Proof Nets for Linguistic Analysis[D].Ph.D.thesis,University of Utrecht,2002.開CCG系統(tǒng)支持CCG語法的發(fā)展,并且執(zhí)行語句的分析和實(shí)現(xiàn),還被應(yīng)用于大范圍的對話系統(tǒng)中。②White Michael.Efficient Realization of Coordinate Structure in Combinatory Categorial Grammar[J].Research on Language and Computation,2006,4(1).計(jì)算應(yīng)用的主要進(jìn)展是構(gòu)造CCG庫,CCG庫允許創(chuàng)造快而準(zhǔn)確的統(tǒng)計(jì)型CCG分析程序,并通過這樣的分析程序生成深層的依存關(guān)系。范疇語法的一個(gè)關(guān)鍵特征是詞匯范疇為整個(gè)句法分析提供了大量信息,Clark and Curran (2007)①Clark,Stephen and Curran,James.Wide-Coverage Efficient Statistical Parsing with CCG and Log-Linear Models[J].Computational Linguistics,2007,33(4).的C&C CCG分析程序應(yīng)用了這個(gè)特征,并因此成為生成深層依存關(guān)系速度最快的大范圍統(tǒng)計(jì)分析程序之一:在語法分析前用一個(gè)快速的超級(jí)標(biāo)記器給詞匯指派范疇,因此極大地減少了結(jié)構(gòu)歧義性。使用CCG庫的另一種方式是引導(dǎo)一個(gè)語法使用支持大范圍語句實(shí)現(xiàn)的開CCG庫。從CCG庫獲得的超集標(biāo)記器還被用來提升統(tǒng)計(jì)型的機(jī)器翻譯系統(tǒng)。不像CCG,CTL在計(jì)算應(yīng)用中作用甚微,這是處理完全邏輯提供的選擇時(shí)面臨的重要挑戰(zhàn)。特別是,與CCG的有窮規(guī)則集比起來,CTL允許使用更多的方法給符號(hào)串加括號(hào)。

范疇語法不僅與組合邏輯和語料敏感的線性邏輯有聯(lián)系,還與范疇理論有聯(lián)系?,F(xiàn)代范疇語法采用的受控的結(jié)合性與交換性允許它們?yōu)樗x范圍內(nèi)的許多麻煩問題提供簡單分析。CTL繼續(xù)探索可應(yīng)用于語言學(xué)的新的結(jié)構(gòu)構(gòu)造算子,探索它們的邏輯和數(shù)學(xué)性質(zhì);組合范疇語法仍然集中在實(shí)際運(yùn)用,以及從CCG庫等資源中和從使用機(jī)器學(xué)習(xí)方法的文本中獲得語法。已知這里概括的兩個(gè)傳統(tǒng)之間的聯(lián)系,很容易把一個(gè)傳統(tǒng)中的創(chuàng)新翻譯到另一個(gè)傳統(tǒng)中。隨著范疇語法在形式上的發(fā)展、計(jì)算上的進(jìn)步及其在語言現(xiàn)象中的應(yīng)用,通過把語言學(xué)研究應(yīng)用于具體的語言和結(jié)構(gòu),以及在文本上或在機(jī)器人這樣的交際主體內(nèi)使用機(jī)器學(xué)習(xí)方法獲得語法,必將加深我們對自然語言語法的理解。

A comparative study of the Combinatory Categorial Grammar and the Categorial Type Logics

YAO Cong-jun
(Department of Politics,Hunan University of Science and Engineering, Yongzhou 425199,China/Institute of Philosophy,Chinese Academy of Social Sciences,Beijing 100732,China)

Categorial Grammar originated in the AB-calculus,and now encompasses a range of related formalisms that treat both syntactic and semantic analysis as type-based inference.The two complete extensions of the AB-calculus are the Categorial Type Logics based on the logical tradition and the Combinatory Categorial Grammar based on the combinatory tradition.They are closely related to each other but obvious differences still remain.The former is largely concerned with the linguistic applicability of different logical operators and proof-theoretical properties of the proposed logical systems.For CTL researchers,issues of generative capacity are not considered to be of prime theoretical importance,and CTL has little use in computational applications.The latter focuses more on obtaining linguistically expressive systems with low automata-theoretic power and attractive computational properties.

Categorial Grammar;Categorial Type Logics;Combinatory Categorial Grammar;computation;generative capacity

B81-092

A

1000-5110(2015)01-0075-07

[責(zé)任編輯: 王德明]

姚從軍,男,湖北隨州人,湖南科技學(xué)院副教授,博士,中國社會(huì)科學(xué)院哲學(xué)所博士后流動(dòng)站研究人員,湘潭大學(xué)碩導(dǎo),研究方向?yàn)楝F(xiàn)代邏輯和語言邏輯。

國家社科基金重大招標(biāo)項(xiàng)目(10&ZD073);湖南省重點(diǎn)建設(shè)學(xué)科“思想政治教育”項(xiàng)目(湘教發(fā)[2011] 76號(hào));湖南科技學(xué)院重點(diǎn)建設(shè)學(xué)科“漢語言文字學(xué)”(湘科院校字[2011]89號(hào))。

猜你喜歡
斜線句法范疇
批評(píng)話語分析的論辯范疇研究
句法與句意(外一篇)
中華詩詞(2021年3期)2021-12-31 08:07:22
述謂結(jié)構(gòu)與英語句法配置
正合范疇中的復(fù)形、余撓對及粘合
Clean-正合和Clean-導(dǎo)出范疇
句法二題
中華詩詞(2018年3期)2018-08-01 06:40:40
詩詞聯(lián)句句法梳理
中華詩詞(2018年11期)2018-03-26 06:41:32
瘋狂的游戲
飛碟探索(2013年2期)2013-08-13 09:31:01
瘋狂的游戲
飛碟探索(2012年12期)2012-04-29 23:33:50
瘋狂的游戲
飛碟探索(2012年10期)2012-04-29 21:11:10
吴川市| 永登县| 集贤县| 安福县| 平陆县| 凯里市| 闸北区| 和平县| 西宁市| 泗洪县| 奉新县| 沂源县| 永福县| 礼泉县| 广西| 阿克陶县| 青田县| 昔阳县| 博湖县| 红桥区| 汽车| 永川市| 大田县| 游戏| 南木林县| 高雄市| 贵定县| 建湖县| 延安市| 麻城市| 阿巴嘎旗| 榆中县| 南汇区| 平武县| 阿尔山市| 盐边县| 东丽区| 河津市| 南郑县| 西宁市| 孝感市|