国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

自然語言機(jī)器處理的發(fā)展與“語義學(xué)轉(zhuǎn)向”

2017-04-26 05:01:32趙小娜高新民
社會科學(xué)動態(tài) 2017年4期
關(guān)鍵詞:機(jī)器語義意義

趙小娜 高新民

前沿聚焦

自然語言機(jī)器處理的發(fā)展與“語義學(xué)轉(zhuǎn)向”

趙小娜 高新民

自然語言機(jī)器處理是應(yīng)用語言學(xué)和人工智能研究中最重要也最為活躍的一個研究領(lǐng)域,已有的自然語言處理理論雖然取得了不小進(jìn)步和成果,但為了推進(jìn)我們的研究,使之實現(xiàn)真正質(zhì)的飛躍,我們?nèi)杂斜匾?jīng)常向我們自身的智能 “回歸”,通過將對人工智能的認(rèn)識與對真實智能的認(rèn)識進(jìn)行比較,一方面深化對我們自身的認(rèn)識,另一方面又以之為鏡,反觀我們的自然語言處理理論和實踐。我們必須經(jīng)常不斷地進(jìn)行這樣的回歸,而這樣的回歸也不會有一個終點。

自然語言;機(jī)器處理;語義學(xué)轉(zhuǎn)向

自然語言機(jī)器處理是AI研究中最重要也最為活躍的一個研究領(lǐng)域,其最終目標(biāo)是在弄清人類自然語言理解和生成的奧秘的基礎(chǔ)上,讓機(jī)器模擬、延伸和拓展甚至超越這種能力。卡特 (M.Carter)說:“人工智能發(fā)展中面臨的最有意義、最困難的計算問題也許是自然語言的理解與產(chǎn)生問題。”①盡管這是一個最為困難的研究課題,但也陸續(xù)取得了一些可喜的成果。如:加拿大蒙特利爾大學(xué)開發(fā)的與天氣預(yù)報有關(guān)的英法機(jī)譯自動播報系統(tǒng);與圖像識別相關(guān)的計算機(jī)自動用自然語言報告比賽的系統(tǒng);以及計算機(jī)充當(dāng)自動閱讀家庭教師等等?,F(xiàn)今盡管人們在自然語言的機(jī)器處理上取得了一定的成績,但按嚴(yán)格的語義性標(biāo)準(zhǔn),即使是最好的自然語言處理系統(tǒng),仍只停留在哲學(xué)家們所說的句法機(jī)水平之上,而人作為自然語言處理系統(tǒng)則既是句法機(jī),又是語義機(jī)。因此AI的自然語言處理仍是一個聚訟紛紜的研究領(lǐng)域。

一、自然語言機(jī)器處理研究的興起與基本進(jìn)程

自然語言處理這一AI研究領(lǐng)域的任務(wù)就是建造能模擬人類語言能力的機(jī)器系統(tǒng)。人類的語言能力包括兩方面,一是對輸入的書面或口頭語言進(jìn)行理解,二是生成作為反應(yīng)的語言表達(dá)式。相應(yīng)地,自然語言處理也有兩大研究課題,一是研究自然語言理解,二是研究其生成。從語義學(xué)的角度說,前者要解決的問題是如何完成從文本到意義的映射,后者要解決的是如何完成從意義到文本的映射。在兩者之中,前者最為重要,處于基礎(chǔ)地位,因為要生成語言無疑離不開理解。同時,前一任務(wù)比后一任務(wù)要難解得多。D.Jurafsky等人說: “語言的生成比語言的理解更容易一些,……正因為如此,語言處理的研究集中于語言理解?!雹谄湓蛟谟冢鹤匀徽Z言有多義性、上下文相關(guān)性、整體性、模糊性、合成性、產(chǎn)生性、與環(huán)境的密切相關(guān)性等特點。就人來說,不管是語言理解,還是語言生成,都必然涉及到三個方面,即語言表征、語法表征和語義表征。例如要說出語句,就涉及到這三個方面的表征傳遞,即先要有交流的意向,有意思想傳達(dá)出去,然后要考察用什么樣的詞、句法結(jié)構(gòu)去表達(dá),進(jìn)而用什么樣的聲音去表達(dá)。既然如此,自然語言處理的兩大領(lǐng)域也都要研究這三個方面的理論和技術(shù)問題。傳統(tǒng)的計算主義從動機(jī)上說也注意到了這三方面,只是在效果上未能真正涉及到語義性。它認(rèn)為,它可以用計算術(shù)語說明人的語言理解和生成過程。因為人的言語行為不過是一個由規(guī)則控制的過程,同理,讓機(jī)器完成語法判斷也是可能的,因為產(chǎn)生語法判斷的機(jī)制可以從計算上實現(xiàn)③。

在人類認(rèn)識和改造世界的活動中,自然語言處理是名副其實的新生事物,人們對它的關(guān)注充其量只有六七十年的時間。大致來說,它經(jīng)歷了三個發(fā)展階段。一是40年代末至50年代初的萌芽時期。其重點是研究人機(jī)對話。但由于人們對人機(jī)對話的理解過于膚淺,因此以失敗告終。二是60年代的初步發(fā)展時期,研究的主要成果是形成了關(guān)鍵詞匹配技術(shù),建立了以此為基礎(chǔ)的語言理解系統(tǒng)。這種系統(tǒng)的優(yōu)點是:允許輸入句子不規(guī)范。但其缺點也是明顯的:它忽視了非關(guān)鍵詞和語義及語法的作用,因此對句子理解的準(zhǔn)確性極差。三是70年代,出現(xiàn)了以句法—語義分析技術(shù)為基礎(chǔ)的系統(tǒng)。這一研究所用的方法是基于規(guī)則的方法,即將理解自然語言所需的各種知識用規(guī)則的形式加以表達(dá),然后再分析推理,以達(dá)到理解的目的。這一方法在語言分析的深度和難度上較以前有較大進(jìn)步,事實上也獲得了積極的成果,如產(chǎn)生了一些句法—語義分析系統(tǒng):LUNAR,SHRDLU和MARGIE等。

LUNAR是由美國BBN公司伍茲 (W.Woods)于1972年設(shè)計的一個允許用英語與計算機(jī)數(shù)據(jù)庫進(jìn)行對話的人機(jī)接口。它由三個模塊組成,即句法分析、語義解釋和數(shù)據(jù)檢索。里面的資源有:ATN語法、詞典、語義規(guī)則和一個數(shù)據(jù)庫。如圖所示:

MARGIE系統(tǒng)是由尚克 (R.Schank)與學(xué)生一道于70年代在斯坦福大學(xué)的人工智能實驗室研制出的一個系統(tǒng),也是塞爾中文屋論證所針對的主要矛頭。MARGIE是Meaning Analysis,Reponse Generation,and Inference on English的第一個字母的集合體,表明它是一個試圖進(jìn)行以英語為載體的意義分析、答案形成和推理的系統(tǒng)。它由三部分組成。一是概念分析器。其任務(wù)是把所輸入的英語句子轉(zhuǎn)換成機(jī)器內(nèi)部的概念從屬性表征。二是推理模塊,它從上一模塊那里接受一個用表征表示的命題,然后根據(jù)當(dāng)前語境中的其他命題演繹出一些事實,換言之,把句子所蘊涵的事實演繹出來。三是篇章生成模塊。其任務(wù)是把概念從屬表征轉(zhuǎn)換成英語輸出。從主觀動機(jī)上說,尚克等人的這個系統(tǒng)旨在讓機(jī)器從句法機(jī)上升為語義機(jī)。因為根據(jù)他們的想法,一旦被輸入的英語句子被分析、轉(zhuǎn)換成機(jī)器內(nèi)部的表征,那么句子的表層結(jié)構(gòu)、句法形式就被置于一邊,而進(jìn)到了對語義的處理,似乎以后的加工都是對這種概念表征的加工。由于意義相同的不同句子只對應(yīng)于一種規(guī)范的表征,因此推理、問題回答似乎就有可能了,并似乎很方便。塞爾的中文屋論證批判的正是這種設(shè)想。在塞爾看來,這種系統(tǒng)從輸入句子到概念表征的轉(zhuǎn)換是虛假的、騙人的,因為它并未真正過渡到概念或語義。這些東西不能為機(jī)器涉及到,只能為設(shè)計和操作人員想到。它們有語義性,但都是由后者所強(qiáng)加的。

二、語義學(xué)轉(zhuǎn)向

80年代后,自然語言處理在經(jīng)歷了因一些人的否定而出現(xiàn)的短暫陣痛之后,發(fā)生了極富革命意義的語義學(xué)轉(zhuǎn)向,即從原來的以句法為中心的研究(至少在實際效果上是這樣)轉(zhuǎn)向了以語義為中心的研究。其表現(xiàn)是人們的確從句法層面進(jìn)到了語義層面,不僅關(guān)心單詞、短語、句子、語音的形式加工問題,而且著力探討意義的形式表示以及從語段到意義表示的映射算法,并深入到言語的意義分析,探討語素的意義怎樣結(jié)合到這一級語言單位的意義之中。基于大量的探討,便誕生了各種關(guān)于語義分析的理論和方法。另外,如何消解單詞意義之歧義性,如何將信息檢索從句法級提升到語義級等應(yīng)用問題也受到了特別關(guān)注。

促成這種轉(zhuǎn)向的動因是多方面的。一方面,80年代初,一大批有后現(xiàn)代精神、熱衷于解構(gòu)和顛覆、喜歡在雞蛋里挑骨頭的哲學(xué)家、科學(xué)家,如上面所說的塞爾、德雷福斯、彭羅斯和霍金斯等,在深入、嚴(yán)肅地反思了AI研究現(xiàn)狀的基礎(chǔ)上,對各種自然語言處理的理論和實踐作了尖刻的批判和否定。如前所說,塞爾的中文屋論證有力地證明:人的語言處理的特點是對意義的理解,而機(jī)器或關(guān)于程序所實現(xiàn)的所謂語言加工如 “理解故事”根本就沒有理解。如果理解、意向性、語義性是人類智能的根本特征,那么已有的語言處理系統(tǒng)根本就沒有表現(xiàn)智能。這一類批評應(yīng)該說抓住了已有研究的要害,后來許多專家的肯定性認(rèn)同和評價以及向語義學(xué)的轉(zhuǎn)向都足以說明這一點。

另外,AI的其他領(lǐng)域提出了向語義回歸的客觀要求。很顯然,不攻克語義性這一瓶頸問題,知識工程、互聯(lián)網(wǎng)、知識管理等領(lǐng)域的研究就不可能有實質(zhì)性進(jìn)展。1977年,西蒙的學(xué)生費根鮑姆 (E. Feigenbaum)提出的知識工程,使知識信息處理進(jìn)入了工程化階段,同時也標(biāo)志著人工智能從以推理為中心的階段進(jìn)入了以知識為中心的階段。從此,知識科學(xué)、知識工程研究如火如荼地開展起來。進(jìn)入90年代,這一研究因互聯(lián)網(wǎng)的發(fā)展而變得更為迫切和重要。因為互聯(lián)網(wǎng)的發(fā)展既為知識共享提供了較好的平臺,同時,其縱深發(fā)展又向知識共享提出了更高的要求。因為人們希望有更全面、更快捷、更高質(zhì)量的知識共享。而要實現(xiàn)這一愿望,就必須解決語義學(xué)問題,必須從過去的以形式為中心的人工智能研究,轉(zhuǎn)向以內(nèi)容為中心的研究。史忠植先生說: “將語義網(wǎng)和網(wǎng)格計算的技術(shù)結(jié)合起來,構(gòu)建語義網(wǎng)絡(luò),可能是實現(xiàn)基于Internet知識共享的有效途徑?!雹?/p>

自然語言處理研究中的另一不可回避的方法論問題是:如果我們承認(rèn)自然語言處理研究必須走“師法人類”的道路,那么由于人們對人類語言處理的條件、機(jī)制、原理、實質(zhì)的看法不盡相同,因此怎樣判斷我們的模擬真的是對人類語言能力的模擬呢?怎樣判斷一機(jī)器是否有語言處理能力?以及判斷這種能力的標(biāo)準(zhǔn)是什么?

美國認(rèn)知心理學(xué)家奧爾森 (G.M.Olson)提出了四標(biāo)準(zhǔn)說:1.能回答與語言材料有關(guān)的問題。2.能對大量材料形成摘要。3.能用一種不同的語言復(fù)述另一種語言。4.將一種語言轉(zhuǎn)譯為另一種語言。一些人認(rèn)為,如果機(jī)器的自然語言理解能符合上述標(biāo)準(zhǔn),那么就可將它們應(yīng)用到下述方面:1.機(jī)器翻譯。2.文件理解。3.文件生成。4.其他應(yīng)用,如給大型系統(tǒng)配上自然語言接口。

當(dāng)然也有不同的看法,如有些人認(rèn)為,應(yīng)從效果上加以判斷,即看機(jī)器語言輸出的因果性效果;而塞爾等人指出真正的標(biāo)準(zhǔn)應(yīng)是看機(jī)器在句法轉(zhuǎn)換過程中,有沒有理解或覺知過程發(fā)生。塞爾的思想受到了許多AI領(lǐng)域?qū)<业脑嵅?,但也有許多人贊成他的觀點。史忠植、王文杰概述說: “自然語言理解成為人工智能研究的中心課題,很多人都意識到在自然語言處理中 ‘理解’的必要性。為了使機(jī)器理解語言,不只是考慮句子,還要考慮語義,利用知識,引進(jìn)一般社會的知識,以及利用上下文信息?!雹?/p>

在自然語言的應(yīng)用系統(tǒng)中,比如在對話系統(tǒng)中,系統(tǒng)要能將對話順利進(jìn)行下去,一個必要的環(huán)節(jié)是對輸入句子作出合理的理解,即要把握符號后的意義。而要理解輸入句子的意義,又有兩方面的工作得做。一是形成意義表征,二是將這表征指派給輸入的句子形式。這兩者合在一起就是所謂的語義分析。正如D.Jurafsky等人所說: “語義分析是生成意義表示,并將這些意義表示指派給語言輸入的一種處理?!闭Z義分析一般是由語義分析機(jī)器完成的。如圖所示:

這就是說,輸入句子首先要經(jīng)過句法分析器的分析,所得的結(jié)果再傳送到語義分析器。其分析的結(jié)果就是要賦予輸入句子以意義表征。

語義表征或意義表征是機(jī)器獲得自然語言處理能力的第一步。它關(guān)心的是怎樣將句子的意義表征出來。人們通過深入到人類語言的結(jié)構(gòu)底層,探討這種語言為什么有語義表征能力,最終發(fā)現(xiàn):人類語言的意義表征能力根源于它之下的謂詞變元結(jié)構(gòu)?;谶@一認(rèn)識,有關(guān)專家試圖模仿人類語言表征意義的結(jié)構(gòu)和方法。

讓機(jī)器獲得自然語言處理能力的第二步是讓它有語義表征能力。這也是消除語義之歧義的必要。自然語言的特點是有歧義性。如果不能正確對待歧義性,就不能使用自然語言。而要有這種能力,就得有語義能力。 “因為要對語言輸入的意義進(jìn)行推理,并且要根據(jù)它來采取行動,所以一個輸入的意義的最后表示必須與任何歧義沒有關(guān)系?!雹蘖硗?,日常語言還有這樣的特點,即一個意義可由不同的句子來表示,而一個句子又可表示不同的意義。要讓機(jī)器有自然語言處理能力,就必須有理解這類句子的能力,而要如此,又必須有語義能力。目前的理論主要是通過意義表征來解決這里的問題,即在知識庫中為每一種輸入提供盡可能多的意義表征。因為 “如果在系統(tǒng)的知識庫中只有一個意義表示,那么這些不同的意義表示將不能進(jìn)行正確的匹配”⑦。

什么是意義表征呢?Jurafsky等人說: “在計算語言學(xué)中,意義表征的主要方法是建立形式意義表示法,以便捕捉與語言輸入有關(guān)的意義。這些意義表征的目的是在語言和關(guān)于世界的普通知識之間建立一座橋梁。”⑧意義表征的形式很多,如一階謂詞演算、語義網(wǎng)絡(luò)等。 “在抽象層次上,它們都有一個共同的概念基礎(chǔ),即意義表征是由符號集合所組成的結(jié)構(gòu)構(gòu)成的。”在他們看來,一階謂詞演算就是其中的一種較好的選擇。D.Jurafsky說:這“是一種靈活方便的、容易理解的、在計算上可行的方法,這種方法可以的表示知識能夠滿足……對意義表示語言提出的要求?!梢詾橐饬x表示的確實性 (Verifiability)驗證、推論和表達(dá)能力等方面提供堅實的計算基礎(chǔ)。”⑨

由于有這樣的好處,因此在自然語言處理中,一階謂詞演算是一種常見的表征意義的方法。我們知道,人類的語言之所以有意義,是因為它有對于它以外的事物的關(guān)于性。同樣,一階謂詞演算之所以被看作表征意義的一種方式,也是因為它可以用來表達(dá)外在的對象、性質(zhì)及關(guān)系。在有關(guān)的學(xué)者看來,它之所以有表征意義的能力,又是因為它有一些原子要素如謂詞詞項、聯(lián)系詞、函數(shù)、變量等。這種表示方法是圍繞謂詞而組織起來的。所謂謂詞是一種符號,其作用是引述對象,表現(xiàn)特定領(lǐng)域內(nèi)的對象之間的關(guān)系。例如: “某餐館供應(yīng)的是綠色食品?!边@里的 “供應(yīng)”就是謂詞,它對有關(guān)的關(guān)系作了編碼,例如它涉及到兩個位置,即 “餐館”和 “綠色食品”,同時標(biāo)出了它們之間的關(guān)系。

一階謂詞演算中的另一個原子要素是詞項(term)。它是這種表征方式表示對象的一個重要設(shè)置,可以看作是一種命名方法,一種表示世界上的對象的手段,或一個信息塊。而它又是用三種方式來表示的,即常量、函數(shù)和變量。常量通常用大寫字母如A或B等來描述,引述的是世界上的特定對象。函數(shù)也是引述對象的方法,比常量更方便。變量常用小寫字母表示,也是引述客體機(jī)制的組成部分,其作用是允許我們對對象作出判斷和推論。

有了引述客體的能力以及把一些客體與另一些客體關(guān)聯(lián)在一起的能力,一階謂詞演算就能構(gòu)造出組合表示,如借助邏輯連詞 (“和”、 “或”等)可以把不同的意義表征組合在一起,形成更大的意義單位。在倡導(dǎo)者看來,借助這種方式,不僅可以表征意義,而且還可以 “根據(jù)它們所編碼的命題是否與外部世界相符而被指派 ‘真’或 ‘假’值”⑩。

在語義網(wǎng)絡(luò)表征中,語言所指對象用圖的結(jié)點來表征,對象之間的關(guān)系用有名字的連接邊來表征。在框架表征中,用特征結(jié)構(gòu)表征對象。而特征被稱為槽 (slot),這些槽的值既可用填充者 (filler)來表示,又可用原子值來表示,還可以用一個嵌套的框架來表示。因此這種方法又被稱作槽填充表示法。

在建立語義表征時,一項必不可少的工作是建立關(guān)于非語言世界的表征。因為人之所以有語義能力,除了有關(guān)于語言規(guī)則的知識之外,還有關(guān)于相關(guān)世界的知識。既然如此,就必須注重建立這方面的表征。Jurafsky等人說: “我們所需要的意義表達(dá)能夠在從語言輸入到與語言輸入意義有關(guān)的各種具體任務(wù)所需的非語言知識之間架起一座橋梁。”?“顯而易見,簡單地使用前幾章討論過的音位表示、形態(tài)表示和句法表示,并不能幫助我們解決這些問題。為了解決這些問題,需要把包含在這些問題中的語言因素與用于成功地完成這些任務(wù)所需的非語言的世界知識結(jié)合起來?!?

語義學(xué)轉(zhuǎn)向還體現(xiàn)在對話段解釋、言語識別和會話自主體等的研究之中。以話段識別為例,它所用的方法主要是BDI方法,而后者就是基于對說者的信念 (Belief)、愿望 (Desire)和意圖 (Intention)的推測來對話語作出語義解釋、進(jìn)而確定它是哪種言語行為的方法,也被稱作意向策略 (Intentional Approach)。這一方法是格羅茲 (B.J.Grosz)等人在1986年提出的?。在他們看來,話語由三部分構(gòu)成,即語言結(jié)構(gòu)、關(guān)注狀態(tài) (指話語在每個時間點上關(guān)注的顯著對象、屬性和關(guān)系及其動態(tài)變化)和意圖結(jié)構(gòu) (指話語后面貫穿的說者的意圖、目的結(jié)構(gòu))。這一方案強(qiáng)調(diào)的是:機(jī)器要理解、解釋說者的言語行為,關(guān)鍵是要設(shè)法把語言結(jié)構(gòu)與后面的意圖結(jié)構(gòu)聯(lián)系起來,或推測這種結(jié)構(gòu)。如果弄清了這個結(jié)構(gòu),那么就能確認(rèn)說者的話語屬于哪一種言語行為。一般來說,說者在對話中表達(dá)的整個話語有一個總目標(biāo),而為了這個目標(biāo),每個語話片斷又有相應(yīng)的子目標(biāo)。在實現(xiàn)會話的整個目標(biāo)時,每個子目標(biāo)都有一個與該話語片斷相對應(yīng)的角色。而總目標(biāo)、子目標(biāo)不外這樣幾類:1.行動者試圖完成某些任務(wù)的意圖。2.相信某些事實的意圖。3.相信一個事實支持另一個事實的意圖。4.企圖識別一個對象 (如物理對象、虛構(gòu)對象、計劃、事件和事件序列)的意圖。5.知道一個對象的某些屬性的意圖。

要讓話段解釋系統(tǒng)對人的話語作出解釋,首要的一項工作就是要確定意圖結(jié)構(gòu)。已有的工作不外是建立關(guān)于對話 (以及口語獨白)的意圖結(jié)構(gòu)的推理算法,它們類似于對話行為的推理算法,當(dāng)然應(yīng)用了BDI模型。其次,系統(tǒng)要對人的話語作出解釋,還要建立信息連貫與意圖連貫。意圖連貫取決于對話參與者識別彼此的意圖并使其適合于計劃的能力;信息連貫取決于確立話段之間內(nèi)容所承擔(dān)的某些類型的關(guān)系的能力。許多學(xué)者認(rèn)為,這兩個層次的分析必須共存。

三、分析與思考

事實上,就各種形式的自然語言機(jī)器處理系統(tǒng)已觸及到了語義問題、進(jìn)到了語義處理的層面來說,完全有理由把它們稱作語義機(jī),而不應(yīng)再只把它們看作句法機(jī)。無論是從動機(jī)還是從效果上看,都是如此。更應(yīng)強(qiáng)調(diào)的是,已有的自然語言處理理論和實踐都取得了不容小視的進(jìn)步和成果,并在改變我們的認(rèn)識和生活中發(fā)揮著積極的作用。但為了推進(jìn)我們的研究,使之實現(xiàn)真正質(zhì)的飛躍,我們?nèi)杂斜匾?jīng)常向我們自身的智能 “回歸”,通過將對AI的認(rèn)識與對真實智能的認(rèn)識進(jìn)行比較,一方面深化對我們自身的認(rèn)識,另一方面又以之為鏡,反觀我們的自然語言處理理論和實踐。我們必須經(jīng)常不斷地進(jìn)行這樣的回歸,而這樣的回歸也不會有一個終點。

當(dāng)我們對兩種語義機(jī)作出比較時,我們?nèi)阅芮宄乜吹?,人工語義機(jī)還存在一些根本性的欠缺。其主要表現(xiàn)是:作為它的理論基礎(chǔ)的關(guān)于語義的研究,從根本上說仍停留在形式主義的層面,如仍只關(guān)心如何用形式方法來表示語義,如何用一些映射算法將話段轉(zhuǎn)化為相應(yīng)的意義表示形式。質(zhì)言之,主要停留在意義的形式表示與轉(zhuǎn)換上。由此決定,所研制出來的自然語言處理系統(tǒng)也就只能作為意義之形式表示和轉(zhuǎn)換的工具而被動地發(fā)揮作用,卻不能主動地、直接地接觸、關(guān)注、理解、把握、處理意義。既然如此,對意義的涉及仍只是設(shè)計、操作人員的事情。Jurafsky等人在概述當(dāng)前的計算語義學(xué)研究現(xiàn)狀及特點時正確地指出:已有研究的 “語義學(xué)方法建立在這樣的概念基礎(chǔ)上:語言話段的意義可以使用形式化方法來捕捉。這種形式化方法稱為意義表征 (meaning representation)。相應(yīng)地,用來說明這種意義表征的句法和語義學(xué)的框架稱為意義表征語言”?。就機(jī)器的語言生成能力來說,目前的計算機(jī)只要安裝了相應(yīng)的語言生成程序,如“hell word”程序,就能生成 “精彩而優(yōu)美的英文文本,但遺憾的是,這些文字所擁有的微妙而卓越的交際語力其實不是由程序本身而是由該程序的作者創(chuàng)作的”?。

人工系統(tǒng)盡管已進(jìn)到了語義級、意向級,如能建立意義表征,但機(jī)器的意義表征與人的意義表征還是有根本的差別,這主要表現(xiàn)在:

第一,機(jī)器的意義表征不知道把符號與外在的所指關(guān)聯(lián)起來。借助一階謂詞演算等方法建立起來的意義表征的確模擬了人類有意義的語言表達(dá)式的深層結(jié)構(gòu),如像人類語言一樣有謂詞及相關(guān)項,因此具備了作為人類語言的能指的一些內(nèi)在特征。但問題是人類語言有語義性。有意義表征能力,除了取決于能指的內(nèi)在結(jié)構(gòu)和特征之外,還取決于人的關(guān)聯(lián)能力。例如在命名過程中,人們除了創(chuàng)造出了名稱之外,還發(fā)生了一個看不見的、也不表現(xiàn)于名稱之中的客觀存在的過程,即把名稱與對象關(guān)聯(lián)起來的心智過程,如為一個新生兒安立一個名字。通過一個命名式,通過人們之間的一傳十、十傳百的傳遞,就有了名稱與對象之間的約定俗成的關(guān)聯(lián)。這才是人類語言意義的實質(zhì)。人們之間傳遞的表面上是表示對象的符號,而實質(zhì)上則是既不存在于對象、符號上,又不存在于個別人心中的那種形而上的關(guān)聯(lián)作用。正是因為這種關(guān)于性、關(guān)聯(lián)作用有這一特點,弗雷格才把意義稱作新的存在,即抽象的實在。它與指稱有關(guān),但又不同于指稱?,F(xiàn)在的一階謂詞演算等意義表征方法雖然抓住并模擬了語言結(jié)構(gòu)中的某些因素和結(jié)構(gòu),但仍未抓住上述抽象的因素。

第二,自然語言處理系統(tǒng)尚沒有人類語言意義活動中的那種必不可少的 “有意識的曉得”或 “知道”的因素。許多學(xué)者認(rèn)識到,語言既然是表征世界的,就一定有真假兩種值,而這種值是離不開判斷或指派活動的。例如 “Ay Caramba is near ICSI”(Ay Caramba在ICSI附近)。D.Jurafsky等人說:“這個句子可以根據(jù)現(xiàn)實世界中Ay Caramba是不是真正與ICSI離得近而被指派True或False值。當(dāng)然由于我們的計算機(jī)很少直接訪問外部世界,所以只好依靠某些手段來決定這個公式的真值?!?這就是說,對真值的判斷,對符號與對象相符關(guān)系的判斷,現(xiàn)在還不是由計算機(jī)來做的,而是由人來完成的。即使是由計算機(jī)來判斷,它的判斷與人仍有本質(zhì)的差別。從原則上說,計算機(jī)可以 “感知”符號所表示的世界,如對上述兩地的距離作出精確的感知和計算,進(jìn)而借助匹配、比較,它能對兩地是否靠近給出較準(zhǔn)確的回答。這與人的判斷在形式上是一致的,因而就此而言,可以說機(jī)器有真值判斷進(jìn)而有意義表征能力。但它的判斷過程仍是一個形式轉(zhuǎn)換過程,一是沒有發(fā)生把符號與世界關(guān)聯(lián)起來的過程,二是沒有有意識的覺知過程。

第三,人與機(jī)器固然都能加工語言,但不同在于:人在加工語言時,一是把語言與它表示的對象區(qū)別開來了,并知道加工的是符號而不是對象本身;二是在加工時或加工之后,都能想到所加工的符號是對象的代表,即又能把它們關(guān)聯(lián)和統(tǒng)一起來。很顯然,這里的分離、關(guān)聯(lián)、想到、統(tǒng)一等都是現(xiàn)行的語言加工系統(tǒng)做不到的。它們只能由旁邊的設(shè)計者、操作者來完成。D.Jurafsky等人說,有四個問題使自然語言處理系統(tǒng) “在實際應(yīng)用中顯得捉襟見肘:如何對于一個給定的事件確定它的正確角色數(shù)目,如何表示關(guān)于與一個事件相聯(lián)系的角色的事實,如何保證能夠直接從一個事件的表示引導(dǎo)出所有正確推論,如何保證從一個事件的表示引導(dǎo)出所有推論沒有不正確的”?。在說明自然語言處理的意義表征的實質(zhì)時,他們說: “對于哲學(xué)家來說,把一個句子從原來的自然形式轉(zhuǎn)寫成另外的人工形式,并不能使我們離它的意義更接近。盡管形式表示可以使實際的語義學(xué)研究工作變得容易一些,但是這些形式表示本身并沒有多大意思。根據(jù)這種觀點,重要的工作是功能和過程,因為它們決定了從這些形式表示到被模擬的世界之間的映射關(guān)系。這些方法中最有意思的是確定句子或其形式表示的真值條件的哪些功能?!?功能主義哲學(xué)家劉易斯等人就持此論?。

D.Jurafsky等人還對意義表征、語義分析的實質(zhì)作了這樣的一針見血的說明: “我們這里的意義表示是邏輯形式,因為它們可以很容易地轉(zhuǎn)換為FOPC。但從稍廣闊的視角看,它們也是中間表示,因為我們確實還需要進(jìn)一步的詮釋來使它們更接近合理的意義表示。” “正是詞匯規(guī)則對我們的意義表示提供了內(nèi)容級的謂詞和詞項,語法規(guī)則的語義附著將這些謂詞和詞項正確地聯(lián)系起來。但總體來說,確實沒有將謂詞和詞項引入生成的意義表示?!?

對短語的語義分析的狀況也是如此。就名詞短語來說,它們的句法 “幾乎沒有為它們的意義表示提供幫助,通常能做的最好情形不過是提供一個相對中間的意義表示,而這個中間意義表示又可以被用于進(jìn)一步的理解處理”21。以語義語法為基礎(chǔ)的語義分析器盡管有較復(fù)雜的生成語義表征的能力,甚至有一定的預(yù)測能力,但也有問題,這就是:它“很容易贊成語義的過度生成”,即根據(jù)既定的規(guī)則把某短語本來沒有的意義賦予該短語,如 “加拿大飯店”會被它生成這樣的意義:一個提供加拿大風(fēng)格的食物的飯店。這就是典型的意義過度生成。因為它沒有這樣的意義,所意指的只是:位于加拿大的飯店22。而人則不同,他在給出意義回答時,盡管也要通過符號,但在說出符號的同時能 “想到”符號之外、與符號有約定關(guān)系的對象。這種 “想到”就是意向性的超越性特點、覺知特點。今后,我們的努力方向似應(yīng)為研究人的意向性這類根本特征及其實現(xiàn)條件。

注釋:

①③ M.Carter,Mind and Computers:An Introduction to the Philosophy of AI,Edinburgh,Edinburgh University Press,2007,p.144,pp.152-153.

②⑥⑦⑧⑨⑩????????21 22 D.Jurafsky and J.H.Martin:《自然語言處理綜論》,馮志偉等譯,電子工業(yè)出版社2005年版,第470、320、321、342、325、327、318、318、318、471、327、331、342、351、353、363頁。

④ 史忠植: 《智能科學(xué)》,清華大學(xué)出版社2006年版,第3—4頁。

⑤ 史忠植、王文杰: 《人工智能》,國防工業(yè)出版社2007年版,第305—306頁。

? B.J.Grosz and C.L.Sidner,Attention,Intentions,and the Structure of Discourse,Computational Linguistics,1986,12(3),pp.175-204.

? D.Lewis,General Semantics,in D.Davidson and G.H.Harman,eds.,Semantics for Natural Language,D. Reidel,Dordrecht,1972,pp.169-218.

(責(zé)任編輯 胡 靜)

N032

A

(2017)04-0031-06

趙小娜,武漢大學(xué)文學(xué)院博士后研究人員,湖北武漢,430072;高新民,華中師范大學(xué)馬克思主義學(xué)院教授、博士生導(dǎo)師,湖北武漢,430079。

猜你喜歡
機(jī)器語義意義
一件有意義的事
新少年(2022年9期)2022-09-17 07:10:54
機(jī)器狗
機(jī)器狗
有意義的一天
語言與語義
未來機(jī)器城
電影(2018年8期)2018-09-21 08:00:06
“上”與“下”語義的不對稱性及其認(rèn)知闡釋
無敵機(jī)器蛛
詩里有你
北極光(2014年8期)2015-03-30 02:50:51
認(rèn)知范疇模糊與語義模糊
富平县| 鄂托克前旗| 黄陵县| 贡觉县| 沂水县| 万全县| 巫山县| 松原市| 即墨市| 若尔盖县| 公主岭市| 遂宁市| 石嘴山市| 东乌珠穆沁旗| 柘城县| 三亚市| 邻水| 稻城县| 罗定市| 日照市| 海伦市| 沁水县| 东乡族自治县| 惠安县| 贵溪市| 双城市| 平凉市| 南澳县| 新巴尔虎右旗| 辽阳市| 叶城县| 大姚县| 忻州市| 邵阳县| 六枝特区| 桂阳县| 青铜峡市| 昌乐县| 茶陵县| 莒南县| 南平市|