陳曉華,杜國平
(1.湘潭大學(xué) 哲學(xué)系,湖南 湘潭 411105;2.中國社會(huì)科學(xué)院 哲學(xué)研究所,北京 100732)
2016年3月15日,圍棋世界冠軍韓國棋手李世石與谷歌人工智能阿爾法圍棋AlphaGo 進(jìn)行較量,這場人機(jī)大戰(zhàn)的總比分最終定格在4∶1。AlphaGo贏了,人工智能借此迎來了新的春天。2017 年7 月8日,國務(wù)院印發(fā)《新一代人工智能發(fā)展規(guī)劃》(以下簡稱《規(guī)劃》)的通知,重點(diǎn)對(duì)我國人工智能發(fā)展的總體思路、戰(zhàn)略目標(biāo)、主要任務(wù)和保障措施進(jìn)行系統(tǒng)的規(guī)劃和部署,為推動(dòng)我國人工智能的長期發(fā)展指明了方向?!兑?guī)劃》指出,人工智能目前的任務(wù)之一就是建立新一代人工智能關(guān)鍵共性技術(shù)體系,共包括八項(xiàng)共性技術(shù),其中一項(xiàng)就是自然語言處理技術(shù):重點(diǎn)突破自然語言的語法邏輯、字符概念表征和深度語義分析的核心技術(shù),推進(jìn)人類與機(jī)器的有效溝通和自由交互,實(shí)現(xiàn)多風(fēng)格、多語言、多領(lǐng)域的自然語言智能理解和自動(dòng)生成。為了進(jìn)一步細(xì)化和落實(shí)《規(guī)劃》的相關(guān)任務(wù),2017年12月14日,中華人民共和國工業(yè)和信息化部印發(fā)了《促進(jìn)新一代人工智能產(chǎn)業(yè)發(fā)展三年行動(dòng)計(jì)劃(2018—2020 年)》,其中特別寫道:培育智能理解產(chǎn)品,加快模式識(shí)別、智能語義理解、智能分析決策等核心技術(shù)研發(fā)和產(chǎn)業(yè)化。筆者將回顧邏輯學(xué)與人工智能的悲歡離合,分析人工智能的困境,探尋擺脫困境的邏輯學(xué)路徑和方法。
“人工智能”一詞正式出現(xiàn)于1956 年麥卡錫召集的“人工智能夏季研討會(huì)”。而對(duì)于該名稱的使用,與會(huì)者當(dāng)時(shí)并未形成共識(shí),紐厄爾和西蒙更贊同“復(fù)雜信息處理”的概念。1958年,英國國家物理實(shí)驗(yàn)室召開“思維過程機(jī)器化”會(huì)議,會(huì)上有人再次提出“人工思維”。人工智能作為一門學(xué)科其起源應(yīng)該有一段較長的路徑。“人工”一詞在日常使用中意思比較確定,就是人造的、人為的,如人工湖、人工降雨等。但是“智能”(intelligence)一詞,人們對(duì)于它就有不同的理解。斯滕伯格就人類意識(shí)這個(gè)主題給出了以下定義:智能是個(gè)人從經(jīng)驗(yàn)中學(xué)習(xí)、理性思考、記憶重要信息以及應(yīng)付日常生活需要的認(rèn)知能力[1]。
對(duì)認(rèn)知能力或思維的形式化、機(jī)械化研究至少可以追溯到亞里士多德的形式邏輯。形式邏輯把思維內(nèi)容和思維形式區(qū)分開來,這是推理活動(dòng)的出發(fā)點(diǎn)。邏輯的形式化是人工智能最強(qiáng)大最根本的基礎(chǔ)。西班牙的盧爾(Raymond Llull)可能是第一個(gè)嘗試機(jī)械化人類思維過程的人,他建立了一套基于邏輯的系統(tǒng),用幾何圖形和原始邏輯來實(shí)現(xiàn)思維機(jī)械化。萊布尼茨又把這個(gè)想法往前推進(jìn)一步,他認(rèn)為所有的推理只是字符的結(jié)合或替代,可以建立一種“邏輯演算”,解決所有的邏輯論證問題,即思維是可計(jì)算的。這個(gè)思想為邏輯的數(shù)學(xué)形式化奠定了基礎(chǔ),也為圖靈機(jī)及其物理實(shí)現(xiàn)奠定了強(qiáng)有力的思想基礎(chǔ)。英國數(shù)學(xué)家布爾在《思維規(guī)律研究》一書中給出了符號(hào)推理的一般方法,他使用三個(gè)邏輯運(yùn)算符號(hào)“或、與和非”,變?cè)谡婊蚣俳㈥P(guān)系,其代數(shù)語言和邏輯運(yùn)算規(guī)則的組合能夠計(jì)算思維。19世紀(jì)末,德國數(shù)學(xué)家和邏輯學(xué)家弗雷格建立了第一個(gè)邏輯公理化系統(tǒng),即給定幾個(gè)初始公理和推理規(guī)則,就可以推出所有的真命題。同時(shí),他提出算術(shù)邏輯形式化,用邏輯形式來表達(dá)算術(shù),開創(chuàng)了數(shù)學(xué)證明論中的邏輯主義學(xué)派。這一切都朝著思維是可計(jì)算的方向發(fā)展,所有的推理都是可以證明或計(jì)算的。但是這一偉大目標(biāo)并非能夠在所有系統(tǒng)中實(shí)現(xiàn),1931年哥德爾證明了一致的初等算術(shù)系統(tǒng),存在無法證明的真語句。這就表明思維形式化和機(jī)械化存在一些局限。1936 年,圖靈在其《論可計(jì)算數(shù)及其在判定性問題上的應(yīng)用》一文中提出一種理想的計(jì)算數(shù)學(xué)模型,后人稱之為圖靈機(jī)。所有可計(jì)算函數(shù)都可以用圖靈機(jī)計(jì)算,圖靈機(jī)為電子計(jì)算機(jī)的出現(xiàn)奠定了理論基礎(chǔ)。1946年,第一臺(tái)電子數(shù)字計(jì)算機(jī)ENIAC(世界上第一臺(tái)電子計(jì)算機(jī)是1942 年的阿塔納索夫- 貝瑞計(jì)算機(jī),Atanasoff-Berry Computer,通常簡稱ABC計(jì)算機(jī))的誕生也是多代人堅(jiān)持不懈努力的結(jié)果。電子計(jì)算機(jī)的誕生為人工智能提供了物理實(shí)現(xiàn)的基礎(chǔ)。
至此,形式計(jì)算理論、依據(jù)形式計(jì)算理論而設(shè)計(jì)的電子計(jì)算機(jī)以及生物學(xué)上神經(jīng)元的發(fā)現(xiàn)奠定了整個(gè)人工智能的基礎(chǔ)。1943年,麥卡洛可和皮茨合作發(fā)表了一篇開創(chuàng)性的文章——《神經(jīng)活動(dòng)內(nèi)在概念的邏輯演算》,建立了第一個(gè)神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型,神經(jīng)元的狀態(tài)和神經(jīng)元之間的關(guān)系采用興奮-抑制(0-1)方式,這個(gè)模型可以執(zhí)行高級(jí)神經(jīng)活動(dòng)功能。神經(jīng)網(wǎng)絡(luò)模型具有計(jì)算能力,而這一切以前只能由人腦來完成。該文開創(chuàng)了邏輯符號(hào)主義學(xué)派人工智能和聯(lián)結(jié)主義人工智能研究的范式。
1956 年達(dá)特茅斯會(huì)議的一個(gè)成果就是紐厄爾和西蒙公布了一個(gè)程序“邏輯理論家”,它可以證明《數(shù)學(xué)原理》中的命題邏輯部分。1958年夏天,王浩在一臺(tái)INM-704機(jī)上只用了九分鐘就證明了《數(shù)學(xué)原理》中的一階邏輯的全部定理,他被認(rèn)為是定理證明的開山鼻祖。定理證明是極端的符號(hào)主義學(xué)派。所有符號(hào)主義學(xué)派的人工智能技術(shù)的基礎(chǔ)都是定理證明,如專家系統(tǒng)、知識(shí)表示和知識(shí)庫。在20世紀(jì)70年代初,人工智能發(fā)展遭遇瓶頸。莫拉維克這樣總結(jié)20世紀(jì)70年代人工智能領(lǐng)域遇到的障礙:首先,最難進(jìn)行自動(dòng)化,且計(jì)算機(jī)難以完成那些在人們看來最自然不過的事情,比如看、聽和利用常識(shí)進(jìn)行推理。這表明當(dāng)時(shí)的困境首先來自計(jì)算機(jī)本身的局限性,由于計(jì)算能力不足,無法解決指數(shù)型爆炸的復(fù)雜計(jì)算問題。其次,常識(shí)推理,需要大量對(duì)世界的認(rèn)識(shí)信息,而計(jì)算機(jī)沒有相關(guān)的知識(shí)儲(chǔ)備。
眾所周知,計(jì)算機(jī)技術(shù)的發(fā)展日新月異,因而硬件的局限性只是暫時(shí)的。而對(duì)于世界的信息獲取問題,也因?qū)<蚁到y(tǒng)的發(fā)展而得以解決。專家系統(tǒng)的知識(shí)表示、自然語言理解都可以用符號(hào)結(jié)構(gòu)來表示,常見的數(shù)理邏輯不夠用,需要新的邏輯系統(tǒng),如知識(shí)圖譜中的描述邏輯。顯然這是邏輯符號(hào)主義學(xué)派的做法,他們堅(jiān)信利用數(shù)學(xué)邏輯方式可以模擬人類大腦思維的運(yùn)行方式。而聯(lián)結(jié)主義學(xué)派則認(rèn)為通過對(duì)大腦結(jié)構(gòu)的仿真設(shè)計(jì)來模擬大腦的工作原理,即智能是源自大腦神經(jīng)元之間的鏈接,而非單個(gè)的神經(jīng)元。1982年,霍普菲爾德提出一種新的神經(jīng)網(wǎng)絡(luò),可以解決一大類模式識(shí)別問題,并給出了一類組合優(yōu)化問題的近似解。
1987年,由于美國蘋果公司和IBM公司生產(chǎn)的臺(tái)式機(jī)性能不斷提升,個(gè)人電腦的理念不斷蔓延,AI硬件的市場需求突然下跌。并且,由于互聯(lián)網(wǎng)的出現(xiàn),人類專家可以隨時(shí)隨地在網(wǎng)上解答問題,專家系統(tǒng)從而失去了存在的意義。
挑戰(zhàn)與機(jī)遇并存,神經(jīng)網(wǎng)絡(luò)在20 世紀(jì)80 年代由于互聯(lián)網(wǎng)的到來而被遮掩。隨后,互聯(lián)網(wǎng)產(chǎn)生的巨大的信息數(shù)據(jù)為神經(jīng)網(wǎng)絡(luò)的發(fā)展提供了更好的契機(jī)。深度學(xué)習(xí)之父辛頓站在神經(jīng)網(wǎng)絡(luò)大神霍普菲爾德的肩膀上,于1983 年發(fā)明了玻兒茲曼機(jī);到2006 年,他又開發(fā)出深度信念網(wǎng)絡(luò),一種用于受限玻兒茲曼機(jī)的快速學(xué)習(xí)算法,深度學(xué)習(xí)技術(shù)開始騰飛。神經(jīng)網(wǎng)絡(luò)由一層層神經(jīng)元構(gòu)成,深度學(xué)習(xí)就是利用具有多層神經(jīng)元的神經(jīng)網(wǎng)絡(luò)來進(jìn)行機(jī)器學(xué)習(xí)。從形式理論來看,一層網(wǎng)絡(luò)就是一個(gè)函數(shù),多層網(wǎng)絡(luò)就是多個(gè)函數(shù)的嵌套。層數(shù)越多,網(wǎng)絡(luò)越深,表達(dá)能力越強(qiáng),當(dāng)然伴隨而來的復(fù)雜度就呈指數(shù)級(jí)增長。深度學(xué)習(xí)技術(shù),催生了“智能就是大數(shù)據(jù)加深度學(xué)習(xí)”的觀念。神經(jīng)網(wǎng)絡(luò)是我們的終極算法嗎?深度學(xué)習(xí)是通向通用人工智能的正確路徑嗎?讓我們拭目以待。
機(jī)器能夠思考嗎?圖靈在1950年的《計(jì)算機(jī)與智能》一文中試圖回答這個(gè)問題。他提出了圖靈測(cè)試,詳細(xì)定義并解釋了人工智能及其研究目的、發(fā)展方向,并駁斥了當(dāng)時(shí)科學(xué)界及社會(huì)上普遍存在的反對(duì)觀點(diǎn)。這在今天看來依然具有深刻意義。圖靈測(cè)試表明,如果測(cè)試者無法區(qū)分人與機(jī)器在語言行為方面的差別,那么我們就可以認(rèn)為機(jī)器具有“智能”。圖靈在文末指明了兩條研究范式:符號(hào)派和聯(lián)結(jié)派。通過這兩種范式,計(jì)算機(jī)程序可以實(shí)現(xiàn)我們今天所說的通用人工智能或強(qiáng)人工智能。他這樣寫道:“我們或許期待著,有一天,機(jī)器能夠在所有純智能的領(lǐng)域中同人類競爭。但是從哪里起步最好呢?甚至這也是一個(gè)困難的抉擇。許多人認(rèn)為,非常抽象的活動(dòng),比如下棋,可能是最好的。也有人認(rèn)為,最好是給機(jī)器配備能買得到的最好的感覺器官,然后教它懂英語,并講英語。這個(gè)過程可以像通常教孩子那樣,指著東西,說出它們的名字,等等。我還是不知道正確答案是什么,但是我認(rèn)為兩種方法都應(yīng)該試一試?!盵2]90
《計(jì)算機(jī)與智能》一文引發(fā)了機(jī)器智能的技術(shù)探索,同時(shí)也引發(fā)了機(jī)器智能技術(shù)背后的哲學(xué)反思。德雷福斯是對(duì)機(jī)器智能進(jìn)行哲學(xué)反思最有影響力的哲學(xué)家之一,他認(rèn)為機(jī)器智能是不可能的。美國蘭德公司1965 年12 月出版了德雷福斯的P-2344 報(bào)告,題為《煉金術(shù)與人工智能》,尖銳唱衰人工智能,對(duì)人工智能早期發(fā)展提出了重大的挑戰(zhàn)。德雷福斯在該報(bào)告的基礎(chǔ)上進(jìn)行擴(kuò)充,于1972年出版了《計(jì)算機(jī)不能做什么:人工智能的極限》。該書專門對(duì)明斯基1968 年出版的人工智能論文集《語義信息加工》進(jìn)行了研究,并且把聯(lián)想主義心理學(xué)假設(shè)擴(kuò)充為生物學(xué)、心理學(xué)、認(rèn)識(shí)論和本體論四個(gè)方面的假設(shè),從而涵蓋了當(dāng)時(shí)人工智能研究方法的全部基礎(chǔ)。德雷福斯對(duì)人工智能在四個(gè)層面的理論一一進(jìn)行了駁斥。在生物學(xué)層面,麥克洛克-皮茨的神經(jīng)元是二元的;德雷福斯認(rèn)為人腦是模擬的。在心理學(xué)層面,人工智能學(xué)家表征為信息處理和規(guī)則;德雷福斯認(rèn)為信息和常識(shí)是無法用規(guī)則表示的。在認(rèn)識(shí)論層面,麥卡錫認(rèn)為所有的知識(shí)都是可以形式化的;德雷福斯認(rèn)為人的知識(shí)不是形式化的,人們可以用微分來描述物體運(yùn)動(dòng),但并不是物體在求微分。在本體層面,人工智能學(xué)者認(rèn)為世界由事實(shí)構(gòu)成,是可以還原的;德雷福斯認(rèn)為人和物是有區(qū)分的,物可以還原,但人需要現(xiàn)象學(xué)。正如德雷福斯所指出的,由于智能必須處在某一局勢(shì)之中,因此它不能同人類生活的其他方面分隔開來[3]。而人工智能學(xué)者認(rèn)為,日常生活中智能所需的一切都可以客體化并表達(dá)為一種信念系統(tǒng),智能的理解力可以形式化為事實(shí)和規(guī)則的復(fù)雜系統(tǒng),這在德雷福斯看來是毫無道理的。
德雷福斯并不孤獨(dú),批評(píng)人工智能的哲學(xué)家還有一位——塞爾,他在1980 年的《心靈、大腦和程序》一文中提出一個(gè)思想實(shí)驗(yàn)“中文屋”,這個(gè)思想實(shí)驗(yàn)就是要反駁即使是機(jī)器通過了圖靈測(cè)試,該機(jī)器依然不具有智能。塞爾認(rèn)為,計(jì)算程序至多是理解語法,但并沒有理解語義,信息必須內(nèi)化才是理解,即知識(shí)成為人身的一部分。也就是說,單純的形式化符號(hào)操控是沒有理解能力的,計(jì)算機(jī)硬件也不同于神經(jīng)蛋白,不具有意向性,缺乏生成心理過程所需的恰當(dāng)?shù)囊蚬芰ΑH麪栒J(rèn)為,只有一種機(jī)器能夠思維,實(shí)際上只有一些類型非常特殊的機(jī)器,即大腦和那些與大腦具有相同因果能力的機(jī)器才能夠思維[2]118。
機(jī)器智能技術(shù)的探索一直在發(fā)展,從當(dāng)初的邏輯符號(hào)學(xué)派到現(xiàn)如今如日中天的深度學(xué)習(xí),總是不斷地向機(jī)器智能方向逼近。2018年的圖靈獎(jiǎng)獲得者深度學(xué)習(xí)三巨頭之一的Yann LeCun指出,深度學(xué)習(xí)存在一些局限性,具體表現(xiàn)在以下幾點(diǎn):缺乏理論支持、推理能力欠缺、短時(shí)記憶能力需要加強(qiáng)以及無監(jiān)督學(xué)習(xí)能力弱[4]。首先,神經(jīng)網(wǎng)絡(luò)依然由經(jīng)驗(yàn)來搭建。網(wǎng)絡(luò)參數(shù)有可能只是一個(gè)局部最優(yōu),而不是全局最優(yōu),因而算法還有很大的優(yōu)化空間。深度學(xué)習(xí)目前不是一個(gè)發(fā)展完善的理論,還有很多地方需要加強(qiáng)研究。其次,深度學(xué)習(xí)最受詬病的是缺乏邏輯推理能力,在面對(duì)需要復(fù)雜推理的任務(wù)時(shí)受到一定限制。圖靈獎(jiǎng)得主、貝葉斯網(wǎng)絡(luò)之父珀?duì)栐贏rXiv上發(fā)布了他的論文《機(jī)器學(xué)習(xí)理論障礙與因果革命七大火花》,其中指出,當(dāng)前的機(jī)器學(xué)習(xí)系統(tǒng)幾乎都是以概率統(tǒng)計(jì)的方式運(yùn)行,不能作為通用智能的基礎(chǔ)。他認(rèn)為,突破口在于“因果革命”,借鑒結(jié)構(gòu)性的因果推理模型,能對(duì)自動(dòng)化推理做出獨(dú)特貢獻(xiàn)。
一句話,以目前的技術(shù),機(jī)器智能還需要走很長一段路。
人工智能領(lǐng)域最經(jīng)典的兩個(gè)思想實(shí)驗(yàn)——圖靈測(cè)試和“中文屋”(塞爾),說的是機(jī)器的自然語言理解問題。圖靈說,檢驗(yàn)機(jī)器智能的高低最好的辦法就是讓機(jī)器會(huì)自然語言并且理解自然語言;而塞爾說,機(jī)器會(huì)把英文翻譯成中文,還不是真正的理解,只有真正理解,機(jī)器才有智能。自然語言顯然是指人類日常使用的語言。機(jī)器理解人類的日常語言,就是用計(jì)算機(jī)科學(xué)中的算法和數(shù)據(jù)結(jié)構(gòu)的概念來建立一個(gè)語言的計(jì)算理論。相對(duì)于“自然語言”來說,這個(gè)計(jì)算理論就是“機(jī)器語言”。這兩者之間的差異是顯而易見的。機(jī)器語言是一套規(guī)則系統(tǒng),系統(tǒng)中的表達(dá)式都是遞歸生成的,語形和語義之間存在一一對(duì)應(yīng)關(guān)系,每一個(gè)語形符號(hào)的含義都是確定的。而自然語言并不完全是遞歸生成的,語形和語義之間并不存在一一對(duì)應(yīng)的關(guān)系,其相關(guān)性是在社會(huì)實(shí)踐活動(dòng)中逐步固定下來或逐步發(fā)生改變。也就是說,自然語言是靈活多樣的。兩者的形成機(jī)制并不一樣,因而自然語言帶來了一些有趣的計(jì)算性挑戰(zhàn),包括分詞、標(biāo)注、分類、信息提取、建立句法和語義表示等。但是從技術(shù)層面來看,語言計(jì)算模型和人類處理自然語言的方式的不一樣并不重要,重要的是計(jì)算機(jī)是否真的理解人類語言。
語言的計(jì)算模型就是自然語言的形式化。1956 年喬姆斯基在《句法結(jié)構(gòu)》一書中創(chuàng)建了轉(zhuǎn)換生成語法。他寫道:“這篇論文是從廣義(跟語義學(xué)相對(duì))和狹義(跟音位學(xué)及詞法相對(duì))兩個(gè)方面來討論句法結(jié)構(gòu)的。我們打算建立一種公式化的一般語言結(jié)構(gòu)理論,并且打算探討這種理論的基礎(chǔ)?!盵5]喬姆斯基的句法分析和自動(dòng)機(jī)有著密切的關(guān)聯(lián)。喬姆斯基把句法分成四種類型,即0型、1型、2型、3型。0 型文法等價(jià)于圖靈機(jī),1 型文法(上下文有關(guān)文法)等價(jià)于線性有界非確定圖靈機(jī),2 型文法(上下文無關(guān)文法)等價(jià)于下推自動(dòng)機(jī),3 型文法(正則表達(dá)式)等價(jià)于有限自動(dòng)機(jī)。顯然,形式語言理論成為一種可以計(jì)算的理論,可以直接應(yīng)用到自然語言的機(jī)器處理中,成為自然語言理解的有力工具。
形式語言理論的發(fā)展和人工智能的抱負(fù)分不開,自然在技術(shù)路線上也和人工智能的兩條路徑相吻合。以生成語言學(xué)為基礎(chǔ)的研究路徑,稱為理性主義,和邏輯符號(hào)主義學(xué)派相對(duì)應(yīng);以大規(guī)模語料庫分析為基礎(chǔ)的研究路徑,稱為經(jīng)驗(yàn)主義,和聯(lián)結(jié)主義相對(duì)應(yīng)。大規(guī)模語料庫的出現(xiàn)其實(shí)就是對(duì)基于規(guī)則分析方法的一個(gè)重要補(bǔ)充,也是研究目標(biāo)的轉(zhuǎn)向,機(jī)器通過自動(dòng)學(xué)習(xí)來獲取語言知識(shí)。
理解自然語言的核心是理解語言的意義。而在形式語言理論中對(duì)于語義的表示方法采用語言學(xué)的直觀表征還是數(shù)學(xué)或邏輯的形式表征,學(xué)界一直沒有取得共識(shí)。顯然語言學(xué)的直觀表征在語料庫中居多,通過對(duì)語言運(yùn)用實(shí)例的大量搜集、整理和分析,歸納出自然語言的典型特征,并用形式的方法表述出來。而數(shù)學(xué)或邏輯的形式表征更方便計(jì)算機(jī)的操控。邏輯的形式表征是將自然語言表達(dá)式的成分轉(zhuǎn)換成高階邏輯的表達(dá)式,數(shù)學(xué)的形式表征通過類型化特征結(jié)構(gòu)圖中的屬性—值來表示語法和語義信息。數(shù)學(xué)或邏輯的形式表征有一個(gè)潛在的原則——組合原則,即一個(gè)復(fù)雜表達(dá)式的語義由它的各個(gè)成分的語義及其組合模式得到。這一原則保證語句語義的遞歸生成,即一個(gè)復(fù)雜的表達(dá)式的語義可以遞歸計(jì)算。
生成語法理論之后衍生出眾多的語法理論,其中組合范疇語法在生成力和解釋力方面更加貼近自然語言。組合范疇語法CCG 是在古典范疇語法基礎(chǔ)上發(fā)展起來的,其優(yōu)點(diǎn)在于:它的句法和語義之間有一個(gè)透明的接口,每個(gè)詞條的語義表達(dá)式和句法范疇都被存放在詞庫的詞項(xiàng)上,句法范疇和語義類型、語義最后的表達(dá)式都可以基于詞庫中的范疇指派生成[6]。組合范疇語法CCG不僅滿足了自然語言處理所需要的句法分析,而且滿足了詞與詞之間的語義關(guān)系?,F(xiàn)階段的自然語言處理僅僅利用CCG的句法范疇進(jìn)行標(biāo)注和推演,忽視語義類型的標(biāo)注和推演,這使得CCG的句法分析器難以達(dá)到完美的效果。尤其對(duì)于意合型的漢語,這類語言句法上缺少嚴(yán)格的形態(tài)標(biāo)記,語序靈活,上下文依賴程度高。CCG 處理的效果更是不盡如人意。對(duì)于該問題的處理,鄒崇理的研究團(tuán)隊(duì)做了一系列的工作,特別是構(gòu)建了漢語CCG語料庫。該語料庫把基于短語結(jié)構(gòu)語法的賓州漢語樹庫轉(zhuǎn)換成基于組合范疇語法的漢語CCG 樹庫。漢語CCG 樹庫目前的一些句法分析在語義上是不合適的,還需要額外的手工標(biāo)注來獲得正確的分析。同時(shí)CCG 樹庫用相同的方式給相同類型的所有范疇提供共指標(biāo)記,顯然不夠嚴(yán)謹(jǐn),無法在語義上反映相應(yīng)的共指關(guān)系。造成這種現(xiàn)象的原因是范疇的標(biāo)注只是句法的,不含有語義信息。這表明CCG 漢語樹庫尚需進(jìn)一步完善,這就需要邏輯語義學(xué)研究的介入。
朱松純認(rèn)為,人工智能是小數(shù)據(jù)、大任務(wù),而不是相反[7]。環(huán)境中的智能體通過觀察操控環(huán)境中的有限信息(小數(shù)據(jù)),建立信息或行為之間的因果關(guān)聯(lián),從而做出復(fù)雜的行為(大任務(wù)),即具有因果推斷能力就可以在小數(shù)據(jù)的基礎(chǔ)上完成大任務(wù)。小數(shù)據(jù)、大任務(wù)的典范就是“烏鴉范式”:烏鴉進(jìn)城覓食,找到一枚堅(jiān)果,現(xiàn)在的任務(wù)是把堅(jiān)果砸碎。烏鴉發(fā)現(xiàn)路過的車輛會(huì)把堅(jiān)果軋碎,但是車流密集,自己也有可能被軋死。那么,覓食的任務(wù)就分解成兩個(gè)任務(wù):車軋碎堅(jiān)果,避免車輛軋到自己。它發(fā)現(xiàn)有紅綠燈的十字路口可以達(dá)成這個(gè)任務(wù)。它發(fā)現(xiàn)了車輛、人行道和紅綠燈之間的因果關(guān)系。也就是說,在這個(gè)過程中烏鴉并不需要大量的數(shù)據(jù),只需要少量的數(shù)據(jù),但是最重要的是在這少量的數(shù)據(jù)中有效地獲得因果關(guān)系,并根據(jù)這個(gè)因果關(guān)系制定相應(yīng)的行動(dòng)方案。也就是說,只有給機(jī)器配備了因果推理模型,機(jī)器才可以說是具有了智能。而因果推理模型則是結(jié)合了演繹推理和歸納推理等推理模式。早期的人工智能理論主流是基于邏輯符號(hào)的演繹推理,而現(xiàn)在如日中天的深度學(xué)習(xí)卻是基于大數(shù)據(jù)的概率統(tǒng)計(jì)推理,均不可能發(fā)明出真正的人工智能。
問題是怎么從數(shù)據(jù)中提煉出因果關(guān)系。這就需要一個(gè)因果模型。如果找到了這樣一個(gè)好的因果模型,那么我們就可以做實(shí)驗(yàn),從大數(shù)據(jù)中找到真正的因果關(guān)系。對(duì)于因果發(fā)現(xiàn)的方法,我們最熟悉的莫過于密爾五法,但是該方法存在很多的問題,可操控性弱。研究因果模型推理的杰出學(xué)者珀?duì)柊岩蚬譃槿齻€(gè)層面,并稱之為“因果關(guān)系之梯”:關(guān)聯(lián)、干預(yù)和反事實(shí)推理。這三個(gè)層面其實(shí)對(duì)應(yīng)于三個(gè)不同層次的認(rèn)知能力:觀察力(發(fā)現(xiàn)環(huán)境中的規(guī)律的能力)、行動(dòng)力和想象力。因果關(guān)系之梯的第一層級(jí)要求我們基于被動(dòng)觀察做出預(yù)測(cè)。其典型問題是:“如果我觀測(cè)到……會(huì)怎樣?”這個(gè)可用條件概率來表征:P(y | x)= p。就是說,假設(shè)我們觀察到事件x 時(shí),事件y 出現(xiàn)的概率等于p,即把x 和y 關(guān)聯(lián)起來。處于第二層級(jí)的“干預(yù)”則是主動(dòng)行動(dòng)起來,即怎么做??梢杂眯稳鏟[y | do(x)]的句子來表征,表述的是假設(shè)我們干預(yù)x,然后觀察事件y 的概率。第三層級(jí)的反事實(shí)就是思想實(shí)驗(yàn),如果我做出了不同的行動(dòng)結(jié)果會(huì)怎樣?這一層級(jí)需要用到回溯推理??梢杂眯稳鏟(yx | x′,y′)的表達(dá)式來刻畫,意思是:我們觀察到x 時(shí)事件y 的概率是基于我們實(shí)際上觀察到x′時(shí)y′的概率。珀?duì)栔赋觯骸耙蚬P(guān)系之梯的每一層級(jí)都有一種代表性生物。大多數(shù)動(dòng)物和當(dāng)前的學(xué)習(xí)機(jī)器都處于第一層級(jí),它們通過關(guān)聯(lián)進(jìn)行學(xué)習(xí)。像早期人類這樣的工具使用者則處于第二層級(jí),前提是他們是有計(jì)劃地采取行動(dòng)而非僅靠模仿行事。我們也可以通過實(shí)驗(yàn)來習(xí)得干預(yù)的效果,這大概也是嬰兒獲取大多數(shù)因果知識(shí)的方式。反事實(shí)的學(xué)習(xí)者處于階梯的頂級(jí),他們可以想象并不存在的世界,并推測(cè)觀察到的現(xiàn)象的原因?yàn)楹??!盵8]珀?duì)枏囊蚬P(guān)系之梯及其形式表達(dá)出發(fā),得出目前的深度學(xué)習(xí)還處于第一層面。僅僅停留在第一層面達(dá)不到真正的因果關(guān)系,還需要額外的條件,才能進(jìn)行因果推理。
珀?duì)栔赋?,因果關(guān)系之梯用因果圖就可以很好地說明。用因果圖來構(gòu)建因果模型不僅僅是畫箭頭,箭頭背后還隱藏著概率。當(dāng)我們繪制一個(gè)從X指向Y的箭頭時(shí),其實(shí)是在說,某些概率規(guī)則或函數(shù)具體說明了“如果X 發(fā)生改變,Y 將如何變化”。通常情況下,因果圖自身的結(jié)構(gòu)就足夠讓我們推測(cè)出各種因果關(guān)系和反事實(shí)關(guān)系:簡單的或復(fù)雜的、確定的或概率的、線性的或非線性的。正是在這個(gè)基礎(chǔ)上,珀?duì)柗Q之為“結(jié)構(gòu)因果模型”[9],該模型由三個(gè)部分構(gòu)成:圖模型、結(jié)構(gòu)化方程以及反事實(shí)和干預(yù)邏輯。其中,圖模型作為表征知識(shí)的語言,反事實(shí)邏輯表達(dá)問題,結(jié)構(gòu)化方程以清晰的語義將前兩者關(guān)聯(lián)起來。由此建立的因果關(guān)系演算系統(tǒng)能夠執(zhí)行一些當(dāng)前機(jī)器學(xué)習(xí)系統(tǒng)無法實(shí)現(xiàn)的任務(wù),并且是使用因果建模工具完成的。
愛因斯坦認(rèn)為,西方科學(xué)的發(fā)展是以兩個(gè)偉大的成就為基礎(chǔ)的,那就是希臘哲學(xué)家發(fā)明的形式邏輯體系,以及通過系統(tǒng)的實(shí)驗(yàn)發(fā)現(xiàn)有可能找出因果關(guān)系。我們現(xiàn)在依然在做這兩件事,用形式系統(tǒng)來刻畫智能,用形式系統(tǒng)找出數(shù)據(jù)或信息之間的因果關(guān)聯(lián)。什么是智能?從圖靈測(cè)試到“中文屋”,從大數(shù)據(jù)到因果推斷,到小數(shù)據(jù)、大任務(wù),其背后隱藏著理性主義和經(jīng)驗(yàn)主義、符號(hào)主義學(xué)派和聯(lián)結(jié)主義學(xué)派的哲學(xué)和方法之爭。
鄒崇理認(rèn)為,在自然語言理解中,理性主義走向極致,規(guī)則模式只能解析實(shí)際運(yùn)用的少量表達(dá)式;經(jīng)驗(yàn)主義走向極致,個(gè)案個(gè)例的羅列無章可循,不便從中識(shí)別不合法的表達(dá)式。怎樣進(jìn)行理性主義和經(jīng)驗(yàn)主義關(guān)于語義的深度融合?目前的研究重心是結(jié)合多種邏輯工具作為自然語言的語義表征,采用統(tǒng)一的機(jī)器算法和人工標(biāo)注相結(jié)合的方式,給漢語CCG句法分析樹庫匹配語義表征。
為了解決深度學(xué)習(xí)中的關(guān)系推理問題,深智團(tuán)隊(duì)(DeepMind)聯(lián)合谷歌大腦、MIT等機(jī)構(gòu)27位作者發(fā)表了一篇探究性的文章《關(guān)系歸納偏置、深度學(xué)習(xí)和圖網(wǎng)絡(luò)》,將圖的一階邏輯和概率推理結(jié)合到一起,試圖解決深度學(xué)習(xí)中的因果推理問題。深智團(tuán)隊(duì)也提供另外一種方案:傳統(tǒng)的貝葉斯因果網(wǎng)絡(luò)、知識(shí)圖譜與深度強(qiáng)化學(xué)習(xí)融合。這種方案也是困難重重。同時(shí)值得一提的是,馬爾科夫邏輯網(wǎng)是將馬爾科夫網(wǎng)絡(luò)與一階謂詞邏輯相結(jié)合的統(tǒng)計(jì)關(guān)系學(xué)習(xí)模型,具有強(qiáng)大的描述能力、邏輯推理能力和處理不確定性的能力。這些方案,暫時(shí)無法分出優(yōu)劣,也許是條條道路通羅馬,只有等到達(dá)人工智能的奇點(diǎn)之后才知道哪條路是可行的。
未來已來,正如圖靈所說:初見前路近可至,細(xì)思百事競待忙。(We can only see a short distance ahead,but we can see plenty there that needs to be done.)[10]