那順烏力吉
(內蒙古師范大學 法政學院, 內蒙古 呼和浩特 011517)
當前,對人工智能發(fā)展的程度,一些研究人工智能和計算機科學的專家或從事該領域工作的人員揭示,機器遠未達到人們所稱贊或期望的那種擁有感知、認知、思維推理和規(guī)劃等智能的程度*參見張玉宏《從深度學習“技因”缺陷看數(shù)據(jù)主義的進化方向》,載于《全國人工智能哲學與跨學科思維論壇論文集》。文中指出當前基于深度學習的人工智能具有“蠻力、‘暴食’數(shù)據(jù)居多、對某個小任務存在人工和能量消耗巨大”等缺陷。文中還引計算機科學家吳恩達對以深度學習為代表的人工智能的評價“表現(xiàn)雖然很精彩,但其水準還很低”來說明。。據(jù)加州大學洛杉磯分校計算機科學家朱松純介紹,由于人工智能這一領域范圍非常廣,如涉及機器學習、視覺識別、語言處理、機器人、博弈、認知和推理等多種領域,因而即使是在人工智能這一工程實踐中多年進行研究的某個專家,因其多年從事于某一領域的某一細節(jié)問題的研究,也很難管中窺豹,對人工智能的整體發(fā)展程度有所把握。
在這種背景下,朱松純在給中國科學院自動化所做的一次講座中,概述了人工智能領域的全貌以及各領域為使人工智能變成嚴格科學所做出的努力。他的講座使人們更清晰地看到了目前人工智能的研究現(xiàn)狀、成果以及機器人的靈敏度。他指出,目前的機器人不僅遠沒有達到智能化而且實際上非常愚笨,其任何一個小的動作例如開門都需要人在后面控制*參閱文獻[1],文中提到2015年,為了測試人工智能的技術現(xiàn)狀,美國國防部高級研究署在洛杉磯郊區(qū)Pomana做了一個DARPA Robot Challenge,其中韓國科技大學隊因救災現(xiàn)場開門、進行救災等突出表現(xiàn)拿下冠軍,不過開門等小動作都是人進行控制的。。
朱松純針對當前流行的大數(shù)據(jù)、深度學習以及人工智能發(fā)展中的瓶頸,提出了“小數(shù)據(jù)、大任務”范式。該范式基于如下哲學假設:“任務塑造了智能?!痹摷僭O與其他很多哲學假設類似,直觀且富有義理。筆者并不關注對這一哲學命題的論證。在此,筆者擬說明在“小數(shù)據(jù)、大任務”范式基礎上思考類比能否對人工智能工程技術提供一種思路。
當前,在人工智能領域盛行“大數(shù)據(jù)、小任務”研究范式。具有全局意識的計算機科學家朱松純提出將“小數(shù)據(jù)、大任務”作為人工智能研究的認知架構。他從“烏鴉在馬路上看到核桃,通過觀察,在人行橫道上綠燈亮后將核桃放下,然后在電線桿上等待車輛通過破開核桃殼,核桃核出來,又等到人行道上綠燈亮后飛來吃”的例子受啟發(fā)來論述“小數(shù)據(jù)、大任務”范式。他認為“智能是一種現(xiàn)象,表現(xiàn)在個體和社會群體的行為過程中”。智能系統(tǒng)的根源可以歸結為兩個前提條件:一是“物理環(huán)境客觀的現(xiàn)實與因果鏈條”。智能系統(tǒng)的一個條件是受物理因果鏈條束縛。物理是智能生命的邊界條件。對于一個智能生命的生活而言,物理因果是生活的邊界。因此他斷言,任何智能生命必須理解物理因果鏈條,并適應它。二是“智能物種與生俱來的任務與價值鏈條”。 智能生命在進化當中為了生存和繁衍順利地展開,存在與生俱來的任務需求。智能生命為了生存有尋找食物和保持安全的環(huán)境等任務需求;為了繁衍需要有交配和交往等任務需求。這些任務本身在具體場景中包含多個任務環(huán)節(jié)。此外,這些任務也產生了許許多多的派生任務以及更高級的任務。動物的行為是任務驅動的。任務可以由價值觀和決策函數(shù)來表示。
朱松純認為,有了物理環(huán)境的因果鏈條和智能生命的任務和價值鏈這兩個條件,其他的東西都是可以推導出來的。想要構造一個智能系統(tǒng),如機器人或游戲虛擬人,我們需要定義“身體的基本行動功能”,然后再定義“模型的空間”,這種“模型的空間”包括價值函數(shù)。朱松純用烏鴉的行為來類比說,智能生命就基于這兩個基本設置(行動功能和價值函數(shù))和進化中形成的兩個條件,與環(huán)境發(fā)生關系?!澳P偷目臻g通過價值函數(shù)、決策函數(shù)、感知、認知、任務、計劃等來表達,一個腦模型就是世界觀、人生觀、價值觀的一個數(shù)學表達。這個空間的復雜度決定了個體的智商和成就?!盵1]對于是什么使得這個模型在空間中運轉起來(也就是說學習如何展開)的問題,朱松純將以上兩個條件轉化為兩點:外來數(shù)據(jù)和內在任務。外來數(shù)據(jù)有兩個來源:觀察和實踐?!坝^察所得到的數(shù)據(jù)用于學習多種多樣的統(tǒng)計模型,統(tǒng)計模型是統(tǒng)計關聯(lián)與相關性,實際上就是某種時間與空間的聯(lián)合分布。實踐所得到的數(shù)據(jù)用于因果模型?!盵1]因果模型是刻畫行為和結果的一種模型,也就是刻畫行為和結果之間關聯(lián)性的模型。內在任務是進化中形成的內在的價值函數(shù)所驅動的行為。朱松純認為,由于任務不同,不同生物質能對環(huán)境中不同變量有不同的敏感度,這樣就形成了不同的模型。人腦和機器腦都可以看成是數(shù)據(jù)與任務的共同塑造。
在這種框架下,當前流行的深度學習方法是“大數(shù)據(jù)、小任務”范式?!按髷?shù)據(jù)、小任務”范式大體上是針對某個特定的任務設計一個價值函數(shù),然后用大量的數(shù)據(jù)訓練特定的模型。據(jù)維基解釋,大數(shù)據(jù)的大對于傳統(tǒng)的數(shù)據(jù)處理軟件而言不只在于數(shù)量的極大性,也在于不可計算的復雜度,因而無法用傳統(tǒng)的數(shù)據(jù)處理軟件來處理。朱松純指出,這種范式對某些特定的任務,如人臉識別或語音識別,非常受用;但這種范式的最大問題是不可能進行泛化和解釋的。泛化指的是將這種特定模型用到其他任務。
基于這一點,朱松純堅持多年來一直提倡的范式轉換:從“大數(shù)據(jù)、小任務”范式轉換到“大任務、小數(shù)據(jù)”范式。“大任務、小數(shù)據(jù)”范式也就是能夠進行大量任務,在進行任務時候使用很少的數(shù)據(jù)(至多剛剛夠完成任務*這個要求不是計算機科學家朱松純所限定,而是筆者通過理解加以限定的。)的研究范式。他為此給出了如下理由,認為人的各種感知和行為是由任務驅動的,它可以(朱松純說這是一種假設)由前面的基本設置來刻畫,不過對于智能生命而言,這種設置是億萬年進化而來的。通過進化而來的智能生命積累了大量的任務,然而完成某任務時大多只是依據(jù)小量的數(shù)據(jù)。
朱松純指出對于如何定義大量的任務、人到底對多少任務感興趣,以及所感興趣的任務是什么空間結構等問題,心理學和認知科學并沒有給出清楚的答案和說明。他認為這對于人工智能的發(fā)展而言是巨大的挑戰(zhàn)。不過,朱松純有一個哲學直覺:是任務塑造了智能,而非數(shù)據(jù)。
在此,計算機科學家朱松純通過描述人工智能發(fā)展給我們的一個啟示是“大任務、小數(shù)據(jù)”范式。在這種范式下,筆者擬探討類比對人工智能帶來的可能的啟示。
與朱松純教授相似,筆者也有一種哲學直覺:
a.任務塑造了智能;
b.在日常生活和科學活動的大多數(shù)任務中類比發(fā)揮了至關重要的作用,其中發(fā)揮更大作用的是類比學習;
c.因此,人工智能會從智能的類比學習中受到啟發(fā)。
上面的推論中隱含了這樣一個推理,如果任務塑造了智能,在智能的活動(日常生活和科學活動中的任務)中類比發(fā)揮了至關重要的作用,那么很可能類比在智能的塑造中占了很大的甚至極大的比重。這里的問題是我們對類比在日常生活和科學活動的任務中的角色的認識依然模糊不清,而僅僅停留在直覺層面上。即便如此,類比學習的路徑依然是值得探討和嘗試的。
與深度學習需要大量數(shù)據(jù)進行訓練不同,智能生命的學習是通過小量數(shù)據(jù)類比地進行學習。就如城市里的烏鴉吃核桃一樣,烏鴉只需知道安全區(qū)域(時間:紅綠燈轉換時;空間:人行道)和破殼工具(馬路上的車)。烏鴉在完成尋覓食物的任務中只需考慮很少數(shù)據(jù)(初次試吃時來回車輛會讓烏鴉逃竄,從而上電線桿上觀察)就能知道這些并成功完成任務。人們在日常生活中完成某項任務的時候也是運用小量數(shù)據(jù)通過類比推理來完成的。筆者從人工智能上的類比和人工智能中的類比兩方面闡述類比在人工智能工程實踐所具有的關鍵角色,并論述“大任務,小數(shù)據(jù)”范式下類比對人工智能的一種可能路徑。
人工智能上的類比意指在人工智能工程實踐中試圖要造出能進行類比推理的程序或機器,從而在機器上實現(xiàn)人類類比推理的這一實踐或研究。這一工程實踐通常是由認知科學對類比推理的研究所帶動的。這種帶動分為兩個派別:結構主義和基于案例的推理。這兩個派別各有各的人工智能程序。結構主義的程序有基恩特(Genter)的結構映射引擎(Structure-mapping Engine,簡稱SME)、霍葉科和薩伽德(Holyoak and Thagard,也譯撒加德)的類比約束映射引擎(Analogical Constraint Mapping Engine,簡稱ACME);基于案例的推理的程序有阿什利的Hypo軟件和卡布內爾(Carbonell)的天才程序(Prodigy)[2]65-81。這兩個派別分別從各自的原則或視角刻畫人類的類比推理實踐,從而試圖在計算機上實現(xiàn)類比推理。結構主義以系統(tǒng)性原則(principle of systematicity)為核心強調類比的源域到目標域的結構映射?;诎咐耐评韯t注重索引和案例庫,用過去的案例來解決未來相似的案例。結構主義是對科學實踐中類比推理進行分析的派別,而基于案例的推理則在日常生活和法律推理中盛行。阿什利的Hypo軟件就是為法律推理而設計的。這種人工智能上的類比實現(xiàn)的傳統(tǒng)最早可追溯到易萬思(Evans)那里。他于1968年創(chuàng)造了類比(ANALOGY)程序,是為處理幾何類比智能測試(geometric-analogy-intelligence-test)而設計的。較近的一種程序來自道格拉斯·霍夫施塔特(Hofstadter也譯為侯世達)和米歇爾(Mitchell)的模仿者程序(Copycat Program)。按照霍夫施塔德的論述,該程序是為了發(fā)現(xiàn)富有洞見的類比及其心理上實現(xiàn)的方式[2]83。它旨在解決如下類型的問題:“令字母序列abc由abd替換;那么如何以‘相同的方式’替換字母序列ijk?”模仿者以如下的概念來運作:后繼者、相同、最左邊、最右邊、第一個字母(僅只是a)、最后一個字母(僅只是z)、群(相連的字母)等。與前兩者不同的是,模仿者是基于霍夫施塔德的哲學直覺的:概念的模型是某種重疊的具有涌現(xiàn)的光暈的(emergent-halo)。在模仿者中,核心概念是靜態(tài)的、孤立的,它們與每一個作為概率云(probabilistic cloud)或光暈(halo)的節(jié)點相連。這些光暈是動態(tài)的、相互重疊的和流動的[2] 83-85。在運行上,模仿者相比結構主義和基于案例的推理的程序更像易萬思的程序。
人工智能中的類比意指人工智能在理論和工程實踐過程中通過類比推理受啟發(fā)或直接應用類比論證乃至以類比學習作為一個子分支的這種聯(lián)系。
追溯人工智能的歷史,可以看到從最先開始到當前人工智能發(fā)展的人工智能工程實踐中總是不乏受類比推理啟發(fā)或應用類比論證的事實。我們所稱的人工智能最早由圖靈做了很多基礎性的工作。這些工作包含在圖靈稱作智能機器的研究工作中,包括啟發(fā)式搜索、類神經元人工神經元網絡、遺傳或進化算法等[3]515-570。而第一次使用人工智能這一術語的是由麥卡錫主辦的達特茅斯會議。達特茅斯會議開啟了到20世紀60、70年代的以邏輯推理為主導的人工智能發(fā)展第一階段。筆者關注的是這一階段中類比處在什么位置這一問題。
在早期人工智能理論中,符號人工智能是卓越的理論之一。其提出者紐厄爾和司馬賀(也譯作西蒙)是基于如下著名的物理符號系統(tǒng)假設而提出的:“就一般智能行動來說,物理符號系統(tǒng)具有必要的和充分的手段……‘一般智能行動’來表示與我們所看到的人類行動范圍相同的智能……物理符號系統(tǒng)是通用機的一個例子。所以,符號系統(tǒng)假設就意味著智能將由一臺通用的計算機來實現(xiàn)?!盵4]紐厄爾和司馬賀在提出假設時應用了如下類比推理:物理符號系統(tǒng)對一般智能行動(人類行動范圍相同的智能);物理符號系統(tǒng)對通用圖靈機。科普蘭和普勞德富特較準確地將其概括為:“既然人類大腦的符號結構加工是人類智能的基礎,那么數(shù)字計算機的符號加工也足以產生人工智能?!盵3]527紐厄爾和司馬賀提出的物理符號理論是一種假設,它是基于計算機科學是像經濟學和細胞學說以及地質學那樣的經驗學科這種假設基礎上的理論。對計算機科學而言,其實驗就是制造新的計算機器和程序。
不難發(fā)現(xiàn),紐厄爾和司馬賀在物理符號系統(tǒng)假設中都應用了類比推理。這或許是因為人工智能的不確定性、模糊性以及人們對人工智能難于清晰把握所致。另外,類比本身的猜測性以及或然性也可能使其作為一個可取的方法??傊谌斯ぶ悄艿脑缙跉v史中,人工智能中的類比不是罕見的事情。
人工智能中期是指從20世紀80年代到近幾年之前的階段。這一階段以概率模型、統(tǒng)計建模、機器學習、隨機算法為主要研究內容。在該階段,人工智能中的類比表現(xiàn)在某個子分支如機器學習理論中,例如依據(jù)類比而構建其學習理論的研究方向。這一領域是基于案例的學習理論。一個明顯的特征就是這一階段的類比與人工智能的類比有重合的部分*關于這一點成果很多,其中較為顯著的成果有Manuela M. Veloso: Planning and Learning by Analogical Reasoning, Springer-Verlag, 1994; Eyke Hüllermeier: Case-Based Approximate Reasoning, Springer,2007。。
當前盛行的“大數(shù)據(jù)、小任務”范式下的深度學習是第三階段,是近幾年才剛剛興起的。它是人工智能學習理論中的很小的一個分支。前面已提到計算機科學家朱松純所指出的這種范式的問題。在此,我們可以將其問題概括為:(1)它不直觀,與智能生命完成任務過程不符;(2)更為致命的是,它只能通過大量訓練才能完成特定任務,并且無法泛化。然而,智能生命是可以泛化的。
計算機科學家將“泛化”定義為把特定模型用到其他任務的過程。如果我們從哲學上辨析泛化,它具有兩種意義:第一種是在一個領域內從一個任務的處理到相似的另一個任務的處理(如棋類中多種不同棋,甚至改變規(guī)則后的相同棋);第二種是跨領域的處理(如從棋類跨到其他領域)。實際上智能生命的日常生活乃至科學活動中泛化任務是一種類比推理實踐*這是筆者的哲學直覺,有待討論和展開。。智能生命從一個任務到另一個任務,依據(jù)相似性進行類比推理,并未涉及大數(shù)據(jù)方法、深度學習就可以迅速在與環(huán)境的互動中完成任務。例如,學習語言的時候,對一種新語言的語音或拼寫,我們往往運用母語的相似音來標音或拼寫以便記住。在這種過程中,我們不需要大量的數(shù)據(jù)和深度學習。這是按照相似性類比學習的典型例子。因此,我們認為小數(shù)據(jù)的類比推理為人工智能提供了一種可能的發(fā)展方向。正如張玉宏在分析人類的“舉一反三”的方法后指出,“遷移學習”*參見張玉宏《從深度學習“技因”缺陷看數(shù)據(jù)主義的進化方向》,載《全國人工智能哲學與跨學科思維論壇論文集》,第34頁。(“把過往其他類似的模型遷移過來”)是人工智能的發(fā)展方向之一。
然而,這里的問題是機器不能像智能生命那樣靈活行動,其原因或許是因為沒有像智能生命一樣的復雜的整體的有機系統(tǒng)。因此,如果想讓機器也像人或其他智能生命一樣行動,那么就需要將人類的類比推理符號化。機器只能夠懂得(在輸入輸出的寬泛意義上的)抽象符號。因此,筆者認為刻畫人類類比推理并將其符號化是人工智能的一種可能路徑。
類比推理符號化是一個正在形成的領域。我們看到,基于案例的推理的學習理論和類比學習理論是類比推理符號化的領先者。此外,近來逐漸形成了另一種類比推理符號化的道路:類比推理形式化[5] 564。數(shù)學類比研究、認知科學中類比研究和為溯因推理而提出的類比論證理論為我們提供了有益的啟示。