李 楠
在最強(qiáng)的意義上,人工智能需要全方位地模擬人類的能力,包括認(rèn)知能力、感受力等,甚至包括現(xiàn)象意識(shí)。于是,強(qiáng)人工智能的目標(biāo)是制造出“人造人”[1],而弱人工智能的目標(biāo)則是“制造出表面上具有人的全部心智能力的信息處理機(jī)器”[2]9。如果我們能造出在功能上全面模擬人類認(rèn)知能力的機(jī)器人,那么弱人工智能就實(shí)現(xiàn)了,不過(guò),如果她不能夠覺得疼、看到紅、欣賞音樂、感到不快,那么她也算不得強(qiáng)??紤]到人類心智能力的豐富多樣,弱人工智能一點(diǎn)兒也不弱。
比弱人工智能更弱的是只擅長(zhǎng)某一項(xiàng)或少數(shù)幾項(xiàng)認(rèn)知任務(wù)的機(jī)器人,為了方便討論,筆者將弱人工智能的定義泛化為模擬人類一項(xiàng)或多項(xiàng)認(rèn)知能力的信息處理機(jī)器。于是,在弱人工智能內(nèi)部,又可以分為狹義人工智能(Artificial Narrow Intelligence)和廣義人工智能(Artificial General Intelligence),后者又被稱為通用人工智能。根據(jù)彭納基(Pennachin)和格策爾(Goertzel)的定義,狹義人工智能是“在某一個(gè)專門領(lǐng)域——如下棋、醫(yī)療診斷、汽車駕駛、代數(shù)運(yùn)算等——表現(xiàn)出智能的程序?!盵3]1
狹義的人工智能系統(tǒng)擅長(zhǎng)執(zhí)行單一或有限范圍的任務(wù)。它們可以在其特定的領(lǐng)域中戰(zhàn)勝人類。但是,如果給它們新的問題,超出其擅長(zhǎng)領(lǐng)域的任務(wù),它們就無(wú)能為力了。目前,狹義人工智能也不會(huì)將知識(shí)從一個(gè)領(lǐng)域遷移到另一個(gè)領(lǐng)域,會(huì)下圍棋的計(jì)算機(jī)并不能自己學(xué)會(huì)下五子棋。
而通用人工智能則被設(shè)想為能在各種常見的認(rèn)知任務(wù)上達(dá)到人類的水平,甚至還可以有學(xué)習(xí)能力。雖然狹義人工智能還不能像人一樣解決各種問題,但這種技術(shù)已經(jīng)很有用了,為人類的生活帶來(lái)了許多便利,如搜索引擎使用了推薦算法,導(dǎo)航系統(tǒng)可以為司機(jī)提供最優(yōu)路徑,智能管家可以幫人安排家居生活,等等。目前,狹義的人工智能技術(shù)可以分為兩大類:符號(hào)人工智能和機(jī)器學(xué)習(xí)。
符號(hào)人工智能是老派的研究主流,依賴于程序員細(xì)致地定義規(guī)則,來(lái)定義各種條件下智能系統(tǒng)的行為。隨著海量數(shù)據(jù)的獲得和各種大數(shù)據(jù)相關(guān)技術(shù)的成熟,機(jī)器學(xué)習(xí)作為狹義人工智能的另一個(gè)分支,近年興盛起來(lái)。機(jī)器學(xué)習(xí)系統(tǒng)讓計(jì)算機(jī)根據(jù)現(xiàn)有數(shù)據(jù)對(duì)問題建模求解,并對(duì)未來(lái)的數(shù)據(jù)進(jìn)行預(yù)測(cè)。例如,機(jī)器學(xué)習(xí)算法可以在大量的瀏覽和購(gòu)買記錄上進(jìn)行訓(xùn)練,進(jìn)而預(yù)測(cè)用戶的喜好和點(diǎn)擊概率。深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)可以被看作廣義機(jī)器學(xué)習(xí)的分支。
需要說(shuō)明的是,對(duì)強(qiáng)人工智能、弱人工智能等諸種概念,學(xué)界和媒體都似乎有不同的定義,本文就按照上述定義進(jìn)行討論,參見圖1。
圖1 人工智能類型
人工智能的發(fā)展歷程中,有三次重要的人機(jī)“較量”,計(jì)算機(jī)分別在不同的智力活動(dòng)中戰(zhàn)勝了人類,引起了公眾的巨大關(guān)注。
第一個(gè)里程碑是IBM 的下棋計(jì)算機(jī)“深藍(lán)”,它在1997年擊敗了國(guó)際象棋世界冠軍加里·卡斯帕羅夫,引起了轟動(dòng)。需要注意的是,深藍(lán)只是狹義的人工智能,它只有在國(guó)際象棋這一智力活動(dòng)中有高超的水平,離通用人工智能還差得很遠(yuǎn)。
第二個(gè)是IBM 的計(jì)算機(jī)Watson。它是為知名問答節(jié)目“Jeopardy!”而生的,該電視節(jié)目以競(jìng)賽形式進(jìn)行,參與者得到答案,需要猜出正確的問題。例如,主持人給出答案“這位‘國(guó)父’并沒有真正砍下一棵櫻桃樹”,參與者應(yīng)該找到的正確問題是:“誰(shuí)是喬治·華盛頓?”“Jeopardy!”需要的知識(shí)和能力比下國(guó)際象棋更多。這個(gè)任務(wù)屬于開放領(lǐng)域問答,需要包括科學(xué)、文化、歷史、體育等諸多領(lǐng)域的知識(shí)。每場(chǎng)比賽有三個(gè)參與者,采取搶答形式。所以,除了豐富的知識(shí),還需要速度和技巧。
Waston 參賽時(shí)盡可能地模擬了人類選手,他使用英語(yǔ)作答,也模擬了按鍵搶答的方式。在比賽現(xiàn)場(chǎng),Waston 并沒有連接到互聯(lián)網(wǎng),而是可以離線訪問上億頁(yè)的信息[4]165。在2011 年,Waston 擊敗了“Jeopardy!”史上最優(yōu)秀的兩位參與者肯·詹寧斯和布拉德·拉特。在為期兩天的比賽中,Waston 贏得的獎(jiǎng)金是人類對(duì)手的3倍還多。
第三個(gè)里程碑是AlphaGo,由DeepMind 公司開發(fā)的下圍棋的機(jī)器人。2016 年3 月,AlphaGo 與圍棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行比賽,以4比1的總比分獲勝;2016年末2017年初,它在中國(guó)棋類網(wǎng)站上與中日韓數(shù)十位圍棋高手進(jìn)行快棋對(duì)決,連續(xù)60局無(wú)一敗績(jī);2017年5月,它與排名世界第一的世界圍棋冠軍柯潔對(duì)戰(zhàn),以3 比0 的總比分獲勝。AlphaGo 獲勝的另一個(gè)重要意義在于其使用了深度學(xué)習(xí)的技術(shù),這使得它和深藍(lán)完全不同。深藍(lán)依賴的是大量的規(guī)則,屬于符號(hào)系統(tǒng)的人工智能,然而AlphaGo使用的是神經(jīng)網(wǎng)絡(luò)的模型,通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練和蒙地卡羅樹搜索求解,其中不存在顯式的規(guī)則,甚至人類無(wú)法描述和理解神經(jīng)網(wǎng)絡(luò)擬合出的復(fù)合函數(shù)。
每次這種機(jī)器戰(zhàn)勝人類的事件出現(xiàn),都會(huì)有很多的爆炸性新聞報(bào)道,甚至說(shuō)“人類最后的智力驕傲即將崩塌”[5],但同時(shí)也有人覺得計(jì)算機(jī)顯然還比不上人。下面我們以Watson 為例,對(duì)這種人工智能的“聰明”程度做個(gè)評(píng)價(jià)。
我們之前就區(qū)分了狹義的和通用的智能,在狹義的層面,一個(gè)主體有智能,只需要在一項(xiàng)或少數(shù)幾個(gè)智力任務(wù)中表現(xiàn)得足夠好,足夠好大致可以理解為和普通人的水平差不多;一個(gè)主體比另一個(gè)在某項(xiàng)智力活動(dòng)中表現(xiàn)得更好,則意味著作為狹義的智能主體,前者比后者更聰明。下文將說(shuō)明在狹義的層面,Waston 比人類對(duì)手更聰明,或者說(shuō),作為狹義的人工智能,Waston有超過(guò)人類對(duì)手的智力水平。
首先,Waston的任務(wù)是真正需要智能的?!癑eopardy!”實(shí)質(zhì)上是一個(gè)開放領(lǐng)域的問題回答任務(wù)。參賽者必須配備足夠的認(rèn)知能力,包括理解自然語(yǔ)言、從記憶中檢索相關(guān)信息、做出符合邏輯或概率的合理決策,并形成人類可以理解的答案。舉例來(lái)說(shuō),當(dāng)一個(gè)選手聽到“我們的這位‘國(guó)父’并沒有真正砍下一棵櫻桃樹”這一線索時(shí),他必須能夠提取出“國(guó)父”和“櫻桃樹”等提示和關(guān)鍵詞,同時(shí)能夠理解“我們”在該語(yǔ)境中的指代,并對(duì)句子的否定部分進(jìn)行一些邏輯推理;當(dāng)他試圖找到正確的回答時(shí),他需要能夠利用關(guān)鍵詞在記憶中搜索,記憶中的知識(shí)是以一種方便檢索的方式組織和表示的,這個(gè)搜索過(guò)程可能最終不會(huì)完全匹配,這意味著需要對(duì)種種候選答案進(jìn)行評(píng)估和排序;最后,回答必須是問題形式,也就是說(shuō),檢索到的信息,無(wú)論以何種形式出現(xiàn),都必須轉(zhuǎn)化為一個(gè)句法正確的英語(yǔ)句子,以問號(hào)結(jié)尾。
其次,Watson 使用了與人類在解決同樣任務(wù)時(shí)相似的認(rèn)知能力,二者的能力是可以比較的。為了給出類似人類的表現(xiàn),Watson 的設(shè)計(jì)整合了自然語(yǔ)言處理、信息檢索、知識(shí)表征和推理等技術(shù),其工作流程大致反映了人類玩家的工作流程:獲取并分析線索、尋找答案、構(gòu)思對(duì)策,最后還有激活蜂鳴搶答器。首先,Watson 會(huì)提取線索中的關(guān)鍵詞,然后梳理它的“記憶”(對(duì)于Watson 而言,是一個(gè)15TB 的人類知識(shí)數(shù)據(jù)庫(kù)),尋找與這些詞相關(guān)的詞群,根據(jù)所有它能收集到的上下文信息來(lái)檢查最高命中率。當(dāng)它覺得足夠“確定”的時(shí)候,它就會(huì)決定發(fā)出蜂鳴聲。
第三,Watson 比詹寧斯和拉特更擅長(zhǎng)做“Jeopardy!”這樣的任務(wù)。原因很簡(jiǎn)單:Watson 穩(wěn)定地、大比分地在所有的比賽中勝出。鑒于這是一場(chǎng)公平的比賽,每個(gè)人都遵守了規(guī)則,Wtason 的成功并不是因?yàn)檫\(yùn)氣或作弊,因此,我們不得不承認(rèn),計(jì)算機(jī)在這項(xiàng)任務(wù)上確實(shí)更勝一籌,而且說(shuō)實(shí)話,要強(qiáng)得多。
最后還需要說(shuō)明的是,在一項(xiàng)需要X型智力的任務(wù)上更勝一籌,說(shuō)明擁有更多的X型智力。這是我們論證的另一個(gè)值得解釋一下的前提。在人類身上也有類似情況。假設(shè)在GRE 考試中Sally 在數(shù)學(xué)部分得到170 分,但Tim 只得到140 分。在這種情況下,我們會(huì)很自然地說(shuō)Sally 比Tim 更有數(shù)學(xué)天賦。那么基于類似的考慮,我們也應(yīng)該自然地說(shuō)Watson在知識(shí)問答任務(wù)中比詹寧斯和拉特有更高的能力。
的確,Watson 在其他類型的智力水平上遠(yuǎn)不如人類:他不能決定從演播室回到“家”的最佳路徑;他甚至恐怕都不知道什么是自己的“家”;他不能像詹寧斯那樣講一個(gè)機(jī)智的笑話,有風(fēng)度地輸?shù)舯荣?。諸如此類的例子不勝枚舉。但這并不影響Watson 是個(gè)優(yōu)越的狹義智能主體。在其他方面的智力匱乏并不會(huì)削弱某一個(gè)方面的智力。從通用智能的角度看,Watson 確實(shí)不如任何一個(gè)正常人,但在知識(shí)問答領(lǐng)域,他卻和任何人一樣優(yōu)秀。這背后的原因很簡(jiǎn)單?;氐轿覀僄RE 的例子,當(dāng)我們說(shuō)Sally 的數(shù)學(xué)比Tim 好的時(shí)候,我們并不關(guān)心Sally 的其他方面:也許Sally 的文字表述讓人費(fèi)解,也許她常常迷路,也許她毫無(wú)幽默感,但是這絲毫不會(huì)削弱我們對(duì)其數(shù)學(xué)天賦的認(rèn)可。
詹寧斯在輸給Watson時(shí)有句妙語(yǔ):“我,代表自己,歡迎我們新的電腦之王?!痹诖斯P者慎重復(fù)議,只不過(guò)Watson的疆土,只是“Jeopardy!”這一小小領(lǐng)域。
事實(shí)上,否認(rèn)狹義人工智能比人類更聰明的觀點(diǎn),通常都會(huì)采取這樣的形式:雖然計(jì)算機(jī)在當(dāng)前任務(wù)中戰(zhàn)勝了人類,但是計(jì)算機(jī)換一個(gè)領(lǐng)域、任務(wù)就無(wú)能為力了,它不會(huì)做的事還很多,所以計(jì)算機(jī)不如人類聰明。確實(shí),計(jì)算機(jī)還沒有通用的人工智能,但是根據(jù)我們之前的思路,這不影響我們承認(rèn)計(jì)算機(jī)在狹義的意義上比人類更聰明。我們可以更清晰地將反對(duì)意見構(gòu)造為下面的論證:
前提1:雖然人工智能在認(rèn)知任務(wù)X上比人類選手有更好的表現(xiàn),但他還不能做另一個(gè)認(rèn)知任務(wù)Y;
前提2:人類可以完成認(rèn)知任務(wù)Y。
結(jié)論:人工智能不比人類更聰明。
上述論證是個(gè)通用的框架,X可以是任何狹義人工智能擅長(zhǎng)的任務(wù),而Y可以是任何人類可以輕松完成、但狹義人工智能沒有實(shí)現(xiàn)的功能。但是,根據(jù)我們之前的討論,我們也可以構(gòu)造一個(gè)通用的反駁論證框架①感謝邢滔滔教授對(duì)這個(gè)論證初版的批評(píng)意見。如下:
前提1:如果主體A 在認(rèn)知任務(wù)X 上比主體H 有更好的表現(xiàn),且認(rèn)知任務(wù)X 需要的認(rèn)知能力為x,則主體A具有比主體H有更高的能力x;
前提2:如果能力y不同于能力x,那么主體A不具有能力y并不影響A具有能力x;
前提3:狹義人工智能不勝任的任務(wù)Y需要的能力不同于其擅長(zhǎng)任務(wù)所需的能力;
前提4:狹義的更聰明,指(狹義的)人工智能在其擅長(zhǎng)的認(rèn)知任務(wù)上比人類有更高的能力。
結(jié)論:人工智能在狹義上比人類更聰明。
這個(gè)論證中一個(gè)重要的概念是“認(rèn)知任務(wù)”,顯然并非所有的任務(wù)都是認(rèn)知任務(wù),否則,望遠(yuǎn)鏡比人類的視野更遠(yuǎn),就能得出望遠(yuǎn)鏡比人更聰明的荒謬結(jié)論②例子來(lái)自陳嘉映教授的批評(píng)。。要給認(rèn)知任務(wù)下定義,并非易事。一個(gè)容易想到的界定是以使用了認(rèn)知能力為標(biāo)準(zhǔn),即,認(rèn)知任務(wù)是使用了某個(gè)或某些認(rèn)知能力的任務(wù),但是認(rèn)知能力又需要進(jìn)一步說(shuō)明,而要說(shuō)明認(rèn)知能力恐怕又要用到認(rèn)知任務(wù)。所幸,我們對(duì)認(rèn)知任務(wù)和所涉及的認(rèn)知能力有常識(shí)性的、相對(duì)無(wú)爭(zhēng)議的理解,我們可以舉一些典型的例子,例如閱讀、寫作、算術(shù),這些是認(rèn)知任務(wù),其中涉及的能力是認(rèn)知能力。同時(shí),我們也都認(rèn)為單純的視覺、條件反射的行動(dòng)都不是認(rèn)知任務(wù)??傊?dāng)給出具體的任務(wù),我們可以相對(duì)無(wú)爭(zhēng)議地判斷這個(gè)任務(wù)是不是認(rèn)知任務(wù),而這對(duì)于我們當(dāng)前的論證就夠用了。
另外,對(duì)于討論人工智能是否比人類更聰明這樣的問題,我們確實(shí)無(wú)需定義認(rèn)知任務(wù),這是因?yàn)?,值得討論、存在?zhēng)議的任務(wù)當(dāng)然是認(rèn)知任務(wù),而且是爭(zhēng)論雙方都承認(rèn)的——畢竟,洗衣機(jī)和微波爐出現(xiàn)的時(shí)候,人們并沒有去考慮這些更會(huì)做家務(wù)的機(jī)器是否比人更聰明。
對(duì)于論證的反駁意見可能來(lái)自能力的“連續(xù)性”:也許有人會(huì)說(shuō),對(duì)于一個(gè)合格的智能主體,任何單項(xiàng)能力都不能單獨(dú)被割裂出來(lái),在某一領(lǐng)域或單項(xiàng)任務(wù)中表現(xiàn)優(yōu)異卻不具備其他領(lǐng)域的能力,只能表明這個(gè)主體還不是合格的智能主體。我們確實(shí)有這種傾向,認(rèn)為真正的“聰明”應(yīng)該是全方面的綜合能力,這體現(xiàn)在早年間對(duì)中國(guó)學(xué)生“高分低能”的批評(píng),以及現(xiàn)在對(duì)“小鎮(zhèn)做題家”的鄙視。然而,作為對(duì)前文論證的批評(píng),這種意見并沒有什么力量,因?yàn)樗呀?jīng)預(yù)設(shè)了狹義的智能不是真正的智能。
也許這個(gè)通用論證的結(jié)論會(huì)被認(rèn)為是平平無(wú)奇的,但是區(qū)分狹義和廣義(通用)的智能含義,對(duì)于理解和澄清圍繞人工智能是否比人更聰明這樣的混亂話題是有幫助的。
現(xiàn)在我們考慮狹義人工智能能否、如何走向通用人工智能。首先,通用人工智能不是多個(gè)狹義人工智能的簡(jiǎn)單疊加。以波蘭尼(Polanyi)和德雷福斯(Dreyfus)為代表的觀點(diǎn)認(rèn)為,人類有一種隱性知識(shí)是不能被計(jì)算機(jī)實(shí)現(xiàn)的;另外還有一種常見的看法是,計(jì)算機(jī)沒有創(chuàng)造力,也不能像人類一樣活學(xué)活用。本章會(huì)逐一討論這些看法,最后試圖說(shuō)明,創(chuàng)造力這樣的能力很可能是一種突現(xiàn)的性質(zhì),即使我們不能從底層物理結(jié)構(gòu)中看到創(chuàng)造力,但這不能構(gòu)成計(jì)算機(jī)擁有創(chuàng)造力的原則性困難。
一個(gè)相對(duì)沒有爭(zhēng)議的看法是通用人工智能還沒有實(shí)現(xiàn),而狹義人工智能已經(jīng)實(shí)現(xiàn)并且在很多領(lǐng)域被應(yīng)用了。表面看來(lái),通用人工智能和狹義人工智能的最顯著差異在于其完成的認(rèn)知任務(wù)數(shù)量不同,狹義人工智能專于一個(gè)或少數(shù)幾個(gè)領(lǐng)域,而通用人工智能應(yīng)該在人類常見的所有認(rèn)知任務(wù)上都至少可以達(dá)到人類水平。但是,通用人工智能顯然并不僅僅是在能力數(shù)量上比狹義人工智能多而已。如果二者的差別僅在能執(zhí)行的任務(wù)數(shù)量上,那么通用人工智能的實(shí)現(xiàn)恐怕并不十分困難。
假設(shè)在不遠(yuǎn)的未來(lái),我們有了分別在各個(gè)人類常用領(lǐng)域的狹義人工智能,他們各司其職,有的擅長(zhǎng)下棋,有的會(huì)寫文章,有的能管理財(cái)務(wù),有的替人規(guī)劃路線。那么我們完全可以設(shè)想用一臺(tái)超級(jí)計(jì)算機(jī),或者云平臺(tái),將這些狹義人工智能整合在一起,成為一個(gè)超級(jí)人工智能,他的能力就是所有這些狹義人工智能的并集。當(dāng)它需要規(guī)劃路線時(shí),就執(zhí)行規(guī)劃路線的模塊,當(dāng)它需要下棋時(shí),就調(diào)用下棋的函數(shù),等等。那么這樣一個(gè)綜合的人工智能,是否就是我們想要的、哲學(xué)家和科學(xué)家所說(shuō)的通用人工智能了呢?
并非如此。這樣一個(gè)綜合人工智能,離我們?cè)O(shè)想的全面模擬人類認(rèn)知能力的主體,似乎還差一些。一種容易想到的質(zhì)疑是,我們?cè)趺纯赡鼙WC窮盡所有人類可能執(zhí)行的認(rèn)知任務(wù),一一編碼為計(jì)算機(jī)指令,讓機(jī)器在對(duì)應(yīng)的任務(wù)場(chǎng)合下能夠調(diào)用呢?畢竟,短短五十年之前,人類社會(huì)還沒有給智能手機(jī)充電這樣的認(rèn)知任務(wù)。這種質(zhì)疑表面看來(lái)是對(duì)上述方案在實(shí)際可行性方面的否定——因?yàn)槲覀儾豢赡芨F舉出所有未來(lái)人類可能遇到的認(rèn)知任務(wù),但是其背后卻有更加實(shí)質(zhì)和原則性的擔(dān)憂——這樣的計(jì)算機(jī)還沒有應(yīng)對(duì)新問題、新任務(wù)的能力,不能將已有的知識(shí)技能主動(dòng)地遷移到類似的新領(lǐng)域,他會(huì)的一切都是通過(guò)人類顯式地編碼賦予的明確指令,離開他知識(shí)儲(chǔ)備中涵蓋的領(lǐng)域,他的智力就等于零。而我們想要的通用人工智能不能受限于此:像人類一樣聰明,就要像人類一樣,能舉一反三,溫故知新,對(duì)于沒見過(guò)的問題,也能利用見過(guò)的問題去嘗試求解。
有一種經(jīng)典的看法是,人類有一種“隱性知識(shí)”(tacit knowledge),不可言傳,甚至無(wú)意識(shí)的技巧,這些是計(jì)算機(jī)所無(wú)法掌握的。隱性知識(shí)的思想最早是由邁克爾·波蘭尼(Michael Polanyi)提出的。關(guān)于隱性知識(shí)的本質(zhì),波蘭尼在其《隱性維度》的開篇說(shuō)道:“我們知道的比我們能說(shuō)的多”[6]4。波蘭尼繼而給出一個(gè)人臉識(shí)別的例子?!拔覀冎酪粋€(gè)人的臉,并能在千人、甚至百萬(wàn)人中認(rèn)出來(lái)。然而,我們通常說(shuō)不出是如何識(shí)別的。所以,這種知識(shí)大部分都無(wú)法用語(yǔ)言表達(dá)?!盵6]4另一個(gè)常見的例子是騎自行車。騎自行車顯然是一種技能,需要“怎么做的知識(shí)”(know how)[7]29(用賴爾的術(shù)語(yǔ))。既然我會(huì)騎車,那么我就有這方面的知識(shí),可是我寫不出一套詳細(xì)指令,能讓一個(gè)不會(huì)騎車的人讀過(guò)就會(huì)騎車。
如果計(jì)算機(jī)能夠獲得的都只是可被言傳的顯式知識(shí),那么我們?nèi)祟愐兄氐姆N種隱性知識(shí)就不可能被計(jì)算機(jī)獲得。不過(guò),波蘭尼的思想顯然有更多復(fù)雜精微之處,我們暫不考慮,而是轉(zhuǎn)向?qū)θ斯ぶ悄芨苯拥呐u(píng),來(lái)自德雷福斯(Hubert Dreyfus)。德雷福斯在一系列著作中論證說(shuō),人類的智能和能力主要取決于無(wú)意識(shí)的過(guò)程,而非有意識(shí)的符號(hào)運(yùn)算,而這些無(wú)意識(shí)的技能不可能被形式化規(guī)則所充分刻畫。德雷福斯描述了人類獲得技能的層級(jí)(圖2)。
圖2 德雷福斯技能獲取模型
其中最低層次的是按照明確的指令的新手階段,而最高層次則是不依賴任何明確規(guī)則,憑豐富經(jīng)驗(yàn)和專業(yè)直覺的專家。而專家的知識(shí)最主要的特征就是隱性、意會(huì)的。要想用計(jì)算機(jī)模擬一個(gè)專家系統(tǒng),最困難且最重要的就是學(xué)到這些隱性的知識(shí)。可是,人類專家要想描述自己日常工作中如何憑經(jīng)驗(yàn)完成任務(wù)時(shí),他們通常只能明確描述更低層次的知識(shí),表現(xiàn)為規(guī)則和指令。這就意味著,依賴于明確規(guī)則的計(jì)算機(jī)系統(tǒng)不能刻畫專家的技能[8]36。
我們需要注意,德雷福斯的批評(píng)對(duì)象是依賴形式化規(guī)則的符號(hào)系統(tǒng)人工智能,而他的這一批評(píng)已經(jīng)被廣泛認(rèn)可。然而,近年來(lái)興起的機(jī)器學(xué)習(xí),尤其是使用大型神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,似乎已經(jīng)不再是簡(jiǎn)單的符號(hào)運(yùn)算了。相反,這些模型所擬合的函數(shù),其復(fù)雜程度之高,似乎也不能被“言傳”。如果是這樣,那么計(jì)算機(jī)也不僅僅是顯式規(guī)則的學(xué)習(xí)者,也可以通過(guò)大量實(shí)例獲得不可“言傳”的知識(shí)。當(dāng)然,有人會(huì)提出這樣的批評(píng),神經(jīng)網(wǎng)絡(luò)是一種表征學(xué)習(xí),仍然是想從事物中提取出對(duì)于完成任務(wù)最為重要的相關(guān)特征,特征在原則上是可以被言傳的,而專家知識(shí)在原則上就不是。要全面地衡量這里的爭(zhēng)議,我們需要對(duì)“可言傳”、專家知識(shí)等概念都有更清晰的界定,然而,筆者發(fā)現(xiàn)這很困難,因?yàn)閷<抑R(shí)或者專家技能,是被從負(fù)面定義的,即,不可被言傳的知識(shí),而從正面角度,似乎我們很難說(shuō)明它到底是什么。或許,專家知識(shí)的定義本身,也是只可意會(huì),不可言傳的吧。但是,至少,在實(shí)際可以被表達(dá)的意義上講,當(dāng)代神經(jīng)網(wǎng)絡(luò)擬合出的函數(shù),確實(shí)是不可被歸約為德雷福斯針對(duì)的符號(hào)系統(tǒng)的,即使在輸入端,我們知道文字被嵌入為字詞向量,圖片被抽象為實(shí)數(shù)矩陣,但是經(jīng)過(guò)層層復(fù)雜的線性和非線性變換,神經(jīng)網(wǎng)絡(luò)對(duì)文字和圖片的表征已經(jīng)不再是能被輕易描述的了。想想看,GPT-3這樣的語(yǔ)言模型,竟然有1750億參數(shù)。
另一種常見的意見是,計(jì)算機(jī)沒有創(chuàng)造力,也不懂變通。甚至,在原則上,我們就不能制造出有創(chuàng)造力和能變通的機(jī)器。這兩者其實(shí)都與“新”有關(guān),變通是指能接收和處理新的輸入數(shù)據(jù),而創(chuàng)造則是能產(chǎn)生新的結(jié)果。細(xì)究起來(lái),變通的難度并沒有那么高。有時(shí)候,人們說(shuō)到計(jì)算機(jī)只能處理一個(gè)領(lǐng)域的問題,是說(shuō)工程師在編寫程序的時(shí)候只能接收某一類型的輸入,但是這僅僅是個(gè)工程方面的實(shí)際問題,要解決的話也可以從工程方面著手。而更麻煩的,是計(jì)算機(jī)在面對(duì)全新的領(lǐng)域時(shí)是束手無(wú)策的。一個(gè)機(jī)器學(xué)習(xí)系統(tǒng)在微博評(píng)論的語(yǔ)料集上訓(xùn)練,用來(lái)判斷評(píng)論的情感傾向,可是在預(yù)測(cè)新聞情感傾向時(shí),卻完全不能給出合理的預(yù)測(cè),更不用說(shuō),如果讓這樣的系統(tǒng)去預(yù)測(cè)房?jī)r(jià)走向,即使我們調(diào)整其輸入值讓程序可以運(yùn)行,這個(gè)模型很可能只能隨機(jī)產(chǎn)生輸出。不過(guò),在這里,似乎也沒有原則性的困難。在某一個(gè)領(lǐng)域的語(yǔ)料集上訓(xùn)練的模型,在另一個(gè)領(lǐng)域的語(yǔ)料集上表現(xiàn)不好,這個(gè)困難有望被新的模型和技術(shù)所解決。而對(duì)于相差甚遠(yuǎn)的問題領(lǐng)域,或許我們應(yīng)該調(diào)整的是我們的期待。畢竟,當(dāng)我們說(shuō)人類懂得變通,能活學(xué)活用的時(shí)候,那些知識(shí)遷移的領(lǐng)域還是有某些相似性或相關(guān)度的,然而,在我們之前舉的例子中,從情感評(píng)價(jià)到房?jī)r(jià)回歸,這兩個(gè)領(lǐng)域似乎找不到多少相關(guān)性,即使對(duì)于人類而言,我們也沒有期待能將體會(huì)文字背后情感緯度的能力運(yùn)用到預(yù)測(cè)房?jī)r(jià)上。
更大的麻煩恐怕在創(chuàng)造力上,畢竟這個(gè)概念本身就令人捉摸不定。哲學(xué)史上有一些關(guān)于創(chuàng)造力的著名說(shuō)法:例如,柏拉圖認(rèn)為,詩(shī)人產(chǎn)生真正偉大的詩(shī)歌時(shí),并不是通過(guò)知識(shí)或技藝,而是被繆斯女神神圣啟發(fā)了,處于一種瘋狂的附體狀態(tài)[9]22;康德則將創(chuàng)造力與想象力聯(lián)系起來(lái),認(rèn)為藝術(shù)家的天賦是一種內(nèi)在的能力,能通過(guò)自由想象產(chǎn)生“典型的獨(dú)創(chuàng)性”的作品,而這種創(chuàng)造過(guò)程不遵循規(guī)則,學(xué)不來(lái)也教不會(huì),對(duì)于天才自己而言都是神秘費(fèi)解的[10]43-50。然而20世紀(jì)哲學(xué)領(lǐng)域?qū)?chuàng)造力的討論卻不多,即使有也主要集中在藝術(shù)哲學(xué)領(lǐng)域。
Gaut 定義創(chuàng)造力為使用天賦產(chǎn)生原創(chuàng)性和有價(jià)值的事物的能力,是主體性的一種特定實(shí)踐,只有人或者其他什么行動(dòng)者才能有這種能力[11]1041。原創(chuàng)性體現(xiàn)在創(chuàng)造物需要是新的,給人帶來(lái)驚奇;有價(jià)值也是一個(gè)必要條件,因?yàn)椴⒎撬行碌?、意料之外的東西都體現(xiàn)了創(chuàng)造力,當(dāng)我隨手亂敲鍵盤,打出一堆文法不通的文字,這段文字也是從沒出現(xiàn)過(guò)的、意料之外的,然而我的創(chuàng)造力(假如有的話)也完全沒有用到。從這個(gè)定義出發(fā),人工智能有創(chuàng)造力的障礙可能來(lái)自兩個(gè)方面。
1.創(chuàng)造性活動(dòng)是無(wú)目的性的,而計(jì)算機(jī)的活動(dòng)都是有目的的。
回應(yīng):一方面,從概念層面上,創(chuàng)造性的定義和無(wú)目的性并沒有什么內(nèi)在的緊密關(guān)聯(lián)。而且,人類的創(chuàng)造性活動(dòng)也并非全然無(wú)目的。我在寫下前面幾段文字之前并沒有將每個(gè)字每句話都了然于胸,而寫作活動(dòng)通常被認(rèn)為是展現(xiàn)了創(chuàng)造性的,所以,我的寫作(希望是)包含了創(chuàng)造性,但是我對(duì)寫作主旨、文字風(fēng)格都有個(gè)大概想法,對(duì)寫作的結(jié)果有大致預(yù)期,因而,從經(jīng)驗(yàn)層面上看,創(chuàng)造性活動(dòng)是可以有目的性的。事實(shí)上,一些認(rèn)知心理學(xué)家將創(chuàng)造力視作在問題空間的搜索過(guò)程,認(rèn)為創(chuàng)造過(guò)程是“目的論的,既受制于一開始就存在的、規(guī)定最終結(jié)果的計(jì)劃,又受制于在創(chuàng)造過(guò)程中產(chǎn)生的計(jì)劃?!盵12]286這樣看來(lái),計(jì)算機(jī)執(zhí)行創(chuàng)造性活動(dòng)是完全可能的,因?yàn)槿斯ぶ悄苤饕P(guān)注的就是在復(fù)雜的問題空間中求解。
2.創(chuàng)造力是一種不同于也不能歸約為任何知識(shí)技能的能力,而計(jì)算機(jī)只能存儲(chǔ)知識(shí)、模擬技能。
回應(yīng):首先有證據(jù)表明,創(chuàng)造力需要大量知識(shí),甚至是專業(yè)領(lǐng)域的知識(shí)[13]226,還有一些證據(jù)表明創(chuàng)造力在某種程度上是可以習(xí)得的[14]。這構(gòu)成了關(guān)于創(chuàng)造力和知識(shí)關(guān)系的“基礎(chǔ)論”,根據(jù)這種觀點(diǎn),知識(shí)對(duì)于創(chuàng)造力有正面作用,提供了基礎(chǔ),創(chuàng)造性成果是建立在特定領(lǐng)域的知識(shí)之上的。
當(dāng)然,這并不等于說(shuō),特定的知識(shí)和技能(假設(shè)我們能準(zhǔn)確找到是哪些)就足以產(chǎn)生出創(chuàng)造力,基礎(chǔ)論者也承認(rèn)“仍然有這種可能性,一個(gè)有深厚知識(shí)的人從未在其擅長(zhǎng)的領(lǐng)域做出創(chuàng)新”[13]248。不過(guò),這至少使創(chuàng)造力沒有那么神秘。
不過(guò),更棘手的問題在于我們似乎總是可以設(shè)想,兩個(gè)具備同樣知識(shí)和技能的人,一個(gè)有創(chuàng)造力,而一個(gè)沒有。一個(gè)能想到苯特殊的環(huán)狀分子結(jié)構(gòu),而另一個(gè)卻沒有想到。甚至,我們可以設(shè)想,兩個(gè)在物理層面完全一樣的主體,一個(gè)有創(chuàng)造力,而另一個(gè)卻沒有,至少可以設(shè)想,在同樣的場(chǎng)景下,一個(gè)突然寫出絕妙的詩(shī)句,而另一個(gè)卻沒有。靈感的火花似乎并不隨附于任何物理性質(zhì)。如果是這樣的話,那么即使我們能制造出在功能、行為上完美模擬人類、在知識(shí)技能方面比人類也毫不遜色的人工智能主體,我們還是不能保證這樣的機(jī)器是有創(chuàng)造力的,而差在哪里,我們似乎又不能確定。
但是,這種可設(shè)想的情況很可能并不構(gòu)成什么嚴(yán)重的質(zhì)疑。心靈哲學(xué)領(lǐng)域圍繞物理主義的爭(zhēng)論中有許多著名的基于可設(shè)想的情況的論證,然而即使這些可設(shè)想性論證的最積極捍衛(wèi)者也承認(rèn)可設(shè)想性與自然律相容——即使現(xiàn)象意識(shí)可以被設(shè)想為獨(dú)立于物理屬性,在我們的現(xiàn)實(shí)世界自然律約束下,現(xiàn)象意識(shí)也是被物理屬性決定的。類似地,即使我們可以設(shè)想創(chuàng)造力獨(dú)立于任何知識(shí)和技能,但是這并不能在原則上否認(rèn)計(jì)算機(jī)可以擁有創(chuàng)造力。我們可以進(jìn)一步將創(chuàng)造力看作一種突現(xiàn)的(emergent)性質(zhì),也許我們不能從物理結(jié)構(gòu)和底層屬性中“看到”創(chuàng)造力,但這并不蘊(yùn)含創(chuàng)造力不可能從電路、代碼、模型中產(chǎn)生。
回到我們一開始的定義,強(qiáng)人工智能需要實(shí)現(xiàn)人類的全部心理狀態(tài)和能力。這就包括現(xiàn)象意識(shí),以及審美能力、幽默感等依賴于現(xiàn)象意識(shí)的能力。
一方面,熟悉心靈哲學(xué)的人會(huì)馬上意識(shí)到前面有何其困難的問題:如果我們想知道AI是否有現(xiàn)象意識(shí),恐怕在概念上、從形而上學(xué)層面,就很困難。而另一方面,如果僅僅要AI 表現(xiàn)出有類似于人類的審美、幽默感,卻完全可以設(shè)想。例如,對(duì)音樂作品,可以構(gòu)造一種打分函數(shù),給人類認(rèn)為悅耳的音階打高分,并在高分作品中隨機(jī)選擇一個(gè)作為AI“最喜歡的”。當(dāng)然,這看起來(lái)很沒有藝術(shù)感,但是,當(dāng)他人說(shuō)這幅畫線條優(yōu)美、色彩和諧的時(shí)候,我們?cè)趺粗浪娴氖莾?nèi)心有所觸動(dòng)?
當(dāng)然,強(qiáng)人工智能似乎離我們還遠(yuǎn),我們首先要實(shí)現(xiàn)多種狹義人工智能,進(jìn)而制造出有創(chuàng)造力的通用人工智能,也許我們對(duì)這些都可以滿懷期待。