李喆
一九九六年二月,計(jì)算機(jī)國際象棋軟件“深藍(lán)”挑戰(zhàn)棋王卡斯帕羅夫,以二比四落敗。
一九九七年五月,“深藍(lán)”卷土重來,以三點(diǎn)五比二點(diǎn)五戰(zhàn)勝卡斯帕羅夫。此后,國際象棋軟件不斷變強(qiáng),成為人類棋手學(xué)習(xí)的工具。
中國象棋、國際跳棋、五子棋、日本將棋……計(jì)算機(jī)在這些棋類項(xiàng)目迅速突破,很長一段時間里,圍棋成了最后的堡壘。
二○一五年十一月,北京舉行了一次世界計(jì)算機(jī)圍棋錦標(biāo)賽,奪冠的韓國軟件挑戰(zhàn)中國職業(yè)棋手連笑,在受讓四子、五子的條件下仍然落敗,只在受讓六子的條件下取得了勝利。這樣巨大的差距使人們認(rèn)為,計(jì)算機(jī)在圍棋競技上擊敗人類棋手,仍然相當(dāng)遙遠(yuǎn)。
“阿爾法圍棋”(AlphaGo)的出現(xiàn)顛覆了這一判斷。二○一六年一月,谷歌旗下“深度思維”(DeepMind)團(tuán)隊(duì)在英國《自然》雜志上發(fā)表文章,公布了“阿爾法圍棋”在去年十月以五比零擊敗歐洲圍棋冠軍樊麾的棋譜,并確認(rèn)將挑戰(zhàn)韓國職業(yè)棋手李世石九段。消息一出,舉世關(guān)注。李世石九段是近十幾年世界圍棋競技賽場成績最優(yōu)者,獲得過十四次世界冠軍。人機(jī)對弈之前,棋界大多數(shù)人認(rèn)為李世石必勝無疑,科技界則大約一半人認(rèn)為李世石會贏。
今年三月九日至十五日,圍棋人機(jī)大戰(zhàn)吸引了全世界的目光。結(jié)果出乎多數(shù)人預(yù)料,“阿爾法圍棋”以四比一的比分戰(zhàn)勝了李世石。
震驚、興奮、不解、懷疑……“阿爾法圍棋”是怎么贏的?
圍棋是一個封閉的復(fù)雜空間,其復(fù)雜程度是棋類之最,人和計(jì)算機(jī)都難以通過暴力計(jì)算達(dá)到窮盡?!鞍柗▏濉比〉猛黄频暮诵脑谟谏疃葘W(xué)習(xí)方法,這一方法也是目前人工智能領(lǐng)域最熱門的方向。它構(gòu)建了兩套神經(jīng)網(wǎng)絡(luò),對人類大量的棋譜進(jìn)行學(xué)習(xí),在此基礎(chǔ)上進(jìn)行“左右互博”,即自對弈學(xué)習(xí)。深度學(xué)習(xí)的一大特點(diǎn)是,它不依賴于任何對象的具體知識,只需通過大量圖像和結(jié)果的比對就能完成學(xué)習(xí)。深度學(xué)習(xí)的方法在二○○六年就已經(jīng)出現(xiàn),但在近年大數(shù)據(jù)的背景下才展現(xiàn)出驚人的威力。
“阿爾法圍棋”通過深度學(xué)習(xí),在形式上達(dá)到了擬人的效果。最顯著的特點(diǎn)是類似人的“直覺”。棋手面對一個局面,通常會有所謂的“第一感”,這是棋手的直覺。直覺起到了非常關(guān)鍵的剪枝作用,把棋盤上眾多的點(diǎn)都直接排除在外,只用考慮直覺留下的一些選點(diǎn),對它們進(jìn)行深入的計(jì)算和比較?!鞍柗▏濉蓖ㄟ^深度學(xué)習(xí)的訓(xùn)練獲得了類似的“直覺”,大幅縮小選點(diǎn)范圍,同樣起到了剪枝的作用。
對一步棋做出決策,人和“阿爾法圍棋”同樣是使用了剪枝+計(jì)算這樣的形式。但是,在具體剪枝和計(jì)算的方法上,人與“阿爾法圍棋”又非常不同。具體到每一手棋,人的直覺來自對類似局面的印象和知識?,F(xiàn)代競技圍棋所強(qiáng)調(diào)的“熟練度”,在很大程度上因?yàn)槭炀毘潭扰c印象的準(zhǔn)確性有很強(qiáng)的關(guān)聯(lián)。知識則主要是如“定式”“棋形”“套路”等等人類經(jīng)驗(yàn)的抽象?!鞍柗▏濉钡摹爸庇X”是由神經(jīng)網(wǎng)絡(luò)給出的選點(diǎn),其本質(zhì)是大數(shù)據(jù)和圖像。
剪枝之后,還需要對這些選點(diǎn)進(jìn)行計(jì)算和決策。棋手的決策由多環(huán)節(jié)構(gòu)成,主要部分是概念的抽象和邏輯演繹,有時在局部近似地使用窮舉,有時輔以綜合了經(jīng)驗(yàn)和數(shù)學(xué)的全局判斷,最終做出選點(diǎn)決策。“阿爾法圍棋”的搜索計(jì)算使用了蒙特卡洛方法,對全局進(jìn)行隨機(jī)模擬,最后與神經(jīng)網(wǎng)絡(luò)結(jié)合,給出選點(diǎn)的勝率預(yù)估。
“阿爾法圍棋”基于全局勝率的算法導(dǎo)致了一個結(jié)果,即它的“大局觀”強(qiáng)于“局部計(jì)算”,這是很多人沒有想到的。計(jì)算機(jī)確實(shí)應(yīng)該強(qiáng)于計(jì)算,但對于“阿爾法圍棋”來說本來就沒有“局部”的概念。這是它的弱點(diǎn),也是長處。蒙特卡洛的隨機(jī)性使得“阿爾法圍棋”不追求最優(yōu),最優(yōu)的判定依賴于邏輯,“阿爾法圍棋”的決策則依賴概率,概率的準(zhǔn)確性不如邏輯。因此我們常常會看到“阿爾法圍棋”下出一些急于“定型”甚至稍虧的棋,這是由于它認(rèn)為對方雖然大概率會正確應(yīng)對,但每步棋都有犯錯的概率?!岸ㄐ汀钡南路ㄓ蒙蕴潛Q取這個概率,對于它的勝率而言是有利的。當(dāng)然,從邏輯的角度,這類定型對方犯錯的概率可以忽略不計(jì),因此棋手通常會選擇“保留變化”。
棋手常常無法對全局有十分清晰的把握,因此希望在局部通過計(jì)算和邏輯找到最優(yōu)下法,對全局的判斷也常常是根據(jù)局部優(yōu)劣的疊加?!鞍柗▏濉薄安痪行」?jié)”,卻總是對全局有更為清晰的認(rèn)識。這讓我們反思,對局部最優(yōu)的追求是否遮蔽了我們對全局的把握?
大局觀,整體性,“阿爾法圍棋”給人類上了一課——雖然它“自己”并不知道。
春信香深雪,冰肌瘦骨絕。梅花不可知,何處東風(fēng)約。
這是一首詠梅絕句,作者名叫“薇薇”。
薇薇是個人工智能。
三月十日下午,“阿爾法圍棋”對陣?yán)钍朗诙?,落下第三十七手。這是圍棋中少見的驚艷一手,吳清源大師的風(fēng)采躍然盤上。
“阿爾法圍棋”是個人工智能。
讀者若以為薇薇是一女子,或許會由此詩而產(chǎn)生與作者的情感共通。那么,詩中傳遞的情感與美,究竟是作者所賦予,還是讀者所賦予?“阿爾法圍棋”的“創(chuàng)造性”著法,究竟意味著什么?
機(jī)器本身沒有情感,但當(dāng)我們把機(jī)器的作品誤認(rèn)為人的作品時,便很可能從作品里體會到作者的“情感”。這是藝術(shù)學(xué)里一個值得探討的重要問題??巳R夫·貝爾將藝術(shù)的本質(zhì)屬性定義為“有意味的形式”,那么,機(jī)器是否也能“創(chuàng)造”出這種“有意味的形式”?
在這次人機(jī)對弈之前,我們認(rèn)為圍棋軟件沒有創(chuàng)造力,它只是會單純地模仿人類棋譜而已。但在這五局棋中,我們看到“阿爾法圍棋”下出了很多超出定式范圍的、棋譜中沒有的精彩招法。其“創(chuàng)新頻率”遠(yuǎn)高于任何一名職業(yè)棋手。
這是一件值得深思的事情:“阿爾法圍棋”到底有沒有創(chuàng)造力?
如果“阿爾法圍棋”這五盤棋是一個人類棋手下出來的,我們不僅會贊嘆他的實(shí)力,還會評價他“極富創(chuàng)造力”。圍棋盤上的“創(chuàng)造力”,正是體現(xiàn)在超出尋常經(jīng)驗(yàn)的有效選點(diǎn)和構(gòu)思。這樣的創(chuàng)新,是許多追求棋道的棋士窮其一生去追尋的東西,它標(biāo)志著對固有思維的突破、對平庸的超越,以及對真理的趨近。
“阿爾法圍棋”本質(zhì)上是一個工具?;\統(tǒng)來看,“阿爾法圍棋”與人對弈,是它接收一個數(shù)據(jù),然后輸出一個數(shù)據(jù)的過程。深度學(xué)習(xí)和蒙特卡洛算法,使接收和輸出的數(shù)據(jù)變得更強(qiáng),更接近正確的圍棋下法,但并未改變它的本質(zhì)。在哲學(xué)的意義上,“阿爾法圍棋”不是一個主體。它沒有自我意識,沒有自由意志,沒有創(chuàng)造和爭奪的欲望。它下出的在我們看來很有“創(chuàng)造力”的著法,只是它一局棋中輸出的一百多次數(shù)據(jù)中平凡的幾次而已。它并不知道自己在下棋—甚至它也沒有“自己”的概念。
雖然“阿爾法圍棋”所有的“創(chuàng)造性”招法都只是工具對于數(shù)據(jù)信息處理之后的反饋,但對于我們?nèi)祟?,這些招法卻有巨大的價值。價值的根源在于,“阿爾法圍棋”用數(shù)據(jù)的方式給出的選點(diǎn),人類可以用道理的方式來接收。這導(dǎo)向了兩方面的價值:其一是圍棋技術(shù)的提升。這些新招拓寬了棋手的視野,使人類棋手在圍棋的天地中有了一個很好的參照物,從而能夠離圍棋真理更近一點(diǎn)點(diǎn);其二是思維方式的提升,隨著對這些新招的逐漸理解、對圍棋真理的不斷趨近,我們的思維也能夠得到提升。
一首詩,在它呈現(xiàn)給讀者的時候,便不再只屬于作者了。
電影《2001太空漫游》的開頭,一個猿人從動物尸骨中拿起了一根骨頭。繼而,他所在的族群開始使用骨頭捕獵,并擊退了前來競爭水源的同類。導(dǎo)演庫布里克用這樣一個事件來描繪“工具”的出現(xiàn)。如果真的存在這個事件,那么它很可能會是人類歷史上最重要的時刻之一。一九六八年上映的這部電影里,骨頭的意象穿越時空,變成了太空飛船。飛船執(zhí)行任務(wù)的過程中,操作飛船的計(jì)算機(jī)接收到兩個矛盾的命令,導(dǎo)致它選擇殺死飛船上的所有人,由“自己”去執(zhí)行任務(wù),這一事件則引發(fā)了一系列人類不能理解的類似進(jìn)化的變化。一個充滿寓意的黑色方碑貫穿了整個影片。
人工智能,在迄今為止的工具進(jìn)化史中,它的出現(xiàn)很晚。越晚出現(xiàn)的工具,力量通常會越強(qiáng),人們對它的迷戀和恐懼也會越大。二○一六年,人工智能的進(jìn)度雖然還沒有如科幻小說和電影中設(shè)想的那樣對人類造成威脅,但在圍棋上完成了壯舉。
從衣食住行到人際交往,現(xiàn)代人的生活中充滿了各種工具。人工智能,或許是人類創(chuàng)造的工具中最獨(dú)特的一種。它近似地?fù)碛辛巳祟惖囊恍┠芰?,甚至在很多方面可以比人類做得更好。隨著深度學(xué)習(xí)引發(fā)的這一波熱潮,人工智能在醫(yī)療等領(lǐng)域中的廣泛應(yīng)用可以預(yù)見。如之前的很多工具發(fā)明一樣,這些人工智能的應(yīng)用會改善我們的生活品質(zhì),將人們從一些繁瑣的勞動中解放出來。與傳統(tǒng)工具不同的是,人工智能有很大的發(fā)展空間,這也使一些人產(chǎn)生了擔(dān)憂。
科幻小說和電影中,常常描繪人工智能反制人類的情境。一旦計(jì)算機(jī)有了情感好惡,能夠自主選擇行為,那么它不斷強(qiáng)大的力量既可以保護(hù)人類,也可以毀滅人類。當(dāng)然,這種情境的發(fā)生需要一個預(yù)設(shè)條件:計(jì)算機(jī)能夠產(chǎn)生自我意識和自由意志。在實(shí)現(xiàn)這個條件之前,人工智能不是主體,只是工具。
自我意識與自由意志,關(guān)于它們的來源,人類自身也知之甚少。有一種還原論的傾向,認(rèn)為自我意識與自由意志都可以分解為低級的元素,最終被數(shù)學(xué)和物理解決,但顯然目前這只是一個猜想或主張。而哲學(xué)上對它們的討論也是眾說紛紜,其中一個有代表性的觀點(diǎn)來自康德,他把自由意志看作一個對人而言必要的懸設(shè)。
我們不知道如何能夠賦予他物以自我意識和自由意志。斯皮爾伯格的電影《人工智能》里,科學(xué)家給一個機(jī)器人輸入了情感,使他走向了尋找自我和人性的道路。這個輸入究竟是否可能實(shí)現(xiàn)?以我們目前的知識體系來看,是相當(dāng)可疑的——單是數(shù)據(jù)的疊加和算法的改進(jìn),不足以使工具成為主體。
但是,對人工智能的擔(dān)憂仍然并非完全沒有道理?!皺C(jī)器人不得傷害人類,或坐視人類受到傷害”,這是阿西莫夫著名的機(jī)器人第一定律。這一定律的可靠性受到他自己小說的攻擊,其中典型的案例是:“機(jī)器人認(rèn)為將人類軟禁起來才能夠防止他們互相傷害。”人工智能對命令的多元理解可能會導(dǎo)致失控,這是比人工智能產(chǎn)生意識更值得擔(dān)憂的事情。
另一個更大的危險則在于,人類對人工智能的惡性使用。作為工具的計(jì)算機(jī)本身并無善惡,但人心卻有善惡。人工智能的發(fā)展將為人類社會帶來很多效益,但也增加了人類自我毀滅的能力和概率。此外,隨著計(jì)算機(jī)能力的增強(qiáng)和廣泛應(yīng)用,與人工智能相關(guān)的倫理建設(shè)將會成為非常重要并且相當(dāng)困難的課題。但是,現(xiàn)階段的人工智能,仍然只是工具?!鞍柗▏濉钡某霈F(xiàn)并未對這一結(jié)論產(chǎn)生任何影響,也沒有增加計(jì)算機(jī)產(chǎn)生自我意識的可能性。
與其他工具不同,人工智能在工具效用之外,還有幫助人類進(jìn)行反思的作用。當(dāng)我們的許多能力和勞動被人工智能取代,作為人的我們,其本質(zhì)究竟是什么?應(yīng)該追求的又是什么?隨著人工智能的不斷發(fā)展,這些反思性問題的重要性將會呈現(xiàn)給大眾,而在人工智能與人類的比較之中,這些反思的推進(jìn)會變得更為容易。
“阿爾法圍棋”的出現(xiàn),也對圍棋指向了這樣的反思性問題。
圍棋的競技性有其明顯的限制。相比于其他體育項(xiàng)目,它的觀賞門檻太高。這使得它的競技價值極大地依賴于競技者身份。從早期的門派對抗、地域?qū)?,到現(xiàn)代的國別對抗,再到今天的人機(jī)對抗,每一次圍棋競技的熱點(diǎn)都依賴于對局者的身份,這是它發(fā)展的瓶頸。人機(jī)對抗的熱點(diǎn)過后,圍棋需要找到競技之外更堅(jiān)實(shí)的價值落腳點(diǎn)——圍棋文化。
圍棋之所以能夠流傳如此之久,正是因?yàn)樗诓煌臅r代背景之下能夠衍生出不同的價值。每一次時代精神的革新變化都不會將它淘汰,反而會催發(fā)它新的意涵。人們用某一種知識體系去認(rèn)識它、使用它,它就會展現(xiàn)出與之相適應(yīng)的價值。子曰“君子不器”,莊子談“無用之用”,這些品質(zhì)都在圍棋中得到呈現(xiàn)。圍棋文化的深刻意涵也隱藏在這種獨(dú)特的品質(zhì)之中?!鞍柗▏濉弊鳛楣ぞ叩囊粋€重要意義,是幫助我們反思圍棋。這種反思在某種程度上幫我們打通了圍棋本質(zhì)與文化之間的通路。
圍棋的核心規(guī)則極為簡易:“交替落子,氣盡棋亡,禁止循環(huán),子多為勝?!焙喴椎囊?guī)則,卻衍生出近乎無窮的變化。二○一六年一月,普林斯頓的研究人員算出十九路圍棋的精確合法位置數(shù)在10171這一數(shù)量級。這個數(shù)只是靜態(tài)盤面的總和,尚未包含不同的動態(tài)次序。對于人類而言,這一數(shù)量級近乎無窮。即使是計(jì)算機(jī),也離窮舉有非常遙遠(yuǎn)的距離。但是,圍棋畢竟是一個封閉的空間,它的變化數(shù)在本質(zhì)上仍然是有限的。
圍棋的變化數(shù)與棋盤的大小直接相關(guān)。在很小的棋盤上,如三路圍棋,人類甚至可以窮盡其變。再大一些,人類雖不能窮盡其變,但可以算出其最優(yōu)解。我在去年做過一個七路圍棋的最優(yōu)解研究,憑人力計(jì)算其中的有效變化,得出了其最優(yōu)解的理論值,即雙方最優(yōu)下法的盤面差距(亦即正確貼子數(shù))。最優(yōu)解下法是一個集合,包含了很多不同的變化,這些變化都導(dǎo)向了最終雙方完全平等的和棋,這樣的殊途同歸是圍棋中絕妙的平衡。
極為重要的發(fā)現(xiàn)是:在我們計(jì)算七路棋盤的最優(yōu)解時,我們完全不需要用到任何抽象的概念和道理,只需要將每一個選點(diǎn)對應(yīng)的最優(yōu)解數(shù)據(jù)進(jìn)行比較,便能得出最優(yōu)解的結(jié)論。但是,在面對十九路圍棋時,人的有限性呈現(xiàn)了出來。我們計(jì)算的極限離最優(yōu)解還有非常遙遠(yuǎn)的距離,因此無法將盤面做數(shù)據(jù)化的處理。
面對這樣的情境,人類思維的特長展現(xiàn)了出來:我們使用了很多抽象的方法來分析盤面,再用道理的方式幫助決策。我們將子和子的關(guān)系抽象為術(shù)語,如“跳”“飛”“長”等;又抽象出一些具體的知識,如“定式”“棋形”“諺語”等;再往上,我們還抽象出如“厚薄”“虛實(shí)”“輕重”“緩急”等等二元概念,這些概念帶有強(qiáng)烈的中國文化印記,起到了幫助我們定義局面的作用。在定義局面的基礎(chǔ)上,我們使用道理的方式來幫助決策,這就是所謂“策略”。圍棋十訣就是對道理的一些經(jīng)典闡述:不得貪勝,入界宜緩,攻彼顧我,棄子爭先,舍小就大,逢危須棄,慎勿輕速,動須相應(yīng),彼強(qiáng)自保,勢孤取和。這些道理的方式不僅可以用在圍棋上,還可以舉一反三,用在世間萬物。面對世界上所有人類無法完全用計(jì)算方式達(dá)到的事物,人們便用道理的方式去理解。圍棋提供了對思維的訓(xùn)練場所,這個場所的獨(dú)特優(yōu)勢在于通過勝負(fù)和復(fù)盤我們可以很輕易地分析自己思維的正誤,從而使我們的思維能力得到提升。
在心性的層面,圍棋同樣能起到鍛煉的效果。圍棋十訣的每一條,實(shí)際上都是對欲望、情緒的克制,對理性的發(fā)揚(yáng)。在對局的過程中,一旦理性未能居于主導(dǎo)地位,就很容易受到對手的懲罰。通過圍棋的練習(xí),我們能夠更好地安排理性、激情和欲望的位置關(guān)系。
七路棋盤人類可以計(jì)算出最優(yōu)解,卻只能得出這個數(shù)而沒有什么更多的意義。但在十九路棋盤,人類的有限性使我們永不能用計(jì)算達(dá)到最優(yōu)解,便使用了道理的方式來理解和思考圍棋——恰是這些道理的方式賦予圍棋以價值。應(yīng)用在如一盤棋這樣具體的可計(jì)算事物上,道理的效用不如計(jì)算機(jī)的計(jì)算很正常。道理的普遍性才是人類思維的獨(dú)特優(yōu)勢,正是看到了道理的普遍性,才使我們能夠踏實(shí)地說一句:棋如人生。
即使未來有一天計(jì)算機(jī)窮盡了圍棋變化,得出了最優(yōu)解集合,圍棋的競技性蕩然無存,圍棋的這個根本價值依然存在。那時人類仍然要用道理的方式來接收這些最優(yōu)解,而最優(yōu)解能使道理的根基更強(qiáng),從而使道理更強(qiáng)。
“阿爾法圍棋”用“數(shù)”的方式達(dá)到了很強(qiáng)的能力,而人類則用“道”的方式來接收和理解它的下法。在這個過程中,我們不僅能夠得到圍棋技術(shù)的提升,從而不斷趨近圍棋真理,更重要的是,通過道理的接收、理解和分析,我們能夠獲得思維的提升,這種提升是因抽象而具有普遍性的。
當(dāng)我們用智慧的方式來對待圍棋,圍棋便成為智慧的源泉。