凱德·梅茨(Cade Metz)王賽錦/譯
AlphaGO 背后的人工智能,能教會我們?nèi)祟愂裁?/p>
凱德·梅茨(Cade Metz)
王賽錦/譯
選自美國《連線》雜志2016年6月號
日裔美國人黃士杰(Aja Huang)把手伸到一個木碗里,碗里滿是圓滑的黑色棋子,他瞧也沒瞧一眼,就用中指和食指夾出一個。目光透過金屬絲眼鏡死死地盯著棋盤,他把手里的棋子放在棋盤上一個幾乎空白的區(qū)域,在一枚孤零零的白色棋子左下方。在圍棋里,這被稱為“肩沖”(shoulder hit),即從遠(yuǎn)離大部分對弈區(qū)域的側(cè)邊進(jìn)行攻擊。
桌子對面的李世石(Lee Sedol),這個圍棋界過去十年里最優(yōu)秀的選手,僵住了。他看了看棋盤上鋪開的37枚棋子,起身默默離開。
在離對弈場50英尺的評論室里,邁克爾·雷德蒙(Michael Redmond)通過閉路電視注視著比賽。雷蒙德是西方世界里圍棋唯一達(dá)到九段的選手,九段是圍棋的最高級別。他和李世石一樣震驚?!拔也恢肋@一步走得好還是不好?!崩酌傻聦?00萬的在線觀眾說道。
“我覺得那是步錯棋。”另外一個英語評論員克里斯·加洛克(Chris Garlock)說道,他是美國圍棋協(xié)會聯(lián)絡(luò)副主席。
幾分鐘以后,李世石重又走回對弈室。他坐下了,但是并沒碰碗里的白色棋子。一分鐘過去了,兩分鐘過去了……15分鐘過去了,而棋手對弈一局的基本時限是兩個小時,這就占去了不少時間。最后,李世石拿出一枚棋子,就放在黃士杰剛落的那枚黑棋的正上方。
黃士杰的那一步是整局棋的第37步,李世石始終未能挽回局面。4小時20分過去了,李世石選擇認(rèn)輸。
但是黃士杰并非這場圍棋游戲的真正贏家。他只是遵照指令行事,位于他左側(cè)的一臺平板顯示器與控制室相連,控制室位于附近的首爾四季酒店,同時還與分布在世界各地的谷歌數(shù)據(jù)中心的成百上千臺電腦相連。在這個或許是人類有史以來設(shè)計的最復(fù)雜的游戲里,它擊敗了世界上最厲害的選手之一。
在同一個房間,另外一位圍棋專家也在觀戰(zhàn),他就是三屆歐洲圍棋冠軍樊麾(Fan Hui)。一開始,第37步棋也令他迷惑。但他與AlphaGo對弈過。與其他人相比,他還兼具AlphaGo的陪練身份。5個月中,樊麾與機(jī)器下了數(shù)百局,目的是為了讓它的創(chuàng)造者知道問題所在。樊麾經(jīng)常輸給機(jī)器,但是他也漸漸了解了AlphaGo,比其他任何人都了解得多。樊麾認(rèn)為,那個“肩沖”不像是人類會走的一步棋。但是想了10秒鐘之后,他明白了?!捌?,”他說道,“太漂亮了!”
在這種五局三勝制里,現(xiàn)在AlphaGo以二比零的優(yōu)勢領(lǐng)先李世石,甚至是整個人類。第37步說明,AlphaGo并不只是重復(fù)多年來的編程,或者是通過暴力預(yù)測算法來機(jī)械地落子。在那一刻,AlphaGo證實了,它有理解的能力,或至少是有別于真實事物的模仿理解力。在李世石眼中,AlphaGo展示了圍棋選手所言的“直覺”,也就是它能以類人的方式,甚至是超越人類的方式進(jìn)行一場漂亮的對弈。
但是不要為李世石的失敗,或人類的失敗掩面哭泣。李世石并非殉道者,第37步棋也不是機(jī)器超越人類的標(biāo)志。恰恰相反:第37步標(biāo)志著機(jī)器與人類共同進(jìn)步的開始。
大衛(wèi)·席爾瓦(David Silver)領(lǐng)導(dǎo)的團(tuán)隊創(chuàng)造了AlphaGo
當(dāng)大衛(wèi)·席爾瓦還是一名來自英格蘭東海岸城市薩??耍⊿uffolk) 的15歲國際象棋錦標(biāo)賽選手時,戴密斯·哈薩比斯(Demis Hassabis)已經(jīng)是一名戰(zhàn)無不勝的國際象棋神童了。哈薩比斯是個不折不扣的神童,他媽媽是中國和新加坡混血,爸爸是希臘和塞浦路斯混血,他們一家人都住在倫敦。他曾是世界上14歲以下棋手中段位排名第二的選手。他常常通過參加一些地方賽事來保持自己思維的靈活性,也順道掙些外快。“我知道戴密斯時他還不知道我,”AlphaGo團(tuán)隊的領(lǐng)導(dǎo)者席爾瓦說道,“我曾經(jīng)見到他出現(xiàn)在我們鎮(zhèn)子上,贏了比賽,然后離開了?!?/p>
到劍橋讀本科時,他們才正式見了面,二人都學(xué)習(xí)計算神經(jīng)科學(xué),為的是理解人類思維,以便有一天也賦予機(jī)器一點(diǎn)兒智力,像人一樣。但是兩人真正深入交往卻是出于游戲,包括棋牌游戲和計算機(jī)游戲。
1998年,二人畢業(yè)之后很自然地開創(chuàng)了一家電子游戲公司。哈薩比斯經(jīng)常和一名同事下圍棋。席爾瓦被哈薩比斯的游戲興趣所鼓動,也開始自己學(xué)習(xí)?!叭绻隳茉谌魏畏矫鎽?zhàn)勝戴密斯的話,這幾乎就像是一種榮譽(yù),”席爾瓦說道,“而且我知道,戴密斯對這個游戲的興趣才剛剛興起?!?/p>
他們加入到了一個當(dāng)?shù)氐膰寰銟凡?,和二段三段選手對弈(相當(dāng)于空手道黑帶)。他們的野心還不止于此:他們?nèi)滩蛔〉厮伎?,為何機(jī)器從未破解這種智力游戲呢?1995年,一個名為“奇努克”(Chinook)的跳棋計算機(jī)程序打敗了世界上最優(yōu)秀的跳棋選手。兩年以后,國際商用機(jī)器公司(IBM)的“深藍(lán)”(Deep Blue)超級計算機(jī)打敗了世界象棋冠軍加利·卡斯帕羅夫(Garry Kasparov)。次年,機(jī)器還在Scrabble(一種拼字游戲——譯注)、Othello,甚至電視問答游戲節(jié)目《危險邊緣》(Jeeopardy)中獲勝!用博弈論的術(shù)語來說,圍棋與國際象棋和西洋跳棋一樣,是一種完全信息博弈游戲——毫無運(yùn)氣可言,信息完全公開。通常來說,電腦應(yīng)該能輕松掌握,但是就是攻克不下圍棋。
圍棋看上去很簡單。源起于3000年前的中國,兩名棋手在19×19的棋盤上對弈。棋手交替將黑白棋子放置于棋盤直線的交叉點(diǎn)上,努力包圍對方的棋子,或者將對方的棋子隔開,避免被包圍。人們把象棋喻為戰(zhàn)場,但是把它比作單個的戰(zhàn)場更形象。圍棋則是整體作戰(zhàn),或地緣作戰(zhàn)。棋盤上一個角落里的變動會影響全局。局勢變幻莫測,勢力此消彼長。在象棋游戲中,棋手在一輪中一般有35種下法可選,但在圍棋中,卻可達(dá)200種。正常對弈下來,復(fù)雜程度不可同日而語。正如哈薩比斯和席爾瓦所言,圍棋棋盤上可能出現(xiàn)的情況比整個宇宙中的原子數(shù)量還要多。
所以,與國際象棋不同,圍棋棋手——不論是人類還是機(jī)器——都看不透每一步落子會帶來的最終結(jié)果。頂級騎手靠的是直覺,而非單純的計算?!傲己玫牟季挚雌饋砭秃苊?,”哈薩比斯說道,“它遵循一定的美學(xué)。這就是幾千年來圍棋一直令人著迷的原因?!?/p>
2005年,哈薩比斯和席爾瓦的游戲公司倒閉了,兩人也分道揚(yáng)鑣。在阿爾伯塔大學(xué)(University of Alberta),席瓦爾學(xué)習(xí)了人工智能的初級形式,也就是增強(qiáng)學(xué)習(xí),機(jī)器通過不斷地執(zhí)行任務(wù)、追蹤帶來最大利益的決策,從而達(dá)到自我學(xué)習(xí)。哈薩比斯進(jìn)了英國倫敦大學(xué)學(xué)院(Unviversity College London),獲得了認(rèn)知神經(jīng)科學(xué)的博士學(xué)位。
2010年,他們重新找到對方。哈薩比斯成立了倫敦DeepMind人工智能公司;席爾瓦加入了他。他們雄心勃勃,想要創(chuàng)造真正能夠思考的通用人工智能。但他們必須找到一個出發(fā)點(diǎn)。
他們理所當(dāng)然地把游戲作為出發(fā)點(diǎn)。這的確是對人工智能的一個很好的測試。從定義上說,游戲是有限制的。這和實際生活不同,而更像是裝在瓶子里的小型宇宙,你能客觀地批判成敗輸贏。DeepMind將增強(qiáng)學(xué)習(xí)和深度學(xué)習(xí)結(jié)合起來,從龐大的數(shù)據(jù)集中尋找規(guī)律。為了驗證這種方式的可行性,研究者們教授他們剛剛成形的人工智能玩“太空侵略者”(Space Invaders)和“打磚塊”(Breakout)。
它在“打磚塊”上成績斐然。這個游戲基本上和“乒乓”(Pong)差不多,不過不是和對手來回?fù)舸蛞粋€像素小球,而是用像素小球擊打彩色磚塊。打中一個塊磚,磚塊便會消失;沒接中球或者把球打到了屏幕外就算輸。玩了500局游戲之后,DeepMind的系統(tǒng)學(xué)會了將球以一定的角度打到磚塊后面去,從而保證小球一直在墻后擊打磚塊。這是一個經(jīng)典的“打磚塊”打法,但是DeepMind的電腦每次都能精準(zhǔn)地使用這一方法,其速度更是無人能及。
為了尋找投資人,哈薩比斯在一次晚宴上瞄準(zhǔn)了著名的貝寶(PayPal)共同創(chuàng)建人和臉譜網(wǎng)(Facebook)投資者彼得·蒂爾(Peter Thiel)。哈薩比斯只有幾分鐘的時間,他知道蒂爾熱衷于國際象棋,就壯著膽子說國際象棋之所以流傳這么久,是因為象和馬的優(yōu)劣勢之間充滿了創(chuàng)意的博弈。蒂爾提出要哈薩比斯第二天和他正式比一場。
一旦一位硅谷(Silicon Valley)億萬富翁聽說了你,其他富翁就也知道了。通過蒂爾,哈薩比斯結(jié)識了伊隆·馬斯克(Elon Musk),馬斯克又向谷歌首席執(zhí)行官拉里·佩奇(Larry Page)介紹了DeepMind。谷歌很快就以6.5億美元(據(jù)報道)的價格購買了這個公司。
加入谷歌這個搜索引擎巨頭之后,哈薩比斯在一次會議上用雅達(dá)利游戲機(jī)(Atari)做了展示,谷歌聯(lián)合創(chuàng)始人謝爾蓋·布林(Sergey Brin)也參加了此次會議。二人發(fā)現(xiàn)他們有著相同的愛好。在斯坦福攻讀碩士學(xué)位時,布林便沉迷于圍棋,佩奇甚至因此擔(dān)心谷歌能不能建立。
所以,當(dāng)布林見到哈薩比斯之時,他們就聊了游戲?!澳阒绬幔珼eepMind或許幾年之后能打敗世界圍棋冠軍,”哈薩比斯告訴布林,“如果我們真的認(rèn)真去做的話?!?/p>
“我覺得不可能?!辈剂执鸬?。
哈薩比斯就等這句話。如他們所言,游戲已經(jīng)開始。
第二局棋結(jié)束之后,席爾瓦進(jìn)入AlphaGo的控制室,就位于走廊盡頭。AlphaGo的大腦不在此處,也不在其他地方,而是存在于全球成百上千臺電腦之中。面對這些顯示器,席爾瓦能窺探AlphaGo的思想,監(jiān)控其運(yùn)行,跟蹤它對每場對弈解決的預(yù)測有何變化。
輕敲幾下鍵盤,席爾瓦輕松地調(diào)出了AlphaGo在游戲中的決策記錄。他主要關(guān)注第37步之前到底發(fā)生了什么。
在DeepMind和AlphaGo出現(xiàn)之前,人工智能的研究者就嘗試著用機(jī)器破解圍棋,在游戲進(jìn)行過程中,他們令機(jī)器用一種系統(tǒng)方式預(yù)測每一步可能產(chǎn)生的結(jié)果,試圖以野蠻的計算機(jī)力量解決問題。1997年IBM的“深藍(lán)”擊敗卡斯帕羅夫時就差不多是這樣的。我當(dāng)時是PC Magazine(美國著名的IT雜志——譯注)的見習(xí)記者,報道了那次事件。和李世石對戰(zhàn)AlphaGo一樣,人們都認(rèn)為這是人工智能發(fā)展的標(biāo)志性事件。奇怪的是,正如李世石和AlphaGo的第二局比賽,“深藍(lán)”在和卡斯帕羅夫?qū)?zhàn)的第二局中也走了一步人類不可能走的棋。兩人都同樣困惑,但是卡斯帕羅夫迫于壓力立刻就認(rèn)輸了,而李世石則堅持戰(zhàn)斗。
暴力計算從未攻克圍棋。圍棋的可能性太多,即使是電腦也難以處理。席爾瓦的團(tuán)隊另辟蹊徑,建造了一個能學(xué)會很好地下棋的機(jī)器,然后再讓它比賽。
在倫敦國王十字車站附近的DeepMind辦公室中,這支團(tuán)隊將3000萬步人類的圍棋步法輸入到一個深度神經(jīng)網(wǎng)絡(luò)中,這個網(wǎng)絡(luò)中的硬件和軟件松散地模仿人類大腦中的神經(jīng)元。神經(jīng)網(wǎng)絡(luò)其實很普通,臉譜網(wǎng)用它們進(jìn)行照片中的人臉識別,谷歌用它們識別安卓智能手機(jī)中的語音指令。如果你把足夠多你媽媽的照片放到神經(jīng)網(wǎng)絡(luò)里,那么它們便能學(xué)會識別她。輸入足夠多的言語,他們也能學(xué)會如何識別你的話語。將3000萬步圍棋步法整合其中,它們也能學(xué)會怎么下圍棋。
但是了解規(guī)則和成為棋王并不是一回事兒。第37步并不在這3000萬步之中。那么,AlphaGo是怎么學(xué)會這一步的呢?
AlphaGo知道——就它所“知道”的東西——那一步是個險招。“它知道專業(yè)人士不會走那一步,但是,在它逐漸加深的搜索中,能推翻最初的指導(dǎo)?!毕癄柾哒f。AlphaGo從某種程度上說,已經(jīng)能自己思考了。它并非根據(jù)其創(chuàng)造者編碼的一系列規(guī)則,而是它自學(xué)的算法?!斑@真的是它在不斷反思和分析的過程中自己發(fā)現(xiàn)的?!?/p>
實際上,這臺機(jī)器已經(jīng)算出來專業(yè)人類選手走同樣一步的概率為1/10000。不管怎樣,AlphaGo那么做了。
它從人類的招數(shù)中學(xué)會這個游戲之后,席爾瓦就讓這臺機(jī)器和它自己對弈。讓它和一個與自己神經(jīng)網(wǎng)絡(luò)(稍)有不同的版本一局一局地下。在對弈的過程中,它會追蹤每一步所能產(chǎn)生的最大效益,也就是在棋盤上占領(lǐng)地盤——這正是席爾瓦在研究生期間學(xué)習(xí)到的增強(qiáng)學(xué)習(xí)技巧。AlphaGo開始開發(fā)出一套屬于它自己的非人類指令系統(tǒng)。
但是這還只是一部分。緊接著,席爾瓦團(tuán)隊把數(shù)百萬非人的步法輸入到它的第二個神經(jīng)網(wǎng)絡(luò)中,教它像卡斯帕羅夫(或“深藍(lán)”)預(yù)測國際象棋棋局一樣預(yù)測圍棋的棋局。它無法像國際象棋那樣預(yù)測所有可能的步法,目前這還無法實現(xiàn)。但是將其與自己對弈多場后收集到的所有信息輸入進(jìn)去之后,AlphaGo開始能預(yù)測一場圍棋對弈可能展開的方式。
戴密斯·哈薩比斯于2010年創(chuàng)立人工智能公司——DeepMind
從最初那些你沒見過的情況中預(yù)見可能的結(jié)果?這叫直覺。AlphaGo第二局中的第37步便是直覺,但是這種直覺連世界頂級的圍棋選手也難以預(yù)料。甚至它的創(chuàng)造者也想不到?!拔矣^賽的時候,說不出心里有多緊張,”席爾瓦在回控制室的途中告訴我,“我也真的不知道接下來會發(fā)生什么?!?/p>
你不可能給一個公司投資6.5億美元就僅僅是建造一臺只會玩棋盤游戲的計算機(jī)。深度學(xué)習(xí)和神經(jīng)網(wǎng)絡(luò)支撐了谷歌的十多項服務(wù),包括其全能搜索引擎在內(nèi)。AlphaGo的另一項武器是增強(qiáng)學(xué)習(xí),現(xiàn)在已經(jīng)正在訓(xùn)練公司實驗室里的機(jī)器人了,教它們學(xué)習(xí)如何拿起和移動各種不同類型的物體。由此你便可看出這項比賽對谷歌來說有多重要了。谷歌前首席執(zhí)行官埃里克·施密特(Eric Schmidt)在第一局游戲開始之前專程趕來。谷歌最有名的工程師杰夫·迪恩(Jeff Dean)也趕到現(xiàn)場等待游戲開始。塞吉·布林(Sergey Brin)乘飛機(jī)來觀戰(zhàn)第三局和第四局,還在他的木制棋盤上跟著下。
還不僅如此。在比賽期間,我和哈薩比斯一起去鐘路區(qū)(Jongno-gu)散步,這個地方是首爾的文化和政治中心,有著600年的歷史。韓國電視和新聞上到處都是哈薩比斯的面孔。我們在交談的過程中,一位年輕女性認(rèn)出了哈薩比斯,她眼睛瞪得大大的,愣了一會兒,就好像看到了泰勒·斯威夫特(Taylor Swift)或賈斯汀·比伯(Justin Bieber)一樣。
“你看到了嗎?”我說。
“看到了,”哈薩比斯面無表情地答道,“這是常事。”
他可能并非開玩笑。計算機(jī)工程師一般沒什么粉絲,但是韓國有800萬人下圍棋,而李世石簡直又是這個國家的民族英雄。中國有超過2.8億人在線觀看此次比賽。
所以,當(dāng)李世石連輸兩局之后,粉絲們狂喜激動的熱情開始被削減了。第二局結(jié)束之后,一位叫周峰(Fred Zhou)的中國記者在評論室攔住我,很高興地和我談?wù)揂lphaGo是科技的勝利,而非僅僅是圍棋殺手。
然后我問他對李世石失敗作何感想,周峰指指自己的心,說道:“我很難過?!?/p>
我也感到難過。曾經(jīng)專屬于人類的智慧已經(jīng)喪失了人類的專屬地位。觀看比賽的很多人都開始意識到,機(jī)器已經(jīng)越線了。它們能比人類做得好。雖然它們還不能真正地進(jìn)行對話,還不能編造一個好玩的笑話,還不能表演猜字游戲,還不能復(fù)制古老的常識,但是,AlphaGo無情地向我們展示了,機(jī)器能夠模仿——實際上是超越——人類的直覺,而正是這種直覺才造就了世界上最優(yōu)秀的圍棋選手。
李世石第三局又輸了,在五局三勝的賽制下,AlphaGo已經(jīng)穩(wěn)拿冠軍了。隨后的新聞發(fā)布會上,哈薩比斯坐在他旁邊,李世石表示歉意,他讓人類失望了?!拔冶究梢阅贸龈玫某煽?,帶來更好的結(jié)局?!彼@樣說道。
李世石發(fā)言的過程中,一種難以預(yù)料的感覺向哈薩比斯襲來。作為AlphaGo的創(chuàng)造者之一,他自豪、甚至得意,人們以為機(jī)器不可能做到的,他讓機(jī)器做到了。但是,他作為人的另一面也在躁動不安,他開始希望李世石贏一局了。
第四局下了兩個小時之后,李世石又陷入了另一個麻煩之中。這局他下得咄咄逼人,對棋盤上的特定區(qū)域猛烈進(jìn)攻。但是AlphaGo也采取了更加豪邁的風(fēng)格,以著眼整體的方式對整局棋進(jìn)行衡量。在下第37步時,AlphaGo將一枚黑子置于一個旁邊只有一枚白棋的地方,遠(yuǎn)離主戰(zhàn)場。又一次,在第四局中,機(jī)器使用了一種神秘的方法控制了這場比賽。
AlphaGo已經(jīng)贏得了比賽。李世石繼續(xù)下棋并非為了輸贏,而是為人類而戰(zhàn)。77步走完之后,他看起來猶豫不決了。他把右手支在下巴上,前后搖晃,坐立不安,另一只手來回得搔著脖頸后方。兩分鐘過去了,四分鐘過去了,六分鐘了。
然后,他依舊左手撓著脖頸后方,開始出擊。右手兩根手指夾起一枚棋子,放在緊挨棋盤中心的地方。這是這局棋的第78步,一步“挖”步,即在兩片大范圍密集的地區(qū)中間插入一棋。然后機(jī)器眨了眨眼,當(dāng)然,并非真的眨眼,但是它的下一步令人心驚肉跳。李世石向黃士杰投以尖銳的目光,似乎黃士杰才是他的對手,而不是那十億個電路。
在AlphaGo的控制室里,人們暫時停下手中的活計,盯著顯示屏看。李世石走出第78步之前,AlphaGo贏得此局的概率為70%。八步之后,雙方勢均力敵。AlphaGo忽然不是“深藍(lán)”的后繼者了——它是卡斯帕羅夫。它想不到人類會走那一步,概率僅僅為1/10000。
和人類一樣,AlphaGo也會因突然襲擊而亂了陣腳。游戲進(jìn)行到4小時45分,AlphaGo投降了,和我們?nèi)祟愐粯樱矔敗?/p>
“AlphaGo之前思考的所有東西在那個點(diǎn)上都成了無用功,”哈薩比斯說道,“它必須得重新開始。”
最后一局比賽開始了,我本該全程關(guān)注報道哈薩比斯和他的團(tuán)隊的。但是就在我要去見他們的時候,一名谷歌工作人員到記者招待室找到了我,說:“我們很抱歉,但是團(tuán)隊改變主意了。最后一局,他們不想有任何記者出現(xiàn)在那個房間?!?/p>
她走之后,我轉(zhuǎn)向《連線》(WIRED)雜志的攝影師喬迪·伍德(Geordie Wood),說:“你知道這意味著什么嗎?AlphaGo覺得它要輸了?!?/p>
事實確實如此。游戲一開始,AlphaGo就犯了一個初級錯誤。在棋盤下半部分的擁擠區(qū)域,它將一枚白子放得太過接近李世石的一些黑子,丟掉了整片區(qū)域。AlphaGo的直覺錯了;和人類一樣,這個機(jī)器也有盲區(qū)。
但是,游戲進(jìn)入第三個小時時,AlphaGo重新振作,開始挽回頹勢。在第三小時30分時,李世石的時限到了。根據(jù)比賽規(guī)則,從此刻開始,他每一步至多能用一分鐘,否則就算犯規(guī)。但是在他右手上方的棋盤上,還有一大片空白區(qū)域。一次又一次,他直到最后一秒才落子。
隨后,AlphaGo的時限也用完了。雙方都開始以看似不可能的速度下著棋。棋盤上滿布棋子。整場比賽中,這是第一次棋局似乎會下到最后才進(jìn)行最終計分,雙方都不認(rèn)輸。但是到了第五個小時,李世石和Alphago之間的差距太大,李世石選擇認(rèn)輸。AlphaGo也會失敗,但依然贏得了最終勝利。
歐洲圍棋冠軍樊麾,AlphaGo的陪練,他也在不斷提升自我
全世界只有一個人能確切地體驗李世石的感受,那就是樊麾。樊麾是三次歐洲圍棋賽冠軍,也是AlphaGo的真正陪練。去年十月,為了給這場在首爾舉行的更大型比賽進(jìn)行訓(xùn)練,他與AlphaGo進(jìn)行了一場非公開對弈,以五比零的結(jié)局輸給了這個機(jī)器。此后,樊麾以雇傭棋手的身份加入了DeepMind,在和這臺機(jī)器的較量中,屢戰(zhàn)屢敗。
雖然樊麾不斷輸給AlphaGo,但是另一個有趣的現(xiàn)象卻在悄然上演。樊麾開始以全新的視角全面地看待圍棋。在與其他人的對弈中,樊麾勝利的次數(shù)增加了——包括四次直接與頂尖圍棋選手的對決。他的排名上升了,AlphaGo也訓(xùn)練了他。
所以,在比賽期間,我問樊麾,我們應(yīng)如何看對李世石與AlphaGo的對決?
“善待李世石,”樊麾說,“善待?!?/p>
這些日子,世界上最大、最富有的科技公司正在加緊利用AlphaGo所擁有的科技尋求競爭優(yōu)勢。哪個應(yīng)用能更好地識別照片?哪個能更好地響應(yīng)語音指令?不久以后,同樣的系統(tǒng)就可能用來幫助機(jī)器人以更加接近人類的方式與現(xiàn)實環(huán)境交互。
但是,相對于AlphaGo的非人類的類人之處,這些現(xiàn)實的應(yīng)用似乎平庸了不少。一種亞文化已經(jīng)圍繞著AlphaGo,以前所未有的方式展現(xiàn)了出來,例如Google Photo應(yīng)用。在德國的杜塞爾多夫,J.馬?。↗. Martin)——游戲設(shè)計、媒體和通訊教授——現(xiàn)在運(yùn)營著一個名為“第37步”的推特賬號。一名來自弗羅里達(dá),名為喬迪·恩賽(Jordi Ensign)的45歲程序員在網(wǎng)上讀過我寫的一篇關(guān)于首爾比賽的文章之后,給我發(fā)來郵件,說她的右臂內(nèi)側(cè)紋有AlphaGo第37步的紋身,而她的左臂內(nèi)側(cè)則紋有李世石的第78步——圍棋界已將這一步稱之為“神之一手”了。
第四局結(jié)束之后,李世石和哈薩比斯坐了一會兒。哈薩比斯這個曾經(jīng)的游戲天才告訴李世石,他理解他的壓力,理解他的創(chuàng)造力及動力?!拔以?jīng)也是一名游戲選手,”哈薩比斯說道,“如果我的生命軌跡有點(diǎn)變化的話……我明白達(dá)到你那樣的高度要做出多少努力,多少犧牲?!?/p>
李世石回答,和機(jī)器對弈重新燃起了他對圍棋的熱情。和樊麾一樣,AlphaGo開拓了他的眼界,讓他看到了圍棋的嶄新一面?!拔乙呀?jīng)得到提高了,”李世石說,“它給了我新的思路。”從那之后,他從未輸過。
這場比賽之前,哈薩比斯向世界宣布,AlphaGo所使用的人工智能技術(shù)能推動一項全新的科學(xué)研究,機(jī)器將指點(diǎn)人類取得巨大突破。那個時候,還沒有證據(jù),這些言辭顯得空洞乏力,就是典型的科技噱頭而已。但是現(xiàn)在不同了。這個機(jī)器做了一件人做的事,而且比人做得更好。但同時,它也讓人類有所進(jìn)步。是的,你可以將第37步視為機(jī)器超越人類創(chuàng)造的預(yù)兆,但你也可以將其視為一粒種子:沒有第37步,怎會有第78步?
原文標(biāo)題:What the AI behind AlphaGO can Teach Us about Being Human