安德魯·麥卡菲
由Google的子公司Deep Mind創(chuàng)建的人工智能系統(tǒng)AlphaGo,不久前在一場(chǎng)圍棋比賽中以4:1的成績(jī)戰(zhàn)勝了人類冠軍李世石。此事有何重大意義?畢竟,在1997年,IBM“深藍(lán)”擊敗加里·卡斯帕羅夫后,電腦已經(jīng)在國(guó)際象棋上超越了人類。人們?yōu)槭裁匆獙?duì)AlphaGo的勝利大驚小怪呢?
和國(guó)際象棋一樣,圍棋也是一種高度復(fù)雜的策略性游戲,不可能靠巧合和運(yùn)氣取勝。兩名棋手輪番將黑色或白色的棋子落在縱橫19道線的網(wǎng)格棋盤(pán)上,一旦棋子的四面被另一色棋子包圍,就要被從棋盤(pán)上提走,最終在棋盤(pán)上留下棋子多的那一方獲勝。
然而和國(guó)際象棋不一樣的是,沒(méi)有人能解釋頂尖水平的圍棋棋手是怎么下棋的。我們發(fā)現(xiàn),頂級(jí)棋手本人也無(wú)法解釋他們?yōu)槭裁聪碌媚敲春?。人類的許多能力中存在這樣的不自知,從在車(chē)流中駕駛汽車(chē),到辨識(shí)一張面孔。對(duì)于這一怪象,哲學(xué)家、科學(xué)家邁克爾·波蘭尼有精彩的概括,他說(shuō):“我們知道的,比我們可言說(shuō)的多?!边@種現(xiàn)象后來(lái)就被稱為“波蘭尼悖論”。
波蘭尼悖論并沒(méi)有阻止我們用電腦完成一些復(fù)雜的工作,比如處理工資單、優(yōu)化航班安排、轉(zhuǎn)送電話信號(hào)和計(jì)算稅單。然而,任何一個(gè)寫(xiě)過(guò)傳統(tǒng)電腦程序的人都會(huì)告訴你,要想將這些事務(wù)自動(dòng)化,必須極度縝密地向電腦解釋人類要它做什么。
這樣的電腦編程方式是有很大局限的,在很多領(lǐng)域無(wú)法應(yīng)用,比如我們知道但不可言說(shuō)的圍棋,或者對(duì)照片中尋常物品的識(shí)別、人類語(yǔ)言間的轉(zhuǎn)譯和疾病的診斷等——多年來(lái),基于規(guī)則的編程方法在這些事務(wù)上幾無(wú)建樹(shù)。
圍棋的可能走法比宇宙間的原子總數(shù)還多,即使最快的電腦也只能模擬微不足道的一小部分。更糟的是,我們甚至說(shuō)不清該從哪一步入手進(jìn)行探索。
這次有什么不同?AlphaGo的勝利清晰地呈現(xiàn)了一種新方法的威力,這種方法并不是將聰明的策略編入電腦中,而是建造了一個(gè)能學(xué)習(xí)制勝策略的系統(tǒng),這種系統(tǒng)在幾乎完全自主的情況下,通過(guò)觀看勝負(fù)實(shí)例來(lái)學(xué)習(xí)。
由于這種系統(tǒng)并不依賴人類對(duì)這項(xiàng)工作的已有知識(shí),故而即使我們知道的比可言說(shuō)的更多,也不會(huì)對(duì)它構(gòu)成限制.