人工智能阿爾法狗去年4勝1負(fù)戰(zhàn)勝圍棋高手李世石,經(jīng)過9個多月的瘋狂學(xué)習(xí)后,它升級了。阿爾法狗披著Master的馬甲,在圍棋對戰(zhàn)網(wǎng)上以60勝0負(fù)的戰(zhàn)績橫掃中日韓圍棋大師,包括“棋圣”聶衛(wèi)平。
圍棋棋路復(fù)雜多變,一直被視為人類智慧的門檻,許多人終其一生都在研究。阿爾法狗“年紀(jì)輕輕”已經(jīng)達(dá)到甚至超過圍棋職業(yè)九段水平,這在圍棋界和科技界可是件了不得的事情——機(jī)器的智慧接近甚至戰(zhàn)勝了人類。
許多人知道阿爾法狗是一款厲害的人工智能圍棋程序,但不知道阿爾法是怎么樣學(xué)習(xí)圍棋的。其實它的學(xué)習(xí)過程模仿了人類小孩,但更加瘋狂。
人類小孩學(xué)習(xí)的過程,可以看做從書本、老師、家長和生活實際中學(xué)習(xí)知識,在頭腦中理解知識,在考試、生活中應(yīng)用知識三個階段。就像先輸入,再整合,最后輸出。
用傳統(tǒng)的英語學(xué)習(xí)過程打比方,第一個階段是輸入,是不斷背單詞、記句式、語法的過程。完成這個階段已經(jīng)很不容易,但是只完成這些還是不會用英語交流,和老外對話。
這個時候,就該進(jìn)入第二個階段,整合。在腦海中整合第一階段的知識,才知道如何把單詞組合成地道的句子,知道什么場合用什么話。
在第三階段,就要輸出了,能用英語交流,表達(dá)自己的想法。
人類學(xué)習(xí)概括起來就是經(jīng)歷從積累經(jīng)驗到總結(jié)規(guī)律,最終靈活運(yùn)用這三個階段。
那么,應(yīng)該怎樣教會機(jī)器學(xué)習(xí)呢?
機(jī)器沒有辦法讀萬卷書,行萬里路,那么第一階段只能從人類給它的數(shù)據(jù)中學(xué)習(xí)了。
在第二階段,該怎么樣教會機(jī)器從數(shù)據(jù)中總結(jié)規(guī)律,是機(jī)器學(xué)習(xí)的主要問題。幾十年間,科學(xué)家們發(fā)明了各式各樣的機(jī)器學(xué)習(xí)算法。通過編程,告訴機(jī)器學(xué)習(xí)需要的模型、執(zhí)行學(xué)習(xí)的流程、學(xué)習(xí)模型中的參數(shù)。
我們用機(jī)器學(xué)習(xí)圍棋做例子。專家們編寫算法,把圍棋的規(guī)則當(dāng)模型,讓機(jī)器執(zhí)行自己和自己下棋的流程,并且下棋速度非常快。在機(jī)器下了成千上萬盤棋后,就能獲得許多參數(shù),比如怎樣的局勢能贏,怎樣的局勢會輸,對手的棋子占據(jù)哪些地方我輸?shù)母怕蚀?,我的棋子占?jù)哪些地方贏的概率大……
漸漸地,機(jī)器就學(xué)會了下圍棋,而且能戰(zhàn)勝人類,完成了學(xué)習(xí)的第三階段。
這樣看來,機(jī)器學(xué)習(xí)的過程是模仿人類小孩的,甚至更簡單,它不會像人類小孩一樣會聯(lián)想,會想象。
但機(jī)器學(xué)習(xí)的瘋狂之處在于,突破了人類學(xué)習(xí)的速度、腦袋的容量和生命長短的限制。阿爾法狗可以在短時間內(nèi)自己和自己下棋千萬局,人類窮其一生也下不了百萬局棋。
機(jī)器學(xué)習(xí)的模式簡單,和人類如出一轍,但瘋狂的量的積累,讓機(jī)器有無限量的智慧和經(jīng)驗。