丁日智
摘要:人工智能指用人工的方法去模擬和實(shí)現(xiàn)人類(lèi)智能,是一門(mén)新的技術(shù)科學(xué)。本文圍繞人機(jī)圍棋大戰(zhàn)事件,對(duì)人工智能的概念、AlphaGo的工作原理和人工智能的意義進(jìn)行了論述,讓我們對(duì)人工智能有了更深刻的認(rèn)識(shí)。
關(guān)鍵詞:AlphaGo;人工智能;圍棋;原理;發(fā)展
1 人工智能概述
2016年3月15日,AlphaGo以4:1的絕對(duì)優(yōu)勢(shì)戰(zhàn)勝世界圍棋冠軍李世石,排名世界第二,僅次于中國(guó)九段選手柯潔。這場(chǎng)引人矚目的“人機(jī)大戰(zhàn)”瞬間卷起一陣“科技”風(fēng)暴,“人工智能”一時(shí)間成為人們密切關(guān)注的話題。
人工智能的本質(zhì)是對(duì)人的意識(shí)、思維的信息過(guò)程的模擬,它并非擁有人一樣的“大腦”,而是像人一樣可以思考,并做出與人相似的智能反應(yīng)。也可指用人工的方法去模擬和實(shí)現(xiàn)人類(lèi)智能,它需要軟件和硬件的緊密結(jié)合。目前實(shí)現(xiàn)的方式通常是利用計(jì)算機(jī)來(lái)模擬人們某些思維過(guò)程和行為方式,并且計(jì)算機(jī)的計(jì)算處理能力遠(yuǎn)超人腦,準(zhǔn)確度也明顯優(yōu)于人腦。人工智能的快速發(fā)展,是對(duì)人類(lèi)智能的延伸擴(kuò)展,體現(xiàn)著人類(lèi)獨(dú)有的智慧。而如何讓計(jì)算機(jī)實(shí)現(xiàn)智能行為,使其更高效便捷地服務(wù)人類(lèi)則是人們要攻克的技術(shù)難題。
AlphaGo,中譯名阿爾法圍棋,便是當(dāng)下人工智能杰出的代表作之一,是由谷歌旗下人工智能公司DeepMind創(chuàng)造的一款智能?chē)宄绦?。AlphaGo的勝利代表著人工智能發(fā)展史上又一重大里程碑。這個(gè)程序利用“價(jià)值網(wǎng)絡(luò)”去計(jì)算局面,用“策略網(wǎng)絡(luò)”去選擇下子,高度模擬了人類(lèi)神經(jīng)網(wǎng)絡(luò)思維模式,并具有自我學(xué)習(xí)功能,完全具備一名職業(yè)選手的下棋水準(zhǔn)。
2 AlphaGo人工智能基本原理
圍棋擁有著5000多年的悠久歷史,是中國(guó)古代四大藝術(shù)之一。一個(gè)棋盤(pán)上縱橫各有19道,共有361個(gè)交叉點(diǎn),但局面數(shù)量卻可達(dá)3^361,體量約為10^170,而全宇宙的原子數(shù)量只有10^80,這足以體現(xiàn)出圍棋的復(fù)雜程度和變幻莫測(cè)的棋形。因此面對(duì)如此復(fù)雜的圍棋規(guī)則,人工智能夠具有與人類(lèi)相似的思維模式和高質(zhì)量的落子判斷能力是極為不容易的。
若AlphaGo通過(guò)計(jì)算,將所有的可能性步驟都羅列出來(lái),這需要很大的計(jì)算量和極高的硬件開(kāi)銷(xiāo),當(dāng)然這也是不理想的事。AlphaGo之所以有著強(qiáng)大的應(yīng)變能力和處理能力依靠的是深度學(xué)習(xí)和強(qiáng)化學(xué)習(xí)這一新型人工智能學(xué)習(xí)模式。
深度學(xué)習(xí)是指通過(guò)合適的矩陣數(shù)量,將多層組織鏈接一起形成神經(jīng)網(wǎng)絡(luò)“大腦”進(jìn)行精準(zhǔn)復(fù)雜的處理,就像人們識(shí)別物體標(biāo)注圖片一樣。
強(qiáng)化學(xué)習(xí)則是通過(guò)不斷反復(fù)試驗(yàn),將變化無(wú)常的動(dòng)態(tài)情況與對(duì)應(yīng)動(dòng)作相匹配。AlphaGo會(huì)通過(guò)上百萬(wàn)盤(pán)的棋盤(pán)對(duì)戰(zhàn)來(lái)獲取經(jīng)驗(yàn)教訓(xùn),這好比“吃一塹長(zhǎng)一智”,多次高強(qiáng)度對(duì)戰(zhàn)將不斷優(yōu)化進(jìn)AlphaGo策略判斷能力,因此AlphaGo只會(huì)變得越來(lái)越強(qiáng)。且AlphaGo的深度學(xué)習(xí)是無(wú)監(jiān)督或半監(jiān)督機(jī)器學(xué)習(xí),這樣它就可以無(wú)需人力參與便可自主得到高強(qiáng)度專(zhuān)業(yè)化訓(xùn)練。
此外AlphaGo還擁有著兩個(gè)不同神經(jīng)網(wǎng)絡(luò)“大腦”。AlphaGo不斷重復(fù)訓(xùn)練,依靠?jī)蓚€(gè)“大腦”檢查對(duì)弈結(jié)果并調(diào)整程序參數(shù),使得下次執(zhí)行能力變得更強(qiáng)。第一大腦是落子選擇器,也稱(chēng)為“監(jiān)督學(xué)習(xí)的策略網(wǎng)絡(luò)”,就是通過(guò)觀察棋盤(pán)布局嘗試找出概率最高的下一步合法棋。AlphaGo的目標(biāo)是學(xué)會(huì)職業(yè)圍棋手的高超棋藝,為此它需要百萬(wàn)級(jí)的對(duì)弈落子來(lái)強(qiáng)化“大腦”。但這上百萬(wàn)次的對(duì)弈主要目標(biāo)并不是贏,而是把每一個(gè)模擬棋局進(jìn)行到底,不斷學(xué)會(huì)最可能贏的下一步棋,最終具備職業(yè)圍棋手的落子分析能力;第二大腦是棋局評(píng)估器,也稱(chēng)為“價(jià)值網(wǎng)絡(luò)”。它不會(huì)去擬合下一步棋,而是預(yù)測(cè)每一步棋贏棋的可能性,并通過(guò)整體局面判斷來(lái)輔助落子選擇器。若評(píng)估器判斷此步棋為劣棋,那么它會(huì)忽略由此步棋延伸的任何其他落子可能性。棋局評(píng)估器亦需通過(guò)百萬(wàn)次的對(duì)弈訓(xùn)練。對(duì)弈中它可分析判斷出任意棋局黑白兩方的贏棋概率。而人類(lèi)的能力和精力是有限的,如此高強(qiáng)度的訓(xùn)練人類(lèi)恐怕難以做到。不過(guò)若僅使用AlphaGo的核心處理芯片,它的“棋藝”將與其它計(jì)算機(jī)圍棋類(lèi)似,但綜合以上處理方式,便可達(dá)到人類(lèi)頂尖棋手水平。
3 總結(jié)人工智能的意義和發(fā)展
雖然在人機(jī)大戰(zhàn)中計(jì)算機(jī)獲得勝利,但這并不意味著人工智能已經(jīng)達(dá)到高度發(fā)達(dá)的水平,在功能和技術(shù)方面,人工智能還需要不斷完善。圍棋大戰(zhàn)只能反映出在規(guī)則既定的計(jì)算領(lǐng)域中,計(jì)算機(jī)的處理能力遠(yuǎn)超人類(lèi)。而人類(lèi)思維、情感、溝通等方面是目前人工智能無(wú)法比擬的。隨著科學(xué)技術(shù)不斷發(fā)展,人工智能和人類(lèi)的差距將會(huì)不斷縮小,未來(lái)的人工智能除了準(zhǔn)確地做出分析判斷外,還將會(huì)逐漸理解人類(lèi)語(yǔ)言,意會(huì)人類(lèi)的情感表達(dá),這意味著人工智能會(huì)達(dá)到更高的領(lǐng)地。
總的來(lái)說(shuō),機(jī)器獲勝表明人工智能技術(shù)正在快速發(fā)展,又一輪新的產(chǎn)業(yè)將不斷推進(jìn)著世界向前發(fā)展。人工智能的終極目標(biāo)是能夠與人類(lèi)一樣的認(rèn)知世界,并更好地造福人類(lèi),為世界做出巨大的貢獻(xiàn)。但萬(wàn)事皆有利弊,我們?nèi)f萬(wàn)不能讓電影中機(jī)器統(tǒng)治人類(lèi)的劇情上演。因此人們只有對(duì)人工智能做出更加徹底全面地研究,使人工智能技術(shù)趨于成熟,才能讓擁有強(qiáng)大運(yùn)算能力的機(jī)器替人類(lèi)做許多繁雜的工作,甚至超越人類(lèi)。倘若正確運(yùn)用人工智能,那么它將極大程度上推動(dòng)人類(lèi)文明的進(jìn)步。