蔣宗岳
摘要:近幾年來,人工智能在社會(huì)各界掀起了一股熱潮。計(jì)算機(jī)技術(shù)的發(fā)展為AI技術(shù)提供了智能化的算法和運(yùn)行空間;計(jì)算機(jī)網(wǎng)絡(luò)的普及為AI技術(shù)提供了數(shù)據(jù)庫基礎(chǔ);信息論與控制論的融合為AI提供了理論基礎(chǔ)。本文回顧了人工智能的發(fā)展歷程,以AlphaGo的成功案例為引,闡述了信息論與控制論在人工智能技術(shù)中的重要地位和作用。
關(guān)鍵詞:人工智能;信息論;控制論;AlphaGo
中圖分類號(hào):G642 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2018)12-0229-02
0 引言
2016年3月,谷歌旗下的DeepMind公司開發(fā)的人工智能機(jī)器人阿爾法圍棋(AlphaGo)與圍棋世界冠軍、職業(yè)九段棋手李世石進(jìn)行人機(jī)大戰(zhàn),以4比1的總比分獲勝,這是人工智能機(jī)器人在象棋領(lǐng)域完勝人類之后的一大進(jìn)步。2017年5月,AlphaGo在中國烏鎮(zhèn)圍棋峰會(huì)上,以3比0的總比分戰(zhàn)勝了排名世界第一的圍棋冠軍柯潔。此后DeepMind團(tuán)隊(duì)又于2017年10月公布了代號(hào)為 “AlphaGo Zero”的最強(qiáng)版阿爾法圍棋。此后,人工智能機(jī)器人在圍棋領(lǐng)域一路戰(zhàn)績輝煌,人類在圍棋界的霸主地位一去不復(fù)返。
當(dāng)AlphaGo在圍棋領(lǐng)域取得成功后,DeepMind公司的研發(fā)團(tuán)隊(duì)繼續(xù)將戰(zhàn)場(chǎng)轉(zhuǎn)移到了基礎(chǔ)科學(xué)研究領(lǐng)域——蛋白質(zhì)折疊結(jié)構(gòu)的預(yù)測(cè)。近日,DeepMind正式宣布Alpha Fold 系統(tǒng)開發(fā)成功,并在蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)界有“奧運(yùn)會(huì)”之稱的蛋白質(zhì)結(jié)構(gòu)預(yù)測(cè)技術(shù)關(guān)鍵評(píng)估社區(qū)范圍實(shí)驗(yàn)(CASP)全球競(jìng)賽上再次拔得頭籌。
阿爾法圍棋(AlphaGo)的成功象征著計(jì)算機(jī)技術(shù)已進(jìn)入人工智能的新IT時(shí)代。對(duì)此,信息論和控制論功不可沒,信息論與控制論的完美融合將推動(dòng)人類新的科技革命和產(chǎn)業(yè)變革。
1 AI的發(fā)展歷程
AI(Artificial Intelligent),即人工智能,是一門研究如何應(yīng)用計(jì)算機(jī)的軟硬件來模擬人類某些智能行為的基本理論、方法和技術(shù)。AI主要是基于對(duì)人類智能活動(dòng)規(guī)律的研究,旨在構(gòu)造一套具有一定智能的人工系統(tǒng),來模擬人類去完成需要人的智力才能勝任或者高于人的智力才能勝任的工作。AI的目的是讓機(jī)器能夠像人一樣地思考,智能地去完成指定的任務(wù)。
自1956年正式提出人工智能學(xué)科以來,人工智能走過了曲折發(fā)展的60余年:
(1)1950年,一位名叫馬文·明斯基的大四學(xué)生與他的同學(xué)鄧恩·埃德蒙一起建造了世界上第一臺(tái)神經(jīng)網(wǎng)絡(luò)計(jì)算機(jī),被看作是人工智能的起點(diǎn),馬文·明基斯也被稱為“人工智能之父”。同年,被稱為“計(jì)算機(jī)之父”的阿蘭·圖靈提出了“圖靈測(cè)試”,并預(yù)言了真正具備智能機(jī)器的可行性。1956年,“人工智能”概念首次提出,“讓機(jī)器能像人那樣認(rèn)知、思考和學(xué)習(xí),即用計(jì)算機(jī)模擬人的智能”。
(2)在此后長達(dá)十余年的時(shí)間里,AI被廣泛應(yīng)用于數(shù)學(xué)、自然語言、工業(yè)、化學(xué)等領(lǐng)域,力圖用人工智能來模擬人類智慧。早期的智能程序主要是為了解決特定的某個(gè)問題,但隨著AI在專業(yè)領(lǐng)域應(yīng)用的深入,以及要解決的問題復(fù)雜性的上升,計(jì)算機(jī)計(jì)算能力和性能不足,早期的人工智能程序立馬就不堪重負(fù)了。而且,因?yàn)閿?shù)據(jù)量的嚴(yán)重缺失,沒有足夠大的數(shù)據(jù)庫來支撐程序進(jìn)行深度學(xué)習(xí),從而導(dǎo)致機(jī)器無法讀取足夠量的數(shù)據(jù)進(jìn)行智能化,AI的應(yīng)用進(jìn)入了技術(shù)瓶頸期。
(3)1980年,美國卡耐基·梅隆大學(xué)為DEC公司設(shè)計(jì)了一套具有完整專業(yè)知識(shí)和經(jīng)驗(yàn)的計(jì)算機(jī)智能的專家系統(tǒng)“XCON”。專家系統(tǒng)的商業(yè)化為AI的發(fā)展帶來了轉(zhuǎn)機(jī),衍生出了像Symbolic、Lisp Machines等這樣的硬、軟件公司。但是好景不長,1987年,蘋果和IBM公司生產(chǎn)的臺(tái)式機(jī)性能大大超過了Symbolic等廠商生產(chǎn)的通用計(jì)算機(jī),從此,專家系統(tǒng)也逐漸被淘汰。
(4)1997年5月,IBM的計(jì)算機(jī)系統(tǒng)“深藍(lán)”戰(zhàn)勝國際象棋世界冠軍,這是AI發(fā)展的一個(gè)重要里程。20世紀(jì)90年代中期,隨著AI技術(shù)的逐步發(fā)展,人們漸漸對(duì)AI開始抱有客觀理性的認(rèn)知,人工智能技術(shù)也開始進(jìn)入平穩(wěn)發(fā)展時(shí)期。2006年,Hinton在神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)領(lǐng)域取得突破,人類又一次看到機(jī)器趕超人類的希望。2016至2017年期間,AlphaGo戰(zhàn)勝圍棋冠軍,深度學(xué)習(xí)大熱。尤其近幾年,谷歌、微軟、百度,還有眾多互聯(lián)網(wǎng)科技公司紛紛加入AI產(chǎn)品的戰(zhàn)場(chǎng)。移動(dòng)終端、可穿戴設(shè)備、感知設(shè)備、互聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)、傳感網(wǎng)絡(luò)、車聯(lián)網(wǎng)……隨著越來越多的AI產(chǎn)品流入市場(chǎng),社會(huì)上掀起了新一輪的智能化狂潮。
隨著計(jì)算機(jī)技術(shù)的發(fā)展,計(jì)算能力已經(jīng)不是用“飛速”能形容的了,高性能的計(jì)算能力,為AI的復(fù)雜程序?qū)崿F(xiàn)提供了保障;當(dāng)今社會(huì),計(jì)算機(jī)網(wǎng)絡(luò)無處不在,作為被這張大網(wǎng)聯(lián)結(jié)的每個(gè)節(jié)點(diǎn),人、機(jī)、物空前地緊密聯(lián)系著,大數(shù)據(jù)開始涌現(xiàn),為AI的智能化學(xué)習(xí)提供了龐大的數(shù)據(jù)庫支持。以深度學(xué)習(xí)等為代表的人工智能模型與算法不斷突破,在數(shù)據(jù)和知識(shí)在社會(huì)、物理空間和信息空間之間的交叉融合與相互作用下,AI不斷發(fā)展著新的計(jì)算范式。
2 信息論及其作用
2.1 信息論
信息是既看不見又摸不著,但是卻存在于我們生活的方方面面。千百年來,人們只能用信息量大、信息量小來籠統(tǒng)地說明某個(gè)信息告訴了我們多少“知道”的東西。直到1948年,克勞迪·香農(nóng)借用熱力學(xué)中“熵”的說法,提出了“信息熵”的概念,才回答了“什么是信息”這個(gè)問題,并且解決了對(duì)信息的度量問題。香農(nóng)提出,信息就是對(duì)系統(tǒng)中不確定的消除,用信息熵來描述一個(gè)系統(tǒng)中的不確定。信息熵越大,對(duì)某個(gè)事件的不確定就會(huì)越少,那么所含的信息量也就越大。也可以認(rèn)為,信息量的度量就是度量系統(tǒng)中不確定性的多少,而系統(tǒng)中不確定性的多少可以通過數(shù)據(jù)量的多少計(jì)算。這樣,香農(nóng)就通過“熵”的概念,將信息量和數(shù)據(jù)量聯(lián)系聯(lián)系起來了。因?yàn)閿?shù)據(jù)量是可測(cè)量的,所以信息量的度量也就由籠統(tǒng)轉(zhuǎn)向了可量可算。而信息論就是這樣一門通過數(shù)理統(tǒng)計(jì)方法來研究信息的度量、傳遞和變換規(guī)律的學(xué)科。
此外,隨著科學(xué)技術(shù)的進(jìn)步,信息論所研究的內(nèi)容也在不斷的加深。新時(shí)代下的信息論所要研究的內(nèi)容不僅僅包括信息的度量、獲取、處理等問題,還逐漸與其他相關(guān)領(lǐng)域融合,例如語義學(xué)、神經(jīng)心理學(xué)、語言學(xué)等等。
2.2 信息論的作用
信息論是建立在概率論基礎(chǔ)上而形成的,主要的作用是將一個(gè)信號(hào)所提供的數(shù)據(jù)進(jìn)行計(jì)算,從而削弱對(duì)系統(tǒng)的不確定。通過模擬概率法的計(jì)算過程和來設(shè)計(jì)AI系統(tǒng)的算法,將下圍棋的問題轉(zhuǎn)化成用于表達(dá)不確定性概率分布的問題。以AlphaGo為例,AlphaGo實(shí)質(zhì)上是一道圍棋人工智能程序。它的核心系統(tǒng)主要是所形成的策略網(wǎng)絡(luò)(policy network)和價(jià)值網(wǎng)絡(luò)(value network)。將棋盤上的當(dāng)前落子局勢(shì)作為原始數(shù)據(jù)輸入,策略網(wǎng)絡(luò)將所有可落子的位置生成一個(gè)概率分布,分析下一步落子位置的概率,價(jià)值網(wǎng)絡(luò)則分析下一步落子后獲勝的概率。二者互相配合,從而篩選出落子概率最高、獲勝概率最高的地方為下一步的落子位置。早期的AlphaGo就是依賴自身快速又龐大的計(jì)算能力,并結(jié)合數(shù)萬人類圍棋專家的棋譜來進(jìn)行概率計(jì)算的。不斷地接觸新棋譜,就是AlphaGo的學(xué)習(xí)過程,在經(jīng)過先期的全盤探索和過程中對(duì)最佳落子的不斷揣摩后,阿爾法圍棋的搜索算法就能在其計(jì)算能力上不斷地接近人類的智力和直覺判斷,進(jìn)而超過人類智能。
此外,信息論所要研究規(guī)律的范疇還應(yīng)包含語法、語義和語用。語法是指信息表達(dá)所用的符號(hào),語義是指各符號(hào)的意義,語用是指信息的接受者所接受的對(duì)他有用的信息。比如表達(dá)同一種語義信息,可以用不同的語言文字來表示,這些語言文字所含的語法信息是不用的,而這信息的接受者只需要接受他能懂的語言,他不懂的語言,對(duì)他來說是沒有語用信息的。從一定程度上來說,語法信息的信息率小于語義的信息率,語義的信息率又小于語用所包含的信息率。通過對(duì)信息論的研究,可以優(yōu)化AI系統(tǒng)的控制語言,使系統(tǒng)傳輸語義信息或語用信息,這將會(huì)大大提升及機(jī)器的信息傳輸效率。
3 控制論及其作用
3.1 控制論
控制論最早是由諾伯特·維納在《控制論——關(guān)于在動(dòng)物和機(jī)器中控制和通訊的科學(xué)》一書中提出來的,在維納的控制論中,信息是控制的基礎(chǔ),這種通過使用信息在某些受控對(duì)象上起到的作用,叫做“控制”。打個(gè)比方,甲向乙發(fā)出某一項(xiàng)指令,乙在收到指令后完成了相應(yīng)的動(dòng)作,這一系列的過程就可以看成是“控制”的過程。所以,控制論主要研究的問題在于系統(tǒng)中控制指令的傳達(dá)和作用。
在2004年,中國科學(xué)院自動(dòng)化研究所王飛躍研究員在控制論的基礎(chǔ)上,首次提出了(Parallel Systems)的概念。簡單來講,平行系統(tǒng)包括實(shí)際系統(tǒng)和一個(gè)或多個(gè)虛擬的人工系統(tǒng)兩部分組成,二者之間存在互動(dòng)指令,可以相互作用。平行系統(tǒng)的一大亮點(diǎn)在于,借用計(jì)算機(jī)龐大的計(jì)算能力,在人工系統(tǒng)的內(nèi)部構(gòu)造一個(gè)虛擬空間用于運(yùn)行、計(jì)算、實(shí)驗(yàn),先觀察、預(yù)測(cè)并評(píng)估策略的效果,得出最合理的解決方案后,再運(yùn)用到實(shí)際系統(tǒng)中。這樣,通過連接實(shí)際系統(tǒng)和人工系統(tǒng),動(dòng)態(tài)分析二者之間的互動(dòng),就可以完成各自未來狀況的借鑒、預(yù)估和引導(dǎo)。
3.2 控制論的作用
平行系統(tǒng)的主要目的是以虛實(shí)互動(dòng)的方式,在虛擬空間反復(fù)迭代,找到規(guī)律,進(jìn)而指導(dǎo)實(shí)際空間進(jìn)行決策。使用人工系統(tǒng)對(duì)實(shí)際系統(tǒng)進(jìn)行預(yù)估,使二者之間能夠相互借鑒和引導(dǎo),從而找到最有效解決方案以及達(dá)到學(xué)習(xí)訓(xùn)練和系統(tǒng)優(yōu)化的目的。
以AlphaGo的進(jìn)步為例,早期的AlphaGo是結(jié)合搜索大量的棋譜,以及強(qiáng)化學(xué)習(xí)的監(jiān)督學(xué)習(xí)進(jìn)行的自我訓(xùn)練。在2017年5月與柯潔人機(jī)大戰(zhàn)后,DeepMind公司的研發(fā)團(tuán)隊(duì)宣布AlphaGo不再參加圍棋比賽,取而代之的是最強(qiáng)版的阿爾法圍棋——AlphaGo Zero。AlphaGo Zero和先前版本的AlphaGo最大的區(qū)別在于AlphaGo Zero一開始并沒有接觸過任何棋譜。最開始它只是隨意地在棋盤上落子,然后分析所有可落子位置和贏的概率來選擇下一步的落子位置。這種博弈的次數(shù)在增加,它的神經(jīng)網(wǎng)絡(luò)也在不斷調(diào)整落子的最佳策略,為自己打下堅(jiān)實(shí)的“基礎(chǔ)”。AlphaGo Zero由最開始的單一的神經(jīng)網(wǎng)絡(luò),通過在虛擬空間中不斷進(jìn)行自我博弈來進(jìn)行學(xué)習(xí)。而在實(shí)際空間中正式下棋時(shí),AlphaGo Zero可以平行地往前探索所有的分叉,評(píng)估出可能的落子位置贏得概率,對(duì)比之后選出最優(yōu)的“下一步落子位置”。不僅如此,隨著訓(xùn)練的深入,研發(fā)團(tuán)隊(duì)驚奇地發(fā)現(xiàn)AlphaGo Zero不僅發(fā)現(xiàn)了游戲規(guī)則,而且走出了新策略。AlphaGo Zero能夠通過自我博弈來不斷地調(diào)整策略,利用深度學(xué)習(xí)來進(jìn)行自我的智能優(yōu)化,這讓我們看到了控制論在AI中應(yīng)用的美好前景。
4 信息論與控制論的完美融合
信息論將推動(dòng)人工智能實(shí)現(xiàn)更高層次的認(rèn)知。盡管AI系統(tǒng)在處理問題時(shí)已經(jīng)足夠“智能化”,但人們更希望有一天能直接用自然語言與計(jì)算機(jī)直接對(duì)話。雖然現(xiàn)在的語音識(shí)別、以及各種人像識(shí)別已經(jīng)基本上解決了這個(gè)問題,但是人們往往還希望計(jì)算機(jī)能夠通過語調(diào)、表情等來識(shí)別說話者所表達(dá)的情緒和信息。信息論所研究的語法和語用信息為未來實(shí)現(xiàn)無障礙的人機(jī)對(duì)話提供了可能。
控制論將推動(dòng)人工智能實(shí)現(xiàn)更深層次的決策。人的一生經(jīng)歷是有限的,人類在解決問題是做出反應(yīng)和決策很大程度上是依據(jù)自身的閱歷??刂普撆cAI系統(tǒng)相融合,AI在與實(shí)際系統(tǒng)連接的過程中,依賴的是當(dāng)前的大數(shù)據(jù)環(huán)境和計(jì)算機(jī)技術(shù)。構(gòu)造一個(gè)虛擬的人工系統(tǒng),模擬人類在不同的環(huán)境中的反應(yīng)與動(dòng)作,不斷學(xué)習(xí)、試錯(cuò)、評(píng)估,并進(jìn)行優(yōu)化,從而指導(dǎo)實(shí)際系統(tǒng)做出更新層次的決策。
現(xiàn)在智能機(jī)器人是AI發(fā)展的一個(gè)高水平的體現(xiàn)。智能機(jī)器人要實(shí)現(xiàn)更復(fù)雜的“仿人”控制,不僅僅要能夠模仿人類的思維方式,還要能夠理解人類的思維決策。有研究表明,人類的思維決策是邏輯思維和情感思維的結(jié)合,這就需要在機(jī)器人身上實(shí)現(xiàn)仿人的情感控制。這不僅僅涉及到人機(jī)之間的信息交互,更是涉及到人機(jī)之間的情感交互。而且,人類是經(jīng)歷了數(shù)百萬年的社會(huì)進(jìn)化后才形成的最復(fù)雜的控制系統(tǒng),這要在智能機(jī)器人身上實(shí)現(xiàn),必將是AI要進(jìn)一步發(fā)展需要深入研究的課題。
參考文獻(xiàn)
[1]朱雪龍.應(yīng)用信息論基礎(chǔ)[M].清華大學(xué)出版社,2001.
[2]王飛躍,魏慶來.智能控制:從學(xué)習(xí)控制到平行控制.控制理論與應(yīng)用,2018,35(7):939-948.
[3]王飛躍.平行系統(tǒng)方法與復(fù)雜系統(tǒng)的管理和控制[J].控制與決策,2004,19(5):485-489.
[4]張善信.人工智能課題及其認(rèn)知意義[J].中國礦業(yè)大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2001,3(1):36-41.
[5]劉知青,吳修竹.解讀AlphaGo背后的人工智能技術(shù)[J].控制理論與應(yīng)用,2016,33(12):1685-1687.
The Perfect Fusion of Information Theory and Cybernetics: Starting from the new Development of AI
JIANG Zong-yue
(Tianjin No. 1 Middle School, Tianjin? 300300)
Abstract:In recent years, artificial intelligence has set off a boom in all walks of life. The development of computer technology provides intelligent algorithms and running space for AI technology; the popularity of computer networks provides a database foundation for AI technology; the integration of information theory and cybernetics provides a theoretical basis for AI. This paper reviews the development of artificial intelligence. Based on the success of AlphaGo, it expounds the important position and role of information theory and cybernetics in artificial intelligence technology.
Key words:artificial intelligence; information theory; cybernetics; AlphaGo