石寧鈺
國際上人工智能的創(chuàng)新和創(chuàng)業(yè)日趨活躍,這將在中關(guān)村掀起一場新的技術(shù)革命……
圍棋人機大戰(zhàn)讓人工智能再度受到廣泛關(guān)注。當(dāng)街頭巷尾都還在紛紛論人工智能到底是什么、它和我們有什么關(guān)系時,這條人工智能的路早已繼續(xù)高歌猛進,漸漸在中關(guān)村蔓延開來。
概念由來:朋友聚會提出來的“人工智能”
1956年夏天,在美國達特茅斯大學(xué)(Dartmouth)召開了一次影響深遠的歷史性會議。這次聚會屬于朋友間沙龍式的學(xué)術(shù)研討,與會者僅僅只有10個人,當(dāng)時僅僅是些名不見經(jīng)傳的年輕學(xué)者,但后來,他們的名字人們不再陌生,例如申龍是《信息論》的創(chuàng)始人,塞繆爾編寫了第一個電腦跳棋程序,麥卡錫、明斯基、紐厄爾和西蒙都是“圖林獎”的獲獎?wù)摺?/p>
達特茅斯會議歷時長達兩個多月,首次提出了“人工智能”(Artificial Intelligence)這一術(shù)語。
達特茅斯會議雖然提出了人工智能,但卻沒能再提出有關(guān)于此的更多內(nèi)容,事實上,人工智能的研究狀況比科學(xué)家們的設(shè)想要復(fù)雜和艱難的多。20世紀(jì)70年代初,人工智能在經(jīng)歷了一段比較快速的發(fā)展時期后,很快就遇到了問題,開始走向低谷。
人工智能的科學(xué)家并沒有被一時的困難所嚇倒,他們在認(rèn)真總結(jié)經(jīng)驗教訓(xùn)的基礎(chǔ)上努力探索,使人工智能走出實驗室,走向?qū)嵱没?。人工神?jīng)網(wǎng)絡(luò)(artificial neural networks)技術(shù)的迅速發(fā)展無疑讓人工智能的學(xué)術(shù)界看到了新的希望,讓人工神經(jīng)網(wǎng)絡(luò)被視為實現(xiàn)人工智能的可能途徑。其實它不是一個新概念,20世紀(jì)60年代,人們把它稱之為感知機,再后來人們開始創(chuàng)造多層感知機,也就是我們今天通常聽到的人工神經(jīng)網(wǎng)絡(luò)。
ANN中有稱作神經(jīng)元的計算單元。這些人工神經(jīng)元通過突觸連接,這里的突觸指的是權(quán)重值。也就是說,給定一個數(shù)字,一個神經(jīng)元將執(zhí)行某種計算,然后計算結(jié)果會被乘上一個權(quán)重。如果你的神經(jīng)網(wǎng)絡(luò)只有一層,那么加權(quán)后的結(jié)果就是該神經(jīng)網(wǎng)絡(luò)的輸出值?;蛘撸阋部梢耘渲枚鄬由窠?jīng)元,這就是深度學(xué)習(xí)的基礎(chǔ)概念。
如何執(zhí)行:人工神經(jīng)網(wǎng)絡(luò)通過反向傳播實現(xiàn)
關(guān)于運行計算的神經(jīng)元和神經(jīng)突觸,它們又是如何學(xué)習(xí)執(zhí)行計算?從本質(zhì)上說,就是我們需要問它們大量的問題,并提供給它們答案,也就是有監(jiān)督學(xué)習(xí)。借助于足夠多的問題和答案案例,儲存在每個神經(jīng)元和神經(jīng)突觸中的計算和權(quán)值就能慢慢進行調(diào)整。通常,這是通過一個叫做反向傳播(backpropagation)的過程實現(xiàn)的。
具體來說,反向傳播算法就是在學(xué)習(xí)過程中從最開始輸入層輸入特征向量,網(wǎng)絡(luò)層層計算獲得輸出,輸出層發(fā)現(xiàn)輸出和正確的信息不一樣,這時它就讓最后一層神經(jīng)元進行參數(shù)調(diào)整,最后一層神經(jīng)元不僅自己調(diào)整參數(shù),還會勒令連接它的倒數(shù)第二層神經(jīng)元調(diào)整,層層往回退著調(diào)整。經(jīng)過調(diào)整的網(wǎng)絡(luò)會在樣本上繼續(xù)測試,如果輸出還是老出錯,繼續(xù)來一輪調(diào)整,直到網(wǎng)絡(luò)輸出滿意為止。
舉例說明,把一張貓的照片交給計算機讓其識別,計算機通過這張照片的像素信息逐層分析,每一層都會有若干個神經(jīng)元負(fù)責(zé)分解畫面上的信息,比如說第一層負(fù)責(zé)分析照片上的輪廓信息,這個時候可能有一半的神經(jīng)元判斷這個照片上是狗,另一半覺得這個照片上是貓,沒關(guān)系,再交給下一層分析,下一層的神經(jīng)元負(fù)責(zé)分析照片上的顏色信息,再下一層負(fù)責(zé)分析照片上的紋理信息,以此類推。到了最后一層計算機得出的結(jié)果是照片上的動物是狗。但如果計算得出了錯誤的信息,神經(jīng)網(wǎng)絡(luò)就得重新再來一遍,這時候每層的神經(jīng)網(wǎng)絡(luò)就會反省上一次的錯誤,分析得出正確的結(jié)果。
技術(shù)變革:爭做人工智能時代的微軟英特爾
深度學(xué)習(xí)近幾年已經(jīng)引起很多擁有大數(shù)據(jù)的互聯(lián)網(wǎng)公司爭相投入資源研發(fā)。這個最初來自學(xué)術(shù)界的研究成果漸漸開始影響到各大高科技公司……
2012年,百度語音和圖像產(chǎn)品快速崛起,在語音識別準(zhǔn)確率方面,2012年全年的進展超過了業(yè)界過去多年進展的總和。在圖像處理方面,百度僅用一個多月的時間就上線了世界首個全網(wǎng)人臉?biāo)阉鳟a(chǎn)品,這些重大突破都得益于深度學(xué)習(xí)技術(shù)的突破與應(yīng)用。
2013年年初,百度CEO李彥宏宣布成立百度深度學(xué)習(xí)研究院(Institute of Deep Learning,IDL),這是百度歷史上首個正式成立的前瞻性研究機構(gòu),致力于“讓計算機像人腦一樣智能”的科學(xué)研究。李彥宏明確表示,希望IDL成為像AT&T-Bell labs(貝爾實驗室)、Xerox PARC(施樂帕洛阿爾托研究中心)一樣的頂尖研究機構(gòu)。
地平線機器人技術(shù)研發(fā)有限公司成立于2015年6月,其創(chuàng)始人余凱曾為百度深度學(xué)習(xí)研究院常務(wù)副院長。自2015年5月離職后,余凱便致力于打造基于深度神經(jīng)網(wǎng)絡(luò)的人工智能“大腦”平臺,其中包括了軟件和芯片的研發(fā),可以做到低功耗、本地化的解決環(huán)境感知、人機交互、決策控制等問題。其中,軟件方面,地平線做了一套基于神經(jīng)網(wǎng)絡(luò)的操作系統(tǒng),目前也正在研發(fā)分別面向自動駕駛的“雨果”平臺和智能家居的“安徒生”平臺,并已開始在一些具體的應(yīng)用場景中逐步落地。硬件方面,未來地平線機器人還會為這個平臺設(shè)計一個大腦芯片BPU (Brain Processing Unit) ,支撐自家的操作系統(tǒng),到那時效能會提升 2-3 個數(shù)量級(100-1000 倍)。
中國科學(xué)院計算技術(shù)研究所日前發(fā)布全球首顆神經(jīng)網(wǎng)絡(luò)處理器“寒武紀(jì)”。該處理器比“AlphaGo”所使用的處理器在性能上提升兩個數(shù)量級,在硬件設(shè)計上更符合神經(jīng)網(wǎng)絡(luò)逐層分析的特點,從而能準(zhǔn)確、快速地識別更加復(fù)雜的事物。也就是說,它能夠讓人工智能跑得更快、更遠。
該課題組負(fù)責(zé)人之一、中科院計算所陳天石博士透露,今年課題組和中科院計算所已經(jīng)孵化了中科寒武紀(jì)公司,正式開始進行科研成果的產(chǎn)業(yè)化。未來應(yīng)用瞄準(zhǔn)企業(yè)、科研院所里的高性能服務(wù)器、高效能終端芯片、機器人芯片三大領(lǐng)域,實現(xiàn)更多功能、可服務(wù)的領(lǐng)域,既包括社會民生,也包括國家重大需求。
陳天石介紹,寒武紀(jì)這個地質(zhì)紀(jì)年是生物多樣性大爆發(fā)的時代,這項科研成果之所以取這個名字,就是希望人工智能也能像生命一樣出現(xiàn)大爆發(fā)。
國際上人工智能的創(chuàng)新和創(chuàng)業(yè)日趨活躍。以創(chuàng)業(yè)企業(yè)為例,市場調(diào)查公司“風(fēng)險掃描”繪制的一張人工智能創(chuàng)業(yè)地圖顯示,截至2015年,全球人工智能初創(chuàng)企業(yè)已有855家,橫跨13個門類,總估值超過87億美元。在中關(guān)村,隨著一大批核心科研成果誕生、轉(zhuǎn)化,人工智能領(lǐng)域加速發(fā)展,正帶動一場新的技術(shù)變革。中關(guān)村企業(yè)將爭做人工智能時代的微軟英特爾。