我們現(xiàn)在這個(gè)時(shí)代確實(shí)是已經(jīng)從大數(shù)據(jù)時(shí)代,移到人工智能時(shí)代。為什么這樣講呢?實(shí)際上這和大數(shù)據(jù)本身的內(nèi)涵關(guān)聯(lián)性比較強(qiáng)。我們知道大數(shù)據(jù)本身的規(guī)模越來越大,從原來的EB級(jí)正在往ZB級(jí)發(fā)展,數(shù)據(jù)本身在不停地增加,我們稱為數(shù)據(jù)泛濫。這個(gè)數(shù)據(jù)泛濫包括很多,比如和零售相關(guān)有很多數(shù)據(jù),再早一點(diǎn)是科學(xué)的數(shù)據(jù),不管哪種數(shù)據(jù)都是和網(wǎng)絡(luò)關(guān)聯(lián)的,個(gè)人自媒體出來以后網(wǎng)絡(luò)數(shù)據(jù)又非常多。
數(shù)據(jù)是不是越大越好,是不是什么東西都一定要一個(gè)數(shù)據(jù)?回答是No。最近有一個(gè)非常好的案例,Alpha Go下圍棋,以前是需要使用人類下圍棋的數(shù)據(jù),同時(shí)自己嘗試了三千萬局的數(shù)據(jù),最近的Alpha Zero不需要人類對(duì)弈數(shù)據(jù)了,自己會(huì)生產(chǎn)數(shù)據(jù)。
現(xiàn)在很多的交易、物流、零售,其實(shí)它有很多的條件一直在變,不滿足剛才的條件,這時(shí)候你需要很多外部的數(shù)據(jù)。有外部數(shù)據(jù)就夠了?當(dāng)然不是,外部數(shù)據(jù)怎么用?它自己不會(huì)去產(chǎn)生一個(gè)用法,這個(gè)用法需要人,需要通過人工智能這些手段去用這些數(shù)據(jù)。所以人工智能實(shí)際上就是從大數(shù)據(jù)科學(xué)到人工智能,非常自然的遷移過程。
人工智能時(shí)代
最近人工智能非常熱。在人工智能路上有很多關(guān)鍵人物不能忘記,圖靈不能忘記,計(jì)算機(jī)領(lǐng)域特別重要的一個(gè)獎(jiǎng)圖靈獎(jiǎng),其他學(xué)科有諾貝爾獎(jiǎng),諾貝爾時(shí)代沒有計(jì)算機(jī),后來有了計(jì)算機(jī)以后,大家就想計(jì)算機(jī)界也應(yīng)該設(shè)一個(gè)和諾貝爾獎(jiǎng)相當(dāng)?shù)莫?jiǎng),這個(gè)獎(jiǎng)就是圖靈獎(jiǎng)。
什么叫人工智能?其實(shí)人工智能是人類智能的一個(gè)計(jì)算機(jī)的實(shí)現(xiàn),它永遠(yuǎn)不可能超過人類智能,只是說在某一個(gè)特定的方面它可能勝出,但從智能本身它沒辦法勝出。我們看看智能的定義,其實(shí)智能有很多方面,包括邏輯能力、語言能力、空間能力、感知能力,包括音樂感知的能力,肢體的控制能力。后面這幾個(gè)是比較難的,包括人的內(nèi)省、自我反省,包括人際關(guān)系的能力,包括自然探索的能力,比如發(fā)現(xiàn)一些新的東西,完全沒有任何線索,你能想出我要做這個(gè),我把這個(gè)問題解決掉。自然探索的能力,包括圖像、圖形的感知能力。
1956年有一個(gè)里程碑式的會(huì)議——達(dá)特茅斯會(huì)議。當(dāng)時(shí)人工智能這幾個(gè)元老還很年輕,他們集聚到一起開了兩個(gè)月的會(huì),討論怎么樣讓機(jī)器具有人的智能、定出了人工智能的最終目標(biāo)以及什么叫人工智能。現(xiàn)在看起來1956年定義的人工智能的白皮書,到現(xiàn)在一點(diǎn)都不過時(shí)。
這次會(huì)議開了以后,全世界很多學(xué)校都開始跨入到人工智能熱潮當(dāng)中,典型的像斯坦福大學(xué)、CMU、MIT、哈佛大學(xué)都在做相關(guān)的這些研究,那個(gè)階段大家采用的技術(shù)手段,主要是邏輯主義或者符號(hào)主義。
什么叫邏輯或者符號(hào)呢?實(shí)際上就是他認(rèn)為一切的推理,我都可以用邏輯演算的方式來實(shí)現(xiàn),我只要定義了整個(gè)邏輯演算的體系,做一個(gè)規(guī)則,就可以完成任何事,可以進(jìn)行推理、數(shù)學(xué)證明,可以創(chuàng)作、奏樂等等。其實(shí)我們小學(xué)就學(xué)過代數(shù)運(yùn)算,邏輯也是一種運(yùn)算,但它用的不是代數(shù)運(yùn)算,而是布爾運(yùn)算,和代數(shù)運(yùn)算非常接近。有了這個(gè)運(yùn)算就可以對(duì)它進(jìn)行推理,推理你要使用一個(gè)工具,他們使用了演繹推理的工具。
我們知道到現(xiàn)在為止,最主要的自然科學(xué)的定理使用的都是演繹推理的方式來完成的。比如說亞里士多德的三段論體系就是非常典型的演繹推理,歐幾里得的幾何學(xué)也是這樣完成的,牛頓力學(xué),麥克斯韋、愛因斯坦全都是用演繹定理推出來的。
所有演繹推理的基礎(chǔ)是滿足三段論方程。什么叫三段論,我有一個(gè)大前提,這是一個(gè)一般的原理,我有一個(gè)小前提是我要研究的特殊情況,根據(jù)大前提、小前提得到一個(gè)結(jié)論,這個(gè)結(jié)論是根據(jù)一般情況,對(duì)特殊情況做出一個(gè)判斷,這就完成了演繹推理,這就叫三段演繹推理。
所有的基礎(chǔ)邏輯的方法都是這樣做的。為了做這個(gè)當(dāng)時(shí)設(shè)計(jì)了很多的人工智能語言,用這種語言可以寫人工智能的方程,機(jī)器就可以去證明。
當(dāng)然這聽起來很好,而且第一次浪潮,大家都認(rèn)為十年之內(nèi)人工智能一定可以完成很多事,但一直到1976年前后,大家發(fā)現(xiàn)一開始定的那么高調(diào)的東西絕大多數(shù)都實(shí)現(xiàn)不了。所以1976年實(shí)際上是人工智能第一次的嚴(yán)冬的到來。
1976年之后盡管沒有經(jīng)費(fèi),但是開始有很多做神經(jīng)元網(wǎng)絡(luò)的學(xué)者,不停的寫東西、發(fā)東西,一直到1986年出來一個(gè)讓人眼睛一亮的東西,這個(gè)東西叫BP算法(即誤差反傳網(wǎng)絡(luò))。以往的神經(jīng)元網(wǎng)絡(luò)只能做非常小的事,做不了大事。但這個(gè)東西出來以后可以做大事了,所以就推動(dòng)了這個(gè)領(lǐng)域發(fā)展的速度非??臁5仓荒芙鉀Q一些問題。一開始人們也是期待要解決很多問題,但遙遙無期,到最后又來了第二次的低谷,包括日本第五代機(jī)的失敗,當(dāng)時(shí)在斯坦福大學(xué)要建一個(gè)知識(shí)百科全書的項(xiàng)目都失敗了,使得第二次人工智能又跌入了低谷。
第三次是從2006年開始的,現(xiàn)在是人工智能的三位知名學(xué)者,一位是在多倫多大學(xué)的Geoffrey Hinton,一位是在蒙特利爾大學(xué)的Yoshua Bingeo,一位是在紐約大學(xué)的Yann LeCun,這一年他們分別發(fā)表了三篇文章在講一件事。文章出來了以后,大家并不知道這個(gè)東西要怎么用,被李凱和李飛飛做的ImageNet激活了。
ImageNet是一個(gè)全球的圖像識(shí)別比賽,在2012年以前都是用常規(guī)的方法,2012年開始有一個(gè)參賽隊(duì)用了這個(gè)方法,比別的隊(duì)錯(cuò)誤率馬上降低了一半。到2013年其它方法全部退出,全都是深度學(xué)習(xí),2014年不停地改進(jìn)。直到2015年,錯(cuò)誤率已經(jīng)降得非常多,深度學(xué)習(xí)的網(wǎng)絡(luò)也非常多。到2016年的時(shí)候幾乎做到不光人沒法比,錯(cuò)誤率已經(jīng)低到不需要再做了,所以李飛飛選擇2017年宣布這個(gè)比賽停止,不再做了,因?yàn)槠鋵?shí)已經(jīng)沒有太大促進(jìn)意義了。
人工智能發(fā)展機(jī)遇
我國(guó)有一個(gè)中國(guó)人工智能2.0的發(fā)展戰(zhàn)略研究,今年發(fā)布了一個(gè)重大研究計(jì)劃,這里面主要是做五個(gè)關(guān)鍵技術(shù)和一批應(yīng)用。這五個(gè)關(guān)鍵技術(shù),包括第一個(gè)方面是大數(shù)據(jù)智能,這和前面講的大數(shù)據(jù)關(guān)聯(lián)性非常強(qiáng)。第二個(gè)方面是群體智能,依靠群體的力量推進(jìn)智能的研究。第三個(gè)是跨媒體智能,要把聲音、圖像、文字、自然語言所有這些東西聯(lián)結(jié)在一起來研究智能,這是跨媒體智能未來所希望達(dá)到的目標(biāo)。第四個(gè)是人機(jī)混合增強(qiáng)智能,人和機(jī)器混合起來怎么樣讓智能更高能力更強(qiáng)。第五個(gè)是自主智能系統(tǒng),其實(shí)就是無人機(jī)。我們有五個(gè)支柱,上面是應(yīng)用,下面是基礎(chǔ)支撐。
那么這樣一個(gè)輪廓,在國(guó)家戰(zhàn)略上來說已經(jīng)進(jìn)行了非常圓滿的布局,這個(gè)是不是夠了?其實(shí)還不是。如果看整個(gè)人工智能學(xué)科的輪廓,包括計(jì)算機(jī)視覺、語言識(shí)別、自然語言、人機(jī)交互、機(jī)器學(xué)習(xí)等等,這些方面目前大的布局是沉浸到應(yīng)用這個(gè)方面。
涉及到人的九類智能,我們從邏輯語言文字和圖形圖像來說現(xiàn)在已經(jīng)做的相當(dāng)不錯(cuò),中間六類還是有相當(dāng)?shù)木嚯x需要探索??偨Y(jié)一下,歷史總是這樣螺旋前進(jìn)的,人工智能的三次浪潮也是從符號(hào)主義到連接主義。這個(gè)符號(hào)主義到現(xiàn)在為止已經(jīng)有30多年,作為人類智能的一個(gè)高等抽象,應(yīng)該是發(fā)揮作用的,所以怎么發(fā)揮作用,未來大家可以慢慢觀察。
連接主義,就是神經(jīng)元網(wǎng)絡(luò)、深度學(xué)習(xí),目前是非常大行其道的,但怎么樣解決小數(shù)據(jù)甚至沒有數(shù)據(jù)的學(xué)習(xí)?實(shí)際還是有相當(dāng)大的挑戰(zhàn),特別是很多的學(xué)習(xí)結(jié)果是不可解釋的,這是最大的挑戰(zhàn)。行為主義是注重自適應(yīng)和進(jìn)化,這是從人從猴子演化過來的,它可能更接近。它怎么樣在學(xué)習(xí)方面做得更好,還是需要探索的。
( 根據(jù)高文院士在京東金融全球數(shù)據(jù)探索者大會(huì)上的演講整理而成,未經(jīng)本人確認(rèn)。)endprint