人們關(guān)心人工智能都聚焦兩個問題,一是人工智能現(xiàn)在發(fā)展到了什么程度?下一步我們該怎么辦?人工智能的發(fā)展比較緩慢。當(dāng)時人工智能主要提出了兩個模型,一個是以知識和經(jīng)驗為基礎(chǔ)的符號推理模型,用來解決人類理性的智能。但是這個工作進展得比較慢。直到2011年,這個模型才取得較大進展,典型的案例就是IBM做的watson系統(tǒng),在人機競賽上打敗了人類。
為什么能取得這個結(jié)果呢?主要原因是,原來專家系統(tǒng)的知識是非常稀缺和昂貴的,而且要把這個知識放到計算機里面去,用人工的方法輸進去難度非常大,所以當(dāng)時進展比較慢。為什么2011年能取得很大進展呢?最主要的原因就是這里面把互聯(lián)網(wǎng)的大眾知識輸入到系統(tǒng),不需要經(jīng)過人工加工。
第二個模型是機器學(xué)習(xí)或者叫做神經(jīng)網(wǎng)絡(luò)。當(dāng)時神經(jīng)網(wǎng)絡(luò)在應(yīng)用上的進展也很慢,最主要原因是當(dāng)時神經(jīng)網(wǎng)絡(luò)輸入要靠人工設(shè)計或者來編制特征。這種情況下我們要做大規(guī)模的系統(tǒng)就很困難。這個問題到本世紀(jì)初有了很大的轉(zhuǎn)折,即我們現(xiàn)在講的深度學(xué)習(xí)。把神經(jīng)元網(wǎng)絡(luò)的層次增加以后,機器學(xué)習(xí)得到了根本性的改變,從原始的淺層學(xué)習(xí)變成現(xiàn)在的深度學(xué)習(xí)。另一個重要改變是我們把原始的數(shù)據(jù)輸進去,不必人工干預(yù),這樣就使得深度學(xué)習(xí)變成一個大眾化的,大家普遍能用的工具,不需要擁有專業(yè)知識。由于這樣的革命性變化,這個技術(shù)正被廣泛采用。
深度學(xué)習(xí)最典型的應(yīng)用是解決問題,即模式識別。圍棋為什么能夠成功呢?我們把下圍棋看成模式識別,通過深度學(xué)習(xí)圍棋程序,2015年以前只能達(dá)到業(yè)余五段,通過深度學(xué)習(xí)以后,在兩年的時間能夠?qū)崿F(xiàn)三級跳,從業(yè)余變成專業(yè),從專業(yè)變成世界冠軍,現(xiàn)在已遠(yuǎn)遠(yuǎn)超過世界冠軍。其中最重要的原因就是利用了大量的數(shù)據(jù)。
從目前來看,我們重要的任務(wù)就是把深度學(xué)習(xí),以及早期的符號推理模型應(yīng)用到交通、家庭、健康、教育等領(lǐng)域。我們國家特別強調(diào)在金融和智能制造的應(yīng)用。我們可以看到我們國家的很多獨角獸企業(yè),都是借助于深度學(xué)習(xí)技術(shù),集中在圖像處理和語音識別這兩個領(lǐng)域。
但是,我們也必須看到深度學(xué)習(xí)的局限性,也就是我們一方面要充分進一步應(yīng)用深度學(xué)習(xí),但是另一方面盡管它可以在各個領(lǐng)域應(yīng)用,但是也必然受到多種條件的制約。
現(xiàn)在用大數(shù)據(jù)建立的識別系統(tǒng),盡管在某個指標(biāo)上超過人類,但其他方面跟人類相比差距非常大。計算機的圖像識別率即使能達(dá)到跟人差不多,但仍有錯訛。我們?nèi)右粋€噪聲給計算機就可以讓它識別成任何東西,這是它很大的弱點。這個弱點在很多應(yīng)用場合里面是不允許的,如果在人臉識別、圖像識別里面有這樣的錯誤還可以容忍的話,如果這樣的錯誤出現(xiàn)在決策上的話,那是人們不可理解的。
我們目前仍然面臨挑戰(zhàn),雖然人工智能取得了一些進展,但仍然有很大的局限性。應(yīng)對這種局限性,深圳非常重視基礎(chǔ)研究,發(fā)展新的理論來引領(lǐng)技術(shù)的突破,克服目前人工智能存在的局限性并擴大應(yīng)用領(lǐng)域,這樣才有可能真正使得人工智能讓人類生活得更美好。
(本文摘編于中國科學(xué)院院士、清華大學(xué)人工智能研究院院長張鈸在第二十屆高交會上的演講。)