孫茂松
人工智能的“熱”現(xiàn)狀
人工智能很“熱”,我們現(xiàn)在談?wù)撊斯ぶ悄芨嗍菑膽?yīng)用來看,從大眾角度來說。人工智能的研究初心是讓機器人具有人類個體的智能,也就是感知和認知的能力。感知,雖然不是人類獨有的,但與人類認知密切相關(guān)。認知則是人們獲得知識或應(yīng)用知識的過程,或信息加工的過程,像語言、記憶、推理、思維、想象等,都屬于認知。人工智能這些年的發(fā)展,特別是隨著互聯(lián)網(wǎng)的興起,產(chǎn)生了超越初心的部分——群體智能,這是個體智能所沒有的,比如智慧城市等。人工智能發(fā)展歷史經(jīng)歷了大的“三起兩落”,發(fā)端于2010年的第三次“起”趨于真實,人工智能研究從象牙塔走向社會,其最早的顯著性標志是語音識別。進入21世紀后大約有十年的時間,全世界研究者嘗試了各種機器學(xué)習(xí)的方法,語音識別的錯誤率怎么也降不下去。2010年人工智能進化到以深層神經(jīng)網(wǎng)絡(luò)為代表的深度學(xué)習(xí),使得語音識別的錯誤率大幅下降,開啟了這一波人工智能的高潮。2012年圖像識別、2015年機器翻譯也取得了類似的效果。圖像識別用的深層神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)CNN,差不多可以說它是直接借鑒了腦的視覺處理機理,在國際公開測試集上前幾年已超過了人類的識圖能力。機器翻譯用的是循環(huán)神經(jīng)網(wǎng)絡(luò)RNN。最近,有研究者發(fā)現(xiàn)人腦中存在類似的機制,這個腦科學(xué)的發(fā)現(xiàn)反而是受到了計算機科學(xué)的啟發(fā)。2016年谷歌研發(fā)的人工智能AlphaGo,利用了人類歷史上所有的優(yōu)秀棋譜,同時加上機器學(xué)習(xí),讓機器自己跟自己下,終于戰(zhàn)勝了人類頂尖棋手;不過,其后迭代出的AlphaGo Zero卻不再需要任何人類棋局,完全由機器自己跟自己下,結(jié)局是AlphaGo Zero完勝AlphaGo。如此種種,令人工智能留給公眾“神乎技矣”的深刻印象,大家對它產(chǎn)生了高度關(guān)注和期待。
人工智能的“冷”思考
這一代人工智能技術(shù)是以CNN和RNN為主要手段的深度學(xué)習(xí)技術(shù),在大數(shù)據(jù)、大算力的支持下,人工智能得以發(fā)揮作用,產(chǎn)生了驚艷的效果。需要注意的是,我們現(xiàn)在可能過多強調(diào)了人工智能“強勢”的一面,對其局限性則關(guān)注不夠。前幾年,我們總在討論人工智能是否會超越人類,答案應(yīng)該是“否”。實際上,這一代的人工智能技術(shù)要超越人類,需具備幾個基本條件。
首先是單一任務(wù),任務(wù)的邊界是清楚的,比如下棋就是下棋,不能是炒菜。該任務(wù)還必須同時滿足如下性質(zhì):第一,其可能狀態(tài)是有限的,不能有超出預(yù)期的狀態(tài)出現(xiàn);第二,元規(guī)則要確定,比如下棋,規(guī)定好你走一步我走一步,什么叫“死棋”,什么叫“活棋”;第三,信息完備,信息對雙方都是公開的;第四,也是最為重要的是,結(jié)果判斷可量化。人工智能面對滿足上述條件的任務(wù),一定能夠戰(zhàn)勝人類頂級高手。但問題是,現(xiàn)實任務(wù)同時符合這幾個條件的幾乎沒有,無論是圖像識別、語音識別、機器翻譯還是自動駕駛,都至少不具備其中一個條件。在這些領(lǐng)域,目前的深度學(xué)習(xí)技術(shù),即使給它足夠大的數(shù)據(jù),要超越人類頂級高手實質(zhì)上是不可能的,但確實有可能比大多數(shù)人做得好,所以可以輔助人類去替代一些相對簡單、重復(fù)性的智力勞動,這是這一代人工智能技術(shù)應(yīng)用的基本定位。
為什么這一代人工智能有局限性?深層神經(jīng)網(wǎng)絡(luò)的中間是一層一層的神經(jīng)元,層與層之間的神經(jīng)元以各種權(quán)重連接。它的長處是通過大量與任務(wù)相關(guān)的輸入輸出數(shù)據(jù),可以自主學(xué)出來一個求解該任務(wù)的“函數(shù)”。理論上已經(jīng)證明,如果一個神經(jīng)網(wǎng)絡(luò)足夠復(fù)雜,它可以模擬、逼近任何函數(shù)。所以它的能力非常強,這是相當了不起的;但問題也恰恰出在這兒——說到底,它僅僅是一個針對特定任務(wù)的“函數(shù)”而已,我們并不清楚其中的功能機理,所以它的可解釋性、魯棒性都比較弱,運用顯式知識的能力差,推理能力缺乏,可用性也會打折扣。也就是說,它的長處和短處是共生并存的。如果某個輸入數(shù)據(jù)超出了這個“函數(shù)”的視野所及,是它沒有學(xué)過的,很可能馬上就會“犯糊涂”,產(chǎn)生種種令人意想不到的錯誤。如在自動駕駛中,本已訓(xùn)練好的AI系統(tǒng)可以很好地識別STOP交通標志,但如果存心在上面貼上若干小紙條之類,人看一點兒問題也沒有,機器卻很可能會識別錯,你要是自動駕駛或許一下子就掉下懸崖了。
深層神經(jīng)網(wǎng)絡(luò)的特點決定了AI很容易被沒有見到的情景所迷惑,而犯人不會犯的低級錯誤。人容易犯的高級錯誤,AI因為學(xué)習(xí)充分卻可能不會犯。人工智能可能隨時會犯低級錯誤,所以在自動駕駛之類關(guān)乎人的生命安全的應(yīng)用場合中,一定要十分慎重,設(shè)計好應(yīng)急措施。我們要正視人工智能的缺陷,辯證地看問題。
人工智能與腦科學(xué)及智慧教育一瞥
這些年人工智能和腦科學(xué)的研究一直在試圖互相借鑒。人工智能學(xué)界始終在留意腦科學(xué)的最新研究成果,看看哪些對設(shè)計新的人工智能算法或模型有啟發(fā),雖然目前為止收獲不大,但這肯定是會越來越得到更多重視的一個方向。另一方面,現(xiàn)階段或許腦科學(xué)更容易從深度學(xué)習(xí)中找到新的實驗方法。腦科學(xué)的實驗數(shù)據(jù)足夠大,符合人工智能大數(shù)據(jù)運算的特點,利用深度學(xué)習(xí)技術(shù),很有希望提出腦科學(xué)數(shù)據(jù)分析的新手段甚至開辟出新范式。
當前人工智能作用于教育并取得確定性成效的工作還不太多,雖然國際上已經(jīng)有了不少初步的工作,如在線學(xué)習(xí)會產(chǎn)生大量數(shù)據(jù),可通過人工智能技術(shù)發(fā)現(xiàn)學(xué)習(xí)者的特點,進行個性化學(xué)習(xí),也就是因材施教。有研究根據(jù)學(xué)習(xí)者的以往學(xué)習(xí)數(shù)據(jù),比如某個視頻看了多長時間、做題效果如何等,通過RNN神經(jīng)網(wǎng)絡(luò)預(yù)先判斷作業(yè)的難度,有針對性地推送適合學(xué)生個體水平的、難度適中的作業(yè);也有研究根據(jù)學(xué)習(xí)者行為讓AI自動判斷課程中哪一部分內(nèi)容比較難。其實不同的學(xué)生感到困難的地方是不一樣的,并非固定不變,而以前決定課程內(nèi)容的難度,多是基于教師的主觀判斷;此外還有通過CNN神經(jīng)網(wǎng)絡(luò),借助視頻技術(shù)來分析老師講課的狀態(tài),如是精神飽滿還是比較平淡的照本宣科。教育學(xué)研究表明,在線教育中教師講課的生動性,是能否抓住學(xué)習(xí)者的關(guān)鍵因素。對教學(xué)視頻進行大規(guī)模的自動分析,再同學(xué)習(xí)者大數(shù)據(jù)建立關(guān)聯(lián),有望對教師的在線教學(xué)提出改進建議??傮w上看,人工智能賦能的智慧教育,其進展還是可圈可點的,但人工智能融合腦科學(xué)的智慧教育,似乎才剛剛起步。