陳詩軍 杜娟 林登萍 薛兵 李俊強(qiáng)
學(xué)術(shù)研究
基于仿生學(xué)的人工智能方法論模型及架構(gòu)評(píng)價(jià)體系
陳詩軍1杜娟2林登萍2薛兵1李俊強(qiáng)1
(1.中興通訊股份有限公司,廣東 深圳 518057 2.華南理工大學(xué)自動(dòng)化科學(xué)與工程學(xué)院,廣東 廣州 510461)
目前,人工智能領(lǐng)域面臨的適應(yīng)性、學(xué)習(xí)效率、可解析性等問題約束了其發(fā)展,也一定程度上預(yù)示著人工智能理論體系偏離了生物智能方向。從人工智能工作機(jī)制及局限性、人腦學(xué)習(xí)行為過程及工作機(jī)制等方面進(jìn)行分析闡述,提出基于仿生學(xué)的人工智能方法論模型、人工智能架構(gòu)評(píng)價(jià)體系以及一種新的學(xué)習(xí)機(jī)制。
人工智能;仿生學(xué);方法論模型;架構(gòu)評(píng)價(jià)體系
人工智能(artificial intelligence, AI)作為計(jì)算機(jī)科學(xué)的前沿技術(shù)之一,自1956年在達(dá)特茅斯會(huì)議上被正式提出就一直備受關(guān)注。早期的AI技術(shù)受當(dāng)時(shí)的顯示芯片算力、采集終端技術(shù)、后端算法以及整體方案成熟度等影響,絕大多數(shù)算法實(shí)際部署時(shí)效果差強(qiáng)人意。2015年Google開源了Tensor Flow源代碼,使深度學(xué)習(xí)的訓(xùn)練系統(tǒng)第一次暴露在公眾視野中,隨之引爆了整個(gè)人工智能算法行業(yè)[1],這使AI技術(shù)取得了較大的研究進(jìn)展。2016年英偉達(dá)發(fā)布了基于人工智能深度優(yōu)化的全新Pascal架構(gòu),并在GTC2016上發(fā)布基于完整P100大核心的Tesla系列顯卡Tesla P40及Tesla P4,同年發(fā)布針對(duì)深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)的嵌入式芯片NVIDIA Jetson TX1,都為AI技術(shù)發(fā)展提供算力支撐。2017年谷歌旗下公司開發(fā)的AI機(jī)器人AlphaGo對(duì)戰(zhàn)世界圍棋冠軍柯潔,并以3∶0大獲全勝;2019年特斯拉推出自動(dòng)駕駛FSD車載芯片,引領(lǐng)汽車產(chǎn)業(yè)的商業(yè)模式變革;2020年百度發(fā)布百度大腦6.0,核心AI技術(shù)進(jìn)一步夯實(shí);同年,谷歌推出了CvxNet、3D形狀的深層隱式函數(shù)、神經(jīng)體素渲染和CoReNet等算法模型,以上這些都展示了AI技術(shù)的重大突破,但離實(shí)現(xiàn)真正意義上的以“機(jī)”代“腦”仍有差距。
盡管人類大腦尚未被探索窮盡,但從神經(jīng)科學(xué)來看,人類大腦的能力可歸結(jié)于3個(gè)基本觀察:廣泛的連通性、結(jié)構(gòu)和功能化的組織層次、時(shí)間依賴的神經(jīng)元突觸連接[3]。
人工智能的初衷是通過學(xué)習(xí)人類的思維方式實(shí)現(xiàn)智能系統(tǒng),因此仿照人類大腦的神經(jīng)元結(jié)構(gòu)提出了神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)。神經(jīng)網(wǎng)絡(luò)作為AI技術(shù)的一個(gè)重要分支,可以代替人腦有效地處理一些復(fù)雜問題,從而推動(dòng)AI發(fā)展。人工神經(jīng)網(wǎng)絡(luò)(artificial neural networks, ANN)又稱為人工神經(jīng)元的連接單元的集合,每個(gè)連接如人類大腦的神經(jīng)元突觸,可在神經(jīng)元之間傳遞信號(hào);接收信號(hào)的神經(jīng)元對(duì)其進(jìn)行處理,并發(fā)信號(hào)通知與之相連的其他神經(jīng)元。
隨著現(xiàn)代科學(xué)技術(shù)和硬件設(shè)備的快速發(fā)展,ANN在處理大量數(shù)據(jù)或復(fù)雜問題時(shí)發(fā)揮越來越重要的作用[2]?;谌祟惔竽X“脈沖”模擬計(jì)算框架下的脈沖神經(jīng)網(wǎng)絡(luò)(spiking neural networks, SNN)、神經(jīng)形態(tài)計(jì)算有望在實(shí)現(xiàn)人工智能的同時(shí),降低計(jì)算能耗。
人工智能發(fā)展經(jīng)歷了自動(dòng)控制、神經(jīng)元網(wǎng)絡(luò)、深度學(xué)習(xí)的過程。但隨著人工智能的發(fā)展,出現(xiàn)了學(xué)習(xí)效率低、復(fù)雜度高、適應(yīng)性差等問題,并且對(duì)于這些問題缺乏有效的解決方法,這在某種程度上預(yù)示著人工智能的發(fā)展方向和路線偏離了生物智能方向。為此,本文從人工智能工作機(jī)制及局限性、人腦學(xué)習(xí)行為過程及工作機(jī)制等方面進(jìn)行分析及論述,提出基于仿生學(xué)的人工智能方法論模型及架構(gòu)評(píng)價(jià)體系。
從感覺生理學(xué)角度來說,人處理信息大致分為3個(gè)過程:
1)獲取感官信息;
2)感官信息處理,神經(jīng)末梢因受刺激產(chǎn)生脈沖信號(hào)等神經(jīng)信號(hào);
3)神經(jīng)信號(hào)引起意識(shí)事件,即感官信息通過刺激激活相同細(xì)胞來產(chǎn)生相應(yīng)的意識(shí)事件[4]。
人工智能模仿人處理信息的過程展開研究,重點(diǎn)是感知信息處理。目前,針對(duì)感知信息處理有2個(gè)立場[4]:
1)感知信息以編碼表征或圖像形式存儲(chǔ),感官刺激和儲(chǔ)存方式之間有一對(duì)一的映射關(guān)系;
2)刺激圖像不會(huì)被記錄,人的中樞神經(jīng)系統(tǒng)像一個(gè)復(fù)雜的交換網(wǎng)絡(luò),記憶是活動(dòng)中采用的一種新連接路徑,以一種特殊回應(yīng)的偏好形式儲(chǔ)存記憶。
目前,大腦模型都是基于立場1),圍繞編碼表征、記憶理念展開研究,深度神經(jīng)網(wǎng)絡(luò)也是如此。
20世紀(jì)60年代,HUBEL等人[5]的生物學(xué)研究表明,視覺信息是通過多個(gè)層次的感受野激發(fā),從視網(wǎng)膜傳遞到大腦[6]?;谶@些研究結(jié)果,神經(jīng)網(wǎng)絡(luò)通過編碼搭建網(wǎng)絡(luò)框架,每一層的響應(yīng)都由上一層的局部感受野激發(fā)得到。同時(shí)模仿動(dòng)物學(xué)習(xí)的“嘗試”機(jī)制,利用數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò)以獲得較好效果。
首先,初始化網(wǎng)絡(luò)框架參數(shù)、定義損失函數(shù),通過前向傳播得到每一層的損失項(xiàng)。
然后,根據(jù)總損失,利用反向傳播算法,通過鏈?zhǔn)角髮?dǎo),依次更新每層的每一個(gè)神經(jīng)元的權(quán)重和偏移量。
最后,通過更新權(quán)重和偏移量不斷糾錯(cuò),直至損失降至最低,此時(shí)神經(jīng)網(wǎng)絡(luò)模型可以實(shí)現(xiàn)特定功能。
神經(jīng)網(wǎng)絡(luò)模型雖然可以獲得相應(yīng)情況下較好的效果,但神經(jīng)網(wǎng)絡(luò)需要對(duì)數(shù)據(jù)集進(jìn)行上千次epoch訓(xùn)練,1.1×108次左右的權(quán)重和偏移。這個(gè)不斷糾錯(cuò)、構(gòu)建正確決策的過程,訓(xùn)練速度慢,消耗大量時(shí)間;儲(chǔ)存參數(shù)達(dá)上百萬個(gè),計(jì)算量龐大,能耗巨大;同時(shí)占據(jù)的存儲(chǔ)空間大,對(duì)計(jì)算機(jī)的要求較高。而人類大腦的每個(gè)神經(jīng)元通過突觸與其他上千個(gè)神經(jīng)元連接[7],這些突觸通過電脈沖信號(hào)傳遞信息,持續(xù)時(shí)間短于千分之一秒,傳播速度約為1~100 m/s[8]。目前,神經(jīng)網(wǎng)絡(luò)傳遞信息以及計(jì)算更新參數(shù)的速度遠(yuǎn)遠(yuǎn)比不上人類大腦。神經(jīng)網(wǎng)絡(luò)與人類大腦訓(xùn)練量和訓(xùn)練時(shí)間對(duì)比圖如圖1所示。
圖1 神經(jīng)網(wǎng)絡(luò)與人類大腦訓(xùn)練量和訓(xùn)練時(shí)間對(duì)比圖
因此,如何提高人工智能的學(xué)習(xí)效率是待解決的問題。
盡管神經(jīng)網(wǎng)絡(luò)模型在某些特定情況下可以實(shí)現(xiàn)相應(yīng)功能,獲得較好的精度和性能,但它仍然存在魯棒性。某個(gè)神經(jīng)網(wǎng)絡(luò)模型僅針對(duì)某些特定情況具有較好的精度,一旦變換應(yīng)用場景,可能造成精度大幅度下降,性能變差。如一個(gè)預(yù)估視差的神經(jīng)網(wǎng)絡(luò)模型可以在室內(nèi)獲得較好效果,但在室外效果就變得很差。這是由于此神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練時(shí),選用室內(nèi)的數(shù)據(jù)集進(jìn)行訓(xùn)練,針對(duì)室內(nèi)場景的情況不斷更新參數(shù),不斷糾錯(cuò)。但室外場景由于光線等問題與室內(nèi)場景不同,且神經(jīng)網(wǎng)絡(luò)無法判斷室內(nèi)與室外,導(dǎo)致效果較差。若想在室外場景取得較好效果,需選取室外數(shù)據(jù)集訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型,并改變神經(jīng)網(wǎng)絡(luò)模型框架。而人類大腦經(jīng)環(huán)境刺激引起一系列的神經(jīng)元活動(dòng)后,通過不斷學(xué)習(xí)進(jìn)化,可以迅速判斷各個(gè)場景,并且自動(dòng)切換場景,針對(duì)相應(yīng)的情況迅速做出相應(yīng)的反應(yīng)和決策。
因此,直接訓(xùn)練一個(gè)能夠容忍環(huán)境變化的神經(jīng)網(wǎng)絡(luò)模型是待解決的問題。
盡管神經(jīng)網(wǎng)絡(luò)模型在很多領(lǐng)域都具有較好的性能[9],但在某些領(lǐng)域無法替換傳統(tǒng)算法的大規(guī)模部署,如計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)。計(jì)算機(jī)網(wǎng)絡(luò)工程師更傾向于直接使用簡單的邏輯規(guī)則表示神經(jīng)網(wǎng)絡(luò),而不是分析其復(fù)雜的激活規(guī)律。由于神經(jīng)網(wǎng)絡(luò)內(nèi)部結(jié)構(gòu)以及更新計(jì)算參數(shù)過程的可解析性較低,導(dǎo)致不能直接對(duì)神經(jīng)網(wǎng)絡(luò)系統(tǒng)進(jìn)行調(diào)試、修正、部署。
因此,如何簡單、高效地提供通用性神經(jīng)網(wǎng)絡(luò)的可解析性是待解決的問題。
針對(duì)人工智能存在的學(xué)習(xí)效率、適應(yīng)性、可解析性等問題,通過分析人類大腦學(xué)習(xí)行為的生理基礎(chǔ),闡述學(xué)習(xí)行為的工作機(jī)制。
學(xué)習(xí)行為是指通過神經(jīng)系統(tǒng)接受環(huán)境變化而獲得行為習(xí)慣或經(jīng)驗(yàn)的過程,是大腦神經(jīng)網(wǎng)絡(luò)的重要功能之一,由眾多神經(jīng)共同作用完成。
近年來,隨著認(rèn)知神經(jīng)科學(xué)的發(fā)展,人們對(duì)于學(xué)習(xí)行為的腦機(jī)制研究更加深入。認(rèn)知神經(jīng)科學(xué)認(rèn)為:學(xué)習(xí)是大腦信息加工的過程;是心智網(wǎng)絡(luò)在大腦與環(huán)境的相互作用下形成的活動(dòng);是大腦對(duì)刺激產(chǎn)生的反應(yīng),包括大腦對(duì)信息的感知、處理和整合[11-12]。人類大腦記憶認(rèn)知原理圖如圖2所示。
此外,大腦處理信息時(shí)加入了時(shí)間維度,即動(dòng)態(tài)信息處理,而人工神經(jīng)網(wǎng)絡(luò)主要用于靜態(tài)信息處理。目前,可實(shí)現(xiàn)的神經(jīng)網(wǎng)絡(luò)規(guī)模距離人類大腦規(guī)模還有1 000倍以上的差別[13]。
圖2 人類大腦記憶認(rèn)知原理圖
認(rèn)知神經(jīng)科學(xué)強(qiáng)調(diào):學(xué)習(xí)以大腦的生物性為支撐;以大腦的可塑性為基礎(chǔ);以大腦鏡像神經(jīng)元系統(tǒng)為主的自身活動(dòng)不斷豐富學(xué)習(xí)主體的經(jīng)驗(yàn)感知,并在此基礎(chǔ)上進(jìn)行模仿學(xué)習(xí)。
2.2.1 神經(jīng)聯(lián)結(jié)
大腦在學(xué)習(xí)過程中,單個(gè)神經(jīng)元會(huì)聯(lián)結(jié)形成神經(jīng)網(wǎng)絡(luò),復(fù)雜的神經(jīng)網(wǎng)絡(luò)可以承載復(fù)雜的認(rèn)知結(jié)構(gòu)。聯(lián)結(jié)主義模型表明[14],神經(jīng)網(wǎng)絡(luò)對(duì)一切學(xué)習(xí)內(nèi)容進(jìn)行編碼,而神經(jīng)元激活的數(shù)量、頻率、模式以及信號(hào)傳遞的有效性,都取決于外部刺激是如何激活網(wǎng)絡(luò)的[15],且已經(jīng)習(xí)得的神經(jīng)網(wǎng)絡(luò)會(huì)隨著學(xué)習(xí)而不斷強(qiáng)化。
2.2.2 多感官共同作用
大腦的不同區(qū)域負(fù)責(zé)編碼不同的信息。在學(xué)習(xí)過程中,大腦接受的大部分信息是多感官的,故要求在不同功能的腦區(qū)間建立連接。學(xué)習(xí)內(nèi)容累積式地存儲(chǔ)在神經(jīng)網(wǎng)絡(luò),倘若2個(gè)腦區(qū)先前已聯(lián)結(jié),即使后來的類似體驗(yàn)缺失了一部分感知信息,相同的區(qū)域仍被激活,即大腦可以自動(dòng)補(bǔ)全從外界接收的不完整信息。
2.2.3 終身可塑性
大腦一生都能根據(jù)學(xué)習(xí)行為發(fā)生顯著變化。通過神經(jīng)元突觸不斷形成、修建、增強(qiáng)、減弱,神經(jīng)聯(lián)結(jié)不斷得到修飾。在不斷強(qiáng)化、減弱和消除原有神經(jīng)聯(lián)結(jié),產(chǎn)生新神經(jīng)聯(lián)結(jié)的過程中,大腦結(jié)構(gòu)發(fā)生改變[11]。大腦這種適應(yīng)環(huán)境的能力即為可塑性。
2.2.4 電生理機(jī)制
學(xué)習(xí)行為伴隨著大腦的電變化,如條件的Alpha波阻斷,皮質(zhì)的慢波活動(dòng)和高頻節(jié)律等[16]。神經(jīng)系統(tǒng)傳遞信息采用脈沖頻率編碼[17]。神經(jīng)脈沖按照“全或無”的規(guī)律工作,當(dāng)刺激低于某閾值時(shí),無脈沖產(chǎn)生;當(dāng)刺激達(dá)到某閾值時(shí),產(chǎn)生一個(gè)脈沖。大腦皮質(zhì)的神經(jīng)元,在沒有明顯外加刺激的情況下,能產(chǎn)生持續(xù)的節(jié)律性電位波動(dòng),稱為Alpha波。當(dāng)大腦充滿Alpha波時(shí),人的意識(shí)活動(dòng)明顯受到抑制,無法進(jìn)行邏輯思維和推理活動(dòng),而當(dāng)思考問題或感受到新異刺激時(shí),會(huì)出現(xiàn)Alpha波阻斷,這種Alpha波阻斷與學(xué)習(xí)行為息息相關(guān)。
2.3.1 神經(jīng)元的通信
神經(jīng)元接受、整合大量信息,并將信息匯總輸出,在神經(jīng)元之間傳遞,進(jìn)而形成特定的網(wǎng)絡(luò)通路。借助網(wǎng)絡(luò)通路,神經(jīng)元可與不直接相連的神經(jīng)元進(jìn)行通信,從而在不同神經(jīng)聯(lián)結(jié)間建立相對(duì)穩(wěn)固的網(wǎng)絡(luò)聯(lián)系,記憶分布在神經(jīng)元的相互聯(lián)結(jié)中,心智網(wǎng)絡(luò)即被建構(gòu)。
2.3.2 心智網(wǎng)絡(luò)的重構(gòu)
認(rèn)知神經(jīng)學(xué)認(rèn)為,學(xué)習(xí)是一個(gè)心智網(wǎng)絡(luò)不斷形成與優(yōu)化的過程,即心智網(wǎng)絡(luò)的每一次變化都在原有基礎(chǔ)上進(jìn)行。學(xué)習(xí)機(jī)制的運(yùn)行從激活原有心智網(wǎng)絡(luò)開始,通過重構(gòu)與融合過渡到更合理的網(wǎng)絡(luò),以此來處理既定情境[17]。
神經(jīng)網(wǎng)絡(luò)通過突觸產(chǎn)生過剩并選擇性消失、突觸修正與增添2種方式改變大腦結(jié)構(gòu),進(jìn)而對(duì)心智網(wǎng)絡(luò)進(jìn)行重組。在這種重組機(jī)制下,大腦不斷地適應(yīng)新環(huán)境,并結(jié)合經(jīng)驗(yàn)逐漸發(fā)展為最佳結(jié)構(gòu)。
2.3.3 大腦的工作模式
當(dāng)學(xué)習(xí)行為發(fā)生時(shí),特定的皮層區(qū)域負(fù)責(zé)特定的任務(wù),每一個(gè)任務(wù)的完成又與多個(gè)皮層區(qū)域的神經(jīng)網(wǎng)絡(luò)相關(guān),同一個(gè)皮層區(qū)域又參與多個(gè)神經(jīng)網(wǎng)絡(luò)的活動(dòng)。多個(gè)皮層區(qū)域神經(jīng)網(wǎng)絡(luò)的活動(dòng)具有協(xié)同性和整體性,各自分工又相互聯(lián)系,它們之間的聯(lián)合互動(dòng)保證了學(xué)習(xí)的順利進(jìn)行。
針對(duì)目前人工智能存在的問題和人腦學(xué)習(xí)行為過程及工作機(jī)制,本文在方法論的層面重新思考人工智能的方法,提出基于仿生學(xué)的人工智能方法論模型,如圖3所示。
圖3 基于仿生學(xué)的人工智能方法論模型
基于仿生學(xué)的人工智能方法論模型包括問題域、過程域和結(jié)果域3部分。
1)在問題域,人工智能方法和生物輸入同樣的問題或任務(wù)。
2)在過程域,比較人工智能方法與生物智能的差異。
根據(jù)生物行為和思維將問題/任務(wù)分解為過程序列:
式中:
人工智能方法過程或模塊序列為
式中:
式中:
3)在結(jié)果域,對(duì)人工智能方法輸出的結(jié)果與生物智能執(zhí)行的結(jié)果進(jìn)行比較。
基于仿生學(xué)的人工智能方法論模型,相比傳統(tǒng)的人工智能方法,增加了過程域。在過程域,用過程序列的方法進(jìn)行模塊化處理,保證人工智能方法能夠逼近生物智能過程,避免在研究過程中方向偏差越來越大。
人工智能主要在結(jié)構(gòu)層次上模擬神經(jīng)元結(jié)構(gòu),采用深度學(xué)習(xí),通過訓(xùn)練集,在輸入層和輸出層之間訓(xùn)練多個(gè)隱藏層的參數(shù),這些隱藏層具有不可解析性,束縛了仿生學(xué)更高層次智能(如邏輯、精神、抽象等)架構(gòu)體系的研究和構(gòu)建。人工智能高層次智能架構(gòu)研究的不足限制了人工智能實(shí)現(xiàn)生物智能的程度?;诜律鷮W(xué)的人工智能架構(gòu)設(shè)計(jì)是目前亟需解決的重要問題,但首先要明確如何評(píng)價(jià)人工智能和生物智能架構(gòu)的一致性。
本文從評(píng)估角度出發(fā),提出基于仿生學(xué)的人工智能架構(gòu)評(píng)價(jià)體系,如圖4所示。
圖4 基于仿生學(xué)的人工智能架構(gòu)評(píng)價(jià)體系
基于仿生學(xué)的人工智能架構(gòu)評(píng)價(jià)體系把人工智能組織架構(gòu)和機(jī)理設(shè)計(jì)分為內(nèi)在視角和外在視角2個(gè)方面。
1)內(nèi)在視角主要評(píng)價(jià)人工智能架構(gòu)和機(jī)理的結(jié)構(gòu)、智能過程、結(jié)果與生物智能的相似度,與人工智能方法論模型的一致性。
2)外在視角主要評(píng)價(jià)人工智能架構(gòu)和機(jī)理在學(xué)習(xí)效率、效益、適應(yīng)性方面與生物智能的差異程度。
①學(xué)習(xí)效率方面。對(duì)于學(xué)習(xí)一個(gè)新事物,人類一般不需要太多樣本,一兩個(gè)實(shí)例就可以達(dá)到學(xué)習(xí)目的。因此,基于仿生學(xué)的人工智能架構(gòu)和機(jī)理需具有小樣本學(xué)習(xí)的特征。
②效益方面。人類對(duì)一個(gè)事物的識(shí)別不需要復(fù)雜運(yùn)算、消耗太多能量,而目前的深度學(xué)習(xí),識(shí)別一幅圖像需要進(jìn)行復(fù)雜的卷積運(yùn)算,經(jīng)過多達(dá)數(shù)十層的深度才能完成學(xué)習(xí),同時(shí)帶來一系列問題,如復(fù)雜度、梯度、過擬合等,并且深度學(xué)習(xí)帶來的功耗問題更加嚴(yán)峻。因此,基于仿生學(xué)的人工智能架構(gòu)和機(jī)理需具有低復(fù)雜度、低功耗的特征。
③適應(yīng)性方面。經(jīng)過深度學(xué)習(xí)的人工智能在環(huán)境發(fā)生變化后,不能很好地適應(yīng)其他環(huán)境,這和人類經(jīng)過學(xué)習(xí)后,在各種復(fù)雜的環(huán)境下,能夠表現(xiàn)出很好的適應(yīng)性有較大差距。因此,基于仿生學(xué)的人工智能架構(gòu)和機(jī)理需具有較強(qiáng)的泛化能力。
人工神經(jīng)網(wǎng)絡(luò)具有內(nèi)部結(jié)構(gòu)及更新計(jì)算參數(shù)過程可解析性低的局限,借鑒人類大腦的工作機(jī)制[10],本文提出一種新的學(xué)習(xí)機(jī)制設(shè)想,拓展類人的學(xué)習(xí)機(jī)制思路。
神經(jīng)生物學(xué)家將學(xué)習(xí)與記憶分為工作記憶、情節(jié)記憶、語義記憶、工具學(xué)習(xí)和動(dòng)作學(xué)習(xí)5種。其中,工作記憶是大腦保持當(dāng)下任務(wù)的暫時(shí)記憶;情節(jié)記憶是回憶特定事件的細(xì)節(jié)能力;語義記憶是學(xué)習(xí)事實(shí)和關(guān)系的能力;工具學(xué)習(xí)是根據(jù)獎(jiǎng)懲來改變行為的能力;動(dòng)作學(xué)習(xí)是通過練習(xí)或者單純的重復(fù)來改善身體運(yùn)動(dòng)模式的能力。
在學(xué)習(xí)與記憶的啟發(fā)之下,本文嘗試提出一種新的學(xué)習(xí)機(jī)制工作設(shè)想,如圖5所示。
圖5 一種新的學(xué)習(xí)機(jī)制工作設(shè)想
一種新的學(xué)習(xí)機(jī)制工作設(shè)想采用分區(qū)學(xué)習(xí)、分區(qū)存儲(chǔ)的方式,包括工作區(qū)、語義區(qū)、情節(jié)區(qū)、工具區(qū)和動(dòng)作區(qū)。每個(gè)區(qū)互相關(guān)聯(lián),互相影響。每個(gè)區(qū)由許多小模塊組成,每個(gè)小模塊都具備一個(gè)刺激信號(hào)。當(dāng)刺激信號(hào)遇到其他模塊傳來的類似刺激信號(hào)時(shí)會(huì)被激活,開啟此區(qū)域或模塊的學(xué)習(xí)更新進(jìn)程。工作區(qū)始終保存最佳模型,并根據(jù)學(xué)習(xí)產(chǎn)生各種相應(yīng)的刺激信號(hào),通過匹配類似的刺激信號(hào)來調(diào)度其他4個(gè)區(qū)開啟學(xué)習(xí)更新。
一種新的學(xué)習(xí)機(jī)制的學(xué)習(xí)進(jìn)程:
1)情節(jié)區(qū)保存曾經(jīng)學(xué)習(xí)的情節(jié),學(xué)習(xí)成熟的情節(jié)成為之后學(xué)習(xí)的部分先驗(yàn)知識(shí),輔助語義區(qū)學(xué)習(xí);
2)語義區(qū)保持當(dāng)前學(xué)習(xí)整個(gè)事實(shí)之間關(guān)系的模型,通過學(xué)習(xí)更新情節(jié)區(qū);
3)工具區(qū)保存獎(jiǎng)懲機(jī)制,根據(jù)學(xué)習(xí)情況,若是有利的參數(shù)標(biāo)注獎(jiǎng)勵(lì),否則標(biāo)注抑制,確保工作區(qū)和語義區(qū)的學(xué)習(xí)向正確方向進(jìn)行;
4)動(dòng)作區(qū)保存正確動(dòng)作,即正確決策,若感官刺激是學(xué)習(xí)過的,則激活相應(yīng)的刺激信號(hào),被激活的刺激信號(hào)返回相應(yīng)的決策,每經(jīng)歷一次學(xué)習(xí),動(dòng)作區(qū)就會(huì)隨著更新。
一種新的學(xué)習(xí)機(jī)制具體學(xué)習(xí)更新過程如下:
1)輸入感官信息,產(chǎn)生一個(gè)刺激信號(hào),將這個(gè)刺激信號(hào)傳送到工作區(qū),激活工作區(qū)的刺激信號(hào);
2)開啟工作區(qū),工作區(qū)根據(jù)當(dāng)前的最佳模型開展學(xué)習(xí),并產(chǎn)生相應(yīng)的刺激信號(hào);
3)匹配其他區(qū)的刺激信號(hào),激活相應(yīng)的區(qū),調(diào)度語義區(qū)和工具區(qū)開啟合作學(xué)習(xí);
4)語義區(qū)根據(jù)情況產(chǎn)生相應(yīng)的激活信號(hào),匹配語義區(qū)的刺激信號(hào),調(diào)用相應(yīng)情節(jié)區(qū)的信息同時(shí)配合工具區(qū)的獎(jiǎng)懲機(jī)制進(jìn)行學(xué)習(xí);
5)每次學(xué)習(xí)后,工作區(qū)更新為當(dāng)前調(diào)度的最佳模型并自動(dòng)刪除舊模型;新學(xué)習(xí)的情節(jié)保存到情節(jié)區(qū)并且根據(jù)工具區(qū)的獎(jiǎng)懲機(jī)制結(jié)果自動(dòng)刪除獎(jiǎng)勵(lì)較低的情節(jié);語義區(qū)保存最新的情節(jié)之間關(guān)系并根據(jù)學(xué)習(xí)結(jié)果自動(dòng)刪除舊情節(jié)關(guān)系;動(dòng)作區(qū)根據(jù)學(xué)習(xí)情況更新為最佳決策。以上更新過程中,相應(yīng)的舊激活信號(hào)也會(huì)隨著更新替換成新的激活信號(hào)。
通過分區(qū)學(xué)習(xí),分區(qū)存儲(chǔ),并在學(xué)習(xí)過程中更新模型和參數(shù)時(shí)自動(dòng)刪除不利的模型和參數(shù),相比目前的人工智能學(xué)習(xí)方法,減少參數(shù)的存儲(chǔ)空間,提高學(xué)習(xí)效率。
作為新一輪科技革命和產(chǎn)業(yè)變革的核心驅(qū)動(dòng)力,人工智能正在疊加釋放歷次科技革命和產(chǎn)業(yè)變革積蓄的能量,快速催生新產(chǎn)品、新服務(wù)、新業(yè)態(tài),培育經(jīng)濟(jì)發(fā)展新動(dòng)能,重塑經(jīng)濟(jì)社會(huì)運(yùn)行模式,改變?nèi)祟惿a(chǎn)和生活方式,促進(jìn)社會(huì)經(jīng)濟(jì)發(fā)展的整體大幅躍升。本文對(duì)人工智能及人工神經(jīng)網(wǎng)絡(luò)的發(fā)展進(jìn)行梳理,對(duì)基于仿生學(xué)的人工智能進(jìn)行深入分析,在方法論、評(píng)價(jià)體系、學(xué)習(xí)機(jī)制等方面提出新的見解,助力推動(dòng)基于仿生的人工智能新一輪產(chǎn)業(yè)變革和科技革命。本方法論具體的定量分析及應(yīng)用,將作為下一步的工作內(nèi)容進(jìn)行展開。
[1] 任成.人工智能技術(shù)發(fā)展綜述[J].中國安防,2020(10):81-83.
[2] 夏瑜潞.人工神經(jīng)網(wǎng)絡(luò)的發(fā)展綜述[J].電腦知識(shí)與技術(shù),2019, 15(20):227-229.
[3] KAUSHIK Roy, AKHILESH Jaiswal, PRIYADARSHINI Panda. Towards spike-based machine intelligence with neuromorphic computing[J]. Nature, 2019,575:607-617.
[4] 章航.人工神經(jīng)網(wǎng)路進(jìn)路研究[D].上海:華東師范大學(xué),2019.
[5] HUBEL D H,WIESEL T N. Receptive fields binocular inter-action and functional architecture in the cat's visual cortex [J]. Journal of Physiology, 1962,160(1):106-154.
[6] 李彥冬,郝宗波,雷航.卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J].計(jì)算機(jī)應(yīng)用,2016,36(9):2508-2515,2565.
[7] DOUGLAS, RJ, MARTIN, KA. Neuronal circuits of the neocortex[J]. Journal of Annual Review of Neuroscience, 2004, 27:419-451.
[8] BARNETT MW, LARKMAN PM. The action potential[J]. Practical Neurology, 2007,7(3):192-197.
[9] 鄭瑩,段慶洋,林利祥,等.深度強(qiáng)化學(xué)習(xí)在典型網(wǎng)絡(luò)系統(tǒng)中的應(yīng)用綜述[J].無線電通信技術(shù),2020,46(6):603-623.
[10] 徐承東.學(xué)習(xí)與記憶生理機(jī)制研究綜述[J].楚雄師專學(xué)報(bào)(社會(huì)科學(xué)版),1991(1):63-66.
[11] 崔亞萌.學(xué)生學(xué)習(xí)機(jī)制研究——基于認(rèn)知神經(jīng)科學(xué)的視角[D].開封:河南大學(xué),2017.
[12] 趙學(xué)武.基于群智能算法的人腦功能劃分方法研究[D].北京:北京工業(yè)大學(xué),2018.
[13] 劉亞東,胡德文.腦科學(xué)視角下的高性能計(jì)算[J].計(jì)算機(jī)學(xué)報(bào),2017,40(9):2148-2166.
[14] 霍鵬飛,吳瑋.大腦的學(xué)習(xí)機(jī)制及其對(duì)教育的啟示[J].集美大學(xué)學(xué)報(bào)(教育科學(xué)版),2011,12(2):50-53.
[15] MUNAKATA Y. Graded representations in behavioral dissociations[J].Trends in Cognitive Sciences,2001,5(7):309-315.
[16] 余建林.學(xué)習(xí)行為的生理基礎(chǔ)和心理基礎(chǔ)[J].長江大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011,34(3):142-143.
[17] 王英華,王玉茹,張少白.大腦高級(jí)智能活動(dòng)的生理學(xué)基礎(chǔ)[J].自動(dòng)化技術(shù)與應(yīng)用,2001(4):10-12.
[18] 喬石.基于人腦學(xué)習(xí)與記憶的多源信息融合算法研究[D].天津:河北工業(yè)大學(xué),2015.
[19]MICHAEL McKinley, VALERIE DEAN O'Loughlin. Human anatomy [M]. 3rd ed. McGraw-Hill, 2011: 416.
[20]SPORNS O. Networks of the Brain[J]. MIT Press,2010:143.
[21]WILLIAMS R W, HERRUP K. The control of neuron number [J]. Annual Review of Neuroscience,1988,11(1):423-453.
[22]SCHMIDT-RHAESA A. The Evolution of Organ Systems[M]. Oxford University, UK, 2007.
[23] KRISTAN W B, CALABRESE R L, FRIESEN W O. Neuro-nal control of leech behavior[J]. Progress Neurobiology, 2005, 76(5):279-327.
[24] BARNES R D. Invertebrate Zoology 5th[M]. Saunders College Pub, America, 1987.
[25]BUTLER A B. Chordate evolution and the origin of craniates: an old brain in a new head[J]. Anatomical Record, 2000,261(3): 111-125.
[26]SHIN H S, BARGIELLO T A, CLARK B T, et al. An unusual coding sequence from a drosophila clock gene is conserved in vertebrates[J]. Nature, 1985,317(6036):445-448.
[27]HODGKIN J. Caenorhabditis elegans. Brenner S, Miller JH.Encyclopedia of Genetics[J]. Elsevier, 2001:251-256.
[28]MARKS A R. In search of memory The emergence of a new science of mind[J]. Journal of Clinical Investigation, 2007, 116(5):1380-1381.
[29] NORTHCUTT R G. Forebrain evolution in bony fishes[J]. Brain Research Bulletin, 2008,75(24):191-205.
[30]D KELLY Flemming. Essential Neuroscience[J]. Mayo Clinic Proceedings, 2006,81(10):1409.
[31] RADINSKY L, JERISON H. Evolution of the Brain and Intelligence [J]. Evolution, 1975,29(1):190.
[32] FOSTER A C, KEMP J A. Glutamate and GABA-based CNS therapeutics[J]. Current Opinion in Pharmacology, 2006,6(1): 7-17.
Artificial Intelligence Methodology Model and Architecture Measurement System Based on Bionics
CHEN Shijun1DU Juan2LIN Dengping2XUE Bing1LI Junqiang1
(1.Zhongxing Telecom Equipment, Shenzhen 518057, China 2.School of Automation Science and Engineering, South China University of Technology, Guangzhou 510641, China)
At present, the problems faced by the field of artificial intelligence, such as adaptability, learning efficiency and analysability, restrict its development and indicate that the theoretical system of artificial intelligence deviates from the direction of biological intelligence to a certain extent. This paper analyses and expounds the working mechanism and limitations of artificial intelligence, the learning behaviour process and working mechanism of human brain, and puts forward the artificial intelligence methodology model based on bionics, the artificial intelligence architecture evaluation system and a new learning mechanism.
artificial intelligence; bionics; methodology model; architecture evaluation system
陳詩軍,杜娟,林登萍,等.基于仿生學(xué)的人工智能方法論模型及架構(gòu)評(píng)價(jià)體系[J].自動(dòng)化與信息工程,2022, 43(1):7-14.
CHEN Shijun, DU Juan, LIN Dengping, et al. Artificial intelligence methodology model and architecture measure-ment system based on bionics[J]. Automation & Information Engineering, 2022,43(1):7-14.
陳詩軍,男,1972年生,碩士,高級(jí)工程師,主要研究方向:高精度定位技術(shù)、無線信道仿真技術(shù)、MIMO和CoMP技術(shù)。E-mail: chen.shijun@zte.com.cn
杜娟,女,1975年生,博士,副教授,主要研究方向:圖像處理、機(jī)器視覺和智能系統(tǒng)技術(shù)。E-mail: dujuan@scut.edu.cn
林登萍,女,1996年生,在讀碩士,主要研究方向:機(jī)器視覺。E-mail: 283728289@qq.com
薛兵,男,1984年生,碩士,工程師,主要研究方向:5G移動(dòng)通信、射頻技術(shù)、高精度時(shí)間同步。E-mail: xue.bing1@zte.com.cn
李俊強(qiáng),男,1992年生,碩士,工程師,主要研究方向:室內(nèi)定位技術(shù)研究、傳感器定位算法以及應(yīng)用領(lǐng)域。E-mail: li.junqiang1@zte.com.cn
TP183
A
1674-2605(2022)01-0002-08
10.3969/j.issn.1674-2605.2022.01.002