許書旭
(廈門市北洋腦機(jī)接口與智慧健康創(chuàng)新研究院,福建廈門 361006)
20 世紀(jì)40 年代,馮·諾依曼基于當(dāng)時(shí)有限的關(guān)于大腦的知識(shí),建立了現(xiàn)代“馮·諾依曼計(jì)算機(jī)架構(gòu)”,這些有限的知識(shí)來源于最初建造人工大腦的嘗試[1]。人工大腦并沒有成功實(shí)現(xiàn),然而,計(jì)算機(jī)的發(fā)明,卻促成了第三次科技革命。隨著計(jì)算機(jī)的應(yīng)用,與電氣技術(shù)廣泛結(jié)合和替代,在整個(gè)社會(huì)層面催生了大量新的需求,從而誘發(fā)了無數(shù)技術(shù)創(chuàng)新,形成了二戰(zhàn)至今的一輪經(jīng)濟(jì)繁榮。當(dāng)前基于計(jì)算機(jī)、 生物技術(shù)、 物聯(lián)網(wǎng)等技術(shù)的第三次科技革命,已經(jīng)進(jìn)入瓶頸,技術(shù)創(chuàng)新難度大,世界經(jīng)濟(jì)有萎縮的傾向。
與此同時(shí),新一輪技術(shù)革命的呼聲也很大。多年來,人們寄希望于區(qū)塊鏈、物聯(lián)網(wǎng)、智慧城市等新概念能夠引領(lǐng)創(chuàng)造新的需求,創(chuàng)造新的崗位,帶來經(jīng)濟(jì)的增長。區(qū)塊鏈技術(shù)帶來了顯卡大范圍鋪開應(yīng)用,為人工智能的爆發(fā)奠定了硬件基礎(chǔ),分布式計(jì)算也將是未來類腦智能重要的技術(shù)基礎(chǔ)之一。智慧城市的發(fā)展,帶來了物理世界技術(shù)的大整合,交通、農(nóng)業(yè)、工業(yè)等行業(yè)內(nèi)和行業(yè)間的數(shù)據(jù)孤島、數(shù)據(jù)煙囪問題得到重視并開始解決,依托于知識(shí)圖譜進(jìn)行知識(shí)結(jié)構(gòu)化,各種數(shù)據(jù)要素正在趨于有序,數(shù)據(jù)要素的進(jìn)階應(yīng)用開始逐步引導(dǎo)數(shù)字化進(jìn)程從物理世界的數(shù)字化進(jìn)入精神世界的數(shù)字化階段。購物平臺(tái)利用購物大數(shù)據(jù)進(jìn)行購物意圖的分析,娛樂平臺(tái)利用興趣標(biāo)簽進(jìn)行信息推薦,這些應(yīng)用反映了社會(huì)對(duì)精神世界數(shù)字化的期待。鑒于對(duì)精神世界數(shù)字化的探索,腦機(jī)接口概念也一度爆發(fā),引起了腦機(jī)接口投資熱潮。2022 年,元宇宙又成為新的熱點(diǎn),從智慧城市進(jìn)一步升級(jí),試圖構(gòu)建物理世界大模型,雖然因?yàn)轶w量過于龐大暫時(shí)難以成型,但是這一數(shù)字化終極版圖也提上日程。元宇宙概念帶來的大量建模、制圖等虛擬化需求,又催生了人工智能生成內(nèi)容(AIGC)的進(jìn)一步發(fā)展,生成對(duì)抗性神經(jīng)網(wǎng)絡(luò)(GAN)、Transformer、Diffusion 等AI 模型的優(yōu)勢得以放大。文生圖、圖文理解的需求,讓類腦智能的諸多研究被提上臺(tái)面,進(jìn)入應(yīng)用。2023 年,因?yàn)镃hatGPT 的誕生,人們?nèi)计鹆藢?duì)通用人工智能(AGI) 的憧憬。在對(duì)ChatGPT 的解析中,其真正令外界驚嘆的能力源于其前置的諸多底層技術(shù),如自編碼器(VAE),思維鏈(COT),以及其他知識(shí)推理技術(shù)。而促進(jìn)ChatGPT 顯現(xiàn)出AGI 潛力的這些前置技術(shù),正是來自類腦智能的研究,如思維鏈的技術(shù)方案來源于畢業(yè)于達(dá)特茅斯大學(xué)的Jason Wei 對(duì)“冥想”的研究[7]。
可以看到,新一輪科技革命的技術(shù)指向性已經(jīng)趨于明朗,AGI 當(dāng)之無愧。但是,雖然人們渴望AGI,科學(xué)家對(duì)其實(shí)現(xiàn)路徑還毫無頭緒,依靠腦科學(xué)的研究逐步探索AGI 謎題成為比較可靠的路徑。
人腦有約860 億神經(jīng)元,100 萬億神經(jīng)連接,而如今家用計(jì)算機(jī)也有超過100 億晶體管,超級(jí)計(jì)算機(jī)更是遠(yuǎn)超此數(shù)量,計(jì)算單元的增加并非催生AGI 的決定性因素。大腦的秘密于人類社會(huì)而言,至今尚未入門,腦科學(xué)被稱為自然科學(xué)的“終極疆域”。
面對(duì)腦科學(xué)與類腦智能發(fā)展所要解決的諸多問題,世界各國早已開始布局,并投入大量資源。美國于2013 年啟動(dòng)“BRAIN 計(jì)劃”,將大腦結(jié)構(gòu)圖建立、類腦相關(guān)理論建模、腦機(jī)接口等列為研發(fā)重點(diǎn);2016 年,中國腦計(jì)劃研究正式啟動(dòng),2021 年啟動(dòng)了百億級(jí)的科技創(chuàng)新2030 重大項(xiàng)目“腦科學(xué)與類腦研究”。北京、上海、浙江、廣東、天津、湖北、四川、重慶等省市陸續(xù)啟動(dòng)區(qū)域腦科學(xué)計(jì)劃,加快腦科學(xué)創(chuàng)新中心建設(shè)??傮w來看,中國腦計(jì)劃以腦認(rèn)知的神經(jīng)基礎(chǔ)為主體,以腦疾病的診治及腦機(jī)智能技術(shù)為兩翼開展底層布局,形成“一體兩翼”的完善戰(zhàn)略布局。
認(rèn)識(shí)腦不僅僅是一個(gè)科研活動(dòng)揭示大腦原理的過程,事實(shí)上,腦認(rèn)知與諸多產(chǎn)業(yè)領(lǐng)域關(guān)系密切。著名競技真人秀節(jié)目《最強(qiáng)大腦》自2014 年首播,曾經(jīng)連續(xù)多年穩(wěn)占同檔期衛(wèi)視綜藝前三的位置,掀起腦科學(xué)熱潮;腦科學(xué)研究所揭示的大腦機(jī)理,拓展出的大腦開發(fā)方法,如照相記憶、快速閱讀、邏輯推理相關(guān)的技巧等,備受學(xué)生、家長推崇;心理學(xué)領(lǐng)域的很多心理現(xiàn)象也需要基于對(duì)大腦的認(rèn)知,設(shè)計(jì)出合理的心理輔導(dǎo)內(nèi)容;在游戲、商業(yè)購物領(lǐng)域存在大量針對(duì)人腦的局限性,對(duì)人進(jìn)行誘導(dǎo)性消費(fèi)的問題;在腦科學(xué)研究中,目前普遍存在的倫理問題,也難以準(zhǔn)確定義。這些問題都依賴對(duì)大腦的認(rèn)知,只有對(duì)大腦機(jī)理建立客觀解析理論,才能準(zhǔn)確定義人類心理行為的邊界,也才能對(duì)各種基于腦科學(xué)原理進(jìn)行應(yīng)用和利用的行為進(jìn)行規(guī)范。
2023 年5 月份,Neuralink 人體臨床試驗(yàn)獲FDA 批準(zhǔn),引發(fā)一輪腦機(jī)接口熱潮,然而,腦機(jī)接口技術(shù)應(yīng)用最大的挑戰(zhàn)便來源于對(duì)大腦的認(rèn)知不足,目前僅有部分現(xiàn)象級(jí)的范式能夠進(jìn)行應(yīng)用。但是,腦機(jī)接口等工具產(chǎn)業(yè)技術(shù)的發(fā)展,也進(jìn)一步推動(dòng)了對(duì)大腦觀測能力的提升,在單點(diǎn)、局部、整體的監(jiān)測技術(shù)的提升,有助于從多個(gè)角度理解大腦。隨著工具得到不斷改良,對(duì)腦科學(xué)的認(rèn)知不斷加深,人類終究可以理解大腦運(yùn)作機(jī)理,并反過來推動(dòng)相應(yīng)工具的升級(jí)。
人類一直備受腦疾病困擾,但是大多數(shù)腦部疾病,從原發(fā)性腦腫瘤等罕見但致命的疾病,到腦轉(zhuǎn)移瘤、多發(fā)性硬化癥、中風(fēng)、帕金森癥或阿爾茨海默?。ɡ夏臧V呆癥)等主要公共健康問題,一直以來都缺乏有效的治療手段,嚴(yán)重威脅著人類的生命健康[4]。
大腦的多重自我保護(hù)機(jī)制,比如血腦屏障作為保護(hù)大腦的“安全衛(wèi)士”,能夠阻擋異物(微生物、毒素、炎癥因子和抗體等)由血液循環(huán)進(jìn)入大腦,使大腦盡可能少受甚至不受外周血液中有害物質(zhì)的侵害,保持腦組織內(nèi)部環(huán)境的穩(wěn)定。但是與此同時(shí),當(dāng)大腦患有疾病的時(shí)候,血腦屏障又成了治療藥物進(jìn)入病灶的障礙。類似地,硬腦膜、蛛網(wǎng)膜、軟腦膜、顱骨等結(jié)構(gòu)在保護(hù)大腦的同時(shí),也都成了治療大腦最大的障礙。
如何有效對(duì)大腦狀態(tài)進(jìn)行干預(yù)成為人類亟需攻克的技術(shù)難題。如今,人類已經(jīng)發(fā)展出諸多技術(shù),如基于吞胞作用的藥物遞送技術(shù)、病毒載體等生物學(xué)技術(shù),光遺傳與聲遺傳、經(jīng)顱電刺激、經(jīng)顱磁刺激等生物與電子結(jié)合的技術(shù)。其中最成功的應(yīng)用為人工耳蝸,由體外言語處理器將聲音轉(zhuǎn)換為一定編碼形式的電信號(hào),通過植入體內(nèi)的電極系統(tǒng)直接興奮聽神經(jīng)來恢復(fù)或重建聾人的聽覺功能。
類腦智能又被稱為神經(jīng)形態(tài)計(jì)算,旨在模擬人類大腦的形態(tài)結(jié)構(gòu)及信息處理機(jī)制,從信息的獲取、存儲(chǔ)、處理與通訊等角度,類腦智能可以劃分為類腦感知、類腦記憶和類腦學(xué)習(xí)等[6]。
類腦感知包括模擬視覺、聽覺、觸覺和嗅味覺等,視覺智能處于產(chǎn)業(yè)化前沿,從上游的光源、鏡頭、相機(jī),到視覺系統(tǒng)中游的中間算法,再到下游的設(shè)備制造和終端應(yīng)用等已經(jīng)取得全面的發(fā)展。但是,在視頻處理、目標(biāo)理解等與認(rèn)知結(jié)合的層面尚需要進(jìn)一步挖掘。聽覺智能的發(fā)展已經(jīng)比較成熟,以自然語言處理為核心,機(jī)器翻譯、聊天機(jī)器人、 輿情分析和市場預(yù)測等各個(gè)領(lǐng)域均已廣泛應(yīng)用。一些研究表明,人腦的機(jī)理、嗅覺、味覺等功能或許與量子隧穿效應(yīng)有關(guān),將量子理論、腦科學(xué)等前沿理論帶入應(yīng)用階段或許是未來新一輪的技術(shù)方向。目前,對(duì)溫度、壓力、疼痛感知的分子機(jī)制均已揭示,并且,基于材料學(xué)的研究,已經(jīng)可以取得精度較高的傳感數(shù)據(jù)。對(duì)物理世界的感知決定了人腦對(duì)世界的認(rèn)知,感知系統(tǒng)也是虛擬世界獲取物理世界狀態(tài)的基本手段,類腦感知的研究,是對(duì)物理世界數(shù)字化的先決條件。
類腦記憶與類腦學(xué)習(xí)交叉融合,在馮·諾依曼計(jì)算機(jī)架構(gòu)體系中,將記憶與學(xué)習(xí)進(jìn)行了區(qū)分,然而,人腦中的相關(guān)功能模塊特征、產(chǎn)生機(jī)理均有較大差異。目前,已有多種方案基于人腦的學(xué)習(xí)記憶機(jī)理進(jìn)行設(shè)計(jì),如清華大學(xué)錢鶴、吳華強(qiáng)教授團(tuán)隊(duì)通過優(yōu)化材料和器件結(jié)構(gòu),成功制備出高性能憶阻器陣列?;趹涀杵鞯男滦痛嫠阋惑w架構(gòu),有望打破算力瓶頸,滿足人工智能等復(fù)雜任務(wù)對(duì)計(jì)算硬件的高需求[3]。脈沖神經(jīng)網(wǎng)絡(luò)(SNN)被稱為第三代神經(jīng)網(wǎng)絡(luò)模型,除了神經(jīng)元和突觸狀態(tài)之外,SNN 還將時(shí)間概念納入了其操作之中,有望為構(gòu)建下一代具有認(rèn)知特色的高效人工智能模型奠定理論基礎(chǔ),在神經(jīng)動(dòng)力學(xué)、自組織學(xué)習(xí)、多模態(tài)時(shí)空信息融合、魯棒信息表征等方面取得突破進(jìn)展[5]。
在腦科學(xué)與類腦智能技術(shù)體系中,對(duì)大腦的認(rèn)識(shí)是理論基礎(chǔ),大腦生理結(jié)構(gòu)、信息處理原理的破解,是腦模擬的前提條件,也是保護(hù)大腦、對(duì)大腦進(jìn)行充分利用的基礎(chǔ)?;谏窠?jīng)系統(tǒng)的網(wǎng)絡(luò)機(jī)制,機(jī)器學(xué)習(xí)算法不僅完成了對(duì)人腦的模擬,還創(chuàng)新性提出了更適合計(jì)算機(jī)處理的反饋機(jī)制,進(jìn)一步發(fā)展完善了現(xiàn)行的人工神經(jīng)網(wǎng)絡(luò)體系。但是,神經(jīng)傳導(dǎo)的脈沖機(jī)制,人腦情景的記憶方式,大腦可塑性機(jī)制還有諸多問題需要解析。
對(duì)大腦進(jìn)行觀察與干預(yù)所需的系列工具形成了腦機(jī)接口產(chǎn)業(yè)。大腦的生理結(jié)構(gòu),血腦屏障的存在,讓生物學(xué)手段難以抵達(dá)大腦;顱骨的存在,讓各種電子觀測技術(shù)對(duì)大腦的監(jiān)測難度大幅度提高;大腦本身的脆弱性、復(fù)雜性,也讓多數(shù)研發(fā)處于停滯狀態(tài)。但是隨著產(chǎn)業(yè)的擴(kuò)張,腦機(jī)接口產(chǎn)業(yè)能夠解決的問題也越來越多。在對(duì)大腦的觀察與監(jiān)測中,核磁共振、紅外、超聲等感應(yīng)技術(shù)提供了多種不同的觀測視角,電生理的監(jiān)測更是產(chǎn)生了消費(fèi)級(jí)腦電應(yīng)用。當(dāng)前通過消費(fèi)級(jí)腦機(jī)接口技術(shù),已經(jīng)可以對(duì)人的專注度、 注意力等宏觀指向性指標(biāo)進(jìn)行一定程度的定性定量;對(duì)興趣程度、喜怒哀樂等情緒指標(biāo)也可以進(jìn)行相對(duì)客觀的標(biāo)定; 通過經(jīng)顱電刺激、磁刺激、光遺傳等技術(shù),可以一定程度上影響大腦運(yùn)行的結(jié)果。大腦信號(hào)的監(jiān)測,使得精神世界的數(shù)字化變得客觀化,從原來依靠統(tǒng)計(jì)分析等間接手段得出的心理特征,開始轉(zhuǎn)化為通過直接監(jiān)測方法獲取心理特征。精神世界的數(shù)字化成為數(shù)字化新階段的重要補(bǔ)充。
對(duì)大腦機(jī)能的模仿形成的類腦智能,衍生出更加多樣化的技術(shù)體系。對(duì)神經(jīng)形態(tài)計(jì)算的研究,挖掘出了憶阻器、憶容器、憶感器等電路單元。隨著對(duì)人各種感知能力的模擬技術(shù)的成熟化,人形機(jī)器人總體架構(gòu)愈加完善,目前人形機(jī)器人已經(jīng)在力量、負(fù)重、重復(fù)勞作及輔助行動(dòng)等多個(gè)領(lǐng)域媲美人類,并且有產(chǎn)業(yè)化趨勢。與此同時(shí),精神世界對(duì)人類的模仿也在加速推進(jìn),情感陪伴機(jī)器人利用語義解析可以在一定程度上通過圖靈測試;虛擬人對(duì)人肢體語言的模仿可以以假亂真; 腦控信號(hào)的輸出與輸入,進(jìn)一步讓人的思維與數(shù)字信號(hào)的交互隱蔽化,虛擬與現(xiàn)實(shí)的邊界正在模糊化。
由于生物技術(shù)(BT)與信息技術(shù)(IT)在材料、供能、控制各方面的差異性,生物技術(shù)與信息技術(shù)發(fā)展路徑一直有較大差異。但隨著應(yīng)用的深入,其交叉融合也越來越緊密,尤其是在電生理方面,以電作為媒介,生物信息與數(shù)字信號(hào)得到有效交互。當(dāng)前以腦機(jī)接口為代表的高端生物技術(shù)正在加速演進(jìn),成為BT+IT 的主戰(zhàn)場。對(duì)生物信息在時(shí)間、空間上更精細(xì)的監(jiān)測以及干預(yù)能力,讓BT、IT 融合踏上了快車道。未來BT 與IT 的交叉融合,在個(gè)體、群體能力上都將大幅度擴(kuò)展。如,通過生物電信號(hào)直接控制機(jī)械外設(shè),典型的應(yīng)用是目前用于康復(fù)領(lǐng)域的外骨骼機(jī)械臂。根據(jù)腦機(jī)接口運(yùn)動(dòng)想象范式的特征,隨著外骨骼得到更精細(xì)的反饋信號(hào),人體對(duì)外骨骼達(dá)到“如臂指使”的操控是完全可行的。進(jìn)一步地,經(jīng)由無線體域網(wǎng)控制,在微觀、介觀、宏觀各式各樣的機(jī)械裝置也將能夠參與到人體的運(yùn)動(dòng)乃至代謝過程中,從而加強(qiáng)人類本身的能力。
數(shù)字化發(fā)展到元宇宙這樣的大型虛擬系統(tǒng),基礎(chǔ)技術(shù)已經(jīng)不是瓶頸,AIGC 將在未來很長時(shí)間代替人類生產(chǎn)主要的圖像、音頻、視頻、模型和動(dòng)畫資源,基礎(chǔ)的交互也將可以由語言大模型逐步完善。但是虛擬世界中物體、人員、事件的組織依然是依托于現(xiàn)實(shí)世界的社會(huì)結(jié)構(gòu),筆者認(rèn)為,腦科學(xué)影響將不僅僅局限于新技術(shù)的發(fā)明與發(fā)現(xiàn)上。正如數(shù)字化早期階段雖然很大程度表現(xiàn)在物體的信息化上,但是更多的資源放在了流程的梳理、管理信息的數(shù)字化上面。數(shù)字化進(jìn)入智能化階段的關(guān)鍵,依然不在于具體某個(gè)開關(guān)的智能化控制上。如何更有效地捕捉到人在場景中的情感需求,從而在更合適的時(shí)間與場景下觸發(fā)合適的動(dòng)作,將持續(xù)主導(dǎo)數(shù)字化的發(fā)展。而在適配人的需求上,傳統(tǒng)依賴大數(shù)據(jù)統(tǒng)計(jì)進(jìn)行模式識(shí)別的方式顯然無法滿足實(shí)時(shí)性要求,更難以滿足參與主體的多樣化需求,因此,腦科學(xué)研究所帶來的精神世界的數(shù)字化將是下一階段數(shù)字化的核心之一。
世界科技在20 世紀(jì)因?yàn)樾录夹g(shù)與新發(fā)現(xiàn),衍生出諸多新領(lǐng)域,呈現(xiàn)出技術(shù)大分化特征。到了21世紀(jì),因?yàn)閿?shù)字化的進(jìn)程加速,又不斷整合諸多領(lǐng)域,呈現(xiàn)出將多個(gè)產(chǎn)業(yè)整合為一套系統(tǒng)的預(yù)期,顯現(xiàn)出大融合姿態(tài)。分化與融合是事物發(fā)展的不同階段,創(chuàng)新、創(chuàng)造、開拓必然帶來事物的分化;總結(jié)、歸納、控制也必然促成事物的系統(tǒng)化。大腦是人體的控制中樞,人體的各個(gè)系統(tǒng)分工明確,通過感知與反饋,人腦能夠?qū)ξ锢硎澜缧纬蓸O其準(zhǔn)確的認(rèn)知,同時(shí)視覺、聽覺、觸覺、溫度、壓力各種感知的協(xié)調(diào)兼具獨(dú)立性與系統(tǒng)性,其協(xié)作有條不紊。這正是接下來數(shù)字化即將面臨的新問題。隨著數(shù)字化系統(tǒng)從單一系統(tǒng)擴(kuò)展到多系統(tǒng)融合,信息的結(jié)構(gòu)化、分布式存儲(chǔ)、模態(tài)融合等都將面臨新的挑戰(zhàn)。從物理世界建模形成的元宇宙世界,如何與物理世界無縫銜接,如何有效地在局部與整體上適應(yīng)環(huán)境的變化,人們又如何透過虛擬世界與機(jī)器人擴(kuò)展自己的活動(dòng)空間,人的社會(huì)性與個(gè)體性如何兼容……從類腦智能發(fā)展出的脈沖神經(jīng)網(wǎng)絡(luò)、吸引子網(wǎng)絡(luò)、腦內(nèi)世界模型等理論,將隨著腦科學(xué)的發(fā)展不斷完善,為未來智能化建設(shè)提供解決方案。