胡小平,毛 軍,范 晨,張禮廉,何曉峰,韓國良,范 穎
(國防科技大學(xué)智能科學(xué)學(xué)院,長沙 410073)
以衛(wèi)星導(dǎo)航系統(tǒng)為核心的導(dǎo)航定位與授時體系在國防和國民經(jīng)濟發(fā)展中發(fā)揮著不可或缺的支撐作用。眾所周知,衛(wèi)星導(dǎo)航信號易受干擾,過分地依賴衛(wèi)星導(dǎo)航在戰(zhàn)時將面臨巨大的風(fēng)險。因此,如何提升各類運動體在衛(wèi)星導(dǎo)航信號拒止環(huán)境下的自主導(dǎo)航能力,是目前導(dǎo)航領(lǐng)域面臨的重大挑戰(zhàn)。近年來,仿生導(dǎo)航、視覺/慣性組合導(dǎo)航、全源導(dǎo)航等多種新型自主導(dǎo)航技術(shù)逐漸成為研究熱點,以期為解決目前導(dǎo)航領(lǐng)域面臨的相關(guān)難題提供新的技術(shù)途徑。
仿生導(dǎo)航是一項多學(xué)科交叉融合的新型自主導(dǎo)航技術(shù)。動物行為學(xué)和生理學(xué)的研究成果以及人工智能、微納米制造、高性能芯片、計算機視覺等相關(guān)技術(shù)的發(fā)展為研究仿生導(dǎo)航技術(shù)提供了有力支撐。本文從仿生導(dǎo)航的內(nèi)涵、仿生導(dǎo)航傳感器技術(shù)、仿生導(dǎo)航方法等方面簡要介紹了國內(nèi)外研究現(xiàn)狀和發(fā)展趨勢。
大自然中許多動物具有驚人的導(dǎo)航本領(lǐng),例如:北極燕鷗每年往返于南、北兩極地區(qū),旅程達5×104~6×104km,從不迷航;信鴿能夠在距離飼養(yǎng)巢穴數(shù)百km遠(yuǎn)的陌生地方,順利返回巢穴;美洲的黑脈金斑蝶每年秋季從加拿大飛到墨西哥,行程約4800km,卻從不迷路。
在19世紀(jì)40年代,Tolman發(fā)現(xiàn)在迷宮實驗中的老鼠能夠迅速地找到通往食物的捷徑,并且當(dāng)熟悉路徑被阻擋后能夠找到新的路徑[1]。據(jù)此,Tolman提出了認(rèn)知地圖的概念,認(rèn)為認(rèn)知地圖中包含有產(chǎn)生復(fù)雜導(dǎo)航行為的經(jīng)驗知識[2]。從目前生物學(xué)的研究成果可知,動物導(dǎo)航經(jīng)驗知識的信息源主要包括視覺、運動感知、地磁、天空偏振光以及聲覺和嗅覺等。神經(jīng)學(xué)領(lǐng)域的研究還發(fā)現(xiàn)了多種與動物導(dǎo)航行為密切相關(guān)的功能性神經(jīng)細(xì)胞,包括位置細(xì)胞[3-4]、網(wǎng)格細(xì)胞[5-6]、頭朝向細(xì)胞[7-8]等。最新研究還表明,多個位置細(xì)胞的聯(lián)合激活機制與動物認(rèn)知運動環(huán)境的拓?fù)浣Y(jié)構(gòu)以及拓?fù)淇臻g中的路徑規(guī)劃有關(guān)[9-10]。雖然現(xiàn)有研究還沒有完全解釋大腦神經(jīng)活動與動物導(dǎo)航行為之間的相互作用機制,但相關(guān)研究成果仍然開闊了人類對動物導(dǎo)航方式的理解。
對昆蟲[11]和鳥類[12-13]等動物導(dǎo)航行為的研究成果也為仿生導(dǎo)航技術(shù)提供了豐富的參考。對信鴿返巢行為的研究發(fā)現(xiàn):將同一信鴿在同一地點多次釋放后,雖然它們每次的返巢路線都各不相同,但都經(jīng)過某些相同的地標(biāo)節(jié)點(如圖1所示)[12];并且,這些地標(biāo)節(jié)點往往具有明顯的地理特征信息[13]。信鴿的返巢路線可以看成是將這些地標(biāo)節(jié)點按某種方式連通的拓?fù)鋵?dǎo)航路線圖。國內(nèi)有的學(xué)者將信鴿與候鳥的這種導(dǎo)航行為抽象為“航向約束+環(huán)境感知+學(xué)習(xí)推斷”的導(dǎo)航模式[14-15],他們認(rèn)為“航向約束+環(huán)境感知”是靠器官與大腦的聯(lián)動來實現(xiàn)的,學(xué)習(xí)推斷結(jié)果的正確與否是靠導(dǎo)航經(jīng)驗知識與導(dǎo)航?jīng)Q策機制的共同作用來保證的。
圖1 信鴿回巢路線示意圖(圖片來源于文獻[12])Fig.1 The homing trajectories of a pigeon(Reproduced from [12])
仿生導(dǎo)航,顧名思義是一種“模仿+借鑒”動物導(dǎo)航本領(lǐng)的新的導(dǎo)航技術(shù)。傳統(tǒng)導(dǎo)航技術(shù)大多數(shù)情況是在幾何空間內(nèi)研究導(dǎo)航問題,關(guān)注于對導(dǎo)航參數(shù)的精確測量。然而,自然界中大多數(shù)動物往往不具備對導(dǎo)航參數(shù)精確測量的能力,但它們?nèi)匀荒軌蛲瓿筛鞣N復(fù)雜的導(dǎo)航任務(wù)。
與常用的導(dǎo)航技術(shù)相比,除了導(dǎo)航傳感器層面的差別外,仿生導(dǎo)航技術(shù)最大的特點是可以綜合利用幾何空間內(nèi)的導(dǎo)航信息與拓?fù)淇臻g內(nèi)的導(dǎo)航經(jīng)驗知識、導(dǎo)航拓?fù)淇臻g關(guān)鍵節(jié)點的引導(dǎo)指令等,從而得到面向任務(wù)的導(dǎo)航指令集,然后按照某種導(dǎo)航模式(例如,“航向約束+環(huán)境感知+學(xué)習(xí)推斷”的節(jié)點遞推導(dǎo)航模式)引導(dǎo)載體運動。根據(jù)需要,可以將多個不同類型的仿生導(dǎo)航傳感器進行組合,也可以將仿生導(dǎo)航傳感器與其他導(dǎo)航傳感器(例如,慣性傳感器)組合,構(gòu)成混合式仿生導(dǎo)航系統(tǒng)。
仿生導(dǎo)航傳感器包括仿生光羅盤、仿生磁羅盤、仿生復(fù)眼等,這些導(dǎo)航傳感器借鑒了動物器官感知自然環(huán)境形成導(dǎo)航信息的機理和大腦內(nèi)導(dǎo)航細(xì)胞處理信息的機制,可以將自然界的光、磁和場景特征等信息源轉(zhuǎn)化為載體運動的航向、位置、速度、姿態(tài)等導(dǎo)航信息,具有全自主、抗干擾、測量誤差不隨時間積累等特點。
仿生光羅盤是一種通過借鑒動物視覺器官感知太陽偏振光信息(包括月光)的機理,以獲得載體航向信息的傳感器。其基本工作原理是:通過偏振光傳感器測量天空的偏振信息,根據(jù)天空觀測點處偏振光的最大E矢量振動方向垂直于由觀測者、天空觀測點以及太陽所構(gòu)成的觀測平面的特殊幾何關(guān)系,結(jié)合時間、觀測位置和太陽星歷,解算出載體的航向角。
2000年,Lambrinos等采用光電二極管,研制了一種模仿昆蟲偏振光敏感單元的點測量式仿生光羅盤[16]。此后,大連理工大學(xué)褚金奎教授課題組對這種結(jié)構(gòu)的偏振光羅盤進行了改進,并提出了一種新的定向算法[17-18]。中北大學(xué)劉俊教授團隊分別研制了四通道和六通道的點測量式偏振光羅盤,并對傳感器標(biāo)定方法進行了深入分析[19-20]。國防科技大學(xué)胡小平教授團隊研制了六通道點測量式仿生光羅盤[21]和基于相機的面測量式仿生光羅盤[22-23],并對光羅盤定向算法[24-25]和光羅盤/多傳感器組合導(dǎo)航方法進行了深入研究[26-29]。仿生光羅盤的國內(nèi)外發(fā)展概況如圖2所示。
圖2 國內(nèi)外仿生光羅盤技術(shù)發(fā)展概況Fig.2 The development of the polarization compass
仿生光羅盤與傳統(tǒng)的航向傳感器相比,具有抗干擾性強、誤差不隨時間積累、易于微小型化等優(yōu)點,主要缺點是定向精度受天空能見度影響較大。目前,對仿生光羅盤技術(shù)的研究主要集中在大氣偏振模式建模[30]、傳感器誤差機理分析與補償方法[31-32]、偏振光定向算法[24-25, 32]、像素化偏振成像專用芯片技術(shù)、微小型化集成技術(shù)、全天候復(fù)雜天空背景自適應(yīng)技術(shù)[26]等方面。其中,像素化偏振成像專用芯片和微小型化集成技術(shù)是研究的熱點和難點。
從原理上考慮,偏振光相機既可以用于偏振成像[24],也可以作為偏振光羅盤使用[33]。但應(yīng)該指出的是,采用偏振光相機作為航向傳感器,有些大材小用,也不利于偏振光羅盤的微小型化和低成本。從已查到的文獻資料來看,目前還沒有一款微小型化的偏振光羅盤樣機問世。
信鴿視網(wǎng)膜上的光敏分子易受光的激發(fā),形成單重態(tài)和三重態(tài)的自由基對。當(dāng)外界磁場介入后,會影響單重態(tài)和三重態(tài)分子的轉(zhuǎn)換速率,這樣就建立了磁場和光信息轉(zhuǎn)換的關(guān)系[34](如圖3所示);此外,信鴿上喙及內(nèi)耳結(jié)構(gòu)中喇叭狀的非晶鐵質(zhì)層能夠?qū)ξ⑷醯牡卮判盘栠M行集聚放大,從而實現(xiàn)對微弱地磁信號的感知[35]?,F(xiàn)有仿生磁羅盤的基本工作原理也有兩類:一類是基于自由基對磁敏感機理,設(shè)計制造自由基對磁電敏感單元,實現(xiàn)高靈敏地磁場檢測;另一類是基于非晶鐵質(zhì)涂層和鏈狀磁片的磁敏感效應(yīng),利用高磁導(dǎo)率材料加工磁性集聚結(jié)構(gòu)進行增敏,實現(xiàn)大量程高精度地磁場測量。仿生磁羅盤具有靈敏度高、全天候全區(qū)域、易于微小型化等優(yōu)點,主要缺點是易受電磁干擾。
圖3 自由基對磁敏感原理示意圖Fig.3 Illustration of the radical-pair-based magnetoreceptor
目前,對仿生磁羅盤技術(shù)的研究主要集中在自由基對及鐵磁顆粒團簇地磁敏感機理[36-37]、量子磁光效應(yīng)敏感材料制備工藝、磁矢量測量技術(shù)、傳感器誤差機理分析與補償方法、微小型化集成技術(shù)等方面。
需要指出的是,如果將仿生光羅盤與仿生磁羅盤以及微慣性測量單元(Micro Inertial Measure-ment Unit,MIMU)組合[29],進行小型化、一體化集成設(shè)計,構(gòu)成仿生復(fù)合羅盤,可以實現(xiàn)優(yōu)勢互補,顯著增強仿生航向傳感器的整體性能,并且還可以增加概略定位功能(定位精度在幾十km量級)[38]。
研究發(fā)現(xiàn),昆蟲復(fù)眼是由成千上萬個結(jié)構(gòu)和功能相同的子眼構(gòu)成的一種特殊成像系統(tǒng)。以曲面陣列方式排列的子眼視場角度能夠達到全視場,使得復(fù)眼在環(huán)境感知方面有著獨特的優(yōu)勢。仿生復(fù)眼是借鑒昆蟲的視覺器官感知光流和環(huán)境特征信息的機理,測量載體姿態(tài)、速度和位置等導(dǎo)航參數(shù)的傳感器,其基本工作原理是:通過多個面向不同方向的孔徑,對大視場內(nèi)的場景進行成像,然后集成到同一探測器上進行圖像輸出。在此基礎(chǔ)上,通過仿生光流和場景識別等算法,獲得載體的運動速度和在環(huán)境中的相對位置等信息。仿生復(fù)眼系統(tǒng)具有體積小、視場大、畸變小、孔徑多、靈敏度高、動態(tài)范圍高等優(yōu)點。
目前,國內(nèi)外已經(jīng)提出了多種仿生復(fù)眼設(shè)計方案。2007年,Radtke等提出了一種球面仿生復(fù)眼結(jié)構(gòu)[39];Julia等則實現(xiàn)了一種可在晶圓上進行加工構(gòu)建的復(fù)眼系統(tǒng),有效降低了復(fù)眼尺寸[40];受節(jié)肢動物復(fù)眼結(jié)構(gòu)的啟發(fā),Song等在2013年研發(fā)出了一款近半球面形的仿生復(fù)眼[41];Voillet等在圓柱面上集成了630個小眼,實現(xiàn)了大視場成像效果[42];Xiao采用了可伸展的硅基光電探測器,成功集成了包含 180個小眼的半球面狀復(fù)眼傳感器[43];Hao結(jié)合了昆蟲復(fù)眼結(jié)構(gòu)和人類視覺器官結(jié)構(gòu),研制了一種混合型的仿生復(fù)眼系統(tǒng)[44]。仿生復(fù)眼傳感器的發(fā)展概況如圖4所示。當(dāng)前,仿生復(fù)眼傳感器已進入實用階段,例如美國的新一代無人機“蜂鳥”上就配備了一部18億像素的高分辨率復(fù)眼相機。
圖4 國內(nèi)外復(fù)眼傳感器技術(shù)發(fā)展概況Fig.4 The development of the artificial compound eye
目前,對仿生復(fù)眼技術(shù)的研究主要集中在仿生復(fù)眼結(jié)構(gòu)設(shè)計與實現(xiàn)[45]、微光學(xué)耦合成像工藝[46]、圖像校正和高動態(tài)/超分辨方法[47]等;仿生復(fù)眼未來的發(fā)展趨勢有快速/高精度運動測量、仿生復(fù)眼系統(tǒng)微小型化設(shè)計與集成制造技術(shù)等方面。
仿生導(dǎo)航方法主要涉及導(dǎo)航經(jīng)驗知識的表達與機器學(xué)習(xí)、多源異質(zhì)導(dǎo)航信息柔性融合和面向任務(wù)的仿生路徑規(guī)劃與導(dǎo)航等方面。
經(jīng)驗知識是動物完成各項復(fù)雜導(dǎo)航任務(wù)的重要基礎(chǔ)。例如,在迷宮實驗中的老鼠隨著導(dǎo)航經(jīng)驗知識的積累,能夠迅速找到最佳覓食路徑[1]。信息源是提煉經(jīng)驗知識的基礎(chǔ),離線或在線獲取的經(jīng)驗數(shù)據(jù)已廣泛地應(yīng)用于現(xiàn)有導(dǎo)航系統(tǒng)中。例如,離線構(gòu)建的街景圖[48]、道路網(wǎng)絡(luò)圖[49]、衛(wèi)星地圖[50]等可以為無人車、無人機的自主定位與導(dǎo)航提供豐富的先驗參考信息。在未知環(huán)境中,則可以通過存儲在線獲取的環(huán)境感知數(shù)據(jù)作為導(dǎo)航經(jīng)驗知識[51]。然而,現(xiàn)有導(dǎo)航方法在經(jīng)驗知識的表達、組織和應(yīng)用方面都與動物相差甚遠(yuǎn)。
動物對導(dǎo)航經(jīng)驗知識的表達方法具有較好的魯棒性,它們能夠在復(fù)雜環(huán)境下使用視覺地標(biāo)和天空偏振態(tài)等進行導(dǎo)航。在基于視覺的導(dǎo)航經(jīng)驗知識表達方面,雖然研究者們采用了多種基于手工設(shè)計的視覺特征表達方法[52],但這些表達方法仍易受到光照、視角和季節(jié)變化等因素的影響。近年來,有研究者采用機器學(xué)習(xí)的方法,例如支持向量機[53]和卷積神經(jīng)網(wǎng)絡(luò)[15]等技術(shù),對視覺經(jīng)驗的表達方法進行了學(xué)習(xí),并展現(xiàn)出了良好的特征表達魯棒性。除視覺信息以外,天空偏振光、地磁等也是動物導(dǎo)航經(jīng)驗知識的重要來源。但當(dāng)前對地磁和偏振光的研究大多集中于仿生傳感器方面,對基于地磁和偏振光的經(jīng)驗知識表達與學(xué)習(xí)研究則相對缺乏。
動物能夠?qū)?jīng)驗知識之間的相互關(guān)系進行學(xué)習(xí)和表達,形成可供自主導(dǎo)航使用的經(jīng)驗知識圖譜。Cummins等采用無監(jiān)督學(xué)習(xí)方法,構(gòu)建了視覺特征之間的概率依賴樹,并根據(jù)特征之間共同出現(xiàn)的概率來判斷載體位置[76]。認(rèn)知科學(xué)研究表明,動物的認(rèn)知地圖中采用了拓?fù)鋱D的形式對經(jīng)驗知識進行組織和表達[9, 54]。利用拓?fù)鋱D表達經(jīng)驗知識之間的空間關(guān)系不僅符合高等動物的認(rèn)知,還可以有效降低路徑規(guī)劃中的搜索空間,提升路徑規(guī)劃算法的實時性。然而,現(xiàn)有導(dǎo)航拓?fù)鋱D大多是基于環(huán)境中天然的拓?fù)浣Y(jié)構(gòu)進行構(gòu)建的,例如,道路網(wǎng)絡(luò)圖[49]、室內(nèi)平面圖[55]等?;谖恢眉?xì)胞、網(wǎng)格細(xì)胞等構(gòu)建的類腦導(dǎo)航模型也可以構(gòu)建出二維平面環(huán)境的導(dǎo)航拓?fù)鋱D,但相關(guān)研究僅處于仿真驗證階段[56]。當(dāng)前,對面向無人機等在三維開放空間中運動的導(dǎo)航拓?fù)鋱D研究則相對較少。
此外,有學(xué)者認(rèn)為導(dǎo)航經(jīng)驗知識還包括知識推理機制,這種推理機制能夠迅速找到通往目標(biāo)點的捷徑或安全路線[15, 57]。值得關(guān)注的是,關(guān)于圖網(wǎng)絡(luò)方面的研究為導(dǎo)航經(jīng)驗知識表達與知識推理提供了新的思路。圖神經(jīng)網(wǎng)絡(luò)不僅能夠?qū)W習(xí)各知識節(jié)點和節(jié)點連通邊的表達方法,還能夠解決最短路徑規(guī)劃等推理問題[57]。最近,Chen等首次實現(xiàn)了基于圖神經(jīng)網(wǎng)絡(luò)的自主導(dǎo)航與定位[58]。
無論是動物還是移動載體,在導(dǎo)航過程中都需要對自身的運動狀態(tài)進行估計,魯棒、準(zhǔn)確的導(dǎo)航狀態(tài)估計往往需要對多種導(dǎo)航信息進行融合。在傳統(tǒng)導(dǎo)航系統(tǒng)中廣泛使用的信息融合方法有卡爾曼濾波器、粒子濾波器等。這些方法具有較好的導(dǎo)航參數(shù)估計精度,但需要建立準(zhǔn)確的數(shù)學(xué)模型,且對融合信息的時間同步關(guān)系、空間標(biāo)定關(guān)系、噪聲特性等有一定要求。與此相比,許多動物雖然不具備精確估計導(dǎo)航參數(shù)的能力,但卻展現(xiàn)出驚人的自主導(dǎo)航能力,這與它們優(yōu)秀的多源異質(zhì)導(dǎo)航信息融合能力緊密相關(guān)。
神經(jīng)科學(xué)領(lǐng)域的研究成果部分揭示了動物的多源異質(zhì)導(dǎo)航信息融合機制。Milford等基于吸引子網(wǎng)絡(luò)模型,構(gòu)建了包含位置細(xì)胞和方向細(xì)胞模型的RatSLAM算法,實現(xiàn)了對路徑積分信息和視覺重定位信息的有效融合[59]。雖然該方法采用了精度較低的路徑積分模塊和低維度的視覺特征模板,但仍然在室外大范圍實驗中展現(xiàn)出了優(yōu)異的建圖與定位性能。網(wǎng)格細(xì)胞是位置細(xì)胞的主要輸入,據(jù)此研究者們將多尺度的網(wǎng)格細(xì)胞通過競爭學(xué)習(xí)[60-61]或干涉模型[14]激活位置細(xì)胞,形成對位置的魯棒估計。此外,通過構(gòu)建三維吸引子網(wǎng)絡(luò)和多層級方向細(xì)胞,可以實現(xiàn)在三維空間中對路徑積分和視覺重定位信息的有效融合[62]。
人工神經(jīng)網(wǎng)絡(luò)具有與生物神經(jīng)元類似的連接結(jié)構(gòu),因此也被認(rèn)為是一種仿生信息處理方式。深度神經(jīng)網(wǎng)絡(luò)通過大量的神經(jīng)元和復(fù)雜的連接關(guān)系,可以實現(xiàn)復(fù)雜的信息處理功能。2017年,Ronald提出了VINet深度網(wǎng)絡(luò)結(jié)構(gòu),首次實現(xiàn)了視覺/慣性組合里程計功能[63]。后續(xù),研究者們提出了多種改進神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),對視覺/慣性[64]、雷達/視覺/慣性[65]等多源異質(zhì)信息進行了有效融合,并展現(xiàn)出了與基于傳統(tǒng)卡爾曼濾波的組合方法相近的導(dǎo)航參數(shù)估計精度。在復(fù)雜環(huán)境和傳感器噪聲模型未知等條件下,基于神經(jīng)網(wǎng)絡(luò)的信息融合方法比傳統(tǒng)組合方法展現(xiàn)出了更為優(yōu)異的魯棒性。然而,神經(jīng)網(wǎng)絡(luò)高度依賴于訓(xùn)練數(shù)據(jù),當(dāng)傳感器特性或測量數(shù)據(jù)與訓(xùn)練數(shù)據(jù)有較大差異時,基于神經(jīng)網(wǎng)絡(luò)的組合導(dǎo)航精度也會隨之下降。如何有效結(jié)合神經(jīng)網(wǎng)絡(luò)在信息融合魯棒性方面的優(yōu)勢以及模型類方法在精度和模型解釋性等方面的優(yōu)勢成為了當(dāng)前的研究熱點之一。近年來,有研究者提出了多種與卡爾曼濾波器相似的信息融合神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),以發(fā)揮兩類方法在多源異質(zhì)信息融合中的優(yōu)勢[66]。
路徑規(guī)劃是在一定的約束條件下,根據(jù)載體當(dāng)前狀態(tài)和目標(biāo)狀態(tài),尋找最優(yōu)路徑的過程。傳統(tǒng)導(dǎo)航方法中,常用的路徑搜索方法有A*搜索算法[67]和Dijkstra搜索算法[68]等。在大范圍路徑規(guī)劃中,由于搜索空間維度較高,傳統(tǒng)路徑搜索方法所需的計算資源和時間成本較高。與此相比,動物的導(dǎo)航行為具有明顯的目標(biāo)導(dǎo)向(goal-directed)特點,即能夠根據(jù)特定導(dǎo)航任務(wù)快速規(guī)劃出運動路徑。
偏振光導(dǎo)航是在自然界中發(fā)現(xiàn)的一種典型的面向任務(wù)的導(dǎo)航方式。研究發(fā)現(xiàn),沙漠螞蟻在覓得食物后,可以從距離巢穴數(shù)百米的地方幾乎沿直線準(zhǔn)確返回。目前,研究者們認(rèn)為螞蟻融合了從偏振光獲取的航向信息和計步/光流中提取的距離信息進行路徑積分;然后根據(jù)路徑積分結(jié)果估計指向蟻穴的返回向量,當(dāng)?shù)竭_蟻穴附近時則依靠熟悉的地標(biāo)特征引導(dǎo)。Lambrions等首次在輪式移動平臺上實現(xiàn)了這種仿沙漠螞蟻的偏振光導(dǎo)航方式[16];禇金奎等基于自研的偏振光羅盤,在兩輪移動平臺上實現(xiàn)了仿生偏振光自主導(dǎo)航[69];Julien等利用多足機器人的計步信息和2個由14個像素組成的偏振光羅盤進行了自主導(dǎo)航實驗,結(jié)果表明該多足機器人具有與沙漠螞蟻相似的導(dǎo)航行為[70]。當(dāng)前,已有的仿生偏振光導(dǎo)航案例都應(yīng)用于地面移動平臺。而蜜蜂、蜻蜓等飛行昆蟲也利用偏振光進行導(dǎo)航,研究適用于小型無人機的仿生偏振光導(dǎo)航具有重要的應(yīng)用前景。
信鴿等動物能夠認(rèn)知導(dǎo)航環(huán)境的拓?fù)浣Y(jié)構(gòu),并根據(jù)拓?fù)涞貓D進行面向任務(wù)的節(jié)點遞推導(dǎo)航(如圖1所示)。節(jié)點遞推導(dǎo)航具有重要的應(yīng)用價值,當(dāng)導(dǎo)航系統(tǒng)的精度不足以直接將載體從起始點引導(dǎo)至終點時,載體可以按順序經(jīng)過多個節(jié)點,并利用節(jié)點中的經(jīng)驗知識(如已知的地標(biāo)特征等)校正導(dǎo)航誤差,提升到達目標(biāo)點的置信度。位置細(xì)胞的聯(lián)合激活特性被認(rèn)為與動物的節(jié)點遞推導(dǎo)航方式密切相關(guān)[9-10]。基于位置細(xì)胞特性,Erdem構(gòu)造了類腦細(xì)胞計算模型,并在仿真環(huán)境下實現(xiàn)了節(jié)點遞推路徑規(guī)劃,然而該模型僅停留在仿真驗證階段[56, 71]。視覺信息是影響位置細(xì)胞充放電活動的主要因素之一[72],因此有研究者將離散分布的地標(biāo)特征構(gòu)建為拓?fù)涔?jié)點,并采用人為設(shè)計的連接規(guī)則構(gòu)建節(jié)點之間的連通邊,然后采用圖搜索的方法進行自主導(dǎo)航[73]。在動物的認(rèn)知地圖中,不同節(jié)點中的經(jīng)驗知識是如何進行關(guān)聯(lián)的這一機理還沒有被人類揭示,但信鴿的返巢路線表明幾何空間中相隔較遠(yuǎn)的節(jié)點區(qū)域在拓?fù)淇臻g中也存在連通邊。分析認(rèn)為,這是因為信鴿能夠借助偏振光、地磁等提供的航向約束信息飛越幾何空間中不相鄰的節(jié)點區(qū)域。據(jù)此,有研究者提出了根據(jù)導(dǎo)航系統(tǒng)的航向保持精度指標(biāo)構(gòu)建拓?fù)涔?jié)點之間的連通邊;在節(jié)點遞推導(dǎo)航過程中,則依靠航向約束飛越拓?fù)淇臻g中的相鄰節(jié)點[15]。
面向任務(wù)的導(dǎo)航方法也可以描述為一個學(xué)習(xí)推斷過程。動物能夠在日常的導(dǎo)航任務(wù)中不斷地積累經(jīng)驗知識,當(dāng)環(huán)境發(fā)生變化或?qū)Ш饺蝿?wù)發(fā)生變化時,它們?nèi)匀荒軌蚋鶕?jù)經(jīng)驗知識采取靈活的導(dǎo)航策略到達目標(biāo)點。采用機器學(xué)習(xí)技術(shù)對面向任務(wù)的運動策略進行學(xué)習(xí)已成為當(dāng)前的研究熱點之一。唐華錦等構(gòu)建了一種循環(huán)脈沖神經(jīng)網(wǎng)絡(luò),用于模擬大腦學(xué)習(xí)導(dǎo)航經(jīng)驗的過程,并成功運用于實際移動平臺小范圍的自主導(dǎo)航中[74]。DeepMind的研究人員通過深度學(xué)習(xí)技術(shù),使神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元具有與導(dǎo)航細(xì)胞類似的激活特性;據(jù)此,他們還采用了強化學(xué)習(xí)方法對面向任務(wù)的自主導(dǎo)航策略進行學(xué)習(xí)(如圖5所示)[75],在仿真環(huán)境中,通過學(xué)習(xí)得到的導(dǎo)航策略能夠迅速找到高效通往目標(biāo)點的路徑。最新研究還表明,大腦中也存在強化學(xué)習(xí)機制,并且動物進行導(dǎo)航推斷的知識圖譜結(jié)構(gòu)與其他任務(wù)的經(jīng)驗知識圖譜(例如,推斷人際關(guān)系的知識圖譜)可能是同一知識圖譜,只是應(yīng)用實體有所不同[54]。
圖5 面向任務(wù)的仿生導(dǎo)航方法示意圖(圖片來源于文獻[75])Fig.5 Schematic of vector-based bio-inspired navigation(Reproduced from [75])
仿生導(dǎo)航技術(shù)是導(dǎo)航領(lǐng)域未來發(fā)展的新方向,也是當(dāng)前的研究熱點之一。各種仿生導(dǎo)航傳感器的研制豐富了導(dǎo)航系統(tǒng)的感知能力;仿生導(dǎo)航方法的發(fā)展則為解決當(dāng)前所面臨的導(dǎo)航難題提供了新的技術(shù)途徑。目前,國內(nèi)外仿生導(dǎo)航技術(shù)研究方興未艾。2019年,美國波士頓大學(xué)、澳大利亞墨爾本大學(xué)等聯(lián)合研究的Neuro-Autonomy項目獲得了美國海軍研究院750萬美元的資助,以期在動物導(dǎo)航神經(jīng)活動、導(dǎo)航知識表示、自主導(dǎo)航與控制等方面進行突破,構(gòu)建可在非結(jié)構(gòu)化環(huán)境和未知環(huán)境中自主移動的無人平臺;美國能源部資助斯坦福研究中心的BrainSLAM項目關(guān)注于構(gòu)建仿類腦模型的同時建圖與定位技術(shù);DeepMind公司則聚焦于基于機器學(xué)習(xí)技術(shù)的仿生導(dǎo)航系統(tǒng),以期實現(xiàn)靈活自主的導(dǎo)航功能。
展望未來,仿生導(dǎo)航技術(shù)需要在導(dǎo)航傳感器與導(dǎo)航方法2個方面進行突破:
1)現(xiàn)有仿生導(dǎo)航傳感器雖然實現(xiàn)了對相應(yīng)感知信息的測量,但在信噪特性、功耗體積等方面都與動物器官存在較大差距,還需進一步對動物器官的感知機理、傳感器結(jié)構(gòu)設(shè)計、傳感器加工工藝等方面進行深入研究。此外,基于仿生傳感器的導(dǎo)航信息提取算法也是研究重點之一,研究魯棒性好、自適應(yīng)性強、精度高的仿生光羅盤定向算法、仿生光流運動估計算法、光磁復(fù)合定向算法等可為仿生導(dǎo)航系統(tǒng)提供可靠的導(dǎo)航信息。
2)目前,動物的導(dǎo)航機理還沒有完全被人類所理解。研究認(rèn)為,大腦中位置細(xì)胞、網(wǎng)格細(xì)胞等導(dǎo)航細(xì)胞的充放電活動與動物的視覺、嗅覺和路徑積分等信息密切相關(guān)。然而,器官感知信息驅(qū)動導(dǎo)航細(xì)胞活動的具體機制還沒有被完全揭示;大腦中各種不同的導(dǎo)航細(xì)胞是如何相互作用、協(xié)同工作,進而產(chǎn)生各種靈活高效的導(dǎo)航行為的過程也還有待進一步探究。為解決上述問題還需要在認(rèn)知學(xué)、動物行為學(xué)、機器學(xué)習(xí)等領(lǐng)域開展交叉研究。近年來,將動物導(dǎo)航機理與機器學(xué)習(xí)技術(shù)相結(jié)合,研究智能化的仿生導(dǎo)航技術(shù)逐漸成為新的發(fā)展趨勢。深度神經(jīng)網(wǎng)絡(luò)中復(fù)雜的神經(jīng)元連接關(guān)系,可用于模擬大腦導(dǎo)航細(xì)胞的空間編碼、知識學(xué)習(xí)、信息融合和導(dǎo)航推斷等機制。深度學(xué)習(xí)技術(shù)為構(gòu)建智能的仿生導(dǎo)航系統(tǒng)提供了新的技術(shù)手段;同時,動物導(dǎo)航過程中的神經(jīng)活動和認(rèn)知機理則為孕育出新的機器學(xué)習(xí)方法提供了基礎(chǔ)。例如,最新研究表明,與導(dǎo)航密切相關(guān)的大腦前額皮層中的學(xué)習(xí)推斷過程可以用元強化學(xué)習(xí)進行描述[77]。