顏明重,黃冰逸,朱大奇
(上海海事大學(xué) a.水下機(jī)器人與智能系統(tǒng)實(shí)驗(yàn)室;b.信息工程學(xué)院,上海 201306)
基于神經(jīng)動(dòng)力學(xué)的水下目標(biāo)觀測(cè)路徑規(guī)劃
顏明重a,黃冰逸b,朱大奇a
(上海海事大學(xué) a.水下機(jī)器人與智能系統(tǒng)實(shí)驗(yàn)室;b.信息工程學(xué)院,上海 201306)
針對(duì)水下工程應(yīng)用中的自治水下機(jī)器人目標(biāo)觀測(cè)的路徑需求問題,提出基于生物啟發(fā)神經(jīng)動(dòng)力學(xué)的路徑規(guī)劃方法,在二維柵格地圖的基礎(chǔ)上,建立二維生物啟發(fā)神經(jīng)網(wǎng)絡(luò)模型,引入來自目標(biāo)觀測(cè)任務(wù)區(qū)域的激勵(lì)信號(hào)和障礙物的抑制信號(hào),任務(wù)區(qū)域能夠全局地吸引機(jī)器人,障礙物對(duì)機(jī)器人具有局部排斥作用,從而使得機(jī)器人能夠近距離觀測(cè)目標(biāo)。仿真結(jié)果表明,在未知的動(dòng)態(tài)水下環(huán)境中,機(jī)器人能夠有效規(guī)避障礙物,自主規(guī)劃出目標(biāo)觀測(cè)路徑和返航路徑。
海洋工程;路徑規(guī)劃;生物啟發(fā)神經(jīng)動(dòng)力學(xué);水下機(jī)器人
自治水下機(jī)器人(autonomous underwater vehicle, AUV)以自主的管理和控制方式來執(zhí)行水下任務(wù),具有長(zhǎng)航程和大范圍活動(dòng)的優(yōu)點(diǎn),主要應(yīng)用于海洋資源勘探、海洋科學(xué)調(diào)查和軍事海防等。路徑規(guī)劃是AUV自主完成任務(wù)所需的關(guān)鍵技術(shù)之一。AUV的航行路徑與其任務(wù)密切相關(guān),最常見的路徑規(guī)劃是從起點(diǎn)到目標(biāo)位置的一條無碰路徑,這類路徑規(guī)劃常用于AUV的布放和回收,已經(jīng)有了較廣泛和深入的研究[1-4]。另一種路徑規(guī)劃是對(duì)目標(biāo)區(qū)域的全覆蓋探測(cè),這種路徑規(guī)劃要求AUV對(duì)局部區(qū)域進(jìn)行無遺漏的訪問,主要用于搜尋和發(fā)現(xiàn)水下相關(guān)目標(biāo),或者用于探測(cè)水下目標(biāo)區(qū)域的某些信息,比如地形地貌等[5-6]。隨著應(yīng)用領(lǐng)域的不斷拓寬,AUV所承擔(dān)的任務(wù)更加多樣,其航行路徑也越發(fā)復(fù)雜,比如AUV在執(zhí)行水下結(jié)構(gòu)體的表面檢查[7]、水下管線跟蹤排查[8]以及海底火山觀測(cè)[9]等任務(wù)時(shí),其路徑必須近距離環(huán)繞各種不規(guī)則目標(biāo)物的表面。針對(duì)這種路徑的規(guī)劃,一般是根據(jù)具體的任務(wù)采取離線規(guī)劃的方法,在普遍適用性和實(shí)時(shí)應(yīng)對(duì)未知狀況方面仍然需要進(jìn)一步改善。
為此,提出一種普遍適用、能夠應(yīng)對(duì)未知環(huán)境的在線動(dòng)態(tài)路徑規(guī)劃方法,旨在滿足AUV執(zhí)行水下目標(biāo)物觀測(cè)任務(wù)時(shí)的路徑需求。AUV的路徑規(guī)劃模型采用基于生物啟發(fā)神經(jīng)動(dòng)力學(xué)(bio-inspired neurodynamics)的二維神經(jīng)網(wǎng)絡(luò)來表示,神經(jīng)網(wǎng)絡(luò)的激勵(lì)輸入來自于任務(wù)線路(區(qū)域),抑制輸入來自于障礙物。AUV根據(jù)神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)輸出(神經(jīng)元活性值)在線規(guī)劃出符合任務(wù)需求的路徑,當(dāng)AUV完成目標(biāo)觀測(cè)任務(wù)后,也能自動(dòng)規(guī)劃出返航路徑。
1.1 模型基本原理
以二維柵格地圖表示AUV的工作環(huán)境,每個(gè)柵格的狀態(tài)為“Free”或“Occupied”,分別表示自由空間和障礙物,如圖1a)所示。對(duì)于AUV所要觀測(cè)的目標(biāo)物,由于AUV不能與之相碰撞,因此地圖上相應(yīng)柵格的狀態(tài)視同障礙物,也標(biāo)記為“Occupied”。在柵格地圖的基礎(chǔ)上,建立基于生物啟發(fā)神經(jīng)動(dòng)力學(xué)的二維神經(jīng)網(wǎng)絡(luò)模型。網(wǎng)絡(luò)中的神經(jīng)元與地圖柵格一一對(duì)應(yīng),神經(jīng)元之間的連接與柵格的連通相對(duì)應(yīng),如圖1b)所示。
在神經(jīng)網(wǎng)絡(luò)中,設(shè)計(jì)神經(jīng)元的外部輸入信號(hào)如下。
(1)
式中:Ik為神經(jīng)網(wǎng)絡(luò)中第k個(gè)神經(jīng)元的外部輸入;E為正常數(shù)。
地圖中的目標(biāo)物或障礙物標(biāo)記為“occupied”,神經(jīng)網(wǎng)絡(luò)中相應(yīng)位置的神經(jīng)元引入外部抑制信號(hào)-E;在AUV執(zhí)行水下觀測(cè)任務(wù)中,目標(biāo)物的邊緣是AUV必須訪問的區(qū)域(稱為任務(wù)區(qū)域),在該區(qū)域的神經(jīng)元引入外部激勵(lì)E;地圖中其他區(qū)域?yàn)樽杂煽臻g,相應(yīng)位置的神經(jīng)元外部輸入為0。
神經(jīng)網(wǎng)絡(luò)中,每個(gè)神經(jīng)元活性值的變化規(guī)律由生物啟發(fā)神經(jīng)動(dòng)力學(xué)方程來表示[10]:
(2)
(3)
1.2 模型特性分析
圖2a)所示為一張20×20大小的柵格地圖,右下角為障礙物,左上角是目標(biāo)物。根據(jù)該地圖,建立神經(jīng)網(wǎng)絡(luò)模型,得到神經(jīng)網(wǎng)絡(luò)的活性分布如圖2b)所示。任務(wù)區(qū)域的神經(jīng)元由于激勵(lì)信號(hào)的作用,呈現(xiàn)較大的正活性,并且向相鄰的神經(jīng)元傳遞,整個(gè)網(wǎng)絡(luò)的正活性分布呈現(xiàn)出任務(wù)區(qū)域處最高、越遠(yuǎn)離任務(wù)區(qū)域越低的特征。障礙物區(qū)域的神經(jīng)元由于抑制信號(hào)的作用而始終表現(xiàn)為負(fù)活性,在神經(jīng)網(wǎng)絡(luò)活性分布圖中位于低谷處。
2.1 路徑規(guī)劃流程
在執(zhí)行水下目標(biāo)物觀測(cè)的任務(wù)時(shí),AUV的目標(biāo)觀測(cè)路線(任務(wù)路徑)與目標(biāo)物的外形有關(guān)。在完成觀測(cè)任務(wù)后,還要求AUV能夠自動(dòng)返航,以確保安全回收,見圖3。由此可知,AUV的路徑規(guī)劃必須具備避開障礙物、沿著任務(wù)路線航行和返航等3個(gè)功能。
為規(guī)劃AUV的任務(wù)路徑,制定如圖4所示的路徑規(guī)劃流程。AUV首先從任務(wù)模塊接受目標(biāo)觀測(cè)任務(wù),接下來判斷是否突發(fā)緊急事件,比如硬件故障、系統(tǒng)運(yùn)行錯(cuò)誤或者電源不足等。如果AUV突發(fā)事故,則啟動(dòng)任務(wù)重規(guī)劃,進(jìn)入返航路徑規(guī)劃。如果AUV工作正常,則啟動(dòng)任務(wù)路徑規(guī)劃,并調(diào)用避碰規(guī)劃模塊來協(xié)助任務(wù)直至完成,最后進(jìn)入返航規(guī)劃。AUV執(zhí)行返航任務(wù)時(shí),同樣調(diào)用避碰規(guī)劃模塊來協(xié)助返航。
2.2 任務(wù)路徑規(guī)劃
AUV的水下工作環(huán)境用離散的二維柵格地圖表示,地圖柵格與神經(jīng)網(wǎng)絡(luò)中的神經(jīng)元在空間位置上呈現(xiàn)對(duì)應(yīng)關(guān)系。任務(wù)路徑規(guī)劃以神經(jīng)元的活性大小來確定,具體算法見圖5。
AUV路徑下一步選擇規(guī)則定義為[7]
(4)
這種策略是從AUV當(dāng)前位置的鄰域中找出神經(jīng)元活性值最大的位置,作為路徑的下一步。
如果AUV完成當(dāng)前任務(wù),則根據(jù)式(4)找出下一步路徑,將當(dāng)前神經(jīng)元的外部輸入置零,AUV進(jìn)入下一步位置,繼續(xù)探測(cè)環(huán)境、更新地圖和神經(jīng)網(wǎng)絡(luò)。當(dāng)AUV完成觀測(cè)任務(wù),則進(jìn)入返航規(guī)劃。式(4)保證了AUV始終趨向任務(wù)區(qū)域(最大正活性)而遠(yuǎn)離障礙物(負(fù)活性)。從神經(jīng)網(wǎng)絡(luò)活性值的空間分布來看,AUV是沿著神經(jīng)網(wǎng)活性最大梯度的方向“往上爬”,障礙物處于低谷,必然不會(huì)成為AUV的路徑選擇,由此AUV能夠自動(dòng)避障。
2.3 返航路徑規(guī)劃
AUV與水面不具有物理連接且自帶能源有限,因此路徑規(guī)劃不僅要考慮任務(wù)的執(zhí)行,還必須考慮返航,以確保設(shè)備安全回收。在AUV完成目標(biāo)觀測(cè)任務(wù)后,或者遇到突發(fā)緊急情況,AUV獲得返航指令,開啟返航路徑規(guī)劃,步驟如下。
1)接受返航指令,確定回收點(diǎn)的位置。
2)神經(jīng)元的外部激勵(lì)置零(任務(wù)未完成時(shí))。
3)在回收位置處的神經(jīng)元輸入激勵(lì)信號(hào)。
4)更新神經(jīng)網(wǎng)絡(luò)。
5)由式(4)確定返航路徑。
6)重復(fù)執(zhí)行步驟4)和5),直至AUV到達(dá)回收點(diǎn)。
3.1 靜態(tài)已知環(huán)境下的路徑規(guī)劃
設(shè)AUV的水下工作環(huán)境以20×20的二維柵格地圖來表示(如圖6a)所示),環(huán)境中的障礙物與目標(biāo)物信息為已知,AUV起始位置是(1,1),設(shè)定返航點(diǎn)在(1,20)。AUV的任務(wù)是從起點(diǎn)出發(fā),執(zhí)行近距離環(huán)繞目標(biāo)物的觀測(cè)任務(wù),完成任務(wù)后返航至回收位置(1,20)。圖6a)顯示了AUV的工作環(huán)境地圖,圖6b)顯示障礙物及目標(biāo)物所占據(jù)區(qū)域的神經(jīng)元活性為負(fù),任務(wù)區(qū)域的神經(jīng)元活性則處于最高位。AUV按“往高處爬”的策略,從起點(diǎn)出發(fā),自動(dòng)避開障礙物,逐漸接近任務(wù)區(qū)域。圖7顯示了AUV完成目標(biāo)觀測(cè)并實(shí)現(xiàn)返航的路徑效果。當(dāng)AUV完成目標(biāo)觀測(cè)后,任務(wù)區(qū)域神經(jīng)元的外部激勵(lì)消失,活性值下降,如圖7b)所示。
3.2 動(dòng)態(tài)環(huán)境中的路徑規(guī)劃
水下環(huán)境往往復(fù)雜且不確定,難以預(yù)料的動(dòng)態(tài)障礙物可能會(huì)影響水下機(jī)器人的正常作業(yè)任務(wù)。因此,AUV必須考慮對(duì)動(dòng)態(tài)障礙物進(jìn)行實(shí)時(shí)規(guī)避?;谏飭l(fā)神經(jīng)動(dòng)力學(xué)的神經(jīng)網(wǎng)絡(luò)是一個(gè)動(dòng)態(tài)變化的系統(tǒng),能夠根據(jù)地圖信息實(shí)時(shí)更新,從而指導(dǎo)AUV實(shí)時(shí)規(guī)劃路徑和避障。
圖8所示的地圖中,1為動(dòng)態(tài)障礙物,2和3為靜態(tài)障礙物。AUV從起點(diǎn)位置(1,1)出發(fā),航行至(4,8),障礙物1由右至左移動(dòng)到其正前方(占據(jù)了(3,9)(4,9)及(5,9)),正好攔住其前進(jìn)路徑,如圖8a)所示。此時(shí)神經(jīng)網(wǎng)絡(luò)隨地圖信息的變化實(shí)時(shí)更新,動(dòng)態(tài)障礙物區(qū)域的神經(jīng)元活性變?yōu)樨?fù)值。按路徑選擇策略,AUV立刻避開該障礙區(qū)域,右拐到達(dá)(5,8),接著繼續(xù)向(6,8)和(7,9)航行,逐漸接近目標(biāo)區(qū)域,安全避開了障礙物,如圖8b)所示。
3.3 未知環(huán)境中的路徑規(guī)劃
在未知的水下環(huán)境中,目標(biāo)物及障礙物的位置和形狀是由AUV的相關(guān)傳感器探測(cè)所得,局部的目標(biāo)物和障礙物的信息,同樣能支持AUV實(shí)現(xiàn)目標(biāo)觀測(cè)及返航的局部路徑規(guī)劃。
水下環(huán)境地圖的初始狀態(tài)首先設(shè)置為“Free”,神經(jīng)網(wǎng)絡(luò)中的所有神經(jīng)元初始激勵(lì)和抑制輸入均設(shè)為0,AUV隨機(jī)尋找下一步路徑。當(dāng)AUV的傳感器探測(cè)到局部的目標(biāo)或者障礙物時(shí),柵格地圖的局部信息和神經(jīng)網(wǎng)絡(luò)的局部輸入同步更新,AUV開始按式(4)規(guī)劃路徑。圖9顯示了AUV從起始位置(1,1)出發(fā),當(dāng)前航行至(6,4)的路徑效果。圖9a)可見地圖更新了在傳感器有限的探測(cè)范圍內(nèi)的部分目標(biāo)物信息,圖9b)顯示被探測(cè)到的局部目標(biāo)物在神經(jīng)網(wǎng)絡(luò)中的活性值處于低谷,而任務(wù)區(qū)域的神經(jīng)元活性值處于高位。隨著地圖信息與神經(jīng)網(wǎng)絡(luò)的實(shí)時(shí)更新,AUV沿著任務(wù)區(qū)域,不斷向前航行,在目標(biāo)物邊緣形成一條觀測(cè)線路,直至任務(wù)完成。當(dāng)AUV完成觀測(cè)任務(wù),最終到達(dá)(2,4)位置,此時(shí)任務(wù)區(qū)域的激勵(lì)全部消失,神經(jīng)元的正活性值逐漸衰減歸零,見圖10。
本文提出了基于生物啟發(fā)神經(jīng)動(dòng)力學(xué)的神經(jīng)網(wǎng)絡(luò)模型,用于解決AUV觀測(cè)水下目標(biāo)的路徑問題。該神經(jīng)網(wǎng)絡(luò)具有無需樣本數(shù)據(jù)訓(xùn)練和學(xué)習(xí)的優(yōu)點(diǎn),其抑制輸入的局部停留和激勵(lì)輸入的全局傳播特性,使得AUV能夠有效避開動(dòng)態(tài)障礙物,實(shí)時(shí)規(guī)劃出滿足任務(wù)需求的路徑。未來的研究工作可將該神經(jīng)網(wǎng)絡(luò)模型拓展到三維,以解決水下空間中的三維路徑規(guī)劃問題。
[1] LIU C, FAN S, LI B, et al. Path planning for autonomous underwater vehicle docking in stationary obstacle environment[C]. Proceedings of OCEANS, Shanghai,2016.
[2] HERNANDEZ J D, VIDAL E, VALLICROSA G, et al. Online path planning for autonomous underwater vehicles in unknown environments[C]. IEEE Conference on Robotics and Automation,2015.
[3] 李曄,姜言清,張國(guó)成,等.考慮幾何約束的AUV回收路徑規(guī)劃[J].機(jī)器人,2015,37(4):478-485.
[4] 溫志文,蔡衛(wèi)軍,楊春武.基于改進(jìn)蟻群算法的UUV三維路徑規(guī)劃方法[J].魚雷技術(shù),2016,24(2):120-125.
[5] URA T, KURIMOTO Y, KONDO H, et al. Observation behavior of an AUV for ship wreck investigation[C].Proceedings of MTS/IEEE OCEANS,2005:2686-2691.
[6] 顏明重,鄧志剛,申雄,等.小型水下機(jī)器人在復(fù)雜水下地形中的目標(biāo)搜尋應(yīng)用[J].船海工程,2012,41(2):174-177.
[7] MAKI T, URA T, SAKAMAKI T. Map based path-planning and guidance scheme of an AUV for inspection of artificial structures[C].Proceedings of MTS/IEEE OCEANS,2009:1-7.
[8] BAGNITSKY A, INZARTSEV A, PAVIN A, et al. Side scan sonar using for underwater cables & pipelines tracking by means of AUV[C].IEEE Symposium on and Workshop on Scientific Use of Submarine Cables and Related Technologies,2011:1-10.
[9] ANDONIAN M, CHYBA M, GRAMMATICO S, et al. Using geometric control to design trajectories for an AUV to map and sample the summit of the Loihi submarine volcano[C]. IEEE/OES Autonomous Underwater Vehicles,2010:191-200.
[10] LUO C M, YANG S X. A bioinspired neural network for real-time concurrent map building and complete coverage robot navigation in unknown environments[J]. IEEE transactions on neural networks,2008,19(7):1 279-1 298.
A Novel Path Planning Algorithm Based on Neurodynamics for Observation of Underwater Structures
YAN Ming-zhonga, HUANG Bing-yib, ZHU Da-qia
(a.Laboratory of Underwater Vehicles and Intelligent Systems; b.School of Information Engineering,Shanghai Maritime University, Shanghai 200015, China)
A novel path planning based on bio-inspired neurodynamics for autonomous underwater vehicles (AUVs) to carry out observation of underwater structures at close range was proposed. The model was topologically expressed in a 2D neural network based on a 2D grid map. In the model, the excitatory and inhibitory inputs to the neurons in the network were generated from the target surroundings of underwater structures and obstacles respectively. Obstacles locally push the AUVs away by negative neural activity in the network, while the AUV was globally attracted through the positive neural activity to reach the target near surroundings of the objects. The AUV choosed its path from the dynamically changing activity landscape of the neural network to continue its observation mission. The simulation results showed that the proposed path planning is effective for AUVs to implement close-range observations of underwater structures with obstacle avoidance in an unknown dynamic underwater environment, and it also can plan the path of the return voyage when missions are completed.
ocean engineering; path planning; bio-inspired neurodynamics; autonomous underwater vehicle
10.3963/j.issn.1671-7953.2017.02.024
2016-08-31
國(guó)家自然科學(xué)基金(51575336)
顏明重(1977—),男,博士,講師
TP183;TP249
A
1671-7953(2017)02-0103-06
修回日期:2016-09-21
研究方向:水下機(jī)器人路徑規(guī)劃與水下視覺技術(shù)