王亞波,張 可,趙恩嬌
(1.武漢第二船舶設(shè)計研究所, 武漢 430060;2.哈爾濱工程大學(xué), 哈爾濱 150001)
隨著海洋裝置技術(shù)的發(fā)展,無人水下航行器(unmanned underwatervehicle,UUV)在民用和軍事領(lǐng)域上發(fā)揮著巨大的作用。在軍事上UUV可以獨立執(zhí)行作戰(zhàn)任務(wù),例如魚雷具有自主航行和制導(dǎo)的能力,可以攻擊敵方的潛艇或者軍艦等高價值目標。民用方面,可以在海底資源探測、水下搜救以及海底目標識別上等具有廣闊的應(yīng)用。UUV在水下航行過程中通過環(huán)境感知系統(tǒng)獲取水下環(huán)境信息,避碰系統(tǒng)接收感知系統(tǒng)獲取的數(shù)據(jù)來規(guī)劃一條避碰路徑,提高了UUV的生存能力[1-2]。由于水下環(huán)境比較復(fù)雜,如果UUV在執(zhí)行任務(wù)的過程中發(fā)生了碰撞,會增加執(zhí)行任務(wù)成本。因此,對UUV的避碰系統(tǒng)展開研究具有重要的工程意義。隨著信息化和智能化的發(fā)展,在UUV的避碰系統(tǒng)中引入智能化算法成為未來的發(fā)展方向。
本文首先介紹了UUV的避碰系統(tǒng)的基本組成和國內(nèi)外研究現(xiàn)狀,重點分析了UUV的環(huán)境感知技術(shù)和避碰智能算法,最后對UUV的避碰系統(tǒng)發(fā)展方向作出了展望。
無人水下航行器智能避碰系統(tǒng)的原理圖如圖1所示。環(huán)境信息感知系統(tǒng)利用傳感器采集周圍環(huán)境的障礙物信息,把采集信息傳入避碰系統(tǒng)中,由避碰系統(tǒng)給出相應(yīng)的執(zhí)行指令,最后由操縱系統(tǒng)完成相應(yīng)的動作。
圖1 無人水下航行器避碰原理圖Fig.1 Schematic diagram of collision avoidance for UUV
在避碰系統(tǒng)中,根據(jù)最近會遇距離(distance to closet point of approach,DCPA)的大小來判斷航行器是否存在碰撞危險,根據(jù)到達最近會遇點的時間(time to closet point of approach,TCPA)來估計危險程度[3]。根據(jù)DCPA和TCPA等因素可以判斷無人水下航行器的危險程度。因此,研究無人水下航行器的碰撞危險度是無人水下航行器避碰系統(tǒng)的發(fā)展方向。
無人水下航行器的避碰問題是一種動態(tài)規(guī)劃問題,由于沒有水下環(huán)境的先驗知識,只能依靠傳感器系統(tǒng)采集水下環(huán)境信息。通過避碰算法來對周圍環(huán)境進行感知的方法相比全局路徑規(guī)劃更具有實用性[4]。傳統(tǒng)的避碰規(guī)劃包括圖像化方法和快速步進法。這2種方法都存在一定的不足,由于水下環(huán)境比較復(fù)雜,航行器感知存在局限性,使得圖像法很難完成避碰任務(wù),針對這一問題,Stentz[5]提出了D*算法,在求解過程中更新避碰成本的參數(shù),解決了復(fù)雜環(huán)境的避碰問題。Feerguson[6]提出了filed D*算法,采取均變分辨率網(wǎng)格來描述航行環(huán)境,降低了算法計算量,但是該方式的代價函數(shù)是線性的,所以適應(yīng)性比較差。文獻[7]在Feerguson的filed D*算法基礎(chǔ)上提出了非線性的代價函數(shù),并將算法應(yīng)用在解決了強海流的動態(tài)環(huán)境中的避碰問題。Philippsen等[8]將Fast Marching(FM)算法用于避碰問題中,FM算法可以實現(xiàn)主動路徑規(guī)劃,具有較高的可靠性,但是存在計算時間長等問題[9]。針對FM計算量大問題,Peter等[10]提出了A*算法,考慮了海流和航行器轉(zhuǎn)彎半徑,有效提取了二維連續(xù)路徑,提高了規(guī)劃的時間。
目前智能避碰算法主要有模糊控制算法、粒子群算法和改進人工勢場算法。模糊控制算法具有良好的魯棒性,但是模糊規(guī)則的設(shè)計依賴于環(huán)境和航行器的特性,導(dǎo)致其泛化能力差。文獻[11]采用自適應(yīng)梯度神經(jīng)模糊算法推理系統(tǒng)解決了無人水下航行器的避碰問題。粒子群算法(particle swarm optimization,PSO)具有搜索速度快和搜索能力強的特點[12]。為提高系統(tǒng)的收斂性能,潘洪悅[13]在粒子群算法中引入遺傳算法的種群共享極值策略。嚴浙平[14]提出了將路徑點導(dǎo)航和PSO相結(jié)合的方法,加快了避碰系統(tǒng)的收斂速度,縮短了航行器避碰的時間。
避碰系統(tǒng)可以利用智能算法實現(xiàn)在水下復(fù)雜環(huán)境下的路徑動態(tài)規(guī)劃。其中,無人水下航行器對周圍環(huán)境的感知是實現(xiàn)避碰系統(tǒng)的基礎(chǔ)。無人水下航行器獲取周圍環(huán)境信息越準確,避開障礙物的成功率越高。下一節(jié)將敘述當(dāng)前主流的環(huán)境信息感知技術(shù)。
環(huán)境感知是指通過傳感器獲取航行器的姿態(tài)和周圍環(huán)境信息,再由通信設(shè)備傳給控制系統(tǒng)做出決策指令的過程。
環(huán)境感知技術(shù)包括主動感知和被動感知。被動感知是航行器利用自身攜帶的傳感器被動接收周圍環(huán)境信息。主動感知則是基于雷達和聲吶傳感器通過發(fā)射信號、收集和處理信號的方式來主動獲取周圍環(huán)境信息的感知方法。
雷達是無人水下航行器中環(huán)境感知系統(tǒng)的重要組成部分。雷達掃描的結(jié)果不僅可以轉(zhuǎn)化為圖像,而且掃描結(jié)果不受外界環(huán)境的影響,可以精確估計出障礙物的位置。本小節(jié)將重點介紹激光雷達、毫米波雷達和航海雷達技術(shù)。
2.2.1基于激光雷達的環(huán)境感知技術(shù)
激光雷達可以獲得更準確的目標信息并具有抗干擾能力強等優(yōu)點。劉冰洋[15]在無人船上搭載激光雷達解決了獲取河底地形難的問題。鄭又能[16]針對水面波紋會對目標識別產(chǎn)生誤差的問題,提出一種將相機和三維激光雷達數(shù)據(jù)融合的目標檢測方法。趙玉梁[17]利用點云梯度分割方法對欄格地圖法進行補充,提出了復(fù)雜水域環(huán)境下的目標識別方法。
三維激光雷達通過多條旋轉(zhuǎn)掃描能夠有效得到障礙物的大體特征,并且測量精度比傳統(tǒng)雷達高。但是光信號受環(huán)境影響很大,面對惡劣天氣下三維激光雷達探測效果不佳。
2.2.2基于毫米波雷達的環(huán)境感知技術(shù)
毫米波雷達是通過發(fā)射毫米波段的電磁波來獲取環(huán)境信息,且比激光雷達更具有穿透力,更容易檢測到有效目標且具有全天候的工作能力[18]。林雨田[19]針對靜態(tài)目標識別使用毫米波雷達會存在目標缺失的問題,使用高斯馬爾科夫模型對毫米波雷達檢測結(jié)果進行標簽數(shù)據(jù),然后結(jié)合高斯聚類方法對目標的標簽數(shù)據(jù)進行預(yù)測,提高了對靜態(tài)目標的精度。
在汽車領(lǐng)域中毫米波雷達應(yīng)用最為廣泛,由于海域環(huán)境比較復(fù)雜,毫米波的探測性能也會受到限制。無人水下航行器使用毫米波探測周圍信息時,需提高毫米波雷達的可靠性。
2.2.3基于航海雷達的環(huán)境感知技術(shù)
航海雷達是雷達中應(yīng)用最為廣泛的一種,技術(shù)已經(jīng)非常成熟。在無人水下航行器中用來定位、探測障礙物和對目標的跟蹤。李立剛等[20]針對海上大型目標,航海雷達容易誤判為多個海上分散目標的問題,提出了一種基于圖像輪廓特征的航海雷達的目標修正方法。面對不同大型目標的同一輪廓,可以進行準確地描述。吳鵬等[21]為了提高對水面上小型目標的感知能力,將航海雷達與光電吊艙結(jié)合起來進行協(xié)同感知,提高了對目標的探測與識別的能力。胡智煥等[22]利用航海雷達在動態(tài)的海洋環(huán)境下進行實時獲取周圍障礙物的位置信息,無人艇的碰撞系統(tǒng)根據(jù)障礙物的位置信息快速做出響應(yīng),最終快速計算出一條無障礙的路徑。在傳統(tǒng)的雷達跟蹤方法中會受到海波的干擾,獲取的位置信息會帶有噪聲,進而導(dǎo)致數(shù)據(jù)存在誤差。高朋舉[23]引入NLM算法對航海雷達獲取的圖像信息進行降噪處理,得到了精度更高的海冰密集度參數(shù)。
激光雷達搜索能力強,但其搜索性能會受到環(huán)境的影響。面對煙霧環(huán)境,毫米波雷達具有更好的穿透力,廣泛應(yīng)用于汽車領(lǐng)域。而航海雷達是雷達技術(shù)應(yīng)用中最成熟的一種。面對水下復(fù)雜環(huán)境,可以結(jié)合不同雷達的優(yōu)勢,從而提高雷達對周圍環(huán)境感知的精度。避碰系統(tǒng)在獲取周圍環(huán)境信息之后會產(chǎn)生相應(yīng)的動作指令,使無人水下航行器完成避障。因此,下一節(jié)將敘述智能避碰算法。
隨著無人水下航行器的智能化發(fā)展,通過引入智能算法來解決傳統(tǒng)無人水下航行器的避碰問題。本節(jié)將介紹模糊控制、粒子算法和改進人工勢場等智能算法在無人水下航行器避碰問題中的應(yīng)用。
由于水下環(huán)境比較復(fù)雜,系統(tǒng)的參數(shù)很難用線性的方程,準確地描述出來,因此,引入模糊控制方法。模糊控制是一種不依賴于被控對象的非線性控制系統(tǒng),適合引入無人水下航行器的避碰系統(tǒng)。該方法是通過模糊化接口使輸入值變成模糊變量并傳入推理機中,推理機結(jié)合數(shù)據(jù)庫和規(guī)則庫得到輸出的模糊值,最后通過解模糊接口得到最終的結(jié)果。模糊算法的原理如圖2所示。
圖2 模糊算法原理Fig.2 Principles of fuzzy algorithms
模糊控制算法的改進主要在模糊分類和模糊推理這兩部分。①模糊分類,選取合適的隸屬函數(shù)可以提高模糊控制算法的性能,是解決智能避碰問題的關(guān)鍵。Hasega-wa[24]用三角形和梯形隸屬函數(shù)來表示模糊變量,實現(xiàn)了輸入值的模糊化。Hara[25]在Hasega-wa的基礎(chǔ)上加入了船員的主觀感受影響,提高了模糊變量分類的準確性。②模糊推理,L.P.Perera在智能避碰系統(tǒng)中采用模糊最大優(yōu)先算法(fuzzy maximum first,FMF)[26]。G.K.Park通過結(jié)合其他智能算法,在避碰模糊推理算法中引入案例推理(case based reasoning,CBR)[27]。
基于模糊控制的無人水下航行器智能避碰方法中的控制量需要以模糊集合為基礎(chǔ),其優(yōu)點是解決推理過程中非確定性問題,但是需要根據(jù)經(jīng)驗法來提前設(shè)定參數(shù)。因此模糊控制的自適應(yīng)性還有待提高。
PSO算法是一種尋找最優(yōu)解的過程,而無人水下航行器的避碰問題也可以被看作成一種尋找路徑最優(yōu)解的過程。粒子算法流程如圖3所示。
圖3 粒子算法原理圖Fig.3 Schematic diagram of particle algorithm
在無人水下航行器中,引入PSO粒子算法可以簡化避碰系統(tǒng),基于PSO算法的避碰系統(tǒng)主要流程分為:① 初始化航行器的位置以及粒子算法的參數(shù);② 根據(jù)初始信息對航行器進行路徑規(guī)劃;③ 評估本航行器與障礙物的避碰風(fēng)險,若存在避碰風(fēng)險則重新進行路徑規(guī)劃來進行避障,若沒有避碰風(fēng)險則繼續(xù)航行;④ 判斷航行器是否到達目的地,若沒有到達目的地則繼續(xù)航行,若到達目的地則流程結(jié)束。具體流程圖如圖4所示。由圖4可知,粒子算法尋優(yōu)能力的好壞決定了避碰系統(tǒng)性能的好壞。為了提高PSO算法的尋優(yōu)能力,許諾[28]進行動態(tài)調(diào)整PSO算法的慣性權(quán)重和認知參數(shù),提高了算法的局部搜索能力。Sun[29]把粒子算法和量子力學(xué)理論相結(jié)合,提出了一種新的離子算法(quantum behavior particle swarm optimization,QPSO)。姚琪[30]研究了粒子凈化的方式和QPSO的原理,提出了一種自適應(yīng)強的粒子分類凈化QPSO算法。郭興海[31]針對海流環(huán)境不穩(wěn)定的避碰問題,引入了混沌圖機制和動態(tài)權(quán)重機制。大大提高了QPSO算法的搜索能力和計算速度。
圖4 基于PSO的無人水下航行器避障系統(tǒng)流程圖Fig.4 Flow chart of obstacle avoid system for UUV based on PSO
以上方法均是通過對PSO算法改進來提高算法的尋優(yōu)能力。由于粒子算法在尋優(yōu)的過程中并未考慮航行器避障系統(tǒng)可靠性以及路徑平滑性問題,從而會導(dǎo)致航行器的航行成本增加。倪生科[32]考慮了航行器的路徑長度、可靠性以及平滑度等因素,結(jié)合了非線性規(guī)劃的方法,提出了一種混合的遺傳算法,考慮到避碰問題中路徑最優(yōu)的問題。除了使用其他智能算法改善航行器路徑可靠性和平滑性之外,可以借鑒粒子算法與滑??刂评碚搧硖岣呦到y(tǒng)的可靠性和抗干擾能力。李沁穎[33]利用粒子優(yōu)化算法獲得滑模控制器的最優(yōu)參數(shù),實現(xiàn)聯(lián)網(wǎng)車隊系統(tǒng)的可靠性以及車隊系統(tǒng)的魯棒性。陳志梅[34]將粒子算法和滑??刂葡嘟Y(jié)合,利用粒子算法優(yōu)化滑??刂期吔上禂?shù),實現(xiàn)了系統(tǒng)狀態(tài)消除抖振現(xiàn)象并且快速到達滑模面,改善系統(tǒng)動態(tài)性能和魯棒性。因此,針對PSO算法對航行器進行避碰存在的規(guī)劃路徑是否最優(yōu)、可靠性以及平滑性等問題,可以設(shè)計一個滑模控制器,采用粒子算法對滑??刂茀?shù)進行優(yōu)化,提高航行器避障系統(tǒng)的魯棒性以及規(guī)劃路徑的平滑性。
在無人水下航行器避碰系統(tǒng)中,引入改進人工勢場法的思想是把無人水下航行器的運動被看作是在人造引力場中運動。在航行的過程中,周圍的障礙物對航行器產(chǎn)生“斥力”,而最終目的地對無人水下航行器產(chǎn)生“引力”,當(dāng)航行器航行路線上存在障礙物時,會收到引力場和斥力場的疊加,最終產(chǎn)生一個使航行器避開障礙物的合力。
當(dāng)目的地對無人水下航行器的引力與障礙物對無人水下航行的斥力相等時,航行器所受合力等于零,此時航行器陷入極小值就無法航行出障礙物區(qū)域,改進人工勢場法就會陷入局部最優(yōu)解。假如障礙物在目的地附近的話,航行器則永遠不能到達目的地。因此,需要考慮如何設(shè)計“引力場”和“斥力場”函數(shù)來避免控制系統(tǒng)陷入局部最優(yōu)解的問題。馬小軒[35]通過設(shè)置距離法和子目標點法來改進傳統(tǒng)人工勢場法,解決了系統(tǒng)容易陷入局部最小值和目標不可達問題。郭凱紅[36]改進斥力場和引力場函數(shù)的參數(shù),解決了無人水下航行器局部路徑規(guī)劃問題。張強[37]提出用滑移區(qū)來代替障礙物產(chǎn)生的斥力場方法,并制定一系列滑移規(guī)則包括(滑移區(qū)判斷、滑移區(qū)方向判別和參數(shù)的選取)。最后在固定海流的環(huán)境下實現(xiàn)水下自主航行器的路徑規(guī)劃。為了提高航行器按照規(guī)劃路徑進行航行的精度,施立煜[38]利用人工勢場法對船舶進行路徑規(guī)劃,將反步思想和積分滑??刂葡嘟Y(jié)合,實現(xiàn)船舶對期望路徑的有效跟蹤并在船舶航行過程中實現(xiàn)了避障。韓麗君[39]利用濾波反步法實現(xiàn)了AUV軌跡跟蹤精度的優(yōu)化。李娟[40]采用濾波反步法設(shè)計控制器,使UUV跟蹤期望路徑。
在無人水下航行器的避碰系統(tǒng)中引入改進人工勢場法,并結(jié)合濾波反步法設(shè)計控制器使航行器來跟蹤期望路徑,提高了無人水下航行器按照規(guī)劃路徑航行的精度。改進人工勢場法使系統(tǒng)結(jié)構(gòu)清晰,規(guī)劃出來的路徑比其他智能算法更平滑。但是改進人工勢場法的缺陷還是很明顯,目前解決陷入局部極小值的方法就是對“引力”和“斥力”函數(shù)進行改進,或與其他智能算法進行結(jié)合。
UUV的環(huán)境感知和路徑規(guī)劃在避碰系統(tǒng)中占重要地位,本文著重介紹了無人水下航行器智能避碰系統(tǒng)中的環(huán)境感知系統(tǒng)和智能避碰方法。通過總結(jié)和分析發(fā)現(xiàn),在實際的海底環(huán)境下,存在渦流和強烈海波的復(fù)雜環(huán)境,傳統(tǒng)的傳感器很難準確描述出環(huán)境信息,進而導(dǎo)致傳統(tǒng)的路徑規(guī)劃算法很難抵消這些強干擾對系統(tǒng)的影響。為了解決上述問題,可以引入學(xué)習(xí)能力更強的深度強化學(xué)習(xí)算法(deep reinforcement learning,DRL),DRL的原理如圖5所示。可以解決當(dāng)環(huán)境感知系統(tǒng)不能準確獲取環(huán)境信息時而導(dǎo)致UUV很難規(guī)劃路徑的問題。例如,DRL算法具有做出自主決策的能力,可以實現(xiàn)對UUV航行環(huán)境的理解并做出最優(yōu)決策。并通過設(shè)計回報函數(shù)來提高DRL的計算速度,提高搜索效率,縮短系統(tǒng)的收斂時間。隨著人工智能算法的不斷更新,未來有望解決UUV環(huán)境先驗知識不足情況下的避碰問題。因此,在UUV避碰系統(tǒng)中應(yīng)用新一代人工智能算法是未來的主要發(fā)展方向。
圖5 基于深度強化學(xué)習(xí)的路徑規(guī)劃Fig.5 Path planning based on deep reinforcement learning