張宏瀚,王亞博,李娟,王元慧,嚴(yán)浙平
(哈爾濱工程大學(xué) 智能科學(xué)與工程學(xué)院, 黑龍江 哈爾濱 150001)
水下無人航行器(unmanned underwater vehicle,UUV)在水下搜救、地形勘探、探測資源等領(lǐng)域有著重要的地位[1],而自主路徑規(guī)劃是UUV的核心技術(shù)之一,其決定著UUV執(zhí)行任務(wù)的效率和安全性[2-3]。無人智能系統(tǒng)的路徑規(guī)劃分為全局路徑規(guī)劃和局部動態(tài)規(guī)劃兩部分,前者基于不完整地圖快速搜尋一條可達(dá)任務(wù)目標(biāo)點(diǎn)的可行路徑[4-9];后者則是利用智能系統(tǒng)的傳感器對周圍環(huán)境的感知及時(shí)避開全局路徑上的未知障礙物[10-11]。然而,近海環(huán)境下大量礁石、人工建筑物以及航行的漁船等因素致使UUV的航行情況變得異常復(fù)雜,對路徑規(guī)劃的要求也相應(yīng)提高[12]。當(dāng)UUV停泊港內(nèi)需執(zhí)行港外近海任務(wù)時(shí),若其具備近海復(fù)雜環(huán)境下的動態(tài)路徑規(guī)劃能力,在抵達(dá)任務(wù)區(qū)域過程中則不需要借助大型漁船及起吊裝置,將極大的節(jié)省人力物力,對完善UUV功能有著重要的工程意義。
針對動態(tài)環(huán)境的路徑規(guī)劃問題,Chowdhury等[13]提出了一種PRM-A*算法,該算法將PRM算法和A*算法聯(lián)合規(guī)劃路徑,解決了路徑不平滑以及動態(tài)障礙物的避碰問題。趙旭等[14]提出了一種改進(jìn)的A*算法,此算法將A*算法的搜索區(qū)域改為UUV可達(dá)的扇形區(qū)域,并且在路徑拓展階段以運(yùn)動學(xué)為約束,實(shí)現(xiàn)了未知環(huán)境的路徑規(guī)劃問題。He等[15]提出了一種改進(jìn)的蟻群算法,引入虛擬可視化概念克服了蟻群只能在相鄰網(wǎng)格行走的限制,使用非線性懲罰機(jī)制避免路徑出現(xiàn)大的轉(zhuǎn)角。李楊等[16]在遇到動態(tài)障礙物時(shí)將人工勢場法與速度障礙法相結(jié)合,根據(jù)障礙物的大小以及運(yùn)動信息使UUV合理避障。
RRT(rapid-exploration random tree)算法由Lavall等[17]提出,被廣泛用于解決路徑規(guī)劃問題,但是RRT算法存在拓展盲目性、路徑冗余度高、路徑不平滑等問題,主要的改進(jìn)方向有增加算法的導(dǎo)向性和提高的路徑可行性[18-20]。劉成菊等[21]提出的RRT改進(jìn)算法在拓展階段以一定概率選擇目標(biāo)點(diǎn),采樣的其他點(diǎn)則增加引力分量使其偏向目標(biāo)點(diǎn),同時(shí)使用路徑緩存策略以及動態(tài)擴(kuò)展策略解決動態(tài)避碰問題。尹高揚(yáng)等[22]在節(jié)點(diǎn)拓展階段添加動力學(xué)約束、航跡距離約以達(dá)到增加路徑的可行性以及縮短距離的作用。上述提出的算法在靜態(tài)環(huán)境下效果較好,但是存在計(jì)算開銷大、不適用于近海環(huán)境存在動態(tài)障礙物的路徑規(guī)劃問題。
為了解決近海復(fù)雜環(huán)境下的動態(tài)路徑規(guī)劃問題,本文提出一種改進(jìn)RRT和動態(tài)窗口法融合的動態(tài)避碰算法AGT-RRT(adaptive guidance target RRT)。首先對RRT算法進(jìn)行改進(jìn)以加快全局路徑的規(guī)劃速度,然后在得到的全局路徑基礎(chǔ)之上,使用自適應(yīng)子節(jié)點(diǎn)選取策略獲取DWA(dynamic window approach)算法的子目標(biāo)點(diǎn),將難以實(shí)現(xiàn)的全局動態(tài)任務(wù)規(guī)劃分解成多個(gè)簡單的動態(tài)規(guī)劃任務(wù),實(shí)現(xiàn)動態(tài)避碰功能的同時(shí)增加DWA算法的導(dǎo)向性。最后,通過仿真驗(yàn)證了算法的有效性。
近海環(huán)境下由于水位較淺,為了簡化系統(tǒng)模型,本文只討論UUV的水平方向運(yùn)動,即UUV的縱蕩、橫蕩、艏搖3個(gè)自由度。
式中:ψ為UUV的艏向角,r、u、v分別為UUV的角速度、橫向線速度、縱向線速度,x、y分別為UUV在水平位置坐標(biāo)。
式中:
其中:m為UUV的自身質(zhì)量,Xu˙、Yv˙、Nr˙為UUV的附加質(zhì)量,τ1、τ3為UUV推進(jìn)器提供的推力以及提供的轉(zhuǎn)向力矩,Jz為轉(zhuǎn)動慣量。
引入文獻(xiàn)[23]中提到的Solstice聲吶模型,該聲吶為多孔徑測掃聲吶,當(dāng)障礙物處于聲吶的200 m范圍內(nèi)可以被其捕捉到,被捕捉到的障礙物和聲吶之間的距離關(guān)系如下:
式中:x0、y0分別為UUV在水平位置坐標(biāo),x、y分別為障礙物在水平位置坐標(biāo),R為聲吶有效工作范圍。
UUV在運(yùn)動過程中由于自身性能影響,存在最大速度、轉(zhuǎn)向角的限制:
式中:Vs為速度對(v,r)的約束范圍,vmin、vmax為UUV速度v的最大最小值,rmin、rmax為r的最大最小值。
本小節(jié)介紹為增加隨機(jī)樹生長的方向性設(shè)計(jì)的自適應(yīng)目標(biāo)引導(dǎo)策略。在任務(wù)空間V中隨機(jī)獲得一個(gè)采樣點(diǎn),首先計(jì)算采樣點(diǎn)與終點(diǎn)之間的距離d,然后將距離d乘以比例因子p得到一個(gè)距離d′,之后將采樣點(diǎn)xrand朝著xrand與xgoal的矢量方向移動d′,得到一個(gè)新的采樣點(diǎn),其計(jì)算公式如下:
這樣此算法不僅使拓展的方向偏向xgoal,而且樹空間T中更加靠近xgoal的節(jié)點(diǎn)被優(yōu)先被選為拓展點(diǎn),加快了算法收斂的速度。
比例因子如果設(shè)置的過大,在復(fù)雜任務(wù)環(huán)境容易陷入局部極小值(見圖1(a)),此時(shí)比例因子為0.3,即使多次迭代也不能擺脫。因此本文采用自適應(yīng)比例因子。在算法開始迭代之前賦予比例因子一個(gè)初始值,然后根據(jù)每次迭代成功或是失敗修改比例因子,以加快收斂速度,防止陷入局部極小值,其計(jì)算公式如下:
圖1 算法改進(jìn)前后對比Fig.1 Comparison chart before and after improvement
迭代成功:
迭代失?。?/p>
式中:nsuccess、nfail分別為成功迭代次數(shù)以及失敗迭代次數(shù),α、β、χ、δ分別為權(quán)重,p0為比例因子p的初始值。改進(jìn)后拓展圖如圖1(b)所示。
觀察算法規(guī)劃過程發(fā)現(xiàn)采樣點(diǎn)遠(yuǎn)大于隨機(jī)樹節(jié)點(diǎn)數(shù)量,這是由于在拓展階段發(fā)生多次碰撞,為了進(jìn)一步加快收斂速度,本文采用避碰策略。
當(dāng)算法發(fā)生碰撞時(shí)不會直接放棄此條路徑而是以朝向的矢量方向?yàn)檩S線向周圍輻射出一個(gè)扇形區(qū)域,在此扇形區(qū)域以一定間隔生成多條路徑,如果其中有無碰路徑,則按照此方向相應(yīng)的進(jìn)行拓展。
在采用轉(zhuǎn)向避碰策略之后如果仍然不能成功拓展則表示此節(jié)點(diǎn)大概率陷入局部極小值,為了逃離局部極小值本文采用重選節(jié)點(diǎn)避碰策略。在拓展的階段放棄作為拓展的隨機(jī)節(jié)點(diǎn),選用之前生成的xrand作為拓展的節(jié)點(diǎn),則使拓展的方向偏離目標(biāo)點(diǎn),可以快速逃離局部極小值。
圖2中給出了避碰策略的有效性,灰色、洋紅色、藍(lán)色曲線分別表示正常拓展、轉(zhuǎn)向避碰策略后拓展、重選節(jié)點(diǎn)避碰策略后的路徑。從圖中可以發(fā)現(xiàn),隨機(jī)樹在發(fā)生碰撞之后可以根據(jù)節(jié)點(diǎn)所處的不同情況選取不同的策略,在隨機(jī)樹朝向目標(biāo)點(diǎn)生長時(shí)如果陷入局部極小值,可以使用設(shè)計(jì)的策略快速逃離,達(dá)到了設(shè)計(jì)的目的。
圖2 避障策略仿真Fig.2 Simulation diagram of obstacle avoidance strategy
本文采用DWA算法實(shí)現(xiàn)局部路徑規(guī)劃,但是DWA算法僅能在窗口大小的范圍內(nèi)規(guī)劃路徑,極易陷入局部最小值。為了解決這個(gè)問題,本文采用自適應(yīng)子節(jié)點(diǎn)選取策略和重規(guī)劃策略。
1) DWA規(guī)劃UUV下一時(shí)刻狀態(tài)方程如下:
式中:x=[xyψvr]T,V為速度對[vr] 。
2)制動距離計(jì)算,當(dāng)制動距離Ddis大于UUV與障礙物的距離則舍棄相應(yīng)的路徑,公式如下:
其中amax為UUV的最大加速度。
3)評價(jià)函數(shù)計(jì)算,評價(jià)函數(shù)主要由艏向角得分、安全距離得分以及速度得分3部分構(gòu)成。為了防止不同評價(jià)體系單差異帶來的異常,對3種評價(jià)體系歸一化處理,具體公式如下:
其中Ei為每條軌跡的參數(shù)。最后可得評價(jià)函數(shù)如下:
其中:e為評價(jià)函數(shù)得分,a、b、c分別為艏向角的分系數(shù)、安全距離的分系數(shù)、速度得分系數(shù)。
在未知路徑彎曲度時(shí),固定距離子節(jié)點(diǎn)易導(dǎo)致DWA算法陷入局部最小值,因此本文提出自適應(yīng)子節(jié)點(diǎn)選取策略。首先,初始長度dinit,在全局路徑上選取距離當(dāng)前位置一個(gè)初始長度的子節(jié)點(diǎn)xchild,之后計(jì)算當(dāng)前位置和子節(jié)點(diǎn)在全局路徑上的距離d1與當(dāng)前位置到子節(jié)點(diǎn)的直線距離d2的比值k,如果比值大于設(shè)置的閾值κ表示全局規(guī)劃的路徑較為曲折,則縮短子節(jié)點(diǎn)的選取距離,直至小于設(shè)置的閾值;如果比值小于設(shè)置的閾值κ則表示路徑較為平滑,則增加子節(jié)點(diǎn)的選取距離,直至大于設(shè)置的閾值。
全局路徑規(guī)劃是基于不完整地圖信息規(guī)劃的路徑,在實(shí)際環(huán)境中可能會出現(xiàn)新的障礙物,當(dāng)障礙物較小使用DWA即可避過障礙物,但是當(dāng)障礙物過大,DWA算法可能會陷入局部極小值導(dǎo)致UUV無法通行。因此本文針對這種情況采用重規(guī)劃策略,當(dāng)DWA算法陷入局部極小值時(shí),則返回主程序中,把雷達(dá)掃描到的障礙物加入到地圖之中,然后以當(dāng)前位置為起點(diǎn)重新規(guī)劃全局路徑,之后再按照之前設(shè)計(jì)的方案進(jìn)行規(guī)劃路徑。
AGT-RRT算法在運(yùn)行時(shí)首先初始化隨機(jī)樹空間,初始化自適應(yīng)比例因子p0為0.32,初始化計(jì)數(shù)器nsuccess、nfail為0,轉(zhuǎn)向避碰策略角度α為30°。在任務(wù)空間獲得采樣點(diǎn)xrand,執(zhí)行目標(biāo)引導(dǎo)策略獲得采樣點(diǎn)。若拓展成功則將其加入隨機(jī)樹空間;失敗則執(zhí)行轉(zhuǎn)向避碰策略獲得采樣點(diǎn)xnew,若其成功拓展則將其加入隨機(jī)樹空間;失敗則執(zhí)行重選節(jié)點(diǎn)策略,采用xrand作為拓展的節(jié)點(diǎn),若其成功拓展則加入隨機(jī)樹空間,失敗則返回第一步在任務(wù)空間重新獲得采樣點(diǎn)。
本文設(shè)計(jì)了map1和map2驗(yàn)證AGT-RRT算法的可行性。將經(jīng)典RRT算法、文獻(xiàn)[11]中提出的AWA_RRT重算法、RRT-Connect算法與本文提出的算法作對比??刂泼糠N算法的參數(shù)一致,步長均為30,AWA-RRT算法權(quán)重的初始值為0.5,AGT-RRT算法比例因子初始值為0.32,map1和map2的大小均為1 000×1 000,起止點(diǎn)為(50,50),目標(biāo)點(diǎn)為(950,950)。由于每次規(guī)劃所需時(shí)間過少,為避免偶然性和便于對比分析,表1、2為1 000次規(guī)劃的總時(shí)間成本,路徑成本以及節(jié)點(diǎn)數(shù)量取1 000次規(guī)劃的平均值。
表1 map1 4種算法仿真數(shù)據(jù)Table 1 Map1 simulation data of four algorithms
圖3給出了4種算法在兩種環(huán)境下的仿真情況。map1環(huán)境較為簡單不存在局部極小值。本文算法可以使用轉(zhuǎn)向避障策略順利躲避障礙物。每次成功的拓展都會提高自適應(yīng)目標(biāo)引導(dǎo)策略比例因子的值,使得下一個(gè)采樣點(diǎn)更加接近目標(biāo)點(diǎn),加快了算法的收斂速度。對比觀察map1中路徑生成過程發(fā)現(xiàn)AGT-RRT算法拓展方向具有較好的引導(dǎo)性,基本沒有冗余節(jié)點(diǎn),達(dá)到了設(shè)計(jì)的目的。
圖3 4種算法在不同環(huán)境的仿真圖Fig.3 Simulation diagrams of four algorithms in different environments
在存在局部極小值的map2中,對比算法增加許多無效拓展,而本文的算法可使用重選節(jié)點(diǎn)避碰策略繞過局部極小值。使用重選節(jié)點(diǎn)避碰策略表示環(huán)境較為復(fù)雜,則會降低自適應(yīng)目標(biāo)引導(dǎo)策略比例因子的值,以增強(qiáng)探索能力。map2中的AGT-RRT算法在應(yīng)對局部極小值,產(chǎn)生的無效拓展較少,證明了設(shè)計(jì)的有效性。
對比表1和表2中數(shù)據(jù)發(fā)現(xiàn),AGT-RRT算法在map1中時(shí)間成本相較于RRT、AWA-RRT、RRT-Connect算法分別減少94.1%、91.3%、72%,路徑成本也分別優(yōu)化了18.1%、4.9%、15%。在環(huán)境更為復(fù)雜的map2中,時(shí)間成本分別減少79%、66.4%、40.8%,路徑成本相較于RRT算法和RRTConnect算法分別減少4.2%、5.4%,但是相較于AWA-RRT算法路徑成本增加了14.3%,節(jié)點(diǎn)數(shù)量減少78%。結(jié)合map2仿真環(huán)境和圖3中路徑觀察可知,這是由于本文算法在遇到障礙物優(yōu)先執(zhí)行轉(zhuǎn)向避障策略,加快算法的收斂速度所致。時(shí)間成本的減少,增加的路徑成本在可接受的范圍。觀察圖4和圖5箱線圖中的數(shù)據(jù)可以發(fā)現(xiàn),所提出的算法有較少的離散點(diǎn),這表明其魯棒性優(yōu)于其他的3種算法,在不同的環(huán)境中有更強(qiáng)的適應(yīng)能力,達(dá)到了設(shè)計(jì)的目的。
表2 map2 4種算法實(shí)驗(yàn)結(jié)果Table 2 Map1 simulation data of four algorithms
圖4 map1 4種算法時(shí)間成本箱線圖Fig.4 Map1 four algorithms time cost boxplot
圖5 map2 4種算法時(shí)間成本箱線圖Fig.5 Map2 four algorithms time cost boxplot
使用AGT-RRT算法生成的路徑距離障礙物太近,轉(zhuǎn)向次數(shù)較多,不滿足實(shí)際路徑規(guī)劃的需求。本文將障礙物膨脹化保證路徑遠(yuǎn)離障礙物,同時(shí)去除冗余節(jié)點(diǎn)減少路徑的轉(zhuǎn)向次數(shù),使生成的路徑更為平滑,處理后的路徑如圖6所示。
圖6 去除冗余節(jié)點(diǎn)路徑(藍(lán)色)Fig.6 Remove redundant node path (blue)
為證明本文所設(shè)計(jì)算法的有效性,使用文獻(xiàn)[24]中所提出算法作對比仿真實(shí)驗(yàn)。動態(tài)路徑規(guī)劃仿真結(jié)果如圖7所示,大小為500 m×500 m。固定變量,兩種算法均采用圖7中藍(lán)色折線作為全局路徑。二者算法參數(shù)見表3,其中d為對比算法特有的偏離函數(shù)權(quán)重,UUV性能參數(shù)見表4。路徑的初始位置為(50,50),終點(diǎn)為(470,470),初始方向角為0。
表3 DWA算法評價(jià)函數(shù)權(quán)重Table 3 Weights of DWA algorithms evaluation function
表4 UUV性能參數(shù)表Table 4 UUV performance parameters
圖7 動態(tài)路徑規(guī)劃仿真結(jié)果Fig.7 Simulation result of dynamic path planning
圖7中洋紅色曲線為動態(tài)規(guī)劃的路徑,其中圖7(a)和圖7(b)為map3和map4的仿真結(jié)果,左圖為對比算法,右圖為本文所設(shè)計(jì)算法。本文算法首先執(zhí)行自適應(yīng)子節(jié)點(diǎn)選取策略,根據(jù)路徑的曲折程度選取DWA算法的子目標(biāo)點(diǎn)。自適應(yīng)子節(jié)點(diǎn)選取策略將完整的動態(tài)規(guī)劃任務(wù)分解為多個(gè)子任務(wù)分別進(jìn)行規(guī)劃,從而降低全局路徑的曲折度對動態(tài)規(guī)劃的影響。
為增加仿真結(jié)果的可靠性,分別對二者進(jìn)行10次仿真實(shí)驗(yàn),取平均值作為結(jié)果,具體數(shù)值見表5。從圖7(a)中可以看出二者均可以較好的參考全局路徑執(zhí)行動態(tài)路徑規(guī)劃任務(wù),通過計(jì)算發(fā)現(xiàn),二者平局路徑長度相差只有1%,但是本文所提出算法規(guī)劃的路徑速度提升了10.4%,具有較大的速度提升,加快了任務(wù)的執(zhí)行速度。
表5 地圖3仿真數(shù)據(jù)Table 5 Map 3 simulation data
在map4中,本文所設(shè)計(jì)的算法借助自適應(yīng)子節(jié)點(diǎn)選取策略可以較好地利用全局路徑進(jìn)行動態(tài)路徑規(guī)劃,而對比算法丟失了全局路徑信息,超出任務(wù)邊界無法抵達(dá)目標(biāo)點(diǎn)。map4 比map3中全局路徑轉(zhuǎn)折角大,任務(wù)目標(biāo)點(diǎn)與航行器當(dāng)前艏向角相差過大,而UUV為大慣性體轉(zhuǎn)向速度較慢,導(dǎo)致對比算法脫離全局路徑,造成最優(yōu)評價(jià)路徑更加偏向任務(wù)目標(biāo)點(diǎn),使得規(guī)劃路徑超出任務(wù)范圍,無法完成近海復(fù)雜環(huán)境中的UUV出港任務(wù),證明了本文算法的優(yōu)越性。
仿真實(shí)驗(yàn)任務(wù)為航行器自主動態(tài)規(guī)劃出港路徑,以抵達(dá)港外任務(wù)區(qū)域。地圖實(shí)際大小為400 m×400 m,像素大小為1 200×1 200,比例為1∶3。
在仿真實(shí)驗(yàn)中,本文采用Bluefin-9型UUV參數(shù)[25],見表4。在使用AGT-RRT規(guī)劃全局路徑時(shí)以UUV最大航速(3 m/s)為一個(gè)步長,DWA規(guī)劃路徑時(shí)取最大航行速度為3 m/s。首先,AGTRRT算法規(guī)劃出一條全局路徑,雖然在狹小空間存在一些無效拓展,但是使用避障策略可輕易擺脫局部極小值,達(dá)到設(shè)計(jì)目的,之后去除初步規(guī)劃全局路徑的冗余節(jié)點(diǎn)。獲得全局路徑之后執(zhí)行動態(tài)路徑規(guī)劃任務(wù),使用自適應(yīng)子節(jié)點(diǎn)選取策略在全局路徑上不斷選取子節(jié)點(diǎn)作為DWA算法的目標(biāo)點(diǎn),將復(fù)雜的路徑規(guī)劃任務(wù)分解成多個(gè)簡單的動態(tài)路徑規(guī)劃任務(wù)。之后DWA算法按照順序依次以生成的子目標(biāo)點(diǎn)作為每階段的目標(biāo)點(diǎn)執(zhí)行動態(tài)路徑規(guī)劃任務(wù),最后獲得出一條符合運(yùn)動學(xué)約束的路徑。
任務(wù)執(zhí)行過程中UUV速度每秒變化曲線以及角速度每秒變化曲線如圖8和圖9所示,可以發(fā)現(xiàn),速度出現(xiàn)的幾次較大變化是由于每當(dāng)DWA算法抵達(dá)目標(biāo)點(diǎn)就會逐漸降低自身速度,保證UUV可以停止在目標(biāo)點(diǎn),最大速度變化率為0.6 m/s2,沒有超過最大加速度;角速度出現(xiàn)較大變化是由于路徑出現(xiàn)較大轉(zhuǎn)角,最大角速度變化率為0.5 rad/s2,沒有超過最大角加速度的范圍??偮窂介L度為421 m,平均速度為1.5 m/s,可以較快完成出港任務(wù)。速度以及角速度的變化在切換子目標(biāo)點(diǎn)以及在較為急促轉(zhuǎn)彎時(shí)變化較為劇烈,其余規(guī)劃時(shí)間變化均較為平緩,符合UUV的運(yùn)動特性,達(dá)到設(shè)計(jì)的要求。
圖8 速度變化率曲線Fig.8 Velocity change rate curve
圖9 角速度變化率曲線Fig.9 Angular velocity change rate curve
為了提高近海環(huán)境特別是港口環(huán)境中UUV自主路徑規(guī)劃的安全性、快速性和動態(tài)避障能力,本文結(jié)合全局和局部路徑規(guī)劃設(shè)計(jì)了一種算法。首先,分析RRT算法存在的不足提出一種AGT-RRT算法。針對RRT的拓展盲目問題提出了自適應(yīng)目標(biāo)引導(dǎo)策略,同時(shí)引入轉(zhuǎn)向機(jī)制提高RRT算法的采樣成功率,進(jìn)一步提高全局路徑規(guī)劃的效率,最后對比仿真實(shí)驗(yàn)驗(yàn)證了算法的有效性。針對DWA算法難以在較為復(fù)雜的環(huán)境實(shí)現(xiàn)動態(tài)規(guī)劃任務(wù),采用自適應(yīng)子節(jié)點(diǎn)選取策略獲取DWA算法的子目標(biāo)點(diǎn),將難以實(shí)現(xiàn)的全局動態(tài)任務(wù)規(guī)劃分解為多個(gè)簡單的動態(tài)規(guī)劃任務(wù),從而實(shí)現(xiàn)復(fù)雜環(huán)境下的動態(tài)路徑規(guī)劃,仿真實(shí)驗(yàn)驗(yàn)證了算法的有效性和實(shí)用性。然而本文算法只能利用當(dāng)前位置及下一個(gè)子目標(biāo)點(diǎn)的信息,無法做到全局信息的利用,導(dǎo)致有些地方路徑較長,速度變化不平滑,對這些問題的處理將是今后的研究工作。