国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進生物啟發(fā)模型的UUV在線避障方法

2019-07-16 06:16磊,杜度,陳
水下無人系統(tǒng)學報 2019年3期
關鍵詞:聲吶柵格障礙物

李 磊,杜 度,陳 科

(海軍研究院,北京,100161)

0 引言

無人水下航行器(unmanned undersea vehicle,UUV)具有能源獨立、自主作業(yè)、隱蔽性好等優(yōu)點,在民用和軍事領域均已獲得廣泛應用。UUV自主航行是其成功完成各種作業(yè)使命的前提保障,是其智能水平和自主能力的重要體現(xiàn)。在復雜未知的海洋環(huán)境中,為保證UUV的安全性,除了規(guī)避靜障礙物,還會面對水下漂浮物和其他水下航行器等運動障礙物帶來的威脅。運動障礙物按運動信息不同,可分為已知運動和未知運動障礙物 2種,對于已知運動障礙物其狀態(tài)可預測,而水下環(huán)境中的運動障礙物常常是突發(fā)的和不可預知的。為此,UUV需要利用探測周圍環(huán)境所得到的信息,在線實時規(guī)劃路徑,以便在UUV遇到運動障礙物時能夠迅速決策和反應。在線實時避障能力的強弱代表了 UUV的自主化、智能化水平的高低,一直以來都是 UUV自主航行亟待解決的關鍵技術之一。

文中采用柵格地圖來構建復雜的海洋環(huán)境。柵格地圖推理簡單,應用方便,但在地圖的構建中,環(huán)境分辨率與環(huán)境信息存儲量存在矛盾。UUV對大范圍海洋環(huán)境建圖時,時間和空間開銷急劇增加,使 UUV有限的存儲處理能力面臨嚴峻的考驗,降低了UUV與環(huán)境的交互性[1]。因此,針對UUV長航程自主航海任務,在保證高精度環(huán)境前提下,減小建圖的空間和時間開銷,是一個亟需解決的問題。針對此,郭利進[2]提出基于四叉樹模型的自適應柵格地圖,可根據(jù)環(huán)境中不同區(qū)域的障礙物密度變化,采用不同大小的柵格建立環(huán)境地圖,從而減少部分存儲空間。馬兆青等[3]提出裁剪低利用率柵格的地圖優(yōu)化策略,刪去落后于車體且與窗口中心的距離大于一定值的柵格,但缺乏對柵格的更新處理機制。為彌補聲吶傳感器鏡面反射的不足,王棟耀等[4]對環(huán)境感知采用了活動窗口的概念,當環(huán)境信息未知時,航行參考只能依賴前方一定范圍內的傳感器感知空間,命名此空間為活動窗口,利用當前和歷史的聲吶數(shù)據(jù)對活動窗口中的障礙物進行感知,可獲得較為豐富的環(huán)境信息,但對歷史數(shù)據(jù)和新障礙數(shù)據(jù)缺乏融合,影響障礙物信息的精度。

生物啟發(fā)是一種模擬鳥類遷徙、人類進化、某種生物的行為和結構特點來處理另一種具有相似發(fā)展趨勢的算法[5]。通過模擬動物的反應式行為的避障策略,根據(jù)動物遇到天敵時的逃跑行為,秦政等[6]提出了一種反應式的避障算法,使UUV具有迅速的實時反應能力。但該算法僅面向于UUV靜態(tài)障礙物的避障,應用具有局限性。孫兵等[7]將生物啟發(fā)模型應用到 UUV的軌跡跟蹤中,增加了 UUV運動過程中的穩(wěn)定性。朱大奇等[8]針對 AUV航行過程中存在速度跳變的問題,將受生物啟發(fā)的動力學模型運用到三維軌跡跟蹤控制算法中。Yang等[9]利用生物啟發(fā)神經網絡模型的無學習、自適應特性,將生物啟發(fā)神經網絡模型[10]應用到地面移動機器人路徑規(guī)劃中,提高了路徑規(guī)劃的實時性。在此基礎上,該方法被進一步應用到地面移動機器人的全覆蓋路徑規(guī)劃[11]以及環(huán)境未知與地圖構建[12]中。Li等[13]提出了一種基于生物啟發(fā)模型的算法用來解決多個移動機器人同時存在一定環(huán)境區(qū)域的路徑規(guī)劃問題。上述研究均為生物啟發(fā)式模型應用于機器人路徑規(guī)劃,以實現(xiàn)機器人的實時避障。但研究環(huán)境大多為已知,無法處理未知障礙物出現(xiàn)的情況。

文中對前視聲吶傳感器探測障礙物的過程、信息的獲取及處理不做研究。假設 UUV可以通過前視聲吶獲得障礙物的位置及運動狀態(tài),采用預測控制滾動優(yōu)化原理,以各種障礙物的信息為基礎,采用滾動柵格法對未知環(huán)境進行實時建模,將所得的滾動柵格地圖一一對應為神經網絡拓撲結構圖,然后根據(jù)UUV的實際航行狀態(tài),設計了改進的生物啟發(fā)模型對UUV進行實時路徑規(guī)劃,使得 UUV沿規(guī)劃好的路徑運動,從而實現(xiàn)了UUV在線、快速和安全避障。

1 基于滾動占有柵格地圖的環(huán)境建模

滾動占有柵格地圖(rolling occupancy grid map,ROGM)是一個由M×N(M,N為奇數(shù),反映了局部地圖的尺寸)個柵格組成的矩形區(qū)域,跟隨 UUV的移動而不斷更新柵格狀態(tài),柵格大小為邊長Lg的正方形,如圖 1中所示。UUV的滾動占有柵格地圖可表示為

式 中:i=1,2,…,M;j=1,2,…,N;Ci,j表 示 第i行,第j列的柵格,里面存儲有占有狀態(tài)概率其中心柵格為可簡寫為Ccenter;Xm是Ccenter在 UUV工作空間上的中心位置坐標。

在ΩM中,Ci,j在UUV工作空間上的中心位置坐標X(Ci,j)可根據(jù)Xm來計算,即

圖1 滾動占有柵格地圖Fig.1 Rolling occupancy grid map(ROGM)

下文將從ROGM的初始化、位置移動及柵格狀態(tài)更新幾個方面對其進行詳細描述,對實時環(huán)境進行動態(tài)建模。

1.1 ROGM初始化

ROGM 的初始化包括地圖中心的初始化和所有柵格占有概率的初始化2部分。文中將中心位置設定在UUV的起始位置。在起始時刻t0,設UUV的起始位置是Xr(t0),將Xr(t0)設為ROGM的中心,即Xm=Xr(t0)。根據(jù)占有柵格原理,在完全未知環(huán)境下,各柵格的初始占有概率設為0.5。

1.2 ROGM位置移動

為了減少更新次數(shù)和保證環(huán)境信息的精確性,ROGM采用間歇移動方式。其發(fā)生移動的條件為

式中,Dcha為ROGM的移動判斷距離,與UUV的最大運動能力和人為設定的調整時間有關。UUV速度一定時,Dcha決定了 ROGM 的移動速度,Dcha越大,移動越慢;Dcha越小,則移動越快。

在滿足移動條件時,ROGM移動,并經移動將舊地圖ΩM變?yōu)樾碌貓D。移動過程中,ΩM上的一部分柵格轉移到Ω′上,柵格狀態(tài)得以保留,只是改變了其下標,即在Ω′中的相對位置發(fā)生改變,稱為留存柵格。而ΩM中的一部分柵格狀態(tài)由于不能包含在Ω′中而被刪除,稱為遺棄柵格。相應的Ω′也開拓了一些新柵格,稱為新拓柵格。ROGM移動時,不同柵格的狀態(tài)變化如下:對于留存柵格,對于新拓柵格,其柵格狀態(tài)設為未知狀態(tài);而遺棄柵格在移動后的地圖上沒有體現(xiàn),其概率狀態(tài)被刪除。

1.3 ROGM的柵格更新

在地圖2次相鄰移動的時間段內,ΩM的地圖中心和其他柵格的空間位置不變,只是柵格的占有概率根據(jù)獲取的聲吶信息實時更新。為解決聲吶信息沖突問題,并獲得高精度的柵格地圖,需對聲吶不同的波束信息進行數(shù)據(jù)融合。考慮柵格Ci,先驗概率為基于歷史聲吶觀測值當前柵格占有概率為給定新的聲吶觀測值rt+1,根據(jù)分區(qū)域聲吶模型,可得柵格在最新觀測值下的占有概率當前柵格狀態(tài)概率做為一個先驗概率由ROGM中提取,根據(jù) Bayes理論,通過與最新的測量值融合,柵格占有概率可被更新為得到最新的柵格占有概率存儲在柵格地圖中。

滾動柵格地圖的動態(tài)建模是將前視聲吶傳感器探測到的障礙物信息融合到環(huán)境模型中以及根據(jù)柵格中心單元與UUV的實際位置距離進行滾動柵格地圖的位置更新的過程,以柵格單元的狀態(tài)來表示障礙物信息,為 UUV動態(tài)避障提供了基礎。

2 生物神經網絡構建

假設整個生物膜上所具有的膜電位為Vm,膜電容為Cm;設定鉀離子、鈉離子及負電流所對應的靜息電位分別為Ek、ENa和Ep;鉀離子、鈉離子及負電流所相應的電導為gk、gNa和gp。則膜上電位可表示為[10]

設計意圖: 學生作為國家未來的棟梁,社會責任意識不可缺,通過對艾滋病在全球、全國發(fā)病的現(xiàn)狀分析,使學生對艾滋病有更多的了解,同時認識到艾滋病發(fā)展的嚴峻形勢和每個公民的責任和義務,在課堂上潤物細無聲地滲透責任意識,鼓勵學生用自己的專業(yè)知識為社會奉獻自己的力量,培養(yǎng)學生責任意識。

通過處理可得以下形式的生物啟發(fā)模型

式中:興奮性輸入f(ei)=max(ei,0);抑制性輸入g(ei)=min(ei,0)。

在有興奮性輸入時,神經元的活性值是趨于增長的;有抑制性輸入時,其活性值趨于遞減。針對神經元活性值的這種變化,將障礙物在滾動柵格地圖中的狀態(tài)信息作為抑制性輸入,把在線避障目標點在滾動柵格地圖中對應的柵格單元的狀態(tài)當做模型的興奮性輸入來不斷調節(jié)神經元的活性值,根據(jù)不同時刻下整個活性輸出值分布情況進行UUV在線實時避障。

3 生物膜神經網絡與柵格地圖的關聯(lián)

通過以上方法,將 UUV實時在線探測的環(huán)境狀態(tài)離散化為滾動柵格地圖。將每個柵格單元看作是一個神經元,滾動柵格地圖中的所有柵格單元與神經元一一對應,又因為相鄰神經元存在橫向聯(lián)系,形成神經網絡拓撲圖,如圖2所示。

圖2 神經網絡拓撲結構Fig.2 Topology of neural network

在每一時刻 UUV都會占據(jù)神經網絡拓撲圖中的一個神經元(對應一個具體柵格單元),其相鄰的神經元為 UUV下一時刻可選的位置,具體航行位置取決于相鄰神經元活性值大小,最大活性值的神經元(柵格)即表示UUV航行方向。圖中:Wij為第i個神經元和第j個神經元間的連接權值,其值通常是一個衰減函數(shù);R為一個區(qū)域半徑。

由式(6)以及神經元之間的關系,可進一步得出第i個神經元活性值對應的微分方程

式中,xi為第i個神經元的活性值。

4 改進的生物膜神經網絡路徑規(guī)劃算法

假設當前時刻 UUV位于柵格單元為Xk,該柵格所對應的神經元為cell[i][j],通過計算其周圍神經元活性值的大小,找出活性輸出值最大所對應的神經元,設其對應的柵格單元為Xk+1,即Xk+1為下一時刻UUV駛向的柵格單元。

為此,將在柵格單元Xk+1內取N個位置點。Xk,i,Xk+1,j分別是Xk和Xk+1內的隨機采樣點,假設Xk,i是UUV在柵格單元Xk的具體位置,那么UUV下一時刻航向的具體位置為柵格單元Xk+1內的Xk+1,j,j=1,2,3,…,N中的一點。

Xk+1到Xk+1,j的移動代價函數(shù)可定義為

Xk+1到Xk+1,j的 航 向為φi=∠ (Xk+1,j-Xk,i),眾所周知,艏向變化越大時,UUV所進行的操作越復雜,即UUV運動到該位置的可能性越小,根據(jù)UUV的艏向限制條件可設計艏向代價函數(shù)

定義判定函數(shù)

式中,λ1,λ2為權重系數(shù),且λ1+λ2=1,文中取λ1=0.25,λ2=0.75。

比較 UUV在N個采樣值范圍內的判定函數(shù)P(Xk,i,Xk+1,j),j=1,2,3,…,N,若j=n時判定函數(shù)最大,那么 UUV 下一時刻的具有航向位置為Xk+1,n。

綜上,文中將 UUV的避障規(guī)劃問題轉變成搜索UUV下一個航行位置的問題。

5 仿真驗證

下面將從2個方面對文中的在線路徑規(guī)劃進行仿真。仿真1為對ROGM進行的建模仿真,驗證實時建模的正確性。仿真2是基于改進生物啟發(fā)算法的避障過程,以驗證該算法的有效性。

5.1 ROGM建模仿真

設定柵格邊長為Lg=5m,取Rdet=150m,Rdec=150 m,Tv=15s,umax=3m/s,則移動判別距離可選為Dcha=45 m。可取M=71,N=71,最終得 ROGM的大小為 (35 5×355)m2。為了描述聲吶的感知誤差,每次探測對每個波束返回的距離值都附加一個隨機誤差值,距離誤差值服從標準方差為5 m的正態(tài)分布。以某障礙環(huán)境進行仿真驗證,UUV從起點(400,600)m航行到目標點(0,1 000)m,環(huán)境大小 (70 0×700)m2,環(huán)境中分布有2個多邊形障礙物。

圖3為UUV運行120 s時形成的路徑。在t=120 s時,根據(jù)移動判別條件,ROGM經過7次移動,其中心變?yōu)?185,835)m。通過比較,柵格占有概率的分布符合環(huán)境特征。ROGM的總柵格數(shù)為 (355/5)2=5041,如果建立全局柵格地圖,需要的柵格數(shù)為 (700/5)2=19600,可看出 ROGM大大節(jié)省了地圖存儲空間,其提供的環(huán)境信息精度較高,可滿足UUV實時避障決策的需要。

圖3 ROGM構建仿真結果Fig.3 Simulation results of ROGM

5.2 基于改進生物啟發(fā)算法的實時避障仿真

為驗證所設計的動態(tài)避障方法的有效性及正確性,下面設計仿真案例進行動態(tài)避障仿真。障礙物位置和運動信息未知,采用前視聲吶作為避障感知設備。取運動參數(shù)由于前視聲吶探測范圍和距離有限,檢測算法對從UUV后面過來的動障礙物無法識別,因此假設環(huán)境中不存在從UUV后方過來的障礙物。靜障礙物的外形為多變形,為簡便計算,動障礙物設為矩形,動障礙物的最小外接圓的直徑等于矩形的對角線長度。UUV從起點(0,0)航行到終點(450,450)m,起始航向45°。

圖4 動態(tài)避障結果示意圖Fig.4 Schematic diagram of dynamic obstacle avoidance

圖5 不同階段UUV動態(tài)避障效果示意圖Fig.5 Schematic diagram of a UUV's dynamic obstacle avoidance in different phases

由圖中可看出,UUV在感知到障礙物后,迅速更新滾動優(yōu)化地圖,進行實時在線規(guī)劃航跡,UUV通過對航跡的跟蹤,實現(xiàn)對障礙物的躲避。試驗結果驗證了 UUV可安全規(guī)避動靜障礙物,對動態(tài)復雜環(huán)境有很強的適應性。

6 結束語

文中針對 UUV在未知環(huán)境自主航行中的障礙物躲避問題,提出一種改進的生物啟發(fā)式算法,致力于實現(xiàn)UUV的在線實時路徑規(guī)劃。首先,根據(jù)前視聲吶傳感器獲得的 UUV周圍環(huán)境信息采用ROGM進行在線環(huán)境建模;然后,使用文中提出的基于改進生物啟發(fā)模型的在線避障方法,并依據(jù)避障檢測機制,實現(xiàn)UUV實時在線避障;最后,設計了復雜環(huán)境中障礙物避障的在線路徑規(guī)劃仿真試驗,驗證了方法的可行性。該算法對UUV的計算能力要求較高,目前正處于理論研究階段,下一階段計劃將其應用于 UUV的實時避障當中。

猜你喜歡
聲吶柵格障礙物
空投聲吶浮標空中運動軌跡研究
柵格環(huán)境下基于開闊視野蟻群的機器人路徑規(guī)劃
超聲速柵格舵/彈身干擾特性數(shù)值模擬與試驗研究
一種基于方位估計的雙站被動聲吶航跡關聯(lián)方法
一種面向潛艇管系自動布局的環(huán)境建模方法
高低翻越
趕飛機
航母中程反潛區(qū)聲吶艦對潛警戒能力分析
月亮為什么會有圓缺
反恐防暴機器人運動控制系統(tǒng)設計
通许县| 龙江县| 康定县| 三河市| 衢州市| 清水河县| 读书| 洞头县| 璧山县| 三河市| 怀宁县| 烟台市| 蒙自县| 阿拉尔市| 泰安市| 祥云县| 云南省| 兴仁县| 河东区| 疏勒县| 苍溪县| 登封市| 山东省| 南开区| 青海省| 怀集县| 余干县| 巴林右旗| 皮山县| 黄石市| 襄樊市| 莎车县| 三门峡市| 永寿县| 泊头市| 巩义市| 普宁市| 镇远县| 从江县| 东莞市| 高安市|