楊 航,寧 芊,周新志
(1.四川大學(xué)電子信息學(xué)院,成都 610065;2.電子信息控制重點(diǎn)實(shí)驗(yàn)室,成都 610036)
近年來(lái)無(wú)人機(jī)技術(shù)的蓬勃發(fā)展,讓無(wú)人機(jī)在偵查、壓制、進(jìn)攻等任務(wù)方面展現(xiàn)出了獨(dú)特的優(yōu)勢(shì)。而無(wú)人機(jī)的路徑規(guī)劃,則是無(wú)人機(jī)技術(shù)的重要組成部分。它是指平臺(tái)在敵方雷達(dá)、地形、任務(wù)等約束條件下,搜索出一條從起點(diǎn)出發(fā),能夠完成任務(wù)并且保證自身生存的最優(yōu)或者次優(yōu)路徑。然而因?yàn)闊o(wú)人機(jī)面對(duì)的戰(zhàn)場(chǎng)態(tài)勢(shì)非常復(fù)雜,約束眾多而且考慮約束相互之間可能的影響,同時(shí)還可能面對(duì)路徑中出現(xiàn)的突發(fā)威脅,在處理這些問(wèn)題的時(shí)候就會(huì)遇到較大的困難。
針對(duì)這些問(wèn)題,國(guó)內(nèi)外的研究人員進(jìn)行了大量的工作。文獻(xiàn)[1]采用了一種電荷法的處理方法,使得進(jìn)入突發(fā)威脅區(qū)域時(shí)根據(jù)斥力讓航線遠(yuǎn)離威脅。文獻(xiàn)[2-3]將靜態(tài)規(guī)劃與實(shí)時(shí)規(guī)劃結(jié)合起來(lái),遇到突發(fā)則用實(shí)時(shí)規(guī)劃的一小段路徑替換掉靜態(tài)規(guī)劃的路徑。但是這些方法都無(wú)法將路徑中任務(wù)完成的情況以及無(wú)人機(jī)的生存狀況實(shí)時(shí)地記錄和展現(xiàn)。粒子群算法是一種新型的元啟發(fā)式算法,概念簡(jiǎn)單易懂并且容易實(shí)現(xiàn)。
本文采用粒子群算法來(lái)進(jìn)行路徑實(shí)時(shí)規(guī)劃,并且加入八狀態(tài)馬爾科夫聯(lián)合模型[4],在飛行的過(guò)程中動(dòng)態(tài)獲取任務(wù)完成情況與飛機(jī)生存情況,從而評(píng)估任務(wù)與生存代價(jià),并據(jù)此對(duì)下一步路徑進(jìn)行規(guī)劃,最后利用Matlab 進(jìn)行仿真,證明了方法的可行性。
為了能夠直截了當(dāng)?shù)卣莆諢o(wú)人機(jī)在飛行過(guò)程中的具體生存概率情況,將文獻(xiàn)[5]中提到的8 種狀態(tài)的馬爾科夫模型與文獻(xiàn)[6]中的狀態(tài)轉(zhuǎn)移與代價(jià)的計(jì)算方式引入,并在此基礎(chǔ)上加以修改以便配合粒子群算法搜索。
生存性模型由兩個(gè)子模型組成,即跟蹤模型(上)和火力模型(下),如圖1 所示。兩個(gè)子模型之間是連接的,因?yàn)閿橙讼蝻w機(jī)發(fā)射武器的概率與飛機(jī)處于被敵方雷達(dá)識(shí)別(Identified)狀態(tài)的概率有關(guān)。兩個(gè)相鄰的狀態(tài)可以以一定的轉(zhuǎn)移強(qiáng)度互相轉(zhuǎn)化。
跟蹤子模型是一個(gè)時(shí)間連續(xù)模型,一共有4 種狀態(tài):未檢測(cè)(Undetected),檢測(cè)(Detected),跟蹤(Tracked)與識(shí)別(Identified)。敵方雷達(dá)對(duì)飛機(jī)的探測(cè)可以看作是一個(gè)隨機(jī)過(guò)程,狀態(tài)之間發(fā)生怎樣的轉(zhuǎn)換取決于飛機(jī)是否在雷達(dá)區(qū)域內(nèi)。當(dāng)飛機(jī)進(jìn)入雷達(dá)區(qū)域時(shí),它將逐漸轉(zhuǎn)移到檢測(cè)(D)狀態(tài),繼續(xù)在雷達(dá)區(qū)域飛行一段時(shí)間后,敵方便可以跟蹤(T)飛機(jī),開(kāi)始為發(fā)射武器做準(zhǔn)備。最后,飛機(jī)將處于被識(shí)別(I)為打擊目標(biāo)的狀態(tài)。因此,當(dāng)飛機(jī)停留在雷達(dá)區(qū)域內(nèi)時(shí),該過(guò)程可以向圖1 中右側(cè)的狀態(tài)傳輸。另一方面,如果飛機(jī)離開(kāi)雷達(dá)區(qū)域,敵人逐漸失去對(duì)飛機(jī)的檢測(cè),直到飛機(jī)再次處于未檢測(cè)狀態(tài)(U),也就是說(shuō),當(dāng)飛機(jī)在雷達(dá)區(qū)域之外時(shí),該過(guò)程僅在圖1中向左側(cè)過(guò)渡。
1.2.1 跟蹤模型的轉(zhuǎn)移強(qiáng)度
強(qiáng)度矩陣以單位時(shí)間為分段而發(fā)生改變:
當(dāng)雷達(dá)范圍過(guò)大時(shí),如果雷達(dá)區(qū)域內(nèi)每一點(diǎn)的轉(zhuǎn)移強(qiáng)度相同,那么就會(huì)出現(xiàn)一個(gè)問(wèn)題:在雷達(dá)區(qū)域內(nèi)部飛機(jī)的航線會(huì)呈現(xiàn)出一條直線。為了在內(nèi)部區(qū)域無(wú)人機(jī)也能較為精確地規(guī)劃路徑,假定離雷達(dá)中心越近,轉(zhuǎn)移強(qiáng)度就越大。設(shè)定o,s分別為雷達(dá)區(qū)域外部與內(nèi)部的轉(zhuǎn)移強(qiáng)度的最大值,雷達(dá)范圍內(nèi)的轉(zhuǎn)移強(qiáng)度與飛機(jī)離雷達(dá)中心的距離有關(guān):
其中,r 為雷達(dá)區(qū)域的半徑,d 為飛機(jī)到雷達(dá)中心區(qū)域的空間距離。用PT(tn)向量來(lái)描述tn時(shí)刻跟蹤模型的各狀態(tài)概率,可以用下面的公式遞歸計(jì)算:
其中,指數(shù)矩陣eΔ定義為:
在一開(kāi)始,飛機(jī)必然處于未檢測(cè)(U)狀態(tài),所以PT(tn)的初始值設(shè)置為(1,0,0,0)。
1.2.2 重疊區(qū)域的處理
實(shí)際情況中為了確保安全,雷達(dá)區(qū)域可能會(huì)重疊。假設(shè)每個(gè)雷達(dá)能夠獨(dú)立地探測(cè)和跟蹤飛機(jī),那么在一個(gè)由多個(gè)雷達(dá)覆蓋的區(qū)域的強(qiáng)度是單個(gè)強(qiáng)度的總和。例如假設(shè)兩個(gè)傳感器的相同,這意味著:
因此,轉(zhuǎn)移前預(yù)期時(shí)間是單個(gè)預(yù)期時(shí)間的一半。
火力模型是一個(gè)時(shí)間離散模型,4 種狀態(tài)為:無(wú)傷害(Unharmed)、開(kāi)火(Fire)、失誤(Miss)和命中(Hit)。這個(gè)過(guò)程從無(wú)傷害狀態(tài)(UH)開(kāi)始,只要飛機(jī)遠(yuǎn)離所有的武器范圍,它就會(huì)保持在這個(gè)狀態(tài)。然而,如果敵方武器已經(jīng)發(fā)射出,這個(gè)轉(zhuǎn)移將被立即轉(zhuǎn)移到下一個(gè)狀態(tài)。開(kāi)火狀態(tài)(F)是一個(gè)臨時(shí)狀態(tài)。飛機(jī)將不會(huì)長(zhǎng)時(shí)間停留在這個(gè)狀態(tài)中,而是會(huì)進(jìn)一步轉(zhuǎn)移到命中(H)或失誤(M)狀態(tài)。一個(gè)發(fā)射后的武器最終將以pkill的概率擊中飛機(jī),所以導(dǎo)彈從武器到飛機(jī)的飛行時(shí)間在本模型中不予考慮。在上一次開(kāi)火的結(jié)果未出來(lái)之前,敵方也不會(huì)進(jìn)行新一次開(kāi)火。在這一工作中,假定飛機(jī)以一定時(shí)間為間隔進(jìn)行傷害情況評(píng)估。每個(gè)武器系統(tǒng)也只能是飛機(jī)在武器射程內(nèi)時(shí)以一定時(shí)間為間隔進(jìn)行發(fā)射,而更復(fù)雜的傷害情況評(píng)估模型將留給未來(lái)的工作。
1.3.1 火力模型的轉(zhuǎn)移概率
火力模型中狀態(tài)的轉(zhuǎn)移是一個(gè)離散時(shí)間的馬爾科夫模型,所以此子模型以概率來(lái)轉(zhuǎn)移,而不是用強(qiáng)度,tk時(shí)間的轉(zhuǎn)移矩陣Λ(tk)用以下公式描述:
此外,當(dāng)飛機(jī)離開(kāi)武器攻擊范圍的時(shí)候,開(kāi)火(F)與失誤(M)這兩種狀態(tài)都將轉(zhuǎn)移到無(wú)傷害(UH)狀態(tài),而命中(H)狀態(tài)則不會(huì)再改變。
1.3.2 pfire與pkill
武器開(kāi)火的概率pfire取決于許多因素,在此將問(wèn)題簡(jiǎn)化,使用以下方法計(jì)算:
pi是當(dāng)前時(shí)刻跟蹤模型里計(jì)算出的飛機(jī)處于被敵方雷達(dá)識(shí)別狀態(tài)(Identify)的概率,TV(Threat Value)是指對(duì)敵方的威脅值,為了估計(jì)威脅值,需要評(píng)估飛機(jī)的接近性、能力和意圖等因素。盡管威脅值不完全由飛機(jī)與武器的距離決定,但如果飛機(jī)離武器越近,威脅值也必然會(huì)更大。這里使用的評(píng)估方法是基于文獻(xiàn)[7]中提出的威脅評(píng)估的貝葉斯網(wǎng)絡(luò),這是一種比較簡(jiǎn)單的方法。該網(wǎng)絡(luò)的輸入是飛機(jī)與武器之間的距離,這是由5 個(gè)層次描述的:
文獻(xiàn)[8]中也提出了一些更復(fù)雜的計(jì)算威脅值的方法,如果為了避免過(guò)于復(fù)雜地計(jì)算TV,也可以指定TV=x,x 為任一確定的值。pkill則是指在導(dǎo)彈已經(jīng)發(fā)射的情況下?lián)糁酗w機(jī)的概率。由于武器的性能通常是保密的,所以在此可以采用一種簡(jiǎn)單的模型,將pkill在整個(gè)過(guò)程中設(shè)定為一個(gè)恒定值。
粒子群算法是一種基于群體的元啟發(fā)式算法,近年來(lái)已經(jīng)被實(shí)驗(yàn)證明了其效果,并且在各種領(lǐng)域得到了相當(dāng)廣泛的應(yīng)用。與其他智能算法類似,PSO算法也是通過(guò)個(gè)體之間的競(jìng)爭(zhēng)選擇而實(shí)現(xiàn)最優(yōu)解。
在PSO 中,整個(gè)空間的每一個(gè)個(gè)體都是求解問(wèn)題的一個(gè)解。在N 維解空間里,有M 個(gè)粒子組成的初始種群Z=(z1z2… zM),第i 個(gè)粒子的位置信息用向量Xi=(xi1xi2… xiN)描述,這個(gè)粒子的運(yùn)動(dòng)速度信息則可以用下面的向量描述[9-11]Vi=(vi1vi2… viN)。每一個(gè)粒子在解空間迭代搜索,并且通過(guò)適應(yīng)度函數(shù)的值來(lái)判斷解的優(yōu)劣,關(guān)于適應(yīng)度函數(shù)的選取將在下一節(jié)中進(jìn)行詳解。在每一次搜索過(guò)程中,通過(guò)兩個(gè)最優(yōu)值來(lái)更新粒子的位置信息,一個(gè)是粒子自身的歷史最優(yōu)值B,一個(gè)是整個(gè)種群中的歷史最優(yōu)粒子值G。然后根據(jù)本公式來(lái)迭代更新第i 個(gè)粒子的速度與位置:
在這里要強(qiáng)調(diào)公式中參數(shù)的選取,不當(dāng)?shù)膮?shù)將影響算法收斂速度甚至不能收斂。其中w 為慣性權(quán)重,代表了全局搜索能力,如果w 為0,則粒子會(huì)失去記憶性將收斂于目前的最佳位置。c1代表了粒子的認(rèn)知能力,如果這一部分為0,在粒子之間的作用下也可以收斂,甚至速度更快,但容易出現(xiàn)局部收斂的問(wèn)題。c2代表粒子的社會(huì)能力,即與種群中其他粒子的交互關(guān)系,如果它為0,那么種群中的粒子將失去相互之間的聯(lián)系而自行搜索,這樣很難尋求到整個(gè)問(wèn)題的最優(yōu)解。
在粒子群算法中通常由適應(yīng)度函數(shù)來(lái)描述一個(gè)粒子的好壞[12-13],在本文中為了權(quán)衡任務(wù)完成度與飛機(jī)生存性等元素,令適應(yīng)度函數(shù)由下式給出:
w 分別為各項(xiàng)的權(quán)重,Ctotal越小說(shuō)明航路的整體代價(jià)越小,粒子也越接近最優(yōu)值。接下來(lái)分別對(duì)每一項(xiàng)約束進(jìn)行說(shuō)明:
其中,F(xiàn) 用于求點(diǎn)到直線的距離,Xk是當(dāng)前粒子的位置,Lreference為2.2.2 節(jié)中將要提到的預(yù)規(guī)劃路徑。
3)Cheight是高度約束的代價(jià),CPH為高度懲罰代價(jià),Hmin,Hmax分別為最低和最高飛行高度。
4)Coil是油量的代價(jià),本文將從當(dāng)前位置垂直飛向預(yù)規(guī)劃航路,然后沿著預(yù)規(guī)劃航路,把剩余路徑的兩段距離之和作為判斷油量是否充足的依據(jù),若油量不足以完成剩余航路,則施加懲罰代價(jià)CPO。
5)Ctarget為到下一個(gè)任務(wù)點(diǎn)的距離,若任務(wù)已經(jīng)全部完成,則計(jì)算到規(guī)劃終點(diǎn)的距離。此項(xiàng)可以使得路徑是朝向任務(wù)點(diǎn)飛行,若無(wú)將會(huì)直接飛向終點(diǎn)。
2.2.1 無(wú)人機(jī)坐標(biāo)的計(jì)算
要確定無(wú)人機(jī)的下一步運(yùn)動(dòng)軌跡,首先要確定它的飛行方向與飛行速度。而在三維空間中,用極坐標(biāo)描述位置變化無(wú)疑會(huì)更加方便[14]。所以將俯仰角、偏航角與飛行速度作為粒子群算法搜索的解[15-17],然后再將極坐標(biāo)轉(zhuǎn)化為笛卡爾坐標(biāo)就可以繪制出規(guī)劃路徑,如圖2 所示。若整個(gè)航路一共為n 步,則粒子的位置為:
α1為第1 步的垂直俯仰角度,β1為第1 步的水平偏航角度,υ1為第1 步飛機(jī)的飛行速度,并以此類推。
圖2 運(yùn)動(dòng)坐標(biāo)三維示意圖
2.2.2 動(dòng)態(tài)航路規(guī)劃
在面對(duì)復(fù)雜的戰(zhàn)場(chǎng)態(tài)勢(shì)時(shí),如果做靜態(tài)的路徑規(guī)劃,面對(duì)突然出現(xiàn)的威脅將比較難以處理,所以本文選擇動(dòng)態(tài)航路規(guī)劃。每次搜索F 步以防止出現(xiàn)路徑不平滑與搜索速度緩慢的問(wèn)題,然后選取其中的D 步來(lái)執(zhí)行。為了保證對(duì)突發(fā)威脅的提前反應(yīng),通常D 應(yīng)當(dāng)不大于F 的一半。下一次規(guī)劃則以本次執(zhí)行的終點(diǎn)作為起點(diǎn)繼續(xù)執(zhí)行。
同時(shí),為了輔助規(guī)劃航路和確定任務(wù)執(zhí)行的先后順序,在規(guī)劃之前提前確定一條預(yù)規(guī)劃航路,由起始點(diǎn)與任務(wù)點(diǎn)按順序連接直到終點(diǎn)的直線組成。
表1 坐標(biāo)信息表
采用matlab2016 對(duì)實(shí)驗(yàn)進(jìn)行仿真,場(chǎng)景設(shè)置為700*600*500 km 的區(qū)域,起始點(diǎn)與任務(wù)信息如表1所示,設(shè)定飛機(jī)自帶雷達(dá)探測(cè)器探測(cè)的范圍為20 km,粒子群規(guī)劃航路的參數(shù)如下頁(yè)表2 所示。馬爾科夫生存模型中跟蹤子模型的轉(zhuǎn)移強(qiáng)度由表3所示,其中表示狀態(tài)i 向狀態(tài)j 轉(zhuǎn)移的強(qiáng)度,令pkill=0.2。從表3 中可以看到,在雷達(dá)區(qū)域內(nèi),如只有圖1 中向右轉(zhuǎn)移的轉(zhuǎn)移強(qiáng)度不為0,向左轉(zhuǎn)移的強(qiáng)度都為0,這是因?yàn)樵诖藚^(qū)域內(nèi),雷達(dá)跟蹤的幾率只會(huì)隨著時(shí)間的增加而增加,不會(huì)減??;反之亦然。生存模型中各個(gè)狀態(tài)的狀態(tài)代價(jià)值由表4 與表5 給出。跟蹤模型的各個(gè)狀態(tài)的生存代價(jià)是遠(yuǎn)小于火力模型的,因?yàn)樗皇谴砝走_(dá)的跟蹤而不會(huì)造成傷害,代價(jià)則隨著狀態(tài)的向后轉(zhuǎn)移而增強(qiáng)?;鹆δP椭懈鳡顟B(tài)的生存代價(jià)比跟蹤模型大,無(wú)傷害(UH)與失誤(M)狀態(tài)都是屬于未命中,開(kāi)火(F)狀態(tài)有可能擊中,所以代價(jià)會(huì)較大,而擊中(H)狀態(tài)會(huì)導(dǎo)致飛機(jī)擊毀,所以代價(jià)極大。
表2 粒子群參數(shù)表
表3 跟蹤模型轉(zhuǎn)移強(qiáng)度表
表4 跟蹤子模型各狀態(tài)生存代價(jià)
表5 火力子模型各狀態(tài)生存代價(jià)
3.2.1 生存代價(jià)w2偏大
在設(shè)置生存代價(jià)權(quán)重偏大的情況下,即式(12)中的0.5<w2<0.7 時(shí),生存代價(jià)在總體的目標(biāo)函數(shù)中所占比重較大,所以在路徑規(guī)劃的時(shí)候會(huì)更多地偏向考慮飛機(jī)的生存情況,在完成任務(wù)的前提下,飛機(jī)寧愿在路徑長(zhǎng)度上耗費(fèi)一定的代價(jià),也不要進(jìn)入雷達(dá)與武器區(qū)域。
圖3 規(guī)劃路徑圖
圖4 跟蹤模型概率圖
圖5 火力模型概率圖
圖6 綜合評(píng)估圖
圖4 中黑色區(qū)域?yàn)槔走_(dá)區(qū)域,紅色區(qū)域?yàn)槲淦鲄^(qū)域,黃色圓點(diǎn)為任務(wù)區(qū)域,紅色路徑則為規(guī)劃的飛行航路。從圖4、圖5 中可以看到,飛機(jī)進(jìn)入第1個(gè)雷達(dá)區(qū)域后被雷達(dá)檢測(cè)跟蹤識(shí)別的概率逐漸上升。到達(dá)一個(gè)任務(wù)點(diǎn)后飛機(jī)開(kāi)始退出雷達(dá)區(qū)域,退出后被跟蹤的概率下降至0;然后進(jìn)入第2 個(gè)雷達(dá)區(qū)域,由于生存權(quán)重較大,所以飛機(jī)沒(méi)有進(jìn)入武器區(qū)域太多,從圖6 中可以看到敵方武器發(fā)射與命中的概率均小于0.1。從下頁(yè)圖7 可以看到TV 值是在進(jìn)入武器區(qū)域的一小段時(shí)間內(nèi)有變化,Pidentify與圖5對(duì)應(yīng),Pfire值與圖6 對(duì)應(yīng),生存能力Survivalblity 是由1-Phit得來(lái),可以看到幾乎約等于1,說(shuō)明飛機(jī)的生存能力得到了很好的保證。
3.2.2 生存代價(jià)w2偏小
當(dāng)設(shè)置生存權(quán)重w2偏小的時(shí)候,即式(12)中的0.2<w2<0.4 時(shí),仿真結(jié)果如圖7~圖10 所示。
從圖中明顯可以看到,當(dāng)生存權(quán)重設(shè)置為較小值的時(shí)候,對(duì)比3.2.1 節(jié),路徑規(guī)劃時(shí)明顯對(duì)飛機(jī)的生存情況不太敏感,在進(jìn)入第2 個(gè)武器區(qū)域時(shí)已經(jīng)深入到武器內(nèi)部了,同時(shí)可以看到圖10 中敵方開(kāi)火與擊中飛機(jī)的概率大大地提高了,飛機(jī)被擊毀的概率甚至達(dá)到了0.4。圖11 中TV 值也在較長(zhǎng)時(shí)間內(nèi)保持高值,整個(gè)航路的生存能力在后半段明顯下降,說(shuō)明改變權(quán)重對(duì)路徑規(guī)劃的影響是非常顯著的。
3.2.3 縮減搜索空間時(shí)間對(duì)比
在本實(shí)驗(yàn)路徑規(guī)劃中,添加了地形、油量、飛行角度等約束條件,可以有效縮減搜索空間,經(jīng)多次實(shí)驗(yàn),得到了運(yùn)行時(shí)間對(duì)比如表6 所示。
表6 運(yùn)行時(shí)間對(duì)比表
從表中可以明顯看出,在添加了約束條件后,粒子群算法中粒子的搜索方向受到限制,搜索空間得到縮減,加快了程序運(yùn)行速度,提高了效率。
本文在三維空間對(duì)實(shí)驗(yàn)進(jìn)行了仿真,結(jié)果表明:使用粒子群算法結(jié)合八狀態(tài)馬爾科夫聯(lián)合生存模型的方法是可行的,能夠在飛行過(guò)程中實(shí)時(shí)掌控飛機(jī)的各個(gè)狀態(tài)的概率情況,通過(guò)改變權(quán)重也能很好地調(diào)節(jié)生存與其他代價(jià)之間的關(guān)系,從而對(duì)飛行路徑進(jìn)行比較有效的評(píng)估。
在未來(lái)的研究中,可以考慮利用多種方法建立對(duì)威脅值TV 的評(píng)估模型,以及對(duì)影響的因素如天氣、干擾做一些分析,希望可以最大程度地接近真實(shí)環(huán)境,從而得到更加準(zhǔn)確、有效的結(jié)果。