來 磊, 吳德偉, 鄒 鯤, 韓 昆, 李海林
(空軍工程大學信息與導航學院, 陜西 西安 710077)
隨著智能化作戰(zhàn)模式的到來,無人機(unmanned aerial vehicle, UAV)在作戰(zhàn)攻擊、情報偵察等行動中的作用日益凸顯,而對于上述UAV突防任務(wù),高效的規(guī)劃航跡可以提升UAV生存和任務(wù)執(zhí)行效能[1]。UAV航跡規(guī)劃實質(zhì)是在起始點和目標點之間搜尋一條既滿足UAV自身物理性質(zhì),又可避免外界環(huán)境威脅、防空威脅的可行航跡。
航跡規(guī)劃按空間維度可分為二維和三維航跡規(guī)劃。二維航跡規(guī)劃只在水平面內(nèi)考慮地面威脅因素,缺少地形高度信息。三維航跡規(guī)劃在二維平面上增加地形高度信息,更接近實際環(huán)境,其計算復雜度相應(yīng)地增加。目前,常規(guī)UAV航跡規(guī)劃方法主要有人工勢場法、快速擴展隨機樹(rapidly expanding random tree, RRT)算法、Dijkstra法、數(shù)學規(guī)劃法等[2]。除此以外,智能優(yōu)化算法在解決非確定性多項式(non-deterministic polynomial, NP)問題時所表現(xiàn)出的優(yōu)異性能,使研究人員關(guān)注將航跡規(guī)劃轉(zhuǎn)化為智能優(yōu)化算法所能解決的最優(yōu)值搜索問題,并且得到了較好的規(guī)劃效果。例如,文獻[3]將航跡規(guī)劃轉(zhuǎn)化成約束限制下的優(yōu)化問題,并將吸引排斥規(guī)則和加速收斂機制引入到化學反應(yīng)優(yōu)化算法中,提出一種混合式化學反應(yīng)優(yōu)化算法,并將其應(yīng)用于航跡求解中。文獻[4]將一種基于協(xié)同進化的遺傳算法用于多UAV的協(xié)同航跡規(guī)劃中,取得了較好的規(guī)劃效果。文獻[5]建立距離、威脅和高度的綜合航跡評價函數(shù),并采用改進的果蠅優(yōu)化算法對航跡進行搜索,取得了較好的航跡規(guī)劃效果。文獻[6]將灰狼優(yōu)化算法應(yīng)用于UAV的航跡尋優(yōu)求解中。文獻[7]利用粒子群算法和遺傳算法中的優(yōu)勢規(guī)則,對中心引力優(yōu)化算法進行改進,并將改進后的算法應(yīng)用到UAV三維航跡規(guī)劃中。文獻[8]提出了一種增強型遺傳算法,并將其應(yīng)用到航跡規(guī)劃中。文獻[9]將鴿群優(yōu)化算法應(yīng)用到UAV的航跡優(yōu)化計算中。文獻[10]采用Metropolis準則對粒子群優(yōu)化算法進行改進,并將改進后的算法用于UAV的航跡規(guī)劃中。文獻[11]在人工蜂群(artificial bee colony, ABC)算法中引入進化規(guī)則,并將改進后的ABC算法應(yīng)用到航跡規(guī)劃中。以上智能優(yōu)化算法在解決航跡規(guī)劃問題時取得了較好的效果,但粒子群、遺傳、蟻群和ABC等算法容易較早收斂陷入局部最優(yōu)解,使航跡規(guī)劃穩(wěn)定性降低的問題在諸多文獻中都得以驗證[12-14]。另外,將智能優(yōu)化算法應(yīng)用于三維航跡規(guī)劃,地形高度的增加使其搜索空間維數(shù)高于二維航跡規(guī)劃,因此其實時性變差。
Paun提出了膜系統(tǒng)計算理論[15],主要研究從細胞結(jié)構(gòu)和功能以及組織器官等高級結(jié)構(gòu)中建立計算模型,并分析其計算能力與效率。膜系統(tǒng)具有分布式、并行性和不確定性的特點,因此受到研究人員的關(guān)注和廣泛應(yīng)用。在實際應(yīng)用方面,膜系統(tǒng)理論已成功應(yīng)用于優(yōu)化計算、系統(tǒng)與合成生物學、故障診斷、機器人控制、經(jīng)濟學和計算機圖形等領(lǐng)域。在以上應(yīng)用研究中,最成功的應(yīng)用是采用膜系統(tǒng)來設(shè)計近似優(yōu)化算法。文獻[16]提出了一種組織型膜系統(tǒng)進化優(yōu)化算法,并將其應(yīng)用到多目標優(yōu)化問題中。文獻[17]將膜系統(tǒng)與ABC算法相結(jié)合,并將其應(yīng)用到IIR濾波器的參數(shù)優(yōu)化中。文獻[18]將膜系統(tǒng)用于優(yōu)化解決量化布爾公式的可滿足性問題。從眾多研究結(jié)果中可以看出,膜系統(tǒng)在優(yōu)化問題中的應(yīng)用可以在一定程度上提高優(yōu)化算法的性能。
本文以復雜山地雷達探測威脅環(huán)境UAV突防任務(wù)中三維航跡規(guī)劃為研究背景,提出了一種基于多準則交互式膜系統(tǒng)進化算法(multi-criterion interactive evolutionary algorithm based on membrane system, MCIEA-MS)的UAV多目標三維航跡規(guī)劃方法。本文提出的基于MCIEA-MS的多目標三維航跡規(guī)劃具有以下特點:① 建立以威脅代價、航跡距離代價、飛行高度代價和約束條件為基礎(chǔ)的多目標航跡評價模型,以克服傳統(tǒng)加權(quán)和評價函數(shù)的不足;② 通過空間降維及離散縮減方法來降低空間搜索的復雜性,以提高三維航跡規(guī)劃的搜索效率;③ 以螢火蟲算法(firefly algorithm, FA)和ABC算法作為不同膜內(nèi)的優(yōu)化規(guī)則,通過膜間的信息交互機制整合兩者的搜索優(yōu)勢,以平衡算法搜索的全局和局部性能;④ 膜內(nèi)優(yōu)化規(guī)則的種群初始化和搜索方法引入Logistic映射、反向?qū)W習機制和自適應(yīng)系數(shù)以提高優(yōu)化性能;⑤ 將非支配排序和擁擠距離計算用于表層膜中外部檔案的維護中,以提高非支配解的多樣性。通過以上策略在算法不同階段的有機結(jié)合,實現(xiàn)了UAV多目標三維航跡規(guī)劃,并通過對比實驗驗證了本文方法的有效性。
通過對作戰(zhàn)環(huán)境中UAV的突防飛行進行分析可知,UAV飛行威脅因素主要是地形威脅和雷達探測威脅。地形威脅是指UAV必須與地面或山體保持一定距離、避免碰撞,同時為提高突防隱蔽性應(yīng)盡量沿較低地勢飛行;雷達探測威脅是指應(yīng)降低被防空武器雷達探測的可能性,從而提高戰(zhàn)場生存能力。
地形環(huán)境模型可表示為
(1)
式中,x、y為三維地形中水平面點坐標;z為地形高度;N為地形中山峰個數(shù);h為山體輪廓;xni、yni為第i個山峰坐標;xgi、ygi為第i個山峰的山體輪廓參數(shù);a、b、c、e、f、g為常系數(shù)。通過上述地形模型建立的地形圖如圖1所示。
圖1 三維地形圖
UAV飛行過程中在滿足地形地貌限制的同時,穿越防空區(qū)域應(yīng)盡量躲避敵防空武器探測雷達的照射范圍,以降低被發(fā)現(xiàn)的概率;因UAV自身所攜帶動力燃料的限制,飛行時應(yīng)以距離最短的航跡作為最優(yōu)航跡。另外,飛行中應(yīng)盡量降低飛行高度以增強隱蔽性。因此,本文將雷達威脅代價、航跡距離代價和飛行高度代價作為評判航跡優(yōu)劣的主要性能指標。
在防空探測雷達設(shè)置地點和雷達探測半徑已知的情況下,雷達的威脅代價[19]可表示為
(2)
式中,R表示防空探測雷達威脅下標;LRT為航跡中穿越雷達威脅區(qū)域的總長度;nradar為探測雷達的個數(shù);dRi為第i個雷達探測區(qū)域的直徑。
由于距離代價與UAV航程成正比,在空間中最短航程應(yīng)為起始點到目標點間的直線距離,因此優(yōu)化航跡中各路徑點和起始點間距離總長度與最短航程越接近,則路徑最短、航跡距離代價最小。則航跡距離代價可定義為
(3)
式中,C表示航跡距離下標;Lst為起始點到目標點的直線距離;Ltotal為UAV優(yōu)化航跡的總長度。
飛行過程中在避免碰地前提下應(yīng)保持低空飛行,則飛行高度代價定義為
JH=(have-Hmin)/(Hmax-Hmin)
(4)
式中,H表示航跡飛行高度下標;have為航跡的平均高度;Hmin和Hmax分別為UAV最小飛行高度和最大飛行高度。
由于UAV自身的物理性質(zhì),因此在飛行過程中應(yīng)滿足一定的約束條件,其主要約束為
(1) 最大航程約束
UAV在飛行過程中,其燃油裝載量有限,相應(yīng)的飛行距離受到限制,最大飛行距離為Lmax,則飛行距離L必須滿足約束:
g1:L≤Lmax
(5)
(2) 最大飛行角度約束
受自身機動能力的影響,UAV必須考慮飛行時最大偏航角αmax和最大俯仰角βmax的限制。如果相鄰兩航跡點的坐標分別為(xi,yi,zi)和(xi+1,yi+1,zi+1),則必須滿足約束:
(6)
(3) 飛行高度約束
UAV在飛行過程中必須滿足一定的飛行高度要求,其飛行高度必須高出地面一定距離,若飛行過低會與地面發(fā)生碰撞。同時若飛行高度過高,其隱蔽性相應(yīng)會變差。因此,UAV飛行高度必須滿足約束:
g3:φzxy≤hxy≤Hmax
(7)
式中,φ為高度增加系數(shù),φ>1;zxy為坐標(x,y)處的地形高度;hxy為UAV在坐標(x,y)處的飛行高度。
從目前航跡規(guī)劃的研究現(xiàn)狀分析可以看出,多數(shù)成果是將各個航跡評判指標進行簡單的加權(quán)求和,生成單目標函數(shù)。而實際上各評判指標可能存在相互沖突的情況,因此主觀恒定不變的加權(quán)系數(shù)不適用于航跡規(guī)劃。本文將雷達威脅代價JR、航跡距離代價JC和飛行高度代價JH作為獨立的評判函數(shù),將問題轉(zhuǎn)化為多目標優(yōu)化的航跡規(guī)劃。其模型可描述為
(8)
對于上述多目標航跡評判函數(shù),其最優(yōu)解不能籠統(tǒng)地確定為某一解,而是一組Pareto最優(yōu)解集。
當多目標航跡評判函數(shù)的解x1、x2滿足條件:
(9)
則解x1Pareto支配解x2;如果所有解中不存在Pareto支配x1的解,則x1稱為Pareto最優(yōu)解;由所有Pareto最優(yōu)解組成的集合為Pareto最優(yōu)解集。
航跡優(yōu)化算法在對三維空間中的航跡點進行搜索時,其復雜度明顯高于二維空間的搜索,加之連續(xù)空間中可行解范圍較大,因此航跡規(guī)劃實時性必然降低。為降低算法搜索空間復雜度,本文將航跡搜索空間坐標進行轉(zhuǎn)換,同時進行離散化處理,即航跡搜索算法以起始點和目標點的連接直線作為參考坐標,并在該直線上均分選取D個點作為新坐標下航跡點的橫坐標值;而對于航跡點縱坐標和高度的選取,實際轉(zhuǎn)化為在過D個點與連接直線垂直的D個平面上的搜索問題,如圖2所示。但在連續(xù)的平面上搜索航跡點顯然搜索范圍較大,因此對D個平面中的每個平面做離散化網(wǎng)格處理,將平面劃分為等間距的網(wǎng)格,則每個網(wǎng)格的交點為可行的航跡點。
圖2 空間降維離散示意圖
當航跡點搜索完成后。再將其轉(zhuǎn)換到原坐標系,轉(zhuǎn)換公式表示為
(10)
θ=arcsin((yt-ys)/|st|)
(11)
式中,q為原坐標系下起始點與目標點連線和X軸所成夾角;(xnew,ynew)為搜索坐標值;(xs,ys)為原坐標系下起始點的坐標值;st為起始點與目標點間的直線。
自然界中生物細胞由細胞膜所包圍,細胞膜作為中介向細胞和細胞體外環(huán)境傳送化學物質(zhì),因此將細胞與外界環(huán)境聯(lián)系起來。膜系統(tǒng)就是受細胞結(jié)構(gòu)和功能的啟發(fā),從細胞的分層結(jié)構(gòu)和物質(zhì)交換方式中建立的計算模型。
膜系統(tǒng)主要由膜結(jié)構(gòu)、對象和進化規(guī)則組成,常見的膜系統(tǒng)有3種類型:細胞型膜系統(tǒng)、組織型膜系統(tǒng)和神經(jīng)型膜系統(tǒng)。細胞型膜系統(tǒng)由單個細胞組成,本文研究內(nèi)容是建立在細胞型膜系統(tǒng)上,一個度為m的細胞型膜系統(tǒng)Π可定義為
Π=(V,O,M,μ,ω1,ω2,…,ωm,R1,R2,…,Rm)
(12)
式中,V是有限非空字母表,其元素為對象;O是輸出對象的集合;M是膜標號,M={1,2,…,m};μ是包含m個膜的膜結(jié)構(gòu);ω1表示膜結(jié)構(gòu)μ中區(qū)域i中含有對象的多重集;Ri為膜結(jié)構(gòu)μ中區(qū)域i的進化規(guī)則的有限集合。
本文MCIEA-MS采用3層細胞膜結(jié)構(gòu),如圖3所示。最外層表層膜主要與外界環(huán)境接觸,同時建立外部檔案并對其進行維護。表層膜內(nèi)嵌套有I、II型兩種中間膜,兩種中間膜之間可進行信息交流,并將非支配解送給表層膜。另外,在兩中間膜中各嵌套有3個基本膜,基本膜內(nèi)部沒有其他膜,其中僅包含優(yōu)化對象和進化規(guī)則。算法運行時,各基本膜同時進化并通過相應(yīng)的交流規(guī)則進行基本膜信息交流,同時各基本膜將自身的非支配解送至中間膜中;中間膜通過相應(yīng)的選取規(guī)則選取交流值進行中間膜交流,同時將非支配解送到表層膜中,如此反復,最后由表層膜輸出最優(yōu)非支配解集作為最后結(jié)果。
圖3 細胞膜結(jié)構(gòu)
本文對于I型基本膜采用全局搜索能力較強的FA進行尋優(yōu)計算。
FA主要源于對螢火蟲群體行為的模擬,算法通過螢火蟲個體間根據(jù)發(fā)光亮度相互吸引實現(xiàn)尋優(yōu),其尋優(yōu)原則為:螢火蟲被發(fā)光亮度更高的個體所吸引;螢火蟲的吸引力與發(fā)光亮度成正比,亮度隨著距離的增加而減小;若沒有找到比自身更亮的個體,螢火蟲會隨機移動。亮度體現(xiàn)螢火蟲位置優(yōu)劣并決定其移動方向,吸引度決定螢火蟲移動距離,算法通過亮度和吸引度實現(xiàn)目標優(yōu)化[20-23]。
螢火蟲i對j的發(fā)光亮度為
Ii j=I0e-γ ri j
(13)
式中,I0為最大發(fā)光亮度;γ為光亮吸收系數(shù);ri j為螢火蟲i和螢火蟲j之間的直線距離。通常,優(yōu)化參數(shù)越優(yōu),發(fā)光亮度相應(yīng)的越高。
假設(shè)螢火蟲i對螢火蟲j的吸引度和螢火蟲i對螢火蟲j的發(fā)光亮度成正比,則螢火蟲的吸引度表示為
χi j=χ0e-γ ri j
(14)
式中,χ0為最大吸引度。
螢火蟲i被吸引到螢火蟲j的位置更新公式表示為
Xi=Xi+χi j(Xj-Xi)+(s-0.5I)
(15)
式中,Xi和Xj為螢火蟲i和螢火蟲j在空間中所處位置,既代表優(yōu)化函數(shù)的可行解;ε∈[0,1]為步長因子;s中的元素為[0,1]均勻分布的隨機數(shù)。
本文對于II型基本膜采用局部搜索能力較強的ABC進行尋優(yōu)計算。
ABC算法是一種模擬蜜蜂尋找蜜源的仿生群體算法[24-27],ABC算法中蜂群被分為3類:采蜜蜂、跟隨蜂和偵查蜂。采蜜蜂在蜜源周圍尋找新的蜜源,并把蜜源信息傳給跟隨蜂,跟隨蜂通過分享采蜜蜂的信息,來尋找蜜源。當一定時間內(nèi)未發(fā)現(xiàn)更好蜜源時,采蜜蜂變?yōu)閭刹旆?并尋找新的蜜源。解空間中每個蜜源代表一個可行解,并且每個蜜源上只能有一個采蜜蜂。適應(yīng)度值代表蜜源的收益度值,最高收益度值的蜜源位置代表可行解中的最優(yōu)解。
采蜜蜂根據(jù)搜索公式在蜜源附近隨機生成可行解,同時計算每個可行解的適應(yīng)度值。位置更新搜索公式為
Xi=Xi+η(Xik-Xi j)
(16)
式中,η為[-1,1]之間的隨機數(shù);j為隨機下標數(shù);k為不等于j的下標數(shù)。
采蜜蜂在產(chǎn)生新的可行解后,跟隨蜂通過隨機概率選擇蜜源;確定蜜源后,跟隨蜂根據(jù)位置更新公式在所選蜜源附近搜索新的可行解。如果經(jīng)過一定次數(shù)循環(huán)后沒有找到新的更優(yōu)可行解,則采蜜蜂將變?yōu)閭刹榉?并用隨機搜索公式搜索新的蜜源。隨機搜索公式表示為
Xi=Xmin+s(Xmax-Xmin)
(17)
式中,Xmin和Xmax為搜索空間的上下界。
采用進化算法對三維航跡進行搜索時,搜索復雜度遠大于二維航跡搜索,優(yōu)化值極易陷入局部最優(yōu)值。為提高優(yōu)化規(guī)則的性能,對優(yōu)化規(guī)則進行如下改進:
(1) 種群初始化改進。種群初始化在智能優(yōu)化中是較為關(guān)鍵的步驟,直接影響算法的收斂速度和最終解的質(zhì)量。本文將Logistic映射和反向?qū)W習機制引入到種群初始化中,以提高初始化種群的多樣性,從而提高算法的收斂速度和尋優(yōu)能力。
加入Logistic映射系數(shù)的初始化公式表示為
X=Xmin+λck(1-ck)(Xmax-Xmin)
(18)
式中,l為映射系數(shù);ck為Logistic映射狀態(tài)值。
通過反向?qū)W習機制可以得到其反向數(shù)為
OX=Xmin+Xmax-X
(19)
則初始化種群由X和OX共同組成。
(2) 優(yōu)化搜索方法改進。對于標準ABC算法和FA其缺點在于難以平衡探索與開發(fā)間的關(guān)系,本文對兩算法標準搜索公式添加權(quán)重系數(shù),使算法在迭代初期偏重于探索,在迭代后期偏重于開發(fā)。其權(quán)重系數(shù)表達式為
(20)
式中,wmax為最大權(quán)重系數(shù);wmin為最小權(quán)重系數(shù);iter為當前迭代次數(shù);Miter為最大迭代次數(shù)。
加入權(quán)重系數(shù)的ABC搜索公式表示為
Xi=Xi+η(Xik-Xi j)w
(21)
添加權(quán)重系數(shù)的FA搜索公式為
(22)
(3) 可行解的優(yōu)劣評價策略。在FA和ABC算法中種群中較優(yōu)個體將會吸引其他個體,個體的優(yōu)劣是由評價函數(shù)確定的,而多目標優(yōu)化中不能依據(jù)某個評價函數(shù)來評價個體的優(yōu)劣,因此本文采用解之間的Pareto支配關(guān)系對個體間的優(yōu)劣進行評判,即若個體i支配個體j,則個體i優(yōu)于個體j。
(4) 外部檔案維護策略。對于多目標優(yōu)化問題求解的關(guān)鍵點之一在于對外部檔案的維護,在眾多多目標進化優(yōu)化算法中,最為經(jīng)典的算法應(yīng)屬非支配排序遺傳算法2(non-dominated sorting genetic algorithms II,NSGA-II)[28-29],該算法主要采用了擁擠距離和非支配排序?qū)ν獠繖n案進行多樣化維護。隨后發(fā)展的其他眾多多目標進化優(yōu)化算法多是引用了NSGA-II中的非支配排序機制,從而驗證了其有效性[30-31]。本文將擁擠距離和非支配排序機制引用到膜內(nèi)進化規(guī)則FA和ABC算法中。
擁擠距離指Pareto前沿上兩個非支配解向量間的距離,其計算方法表示為
(23)
非支配排序是指將算法迭代得到的種群解按支配等級進行排序,其過程可簡述為:將算法迭代前后的新舊種群進行合并,并進行非支配排序,即不被任何解支配的解集設(shè)為第一級,剩余解集中不被任何解支配的解集為第二級,以此類推直到最后一個解集;按照排序等級組成新的種群解集,此時為防止種群規(guī)模過大,對各解進行擁擠距離計算并逆序排序,保留擁擠排序靠前的種群組成新的種群,至此非支配排序結(jié)束。
膜結(jié)構(gòu)中的細胞膜之間存在相應(yīng)的交流機制,用于膜間進行優(yōu)化參數(shù)的交換和共享。在本文的膜結(jié)構(gòu)中設(shè)計如下的膜交流規(guī)則。
(1) 基本膜交流規(guī)則:兩種類型的基本膜分別在各自所屬的中間膜中進行相互交流,即每個基本膜將本次迭代所得非支配解傳送給其他兩個基本膜,同時將非支配解傳送給中間膜。
(2) 中間膜交流規(guī)則:兩中間膜在每次迭代后將自身非支配解傳送給對方,同時將非支配解傳送給表層膜。
(3) 表層膜交流規(guī)則:表層膜在每次迭代過程中接收來自中間膜的非支配解,并建立外部檔案,同時對外部檔案進行維護。
采用MCIEA-MS對UAV航跡進行優(yōu)化搜索的步驟如圖4所示。
步驟 1初始化MCIEA-MS中各參數(shù),并采用初始化式(19)為每個基本膜生成初始值,每個初始值代表可行的航跡點組合。
步驟 2計算各基本膜初始值的適應(yīng)度值,并進行非支配排序。
步驟 3I、II型基本膜分別根據(jù)改進的搜索式(21)和式(22)進行尋優(yōu)搜索;根據(jù)式(8)航跡代價函數(shù)計算搜索航跡解的航跡代價值;若基本膜完成膜內(nèi)迭代,則進行基本膜間的信息交流。
步驟 4中間膜進行膜間信息交流,并將非支配解傳送給表層膜。
步驟 5表層膜采用擁擠距離和非支配排序規(guī)則對外部檔案進行維護。
步驟 6若達到規(guī)定的迭代次數(shù)或達到閾值則終止算法,并輸出結(jié)果;如不滿足,則轉(zhuǎn)至步驟3進行下一次迭代。
圖4 航跡規(guī)劃流程圖
為了驗證本文算法對UAV三維航跡規(guī)劃的有效性,在Intel Core(TM) i3-3240,3.4 GHz, 3 G內(nèi)存的PC機上進行仿真實驗,運行環(huán)境為Windows XP,編程環(huán)境為Matlab 2013。實驗區(qū)域為60 km×60 km×2 km三維地圖,設(shè)UAV起始坐標為(2.5,5,0.16)km,目標點坐標為(57,43,0.23)km。MCIEA-MS算法中蜂群種群個數(shù)設(shè)為20,采蜜蜂和跟隨蜂數(shù)設(shè)為10;FA中螢火蟲數(shù)目設(shè)為20,最大吸引度設(shè)為1;算法最大迭代次數(shù)設(shè)為500次。實驗分為兩種情況,分別為無威脅下的航跡規(guī)劃和有威脅下的航跡規(guī)劃,并采用飛行高度代價、雷達威脅代價和航跡距離代價作為指標評價算法性能。
無威脅環(huán)境下理想航跡主要受到航跡距離和飛行高度代價指標的影響,與單目標優(yōu)化航跡不同的是,多目標優(yōu)化的最優(yōu)航跡不再是滿足目標函數(shù)最小的一條航跡,而是一組最優(yōu)航跡解集。實驗中采用本文MCIEA-MS對多目標航跡進行規(guī)劃,得到一組最優(yōu)非支配解集,選取其中6組解作為最優(yōu)航跡點形成的航跡如圖5所示。多目標優(yōu)化航跡中的最優(yōu)非支配解集實際上是以多個航跡評判代價為目標,生成不同側(cè)重點的相對最優(yōu)航跡。圖5(a)為三維航跡效果,圖5(b)為相應(yīng)的二維高程航跡效果,6條航跡中,有3條航跡是以航跡距離代價為側(cè)重點,另外3條是以飛行高度代價為側(cè)重點,各航跡的代價值如表1所示。
圖5 無威脅環(huán)境下MCIEA-MS優(yōu)化航跡
表1 無威脅環(huán)境下航跡性能對比數(shù)據(jù)
從表1中的數(shù)據(jù)可以看出,航跡P1~P3相對于P4~P5更側(cè)重于達到航跡高度最優(yōu),P4~P5側(cè)重于達到航跡距離最短。以航跡高度最低的航跡P1和航程最短航跡P5作對比如圖6示。從圖6對比效果中可以看出,實線航跡P1基本是沿地形最低處飛行,因此其飛行的隱蔽性更好;而虛線航跡P5注重縮短飛行距離,因此其隱蔽性相對較弱。
圖6 無威脅環(huán)境典型航跡對比
有威脅環(huán)境下UAV航跡不僅受到地形環(huán)境的限制,還應(yīng)躲避雷達探測威脅。實驗中在坐標點(10,17,0.2)km、(25,32,0.29)km、(47,25,0.37)km、(20,5,0.25)km、(35,37,0.25)km和(16,15,0.06)km處設(shè)置探測半徑分別為6 km、7 km、10 km、12 km和13 km的威脅區(qū)域(圖中圓形區(qū)域示)。同樣采用本文MCIEA-MS對多目標航跡進行規(guī)劃,得到一組最優(yōu)非支配解航跡如圖7所示。
圖7 有威脅環(huán)境MCIEA-MS優(yōu)化航跡
圖7中6組航跡同樣具有不同的側(cè)重點,各有兩組航跡分別側(cè)重于雷達威脅代價、航跡距離代價和飛行高度代價。各航跡的目標代價值如表2所示。
表2 有威脅環(huán)境下航跡性能對比數(shù)據(jù)
表2中航跡P1~P2飛行高度代價相對較小,側(cè)重于盡可能地降低飛行高度;航跡P3~P4威脅代價值較小,從實驗圖中可以看出其航跡基本繞過雷達威脅探測區(qū)域;航跡P5~P6的距離代價較低,因此其航跡長度最短。
另外,為驗證本文MCIEA-MS膜間多準則交互相對于單進化準則的優(yōu)勢,實驗中采用多目標優(yōu)化FA對航跡進行優(yōu)化。同樣多目標FA會生成一組非支配最優(yōu)解集,為了便于進行算法對比,實驗中從MCIEA-MS和FA最優(yōu)解集中找出以飛行高度為側(cè)重目標的一組最優(yōu)解進行對比,如圖8所示。圖8中實線為MCIEA-MS優(yōu)化航跡,其飛行高度代價JH=0.219、航跡距離代價JC=0.055、威脅代價JR=0.214;虛線為FA優(yōu)化航跡,其飛行高度代價JH=0.311、航跡距離代價JC=0.047、威脅代價JR=0.333;從對比數(shù)據(jù)可以看出,本文MCIEA-MS相對于FA整體優(yōu)化目標有所提升。
圖8 兩種算法航跡對比
航跡規(guī)劃是UAV實行突防等任務(wù)的關(guān)鍵技術(shù),甚至在一定程度上影響著任務(wù)的成敗。本文提出了一種基于MCIEA-MS的UAV三維航跡規(guī)劃方法,該方法建立多目標優(yōu)化模型將UAV航跡規(guī)劃作為多目標優(yōu)化問題;其次,建立嵌套式膜系統(tǒng),膜內(nèi)采用不同的進化規(guī)則,并通過膜間信息的交互實現(xiàn)進化規(guī)則間的優(yōu)勢互補;為使膜內(nèi)進化適應(yīng)多目標優(yōu)化,采用擁擠計算、非支配排序等機制對進化規(guī)則進行改進。
實驗結(jié)果表明:MCIEA-MS可以根據(jù)不同側(cè)重目標代價,生成多個最優(yōu)非支配航跡路徑,相對于單目標航跡規(guī)劃和單進化算法具有較優(yōu)性能指標。在本文基礎(chǔ)上未來將從以下兩方面進一步研究:復雜多目標下的三維航跡規(guī)劃和多UAV協(xié)同的三維航跡規(guī)劃。