賴幸君,唐 鑫,林 磊,王志勝,叢玉華
(1 國(guó)家無(wú)線電監(jiān)測(cè)中心檢測(cè)中心,北京 100041;2 南京航空航天大學(xué)自動(dòng)化學(xué)院,江蘇 南京 210016)
無(wú)人機(jī)是一種可自主控制或通過(guò)無(wú)線電控制的無(wú)人駕駛航空器,與有人駕駛飛機(jī)相比,無(wú)人機(jī)具有成本低、體積小、機(jī)動(dòng)性強(qiáng)、部署方便、在高危環(huán)境下無(wú)人員傷亡等優(yōu)點(diǎn)[1],目前已被廣泛應(yīng)用于搜索、遙感、勘探等領(lǐng)域[2-6]。
目前針對(duì)未知區(qū)域的全區(qū)域覆蓋和針對(duì)已知目標(biāo)信息的搜索問(wèn)題已有了大量研究,但對(duì)于未知環(huán)境的目標(biāo)搜索問(wèn)題研究相對(duì)較少。全區(qū)域覆蓋方面,Muoz等[7]針對(duì)在雜亂的城市環(huán)境中執(zhí)行區(qū)域覆蓋任務(wù)時(shí)可能產(chǎn)生碰撞的問(wèn)題,建立了考慮城市中障礙物的地圖模型,并基于無(wú)沖突領(lǐng)航路徑和領(lǐng)航-跟隨者編隊(duì)策略,計(jì)算所有無(wú)人機(jī)的路徑。Chen等[8]針對(duì)異構(gòu)無(wú)人機(jī)群在多個(gè)獨(dú)立的區(qū)域進(jìn)行大規(guī)模協(xié)作搜索任務(wù)時(shí),計(jì)算復(fù)雜度高,難以求解的問(wèn)題,提出基于蟻群算法求解近似最優(yōu)的區(qū)域覆蓋路徑。Zhang等[9]針對(duì)多無(wú)人機(jī)在大范圍區(qū)域中的覆蓋問(wèn)題,將該區(qū)域分解為可以被無(wú)人機(jī)相機(jī)完全覆蓋的若干正三角形,并將需要覆蓋的目標(biāo)區(qū)域轉(zhuǎn)換為由節(jié)點(diǎn)和邊組成的連通圖,并采用混合線性整數(shù)規(guī)劃法來(lái)求解無(wú)人機(jī)的區(qū)域覆蓋航路規(guī)劃問(wèn)題。
目標(biāo)搜索問(wèn)題的思想與區(qū)域覆蓋相反,其主要目標(biāo)為:用盡可能短的時(shí)間搜索到區(qū)域內(nèi)的目標(biāo),減少多余搜索。Zhou等[10]為了在提高無(wú)人機(jī)搜索目標(biāo)效率的同時(shí),能躲避環(huán)境中的障礙物,提出了一種免疫遺傳算法,并在返程階段,設(shè)計(jì)了一種分而治之和確定性路徑優(yōu)化算法,解決無(wú)人機(jī)完成任務(wù)后的返程問(wèn)題。Duan等[11]針對(duì)多無(wú)人機(jī)執(zhí)行空中搜索任務(wù)的優(yōu)化指標(biāo)建立問(wèn)題,利用貝葉斯公式構(gòu)造和更新概率圖,指導(dǎo)無(wú)人機(jī)的搜索。Yu等[12]針對(duì)災(zāi)害場(chǎng)景中的目標(biāo)搜索問(wèn)題,將無(wú)人機(jī)的飛行距離和航跡的風(fēng)險(xiǎn)加入考慮范圍,使無(wú)人機(jī)能完成目標(biāo)搜索任務(wù)的同時(shí),減少無(wú)人機(jī)執(zhí)行任務(wù)過(guò)程中發(fā)生意外的概率。
根據(jù)搜索任務(wù)需求提出的優(yōu)化問(wèn)題,設(shè)計(jì)合適的優(yōu)化算法求解無(wú)人機(jī)的搜索路線是解決區(qū)域搜索問(wèn)題的關(guān)鍵。由于待搜索環(huán)境往往有很大的不確定性,離線規(guī)劃的算法在區(qū)域搜索問(wèn)題中并不適用,需要無(wú)人機(jī)根據(jù)實(shí)時(shí)變化的環(huán)境調(diào)整搜索路線,這對(duì)算法的實(shí)時(shí)性要求較高。目前主流的算法主要有啟發(fā)式算法(模擬退火法、遺傳算法、蟻群算法、粒子群算法、狼群算法等)和人工智能優(yōu)化算法(深度學(xué)習(xí)、強(qiáng)化學(xué)習(xí)等)[13]。啟發(fā)式算法由于其在規(guī)定時(shí)間內(nèi)必然可以給出可行解、且不依賴于模型的特點(diǎn),被研究者們用于無(wú)人機(jī)實(shí)時(shí)決策問(wèn)題上。Ghambari等[14]將幾種典型的自然啟發(fā)式算法應(yīng)用于帶約束的路徑規(guī)劃問(wèn)題,為啟發(fā)式算法在帶約束問(wèn)題中的應(yīng)用提供了參考。Cho等[15]為搜索問(wèn)題建立了混合整數(shù)線性規(guī)劃模型,并開(kāi)發(fā)了一種隨機(jī)搜索啟發(fā)式算法,減少計(jì)算時(shí)間的同時(shí),保證了搜索方案的最優(yōu)性。Zhu等[16]提出了一種分布式在線啟發(fā)式策略,在其中融合了并行搜索和內(nèi)螺旋搜索等幾何特征,在多無(wú)人機(jī)協(xié)同區(qū)域覆蓋問(wèn)題中取得了較高的搜索效率。Han等[17]在考慮避障的區(qū)域覆蓋路徑規(guī)劃問(wèn)題中引入蟻群算法,在規(guī)劃的路徑長(zhǎng)度和能耗方面取得了很好的性能。Kyriakakis等[18]針對(duì)無(wú)人機(jī)搜索和救援場(chǎng)景的動(dòng)態(tài)優(yōu)化問(wèn)題,提出了一種多群框架,將多種群智能算法用于求解該問(wèn)題,證明粒子群算法是眾多算法中最有效的群智能算法。
綜上分析,現(xiàn)有國(guó)內(nèi)外研究雖然在多無(wú)人機(jī)協(xié)同區(qū)域搜索決策方法上有一定的研究,但仍存有以下問(wèn)題有待研究解決:1)現(xiàn)有的區(qū)域搜索方法考慮的因素不夠全面,當(dāng)綜合考慮多項(xiàng)優(yōu)化指標(biāo)后,傳統(tǒng)的群智能優(yōu)化算法求解區(qū)域搜索問(wèn)題易陷入局部最優(yōu),導(dǎo)致搜索性能不佳;2)傳統(tǒng)群智能優(yōu)化算法在求解復(fù)雜多目標(biāo)優(yōu)化問(wèn)題時(shí)尋優(yōu)時(shí)間更長(zhǎng),實(shí)時(shí)性較差。
針對(duì)以上問(wèn)題,開(kāi)展了以下研究:首先為了提高多無(wú)人機(jī)協(xié)同區(qū)域搜索綜合性能,將區(qū)域覆蓋率、區(qū)域不確定度、目標(biāo)發(fā)現(xiàn)概率加入優(yōu)化目標(biāo),作為衡量區(qū)域搜索性能的指標(biāo);其次提出一種基于差分進(jìn)化粒子群混合算法的無(wú)人機(jī)區(qū)域搜索策略,提高搜索性能和尋優(yōu)效率;最后通過(guò)充分的仿真實(shí)驗(yàn),驗(yàn)證所提算法在多無(wú)人機(jī)協(xié)同區(qū)域搜索問(wèn)題中的性能。
文中主要針對(duì)區(qū)域內(nèi)目標(biāo)數(shù)量NT未知,區(qū)域內(nèi)目標(biāo)分布情況未知的場(chǎng)景下,NU架無(wú)人機(jī)飛入待搜索區(qū)域,利用自身攜帶的傳感器對(duì)區(qū)域進(jìn)行自主搜索,根據(jù)無(wú)人機(jī)獲得的區(qū)域地圖信息,在線自主決策,在規(guī)定的任務(wù)時(shí)間內(nèi),盡可能多地發(fā)現(xiàn)未知目標(biāo),并覆蓋盡可能多的未知區(qū)域,從而掌握區(qū)域內(nèi)的信息。任務(wù)的示意圖如圖1所示。
圖1 多無(wú)人機(jī)區(qū)域搜索任務(wù)示意圖Fig.1 Multi-UAV area search mission diagram
在多無(wú)人機(jī)區(qū)域搜索場(chǎng)景中,NU架無(wú)人機(jī)對(duì)區(qū)域內(nèi)的NT個(gè)目標(biāo)進(jìn)行搜索和位置確認(rèn)。無(wú)人機(jī)用Ai(1≤i≤NU)表示,待搜索目標(biāo)用Tj(1≤j≤NT)表示。
將待搜索區(qū)域Ω離散成網(wǎng)格圖[19-21],如圖2所示。網(wǎng)格圖由Lx×Ly個(gè)網(wǎng)格構(gòu)成,每個(gè)網(wǎng)格的長(zhǎng)和寬分別為Δx和Δy。根據(jù)網(wǎng)格圖建立二維坐標(biāo)系,第m行第n列的網(wǎng)格中心的坐標(biāo)為(m,n),其中1≤m≤Lx,1≤n≤Ly。
圖2 網(wǎng)格化后的待搜索環(huán)境Fig.2 Environment to be searched after gridding
假設(shè)每個(gè)網(wǎng)格中最多存在一個(gè)目標(biāo),那么網(wǎng)格中的目標(biāo)存在情況可表示為:
sc={(xc,yc,ξc)|c∈Ω}
(1)
式中:xc和yc分別為網(wǎng)格c的x軸坐標(biāo)和y軸坐標(biāo);ξc為網(wǎng)格c處的目標(biāo)存在狀態(tài)。ξc可表示為:
(2)
文中采用旋翼無(wú)人機(jī)執(zhí)行區(qū)域搜索任務(wù)。由于傳感器的檢測(cè)性能受無(wú)人機(jī)飛行高度影響,為了便于無(wú)人機(jī)判斷,將無(wú)人機(jī)設(shè)為固定高度,從而使無(wú)人機(jī)機(jī)載傳感器的探測(cè)范圍固定。無(wú)人機(jī)的運(yùn)動(dòng)學(xué)模型簡(jiǎn)化為:
(3)
式中:xi(t),yi(t)為無(wú)人機(jī)的空間坐標(biāo);Vi(t)為無(wú)人機(jī)i的飛行速度;φi(t)為無(wú)人機(jī)i飛行方向與x軸正方向的夾角;ωi(t)為無(wú)人機(jī)轉(zhuǎn)彎時(shí)的角速度。
無(wú)人機(jī)基于式(3)所示的運(yùn)動(dòng)模型在待搜索區(qū)域中運(yùn)動(dòng),航向角φi可為[-180°,180°]區(qū)間內(nèi)的任意值,速度Vi(t)需滿足無(wú)人機(jī)最大飛行速度約束,即Vi(t)≤Vmax。無(wú)人機(jī)在空中的飛行時(shí)間需滿足無(wú)人機(jī)最大續(xù)航時(shí)間,即t≤tmax。
為準(zhǔn)確反映無(wú)人機(jī)對(duì)區(qū)域的搜索情況,下面建立無(wú)人機(jī)的目標(biāo)存在概率圖模型、區(qū)域不確定度地圖模型、區(qū)域覆蓋圖模型。
1.2.1 目標(biāo)存在概率圖
根據(jù)任務(wù)環(huán)境的地形與目標(biāo)類型,建立目標(biāo)存在概率圖。隨著無(wú)人機(jī)搜索的進(jìn)行,無(wú)人機(jī)對(duì)區(qū)域內(nèi)的探測(cè)結(jié)果會(huì)影響后續(xù)對(duì)目標(biāo)位置的判斷,每架無(wú)人機(jī)建立目標(biāo)存在概率地圖[22]可表示為:
Mi,prob(k)={pi,c(k)|c∈Ω}
(4)
式中pi,c(k)為無(wú)人機(jī)i的概率地圖中網(wǎng)格c處的目標(biāo)存在概率。
根據(jù)貝葉斯公式[23],更新k時(shí)刻在無(wú)人機(jī)視場(chǎng)范圍內(nèi)的網(wǎng)格的目標(biāo)存在概率pi,c(k)為:
(5)
式中:pd為無(wú)人機(jī)的探測(cè)概率;pf為無(wú)人機(jī)的虛警概率;Φi,k為無(wú)人機(jī)的傳感器探測(cè)范圍,若k時(shí)刻無(wú)人機(jī)i在網(wǎng)格c中發(fā)現(xiàn)目標(biāo),無(wú)人機(jī)的探測(cè)結(jié)果表示為Wi,c(k)=1,反之,探測(cè)結(jié)果表示為Wi,c(k)=0。
1.2.2 區(qū)域不確定度地圖
為了將無(wú)人機(jī)對(duì)網(wǎng)格的信息認(rèn)知程度量化,以反映無(wú)人機(jī)是否了解區(qū)域中的目標(biāo)存在情況,引入?yún)^(qū)域不確定度ηi,c(k),建立區(qū)域不確定度地圖[24]:
(6)
式中Kη>0,為常數(shù)。根據(jù)式(6)與式(7)可以得出區(qū)域不確定度ηi,c(k)與目標(biāo)存在概率pi,c(k)的關(guān)系。
1.2.3 區(qū)域覆蓋地圖
為了準(zhǔn)確表示待搜索區(qū)域中被無(wú)人機(jī)搜索過(guò)的區(qū)域面積,文中用區(qū)域覆蓋狀態(tài)Cc(k)表示無(wú)人機(jī)對(duì)網(wǎng)格c的覆蓋情況:
(7)
根據(jù)整個(gè)區(qū)域網(wǎng)格覆蓋狀態(tài),可以將無(wú)人機(jī)對(duì)環(huán)境的區(qū)域覆蓋率[25]C(k)表示為:
(8)
式中Gall為環(huán)境網(wǎng)格地圖中的網(wǎng)格總數(shù)。
在無(wú)人機(jī)區(qū)域搜索問(wèn)題中,由于環(huán)境的未知與多變性,離線解算的結(jié)果無(wú)法適應(yīng)動(dòng)態(tài)變化的環(huán)境,因此,文中借鑒模型預(yù)測(cè)控制中的滾動(dòng)時(shí)域優(yōu)化思想[26-30],建立小規(guī)模優(yōu)化目標(biāo),無(wú)人機(jī)只需求解預(yù)測(cè)的時(shí)間窗范圍內(nèi)的最優(yōu)動(dòng)作,降低計(jì)算的難度。無(wú)人機(jī)的滾動(dòng)時(shí)域優(yōu)化模型可表示為:
(9)
式中:U*(k)為決策的控制輸入序列;U(k)={u(k),u(k+1),…,u(k+tw)}為無(wú)人機(jī)在動(dòng)態(tài)時(shí)間窗內(nèi)的輸入決策序列;tw為動(dòng)態(tài)時(shí)間窗長(zhǎng)度;X(k)為k時(shí)刻的狀態(tài)輸入,包括k時(shí)刻的區(qū)域覆蓋圖、目標(biāo)存在概率圖、區(qū)域不確定度地圖以及所有無(wú)人機(jī)的位置信息、能量消耗情況;Jc,Jp,Ju分別為區(qū)域覆蓋率目標(biāo)函數(shù)、目標(biāo)發(fā)現(xiàn)概率目標(biāo)函數(shù)、區(qū)域不確定度目標(biāo)函數(shù);Je為無(wú)人機(jī)能量消耗代價(jià)函數(shù),用于減少無(wú)人機(jī)在搜索過(guò)程中的能量消耗;λc,λp,λu,λe分別為四種優(yōu)化目標(biāo)對(duì)應(yīng)的權(quán)重系數(shù)。
為了防止無(wú)人機(jī)的搜索路線過(guò)早陷入局部最優(yōu),對(duì)差分進(jìn)化算法(DE)和粒子群優(yōu)化算法(PSO)取長(zhǎng)補(bǔ)短,提出基于差分進(jìn)化粒子群混合算法(PSODE)的區(qū)域搜索策略,求解所提出的多目標(biāo)優(yōu)化問(wèn)題。PSODE算法的尋優(yōu)過(guò)程如圖3所示。
基于PSODE算法規(guī)劃無(wú)人機(jī)搜索路線的總體步驟如下:
步驟1:分別為DE算法和PSO算法產(chǎn)生n個(gè)初始隨機(jī)解Ui,de(k)、Ui,pso(k),i=1,2,…,n(即為無(wú)人機(jī)的控制決策輸入)。
(10)
式中:Ui,pso(k)為粒子群算法解集中第i個(gè)解(簡(jiǎn)稱為粒子i);Vi為粒子i的更新速度;Gbest(k)為k時(shí)刻Ui,pso(k)中的全局最優(yōu)解;c1,c2分別為個(gè)體學(xué)習(xí)因子和群體學(xué)習(xí)因子;r1,r2為區(qū)間[0,1]內(nèi)的隨機(jī)數(shù);w為慣性權(quán)重,表示當(dāng)前迭代輪次受上一輪迭代速度的影響程度。根據(jù)Gbest(k)計(jì)算出粒子群算法中的最優(yōu)適應(yīng)度函數(shù)fpso。
步驟4:比較fde,fpso,取其最大值作為全局最優(yōu)適應(yīng)度f(wàn)pg,計(jì)算DE算法與PSO算法的選擇概率pselde,pselpso,其中DE算法的選擇概率計(jì)算公式為:
(11)
其中,λ1和λ2的計(jì)算方式分別為:
(12)
(13)
相對(duì)應(yīng)的,PSO算法的選擇概率為:
pselpso=1-pselde
(14)
步驟5:產(chǎn)生0~1之間的隨機(jī)數(shù)Nrand,若Nrand
步驟6:若未達(dá)到設(shè)定的最大迭代次數(shù),則按步驟5的方式不斷更新Ui,de(k);Ui,pso(k);否則,比較fde與fpso,若fde>fpso,則選用Ui,de(k)作為無(wú)人機(jī)的控制輸入;否則,將Ui,pso(k)作為無(wú)人機(jī)的控制輸入。
為了讓算法能在收斂速度和尋優(yōu)精度取得均衡,文中對(duì)算法中的PSO算法和DE算法均采用自適應(yīng)參數(shù)調(diào)整的策略。
在PSO算法中,種群的更新速度和精度主要受慣性權(quán)重w影響,文中對(duì)w采用線性遞減策略,w的更新公式為:
(15)
式中:wmax為慣性權(quán)重的最大值;wmin分別為慣性權(quán)重的最小值;Nmaxit為最大迭代次數(shù)。
在DE算法中,變異因子F是影響其種群更新的關(guān)鍵參數(shù)。在進(jìn)化早期,種群應(yīng)擴(kuò)大搜索范圍尋找最優(yōu)解,此時(shí)F的值應(yīng)較大,隨著進(jìn)化過(guò)程的進(jìn)行,F的值應(yīng)逐漸變小,由全局搜索轉(zhuǎn)變?yōu)橐跃植克阉鳛橹?精準(zhǔn)尋優(yōu)。因此,DE算法的變異因子F采用如下的自適應(yīng)調(diào)整方式:
(16)
式中,Fmax與Fmin分別為最大變異因子和最小變異因子。
為驗(yàn)證基于PSODE算法的無(wú)人機(jī)區(qū)域搜索策略的有效性,首先,在相同環(huán)境下,對(duì)比基于PSODE算法的無(wú)人機(jī)區(qū)域搜索策略與單一的PSO算法、DE算法的性能差異;其次,進(jìn)行多次實(shí)驗(yàn),對(duì)比三種算法的性能指標(biāo)平均值與方差,驗(yàn)證算法的穩(wěn)定性;最后分析迭代次數(shù)對(duì)算法性能的影響,驗(yàn)證提出的PSODE算法在實(shí)時(shí)性方面的性能。
設(shè)置環(huán)境未知的待搜索區(qū)域大小為30 km×30 km,將待搜索區(qū)域進(jìn)行網(wǎng)格化處理,將區(qū)域劃分為30×30的網(wǎng)格圖,執(zhí)行任務(wù)的無(wú)人機(jī)數(shù)量為3,無(wú)人機(jī)的初始位置分別為(2 km,2 km)、(28 km,2 km)、(2 km,28 km),無(wú)人機(jī)攜帶的傳感器探測(cè)概率pd為0.8,虛警概率pf為0.2,認(rèn)為網(wǎng)格中存在目標(biāo)的概率閾值設(shè)置為0.9;設(shè)置執(zhí)行未知區(qū)域搜索任務(wù)的時(shí)間為30 min,無(wú)人機(jī)的能耗模型參考文獻(xiàn)[30]。優(yōu)化算法的參數(shù)設(shè)置方面,PSO算法的初始慣性系數(shù)wstart為0.8,末尾慣性系數(shù)wend為0.2,更新速度Vd范圍限制設(shè)置為[-1,1],個(gè)體學(xué)習(xí)因子c1與群體學(xué)習(xí)因子c2均為0.25。DE算法的初始變異因子Fmax為0.65,末尾變異因子Fmin為0.3,交叉概率CR為0.9;PSODE算法的參數(shù)與PSO算法和DE算法的參數(shù)均相同。
分別采用DE算法、PSO算法和PSODE算法求解多無(wú)人機(jī)協(xié)同區(qū)域搜索問(wèn)題,三種算法的搜索結(jié)果圖如圖4~圖6所示,DE算法在任務(wù)過(guò)程中會(huì)產(chǎn)生較多的重復(fù)搜索,導(dǎo)致搜索效率不高,有大片區(qū)域未被搜索?;赑SO算法的無(wú)人機(jī)區(qū)域搜索策略在搜索后期,無(wú)人機(jī)會(huì)存在重復(fù)搜索的問(wèn)題。PSODE算法重復(fù)搜索的頻率比PSO算法和DE算法更低,搜索結(jié)束時(shí)對(duì)區(qū)域的覆蓋率更高,可將區(qū)域不確定度降至更低。
圖4 基于DE算法的搜索結(jié)果圖Fig.4 Search result graph based on DE algorithm
圖5 基于PSO算法的搜索結(jié)果圖Fig.5 Search result graph based on PSO algorithm
圖6 基于PSODE算法的搜索結(jié)果圖Fig.6 Search result graph based on PSODE algorithm
無(wú)人機(jī)在搜索結(jié)束時(shí)的區(qū)域覆蓋率、區(qū)域不確定度與消耗的總能量對(duì)比如表1所示。文中提出的PSODE算法可達(dá)到97.26%的區(qū)域覆蓋率,分別比PSO算法和DE算法高1.59%、10.04%;搜索完成后的區(qū)域不確定度方面,提出的PSODE算法分別比另外兩種算法低2.46%、9.87%,對(duì)區(qū)域的信息掌握程度更高;用于轉(zhuǎn)彎消耗的能量分別比PSO算法和DE算法少57.74%、61.25%;發(fā)現(xiàn)目標(biāo)數(shù)方面,三種算法幾乎相同。綜合四項(xiàng)性能指標(biāo)可以看出,基于PSODE算法的區(qū)域搜索策略在相同條件下,具備更好的搜索性能。
表1 三種算法的區(qū)域搜索結(jié)果性能比較Table 1 Performance comparison of area search results for three algorithms
由于無(wú)人機(jī)需要在線決策搜索路線,因此對(duì)算法的實(shí)時(shí)性要求較高,本節(jié)對(duì)不同迭代次數(shù)下三種算法的區(qū)域搜索性能進(jìn)行量化分析,驗(yàn)證迭代次數(shù)對(duì)算法性能的影響。分別設(shè)置算法的迭代次數(shù)為20,50,100,在相同環(huán)境中進(jìn)行次數(shù)為20仿真實(shí)驗(yàn),對(duì)比結(jié)果如圖7和表2所示。
表2 不同迭代次數(shù)下三種算法的性能指標(biāo)情況Table 2 Performance indexes of the three algorithms with different number of iterations
圖7 不同迭代次數(shù)下三種算法的性能指標(biāo)情況Fig.7 Performance metrics of the three algorithms with different iterations
由圖7可知,相同迭代次數(shù)下,文中提出的基于PSODE算法的區(qū)域搜索策略各項(xiàng)性能指標(biāo)的方差比其他兩種未改進(jìn)的算法小,在區(qū)域搜索過(guò)程中表現(xiàn)出的性能更穩(wěn)定。
表2為仿真實(shí)驗(yàn)中算法不同迭代次數(shù)的平均性能指標(biāo),由數(shù)據(jù)可以看出,隨著迭代次數(shù)的提升,三種算法的性能指標(biāo)均有不同程度的提高,基于PSODE算法的區(qū)域搜索策略在迭代次數(shù)20時(shí),平均區(qū)域覆蓋率就已經(jīng)達(dá)到94.17%,比另外兩種算法高5.26%,3.65%,區(qū)域不確定度降低至8.56%,比其他兩種算法低5.64%、4.45%,平均發(fā)現(xiàn)目標(biāo)數(shù)為16.9,分別比其他兩種算法多1.25、2,且PSODE算法在迭代次數(shù)20時(shí),便已獲得比其他兩種算法100次迭代時(shí)更優(yōu)的性能,由此可見(jiàn)基于PSODE算法的區(qū)域搜索策略具備更好的實(shí)時(shí)性。
在提出的滾動(dòng)時(shí)域優(yōu)化模型中,λc,λp、λu與λe分別表示無(wú)人機(jī)執(zhí)行區(qū)域搜索任務(wù)時(shí)對(duì)區(qū)域的覆蓋率、發(fā)現(xiàn)目標(biāo)概率、區(qū)域不確定度和無(wú)人機(jī)能量消耗四個(gè)方面的權(quán)重,為了驗(yàn)證不同的權(quán)重對(duì)無(wú)人機(jī)區(qū)域搜索策略的影響,將權(quán)重系數(shù)按表3中的組合分別進(jìn)行仿真分析。
表3 無(wú)人機(jī)區(qū)域搜索優(yōu)化目標(biāo)權(quán)重系數(shù)組合Table 3 Combination of target weight coefficients for UAV area search optimization
三種權(quán)重組合的航跡圖如圖8所示。在待搜索區(qū)域中,紅色區(qū)域和綠色區(qū)域?yàn)闊o(wú)人機(jī)開(kāi)始搜索前,根據(jù)已知的地形推測(cè)出的部分已知目標(biāo)存在概率的區(qū)域,其中紅色區(qū)域表示目標(biāo)存在概率為0.8,綠色區(qū)域表示目標(biāo)存在概率為0.2,其他區(qū)域的信息完全未知,目標(biāo)存在概率為0.5。三種權(quán)重組合分別對(duì)應(yīng)了不同的任務(wù)需求。
圖8 不同權(quán)重系數(shù)下無(wú)人機(jī)區(qū)域搜索航跡Fig.8 UAV regional search trajectory with different weighting factors
搜索性能的指標(biāo)變化曲線如圖9所示。在區(qū)域覆蓋率方面,組合1權(quán)重下的區(qū)域搜索策略,獲得的區(qū)域覆蓋率最高,為95.56%,分別比組合2和組合3高20.56%、18.00%,;在區(qū)域不確定度方面,組合2的不確定度下降速度更快,任務(wù)完成時(shí),組合2與組合1的區(qū)域不確定度分別為6.15%、6.21%,分別比組合3低11.64%、11.58%;無(wú)人機(jī)搜索區(qū)域的目標(biāo)存在概率方面,權(quán)重組合3的搜索路線會(huì)優(yōu)先搜索目標(biāo)存在概率高的區(qū)域,搜索過(guò)的區(qū)域目標(biāo)存在概率總和曲線上升速度比組合1和組合2快。在實(shí)際應(yīng)用時(shí),可選擇不同的權(quán)重組合以適應(yīng)不同的任務(wù)需求。
圖9 不同權(quán)重系數(shù)無(wú)人機(jī)區(qū)域搜索性能指標(biāo)變化曲線Fig.9 Change curve of UAV area search performance index under different weighting factors
文中針對(duì)未知環(huán)境下的無(wú)人機(jī)區(qū)域搜索問(wèn)題,提出基于差分進(jìn)化粒子群混合算法的無(wú)人機(jī)區(qū)域搜索策略,解決了現(xiàn)有的區(qū)域搜索方法總體性能不佳、實(shí)時(shí)性差的問(wèn)題,從區(qū)域覆蓋率、目標(biāo)發(fā)現(xiàn)概率、區(qū)域不確定度和能量消耗4個(gè)方面提升了無(wú)人機(jī)區(qū)域搜索性能,從仿真結(jié)果可以看出,所設(shè)計(jì)的基于差分進(jìn)化粒子群混合算法的無(wú)人機(jī)區(qū)域搜索策略可獲得比基于粒子群算法、差分進(jìn)化算法的區(qū)域搜索策略更優(yōu)的搜索性能,并具備較好的實(shí)時(shí)性和穩(wěn)定性。然而,文中提出的區(qū)域搜索策略未考慮無(wú)人機(jī)在環(huán)境中可能遇到意外事件損毀的情況,未來(lái)計(jì)劃將無(wú)人機(jī)損毀情況加入考慮范圍,使區(qū)域搜索策略可適應(yīng)更為復(fù)雜的環(huán)境。