張耀中, 陳 嵐, 張 蕾, 謝松巖
(西北工業(yè)大學(xué)電子信息學(xué)院,西安 710129)
由于UAV具有較低的應(yīng)用成本和較好的機(jī)動(dòng)性,使其成為戰(zhàn)場(chǎng)上被廣泛使用的一種偵察手段。UAV可以在“危險(xiǎn)、惡劣、枯燥”的任務(wù)環(huán)境中替代有人機(jī)執(zhí)行戰(zhàn)場(chǎng)偵察任務(wù)[1]。UAV任務(wù)偵察一般是指通過(guò)UAV所攜帶的任務(wù)載荷,來(lái)獲取特定任務(wù)區(qū)域內(nèi)情報(bào)信息的過(guò)程[2]。如何在UAV執(zhí)行偵察任務(wù)前進(jìn)行最優(yōu)的任務(wù)規(guī)劃,從而有效提高UAV的任務(wù)執(zhí)行效率已經(jīng)成為該領(lǐng)域中的一個(gè)研究熱點(diǎn)問題,受到了諸多研究者的關(guān)注。如文獻(xiàn)[3]在考慮三維任務(wù)環(huán)境和禁飛區(qū)限制的條件下,給出了一種基于改進(jìn)的遺傳算法求解方案來(lái)進(jìn)行多UAV的路徑規(guī)劃,從而獲得對(duì)目標(biāo)區(qū)域的最大偵察信息;文獻(xiàn)[4]提出了一種基于改進(jìn)的自適應(yīng)進(jìn)化多目標(biāo)優(yōu)化算法來(lái)進(jìn)行多UAV協(xié)同任務(wù)偵察,取得了良好的任務(wù)偵察效果。
通過(guò)分析大量的文獻(xiàn)可以看出,目前研究者一般側(cè)重于任務(wù)的航路規(guī)劃和偵察搜救問題,大多未考慮UAV攜帶特定偵察載荷時(shí)的偵察信息收益最大化問題,該問題在很多應(yīng)用場(chǎng)景中具有相應(yīng)的實(shí)際意義。在高度復(fù)雜的戰(zhàn)場(chǎng)環(huán)境中、震后的災(zāi)情分析中或大面積海域的海情偵察與搜索中,一般都有大量的熱點(diǎn)區(qū)域需要UAV攜帶特定偵察載荷去執(zhí)行信息收集任務(wù)。由于UAV所攜帶任務(wù)載荷的工作時(shí)間及能力都是有限的,通常難以完成對(duì)全部任務(wù)區(qū)的完全信息偵察,因此,如何能夠快速有效地完成對(duì)所有任務(wù)區(qū)的非完全信息遍歷偵察是本文的研究?jī)?nèi)容。本文提出一種將仿生智能算法——布谷鳥搜索算法[5-7]應(yīng)用于UAV多任務(wù)區(qū)的協(xié)同偵察問題,很好地解決了對(duì)該類問題求解的快速性和有效性,從而為實(shí)際應(yīng)用提供了決策依據(jù)[8-10]。
在戰(zhàn)場(chǎng)中的情報(bào)收集、震區(qū)災(zāi)情搜集與救援以及廣域海上搜救等諸多任務(wù)中,經(jīng)常需要單架UAV對(duì)任務(wù)區(qū)中多個(gè)感興趣的區(qū)域進(jìn)行信息偵察。由于UAV的性能、攜帶載荷的有效工作時(shí)間及載荷的工作能力都是受限的,如何規(guī)劃出最優(yōu)的任務(wù)路徑,同時(shí)規(guī)劃出載荷在各個(gè)感興趣區(qū)域的工作時(shí)間對(duì)整個(gè)偵察任務(wù)的完成效果都有極大的影響[11-12]。設(shè)定任務(wù)場(chǎng)景中存在N個(gè)感興趣的待偵察區(qū)域,如圖1所示。
圖1 UAV多任務(wù)區(qū)偵察規(guī)劃示意圖Fig.1 Reconnaissance planning of UAV multi-task area
圖中,tij表示從任務(wù)區(qū)i到任務(wù)區(qū)j的任務(wù)飛行時(shí)間,其中,i=0時(shí)表示基地。假定N個(gè)待偵察任務(wù)區(qū)的位置、范圍及所需任務(wù)載荷均為已知,則對(duì)任務(wù)區(qū)的偵察信息收益就主要體現(xiàn)在UAV所獲取的偵察情報(bào),通常偵察情報(bào)的獲得主要由UAV在該任務(wù)區(qū)內(nèi)載荷的工作時(shí)間決定,載荷工作時(shí)間越長(zhǎng),所獲得的對(duì)該任務(wù)區(qū)的情報(bào)信息就越多。通過(guò)研究,本文引入對(duì)任務(wù)區(qū)的偵察信息確定性指標(biāo)來(lái)度量任務(wù)載荷的偵察信息收益,通常在UAV進(jìn)入預(yù)定任務(wù)區(qū)之前對(duì)該任務(wù)區(qū)的先驗(yàn)情報(bào)信息為0,隨著偵察載荷工作時(shí)間的增加,對(duì)該任務(wù)區(qū)的信息確定性度量值將逐漸增加,當(dāng)該任務(wù)區(qū)的信息確定性指標(biāo)接近1時(shí)就完成對(duì)該任務(wù)區(qū)的完全信息偵察。通常UAV在偵察過(guò)程中由于續(xù)航時(shí)間及載荷持續(xù)工作時(shí)間等的約束,難以完成對(duì)全部任務(wù)區(qū)的完全信息偵察,通常也沒有必要進(jìn)行完全信息偵察。因此,如何在滿足相應(yīng)約束條件下使UAV對(duì)所有待偵察任務(wù)區(qū)綜合偵察信息確定性指標(biāo)達(dá)到最大化是本文要解決的問題。
在UAV執(zhí)行對(duì)多任務(wù)區(qū)的偵察問題中,對(duì)感興趣任務(wù)區(qū)的傳感器工作時(shí)間分配問題屬于連續(xù)時(shí)間約束的非線性規(guī)劃問題,是典型的NP Hard問題。由英國(guó)劍橋大學(xué)YANG等提出的布谷鳥搜索算法(Cuckoo Search Algorithm,CSA)在解決該類問題時(shí)表現(xiàn)出了較好的計(jì)算性能,因此,選擇CSA進(jìn)行相應(yīng)的改進(jìn)來(lái)求解該問題。
CSA主要是基于北美一種布谷鳥的寄生孵化行為,并采用Lévy飛行的隨機(jī)游走進(jìn)化策略[5]來(lái)進(jìn)行最優(yōu)解的獲取。該算法設(shè)計(jì)了3條基本規(guī)則:1) 每只布谷鳥每次只能產(chǎn)下一枚蛋,同時(shí)布谷鳥隨機(jī)地選取一個(gè)其他種類的鳥巢進(jìn)行寄生孵化;2) 具有最優(yōu)性能的鳥巢會(huì)被保存到進(jìn)化過(guò)程的下一代;3) 用來(lái)寄生孵化的鳥巢數(shù)目固定,設(shè)宿主鳥發(fā)現(xiàn)外來(lái)鳥蛋的概率為pa,假如宿主鳥發(fā)現(xiàn)了外來(lái)鳥蛋,則宿主鳥或拋棄這個(gè)蛋,或拋棄該鳥巢,并尋找新的位置重建鳥巢。該進(jìn)化算法操作簡(jiǎn)單,只需設(shè)置鳥巢數(shù)量n和宿主鳥發(fā)現(xiàn)外來(lái)鳥蛋概率pa兩個(gè)參數(shù)。
CSA的進(jìn)化過(guò)程主要包括最優(yōu)鳥巢的選擇、局部隨機(jī)擾動(dòng)、全局Lévy飛行隨機(jī)選擇3個(gè)過(guò)程[7]。
1) 最優(yōu)巢穴的選擇。在算法迭代過(guò)程中,保留當(dāng)前代中性能最好的巢穴直接進(jìn)入下一代種群中,以保證算法的迭代性能,類似于遺傳算法中的精英保留主義。
2) CSA的局部隨機(jī)擾動(dòng)。算法進(jìn)化過(guò)程中疊加隨機(jī)擾動(dòng),保證種群的多樣性。局部隨機(jī)擾動(dòng)過(guò)程為
(1)
3) 采用Lévy飛行過(guò)程進(jìn)行算法迭代。
算法的迭代進(jìn)化過(guò)程采用全局Lévy飛行隨機(jī)游走策略進(jìn)行,即
(2)
式中:
(3)
CSA的基本處理流程如圖2所示。
圖2 CSA流程圖Fig.2 Flow chart of CSA
CSA在解決連續(xù)變量最優(yōu)化問題中顯示出良好性能,但是標(biāo)準(zhǔn)的CSA只能求解具有連續(xù)型變量的最優(yōu)化問題,無(wú)法求解離散型變量的最優(yōu)化問題[13-14]。在本文中采用一種基于Lévy隨機(jī)分布策略的插入、交換、倒置操作算子來(lái)進(jìn)行算法的離散化,從而求解最優(yōu)偵察路徑規(guī)劃問題。離散布谷鳥搜索算法處理流程見圖3。
圖3 離散布谷鳥搜索算法流程圖Fig.3 Flow chart of discrete CSA
基本型的CSA進(jìn)化過(guò)程具有較大的隨機(jī)性、迭代過(guò)程難以控制,收斂速度難以保證[15]。因此,本文基于基本型的CSA和偵察決策問題的特點(diǎn),給出對(duì)應(yīng)的改進(jìn)措施,提出一種改進(jìn)型CSA(ICSA),包括采用自適應(yīng)步長(zhǎng)的比例調(diào)節(jié)因子、進(jìn)化過(guò)程中解向量的高斯擾動(dòng)法則。
1) 自適應(yīng)步長(zhǎng)比例調(diào)節(jié)因子
(4)
2) 解向量的高斯擾動(dòng)法則。
CSA的特點(diǎn)就是參數(shù)少、全局搜索能力較強(qiáng)、局部搜索能力較弱,因此在進(jìn)化迭代過(guò)程中,采用對(duì)解向量進(jìn)行小步長(zhǎng)的擾動(dòng),使鳥巢進(jìn)化位置進(jìn)行微調(diào)以增加解向量的多樣性,不僅加快了收斂速度,而且有效提高了算法的局部搜索性能[16-17]。
引入解向量的高斯擾動(dòng),當(dāng)CSA經(jīng)過(guò)Lévy飛行得到一組新的解向量后,通過(guò)增加一次高斯擾動(dòng),使得新的解向量在舊的解向量附近微調(diào)并保留較優(yōu)的解向量。該過(guò)程可表示為
xn*=xn+k⊕u
(5)
式中:x為鳥巢的位置向量;u為與解向量同階的隨機(jī)矩陣且滿足uij~N(0,1);k為擾動(dòng)調(diào)節(jié)因子,避免對(duì)解向量造成的影響過(guò)大而導(dǎo)致算法的進(jìn)化效率下降。
為了敘述方便,定義:n為仿真任務(wù)場(chǎng)景中的待偵察任務(wù)區(qū)數(shù)量;M為UAV基地與待偵察任務(wù)區(qū)集合,M={1,2,3,…,n},節(jié)點(diǎn){1}為基地,節(jié)點(diǎn)M{1}為待偵察任務(wù)區(qū)的集合;E表示待偵察任務(wù)區(qū)之間的任務(wù)路徑,E={i,j|i,j∈M,i≠j};(xi,yi)為第i個(gè)任務(wù)區(qū)中心點(diǎn)的位置坐標(biāo),i∈M,(x1=0,y1=0);Si為第i個(gè)任務(wù)區(qū)的待偵察面積,i∈M,設(shè)定任務(wù)區(qū)為長(zhǎng)方形規(guī)則區(qū)域;dij為第i個(gè)任務(wù)區(qū)到第j個(gè)任務(wù)區(qū)的距離;Dmin為從基地起飛完成對(duì)所有任務(wù)區(qū)遍歷飛行的最短任務(wù)航路;ci為第i個(gè)任務(wù)區(qū)的偵察價(jià)值,i∈M;w為所攜帶偵察載荷的掃描寬度;v為UAV的飛行速度;T為UAV的總?cè)蝿?wù)可飛行時(shí)間;tij為UAV從任務(wù)區(qū)i到任務(wù)區(qū)j的飛行時(shí)間,tij=dij/v;tmin為UAV從基地起飛完成任務(wù)航路飛行所需的最小飛行時(shí)間;Gimin為第i個(gè)任務(wù)區(qū)需要達(dá)到的最小信息偵察收益,i∈M;Gi為對(duì)第i個(gè)任務(wù)區(qū)的偵察信息收益;Gmax為對(duì)全部任務(wù)區(qū)進(jìn)行偵察所獲取的綜合化最大偵察信息收益;ti為第i個(gè)任務(wù)區(qū)分配的載荷工作時(shí)間,
在多任務(wù)區(qū)的偵察決策問題中,需要解算的決策變量有Xij和ti兩類。為了使每個(gè)任務(wù)區(qū)都能獲取到比較滿意的偵察信息收益,首先需要保證UAV對(duì)全部待偵察任務(wù)區(qū)的偵察路徑是最優(yōu)的,從而保證有更多的有效任務(wù)工作時(shí)間分配給相應(yīng)的任務(wù)區(qū)來(lái)執(zhí)行相應(yīng)的偵察任務(wù)。在此將整個(gè)任務(wù)決策過(guò)程分為2個(gè)階段來(lái)求解:第1階段主要進(jìn)行偵察路徑的規(guī)劃,求取UAV完成所有任務(wù)區(qū)飛行所需要的時(shí)間;第2階段進(jìn)行任務(wù)區(qū)偵察時(shí)間的分配,將UAV剩余的可用任務(wù)飛行時(shí)間最優(yōu)化地分配給相應(yīng)的任務(wù)區(qū)。兩階段的求解過(guò)程見圖4。
圖4 多任務(wù)區(qū)偵察決策問題求解流程Fig.4 Process of multi-task area reconnaissancedecision-making
UAV對(duì)多任務(wù)區(qū)進(jìn)行偵察的最短任務(wù)路徑問題可以歸結(jié)為經(jīng)典的TSP問題來(lái)進(jìn)行求解,建立數(shù)學(xué)模型為
(6)
(7)
約束條件為
(8)
(9)
(10)
(11)
(12)
(13)
其中:約束方程式(8)、式(9)為任務(wù)區(qū)的偵察約束,確保每個(gè)任務(wù)區(qū)只能到達(dá)一次;約束方程式(10)為偵察遍歷約束,保證UAV能夠遍歷飛行到所有待偵察的任務(wù)區(qū);約束方程式(11)為起點(diǎn)約束,保證UAV從基地起飛;約束方程式(12)為終點(diǎn)約束,保證UAV完成任務(wù)后能夠返回基地;約束方程式(13)為平衡約束。
UAV對(duì)任務(wù)區(qū)進(jìn)行任務(wù)偵察的主要目的是獲取有用的情報(bào)信息,降低決策者對(duì)相應(yīng)任務(wù)區(qū)的不確定性,一般而言,UAV對(duì)任務(wù)區(qū)進(jìn)行偵察時(shí)都處于極其復(fù)雜的外部環(huán)境,難以保證對(duì)每個(gè)任務(wù)區(qū)都能夠進(jìn)行完全信息偵察。UAV的偵察信息收益主要取決于其所攜帶的偵察載荷的工作能力,在特定偵察載荷(如機(jī)載CCD照相設(shè)備等)下,UAV在每個(gè)待偵察任務(wù)區(qū)內(nèi)的偵察信息收益主要與在該任務(wù)區(qū)內(nèi)的載荷工作時(shí)間成正比,載荷工作時(shí)間越長(zhǎng),偵察收益越大。因此,偵察信息的度量主要與UAV在該任務(wù)區(qū)內(nèi)的偵察時(shí)間長(zhǎng)短、所攜帶偵察載荷的工作能力等因素相關(guān),即
G(t)=G0+G1(1-e-βt)
(14)
式中:G0為偵察任務(wù)開始前UAV對(duì)該任務(wù)區(qū)域的已知信息,0≤G0<1,G1為UAV對(duì)任務(wù)區(qū)的信息不確定性部分,且G0+G1=1;β為偵察載荷對(duì)任務(wù)區(qū)的偵察能力指數(shù)。不同偵察載荷的工作能力指數(shù)對(duì)偵察收益的影響如圖5所示。
圖5 不同偵察載荷工作能力下的偵察收益曲線Fig.5 Reconnaissance revenue curve under different reconnaissance load capacity
為便于計(jì)算,假定UAV在對(duì)任務(wù)區(qū)進(jìn)行偵察前沒有任何已知信息,即取G0=0。同時(shí)設(shè)定任務(wù)區(qū)為矩形區(qū)域,偵察載荷為機(jī)載CCD照相設(shè)備,則偵察能力指數(shù)主要由任務(wù)區(qū)的面積S,偵察載荷的有效掃描寬度w及UAV的任務(wù)飛行速度v所決定,表示為
(15)
則UAV偵察收益的信息確定性度量指標(biāo)可以表示為
G(t)=1-e(-w·v/S)t。
(16)
多任務(wù)區(qū)的偵察時(shí)間分配問題可以表示為如下的最優(yōu)化問題,即
(17)
式中,ci為任務(wù)區(qū)的價(jià)值系數(shù)。
該最優(yōu)化問題的約束條件為
(18)
tmin=Dmin/v
(19)
(20)
其中:約束方程式(18)為UAV對(duì)所有任務(wù)區(qū)的任務(wù)飛行時(shí)間約束;約束方程式(20)為每個(gè)任務(wù)區(qū)需要滿足的最小偵察收益約束。
以某偵察UAV為參考,在Windows7操作系統(tǒng)和Matlab2012b 編程環(huán)境下進(jìn)行仿真驗(yàn)證。設(shè)定UAV的最大任務(wù)工作時(shí)間為30 h,任務(wù)飛行速度為v=220 km/h,所攜帶偵察載荷的有效掃描寬度為w=0.3 km,以UAV所在基地坐標(biāo)為原點(diǎn)建立坐標(biāo)系,場(chǎng)景中感興趣的任務(wù)區(qū)域共有24個(gè),任務(wù)區(qū)域的有關(guān)參數(shù)如表1所示。
表1 待偵察任務(wù)區(qū)域的信息設(shè)置表
基于上述仿真任務(wù)想定,將問題劃分為任務(wù)航路規(guī)劃和任務(wù)區(qū)偵察時(shí)間分配兩個(gè)階段,分別采用離散型和連續(xù)型的ICSA進(jìn)行求解。
仿真中設(shè)定ICSA的最大迭代次數(shù)為500,巢穴的數(shù)量為20,宿主鳥發(fā)現(xiàn)外來(lái)鳥蛋的概率為0.25,對(duì)每個(gè)待偵察任務(wù)區(qū)的偵察時(shí)間分配及相應(yīng)的偵察信息收益及偵察任務(wù)航路規(guī)劃結(jié)果分別如圖6、圖7所示,其中,i為對(duì)應(yīng)任務(wù)區(qū)序號(hào),UAV完成全部任務(wù)區(qū)偵察的總偵察信息收益為6.12,從UAV所在基地起飛遍歷全部任務(wù)區(qū)的最小任務(wù)航路飛行時(shí)間為6.62 h,任務(wù)航路的飛行距離為1 456.33 km。
為了分析ICSA的收斂速度,針對(duì)以上仿真任務(wù)場(chǎng)景分別選用了基本CSA和GA進(jìn)行了對(duì)比計(jì)算,3種算法的進(jìn)化收斂曲線如圖8所示。
圖6 UAV多任務(wù)區(qū)偵察時(shí)間分配結(jié)果圖Fig.6 Time allocation result of multi-task area reconnaissance
圖7 UAV多任務(wù)區(qū)偵察收益圖Fig.7 Revenue of multi-task area reconnaissance
圖8 ICSA,CSA,GA算法下的進(jìn)化收斂曲線Fig.8 Evolution curve of ICSA,CSA and GA
仿真結(jié)果顯示,GA運(yùn)行時(shí)間為19.20 s,而ICSA運(yùn)行時(shí)間僅為6.07 s,可見ICSA求解速度明顯快于GA。從ICSA,CSA和GA這3種的進(jìn)化收斂曲線能夠看出,相比于標(biāo)準(zhǔn)CSA和GA,ICSA能夠克服GA早熟的缺點(diǎn),收斂速度快,同時(shí)自適應(yīng)的搜索步長(zhǎng)能夠明顯提高基本CSA進(jìn)化的速度,從而能夠在較小的迭代次數(shù)下快速收斂。仿真計(jì)算結(jié)果表明,ICSA能夠快速有效地給出多任務(wù)區(qū)偵察決策問題的最優(yōu)方案。
本文針對(duì)UAV多任務(wù)區(qū)的偵察決策問題,將整個(gè)偵察決策過(guò)程分為任務(wù)路徑規(guī)劃與偵察時(shí)間分配2個(gè)階段,給出了偵察信息的度量指標(biāo)。同時(shí)提出了一種改進(jìn)的CSA為每個(gè)待偵察任務(wù)區(qū)分配最優(yōu)的任務(wù)偵察時(shí)間,從而使整個(gè)偵察任務(wù)過(guò)程的信息收益最大化。最后進(jìn)行了相應(yīng)的仿真分析,仿真結(jié)果表明,該算法可以在UAV任務(wù)飛行時(shí)間約束下獲得對(duì)多任務(wù)區(qū)的綜合偵察信息收益最大化決策方案。
參 考 文 獻(xiàn)
[1] LOH R,BIAN Y,ROE T.UAVs in civil airspace:safety requirements[J].IEEE Aerospace and Electronic Systems Magazine,2009,24(1):5-17.
[2] 許友平.無(wú)人機(jī)對(duì)地偵察/攻擊航路規(guī)劃軟件系統(tǒng)的研制與研發(fā)[D].南京:南京航空航天大學(xué),2013.
[3] ERGEZER H,LEBLEBICIOLU M K.3D path planning for UAVs for maximum information collection[C]//International Conference on Unmanned Aircraft Systems(ICUAS),2013:79-88.
[4] MA J Y,ZHANG K H.Research on TSP solution based on genetic algorithm of logistic equation[C]//The 2nd International Conference on Computer Science and Network Technology,2010:738-742.
[5] YANG X S,DEB S.Cuckoo search via Lévy flights[C]// World Congress on Nature & Biologically Inspired Computing(NaBIC 2009),2010:210-214.
[6] YANG X S.Cuckoo search and firefly algorithm[M].Poland:Polish Academy of Sciences,2014:49-195.
[7] YANG X S,DEB S.Engineering optimization by cuckoo search[J].International Journal of Mathematical Modelling and Numerical Optimisation,2010,1(4):330-343.
[8] 張耀中,胡波,李寄瑋,等.不確定環(huán)境下無(wú)人機(jī)多任務(wù)區(qū)偵察決策研究[J].西北工業(yè)大學(xué)學(xué)報(bào),2016,34(6):1028-1034.
[9] BAXTER J,FINDLAY S,PAXTON M.Scheduling UAV surveillance tasks,lessons learnt from trials with users[C]//IEEE International Conference on Systems,Man and Cybernetics,2013:2606-2610.
[10] SHIN H S,LEBOUCHER C,TSOURDOS A.Resource allocation with cooperative path planning for multiple UAVs[C]//UKACC International Conference on Control, 2012:298-303.
[11] HABIB D,KHAN S A,JAMAL H. Collaborative path planning for multiple unmanned aerial vehicles in dynamic environment[C]//The Signal Processing, Communications and Computing (ICSPCC),2011:1-5.
[12] BERTUCCELLI L F,CHOI H L,CHO P,et al.Real-time multi-UAV task assignment in dynamic and uncertain environment[C]//AIAA Guidance,Navigation,and Control Conference,2009:10-13.
[13] YANG X S,DEB S.Cuckoo search:recent advances and applications[J].Neural Computing and Applications, 2014,24(1):169-174.
[14] OUAARAB A,AHIOD B,YANG X S.Discrete cuckoo search algorithm for the traveling salesman problem[J].Neural Computing and Applications,2014,24(7/8):1659-1669.
[15] OUAARAB A,AHIOD B,YANG X S,et al.Discrete cuckoo search algorithm for job shop scheduling problem[C]//IEEE International Symposium on Intelligence Control(ISIC),2014:1872-1876.
[16] MARICHELVAM M K,PRABAHARAH T,YANG X S.Improved cuckoo search algorithm for hybrid flow shop scheduling problems to minimize makespan[J].Applied Soft Computing,2014,19(1):93-101.
[17] YANG X S,DEB S.Multiobjective cuckoo search algorithm for design optimization[J].Computers & Operations Research,2013,40(6):1616-1624.