国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于SAGWO算法的UCAVs動(dòng)態(tài)協(xié)同任務(wù)分配

2018-09-04 01:58:42魏政磊趙輝黃漢橋王驍飛周瑞
關(guān)鍵詞:灰狼編隊(duì)適應(yīng)度

魏政磊, 趙輝, 黃漢橋, 王驍飛, 周瑞

(1. 空軍工程大學(xué) 航空工程學(xué)院, 西安 710038; 2. 西北工業(yè)大學(xué) 無(wú)人機(jī)系統(tǒng)技術(shù)研究院, 西安 710072)

隨著作戰(zhàn)環(huán)境的復(fù)雜化、作戰(zhàn)過(guò)程的動(dòng)態(tài)化、作戰(zhàn)任務(wù)的多樣化,多無(wú)人作戰(zhàn)飛機(jī)(Unmanned Combat Aerial Vehicles, UCAVs)協(xié)同攻擊多目標(biāo)將是一種未來(lái)的重要作戰(zhàn)模式。UCAVs協(xié)同任務(wù)分配是UCAV協(xié)同作戰(zhàn)的關(guān)鍵技術(shù)之一,其目的是在一定戰(zhàn)場(chǎng)環(huán)境和任務(wù)要求下,考慮執(zhí)行任務(wù)的約束條件和技術(shù)指標(biāo),將目標(biāo)合理地分配給不同的UCAV,使得整個(gè)編隊(duì)作戰(zhàn)效能達(dá)到最大。

目前,對(duì)UCAVs協(xié)同任務(wù)分配技術(shù)的研究已經(jīng)成為UCAV作戰(zhàn)研究中的熱點(diǎn)。針對(duì)任務(wù)分配問(wèn)題,文獻(xiàn)[1]采用多種協(xié)商機(jī)制建立分布式UCAVs控制系統(tǒng);文獻(xiàn)[2]提出了基于多層樹(shù)的協(xié)同攻擊多目標(biāo)模型;也可以采用智能優(yōu)化算法對(duì)UCAVs任務(wù)分配問(wèn)題求解,比如螢火蟲(chóng)優(yōu)化算法[3]、粒子群算法[4]等。在實(shí)際的UCAV協(xié)同任務(wù)執(zhí)行過(guò)程中,可能會(huì)出現(xiàn)任務(wù)獲取信息不完整,或者在任務(wù)執(zhí)行過(guò)程中存在戰(zhàn)場(chǎng)環(huán)境和任務(wù)需求以及任務(wù)信息的變化,導(dǎo)致現(xiàn)有的任務(wù)分配方案對(duì)實(shí)時(shí)環(huán)境的不適應(yīng)[5-6]。同時(shí),相關(guān)文獻(xiàn)中的任務(wù)分配算法模型同時(shí)或部分存在以下問(wèn)題,如:①未考慮目標(biāo)之間的支援關(guān)系;②未考慮電子干擾下的任務(wù)分配;③動(dòng)態(tài)的任務(wù)分配沒(méi)有用時(shí)間指標(biāo)體現(xiàn)出來(lái)。

針對(duì)動(dòng)態(tài)任務(wù)分配的特點(diǎn),同時(shí)考慮到以上存在的問(wèn)題,本文采用了時(shí)間片下基于改進(jìn)灰狼優(yōu)化(Grey Wolf Optimization, GWO)算法[7]的任務(wù)分配方法。通過(guò)對(duì)UCAV編隊(duì)信息和任務(wù)目標(biāo)信息的分析,提出了基于時(shí)間片的多約束動(dòng)態(tài)任務(wù)分配模型;針對(duì)動(dòng)態(tài)任務(wù)分配數(shù)學(xué)模型,采用了自適應(yīng)灰狼優(yōu)化(Self-Adaptive GWO, SAGWO)算法進(jìn)行求解;最后進(jìn)行了仿真驗(yàn)證。

1 UCAVs動(dòng)態(tài)任務(wù)分配模型

假設(shè)攻擊目標(biāo)的L枚導(dǎo)彈構(gòu)成集合K={k,k=1,2,…,L},則UCAV編隊(duì)的第k枚導(dǎo)彈與無(wú)人機(jī)Vi的第l枚導(dǎo)彈對(duì)應(yīng)的關(guān)系為

(1)

式中:i={1,2,…,M};l={1,2,…,Li}。

1.1 UCAV優(yōu)勢(shì)概率

UCAV對(duì)目標(biāo)的優(yōu)勢(shì)概率與UCAV距離威脅因子、速度威脅因子和角度威脅因子有關(guān)。UCAV編隊(duì)中Vi對(duì)目標(biāo)Tj的優(yōu)勢(shì)概率可以表示為

PKij=c1Tij,DTij,θ+c2Tij,v

(2)

式中:c1和c2分別為無(wú)人機(jī)Vi相對(duì)任務(wù)目標(biāo)Tj的距離-角度威脅和速度威脅的權(quán)重;Tij,D、Tij,θ和Tij,v分別為距離威脅概率、角度威脅概率和速度威脅概率[8]。

距離威脅概率為

(3)

式中:dij為Vi相對(duì)于Tj的距離;rW為我方UCAV導(dǎo)彈的有效作用距離;RWmax為UCAV的最大跟蹤距離。

角度威脅概率為

Tij,θ=exp(-λ1(πθij/180)λ2)

(4)

式中:θij為UCAV速度方向與視線之間的夾角;λ1和λ2為正常數(shù)。

速度威脅概率為

(5)

式中:vi和vTj分別為第i個(gè)UCAV和任務(wù)目標(biāo)Tj的速度矢量。

1.2 任務(wù)威脅分析

戰(zhàn)場(chǎng)目標(biāo)威脅信息分析對(duì)UCAV執(zhí)行任務(wù)成功率是非常重要的。對(duì)于目標(biāo)威脅特性,將目標(biāo)威脅分為探測(cè)類(lèi)目標(biāo)威脅和殺傷類(lèi)武器威脅[9]。探測(cè)類(lèi)目標(biāo)威脅一般指雷達(dá)威脅,殺傷類(lèi)武器威脅包括地空導(dǎo)彈和高炮,其威脅概率采用文獻(xiàn)[7]的模型。

當(dāng)UCAV在多目標(biāo)威脅空間中執(zhí)行任務(wù)時(shí),面臨的威脅程度增加。這種威脅程度增加的原因不僅僅是由于多個(gè)威脅源獨(dú)立探測(cè)和殺傷的疊加效果,而且是由于整個(gè)目標(biāo)網(wǎng)絡(luò)化信息管理與共享。因此,提出了目標(biāo)依賴矩陣來(lái)反映目標(biāo)之間的關(guān)系[10]。

定義1AN×N為目標(biāo)內(nèi)部之間依賴矩陣。矩陣元素aij為第i個(gè)目標(biāo)對(duì)第j個(gè)目標(biāo)的依賴程度,也可以說(shuō)第j個(gè)目標(biāo)對(duì)第i目標(biāo)的信息共享或者火力支援能力。

對(duì)于多個(gè)目標(biāo)的威脅,考慮到目標(biāo)之間相互支援的情況,則目標(biāo)對(duì)UCAV的威脅概率為

PTij=[1-∏ (1-aik,DPD(k,j))]·

[1-∏ (1-aim,GPG(m,j))]

(6)

式中:PTij為目標(biāo)i對(duì)無(wú)人作戰(zhàn)飛機(jī)j的威脅概率;aik,D為任務(wù)目標(biāo)中探測(cè)類(lèi)武器對(duì)其他武器的依賴程度;aim,G為任務(wù)目標(biāo)中攻擊類(lèi)武器對(duì)其他武器的依賴程度;PD(k,j)為單個(gè)探測(cè)類(lèi)武器的威脅概率;PG(m,j)為單個(gè)攻擊類(lèi)武器的威脅概率(包括地空導(dǎo)彈威脅概率與高炮威脅概率)。

對(duì)于攻擊類(lèi)目標(biāo),考慮到信息資源相互共享與火力支援,同時(shí)其威脅過(guò)程是即發(fā)現(xiàn)就攻擊,探測(cè)概率為1,因此,只計(jì)算攻擊類(lèi)目標(biāo)對(duì)UCAV的威脅概率:

PTij=1-∏ (1-aim,GPG(m,j))

(7)

1.3 任務(wù)時(shí)間分析

UCAV完成任務(wù)的時(shí)間主要是根據(jù)任務(wù)類(lèi)型、可執(zhí)行該任務(wù)的UCAV特性及載荷類(lèi)型等先驗(yàn)經(jīng)驗(yàn)得到完成各項(xiàng)任務(wù)的統(tǒng)計(jì)時(shí)間。觀測(cè)某一時(shí)刻的分配情況、任務(wù)目標(biāo)對(duì)UCAV的威脅、UCAV對(duì)任務(wù)目標(biāo)的殺傷情況以及完成任務(wù)的效果需要引入時(shí)間片這個(gè)概念。

定義2任務(wù)時(shí)間片[11]是指對(duì)事件變量集的某一次觀察。在協(xié)同攻擊多目標(biāo)的任務(wù)分配問(wèn)題中,時(shí)間片就是每隔一定的時(shí)間去觀測(cè)UCAV的任務(wù)情況。時(shí)間片的間隔越小,意味著系統(tǒng)觀測(cè)分配結(jié)果、目標(biāo)威脅程度、UCAV的殺傷情況以及對(duì)各方兵力信息的統(tǒng)計(jì)分析頻率越高,那么決策越精細(xì),其實(shí)時(shí)性提高;但是間隔小的時(shí)間片會(huì)引起信息量的增大,系統(tǒng)處理數(shù)據(jù)的時(shí)間增長(zhǎng),不利于戰(zhàn)場(chǎng)快速?zèng)Q策,因此,要選取一定任務(wù)時(shí)間片是分配決策的關(guān)鍵問(wèn)題。

定義3UCAV飛行矩陣Tfly是(M+N)×N矩陣,行包含UCAV和目標(biāo),列包含目標(biāo),tij表示節(jié)點(diǎn)i到節(jié)點(diǎn)j的時(shí)間消耗。Tfly取決于UCAV的速度和位置、任務(wù)目標(biāo)的位置以及其機(jī)動(dòng)性,Tfly可表示為

對(duì)于Tfly元素tij的計(jì)算主要與在時(shí)間片結(jié)束時(shí)刻UCAV的速度和位置、任務(wù)目標(biāo)的位置有關(guān),如下:

(8)

定義4任務(wù)累計(jì)完成時(shí)間ti[12]是指第i個(gè)UCAV在執(zhí)行任務(wù)集Si={Ti,1,Ti,2,…,Ti,j}的累計(jì)完成時(shí)間。ti可表示為

ti=tiTi,1+tTi,1Ti,2+…+tTi,j-1Ti,j

(9)

式中:tiTi,1、tTi,1Ti,2和tTi,j-1Ti,j分別為第i個(gè)UCAV從所在位置節(jié)點(diǎn)到目標(biāo)Ti,1節(jié)點(diǎn)的時(shí)間、Ti,1到Ti,2的時(shí)間和Ti,j-1到Ti,j的時(shí)間。

1.4 協(xié)同任務(wù)分配評(píng)價(jià)指標(biāo)

UCAVs協(xié)同對(duì)地攻擊任務(wù)目標(biāo)是以整個(gè)編隊(duì)的作戰(zhàn)效能作為最優(yōu)目標(biāo),而評(píng)價(jià)整個(gè)編隊(duì)的作戰(zhàn)效能指標(biāo)有目標(biāo)價(jià)值毀傷(Target Value Damage,TVD)、UCAV編隊(duì)損耗代價(jià)(UCAV attrition)和執(zhí)行任務(wù)預(yù)計(jì)消耗時(shí)間(Task Expending Time,TET)。

1) 目標(biāo)價(jià)值毀傷最大化

無(wú)人機(jī)Vi完成任務(wù)Tj的目標(biāo)毀傷收益值的大小體現(xiàn)了任務(wù)的重要程度和UCAV的執(zhí)行能力,也可以量化目標(biāo)價(jià)值毀傷值。編隊(duì)對(duì)多目標(biāo)的協(xié)同打擊中,產(chǎn)生總的價(jià)值毀傷為

(10)

式中:f1為編隊(duì)完成任務(wù)目標(biāo)的價(jià)值毀傷;VTj表示摧毀目標(biāo)Tj獲得的價(jià)值量,其由指揮人員預(yù)先設(shè)定,在作戰(zhàn)過(guò)程中隨著態(tài)勢(shì)的變化和作戰(zhàn)意圖的變化可以進(jìn)行調(diào)整。

2) UCAV編隊(duì)損耗代價(jià)最小化

如果在UCAV編隊(duì)中無(wú)人機(jī)攜帶軟殺傷武器,那么無(wú)人機(jī)會(huì)因?yàn)槠垓_和干擾設(shè)備而增大無(wú)人機(jī)的生存概率。假設(shè)第i架無(wú)人機(jī)Vi攜帶ni個(gè)欺騙和干擾設(shè)備,則該機(jī)的損耗代價(jià)為

(11)

式中:VVi為無(wú)人機(jī)Vi的價(jià)值量。

在整個(gè)UCAV編隊(duì)攻擊過(guò)程中所遭受的損耗代價(jià)為

(12)

3) 任務(wù)時(shí)間消耗最短

執(zhí)行任務(wù)的時(shí)間可以用UCAV與任務(wù)目標(biāo)間的距離來(lái)衡量,距離目標(biāo)越短,則執(zhí)行任務(wù)消耗的時(shí)間越短。任務(wù)消耗時(shí)間最短模型如下:

(13)

式中:f3為任務(wù)時(shí)間消耗指標(biāo)。

4) 總評(píng)價(jià)指標(biāo)

在多機(jī)協(xié)同過(guò)程中,設(shè)計(jì)總評(píng)價(jià)指標(biāo)函數(shù)時(shí),考慮到任務(wù)目標(biāo)價(jià)值毀傷最大化、UCAV編隊(duì)損耗代價(jià)最小化以及任務(wù)時(shí)間消耗最短,因此,分配模型的總體評(píng)價(jià)指標(biāo)函數(shù)為

(14)

式中:J(Π)為UCAV編隊(duì)協(xié)同攻擊多目標(biāo)的總體評(píng)價(jià)指標(biāo)函數(shù),Π為分配方案;ω1和ω2分別為衡量減少UCAV代價(jià)損耗和時(shí)間損耗的權(quán)重,其來(lái)源于決策者的偏好。協(xié)同攻擊多目標(biāo)分配問(wèn)題實(shí)質(zhì)就是尋找一個(gè)方案Π使評(píng)價(jià)指標(biāo)函數(shù)最小,使問(wèn)題轉(zhuǎn)化為尋優(yōu)問(wèn)題。

約束條件:

2)X1j+X2j+…+XLj=1,不允許多個(gè)UCAV導(dǎo)彈攻擊同一個(gè)任務(wù)目標(biāo)。

3)ci≤Li,單架UCAV執(zhí)行任務(wù)數(shù)量ci不超過(guò)UCAV可攜帶最大導(dǎo)彈數(shù)量Li。

4) 由于UCAV性能和掛架的限制,UCAV和其掛載的武器或者導(dǎo)彈之間存在約束,UCAV影響武器效能的發(fā)揮可以用UCAV-武器適應(yīng)度表進(jìn)行描述,該適應(yīng)度表中的元素用[0,1]之間的數(shù)表示,數(shù)值的大小表示武器攻擊效能發(fā)揮程度,數(shù)值越小表明UCAV越不利于武器的發(fā)揮。

2 自適應(yīng)灰狼優(yōu)化算法

2.1 基本GWO算法及改進(jìn)策略

受灰狼的社會(huì)等級(jí)制度和獵食行為的啟發(fā),Seyedali等提出了GWO算法[14]。同其他啟發(fā)式優(yōu)化算法相比,GWO算法具有實(shí)現(xiàn)簡(jiǎn)單、全局優(yōu)化能力強(qiáng)、收斂速度快等特點(diǎn),一經(jīng)提出便受到了眾多學(xué)者的關(guān)注與研究[15-17]。

在尋找最優(yōu)解過(guò)程中,根據(jù)灰狼獵食的3個(gè)重要步驟,即接近、包圍、攻擊獵物,GWO算法建立了一個(gè)數(shù)學(xué)模型:狼群中每一個(gè)個(gè)體都是一個(gè)潛在解,其中α狼的位置是最好的解,β和δ的位置分別為優(yōu)解和次優(yōu)解,其他的候選解是ω的位置。獵食過(guò)程如圖1所示,C1、C2和C3分別為α、β和δ狼的位置系數(shù);a1、a2、a3分別為α、β和δ狼的控制參數(shù);Dα、Dβ和Dδ分別為α、β和δ狼到ω狼的距離。在文獻(xiàn)[14]中,通過(guò)大量的仿真實(shí)驗(yàn)表明,GWO在函數(shù)優(yōu)化問(wèn)題時(shí)具有較快的收斂速度,但是控制參數(shù)a線性變化忽略了要解決的優(yōu)化問(wèn)題多樣性,尤其在解決多峰值函數(shù)問(wèn)題時(shí)容易陷入局部最優(yōu),很難達(dá)到全局最優(yōu)。

針對(duì)以上缺點(diǎn)與不足,本文提出了自適應(yīng)調(diào)整策略,通過(guò)學(xué)習(xí)種群最優(yōu)位置信息去控制種群的搜索方向;另一方面,改進(jìn)算法利用最優(yōu)個(gè)體與當(dāng)前個(gè)體之間的位置矢量差,跳出局部最優(yōu)區(qū)域來(lái)保持種群多樣性。對(duì)于控制參數(shù)a(包括a1、a2和a3)來(lái)說(shuō),根據(jù)文獻(xiàn)[18-20]的分析,為了確保算法在多種條件下具有好的優(yōu)化結(jié)果,a采用二次曲線策略。

1) 自適應(yīng)調(diào)整策略

為了進(jìn)一步提高算法的收斂速度,采用自適應(yīng)調(diào)整策略,將當(dāng)前個(gè)體的適應(yīng)度值Ji與灰狼群的平均適應(yīng)度值Javg進(jìn)行比較,如果Ji優(yōu)于Javg,繼續(xù)使用原策略更新灰狼位置;如果Ji次于Javg,利用式(15)變異灰狼位置[7]。

X(g+1)=

(15)

式中:X(g+1)為第g代位置更新后的灰狼位置,即第g+1代灰狼位置,g為當(dāng)前迭代次數(shù);X1、X2和X3分別為當(dāng)前灰狼到α、β和δ灰狼的距離;aJ為1/Jα、1/Jβ與1/Jδ之和,Jα、Jβ和Jδ分別為α、β和δ的適應(yīng)度值。

2) 跳出局部最優(yōu)策略

針對(duì)原種群多樣性較差,該策略對(duì)更新后的位置進(jìn)行重置,通過(guò)最優(yōu)個(gè)體與當(dāng)前個(gè)體之間的位置矢量差隨機(jī)控制當(dāng)前個(gè)體不在當(dāng)前局部最優(yōu)解的區(qū)域內(nèi)[21]:

(16)

3) 控制參數(shù)非線性調(diào)整策略

對(duì)于基本的GWO算法,選擇二次曲線來(lái)設(shè)計(jì)控制參數(shù)a的調(diào)整策略。利用二次曲線在區(qū)間[0,1]上非線性遞增,將GWO算法的迭代次數(shù)映射到[0,1]上,控制參數(shù)調(diào)整策略為

a=amax-(amax-amin)(g/gmax)2

(17)

式中:amax和amin分別為控制參數(shù)的最大值和最小值,一般分別取2和0;gmax為最大迭代次數(shù)。

2.2 SAGWO算法流程

由于GWO存在收斂速度慢,容易陷入局部最優(yōu)的缺點(diǎn),結(jié)合上面策略,提出了SAGWO算法。下面給出了SAGWO算法的流程:

步驟1初始化灰狼種群,即隨機(jī)產(chǎn)生n個(gè)智能個(gè)體的位置;初始化a、距離系數(shù)A和位置系數(shù)C[14];初始化Xα、Xβ和Xδ的值。

步驟2處理越界智能個(gè)體,計(jì)算每個(gè)智能體的適應(yīng)度值,計(jì)算灰狼群的平均適應(yīng)度值Javg。

步驟3更新當(dāng)前迭代期間的Xα、Xβ和Xδ。

步驟4根據(jù)式(17),計(jì)算各個(gè)優(yōu)解的a、A和C。

步驟5采用式(15)的策略更新當(dāng)前智能個(gè)體的位置。

步驟6通過(guò)式(16),使智能個(gè)體跳出局部最優(yōu)解的區(qū)域。

步驟7輸出最優(yōu)解Xα和最優(yōu)值Jα。

步驟8如果達(dá)到結(jié)束條件(最大迭代次數(shù)或連續(xù)5次結(jié)果相差小于一定的精度),則結(jié)束;否則轉(zhuǎn)到步驟2。

2.3 SAGWO算法的收斂性分析

條件1若f(Fal(x,ξ))≤f(x),且ξ∈S,則有f(Fal(x,ξ))≤f(ξ)。

其中:xk+1=Fal(xk,ξ)為下一次迭代結(jié)果;S為解空間;f為優(yōu)化函數(shù);ξ為迭代過(guò)程中得到的解;v(B)為集合B的Lebesgue測(cè)度;uk(B)為算法Fal第k次迭代解在集合B上的概率測(cè)度。

定理1SAGWO算法收斂于全局最優(yōu)。

證明首先,SAGWO算法每次迭代都保存了灰狼群體的最優(yōu)位置,保證了目標(biāo)函數(shù)的適應(yīng)度值的非增性,所以算法的收斂滿足條件1。

其次,再需要證明SAGWO算法滿足條件2,便可根據(jù)文獻(xiàn)[23]的隨機(jī)優(yōu)化算法收斂定理,得到SAGWO算法收斂于全局最優(yōu)。根據(jù)文獻(xiàn)[14]的灰狼群體位置更新公式轉(zhuǎn)換,可得

(18)

式中:X1(g)為更新X(g)而產(chǎn)生與最優(yōu)解有關(guān)的中間變量;r1與r2為隨機(jī)變量。

由式(18)對(duì)每一代左右累乘,可得

(19)

(20)

根據(jù)式(19)與式(20),可得

(21)

因此必有

(22)

同理可得,優(yōu)解、次優(yōu)解、X2與X3收斂于最優(yōu)解Xα。由式(15)可知,當(dāng)g→∞時(shí),X(g+1)收斂于最優(yōu)解Xα。

SAGWO算法的單個(gè)灰狼智能體搜素空間是有限的,則由n個(gè)灰狼組成的群體的狀態(tài)也是有限的。當(dāng)前的群體狀態(tài)僅與上一時(shí)刻的群體狀態(tài)有關(guān),所以,狼群狀態(tài)具有Markov性。狼群的轉(zhuǎn)移狀態(tài)與時(shí)間g無(wú)關(guān),則狼群位置的狀態(tài)序列是齊次的。綜上述分析,狼群位置的狀態(tài)序列是有限齊次Markov鏈。

設(shè)優(yōu)化問(wèn)題的全局最優(yōu)解為Xα,定義狼群位置的最優(yōu)狀態(tài)集為

H={q=(Xα1,Xα2,…,Xαn)}

(23)

對(duì)于狼群狀態(tài)序列{Xα(t);g≥0},最優(yōu)狀態(tài)集H是群體狀態(tài)空間S上的一個(gè)閉集。由式(22)和狼群狀態(tài)序列是有限齊次Markov鏈可知,S中不存在H之外的非閉空間,即群體狀態(tài)序列必將進(jìn)入最優(yōu)狀態(tài)集H,連續(xù)無(wú)窮次搜索不到全局最優(yōu)解的可能性是0,則滿足2.3節(jié)條件2,故SAGWO算法收斂于全局最優(yōu)。

證畢

2.4 SAGWO算法的復(fù)雜度分析

根據(jù)SAGWO算法的特點(diǎn)與執(zhí)行步驟,在這里討論算法每一步時(shí)間復(fù)雜度。在2.2節(jié)的步驟1中,對(duì)D維空間下的n個(gè)灰狼進(jìn)行初始化,需要nD次運(yùn)算;在步驟2中,計(jì)算狼群的適應(yīng)度值需要n次運(yùn)算,一般的適應(yīng)度函數(shù)的復(fù)雜度為O(D),還要計(jì)算種群適應(yīng)度值平均值,需要n次運(yùn)算;在步驟3中,通過(guò)比較得到3個(gè)優(yōu)解,最多需要3n-3次運(yùn)算;在步驟4中,計(jì)算更新各個(gè)優(yōu)解的a、A和C需要3nD;在步驟5中,計(jì)算各個(gè)狼到Xα、Xβ和Xδ的距離需要3nD次運(yùn)算,根據(jù)式(15)需要D+n,包括計(jì)算更新位置與比較;在步驟6中,跳出局部最優(yōu)策略需要nD;在步驟7和8中,輸出最優(yōu)解與判斷算法是否滿足終止條件,其復(fù)雜度均為常數(shù)。由于算法最多執(zhí)行g(shù)次,則SAGWO算法的時(shí)間復(fù)雜度為O(((3n+1)·D+n)g)≈O(3nDg)。

3 UCAVs動(dòng)態(tài)任務(wù)分配方法

3.1 目標(biāo)任務(wù)序列編碼

在GWO算法中,每個(gè)智能個(gè)體就是一個(gè)備選解,多個(gè)智能個(gè)體通過(guò)種群搜索和其位置更新來(lái)尋優(yōu)。協(xié)同攻擊多目標(biāo)的任務(wù)決策關(guān)鍵在于確定:哪架UCAV來(lái)執(zhí)行哪些任務(wù)和UCAV執(zhí)行任務(wù)的時(shí)序[23]。

3.2 多目標(biāo)動(dòng)態(tài)任務(wù)分配流程

UCAV在執(zhí)行任務(wù)過(guò)程中,所有的元素都可能隨著時(shí)間發(fā)生變化。設(shè)定動(dòng)態(tài)的任務(wù)分配的適應(yīng)度函數(shù)為

J(Π(t),t)=

(24)

其中:Xmissile-T(t)為UCAV攜帶的導(dǎo)彈對(duì)任務(wù)目標(biāo)的分配方案;Xorder(t)為UCAV執(zhí)行任務(wù)的順序方案;t表示執(zhí)行任務(wù)中的時(shí)刻。

具體基于SAGWO算法的UCAV協(xié)同攻擊多目標(biāo)動(dòng)態(tài)任務(wù)分配流程如下:

步驟1定義任務(wù)時(shí)間片長(zhǎng)度tslice。根據(jù)估算最小的任務(wù)飛行時(shí)間min(tij),將其劃分為nt個(gè)時(shí)間片,因此,可以計(jì)算得到

(25)

步驟2初始化UCAV與目標(biāo)的信息。在分配開(kāi)始之前,獲取初始UCAV的位置、數(shù)量、速度以及其武器信息,探測(cè)得到目標(biāo)的位置、數(shù)量和機(jī)動(dòng)性。計(jì)算目標(biāo)的威脅概率和UCAV對(duì)目標(biāo)的毀傷概率。

步驟3初始化參數(shù)。設(shè)置GWO的基本參數(shù),控制參數(shù)最大值amax和最小值amin,GWO參數(shù)A、C,搜索方程的慣性權(quán)重ω,最大迭代次數(shù)gmax,搜索空間智能個(gè)體數(shù)為nagent。

步驟4隨機(jī)生成一組實(shí)數(shù)然后基于編碼生成初始分配方案。

步驟5當(dāng)t=0時(shí),根據(jù)2.2節(jié)的步驟2~步驟8,計(jì)算初始最優(yōu)分配方案。

步驟6UCAV根據(jù)初始分配方案,對(duì)將要執(zhí)行的任務(wù)目標(biāo)進(jìn)行動(dòng)態(tài)追蹤。

步驟7在第一個(gè)時(shí)間片開(kāi)始時(shí),獲取UCAV失效信息與目標(biāo)是否發(fā)生變化。

步驟8在時(shí)間片內(nèi),根據(jù)變化的信息,隨機(jī)生成一組分配方案,重復(fù)步驟5,尋求信息變化后的最優(yōu)分配方案。

步驟9在時(shí)間片末,根據(jù)步驟8的最優(yōu)方案,利用追蹤法更新UCAV的位置信息,并且輸出最優(yōu)分配結(jié)果。

步驟10在下一個(gè)時(shí)間片或者在t+tslice時(shí)刻,重復(fù)步驟7~步驟9,直到t≥min(tij)或者開(kāi)始執(zhí)行航路規(guī)劃層的時(shí)候,輸出最終結(jié)果。

4 仿真實(shí)驗(yàn)及分析

4.1 任務(wù)想定

為驗(yàn)證算法的有效性,針對(duì)6架UCAV對(duì)8個(gè)具有威脅的敵方目標(biāo)的任務(wù)分配進(jìn)行仿真實(shí)驗(yàn),如圖3所示,x和y分別為橫向和縱向坐標(biāo)。其中,UCAV編隊(duì)擁有6架無(wú)人機(jī),每架無(wú)人機(jī)攜帶2枚空地導(dǎo)彈,其攻擊目標(biāo)的任務(wù)是毀傷目標(biāo),相關(guān)屬性見(jiàn)表1和表2;敵方由雷達(dá)(Radar)、SAM(Surface-to-Air Missile)防空導(dǎo)彈和AAGun(Anti-Aircraft Gun)防空炮3種類(lèi)型目標(biāo)組成,每個(gè)目標(biāo)最多只能被我方1個(gè)UCAV攻擊,其相關(guān)屬性見(jiàn)表3和表4。A型空對(duì)地導(dǎo)彈的性能參數(shù):有效作用距離rW-A=10 km、最大跟蹤距離RWmax-A=60 km;B型空對(duì)地導(dǎo)彈的性能參數(shù):rW-B=10 km、RWmax-B=80 km。表2表示UCAV與機(jī)載導(dǎo)彈之間約束。

UCAV 位置/km導(dǎo)彈數(shù)量×型號(hào)軟殺傷武器數(shù)量速度/(m·s-1)價(jià) 值 量V1(35,0)2×A-AGM22380.8V2(40,6)2×B-AGM12380.9V3(48,10)2×A-AGM22380.95V4(54,9)2×B-AGM12380.95V5(62,6)2×A-AGM22380.85V6(67,0)2×B-AGM02380.8

表2 UCAV的武器適應(yīng)度

表3 目標(biāo)信息設(shè)置

表4 目標(biāo)間依賴矩陣

表3表示敵方目標(biāo)的編號(hào)、類(lèi)型、位置信息以及價(jià)值量,由文獻(xiàn)[7,9]可知,雷達(dá)目標(biāo)性能參數(shù):雷達(dá)參數(shù)KR=1.0×1012m4,最大作用距離Rmax=100 km;防空導(dǎo)彈SAM性能參數(shù):殺傷區(qū)近界水平距離dsj=30 km,殺傷區(qū)遠(yuǎn)界水平距離dsy=100 km;高炮AAGun性能參數(shù):有效火力半徑Rg=10 km,圓錐死界半徑rg=0.9 km。表4表示目標(biāo)間相互支援能力。

SAGWO算法和GWO算法種群數(shù)大小設(shè)置為30,迭代次數(shù)為100次,控制參數(shù)值的最大值amax、最小值amin分別取值為2和0。對(duì)于IPSO、ACA、GA、GWO算法,其算法參數(shù)設(shè)置與文獻(xiàn)[7]相同,便于比較參考。

任務(wù)分配模型中的威脅優(yōu)勢(shì)權(quán)重c1和c2分別為0.6和0.4,總體評(píng)價(jià)指標(biāo)函數(shù)中的衡量減少UCAV代價(jià)損耗和時(shí)間損耗的權(quán)重ω1和ω2分別為0.6和0.4。

本文采用MATLAB 2014a進(jìn)行仿真,運(yùn)行環(huán)境為Inter(R)Core(TM)i5-3470處理器,操作系統(tǒng)為Windows7。

4.2 靜態(tài)任務(wù)分配仿真

為了驗(yàn)證SAGWO算法的求解有效性,對(duì)該實(shí)驗(yàn)運(yùn)行30次,得到最優(yōu)分配方案、算法耗時(shí)和平均最優(yōu)函數(shù)值。根據(jù)優(yōu)勢(shì)概率模型,計(jì)算得到我方無(wú)人機(jī)編隊(duì)各個(gè)UCAV對(duì)敵方目標(biāo)的優(yōu)勢(shì)概率,如表5所示;根據(jù)目標(biāo)對(duì)UCAV的威脅模型,求出各目標(biāo)對(duì)UCAV的威脅概率,如表6所示。

仿真結(jié)果:SAGWO算法耗時(shí)為0.281 06 s,最優(yōu)函數(shù)值為0.733 8,最優(yōu)任務(wù)分配結(jié)果如表7所示,具體分配如圖4所示。

由圖5可知,最優(yōu)適應(yīng)度值隨著迭代次數(shù)的增加,漸趨于穩(wěn)定,在第42代以后最優(yōu)適應(yīng)度值基本不再變化,其值為0.733 8;平均函數(shù)值也隨著迭代次數(shù)增加而趨于穩(wěn)定,雖然有微小波動(dòng),但是總體趨勢(shì)不再變化。由圖6可知,任務(wù)分配的各個(gè)指標(biāo)值在最開(kāi)始有波動(dòng),但是隨著迭代次數(shù)增加,各指標(biāo)值區(qū)趨于穩(wěn)定,編隊(duì)損耗代價(jià)值隨著迭代增加而減小,目標(biāo)價(jià)值毀傷值相對(duì)原來(lái)變化不大,任務(wù)時(shí)間消耗值比迭代初期減少,基本符合任務(wù)分配的目標(biāo)毀傷最大化、編隊(duì)損耗最小化、任務(wù)時(shí)間消耗最小化的原則。綜合以上分析,SAGWO算法對(duì)任務(wù)分配問(wèn)題是有效的。

表5 UCAV對(duì)目標(biāo)的優(yōu)勢(shì)概率Table 5 Advantage probability of UCAV to target

表6 目標(biāo)對(duì)UCAV的威脅概率

表7 UCAVs最優(yōu)任務(wù)分配

為了驗(yàn)證改進(jìn)算法的求解質(zhì)量與求解穩(wěn)定性,將SAGWO算法與IPSO、ACO、GA、GWO算法相比較[7],并且應(yīng)用于不同規(guī)模。從圖7可以分析出,在分配方案變化不大的基礎(chǔ)上,5種算法的最優(yōu)函數(shù)值隨著迭代次數(shù)的增加漸漸趨于穩(wěn)定,只是求解精度與求解速度不一樣,GWO、ACO和IPSO算法相對(duì)于其他2種算法過(guò)早的收斂,陷入局部最優(yōu);GA算法在58代時(shí)達(dá)到最優(yōu)解,但是收斂速度較慢,SAGWO算法在43代達(dá)到最優(yōu)解,相較于GA算法收斂速度較快。圖8是針對(duì)不同規(guī)模的任務(wù)分配問(wèn)題,采用不同算法的優(yōu)化時(shí)間對(duì)比結(jié)果,從其可以看出,基于各個(gè)算法的任務(wù)分配優(yōu)化時(shí)間隨著任務(wù)分配規(guī)模增加而增加,其中GA、ACO、IPSO算法對(duì)問(wèn)題規(guī)模增加更加敏感,優(yōu)化時(shí)間增加得更快,而SAGWO算法與GWO算法的優(yōu)化時(shí)間增加程度基本上一樣。通過(guò)以上基于不同算法的任務(wù)分配實(shí)驗(yàn),進(jìn)一步驗(yàn)證了SAGWO算法的求解穩(wěn)定性和有效性,也驗(yàn)證了SAGWO算法的求解精度好于其他4種算法,而且優(yōu)化時(shí)間也好于GA、ACO、IPSO算法。

4.3 動(dòng)態(tài)任務(wù)分配仿真

1) 基于目標(biāo)移動(dòng)的動(dòng)態(tài)任務(wù)分配仿真

為了驗(yàn)證基于目標(biāo)移動(dòng)的動(dòng)態(tài)任務(wù)分配有效性,對(duì)6架UCAV編隊(duì)攻擊8目標(biāo)的動(dòng)態(tài)任務(wù)分配實(shí)驗(yàn)運(yùn)行30次,得到一定時(shí)間片末的最優(yōu)分配方案、算法耗時(shí)和平均最優(yōu)函數(shù)值。首先通過(guò)UCAV飛行時(shí)間矩陣定義得到表8,根據(jù)時(shí)間片定義與分析,確定最小飛行時(shí)間min(tij)和時(shí)間片數(shù)nt分別為279.3和270,得到時(shí)間片長(zhǎng)度為1 s(取整數(shù),方便計(jì)算),滿足大于每次任務(wù)分配優(yōu)化時(shí)間。其次設(shè)置機(jī)動(dòng)目標(biāo)參數(shù),如表9所示,合速度為x、y方向速度平方和的開(kāi)方。在實(shí)驗(yàn)中,取定前240個(gè)時(shí)間片進(jìn)行仿真與分析,首先對(duì)整個(gè)過(guò)程的動(dòng)態(tài)任務(wù)分配進(jìn)行分析,選取240個(gè)時(shí)間片其中的4個(gè)時(shí)間片與0時(shí)刻進(jìn)行對(duì)比分析,然后對(duì)240個(gè)時(shí)間片的函數(shù)值曲線進(jìn)行分析,最后對(duì)第240個(gè)時(shí)間片優(yōu)化函數(shù)值曲線和指標(biāo)值變化曲線進(jìn)行分析。

圖9和表10是針對(duì)基于目標(biāo)移動(dòng)的動(dòng)態(tài)任務(wù)分配問(wèn)題的任務(wù)分配圖和其中5個(gè)時(shí)間片的任務(wù)分配方案。從圖9可以看出,經(jīng)過(guò)240個(gè)時(shí)間片,UCAV根據(jù)自己的優(yōu)勢(shì)去攻擊相應(yīng)的目標(biāo),分配結(jié)果比較均勻。表10中的5個(gè)時(shí)間片任務(wù)分配方案隨著時(shí)間片的變化,其有一定的變動(dòng),這是因?yàn)槟繕?biāo)位置發(fā)生變化,UCAV也發(fā)生變化,導(dǎo)致分配方案也發(fā)生變化。

表8 UCAV飛行時(shí)間矩陣

表9 機(jī)動(dòng)目標(biāo)速度

表11是針對(duì)基于目標(biāo)移動(dòng)的動(dòng)態(tài)任務(wù)分配問(wèn)題選取其中5個(gè)時(shí)間片的優(yōu)化時(shí)間和適應(yīng)度值進(jìn)行比較分析,圖10表示240個(gè)時(shí)間片的平均函數(shù)值與最優(yōu)函數(shù)值隨時(shí)間片變化的曲線。通過(guò)以上結(jié)果分析,隨著時(shí)間變化,基于移動(dòng)目標(biāo)的任務(wù)分配方法是有效的,而且任務(wù)分配方案也是變化的。圖11為第240個(gè)時(shí)間片的最優(yōu)適應(yīng)度值、平均值以及各評(píng)價(jià)指標(biāo)值隨迭代次數(shù)增加的變化趨勢(shì)。通過(guò)圖11的結(jié)果分析,時(shí)間片內(nèi)基于SAGWO算法的任務(wù)分配是有效的,而且趨于穩(wěn)定,得到最優(yōu)值。

2) 基于UCAV失效的動(dòng)態(tài)任務(wù)分配仿真

在第240個(gè)時(shí)間片,V4被擊傷,退出戰(zhàn)場(chǎng),通過(guò)仿真實(shí)驗(yàn),得到表12、表13和圖12。表12中“0”表示無(wú)目標(biāo)可執(zhí)行。從表13的仿真結(jié)果可以知道,隨著UCAV減少一架,優(yōu)化時(shí)間消耗也減少。從圖12中可以看出,隨著迭代次數(shù)的增加,最優(yōu)函數(shù)值和平均函數(shù)值趨于穩(wěn)定,任務(wù)分配的各個(gè)指標(biāo)值也漸趨于穩(wěn)定,而且其值走向符合編隊(duì)損耗代價(jià)值最小化、任務(wù)時(shí)間消耗最小化和目標(biāo)價(jià)值毀傷最小化的原則。

時(shí)間/sV1V2V3V4V5V60T1T 3, T 2T 4T 5, T 8T 7T 660T 2T 1, T 3T 4T 5T 6, T 7T 8120T 3T 1, T 2T 4T 5T 6, T 7T 8180T 3, T 2T 1T 5T 4T 6T 8, T 7240T 3T 1, T 2T 5T 4T 6T 8, T 7

表11 5個(gè)時(shí)間片的任務(wù)分配優(yōu)化時(shí)間消耗與適應(yīng)度值

UCAVV1V2V3V4V5V6失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后失效前失效后目 標(biāo)T3T4, T3T1, T2T1, T2T5T5T40T6T6T8, T7T8, T7

表13 一架UCAV失效前后的任務(wù)分配優(yōu)化結(jié)果對(duì)比

3) 基于新增2個(gè)目標(biāo)的動(dòng)態(tài)任務(wù)分配仿真

對(duì)新增2個(gè)目標(biāo)的性能參數(shù)如表14和表15所示。在第240個(gè)時(shí)間片之后,發(fā)現(xiàn)2個(gè)新目標(biāo)——T9和T10,通過(guò)仿真實(shí)驗(yàn),得到圖13、表16和表17。從表17可以看出,隨著在240時(shí)間片之后增加2目標(biāo),最優(yōu)函數(shù)值和種群平均函數(shù)值都增加,并且優(yōu)化時(shí)間消耗也增加。從圖13可知,任務(wù)分配的最優(yōu)函數(shù)值和平均函數(shù)值隨著迭代次數(shù)的增加趨于穩(wěn)定,任務(wù)分配的各個(gè)指標(biāo)值隨迭代次數(shù)增加而漸趨于穩(wěn)定,而且其值走向符合任務(wù)分配各指標(biāo)優(yōu)化原則,提高打擊敵方目標(biāo)效費(fèi)比。

表14 新增目標(biāo)的信息設(shè)置

表15 新增目標(biāo)依賴矩陣

表16 增加目標(biāo)前后的任務(wù)分配方案比較

表17 增加目標(biāo)前后的任務(wù)分配優(yōu)化結(jié)果對(duì)比

5 結(jié) 論

1) 針對(duì)UCAVs協(xié)同對(duì)地打擊多目標(biāo)任務(wù)分配問(wèn)題的實(shí)時(shí)性、高效性以及復(fù)雜性,對(duì)UCAV編隊(duì)信息以及對(duì)任務(wù)目標(biāo)信息進(jìn)行分析,設(shè)計(jì)了基于時(shí)間片的多約束動(dòng)態(tài)任務(wù)分配模型。

2) 傳統(tǒng)算法對(duì)動(dòng)態(tài)任務(wù)分配問(wèn)題求解速度慢、求解精度不高的缺點(diǎn),提出了一種基于SAGWO算法的動(dòng)態(tài)任務(wù)分配方法,同時(shí)證明了改進(jìn)算法全局收斂,并分析了時(shí)間復(fù)雜度。

3) 本文對(duì)所設(shè)計(jì)的基于SAGWO的任務(wù)分配從靜態(tài)與動(dòng)態(tài)2種情況進(jìn)行仿真驗(yàn)證。仿真結(jié)果表明,SAGWO算法可快速精確地求解出動(dòng)態(tài)任務(wù)分配,且分配結(jié)果符合作戰(zhàn)要求。由于篇幅有限,對(duì)于UCAVs武器分配尚且研究有限,需要進(jìn)一步深入研究。

猜你喜歡
灰狼編隊(duì)適應(yīng)度
2023年1月25日,美軍一次演習(xí)期間,空軍正在進(jìn)行編隊(duì)飛行
軍事文摘(2023年5期)2023-03-27 08:56:26
改進(jìn)的自適應(yīng)復(fù)制、交叉和突變遺傳算法
谷谷雞和小灰狼
灰狼的大大噴嚏
基于事件驅(qū)動(dòng)的多飛行器編隊(duì)協(xié)同控制
灰狼和老虎
基于空調(diào)導(dǎo)風(fēng)板成型工藝的Kriging模型適應(yīng)度研究
基于預(yù)測(cè)控制的無(wú)人機(jī)編隊(duì)內(nèi)部避碰
灰狼的幸福
多彈編隊(duì)飛行控制技術(shù)研究
天津市| 运城市| 响水县| 博客| 龙江县| 阿巴嘎旗| 武乡县| 宾阳县| 冀州市| 巨鹿县| 从江县| 南京市| 巴青县| 娱乐| 保靖县| 陆川县| 滕州市| 内黄县| 十堰市| 丰都县| 洛川县| 民乐县| 朝阳市| 虹口区| 海城市| 保亭| 乐东| 蚌埠市| 奉新县| 简阳市| 闸北区| 昭觉县| 松桃| 梅河口市| 台北县| 永嘉县| 潜山县| 新余市| 句容市| 灵丘县| 澄江县|