摘 要:提出一種考慮RMS因素的裝備論證多方案分析方法。建立裝備論證過(guò)程中的多方案分析框架,并給出裝備論證多方案分析指標(biāo)體系。通過(guò)分析對(duì)多方案具有影響的RMS和費(fèi)用因素建立這些因素的量化模型。結(jié)合基于數(shù)據(jù)包絡(luò)法的多方案分析模型及應(yīng)用示例,說(shuō)明方法的可行性和有效性。
關(guān)鍵詞:可靠性;維修性;保障性;裝備論證;多方案分析;數(shù)據(jù)包絡(luò)法
中圖分類(lèi)號(hào):E242 文獻(xiàn)標(biāo)志碼:A DOI:10.3969/j.issn.1673-3819.2024.04.003
引用格式:
呂學(xué)志,馮曉容,謝智歌.
考慮RMS因素的裝備論證多方案分析方法
.指揮控制與仿真,2024,46(4):22-27.
LYU X Z,F(xiàn)ENG X R,XIE Z G.
Analysis of alternatives for equipment demonstration considering RMS factors
.Command Control & Simulation,2024,46(4):22-27.
Analysis of alternatives for equipment demonstration considering RMS factors
LYU Xuezhi1, FENG Xiaorong2, XIE Zhige3
(1. Unit 32179 of PLA, Beijing 100021, China; 2. Unit 32180 of PLA, Beijing 100072, China;
3. Military Science Academy, Beijing 100091, China)
Abstract:This paper presents a method of equipment demonstration AoA method considering RMS factors. It puts forward the equipment demonstration AoA framework, and elaborates equipment demonstration AoA measure system. It analyses the RMS and cost factors, and establishes their quantitative models. An AoA model based on Data Envelopment Analysis (DEA) and an application example are given to illustrate the feasibility and effectiveness of the method.
Key words:reliability; maintainability; supportability; equipment demonstration; analysis of alternatives; data envelopment analysis
收稿日期: 2023-06-14修回日期: 2023-07-20
*基金項(xiàng)目:中國(guó)博士后科學(xué)基金(2017M613360)
作者簡(jiǎn)介: 呂學(xué)志(1979—),男,博士,副研究員,研究方向?yàn)樽鲬?zhàn)指揮。
馮曉容(1986—),男,碩士,助理研究員。
多方案分析(Analysis of Alternatives, AoA)是針對(duì)指定的某個(gè)或某些需求,研究各種可能方案的費(fèi)用、效能和風(fēng)險(xiǎn)的客觀分析活動(dòng)。多方案分析是武器裝備系統(tǒng)論證過(guò)程中的一個(gè)關(guān)鍵階段,主要目的是確定裝備備選方案是否具有完成任務(wù)的能力,其本質(zhì)上是一個(gè)涉及多個(gè)利益相關(guān)者的多準(zhǔn)則決策過(guò)程。
國(guó)內(nèi)外學(xué)者的多方案分析方法研究可分為以下幾個(gè)方面:一是框架研究。陳白雪分析了面向裝備論證的多方案分析內(nèi)涵,并從需求分析、可行性分析階段和方案分析及優(yōu)選三個(gè)階段構(gòu)建了面向裝備論證的多方案分析基本框架[1]。KRESS和MORGAN針對(duì)裝備論證多方案分析給出了具有廣泛適用性的分析框架[2]。二是方法研究。國(guó)內(nèi)學(xué)者采用的方法主要包括數(shù)據(jù)包絡(luò)法[3-7]、博弈論[8]、粗糙集[9]、模糊綜合評(píng)判[10]、協(xié)同論證[11]、層級(jí)分析法[12]。三是指標(biāo)體系研究。蔣鐵軍針對(duì)艦船裝備論證方案的綜合評(píng)估問(wèn)題,提出了一種較為系統(tǒng)而全面的綜合評(píng)估方法,建立了論證方案的評(píng)價(jià)指標(biāo)體系[13]。
根據(jù)研究現(xiàn)狀的分析,目前的裝備論證多方案分析方法在作戰(zhàn)效能分析中,通常將裝備固有能力作為其系統(tǒng)效能,沒(méi)有充分考慮裝備的可用性和任務(wù)成功性,而可用度和任務(wù)成功度與裝備可靠性(Reliability, R)、維修性(Maintainability, M)和保障性(Supportability, S)密切相關(guān)。因此,需要在多方案分析中充分考慮RMS因素。本文首先介紹裝備論證過(guò)程中的多方案分析框架,并給出裝備論證多方案指標(biāo)體系,然后介紹對(duì)多方案分析具有影響的RMS和費(fèi)用的因素及其量化模型,最后給出基于數(shù)據(jù)包絡(luò)法的多方案分析模型及應(yīng)用示例,說(shuō)明方法的可行性和有效性。
1 裝備論證多方案分析
多方案分析是對(duì)所提出的裝備備選方案的效能、費(fèi)用和風(fēng)險(xiǎn)的分析比較,以解決作戰(zhàn)能力上的差距和不足。裝備論證過(guò)程中的多方案分析基本框架如圖1所示。因?yàn)橄到y(tǒng)效能和費(fèi)用是裝備研制、采購(gòu)及維修保障決策的重要目標(biāo)或制約條件,所以,多方案分析通常采用效用-費(fèi)用分析框架,主要包括作戰(zhàn)效能分析和費(fèi)用分析兩部分。
以上研究從資源約束、評(píng)價(jià)函數(shù)、任務(wù)時(shí)序等不同角度對(duì)CMTAP進(jìn)行改進(jìn),但仍存在異構(gòu)型無(wú)人機(jī)及不同類(lèi)型目標(biāo)間的差異刻畫(huà)較為簡(jiǎn)單的問(wèn)題,同時(shí),模型中目標(biāo)的設(shè)定規(guī)模往往較小,難以充分體現(xiàn)多機(jī)相較于單機(jī)執(zhí)行多任務(wù)目標(biāo)時(shí)的效率優(yōu)勢(shì)。且由于多機(jī)協(xié)同任務(wù)分配的NP-Hard特性,隨著目標(biāo)規(guī)模的增加,傳統(tǒng)啟發(fā)式算法搜索結(jié)果質(zhì)量差,易陷入局部最優(yōu)的缺陷將愈發(fā)明顯[16]。
2020年,學(xué)者Khishe通過(guò)模擬黑猩猩捕獵行為,提出一種新型啟發(fā)式算法黑猩猩算法(Chimp Optimization Algorithm, ChOA)[17]。ChOA根據(jù)個(gè)體能力的差異將黑猩猩群體劃分為不同角色,進(jìn)而使用不同的搜索策略使得整個(gè)群體在求解空間中快速尋優(yōu),具有原理簡(jiǎn)單,搜索效率高,擅長(zhǎng)高維問(wèn)題求解的特點(diǎn),因此在異構(gòu)多無(wú)人機(jī)協(xié)同任務(wù)分配這一典型的高維優(yōu)化問(wèn)題求解方面具有很大的應(yīng)用潛力。同時(shí),由于算法提出較晚,ChOA在很多方面仍有很大的改進(jìn)空間,如在求解復(fù)雜多維目標(biāo)函數(shù)時(shí)依然存在局部易收斂、全局與局部搜索不平衡的問(wèn)題。
基于上述分析,本文使用CMTAP對(duì)異構(gòu)無(wú)人機(jī)執(zhí)行地面多類(lèi)型固定目標(biāo)的場(chǎng)景進(jìn)行刻畫(huà),使用改進(jìn)黑猩猩算法(Modified Chimp Optimization Algorithm, MChOA)進(jìn)行求解。在模型構(gòu)建中,將任務(wù)收益、威脅代價(jià)、總航程三個(gè)優(yōu)化目標(biāo)按權(quán)重納入評(píng)價(jià)函數(shù),以更好地反映執(zhí)行不同任務(wù)分配方案時(shí)的總收益、危險(xiǎn)系數(shù)和能耗三項(xiàng)指標(biāo)。
1 異構(gòu)多無(wú)人機(jī)協(xié)同任務(wù)分配模型
本節(jié)將設(shè)計(jì)一個(gè)可更好刻畫(huà)異構(gòu)無(wú)人機(jī)執(zhí)行地面多類(lèi)型固定目標(biāo)場(chǎng)景的CMTAP。為更好地體現(xiàn)差異性,本文首先使用六元組對(duì)每一架無(wú)人機(jī)及每一個(gè)目標(biāo)的多方面信息進(jìn)行設(shè)定,然后,設(shè)置了相應(yīng)的約束條件以確保任務(wù)分配方案的可行性,最后,設(shè)計(jì)了評(píng)價(jià)函數(shù)以衡量任務(wù)分配方案的優(yōu)劣。
1.1 問(wèn)題描述
CMTAP中,可將任務(wù)分配問(wèn)題用一個(gè)四元組{E,V,T,C}表示,其中,E為任務(wù)區(qū)域,V為無(wú)人機(jī)集合,T為任務(wù)集合,C為約束集合,通過(guò)對(duì)四元組集合內(nèi)的元素進(jìn)行調(diào)整以刻畫(huà)不同的任務(wù)需求。
無(wú)人機(jī)集合為V={V1,V2,…,VNV},本文為更好地體現(xiàn)無(wú)人機(jī)的異構(gòu)性,設(shè)定無(wú)人機(jī)Vi均可由六元組〈LVi,SVi,RVi,AVi,Pi,WVi〉進(jìn)行描述,其中,LVi={xVi,yVi}為無(wú)人機(jī)Vi的當(dāng)前位置坐標(biāo);SVi為無(wú)人機(jī)Vi的類(lèi)型,SVi=1表示可實(shí)施打擊的戰(zhàn)斗無(wú)人機(jī),SVi=2表示可實(shí)施偵測(cè)的偵察無(wú)人機(jī),SVi=3表示可實(shí)施偵測(cè)和打擊的多功能無(wú)人機(jī);RVi為無(wú)人機(jī)Vi的偵察能力;AVi為無(wú)人機(jī)Vi的攻擊能力;Pi為無(wú)人機(jī)Vi攜帶的武器數(shù)目;WVi為無(wú)人機(jī)Vi的價(jià)值。
目標(biāo)集合為T(mén)={T1,T2,…,TN},設(shè)定目標(biāo)Tj均可由六元組〈LTj,Dj,Sj,Rj,Aj,Wj〉表示,其中,LTj={xTj,yTj}為目標(biāo)Tj的位置坐標(biāo);Dj為目標(biāo)Tj的防空威脅;Sj為目標(biāo)Tj的類(lèi)型,Sj=1表示打擊目標(biāo),Sj=2表示偵察目標(biāo);Rj為目標(biāo)Tj的偵察需求;Aj為目標(biāo)Tj的攻擊需求;Wi為目標(biāo)Tj的價(jià)值。
在確保模型有效性的前提下,為降低求解難度,本文假設(shè)模型中所有目標(biāo)的地理坐標(biāo)已通過(guò)前期各種偵察手段得到,所有無(wú)人機(jī)在執(zhí)行任務(wù)過(guò)程中為定高勻速直線飛行,任務(wù)執(zhí)行完畢后返回原出發(fā)位置。
1.2 約束條件
在構(gòu)建CMTAP時(shí),通常需要設(shè)置約束條件以確保任務(wù)的可行性。本文約束設(shè)置環(huán)節(jié)主要考慮無(wú)人機(jī)資源約束和任務(wù)協(xié)同約束,其中無(wú)人機(jī)資源約束包含最大航程約束和載彈量約束,具體內(nèi)容如下:
1)最大航程約束。為確保無(wú)人機(jī)的安全,各架無(wú)人機(jī)執(zhí)行任務(wù)期間的總飛行距離應(yīng)小于該無(wú)人機(jī)的最大航程。無(wú)人機(jī)Vi所執(zhí)行任務(wù)序列為SeqVi={TVij1,TVij2,…,TVijN},dist(TVik,TVik+1)表示無(wú)人機(jī)Vi從第k個(gè)任務(wù)到第k+1個(gè)任務(wù)的飛行距離,即
dist(LVi,TVij1)+dist(TVijN,LVi)+∑TVik ∈SeqVidist(TVik,TVik+1)≤max distVi (1)
2)載彈量約束。受載荷限制,無(wú)人機(jī)只能攜帶一定數(shù)量的導(dǎo)彈。因此,單個(gè)無(wú)人機(jī)執(zhí)行任務(wù)使用的導(dǎo)彈數(shù)目不能高于其攜帶的武器數(shù)目。CVi為無(wú)人機(jī)Vi任務(wù)序列中攻擊目標(biāo)的數(shù)量,即
CVi≤Pi (2)
3)任務(wù)協(xié)同約束。為了避免任務(wù)重復(fù)執(zhí)行和無(wú)人機(jī)空置問(wèn)題的發(fā)生,要求目標(biāo)集合里的每個(gè)目標(biāo)只能被執(zhí)行一次,無(wú)人機(jī)集合里的每架無(wú)人機(jī)至少分配一個(gè)目標(biāo),且無(wú)人機(jī)具有執(zhí)行對(duì)應(yīng)分配目標(biāo)的能力。
1.3 評(píng)價(jià)函數(shù)
無(wú)人機(jī)協(xié)同多任務(wù)分配的原則是在滿足約束的條件下,實(shí)現(xiàn)整體作戰(zhàn)效率最高的同時(shí)所付出的代價(jià)最小,而多無(wú)人機(jī)執(zhí)行所有任務(wù)的任務(wù)收益、威脅代價(jià)和總航程是評(píng)價(jià)任務(wù)分配方案質(zhì)量的重要指標(biāo)。因此,本文衡量無(wú)人機(jī)協(xié)同多任務(wù)分配方案優(yōu)劣的評(píng)價(jià)函數(shù)由以下三部分組成:
1)任務(wù)收益。rewardVi(Tj)表示無(wú)人機(jī)Vi完成目標(biāo)Tj的任務(wù)收益,其值由目標(biāo)價(jià)值、目標(biāo)需求和無(wú)人機(jī)能力共同決定,在任務(wù)分配中的作用是促使高價(jià)值目標(biāo)和高需求目標(biāo)傾向于分配給能力強(qiáng)的無(wú)人機(jī)執(zhí)行,以提升重點(diǎn)目標(biāo)的任務(wù)執(zhí)行成功率,對(duì)偵察目標(biāo)和打擊目標(biāo)的任務(wù)收益計(jì)算分別為:
rewardVi(Tj)=RVi*Rj*Wj (3)
rewardVi(Tj)=AVi*Aj*Wj (4)
2)威脅代價(jià)。riskVi(Tj)表示無(wú)人機(jī)Vi完成目標(biāo)Tj所承擔(dān)的風(fēng)險(xiǎn)代價(jià),其值由目標(biāo)的防空威脅和無(wú)人機(jī)的價(jià)值共同決定,其在任務(wù)分配中的作用是促使高價(jià)值無(wú)人機(jī)傾向于執(zhí)行較安全的目標(biāo),以減小無(wú)人機(jī)被防空火力擊落造成損失,其表達(dá)式如下所示:
riskVi(Tj)=Dj*WVi (5)
3)無(wú)人機(jī)航程。distVi(Tj)表示無(wú)人機(jī)Vi前往目標(biāo)Tj的航程代價(jià),所有無(wú)人機(jī)的總航程之和反映了當(dāng)前任務(wù)分配的資源消耗情況,其在任務(wù)分配中的作用是減少多無(wú)人機(jī)執(zhí)行任務(wù)的資源消耗,其表達(dá)式如下所示:
distVi(Tj)=(xVi-xTj)2+(yVi-yTj)2 (6)
根據(jù)以上優(yōu)化指標(biāo),得到無(wú)人機(jī)Vi執(zhí)行目標(biāo)Tj的任務(wù)評(píng)價(jià)函數(shù)如下:
JVi(Tj)=w1*rewardVi(Tj)+w2*riskVi(Tj)+w3*distVi(Tj) (7)
其中,w1、w2、w3分別為以上三項(xiàng)指標(biāo)的權(quán)重值,且w1+w2+w3=1,具體數(shù)值由指揮中心根據(jù)任務(wù)需要設(shè)定,計(jì)算時(shí)需要確保各指標(biāo)量綱統(tǒng)一。
2 基于改進(jìn)黑猩猩算法的多機(jī)協(xié)同任務(wù)分配算法
對(duì)異構(gòu)多無(wú)人機(jī)協(xié)同任務(wù)分配的求解本質(zhì)上是多約束下的多目標(biāo)優(yōu)化求解問(wèn)題,為此本節(jié)采用了基于改進(jìn)黑猩猩算法的多機(jī)協(xié)同任務(wù)分配算法。
2.1 標(biāo)準(zhǔn)黑猩猩算法
ChOA可由以下三個(gè)方面描述:
1)等級(jí)制度。ChOA模擬自然界中黑猩猩群體的等級(jí)系統(tǒng)與捕獵機(jī)制,在完成種群初始化后,依據(jù)適應(yīng)度的大小將群體劃分為兩層:領(lǐng)導(dǎo)層和基礎(chǔ)層。領(lǐng)導(dǎo)層中包括攻擊者、追逐者、障礙者和驅(qū)趕者四只黑猩猩,他們依次是本次計(jì)算中適應(yīng)度最好的四個(gè)解。其他黑猩猩統(tǒng)一作為基礎(chǔ)層,依據(jù)與領(lǐng)導(dǎo)層黑猩猩的距離來(lái)更新自身位置。在黑猩猩群體不斷迭代的過(guò)程中,基礎(chǔ)層的黑猩猩也會(huì)不斷擇優(yōu)替補(bǔ)以更新領(lǐng)導(dǎo)層。
2)驅(qū)趕、包圍獵物。黑猩猩驅(qū)趕、包圍獵物的數(shù)學(xué)模型為:
d=|C·xprey(t)-m·xchimp(t)| (8)
xchimp(t+1)=xprey(t)-A·d (9)
其中,t為當(dāng)前迭代次數(shù),d為黑猩猩距獵物的距離,A、C、m為系數(shù)向量,xprey(t)為獵物位置,xchimp(t)為當(dāng)前黑猩猩所在位置。A、C、m由式(10)~(12)計(jì)算得出。
A=2·f·r1-f (10)
C=2·r2 (11)
m=chaotic_value (12)
其中,f為收斂因子,其值從2.5隨迭代過(guò)程非線性減小至0,算法通過(guò)不同類(lèi)型的黑猩猩采用不同策略更新f的方式,賦予了黑猩猩群體用多種方式搜索解空間的能力。A為[-f,f]之間的隨機(jī)數(shù),當(dāng)|A|>1時(shí),黑猩猩遠(yuǎn)離獵物開(kāi)展全局搜索,反之,靠近獵物進(jìn)行局部搜索。r1和r2是[0,1]間的隨機(jī)向量。m為混沌映射,代表黑猩猩在捕獵過(guò)程中搶食行為的影響。
3)攻擊獵物。在捕獵過(guò)程中,位于領(lǐng)導(dǎo)層的黑猩猩能夠更好地了解獵物的所在位置,其他黑猩猩依據(jù)領(lǐng)導(dǎo)層黑猩猩的位置更新自身位置,最后由攻擊者黑猩猩完成捕獵。這種行為可用數(shù)學(xué)公式(13)~(15)表示:
dAttacker=|C1·xAttacker-m1·x|dBarrier=|C2·xBarrier-m2·x|dChaser=|C3·xChaser-m3·x|dDriver=|C4·xDriver-m4·x| (13)
x1=xAttacker-A1·dAttackerx2=xBarrier-A2·dBarrierx3=xChaser-A3·dChaserx4=xDriver-A4·dDriver (14)
x(t+1)=(x1+x2+x3+x4)/4 (15)
在捕獵的最后階段,食物的吸引力會(huì)導(dǎo)致黑猩猩暫時(shí)忘記它們的捕獵責(zé)任,試圖在混亂中獲取食物。ChOA使用混沌映射對(duì)這種搶食行為進(jìn)行描述,并設(shè)定在優(yōu)化過(guò)程中有50%的概率在正常位置和混沌位置之間選擇,這種行為有助于避免算法陷入局部最優(yōu)和求解高維問(wèn)題,是區(qū)分ChOA與其他啟發(fā)式算法最重要的因素。搶食行為可用數(shù)學(xué)公式(16)表示:
xchimp(t+1)=xprey(t)-A×di,μ<0.5chaotic_value,μ≥0.5 (16)
其中,μ是[0,1]間的隨機(jī)值。
2.2 混沌反向?qū)W習(xí)策略的種群初始化
初始化階段,初始種群的生成質(zhì)量對(duì)啟發(fā)式算法的求解速度和最終結(jié)果有很大影響。ChOA采用的純隨機(jī)初始化方式易造成黑猩猩初始種群分布過(guò)于集中或分散,導(dǎo)致算法局部收斂和搜索效率低下等缺陷。為提升算法的全局尋優(yōu)性能,在保證隨機(jī)性的同時(shí)應(yīng)使初始種群盡可能均勻分布。為此,本文使用混沌反向?qū)W習(xí)策略完成MChOA的種群初始化。
混沌映射生成的混沌序列是一種由確定性規(guī)則產(chǎn)生的隨機(jī)序列,該序列能夠在一定范圍內(nèi)根據(jù)規(guī)則遍歷解空間而不發(fā)生重復(fù)。使用混沌映射取代純隨機(jī)的方式完成初始化環(huán)節(jié),結(jié)合其遍歷性和非重復(fù)性的特點(diǎn),可提升黑猩猩初始種群分布的多樣性,改善算法的全局尋優(yōu)能力。
本文首先引入Tent混沌映射,其形式如下:
zk+1=zk/β,zk∈(0,β](1-zk)/(1-β),zk∈(β,1] (17)
該映射結(jié)構(gòu)簡(jiǎn)單,在[0,1]區(qū)間內(nèi)產(chǎn)生的混沌序列分布較均勻,設(shè)β取值0.7,此時(shí)映射具有較好的混沌特性。
其次,在使用混沌映射生成初始種群的基礎(chǔ)上,ChOA通過(guò)領(lǐng)導(dǎo)層四只黑猩猩(歷次計(jì)算中適應(yīng)度最好的四個(gè)解)的分布來(lái)估計(jì)獵物的位置,進(jìn)而影響種群中個(gè)體的迭代方向,初始種群中個(gè)體的分布距全局最優(yōu)解越近,則算法的尋優(yōu)速度越快。由于種群中的個(gè)體黑猩猩和其反向個(gè)體更靠近全局最優(yōu)解的概率是50%,因此,在MChOA的種群初始化中考慮每個(gè)個(gè)體的反向個(gè)體,選擇更靠近全局最優(yōu)解的個(gè)體黑猩猩組成更高質(zhì)量的初始種群,通過(guò)減少低效搜索的次數(shù)進(jìn)一步加快算法的尋優(yōu)進(jìn)程。數(shù)學(xué)表達(dá)式如下所示:
X′(1)=lb+ub-X(1)X(1)=X(1), J(1)>J′(1)X′(1), J(1)<J′(1) (18)
式中,ub、lb是種群X的上下界,X(1)是種群該次迭代中的第一個(gè)粒子。
2.3 搶食行為動(dòng)態(tài)調(diào)整策略
ChOA在收斂階段設(shè)置了搶食行為,通過(guò)以固定跳變概率μ在正常位置迭代和混沌位置迭代間切換的方式達(dá)到跳出局部最優(yōu)的目的。但是,由于收斂階段不同適應(yīng)度的個(gè)體陷入局部最優(yōu)的風(fēng)險(xiǎn)并不相同,如能對(duì)不同風(fēng)險(xiǎn)陷入局部最優(yōu)的個(gè)體施加相對(duì)應(yīng)的跳變概率,可進(jìn)一步提高算法在收斂階段的搜索性能,為此本文引入搶食行為動(dòng)態(tài)調(diào)整策略。
啟發(fā)式算法收斂階段陷入局部最優(yōu)解,往往是因?yàn)榉N群中個(gè)體隨迭代逐漸聚集到當(dāng)前最優(yōu)解(非全局最優(yōu)解)。在迭代中,適應(yīng)度值越高的個(gè)體陷入局部最優(yōu)解的風(fēng)險(xiǎn)越大。在收斂階段,可將適應(yīng)度值較高個(gè)體的跳變概率增大,使其更多地?fù)?dān)負(fù)尋找更優(yōu)解的責(zé)任,增強(qiáng)其規(guī)避局部最優(yōu)的能力。同時(shí),由于黑猩猩算法記錄的是歷史最佳四個(gè)解并將其定義為領(lǐng)導(dǎo)層黑猩猩,因此,即使適當(dāng)增大適應(yīng)度值較高個(gè)體的跳變概率,在未尋找到更優(yōu)解的情況下,也不影響種群主體向最優(yōu)解靠攏的趨勢(shì)。對(duì)適應(yīng)度值較低的個(gè)體,通過(guò)降低其跳變概率,可使其按照正常模式更新并盡快向歷史最優(yōu)解靠攏,若此時(shí)歷史最優(yōu)解位于全局最優(yōu)解附近,基于該模式下A、C、m系數(shù)本身的隨機(jī)性,可通過(guò)種群在歷史最優(yōu)解周?chē)芗靥剿魈嵘肿顑?yōu)解的發(fā)現(xiàn)概率。
假設(shè)經(jīng)過(guò)k次迭代,當(dāng)前粒子i的適應(yīng)度為Jk(i),種群X的平均適應(yīng)度為Jkavg,種群X中高于平均適應(yīng)度的所有粒子的平均適應(yīng)度為Jkabove_avg,種群X中低于平均適應(yīng)度的所有粒子的平均適應(yīng)度為Jklow_avg,種群X的最大適應(yīng)度為JkAttacker,種群X的最低適應(yīng)度為Jkmin,則將跳變概率μ按如下方式設(shè)置:
1)Jk(i)>Jkabove_avg 時(shí)
此時(shí)粒子的適應(yīng)度值處于較高水平,為此應(yīng)在合理區(qū)間內(nèi)加大該粒子的跳變概率μ,以減小領(lǐng)導(dǎo)層黑猩猩的影響,從而增強(qiáng)該粒子的全局尋優(yōu)能力,防止陷入局部最優(yōu)。數(shù)學(xué)表達(dá)式如下所示:
μ=μavg+(Jk(i)-Jkabove_avg)(μmax-μmin)JkAttacker-Jkmin (19)
2)Jklow_avg <Jk(i)<Jkabove_avg 時(shí)
當(dāng)粒子適應(yīng)度值介于中間值時(shí),粒子搶食行為跳變概率μ設(shè)置為固定值,數(shù)學(xué)表達(dá)式如下所示:
μ=0.5 (20)
3)Jk(i)<Jklow_avg 時(shí)
此時(shí)粒子的適應(yīng)度值較低,應(yīng)減小該粒子的跳變概率μ,以增大領(lǐng)導(dǎo)層黑猩猩對(duì)其下次位置更新的影響。數(shù)學(xué)表達(dá)式如下所示:
μ=μmin-(Jklow_avg-Jk(i))(μmax-μmin)JkAttacker-Jkmin (21)
3 仿真實(shí)驗(yàn)及分析
3.1 仿真參數(shù)設(shè)置
本次實(shí)驗(yàn)采用Windows 11操作系統(tǒng),仿真平臺(tái)使用Matlab R2020a。設(shè)定任務(wù)區(qū)域?yàn)?00 km*100 km,任務(wù)區(qū)域內(nèi)目標(biāo)為隨機(jī)生成。
為進(jìn)一步驗(yàn)證本文提出的MChOA在多無(wú)人機(jī)協(xié)同任務(wù)分配中的性能,使用經(jīng)典啟發(fā)式算法——遺傳算法(Genetic Algorithm, GA)[18]、新型啟發(fā)式算法——灰狼優(yōu)化算法(Grey Wolf Optimizer, GWO)[19]以及ChOA作為對(duì)照組,算法的種群規(guī)模均設(shè)置為50,迭代次數(shù)為200,其他各項(xiàng)初始參數(shù)如表1所示。本文CMTAP評(píng)價(jià)函數(shù)中的三項(xiàng)指標(biāo)權(quán)重值w1、w2、w3分別設(shè)置為0.6、0.3、0.1。
3.2 仿真結(jié)果及分析
為減少隨機(jī)因素的影響,確保對(duì)比結(jié)果的準(zhǔn)確性,各算法均重復(fù)運(yùn)行20次,對(duì)比實(shí)驗(yàn)的結(jié)果以本文CMTAP的評(píng)價(jià)函數(shù)作為衡量指標(biāo)。
1)UAV數(shù)量為6,目標(biāo)數(shù)量為20
UAV和目標(biāo)的設(shè)定如表2和表3所示。MChOA所得最佳任務(wù)分配方案如表4所示,該方案滿足CMTAP中各約束條件,表明該異構(gòu)多無(wú)人機(jī)協(xié)同任務(wù)分配方案的結(jié)果符合實(shí)驗(yàn)想定,具備可行性。
從表5的統(tǒng)計(jì)結(jié)果可以得出,在符合CMTAP約束的要求下,MChOA所得任務(wù)分配方案的評(píng)價(jià)函數(shù)值在最優(yōu)值、最低值、平均值和中位數(shù)四項(xiàng)指標(biāo)中均取得了最好的結(jié)果。相較于ChOA、MChOA的最優(yōu)值、最低值、平均值、中位數(shù)分別提升了3.69%、 7.46%、7.66%、8.03%,這是因?yàn)閾屖承袨閯?dòng)態(tài)調(diào)整策略的引入使得MChOA具有更強(qiáng)的全局搜索能力,有效避免了陷入局部最優(yōu);MChOA的方差指標(biāo)相較ChOA減小了30.89%,表明算法具有更好的收斂性,這是因?yàn)槌跏蓟A段的混沌反向?qū)W習(xí)策略使得初始種群分布更加均勻,一定程度上減少了啟發(fā)式算法的隨機(jī)性對(duì)最終結(jié)果的影響。
為進(jìn)一步探究評(píng)價(jià)函數(shù)值在衡量無(wú)人機(jī)集群執(zhí)行任務(wù)分配方案中的實(shí)際影響,對(duì)比各算法20次仿真中評(píng)價(jià)函數(shù)加權(quán)前的各指標(biāo),結(jié)果如表6、圖1和圖2所示。從表6可以看出,MChOA之所以在評(píng)價(jià)函數(shù)中獲得了最好的結(jié)果,是因?yàn)槠渌萌蝿?wù)分配方案在保持較高任務(wù)收益和較低威脅代價(jià)的同時(shí),無(wú)人機(jī)總航程大幅度降低,其總航程平均值相較ChOA、GWO、GA分別降低了22.6%、37.4%、43.4%。在圖1和圖2任務(wù)分配方案的指標(biāo)分布中也可以看出,MChOA的歷次任務(wù)分配方案在保持了較高任務(wù)收益值和較低威脅代價(jià)的同時(shí),在總航程代價(jià)方面始終分布在較低區(qū)域。
2)UAV數(shù)量為12,目標(biāo)數(shù)量為40
根據(jù)多機(jī)協(xié)同任務(wù)分配問(wèn)題的NP-Hard特性,問(wèn)題維度越高,尋找全局最優(yōu)解的難度越大。為驗(yàn)證更高維度下MChOA的性能,將UAV和目標(biāo)的數(shù)量規(guī)模擴(kuò)充一倍,具體參數(shù)設(shè)定如表7和表8所示,各算法20次任務(wù)分配結(jié)果的評(píng)價(jià)函數(shù)統(tǒng)計(jì)如表9所示??梢钥闯觯琈ChOA在最優(yōu)值、最低值、平均值、中位數(shù)四個(gè)指標(biāo)方面依舊取得了算法對(duì)比中的最好值,相較于ChOA,MChOA在最優(yōu)值、最低值、平均值、中位數(shù)指標(biāo)方面分別提升了9.14%、 5.66%、7.65%、8.86%,表明其在求解問(wèn)題維度升高時(shí)依舊可以保持較好的尋優(yōu)性能。此時(shí),
高維問(wèn)題下的全局最優(yōu)解搜索難度加大導(dǎo)致MChOA的方差增加,但結(jié)合統(tǒng)計(jì)數(shù)據(jù)可以看出,ChOA及其他對(duì)比算法所得任務(wù)分配方案的最優(yōu)值仍低于MChOA的平均值,表明方差指標(biāo)增大并未影響MChOA給出的方案始終穩(wěn)定在一個(gè)較高水平。
進(jìn)一步對(duì)比各算法評(píng)價(jià)函數(shù)加權(quán)前的各指標(biāo),結(jié)合表10、圖3和圖4可知,MChOA所得20次任務(wù)分配方案在取得最高平均任務(wù)收益及最低平均威脅代價(jià)的基礎(chǔ)上,總航程平均值相較ChOA、GWO、GA分別降低了21.1%、24.5%、32.2%,取得了高評(píng)價(jià)函數(shù)值,證明了MChOA所得任務(wù)分配方案的優(yōu)越性。
4 結(jié)束語(yǔ)
本文利用CMTAP和MChOA解決了異構(gòu)多無(wú)人機(jī)對(duì)地面多類(lèi)型固定目標(biāo)的協(xié)同任務(wù)分配問(wèn)題。首先,通過(guò)對(duì)四元組內(nèi)元素的設(shè)定完成模型構(gòu)建,更好地體現(xiàn)了異構(gòu)無(wú)人機(jī)、多類(lèi)型目標(biāo)間的差異性。其次,引入混沌反向?qū)W習(xí)策略和搶食行為動(dòng)態(tài)調(diào)整策略對(duì)ChOA的初始化階段和迭代階段進(jìn)行改進(jìn)。兩種不同規(guī)模下的仿真實(shí)驗(yàn)中,MChOA仿真結(jié)果的評(píng)價(jià)函數(shù)的最優(yōu)值、最低值、平均值、中位數(shù)均取得了最好的結(jié)果,其所得任務(wù)分配方案在保持較高的任務(wù)收益和較低威脅代價(jià)的同時(shí),相較于原算法,兩種規(guī)模場(chǎng)景下的平均總航程分別降低了22.6%和21.1%,驗(yàn)證了算法的有效性。但本文在計(jì)算航路代價(jià)時(shí)使用了歐氏距離,在航路中間存在繞行障礙時(shí)可能導(dǎo)致預(yù)估誤差較大,會(huì)影響任務(wù)分配方案的實(shí)際優(yōu)化效果,下一步可在衡量航路代價(jià)時(shí)引入新的計(jì)算方式,以快速且更加準(zhǔn)確地完成障礙環(huán)境下的航路代價(jià)預(yù)估。
參考文獻(xiàn):
[1] YANG W Z, XIN Y. Multi-UAV task assignment based on quantum genetic algorithm[J]. Journal of Physics: Conference Series, 2021, 1824(1): 012 010.
[2] 樊鵬輝, 宋國(guó)鵬, 孟博, 等. 多無(wú)人機(jī)協(xié)同作戰(zhàn)應(yīng)用研究[C]//中國(guó)航天電子技術(shù)研究院科學(xué)技術(shù)委員會(huì)2020年學(xué)術(shù)年會(huì)論文集. 北京, 2020: 54-60.
FAN P H, SONG G P, MENG B, et al. Research on the application of multi-UAV cooperative operations[C]//Proceedings of the 2020 Academic Annual Meeting of the Science and Technology Committee of the China Academy of Aerospace Electronics Technology.Beijing,2020:54-60.
[3] 康瑞夢(mèng). 基于群智能算法的無(wú)人機(jī)群協(xié)同任務(wù)分配研究[D]. 成都:電子科技大學(xué), 2023.
KANG R M. Research on the multi-UAV cooperative task assignment method based on the swarm intelligence algorithm[D]. Chengdu: University of Electronic Science and Technology of China, 2023.
[4] 張力升, 鄭明發(fā), 鐘海濤. 不確定環(huán)境下無(wú)人機(jī)多目標(biāo)任務(wù)分配問(wèn)題研究[J]. 計(jì)算機(jī)仿真, 2022, 39(9): 68-73, 100.
ZHANG L S, ZHENG M F, ZHONG H T. Research on multi-target assignment of UAV under uncertain environment[J]. Computer Simulation, 2022, 39(9): 68-73, 100.
[5] 彭鵬菲,龔雪,姜俊,等.基于改進(jìn)多維粒子群的多無(wú)人機(jī)任務(wù)分配方法[J].兵器裝備工程學(xué)報(bào),2023,44(7): 227-236.
PENG P F, GONG X, JIANG J, et al. An improved multi-dimensional particle swarm-based approach to multi-UAV mission assignment[J]. Journal of Ordnance Equipment Engineering, 2023,44(7): 227-236.