無人機集群反制與對抗技術(shù)探討

2024-01-26 03:18王孟陽李智軍

指揮與控制學報 2023年6期

任智張棟唐碩王孟陽李智軍

無人機集群作戰(zhàn)是網(wǎng)絡(luò)化智能化作戰(zhàn)的重要模式,能夠借助數(shù)量優(yōu)勢實現(xiàn)大范圍區(qū)域覆蓋的多源感知與任務(wù)執(zhí)行,在體系對抗中占據(jù)戰(zhàn)場優(yōu)勢[1].無人機集群系統(tǒng)在復雜多變的戰(zhàn)場環(huán)境中具有強大的戰(zhàn)場生存力、環(huán)境適應(yīng)力和快速響應(yīng)力.給現(xiàn)有的防空體系帶來極大的顛覆與挑戰(zhàn),出現(xiàn)“打得上的打不起”和“打得起的打不上”的對抗難題[2].因此,無人機集群系統(tǒng)反制與對抗是未來體系化作戰(zhàn)的研究重點.

由于無人機集群系統(tǒng)成本低、規(guī)模大、機動性能強,傳統(tǒng)地面防御系統(tǒng)難以經(jīng)濟有效地應(yīng)對集群目標威脅,常見的集群反制對抗措施主要通過物理攻擊或電子干擾等方法破壞集群系統(tǒng)網(wǎng)絡(luò)節(jié)點或通信鏈路.對此,中國電子技術(shù)標準化研究院2021 年發(fā)布的《智能無人機群系統(tǒng)發(fā)展白皮書》根據(jù)不同任務(wù)與應(yīng)用場景,對無人機集群系統(tǒng)的穩(wěn)定性、可靠性、安全性提出了不同層級的要求,以保證集群系統(tǒng)在有限通信與復雜環(huán)境下的作戰(zhàn)能力[3].由此可見,隨著復雜場景下集群控機技術(shù)的發(fā)展,“硬殺傷”與“軟殺傷”等方法對無人機集群的反制效果有限.因此,交戰(zhàn)雙方集群間的智能化與體系化對抗是未來集群反制與對抗的主要途徑與發(fā)展趨勢.

集群對抗問題的研究最早在博弈論中的疆土防御[4-6]與追逃博弈[7-9]問題中展開,由于集群對抗博弈的局中人規(guī)模大導致求解困難,有學者通過目標分配方法將集群對抗問題轉(zhuǎn)換為一對一或二對一的問題,進而規(guī)劃集群個體的作戰(zhàn)任務(wù)與機動軌跡[10-12].雖然基于目標分配的集群對抗博弈模型簡化方法能夠在一定程度上降低模型求解的計算復雜度,但是并沒有考慮目標分配后各子集智能體間的相互作用,不能夠體現(xiàn)大規(guī)模無人機集群協(xié)同作戰(zhàn)與集群智能的特點.因此,也有學者從多智能體系統(tǒng)理論[13-14]與網(wǎng)絡(luò)動力學[15-16]的角度出發(fā),為每個智能體設(shè)計獨立的個體行為與自組織決策規(guī)則,本文根據(jù)無人機集群對抗的典型場景、任務(wù)需求與作戰(zhàn)流程,從復雜群體行為演化控制、敵方集群統(tǒng)計特征識別推斷以及集群博弈對抗機理的角度出發(fā),探討無人機集群對抗的基本模型與關(guān)鍵技術(shù),分析了集群對抗問題研究的難點與挑戰(zhàn).

1 集群對抗問題與相關(guān)概念

在集群對抗過程中,無人機集群系統(tǒng)通過個體間相互作用的分布式自主決策涌現(xiàn)出復雜的集群行為與協(xié)同戰(zhàn)術(shù),根據(jù)戰(zhàn)場環(huán)境實時態(tài)勢、敵方集群策略與實際對抗任務(wù)需求,實現(xiàn)戰(zhàn)場快速響應(yīng)與集群作戰(zhàn)目標.對此,本文提出了涵蓋群體動力學模型、對手建模問題和集群博弈對抗的集群對抗基本模型與體系框架,如圖1 所示.

圖1 集群對抗體系框架Fig 1 Swarm confrontation system framework

其中,群體動力學模型在確定集群網(wǎng)絡(luò)結(jié)構(gòu)與相互作用關(guān)系的基礎(chǔ)上,設(shè)計集群個體間交互規(guī)則響應(yīng)與分布式自主決策方法,分析集群智能行為的涌現(xiàn)過程與演化機理.然后進一步考慮未知的敵方對抗策略進行對手建模,根據(jù)局部態(tài)勢感知信息實現(xiàn)對敵方集群的狀態(tài)觀測估計與網(wǎng)絡(luò)結(jié)構(gòu)辨識,推斷敵方集群采取的行為樣式與作戰(zhàn)意圖,進而采取有針對性的對抗策略.最后,集群對抗博弈模型在群體動力學模型與對手建模的基礎(chǔ)上考慮戰(zhàn)場環(huán)境與敵方集群行為的影響,根據(jù)集群對抗任務(wù)耦合的作戰(zhàn)效能指標,評估從個體自主決策到群體對抗策略的對抗效果.在此基礎(chǔ)上,進一步優(yōu)化集群個體自組織規(guī)則與分布式自適應(yīng)決策,引導集群系統(tǒng)群體行為與集群智能的涌現(xiàn),提高集群對抗的響應(yīng)速度與決策效率.

結(jié)合集群對抗過程中無人機集群攜帶機載雷達、電子干擾設(shè)備與機載武器等有效載荷的特點,構(gòu)想集群對抗典型作戰(zhàn)場景如圖2 所示.假設(shè)交戰(zhàn)雙方出動大規(guī)模無人機集群進攻敵方地面目標,同時在交戰(zhàn)對抗中對敵方集群目標展開突防攔截.交戰(zhàn)雙方都需要在保證己方陣地安全的基礎(chǔ)上首先實現(xiàn)對敵方陣地的飽和打擊,其次盡可能地減少己方無人機的損毀并增加敵方有生力量的消耗.

圖2 集群對抗典型作戰(zhàn)場景Fig 2 Typical battle scenario of swarm confrontation

在對抗的初始階段,作戰(zhàn)雙方通過地面指揮控制中心的預(yù)警雷達實現(xiàn)陣地區(qū)域覆蓋掃描,探測并預(yù)警敵方集群目標.由于地面預(yù)警雷達覆蓋面積大,掃描周期長,對敵方大規(guī)模集群目標的預(yù)警信息時效差、精度低,僅能夠為我方集群提供較為粗略的戰(zhàn)場態(tài)勢信息.因此,無人機集群還需要結(jié)合作戰(zhàn)環(huán)境與己方拒止區(qū)域等掩護,采取合適的編隊構(gòu)型與接敵策略執(zhí)行集群偵察任務(wù),鎖定跟蹤探測范圍內(nèi)的敵方目標,并通過集群內(nèi)個體間通信組網(wǎng)的信息交互,實現(xiàn)戰(zhàn)場多源態(tài)勢感知融合,獲得更為精確的戰(zhàn)場態(tài)勢信息.在此基礎(chǔ)上,無人機集群可根據(jù)實時作戰(zhàn)態(tài)勢選擇執(zhí)行電子封控任務(wù)或戰(zhàn)術(shù)騙擾任務(wù),為集群突防提供更有利的作戰(zhàn)優(yōu)勢.隨著對抗雙方交戰(zhàn)進程的推進,無人機集群結(jié)合對抗結(jié)果與實時態(tài)勢,根據(jù)自主決策規(guī)則確定當前的作戰(zhàn)任務(wù)與機動策略.若集群突防成功,則可以考慮追擊敵方目標并執(zhí)行既定打擊任務(wù)；若集群突防失敗,則可以考慮執(zhí)行回防撤退任務(wù)四散逃逸并回防陣地.在對抗的結(jié)束階段,態(tài)勢占優(yōu)的一方通過集群對抗戰(zhàn)術(shù)完成了既定戰(zhàn)術(shù)任務(wù)目標,由存活的無人機集群對當前戰(zhàn)場態(tài)勢進行快速評估,并將實時態(tài)勢信息回傳給地面指揮控制中心,根據(jù)對抗評估結(jié)果決定下一周期的集群作戰(zhàn)任務(wù)目標.

2 集群對抗基本模型

2.1 群體動力學演化與控制模型

在集群對抗過程中,如何描述個體到群體行為的演化關(guān)系與群體智能的涌現(xiàn)機理,是研究集群對抗問題建模的關(guān)鍵.集群系統(tǒng)個體在空間中的分布與群體行為建模的主要方法包括空間法和非空間法[17],如表1 所示.其中,空間法著眼于集群系統(tǒng)的空間分布規(guī)律,將集群系統(tǒng)視為連續(xù)整體,采用概率密度分布描述集群系統(tǒng)的運動與狀態(tài)變化[18]；非空間法則從個體的運動學與動力學模型出發(fā),通過描述個體與環(huán)境或其他個體行為的相互作用,確定集群系統(tǒng)個體的運動狀態(tài)[19].由于實際宏觀集群系統(tǒng)中個體的運動學與動力學特征不可忽略,難以滿足空間法對群體的連續(xù)性假設(shè),因此,群體動力學建模從個體運動學與動力學模型出發(fā),考慮集群個體間的相互作用與感知決策,描述集群系統(tǒng)在空間內(nèi)的運動狀態(tài)與內(nèi)部動力學響應(yīng),對應(yīng)集群個體的行為響應(yīng)與決策流程如圖3 所示.

表1 群體動力學建?？臻g法與非空間法的異同Table 1 Similarities and differences between spatial and non-spatial methods of group dynamics modeling

圖3 個體行為響應(yīng)與決策流程Fig 3 Individual behavior response and decision-making process

集群個體首先根據(jù)自身感知交互能力定位其他集群節(jié)點,然后選取滿足個體通信約束與感知邊界的鄰居節(jié)點建立動態(tài)連通的集群拓撲網(wǎng)絡(luò).在鄰居節(jié)點位置、速度等運動狀態(tài)的影響下,集群個體根據(jù)既定的自組織規(guī)則與控制協(xié)議確定各自的行為策略.在此基礎(chǔ)上,集群系統(tǒng)通過上述動作狀態(tài)轉(zhuǎn)移與鄰居節(jié)點交互響應(yīng),實現(xiàn)對應(yīng)既定交互規(guī)則的復雜集群行為演化.集群系統(tǒng)的內(nèi)部響應(yīng)機理與復雜行為演化機制最早在生物集群研究中展開,通過分析魚群[20,21]、鳥群[22]與鴿群[23]等生物集群行為,研究不同生物集群中個體相互作用關(guān)系的建立與復雜集群網(wǎng)絡(luò)的形成,提出了不同生物集群的鄰居節(jié)點選擇方式與對應(yīng)集群網(wǎng)絡(luò)的拓撲結(jié)構(gòu),如表2 所示.表中鄰居節(jié)點示意圖的紅色節(jié)點表示當前節(jié)點,藍色節(jié)點表示鄰居節(jié)點,白色節(jié)點表示集群系統(tǒng)其他節(jié)點,箭頭代表節(jié)點當前速度方向,陰影部分代表了對應(yīng)鄰居節(jié)點選擇方法考慮的約束條件邊界.

表2 集群網(wǎng)絡(luò)拓撲連通與鄰居節(jié)點選擇方式Table 2 Swarm network topology connection and neighbor node selection mode

實驗物理學家從統(tǒng)計力學的角度出發(fā),進一步總結(jié)了生物集群的自組織規(guī)則與相互作用規(guī)律.Reynolds 等首先提出了集中、防碰撞與速度匹配3個個體間相互作用規(guī)則,并據(jù)此建立Boid 模型模擬集群系統(tǒng)速度一致的聚集行為[24].在此基礎(chǔ)上,相關(guān)研究從多智能體系統(tǒng)、平均場理論、復雜網(wǎng)絡(luò)理論和最優(yōu)控制理論等角度出發(fā),通過設(shè)計集群系統(tǒng)中個體的簡單交互規(guī)則,確定集群系統(tǒng)的局部信息交互方式與個體間相互作用規(guī)則的行為響應(yīng)流程,分別提出了自驅(qū)動粒子模型、異質(zhì)平均場模型、引力/斥力勢模型、一致性控制模型和最優(yōu)控制模型等各類不同的群體動力學模型[25-30].在此基礎(chǔ)上,進一步研究了模型中不同個體相互作用規(guī)則對集群系統(tǒng)動態(tài)演化過程與復雜集群行為涌現(xiàn)結(jié)果的影響,然后通過相應(yīng)的集群控制方法實現(xiàn)集聚、渦旋與分簇等不同群體行為的自組織控制與自適應(yīng)切換[31].典型集群動力學模型的對應(yīng)自組織規(guī)則與集群行為如表3 所示,集群動力學模型的自組織規(guī)則描述了集群個體間的相互作用關(guān)系.在此基礎(chǔ)上,集群系統(tǒng)能夠通過根據(jù)既定自組織規(guī)則在宏觀層次上涌現(xiàn)出各類復雜的集群行為.對此,Olfati-Saber 等通過設(shè)計式（1）所示一致性協(xié)議與個體間相互作用的勢函數(shù)[29],實現(xiàn)集群系統(tǒng)集聚與跟蹤等復雜集群行為的自組織控制：

表3 集群動力學模型自組織規(guī)則與集群行為Table 3 Self-organizing rules and swarm behavior of swarm dynamics model

式中,xi∈R3和vi∈R3表示集群系統(tǒng)個體位置和速度矢量;σ 為正則化梯度函數(shù);ε 為對應(yīng)正則化梯度函數(shù)參數(shù);aij為對應(yīng)鄰居節(jié)點相互作用強度;φα為對應(yīng)集群個體間鄰居節(jié)點相互作用的勢函數(shù).在上述模型與集群個體自組織相互作用規(guī)則中,通過設(shè)計正則化梯度函數(shù)σ 的對應(yīng)參數(shù)ε,可以實現(xiàn)集群系統(tǒng)集聚、渦旋、極化與分簇等復雜群體行為,進而實現(xiàn)蜂擁、盤旋、編隊、跟蹤與避障等集群作戰(zhàn)任務(wù).

2.2 敵方集群統(tǒng)計特征模型

集群系統(tǒng)空間分布特征可以采用聚類方法對觀測的目標位置信息進行統(tǒng)計分析,通過對觀測集群目標的子群分簇質(zhì)心與形狀的估計與擬合實現(xiàn)對集群目標空間分布特征提取與分析[32].常見的聚類方法包括K-means 聚類方法與EM 聚類方法（expectation maximization,EM）.其中,K-means 聚類方法根據(jù)集群個體間樣本距離將觀測集群目標劃分為若干個子群,具有較高的計算效率,能夠?qū)崿F(xiàn)指定子群個數(shù)的快速聚類,但僅能夠確定集群整體的空間分布,無法確定對應(yīng)各分簇子群的形狀與質(zhì)心[33].而EM 聚類方法則采用期望最大化算法（expectation-maximization algorithm）,通過期望（E 步）和最大化（M 步）兩個步驟的迭代更新,能夠?qū)崿F(xiàn)對觀測目標集群子群的分布估計[34].假設(shè)集群空間分布由k 個高斯分布組成,對應(yīng)高斯混合分布函數(shù)：

式中,xi為對應(yīng)集群狀態(tài)總體X 的m 個觀測樣本;ai為對應(yīng)第i 個高斯分布的混合系數(shù);為對應(yīng)高斯分布概率密度函數(shù);μi和σi為對應(yīng)第i 個高斯分布的均值向量與協(xié)方差矩陣.則對應(yīng)觀測目標xj∈X從屬于第i 個高斯分布的后驗概率為：

集群系統(tǒng)運動狀態(tài)的統(tǒng)計特征參數(shù)主要包括速度一致性序參量、群體角動量和群體極化程度[35].其中,VISCEK 等首先定義了集群個體速度矢量的加權(quán)平均參數(shù)[25],用來描述集群中不同個體運動速度的一致性程度,如下式所示：

式中,va為速度一致性序參量;m 為觀測的集群目標個體數(shù)目;vi為對應(yīng)個體i 的速度矢量,對應(yīng)集群系統(tǒng)個體運動狀態(tài)與速度波動與群體的規(guī)模分布存在空間關(guān)聯(lián)關(guān)系如下式所示[36]：

群體極化程度和群體角動量[21,27]針對集群系統(tǒng)中不同個體的運動狀態(tài)與速度方向特征,定義了集群個體運動速度方向的一致程度和集群整體運動速度方向的旋轉(zhuǎn)程度如下式所示：

式中,ui為對應(yīng)個體i 的單位速度矢量；ri為對應(yīng)個體i 指向集群質(zhì)心的矢徑；Op為群體極化程度,表征了集群中不同個體運動速度方向的一致性程度；Or為群體角動量,表征了集群中不同個體繞集群質(zhì)心運動的旋轉(zhuǎn)程度.Op越大,則表征集群不同個體的速度方向一致性程度高;Or越大,則表征集群不同個體繞質(zhì)心的旋轉(zhuǎn)程度越大.

對此,結(jié)合生物集群的實驗觀測統(tǒng)計數(shù)據(jù)信息,可以進一步將集群系統(tǒng)涌現(xiàn)的集聚、渦旋與極化等復雜行為與群體狀態(tài)映射到集群系統(tǒng)運動狀態(tài)的序參數(shù)取值范圍,總結(jié)如下集群行為狀態(tài)的唯像規(guī)律[21].因此,通過分析群體極化程度與群體角動量的統(tǒng)計特征與變化規(guī)律,能夠在識別目標集群運動狀態(tài)的基礎(chǔ)上進一步推斷目標集群的行為樣式.在此基礎(chǔ)上,可以進一步定義集群行為涌現(xiàn)的表達熵（expressive entropy）[37]來描述對應(yīng)各類統(tǒng)計特征參數(shù)識別與推斷集群行為樣式的不確定性,如下式所示：

式中,Sp為對應(yīng)集群系統(tǒng)的各類統(tǒng)計特征參數(shù)；Hexp為表達熵,表征了通過各類統(tǒng)計特征參數(shù)分析集群行為涌現(xiàn)的不確定性；M（Sp）為對應(yīng)各類集群行為樣式b 的集合；p（b）為對應(yīng)各類統(tǒng)計特征參數(shù)識別與推斷集群行為樣式b 的概率.

2.3 集群對抗態(tài)勢效能模型

在無人機空戰(zhàn)對抗問題中,集群系統(tǒng)的空戰(zhàn)對抗態(tài)勢效能評估[38]涵蓋了戰(zhàn)場空間態(tài)勢、作戰(zhàn)任務(wù)能力和體系對抗效能.通過考慮集群網(wǎng)絡(luò)相鄰節(jié)點的協(xié)同效應(yīng)與集群系統(tǒng)協(xié)同作戰(zhàn)的空間態(tài)勢,分析交戰(zhàn)雙方集群系統(tǒng)在攻擊占位或防御機動等方面的作戰(zhàn)優(yōu)勢,衡量交戰(zhàn)雙方采取方采取對抗戰(zhàn)術(shù)意圖的優(yōu)劣與威脅程度.

集群對抗的戰(zhàn)場空間態(tài)勢在一對一作戰(zhàn)態(tài)勢的基礎(chǔ)上考慮集群個體間的協(xié)同效應(yīng).一對一對抗的戰(zhàn)場空間態(tài)勢評估根據(jù)交戰(zhàn)雙方相對位置與速度方向,將對應(yīng)戰(zhàn)場空間分布的迎頭態(tài)勢和尾追態(tài)勢分為均勢、優(yōu)勢與劣勢.通過結(jié)合自身任務(wù)作戰(zhàn)能力的機動性能約束、偵察感知范圍和毀傷打擊邊界,基于專家經(jīng)驗設(shè)計對應(yīng)個體i 與個體j 的角度態(tài)勢、距離態(tài)勢、高差態(tài)勢和速度態(tài)勢等態(tài)勢函數(shù)[39].集群個體各類戰(zhàn)場空間態(tài)勢函數(shù)的具體數(shù)學模型因?qū)＜医?jīng)驗相異而各不相同,常通過非線性函數(shù)的組合描述集群個體對抗態(tài)勢的空間分布規(guī)律與特征.在此基礎(chǔ)上,將集群對抗中每組個體間的戰(zhàn)場空間態(tài)勢以矩陣形式描述,如下式所示：

式中,Sk為對應(yīng)各類戰(zhàn)場空間態(tài)勢的態(tài)勢矩陣;sij為個體i 與個體j 間的相對態(tài)勢.

在對抗過程中,集群系統(tǒng)首先根據(jù)當前戰(zhàn)場空間分布與運動狀態(tài)將敵我雙方集群個體劃分為若干分簇子群社團,不同子群的個體在戰(zhàn)場中的空間態(tài)勢互不影響[40].假設(shè)同一子群中的個體僅能夠選取同一敵方子群中的個體作為對抗目標,對抗目標相同的集群個體戰(zhàn)場空間態(tài)勢相互獨立且形成協(xié)同作戰(zhàn)態(tài)勢[41],則對應(yīng)集群個體的協(xié)同作戰(zhàn)態(tài)勢如下式所示：

式中,Rj為以敵方個體j 為對抗目標的集群個體集合;Jsi為對應(yīng)個體i 考慮協(xié)同效應(yīng)的戰(zhàn)場空間態(tài)勢,表征了具有相同對抗目標的集群個體間存在協(xié)同效應(yīng),可以通過相互配合形成協(xié)同機動策略,提升集群對抗整體戰(zhàn)場空間態(tài)勢與作戰(zhàn)效能.

此外,集群個體間確定的協(xié)同關(guān)系與目標分配結(jié)果影響了集群系統(tǒng)整體的目標殺傷率、裝備生存率和作戰(zhàn)效費比等體系對抗效能.其中,目標殺傷率和裝備生存率與集群個體雷達探測系統(tǒng)的預(yù)警概率和機載武器系統(tǒng)的毀傷概率有關(guān).在集群對抗過程中,集群系統(tǒng)個體對目標的探測預(yù)警與毀傷打擊過程相互獨立,則以敵方集群個體j 為對抗目標的我方集群個體i∈Rj協(xié)同打擊的毀傷概率為：

式中,pf,ij為集群i 個體雷達探測系統(tǒng)發(fā)現(xiàn)對抗目標j的預(yù)警概率；pd,ij為集群個體i 機載武器系統(tǒng)對打擊目標j 的毀傷概率.

根據(jù)集群個體通過協(xié)同配合對目標的殺傷概率,定義集群在對抗過程中對敵方目標總體殺傷概率與敵方目標總體數(shù)量的比值為集群對抗的目標殺傷率,如下式所示：

同理,定義集群系統(tǒng)在敵方攻擊下存活概率與集群個體總數(shù)量的比值為集群系統(tǒng)的裝備生存率,如下式所示：

式中,pd,ji為敵方集群個體j 機載武器系統(tǒng)對我方集群個體i 的毀傷概率.在此基礎(chǔ)上,進一步定義集群系統(tǒng)對抗過程中對目標殺傷率與己方集群個體在敵方攻擊下毀傷概率的比值為集群系統(tǒng)完成既定作戰(zhàn)任務(wù)的效費比[42],如下式所示：

在集群對抗的戰(zhàn)場空間態(tài)勢與體系對抗效能的基礎(chǔ)上,進一步考慮敵我雙方集群系統(tǒng)在機動響應(yīng)、感知探測、毀傷打擊和電子對抗等方面的整體作戰(zhàn)能力優(yōu)勢與劣勢.針對各類集群對抗態(tài)勢效能,采用加權(quán)方法確定對應(yīng)集群系統(tǒng)個體的綜合協(xié)同態(tài)勢函數(shù)如下式所示：

式中,Js為對應(yīng)集群系統(tǒng)角度態(tài)勢、距離態(tài)勢、高差態(tài)勢和速度態(tài)勢的戰(zhàn)場空間協(xié)同態(tài)勢；Je為對應(yīng)集群系統(tǒng)機動響應(yīng)、感知探測、毀傷打擊和電子對抗的整體協(xié)同作戰(zhàn)任務(wù)優(yōu)勢；Jc為對應(yīng)集群系統(tǒng)體系對抗效能；ωs、ωe和ωc分別為對應(yīng)各類型態(tài)勢效能的加權(quán)系數(shù).

3 集群對抗關(guān)鍵技術(shù)

結(jié)合無人機集群對抗過程中感知、決策與控制的具體作戰(zhàn)流程,在集群對抗中敵方集群統(tǒng)計特征模型、集群對抗態(tài)勢效能模型和群體動力學演化與控制模型的基礎(chǔ)上,從敵方集群建模、動態(tài)博弈決策和集群協(xié)同控制的角度出發(fā),確定集群對抗關(guān)鍵技術(shù)包括基于多源態(tài)勢感知的對手建模方法、面向不完全信息動態(tài)博弈的集群對抗決策方法和結(jié)合虛擬領(lǐng)導者的分布式集群牽制控制方法,具體內(nèi)容如圖4 所示.

圖4 集群對抗基本模型與關(guān)鍵技術(shù)Fig 4 Basic model and key technology of swarm confrontation

3.1 結(jié)合虛擬領(lǐng)導者的集群牽制控制

在高動態(tài)強對抗的復雜戰(zhàn)場環(huán)境中,面對突發(fā)敵方威脅時集群個體需要快速機動響應(yīng)實現(xiàn)既定作戰(zhàn)任務(wù)的集群控制.牽制控制方法能夠根據(jù)集群系統(tǒng)的群體動力學模型,通過對集群部分節(jié)點的控制實現(xiàn)在保證集群網(wǎng)絡(luò)最小功能單位持續(xù)連通的條件下集群系統(tǒng)作戰(zhàn)任務(wù)與群體行為的牽制控制[43].其中,關(guān)鍵牽制節(jié)點的選取根據(jù)對應(yīng)分簇子群網(wǎng)絡(luò)節(jié)點度量參數(shù)來確定,而虛擬領(lǐng)導者根據(jù)集群系統(tǒng)期望的空間分布與運動狀態(tài)來確定.在對應(yīng)博弈模型納什均衡解的基礎(chǔ)上,通過確定△T 時刻后集群系統(tǒng)最小功能單位的分簇子群,選取對應(yīng)分簇子群的群體質(zhì)心為虛擬領(lǐng)導者,虛擬領(lǐng)導者在當前時刻的速度即為△T 時刻后對應(yīng)分簇子群精煉貝葉斯納什均衡策略的平均速度.設(shè)對應(yīng)第k 個分簇子群有nk個節(jié)點,則對應(yīng)虛擬領(lǐng)導者k 的動態(tài)方程如下式所示：

式中,xk和vk為集群分簇子群k 中虛擬領(lǐng)導者k 的位置矢量和速度矢量；為對應(yīng)集群對抗博弈模型中個體i 的精煉貝葉斯納什均衡策略；ui為對應(yīng)個體i 的單位速度方向矢量.

在此基礎(chǔ)上,集群系統(tǒng)通過虛擬領(lǐng)導者對關(guān)鍵節(jié)點的牽制引導與集群網(wǎng)絡(luò)相鄰節(jié)點間的相互作用影響,實現(xiàn)對應(yīng)集群系統(tǒng)群體行為與對抗戰(zhàn)術(shù)等期望目標的牽制控制.對應(yīng)集群系統(tǒng)各節(jié)點的運動學與動力學模型如下式所示：

式中,xik和vik為集群分簇子群k=1,2,…,m 中集群個體i=1,2,…,ni的位置向量和速度向量；為對應(yīng)集群個體i 受同一分簇子群中鄰居節(jié)點個體j∈Ii影響的速度方向控制輸入；為對應(yīng)集群個體受虛擬領(lǐng)導者k 影響的控制輸入；α 為對應(yīng)集群個體是否為關(guān)鍵牽制節(jié)點的判斷標識,若α=1 則該個體為關(guān)鍵牽制節(jié)點,在虛擬領(lǐng)導者的引導信息下不受其他集群個體節(jié)點的影響.

在此基礎(chǔ)上,設(shè)計對應(yīng)各節(jié)點間相互作用下的控制輸入如下式所示：

式中,第1 項表征了群體動力學模型中遠距吸引、近距排斥的相互作用規(guī)則；第2 項則表征了群體動力學模型中速度匹配的相互作用規(guī)則；k1,k2為對應(yīng)各類相互作用規(guī)則的權(quán)重系數(shù)；Ni為節(jié)點i 的鄰居節(jié)點集合;為對應(yīng)集群網(wǎng)絡(luò)拓撲連通關(guān)系的鄰接矩陣;ψ 為對應(yīng)集群個體間引力/斥力相互作用的人工勢函數(shù),在不同集群動力學模型中具體的數(shù)學形式各不相同.

集群對抗問題中結(jié)合虛擬領(lǐng)導者的集群牽制控制流程如圖5 所示,集群系統(tǒng)首先根據(jù)當前時刻敵我雙方集群狀態(tài)實時優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)與拓撲重構(gòu).在此基礎(chǔ)上,根據(jù)期望的集群系統(tǒng)空間分布與運動狀態(tài)劃分集群分簇社團,通過計算網(wǎng)絡(luò)節(jié)點度量參數(shù)確定集群網(wǎng)絡(luò)的關(guān)鍵節(jié)點.然后,根據(jù)集群系統(tǒng)關(guān)鍵節(jié)點與其他網(wǎng)絡(luò)節(jié)點信息反饋,確定虛擬領(lǐng)導者與網(wǎng)絡(luò)節(jié)點的控制輸入.最后,通過集群系統(tǒng)網(wǎng)絡(luò)節(jié)點的空間分布與運動狀態(tài)更新實現(xiàn)集群對抗的作戰(zhàn)推演與節(jié)點更新.

圖5 集群對抗牽制控制流程示意圖Fig 5 Flow diagram of swarm confrontation pinning control

3.2 基于有限觀測信息的對手建模

集群對抗的對手建模從個體運動狀態(tài)、群體協(xié)同行為與集群戰(zhàn)術(shù)意圖出發(fā),通過對敵方集群系統(tǒng)的觀測信息推斷敵方集群系統(tǒng)模型[44].其中,敵方集群系統(tǒng)的空間分布與個體運動狀態(tài)信息可以通過局部態(tài)勢感知確定,在此基礎(chǔ)上根據(jù)有限觀測信息實現(xiàn)敵方集群系統(tǒng)模型的推斷.

由于集群系統(tǒng)時序狀態(tài)信息的變化規(guī)律能夠反映集群系統(tǒng)采取的戰(zhàn)術(shù)意圖,因此,考慮采用動態(tài)貝葉斯網(wǎng)絡(luò)方法分析敵方集群的統(tǒng)計特征,推斷敵方集群行為與作戰(zhàn)意圖[45].設(shè)狀態(tài)變量與觀測變量

,則動態(tài)貝葉斯網(wǎng)絡(luò)可表示為狀態(tài)變量與觀測變量的聯(lián)合概率分布:

將動態(tài)貝葉斯網(wǎng)絡(luò)分為決策層和特征層兩層結(jié)構(gòu).其中,特征層選取集群個體速度V、偏航角φ 和高度h 作為觀測節(jié)點,表征了對應(yīng)空間分布與運動狀態(tài)的變化特征與規(guī)律；決策層選取集群系統(tǒng)宏觀群體行為M 和作戰(zhàn)意圖A 作為狀態(tài)節(jié)點,表征了對應(yīng)聚集、盤旋與分簇等復雜集群行為,以及合圍打擊、戰(zhàn)術(shù)騙擾與集群突防等集群對抗作戰(zhàn)戰(zhàn)術(shù).設(shè)t-1 時刻的底層狀態(tài)與觀測節(jié)點信息序列為e1:t,頂層決策節(jié)點濾波結(jié)果為At,根據(jù)設(shè)計動態(tài)貝葉斯網(wǎng)絡(luò)的鏈式結(jié)構(gòu),結(jié)合式貝葉斯公式與鏈式推理規(guī)則可得t 時刻頂層決策節(jié)點At采取戰(zhàn)術(shù)意圖的條件概率如下式所示:

針對有限觀測信息對手建模問題的動態(tài)貝葉斯網(wǎng)絡(luò)推理過程如圖6 所示.集群系統(tǒng)首先根據(jù)獲取敵方集群的有限觀測信息進行多源數(shù)據(jù)融合與目標關(guān)聯(lián)處理,為對手建模的集群行為識別與作戰(zhàn)意圖預(yù)測提供實時輸入數(shù)據(jù).在此基礎(chǔ)上,動態(tài)貝葉斯網(wǎng)絡(luò)進行網(wǎng)絡(luò)參數(shù)初始化并確定對應(yīng)狀態(tài)節(jié)點的條件概率與轉(zhuǎn)移概率,然后更新貝葉斯網(wǎng)絡(luò)節(jié)點概率分布,實現(xiàn)敵方集群系統(tǒng)狀態(tài)特征提取與行為意圖識別.

圖6 動態(tài)貝葉斯網(wǎng)絡(luò)推理流程示意圖Fig 6 Flow diagram of dynamic Bayesian network inference

3.3 面向集群對抗的不完全信息動態(tài)博弈

博弈模型的不完全信息專指局中人在博弈開始前對其他局中人的事前信息了解不充分,這些事前信息泛指能夠影響博弈局勢的局中人屬性[46].在集群對抗問題中,由于雙方遭遇交戰(zhàn)時并不清楚對方的群體動力學模型與態(tài)勢效能評估依據(jù),因此,可以將集群對抗博弈模型中的不完全信息定義為集群系統(tǒng)個體的作戰(zhàn)意圖偏好,在對手建模結(jié)果的基礎(chǔ)上,通過海薩尼轉(zhuǎn)換引入虛擬局中人“自然”,賦予博弈中各局中人的作戰(zhàn)偏好類型與對應(yīng)概率密度[47],表征了集群系統(tǒng)在當前態(tài)勢下的作戰(zhàn)偏好是更傾向于保守策略還是激進策略.

式中,gb為對應(yīng)藍方集群系統(tǒng)對當前戰(zhàn)場態(tài)勢的評估結(jié)果;At為對手建模中對應(yīng)t 時刻動態(tài)貝葉斯頂層決策節(jié)點濾波結(jié)果;e1:t為對手建模中對應(yīng)t-1 時刻的底層狀態(tài)與觀測節(jié)點信息序列.

式中,V 為對應(yīng)博弈模型中采取相應(yīng)策略的效用函數(shù);πk為對應(yīng)局中人采取的混合策略組合;為集群協(xié)同態(tài)勢效能評估函數(shù);s 為對應(yīng)局中人采取混合策略的動作狀態(tài)轉(zhuǎn)移.

不完全信息動態(tài)博弈模型的精煉貝葉斯納什均衡是推斷概率和混合策略組合共同組成的策略評估,是完全信息動態(tài)博弈子博弈精煉納什均衡與不完全信息靜態(tài)博弈貝葉斯納什均衡的結(jié)合[48].對此,集群對抗博弈模型的精煉貝葉斯納什均衡定義如下：設(shè)是局中人在全部博弈階段中的某一混合策略組合序列,是除此局中人i 外其他局中人的全部混合策略組合序列.若對每一個局中人i在全部博弈階段任意策略組合序列都有：

針對集群對抗問題的不完全信息動態(tài)博弈過程如圖7 所示.集群對抗采用海薩尼轉(zhuǎn)換將不完全信息動態(tài)博弈轉(zhuǎn)換為完全不完美信息動態(tài)博弈,通過自然確定局中人概率分布并采用貝葉斯估計推斷敵方未知屬性與概率分布.在此基礎(chǔ)上,集群系統(tǒng)通過協(xié)同戰(zhàn)術(shù)意圖決策進行動作狀態(tài)轉(zhuǎn)移,并根據(jù)效用函數(shù)求解對應(yīng)貝葉斯納什均衡的集群對抗協(xié)同策略.

圖7 集群博弈對抗流程示意圖Fig 7 Flow diagram of swarm game confrontation

4 研究難點與挑戰(zhàn)

4.1 動態(tài)對抗過程中集群網(wǎng)絡(luò)的即時修復

集群拓撲網(wǎng)絡(luò)結(jié)構(gòu)的連通性與魯棒性是集群系統(tǒng)發(fā)揮協(xié)同作戰(zhàn)效能的關(guān)鍵.在高動態(tài)強對抗的作戰(zhàn)過程中,集群系統(tǒng)復雜行為的形成與群體智能的涌現(xiàn)依賴于集群系統(tǒng)的持續(xù)連通與信息交互.現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)優(yōu)化設(shè)計與拓撲重構(gòu)研究主要針對無線傳感系統(tǒng)與電網(wǎng)配電系統(tǒng)等問題[49-50].由于傳感器網(wǎng)絡(luò)和電網(wǎng)系統(tǒng)中的節(jié)點不具備移動能力,靜態(tài)網(wǎng)絡(luò)節(jié)點構(gòu)成的固定網(wǎng)絡(luò)系統(tǒng)能夠預(yù)先確定各節(jié)點的重要程度,根據(jù)復雜網(wǎng)絡(luò)性質(zhì)將網(wǎng)絡(luò)節(jié)點分為關(guān)鍵節(jié)點、冗余節(jié)點和普通節(jié)點3 種不同類型.在此基礎(chǔ)上,針對不同類型節(jié)點的失效情況預(yù)先設(shè)定對應(yīng)網(wǎng)絡(luò)節(jié)點故障的重構(gòu)策略與方案.在對抗過程中,集群網(wǎng)絡(luò)節(jié)點的空間分布與個體的運動狀態(tài)在高度動態(tài)變化,各節(jié)點在集群網(wǎng)絡(luò)中的重要程度與對應(yīng)節(jié)點類型也隨之發(fā)生變化.傳統(tǒng)網(wǎng)絡(luò)重構(gòu)與優(yōu)化方法難以適應(yīng)無人集群系統(tǒng)的動態(tài)性場景與實時性要求,需要進一步研究集群網(wǎng)絡(luò)的在線故障診斷與即時修復策略,在網(wǎng)絡(luò)故障診斷結(jié)果的基礎(chǔ)上定位失效節(jié)點類型與其對應(yīng)的鄰居節(jié)點,由其中冗余節(jié)點自組織代替失效節(jié)點,實現(xiàn)集群網(wǎng)絡(luò)的信息交互與作戰(zhàn)能力的自適應(yīng)恢復.因此,集群系統(tǒng)網(wǎng)絡(luò)的在線重構(gòu)與即時修復是群體動力學模型未來實際應(yīng)用中關(guān)鍵難點與挑戰(zhàn).

4.2 局部感知下敵方集群的全局狀態(tài)估計

對手建模問題一方面需要對多源局部態(tài)勢感知信息進行融合處理獲得敵方集群整體統(tǒng)計特征等戰(zhàn)場態(tài)勢信息；另一方面需要根據(jù)敵方集群的空間分布與運動狀態(tài)信息推斷敵方整體集群的行為樣式與作戰(zhàn)意圖[51].而集群對抗的交戰(zhàn)雙方在遭遇時僅能通過個體的局部觀測獲取敵方集群個體的狀態(tài)與位置信息,往往無法直接獲取敵方集群的全局空間分布與運動狀態(tài)信息.傳統(tǒng)的數(shù)據(jù)融合與目標關(guān)聯(lián)算法研究主要集中在多傳感器多目標跟蹤問題[52],通過濾波方法對同一時刻多傳感器的探測信息進行融合處理,實現(xiàn)對多個目標的狀態(tài)定位與估計.在此基礎(chǔ)上,采用目標關(guān)聯(lián)算法實現(xiàn)對不同時刻多目標跟蹤的數(shù)據(jù)關(guān)聯(lián),通過計算相似度函數(shù)確定當前探測目標與已形成軌跡跟蹤目標之間的關(guān)聯(lián)概率.由于集群對抗過程中,不同時刻個體節(jié)點觀測到的敵方目標數(shù)量與對應(yīng)位置動態(tài)變化.傳統(tǒng)數(shù)據(jù)融合與目標關(guān)聯(lián)算法對無人集群系統(tǒng)觀測數(shù)據(jù)偏差的敏感度更高,數(shù)據(jù)融合的準確性與目標關(guān)聯(lián)的成功率難以保證.因此,集群系統(tǒng)在局部觀測下對敵方集群整體的全局狀態(tài)估計是對手建模的核心難點與挑戰(zhàn).

4.3 多階段博弈對抗納什均衡策略的精煉

集群系統(tǒng)的博弈對抗具有較長的對抗過程與博弈階段,對應(yīng)集群對抗的分布式不完全信息動態(tài)博弈模型可能存在多組混合策略組合序列滿足納什均衡條件.因此,集群系統(tǒng)多階段博弈對抗需要結(jié)合集群對抗的具體作戰(zhàn)任務(wù)需求,實現(xiàn)對博弈模型納什均衡解的精煉.由于集群對抗問題中集群的作戰(zhàn)規(guī)模大,對應(yīng)博弈模型精煉納什均衡的計算復雜度高且求解困難.傳統(tǒng)的分布式不完全信息博弈模型納什均衡求解與精煉主要采用反事實遺憾值最小化算法（counterfactual regret minimization,CFR）[53],通過遺憾值表征當前迭代策略相較于精煉納什均衡策略的收益效用偏差,并結(jié)合反事實值評價對應(yīng)個體當前策略下遺憾值最小化指標,使得對應(yīng)全局博弈的平均整體遺憾值最優(yōu).隨著深度強化學習技術(shù)的發(fā)展,神經(jīng)網(wǎng)絡(luò)因其較強的擬合能力引入納什均衡策略求解方法中,神經(jīng)虛擬自我對弈算法（neural stochastic fictitious play,NSFP）[54]通過建立對應(yīng)博弈模型中對抗雙邊的局中人策略空間,訓練對應(yīng)敵方平均策略的最佳響應(yīng)策略,實現(xiàn)對應(yīng)博弈模型納什均衡策略的求解與精煉.在傳統(tǒng)強化學習模型的基礎(chǔ)上,進一步結(jié)合深度神經(jīng)網(wǎng)絡(luò)優(yōu)化強化學習訓練架構(gòu)設(shè)計,建立泛化性博弈模型納什均衡求解框架,是未來多階段博弈對抗納什均衡策略求解與精煉的突破方向.

5 結(jié)論

本文結(jié)合無人機集群反制與對抗的典型任務(wù)場景需求與感知決策控制的基本作戰(zhàn)流程,從無人機集群系統(tǒng)的群體動力學模型、統(tǒng)計特征模型和博弈對抗模型出發(fā),探討了集群對抗研究中群體行為演化控制問題、對手建模問題與集群博弈對抗問題的理論基礎(chǔ)與關(guān)鍵技術(shù).在此基礎(chǔ)上,針對集群對抗過程中戰(zhàn)場態(tài)勢高度動態(tài)變化、敵我雙方對抗策略信息不完備的特點,分析了動態(tài)集群網(wǎng)絡(luò)拓撲結(jié)構(gòu)即時修復,敵方集群全局狀態(tài)估計與集群博弈對抗納什均衡策略求解與精煉的研究難點與挑戰(zhàn),為未來無人機集群系統(tǒng)反制與對抗的研究提供了新的解決思路與借鑒參考.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡