国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于回訪機(jī)制的無人機(jī)集群分布式協(xié)同區(qū)域搜索方法

2023-07-29 03:04:42文超董文瀚解武杰蔡鳴劉日
航空學(xué)報(bào) 2023年11期
關(guān)鍵詞:柵格集群分布式

文超,董文瀚,解武杰,蔡鳴,*,劉日

1.空軍工程大學(xué) 研究生院,西安 710038

2.空軍工程大學(xué) 航空工程學(xué)院,西安 710038

3.空軍哈爾濱飛行學(xué)院 理論訓(xùn)練系,哈爾濱 150000

近年來,受益于人工智能與無人系統(tǒng)的蓬勃發(fā)展,無人機(jī)(Unmanned Aerial Vehicle,UAV)被廣泛應(yīng)用于軍事作戰(zhàn)領(lǐng)域,而采用多架UAV以集群網(wǎng)絡(luò)形式協(xié)同執(zhí)行區(qū)域搜索、目標(biāo)跟蹤、飽和打擊等任務(wù)正逐漸成為UAV 作戰(zhàn)的發(fā)展趨勢(shì)。其中,區(qū)域搜索任務(wù)作為UAV 集群協(xié)同作戰(zhàn)的關(guān)鍵環(huán)節(jié),能夠?yàn)楹罄m(xù)作戰(zhàn)任務(wù)決策提供有效的全局信息支撐,得到了國(guó)內(nèi)外學(xué)者的廣泛關(guān)注[1-5]。

UAV 集群協(xié)同區(qū)域搜索是指UAV 成員利用機(jī)載探測(cè)設(shè)備偵察指定任務(wù)區(qū)域,并通過通信網(wǎng)絡(luò)交互共享探測(cè)信息,從而協(xié)作完成對(duì)任務(wù)目標(biāo)的捕獲[6-7]。目前,諸多學(xué)者主要圍繞任務(wù)環(huán)境建模與協(xié)同搜索策略2 個(gè)方面對(duì)UAV 集群協(xié)同區(qū)域搜索問題進(jìn)行了廣泛而深入的探究,并取得了豐碩的成果。

在任務(wù)環(huán)境建模方面,現(xiàn)有成果大多基于柵格化方法來構(gòu)建任務(wù)環(huán)境的搜索圖模型,主要包括目標(biāo)分布概率圖、數(shù)字信息素圖及確定度圖等[8-15]。Yang 等[8]為準(zhǔn)確描述動(dòng)態(tài)未知環(huán)境下傳感器對(duì)目標(biāo)觀測(cè)信息的實(shí)時(shí)獲取與更新,分別基于貝葉斯準(zhǔn)則與D-S 證據(jù)理論構(gòu)建了目標(biāo)分布概率圖,并借此引導(dǎo)集群對(duì)威脅場(chǎng)景下的目標(biāo)進(jìn)行合作定位。Khan 等[9]考慮到不確定環(huán)境下各UAV 的局部探測(cè)信息可能存在偏差,通過占用柵格合并技術(shù)對(duì)目標(biāo)分布概率圖進(jìn)行融合,進(jìn)一步增強(qiáng)了概率圖對(duì)潛在目標(biāo)的指示能力。沈東等[11]為實(shí)現(xiàn)集群對(duì)廣域目標(biāo)的協(xié)同搜索,分別定義了數(shù)字信息素的吸引和排斥屬性,前者用于記錄UAV 對(duì)搜索區(qū)域的訪問特性,后者用于協(xié)調(diào)集群成員之間的搜索行為。吳傲等[13]通過將信息素圖作為多機(jī)協(xié)同的載體,實(shí)現(xiàn)了集群對(duì)未知區(qū)域的高效覆蓋搜索。Saadaoui 和el Boua‐nani[14]將確定度引入未知區(qū)域內(nèi)離散柵格單元,借此來描述UAV 對(duì)搜索環(huán)境的認(rèn)知程度,進(jìn)而指導(dǎo)其自主搜索決策過程。彭輝等[15]在確定度圖的基礎(chǔ)上,借鑒生物細(xì)胞中荷爾蒙的擴(kuò)散-傳播機(jī)理,提出一種基于擴(kuò)展搜索圖的多UAV 協(xié)同搜索決策方法,較好地激發(fā)了多機(jī)系統(tǒng)的自組織性??偠灾?,搜索圖模型本質(zhì)上都是通過建立一個(gè)二維離散柵格地圖來反映UAV 對(duì)當(dāng)前搜索環(huán)境的認(rèn)知情況。隨著任務(wù)的推進(jìn),UAV 持續(xù)探測(cè)柵格,并不斷更新本機(jī)搜索圖,在每個(gè)決策時(shí)刻,UAV 能夠根據(jù)實(shí)時(shí)探測(cè)信息進(jìn)行在線搜索決策。因此,搜索圖對(duì)于引導(dǎo)UAV 集群遂行動(dòng)態(tài)協(xié)同搜索任務(wù)具有較好的適應(yīng)性。

在協(xié)同搜索策略方面,提出的方法主要包括區(qū)域分割覆蓋掃描[16-20]、模型預(yù)測(cè)控制(Model Predictive Control,MPC)[21-25]和潛在博弈等[26-27]。其中,前兩者的應(yīng)用最為廣泛。文獻(xiàn)[16-17]首先基于Voronoi 構(gòu)型劃分搜索區(qū)域,然后結(jié)合概率圖信息設(shè)計(jì)合理的控制律引導(dǎo)UAV成員收斂至各自的Voronoi 質(zhì)心,從而實(shí)現(xiàn)對(duì)任務(wù)子區(qū)域的覆蓋搜索。這種分割方法原理相對(duì)簡(jiǎn)單,但具有較高的不確定度和計(jì)算復(fù)雜度。文獻(xiàn)[18]分別針對(duì)凸和非凸的多邊形任務(wù)區(qū)域提出了基于UAV 來向均衡劃分策略與凹點(diǎn)凸分解策略,同時(shí)采用“Z”型路徑與Dubins 轉(zhuǎn)彎路徑來規(guī)劃子區(qū)域內(nèi)的覆蓋掃描路徑,實(shí)現(xiàn)了集成區(qū)域分割與路徑規(guī)劃的整體調(diào)用。文獻(xiàn)[19]根據(jù)UAV 的初始位置和搜索面積將任意凸多邊形區(qū)域分割為若干不同子區(qū)域,并將UAV 集群的總轉(zhuǎn)彎次數(shù)作為主要指標(biāo)評(píng)估分割結(jié)果,通過數(shù)值仿真證明了所提方法的有效性。

上述方法對(duì)于靜態(tài)未知環(huán)境下的區(qū)域搜索問題表現(xiàn)出良好的適應(yīng)性,但難以求解動(dòng)態(tài)搜索規(guī)劃問題,具有一定的現(xiàn)實(shí)局限性。為了提高UAV 動(dòng)態(tài)決策能力,文獻(xiàn)[21]重點(diǎn)研究了不確定環(huán)境下通信約束對(duì)于多UAV 協(xié)同搜索效能的影響,通過引入MPC 思想使UAV 在決策時(shí)能夠充分兼顧長(zhǎng)短期收益,有效解決了UAV 決策后期易陷入局部最優(yōu)的問題。文獻(xiàn)[22]基于MPC思想提出一種UAV 集群分布式搜索意圖交互決策機(jī)制,通過定制環(huán)境更新算子與環(huán)境融合算子,實(shí)現(xiàn)了集群在未知威脅場(chǎng)景下的高效覆蓋搜索。文獻(xiàn)[24-25]為了將集群系統(tǒng)的大規(guī)模優(yōu)化決策分解為各UAV 子系統(tǒng)的分布式優(yōu)化決策,基于分布式模型預(yù)測(cè)控制(Distributed Model Predictive Control,DMPC)方法提出一種廣泛適用的多UAV 動(dòng)態(tài)搜索規(guī)劃框架,通過結(jié)合滾動(dòng)時(shí)域優(yōu)化(Receding Horizon Optimization,RHO)與智能優(yōu)化算法來迭代求解各UAV 成員的搜索路徑,有效降低了問題求解維度,提高了UAV 實(shí)時(shí)在線決策能力。

綜上所述,現(xiàn)有國(guó)內(nèi)外研究雖然使UAV 集群在動(dòng)態(tài)未知環(huán)境中具備了一定的協(xié)同搜索能力,但仍存有以下問題有待解決:

1)區(qū)域搜索任務(wù)中未能兼顧對(duì)地面動(dòng)目標(biāo)的搜索需求,僅以區(qū)域覆蓋率為評(píng)價(jià)指標(biāo)衡量集群協(xié)同搜索效率。

2)未針對(duì)傳感器的探測(cè)性能局限可能造成的目標(biāo)誤判和漏檢問題制定具體解決方案。

3)UAV 成員在基于傳統(tǒng)DMPC 方法實(shí)時(shí)更新本機(jī)搜索圖時(shí),通常需要接收來自通信網(wǎng)絡(luò)共享的它機(jī)預(yù)測(cè)狀態(tài)信息或決策信息。從通信層面考慮,這種耦合更新方式會(huì)導(dǎo)致某UAV 成員一旦受干擾發(fā)生通信中斷,通信范圍內(nèi)其他成員的搜索圖將會(huì)不可逆地缺乏該成員的歷史決策信息,進(jìn)而降低集群后續(xù)協(xié)同搜索效能。

針對(duì)上述問題,論文主要開展了以下工作:

1)為實(shí)時(shí)描述未知搜索環(huán)境的變化情況,構(gòu)建了環(huán)境認(rèn)知圖模型,并借此引導(dǎo)UAV 對(duì)未知任務(wù)區(qū)域進(jìn)行覆蓋搜索。在此基礎(chǔ)上,通過利用動(dòng)目標(biāo)位置分布先驗(yàn)信息,進(jìn)一步構(gòu)建了目標(biāo)分布概率圖模型,用于引導(dǎo)UAV 搜索地面動(dòng)目標(biāo)。

2)為減少UAV 在搜索過程中錯(cuò)失動(dòng)目標(biāo)情況以及由傳感器虛警概率導(dǎo)致的目標(biāo)誤判情況,通過定制信息素引導(dǎo)的回訪機(jī)制,驅(qū)動(dòng)UAV對(duì)全局柵格進(jìn)行可控回訪;為緩解由傳感器探測(cè)概率導(dǎo)致的目標(biāo)漏檢問題,通過定制權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制,驅(qū)動(dòng)UAV 對(duì)發(fā)現(xiàn)可疑目標(biāo)的區(qū)域進(jìn)行回訪復(fù)檢。

3)借鑒DMPC 思想,設(shè)計(jì)了一種基于信息融合的UAV 集群分布式協(xié)同搜索決策機(jī)制,確保各UAV 成員在分布式最優(yōu)決策的基礎(chǔ)上實(shí)現(xiàn)對(duì)本機(jī)搜索圖的獨(dú)立更新,以進(jìn)一步增強(qiáng)系統(tǒng)魯棒性。

本文剩余部分的組織結(jié)構(gòu)如圖1 所示,共分為6 節(jié):第1 節(jié)簡(jiǎn)要描述了UAV 集群協(xié)同區(qū)域搜索任務(wù)的典型想定,并構(gòu)建了相應(yīng)的任務(wù)區(qū)域柵格模型與UAV 系統(tǒng)狀態(tài)模型;第2 節(jié)面向動(dòng)態(tài)未知搜索區(qū)域,建立了綜合態(tài)勢(shì)信息圖模型及其更新機(jī)理;第3 節(jié)重點(diǎn)考慮機(jī)載傳感器的探測(cè)性能約束,提出了2 種區(qū)域回訪機(jī)制,在此基礎(chǔ)上,結(jié)合所建立的綜合態(tài)勢(shì)信息圖,設(shè)計(jì)了UAV 搜索效能函數(shù);第4 節(jié)詳細(xì)介紹了基于信息融合的UAV 集群分布式協(xié)同搜索決策流程,并提出回訪機(jī)制驅(qū)動(dòng)的UAV 集群分布式協(xié)同搜索決策算法;第5 節(jié)進(jìn)行了數(shù)值仿真實(shí)驗(yàn),以驗(yàn)證所提回訪機(jī)制、決策機(jī)制和算法的有效性;第6 節(jié)給出了結(jié)論。

圖1 論文組織結(jié)構(gòu)Fig.1 Paper organization structure

1 問題建模

UAV 集群協(xié)同區(qū)域搜索任務(wù)的典型想定如圖2 所示。假設(shè)某一指定的未知任務(wù)區(qū)域Ω內(nèi)分布有若干動(dòng)目標(biāo),現(xiàn)派遣Nu架(Nu≥2)UAV 組成搜索集群,利用各自攜帶的探測(cè)設(shè)備(激光、視覺等傳感器)對(duì)Ω進(jìn)行偵察,要求在捕獲盡可能多的動(dòng)目標(biāo)的同時(shí),實(shí)現(xiàn)對(duì)Ω的最大化覆蓋搜索,以為指戰(zhàn)員提供相對(duì)全面和準(zhǔn)確的戰(zhàn)場(chǎng)態(tài)勢(shì)信息。

圖2 無人機(jī)集群協(xié)同區(qū)域搜索任務(wù)Fig.2 UAV swarm cooperative area search mission

為保證任務(wù)順利進(jìn)行,UAV 在偵察期間應(yīng)重點(diǎn)探測(cè)環(huán)境認(rèn)知程度低、目標(biāo)分布概率大的區(qū)域。同時(shí),需要引導(dǎo)UAV 對(duì)指定任務(wù)子區(qū)域進(jìn)行回訪復(fù)檢,以盡可能減少UAV 遺漏和誤判目標(biāo)情況。

1.1 任務(wù)區(qū)域柵格模型

為了簡(jiǎn)化UAV 搜索決策的解空間,在笛卡爾坐標(biāo)系下對(duì)Lx×Ly的矩形任務(wù)區(qū)域Ω進(jìn)行柵格化處理,即將其劃分為若干大小為Δx×Δy的離散柵格單元,如圖3 所示。則任意柵格單元的位置坐標(biāo)表示為

圖3 任務(wù)區(qū)域柵格Fig.3 Grid mission area

1.2 UAV 系統(tǒng)狀態(tài)模型

通常情況下,為保證傳感器成像尺寸的一致性,UAV 在搜索期間一般不進(jìn)行高度機(jī)動(dòng)[22]。因此,為便于研究,將UAV 視為二維空間中的平動(dòng)質(zhì)點(diǎn),記k時(shí)刻第i個(gè)UAV 的狀態(tài)矢量為

式中:Pi(k)=(xi(k),yi(k))為第i個(gè)UAV 位置坐標(biāo);ψi(k)為UAV 偏航角。

則第i個(gè)UAV 的離散系統(tǒng)狀態(tài)模型表示為

式中:v為UAV 飛行速率;Δt為時(shí)間步長(zhǎng);ui(k)=Δψi(t)為UAV 的決策變量,即偏航角變化量。

進(jìn)而可以表示第i個(gè)UAV 的狀態(tài)轉(zhuǎn)移方程為

式中:f(?)為狀態(tài)轉(zhuǎn)移函數(shù),由式(3)確定。

值得說明的是,式(3)僅描述了UAV 在相鄰決策時(shí)刻的狀態(tài)信息,這就意味著當(dāng)前時(shí)刻的UAV 只能獲取下一時(shí)刻的目標(biāo)柵格位置和航向信息。然而,在實(shí)際搜索過程中,UAV 是連續(xù)機(jī)動(dòng)的,因此,需要根據(jù)每步?jīng)Q策結(jié)果所確定的目標(biāo)柵格位置,為UAV 在線規(guī)劃出從當(dāng)前柵格到目標(biāo)柵格的飛行航跡。這涉及UAV 航跡規(guī)劃領(lǐng)域,不是本文的研究重點(diǎn),故不作詳述。

鑒于上述分析,對(duì)UAV 的動(dòng)作空間進(jìn)行離散化處理。則第i個(gè)UAV 在k時(shí)刻有8 個(gè)可選航向,數(shù)字化表示為ψi(k)∈{0,1,2,3,4,5,6,7}。圖4 展示了各個(gè)數(shù)字代表的UAV 飛行方向??紤]到UAV 本體性能約束,基于k時(shí)刻航向限定k+1 時(shí)刻UAV 的航向?yàn)椋鹤笃?5°;直飛;右偏航45°。則有ψi(k+1)∈{ψi(k)?1,ψi(k),ψi(k)+1}mod 8,此處是數(shù)字化描述無人機(jī)在k+1 時(shí)刻的可選航向,mod8 表示對(duì)8 取余,用于約束可選航向的取值范圍。

圖4 無人機(jī)離散動(dòng)作空間Fig.4 Discrete action space of UAV

2 綜合態(tài)勢(shì)信息圖模型及其更新機(jī)理

本節(jié)將建立包含目標(biāo)分布概率圖(Target Distribution Probability Map,TDPM)、環(huán)境認(rèn)知圖(Environment Cognition Map,ECM)與數(shù)字信息素圖(Digital Pheromone Map,DPM)在內(nèi)的綜合態(tài)勢(shì)信息圖模型及其更新機(jī)理,從而為UAV 進(jìn)行實(shí)時(shí)在線搜索決策奠定基礎(chǔ)。在綜合態(tài)勢(shì)信息圖中,每個(gè)柵格單元均包含以下3 種屬性:

式中:下標(biāo)xy表示(x,y),為柵格單元坐標(biāo);k為決策時(shí)刻;pxy(k)為目標(biāo)存在概率;χxy(k)為環(huán)境不確定度;ηxy(k)為信息素濃度。

2.1 目標(biāo)分布概率圖

在UAV 實(shí)際執(zhí)行搜索任務(wù)前,動(dòng)目標(biāo)的大致位置分布區(qū)域通常可以借助衛(wèi)星偵察等情報(bào)搜集手段來預(yù)先獲?。?]。因此,為有效利用先驗(yàn)情報(bào)信息,引入pxy(k)∈[0,1]來描述柵格中存有動(dòng)目標(biāo)的概率,pxy(k)越大,表示柵格中存在動(dòng)目標(biāo)的概率越大。假設(shè)先驗(yàn)信息給定的目標(biāo)預(yù)估位置為() (n=1,2,…,NT),采用式(6)所示的高斯分布初始化TDPM。

考慮到傳感器在探測(cè)過程中存在噪聲、遮擋等因素干擾,因此,UAV 在搜索過程中根據(jù)貝葉斯準(zhǔn)則持續(xù)更新TDPM,數(shù)學(xué)描述為[10]

式中:pd、pf分別為傳感器的探測(cè)概率和虛警概率,反映了傳感器的探測(cè)性能;bxy(k)∈{0,1}為傳感器對(duì)目標(biāo)的探測(cè)狀態(tài),取值為1 時(shí)認(rèn)為探測(cè)到目標(biāo),反之即認(rèn)為未探測(cè)到目標(biāo)。

2.2 環(huán)境認(rèn)知圖

為實(shí)時(shí)描述UAV 對(duì)未知區(qū)域的搜索認(rèn)知情況,將不確定度χxy(k)∈[0,1]引入離散柵格單元。χxy(k)越小,表示UAV 對(duì)柵格內(nèi)靜目標(biāo)信息的認(rèn)知越完全。

考慮到香農(nóng)熵能夠有效量化不確定性信息,因此,采用靜目標(biāo)初始存在信息的香農(nóng)熵來描述搜索環(huán)境的初始不確定度,具體為

式中:γ∈(0,1]為衰減系數(shù),當(dāng)γ=1 時(shí),表示UAV 僅需對(duì)柵格進(jìn)行一次訪問便可完全確定柵格內(nèi)的靜目標(biāo)信息;c(k+1)為截止到k+1 時(shí)刻?hào)鸥竦睦鄯e搜索次數(shù)。

2.3 數(shù)字信息素圖

自然界生物普遍涌現(xiàn)出集群協(xié)同行為,其中較為經(jīng)典的是蟻群覓食,即螞蟻個(gè)體通過跟蹤自身及蟻群其他成員共同分泌的化學(xué)信息素來快速尋找和獲取食物源[28]。不難看出,蟻群覓食機(jī)理與集群協(xié)同搜索過程具有高度相似性,因此,為進(jìn)一步提高UAV 搜索效率,借鑒蟻群覓食機(jī)理構(gòu)建DPM 為

式(10)表示采用一個(gè)Lx×Ly的信息素濃度矩陣M來數(shù)字化構(gòu)建DPM。

值得說明的是,數(shù)字信息素種類較多,有吸引類、排斥類和跟蹤類等,可根據(jù)具體任務(wù)需求選定。此外,由于數(shù)字信息素是對(duì)生物信息素進(jìn)行的模擬,因此,數(shù)字信息素同樣具備分泌、傳播、揮發(fā)等仿生特性,具體可視任務(wù)需求定義。

定義數(shù)字信息素為吸引信息素,且具有分泌、傳播和揮發(fā)3 種物理屬性,用于引導(dǎo)UAV 對(duì)受訪時(shí)間間隔較長(zhǎng)的區(qū)域進(jìn)行回訪復(fù)檢(詳見3.1.1 節(jié))。吸引信息素按照如式(11)所示的規(guī)則進(jìn)行動(dòng)態(tài)更新[11]:

式中:Ga,Va∈[0,1]分別為傳播系數(shù)和揮發(fā)系數(shù);二值變量Wxy∈{0,1}為信息素分泌開關(guān)因子;oxy(k+1)表示柵格自主分泌的信息素量;sxy(k+1)表示(k,k+1]時(shí)間段內(nèi)相鄰柵格傳入的信息素總量,計(jì)算方法為

3 回訪機(jī)制與搜索效能函數(shù)

3.1 回訪機(jī)制

對(duì)于存有動(dòng)目標(biāo)的未知任務(wù)區(qū)域,UAV 進(jìn)行覆蓋搜索時(shí)需要著重考慮2 方面的問題:①相對(duì)于靜目標(biāo),動(dòng)目標(biāo)存在運(yùn)動(dòng)至UAV 已搜索區(qū)域的可能性,增大了后續(xù)搜索過程中UAV 遺漏目標(biāo)概率;② 傳感器的虛警概率和探測(cè)概率造成的目標(biāo)誤判和漏檢情況。為此,分別設(shè)計(jì)了信息素引導(dǎo)的回訪機(jī)制和權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制,以進(jìn)一步提高集群協(xié)同區(qū)域搜索效能。

3.1.1 信息素引導(dǎo)的回訪機(jī)制

為降低UAV 遺漏和誤判目標(biāo)概率,基于DPM 引導(dǎo)UAV 對(duì)受訪時(shí)間間隔較長(zhǎng)的區(qū)域進(jìn)行回訪復(fù)檢。假設(shè)柵格前一次的受訪時(shí)刻為ts,當(dāng)前時(shí)刻為t,規(guī)定回訪時(shí)限為τ。則信息素引導(dǎo)的回訪機(jī)制的觸發(fā)條件為

具體作用機(jī)理為:當(dāng)柵格的未受訪時(shí)長(zhǎng)大于規(guī)定回訪時(shí)限時(shí),意味著UAV 需要對(duì)柵格進(jìn)行回訪復(fù)檢。此時(shí),打開信息素分泌開關(guān),即設(shè)定Wxy=1,柵格將持續(xù)分泌信息素并不斷傳入鄰近柵格,最終形成一種關(guān)于信息素濃度的梯度分布,如圖5 所示。在吸引信息素作用下,UAV 將前往高信息素濃度柵格進(jìn)行重搜索,從而實(shí)現(xiàn)對(duì)長(zhǎng)時(shí)間未被探測(cè)柵格的回訪。

圖5 信息素引導(dǎo)的回訪機(jī)制原理Fig.5 Principle of pheromone-guided revisit mechanism

基于上述分析可知,開關(guān)因子Wxy的取值是實(shí)現(xiàn)由信息素引導(dǎo)UAV 進(jìn)行回訪的關(guān)鍵。因此,定義信息素引導(dǎo)的回訪機(jī)制的終止條件為:一旦有UAV 對(duì)柵格進(jìn)行重搜索,則關(guān)閉信息素分泌開關(guān),即設(shè)定Wxy=0。此后,柵格內(nèi)的信息素將隨時(shí)間逐漸揮發(fā),濃度隨之減小,直到柵格再次滿足回訪機(jī)制的觸發(fā)條件時(shí),設(shè)定Wxy=1。通過定制具有周期分泌能力的吸引信息素來驅(qū)動(dòng)UAV 對(duì)全局柵格進(jìn)行可控回訪,從而盡量減少UAV 遺漏和誤判目標(biāo)情況。

3.1.2 權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制

為進(jìn)一步緩解由傳感器探測(cè)性能限制造成的目標(biāo)誤判和漏檢問題,基于搜索效能函數(shù)(詳見3.2 節(jié))定制了權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制,該機(jī)制在UAV 認(rèn)為探測(cè)到可疑目標(biāo)時(shí)觸發(fā)。為便于闡述,記UAV 探測(cè)到可疑目標(biāo)的區(qū)域?yàn)棣ⅰ?quán)系數(shù)的動(dòng)態(tài)切換規(guī)則為

具體來說,就是當(dāng)UAV 探測(cè)到區(qū)域Β 中的可疑目標(biāo)時(shí),通過提高一定規(guī)劃時(shí)域內(nèi)目標(biāo)探測(cè)收益的權(quán)系數(shù),快速引導(dǎo)該UAV 或鄰近UAV 重點(diǎn)回訪Β 以便再次確認(rèn)目標(biāo)真?zhèn)?,進(jìn)而降低UAV漏檢和誤判目標(biāo)概率。在UAV 完成回訪后,切換權(quán)系數(shù)為初始值,即在決策時(shí)刻tk+q終止回訪機(jī)制。

3.2 搜索效能函數(shù)

以最大化UAV 集群協(xié)同搜索效率為優(yōu)化目標(biāo),同時(shí)兼顧各UAV 偏航代價(jià)與飛行安全,建立式(15)所示的UAV 搜索效能函數(shù):

式中:Si(k)、Ui(k)分別為第i個(gè)UAV 的N步預(yù)測(cè)狀態(tài)集與N步?jīng)Q策輸入集(詳見4.1 節(jié));各優(yōu)化子目標(biāo)的具體定義如3.2.1~3.2.5 節(jié)所示。

3.2.1 目標(biāo)探測(cè)收益

目標(biāo)探測(cè)收益JD描述為UAV 搜索過程中探測(cè)到目標(biāo)可能性的度量,用于引導(dǎo)UAV 重點(diǎn)搜索目標(biāo)存在概率大的區(qū)域。因此,采用第i個(gè)UAV 搜索航跡所覆蓋的探測(cè)區(qū)域Ri的目標(biāo)存在概率累加和來定義JD為[6]

式中:ζxy(k)為UAV 對(duì)(x,y)柵格中是否存有目標(biāo)的判定結(jié)果,數(shù)學(xué)描述為

其中:δp∈(0.5,1]為目標(biāo)存在閾值,取δp=0.8;ζxy(k)=1 表示(x,y)柵格中存有目標(biāo),反之則表示目標(biāo)不存在。

3.2.2 環(huán)境探索效益

環(huán)境探索效益JE描述為UAV 搜索過程中環(huán)境不確定性信息的減少量,用于引導(dǎo)UAV 探索未知環(huán)境,從而提高對(duì)靜目標(biāo)的發(fā)現(xiàn)概率。因此,基于環(huán)境不確定度的衰減量定義JE為

3.2.3 柵格回訪收益

柵格回訪收益JR描述為UAV 對(duì)受訪時(shí)間間隔較長(zhǎng)的柵格進(jìn)行重搜索時(shí)所獲得的信息素收益,用于引導(dǎo)UAV 重點(diǎn)探測(cè)高信息素濃度區(qū)域。因此,定義JR為

3.2.4 偏航代價(jià)

為減少UAV 執(zhí)行任務(wù)期間的轉(zhuǎn)彎油耗與飛行時(shí)間損耗,建立UAV 偏航角調(diào)整代價(jià)函數(shù)JT為

式中:N為滾動(dòng)優(yōu)化長(zhǎng)度(詳見4.1 節(jié));|·|為絕對(duì)值。由式(20)可以看出,當(dāng)UAV 在任意相鄰決策時(shí)刻保持直飛航向時(shí),偏航代價(jià)最小。

3.2.5 碰撞代價(jià)

機(jī)間避撞對(duì)于UAV 集群協(xié)同作業(yè)至關(guān)重要?,F(xiàn)有方法大多采用人工勢(shì)場(chǎng)法來實(shí)現(xiàn)UAV成員間的防相撞[29],借鑒其斥力勢(shì)場(chǎng)思想,建立碰撞代價(jià)函數(shù)JC為

式中:‖·‖為歐氏距離。

4 回訪機(jī)制驅(qū)動(dòng)的UAV 集群分布式協(xié)同搜索決策算法

4.1 UAV 集群分布式協(xié)同搜索決策機(jī)制

MPC 方法能夠使智能體在決策時(shí)充分兼顧長(zhǎng)短期收益,因此對(duì)動(dòng)態(tài)規(guī)劃問題具有良好的適應(yīng)性。針對(duì)UAV 集群協(xié)同區(qū)域搜索問題,基于MPC 的集中式優(yōu)化求解方法雖然使UAV集群具備了良好的全局最優(yōu)決策能力,但系統(tǒng)魯棒性不強(qiáng),且隨著集群規(guī)模的擴(kuò)大,由于受到中央節(jié)點(diǎn)的計(jì)算能力、網(wǎng)絡(luò)通信能力等諸多方面限制,UAV 可能難以進(jìn)行實(shí)時(shí)任務(wù)決策[25]。DMPC 方法能夠有效解決上述問題,但其耦合更新搜索圖的方式限制了集群系統(tǒng)魯棒性的提升。

因此,借鑒DMPC 思想,設(shè)計(jì)了基于信息融合的UAV 集群分布式協(xié)同搜索決策機(jī)制,確保集群在分布式協(xié)同最優(yōu)決策的基礎(chǔ)上對(duì)成員態(tài)勢(shì)信息圖進(jìn)行解耦式更新。

4.1.1 UAV 子系統(tǒng)搜索決策機(jī)制

為提高UAV 自主決策能力,首先基于MPC思想建立圖6 所示的UAV 子系統(tǒng)搜索決策機(jī)制。

圖6 無人機(jī)子系統(tǒng)搜索決策流程Fig.6 Search decision process for UAV subsystem

在每個(gè)決策時(shí)刻k,UAV 子系統(tǒng)搜索決策機(jī)制分為以下4 個(gè)步驟:

步驟1基于k時(shí)刻UAV 當(dāng)前狀態(tài)si(k),對(duì)未來N個(gè)時(shí)刻的子系統(tǒng)狀態(tài)Si(k)={si(k+1|k),si(k+2|k),…,si(k+N|k)}進(jìn)行預(yù)測(cè)。根據(jù)1.2 節(jié)定義的UAV 離散系統(tǒng)狀態(tài)模型及動(dòng)作空間,可將UAV 在未來N個(gè)時(shí)刻的所有可行航路點(diǎn)表示為一種樹狀結(jié)構(gòu)。圖7 展示了N=3 時(shí)UAV 的路徑?jīng)Q策樹。

步驟4將最優(yōu)控制序列的首項(xiàng)作為k時(shí)刻UAV 離散系統(tǒng)狀態(tài)模型的決策輸入,從而引導(dǎo)UAV 探測(cè)目標(biāo)柵格。同時(shí),根據(jù)傳感器探測(cè)結(jié)果更新本機(jī)綜合態(tài)勢(shì)信息圖。直到k+1 時(shí)刻最優(yōu)控制指令介入,返回步驟1。

對(duì)于第i個(gè)UAV 子系統(tǒng),基于滾動(dòng)優(yōu)化思想建立局部有限時(shí)域滾動(dòng)優(yōu)化模型為

式中:Si(k)和Ui(k)分別為第i個(gè)UAV 子系統(tǒng)的N步預(yù)測(cè)狀態(tài)集與N步?jīng)Q策輸入集;分別為其他UAV 的N步預(yù)測(cè)狀態(tài)集與N步?jīng)Q策輸入集;Θ和Ξ分別表示UAV 的容許輸入集和可行狀態(tài)集。

4.1.2 信息融合策略

在UAV 利用傳感器實(shí)時(shí)觀測(cè)信息對(duì)本機(jī)綜合態(tài)勢(shì)信息圖進(jìn)行獨(dú)立更新后,通常需要將其與其他UAV 更新后的綜合態(tài)勢(shì)信息圖進(jìn)行整合,以確保后續(xù)決策周期中UAV 能更全面準(zhǔn)確地認(rèn)知搜索環(huán)境并進(jìn)行最優(yōu)決策。因此,為進(jìn)一步提高UAV 搜索效能,設(shè)計(jì)TDPM、ECM 和DPM 的融合規(guī)則為

4.1.3 UAV 集群分布式協(xié)同搜索決策機(jī)制

綜上所述,基于信息融合的UAV 集群分布式協(xié)同搜索決策機(jī)制如圖8 所示。

圖8 無人機(jī)集群分布式協(xié)同搜索決策流程Fig.8 Distributed cooperative search decision process for UAV swarms

首先,各UAV 成員基于當(dāng)前時(shí)刻的自身狀態(tài),分別利用MPC 決策器生成各自最優(yōu)決策信息。接著,根據(jù)各自最優(yōu)決策信息獨(dú)立更新本機(jī)綜合態(tài)勢(shì)信息圖。然后,通過信息融合策略將其與通信網(wǎng)絡(luò)共享的其他UAV 的綜合態(tài)勢(shì)信息圖進(jìn)行融合計(jì)算,得到全局綜合態(tài)勢(shì)信息圖并作為下一決策周期的本機(jī)綜合態(tài)勢(shì)信息圖,進(jìn)而實(shí)現(xiàn)集群的分布式協(xié)同最優(yōu)決策。

4.2 回訪機(jī)制驅(qū)動(dòng)的UAV 集群分布式協(xié)同搜索決策算法

將回訪機(jī)制引入上述決策機(jī)制,提出一種回訪機(jī)制驅(qū)動(dòng)的UAV 集群分布式協(xié)同搜索決策(Distributed Cooperative Search Decision with Revisit Mechanism,RM-DCSD)算法,主要流程如算法1 所示。

5 仿真實(shí)驗(yàn)與分析

為全面驗(yàn)證所提RM-DCSD 算法的有效性,基于 Windows 10(64 位),Intel Core i7-7700HQ CPU(2.8 GHz),24 GB RAM 的實(shí)驗(yàn)平臺(tái)對(duì)圖2 所示的典型協(xié)同區(qū)域搜索任務(wù)想定進(jìn)行數(shù)值仿真實(shí)驗(yàn)。

5.1 實(shí)驗(yàn)參數(shù)設(shè)置

設(shè)定矩形任務(wù)區(qū)域Ω的大小為50 km×50 km,將其均勻劃分為50×50 的離散柵格,則每個(gè)柵格單元大小為1 km×1 km。根據(jù)先驗(yàn)情報(bào)信息,假定Ω中x∈[10,40] km,y∈[12,42] km范圍內(nèi)分布有若干動(dòng)目標(biāo),現(xiàn)派遣4 架同構(gòu)UAV組成搜索集群對(duì)Ω執(zhí)行協(xié)同搜索任務(wù),分別將區(qū)域覆蓋率和動(dòng)目標(biāo)捕獲數(shù)量作為主要評(píng)價(jià)指標(biāo)衡量集群對(duì)靜目標(biāo)和動(dòng)目標(biāo)的搜索效率。表1~表4 給出了UAV 集群初始狀態(tài)信息、傳感器性能參數(shù)、綜合態(tài)勢(shì)信息圖參數(shù)以及算法參數(shù)。初始化TDPM 與ECM 分別如圖9 和圖10 所示。設(shè)定仿真時(shí)長(zhǎng)為9 000 s,決策周期Td=10 s,規(guī)定回訪時(shí)限τ=10Td。

表1 無人機(jī)集群初始狀態(tài)信息Table 1 Initial state information of UAV swarms

表2 傳感器性能參數(shù)Table 2 Parameters of sensor performance

表3 綜合態(tài)勢(shì)信息圖參數(shù)Table 3 Parameters of comprehensive situational information map

表4 RM-DSCD 算法參數(shù)Table 4 Parameters of RM-DCSD algorithm

圖9 初始目標(biāo)概率分布Fig.9 Initial distribution of target probability

圖10 初始環(huán)境不確定度分布Fig.10 Initial distribution of environmental uncertainty

5.2 協(xié)同搜索規(guī)劃結(jié)果

RM-DCSD 算法的規(guī)劃結(jié)果如圖11 所示。圖11(a)~圖11(c)分別為t=2 400,4 850,9 000 s的協(xié)同搜索規(guī)劃結(jié)果。

圖11 協(xié)同搜索規(guī)劃結(jié)果Fig.11 Results of cooperative search planning

由圖11(a1)、圖11(b1)和圖11(c1)可知,隨著任務(wù)的推進(jìn),ECM 能夠持續(xù)引導(dǎo)UAV 集群對(duì)未知區(qū)域進(jìn)行覆蓋搜索,從而實(shí)現(xiàn)了對(duì)靜目標(biāo)信息的有效獲??;由圖11(a2)、圖11(b2)和圖11(c2)可知,當(dāng)柵格的未受訪時(shí)長(zhǎng)大于規(guī)定回訪時(shí)限時(shí),通過打開信息素分泌開關(guān),柵格能夠持續(xù)分泌信息素并不斷傳入鄰近柵格;由圖11(a3)、圖11(b3)和圖11(c3)可知,通過引入動(dòng)目標(biāo)位置分布先驗(yàn)信息構(gòu)建TDPM,能夠有效引導(dǎo)UAV 對(duì)目標(biāo)存在概率大的區(qū)域展開搜索,提高了UAV 對(duì)地面動(dòng)目標(biāo)的搜索能力。圖11(a4)中UAV 搜索航跡重疊部分表明,基于DPM 定制的信息素引導(dǎo)的回訪機(jī)制能夠有效驅(qū)動(dòng)UAV 對(duì)受訪時(shí)間間隔較長(zhǎng)的區(qū)域進(jìn)行回訪復(fù)檢。此外,分析圖11(a4)和圖11(b4)可知,當(dāng)UAV3 和UAV1 分別在(26,27)km 和(27,42)km 柵格內(nèi)首次探測(cè)到可疑目標(biāo)后,通過增大規(guī)劃時(shí)域內(nèi)目標(biāo)探測(cè)收益的權(quán)系數(shù),能夠快速引導(dǎo)UAV3 自身以及UAV4 分別對(duì)發(fā)現(xiàn)可疑目標(biāo)的區(qū)域進(jìn)行回訪,進(jìn)而再次確認(rèn)動(dòng)目標(biāo)真?zhèn)危砻髁藱?quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制具有較高的合理性。綜上,RM-DCSD 算法能夠在引導(dǎo)UAV 集群對(duì)未知任務(wù)區(qū)域遂行覆蓋式協(xié)同搜索的基礎(chǔ)上,通過回訪機(jī)制驅(qū)動(dòng),有效兼顧對(duì)地面動(dòng)目標(biāo)的搜索及捕獲需求。

圖12 為集群協(xié)同執(zhí)行搜索任務(wù)過程中,各UAV 成員間的實(shí)時(shí)最小距離變化曲線??梢钥闯?,機(jī)間最小距離始終保持在24 m 以上,滿足UAV 集群的防碰撞要求。

圖12 機(jī)間最小距離變化Fig.12 Minimum distance variation among UAVs

5.3 決策機(jī)制有效性驗(yàn)證與分析

為進(jìn)一步驗(yàn)證所提出的決策機(jī)制在通信中斷情況下的有效性,分別將基于信息融合的UAV 集群分布式協(xié)同搜索決策機(jī)制(記作決策機(jī)制1)與文獻(xiàn)[24]提出的DMPC 決策機(jī)制(記作決策機(jī)制2)應(yīng)用于搜索規(guī)劃全過程,并獨(dú)立進(jìn)行30 次蒙特卡洛仿真,對(duì)比分析區(qū)域覆蓋率與動(dòng)目標(biāo)捕獲數(shù)量2 個(gè)評(píng)價(jià)指標(biāo)。為確保實(shí)驗(yàn)數(shù)據(jù)公平可靠,在應(yīng)用兩種決策機(jī)制進(jìn)行搜索規(guī)劃時(shí)均不考慮回訪機(jī)制的驅(qū)動(dòng),則令初始權(quán)系數(shù)κ3=0,其他參數(shù)設(shè)定同5.1 節(jié)。

假定搜索任務(wù)進(jìn)行至2 500 s 時(shí),UAV1 和UAV4 受干擾發(fā)生通信中斷,并于6 000 s 時(shí)恢復(fù)通信。仿真結(jié)果如表5 和圖13 所示。

表5 評(píng)價(jià)指標(biāo)的均值及標(biāo)準(zhǔn)差Table 5 Mean and standard deviation of evaluation indicators

圖13 2 種決策機(jī)制規(guī)劃結(jié)果對(duì)比Fig.13 Comparison of planning results of two decisionmaking mechanisms

由表5 和圖13 可知,決策機(jī)制1 在2 個(gè)評(píng)價(jià)指標(biāo)的均值及標(biāo)準(zhǔn)差上的表現(xiàn)均優(yōu)于決策機(jī)制2,表明在通信中斷情況下,決策機(jī)制1 相比于決策機(jī)制2,具有更好的搜索規(guī)劃效能與更強(qiáng)的穩(wěn)定性。分析其原因?yàn)椋篣AV 集群基于決策機(jī)制1 進(jìn)行協(xié)同搜索規(guī)劃時(shí),由于各成員是獨(dú)立更新本機(jī)綜合態(tài)勢(shì)信息圖的,因此,即使UAV1和UAV4 通信中斷一定時(shí)間,但只要通信恢復(fù),其他UAV 便能通過信息融合策略快速恢復(fù)UAV1 和UAV4 的歷史決策信息,從而減少后續(xù)搜索過程中重復(fù)探測(cè)已知區(qū)域的情況,提高了集群對(duì)靜目標(biāo)的覆蓋搜索效率。同理,也能通過信息融合后的全局TDPM 引導(dǎo)其他UAV 對(duì)UAV1 和UAV4 發(fā)現(xiàn)可疑目標(biāo)的區(qū)域進(jìn)行訪問,從而完成對(duì)動(dòng)目標(biāo)的協(xié)同捕獲。

綜上所述,所提決策機(jī)制進(jìn)一步增強(qiáng)了集群系統(tǒng)的魯棒性,確保了集群即便在通信中斷情況下,仍能相對(duì)穩(wěn)定且高效地完成對(duì)靜目標(biāo)的覆蓋搜索和對(duì)動(dòng)目標(biāo)的捕獲。

5.4 回訪機(jī)制有效性驗(yàn)證與分析

在5.3 節(jié)基礎(chǔ)上,為進(jìn)一步驗(yàn)證所提2 種回訪機(jī)制的有效性,并分析其對(duì)集群協(xié)同搜索效能的影響,基于控制變量思想,在采用決策機(jī)制1 情況下,設(shè)置4 組回訪機(jī)制標(biāo)準(zhǔn)對(duì)照實(shí)驗(yàn),如表6 所示。其中,回訪機(jī)制1 和回訪機(jī)制2 分別表示信息素引導(dǎo)的回訪機(jī)制和權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制。針對(duì)每組實(shí)驗(yàn),分別在無干擾條件下獨(dú)立進(jìn)行30 次蒙特卡洛仿真,每次仿真時(shí)長(zhǎng)為6 000 s,其他參數(shù)設(shè)定同5.1 節(jié)。統(tǒng)計(jì)區(qū)域覆蓋率、動(dòng)目標(biāo)捕獲數(shù)量、柵格回訪率和誤判率4 個(gè)評(píng)價(jià)指標(biāo),結(jié)果如圖14 和圖15 所示。

表6 回訪機(jī)制有效性驗(yàn)證實(shí)驗(yàn)設(shè)置Table 6 Experimental setup for validation of revisit mechanism

圖14 標(biāo)準(zhǔn)對(duì)照組實(shí)驗(yàn)規(guī)劃結(jié)果對(duì)比Fig.14 Comparison of planning results of standard con‐trol group experiments

圖15 評(píng)價(jià)指標(biāo)均值對(duì)比Fig.15 Comparison of mean of evaluation indicators

結(jié)合圖14(b)~圖14(d)和圖15 分析可知,對(duì)照組2 在柵格回訪率、動(dòng)目標(biāo)捕獲數(shù)量和誤判率3 個(gè)評(píng)價(jià)指標(biāo)上的表現(xiàn)均優(yōu)于基準(zhǔn)組1,表明回訪機(jī)制1 能夠有效驅(qū)動(dòng)UAV 對(duì)全局柵格進(jìn)行可控回訪,從而減少UAV 遺漏目標(biāo)情況,滿足了動(dòng)目標(biāo)的搜索需求。同時(shí)也表明回訪機(jī)制1 能夠有效緩解因傳感器虛警導(dǎo)致的目標(biāo)誤判問題,證明了所提信息素引導(dǎo)的回訪機(jī)制的有效性。結(jié)合圖14(b)、圖14(d)和圖15 分析可知,相比于基準(zhǔn)組1,對(duì)照組3 具有更多的動(dòng)目標(biāo)捕獲數(shù)量與更低的誤判率,表明回訪機(jī)制2 能有效引導(dǎo)UAV 對(duì)發(fā)現(xiàn)可疑目標(biāo)的區(qū)域進(jìn)行復(fù)檢確認(rèn),在降低誤判目標(biāo)概率的同時(shí),進(jìn)一步提升了UAV 對(duì)動(dòng)目標(biāo)的捕獲性能,證明了所提權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制的有效性。綜合分析圖14 和圖15 可知,對(duì)照組4 相比于其他實(shí)驗(yàn)組,具有更多的動(dòng)目標(biāo)捕獲數(shù)量,且柵格回訪率和誤判率僅次于對(duì)照組2,表明通過2 種回訪機(jī)制的聯(lián)合驅(qū)動(dòng),能更好地滿足UAV 集群對(duì)地面動(dòng)目標(biāo)的搜索需求。此外,從圖14(a)和圖14(c)可以看出,區(qū)域覆蓋率與柵格回訪率在整體上呈現(xiàn)出一種反比關(guān)系,表明2 種回訪機(jī)制在提高了UAV 回訪復(fù)檢能力的同時(shí),均會(huì)不同程度地降低對(duì)靜目標(biāo)的覆蓋搜索效率??梢园l(fā)現(xiàn),回訪機(jī)制1 相對(duì)于回訪機(jī)制2,具有更高的柵格回訪率與更低的區(qū)域覆蓋率,這主要是由于前者的觸發(fā)條件更為寬泛,且回訪對(duì)象為全局受訪時(shí)間間隔較長(zhǎng)的已知區(qū)域。

值得說明的是,本文中2 種回訪機(jī)制主要是針對(duì)協(xié)同區(qū)域搜索任務(wù)中動(dòng)目標(biāo)的實(shí)際搜索需求以及傳感器虛警和漏檢情況提出的。因此,上述分析過程中并沒有將區(qū)域覆蓋率作為驗(yàn)證回訪機(jī)制有效性的評(píng)判指標(biāo),而是僅將其作為參照用于討論2 種回訪機(jī)制對(duì)靜目標(biāo)搜索效率產(chǎn)生的影響。

5.5 集群規(guī)模對(duì)協(xié)同搜索效能的影響

為定量分析集群規(guī)模對(duì)協(xié)同搜索效能的影響,分別指派由4、6、8、10、12、14 和16 架UAV 組成的搜索集群執(zhí)行協(xié)同搜索任務(wù)。針對(duì)每種集群規(guī)模,分別進(jìn)行30 次蒙特卡羅仿真,每次仿真時(shí)長(zhǎng)為3 000 s,其他參數(shù)設(shè)定同5.1 節(jié)。不同規(guī)模下UAV 集群的區(qū)域覆蓋率與動(dòng)目標(biāo)捕獲數(shù)量統(tǒng)計(jì)結(jié)果如圖16 所示。

圖16 不同規(guī)模下UAV 集群的協(xié)同搜索效率Fig.16 Cooperative search efficiency of UAV swarms with different scales

由圖16(a)可知,隨著集群規(guī)模的擴(kuò)大,區(qū)域覆蓋率整體呈增長(zhǎng)趨勢(shì)??梢钥闯?,在集群規(guī)模少于12 架次時(shí),覆蓋率的增長(zhǎng)速度較快,12 架次之后,覆蓋率的增長(zhǎng)速度明顯放緩。由圖16(b)可知,當(dāng)集群規(guī)模少于14 架次時(shí),動(dòng)目標(biāo)捕獲數(shù)量隨著集群規(guī)模的擴(kuò)大明顯增多,而當(dāng)集群規(guī)模超過14 架次后,動(dòng)目標(biāo)捕獲數(shù)量基本保持不變。

基于上述分析可知,在任務(wù)區(qū)域大小、目標(biāo)數(shù)量以及搜索時(shí)長(zhǎng)一定的情況下,不斷擴(kuò)大集群規(guī)模并不能持續(xù)提升集群協(xié)同搜索效能,相反,還會(huì)造成資源浪費(fèi)。因此,需要根據(jù)具體任務(wù)需求確定適合當(dāng)前任務(wù)場(chǎng)景的最佳集群規(guī)模。

考慮到論文任務(wù)需求是在保證UAV 集群捕獲盡可能多的動(dòng)目標(biāo)的基礎(chǔ)上,最大化覆蓋搜索未知區(qū)域,因此,對(duì)于本文協(xié)同區(qū)域搜索任務(wù)想定而言,最佳集群規(guī)模為14。

5.6 不同方法性能對(duì)比

為了進(jìn)一步驗(yàn)證所提算法的有效性,分別采用光柵式掃描方法、并排回尋式掃描方法[30]以及RM-DCSD 算法對(duì)任務(wù)區(qū)域進(jìn)行搜索規(guī)劃。為確保實(shí)驗(yàn)數(shù)據(jù)公平可靠,每種方法在相同實(shí)驗(yàn)平臺(tái)上獨(dú)立進(jìn)行30 次蒙特卡羅仿真,仿真參數(shù)設(shè)定同5.1 節(jié)。統(tǒng)計(jì)區(qū)域覆蓋率、動(dòng)目標(biāo)捕獲數(shù)量和誤判率,結(jié)果如表7 和圖17 所示。

表7 評(píng)價(jià)指標(biāo)均值Table 7 Mean of evaluation indicators

圖17 3 種方法規(guī)劃結(jié)果對(duì)比Fig.17 Comparison of planning results for three methods

由仿真結(jié)果可知,光柵式掃描方法與并排回尋式掃描方法雖然能夠相對(duì)穩(wěn)定且高效地完成對(duì)靜目標(biāo)的覆蓋搜索,但兩者均未有效利用先驗(yàn)任務(wù)信息,且受限于UAV 的初始位置分布與固定的搜索模式,難以滿足動(dòng)態(tài)環(huán)境下的搜索需求。其中,光柵式掃描方法引導(dǎo)的UAV 因回訪能力不足而造成大量遺漏和誤判目標(biāo)情況,工程實(shí)用性較差。并排回尋式掃描方法雖然在一定程度上緩解了UAV 遺漏和誤判目標(biāo)問題,提高了對(duì)動(dòng)目標(biāo)的搜索效率,但規(guī)劃過程中UAV 不能及時(shí)調(diào)整搜索航跡,回訪復(fù)檢效率不高,容易因傳感器漏檢而丟失目標(biāo),具有一定的現(xiàn)實(shí)局限性。相比于上述2 種對(duì)比方法,RM-DCSD 算法能夠有效利用先驗(yàn)任務(wù)信息,從而實(shí)現(xiàn)UAV 實(shí)時(shí)在線自主決策,在回訪機(jī)制驅(qū)動(dòng)下,通過犧牲較少的覆蓋搜索效率,高效引導(dǎo)UAV 對(duì)地面動(dòng)目標(biāo)進(jìn)行捕獲,并保證較低的誤判概率。此外,對(duì)比分析5.4 節(jié)中對(duì)照組4 的實(shí)驗(yàn)結(jié)果可知,在任務(wù)區(qū)域大小和目標(biāo)數(shù)量一定的情況下,適當(dāng)延長(zhǎng)搜索時(shí)長(zhǎng)可以在一定程度上緩解RM-DCSD因回訪機(jī)制造成的覆蓋搜索效率下降的問題。

綜上,所提出的RM-DCSD 算法能夠有效兼顧未知任務(wù)區(qū)域內(nèi)地面靜目標(biāo)和動(dòng)目標(biāo)的搜索需求,對(duì)動(dòng)態(tài)未知搜索環(huán)境表現(xiàn)出良好的適應(yīng)性。

6 結(jié)論

為提高協(xié)同區(qū)域搜索任務(wù)中UAV 集群對(duì)地面動(dòng)目標(biāo)的搜索效率,同時(shí)兼顧最大化覆蓋搜索效能,在考慮傳感器探測(cè)性能局限的基礎(chǔ)上,提出一種回訪機(jī)制驅(qū)動(dòng)的UAV 集群分布式協(xié)同搜索決策算法。通過開展仿真實(shí)驗(yàn),得出以下結(jié)論:

1)通過引入環(huán)境認(rèn)知圖,實(shí)現(xiàn)了UAV 集群對(duì)未知任務(wù)區(qū)域的覆蓋搜索;通過引入目標(biāo)分布概率圖,提高了UAV 集群對(duì)動(dòng)目標(biāo)的搜索能力。

2)基于信息融合的UAV 集群分布式協(xié)同搜索決策機(jī)制實(shí)現(xiàn)了成員態(tài)勢(shì)信息圖的解耦式更新,進(jìn)一步增強(qiáng)了集群系統(tǒng)魯棒性。同時(shí),通過信息融合策略確保了集群的分布式協(xié)同最優(yōu)決策。

3)通過信息素引導(dǎo)的回訪機(jī)制能夠有效驅(qū)動(dòng)UAV 對(duì)全局柵格進(jìn)行可控回訪,緩解了由于動(dòng)目標(biāo)的隨機(jī)特性導(dǎo)致的UAV 遺漏目標(biāo)問題以及因傳感器虛警導(dǎo)致的目標(biāo)誤判問題;通過權(quán)系數(shù)動(dòng)態(tài)切換引導(dǎo)的回訪機(jī)制能夠快速驅(qū)動(dòng)UAV對(duì)發(fā)現(xiàn)可疑目標(biāo)的區(qū)域進(jìn)行回訪復(fù)檢,進(jìn)一步減少了由于傳感器的探測(cè)性能限制造成的目標(biāo)漏檢和誤判情況。

4)集群規(guī)模與協(xié)同搜索效能之間呈現(xiàn)出一種非線性關(guān)系。因此,為避免資源浪費(fèi),在實(shí)際任務(wù)前應(yīng)根據(jù)具體任務(wù)需求,通過數(shù)值仿真預(yù)先擬定合理的集群規(guī)模。

5)通過與光柵式掃描方法和并排回尋式掃描方法進(jìn)行對(duì)比,表明所提出的RM-DCSD 算法能夠更好地引導(dǎo)UAV 在動(dòng)態(tài)未知環(huán)境下進(jìn)行實(shí)時(shí)在線搜索決策,從而增強(qiáng)了UAV 對(duì)動(dòng)態(tài)搜索任務(wù)的適應(yīng)性。同時(shí),在2 種回訪機(jī)制的聯(lián)合驅(qū)動(dòng)下,能夠有效緩解因傳感器的性能約束造成的目標(biāo)漏檢和誤判問題,通過犧牲較少的覆蓋搜索效率,進(jìn)一步提升了UAV 集群對(duì)動(dòng)目標(biāo)的捕獲效率。

猜你喜歡
柵格集群分布式
基于鄰域柵格篩選的點(diǎn)云邊緣點(diǎn)提取方法*
海上小型無人機(jī)集群的反制裝備需求與應(yīng)對(duì)之策研究
一種無人機(jī)集群發(fā)射回收裝置的控制系統(tǒng)設(shè)計(jì)
電子制作(2018年11期)2018-08-04 03:25:40
分布式光伏熱錢洶涌
能源(2017年10期)2017-12-20 05:54:07
分布式光伏:爆發(fā)還是徘徊
能源(2017年5期)2017-07-06 09:25:54
Python與Spark集群在收費(fèi)數(shù)據(jù)分析中的應(yīng)用
勤快又呆萌的集群機(jī)器人
基于DDS的分布式三維協(xié)同仿真研究
不同剖面形狀的柵格壁對(duì)柵格翼氣動(dòng)特性的影響
基于CVT排布的非周期柵格密度加權(quán)陣設(shè)計(jì)
彩票| 刚察县| 永济市| 金溪县| 揭东县| 长汀县| 定西市| 米易县| 克山县| 南江县| 黑龙江省| 会宁县| 霍邱县| 察雅县| 乾安县| 灵山县| 南华县| 会东县| 凤翔县| 英吉沙县| 包头市| 甘南县| 沁源县| 弥渡县| 肥城市| 新民市| 合水县| 金溪县| 新竹县| 清远市| 达拉特旗| 房产| 沂源县| 汶上县| 乌拉特后旗| 南和县| 陆丰市| 洛南县| 大厂| 安龙县| 红河县|