張宏宏,甘旭升,孫靜娟,王 寧,陳致遠
1.空軍工程大學(xué) 空管領(lǐng)航學(xué)院,西安710051
2.國家空管防相撞技術(shù)重點實驗室,西安710051
近年來隨著無人機(unmanned aerial vehicle,UAV)在軍事、農(nóng)業(yè)、科技等領(lǐng)域廣泛應(yīng)用[1],無人機離開“隔離空域”,進入低空融合空域執(zhí)行多樣化任務(wù)已成為趨勢,無人機沖突解脫也變得至關(guān)重要。面對融合空域內(nèi)飛行環(huán)境的復(fù)雜性與高度不確定性,無人機的自主避障技術(shù)逐漸成為關(guān)鍵技術(shù)之一[2-3]。與有人機相比,無人機載荷小,機動性強,動力學(xué)模型較為復(fù)雜,空域內(nèi)面臨的威脅不確定性更高,解決低空融合空域內(nèi)無人機沖突解脫問題對當前無人機安全運行具有重大意義[4]。
目前,無人機沖突解脫算法主要分為以下兩類:(1)非合作式避障,核心在于無人機利用自身傳感器,獲取周圍環(huán)境信息,實現(xiàn)對入侵障礙物的感知與定位,并執(zhí)行避障策略,保證飛行安全。其中幾何法[5-9]是利用沖突雙方的位置與速度等信息,計算沖突雙方的幾何關(guān)系,并通過設(shè)計控制律,實現(xiàn)空域內(nèi)避障功能。勢場法[10-11]是將沖突方放置在虛擬勢場中,智能體之間在引力與斥力的作用下,實現(xiàn)沖突消解,并向目標點靠近。(2)合作式避障,核心在于無人機與入侵障礙物共享位置、速度、航向等信息,并利用共享信息設(shè)計控制律,從而避免相撞。其中常用的方法有分布式多Agent 系統(tǒng)[12-13]、復(fù)雜網(wǎng)絡(luò)[4,14]等。與非合作避障方式相比,合作式避障從沖突整體的角度進行考慮,保證解脫過程的全局最優(yōu),避免支付代價過大。
無人機沖突解脫與有人機類似,但由于其在復(fù)雜融合空域下面臨的不確定性增大,現(xiàn)有解決方案存在以下缺點:(1)對數(shù)據(jù)鏈通信可靠性要求較高,無人機狀態(tài)實時控制調(diào)整機動,穩(wěn)定性差;(2)單獨改變速度或航向進行沖突解脫研究較多,速度與航向同時改變進行避撞研究較少;(3)對非合作沖突解脫算法研究多,對沖突雙方合作博弈解脫研究較少,不能保證整體解脫利益最優(yōu)。
基于此,本文針對融合空域內(nèi)無人機飛行沖突的特點,基于無人機實時控制與最少機動的原則,根據(jù)速度障礙算法,提出了基于合作博弈的無人機沖突解脫模型,在支付代價最小前提下實現(xiàn)無人機避撞功能。
融合空域內(nèi)無人機在執(zhí)行任務(wù)狀態(tài)時,自身的航向和速度在收到控制指令之前保持勻速直線運動的狀態(tài)不變。速度障礙法以空域內(nèi)無人機的相對飛行速度為研究對象,UAV1 相對于UAV2 空間關(guān)系如圖1 所示。以UAV2 為圓心,無人機的安全間隔d為半徑,圍成的圓為UAV2的安全圓,從UAV1的中心A點引出兩條切線與UAV2的安全圓相切,如果兩架無人機的相對速度為vR=v1-v2所在直線lA與⊙O相交時,表示無人機之間存在沖突。
由于該模型只考慮相對速度與圓錐之間的幾何關(guān)系,融合空域內(nèi)任何兩架存在沖突的航空器都需要進行沖突解脫,算法較為復(fù)雜,過早進行沖突解脫也會造成空域資源的浪費?,F(xiàn)提出基于時間約束的速度障礙模型,引入時間參數(shù)τ,即在設(shè)定的時間τ內(nèi),無人機之間會產(chǎn)生飛行沖突。以O(shè)′為中心,d/τ為半徑,使得AO=τAO′,當存在λ∈[0,1],使得,兩架無人機在λτ<τ的時間內(nèi)存在沖突,此時,即當且僅當vR位于該紅色區(qū)域時,沖突才會發(fā)生。通過調(diào)整v1和v2的大小與航向,保證相對速度在障礙區(qū)之外,從而進行沖突解脫。相對于傳統(tǒng)距離解脫算法,基于有限時間的速度障礙探測模型能夠考慮到?jīng)_突雙方的速度、反應(yīng)時間等因素,能夠最大限度利用空域資源[15]。
以UAV2的中心O點為原點,兩無人機之間連線所在直線為x軸,垂直兩機連線的直線作為y軸,建立慣性直角坐標系,如圖2所示。兩無人機與它們之間連線的航向夾角分別為θ1和θ2,兩機之間解脫距離為D0,兩機之間連線與障礙區(qū)域邊界的夾角為α,相對速度vR所在直線與兩機之間夾角為γ,與障礙區(qū)域邊界的夾角為β,與v2的夾角為ε1。若兩機不進行沖突解脫,兩機按照原航線飛行的最小間隔為dmin,根據(jù)相對速度的物理意義,UAV2到相對速度vR所在直線的最小距離也為dmin。
圖2 飛行狀態(tài)示意圖Fig.2 Schematic diagram of flight status
根據(jù)圖2的幾何關(guān)系,得出兩機連線與障礙區(qū)域邊界的夾角:
則經(jīng)過t時間后,兩無人機之間的距離為:
為簡化表達式,令:
則t時間后,兩無人機之間的距離表示為:
一般來說,(Δvx)2+(Δvy)2≠0,兩無人機之間的距離D2(t)為一條拋物線,若ΔxΔvx+ΔyΔvy<0,則兩無人機之間的距離逐漸減小,有可能發(fā)生飛行沖突。為求出兩機的最小距離,令dD2(t)/dt=0,求得t代入距離公式,得到兩無人機之間最小距離為:
根據(jù)圖2中的幾何關(guān)系,可計算出:
根據(jù)速度障礙法原理,即當α>γ時,無人機之間存在飛行沖突,α≤γ時,無人機之間不存在飛行沖突。
博弈論是常用于解決理性決策者之間沖突與矛盾問題的理論[16]。合作博弈是基于聯(lián)盟內(nèi)部可以進行信息互通以及決策者之間存在約束力為前提條件的博弈類型,博弈方之間通過相互合作形成聯(lián)盟,強調(diào)集體主義和團體理性[17]。合作博弈的求解原則就是維護聯(lián)盟利益的前提下保證參與者獲得更高收益。本文以無人機沖突方獲取更多利益作為有約束力的協(xié)議,沖突解脫方采用合作博弈控制方法。雙機飛行沖突背景下,單機機動避讓的支付代價往往較大,雙機同時機動避撞時,聯(lián)盟福利最優(yōu)解配置的公平性與整體效益性是統(tǒng)一的[18]。
博弈論的3 個基本要素為:博弈方、博弈策略和目標函數(shù)[19]。
2.2.1 博弈方
博弈方是指博弈過程中具有決策權(quán)的參與方。本文中的博弈方為無人機沖突解脫方,分別以UAV1、UAV2表示博弈雙方。
2.2.2 博弈策略
博弈策略是博弈方可以選擇的策略集合。如圖3所示,通過調(diào)整v1和v2的大小與方向來保證vR位于障礙區(qū)域之外,c為vR距離障礙區(qū)域最近的修改速度,根據(jù)速度障礙法原理,需要修改的c由沖突解脫博弈雙方共同承擔(dān),博弈雙方各自選擇自己的調(diào)整速度進行沖突解脫。對于UAV1來說,v1修正速度對應(yīng)的半平面由以下公式定義:
圖3 博弈雙方可以選擇的策略集合Fig.3 Sets of strategies chosen by both sides of game
同樣對UAV2來說,v2修正速度對應(yīng)的半平面由以下公式定義:
如果將修改后的速度v1和v2放在這兩個半平面上,新的相對速度就跳出了障礙區(qū)域,解決了沖突?;跓o人機速度改變量盡量小的原則,修改后的速度v1和v2分別在半平面的邊界線上選擇解脫策略。
融合空域內(nèi)無人機為達到?jīng)_突解脫的目的,可以通過調(diào)整速度大小或者改變航向的方式進行沖突解脫,由于無人機具有機動性強、操作便捷的特點,通過航向與速度共同調(diào)整的混合解脫方式可以更好達到解脫效果。下面通過公式推導(dǎo)進一步說明無人機可調(diào)速度大小與航向的關(guān)系。
對于無人機UAV1,如圖4所示,M1點為v1在障礙邊界的投影點,N1為v1的終點,沖突解脫調(diào)整后的相對速度與的夾角為,無人機航向調(diào)整量分別為Δθ1、Δθ2,在無人機未進行沖突解脫前的速度矢量三角形中,由幾何關(guān)系得:
圖4 UAV1博弈方速度調(diào)整示意圖Fig.4 Schematic diagram of UAV1 game side speed adjustment
由正弦定理得:
在△AM1N1中,由幾何關(guān)系得:
解得UAV1速度調(diào)整量Δv1與航向調(diào)整量Δθ1之間的關(guān)系為:
無人機航向調(diào)整量Δθ1、Δθ2的關(guān)系由幾何關(guān)系得:
在無人機沖突解脫調(diào)整后的速度矢量三角形中,由正弦定理得:
對于無人機UAV2,如圖5所示,M2點為v2在障礙邊界的投影點,N2為v2的終點,等參數(shù)計算方式與UAV1基本一致,現(xiàn)在對計算方式不同的參數(shù)進行說明。
圖5 UAV2博弈方速度調(diào)整示意圖Fig.5 Schematic diagram of UAV2 game side speed adjustment
在△OM2N2中,由幾何關(guān)系得:
解得UAV2 速度調(diào)整量Δv2與航向調(diào)整量Δθ2之間的關(guān)系為:
由于無人機在運行過程中,受自身性能的影響,其自身速度調(diào)整量與航向調(diào)整量均有限制,需要滿足以下公式:
同時滿足無人機航向調(diào)整量與速度調(diào)整量性能的可選速度決策集為重合陰影部分,無人機可以選擇速度決策集合中的任一速度進行沖突解脫。如圖6、圖7 所示,UAV1博弈方可選速度調(diào)整策略為圖6重合陰影部分,UAV2博弈方可選速度調(diào)整策略為圖7重合陰影部分。
圖6 UAV1博弈方可選速度調(diào)整策略(重合陰影部分)Fig.6 UAV1 game side optional speed adjustment strategy(overlapped shadow part)
圖7 UAV2博弈方可選速度調(diào)整策略(重合陰影部分)Fig.7 UAV2 game side optional speed adjustment strategy(overlapped shadow part)
根據(jù)式(15)、(20),分析得無人機的航向調(diào)整量與速度大小調(diào)整量存在一一對應(yīng)的關(guān)系,可將無人機速度調(diào)整量的約束轉(zhuǎn)換為無人機航向調(diào)整量的約束,從而降低計算復(fù)雜度,雙方的博弈策略集轉(zhuǎn)化成航向變化量集合。
2.2.3 目標函數(shù)
目標函數(shù)也稱為性能指標,用來衡量博弈雙方的收益。在沖突解脫過程,主要是由避讓支付的代價決定的。對于博弈方來說,沖突解脫過程中所需支付的威脅代價主要由時間延遲、航向改變量決定,下面分別對各支付代價指標進行說明。
(1)時間延遲指標。如圖8所示,相對速度所在直線與無人機安全圓相切點為E點,無人機中心O與沖突解脫前的相對速度vR所在直線垂直于Q點,并延長交解脫后相對速度所在直線于P點,無人機的沖突解脫航線為AP,無人機按照相對速度飛行到P點后,進行航跡恢復(fù),航跡恢復(fù)點為A′。
圖8 時間指標示意圖Fig.8 Schematic diagram of time index
根據(jù)圖8中幾何關(guān)系,無人機沖突解脫相對飛行距離S為:
沖突消解時間tm為:
AP段航線實際長為v1tm,由于沖突解脫造成的時間延遲為:
時間延遲越小,沖突解脫的支付代價越小,效用函數(shù)u1(t)可表示為:
(2)航向調(diào)整量指標。博弈方航向調(diào)整量也為影響支付代價的關(guān)鍵指標,無人機航向調(diào)整量越大,越不利于安全運行,博弈方支付代價更大。效用函數(shù)u2(t)可表示為:
(3)綜合指標。綜合考慮時間和航向調(diào)整量的指標,提出綜合目標函數(shù)u3(t,θ1)為:
在無人機進行博弈解脫過程中,所有博弈方I={i|i∈[1,N]} 的解脫策略組成的集合S(isij∈Si表示第i個博弈方采用第j個策略),每場博弈局中,博弈方通過信息互通與相互約束,分別選擇合適的策略(s1,s2,…,sN),支付相應(yīng)的代價為ui(i=1,2,…,N),聯(lián)盟福利函數(shù)為:
式中,Wj為第j個策略組合得到的收益,即為聯(lián)盟福利;uij為第i個博弈方采用第j個策略得到的博弈方收益;ki為權(quán)重,反映各博弈方對聯(lián)盟福利的重要程度。通過合作博弈,最終選擇最佳決策策略(),獲得最大的聯(lián)盟福利[18]。
融合空域內(nèi)飛行的無人機通過自身雷達設(shè)備不斷探測周圍的物體運行信息(速度、位置、航向),通過航跡預(yù)推模型判斷無人機之間是否存在沖突,若不存在沖突,無人機保持當前參數(shù)繼續(xù)運行,若存在沖突,沖突雙方計算聯(lián)盟福利函數(shù)以及雙方解脫策略,通過最優(yōu)化理論計算出雙方最優(yōu)解脫策略。本文采用有約束的最優(yōu)化函數(shù)fmincon來實現(xiàn)求解過程。
針對合作型無人機最優(yōu)防相撞策略轉(zhuǎn)化為以下最優(yōu)化問題。
其中,θi與,i=1,2 分別表示無人機沖突雙方的航向與速度。
基于合作博弈的無人機沖突解脫流程如圖9所示。
圖9 基于合作博弈的沖突解脫流程圖Fig.9 Conflict resolution flow chart based on cooperative game
為驗證本文提出的無人機沖突解脫策略的有效性、實時性與高效性,運用Matlab2018a 環(huán)境對具體沖突解脫場景進行仿真。根據(jù)融合空域內(nèi)無人機飛行特性與相關(guān)空中交通管理規(guī)定,假設(shè)無人機安全間隔d為20 m,航向調(diào)整范圍為Δθ∈[-π/6,π/6],速度性能約束范圍為v1,v2∈[13,18]。為了避免τ設(shè)置過高導(dǎo)致高流量融合空域內(nèi)算法效率太低,以及τ設(shè)置過小來不及沖突解脫的極端情況,時間約束參數(shù)τ設(shè)置為8 s。
為驗證沖突解脫算法的有效性,選取航跡交叉角分別為銳角、直角和鈍角三種沖突類型進行博弈,博弈雙方的初始位置、航向、速度等信息假設(shè)通過無人機機載雷達設(shè)備可以實時獲取,具體數(shù)據(jù)由表1列出。
表1 沖突雙方初始信息Table 1 Initial information of both sides of conflict
場景1為無沖突博弈情景,博弈雙方初始位置分別為(100,0)、(0,200),航向分別為75°、15°,速度分別為16 m/s、14 m/s,仿真步長為0.01 s。通過對博弈雙方的飛行信息進行計算,得到α≤γ,根據(jù)速度障礙法原理,雙方不存在飛行沖突,按照原定航線繼續(xù)運行。雙方軌跡圖以及實時間隔如圖10所示。從無人機運行間隔來看,雙機的實際距離始終大于安全間隔,說明場景不需要進行沖突解脫。
圖10 場景1沖突解脫示意圖Fig.10 Scenario 1 conflict resolution schematic
場景2為航跡交叉角度為銳角的沖突類型情景,博弈雙方初始位置分別為(100,0)、(0,100),航向分別為75°、15°,速度分別為16 m/s、14 m/s,仿真步長為0.01 s。當無人機受航向調(diào)整量與速度改變量性能指標影響時,UAV1可選沖突解脫角度范圍為Δθ1∈[-6.1,27.8],UAV2可選沖突解脫角度改變范圍為Δθ2∈[-23.6,10.3],通過最優(yōu)化理論求解出UAV1、UAV2 最優(yōu)解脫角度改變量分別為-6°、-24°。博弈雙方軌跡圖以及實時間隔如圖11所示,若未進行沖突解脫,可以看出雙機的實際間隔會小于安全間隔,而沖突解脫后雙機間隔均大于安全間隔。
圖11 場景2沖突解脫示意圖Fig.11 Scenario 2 conflict resolution schematic
場景3為航跡交叉角度為直角的沖突類型情景,博弈雙方初始位置分別為(100,0)、(0,100),航向分別為90°、0°,速度分別為16 m/s、16 m/s,仿真步長為0.01 s,當無人機受航向調(diào)整量與速度改變量性能指標影響時,UAV1可選沖突解脫角度范圍為Δθ1∈[0.8,21.9],UAV2可選沖突解脫角度改變范圍為Δθ2∈[-13.6,7.4],通過最優(yōu)化理論求解出UAV1、UAV2 最優(yōu)解脫角度改變量分別為1°、-14°。博弈雙方軌跡圖以及實時間隔如圖12所示,若未進行沖突解脫,可以看出雙機的實際間隔逐步減小到0,而沖突解脫后雙機間隔均大于安全間隔。
圖12 場景3沖突解脫示意圖Fig.12 Scenario 3 conflict resolution schematic
場景4為航跡交叉角度為鈍角的沖突類型情景,博弈雙方初始位置分別為(300,100)、(0,100),航向分別為165°、15°,速度分別為16 m/s、14 m/s,仿真步長為0.01 s。當無人機受航向調(diào)整量與速度改變量性能指標影響時,UAV1可選沖突解脫角度范圍為Δθ1∈[2.1,6.9],UAV2可選沖突解脫角度改變范圍為Δθ2∈[-7.8,-3.1],通過最優(yōu)化理論求解出UAV1、UAV2 最優(yōu)解脫角度改變量分別為2°、-8°。博弈雙方軌跡圖以及實時間隔如圖13所示,若未進行沖突解脫,可以看出雙機的實際間隔會小于安全間隔,而沖突解脫后雙機間隔均大于安全間隔。
圖13 場景4沖突解脫示意圖Fig.13 Scenario 4 conflict resolution schematic
場景1~場景4 涵蓋了復(fù)雜融合空域內(nèi)雙機沖突的基本類型,從仿真結(jié)果來看,沖突雙方都能在自身性能指標的約束下進行選擇解脫策略。同時在運行過程中,博弈雙方之間始終保持在安全間隔之外,可以看出該沖突解脫算法具有有效性。無人機沖突解脫與恢復(fù)過程相關(guān)參數(shù)如表2所示。
表2 無人機沖突解脫與恢復(fù)過程相關(guān)參數(shù)Table 2 Relevant parameters of UAV conflict resolution and recovery process
為進一步說明該沖突解脫算法的實時性與高效性,選取最優(yōu)策略求解時間、解脫時間、繞飛距離占比、機動次數(shù)等指標進行分析。以場景2為例,沖突解脫最優(yōu)策略的求解時間為0.02 s,整個沖突解脫過程耗時1.00 s,根據(jù)式(25),整個沖突解脫過程延遲時間為0.055 7 s,文獻[20]提出的基于速度障礙圓弧法避撞算法(非合作式避撞)延遲時間為0.009 4 s,本文提出的算法,博弈雙方均只需機動兩次便完成解脫過程。場景3、場景4延遲時間分別為0.089 0 s、0.028 6 s,具體數(shù)據(jù)見表3 所示。經(jīng)分析可得,沖突解脫算法求解時間與解脫時間均比較小,滿足解脫的實時性要求,同時延遲時間小,在滿足無人機性能指標約束與運行安全的前提下,沖突解脫所需的支付代價較小。
表3 仿真結(jié)果關(guān)鍵指標Table 3 Key indicators of simulation results
將本文的解脫算法與文獻[21-22]分別提出的基于改進煙花-蟻群混合避障算法、改進勢場蟻群法避撞算法的關(guān)鍵參數(shù)進行比較,如表4 對比得出,本文提出的雙機避撞算法求解時間遠遠小于傳統(tǒng)啟發(fā)式算法,且只需兩次機動便可完成避障,可操作性強。
表4 算法結(jié)果比較Table 4 Comparison of algorithm results
本文針對融合空域內(nèi)雙機沖突類型,提出了合作博弈解脫模型,將聯(lián)盟福利最優(yōu)解作為飛行沖突解脫的最優(yōu)策略,在滿足無人機性能指標約束下,通過最優(yōu)化理論進行解脫策略計算。無人機在滿足最小機動的基礎(chǔ)上,實現(xiàn)了實時沖突解脫。仿真結(jié)果表明:
(1)針對融合空域內(nèi)不同沖突類型,本文算法都能找到博弈雙方最優(yōu)解脫策略,保證沖突雙方實際運行距離都保持在安全范圍以外。
(2)沖突方在自身機動性能約束下選擇解脫策略,將速度大小改變量約束轉(zhuǎn)換為航向變化量,快速計算出滿足聯(lián)盟最優(yōu)福利的策略,滿足實時性要求。
(3)相對于非合作解脫方式,基于合作博弈的沖突解脫算法能夠均衡博弈方利益,保證聯(lián)盟整體解脫支付代價最小的前提下,計算出最優(yōu)解脫策略。