于飛 李擎 原鑫
摘 要: 研究無人戰(zhàn)車在無障礙、有障礙兩種對局環(huán)境中的追逃問題,主要討論了追逃定性微分對策中界柵的確定。在無障礙條件下,建立對局雙方的運動模型,由于兩者到達(dá)捕獲點的時間是相同的,因此可以通過消除時間參數(shù)構(gòu)建界柵。該方法與Isaac提出的構(gòu)造界柵的經(jīng)典方法結(jié)果一致,并在此基礎(chǔ)上分析了躲避區(qū)的最大面積。在無人車的實際行駛過程中肯定會受到障礙物的影響,探討了在有障礙條件下的追逃微分對策界柵的構(gòu)建??紤]線性障礙物的影響,分析在障礙物存在的條件下雙方的等時線分布情況,并提出用等時線的交集確定界柵的方法。
關(guān)鍵詞: 無人戰(zhàn)車; 追逃定性微分對策; 運動模型; 障礙; 等時線; 界柵
中圖分類號: TN99?34; V412.4 文獻(xiàn)標(biāo)識碼: A 文章編號: 1004?373X(2018)15?0161?04
Determination of barrier in pursuit?evasion qualitative differential game of
unmanned combat vehicle
YU Fei, LI Qing, YUAN Xin
(Beijing Key Laboratory of High Dynamic Navigation Technology, Beijing Information Science and Technology University, Beijing 100101, China)
Abstract: The pursuit?evasion issue of unmanned combat vehicle in the play environments with or without obstacle is studied. The determination of barrier in pursuit?evasion qualitative differential game is mainly discussed in this paper. Under the condition without obstacle, the motion model of game players is established. Since the arriving time of two players to the capture point is the same, the time parameters are eliminated to build the barrier. The result of the method is consistent with that of the classical barrier construction method proposed by Isaac, and on this basis, the maximum area of the evading region is analyzed. In the actual driving process of unmanned combat vehicle, the obstacle will affect the method, so it is necessary to construct the barrier in pursuit?evasion qualitative differential game under the obstacle condition. Considering the influence of linear obstacle, the isochron distribution of players under the obstacle condition is analyzed, and a method is proposed to determine the barrier by means of the intersection of isochrons.
Keywords: unmanned combat vehicle; pursuit?evasion qualitative differential game; motion model; obstacle; isochron; barrier
無人戰(zhàn)車是信息化裝備體系的重要組成部分,在戰(zhàn)術(shù)預(yù)警偵查、戰(zhàn)場信息獲取,以及戰(zhàn)略物資運輸方面發(fā)揮著重大的作用。微分對策理論為軍事對抗問題提供了較為完善的模型,并且能基于最優(yōu)控制等控制理論求解雙方最優(yōu)策略、優(yōu)勢區(qū)域,因此可用微分對策理論研究無人戰(zhàn)車應(yīng)用場景中的問題。微分對策是使用微分方程處理雙方或多方連續(xù)動態(tài)沖突、競爭或合作問題的一種數(shù)學(xué)工具。它已經(jīng)廣泛應(yīng)用于生物學(xué)、經(jīng)濟(jì)學(xué)、國際關(guān)系、計算機(jī)科學(xué)和軍事戰(zhàn)略等諸多領(lǐng)域[1]。根據(jù)有無支付泛函,微分對策可以分為定量與定性微分政策兩大類。對抗雙方關(guān)心的不是支付的極值大小,而是某種結(jié)局是否能夠?qū)崿F(xiàn),這種問題稱為定性問題。將對策空間劃分為捕獲區(qū)和躲避區(qū),兩區(qū)域的分界面稱為界柵。
追逃微分對策的定性分析多集中在軍事對抗方面。其中,文獻(xiàn)[2]研究了三維空間雙機(jī)格斗問題,給出了界柵和等時線組成的捕獲區(qū)與躲避區(qū)的確定方法。文獻(xiàn)[3]針對近地共面軌道上兩飛行器在軌追逃對策問題,提出基于軌道根數(shù)描述運動方程的對策問題,在雙方均為徑向連續(xù)可變小推力的假設(shè)條件下,研究定性微分對策方法中考慮推力性能的界柵存在條件。文獻(xiàn)[4]基于微分對策理論研究三維空間內(nèi)導(dǎo)彈攔截飛機(jī)末端制導(dǎo)問題。通過軌道線性化將三維非線性對策時間自由的對策問題簡化成二維線性對策時間固定的對策問題,構(gòu)建哈密頓函數(shù)求解最優(yōu)控制,將求解的最優(yōu)控制代入運動方程倒向積分可得最優(yōu)軌線,最優(yōu)軌線構(gòu)成界柵。文獻(xiàn)[5]對2輛自主無人車碰撞問題的定性微分對策進(jìn)行研究,說明微分對策方法在處理兩車碰撞問題上的有效性。但是現(xiàn)實情況中無人駕駛車輛行駛的環(huán)境比較復(fù)雜,存在禁入?yún)^(qū)、復(fù)雜行駛環(huán)境中的障礙,以上文獻(xiàn)定性分析都沒有考慮到障礙物的影響。本文提出在無障礙對局環(huán)境中,一種基于消除時間參數(shù)的界柵確定方法,經(jīng)過證明該方法與Isaac提出的構(gòu)造界柵的經(jīng)典方法結(jié)果一致??紤]線性障礙存在的對局環(huán)境,給出無人戰(zhàn)車在該環(huán)境中追逃定性微分對策界柵的確定方法。
微分對策中最早研究的是追逃問題,即追逃微分對策,這些問題的例子涉及一個追捕者,其試圖捕捉一個逃避者,或是一個逃避者,試圖在一個復(fù)雜的環(huán)境中試圖逃脫。在本文中,以無人駕駛車輛為載體,研究不存在障礙和存在障礙環(huán)境時追逃問題,對局雙方為單一的追擊者和單一的逃避者。
對局雙方視為點運動物體,它們能夠立即執(zhí)行轉(zhuǎn)向,并且速度不存在隨機(jī)變化。假設(shè)對局雙方在對局開始時知道對方的位置,并且除了有界速度之外,它們的運動沒有任何限制[6]。對策活動中局中人都有獨立決策權(quán),他們根據(jù)實際情況行使控制能力使對抗行為朝著有利于自己的方向發(fā)展,為了方便分析,對相關(guān)符號進(jìn)行定義:[P(xp,yp)]為追擊者的位置;[E(xe,ye)]為逃避者的位置;[Vp]是追擊者的最大速度;[Ve]是逃避者的最大速度;[k]為兩者速度的比值。
由于在[k>1]時,逃避者處在任意初始位置都會獲勝,所以只考慮[k≤1]的情況,追擊者的速度比逃避者要快,這樣,追擊者才有可能捕捉到逃避者。無人戰(zhàn)車追逃雙方如圖1所示。列出追逃雙方的運動學(xué)方程如下:
[xp=Vpcos φyp=Vpcos φxe=Vecos ?ye=Vecos ?] (1)
式中:捕獲者P的運動方向與[x]軸的夾角為[φ];躲避者E的運動方向與x軸的夾角為[?]。
當(dāng)周圍環(huán)境不存在障礙時,追捕雙方只是簡單的移動,其中的一方總是可以知道其對手的位置。捕獲者[P]通過選擇策略[u],力圖實現(xiàn)與逃避者[E]的距離為0,達(dá)到捕獲[E]的目的,此時對局結(jié)束。躲避者[E]選擇策略[v],使得兩者距離大于0,從而躲避追捕。那么存在一個分界面,在分界面上的每一點都是捕獲點,該分界面稱為界柵。界柵將這種情況下的對策空間[Rm]分為捕獲區(qū)和躲避區(qū),在捕獲區(qū),無論躲避者采取什么行動總會被捕捉到,在躲避區(qū),無論捕獲者采取什么行動躲避者總會逃脫。
對局環(huán)境中不存在障礙時,假設(shè)捕獲者于點[C]處將躲避者捕獲。對于捕捉者,為了在最短的時間內(nèi)結(jié)束對局,最佳追捕策略顯然是以最大速度[Vp]朝向捕獲點做直線運動。在相同時間躲避者由初始點移動到捕獲點[C],逃避者此時也是以最大速度朝捕獲點做直線運動。下面通過建立運動模型消除公共參數(shù),來確定界柵,追捕場景見圖2。
已知[(xe,ye)]和[(xp,yp)]分別是逃避者[E]和追蹤者[P]的位置,并且如果追蹤者[P]的初始位置是[(xp0,yp0)],對于相同的時間[t],追逃雙方的運動方程可以表示為:
[x2e+y2e=v2et2] (2)
[(xp-xp0)2+(yp-yp0)2=v2pt2] (3)
由于追逃雙方到達(dá)捕獲點[C]時所耗費的時間是相等的,可以通過消除公共參數(shù)[t]得到:
[x2+y2v2e=(xp-xp0)2+(yp-yp0)2v2p] (4)
代入[xp0=d],[yp0= 0],[γ=VpVe],得到:
[(γ2-1)(x2+y2)+2dx-d2=0] (5)
阿波羅尼斯圓如圖3所示,其數(shù)學(xué)表達(dá)式定義如下:
[(k2-1)(x2+y2)+2ax-a2=0] (6)
對比式(5),式(6)得出,捕獲點[C]的軌跡[A]即為阿波羅尼斯圓,其將由追擊者主導(dǎo)的平面區(qū)域與逃避者主導(dǎo)的平面區(qū)域分離。此處的軌跡[A]將平面劃分為追捕區(qū)與躲避區(qū),即為界柵,其構(gòu)造不考慮追擊者和逃避者的角色,而是將對局雙方簡單地視為運動物體。
軌跡[A]的構(gòu)建提供了追蹤者[P]和逃避者[E]執(zhí)行最佳追擊和規(guī)避策略的所有信息,其中阿波羅尼斯圓內(nèi)是逃避者的主導(dǎo)區(qū)域,阿波羅尼斯圓外部是追擊者的主導(dǎo)區(qū)域。下面將證明逃避者最大速度直線行進(jìn)產(chǎn)生的主導(dǎo)區(qū)域面積最大。
如果逃避者不以最大速度直線行進(jìn)到捕獲點[C],則新形成的阿波羅尼斯圓記做[A]。對于兩個阿氏圓[A]和[A]具有相同參考點[E]和[P]。但具有兩個不同速度比,分別為[k]和[k],并使得[k>k>1]。另外,[a]和[a]分別為線段[EP]與圓[A]和[A]的交點。首先,由于速度比不同,所以兩圓不可能會有交點。其次,通過對比點E到[a]和[a]的距離:
[E-a=1k+1E-P<1k+1E-P=E-a] (7)
可以得出,如果逃避者不以其最大速度移動,則新的追蹤者位置將更接近新的逃避者位置。這也就證明了逃避者最大速度直線行進(jìn)產(chǎn)生的優(yōu)勢區(qū)域最大,如圖4所示。
無人戰(zhàn)車在野外區(qū)域進(jìn)行軍事對抗時,首先要進(jìn)行機(jī)器感知,探測周圍環(huán)境,然后選擇出對自己最有益的決策方案。周圍環(huán)境中的障礙物都可以在對策空間中設(shè)置約束與之對應(yīng)。本節(jié)中主要研究對策空間中存在線性障礙時界柵的確定。文獻(xiàn)[2]通過將等時點連接成等時線,結(jié)合目標(biāo)集以及界柵得到有限時間內(nèi)的捕獲區(qū),本文通過構(gòu)造等時線交點來構(gòu)造此種對局環(huán)境的界柵。
圖5給出了具有線段障礙物的初始對局情況,其中,□代表逃避者,△代表追擊者。假設(shè)追逃雙方都以最大速度運動,其中追擊者速度為逃避者速度的2倍。
在有障礙物的PE游戲中,平面被窮盡地分為三個不相交的區(qū)域:由一方嚴(yán)格控制的區(qū)域;由另一方嚴(yán)格控制的區(qū)域;對局雙方都不主導(dǎo)的區(qū)域。
證明:考慮平面中的任意點,對于這一點,解決對局雙方從初始位置移動到任意點的兩個時間最優(yōu)控制問題。只有兩個結(jié)果是可能的,即一方所用時間嚴(yán)格小于另一方,或雙方時間相等。在第一結(jié)果中,任意點在捕獲區(qū)或者躲避區(qū)的內(nèi)部。在第二結(jié)果中,任意點在兩個優(yōu)勢區(qū)域之間的交界處,由于該情況的特征在于時間的相等性,因此該點屬于等時線束的交集。
將追逃問題表述為時間最優(yōu)控制問題:給定一個運動物體以速度[v]簡單運動,初始和最終位置[(xi,yi)],[(xf,yf)]和已知障礙物[H],連接[(xi,yi)]到[(xf,yf)]而不與[H]相交的路徑,使得運動物體到達(dá)[(xf,yf)]所需的時間最小化。逃避者采取策略使追捕時間最大化,追擊者采取相關(guān)策略使追捕時間最小化。
定理1 在沒有障礙物的情況下,時間最優(yōu)軌跡是直線,并且等時線是以運動物體的初始位置為中心的同心圓。
定理2 在存在一組障礙物的情況下,時間最佳軌跡是虛線,在障礙物頂點處斷裂,并且等時線形成以生成點為中心的同心圓弧,其中生成點是障礙物頂點或者運動物體的初始位置。
定理3 將平面分成具有唯一生成點區(qū)域的曲線是線段或雙曲線。
以上定理來自于波前傳播,可用于該對局環(huán)境的研究,它們的證明見文獻(xiàn)[7]。
如圖6所示,粗線是障礙物,細(xì)線是等時線,虛線是分離具有不同生成點的區(qū)域的曲線。在區(qū)域1中,時間最優(yōu)軌跡不受障礙物影響,并且等時線形成以運動物體的初始位置為中心的同心圓。對于區(qū)域2和3,時間最優(yōu)軌跡在障礙物的端點處斷開,并且等時線在端點處形成同心圓。區(qū)域2和3由雙曲線弧分隔,其中弧上的每個點可以通過在任一方向上繞障礙物行進(jìn)而以相等的時間到達(dá)。
在指定的持續(xù)時間內(nèi)為每個對局者構(gòu)造等時線,如為每個對局者以時間為參數(shù)形成一組曲線,就形成了等時線。追逃雙方都以變量t為參數(shù),如果雙方都遵循時間最優(yōu)路徑,消除這個共同參數(shù)使得對局者在所有時間點上可以滿足的區(qū)域,推導(dǎo)過程見式(2)~式(5)。
圖7為在存在線段障礙物情況下,界柵的確定方法。圖7a)線束來自等時線的每個交叉點,由*標(biāo)記。在圖7b)中,為了清楚起見去除了等時線束,并且繪制了較大的交叉點以形成兩個主導(dǎo)區(qū)域之間的界柵。在圖7中,圓圈表示障礙物不存在時由阿波羅尼斯圓確定的主導(dǎo)區(qū)域,由于障礙物的存在而導(dǎo)致界柵改變。
如果對局雙方勢均力敵,則對抗總是在界柵上展開,即[x∈B](此處的界柵標(biāo)記為B)。在捕獲區(qū)內(nèi)的運動,軌跡[x(t)]將達(dá)到目標(biāo)集的邊界并穿過,在躲避區(qū)內(nèi)的運動,軌跡不能達(dá)到目標(biāo)集的邊界。追擊者P使逃避者E進(jìn)入捕獲區(qū),則不論E采取什么策略,追擊者總能選擇適當(dāng)?shù)牟呗圆东@到E。在躲避區(qū)域E中,不管追擊者采用什么策略,躲避者E總能采取適當(dāng)?shù)牟呗远惚躊的捕獲。
根據(jù)無人戰(zhàn)車軍事對抗對策空間中有無障礙物約束的兩種情況,本文對追逃定性微分對策進(jìn)行相關(guān)研究,主要目標(biāo)是確定躲避區(qū)與捕獲區(qū)的分界界柵。無障礙物時,界柵為阿波羅尼斯圓;存在線性障礙時,界柵由對局雙方的等時線交叉點構(gòu)造。無人戰(zhàn)車追逃雙方將在界柵上采用自己的最優(yōu)策略,展開最激烈的爭奪以達(dá)到取勝的目的。不同的障礙物對界柵的形狀會有不同的影響,分析界柵的形狀、對策空間的劃分對于作戰(zhàn)能力評價、指揮訓(xùn)練、作戰(zhàn)等都有一定的價值。對其他形狀障礙物的分析,以及相關(guān)最優(yōu)策略的求解需要進(jìn)一步探究。
參考文獻(xiàn)
[1] 譚拂曉,劉德榮,關(guān)新平,等.基于微分對策理論的非線性控制回顧與展望[J].自動化學(xué)報,2014,40(1):1?15.
TAN Fuxiao, LIU Derong, GUAN Xinping, et al. Review and perspective of nonlinear systems control based on differential games [J]. Acta automatica sinica, 2014, 40(1): 1?15.
[2] 佟明安,王立新.三維空間雙機(jī)格斗的捕捉區(qū)和危險區(qū)[J].航空學(xué)報,1989,10(11):536?544.
TONG Mingan, WANG Lixin. The capture and dangerous range for a three?dimensional two?aircraft air?to?air combat problem [J]. Acta aeronautica et astronau, 1989, 10(11): 536?544.
[3] 張秋華,孫毅,黃明明,等.近地共面軌道上兩飛行器在徑向連續(xù)小推力下的追逃界柵[J].控制與決策,2007,22(5):530?534.
ZHANG Qiuhua, SUN Yi, HUANG Mingming, et al. Pursuit?evasion barrier of two space crafts under minute continuous radial thrust in coplanar orbit [J]. Control and decision, 2007, 22(5): 530?534.
[4] 黃銀春.導(dǎo)彈攔截飛機(jī)末端制導(dǎo)制導(dǎo)律和界柵的研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2014.
HUANG Yinchun. The research about the barrier and guidance law of misslie intercepting aircraft terminal guidance [D]. Harbin: Harbin Institute of Technology, 2014.
[5] 原鑫,李擎,蘇中.基于微分對策理論的兩車碰撞問題[J].北京信息科技大學(xué)學(xué)報(自然科學(xué)版),2016,31(5):68?72.
YUAN Xin, LI Qing, SU Zhong. Collision problem of two cars based on differential game theory [J]. Journal of Beijing Information Science & Technology University (natural science), 2016, 31(5): 68?72.
[6] 車競,錢煒祺,和爭春.基于矩陣博弈的兩機(jī)攻防對抗空戰(zhàn)仿真[J].飛行力學(xué),2015,33(2):173?177.
CHE Jing, QIAN Weiqi, HE Zhengchun. Attack?defense confrontation simulation of air combat based on game?matrix approach [J]. Flight dynamics, 2015, 33(2): 173?177.
[7] MITCHELL J S B. A new algorithm for shortest paths among obstacles in the plane [J]. Annals of mathematics and artificial intelligence, 1991, 3(1): 83?105.
[8] CHEN Jie, ZHA Wenzhong, PENG Zhihong. Multi?player pursuit?evasion games with one superior evader [J]. Automatica, 2016, 71: 24?32.
[9] 龔華軍,楊長鋒,王彪,等.無人機(jī)的追逃對抗仿真研究[J].控制理論與應(yīng)用,2009,26(9):1019?1022.
GONG Huajun, YANG Changfeng, WANG Biao, et al. Simulation of pursuit?evasion among multi?UAV [J]. Control theory & applications, 2009, 26(9): 1019?1022.
[10] 黃力偉.求解微分對策問題的混合法[J].火力與指揮控制,2011,36(1):50?52.
HUANG Liwei. Mixed method for solving the problem of differential games [J]. Fire control & command control, 2011, 36(1): 50?52.
[11] RUIZ U. A visual feedback?based time?optimal motion policy for capturing an unpredictable evader [J]. International journal of control, 2015, 88(4): 663?681.
[12] 王發(fā)坤,秦艷琳.三維空間中追逃對抗定性微分對策模型研究[J].艦船電子工程,2008,28(7):8?10.
WANG Fakun, QIN Yanlin. Research on pursuit and evasion resist model in the space based on qualitative differential games [J]. Ship electronic engineering, 2008, 28(7): 8?10.
[13] 蔡文新,方洋旺,吳彥銳,等.基于馬爾科夫跳變系統(tǒng)的微分對策制導(dǎo)律[J].彈道學(xué)報,2013,25(3):24?27.
CAI Wenxin, FANG Yangwang, WU Yanrui, et al. Differential game guidence?law based on Markov jump system [J]. Journal of ballistics, 2013, 25(3): 24?27.
[14] 車競,鄭鳳麒.基于微分對策的追逃對抗仿真[J].飛行力學(xué),2014,32(4):372?375.
CHE Jing, ZHENG Fengqi. Simulation of pursuit?evasion resistance based on differential game [J]. Flight dynamics, 2014, 32(4): 372?375.
[15] 李登峰.微分對策及應(yīng)用[M].北京:國防工業(yè)出版社,2000.
LI Dengfeng. Differential strategy and its application [M]. Beijing: National Defense Industry Press, 2000.