郭 昊, 周德云, 張 堃
(西北工業(yè)大學,西安 710072)
目前,無人機已成為航空技術的重要發(fā)展方向,無人作戰(zhàn)飛機更是處于研究的前沿。隨著航電火控技術、通信與導航技術和先進制導武器的發(fā)展,無人作戰(zhàn)飛機將逐步承擔起包括綜合打擊、對地火力壓制等作戰(zhàn)任務,甚至參與制空權的奪取。能夠在復雜的空戰(zhàn)環(huán)境下進行自主空戰(zhàn)決策是無人作戰(zhàn)飛機進行空戰(zhàn)的關鍵技術之一。在空戰(zhàn)最為激烈的機動攻擊階段,無人作戰(zhàn)飛機應根據(jù)空戰(zhàn)態(tài)勢及時搶占并保持有利位置,尋機殲敵,保全自己。自主機動決策是自主空戰(zhàn)決策的核心內(nèi)容。在空戰(zhàn)過程中,交戰(zhàn)雙方是一個動態(tài)的對抗過程,機動策略的選擇具有主動性、目的性和風險性[1]。目前,對機動策略的研究常用的方法有微分對策法、矩陣對策法、人工智能法等[2],但這些方法都未考慮決策過程的風險性。本文以對策論為基礎,研究基于風險型決策的空戰(zhàn)自主機動策略,并對不同條件下的實例進行仿真。
在一對一空戰(zhàn)機動攻擊階段,交戰(zhàn)雙方的對抗過程可以看作是一個有限二人零和對策過程。根據(jù)對策論的知識,構(gòu)建空戰(zhàn)機動攻擊階段的對策模型。模型包括局中人、策略集和支付等3個要素。
局中人為我方攻擊機和敵方目標機。策略集以常用空戰(zhàn)操縱方式為基礎,進而設計提出的7種基本機動方式[3-4],包括最大加速、最大減速、最大過載爬升、最大過載俯沖、最大過載右轉(zhuǎn)、最大過載左轉(zhuǎn)、保持穩(wěn)定飛行。通過實時進行機動選擇,可由此7種機動方式組合出多種機動動作。在交戰(zhàn)雙方策略集選定以后,就可構(gòu)造出我方攻擊機的支付矩陣:
Sij為針對目標機執(zhí)行第j種機動策略,攻擊機選擇第i種機動策略與之進行對抗時,攻擊機的贏得值。贏得值越大,表示攻擊機優(yōu)勢越大,損失越小,目標機優(yōu)勢越小,損失越大。
支付矩陣中的贏得值是以空戰(zhàn)態(tài)勢為依據(jù),通過依次分別預測一段時間后,交戰(zhàn)雙方執(zhí)行7種機動方式所達到的狀態(tài),并計算各狀態(tài)的評估函數(shù)來實現(xiàn)[5]。本文采用的空戰(zhàn)態(tài)勢評估函數(shù)主要由交戰(zhàn)雙方的角度、距離、接近速度、相對高度及武器性能等因素決定。
角度跟蹤優(yōu)勢函數(shù)為
式中:qR為攻擊機R速度矢量與目標線夾角;qB為目標機B速度矢量與目標線夾角。
接近速度優(yōu)勢函數(shù)為
式中:Vc為攻擊機R與目標機B的接近速度。
高度優(yōu)勢函數(shù)為
式中:h為攻擊機與目標機的相對高度差;hX為門限高度差,其值隨空戰(zhàn)形式的不同而變化,可由決策者根據(jù)經(jīng)驗設定;σhX=1.2hX。
現(xiàn)代空戰(zhàn)武器主要以各型空空導彈為主,對于全向空空導彈來講,在目標周圍存在一可攻擊區(qū),只有攻擊機進入該區(qū)內(nèi),且目標機處于攻擊機有效截獲區(qū)時方可進行攻擊[6],即攻擊機應滿足:
式中:νR為目標方位角;μR為目標俯仰角;Δφs為攻擊機雷達水平掃描范圍;Δφc為攻擊機雷達垂直掃描范圍;Rmin,Rmax為導彈最小允許發(fā)射距離和最大允許發(fā)射距離;Dmin,Dmax為雷達最小截獲距離和最大截獲距離。一般總有Rmax<Dmax,Rmin>Dmin,因而只需滿足式(5)的前兩式即可。當相對距離r>>Rmax時,攻擊機R遠離目標機B的攻擊區(qū),可以認為距離優(yōu)勢很小;當r逐漸減小,從而靠近 Rmax時,距離優(yōu)勢隨之增大;當Rmin≤r≤Rmax時,R機處于B機的可攻擊區(qū)內(nèi),可認為距離優(yōu)勢很大;當r進一步減小,使得r<Rmin時,R機出了B機的可攻擊區(qū),距離優(yōu)勢減小。因此,構(gòu)造距離優(yōu)勢函數(shù):
式中:R0=(Rmax+Rmin)/2;σr=2(Rmax-Rmin)。
同理可構(gòu)造截獲優(yōu)勢函數(shù):
式中:σs=2.5Δφs;σc=2.5Δφc。從而,可定義攻擊優(yōu)勢函數(shù):
空戰(zhàn)態(tài)勢評估函數(shù)是決策者選擇機動策略的依據(jù),不同的空戰(zhàn)形式,影響空戰(zhàn)態(tài)勢的因素有所不同。在近距格斗中,空戰(zhàn)雙方對抗激烈,機動轉(zhuǎn)換迅速,機動目的以擺脫敵方瞄準跟蹤、搶占有利攻擊位置為主,決策者應綜合考慮角度、距離、接近速度、高度及武器性能等對空戰(zhàn)態(tài)勢的影響。與近距格斗相比,在超視距空戰(zhàn)中,交戰(zhàn)雙方大都在彼此的前半球進行對射攻擊,機動目的以保持對敵方的瞄準跟蹤、調(diào)整姿態(tài)滿足武器發(fā)射條件為主,這在一定程度上限制了彼此的角度優(yōu)勢的大小,因此決策者需著重考慮距離、高度和武器性能的影響。綜合考慮交戰(zhàn)雙方的角度、距離、接近速度、相對高度、武器性能以及空戰(zhàn)形式等因素,則攻擊機和目標機分別采取第i種機動和第j種機動進行對抗后的總的空戰(zhàn)態(tài)勢評估函數(shù),即攻擊機的贏得值為
式中:w1,w2,w3為各優(yōu)勢函數(shù)的權重,其值可根據(jù)當前空戰(zhàn)形式以及決策者的經(jīng)驗、偏好確定。計算得到贏得值后,就可構(gòu)造攻擊機支付矩陣S。
空戰(zhàn)是一種在沖突環(huán)境下的激烈對抗過程,機動策略的選擇通常采用對策論方法,以找出“穩(wěn)定解”或“平衡解”。這樣的結(jié)果比較保守,本文將沖突局勢下的雙邊對策問題,轉(zhuǎn)變?yōu)閱芜咃L險決策問題,并通過模糊決策方法對其進行分析求解,找出最優(yōu)對抗策略。
風險型決策是指決策者在決策環(huán)境不是完全確定,但對各個狀態(tài)發(fā)生的概率已知的情況下所作出的決策[7]。能否準確預測當前時刻交戰(zhàn)雙方執(zhí)行各種機動策略的概率是影響機動決策有效性的關鍵因素之一。本文通過在每一決策時刻依次分別預測一段時間后交戰(zhàn)雙方執(zhí)行7種機動策略所達到的狀態(tài),確定當前時刻交戰(zhàn)雙方執(zhí)行各種機動策略的概率。
設 ΓR=(r1,r2,…,r7)為攻擊機R 的機動策略集,ΓB=(b1,b2,…,b7)為目標機 B 的機動策略集,根據(jù)第1、第2節(jié)的分析,可確定攻擊機R對目標機B的機動對策矩陣 S=(sij)7×7。
設Y=(y1,y2,…,y7)為攻擊機R采取7種機動策略的概率向量,則有:
式中:i=1,2,…,7。
同理,設X=(x1,x2,…,x7)為目標機 B采取7種機動策略的概率向量,則有:
式中:j=1,2,…,7。
根據(jù){S,Y},可建立攻擊機R對目標機B的風險型機動決策矩陣[8]:
式中:yisij,i,j=1,2,…,7 為針對目標機執(zhí)行第 j種機動策略,攻擊機選擇第i種機動策略與之進行對抗時,攻擊機所得的風險收益。
在建立攻擊機R對目標機B的風險型機動決策矩陣 A=(aij)7×7的基礎上,令:
式中:j=1,2,…,7。定義相對偏差為
于是得到由相對偏差值構(gòu)成的模糊決策矩陣Δ=(μij)7×7,采用最大隸屬度偏差法[9]可確定攻擊機 R 執(zhí)行各種機動策略的相對風險收益值為
式中:bj=(μij)。攻擊機 R 的最優(yōu)機動策略應滿足:
則攻擊機R的最優(yōu)機動策略為ri*。
決策時機的確定是能否有效進行機動決策的關鍵因素之一。為了提高機動決策的快速性及有效性,決策觸發(fā)器采用決策觸發(fā)機制,決策時機根據(jù)空戰(zhàn)實際情況確定。在決策觸發(fā)器中設置一些條件,在每個采樣周期都對這些條件進行判斷,若有條件滿足則觸發(fā)一次決策[10],決策觸發(fā)條件如下所述。
1)初始決策時刻。在空戰(zhàn)開始時刻,即t=t0時,應觸發(fā)第一次決策。
2)戰(zhàn)術終止時刻。每次決策都對未來一段時間內(nèi)的空戰(zhàn)過程進行預測,以此為基礎進行機動決策。因此,一次決策的有效期就是其最優(yōu)空戰(zhàn)過程的時間跨度。若實際的空戰(zhàn)過程與上一次決策時預測的最優(yōu)過程基本一致,則應在該最優(yōu)過程的終止時刻t=tk時觸發(fā)新的一次決策,tk=tk-1+ ΔT。其中:tk-1為上一次決策時刻;ΔT為最優(yōu)空戰(zhàn)過程的時間跨度,即空戰(zhàn)過程預測時間。ΔT=KΔtf,Δtf為空戰(zhàn)積分步長,K為預測時間間隔數(shù)。根據(jù)專家經(jīng)驗,K主要依賴于攻擊機速度矢量與目標線的夾角ω以及攻擊機與目標機距離r的變化而確定[11-12],三者之間關系如圖1所示,圖中,Kc為K 的上限,ωd=0.2ωc,ωc決定曲線 K(ω)的拐點,其值可按曲線ωc(r/Rm)確定,Rm為武器作用范圍,ωe的值可由經(jīng)驗確定。
圖1 預測時間間隔數(shù)K示意圖Fig.1 Time predicting interval K
3)本方局勢危急或決策失誤。若空戰(zhàn)過程中本機高度過低、速度過低、空戰(zhàn)狀態(tài)非常不利,或?qū)嶋H空戰(zhàn)態(tài)勢與最近一次決策的預測結(jié)果發(fā)生顯著偏差,則此時不能再采用上一次的決策結(jié)果,應觸發(fā)新一次決策以便及時改出。在t時刻,若滿足以下條件之一則觸發(fā)決策:
式中:S(t)為空戰(zhàn)態(tài)勢評估函數(shù)值;Hmin,Vmin及Smin為高度、速度和S(t)的閾值;S^(t)為最近一次決策中對S(t)的預測值,ΔS為閾值。
決策觸發(fā)機制充分考慮了空戰(zhàn)態(tài)勢變化的快速性及不可預見性,能夠根據(jù)空戰(zhàn)實際情況靈活選擇決策時機,提高了機動決策的快速性及有效性。
設攻擊機為A,目標機為T,A,T機最大可用過載均為7g。仿真采用北-天-東坐標系。
1)近距(WVR)決策仿真。A機初始位置(單位:m):(1 000,5 200,2 000)。T 機初始位置(單位:m):(6 700,4 500,5 300)。A 機初始速度 VA=280 m/s,初始航跡俯仰角θA=0°,初始航跡偏轉(zhuǎn)角φA=0°。T機初始速度VT=310 m/s,初始航跡俯仰角θT=9°,初始航跡偏轉(zhuǎn)角φT=45°。
雙方在120 s中的機動對抗情況如圖2、圖3所示。
圖2 A,T機近距對抗軌跡Fig.2 The trajectory of aircrafts in WVR combat
圖3 A,T機近距對抗機動決策結(jié)果Fig.3 The maneuvering decision-making of aircrafts in WVR combat
2)超視距(BVR)決策仿真。A機初始位置(單位:m):(1 000,2 500,2 000)。T機初始位置(單位:m):(36 000,4 500,34 300)。A 機初始速度 VA=450 m/s,初始航跡俯仰角 θA=0°,初始航跡偏轉(zhuǎn)角φA=0°。T機初始速度VT=420 m/s,初始航跡俯仰角θT=0°,初始航跡偏轉(zhuǎn)角 φT=270°。
雙方在25 s中的機動對抗情況如圖4、圖5所示。
圖4 A,T機超視距對抗軌跡Fig.4 The trajectory of aircrafts in BVR combat
圖5 A,T機超視距對抗機動決策結(jié)果Fig.5 The maneuvering decision-making of aircrafts in BVR combat
3)仿真結(jié)果分析。圖2描述了近距對抗過程中A,T機的飛行軌跡,圖3中的縱坐標表示A,T機的機動策略號,其值依次對應于第1節(jié)中的7種基本機動方式,它分別描述了近距對抗過程中A,T機在每一時刻所執(zhí)行的機動策略。由圖2、圖3可以看出,在空戰(zhàn)初始時刻,A機在速度上并不占優(yōu)。在空戰(zhàn)的前10 s,A機不斷調(diào)整速度以增大本機總體優(yōu)勢,T機由于A機的機動對其現(xiàn)有的優(yōu)勢影響不大,因此保持向左盤旋上升以增大角度及高度優(yōu)勢。在第11 s時,由于A機相對于T機的角度優(yōu)勢降低,因此A機采取水平向右盤旋以擺脫T機的跟蹤瞄準,T機則相應地采取向右盤旋上升,試圖進入A機尾后上方區(qū)域,以獲得有利的攻擊位置。在第43 s時,A機加速躍升以降低T機的高度優(yōu)勢,T機則繼續(xù)向右盤旋上升,以保持對A機的跟蹤。由此可以看出,在近距情況下,交戰(zhàn)雙方對空戰(zhàn)態(tài)勢變化敏感,能夠及時根據(jù)空戰(zhàn)態(tài)勢及敵方機動動作的轉(zhuǎn)換,相應地改變機動策略,以擺脫敵方的跟蹤瞄準,并搶占有利的攻擊位置。
圖4描述了超視距對抗過程中A,T機的飛行軌跡,圖5分別描述了超視距對抗過程中A,T機在每一時刻所執(zhí)行的機動策略。由圖4、圖5可以看出,在空戰(zhàn)的前15 s,A機向右轉(zhuǎn)彎,加速躍升,在保持對T機截獲跟蹤的情況下,增大高度優(yōu)勢;T機則水平右轉(zhuǎn)盤旋以實現(xiàn)對A機的截獲跟蹤。在15~25 s,T機不斷調(diào)整方位角,以保持對A機的跟蹤;A機則不斷調(diào)整本機的速度、姿態(tài),完成對T機的跟蹤瞄準。由此可以看出,與近距格斗相比,在超視距情況下,交戰(zhàn)雙方相距較遠,空戰(zhàn)方式以迎頭對攻為主,空戰(zhàn)態(tài)勢變化平緩,交戰(zhàn)雙方對敵方機動動作的敏感程度降低,機動動作的轉(zhuǎn)換主要以滿足中距武器發(fā)射條件為主。
空戰(zhàn)機動對抗是一個復雜的、動態(tài)的過程,影響機動動作選擇的因素很多。本文通過對空戰(zhàn)機動方式的分析,以對策論為基礎,將空戰(zhàn)態(tài)勢作為預測機動策略概率的依據(jù),提出了一種基于風險型決策的空戰(zhàn)自主機動決策算法,并在不同的條件下,對空戰(zhàn)機動攻擊階段的自主機動決策進行了仿真。仿真結(jié)果符合空戰(zhàn)實際情況,較好地體現(xiàn)了空戰(zhàn)過程的對抗性,機動決策的主動性、目的性和風險性。對無人機空戰(zhàn)自主機動決策具有一定參考價值。
[1]劉昌云,劉進忙,陳長興.基于風險型決策的目標機動策略研究[J].系統(tǒng)工程理論與實踐,2003(10):99-102.
[2]董彥非,郭基聯(lián),張恒喜.空戰(zhàn)機動決策方法研究[J].火力與指揮控制,2002,27(2):75-78.
[3]鐘友武,柳嘉潤,楊凌宇,等.自主近距空戰(zhàn)中機動動作庫及其綜合控制系統(tǒng)[J].航空學報,2008,29(增):114-121.
[4]HERBST W B.Dynamics of air combat[J].Aircraft,1982,20(7):594-598.
[5]吳云潔,宋立國,姜玉憲.飛行綜合控制系統(tǒng)空戰(zhàn)決策方法[J].北京航空航天大學學報,1999,25(3):272-274.
[6]周德云,李鋒,蒲小勃,等.基于遺傳算法的飛機戰(zhàn)術飛行動作決策[J].西北工業(yè)大學學報,2002,20(1):109-112.
[7]運籌學教材編寫組.運籌學[M].3版.北京:清華大學出版社,2005.
[8]羅小明.C3I系統(tǒng)攻防對抗作戰(zhàn)決策的建模及仿真研究[J].指揮技術學院學報,2001(1):54-56.
[9]李登峰.模糊多目標多人決策與對策[M].北京:國防工業(yè)出版社,2003.
[10]柳嘉潤,鐘友武,張磊,等.自主空戰(zhàn)決策的試探機動方法及仿真研究[J].系統(tǒng)仿真學報,2008,20(5):1238-1242.
[11]王芳,姜長生.基于風險型決策的多目標空戰(zhàn)機動策略研究[J].電光與控制,2008,15(12):21-26.
[12]AUSTIN F,CARBONE G,F(xiàn)ALCO M,et al.Game theory for automated maneuvering during air-to-air combat[J].J Guidance,1990,13(6):1143-1149.