張立鵬, 魏瑞軒, 李 霞
(空軍工程大學(xué)工程學(xué)院,西安 710038)
具有空中打擊能力的無人作戰(zhàn)飛機(jī)(UCAV),作為一種可執(zhí)行殲擊機(jī)戰(zhàn)場任務(wù)的新概念武器,已經(jīng)引起了各軍事強(qiáng)國的廣泛關(guān)注。UCAV的出現(xiàn),標(biāo)志著無人機(jī)將從過去一直執(zhí)行空中偵察、戰(zhàn)場監(jiān)視和戰(zhàn)斗毀傷評估等任務(wù)的作戰(zhàn)支援裝備,上升為能執(zhí)行壓制敵防空系統(tǒng)、對地攻擊、攔截戰(zhàn)術(shù)導(dǎo)彈和巡航導(dǎo)彈,甚至可執(zhí)行空對空作戰(zhàn)任務(wù)的真正的作戰(zhàn)裝備。要實(shí)現(xiàn)壓制、攻擊、攔截甚至空對空作戰(zhàn),就必須要求UCAV具有自主戰(zhàn)術(shù)決策的能力。自主戰(zhàn)術(shù)決策是指無人機(jī)自主地評估戰(zhàn)場態(tài)勢,根據(jù)一定的空戰(zhàn)規(guī)則和推理機(jī)制生成機(jī)動(dòng)控制指令,控制UCAV的戰(zhàn)術(shù)動(dòng)作,從而達(dá)到自主戰(zhàn)術(shù)決策進(jìn)行作戰(zhàn)的目的。未來戰(zhàn)場將更加智能化和信息化,而對于無人機(jī)來說,提高其智能化水平,使其能夠自主地進(jìn)行戰(zhàn)術(shù)決策顯得尤為重要[1],因此,研究UCAV自主決策控制技術(shù)意義深遠(yuǎn)。
目前對于空戰(zhàn)決策的研究,一般分為傳統(tǒng)方法和智能方法兩類。對于傳統(tǒng)的方法,多采用微分對策的方法進(jìn)行雙機(jī)追逃問題的研究[2],或是進(jìn)行基于飛行員經(jīng)驗(yàn)的專家系統(tǒng)的設(shè)計(jì)[3]等;對于智能方法,有影響圖方法[4]、試探性機(jī)動(dòng)方法[5]等。
本文著重研究UCAV在空戰(zhàn)中如何利用已知的目標(biāo)機(jī)和UCAV的相對態(tài)勢,進(jìn)行有效的在線解算,不斷實(shí)時(shí)地進(jìn)行評估,確定應(yīng)當(dāng)采用何種戰(zhàn)術(shù)動(dòng)作,即如何進(jìn)行自主戰(zhàn)術(shù)決策的問題。首先建立了基于航跡坐標(biāo)系下的UCAV運(yùn)動(dòng)方程,提出了考慮動(dòng)態(tài)延遲的機(jī)動(dòng)控制指令,并對美國NASA提出的7種基本操作動(dòng)作進(jìn)行了定量描述;其次,按照模糊空戰(zhàn)規(guī)則,在每個(gè)周期都進(jìn)行機(jī)動(dòng)決策選擇動(dòng)作,并不斷進(jìn)行威脅評估;最后,設(shè)計(jì)了自主戰(zhàn)術(shù)決策系統(tǒng)。
本文主要研究的是側(cè)重于UCAV航跡特性的自主戰(zhàn)術(shù)決策,這樣,可以忽略短時(shí)間的力矩不平衡引起的飛機(jī)姿態(tài)變化過渡過程,假定飛機(jī)總是處于力矩平衡狀態(tài),因此飛機(jī)的運(yùn)動(dòng)主要取決于飛機(jī)的受力情況。本文根據(jù)UCAV的力方程和質(zhì)心運(yùn)動(dòng)方程,忽略側(cè)滑角的影響,在飛機(jī)航跡坐標(biāo)系下建立的飛機(jī)的3DOF質(zhì)點(diǎn)模型。
1)力的方程。
式中:nx,ny,γs分別為飛機(jī)的切向過載、法向過載和繞速度軸的滾轉(zhuǎn)角;V,θ,ψs分別為UCAV速度大小、航跡傾斜角、航向角;g為重力加速度。值得說明的一點(diǎn)是,在考慮飛機(jī)3DOF模型時(shí),滾轉(zhuǎn)角γs是沒有實(shí)際意義的,此時(shí)的γs是指繞速度軸的滾轉(zhuǎn)角。
由于nx和ny都是在氣流坐標(biāo)系下定義的,而在以上建立力的方程時(shí),采用的是航跡坐標(biāo)系,所以,必須把nx和ny從氣流坐標(biāo)系轉(zhuǎn)化到航跡坐標(biāo)系,其變換矩陣為
將式(2)代入式(1),得到飛機(jī)在航跡坐標(biāo)系下的飛機(jī)力方程為
2)質(zhì)心運(yùn)動(dòng)方程。
對于航跡特性的描述,可以采用飛機(jī)上某點(diǎn)的速度矢量V特性(包括速度的大小和方向),因此對飛機(jī)航跡特性的控制,也就是對飛機(jī)速度矢量V=(V,θ,ψs)的控制。其中:V為速度的大小;θ為航跡傾斜角;ψs為對應(yīng)速度矢量的航向角。
從式(1)和式(4)可以看出,只要已知 nx,ny,γs三個(gè)量,通過數(shù)值積分能求出UCAV的位置和速度,根據(jù)解算出的UCAV的位置速度信息,以及其探測到的敵機(jī)的位置速度信息,可以確定UCAV與敵機(jī)的相對位置和速度信息,從而評估敵機(jī)對UCAV的威脅指數(shù)。因此,本文采用nx,ny,γs作為UCAV的機(jī)動(dòng)控制指令。因?yàn)閁CAV機(jī)動(dòng)控制存在動(dòng)態(tài)延遲,在機(jī)動(dòng)控制指令生成環(huán)節(jié)中加入延遲環(huán)節(jié),如下
式中:τx,τy分別為 nx和 ny的延遲時(shí)間常數(shù);nxcom,nycom,γscom為期望機(jī)動(dòng)控制指令;ωn為自然震蕩頻率;ξ為阻尼系數(shù)。
本文采用美國NASA提出的基本操縱動(dòng)作庫作為自主戰(zhàn)術(shù)決策的候選范圍[6],如圖1所示。
圖1 基本操縱動(dòng)作庫示意圖Fig.1 Schematic diagram of basic manipulation database
基本操作動(dòng)作庫以常用空戰(zhàn)操縱方式為依據(jù)設(shè)計(jì),包括7種機(jī)動(dòng)動(dòng)作:1)定常保持飛行;2)最大加力加速;3)最大加力減速;4)最大過載左轉(zhuǎn);5)最大過載右轉(zhuǎn);6)最大過載上升;7)最大過載俯沖。
對于基本操縱動(dòng)作庫的實(shí)現(xiàn),采用航跡坐標(biāo)系下的機(jī)動(dòng)動(dòng)作指令nx,ny,γs來實(shí)現(xiàn),如表1所示。列出了7種基本動(dòng)作與其相對應(yīng)的機(jī)動(dòng)控制指令,作為自主戰(zhàn)術(shù)決策的候選動(dòng)作庫。
表1 基本操縱動(dòng)作相應(yīng)機(jī)動(dòng)控制指令Table 1 Maneuver control command of basic manipulation database
研究UCAV自主戰(zhàn)術(shù)決策的目的:賦予UCAV更高的智能性,使其具有更強(qiáng)的自主性,可以獨(dú)立地應(yīng)對突發(fā)事件,自主進(jìn)行戰(zhàn)術(shù)決策,完成從偵察監(jiān)視到空戰(zhàn)打擊的戰(zhàn)場任務(wù),從而最大程度地解放操作員,讓操作員能夠從事更加上層的工作,或者同時(shí)操縱多架UCAV,提高戰(zhàn)場效率[7]。
駕駛員操縱飛機(jī)時(shí),可以把駕駛員理解為一個(gè)智能模塊,該模塊是在對敵機(jī)和我機(jī)位置和速度預(yù)測的基礎(chǔ)上,做出合理的分析判斷,在現(xiàn)有的經(jīng)驗(yàn)戰(zhàn)術(shù)動(dòng)作知識庫中,采取某一戰(zhàn)術(shù)機(jī)動(dòng),達(dá)到保持優(yōu)勢、消滅敵機(jī)的目的[8-10]。對于UCAV我們完全可以仿照有人機(jī)的控制過程結(jié)構(gòu),圖2中用“自主戰(zhàn)術(shù)決策模塊”代替駕駛員,進(jìn)行有效的戰(zhàn)術(shù)決策,進(jìn)而生成機(jī)動(dòng)控制指令,控制UCAV完成機(jī)動(dòng)動(dòng)作?;谝陨戏治?,提出UCAV空戰(zhàn)自主戰(zhàn)術(shù)決策結(jié)構(gòu),如圖2所示。
圖2 UCAV空戰(zhàn)自主戰(zhàn)術(shù)決策結(jié)構(gòu)示意圖Fig.2 Structure of UCAV's autonomous tactical decision-making in air combat
圖2 中,“相對態(tài)勢解算”提供“自主戰(zhàn)術(shù)決策模塊”所需的態(tài)勢信息,“自主戰(zhàn)術(shù)決策模塊”輸出機(jī)動(dòng)控制指令,控制UCAV完成機(jī)動(dòng),整個(gè)控制模塊是一個(gè)閉環(huán)系統(tǒng),不斷進(jìn)行解算更新,達(dá)到最優(yōu)的目的。
自主戰(zhàn)術(shù)決策模塊的內(nèi)部結(jié)構(gòu)如圖3所示?!皺C(jī)動(dòng)觸發(fā)器”根據(jù)“決策推理規(guī)則”產(chǎn)生結(jié)果,從基本操縱動(dòng)作庫中選擇機(jī)動(dòng)動(dòng)作。其中,“決策推理規(guī)則”按照模糊控制[11]的規(guī)則遍歷7種基本操縱動(dòng)作。該模塊是在雙機(jī)相對態(tài)勢解算完成的情況下,不斷進(jìn)行完全嘗試選擇最優(yōu)的結(jié)果。
自主戰(zhàn)術(shù)決策模塊的核心是“決策推理規(guī)則”環(huán)節(jié),本文采用模糊控制的思想,提出在空戰(zhàn)中起主導(dǎo)作用的4個(gè)模糊因子,作為決策推理的構(gòu)成因子,把空戰(zhàn)中基于專家知識或駕駛員長期積累的經(jīng)驗(yàn),轉(zhuǎn)化為具有實(shí)際意義的模糊控制規(guī)則。從量化比較的角度,不斷在線更新數(shù)據(jù),實(shí)時(shí)引導(dǎo)UCAV機(jī)動(dòng)決策,使得機(jī)動(dòng)的結(jié)果對UCAV更加有利,占取優(yōu)勢區(qū)域,爭得有利攻擊時(shí)機(jī)。
圖3 UCAV自主戰(zhàn)術(shù)決策模塊Fig.3 Module of autonomous tactical decision-making
“決策推理規(guī)則”由角度模糊因子μA、距離模糊因子μD、高度模糊因子μH以及速度模糊因子μV組成,對于每種模糊因子,根據(jù)其不同的物理意義,選擇不同的計(jì)算方法,但是,計(jì)算的目的都是把該模糊因子化為0~1的閉區(qū)間內(nèi)的數(shù)值,數(shù)值越是接近1,則該模糊因子對于UCAV更具有優(yōu)勢。本文以下標(biāo)p表示UCAV,以下標(biāo)e表示敵機(jī),下面分別給出表達(dá)式,并對相應(yīng)的符號作以說明。
1)角度模糊因子L。
角度模糊因子μA由式(6)~式(9)可計(jì)算,圖4a給出了μA和αp之間的關(guān)系圖,αp是矢量R和Vp之間的夾角,如圖4b所示。
圖4 角度模糊因子示意圖Fig.4 Schematic diagram of fuzzy aspect factor
其中:xp,yp,zp為 UCAV 的位置坐標(biāo);xe,ye,ze為敵機(jī)的位置坐標(biāo);R為雙機(jī)距離矢量;Vp為UCAV的速度矢量;Vp為UCAV的速度矢量大小??煽闯?,當(dāng)αp=π時(shí),UCAV速度矢量直接指向敵機(jī),優(yōu)勢最大;當(dāng)αp=0時(shí),UCAV速度矢量背離敵機(jī),優(yōu)勢最小。同時(shí)值得說明的一點(diǎn)是,角度模糊因子在4個(gè)模糊因子中的影響最大,所以在后面的規(guī)則中,對角度模糊因子做了閥值處理。
2)距離模糊因子。
距離模糊因子μD由式(10)~式(11)可計(jì)算,圖5給出了μD和R之間的關(guān)系,其中:Rm為UCAV的最佳射擊距離;δ為標(biāo)準(zhǔn)方差;R是矢量R的大小,采用正態(tài)分布來計(jì)算距離模糊因子μD,是因?yàn)檫@樣能更好地反映雙機(jī)距離與最佳射擊距離之間的關(guān)系:一方面,從數(shù)學(xué)的角度說明,并非是距離越小越好;另一方面,也說明距離的變化對UCAV的優(yōu)勢影響并非是線性的。
圖5 距離模糊因子示意圖Fig.5 Schematic diagram of fuzzy distance factor
3)高度模糊因子。
高度模糊因子μH由式(12)可計(jì)算,圖6給出了μH和z之間的關(guān)系,其中:Ho為UCAV的最小極限高度,如果UCAV的高度小于最小極限高度,則UCAV處于危險(xiǎn)區(qū)域,如果UCAV的高度大于最小極限高度,則UCAV處于優(yōu)勢位置,采用分段函數(shù)來描述。
圖6 高度模糊因子示意圖Fig.6 Schematic diagram of fuzzy height factor
4)速度模糊因子。
速度模糊因子μV由式(13)~式(14)可計(jì)算,圖7給出了μV和Vp之間的關(guān)系,其中:Ve為敵機(jī)速度矢量大小;Vmax為UCAV的最大速度;Vo為UCAV的最佳攻擊速度。如前所述,Rm為UCAV的最佳射擊距離。對于速度模糊因子的描述,既借鑒了距離模糊因子μD的正態(tài)分布描述,又借鑒了高度模糊因子μH的分段函數(shù)法。
至此,UCAV空戰(zhàn)中的4個(gè)模糊因子描述完成,這樣就可以用4個(gè)模糊因子的函數(shù)來不斷地分析采用各種動(dòng)作所產(chǎn)生的效果的優(yōu)劣,也就是試探性地執(zhí)行基本操縱動(dòng)作庫的各種動(dòng)作,把4個(gè)模糊因子的函數(shù)作為目標(biāo)函數(shù),進(jìn)行比較,從而獲取最優(yōu)的戰(zhàn)術(shù)動(dòng)作。
圖7 速度模糊因子示意圖Fig.7 Schematic diagram of fuzzy velocity factor
本文這樣獲得最優(yōu)基本動(dòng)作:首先,預(yù)測出雙機(jī)的位置和速度信息,作為“決策推理規(guī)則”的輸入信息;其次,分別計(jì)算在當(dāng)前狀態(tài)下執(zhí)行7種基本動(dòng)作后,以上 4 個(gè)模糊因子 μAi,μDi,μHi,μVi的大小;然后,確定每種基本動(dòng)作下的4個(gè)模糊因子的最小值,并記為μi;最后,找出μi中的最大值,選擇相應(yīng)的機(jī)動(dòng)動(dòng)作執(zhí)行。
以上描述,采用下面的數(shù)學(xué)函數(shù)實(shí)現(xiàn)。
其中:μAT是角度模糊因子閥值,因?yàn)榻嵌饶:蜃釉诳諔?zhàn)中起更重要的作用,所以是μAi<μAT,不再取4個(gè)模糊因子中的最小值,而是把角度模糊因子直接作為比較的因素。
為了驗(yàn)證本文提出的UCAV空戰(zhàn)自主決策系統(tǒng),選擇參數(shù)進(jìn)行仿真實(shí)驗(yàn),選擇時(shí)間常數(shù)τx=0.2 s,τy=1.2 s,自然振蕩頻率 ωn=6.34 rad/s,阻尼系數(shù) ξ=0.707,UCAV最佳攻擊距離Rm=600 m,標(biāo)準(zhǔn)方差σ=600,UCAV最大速度 Vmax=304 m/s,UCAV最小高度極限Ho=1550 m,角度因子閥值μAT=0.5,控制指令仿真時(shí)間常數(shù)T=0.5 s。
取 UCAV 的位置矢量P=(x,y,z)為(3032,0,1535),速度矢量V=(V,θ,ψs)為(205,0,0);敵機(jī)的位置矢量為(3032,3047,1535),速度矢量為(205,0.52,2.62),其中,速度矢量V中的θ和ψs是用rad表示的,敵機(jī)的速度矢量的角度用“°”來表示,分別是30°和150°,在仿真中假設(shè)敵機(jī)作轉(zhuǎn)彎半徑為250 m的戰(zhàn)斗轉(zhuǎn)彎(在轉(zhuǎn)彎的過程中不斷地爬升)。
仿真實(shí)驗(yàn)結(jié)果如圖8~圖10所示。圖8是雙方空戰(zhàn)運(yùn)動(dòng)軌跡,圖9是在空戰(zhàn)過程中模糊因子的變化曲線,圖10是機(jī)動(dòng)控制指令的變化曲線。
圖8 UCAV空戰(zhàn)雙機(jī)的運(yùn)動(dòng)軌跡Fig.8 The trajectories of UCAV in air combat
圖9 模糊因子變化仿真結(jié)果Fig.9 Simulation results of fuzzy factors
圖10 機(jī)動(dòng)控制指令變化仿真結(jié)果Fig.10 Simulation results of maneuver control command
從仿真結(jié)果可以看出,UCAV自主戰(zhàn)術(shù)決策系統(tǒng)性能良好,在最優(yōu)機(jī)動(dòng)控制指令的作用下能夠很好地完成UCAV自主戰(zhàn)術(shù)決策,使UCAV取得空戰(zhàn)優(yōu)勢,進(jìn)行攻擊。
本文在考慮延遲的機(jī)動(dòng)指令的基礎(chǔ)上,設(shè)計(jì)了UCAV空戰(zhàn)自主戰(zhàn)術(shù)決策系統(tǒng)。從仿真結(jié)果可以看出,UCAV能夠依據(jù)當(dāng)前的敵我態(tài)勢,及時(shí)作出正確的機(jī)動(dòng)方案決策,使我方擁有很大的作戰(zhàn)效益優(yōu)勢。系統(tǒng)的設(shè)計(jì)在未來UCAV空戰(zhàn)特別是近距空戰(zhàn)中具有重要的意義。另外,本文從基于美國NASA提出的基本操作動(dòng)作庫對UCAV的自主戰(zhàn)術(shù)決策系統(tǒng)進(jìn)行了設(shè)計(jì),在實(shí)際應(yīng)用系統(tǒng)的設(shè)計(jì)中,還需要考慮怎樣選擇合理的機(jī)動(dòng)動(dòng)作庫。
[1] 陳小兵,常勇,孔繁峨.近距格斗自主決策研究[J].電光與控制,2009,16(4):34-37.
[2] NUSYIRWAN I F,BIL C.Factorial analysis of a real time optimisation for pursuit-evasion problem[C]//46th AIAA Aerospace Sciences Meeting and Exhibit,2008:195-198.
[3] 鐘友武,柳嘉潤,楊凌宇,等.自主近距空戰(zhàn)中機(jī)動(dòng)動(dòng)作庫及其綜合控制系統(tǒng)[J].航空學(xué)報(bào),2008,29(5):114-121.
[4] 鐘麟,佟明安,鐘衛(wèi),等.多級影響圖在空戰(zhàn)機(jī)動(dòng)決策中的應(yīng)用[J].系統(tǒng)工程理論與實(shí)踐,2006,26(10):137-140.
[5] 柳嘉潤,鐘友武,張磊,等.自主空戰(zhàn)決策的試探機(jī)動(dòng)方法及仿真研究[J].系統(tǒng)仿真學(xué)報(bào),2008,20(5):1238-1243.
[6] YANG C D,KUNG C C.Implement the one-on-one air combat simulation using prediction of optimal maneuver[J].Trans aeronautical and astronautical society of the Republic of China,1998,30(2):149-159.
[7] 董卓寧,張汝麟,陳宗基.無人機(jī)在惡劣氣象條件下的自主決策技術(shù)[J].航空學(xué)報(bào),2007,29(5):107-113.
[8] STEVENS B L.Aircraft control and simulation[M].2nd ed.USA:John wiley & sons,2003.
[9] 柳嘉潤.綜合控制系統(tǒng)與自主近距格斗技術(shù)研究[D].北京:北京航空航天大學(xué),2006.
[10] 楊暉.無人作戰(zhàn)飛機(jī)自主控制技術(shù)研究[J].無人機(jī),2007(1):27-29.
[11] 劉金琨.智能控制[M].北京:國防工業(yè)出版社,2005:36-43.