趙彬, 周中良, 謝新輝, 李飛, 江建成
(1.空軍工程大學(xué) 航空航天工程學(xué)院, 陜西 西安 710038;2.空軍西安飛行學(xué)院 理訓(xùn)系, 陜西 西安 710300)
?
基于RHC-GCPSO的末端規(guī)避軌跡最優(yōu)控制方法
趙彬1, 周中良1, 謝新輝1, 李飛2, 江建成1
(1.空軍工程大學(xué) 航空航天工程學(xué)院, 陜西 西安 710038;2.空軍西安飛行學(xué)院 理訓(xùn)系, 陜西 西安 710300)
針對傳統(tǒng)典型末端規(guī)避戰(zhàn)術(shù)實(shí)時性低、操作難度大和規(guī)避效果差等缺點(diǎn),研究了一種實(shí)時指令控制的戰(zhàn)斗機(jī)末端規(guī)避戰(zhàn)術(shù)軌跡控制方法;分析了增大脫靶量的末端規(guī)避原理,在以導(dǎo)彈為原點(diǎn)的球坐標(biāo)系下建立了導(dǎo)彈與戰(zhàn)斗機(jī)的相對運(yùn)動模型;結(jié)合戰(zhàn)斗機(jī)動力學(xué)模型,建立了脫靶量末端規(guī)避數(shù)學(xué)模型;選取脫靶量為優(yōu)化指標(biāo),建立了戰(zhàn)術(shù)軌跡最優(yōu)控制指令模型;提出了滾動關(guān)聯(lián)粒子群算法并對該模型進(jìn)行求解,得到了戰(zhàn)斗機(jī)的最優(yōu)戰(zhàn)術(shù)機(jī)動控制指令;通過仿真,對比了滾動關(guān)聯(lián)粒子群與粒子群、混沌粒子群三種算法對最優(yōu)控制指令模型求解的結(jié)果,驗(yàn)證了該算法的優(yōu)越性。
末端規(guī)避; 脫靶量; 控制指令; 滾動時域控制
末端規(guī)避是戰(zhàn)斗機(jī)通過戰(zhàn)術(shù)機(jī)動規(guī)避來襲導(dǎo)彈,阻止戰(zhàn)斗機(jī)被導(dǎo)彈命中,達(dá)到提高其生存率,實(shí)現(xiàn)“保己”的目的[1-2]。目前國內(nèi)對于戰(zhàn)斗機(jī)末端防御來襲導(dǎo)彈攻擊的技術(shù)還不成熟,尤其是在實(shí)際訓(xùn)練中沒有實(shí)踐,而當(dāng)飛行員遇到此類問題時,只能通過自己的臨場發(fā)揮去處理。文獻(xiàn)[3-4]建立了戰(zhàn)斗機(jī)機(jī)動規(guī)避的微分動態(tài)規(guī)劃模型,并對該模型進(jìn)行前、后向積分的推導(dǎo)求解,得到戰(zhàn)斗機(jī)機(jī)動規(guī)避的最優(yōu)機(jī)動軌跡。文獻(xiàn)[5]探索性地研究了在兩枚導(dǎo)彈來襲的情況下戰(zhàn)斗機(jī)的末端規(guī)避問題,建立了戰(zhàn)斗機(jī)規(guī)避優(yōu)化解算模型,提出了基于最速下降法對其進(jìn)行優(yōu)化解算的方法。文獻(xiàn)[6]針對未知來襲導(dǎo)彈導(dǎo)引律的情況,提出了一套新的方法研究最優(yōu)的規(guī)避路徑。文獻(xiàn)[7]對無人機(jī)規(guī)避攻擊進(jìn)行了研究,以威力勢為目標(biāo)函數(shù),將規(guī)避決策問題視為威力勢的增減問題。文獻(xiàn)[8-9]基于NMPC的思想,對戰(zhàn)斗機(jī)末端規(guī)避策略進(jìn)行了閉環(huán)求解,得到了最優(yōu)的規(guī)避軌跡??諔?zhàn)中,如何在提升戰(zhàn)斗力的同時提高飛機(jī)在導(dǎo)彈威脅下的生存力成為了各國專家和飛行員較為關(guān)注的問題。為進(jìn)一步提高規(guī)避效果,克服傳統(tǒng)典型末端規(guī)避戰(zhàn)術(shù)的實(shí)時性低、操作難度大和規(guī)避效果差等缺點(diǎn),本文建立了導(dǎo)彈和戰(zhàn)斗機(jī)的交互模型,對大過載機(jī)動進(jìn)行了定量分析與研究,并指出了典型末端規(guī)避機(jī)動戰(zhàn)術(shù)的缺點(diǎn)。以最大化脫靶量為性能指標(biāo),通過建立戰(zhàn)斗機(jī)最優(yōu)規(guī)避控制模型,提出了基于滾動時域的灰色關(guān)聯(lián)混沌粒子群優(yōu)化決策算法(RHC-GCPSO),對該最優(yōu)控制模型進(jìn)行了閉環(huán)實(shí)時解算,并通過仿真驗(yàn)證了此方法的有效性。
導(dǎo)引律未知時,戰(zhàn)斗機(jī)末端規(guī)避軌跡設(shè)計(jì)問題本質(zhì)上是兩端受約束的路徑引導(dǎo)問題,通常采用的解決方法是微分對策理論,這類問題過于復(fù)雜。本文假設(shè)導(dǎo)彈為PN制導(dǎo),確定了導(dǎo)彈導(dǎo)引律,則可以將此問題看作為單邊最優(yōu)控制問題[5]。
1.1地理坐標(biāo)系下的運(yùn)動模型
(1)導(dǎo)彈運(yùn)動模型
(1)
式中:vm為導(dǎo)彈的速度;θm為導(dǎo)彈的俯仰角,導(dǎo)彈抬頭為正;φm為導(dǎo)彈的偏航角,逆時針為正;nmd和nmt分別為導(dǎo)彈的俯仰過載和偏航過載;Tm(t)和Dm分別為導(dǎo)彈的推力和所受的空氣阻力。
(2)戰(zhàn)斗機(jī)運(yùn)動模型
(2)
式中:vf為戰(zhàn)斗機(jī)的速度;θf和φf分別為戰(zhàn)斗機(jī)的航跡俯仰角和航跡偏航角;αf,μf和ηf為控制量,分別為戰(zhàn)斗機(jī)的迎角、滾轉(zhuǎn)角和油門大小,且ηf∈[0,1];Lf為升力;Tfmax為戰(zhàn)斗機(jī)的最大推力;Df為空氣阻力;mf為戰(zhàn)斗機(jī)的質(zhì)量。
1.2球坐標(biāo)系下的相對運(yùn)動模型
圖1給出了導(dǎo)彈和戰(zhàn)斗機(jī)的態(tài)勢幾何關(guān)系。圖中,M表示導(dǎo)彈,F表示戰(zhàn)斗機(jī);Oxeyeze為“北-天-東”地理坐標(biāo)系,Fxfyfzf為以F為原點(diǎn)的飛機(jī)坐標(biāo)系;(u,υ)為相對俯仰角和相對偏航角,r為相對距離,h為相對高度差。
圖1 導(dǎo)彈與戰(zhàn)斗機(jī)的幾何關(guān)系圖Fig.1 The geometric relationship between missile and fighter
直角坐標(biāo)系下M與F的相對運(yùn)動模型為:
(3)
式中:xr,yr及zr分別為導(dǎo)彈與戰(zhàn)斗機(jī)的相對水平距離、相對高度和相對側(cè)向距離。
根據(jù)直角坐標(biāo)系到球坐標(biāo)系(以M為球心)的轉(zhuǎn)換原理,可以得到:
(4)
高度差為:
(5)
綜合式(4)和式(5)及戰(zhàn)斗機(jī)動力學(xué)模型,可得到增大脫靶量末端的規(guī)避模型為:
(6)
2.1最優(yōu)控制模型
戰(zhàn)斗機(jī)規(guī)避時的戰(zhàn)術(shù)軌跡最優(yōu)控制指令模型可以由下式描述[4,9]:
(7)
2.2性能指標(biāo)
考慮導(dǎo)彈過載限制和戰(zhàn)斗機(jī)的飛行參數(shù)、控制量的限制,選定脫靶量為優(yōu)化性能指標(biāo)。脫靶量為接近速度為零時戰(zhàn)斗機(jī)與導(dǎo)彈之間的相對距離[4]。戰(zhàn)斗機(jī)在末端規(guī)避時,應(yīng)使導(dǎo)彈脫靶量越大越好,因此可以選擇脫靶量為優(yōu)化指標(biāo):
(8)
在終端時刻,可以認(rèn)為導(dǎo)彈與戰(zhàn)斗機(jī)的相對速度vc等于零,即:
(9)
指令實(shí)時解算方法
本文引入了RHC[4]方法。在RHC的架構(gòu)上,基于GAD[5]和CO對PSO算法[10]進(jìn)行了改進(jìn),提出了RHC-GCPSO算法,該算法能夠大大提高計(jì)算效率,克服GAD-COPSO實(shí)時性不高等缺點(diǎn)。
3.1控制量的編碼
采用十進(jìn)制對戰(zhàn)斗機(jī)的控制量u(t)=[αf,μf,ηf]T進(jìn)行編碼,每個粒子的位置信息對應(yīng)一個6位數(shù)的數(shù)字串,初始的控制量[αf1,μf1,ηf1]T分別對應(yīng)C1,C2和C3,迭代后的控制量[αf2,μf2,ηf2]T分別對應(yīng)C4,C5和C6。
根據(jù)戰(zhàn)斗機(jī)編碼的規(guī)則和PSO算法位置的更新公式,可以得到控制量與對應(yīng)編碼的轉(zhuǎn)換公式。以μf為例,相應(yīng)的轉(zhuǎn)換方程可以表示為:
(10)
式中:Δμfmax為最大滾轉(zhuǎn)角變化率;k為迭代次數(shù)(k=1,2,…,n)。同理,可以得到αf和ηf的轉(zhuǎn)換公式。
3.2飛行控制量的求解
由于ηf不能用角度來表示,可以用當(dāng)前狀態(tài)的推力系數(shù)作為參考,故在對飛行控制量進(jìn)行求解時對ηf不加限制,下面對控制量進(jìn)行推導(dǎo)。由于:
(11)
(12)
(13)
將式(13)代入式(12),可得偏航角變化率的表達(dá)式為:
(14)
(15)
賦予αf,μf,φf,θf一定的初值,通過5階龍格-庫塔法就能夠解算出當(dāng)前態(tài)勢下控制量αf,μf與姿態(tài)角φf,θf之間的關(guān)系,并由此可以建立當(dāng)前態(tài)勢下αf,μf與φf,θf之間關(guān)系的數(shù)據(jù)庫,方便后期求解時調(diào)用。
3.3不可行解的拯救策略
為簡化計(jì)算方法,對不可行解進(jìn)行拯救時考慮到戰(zhàn)斗機(jī)的控制約束范圍αfmin≤αf≤αfmax和μfmin≤μf≤μfmax,當(dāng)αf和μf的可行解都為正時,設(shè)Π(u)為可行解,此時不可行域可以表示為:
(16)
拯救的粒子集合C(u)可以表示為:
(17)
將集合C(u)中的粒子加入到搜索空間內(nèi),增加粒子的活性,以便取得更加優(yōu)異的全局最優(yōu)解。在每次迭代中,對于不在可行域內(nèi)的粒子需要作以下處理:
(1)判斷粒子Xi,若不在不可行域內(nèi),則進(jìn)入更新極值;若在,則轉(zhuǎn)入下一步繼續(xù)處理;
(2)判斷Xi是否在拯救集合C(u)內(nèi),若在,則對其進(jìn)行保留;反之舍棄。
下面通過數(shù)字仿真,驗(yàn)證RHC-GCPSO算法的有效性。首先給定典型的作戰(zhàn)場景:敵方一枚中遠(yuǎn)距半主動雷達(dá)制導(dǎo)空空導(dǎo)彈對我機(jī)進(jìn)行攔截,并采用比例導(dǎo)引進(jìn)行制導(dǎo)。初始態(tài)勢為:戰(zhàn)斗機(jī)初始參數(shù):(xf0,yf0,zf0)=(10,5.5,2) km,vf0=350 m/s,(θf0,φf0)=(30°,20°) ;導(dǎo)彈初始參數(shù):(xm0,ym0,zm0)=(0,4.5,0) km,vm0=1 200 m/s,(θm0,φm0)=(30°,20°);載機(jī)的控制量初值取[αf0,μf0,ηf0]=[5°,10°,0.8]。根據(jù)式(4)和式(5)可求得r0,u0,υ0,h0。
某型中遠(yuǎn)距半主動雷達(dá)制導(dǎo)空空導(dǎo)彈的性能參數(shù)為:nmmax=40,K=3,τm=0.2 s,CD0=0.4,CL=2,Km=0.08,tmax=28 s。
設(shè)定仿真時間為30 s,戰(zhàn)斗機(jī)初始規(guī)避時刻為零時刻,最大可規(guī)避時間Tm=28 s,RHC時域窗口取為T=2 s。取粒子總數(shù)為60,慣性權(quán)值ω=0.5,最大迭代次數(shù)50,加速因子N1=N2=2。仿真結(jié)果如圖2~圖7所示。
圖2 基于PSO的運(yùn)動軌跡Fig.2 The trajectories based on PSO
圖3 基于COPSO的運(yùn)動軌跡Fig.3 The trajectories based on COPSO
圖4 基于RHC-GCPSO的運(yùn)動軌跡Fig.4 The trajectories based on RHC-GCPSO
圖5 迎角的變化Fig.5 Variation of angle of attack
圖6 滾轉(zhuǎn)角的變化Fig.6 Variation of roll angle
圖7 油門桿的變化Fig.7 Variation of throttle lever
由圖2~圖4可以看出,基于PSO,COPSO及RHC-GCPSO三種優(yōu)化算法求解的結(jié)果均表明戰(zhàn)斗機(jī)最終能夠完成規(guī)避任務(wù),三種算法解算的終端脫靶量分別為36.05 m,55.16 m,75.89 m,完成規(guī)避的時間分別為22.5 s,23.3 s,24.5 s。規(guī)避軌跡呈現(xiàn)先爬升、后下降的變化趨勢,符合實(shí)際空戰(zhàn)情景。
由圖5和圖6可以看出,戰(zhàn)斗機(jī)的迎角指令呈現(xiàn)來回振蕩的變化趨勢,基于PSO算法解算的振蕩趨勢最大,其次為COPSO,RHC-GCPSO的振蕩最小;戰(zhàn)斗機(jī)的滾轉(zhuǎn)角變化曲線出現(xiàn)輕微振蕩,整體呈現(xiàn)向負(fù)方向增大的變化趨勢。
由圖7可以看出,三種算法得出的戰(zhàn)斗機(jī)油門桿指令均處于最大位置上,表明戰(zhàn)斗機(jī)一直以最大加力狀態(tài)在執(zhí)行規(guī)避任務(wù),這樣不斷提高載機(jī)的能量,也在不斷消耗著導(dǎo)彈的能量。
(1)本文研究的基于增大脫靶量的戰(zhàn)斗機(jī)末端規(guī)避軌跡最優(yōu)控制方法是有效的,提出的基于RHC-GCPSO的算法經(jīng)仿真驗(yàn)證也是有效的。
(2)基于RHC-GCPSO的方法增加了粒子活性,擴(kuò)大了可行域的解空間,與其他兩種算法比較,得到的終端脫靶量最大。
(3)由于RHC-GCPSO解算步驟最為繁瑣,在尋優(yōu)進(jìn)程中所消耗的時間最長,但其解算更為精確,更加貼近實(shí)際情況,規(guī)避效果更好,所得到的戰(zhàn)斗機(jī)控制指令更加真實(shí)。
[1]賈秋銳,孫媛媛,鐘詠兵.空空導(dǎo)彈發(fā)展趨勢[J].飛航導(dǎo)彈,2012(7):29-42.
[2]李飛.先進(jìn)戰(zhàn)斗機(jī)規(guī)避決策與控制技術(shù)研究[D].西安:空軍工程大學(xué),2014.
[3]Tal Shima.Cooperative evasion and pursuit for aircraft protection[R].Haifa,Israel:Technion Research and Development Foundation Limited,Israel Institute of Technology,2012.
[4]Tal Shima.Optimal cooperative pursuit and evasion strategies against a homing missile[J].Journal of Guidance,Control,and Dynamics,2011,34(2):414-425.
[5]Fumiaki Imado,Akeshi Kuroda.Engagement tactics for two missiles against an optimally maneuvering aircraft[J].Journal of Guidance,Control,and Dynamics,2011,34(2):574-582.
[6]胡安輝,鄭濤,朱石剛.未知導(dǎo)引律導(dǎo)彈攻擊情況下的規(guī)避路徑[J].彈箭與制導(dǎo)學(xué)報(bào),2010,30(3):32-34.
[7]劉杰,張健,李世曉,等.基于三維空間的無人機(jī)規(guī)避攻擊導(dǎo)引設(shè)計(jì)[J].電光與控制,2014,21(4):34-37.
[8]李飛,于雷,周中良,等.戰(zhàn)斗機(jī)末端機(jī)動的非線性模型預(yù)測控制規(guī)避策略[J].國防科技大學(xué)學(xué)報(bào),2014,36(3):83-90.
[9]于雷,付昭旺,李戰(zhàn)武,等.目標(biāo)威脅規(guī)避約束下戰(zhàn)斗機(jī)引導(dǎo)控制優(yōu)化方法[J].北京航空航天大學(xué)學(xué)報(bào),2014,40(2):229-234.
[10]Janne Karelahti,Kai Virtanen,Tuomas Raivio.Near-optimal missile avoidance trajectories via receding horizon control[J].Journal of Guidance,Control,and Dynamics,2007,30(5):1287-1298.
(編輯:姚妙慧)
The model of terminal avoidance trajectory optimal control based on RHC-GCPSO
ZHAO Bin1, ZHOU Zhong-liang1, XIE Xin-hui1, LI Fei2, JIANG Jian-cheng1
(1.Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi’an 710038, China;2.Theory Training Department, Air Force Xi’an Flight College, Xi’an 710300, China)
For the poor real-time performance, difficult operation and bad effect of traditional terminal avoidance tactics, this paper studied a tactical track real-time control method of fighter. The terminal avoidance theory of increasing miss distance was analyzed and a relative motion model of missile and fighter was constructed with the missile as origin in the spherical coordinate system. According to aircraft dynamics model, a mathematical model of miss distance terminal avoidance was established, which was taken as state constraints. A tactical track optimization control command model was built up with the miss distance as the optimization index. The model was solved by Receding Horizon Control-Grey Chaos Particle Swarm Optimization (RHC-GCPSO) algorithm, thus getting the optimal tactical maneuvering control command of the fighter. The advantages of the algorithm were verified by comparing the particle swarm, chaos particle swarm and RHC-GCPSO in simulation.
terminal avoidance; miss distance; control command; receding horizon control
2015-11-09;
2016-03-15; 網(wǎng)絡(luò)出版時間:2016-04-22 09:52
國家自然科學(xué)基金資助(61472441)
趙彬(1991-),男,山東濟(jì)南人,碩士研究生,研究方向?yàn)槲淦飨到y(tǒng)總體技術(shù)與作戰(zhàn)運(yùn)用。
TJ765.3
A
1002-0853(2016)04-0064-05