孟克子, 周 荻
(哈爾濱工業(yè)大學(xué)航天學(xué)院, 黑龍江 哈爾濱 150001)
?
多約束條件下的最優(yōu)中制導(dǎo)律設(shè)計
孟克子, 周荻
(哈爾濱工業(yè)大學(xué)航天學(xué)院, 黑龍江 哈爾濱 150001)
摘要:考慮到三維空間目標(biāo)-導(dǎo)彈相對運動方程的非線性特性以及中制導(dǎo)段的多約束條件,采用Gauss偽譜法設(shè)計了一種多約束條件下的最優(yōu)中制導(dǎo)律,同時考慮了導(dǎo)彈自動駕駛儀的二階動態(tài)特性??紤]的約束條件包括:交班距離、視線角、視線角速率以及過載指令。性能指標(biāo)為剩余飛行時間n次方的倒數(shù)乘以控制輸入的平方的積分。研究結(jié)果表明,在性能指標(biāo)中引入時變權(quán)重系數(shù)時,雖然消耗的燃料有所增加,但是導(dǎo)彈在滿足交班約束條件的同時過載指令能夠收斂至零,利于中末制導(dǎo)的順利交接。
關(guān)鍵詞:多約束; Gauss偽譜法; 最優(yōu)中制導(dǎo)律; 時變權(quán)重系數(shù)
0引言
對于中遠程攔截問題而言,采用“中制導(dǎo)+末制導(dǎo)”的復(fù)合制導(dǎo)體制是常見的做法,如反臨近空間攔截導(dǎo)彈。反臨近空間攔截導(dǎo)彈飛行速度快,易因氣動加熱對導(dǎo)引頭的探測產(chǎn)生干擾。采用側(cè)窗探測導(dǎo)引頭可以避免此問題。為了滿足側(cè)窗探測條件,需要對中末制導(dǎo)交班時刻的視線指向進行約束。視線角約束的其他方面作用還體現(xiàn)在其可保證中末制導(dǎo)段彈道的平滑過渡以及末制導(dǎo)段導(dǎo)彈以最佳角度擊中目標(biāo)以此發(fā)揮戰(zhàn)斗部的最大殺傷效能,例如,針對反艦導(dǎo)彈而言,使導(dǎo)彈以一定角度攻擊目標(biāo)可提高殺傷效果。最后,要求中末制導(dǎo)交班時刻視線角速率趨于零,以保證末制導(dǎo)段導(dǎo)彈準(zhǔn)平行接近目標(biāo)并實現(xiàn)攔截[1]。另外,由于物理約束的存在,導(dǎo)彈可執(zhí)行的過載指令也是有限的。中制導(dǎo)律設(shè)計過程中應(yīng)考慮這些約束條件。
目前,中制導(dǎo)律設(shè)計廣泛采用最優(yōu)控制方法,如文獻[2-7],這些最優(yōu)中制導(dǎo)律的推導(dǎo)可歸結(jié)為基于導(dǎo)彈的質(zhì)點運動方程,求解以中制導(dǎo)段剩余末速最大、控制能量消耗最少(或末端剩余能量最大)和飛行時間最短等為性能指標(biāo),以導(dǎo)彈交班點(包括位置以及彈道角)為終端約束條件的若干最優(yōu)控制問題。其最優(yōu)性條件是非線性的8階(平面攔截)或12階(空間攔截)兩點邊值問題。文獻[2-3]求解兩點邊值問題采用的是最速上升法??紤]到直接求解兩點邊值問題計算量大,難以在彈上實時完成,文獻[4-7]引入了奇異攝動技術(shù),其基于時標(biāo)分離將最優(yōu)制導(dǎo)問題分解為一系列低階子問題,通過求解子問題的最優(yōu)解并將其結(jié)合以得到全階問題的近最優(yōu)解,其中通過邊界層修正來補償慢時標(biāo)解中忽略的快變狀態(tài)變量動態(tài)。上述研究基于導(dǎo)彈交班點可準(zhǔn)確預(yù)測的假設(shè),在制導(dǎo)律設(shè)計中僅考慮了導(dǎo)彈的運動特性。由此,上述中制導(dǎo)律無法控制視線指向及視線角速率。另外,僅文獻[5,7]考慮了過載指令約束條件。
Gauss偽譜法是基于全局Lagrange插值多項式的直接配點方法,其配點為Legendre-Gauss (LG)點,可用于求解帶有動態(tài)約束、邊界條件約束和不等式路徑約束的一般性最優(yōu)控制問題(連續(xù)Bolza問題)。Gauss偽譜法相對其他方法的優(yōu)勢在于求解精度高,收斂速率快,且由Gauss偽譜直接轉(zhuǎn)化而來的非線性規(guī)劃問題(nonlinear programming,NLP)的KKT(Karush-Kuhn-Tucker)條件等價于Gauss偽譜一階最優(yōu)性條件,即Gauss偽譜解的最優(yōu)性在理論上得到了證明[8-11]。目前,Gauss偽譜法廣泛應(yīng)用于軌跡優(yōu)化[10,12-14],也應(yīng)用于航天器編隊[11]。文獻[15]首次將Gauss偽譜法用于中制導(dǎo)律的設(shè)計,但其解決的問題與文獻[5]類似??紤]到Gauss偽譜法適用于處理中制導(dǎo)問題中的多約束條件以及其相對其他優(yōu)化方法的優(yōu)勢,本文采用Gauss偽譜法設(shè)計了一種新的多約束條件下的最優(yōu)中制導(dǎo)律。并且在能量性能指標(biāo)中引入含參變量n的時變權(quán)重系數(shù)。該權(quán)重系數(shù)的引入不僅能夠使導(dǎo)彈滿足交班約束條件,而且能使過載指令在交班時刻接近于零,這有利于中末制導(dǎo)的順利交接。
1問題描述
1.1目標(biāo)-導(dǎo)彈相對運動方程
三維空間中,目標(biāo)-導(dǎo)彈相對運動幾何關(guān)系如圖1所示。M和T分別表示導(dǎo)彈和目標(biāo)的質(zhì)心。坐標(biāo)系Mxyz平行于參考慣性坐標(biāo)系。Mx4y4z4為視線坐標(biāo)系,Mx4軸沿導(dǎo)彈-目標(biāo)視線方向,My4軸垂直于Mx4軸且位于包含視線的鉛錘平面內(nèi)向上為正,Mz4軸與Mx4軸和My4軸滿足右手定則。R表示目標(biāo)-導(dǎo)彈之間的相對距離,qε和qβ分別表示視線仰角和偏角。
圖1 三維空間目標(biāo)-導(dǎo)彈相對運動幾何關(guān)系
目標(biāo)-導(dǎo)彈相對運動方程可表示為
(1)
(2)
(3)
式中,(aTR,aTε,aTβ)、(aMR,aMε,aMβ)分別表示目標(biāo)加速度和導(dǎo)彈加速度在視線坐標(biāo)系Mx4y4z4的3個軸上的分量。
假設(shè)在制導(dǎo)過程中,僅導(dǎo)彈的法向加速度aMε和aMβ可調(diào)節(jié)。若近似導(dǎo)彈自動駕駛儀為二階動態(tài)環(huán)節(jié),則導(dǎo)彈法向加速度響應(yīng)特性表示為
(4)
式中,ζ和ωn分別表示自動駕駛儀二階動態(tài)特性的阻尼比和自然振蕩角頻率;uε和uβ分別為對應(yīng)于aMε和aMβ的制導(dǎo)指令。
1.2多約束條件
(1) 交班距離約束
依據(jù)導(dǎo)引頭的探測距離設(shè)定中末制導(dǎo)交班時刻目標(biāo)-導(dǎo)彈相對距離為Rc,則有
(5)
(2) 視線角約束
設(shè)qε和qβ的期望值分別為qεd和qβd, 則
(6)
(3) 視線角速率約束
中末制導(dǎo)交班時刻要求視線角速率趨于零,以保證末制導(dǎo)段導(dǎo)彈準(zhǔn)平行接近目標(biāo)并實現(xiàn)攔截。于是有
(7)
(4) 過載指令約束
由于物理約束的存在,制導(dǎo)指令滿足
(8)
式中,um表示制導(dǎo)指令的上限值。
1.3性能指標(biāo)
選取能量最優(yōu)性能指標(biāo)
(9)
最后,最優(yōu)中制導(dǎo)律的設(shè)計問題歸結(jié)為:確定uε, uβ和終端時間tf使性能指標(biāo)式(9)達到極小,并滿足動態(tài)約束式(1)~式(4), 邊界約束式(5)~式(7)以及過載指令約束式(8)。
2Gauss偽譜法
Gauss偽譜法求解連續(xù)Bolza問題的思路是通過離散化將連續(xù)Bolza問題轉(zhuǎn)化為NLP, 通過求解NLP來確定原始最優(yōu)問題的解。
2.1連續(xù)Bolza問題
不失一般性,定義在時間區(qū)間[-1,1]上的連續(xù)Bolza問題可以描述為:確定狀態(tài)x(τ)∈Rn,控制u(τ)∈Rm, 初始時刻t0以及終端時刻tf使如下性能指標(biāo)達到極小。
(10)
滿足約束條件
(11)
(12)
(13)
式(10)~式(13)所示的連續(xù)Bolza問題可以通過仿射變換
(14)
從時間區(qū)間τ∈[-1,1]變換到時間區(qū)間t∈[t0,tf]。
2.2Gauss偽譜離散化
Gauss偽譜離散化的思路為:首先,采用Lagrange插值多項式近似狀態(tài)變量和控制變量。其次,將近似狀態(tài)變量在Legendre-Gauss(LG)點處進行配置將動態(tài)約束轉(zhuǎn)化為代數(shù)約束,并將終端狀態(tài)表達為初始狀態(tài)和Gauss積分的形式。進而,采用Gauss積分近似性能指標(biāo)中的積分項從而將其離散化。最后,離散化邊界條件以及路徑約束[9]。
設(shè)τ1,τ2,…,τN為N個嚴格遞增的LG點,其對應(yīng)于N次Legendre多項式PN(τ)的N個零點。同時記τ0=-1和τf=τN+1=1。
采用N+1個Lagrange插值多項式基Li(τ)(i=0,1,…,N)近似狀態(tài)變量x(τ), 得
(15)
(16)
(17)
(18)
式(15)相對時間τ求導(dǎo),得
(19)
(20)
基于微分近似矩陣,動態(tài)約束式(11)可轉(zhuǎn)化為代數(shù)約束
(21)
注意到動態(tài)約束僅在LG點進行了配置。根據(jù)Gauss積分,X(τf)可定義為X(τk)(k=0,1,…,N)和U(τk)(k=1,2,…,N)的形式
(22)
式中,ωk(k=1,2,…,N)表示Gauss權(quán)重。
采用Gauss積分近似性能指標(biāo)中的積分項,連續(xù)性能指標(biāo)式(10)轉(zhuǎn)化為離散形式
(23)
邊界條件式(12)和路徑約束式(13)轉(zhuǎn)化成離散形式分別為
(24)
(25)
至此,離散性能指標(biāo)式(23)與代數(shù)約束式(21)、式(22)、式(24)和式(25)定義了一個NLP。該NLP的解(滿足KKT條件[9])即為連續(xù)Bolza問題的解。
2.3邊界控制
Gauss偽譜法僅在LG點處對控制變量進行離散化。由此,通過求解NLP無法確定邊界控制U(τ0)和U(τf). 采用插值確定邊界控制并不是最好的方法,應(yīng)采用極小值原理來確定U(τ0)和U(τf)[9]。
定義擴展Hamilton函數(shù)
(26)
根據(jù)極小值原理,最優(yōu)控制u*(τ0)可以通過下式確定:
(27)
顯然,要確定u*(τ0), 需要知道x*(τ0),λ*(τ0)和μ*(τ0)。 x*(τ0)和λ*(τ0)的近似解X*(τ0)和Λ*(τ0)可以通過求解NLP得到,但是μ*(τ0)無法確定。因此,定義不含路徑約束的Hamilton函數(shù)
(28)
同時將路徑約束歸入可行性控制集中,即
(29)
式中,U0為τ0時刻的可行性控制集;C0為τ0時刻滿足路徑約束的控制集。
由此,U(τ0)可以通過下式來確定:
(30)
進而,U(τf)可以采用同樣的方法確定。
3仿真結(jié)果
以反臨近空間飛行器X-51和HTV-2為例進行仿真實驗。中末制導(dǎo)交班時刻導(dǎo)彈目標(biāo)相對距離為Rc=80km, 制導(dǎo)控制周期為10ms, 制導(dǎo)指令上限um=3 g, g=9.8m/s2為重力加速度。
Gauss偽譜離散化采用LG點的個數(shù)為N=40。 序列二次規(guī)劃(seqentialquadraticprogramming,SQP)算法證明是求解約束優(yōu)化問題的可靠且有效的方法。由此,經(jīng)Gauss偽譜離散化轉(zhuǎn)換而來的NLP采用SQP算法軟件包SNOPT[16]來求解。
3.1反X-51仿真實驗
表1 反X-51攔截導(dǎo)彈與目標(biāo)初始條件
圖2 反X-51情況下導(dǎo)彈與目標(biāo)飛行彈道
圖3 反X-51情況下的視線角
圖4 反X-51情況下的視線角速率
圖5 反X-51情況下的導(dǎo)彈制導(dǎo)指令
ntf/sΔV/(m/s)n=059.891055.9n=160.071488.6
3.2反HTV-2仿真實驗
表3 反HTV-2攔截導(dǎo)彈與目標(biāo)初始條件
圖6 反HTV-2情況下導(dǎo)彈與目標(biāo)飛行彈道(情形1)
圖7 反HTV-2情況下的視線角(情形1)
圖8 反HTV-2情況下的視線角速率(情形1)
圖9 反HTV-2情況下的導(dǎo)彈制導(dǎo)指令(情形1)
圖10 反HTV-2情況下導(dǎo)彈與目標(biāo)飛行彈道(情形2)
圖11 反HTV-2情況下的視線角(情形2)
圖12 反HTV-2情況下的視線角速率(情形2)
圖13 反HTV-2情況下導(dǎo)彈制導(dǎo)指令(情形2)
情形ntf/sΔV/(m/s)情形1n=060.291042.3n=160.431290.6情形2n=060.34920.6n=160.511186.3
3.3仿真分析
(31)
基于Gauss偽譜的尋優(yōu)過程是在操作系統(tǒng)為Windows7,CPU為3.10GHz/IntelCorei5的普通計算機上采用Matlab仿真軟件執(zhí)行的。當(dāng)n=1時,反X-51, 反HTV-2(情形1)和反HTV-2(情形2)的尋優(yōu)時間分別為114s, 115s和153s。若在彈體上的基于快速處理器采用高性能DSP來執(zhí)行尋優(yōu)過程,尋優(yōu)時間將會至少縮短50倍。
4結(jié)論
本文將Gauss偽譜法應(yīng)用于多約束條件的最優(yōu)中制導(dǎo)律設(shè)計,考慮的約束條件包括:交班距離、視線角、視線角速率以及過載指令。并且在能量性能指標(biāo)中引入含參變量n的時變權(quán)重系數(shù)。該權(quán)重系數(shù)的引入不僅能夠滿足交班約束條件,而且能使過載指令在交班時刻接近于零,這有利于中末制導(dǎo)的順利交接。
參考文獻:
[1]ZhouD. New guidance laws for homing missile[M].Beijing:NationalDefenseIndustryPress, 2002. (周荻. 尋的導(dǎo)彈新型導(dǎo)引規(guī)律[M]. 北京: 國防工業(yè)出版社, 2002.)
[2]ImadoF,KurodaT,MiwaS.Optimalmidcourseguidanceformedium-rangeair-to-airmissiles[J]. Journal of Guidance, Control, and Dynamics, 1990, 13(4): 603-608.
[3]WangJD,LuoXS,ZhangTQ.Studyofoptimalmidcourseguidancelawincombinedguidance[J]. Journal of Ballistics, 2002, 14(2): 44-47. (王建棟, 羅喜霜, 張?zhí)鞓? 用于復(fù)合制導(dǎo)的最優(yōu)中制導(dǎo)律研究[J]. 彈道學(xué)報, 2002, 14(2): 44-47.)
[4]ChengVHL,GuptaNK.Advancedmidcourseguidanceforair-to-airmissiles[J]. Journal of Guidance,Control,and Dynamics,1986,9(2):135-142.
[5]MenonPKA,BriggsMM.Nearoptimalmidcourseguidanceforairtoairmissiles[J]. Journal of Guidance, Control, and Dynamics, 1990, 13(4): 596-602.
[6]FuL,FanYZ,NingWR.Investigationofsimplemidcourseguidanceforlongandmedium-rangeair-to-airmissiles[J]. Acta Aeronautica et Astronautica Sinica,1998,19(7):92-95.(富立,范耀祖,寧文如.一種簡單的中遠程空-空導(dǎo)彈中制導(dǎo)律研究[J].航空學(xué)報,1998,19(7):92-95.)
[7]QiaoQQ,ChenWC.Singularperturbationmidcourseguidancelawbasedondynamicinversionforair-to-airmissile[J]. Journal of Beijing University of Aeronautics and Astronautics, 2011, 37(11): 1365-1371.(喬清青,陳萬春.基于動態(tài)逆的空空導(dǎo)彈奇異攝動中制導(dǎo)律[J].北京航空航天大學(xué)學(xué)報,2011,37(11):1365-1371.)
[8]BensonD.AGausspseudospectraltranscriptionforoptimalcontrol[D].Cambridge:MassachusettsInstituteofTechnology, 2005.
[9]HuntingtonGT.AdvancementandanalysisofaGausspseudospectraltranscriptionforoptimalcontrolproblems[D].Cambridge:MassachusettsInstituteofTechnology, 2007.
[10]BensonDA,HuntingtonGT,ThorvaldsenTP,etal.Directtra-jectoryoptimizationandcostateestimationviaanorthogonalcolloca-tionmethod[J].Journal of Guidance,Control,and Dynamics,2006,29(6):1435-1440.
[11]HuntingtonGT,RaoAV.OptimalreconfigurationofspacecraftformationsusingtheGausspseudospectralmethod[J].Journal of Guidance,Control,and Dynamics,2008,31(3):689-698.
[12]ZhangKN,ChenWC.Reentryvehicleconstrainedtrajectoryoptimization[C]∥Proc.of the 17th AIAA International Space Planes and Hypersonic Systems and Technologies Conference, 2011.
[13]ZhangY,ZhangWP,ChenJ,etal.Air-to-groundweapondeliverytrajectoryplanningforUCAVsusingGausspseudospec-tralmethod[J].Acta Aeronautica et Astronautica Sinica,2011,32(7):1240-1251.(張煜,張萬鵬,陳璟,等.基于Gauss偽譜法的UCAV對地攻擊武器投放軌跡規(guī)劃[J].航空學(xué)報,2011,32(7):1240-1251.)
[14]ZhaoJ,ZhouR.Reentrytrajectoryoptimizationforhypersonicvehiclesatisfyingcomplexconstraints[J]. Chinese Journal of Aeronautics, 2013, 26(6): 1544-1553.
[15]YangXX,ZhangWH.Midcourseguidancelawoptimaloptimaldesignforair-to-airmissilesbasedonGausspseudospectralmethod[J]. Journal of National University of Defense Technology,2013,35(1):28-35.(楊希祥,張為華.基于Gauss偽譜法的空空導(dǎo)彈最優(yōu)中制導(dǎo)律的設(shè)計[J].國防科技大學(xué)學(xué)報,2013,35(1):28-35.)
[16]GillPE,MurrayW,SaundersMA.SNOPT:anSQPalgorithmforlarge-scaleconstrainedoptimization[J]. SIAM Journal on Optimization, 2002, 12(4): 979-1006.
孟克子(1988-),男,博士研究生,主要研究方向為飛行器制導(dǎo)與控制。
E-mail:ljymkz@126.com.
周荻(1969-),男,教授,博士,主要研究方向為飛行器制導(dǎo)與控制。
E-mail:zhoud@hit.edu.cn.
網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20150918.1829.022.html
Design of optimal midcourse guidance law with multiple constraints
MENG Ke-zi, ZHOU Di
(SchoolofAstronautics,HarbinInstituteofTechnology,Harbin150001,China)
Abstract:In view of nonlinearity of target-missile relative kinematic equations in three-dimensional space and multiple constraints imposed in the midcourse guidance phase, the Gauss pseudospectral method is adopted for the design of the optimal midcourse guidance law with multiple constraints. And the second-order dynamics of the missile autopilot is taken into account. The constraints include handover distance, line-of-sight (LOS) angles, LOS angular rates, and acceleration commands. The performance criterion is the integral of the squared control input multiplied by reciprocal of time-to-go to the power of n. The research results indicate that when time-varying weight coefficient is introduced into the performance criterion, in spite of the increasing fuel usage, the handover conditions are fulfilled while the acceleration commands could converge to zero, which contributes to the smooth transition from midcourse guidance to terminal guidance.
Keywords:multiple constraints; Gauss pseudospetral method; optimal midcourse guidance law; time-varying weight coefficient
作者簡介:
中圖分類號:V 448.232
文獻標(biāo)志碼:A
DOI:10.3969/j.issn.1001-506X.2016.01.19
基金項目:國家自然科學(xué)基金(61174203)資助課題
收稿日期:2014-09-22;修回日期:2015-06-15;網(wǎng)絡(luò)優(yōu)先出版日期:2015-09-18。