王志剛, 陳祥
(西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072)
基于配點(diǎn)法的軌道在線優(yōu)化方法研究
王志剛, 陳祥
(西北工業(yè)大學(xué) 航天學(xué)院, 陜西 西安 710072)
針對(duì)傳統(tǒng)軌道優(yōu)化方法無(wú)法應(yīng)用于軌道在線優(yōu)化的問(wèn)題,提出了三階辛普森配點(diǎn)法結(jié)合乘子法求解軌道在線優(yōu)化問(wèn)題的方法。首先建立變軌的最優(yōu)化模型;然后,用三階辛普森配點(diǎn)法將該最優(yōu)控制問(wèn)題轉(zhuǎn)化為受約束的非線性規(guī)劃問(wèn)題;最后,采用增廣拉格朗日乘子法對(duì)轉(zhuǎn)化得來(lái)的受約束的非線性規(guī)劃問(wèn)題進(jìn)行求解。仿真結(jié)果表明,所提出的方法可以得到高精度的軌道優(yōu)化結(jié)果,并且對(duì)狀態(tài)量和控制量的初值選取不敏感,且仿真具有實(shí)時(shí)性,計(jì)算速度快,可以達(dá)到在線進(jìn)行軌道優(yōu)化的要求。
最優(yōu)控制; 軌道優(yōu)化; 在線優(yōu)化; 配點(diǎn)法; 拉格朗日乘子法
傳統(tǒng)的軌道優(yōu)化方法都不同程度地存在計(jì)算量過(guò)大或者軌道優(yōu)化的求解對(duì)初值選取過(guò)于敏感等問(wèn)題,這就導(dǎo)致只能在地面進(jìn)行軌道優(yōu)化計(jì)算,然后將數(shù)據(jù)存儲(chǔ)于機(jī)載計(jì)算機(jī)從而控制航天器的飛行,無(wú)法達(dá)到航天器在空間自主在線進(jìn)行軌道最優(yōu)規(guī)劃的目的。為了解決這一問(wèn)題,本文采取了直接配點(diǎn)法和增廣拉格朗日乘子法相結(jié)合的方法來(lái)求解軌道優(yōu)化問(wèn)題,提出了一種在線優(yōu)化的方法。目的是只要航天器通過(guò)定軌系統(tǒng)得到其當(dāng)前的位置和速度信息,結(jié)合目標(biāo)任務(wù)的要求,就能實(shí)時(shí)在線、快速地生成一條最優(yōu)軌道。
三階辛普森配點(diǎn)法是一種將最優(yōu)控制問(wèn)題離散化求解的方法[1-2]。增廣拉格朗日乘子法是求解帶約束的非線性規(guī)劃問(wèn)題的方法,計(jì)算速度快,不需要取無(wú)窮大的懲罰因子就可以得到問(wèn)題的最優(yōu)解,得到的最優(yōu)解和采用極小值原理求解得到的理論最優(yōu)解非常接近[3]。因此考慮將二者進(jìn)行結(jié)合,來(lái)解決在線優(yōu)化問(wèn)題。
本文研究了應(yīng)用三階辛普森配點(diǎn)進(jìn)行在線軌道優(yōu)化的方法。首先建立了軌道轉(zhuǎn)移的最優(yōu)控制模型;然后采取配點(diǎn)法將軌道轉(zhuǎn)移最優(yōu)化問(wèn)題轉(zhuǎn)化為帶約束的非線性規(guī)劃問(wèn)題,用增廣拉格朗日乘子法對(duì)該非線性規(guī)劃問(wèn)題進(jìn)行求解;最后進(jìn)行了仿真,驗(yàn)證了方法的正確性和解決在線優(yōu)化問(wèn)題的可行性。
1.1 無(wú)量綱動(dòng)力學(xué)模型
視地球?yàn)槔硐刖|(zhì)的球體,且不考慮空間各種攝動(dòng)的干擾。為了計(jì)算簡(jiǎn)便,在地心慣性坐標(biāo)系下建立如下空間飛行器進(jìn)行軌道轉(zhuǎn)移的無(wú)量綱動(dòng)力學(xué)模型[4]:
(1)
式中,x,y,z,vx,vy,vz分別為飛行器的位置和速度;r為飛行器的地心距;Ux,Uy,Uz分別為推力方向矢量的三個(gè)分量;G為發(fā)動(dòng)機(jī)的推力;m為飛行器的質(zhì)量。
空間飛行器軌道轉(zhuǎn)移采用常值連續(xù)推力工作方式,補(bǔ)充質(zhì)量方程如下:
(2)
式中,ve為發(fā)動(dòng)機(jī)燃料噴射速度,是無(wú)量綱的。
式(1)和式(2)組成了軌道轉(zhuǎn)移的狀態(tài)方程。
1.2 控制量和狀態(tài)量
狀態(tài)量為:
(3)
控制量為:
(4)
式中,φ為高低角;ψ為方位角。高低角的定義為推力矢量與赤道面的夾角,以推力矢量指向赤道面之上為負(fù),限制范圍為[-π/2,π/2];方位角的定義為推力矢量在當(dāng)?shù)厮矫娴耐队芭c地心-平春分點(diǎn)連線的夾角,順著地心-平春分點(diǎn)連線的正向看,該投影從左往右旋轉(zhuǎn)與地心-平春分點(diǎn)連線重合時(shí),方位角為正,大小限制范圍為[-π,π]。
1.3 性能指標(biāo)的選取
選取性能指標(biāo)為軌道轉(zhuǎn)移過(guò)程中燃料消耗最少,可以表示為:
J=-m(tf)
(5)
1.4 約束條件
約束條件包含控制量約束和邊界條件約束,可以表示為:
-π/2≤φ≤π/2, -π≤ψ≤π
(6)
xt0=x0,G(xf)=0
(7)
(8)
可用三次Hermite多項(xiàng)式表示在該子區(qū)間內(nèi)的任意一個(gè)狀態(tài)量:
x=C0+C1S+C2S2+C3S3
(9)
三次Hermite多項(xiàng)式的定義是:在區(qū)間[a,b]內(nèi),對(duì)于三次多項(xiàng)式式(10),p(a),p′(a),p(b)和p′(b)已知,那么整個(gè)區(qū)間[a,b]內(nèi)的p(x)都是已知的。
p(x)=C0+C1x+C2x2+C3x3
(10)
式(9)的邊界條件為:
(11)
將式(11)帶入式(10)可以得到:
(12)
求解式(12)可以得到:
(13)
取子區(qū)間的中點(diǎn),即S=0.5,將式(13)帶入式(9)可以得到:
(14)
(15)
其中:
fi=f(ti,xi,ui)
(16)
fi+1=f(ti+1,xi+1,ui+1)
(17)
三階辛普森方法將每個(gè)節(jié)點(diǎn)處的狀態(tài)量和控制量以及配點(diǎn)處的控制量作為優(yōu)化的決策變量,配點(diǎn)選取為子區(qū)間的中點(diǎn)。即:
(18)
三階辛普森方法要求通過(guò)估計(jì)得到的配點(diǎn)處的導(dǎo)數(shù)值式(15)必須和式(14)代入狀態(tài)方程得到的配點(diǎn)處的導(dǎo)數(shù)值相等,這樣才能保證式(9)能夠很好地?cái)M合最優(yōu)狀態(tài)量的變化,這樣就得到了defect向量:
(19)
此時(shí),最優(yōu)控制問(wèn)題就轉(zhuǎn)化為帶約束的非線性規(guī)劃問(wèn)題。
采用三階辛普森配點(diǎn)法將軌道轉(zhuǎn)移的最優(yōu)控制問(wèn)題轉(zhuǎn)化為如式(20)所示的具有等式和不等式約束的非線性規(guī)劃問(wèn)題:
(20)
目標(biāo)函數(shù)為f(x)=-m(tf);不等式約束gi(x)為-π/2≤φ≤π/2和-π≤ψ≤π;等式約束hj(x)為變軌的初始點(diǎn)和終端點(diǎn)的邊界條件約束,以及由式(19)形成的Δ=0的約束。這樣,就把軌道轉(zhuǎn)移的最優(yōu)化問(wèn)題轉(zhuǎn)化為帶約束的非線性規(guī)劃問(wèn)題。
本文采取增廣拉格朗日乘子法求解式(20)描述的問(wèn)題,這種方法結(jié)合了罰函數(shù)法和古典拉格朗日乘子法,在罰因子適當(dāng)大的情況下,借助于調(diào)節(jié)乘子向量逐次逼近原非線性規(guī)劃問(wèn)題的最優(yōu)解,具有快速求解優(yōu)化問(wèn)題的優(yōu)點(diǎn)[5]。并且采用增廣拉格朗日乘子法求解優(yōu)化問(wèn)題得到的最優(yōu)解和采用傳統(tǒng)的龐特里亞金極小值原理求解得到的理論最優(yōu)解非常接近。
5.1 仿真參數(shù)
本文仿真算例是給定初始點(diǎn)和終端點(diǎn)的異面軌道交會(huì)。
表1 軌道交會(huì)邊界條件
發(fā)動(dòng)機(jī)為兩臺(tái)490 N發(fā)動(dòng)機(jī)組合,發(fā)動(dòng)機(jī)噴射速度為ve=3 000 m/s,仿真狀態(tài)初始值和終端約束值如表1所示;控制量約束為:-π/2≤φ≤π/2和-π≤ψ≤π;性能指標(biāo)為軌道轉(zhuǎn)移過(guò)程中燃料消耗最少。
仿真選取轉(zhuǎn)移軌道的26個(gè)時(shí)間節(jié)點(diǎn),將整個(gè)軌道優(yōu)化過(guò)程的時(shí)間等分為25段。
5.2 仿真結(jié)果
仿真是基于Visual C++6.0平臺(tái),用HP XW4600工作站進(jìn)行計(jì)算,計(jì)算機(jī)仿真時(shí)間消耗為282.6 s,軌道轉(zhuǎn)移時(shí)間為1 764.9 s,質(zhì)量損失為576.6 kg。
本文的所有狀態(tài)變量和控制變量曲線均是由各個(gè)節(jié)點(diǎn)的狀態(tài)量和控制量通過(guò)復(fù)現(xiàn)連續(xù)的動(dòng)力學(xué)過(guò)程得到的[6]。復(fù)現(xiàn)連續(xù)的動(dòng)力學(xué)過(guò)程是一個(gè)求解連續(xù)方程的過(guò)程,計(jì)算量不大,相對(duì)于變軌計(jì)算時(shí)間來(lái)說(shuō),復(fù)現(xiàn)得到連續(xù)的狀態(tài)量和控制量所花費(fèi)的時(shí)間基本可以忽略不計(jì)。變軌過(guò)程中狀態(tài)量的變化如圖1~圖3所示,控制量的變化如圖4所示。
圖1 位置隨時(shí)間的變化曲線
圖2 速度隨時(shí)間的變化曲線
圖3 質(zhì)量隨時(shí)間的變化曲線
圖4 控制量隨時(shí)間的變化曲線
5.3 結(jié)果分析
由表1的數(shù)據(jù)可以看出,軌道轉(zhuǎn)移結(jié)束后,終端時(shí)刻飛行器的位置和速度的大小與理想值之間的偏差分別低于10 m和1 m/s,可見(jiàn)精度很高。由圖1~圖3可以看出,各個(gè)狀態(tài)量的變化是平緩的。由圖4可以看出,飛行過(guò)程中兩個(gè)控制量的大小均嚴(yán)格限制在所要求的范圍內(nèi),并且過(guò)程變化平緩,證明了發(fā)動(dòng)機(jī)控制實(shí)現(xiàn)軌道轉(zhuǎn)移是可行的。
在調(diào)試過(guò)程中發(fā)現(xiàn),本文采用的方法對(duì)除了允許誤差之外的其他初值(例如狀態(tài)變量初值、乘子向量初值等)是不敏感的,不同的初值計(jì)算得到的優(yōu)化結(jié)果相差都基本保持在本文算例的精度之內(nèi),而且計(jì)算機(jī)時(shí)相差不大,這證明本文的算法具有很好的魯棒性。
本文研究了三階辛普森配點(diǎn)法結(jié)合乘子法來(lái)解決軌道優(yōu)化問(wèn)題,采用三階辛普森配點(diǎn)法將軌道轉(zhuǎn)移的最優(yōu)控制問(wèn)題轉(zhuǎn)化為帶約束的非線性規(guī)劃問(wèn)題,并采取了增廣拉格朗日乘子法來(lái)求解帶約束的非線性規(guī)劃問(wèn)題。將傳統(tǒng)的軌道優(yōu)化問(wèn)題轉(zhuǎn)化為靜態(tài)的參數(shù)規(guī)劃問(wèn)題,避免了傳統(tǒng)軌道優(yōu)化方法的缺點(diǎn),如收斂速度慢和對(duì)初值猜測(cè)過(guò)于敏感等不利于在線優(yōu)化等。仿真結(jié)果表明,采取這種方法解決軌道優(yōu)化問(wèn)題可以得到很精確的優(yōu)化結(jié)果,對(duì)初值猜測(cè)不敏感,尋優(yōu)能力強(qiáng),計(jì)算速度快,適合用于在線優(yōu)化,實(shí)時(shí)生成最優(yōu)軌跡。
[1] Paul J,Bruce A.Optimal spacecraft trajectories using collocation and nonlinear programming[J].Journal of Guidance,Control,and Dynamics,1991,14 (15):981-985.
[2] Herman L A.Direct optimization using collocation based on high-order Gauss-Lobatto quadrature rules[J].Journal of Guidance,Control,and Dynamics,1996,19(3):592-599.
[3] 趙吉松,谷良賢.基于廣義乘子法的月球軟著陸軌道快速優(yōu)化設(shè)計(jì)[J].科技導(dǎo)報(bào),2008,26(20):50-54.
[4] 王小軍.航天飛行器最佳變軌策略研究[D].北京:中國(guó)運(yùn)載火箭技術(shù)研究院,1995.
[5] 陳寶林.最優(yōu)化理論與算法[M].北京:清華大學(xué)出版社,2005:405-413.
[6] 黃奕勇,張育林.配點(diǎn)法研究[J].彈道學(xué)報(bào), 1998,10(3):40-43.
Researchofon-lineorbitoptimizationbasedondirectcollocationmethod
WANG Zhi-gang, CHEN Xiang
(College of Astronautics, NWPU, Xi’an 710072, China)
In order to settle the on-line orbit optimization problem, a method based on a direct collocation method is put forward. Firstly, a trajectory optimization control model is established. Secondly, the trajectory optimization model is dispersed into a discrete model by using the direct collocation method. Then, we change the optimization problem into a nonlinear programming problem. Finally, we solve the nonlinear programming problem by using the Lagrange multiplier method. The simulation results demonstrate that direct collocation method combined with the Lagrange multiplier method is not sensitive to the initial conditions we choose. The results also show that an accurate trajectry optimization result can be got by using this method in a short period. Therefore, direct collocation method is a viable one for us to settle the on-line optimization problem.
optimal control; orbit optimization; on-line optimization; collocation method; Lagrange multiplier method
2011-04-25;
2011-09-10
王志剛(1968-),男,陜西渭南人,教授,博士,研究方向?yàn)轱w行器設(shè)計(jì)。
V412.4
A
1002-0853(2012)01-0053-04
(編輯:姚妙慧)