馮 昊,李新明,潘 豪
(北京航天自動控制研究所,北京100854)
航天員艙外活動(EVA)是當今最危險、最耗資的載人航天技術(shù)之一,EVA控制技術(shù)是研究航天員駕駛載人機動裝置(MMU)與空間站(SS)分離,到達相對空間站周圍的某一固定位置,或去捕捉一個有相對運動的空間飛行目標,可以再補給并可重復(fù)使用的MMU技術(shù)[1]。
MMU能夠為太空艙外活動的航天員提供軌道和姿態(tài)機動能力,讓航天員安全、迅速、無碰撞的完成靠近飛行各種空間作業(yè)的空間“行走”機械裝置,所帶推進劑總是有限的,在變軌過程中,盡量減少推進劑消耗,可以增加飛行器的有效載荷、延長在軌使用時間,提高經(jīng)濟效益。因此節(jié)省推進劑、時間短的軌跡優(yōu)化問題,一直是研究人員很感興趣的問題[2,3]?;?CW-HILL 方程的脈沖控制方法[3]能夠使推進劑消耗達到最優(yōu),其線性形式也適合星載計算機進行星上計算,但是其精度不高。隨著計算機硬件性能的提高,計算機的處理能力越來越強大,這就為采取更復(fù)雜但更精確的算法提供了可能。在硬件水平允許的條件下,研究更先進的控制算法,可以得到更高的精度。
目前,一般的優(yōu)化設(shè)計方法如極大值原理可以將優(yōu)化軌跡的求解歸結(jié)為一個關(guān)于兩點邊值問題的求解,但它對迭代初值的選擇十分敏感;動態(tài)規(guī)劃算法可以得到問題的最優(yōu)解,但具有維數(shù)爆炸特性,其本質(zhì)是一種枚舉法;梯度法、模擬退火法等則容易陷入局部最優(yōu);而遺傳算法是一種模擬生命進化機制的搜索算法,其算法簡單,同時又具有魯棒性、隱含并行性的特點,能得到全局最優(yōu)解[4]。因此,從算法的實用性、解算的精度及運算時間三方面考慮,本文基于遺傳算法(GA)進行分析研究。
MMU在空間站附近的相對運動可以用航天器近距離相對運動方程[5]來描述,在執(zhí)行救援任務(wù)時,使其變得復(fù)雜的原因是MMU的飛行軌跡被要求,從空間站、航天飛機出來后,在任何時刻都不能碰撞到空間站、航天飛機。目前現(xiàn)有可以查閱到的文獻中沒有考慮飛行過程中障礙物的存在,因此本文從工程實際出發(fā),進一步針對救援過程中存在如航天飛機機翼這一類障礙物的情況,利用GA對MMU的飛行軌跡進行了有意義的研究和優(yōu)化設(shè)計,得出了一些有價值的結(jié)果。
為了對MMU執(zhí)行救援任務(wù)的飛行軌跡進行優(yōu)化設(shè)計,首先要建立數(shù)學(xué)模型。采用的軌道坐標系的原點位于空間站的質(zhì)心,z軸指向地心,x軸指向空間站的運動方向,y軸指向軌道面法向。準圓形軌道中運動的角速率為ω,兩個相近軌道航天器的相對運動可用如式(1)所示的Clohessy-Wiltshire 方程[5]描述。
其中x、y、z是主動飛行器(MMU)的坐標,ω是空間站在近圓軌道上繞地球轉(zhuǎn)動的角速度,這里取ω為常值。求解方程(1),當初始條件(x0、已知時,得其解析解如式(2)(3)。
和
MMU的救援飛行軌跡可分為6個階段(如圖1 所示),定義[3]如圖1。
圖1 MMU系統(tǒng)救援軌跡示意圖Fig.1 Schematic diagram of the MMU rescue trajectory
DT1:目標分離和MMU發(fā)射(彈射分離)之間的初始延遲時間;
DT2:MMU發(fā)射和目標(待救航天員或捕捉失效的衛(wèi)星或飛到指定的防熱瓦部位)交會之間的第一個自由飛行段;
DT3:MMU到達目標,并與其進行對接,DT3結(jié)束時刻,MMU和目標對接完成,但還沒有準備好返航;
DT4:對接后段,航天員將目標緊固在MMU上,并轉(zhuǎn)動到合適的角度進行返航,DT4結(jié)束時刻,MMU執(zhí)行返航點火;
DT5:第二個自由飛行段,DT5結(jié)束時刻,MMU到達空間站并點燃推進器進行減速;
DT6:MMU慢慢地到達SS,DT6結(jié)束時刻,MMU與空間站對接。
DV1:將MMU發(fā)射到相對于目標的最優(yōu)交會軌跡上所需要的Δv;
DV2:在與目標交會中,匹配目標速度所需要的Δv;
DV3:將MMU和目標組合置于向空間站的返回軌跡上需要的Δv;
DV4:靠近空間站時進行制動所需要的Δv。
表1給出了DT1—DT6的最小約束值[3]。
MMU的推進劑消耗可以用理想的火箭方程[2]計算得到如式(4)所示結(jié)果。
其中ve是推進劑噴出速度,m是運載器機動初始質(zhì)量,Δv是運載器速度增量,Δm是產(chǎn)生Δv所消耗的推進劑質(zhì)量。
表1 DT最短飛行時間的約束值Table 1 The shortest flight time constraint values
由C-W方程的解析解(2)和(3)式,當已知目標的初始速度和位置時,可以計算得到任意t時刻目標所在的位置和速度;對于執(zhí)行捕捉目標的MMU,當已知MMU的初始位置和t時刻目標所在的位置,通過(2)式可以計算出t時刻MMU飛行到目標所在位置所需要的初始速度增量,通過(3)式可以計算出t時刻MMU的速度,進而得到MMU與目標交會中匹配目標速度所需要的速度增量。由此可知MMU救援過程中所需要的DV1、DV2、DV3、DV4 是時間 DT1、DT2、DT3、DT4、DT5、DT6和目標初始條件(x0、y0、z0、x·0、y·0、z·0)的函數(shù),而推進劑消耗是Δv的函數(shù)(如(4)式所示)。這樣最小推進劑消耗問題就簡化為一個參數(shù)最優(yōu)化問題,狀態(tài)向量由6個DT組成。
而 DT1、DT3、DT4、DT6 應(yīng)盡可能小,因此DT1、DT3、DT4、DT6可以從最優(yōu)化過程中去掉,取其各段的最小允許值。而DT2、DT5為自由飛行段時間,不受約束,對于給定的初始條件,這兩個變量就決定了MMU的最小推進劑飛行軌跡,因此確定DT2、DT5為設(shè)計變量。
MMU從空間站、航天飛機出來和返回過程中,任何時刻都不能碰撞到空間站、航天飛機,在優(yōu)化設(shè)計MMU救援軌跡時必須考慮在飛行過程中存在如航天飛機機翼這一類障礙物的情況,因此將禁飛區(qū)(包括航天飛機的艙體、垂直尾翼、翼展)作為約束條件。
MMU艙外活動依據(jù)任務(wù)的性質(zhì)不同,一般不只單對推進劑消耗或單對時間有要求,而是對推進劑和時間都有要求,是能量與時間綜合優(yōu)化的問題,因此可以對能量與時間優(yōu)化指標進行線性加權(quán)處理,其優(yōu)化指標可以表示為公式(5)。
當考慮禁飛區(qū)約束時,通過采用懲罰函數(shù)法[4],可以將有約束的優(yōu)化問題變?yōu)闊o約束的優(yōu)化問題。經(jīng)過這樣的處理,MMU飛行軌跡的優(yōu)化指標可表示為公式(6)。
其中Δmi為各DT段MMU推進器的推進劑消耗,D為MMU飛行軌跡進入到禁飛區(qū)內(nèi)的點數(shù),k1為推進劑消耗量加權(quán)系數(shù)、k2為飛行時間加權(quán)系數(shù)、k3為懲罰系數(shù);k3取值較大,以使進入禁飛區(qū)的劣質(zhì)個體具有較低的適應(yīng)度,加速其淘汰。
經(jīng)過上述分析,本文選取DT2、DT5為設(shè)計變量。由式(2)和(3)可以確定 DV1、DV2、DV3、DV4,進而確定推進劑消耗,并通過懲罰函數(shù)法處理避開禁飛區(qū)的約束問題。利用多起始點的GA,在全局范圍內(nèi)搜索MMU飛行過程中能夠避開禁飛區(qū)的最少推進劑飛行軌跡。
1)確定決策變量及各種約束條件,即確定出個體的表現(xiàn)型和問題的解空間。在本文的優(yōu)化設(shè)計中,決策變量即為所選取的設(shè)計變量 DT2、DT5,解空間為設(shè)計變量所允許的最大時間約束,均設(shè)為20 min。
2)建立優(yōu)化模型,即確定出目標函數(shù)的類型及數(shù)學(xué)描述形式。本文的目標函數(shù)表達式及含義見式(5)、(6)。
3)確定可行解染色體的編碼方法,也即確定出個體基因型及遺傳算法的搜索空間。本文采用二進制編碼方案,根據(jù)決策變量的上、下界及所要求的時間精度(至少要滿足MMU噴氣發(fā)動機開關(guān)機時間精度)確定 DT2、DT5的編碼長度為15位。
4)確定解碼方法,即確定出個體基因型到個體表現(xiàn)型的對應(yīng)關(guān)系或轉(zhuǎn)換方法。本文的二進制編碼的解碼公式為表現(xiàn)型=設(shè)計變量區(qū)間長度×基因型/pow[2(編碼長度-1)]-設(shè)計變量的區(qū)間左端點值。
5)確定個體適應(yīng)度的量化評價方法,即確定出由目標函數(shù)值到個體適應(yīng)度的轉(zhuǎn)換規(guī)則。因本文的優(yōu)化目標是求函數(shù)的最小值且函數(shù)值均為正值,故可取其倒數(shù)作為評價個體的適應(yīng)度。
6)設(shè)計遺傳算子。
基本遺傳算法[4]是基于采用適應(yīng)度比例選擇、單點交叉和單點變異的遺傳算法。其主要不足是收斂速度慢,不成熟收斂等。為克服這些缺點,本文在基本遺傳算法的基礎(chǔ)上,對各種算子進行了改進,提出了新的改進遺傳算法。
1)最優(yōu)解保存法:選擇的過程是利用解碼后求得的各個體適應(yīng)度的大小,淘汰一些較差個體而選出一些比較優(yōu)良的個體,以進行下一步的交叉和變異操作。本文采用了最優(yōu)保存策略和比例選擇相結(jié)合的方法,即首先找出當前群體中適應(yīng)度最高的個體,為保證當前最佳個體不被交叉和變異所破壞,允許其不參與交叉和變異而直接進入下一代,然后剩下的個體按比例選擇法操作。引入最優(yōu)保存策略,可以不斷提高群體的平均適應(yīng)度,而且能保證最佳個體的適應(yīng)度不減小。
2)優(yōu)劣個體相互交叉法:GA中的交叉算子是遺傳操作中產(chǎn)生新個體的主要方法。本文在單點交叉的基礎(chǔ)上引入優(yōu)劣個體相互交叉的策略,即在種群遺傳過程中,要按照個體適應(yīng)度高低進行排序,然后將群體中一定數(shù)量適應(yīng)度高的優(yōu)良個體與相應(yīng)數(shù)量適應(yīng)度低的劣質(zhì)個體兩兩配對,對每一個體對產(chǎn)生一個隨機數(shù)r∈[0,1],若r大于交叉概率Pc,則在兩兩配對的個體編碼串中隨機設(shè)置一個交叉點,然后在該點相互交換兩個配對的優(yōu)良個體和劣質(zhì)個體的部分基因,從而生成子代兩個新的個體。這種方法不但可以避免近親交叉,還可以使最優(yōu)個體在整個種群中得以繼承。
3)非一致性變異法:對于二進制基因串而言,變異操作就是按照變異概率Pm,隨機選擇變異點,在變異點處將種群中某些基因位取反,變異概率一般很小。本文采用基本位變異法,種群中每個個體的每一位依相同的概率Pm發(fā)生變異,在此基礎(chǔ)上引入非一致性變異策略,從第2代開始在變異過程中,隨機產(chǎn)生一定數(shù)量的新個體,并用新產(chǎn)生的個體代替種群中適應(yīng)度較低的個體。這種方法在變異過程中可以維持種群的多樣性,避免因變異概率小出現(xiàn)未成熟而收斂的現(xiàn)象。
4)確定GA的運行參數(shù),如種群大小、交叉概率、變異概率等。本文取種群大小為200,進化代數(shù)為100,交叉概率為0.6,變異概率為0.1。
本文仿真實例中,假設(shè)目標的初始位置是(0,0,0),初始脫離速度的大小為 1.732 m/s,方向共分為9種典型情況[3],如圖2所示。MMU的初始位置是(0,0,0),DT1、DT3、DT4 取表1 中的最小約束值,DT2、DT5的最大約束時間均為20 min。設(shè)MMU及航天員的質(zhì)量為110 kg,目標質(zhì)量為120 kg,推進劑噴射速度為588 m/s。
圖2 目標初始分離速度的方向Fig.2 The initial separation velocity direction of target
本文首先研究了飛行過程中不存在障礙物的理想情況下,目標和MMU在軌道面外的運動情況,根據(jù)MMU飛行軌跡的優(yōu)化指標(5)式,應(yīng)用上面所設(shè)計的遺傳算法求取MMU的滿足其噴氣發(fā)動機開關(guān)機時間精度(0.02 s)要求的最小推進劑解的計算結(jié)果見表2。如目標的初始脫離狀態(tài)以第3種情況為例(初始脫離速度為(1,1,1)),則在軌道平面外理想情況最小推進劑飛行軌跡見圖3所示。本文研究時將航天飛機幾何外形簡單描述為如圖4,在疊加了航天飛機的圖例后,相應(yīng)的救援軌跡在返回時航天飛機附近的軌跡放大部分見圖4所示(圖中“——”線型表示目標的運動軌跡,“…”線型表示MMU的救援軌跡,“-”線型表示MMU與目標交會后的滑行段運動軌跡,“.-”線型表示MMU與目標返回過程運動軌跡,“o”處表示初始位置,以下均同)。
表2 理想情況MMU艙外救援的最小推進劑消耗Table 2 Minimum fuel consumption under the ideal situation
圖3 理想情況MMU最小燃料救援軌跡Fig.3 The minimum fuel rescue trajectory under ideal situation
圖4 理想情況疊加航天飛機時最小燃料救援軌跡局部放大圖Fig.4 The partial enlarged detail of the minimum fuel rescue trajectory under ideal situation with the space shuttle
從仿真結(jié)果可以看出,通過GA可以搜索得到滿足MMU噴氣發(fā)動機開關(guān)時間精度要求的最小推進劑解;并從飛行曲線圖3和圖4,可以看出單純研究以最小推進劑為優(yōu)化指標的飛行軌跡在MMU返回過程中與航天飛機發(fā)生碰撞,這不但嚴重威脅航天員的安全,也會損壞航天飛機,這樣的救援方案并不可行。
針對前面提出的實際問題,本文進一步利用改進遺傳算法搜索能夠避開障礙物(對于MMU,航天飛機機身、機翼可視為障礙物),使MMU安全飛行并盡量節(jié)省推進劑消耗的救援軌跡。
在優(yōu)化過程中,如(6)式所示,所研究問題的目標函數(shù)采用線性加權(quán)的方法,k1,k2,k3是可調(diào)的權(quán)系數(shù)。在利用GA解決繞障礙物的問題時,為了使碰到障礙物進入禁飛區(qū)的個體具有較低的適應(yīng)度,k3取值較大;但也不要過大,以避免造成GA的選擇壓力過大,破壞了種群的多樣性,使GA過早收斂,而無法搜索到全局最優(yōu)值。
算例如前所述,進一步考慮MMU救援過程中障礙物的存在對其飛行軌跡的影響。假設(shè)目標從航天飛機有效載荷艙的頂部附近脫離,MMU進行營救任務(wù)。同樣目標的初始脫離狀態(tài)以第3種情況為例(初始脫離速度為(1,1,1)),通過 GA搜索到的能夠使MMU避開障礙物安全返回艙內(nèi)的飛行軌跡如圖5所示,相應(yīng)的在航天飛機附近救援軌跡放大部分如圖6所示。
由仿真結(jié)果我們可以看出,雖然MMU能夠避開障礙物飛行的軌跡是以推進劑消耗為代價的,但應(yīng)用本文的綜合優(yōu)化指標,我們也可以做到在確保安全的前提下,盡可能節(jié)省推進劑的消耗。
本文僅以目標初始脫離速度沿第3種情況為例進行介紹,當目標初始脫離速度的大小、方向不同、MMU與目標交會的時間不同以及整個營救過程遇到的障礙物幾何構(gòu)型不同,則MMU繞障礙物飛行的軌跡也不同,但無論何種情況,采用本文的研究方法,可以確保MMU在安全完成救援任務(wù)的同時盡可能減少推進劑消耗。
圖5 MMU安全完成救援的飛行軌跡Fig.5 Safety flight rescuing trajectory
圖6 MMU避開障礙物飛行時的局部放大軌跡Fig.6 The partial enlarged detail of avoiding obstacles flight trajectory
本文從載人機動裝置實際飛行任務(wù)需求出發(fā),在確保安全的前提下進行空間艙外救援,研究了以能量-時間為綜合優(yōu)化目標的MMU飛行軌跡,并設(shè)計了相應(yīng)的改進遺傳算法;不但可以在全局范圍搜索到MMU的優(yōu)化軌跡,其隱含的并行性使問題的處理時間也相應(yīng)縮短。本文仿真所得到的MMU能夠繞過障礙物飛行的軌跡在理論研究同時對工程實踐不斷提出的新問題進行了一次十分有意義的探索研究。
[1]陳善廣.航天員出艙活動技術(shù)[M].北京:中國宇航出版社,2007:1-5.
[2]Neff M,F(xiàn)owler W T.Minimum-fuel rescure trajectories for the extravehicular excursion unit[J].The Journal of the Astronautical Sciences,1991,39(1):21-45.
[3]周荻,慕春棣,王旭東.載人機動裝置救援軌跡優(yōu)化設(shè)計[J].宇航學(xué)報,2000,4:19-26.
[4]周明,孫樹棟.遺傳算法原理及應(yīng)用[M].北京:國防工業(yè)出版社,1999:35-60.
[5]郗曉寧,王威.近地航天器軌道基礎(chǔ)[M].長沙:國防科技大學(xué)出版社,2003:10-21.