徐西寶,白成超,陳宇燊,唐浩楠
(1. 哈爾濱工業(yè)大學航天學院,哈爾濱 150001; 2. 北京宇航系統(tǒng)工程研究所,北京 100076)
人類探索深空的腳步從未停止,通過七十多年的不懈努力和奮斗,航天技術得到了快速發(fā)展,正逐步揭開其神秘的面紗。從早期的人造衛(wèi)星到空間站建立,從月球探測到火星探測,再從小行星探測到土星/木星探測,無論是探測深度還是對象的尺度,其范圍都在逐步擴大。另一角度來看,探測目標也逐漸多元化,不再是簡單的到達,拍攝,亦或是登陸,更多的是體現(xiàn)對科學本質(zhì)的探索,如地外水資源的發(fā)現(xiàn)和證明,地外大氣的演化以及地外生命的尋找等,甚至是建立地外基地,進行原位資源開采及利用。這些都說明了開展深空探測研究,是人類認識自我、認識未知宇宙,同時又服務于自身的必要途徑。
目前針對地外天體探測任務,主要還是集中在月球和火星,其中月球作為離地球最近的地外天體,從古至今都一直是大家關注的焦點,隨著阿波羅計劃等多個探月任務的成功實施,人類歷史上實現(xiàn)了多個第一,第一次登上月球、第一次采樣返回、第一次看到月球背面、第一次發(fā)現(xiàn)月球有永久陰影區(qū)等[1-2]。而火星作為人類可能最宜移居的星球,也吸引了多個機構的研究熱情,但受制于其距離地球較遠,探測難度較大,目前還只是有少數(shù)國家具備探測能力,且基本上所有著陸火星的巡視器均為美國研制,例如勇氣號、機遇好、好奇號等,同樣也實現(xiàn)了多個第一,第一次看見火星的地質(zhì)地貌、第一次了解火星大氣、第一次長途巡視、第一次探測到火震等[3-4]。隨著探測任務的推進,勢必對月球及火星有更深入的了解和發(fā)現(xiàn),到時候距離地外建設基地、構建星際網(wǎng)絡的期望就會更近一步。
但在實現(xiàn)對月球及火星的精確、安全探測過程中,仍有很多的技術及工程難題需要攻克,作為一個大系統(tǒng)工程,涉及多個子系統(tǒng)、多個環(huán)節(jié)、多個學科的交叉,以及多個團隊之間的協(xié)同,故難度大、約束多、可靠性要求高是需要直接面對的挑戰(zhàn)。這其中,作為對地外開展探測活動至關重要的一環(huán),即軟著陸,其決定了整個探測任務的成敗,故開展精確魯棒的軟著陸制導技術研究是關鍵。
基于上述分析,本文將針對月球及火星探測任務及軟著陸制導技術的發(fā)展歷程進行整理和總結。首先分別對過往的探測任務進行回顧,分析在任務層面的變化;其次對軟著陸過程進行定義,并對軟著陸制導技術體系進行梳理;最后給出軟著陸制導技術的發(fā)展趨勢及關鍵問題。
針對月球探測,各國的基本探測路線大體是“探”、“登”、“駐”?!疤健笔峭ㄟ^飛越、環(huán)繞對月球的環(huán)境特征進行初步探測,了解月面特征等信息,為后續(xù)探測做準備;“登”是在“探”的基礎上進行硬著陸和軟著陸實驗,實現(xiàn)月球登陸;“駐”是在月球建立基地,并基于月球資源進行原位利用[5]。
通過對目前月球探測任務的梳理,如圖1所示,按時間可以將探測階段分為三期[6]:
1)第一階段1959~1976
第一階段主要參與者是美國和蘇聯(lián),為奪取競爭空間優(yōu)勢,二者均進行了大量的月球探測,掀起了第一次月球探測高峰。期間共進行了121次與月球相關的發(fā)射探測活動。通過對月球的在軌探測和巡視探測,獲得了大量高價值科學數(shù)據(jù),如地質(zhì)地貌,成分分析等,把人類對月球、地球和太陽系的認識提到了新的高度,并帶動了一系列新技術的創(chuàng)新,航天技術的成果民用化極大的改進了人們的生活,月球探測取得了劃時代的成就。
2)第二階段1976~1994
受冷戰(zhàn)緩和影響,美國和蘇聯(lián)對于探月熱情逐漸降低,所以該階段是月球探測的寧靜期。這一期間,蘇聯(lián)和美國主要是對第一階段的探測活動進行總結,對部分探測任務失敗和效率低的原因進行了分析,探索和提出了更好的探測思路和方案。這一階段也是對第一階段探測資料消化的階段,通過將相關技術推廣和民用化,將月球探測的成果轉(zhuǎn)化為豐厚的經(jīng)濟效益。除此之外,世界各國將新的研究點逐漸向空間往返運輸能力建設以及復雜環(huán)境高魯棒性能的探測裝備研制轉(zhuǎn)變。
3)第三階段1994~至今
經(jīng)過第二階段的積累和總結,隨著空間技術逐漸成熟,在空間應用和空間科學任務及空間軍事活動發(fā)展的需求的推動下,開啟了新一輪的月球探測。與第一次探測高潮注重發(fā)展空間技術不同,地外資源與能源的勘察、采集及利用是其主要目標,因為有價值的資源是發(fā)展的基礎支撐,不僅可以補充地球上日益減少的資源儲備,而且人類的探索必然逐步走向更深的宇宙空間,而月球上的這些資源可以為未來的深空探測提供保障。
相比于月球探測,由于距離地球更遠,大氣環(huán)境更復雜,火星探測難度更大,同時因其為距地球最近的行星,以及與地球相似的軌道,火星備受關注,也被認為是最有可能、最有條件載人登陸的行星[7]。回顧往年的探測歷程,人類對火星的探索從未停止,從冷戰(zhàn)開始,美國和蘇聯(lián)就開始了對火星的探索,希望通過對火星構成、地貌和大氣等環(huán)境特征的探測,提高對火星的了解并尋找地外生命。但是由于技術上的不足以及任務的復雜性,大多數(shù)探測均宣告失敗。直到后續(xù)技術的積累,以美國為代表的探火任務取得了歷史性突破,例如“勇氣號”“機遇號”“好奇號”,以及即將開展的Mars2020和ExoMars等,正逐步向人類展示火星的真實一面,并逐一解答例如是否有水、是否有生命、是否適合人類居住等多個疑惑。通過對火星探測的發(fā)展歷程進行分析,如圖2所示,可以得到如下啟示:
1)火星探測是未來行星探測的重點:各國的行星探測任務的首選目標都是火星,然后在其基礎上,再開展更遙遠的深空探測計劃。同時各航天大國均制訂了長遠而明確的火星探測任務,未來20多年大多數(shù)火星探測窗口均有發(fā)射計劃,2022~2024公布的火星探測任務就有四次。
2)火星探測與月球探測技術互補:從探測路線來看,火星和月球的探索過程都經(jīng)歷了飛越、環(huán)繞、著陸、采樣返回這四個階段,這符合技術發(fā)展由易到難循序漸進的規(guī)律;從技術角度來看,火星和月球探測采用的大多數(shù)技術都是相通和類似的,技術發(fā)展的內(nèi)在規(guī)律也類似,因此火星和月球探測的技術之間可以相互轉(zhuǎn)化利用。
3)火星探測注重“技術和科學”雙輪驅(qū)動:基于科學目標牽引,推動技術革新;技術積累成熟,開展科學研究。即第一階段解決技術問題,即實現(xiàn)遠距離和長時間的探索;第二階段開展科學研究,在第一階段的基礎上,開展更多有價值的科學探索。
由于月球沒有大氣,通常所說的月球軟著陸即為其動力下降階段。當探測器到達近月點后,著陸器發(fā)動機點火制動,開始動力下降。針對不同的月球軟著陸任務,會設計不同的軟著陸動力下降段以適應任務的需求,一般的階段劃分為減速制動段、接近段以及最終下降段。
減速制動段持續(xù)過程從近月點(通常15 km高度)開始,到離月球表面1~2 km處,軟著陸燃料大部分在此段消耗,因為其主要任務是抵消初始軌道速度和重力加速度帶來的速度,故減速制動段以燃料最優(yōu)為主要指標。
接近段從月球表面1~2 km開始一直到著陸點上方約30 m高度處,此過程中將要消除干擾及偏差,對危險障礙進行精確識別,最后實現(xiàn)對安全著陸區(qū)的選址及定位。著陸器的接近段開始的時候需要調(diào)整著陸器的姿態(tài)以使傳感器保持足夠的視野,在下降過程中應當滿足相應的姿態(tài)角約束和高度角約束以及終端狀態(tài)約束。同時在避障時,著陸點重定位需考慮著陸器燃料消耗等約束,因此接近段以滿足約束條件為主要指標。
最終下降段一般是垂直下降段,為了實現(xiàn)平穩(wěn)著陸,著陸器將以低速勻速緩慢下降,因此在最終下降段以控制穩(wěn)定性為主要指標。
由于有大氣的影響,傳統(tǒng)火星著陸過程一般分為 3個階段:進入段、下降段和最終著陸段[8]。
進入段主要指探測器從接近段進入火星大氣到降落傘打開的過程?;鹦侵懫髟谂c軌道器分離之后,將會調(diào)整到一個特定的姿軌狀態(tài)開始在大氣層外的自由巡航。當其高度接近火星大氣層高度時(約125 km),開始大氣再入。在此過程中,需要不斷調(diào)整姿態(tài)以獲得合適的側傾角和攻角來調(diào)節(jié)側向力和升力,降低軌跡誤差,直到滿足降落傘展開條件。
下降段主要是指超音速傘降階段,即從著陸器降落傘打開到降落傘脫離結束。當著陸器經(jīng)過大氣減速后,降落傘在拋掉整流罩之后開始展開,當?shù)竭_距離火星表面約2~5 km時拋掉降落傘,開始最終著陸過程。
最終著陸段一般是指動力下降段和著陸緩沖段(包含動力反推緩沖)。動力下降過程將主要完成安全著陸區(qū)定位,消除偏差,以及避障和重規(guī)劃。在下降到一定高度時(30~200 m),火星車被釋放,并通過一定的緩沖措施最終著陸。
在制導過程中,制導系統(tǒng)不斷確定飛行器與目標或預定軌道之間的相對位置關系,并將制導信息發(fā)送給飛行器控制系統(tǒng)進行飛行控制。目前對月球軟著陸制導方法[9]的研究可以歸納為五類:建立月球垂線法、重力轉(zhuǎn)彎制導法、標稱軌跡制導方法、顯式制導方法和智能學習方法。火星軟著陸動力下降段制導方法[10]大致可以分為三類:標稱軌跡制導方法、顯式制導方法和智能學習方法。在實現(xiàn)軟著陸的任務中,制導控制算法需要滿足以下要求[11]:燃耗最優(yōu)或次優(yōu)性,魯棒性,自主性,實時性以及避障性能。
建立月球垂線法的基本原理是著陸器以大于0的相對速度進入月球影響球,將以月球為焦點的做雙曲線運動。在到達制動點之前,調(diào)整探測器的姿態(tài)和速度,使其與月面基本垂直,推力方向盡可能與速度方向重合反向并指向月心,滿足著陸初始條件后,保持垂直姿態(tài)實施軟著陸。這時的制導過程基本是一種開環(huán)的方式。
這種方法需要預先選定著陸點,然后計算給出著陸方案,如果著陸過程中發(fā)生突發(fā)情況,比如發(fā)現(xiàn)預定區(qū)域存在障礙不適合降落,也無法重新規(guī)劃,探測任務就會失敗,因此這種方法在沒有高精度地圖的情況下應用比較有限。此外這種方法對入軌精度和中途軌道修正精度要求較高,給制導控制系統(tǒng)的設計帶來困難,隨著深空探測任務越來越復雜,這種方法的應用越來越局限。
重力轉(zhuǎn)彎制導方法的主要原理是控制發(fā)動機的推力方向,使其與著陸器的速度方向重合反向,利用發(fā)動機推力減速,在發(fā)動機推力和月球引力的作用下,逐漸將探測器在月面水平方向的速度減到零,速度逐漸指向月心,實現(xiàn)月球的垂直軟著陸。這種方法采取半開環(huán)半閉環(huán)的方式,在主制動段時主要目標是降低著陸器速度,采取開環(huán)制導方式,當著陸器與月面距離縮短到一定范圍時,將敏感器的測量信息引入反饋控制器,進行閉環(huán)制導,盡可能提高著陸的精度性和平穩(wěn)性。
關于重力轉(zhuǎn)彎制導方法的研究主要存在于早期的無人月球著陸任務中:Citron等[12]同時對推力的大小和方向進行調(diào)節(jié),對重力轉(zhuǎn)彎著陸過程進行改進,實現(xiàn)定點軟著陸;Mcinnes等[13]設計了非線性反饋制導控制律;文獻[14]結合極大值原理,設計了重力轉(zhuǎn)彎開關制導律,能實現(xiàn)燃料最優(yōu)。
標稱軌跡制導方法由開環(huán)離線軌跡規(guī)劃和閉環(huán)在線軌跡控制兩部分組成,著陸器在著陸前需要離線規(guī)劃一條優(yōu)化過的著陸飛行軌跡,著陸過程中按照該軌跡著陸,不斷測量著陸器的位置速度與規(guī)劃的軌跡之間的偏差,控制著陸器按規(guī)劃的方案飛行完成著陸。
4.3.1著陸軌跡優(yōu)化
著陸軌跡優(yōu)化問題的求解可以通過解析法和數(shù)值法兩種方法實現(xiàn)。解析法先建立關于系統(tǒng)狀態(tài)的狀態(tài)方程和最優(yōu)條件,然后利用經(jīng)典最優(yōu)控制論求解,得到最優(yōu)控制量及狀態(tài)量的表達式,通過這種方法可以獲得最優(yōu)解的解析形式,但當系統(tǒng)復雜度高時,呈現(xiàn)強非線性,該類方法對解的最優(yōu)性無法保障。而數(shù)值法則利用一定的插值逼近方法,將連續(xù)系統(tǒng)離散化,將其最優(yōu)控制問題轉(zhuǎn)化為有限維參數(shù)優(yōu)化問題,通過數(shù)值解法,得到一系列最優(yōu)軌跡的標稱點,從而得到最優(yōu)解的數(shù)值形式。相比于解析法,數(shù)值法更易于在強非線性環(huán)境下的應用,也是目前研究的主流方向,分為軌跡優(yōu)化問題轉(zhuǎn)化和參數(shù)優(yōu)化問題求解兩個階段[15]。
數(shù)值法中軌跡優(yōu)化問題的轉(zhuǎn)化方法可以分為直接法和間接法[15]。直接法包括直接打靶法、配點法、微分包含法等,第一步采用參數(shù)化方法將連續(xù)空間最優(yōu)控制問題的求解轉(zhuǎn)化為非線性規(guī)劃問題,再利用數(shù)值方法求解轉(zhuǎn)化后的非線性規(guī)劃問題,由此獲得最優(yōu)軌跡。間接法包括各種偽譜方法,其基本思想是利用Pontryagin極大值原理,將最優(yōu)控制問題轉(zhuǎn)化為哈密頓邊值問題(HBVP)。
利用上述的轉(zhuǎn)化方法,軌跡優(yōu)化問題就轉(zhuǎn)化成了相應的參數(shù)優(yōu)化問題,對參數(shù)優(yōu)化問題求解即可得到優(yōu)化軌跡。目前,對于參數(shù)優(yōu)化問題的求解算法主要分為精確算法、現(xiàn)代啟示算法以及混合算法三類。精確算法包括梯度下降法、內(nèi)點法、罰函數(shù)方法、動態(tài)規(guī)劃法、QP以及SQP等;現(xiàn)代啟示算法包括GA、群智能算法、模擬退火算法及神經(jīng)網(wǎng)絡算法等;而混合優(yōu)化算法將以上精確算法和現(xiàn)代啟示算法中的幾種參數(shù)化算法相結合以取長補短。
4.3.2著陸軌跡跟蹤制導律
著陸軌跡跟蹤的目標是對離線著陸軌跡優(yōu)化得到的軌跡進行在線跟蹤,控制著陸器使其位置和速度與設定軌跡保持一致,實現(xiàn)近似最優(yōu)的軟著陸。實際著陸過程中位置和速度與設定軌跡一致性越好,實際軌跡的最優(yōu)性也更好,因此應設計合適的跟蹤制導律,使著陸器盡快到達預定軌跡并沿軌跡運動至目標點。
常用的標稱跟蹤的制導控制律有:多項式制導律、線性反饋制導律、非線性反饋制導律、H∞控制反饋制導律、滑??刂品答佒茖傻取N墨I[15]利用極大值原理給出了著陸軌跡最優(yōu)性推導,同時基于人工神經(jīng)網(wǎng)絡設計了閉環(huán)形式的制導律。Liaw等[16]利用滑模邊界層法,設計了能夠?qū)χ憳朔Q軌跡進行跟蹤三維制導律;Liu等[17]基于H∞控制方法設計了魯棒性和抗干擾性較好的H∞控制反饋制導律;Li等[18]基于反步法設計了自適應跟蹤制導律,該跟蹤律能實現(xiàn)在線的故障診斷容錯控制。
4.3.3其它變體
除上述方法外,當實際軌跡和標稱軌跡之間的偏差較小時,標稱軌跡制導可擴展為攝動制導,攝動制導通過線性化,在標稱軌跡附近將軌道約束函數(shù)一階泰勒展開,然后利用線性化的結果求解控制量,線性化后的計算量大大減少且準確性也未降低。此外,也有學者利用曲線插值技術來生成軌跡,如文獻[19]利用樣條插值方法綜合全弧段數(shù)據(jù)來數(shù)值逼近有效的落月軌跡。
顯式制導方法又稱預測/校正制導方法,其核心是利用控制泛函的顯函數(shù)形式進行閉環(huán)制導解算。通常建立數(shù)學模型時需要對軟著陸模型進行簡化,得到軟著陸最優(yōu)控制問題的解析表達式。常見的顯式制導律有迭代制導律、動力顯式制導律和燃耗次優(yōu)制導律等。
迭代制導方式最早應用于土星IB和土星V的飛行上[20]。迭代制導方案根據(jù)飛行器速度、位置、縱向加速度和重力加速度的狀態(tài)以及期望的截止條件計算轉(zhuǎn)向指令;使用飛行器更新后狀態(tài)在每個制導周期中更新制導命令。迭代制導方案是一種路徑自適應制導方案,因為它在所有可能的飛行器擾動類型和程度下保持其優(yōu)化性能,而不會損失精度。航天飛機的制導方案是動力顯式制導方法的成功應用的實例。Mchenry等[21]推導出了滿足大范圍機動約束的顯式制導方程和由制導解產(chǎn)生姿態(tài)轉(zhuǎn)向誤差的轉(zhuǎn)向方程,以及導航方程和由冗余測量值確定故障儀表的方程;Guo等[22]基于平坦地形及定量重力加速度假設,提出了一種基于Pontryagin極大值原理的相似的多項式制導律;Lu等[23]開發(fā)了一種單基線預測校正算法,該算法可應用于不同推力的著陸器。
一般情況下,GNC系統(tǒng)從動力下降段開始探測器根據(jù)傳器得到實時狀態(tài)和終端狀態(tài)進行解算,具有完全的自主性。顯式制導具有對抗大干擾的能力,制導末端精度幾乎不受干擾影響,具有一定的魯棒性。但是為滿足實時性要求,對搭載的GNC計算機有較快的運算速度和穩(wěn)定的性能。由于最優(yōu)控制問題數(shù)學建模時存在大量的假設和擾動偏差,因此顯式制導律的燃料消耗是次優(yōu)的。
深度學習是一類新興的多層神經(jīng)網(wǎng)絡學習算法[24]。深度強化學習具備較強的高維感知能力和具有策略性的決策能力,是一種端到端的優(yōu)化學習方法,為解決類似航天器這樣的復雜非線性系統(tǒng)的軟著陸問題提供了思路。
近兩年,Carlos等[25]在假設狀態(tài)信息完備的情況下,對訓練深度人工神經(jīng)網(wǎng)絡來表示精確著陸過程中的最優(yōu)控制過程進行了詳細的研究,他們的系統(tǒng)能夠處理大量可能的初始狀態(tài),同時仍能產(chǎn)生最優(yōu)響應;Furfaro等[26]提出了一種基于深度學習的自主登月方法,這種方法可以用于狀態(tài)估計而不需要濾波器;此外,還提出了一種深度遞歸神經(jīng)網(wǎng)絡結構,從行星動力下降階段的狀態(tài)序列預測最優(yōu)燃料推力并利用長、短期記憶網(wǎng)絡對增加的網(wǎng)絡信息進行跟蹤,從而提高了輸出估計的精度[27]。Gaudet等[28]提出了一種基于深度強化學習的行星動力下降制導方法,該方法采用了策略梯度法來生成精確且省油的軌跡。文獻[29]提出了一種基于經(jīng)典ZEM-ZEV的自適應反饋制導算法,使用深度強化學習來克服其局限性。文獻[30]提出了一種基于遞歸策略和價值函數(shù)逼近器的增強元學習自適應導引系統(tǒng),該系統(tǒng)集成了制導和導航功能。
相較于傳統(tǒng)方法而言,深度強化學習具有全局搜索最優(yōu)性。訓練好的智能體運行速度非??欤哂蟹浅:玫膶崟r性。此外,在GNC方面也有一定的優(yōu)越性,例如動力學無縫銜接且無約束,不需要狀態(tài)反饋、控制約束易處理等。然而,并不是每一次訓練都能夠讓智能體損失函數(shù)收斂,并且訓練好的智能體在仿真測試過程中也有可能出現(xiàn)失誤,這在工程上是不被允許的。此外,如何能讓智能體在真實環(huán)境下表現(xiàn)得和仿真環(huán)境一樣好也是目前亟待解決的問題。
在軟著陸制導問題中,受發(fā)射能力及有效載荷質(zhì)量限制,攜帶的燃料是有限的,常以燃料最省為優(yōu)化指標進行求解。同時考慮到著陸器的動力學模型和機動能力邊界,需要在著陸軌跡優(yōu)化的過程中考慮多種必要的狀態(tài)約束和路徑約束,其中包括推力約束,姿態(tài)約束,起始狀態(tài)約束,終端狀態(tài)約束,以及在復雜的地形環(huán)境下著陸還需要考慮障礙約束。而包含大量約束的最優(yōu)控制問題一般存在嚴重的非線性和非凸形,求解起來十分困難且容易陷入局部最優(yōu),因此在建立最優(yōu)控制問題模型的階段均對原始任務進行不同程度的線性化或凸化[31]。常用于軟著陸的約束優(yōu)化方法有:二階錐優(yōu)化、連續(xù)線性化等。
近年來,可變推力大小發(fā)動機的工程研究取得了一定的突破,同時各大工程傾向于在最終著陸段引入自主避障技術,因此障礙約束的處理方法和包含推力大小約束及障礙約束的制導方法對于提高探測器的避障能力至關重要。Acikmese等[32]提出了將非凸優(yōu)化問題進行凸化轉(zhuǎn)化的思想,解決了以發(fā)動機推力幅值的上下界作為約束條件的燃耗最優(yōu)問題。在此基礎上,Blackmore等[33]的研究已經(jīng)擴展到尋找最小的著陸誤差軌跡的燃耗最優(yōu)問題;Harris等[34]提出了一種處理半連續(xù)控制約束的方法,用于尋找一類混合整數(shù)非凸問題的全局最優(yōu)解。Shen等[35]將靈敏度補償因子應用于燃耗最優(yōu)著陸問題,得到了一種考慮不確定性和擾動的最優(yōu)控制方法。Lu等[36]提出了一種優(yōu)化燃料和保證足夠的制導裕度增強型阿波羅動力下降制導方法,該方法能適應多種任務。Cui等[37]提出了凸軌跡可以通過一種新型的和解析的軌跡曲率制導方法來構建;Bai等[38]提出了利用非凸函數(shù)對障礙物進行合并,將這些非凸障礙約束轉(zhuǎn)化為凸障礙約束的線性化方法。
如圖3所示,從技術的發(fā)展變化可以總結出軟著陸制導技術的發(fā)展趨勢呈現(xiàn)三個階段,也說明了隨著通用技術體系的發(fā)展,如人工智能等,對制導方法的性能優(yōu)化與更新起到了關鍵作用。下面對每一個階段做簡要總結:
1)人為智能:固定軌跡制導
早期深空著陸任務著陸區(qū)相對平坦,其制導方法相對簡單,計算量小,如月球垂線法和重力轉(zhuǎn)彎法都是提前生成軟著陸軌跡。該類方法最大特點是簡單實用,但所規(guī)劃的軌道不是能量最優(yōu)軌道,故常用于早期探測任務,以及對著陸精度要求不高的探測任務。
2)機器智能:基于優(yōu)化制導
隨著最優(yōu)控制和優(yōu)化理論的發(fā)展以及搭載計算機性能的提升,軌跡優(yōu)化逐漸成為制導技術的熱門選擇。對于離線設計的軌跡一般而言是最優(yōu)的,但是這樣的方法靈活性較差,自主能力和避障能力都是有限的,不適用于環(huán)境復雜的著陸任務。顯式制導方法在線更新飛行的軌跡,有一定的自主性和較強的避障能力。
近年來,隨著路徑規(guī)劃技術的興起,RRT、PRM等基于采樣理論的算法得到了快速發(fā)展。該類方法能夠快速、有效地搜索高維空間,適用于復雜或動態(tài)環(huán)境下多自由度智能體路徑規(guī)劃求解。將基于采樣的方法融入制導體系對提高探測器的實時性,進一步降低算法計算量有著巨大的潛力。
3)人工智能:基于學習制導
基于優(yōu)化的設計思路,其設計較為復雜,計算量大,對著陸器動力學及擾動建模精度要求較高,目前在線求解還很少應用。而強化學習技術的出現(xiàn),給出了一個全新的軟著陸制導技術研究方向,既可以利用基于模型的強化學習方法來完成參數(shù)訓練,也可以僅基于數(shù)據(jù)實現(xiàn)著陸策略的學習,這將大大提高算法的通用性及魯棒性。當然目前基于學習的制導策略還存在其自身的問題,比如黑盒操作模式,不可解釋性等,這對于后續(xù)的任務應用提出了很大的挑戰(zhàn)。但是隨著有穩(wěn)定性保障的深度強化學習研究的不斷深入,相信這會是未來的研究趨勢。
此外,制導方案的選擇很大程度上取決于著陸要求、任務目標和規(guī)劃方案的不同。而一個任務往往是由若干個子任務組成,故可以根據(jù)子問題進行具體分析,通過選擇不同的性能指標及約束定義運用到不同的子任務當中,最終實現(xiàn)整體任務的成功實現(xiàn)。
通過對上述三個階段發(fā)展的本質(zhì)可以看出,智能化與制導技術的融合是未來的前沿,勢必會帶動更多的研究熱情,逐漸向著具備通用性、可解釋性、以及自主學習能力的智能軟著陸技術發(fā)展。與此同時,人類對于月球以及火星的探測目標已發(fā)生了轉(zhuǎn)變,更多的任務將集中在復雜極區(qū)著陸,甚至是探索從未到達過的永久陰影區(qū),其任務難度之大,對精確軟著陸技術提出了更為嚴苛的要求。綜上分析,對于月球及火星軟著陸的發(fā)展,其趨勢總結如下:
1)算法輕量化,規(guī)劃實時化:從算法的復雜性發(fā)展過程可以看出,制導控制算法有著從簡單到復雜再到精煉的發(fā)展趨勢。早期深空探測任務受到星載計算機計算能力的限制,只能使用計算量小的制導算法盡量滿足著陸任務的需求,著陸過程甚至存在內(nèi)存溢出這樣的風險。隨著計算機技術的發(fā)展,復雜性更高、性能更加優(yōu)越的算法得以在實際工程中運用。未來的著陸任務為了滿足實時規(guī)劃避障的需求,必然需要更加輕量化的制導控制算法。
2)方案多樣化,技術通用化:隨著探測任務的增加,以及探測目標的復雜化,勢必會涉及到不同約束下的精確著陸問題。極區(qū)的復雜山地,黑暗的永久陰影區(qū)和常規(guī)的平坦區(qū)域都會對應不同的制導方案。加之對月球及火星開展探測活動的機構越來越多,可以預見軟著陸制導控制方案將越來越多元化。方案多樣化為不同的著陸任務提供了豐富的選擇,同時,多樣的方案能夠凸顯某些技術的共性,為技術的通用化打下了基礎,使得技術和任務的關系從一對一逐漸向一對多和多對多發(fā)展。
3)平臺智能化,環(huán)境自適應:著陸器作為開展地外探測任務的主體,對整個任務是非常重要的一環(huán),精準的著陸會給后續(xù)任務帶來能量、時間、安全等全方位的支撐。隨著技術的發(fā)展,以及器件、處理能力的提升,其自主化程度顯著提升,可以預見隨著人工智能技術與航天的深入融合,必然將引導著陸器向完全智能化發(fā)展。同時隨著智能化程度的變化,不僅會增加對著陸環(huán)境的檢測精度及效率,同時會提升在線的解算及決策能力,結合之前多樣化的制導方案,通過不斷的學習,可以預見軟著陸能力逐漸向環(huán)境自適應發(fā)展。
現(xiàn)有的軟著陸技術在精度、穩(wěn)定性、魯棒性等方面都存在不足,無法滿足未來密集、復雜探測任務新的能力要求。很難為后續(xù)月球/火星定點采樣返回,月面/火星表面大范圍巡視,地外基地建設,以及原位資源利用等任務提供有效保障,故基于上述回顧及分析,下面從三個層面淺析面臨的挑戰(zhàn)。
1)技術層關鍵問題
技術急需迭代創(chuàng)新,智能學習有望突破。傳統(tǒng)的給定軌道及優(yōu)化思想實現(xiàn)的軟著陸制導,很大程度上依賴于先驗知識,比如模型、約束、環(huán)境等,缺乏對不同任務設計的通用性,同時容易受建模偏差、不確定擾動等因素影響,且相當一部分基于優(yōu)化的方法難以在線使用。而隨著深度強化學習的興起,給智能化著陸制導提供了新的思路,可以從數(shù)據(jù)的角度去擺脫對模型的依賴,通過端到端的設計去簡化考慮擾動帶來的影響,完全依靠神經(jīng)網(wǎng)絡實現(xiàn)學習,但因其黑盒的操作模式,存在著強不可解釋性,無法保證運行的可靠和收斂;同時,對于訓練數(shù)據(jù)的獲取,以及如何實現(xiàn)在有限數(shù)據(jù)樣本或者差異數(shù)據(jù)樣本條件下的魯棒學習等等都是值得后續(xù)研究的關鍵。綜上,如何讓傳統(tǒng)制導方法高效化、輕量化、通用化,以及如何讓學習制導方法可解釋、可證明、可泛化是技術層亟待解決的難題。
2)系統(tǒng)層關鍵問題
系統(tǒng)急需綜合優(yōu)化,一體化設計勢在必行。軟著陸的成功與否,精度是否滿足要求,除了算法本身的性能,同時與導航、控制、結構等多個環(huán)境存在耦合關聯(lián),準確的導航信息獲取、可靠的控制指令執(zhí)行都是決定成敗的關鍵。目前系統(tǒng)之間多采取模塊化設計,通過接口來實現(xiàn)互聯(lián),即使有提出一體化設計思路,但是在工程實踐方面還是很難完全保證,而對于之間的關聯(lián)還未有深入研究,什么類型的感知信息是最適合當前任務制導解算的,生成何種形式的制導指令是控制系統(tǒng)最佳的輸入,可否通過給定任務實現(xiàn)從選型到技術實現(xiàn)的自適應設計,從系統(tǒng)本身更有研究的價值。綜上,如何實現(xiàn)軟/硬件靈活設計、感知/制導/控制/通信一體化融合設計是系統(tǒng)層需要考慮的難題。
3)任務層關鍵問題
任務趨于定制化,組件模塊化、流程標準化的泛化設計尤為重要。除了已經(jīng)開展的月球、火星軟著陸任務,后續(xù)還將會拓展到其它地外天體,環(huán)境的差異(大氣、密度分布、光照、輻射等)、干擾源的不同都會提出新的挑戰(zhàn);同時,面對未來大密度開展的月球開發(fā)任務,比如復雜月背、極區(qū)、永久陰影區(qū)等未知區(qū)域的探測,對快速障礙檢測、自適應自主避障等方面都有由嚴格的要求;再者,高昂的任務成本,難以接受不靈活的設計方案,更加看重方案的通用性。綜上,如何基于任務出發(fā),實現(xiàn)適應多種環(huán)境、約束條件下的成本可控、通用化、標準化的軟著陸制導系統(tǒng)是任務層考慮的關鍵。
本文對月球及火星探測任務進行了回顧,分別整理了到目前已經(jīng)開展或即將開展的任務序列表,并就其任務發(fā)展的趨勢及變化進行了分析。同時,針對探測過程中關鍵的軟著陸過程進行了闡述,并總結整理了目前軟著陸制導技術的發(fā)展體系,最后著重分析了該技術的發(fā)展趨勢,以及制約其發(fā)展的關鍵問題。通過本文的梳理,意在為后續(xù)的探測發(fā)展以及學術研究提供可行的參考。