(北京控制工程研究所,北京 100094)
目前我國(guó)大多數(shù)航天器仍采用地面遙控遙測(cè)的控制方法,地面飛控人員預(yù)先設(shè)計(jì)航天器的飛行程序,編排飛行事件,據(jù)此生成航天器的在軌注入指令。在執(zhí)行飛控任務(wù)時(shí),以指令序列的形式將指令批量發(fā)送至航天器,通過(guò)地面遙測(cè)信息確認(rèn)指令的執(zhí)行情況和各部件的狀態(tài)。對(duì)深空探測(cè)航天器而言,由于遠(yuǎn)距離產(chǎn)生的通信延遲,這種傳統(tǒng)的控制方式無(wú)法滿足對(duì)觀測(cè)信息處理和決策的實(shí)時(shí)要求[1-2]。以月球探測(cè)飛行器為例,與地面之間的往返時(shí)延是高軌道航天器的10倍以上,且只有當(dāng)被探測(cè)的月面區(qū)域處于地面測(cè)控站測(cè)控區(qū)間內(nèi)時(shí)才能與地面站建立通信鏈路。另外,由于飛行距離遠(yuǎn)、任務(wù)時(shí)間長(zhǎng)、環(huán)境未知性較強(qiáng)等因素,導(dǎo)致對(duì)探測(cè)器的可靠性和生存能力也提出了更高要求。
以美國(guó)NASA“新盛世”計(jì)劃“深空一號(hào)(DS-1)”飛行任務(wù)中自主管理技術(shù)的成功應(yīng)用為代表,航天器自主管理技術(shù)使解決該問(wèn)題成為可能[3-5]。DS-1具有很強(qiáng)的自主能力,能夠自主執(zhí)行拍照序列規(guī)劃、圖像處理和分析、軌道和姿態(tài)確定、軌道修正等任務(wù),如軌道修正和圖像處理等過(guò)去需要大量人員參與的任務(wù)都由器上自主完成,甚至不需要地面確認(rèn)結(jié)果,相比Cassini、Galileo項(xiàng)目,地面導(dǎo)航小組人員數(shù)量由7~10人降低至4~5人。NASA在DS-1的基礎(chǔ)上,又先后在對(duì)地觀測(cè)項(xiàng)目(EO-1)和火星探測(cè)項(xiàng)目中進(jìn)行應(yīng)用[6-7],指揮人員只需向航天器發(fā)送高級(jí)的、抽象的任務(wù)目標(biāo),航天器就能根據(jù)接收的任務(wù)和自身的狀況產(chǎn)生出合理的行動(dòng)序列。當(dāng)遇到突發(fā)情況時(shí),航天器還能自主調(diào)整任務(wù)目標(biāo),以適應(yīng)突發(fā)情況。
航天器自主管理系統(tǒng)的主要功能包括:自主任務(wù)規(guī)劃、自主故障診斷及系統(tǒng)重構(gòu)、自主生成指令序列等。目前,國(guó)外典型的航天器自主控制系統(tǒng)都采用了基于遠(yuǎn)程智能體(Remote Agent,RA)的自主管理體系架構(gòu)[8]。該體系架構(gòu)主要具有自主規(guī)劃和診斷的能力:① 自主規(guī)劃旨在降低深空探測(cè)任務(wù)對(duì)地面站操控的依賴(lài),以提高實(shí)時(shí)控制能力和故障應(yīng)對(duì)能力,保證在軌長(zhǎng)期穩(wěn)定運(yùn)行;② 自主故障診斷是通過(guò)自主管理軟件對(duì)比模型預(yù)期和系統(tǒng)實(shí)際間的差異,從而發(fā)現(xiàn)故障。例如,NASA開(kāi)發(fā)的Livingstone軟件系統(tǒng)是一個(gè)基于定性模型的故障診斷和恢復(fù)引擎,實(shí)現(xiàn)了在線故障診斷功能[8-11]。
隨著以月球探測(cè)工程和天問(wèn)一號(hào)火星探測(cè)為代表的深空探測(cè)任務(wù)順利實(shí)施,小行星及其他行星等探測(cè)任務(wù)逐步進(jìn)入關(guān)鍵技術(shù)攻關(guān)階段,其對(duì)航天器自主管理能力提出了更為迫切的需求[12]。本文結(jié)合我國(guó)深空探測(cè)航天器控制系統(tǒng)信息體系結(jié)構(gòu)現(xiàn)狀,對(duì)未來(lái)深空探測(cè)航天器自主管理體系結(jié)構(gòu)和軟件架構(gòu)進(jìn)行了探討。
借鑒國(guó)外航天器遠(yuǎn)程智能體的設(shè)計(jì)思想,我國(guó)深空探測(cè)器控制系統(tǒng)由自主管理功能模塊和傳統(tǒng)控制軟件兩部分構(gòu)成,其關(guān)系如圖1所示。自主管理體系結(jié)構(gòu)可由以下3個(gè)功能模塊組成,即規(guī)劃和調(diào)度模塊、故障診斷和重構(gòu)模塊及智能執(zhí)行模塊。
規(guī)劃和調(diào)度模塊負(fù)責(zé)平衡規(guī)劃目標(biāo)和約束條件的矛盾沖突,將高級(jí)命令分解成低級(jí)指令,從而確保規(guī)劃結(jié)果滿足航天器資源約束。
深空探測(cè)器是一個(gè)包括時(shí)間和資源信息等多種約束的復(fù)雜系統(tǒng),例如,它包括調(diào)度問(wèn)題中的時(shí)間約束、具有不同時(shí)間區(qū)間和資源的活動(dòng)、優(yōu)化問(wèn)題等,還包括規(guī)劃問(wèn)題中的活動(dòng)選擇,因此它既具有規(guī)劃特性又具有調(diào)度特性。隨著規(guī)劃技術(shù)和人工智能技術(shù)的結(jié)合,航天器自主任務(wù)規(guī)劃技術(shù)逐漸形成兩大分支,即以動(dòng)作為核心的傳統(tǒng)規(guī)劃和以狀態(tài)為核心的時(shí)間線規(guī)劃。
圖1 深空探測(cè)航天器自主管理系統(tǒng)框圖
傳統(tǒng)規(guī)劃規(guī)劃方法主要以處理動(dòng)作邏輯順序?yàn)橹黧w,包括圖規(guī)劃、鄰域無(wú)關(guān)的啟發(fā)式搜索、類(lèi)經(jīng)典規(guī)劃等。傳統(tǒng)規(guī)劃技術(shù)發(fā)展較為完善、算法效率高,在機(jī)器人規(guī)劃、生產(chǎn)車(chē)間調(diào)度等多個(gè)領(lǐng)域得到應(yīng)用,其缺點(diǎn)是無(wú)法簡(jiǎn)潔直觀地表述航天領(lǐng)域任務(wù)規(guī)劃的顯著時(shí)間特性和復(fù)雜約束關(guān)系,易造成建模的不精確和知識(shí)搜索空間增大[13]。
時(shí)間線規(guī)劃是以處理時(shí)序狀態(tài)約束為主體,通過(guò)時(shí)間線顯示探測(cè)器控制系統(tǒng)狀態(tài)變化和約束關(guān)系,在一定程度上彌補(bǔ)了傳統(tǒng)規(guī)劃技術(shù)的不足,更適合未來(lái)深空探測(cè)技術(shù)的發(fā)展趨勢(shì)。
規(guī)劃和調(diào)度模塊的設(shè)計(jì)思想是通過(guò)使用狀態(tài)時(shí)間線知識(shí)表示方法實(shí)現(xiàn)基于航天器模型、活動(dòng)約束和飛行規(guī)則的航天器自主任務(wù)規(guī)劃。規(guī)劃系統(tǒng)通過(guò)使用等級(jí)分解和重復(fù)修補(bǔ)的方法,將高級(jí)的狀態(tài)變量描述為一條時(shí)間變化線,并用標(biāo)志(Token)來(lái)描述一個(gè)時(shí)間線上的具有一定時(shí)間區(qū)間的狀態(tài)常量。規(guī)劃算法通過(guò)放置這些標(biāo)志,使其滿足所有的資源和時(shí)間約束。規(guī)劃系統(tǒng)使用時(shí)間窗口表示標(biāo)志的開(kāi)始和結(jié)束時(shí)間點(diǎn),在創(chuàng)建和執(zhí)行調(diào)度時(shí)都給系統(tǒng)帶來(lái)了很大的靈活性。圖2給出以軌道控制為例進(jìn)行自主規(guī)劃的示例。軌道控制是將航天器由原來(lái)軌道轉(zhuǎn)變?yōu)槠谕壍浪M(jìn)行的控制;軌控發(fā)動(dòng)機(jī)開(kāi)機(jī)前通常需要進(jìn)行預(yù)熱等準(zhǔn)備工作,實(shí)現(xiàn)軌道控制首先要進(jìn)行姿態(tài)調(diào)節(jié)(由姿態(tài)a調(diào)至姿態(tài)b),使軌控發(fā)動(dòng)機(jī)推力矢量方向與期望指向相同,根據(jù)指令進(jìn)行發(fā)動(dòng)機(jī)點(diǎn)火(開(kāi)機(jī)200 s),到達(dá)預(yù)期速度增量后發(fā)動(dòng)機(jī)關(guān)機(jī),待姿態(tài)穩(wěn)定后,恢復(fù)軌控初始姿態(tài)(由姿態(tài)b調(diào)至姿態(tài)a)。
故障診斷和重構(gòu)模塊采用基于探測(cè)器模型的診斷方法,跟蹤航天器上控制系統(tǒng)的執(zhí)行情況,并基于智能執(zhí)行模塊的指令以及監(jiān)測(cè)模塊的輸出診斷硬件狀態(tài)并反饋給智能執(zhí)行模塊,還可以基于探測(cè)器系統(tǒng)總體情況輔助生成容錯(cuò)策略。
圖2 時(shí)間線規(guī)劃示例
故障診斷和重構(gòu)模塊由離散系統(tǒng)模型和系統(tǒng)狀態(tài)跟蹤算法構(gòu)成。通過(guò)使用一組多層次的定性邏輯模型來(lái)描述系統(tǒng)的行為,能夠在最小人工干預(yù)的情況下高效、魯棒地完成航天器或者其他復(fù)雜系統(tǒng)的故障檢測(cè)和診斷任務(wù),并且具有診斷并發(fā)多項(xiàng)故障等諸多功能[14-15]。其推理引擎不僅可以基于定性模型搜索故障,而且可以跟蹤和預(yù)報(bào)航天器的運(yùn)行狀態(tài)。它主要由兩部分組成:① 通用診斷引擎(General Diagnostic Engine,GDE),采用命題邏輯和沖突直接搜索的通用設(shè)計(jì),包括MI(Mode Identification,模式辨識(shí)) 和MR (Mode Reconfiguration,模式重構(gòu))兩部分;② 被診斷航天器的定性模型。利用定性表述和命題編輯對(duì)不同飛行器診斷對(duì)象進(jìn)行建模。圖3為故障診斷和重構(gòu)工作過(guò)程示意圖。
圖3 故障診斷和重構(gòu)工作示意圖
智能執(zhí)行模塊負(fù)責(zé)管理遙控指令接收,發(fā)起規(guī)劃申請(qǐng),根據(jù)規(guī)劃結(jié)果生成控制軟件的指令序列,并根據(jù)指令執(zhí)行結(jié)果決定是否發(fā)起重新規(guī)劃。
參照?qǐng)D1所示的系統(tǒng)框圖,表1給出了飛行任務(wù)剖面中自主管理各模塊的功能。
將自主管理模塊視為黑盒嵌入到傳統(tǒng)探測(cè)器飛行軟件中,如圖4所示。自主管理模塊包括5個(gè)軟件接口函數(shù):地面遙控指令接收接口、探測(cè)器狀態(tài)監(jiān)測(cè)采集接口、規(guī)劃調(diào)度模塊擴(kuò)展接口和故障診斷專(zhuān)家?guī)鞌U(kuò)展接口、規(guī)劃指令輸出接口。
表1 自主管理模塊功能說(shuō)明
圖4 軟件結(jié)構(gòu)圖
由地面發(fā)送“探測(cè)器軌道入射”高級(jí)遙控指令,探測(cè)器接收到地面遙控指令后發(fā)送給智能執(zhí)行模塊,智能執(zhí)行模塊負(fù)責(zé)向規(guī)劃和調(diào)度模塊發(fā)起規(guī)劃申請(qǐng),規(guī)劃和調(diào)度模塊根據(jù)約束條件進(jìn)行規(guī)劃,規(guī)劃完成后將結(jié)果發(fā)送給智能執(zhí)行模塊。智能執(zhí)行模塊監(jiān)測(cè)到生成規(guī)劃結(jié)果后,將規(guī)劃結(jié)果生成指令序列發(fā)送給飛行軟件。智能執(zhí)行模塊根據(jù)飛行軟件反饋數(shù)據(jù)或者故障診斷和重構(gòu)模塊(Mode Identification and Reconfiguration,MIR)推斷結(jié)果來(lái)確定指令是否正確執(zhí)行。若監(jiān)測(cè)指令執(zhí)行失敗,智能執(zhí)行模塊會(huì)采用替代方案或者由故障診斷和重構(gòu)模塊重構(gòu)方案再次申請(qǐng)規(guī)劃。如果智能執(zhí)行模塊無(wú)法執(zhí)行或修復(fù)當(dāng)前規(guī)劃,則取消規(guī)劃,清除執(zhí)行指令,將控制系統(tǒng)進(jìn)入安全模式。軟件執(zhí)行時(shí)序如圖5所示。
圖5 軟件執(zhí)行時(shí)序
以深空探測(cè)器行星軌道入射為場(chǎng)景,在Visual Studio開(kāi)發(fā)環(huán)境中搭建閉環(huán)仿真系統(tǒng),對(duì)探測(cè)器自主管理技術(shù)的實(shí)現(xiàn)進(jìn)行某些任務(wù)功能性初步仿真實(shí)驗(yàn)。深空探測(cè)器由巡航段轉(zhuǎn)入環(huán)繞段的軌道入射任務(wù)通常需要執(zhí)行以下幾個(gè)步驟。
① 變軌前自主進(jìn)行敏感器標(biāo)定、校準(zhǔn)。
② 自主執(zhí)行自主導(dǎo)航任務(wù)以精確確定探測(cè)器軌道。
③ 根據(jù)導(dǎo)航結(jié)果自主執(zhí)行制導(dǎo)律,計(jì)算軌控姿態(tài)、軌控速度增量。
④ 自主進(jìn)行姿態(tài)機(jī)動(dòng)、控制天線指向,向地面下傳導(dǎo)航信標(biāo)星和目標(biāo)星圖像信息。
⑤ 變軌前保持對(duì)日姿態(tài),控制帆板對(duì)日。
⑥ 軌控發(fā)動(dòng)機(jī)預(yù)熱。
⑦ 變軌姿態(tài)調(diào)整至預(yù)定指向、帆板自主控制。
⑧ 軌控發(fā)動(dòng)機(jī)開(kāi)機(jī),自主進(jìn)行姿態(tài)控制,監(jiān)測(cè)軌控速度增量、發(fā)動(dòng)機(jī)狀態(tài)。
⑨ 速度增量到達(dá)自主關(guān)閉軌控發(fā)動(dòng)機(jī)。
⑩ 姿態(tài)穩(wěn)定后恢復(fù)對(duì)日指向。
深空探測(cè)器行星軌道入射任務(wù)可描述為一組時(shí)間線,每條時(shí)間線上根據(jù)時(shí)間關(guān)系排列著探測(cè)器對(duì)應(yīng)子系統(tǒng)的狀態(tài),多組時(shí)間線共同定義了探測(cè)器在工作過(guò)程中的活動(dòng)流程。通過(guò)自主規(guī)劃模塊將這些標(biāo)志在各自的時(shí)間線上進(jìn)行排列,使其滿足時(shí)間、資源和飛行安全規(guī)則的約束限制。任務(wù)規(guī)劃的結(jié)果如圖6所示。
圖6 任務(wù)規(guī)劃結(jié)果
圖7~圖9為軌控發(fā)動(dòng)機(jī)開(kāi)機(jī)期間分別注入發(fā)動(dòng)機(jī)故障時(shí),軌控過(guò)程中姿態(tài)控制及軌控速度增量仿真曲線。可以看出軌控速度增量保持一段時(shí)間不變后,航天器自主診斷出發(fā)動(dòng)機(jī)故障,切換發(fā)動(dòng)機(jī)組后,繼續(xù)進(jìn)行正常軌控直到軌控速度增量遞減到0 m/s結(jié)束。
筆者結(jié)合國(guó)外深空探測(cè)航天器自主管理技術(shù)的發(fā)展,提出未來(lái)我國(guó)航天器控制系統(tǒng)自主管理體系結(jié)構(gòu),通過(guò)仿真實(shí)驗(yàn)表明采用以“規(guī)劃和調(diào)度”和“故障診斷和重構(gòu)”為內(nèi)核的自主管理軟件架構(gòu),可有效解決航天器在軌應(yīng)對(duì)能力、提升飛控實(shí)效性需求,且對(duì)現(xiàn)有控制系統(tǒng)信息體系結(jié)構(gòu)具有較好的兼容性。在此基礎(chǔ)上,后續(xù)將進(jìn)一步通過(guò)構(gòu)建應(yīng)用任務(wù)域模型,研究基于狀態(tài)的自主規(guī)劃方法和基于深度神經(jīng)網(wǎng)絡(luò)構(gòu)建控制系統(tǒng)知識(shí)庫(kù)的可行性,從而提升故障診斷系統(tǒng)性能以及普適性。
圖7 軌控姿態(tài)角控制
圖8 軌控角速度控制
圖9 軌控速度增量