董云峰 李洪玨 王赟
(北京航空航天大學(xué),北京 100191)
空間操作中的靈巧飛行控制方法
董云峰 李洪玨 王赟
(北京航空航天大學(xué),北京 100191)
空間操作中的靈巧飛行控制是指通過模仿生物的決策與運(yùn)動方式,采用多種執(zhí)行機(jī)構(gòu)相互配合協(xié)調(diào)控制完成空間操作任務(wù),在任務(wù)過程中能夠進(jìn)行實時決策且各項性能指標(biāo)均能達(dá)到最優(yōu)。文章引入靈巧控制的思想,提出了一種靈巧飛行控制方法。按照生物運(yùn)動協(xié)調(diào)的方式,采用冗余執(zhí)行機(jī)構(gòu)各取所長協(xié)同配合,利用計算智能結(jié)合人類智慧完成對失效衛(wèi)星的接近軌跡規(guī)劃,實現(xiàn)抓捕過程中可達(dá)性、精準(zhǔn)性、敏捷性、平順性與魯棒性的全優(yōu)。采用神經(jīng)網(wǎng)絡(luò)完成對軌跡規(guī)劃結(jié)果的學(xué)習(xí),將規(guī)劃和控制合二為一。對失效衛(wèi)星的跟瞄、接近和捕獲過程仿真表明:采用傳統(tǒng)規(guī)劃與控制方法的服務(wù)衛(wèi)星無法在失效衛(wèi)星狀態(tài)突變時完成抓捕,而采用靈巧飛行控制方法的服務(wù)衛(wèi)星,在失效衛(wèi)星翻滾狀態(tài)發(fā)生突變時能進(jìn)行快速決策,成功對失效衛(wèi)星進(jìn)行捕獲,且接近抓捕過程的性能指標(biāo)比失效衛(wèi)星翻滾狀態(tài)未突變時幾乎沒有損失,從而驗證了靈巧飛行控制方法的可行性和有效性。
空間操作;靈巧飛行控制;失效衛(wèi)星在軌捕獲;計算智能;機(jī)器學(xué)習(xí)
空間操作任務(wù)是指一個航天器為實現(xiàn)某種目的而針對其他一個或多個航天器進(jìn)行運(yùn)動控制和操作。典型的空間操作包括對空間目標(biāo)的觀測和失效衛(wèi)星的捕獲。有別于傳統(tǒng)的對地觀測,對空間目標(biāo)的觀測是在2個航天器有相對視線運(yùn)動情況下完成的,是在運(yùn)動中快速精確穩(wěn)定成像。有別于傳統(tǒng)的交會對接[1-2],失效衛(wèi)星沒有配合服務(wù)衛(wèi)星的相對運(yùn)動敏感器和對接裝置[3-4],且一般繞主軸作自旋運(yùn)動并伴隨有章動。為避免產(chǎn)生碎片危及自身和其他航天器安全,服務(wù)衛(wèi)星要完成復(fù)雜的軌道、姿態(tài)、機(jī)械臂的協(xié)同控制才能無沖擊地抓住失效衛(wèi)星。因此,空間操作相比傳統(tǒng)規(guī)劃控制,是在狀態(tài)估計測量存在嚴(yán)重不確定性的情況下,同時提高飛行的可達(dá)性、精準(zhǔn)性、平順性等性能指標(biāo),并要具備實時快速決策能力。
傳統(tǒng)控制方法一般采用單一執(zhí)行機(jī)構(gòu)、在有限的不確定性下實施控制。當(dāng)任務(wù)約束增多、不確定性增強(qiáng)時,航天器控制性能下降,過于復(fù)雜的任務(wù)還要依賴地面進(jìn)行任務(wù)規(guī)劃后按照規(guī)劃結(jié)果實施控制,難以滿足空間操作任務(wù)的控制性能要求和實時性要求。文獻(xiàn)[5]中的研究表明,現(xiàn)有運(yùn)動控制理論框架與大量觀察到的生物運(yùn)動[6-9]不符,自然界生物并不是先想好如何運(yùn)動再執(zhí)行動作,而是在執(zhí)行動作的過程中將規(guī)劃與控制合二為一,在控制過程中利用冗余帶來靈巧性,并將冗余一直留到最后用于解決運(yùn)動過程中出現(xiàn)的不確定性。若將文獻(xiàn)[5]中的思想翻譯為靈巧控制,那么靈巧控制中的靈巧應(yīng)包含兩方面的內(nèi)涵,一是巧妙,即通過冗余自由度的協(xié)調(diào)實現(xiàn)多指標(biāo)全優(yōu);二是靈活,即將冗余自由度一直保留到用于應(yīng)對突發(fā)的不確定性。靈巧控制思想已在機(jī)電系統(tǒng)[10-12]和航天領(lǐng)域[13-14]中得到應(yīng)用,但在高度不確定的復(fù)雜任務(wù)中,仍然依賴計算智能方法完成任務(wù)規(guī)劃,其計算資源消耗對只具備有限計算能力的航天器計算機(jī)而言是難以想象的。與此相反,生物是通過長期大量的學(xué)習(xí)后實現(xiàn)一體化的實時規(guī)劃控制。正如文獻(xiàn)[15]中指出,熟練的打鐵動作只有老資歷的鐵匠才能做到,而不是鐵匠鋪的學(xué)徒。與生物學(xué)習(xí)類似,利用機(jī)器學(xué)習(xí)方法提高機(jī)器控制決策的智能化和快速性已在其他領(lǐng)域得到廣泛研究[16-18]。雖然靈巧控制思想已得到廣泛應(yīng)用,但在空間操作任務(wù)中還沒有人對其給出明確的定義。本文建議在空間操作任務(wù)中運(yùn)用上述思想進(jìn)行的航天器飛行控制方法稱為靈巧飛行控制(Dexterous Flight Control),指航天器的軌道控制推力器、姿態(tài)控制飛輪等多種執(zhí)行機(jī)構(gòu)像人的手腳軀干一樣相互配合協(xié)調(diào)控制,使航天器在完成空間操作任務(wù)時具備運(yùn)動范圍大、響應(yīng)速度快、控制精度高和運(yùn)動過程平順穩(wěn)定的特點(diǎn)。
本文引入靈巧控制思想,提出執(zhí)行空間操作任務(wù)的航天器靈巧飛行控制方法。結(jié)合計算智能與機(jī)器學(xué)習(xí),探討該方法在應(yīng)對各種突發(fā)不確定性時仍能實時進(jìn)行決策、保證多任務(wù)指標(biāo)全優(yōu)的可行性。
靈巧控制是一個寬泛的概念,凡是采用冗余執(zhí)行機(jī)構(gòu)的對象都可以進(jìn)行靈巧控制。將靈巧控制的概念用于軌道機(jī)動、姿態(tài)機(jī)動、對地凝視、空間操作等各類航天器控制中,即為靈巧飛行控制。
在空間操作任務(wù)中,航天器的冗余執(zhí)行機(jī)構(gòu)一般包括軌道控制發(fā)動機(jī)、姿態(tài)控制推力器、控制力矩陀螺、飛輪和精密輪等各種動量交換裝置和多自由度機(jī)械臂關(guān)節(jié)電機(jī)。應(yīng)根據(jù)各執(zhí)行機(jī)構(gòu)的不同特性來設(shè)計其應(yīng)用策略。推力器是能力最強(qiáng)的執(zhí)行機(jī)構(gòu),因此用于進(jìn)行大角度姿態(tài)機(jī)動以快速消除角度偏差,同時還用于消除常值干擾和對飛輪進(jìn)行卸載??刂屏赝勇菥邆鋬H次于推力器的力矩輸出能力,又具備較高的控制精度,但成組應(yīng)用時存在奇異性,因此用于保證控制過程由粗到精的過渡。飛輪能夠提供小幅值但精度較高的力矩,因此用于補(bǔ)償控制力矩陀螺的不確定性,同時協(xié)助控制力矩陀螺逃離奇異。精密輪采用超聲電機(jī)驅(qū)動轉(zhuǎn)子,工作在步進(jìn)模式,在姿態(tài)趨于穩(wěn)定時能夠達(dá)到很高的控制精度,因此用于補(bǔ)償飛輪的不確定性,同時提高穩(wěn)態(tài)控制精度。
冗余執(zhí)行機(jī)構(gòu)控制可以分為3個階段:①推力器大角度姿態(tài)機(jī)動;②控制力矩陀螺與飛輪的過度協(xié)調(diào)控制;③精密輪的精細(xì)控制。這3個階段并不是簡單的串聯(lián)或并聯(lián),而是存在交叉和混合。通過采用優(yōu)化算法(如粒子群優(yōu)化)、選取合適的性能指標(biāo)(如三軸姿態(tài)角偏差小于期望值的時刻或控制過程中的能量消耗),可以對交叉時間進(jìn)行優(yōu)化,得到最優(yōu)的交叉混合方式。
冗余執(zhí)行機(jī)構(gòu)中,飛輪和精密輪需要分別具備補(bǔ)償控制力矩陀螺和飛輪不確定性的能力??刂屏赝勇莸牟淮_定性,主要包括自身控制精度帶來的不確定性T1和響應(yīng)頻率帶來的不確定性T2。另外,飛輪需要額外提供幫助控制力矩陀螺逃離奇異的力矩T3和補(bǔ)償高于控制力矩陀螺控制頻率的高頻干擾幅值A(chǔ)。因此,飛輪所能提供的力矩Tw應(yīng)滿足
在飛輪控制過程中,同樣具備由響應(yīng)頻率帶來的不確定性T4,以及自身控制精度帶來的不確定性T5,若飛輪一個控制周期內(nèi)所產(chǎn)生的不確定性累計高于高頻干擾的幅值A(chǔ),即T4+T5≤A,那么高頻干擾應(yīng)由精密輪控制。
空間操作中的靈巧飛行控制通過冗余執(zhí)行機(jī)構(gòu)和計算智能實現(xiàn)多指標(biāo)全優(yōu),通過機(jī)器學(xué)習(xí)提高響應(yīng)快速性。在靈巧飛行控制能力的實現(xiàn)過程中,人一般需要進(jìn)行任務(wù)工況選取、數(shù)字建模、計算智能性能指標(biāo)設(shè)計、機(jī)器學(xué)習(xí)參數(shù)設(shè)計等工作,如圖1所示。
失效衛(wèi)星在軌捕獲是空間操作中最具價值的任務(wù)之一。下文針對失效衛(wèi)星在軌捕獲任務(wù),討論靈巧飛行控制方法的實現(xiàn)。需要注意的是,失效衛(wèi)星在軌捕獲任務(wù)與空間運(yùn)動目標(biāo)觀測等其他航天任務(wù)相比,雖然在控制對象和任務(wù)目標(biāo)上有差異,但均存在不確定性大、復(fù)雜程度高、任務(wù)要求和任務(wù)評價指標(biāo)眾多的特點(diǎn)。針對這類任務(wù),靈巧飛行控制方法均適用。
2.1 基于計算智能的靈巧飛行控制
傳統(tǒng)控制方法傾向于將任務(wù)分解為多個過程,每個過程中僅考慮一個性能指標(biāo)要求,并且采用一個執(zhí)行機(jī)構(gòu)完成該過程。空間操作中的靈巧飛行控制重點(diǎn)則在于冗余執(zhí)行機(jī)構(gòu)的協(xié)調(diào),通過優(yōu)缺點(diǎn)各異的多個執(zhí)行機(jī)構(gòu)的相互配合,實現(xiàn)可達(dá)性、快速性、精準(zhǔn)性、敏捷性、穩(wěn)定性、平順性和魯棒性的全部最優(yōu)。多指標(biāo)全優(yōu)是通過人類智慧和計算智能共同保證的。結(jié)合人的智慧和計算智能,可在數(shù)字空間得到對任意工況在任意性能指標(biāo)要求下的最優(yōu)規(guī)劃結(jié)果,如圖2所示。圖2中,人的智慧和計算智能方法都是可擴(kuò)展的,可隨著科學(xué)技術(shù)的發(fā)展吸納更加先進(jìn)的人類智慧和計算智能方法。
對于圖3所示的服務(wù)衛(wèi)星接近與捕獲失效衛(wèi)星的任務(wù),可采用高斯偽譜法[19]完成對失效衛(wèi)星的接近軌跡規(guī)劃;然后通過數(shù)學(xué)方法進(jìn)行規(guī)劃或優(yōu)化求解,得到滿足各種約束且性能指標(biāo)最優(yōu)的解。圖3中,OoXoYoZo為失效衛(wèi)星軌道坐標(biāo)系,OiXiYiZi為地心慣性坐標(biāo)系,OTbXTbYTbZTb為失效衛(wèi)星本體坐標(biāo)系,OCbXCbYCbZCb為服務(wù)衛(wèi)星本體坐標(biāo)系,r為兩星間相對位置矢量。
在高斯偽譜法中,首先確定規(guī)劃問題的狀態(tài)量和控制量,失效衛(wèi)星接近軌跡規(guī)劃問題中的狀態(tài)量選取為服務(wù)衛(wèi)星相對失效衛(wèi)星的3軸相對位置r、3軸相對速度v,服務(wù)衛(wèi)星3軸角速度ωC、失效衛(wèi)星3軸角速度ωT,3軸相對位置和相對速度在失效衛(wèi)星軌道系下的坐標(biāo)為[rxryrz]和[vxvyvz],服務(wù)衛(wèi)星和失效衛(wèi)星的3軸角速度在慣性系下的坐標(biāo)為 [ωCxωCyωCz]和 [ωTxωTyωTz],服務(wù)衛(wèi)星姿態(tài)四元數(shù)qC=[qC0qC1qC2qC3],失效衛(wèi)星姿態(tài)四元數(shù)qT=[qT0qT1qT2qT3],分別描述了服務(wù)衛(wèi)星和失效衛(wèi)星本體系相對于慣性系的姿態(tài),共計20個狀態(tài)量[19-20]。
控制量為服務(wù)衛(wèi)星的3軸控制力[FxFyFz]和3軸控制力矩[MxMyMz],即
確定接近過程的性能指標(biāo),最優(yōu)控制問題的性能指標(biāo)一般表示為
式中:與控制量有關(guān)的函數(shù)f(u)可表示為式(4);t0和tf為規(guī)劃問題的初始時刻和終端時刻。
式中:P0為時間指標(biāo)的權(quán)重系數(shù),取0則為燃料最優(yōu);P1~P6為燃料指標(biāo)的權(quán)重系數(shù),均取0為時間最優(yōu),均大于0為時間燃料多目標(biāo)優(yōu)化。
確定接近問題的約束條件,包括初始約束、終端約束、過程約束和狀態(tài)量約束。
初始約束即為服務(wù)衛(wèi)星相對失效衛(wèi)星的初始相對位置、相對速度,以及服務(wù)衛(wèi)星和失效衛(wèi)星的初始姿態(tài)角和角速度。
終端約束包括接近終端的繞飛位置約束、繞飛速度約束、繞飛姿態(tài)約束和繞飛角速度約束。
在失效衛(wèi)星軌道坐標(biāo)系下,繞飛位置約束為
式中:Lob為失效衛(wèi)星本體坐標(biāo)系到軌道坐標(biāo)系的坐標(biāo)轉(zhuǎn)換矩陣;[dxdydz]T為失效衛(wèi)星對接點(diǎn)d在其本體坐標(biāo)系下的坐標(biāo)。
在失效衛(wèi)星軌道坐標(biāo)系下,繞飛速度約束為
繞飛姿態(tài)角和角速度約束為
過程約束包括動力學(xué)約束和路徑約束。動力學(xué)約束包括相對運(yùn)動動力學(xué)方程(如C-W方程)、姿態(tài)動力學(xué)方程和姿態(tài)運(yùn)動方程。路徑約束包括控制量約束、防撞約束和避障約束等??刂屏考s束一般為控制量大小不超過某個上限。防撞約束一般為服務(wù)衛(wèi)星飛行過程中與失效衛(wèi)星間的距離保持大于特定值。避障約束一般為服務(wù)衛(wèi)星飛行過程中保持與失效衛(wèi)星太陽翼等延伸機(jī)構(gòu)占據(jù)的特定空間的距離大于特定值。
狀態(tài)量約束即為上文中的20個狀態(tài)量等于特定的初始值。
最終得到的期望接近軌跡是包括時刻、相對位置、相對速度、相對姿態(tài)角、相對角速度在內(nèi)的一系列離散狀態(tài)量集合。
通過計算智能方法得到的接近軌跡,可能仍然不滿足接近任務(wù)的要求,需要人通過調(diào)整性能指標(biāo)、改變初始約束等方法進(jìn)行重新規(guī)劃,或者選取臨近的工況進(jìn)行重新規(guī)劃,或者將不滿足要求的規(guī)劃結(jié)果舍棄。另外,人還要參與確定機(jī)械臂關(guān)節(jié)轉(zhuǎn)動的初始時刻和轉(zhuǎn)動規(guī)律等不依賴計算智能獲取的規(guī)劃結(jié)果。
2.2 基于機(jī)器學(xué)習(xí)的靈巧飛行控制
空間操作中的靈巧飛行控制與運(yùn)動協(xié)調(diào)類似,規(guī)劃與控制是一個整體。通過對已有飛行規(guī)劃、飛行控制優(yōu)化過程及優(yōu)化結(jié)果的認(rèn)知與學(xué)習(xí),獲得規(guī)劃控制過程中的規(guī)律和知識,將其運(yùn)用于空間操作在線實時規(guī)劃與控制,可以避免長時間的地面離線計算,同時具備應(yīng)對各種來自環(huán)境、自身及目標(biāo)突發(fā)不確定性情況的能力,并且在發(fā)生不確定性情況下仍然能夠保證各任務(wù)指標(biāo)全部最優(yōu)。實時規(guī)劃與控制能力的實現(xiàn)是一個過程,需要對數(shù)字仿真產(chǎn)生的樣本和真實衛(wèi)星的運(yùn)行結(jié)果進(jìn)行長時間的學(xué)習(xí)訓(xùn)練,其學(xué)習(xí)周期可以很長,而一旦學(xué)習(xí)完畢,其規(guī)劃控制的執(zhí)行過程很快。
靈巧飛行控制實現(xiàn)過程中,可首先在數(shù)字空間中采用簡單理想模型進(jìn)行學(xué)習(xí)訓(xùn)練,然后逐步對數(shù)字空間中的各個對象進(jìn)行復(fù)雜化,進(jìn)一步引入工程試驗數(shù)據(jù)、測試數(shù)據(jù)乃至真實遙測數(shù)據(jù)來提高控制指標(biāo),甚至在將來還可能在真實衛(wèi)星飛行過程中實時學(xué)習(xí)。隨著新的仿真工況的設(shè)計和新的真實衛(wèi)星運(yùn)行數(shù)據(jù)的加入,靈巧飛行過程的各個指標(biāo)可以優(yōu)化得越來越好,如圖4所示。與第2.1節(jié)的人類智慧和計算智能類似,圖4中的機(jī)器學(xué)習(xí)方法也都是可擴(kuò)展的,可隨著科學(xué)技術(shù)的發(fā)展吸納更加先進(jìn)的機(jī)器學(xué)習(xí)方法。
對于失效衛(wèi)星接近與捕獲任務(wù),通過計算智能得到的一系列規(guī)劃結(jié)果是對各種確定工況的理想接近軌跡。采用神經(jīng)網(wǎng)絡(luò)對上述接近軌跡規(guī)劃結(jié)果進(jìn)行學(xué)習(xí)。針對每條規(guī)劃的接近軌跡,以接近軌跡末端為中心,以軌跡始端到末端間的距離差為半徑R,等距離取N個特征點(diǎn),與始端點(diǎn)和末端點(diǎn)一起共N+2個特征點(diǎn),如圖5所示。這些個特征點(diǎn)對應(yīng)的接近時刻、相對位置、相對速度、相對姿態(tài)角和相對角速度共同構(gòu)成一組數(shù)據(jù),作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練輸出。對捕獲工況進(jìn)行分析,得到每個規(guī)劃結(jié)果對應(yīng)的初始狀態(tài)作為神經(jīng)網(wǎng)絡(luò)的輸入,選取合適的網(wǎng)絡(luò)和網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí),并將學(xué)習(xí)得到的規(guī)律用于實際任務(wù)規(guī)劃中。
為了應(yīng)對失效衛(wèi)星發(fā)生不確定性姿態(tài)機(jī)動的情形,首先分別將每條期望接近軌跡劃分為若干段,在每段區(qū)間內(nèi)再分別針對失效衛(wèi)星可能不同的翻滾角速度采用高斯偽譜法重新進(jìn)行規(guī)劃,直至覆蓋所有位置和所有翻滾角速度,如圖6所示。
完成規(guī)劃后,可得到一系列在不同位置對應(yīng)失效衛(wèi)星不同翻滾角速度的接近軌跡規(guī)劃結(jié)果。以這些結(jié)果為樣本,進(jìn)行訓(xùn)練,得到的神經(jīng)網(wǎng)絡(luò)應(yīng)用于實際任務(wù)中,即可使服務(wù)衛(wèi)星具備應(yīng)對失效衛(wèi)星不確定性姿態(tài)機(jī)動的能力。
本節(jié)通過3個仿真算例論證靈巧飛行控制方法的可行性。其中:失效衛(wèi)星跟瞄算例用于驗證采用冗余執(zhí)行機(jī)構(gòu)實現(xiàn)多指標(biāo)全優(yōu)的可行性。基于計算智能的捕獲算例和基于機(jī)器學(xué)習(xí)的捕獲算例,用于論證規(guī)劃與控制一體化快速決策的可行性。
3.1 失效衛(wèi)星跟瞄
本文采用推力器、雙框架定速控制力矩陀螺(DGVSCMG)、飛輪和精密輪組成復(fù)合執(zhí)行機(jī)構(gòu),分別從控制時間、跟瞄精度、穩(wěn)定度和能量消耗的指標(biāo)出發(fā),比較采用復(fù)合執(zhí)行機(jī)構(gòu)與單獨(dú)采用DGVSCMG的跟瞄控制性能。假設(shè)在初始時刻服務(wù)衛(wèi)星運(yùn)行于地球靜止軌道,失效衛(wèi)星與服務(wù)衛(wèi)星存在較大的初始姿態(tài)偏差。DGVSCMG的控制效果如圖7所示,復(fù)合執(zhí)行機(jī)構(gòu)的控制效果如圖8所示,兩者的能量消耗隨時間變化情況見圖9。
將姿態(tài)精度達(dá)到0.005°、姿態(tài)穩(wěn)定度達(dá)到0.005(°)/s的時刻作為服務(wù)衛(wèi)星進(jìn)入穩(wěn)態(tài)的時刻T,則進(jìn)入穩(wěn)態(tài)的時刻T、指向精度α、穩(wěn)定度γ和能量消耗F結(jié)果對比如表1所示。
表1 DGVSCMG與復(fù)合執(zhí)行機(jī)構(gòu)控制性能對比Table 1 Comparison of control performances by DGVSCMG and multi-actuators
3.2 基于計算智能的失效衛(wèi)星捕獲
假設(shè)失效衛(wèi)星運(yùn)行于地球靜止軌道,繞其最大慣量軸以2(°)/s的角速度翻滾。采用高斯偽譜法進(jìn)行服務(wù)衛(wèi)星接近和圍繞失效衛(wèi)星的軌跡規(guī)劃[19-20],規(guī)劃狀態(tài)量的初始取值為[-10 0 0],[0 0 0],[0 0 0],[1.155 0.000 1.633],[1 0 0 0],[1 0 0 0]。性能指標(biāo)中的權(quán)重系數(shù)P0~P6取值分別為1.0,1.0,1.0,0.1,0.1,0.1,失效衛(wèi)星對接點(diǎn)d在其本體坐標(biāo)系下的坐標(biāo)為[-2 0 0]m。規(guī)劃計算總耗時36 min,在失效衛(wèi)星軌道坐標(biāo)系下的飛行軌跡如圖10所示。采用可直接伸展捕獲的5自由度機(jī)械臂進(jìn)行失效衛(wèi)星的捕獲,機(jī)械臂伸展時服務(wù)衛(wèi)星平臺的位置和姿態(tài)同時保持受控狀態(tài)。關(guān)節(jié)角速度和關(guān)節(jié)轉(zhuǎn)角運(yùn)動遵循三角函數(shù)規(guī)則,在第37 s時機(jī)械臂完成伸展實施抓捕。服務(wù)衛(wèi)星相對軌道控制偏差如圖11所示,機(jī)械臂末端捕獲沖擊載荷如圖12所示。
可以看出,采用該規(guī)劃結(jié)果時,服務(wù)衛(wèi)星能夠?qū)Ψ瓭L失效衛(wèi)星進(jìn)行捕獲,捕獲過程中控制偏差均保持在較低的水平,接近與捕獲間的切換平順,從而進(jìn)一步證明了采用冗余執(zhí)行機(jī)構(gòu)協(xié)調(diào)控制能夠?qū)崿F(xiàn)多任務(wù)指標(biāo)全優(yōu)。與其他方法類似,針對一個特定工況,采用計算智能的方法需要大量的地面離線規(guī)劃時間,以獲取最優(yōu)任務(wù)決策。當(dāng)工況發(fā)生變化時,要改變參數(shù)重新進(jìn)行規(guī)劃,無法滿足空間操作的實時性要求。
3.3 基于機(jī)器學(xué)習(xí)的失效衛(wèi)星捕獲
為實現(xiàn)特定工況下的實時規(guī)劃決策,在第3.2節(jié)的基礎(chǔ)上,在服務(wù)衛(wèi)星初始位置附近的一小塊區(qū)域內(nèi)選取10個點(diǎn)(如表2所示),在失效衛(wèi)星不翻滾的情況下,采用高斯偽譜法分別進(jìn)行接近軌跡規(guī)劃,得到10條最優(yōu)的接近軌跡。設(shè)計時間、相對位置、相對速度、相對姿態(tài)角、相對角速度共計13個神經(jīng)網(wǎng)絡(luò),對于每條規(guī)劃得到的最優(yōu)接近軌跡,除首末端點(diǎn)外選取8個特征點(diǎn)作為神經(jīng)網(wǎng)絡(luò)期望輸出,10個規(guī)劃樣本對應(yīng)的初始狀態(tài)作為神經(jīng)網(wǎng)絡(luò)的期望輸入,對上述軌跡規(guī)劃結(jié)果進(jìn)行學(xué)習(xí)訓(xùn)練。以相對位置網(wǎng)絡(luò)為例,部分網(wǎng)絡(luò)訓(xùn)練過程圖13所示。將訓(xùn)練成型的神經(jīng)網(wǎng)絡(luò)植入服務(wù)衛(wèi)星計算機(jī)中,選取上述10個點(diǎn)包絡(luò)內(nèi)的隨機(jī)一個點(diǎn)(-24.90,-0.80,1.00)m,從該點(diǎn)出發(fā)對失效衛(wèi)星進(jìn)行抓捕仿真驗證,機(jī)械臂末端捕獲沖擊載荷如圖14所示。神經(jīng)網(wǎng)絡(luò)部署在FPGA上,計算耗時,通過軟件監(jiān)測如圖15所示,FPGA晶振頻率為100 MHz。
表2 樣本集Table 2 Sample set
從驗證結(jié)果可以看出:單個神經(jīng)網(wǎng)絡(luò)規(guī)劃經(jīng)歷35個振蕩周期,總耗時350 ns,所有13個神經(jīng)網(wǎng)絡(luò)規(guī)劃總耗時在4.5 ms左右,相比高斯偽譜法的36 min而言幾乎可以忽略不計。服務(wù)衛(wèi)星能夠完成對失效衛(wèi)星的接近與捕獲,接近過程控制平順,捕獲后的末端沖擊載荷大小與采用傳統(tǒng)方法進(jìn)行控制(見圖14)相比,幾乎沒有差別。
3.4 失效衛(wèi)星運(yùn)動狀態(tài)突變時捕獲
為進(jìn)一步驗證神經(jīng)網(wǎng)絡(luò)的適應(yīng)性,在原有工況的基礎(chǔ)上,設(shè)計失效衛(wèi)星的姿態(tài)角速度發(fā)生突變的情況。因星上資源限制,在失效衛(wèi)星運(yùn)動狀態(tài)發(fā)生突變時無法進(jìn)行重規(guī)劃,因此無法完成對其抓捕,傳統(tǒng)控制方法失效。為訓(xùn)練神經(jīng)網(wǎng)絡(luò)使其能夠?qū)顟B(tài)突變的情況做出響應(yīng),首先要對其輸入知識樣本進(jìn)行進(jìn)一步擴(kuò)展設(shè)計。將規(guī)劃得到的每個樣本軌跡分為10段,在每段軌跡的中點(diǎn)處設(shè)置不同的失效衛(wèi)星姿態(tài)角速度取值,形成如表3所示的增廣樣本集。繼續(xù)采用神經(jīng)網(wǎng)絡(luò)對上述軌跡規(guī)劃結(jié)果進(jìn)行學(xué)習(xí)訓(xùn)練,訓(xùn)練過程與圖13類似,因此不再附圖。將訓(xùn)練成型的神經(jīng)網(wǎng)絡(luò)集成到服務(wù)星星載計算機(jī)中,服務(wù)星能在失效衛(wèi)星狀態(tài)發(fā)生突變時依然完成對其接近與捕獲任務(wù),捕獲后的末端沖擊載荷如圖16所示。
表3 增廣樣本集Table 3 Augmented sample set
本文引入靈巧控制的思想,提出一種靈巧飛行控制方法,通過模仿生物的運(yùn)動決策過程,能夠應(yīng)對空間操作任務(wù)出現(xiàn)的突發(fā)情況,且保證任務(wù)完成時的各項性能指標(biāo)最優(yōu)。本文研究的主要結(jié)論如下。
(1)采取多種特性各異的冗余執(zhí)行機(jī)構(gòu)相互協(xié)調(diào)配合,可以使服務(wù)衛(wèi)星的飛行范圍、快速性、敏捷性、平順性和魯棒性都達(dá)到最優(yōu)。
(2)通過機(jī)器學(xué)習(xí)可以實現(xiàn)一體化的規(guī)劃與控制,能夠設(shè)計出具備快速響應(yīng)能力的智能任務(wù)規(guī)劃器。
(3)通過失效衛(wèi)星在軌捕獲案例的仿真驗證,證明了基于冗余執(zhí)行機(jī)構(gòu)協(xié)調(diào)與機(jī)器學(xué)習(xí)的靈巧飛行控制方法應(yīng)用于失效衛(wèi)星跟瞄和失效衛(wèi)星捕獲任務(wù)的可行性,該方法還可擴(kuò)展到其他航天任務(wù)中。
References)
[1]David A Whelan,Allen A Adler,Samuel B Wilson,et al.The DARPA Orbital Express Program:effecting a revolution in space-based systems[C]//Proceedings of SPIE 2000,4136.Bellingham,WA:SPIE,2000:48-56
[2]周建平.天宮一號/神舟八號交會對接任務(wù)總體評述[J].載人航天,2012,18(1):1-5 Zhou Jianping.A review of Tiangong-1/Shenzhou-8 rendezvous and docking mission[J].Manned Spaceflight,2012,18(1):1-5(in Chinese)
[3]Del Cura,Juan Manuel.ConeXpress orbital life extension vehicle(CX-OLEV)GNC[C]//Proceedings of AIAA International Astronaut Congress.Washington D.C.:AIAA,2006:4720-4733
[4]Hirzinger G,Brunner B,Landzettel K,et al.Space robotics-DLR’s telerobotic concepts,lightweight arms and articulated hands[J].Autonomous Robots,2003,14(2):127-145
[5]Emanuel Todorov,Michael I Jordan.Optimal feedback control as a theory of motor coordination[J].Nature Neuroscience,2002(5):1226-1235
[6]Cole K J,Abbs J H.Kinematic and electromyographic responses to perturbation of a rapid grasp[J].Journal of Neurophysiology,1987,57(5):1498-1510
[7]Robertson E M,Miall R C.Multi-joint limbs permit a flexible response to unpredictable events[J].Experimental Brain Research,1997,117(1):148-152
[8]Scholz J P,Schoner G,Latash M.Identifying the control structure of multi-joint coordination during pistol shooting[J].Experimental Brain Research,2000,135(3):382-404
[9]Tseng Y W,Scholz J P,Schoner G.Goal-equivalent joint coordination in pointing:affect of vision and arm dominance[J].Motor Control,2002,6(2):183-207
[10]Mohan Sankar.All-wheel drive/four-wheel drive systems and strategies[C]//Proceedings of Seoul 2000 FISITA World Automotive Congress.Seoul:FISITA World Automotive Congress,2000:1-7
[11]Shen Y H,Gao Y,Xu T.Multi-axle vehicle dynamics stability control algorithm with all independent drive wheel[J].International Journal of Automotive Technology,2016,17(5):795-805
[12]Raffaello D’Andrea.The astounding athletic power of quadcopters[EB/OL].(2013-06-01).[2016-11-11].http://www.ted.com/talks/raffaello_d_andrea_the_astounding_athletic_power_of_quadcopters
[13]葉東,孫兆偉,王健穎.敏捷衛(wèi)星的聯(lián)合執(zhí)行機(jī)構(gòu)控制策略[J].航空學(xué)報,2012,33(6):1108-1115 Ye Dong,Sun Zhaowei,Wang Jianying.Control strategy of hybrid actuator for agile satellites[J].Acta Aeronautica et Astronautica Sinica,2012,33(6):1108-1115(in Chinese)
[14]Roithmayr C M,Karlgaar C D,Kumar R R,et al.Dynamics and control of attitude,power,and momentum for a spacecraft using flywheels and control moment gyroscopes,NASA Technical Documents TP-2003-212178[J].Washington D.C.:NASA,2003
[15]Nikolai Bernstein.The coordination and regulation of movements[M].Oxford:Pergamon Press,1967:38-42
[16]Silver D,Huang A,Maddison C J,et al.Mastering the game of go with deep neural networks and tree search[J/OL].[2017-05-23].http://ai.arizona.edu/sites/ai/files/resources/mastering_the_game_of_go_with_deep_neural_networks_and_tree_search.pdf
[17]Mihai Duguleana,Gheorghe Mogan.Neural networks based reinforcement learning for mobile robots obstacle avoidance[J].Expert Systems with Applications,2016,62:104-115
[18]Wang Hongbin,Liu Mian.Design of robotic visual servo control based on neural network and genetic algorithm[J].International Journal of Automation and Computing,2012,9(1):24-29
[19]Boyarko G,Yakimenko O,Romano M.Optimal rendezvous trajectories of a controlled spacecraft and a tumbling object[J].Journal of Guidance,Control,and Dynamics,2011,34(4):1239-1250
[20]Parv Patel,Bogdan Udrea,Michael Nayak.Optimal guidance trajectories for a Nanosat docking with a non-cooperative resident space object[C]//Proceedings of IEEE Aerospace Conference.New York:IEEE,2005:1-11
Method of Dexterous Flight Control in Space Operation
DONG Yunfeng LI Hongjue WANG Yun
(Beihang University,Beijing 100191,China)
Method of dexterous flight control is to accomplish a space operation task by imitating biological decision-making and moving method to coordinate redundant actuators together so that real-time decision can be made and all kinds of performance indices can be optimized.Taking uncontrolled tumbling satellite on-orbit service as a typical case,different actuators are coordinated together to get all their advantages,the approaching trajectories are planned by combining computational intelligence and human intelligence,thus performance indices including accessibility,accuracy,agility,smoothness and robustness are optimal.A series of artificial neural networks are used to learn from the planned trajectories in order to combine plan and control into one procedure.The dexterous flight control method is proved to be practical and effective through simulations of aiming,approaching and capturing of an uncontrolled tumbling satellite.The approaching and capture of the uncontrolled tumbling satellite can be successfully achieved even the tumbling status of the uncontrolled satellite changes,with almost no loss on approach and capture performances compared to the capture of uncontrolled satellite with unchanged tumbling status.
space operation;dexterous flight control;capture of uncontrolled satellite;computational intelligence;machine learning
V448.2
A
10.3969/j.issn.1673-8748.2017.05.002
2017-07-07;
2017-08-24
董云峰,男,博士,教授,研究方向為航天器動力學(xué)與控制。Email:sinosat@buaa.edu.com。
(編輯:夏光)