羅世彬,吳瑕,魏才盛
1.中南大學 自動化學院,長沙 410083
2.中南大學 航空航天學院,長沙 410083
可重復使用飛行器(Reusable Launch Vehicle, RLV)作為一類新型天地往返飛行器,在軍事以及民用領域受到了廣泛的關注,是近年來的研究熱點,具有廣闊的應用前景[1]。與傳統(tǒng)飛行器相比,RLV承擔著更為復雜的飛行任務,其再入飛行是一個大范圍機動、快速域、強不確定性、強耦合的復雜運動過程,承受著如過載、動壓、熱流等多種約束,且飛行環(huán)境復雜,易受到多種外部擾動的影響,因此,RLV的控制系統(tǒng)設計具有極大的挑戰(zhàn)性。
作為一類具有強非線性、快時變、強耦合、強不確定性的被控對象,RLV用于控制器設計的模型與其真實動力學模型之間存在著很多的不確定項,因此,對不確定項的估計是控制系統(tǒng)設計所必須面臨的問題。神經網絡和模糊控制技術由于對非線性函數具有很好的逼近能力,是估計模型不確定性常用的兩種方法。文獻[2]提出了一種魯棒自適應非線性容錯控制算法實現了對帶執(zhí)行器故障的RLV姿態(tài)的精確跟蹤,其中引入模糊邏輯系統(tǒng)來實現對參數不確定性的估計;文獻[3]提出一種神經自適應最優(yōu)非線性控制方法實現對飛行器的跟蹤控制,其中引入神經網絡來逼近參數和不匹配的不確定性以及未建模動態(tài)。文獻[4-6]同樣通過神經網絡/模糊控制技術實現了對飛行器不確定性的在線估計。然而,兩種近似技術設計思想復雜,計算量大,且僅在一些緊集上有效,它們的引入增加了控制器設計的復雜性,提高了控制參數選擇的難度,且神經網絡/模糊控制技術僅能對不確定性進行在線逼近。
高增益觀測器是非線性反饋控制設計中一種常用的方法,它可以在不依賴系統(tǒng)數學模型的情況下,通過系統(tǒng)的輸出來實現對模型內部未知狀態(tài)的精確估計。高增益觀測器結構簡單,魯棒性強,已經成為不確定非線性系統(tǒng)進行輸出反饋控制器設計的重要工具[7]。然而,當觀測器增益足夠高時,會產生峰化現象,造成閉環(huán)系統(tǒng)的不穩(wěn)定,且作為一類狀態(tài)觀測器,高增益觀測器僅能對系統(tǒng)的狀態(tài)進行估計,在系統(tǒng)狀態(tài)未知且存在模型不確定性時,需要分別設計神經網絡/模糊控制技術以及高增益觀測器同時估計系統(tǒng)不確定性和未建模狀態(tài),增加了控制器設計的復雜性。
在實際應用中,考慮到設備成本和傳感器損壞的風險,設計輸出反饋控制方法是很必要的。已有的研究工作表明,將高增益觀測器與狀態(tài)反饋控制器相結合,是設計輸出反饋控制方法的一種常用思路,而對于高增益觀測器所引起的峰化現象,可以利用飽和函數保證控制器的全局有界性,使得在峰化現象出現時控制器始終保持有界,避免了峰化現象引起的系統(tǒng)不穩(wěn)定[8]?;诜床娇刂萍夹g進行輸出反饋控制器的設計是目前常用的設計思想[9-10]。作為經典的非線性控制方法之一,反步法已經被廣泛應用于飛行器的控制器設計中。文獻[11]提出了一種魯棒自適應反步控制算法,實現了對RLV再入飛行過程飛行姿態(tài)的精確跟蹤。文獻[12]采用一種終端滑模反步控制策略,實現了對含參數不確定性和擾動的飛行器速度和高度的平穩(wěn)控制。然而,傳統(tǒng)的反步控制方法要求對虛擬控制律重復求導,隨著系統(tǒng)階數增加,會導致“微分爆炸”的問題,控制的復雜性也迅速增加,文獻[13]利用動態(tài)面控制方法很好地解決了這個問題,它利用一階低通濾波器對虛擬控制律進行濾波,避免了反步控制中復雜的微分運算。但是動態(tài)面控制方法沒有實現對濾波誤差的補償,只能通過取盡可能小的濾波參數,來減小濾波誤差,這對高精度再入飛行器控制提出了極大挑戰(zhàn)。因此,尋找一種新型的反步控制算法,在無需對虛擬控制信號求導的情況下,就可以完成控制器設計,避免“微分爆炸”的問題,具有重要的意義。
從已有工作來看,在設計RLV跟蹤控制器時,大多數非線性控制算法側重于閉環(huán)系統(tǒng)的穩(wěn)態(tài)性能,保證系統(tǒng)的跟蹤誤差衰減至穩(wěn)態(tài)區(qū)域,而并沒有同時關注系統(tǒng)的瞬態(tài)性能,如超調量和收斂速度等。預設性能控制算法的提出為上述問題的求解貢獻了新的角度[14]。這里的預設性能是指在確保跟蹤誤差衰減至一個提前設置的任意小的包絡內的時候,收斂速度和超調量可以同時達到預先規(guī)定的要求。預設性能控制算法兼顧了系統(tǒng)的瞬態(tài)和穩(wěn)態(tài)性能,以改善系統(tǒng)性能為直接的控制目標[15-17]。常規(guī)的預設性能控制算法是指數形式的,只能保證閉環(huán)系統(tǒng)的漸進收斂, 顯然, 如果能夠設計一種預設性能控制算法使得系統(tǒng)的跟蹤誤差在指定時間內衰減至預設的包絡內, 即實現有限時間鎮(zhèn)定,是十分有意義的。
針對RLV再入段姿態(tài)回路數學模型,基于反步控制的框架,提出了一種保性能輸出反饋控制算法,使得在存在氣動參數攝動、外部擾動以及執(zhí)行器飽和的情況下,實現對期望姿態(tài)指令的精確跟蹤。其中,借助于擴張狀態(tài)觀測器的思想,引入了一種高增益擴張狀態(tài)觀測器實現對系統(tǒng)狀態(tài)和未知不確定性的估計,取代了神經網絡/模糊控制技術,降低了算法的計算復雜度;同時,為了避免“微分爆炸”的問題,控制器設計不在需要虛擬控制律的導數;此外,采用了一種有限時間預設性能函數,保證了姿態(tài)跟蹤誤差系統(tǒng)的有限時間收斂和跟蹤精度。最后,仿真驗證了所設計控制算法的性能。
以文獻[18]中的RLV再入飛行過程的數學模型為研究對象,不失一般性,假設RLV為無動力飛行,即在再入過程中,發(fā)動機關閉。
RLV 再入飛行動態(tài)過程的數學模型可由三自由度的質心平動模型和三自由度的繞質心轉動模型完整的描述。其中,質心平動模型是描述RLV位置信息的數學模型,繞質心轉動模型是描述RLV姿態(tài)信息的數學模型。本文主要研究的是RLV姿態(tài)跟蹤控制系統(tǒng),因此只針對繞質心轉動模型進行分析。繞質心轉動模型由繞質心轉動運動學模型和繞質心轉動動力學模型組成:
(1)
(2)
(3)
式中:δa、δe、δr分別為RLV的副翼、升降舵和方向舵的偏轉角。fp、fq、fr、Gu的表達式為
(4)
式中:Mx、My、Mz的表達式為
(5)
對式(2)求導可得
(6)
將式(3)代入式(6)可得
L(φ,θ)Gu[δa,δe,δr]T
(7)
式中:
(8)
式(7)表明繞質心轉動動力學模型被轉化成一個二階非線性模型的形式,通過設計控制律獲得δa、δe、δr的值就能實現對RLV姿態(tài)的跟蹤控制。
為了便于設計姿態(tài)控制器,將式(7)中的姿態(tài)模型簡化為二階非線性系統(tǒng)的形式[18]:
(9)
式中:x=[φ,θ,ψ]T是系統(tǒng)的狀態(tài)矢量;y∈3為系統(tǒng)輸出;u=[δa,δe,δr]T為系統(tǒng)的控制輸入;G(x)=[gij(x)]∈3×3,f(x)=[fi(x)]∈3(i,j=1,2,3)為函數矩陣,表達式為
(10)
由于RLV飛行環(huán)境復雜,存在大量的外部干擾,式(10)所示的動態(tài)模型無法準確描述模型的實際信息,為了盡可能描述飛行過程,一種更準確的數學模型可以表述為
(11)
式中:d∈3為外部擾動。除外部擾動外,為了更接近實際的再入過程,需要考慮可能出現的氣動導數攝動因此與氣動導數有關的量都是不確定的,需要進行在線估計,以便控制器設計。
首先介紹相關預備知識,之后根據式(11)所得的控制模型,進行控制算法的設計,實現對RLV的姿態(tài)跟蹤。
為了便于對算法的理解以及后續(xù)分析,首先對算法中涉及的相關理論進行簡單介紹。
2.1.1 初值問題
引入初值問題(Initial Value Problem-IVP)來輔助后續(xù)的穩(wěn)定性分析:
(12)
式中:φ:+×Ωζ→n,Ωζ?n是非空開集。
定義1[8]如果式(12)在ζ(t)的右邊沒有其他解,則稱ζ(t)為IVP的最大解。
引理1[8]如果φ(t,ζ)滿足:① 對于所有t≥0,φ(t,ζ)關于ζ滿足局部Lipschitz條件;② 對 于每個固定的ζ∈Ωζ,φ(t,ζ)在t上分段連續(xù)且局部可積,則式(12)在時間區(qū)間[0,tf)上存在一個最大解ζ(t)使對于?t∈[0,tf),ζ(t)∈Ωζ,tf>0。
2.1.2 預設性能函數
定義一個廣義誤差變量e(t),則根據定義2可知,若想實現預設性能控制,e(t)需要嚴格限制在ρ(t)包圍的衰減區(qū)域內,即
-ρ(t) (13) 通常,預設性能函數會選擇滿足定義1的指數形式的函數: ρ(t)=(ρ0-ρ∞)exp(-lt)+ρ∞ (14) (15) 式中:p0=((ρ0-ρ∞)1-ε)/((1-ε)T1);ρ0、ρ∞∈+;ε∈(0.5,1)?為預先設計的正常數;T1>0是預先設置的收斂時間;顯然,式(15)所提出的預設性能函數滿足: 2)ρ(0)=ρ0>2ρ(t≥T1)=2ρ∞>0。 引理2[20]預設性能函數式(15)能夠在規(guī)定時間T1內獲得預期的跟蹤精度。 注1從不等式(13)可以知道,當0≤|e(0)|<ρ0時,e(t)的性質將和預設性能函數ρ(t)息息相關。也就是說,ρ(t)的衰減速率決定了e(t)收斂速率的下界,ρ(t)決定了系統(tǒng)瞬態(tài)行為超調量的最大可允許值,ρ∞決定了e(t)在穩(wěn)態(tài)時的上界。 由于氣動導數存在攝動問題,因此與氣動導數有關的項都可以看作為系統(tǒng)的不確定項,若將氣動參數攝動納入式(11)所示的飛行器的姿態(tài)模型中,則式(11)可改寫為 (16) 式中: (17) 為了便于控制器設計,將式(16)改寫為 (18) 針對式(18)所示的擴張后的姿態(tài)模型,可以設計高增益擴張狀態(tài)觀測器,如式(19)所示,來實現對系統(tǒng)未知狀態(tài)、不確定性和擾動的估計。 (19) 式中:zi=[zi1,zi2,zi3]T∈3(i=1,2,3)是觀測器的輸出,表示狀態(tài)xi的估計;eE1=x1-z1; 0<μ<1為增益參數;ai>0(i=1,2,3)是適當選取的參數,它的設計需滿足式(20)所示的多項式: (20) 式中:s表示多項式算子;ωo表示觀測器的帶寬。 根據觀測器的估計值,基于反步控制的框架,針對RLV再入過程,一種保性能輸出反饋姿態(tài)跟蹤控制算法(Output feedback attitude tracking control with guaranteed performance-OFATC)設計過程為 步驟1受文獻[21]啟發(fā),首先為第1個子系統(tǒng)即輸出通道x1進行虛擬控制律設計。選擇輸出通道的預設性能函數ρ1(t)滿足如下條件: ①ρ1(0)>|x1(0)-yd(0)|; ② 綜合考慮穩(wěn)態(tài)跟蹤精度和收斂速度等預先設定性能要求,則可設計虛擬控制律: (21) 式中:e=x1-yd=[e1,e2,e3]T表示跟蹤誤差;I=[1, 1, 1]T;k1=diag(k11,k12,k13)為虛擬控制律α1的增益;yd=[yd1,yd2,yd3]T=[φd,θd,ψd]T為參考輸入,且假設yd有界。 注2為了實現有限時間跟蹤控制,ρ1(t)選擇式(15)所示的有限時間預設性能函數形式。 步驟2對第2個子系統(tǒng)x2進行虛擬控制律的設計。選擇第二個性能函數ρ2(t)滿足如下條件ρ2(0)>|z2(0)-α1(0)|,則第2個虛擬控制律可設計為 (22) 式中:k2=diag(k21,k22,k23)為待設計的虛擬控制律α2的增益。 步驟3為了保證所提出控制算法的抗干擾性能,最終的控制律設計為 (23) 考慮到RLV的執(zhí)行機構具有動作幅值限制,即控制舵面不能提供無限大的偏轉角,存在執(zhí)行器飽和,實際的保性能輸出反饋跟蹤控制算法的控制律設計為 (24) 式中:um>0為控制輸入的飽和邊界。 注3式(15)所示的預設性能函數能夠對跟蹤誤差施加有限時間預設性能約束,這意味著對于閉環(huán)系統(tǒng)來說,在不需要任何其他有限時間設計的情況下,就能夠實現有限時間控制,超調量和穩(wěn)態(tài)誤差也能滿足提前設定的性能要求。 注4由于第2個子系統(tǒng)無需實現有限時間跟蹤性能,則第2個性能函數ρ2(t)選擇指數形式,如式(14)所示。 注5算法設計過程可以看出,本文所設計的算法沒有設計任何輔助系統(tǒng)對執(zhí)行器飽和進行處理,而是利用飽和現象來避免高增益觀測器設計引起的“峰化現象”,而飽和控制輸入產生的非線性誤差,可以歸結到總擾動中,利用高增益擴張狀態(tài)觀測器進行估計,利用控制律進行補償。 圖1給出了所設計的保性能輸出反饋跟蹤控制算法的結構框圖,其中,高增益擴張狀態(tài)觀測器用來估計系統(tǒng)的不確定性和外部擾動,并將估計值用于控制算法的設計中,用來實現對RLV的跟蹤控制;引入了兩種類型的預設性能函數來改善算法的瞬態(tài)和穩(wěn)態(tài)特性;并利用飽和函數使控制輸入始終保持有界。 圖1 RLV姿態(tài)回路的控制框圖 進行算法穩(wěn)定性分析,證明各狀態(tài)變量的有界性以及跟蹤誤差的收斂性。 證明為便于穩(wěn)定性分析,定義新的誤差矢量Ξi∈3(i=1,2): (25) 對式(25)求導可得 (26) 式中:βi=ai/μi(i=1,2)。假設αik、Ξik、Ψik(i=1,2;k=1,2,3)分別表示αi、Ξi、Ψi中的第k個元素,Υi∈3(i=1,2)為新定義的矢量,其第k個元素Υik的表達式為且ρ1(0)>|x1(0)-yd(0)|,ρ2(0)>|z2(0)-α1(0)|,則|Ξik(0)|<1。即若定義一個非空開集則根據式(26)可得 (27) ?t∈[0,tf),Ξik(t)∈(-1, 1) i=1,2;k=1,2,3 (28) 在時間區(qū)間[0,tf)上定義一個新的矢量 Φi=ln(Ι+Ξi)-ln(Ι-Ξi) (29) 則式(21)和式(22)中α1、α2表達式可寫為 αi=-kiΦi (30) 步驟 1定義如下Lyapunov函數: (31) 則對式(31)求導可得 (32) 若假設x2k、ydk、z2k、k1k為矢量x2、yd、z2、k1的第k個元素,定義eEj=xj-zj為觀測器估計誤差,eEj,k為eEj的第k個元素(j,k=1,2,3),則根據式(19)、式(25)和式(26)可知: (33) (34) ?t∈[0,tf) (35) 根據式(29),可以得到?t∈[0,tf): (36) 步驟 2定義如下Lyapunov函數: (37) 則對式(37)求導可得 (38) (39) 式中:Gk∈3為矩陣的第k(k=1,2,3)個元素;根據式(24)可知,u為飽和函數,因此需要分情況討論。 (40) (41) 則同樣存在一個常數m2k,1>0使得 (42) ?t∈[0,tf) (43) 根據式(29),整理可得?t∈[0,tf): (44) 2) 考慮到RLV的執(zhí)行機構有動作幅值限制,存在執(zhí)行器飽和,即實際的控制律為u=sat(uc),代入式(26)第2個子式有: (45) (46) 根據前面分析可知,在區(qū)間?t∈[0,tf)上,sat(uc)-uc是有界的,則存在一個常數m2k,2>0使得: (47) (48) 同樣地可以得到在區(qū)間?t∈[0,tf)上: (49) 根據式(36)、式(44)和式(49)可以得到,?t∈[0,tf),Ξ(t)∈Ω′ζ?Ωζ,式中: (50) 由式(50)可知,Ω′ζ是非空緊集。因此,假設tf<∞且Ω′ζ?Ωζ,根據推論1可知,存在一個時間常數t′∈[0,tf),使得Ξ(t′)?Ω′ζ,這顯然是不成立的,因此tf=∞,也就是說,對于任意時間t≥0,系統(tǒng)的所有信號始終保持有界,且根據式(36) 可知 (51) 式中:x1k為矢量x1的第k個元素。式(51)表示輸出跟蹤誤差滿足提前設置的性能函數要求,即跟蹤誤差在預設性能函數所設定的包絡內演化。 為了驗證所設計的算法的有效性,本節(jié)利用RLV再入過程的姿態(tài)模型,進行仿真分析,并將仿真結果和自抗擾控制(Active Disturbance Rejection Control-ADRC)算法進行對比,從而驗證算法的性能。 圖2給出了RLV的姿態(tài)輸出曲線及其估計值,圖3給出了控制信號的響應曲線,圖4給出了RLV姿態(tài)角的跟蹤誤差曲線。從圖2和圖4可以看出,當不存在參數不確定性和外部擾動時,兩種算法都可以快速跟蹤上指令信號。與ADRC控制算法相比,所設計的保性能輸出反饋控制算法跟蹤速度更快,且跟蹤誤差始終在預先設計的包絡線內,穩(wěn)態(tài)精度更好,這充分反映了所設計的算法具有良好的瞬態(tài)和穩(wěn)態(tài)性能;由圖3可以看出,兩種算法的控制輸入都能滿足預先設定的飽和函數要求,與ADRC算法相比,RLV 在所提出算法的控制下能獲得更加平滑的控制力矩。 圖3 RLV執(zhí)行器響應曲線 圖4 RLV姿態(tài)跟蹤誤差曲線 圖5 RLV姿態(tài)輸出曲線 圖5和圖8是存在不確定性和擾動時RLV的姿態(tài)輸出曲線,圖6和圖9是RLV控制輸入曲線,圖7和圖10是RLV跟蹤誤差的輸出曲線。從圖5、圖7、圖8和圖10中可以看出,即使存在氣動導數攝動和外部擾動,在兩種算法控制下,系統(tǒng)的輸出依然能夠跟蹤其參考輸入,相較于ADRC控制算法,RLV在所提出的姿態(tài)控制算法下響應速度更快,其跟蹤誤差在穩(wěn)態(tài)時的精度更高,可以達到10-4度;圖6和圖9表明,即使存在不確定性和外部擾動,兩種算法執(zhí)行器的響應曲線仍未超過規(guī)定的飽和邊界,仍滿足執(zhí)行器的飽和條件,與ADRC算法相比,所提出的算法執(zhí)行器的響應曲線更為平滑。 圖6 RLV執(zhí)行器響應曲線 圖7 RLV姿態(tài)跟蹤誤差曲線 圖8 RLV在-20%攝動下的姿態(tài)輸出曲線 圖9 RLV在-20%攝動下的執(zhí)行器響應曲線 圖10 RLV在-20%攝動下的姿態(tài)跟蹤誤差曲線 1) 提出了一種基于反步控制技術的保性能輸出反饋跟蹤控制方案,在模型參數不確定性、外部擾動以及執(zhí)行器飽和存在的情況下,實現了對RLV再入飛行過程姿態(tài)回路的跟蹤控制,利用對比仿真驗證了算法的性能。 2) 所設計的算法,引入高增益擴張狀態(tài)觀測器實現對系統(tǒng)模型參數不確定性和外部擾動的估計,避免了神經網絡/模糊控制技術設計思想復雜計算量大,且僅在一些緊集上有效的缺陷。 3) 沒有設計其他輔助系統(tǒng)來處理執(zhí)行器飽和現象,而利用執(zhí)行器飽和來處理高增益觀測器的引入所造成的“峰化現象”,仿真結果表明,系統(tǒng)的控制輸入曲線始終在飽和函數所約束的范圍內演化。 4) 算法是基于反步控制技術設計的,與傳統(tǒng)反步控制技術相比,所提出的方法無需對虛擬控制律重復微分,避免了傳統(tǒng)反步控制技術所引起的“微分爆炸”的問題。2.2 控制算法設計
3 算法穩(wěn)定性分析
4 仿真分析
4.1 不考慮參數不確定性和外部擾動
4.2 同時考慮參數不確定項和外部擾動
5 結 論