樸敏楠,陳志剛,孫明瑋,*,陳增強
1. 南開大學 人工智能學院,天津 300350 2. 空間物理重點實驗室,北京 100076
吸氣式高超聲速飛行器(Air-Breathing Hypersonic Vehicle,AHV)被認為是能夠經(jīng)濟可靠地實現(xiàn)太空探索與全球到達的重要手段,具有重要的軍用和民用價值。2004年,X-43A AHV在馬赫數(shù)為7和10的試飛試驗中取得成功,這使得高超聲速技術(shù)在近些年來重新成為科技界的研究熱點。
不同于傳統(tǒng)的飛行器,AHV采用機身與推力系統(tǒng)高度一體化設計、細長外形與輕質(zhì)材料,這些使得AHV在氣動、推力、彈性之間存在十分嚴重的耦合效應。此外,在整個飛行包絡中,氣動和環(huán)境參數(shù)變化范圍很大且具有很強的不確定性。這些因素使得AHV的建模問題十分復雜且面向控制的模型存在很強的不確定性。針對彈性AHV的強耦合效應和各種不確定性帶來的控制問題,已有很多學者開展了研究,提出了基于自適應控制、滑模控制、神經(jīng)網(wǎng)絡控制、自抗擾控制等方法的諸多控制方案[1-9]。這些控制方法僅考慮了氣動彈性問題,即AHV的結(jié)構(gòu)動力學和非定常氣動力之間的交互作用。除了氣動彈性問題,控制系統(tǒng)設計還需要考慮傳感器測量信號包含的彈性振動通過控制器反饋對整個閉環(huán)系統(tǒng)的影響,即氣動伺服彈性(Aeroservoelasticity,ASE)問題。AHV的ASE抑制主要有兩個難點:一是其彈性頻率隨著燃油消耗和氣動加熱在整個飛行包絡內(nèi)有較大的變化范圍;二是其低階彈性頻率較低,剛體控制性能與低階彈性模態(tài)抑制之間相互沖突,尤其對于具有靜不穩(wěn)特性的AHV[10]。針對這兩個問題,自適應陷波器(Adaptive Notch Filter,ANF)是一種有效的解決方法。ANF可以通過實時的頻率辨識濾除測量信號中的彈性振動從而實現(xiàn)彈性模態(tài)的幅值穩(wěn)定,并且其窄陷波帶寬可以降低對剛體控制性能的影響。
根據(jù)ASE抑制問題的特點,提煉出ANF的關(guān)鍵性能需求如下:
1) 只需用到速率陀螺測量信號,不需要剛體模型信息。這樣可以降低辨識算法復雜度以及剛體建模誤差對辨識結(jié)果的影響。
2) 能夠進行多個彈性頻率的直接辨識。傳統(tǒng)ANF設計采用頻率間接辨識方案,需要基于多項式系數(shù)進行在線因式分解得到頻率估計。當彈性頻率多于兩個時,高階多項式因式分解的計算復雜度較高且因式分解結(jié)果對多項式系數(shù)的微小攝動非常敏感。而頻率直接辨識方案無需在線進行高階多項式的因式分解,這樣能夠避免間接辨識帶來的上述問題。
3) 具有較快的收斂速度和較高的辨識精度,能夠快速有效地抑制彈性模態(tài)。
4) 當系統(tǒng)中的彈性振動能量較低,即振動信號的信噪比(Signal-to-Noise Ratio,SNR)較低時,辨識算法仍需要具有收斂性。
5) 隨著AHV飛行工況以及結(jié)構(gòu)動力學的變化,各階彈性模態(tài)的能量也在不斷發(fā)生變化。辨識算法需要能夠精確地區(qū)分多個能量相近的彈性模態(tài),并且對各階彈性模態(tài)的能量變化具有較強的魯棒性。
國內(nèi)外學者針對ANF在AHV、防空導彈、運載火箭等對象上的應用性研究已經(jīng)取得了很多成果[11-19]。然而,這些研究設計的ANF都只具有上述一個或者某幾個特點,不能夠綜合滿足多個需求。文獻[11-14]的ANF設計需要剛彈模型參數(shù)的聯(lián)合辨識,增加辨識難度的同時降低了辨識結(jié)果的可靠性。文獻[15-19]在頻率間接辨識框架下采用SMM(Steiglitz-Mcbride Method)實現(xiàn)對一個或者兩個頻率的辨識,但是在針對3個及以上彈性頻率時仍存在間接辨識的諸多弊端。因此,探索滿足上述多種要求的ANF設計方法是十分必要的。
基于上述對控制問題和需求的分析,本文提出一種實用的AHV氣動伺服彈性控制方案。針對強耦合和強不確定性問題,采用線性自抗擾控制(Linear Active Disturbance Rejection Control,LADRC)[20-21]。通過將所有異于串聯(lián)積分型的動態(tài)視為總擾動,并采用擴張狀態(tài)觀測器(Extended State Observer,ESO)進行估計,可以以一種簡單高效的方式處理強耦合與不確定性[22-23]。對于ASE抑制問題,本文針對上述總結(jié)的性能要求,從辨識框架、辨識算法和在線有效性監(jiān)督3個角度研究了面向?qū)嵱玫腁NF設計方法。首先,ANF的設計僅需采用速率陀螺信號即需求1)。其次,為了實現(xiàn)頻率直接辨識,設計、分析和對比了兩種方案,參數(shù)單獨自適應(Individual Adaptation,IA)方案和同步自適應(Simultaneous Adaptation,SA)方案[24]即需求2)。在辨識算法上,基于有些學者對隨機高斯牛頓法(Stochastic Gauss-Newton,SGN)、遞推最大似然法(Recursive Maximum Likelihood,RML)、近似最大似然法(Approximate Maximum Likelihood,AML)和近似梯度法(Approximate Gradient Based,AGB)在性能上的比較研究[25],本文選擇收斂速度和辨識精度綜合性能更好的RML作為辨識算法(需求3)。雖然SMM算法近些年來在ANF上得到了很多研究[15-19],但是其在兩種頻率直接辨識框架下的性能相比于RML并不優(yōu)越。針對需求4)和5),本文設計出一種能夠顯著增強辨識算法在低信噪比和變化飛行工況下魯棒性的在線有效性監(jiān)督機制。通過對上述問題的研究,本文對AHV的ASE抑制問題提供了一個考慮更多實際因素的綜合解決方案。
本文選擇文獻[26]中的彈性AHV模型作為研究對象。文獻[26]將彈性AHV建模為自由梁,使得剛體模態(tài)與彈性模態(tài)之間滿足正交性,即剛體與彈性模態(tài)之間僅通過力和力矩的作用相互影響。考慮到鴨翼的引入不僅能夠改善彈道傾角動態(tài)特性而且有助于鎮(zhèn)定彈性模態(tài),該模型中還引入了鴨翼控制量。該模型如下:
(1)
(2)
(3)
表1 隨燃油水平變化的彈性頻率Table 1 Elastic frequencies for different fuel levels
式(3)中各氣動系數(shù)的取值詳見文獻[26]。該AHV的幾何外形如圖2所示,其中θm表示附加的彈性俯仰角。
在實際情況中,角度和角速度測量量不僅包含剛體運動信息,還包括與傳感器安裝位置有關(guān)的各階彈性振動信息。設該彈性AHV的前三階彈性振型分別為φ1(l)、φ2(l)和φ3(l),其中l(wèi)表示沿飛行器軸縱與機頭之間的距離。速率陀螺安裝在飛行器的lrg處,則速率陀螺測量到的俯仰角速度和相應的俯仰角為
(4)
圖2 彈性AHV的幾何外形Fig.2 Geometry of flexible AHV
為處理彈性AHV的強耦合和強不確定性,姿態(tài)控制器設計采用的是LADRC。首先建立被控量俯仰角與控制舵偏之間的標準型——串聯(lián)積分型,然后將所有異于標準型的部分視為總擾動并設計ESO對其進行估計,最后在控制量中通過總擾動估計直接對總擾動進行補償。首先為了消除升降舵對升力的影響帶來的彈道傾角非最小相位特性,將鴨翼和升降舵之間按照
(5)
進行配置。將式(2)和式(3)代入到式(1)中的姿態(tài)角運動方程得到
(6)
將式(6)寫為
(7)
其中:
(8)
其中:aδe為穩(wěn)態(tài)控制增益;fθ為俯仰角通道的總擾動,其中包括了推力、彈性效應對俯仰力矩的影響、參數(shù)不確定性、未建模動態(tài)以及可能受到的各種外擾。下面對式(7)設計降階ESO
(9)
其中:w為輔助變量;z2為總擾動估計值;ωo為文獻[21]提出的觀測器帶寬。ωo在自抗擾控制中是一個非常關(guān)鍵的參數(shù),其選擇需要綜合考慮擾動抑制能力以及穩(wěn)定裕度。在得到總擾動的估計后,可以設計帶有擾動補償和誤差反饋的綜合控制輸入
(10)
式中:θc為俯仰角指令;kp和kd分別為比例和微分控制增益。令Qp和θp分別表示測量信號經(jīng)過ANF的俯仰角速度和俯仰角輸出,即
(11)
(12)
整個控制系統(tǒng)的框圖如圖3所示。
圖3 姿態(tài)閉環(huán)控制系統(tǒng)框圖Fig.3 Diagram of the closed-loop attitude control system
頻率直接辨識可以通過IA和SA兩種框架實現(xiàn),這兩種框架的參數(shù)更新方式如圖4所示。在IA框架下,ANF可以視為多個二階ANF的串聯(lián),每個ANF只辨識一個彈性頻率,且參數(shù)更新僅基于局部的輸入輸出數(shù)據(jù)。而在SA框架下,所有的頻率估計都基于測量信號和最終的濾波器輸出同時進行更新。本文選用文獻中使用最為廣泛的零極點受限ANF模型[27]
(13)
圖4 兩種頻率直接辨識框架Fig.4 Two schemes for the direct estimation of frequency
IA框架下,每個ANF待優(yōu)化的目標函數(shù)為
(14)
式中:λ為遺忘因子;Ns為數(shù)據(jù)長度。每個ANF基于RML[27]的頻率估計算法流程如下:
1) 預測誤差計算
(15)
2) 梯度計算
令ψi(k)=-?ei(k)/?ai可以得到
ψi(k)=-ai(k-1)ρ(k)ψi(k-1)-ρ2(k)·
(16)
3) 參數(shù)更新
根據(jù)預測誤差和參數(shù)梯度可以得到參數(shù)的更新式為
(17)
ai(k)=ai(k-1)+Pi(k)ψi(k)ei(k)
(18)
對于每個ANF,只有一個待辨識參數(shù)ai,因此式(17)可以簡化為
(19)
4) 后驗誤差計算
(20)
5) 設計參數(shù)更新
為了提高算法的收斂速度,為ρ和λ設計過渡過程
(21)
式中:ρs和λs為期望的穩(wěn)態(tài)值;ρw和λw為過渡過程時間常數(shù)。
6) 頻率計算
ωi(k)=arccos(-ai(k)/2)/ts
(22)
由于該框架直接對ai進行更新,因此需要在線進行如下的穩(wěn)定性監(jiān)測
(23)
這種串聯(lián)式估計框架存在以下幾個特點:
1)H1(z-1)具有最高的優(yōu)先權(quán)選擇一個收斂頻率。隨著序列號的增加,ANF的優(yōu)先權(quán)依次遞減。序列號高的ANF只有當前面的ANF收斂之后才能夠收斂。因此,可以經(jīng)常觀察到高序列號ANF的頻率辨識結(jié)果呈階梯狀且收斂速率較慢。
2) 由于估計算法基于目標函數(shù)式(14),具有更高能量的頻率會被ANF優(yōu)先估計。
3) 在自適應算法的開始階段,幾個ANF可能會同時估計某一個頻率直到其中一個ANF首先收斂到這個頻率并使得相應的彈性振動信號能量衰減到很小。這是因為每個ANF都是基于局部的誤差信息進行參數(shù)更新的,因此這種框架會導致一個較低的收斂速率并且整體最優(yōu)性難以得到保證。
SA框架下自適應辨識算法待優(yōu)化的目標函數(shù)為
(24)
其基于RML的頻率估計算法流程[29]和IA框架相似,具體步驟如下:
1) 預測誤差計算
(1-ρ2(k))Zi(k-2)+xi(k)
(25)
式中:x1(k)=x(k),xi(k)=ei-1(k)(i=2,3,…,N),Zi為根據(jù)k時刻最新參數(shù)估計得到的ANF中間狀態(tài)。
2) 梯度計算
(26)
可以得到
(27)
其中
(28)
聯(lián)合式(27)和式(28)可以得到
(29)
其中
(30)
可以看出所有梯度的計算都用到了最終誤差估計e(k)。
3) 參數(shù)更新
定義梯度向量和參數(shù)向量
(31)
(32)
則參數(shù)更新公式為
(33)
(34)
4) 后驗誤差和中間狀態(tài)計算
基于最新參數(shù)估計計算后驗誤差和ANF的中間狀態(tài)
(35)
5) 設計參數(shù)更新
(36)
該部分通過3種情形下的數(shù)值仿真說明2種算法的特點以及當存在測量噪聲時進行在線監(jiān)督的必要性和有效性。ANF輸入信號的形式為
(37)
表2 3種情形下的參數(shù)設置Table 2 Design of parameters for three cases
圖5 情形1下的頻率估計Fig.5 Frequency estimation for case 1
在ASE抑制問題中,ANF的輸入信號包含測量噪聲且是復雜多變的。當系統(tǒng)中的彈性振動能量較低,即振動信號信噪比較低時,辨識算法的收斂性很難得到保證。隨著AHV飛行工況以及結(jié)構(gòu)動力學的變化,辨識算法需要對各階彈性模態(tài)的能量(振動幅值)變化具有較強的魯棒性。因此,為了保證算法可靠性,本文設計了一種基于彈性頻率先驗知識的在線有效性監(jiān)督機制。令
(38)
(39)
這樣可以對辨識結(jié)果進行及時的在線糾正,保證自適應算法在合理的范圍內(nèi)進行搜索并使得參數(shù)估計最終收斂到真值。下面考慮存在噪聲時頻率不變和時變兩種情形,情形2下的頻率同情形1,情形3下的頻率分別為ω1=10+t,ω2=40+1.5t,ω3=80+6t。在不同SNR下,兩種算法在以上兩種輸入信號下運行100次,并統(tǒng)計100次運行結(jié)果的估計偏差標準差DIA和DSA,如表3 和表4所示。當存在白噪聲且沒有式(39)中的有效性監(jiān)督時,兩種算法在多次仿真中都有一個或者多個頻率不能夠收斂到真值。加上在線監(jiān)督后,每次仿真結(jié)果中的所有頻率都會收斂到真值。由此可見,本文設計的監(jiān)督策略會增強SA對初始設計參數(shù)的魯棒性。從表3和表4可以看出,SA框架具有更高的辨識精度。因此,SA框架通過在線監(jiān)督魯棒性得到提高后,其相較于IA框架具有更好的頻率辨識性能。
表3 不同信噪比下兩種框架的估計標準差(情形2)
表4 不同信噪比下兩種框架的估計標準差(情形3)
(40)
其中
u=δer
(41)
圖6 自適應陷波器在50%燃油水平下的伯德圖Fig.6 Bode plot of ANF for 50% fuel level
圖7 控制器參數(shù)優(yōu)化框圖Fig.7 Block diagram for controller parameter optimization
(42)
通過觀察優(yōu)化結(jié)果是否滿足氣動伺服彈性抑制和魯棒性要求來適當?shù)卣{(diào)整權(quán)重函數(shù),最終得到滿足多個要求的控制參數(shù)。權(quán)重函數(shù)的選擇詳見文獻[10]??梢钥闯錾鲜鰞?yōu)化過程綜合考慮了飛行器本體剛彈特性以及濾波器的特性。
假設各階彈性頻率隨燃油消耗以線性形式變化,變化范圍覆蓋表1。當彈性阻尼ζi=0.02時,仿真結(jié)果如圖8~圖13所示。圖8顯示了經(jīng)過ANF濾波后的彈性俯仰角響應,可以看出彈性振動經(jīng)過20 s的抑制之后衰減顯著??刂贫嫫咳鐖D9所示。為了進一步分析彈性振動的抑制情況,將彈性俯仰角速度信號在仿真時間內(nèi)分為3個階段P1(0~20 s)、P2(20~50 s)和P3(50~120 s)進行離散傅立葉變換,變換結(jié)果如圖10所示。從圖10可以看出,各階彈性振動的能量在不同階段有所變化。在P1階段,三階模態(tài)能量最強,在P2階段,三階模態(tài)得到了顯著抑制,一、二階模態(tài)能量相對較強,在P3階段,前三階彈性振動都已基本濾除干凈。彈性頻率估計結(jié)果如圖11所示,可以看出3個辨識頻率在1 s左右收斂到真值附近,具有較快的辨識速度。由于各階彈性模態(tài)都得到了及時有效的抑制,系統(tǒng)能夠穩(wěn)定運行。在20 s之后,三階彈性頻率估計出現(xiàn)了較大的波動。這個波動的產(chǎn)生主要有兩個原因。一是在這個階段三階彈性俯仰角速度不是廣義正弦信號(幅值和頻率時變的正弦信號),其不止在三階頻率點處有能量,還在其他頻率處有能量。這可以從圖12及其局部放大圖13中看出。由于彈性模態(tài)阻尼非零且各階彈性模態(tài)之間存在耦合作用,某些飛行工況下彈性振動信號不只是在某個頻率點處有能量。由于一二階彈性俯仰角速度還保持廣義正弦信號形式,所以估計不存在較大的波動。第2個原因是隨著彈性模態(tài)逐漸被抑制,彈性振動信號的SNR逐漸降低,在P2階段,三階模態(tài)的SNR最低,這也會導致估計值出現(xiàn)較大的波動。這些實際因素都說明了AHV的>ASE抑制問題更為復雜,必須進行在線有效性監(jiān)督以保證其可靠性。作為對比,不加監(jiān)測機制的仿真結(jié)果如圖14和圖15所示。由于三階頻率辨識收斂較慢(1.8 s左右)且二階頻率辨識錯誤地收斂到一階頻率,產(chǎn)生了彈性振動反饋導致的控制量飽和以及不穩(wěn)定飛行器的失穩(wěn)。將彈性模態(tài)阻尼減小至ζi=0.004,這樣可以使得彈性振動信號更接近于廣義正弦信號,此時頻率辨識結(jié)果如圖16所示,可以看到波動幾乎消失,這也驗證了上述分析結(jié)果的正確性。
圖8 俯仰角響應Fig.8 Pitch angle response
圖9 控制舵偏Fig.9 Control deflections
圖10 彈性俯仰角速度信號的離散傅立葉變換Fig.10 DFT of flexible pitch angular rate signal
圖11 各階彈性模態(tài)的頻率估計Fig.11 Frequency estimation of flexible mode
圖12 彈性俯仰角速度Fig.12 Flexible pitch angular rate
圖13 彈性俯仰角速度20 s左右局部放大圖Fig.13 Flexible pitch angular rate around 20 s
圖14 不加監(jiān)測時的頻率估計Fig.14 Frequency estimation without monitoring
圖15 不加監(jiān)測時的俯仰角響應Fig.15 Pitch angle response without online monitoring
圖16 ζi=0.004時各階彈性模態(tài)的頻率估計Fig.16 Frequency estimation of flexible mode for ζi=0.004
魯棒控制解決ASE問題的機理和幅值穩(wěn)定比較相似,主要通過在控制器中進行關(guān)鍵彈性模態(tài)的幅值衰減,因此文中選擇魯棒控制作為新的彈性控制對比方法。魯棒控制是一種基于對象線性模型的方法,在整個飛行包絡內(nèi)同時考慮氣動參數(shù)、結(jié)構(gòu)參數(shù)時變和不確定性的魯棒控制器設計本身就是一個較為復雜的研究問題,需要進行控制器參數(shù)調(diào)度。因為本文重點關(guān)注ASE抑制問題,所以在只考慮彈性頻率不確定性條件下(各彈性頻率攝動范圍如表1所示)選擇一個特征點進行魯棒控制器設計。
(43)
圖17 彈性俯仰角頻率響應的乘性不確定性Fig.17 Multiplicative uncertainty of frequency response of flexible pitch angle
圖18 魯棒控制彈性俯仰角階躍響應Fig.18 Step response of flexible pitch angle for robust control
圖19 魯棒控制回路傳遞函數(shù)Fig.19 Loop transfer function for robust control
在該特征點處同樣進行本文控制方案的性能分析,假設ANF的頻率估計準確,階躍響應結(jié)果和回路傳遞函數(shù)如圖20和圖21所示。由于ANF的自適應能力,陷波寬度可以設計得較窄,在保證響應速度和彈性頻率處衰減程度的前提下穩(wěn)定裕度得到了提升,為(4.45 dB,21.3°),因此本文方案能夠在保證ASE抑制能力的前提下一定程度上提高系統(tǒng)的魯棒性。
圖20 本文控制方案彈性俯仰角階躍響應Fig.20 Step response of the flexible pitch angle for proposed method
圖21 本文控制方案回路傳遞函數(shù)Fig.21 Loop transfer function for proposed method
1) 將LADRC和ANF結(jié)合在一起既能夠處理強耦合和強不確定性,又能夠?qū)︻l率時變的彈性振動進行抑制。由于ANF的陷波帶寬較窄,可以最大程度減小對剛體控制效果的影響。此外,整個控制系統(tǒng)的線性形式也便于進行工程上的頻域分析。
2) IA和SA框架在實現(xiàn)多頻率直接辨識時各有利弊。IA框架的收斂速度和辨識精度差于SA,但是對ANF設計參數(shù)以及信號幅值變化的魯棒性更強。當加上在線監(jiān)督機制后,SA對設計參數(shù)以及信號幅值變化的魯棒性可以顯著提升,此時其綜合性能更優(yōu)于IA框架。
3) 實際彈性振動信號復雜多變,可能不是廣義正弦信號的疊加,且受到測量噪聲的影響,因此,對頻率辨識結(jié)果的在線有效性監(jiān)督是必須的。