楊希祥,楊曉偉,鄧小龍
(國防科技大學(xué)空天科學(xué)學(xué)院,長沙 410073)
平流層飛艇是典型的低速臨近空間飛行器,依靠浮力駐空,采用太陽電池和儲能電池構(gòu)成循環(huán)能源系統(tǒng),采用電機(jī)驅(qū)動螺旋槳抗風(fēng),可實現(xiàn)月量級的區(qū)域超長航時駐留,也被形象的稱為“平流層衛(wèi)星”,在對地觀測、通信廣播、移動互聯(lián)網(wǎng)、防災(zāi)減災(zāi)等領(lǐng)域具有巨大應(yīng)用潛力[1-2]。
有效的飛行軌跡控制是實現(xiàn)區(qū)域長期駐留的核心挑戰(zhàn)之一[3]。平流層飛艇總體布局、飛行原理、工作模式顯著不同于飛機(jī)等飛行器,軌跡控制技術(shù)難度很高,主要表現(xiàn)在:屬于大尺度柔性體(長度超100 m),囊體氣動外形變化等引起的未知因素多,非線性強(qiáng),導(dǎo)致建立的動力學(xué)模型存在很大不確定性;飛行速度與環(huán)境風(fēng)速在一個量級(一般不超過20 m/s),受環(huán)境風(fēng)場干擾影響大,且環(huán)境風(fēng)速風(fēng)向短期內(nèi)存在多變特征;體積/慣量巨大(體積達(dá)幾十萬立方米),執(zhí)行機(jī)構(gòu)控制力/力矩相對較小,具有明顯的大慣量、長時延特征。
國內(nèi)外學(xué)者針對平流層飛艇及具有部分相似特征的浮空飛行器軌跡控制問題開展了系列研究[4],文獻(xiàn)[5]對平流層飛艇姿態(tài)控制、軌跡控制等研究現(xiàn)狀和難點挑戰(zhàn)進(jìn)行了綜述分析,特別指出了不確定、參數(shù)攝動、風(fēng)場影響等耦合因素制約??傮w來看,現(xiàn)有研究方法大致可分為三類:基于線性化模型的軌跡控制方法、非線性軌跡控制方法和智能軌跡控制方法。
基于線性化模型的軌跡控制方法,往往是針對某一特征點的標(biāo)稱狀態(tài),將平流層飛艇動力學(xué)模型按縱向和橫側(cè)向解耦分離設(shè)計,采用線性化方法將非線性動力學(xué)模型線性化,然后設(shè)計線性控制系統(tǒng)[6]。Pais以低空飛艇為研究對象,分高度控制和航向控制兩個通道,采用PI方法設(shè)計了軌跡控制系統(tǒng)[7]。Nagata等[8]研究了自調(diào)參的小型浮空器PID控制器設(shè)計方法,相對手動調(diào)參,控制性能得到改進(jìn)。線性化軌跡控制方法簡單,易于工程實現(xiàn),但在模型參數(shù)及工作點發(fā)生變化、面臨外部不確定擾動時,控制性能難以得到保證。
非線性軌跡控制方法,是指直接針對飛艇動力學(xué)模型,利用非線性控制方法實現(xiàn)軌跡控制[9]?;?刂品椒╗10-11]和反步法(backstepping)是應(yīng)用最廣泛的飛艇非線性軌跡控制方法,其中,反步法通過遞歸構(gòu)造閉環(huán)系統(tǒng)的李雅普諾夫函數(shù),獲得相對應(yīng)的控制變量和控制律[12],具有嚴(yán)反饋特點,魯棒性好。文獻(xiàn)[13]研究了平流層飛艇最優(yōu)軌跡規(guī)劃和跟蹤,采用反步法設(shè)計了全局穩(wěn)定的非線性軌跡控制器,研究中推力不受限;Vieira等[14]將反步法與滑??刂品椒ńY(jié)合,用于飛艇軌跡跟蹤,相對傳統(tǒng)反步法和滑??刂品椒?,控制精度和魯棒性進(jìn)一步改善。
增益參數(shù)設(shè)置調(diào)整是反步法應(yīng)用中的關(guān)鍵點,對軌跡控制精度和魯棒性存在很大影響。本文提出采用神經(jīng)網(wǎng)絡(luò)進(jìn)行尋優(yōu),實現(xiàn)增益參數(shù)動態(tài)自主調(diào)整,以更好應(yīng)對平流層飛艇軌跡控制面臨的外部風(fēng)場擾動和系統(tǒng)模型參數(shù)不確定問題。
平流層飛艇軌跡跟蹤控制的目標(biāo)是,使實際軌跡與參考軌跡之間的誤差趨于零,因此,對于水平軌跡控制來說,控制器設(shè)計應(yīng)使表征飛艇水平運動的狀態(tài)量實際值與期望值一致。
為使平流層飛艇狀態(tài)量具有統(tǒng)一性,采用Lagrange動力學(xué)模型[15-16]
(1)
式中:υ=[u,v,r]T,η=[x,y,ψ]T為體坐標(biāo)系下水平運動狀態(tài)量的廣義坐標(biāo);C為科氏力和向心力矩陣;D為耗散阻尼系數(shù)矩陣;G(η)為恢復(fù)力矩;R為慣性坐標(biāo)系到體坐標(biāo)系的轉(zhuǎn)換矩陣;M為考慮附加質(zhì)量的慣量矩陣,
將式(1)展開得到標(biāo)量形式的非線性模型
(2)
式中:u,v分別為飛艇軸向速度和側(cè)向速度;r為飛艇偏航角速度;x,y,ψ分別為飛艇在地面慣性坐標(biāo)系下的位置和偏航角;Iz為飛艇繞體坐標(biāo)系z軸的轉(zhuǎn)動慣量;λ11=k11m,λ22=k22m,λ66=k66m, 其中k11,k22,k66為慣性因子,與飛艇外形尺寸有關(guān);Fwind=[Fwind-x,Fwind-y,τwind]為風(fēng)場導(dǎo)致的干擾力和力矩;Xw,Yw,Nw為氣動力分量;F,τ為飛艇所受推力和力矩。
對平流層飛艇非線性運動模型中的狀態(tài)量進(jìn)行同胚變換,將位置狀態(tài)量變換為三個非線性狀態(tài)量,即令
(3)
建立與速度狀態(tài)量的關(guān)系
(4)
設(shè)參考軌跡為ηd=[xdydψdudvdrd]T,得到參考軌跡的非線性模型
(5)
式中:ud,vd,ud分別為參考軌跡對應(yīng)的軸向速度、側(cè)向速度和偏航角速度;xd,yd,ψd分別為參考軌跡在慣性坐標(biāo)系中的位置和偏航角;Fd,τd為飛艇沿參考軌跡飛行時受到的力與力矩;Xw-d,Yw-d,Nw-d分別為飛艇沿參考軌跡飛行時受到的氣動阻力、側(cè)力與偏航力矩。因為參考軌跡是在理想條件下的,所以風(fēng)場干擾項均等于零,且氣動力與氣動力矩均為常數(shù)。
軌跡的誤差系統(tǒng)可表示為
(6)
反步法的基本思路是,將復(fù)雜的非線性系統(tǒng)分解成多個不超過系統(tǒng)階數(shù)的子系統(tǒng),然后為每個子系統(tǒng)設(shè)計滿足Lyapunov穩(wěn)定性理論的標(biāo)量函數(shù)和中間虛擬控制量,最終集成起來完成系統(tǒng)總控制律的設(shè)計[16]。
考慮式(6)表示的軌跡誤差系統(tǒng),存在兩個控制量:推力F和力矩τ,根據(jù)反步法的設(shè)計思路,將其分成兩個子系統(tǒng),分別為:(z1e,z2e,ue,ve)和(z3e,re)。對于第一個子系統(tǒng),狀態(tài)量z1e,z2e,ve的微分表達(dá)式中均含有re,所以如果第二個子系統(tǒng)能夠達(dá)到漸近穩(wěn)定,則re對狀態(tài)量z1e,z2e,ve沒有影響,因此,劃分為上述兩個子系統(tǒng)是合理的,后者影響前者,屬于包含關(guān)系。
1)求解力矩項控制律
依據(jù)反步法設(shè)計步驟,首先求取第二個子系統(tǒng)的控制律,分析可知,其角速度項直接受控于控制力矩大小。
引入變量x1=z3e,x2=re,u=τ-τd,根據(jù)誤差系統(tǒng)得到以下關(guān)系式
(7)
預(yù)選Lyapunov正定函數(shù):
(8)
將x2作為x1的虛擬控制輸入,計算正定函數(shù)的導(dǎo)數(shù)
(9)
式中:
y2=x2-α(x1)
(10)
其中,α(x1)為虛擬控制量,令
α(x1)=-k1x1,k1>0
(11)
式中:k1為控制增益參數(shù)。
得到正定函數(shù)導(dǎo)數(shù)值為
(12)
預(yù)選另一Lyapunov正定函數(shù)
(13)
同理可得
(14)
令控制律
(15)
根據(jù)式(7)~(10),將控制律轉(zhuǎn)換為關(guān)于輸入變量re,z3e和增益參數(shù)的關(guān)系,即
u=-(Iz+λ66)·
(16)
進(jìn)而得到力矩的控制律:
τ=τd-(Iz+λ66)·
(17)
2)求解推力項控制律
針對第一個子系統(tǒng)(z1e,z2e,ue,ve),在求解得到力矩項的控制律后即保證了第二個子系統(tǒng)是穩(wěn)定的,由于推力直接影響橫向速度ue,而力矩對位置以及速度無影響,所以直接對推力和橫向速度進(jìn)行反步法設(shè)計。通過設(shè)計力與力矩項獲得相應(yīng)的控制律使得誤差系統(tǒng)中的誤差狀態(tài)量漸近趨于零。
與力矩項控制律求解過程類似,引入變量x1=ue,u=F-Fd,得到推力關(guān)于ue的控制律
F=Fd-(m+λ22)(vr-vdrd)-
Xw-e-(m+λ11)k3ue
(18)
式中:k3也為控制增益參數(shù)。
第2.1節(jié)利用反步法設(shè)計的軌跡控制律中,控制增益參數(shù)k1,k2,k3對控制性能影響很大,且其確定和調(diào)整過程較為困難。為此,本節(jié)引入神經(jīng)網(wǎng)絡(luò)參數(shù)尋優(yōu)的方式,將增益參數(shù)作為神經(jīng)網(wǎng)絡(luò)權(quán)值,根據(jù)輸入輸出之間傳遞函數(shù)以及實際輸出與期望輸出的差異,對網(wǎng)絡(luò)權(quán)值進(jìn)行動態(tài)更新,最終達(dá)到對參考軌跡的高精度跟蹤控制,如圖1所示。
圖1 反步法與RBF神經(jīng)網(wǎng)絡(luò)融合的軌跡控制器Fig.1 Trajectory controller with combination of backstepping and RBF neural network
RBF神經(jīng)網(wǎng)絡(luò)是典型的局部神經(jīng)網(wǎng)絡(luò),泛化能力強(qiáng)、收斂速度快,適用于非線性系統(tǒng)中對可控增益參數(shù)的快速尋找問題。RBF神經(jīng)網(wǎng)絡(luò)為三層網(wǎng)絡(luò)結(jié)構(gòu)[17],中間隱含層的作用函數(shù)為高斯基函數(shù),可以擬合任意的非線性函數(shù)。
控制增益參數(shù)尋優(yōu)流程如圖2所示,將軌跡狀態(tài)量作為網(wǎng)絡(luò)的輸入層,增益參數(shù)作為網(wǎng)絡(luò)權(quán)值項,隱含層輸出為推力與推力矩,輸出層輸出為實際的軌跡狀態(tài)量,根據(jù)期望與實際的狀態(tài)之差作為網(wǎng)絡(luò)權(quán)值的更新依據(jù),當(dāng)誤差值達(dá)到精度要求則尋優(yōu)結(jié)束,反之,則繼續(xù)更新,直至滿足控制精度需求。
圖2 采用RBF神經(jīng)網(wǎng)絡(luò)的增益參數(shù)尋優(yōu)流程Fig.2 Optimization process of control gain parameters with RBF neural network
參考軌跡為直線與圓弧的組合,前100 s作直線運動,中間250 s跟蹤半徑為20 km的圓弧運動,最后50 s作直線運動。給定參考軌跡初值,
[xd(0),yd(0),ψd(0),ud(0),vd(0),rd(0)]=
[0 m,0 m,0.02 rad,5 m/s,0 m/s,0 rad/s]
同時給出初始狀態(tài)值,
[x0(0),y0(0),ψ0(0),u0(0),v0(0),r0(0)]=
[0 m,0 m,0 rad,0.1 m/s,0.1 m/s,0.1 rad/s]
給定風(fēng)場干擾項
Fwind=[Fwind-x,Fwind-y,τwind]=
固定控制增益仿真中,直線段控制增益取值為k1=4,k2=3,k3=0.4,圓弧段控制增益取值為k1=6,k2=1,k3=0.12。
采用RBF神經(jīng)網(wǎng)絡(luò)對控制增益參數(shù)進(jìn)行尋優(yōu)的仿真過程中,控制增益參數(shù)初值取為:k1=k2=k3=0.01。
仿真過程所用其余主要參數(shù)見表1。
表1 主要仿真參數(shù)Table 1 Main simulation parameters
考慮平流層飛艇重心在體心下方,具有強(qiáng)滾轉(zhuǎn)穩(wěn)定性,忽略滾轉(zhuǎn)運動。執(zhí)行機(jī)構(gòu)推力上限為1000 N,控制力矩上限為6000 N·m。
固定控制增益時的軌跡跟蹤結(jié)果和跟蹤誤差如圖3~圖5所示,從圖中可以看出,針對外部變化風(fēng)場,軌跡跟蹤誤差大,最大誤差1.3 km,且振蕩不穩(wěn)定。
圖3 固定控制增益時的軌跡跟蹤結(jié)果Fig.3 Trajectory tracking results with fixed control gain
圖4 固定控制增益時圓軌跡跟蹤放大結(jié)果Fig.4 Amplification results of circular trajectory tracking
圖5 固定控制增益時的軌跡跟蹤誤差Fig.5 Trajectory tracking error with fixed control gain
采用RBF神經(jīng)網(wǎng)絡(luò)對控制增益參數(shù)進(jìn)行尋優(yōu)的軌跡跟蹤結(jié)果和跟蹤誤差如圖6~圖8所示,增益參數(shù)變化過程如圖9所示。
圖6 控制增益動態(tài)優(yōu)化時的軌跡跟蹤結(jié)果Fig.6 Trajectory tracking results with dynamic optimization of control gain
圖7 控制增益動態(tài)優(yōu)化時的圓軌跡跟蹤放大結(jié)果Fig.7 Amplification results of circular trajectory tracking with optimal gain
圖8 控制增益動態(tài)優(yōu)化時的軌跡跟蹤誤差Fig.8 Trajectory tracking error with optimal gain
圖9 控制增益參數(shù)變化過程Fig.9 Changing process of control gain
從圖6~圖8可以看出,采用神經(jīng)網(wǎng)絡(luò)動態(tài)優(yōu)化增益參數(shù)后,在變化的擾動風(fēng)場中,平流層飛艇實現(xiàn)了對參考軌跡的精確跟蹤,軌跡跟蹤誤差僅在軌跡形式發(fā)生較大變化時有較大誤差(0.7 km),整體上誤差維持在米量級且十分穩(wěn)定,表明控制方法對外部擾動風(fēng)場具有較好的魯棒性。
由圖9可知,采用RBF局部神經(jīng)網(wǎng)絡(luò)對三個增益參數(shù)進(jìn)行動態(tài)尋優(yōu),能夠快速收斂得到當(dāng)前狀態(tài)下的最優(yōu)數(shù)值。
將利用RBF神經(jīng)網(wǎng)絡(luò)動態(tài)優(yōu)化控制增益的方法,進(jìn)一步應(yīng)用于平流層飛艇模型參數(shù)不確定的情況。假設(shè)飛艇的轉(zhuǎn)動慣量在±5%范圍內(nèi)隨機(jī)波動,軌跡跟蹤結(jié)果和跟蹤誤差如圖10~圖12所示,增益參數(shù)變化過程如圖13所示。
從圖10~圖12可以看出,在系統(tǒng)模型參數(shù)不確定情況下,采用神經(jīng)網(wǎng)絡(luò)動態(tài)優(yōu)化增益參數(shù)的方法,雖然誤差存在一定震蕩波動,但整體上誤差值很小,除在軌跡切換處達(dá)到1 km左右外,實際軌跡與參考航跡的誤差仍能控制在幾十米范圍內(nèi),表明軌跡控制方法具有較好魯棒性。
圖10 模型參數(shù)不確定條件下的軌跡跟蹤結(jié)果Fig.10 Trajectory tracking results under model uncertainty
圖11 模型參數(shù)不確定條件下圓軌跡跟蹤放大結(jié)果Fig.11 The amplification results of circular trajectory tracking under model uncertainty
圖12 模型參數(shù)不確定條件下軌跡跟蹤誤差Fig.12 Trajectory tracking error under model uncertainty
圖13 模型參數(shù)不確定條件下控制增益參數(shù)變化過程Fig.13 Changing process of control gain under model uncertainty
仿真結(jié)果與文獻(xiàn)[14]采用指數(shù)趨近律形式滑??刂骗h(huán)節(jié)的反步法控制器相比,風(fēng)場擾動條件下,本文所提控制方法與其控制誤差相當(dāng),模型不確定條件文獻(xiàn)[14]仿真過程未考慮,且本文所提方法采用神經(jīng)網(wǎng)絡(luò)在線動態(tài)調(diào)整控制增益,智能自主程度高。
對于外部風(fēng)場擾動和模型不確定條件下的平流層飛艇軌跡控制問題,采用反步法設(shè)計控制器,增益參數(shù)選取是關(guān)鍵和難點,本文提出采用RBF神經(jīng)網(wǎng)絡(luò)動態(tài)調(diào)整增益參數(shù)的方法,按照兩個方法融合形成的水平軌跡跟蹤控制器,可以高精度跟蹤參考軌跡,魯棒性、適應(yīng)性好。文中給出的仿真實例說明了該方法的有效性。