薛光偉,辛萬青,傅 瑜
(1. 北京宇航系統(tǒng)工程研究所,北京 100076;2. 中國運(yùn)載火箭技術(shù)研究院,北京 100076)
升力式再入飛行器是一種可以利用氣動(dòng)升力在大氣層內(nèi)進(jìn)行無動(dòng)力飛行的飛行器[1-2],是近年來各國學(xué)者的研究熱點(diǎn)。升力式飛行器在飛行過程中面臨著諸多干擾,包括參數(shù)、環(huán)境的不確定性,以及可能存在的沖突對(duì)抗,需要不斷進(jìn)行軌跡調(diào)整與恢復(fù),過程中需要消耗能量;很多場(chǎng)景中,多個(gè)飛行器需要集結(jié)起來完成一些協(xié)同任務(wù),而集結(jié)的過程同樣需要調(diào)整軌跡,消耗能量。升力式飛行器無動(dòng)力的特性決定了其可利用的機(jī)械能總量在飛行過程中無法增加,因此適應(yīng)干擾的能力與集結(jié)飛行的任務(wù)之間存在矛盾。
對(duì)于升力式飛行器的集結(jié)軌跡規(guī)劃問題,文獻(xiàn)[3]利用神經(jīng)網(wǎng)絡(luò)生成傾側(cè)角翻轉(zhuǎn)控制指令,實(shí)現(xiàn)了升力式飛行器的時(shí)間協(xié)同;文獻(xiàn)[4]推導(dǎo)了滑翔段高度、速度、航程等的高精度解析解,在此基礎(chǔ)上引入粒子群算法和強(qiáng)化學(xué)習(xí),實(shí)現(xiàn)了時(shí)間協(xié)同軌跡的在線優(yōu)化求解。文獻(xiàn)[3-4]設(shè)計(jì)的集結(jié)軌跡規(guī)劃算法通過智能算法估計(jì)剩余時(shí)間,求解速度快,但其結(jié)果具有一定不可解釋性。文獻(xiàn)[5]根據(jù)預(yù)測(cè)能量和期望能量的關(guān)系,實(shí)時(shí)調(diào)整飛行攻角和升阻比,進(jìn)而控制到達(dá)時(shí)間。文獻(xiàn)[6]通過傾側(cè)角幅值控制到達(dá)時(shí)間,通過攻角控制攻擊角度,實(shí)現(xiàn)了多升力式飛行器的協(xié)同攻擊。文獻(xiàn)[7]把攻角固定為速度的線性函數(shù),剩余時(shí)間通過軌跡仿真獲得,迭代求解滿足時(shí)間約束的攻角。文獻(xiàn)[8]通過分析軌跡長(zhǎng)度與到達(dá)時(shí)間之間的關(guān)系,設(shè)計(jì)了公共參考軌跡并利用線性二次型調(diào)節(jié)器進(jìn)行跟蹤,實(shí)現(xiàn)了升力式飛行器的多陣位協(xié)同再入。文獻(xiàn)[5-8]所提出的集結(jié)軌跡模式中,飛行器需要在大部分航程中為實(shí)現(xiàn)協(xié)同而調(diào)整軌跡,這會(huì)帶來較大的能量消耗,影響飛行器對(duì)于未知干擾的適應(yīng)能力?;趥巫V法的軌跡優(yōu)化方法是近年來的研究熱點(diǎn),理論上能夠求出最優(yōu)的集結(jié)軌跡。文獻(xiàn)[9]提出了一種再入軌跡優(yōu)化方法,通過自適應(yīng)樽海鞘群算法改善偽譜法的全局尋優(yōu)性能。文獻(xiàn)[10]通過優(yōu)化控制量變化率約束的處理方法,大幅提升偽譜法求解軌跡優(yōu)化問題的計(jì)算效率。但遠(yuǎn)距離集結(jié)軌跡的規(guī)劃問題更加復(fù)雜,狀態(tài)空間更為龐大,應(yīng)用偽譜法求解的實(shí)時(shí)性依然存在一定問題。
為提高飛行器應(yīng)對(duì)未知干擾的能力,本文提出一種升力式飛行器集結(jié)軌跡規(guī)劃方法。建立以能量為自變量的飛行器模型,分析了在平衡滑翔條件下升力式飛行器的最快到達(dá)軌跡模式與最慢到達(dá)軌跡模式,并提出最速能量調(diào)整軌跡的快速迭代計(jì)算方法。通過實(shí)時(shí)求解多個(gè)飛行器的可達(dá)時(shí)間范圍,動(dòng)態(tài)調(diào)整最終的集結(jié)時(shí)間,構(gòu)建了多飛行器集結(jié)軌跡規(guī)劃方法。
考慮地球自轉(zhuǎn)的影響,建立飛行器在極坐標(biāo)系中的數(shù)學(xué)模型[11]:
(1)
式中:V飛行器為相對(duì)地球的速度,γ為飛行路徑角,ψ為航向角,r為從地心到飛行器質(zhì)心的距離,θ為經(jīng)度,φ為地心緯度,m為飛行器質(zhì)量,gr為引力加速度沿地心矢徑方向的分量,gωe為引力加速度沿地球自轉(zhuǎn)角速度方向的分量,ωe為地球自轉(zhuǎn)角速度,D為氣動(dòng)阻力,L為氣動(dòng)升力,σ為傾側(cè)角。
氣動(dòng)阻力和升力的計(jì)算公式如下[9]:
(2)
式中:Sref為飛行器參考面積,Cd,Cl為氣動(dòng)阻力系數(shù)和氣動(dòng)升力系數(shù),ρ為大氣密度。
以無窮遠(yuǎn)處為勢(shì)能零點(diǎn),定義飛行器單位質(zhì)量的機(jī)械能E:
(3)
式中:μ為地球引力常數(shù),Re為地球半徑。
將能量對(duì)時(shí)間微分,可得:
(4)
由于升力式飛行器不帶動(dòng)力,只依靠最初的能量在大氣層內(nèi)飛行,且受到氣動(dòng)阻力影響,E在飛行過程中是不斷衰減的,即dE/dt始終小于零。
為了實(shí)現(xiàn)飛行器的集結(jié),需要確定每個(gè)飛行器的可達(dá)時(shí)間范圍,即飛行器抵達(dá)目標(biāo)點(diǎn)的最晚到達(dá)飛行時(shí)間和最早到達(dá)飛行時(shí)間。
(5)
當(dāng)剩余航程相同時(shí),到達(dá)時(shí)間的上下界分別對(duì)應(yīng)于平均速度的上下界。升力式飛行器的能量基本由速度決定[12],因此平均速度的上下界與平均能量的上下界相對(duì)應(yīng)。
考慮能量航程剖面上的五條曲線,如圖1所示。其中,曲線A與曲線E對(duì)應(yīng)飛行器按照最大升阻比攻角飛行的軌跡,其中曲線A的終點(diǎn)為目標(biāo)點(diǎn),曲線E的起點(diǎn)為當(dāng)前點(diǎn)。根據(jù)文獻(xiàn)[13-14]可知,升力式飛行器按照最大升阻比攻角飛行時(shí),航程最遠(yuǎn),能量隨航程衰減最慢。因此,最終能夠抵達(dá)目標(biāo)點(diǎn)的所有軌跡,不可能出現(xiàn)低于曲線A的點(diǎn),否則將無法抵達(dá)目標(biāo)點(diǎn);而從當(dāng)前點(diǎn)出發(fā)的所有軌跡,能量衰減速度不可能慢于曲線E,因此不可能出現(xiàn)高于曲線E的點(diǎn)。
圖1 能量航程剖面軌跡示意圖Fig.1 Trajectories in energy-range plane
曲線B、C、D分別對(duì)應(yīng)三條從當(dāng)前點(diǎn)到目標(biāo)點(diǎn)的可行軌跡。曲線B代表的軌跡從當(dāng)前點(diǎn)開始,以最大能力消耗能量,直到與曲線A相交,之后按照最大升阻比攻角飛行,軌跡與A重合。曲線D代表的軌跡前期與曲線E重合,在最后階段以最大能力消耗能量,直到抵達(dá)目標(biāo)點(diǎn)。曲線B和D其實(shí)就是從當(dāng)前點(diǎn)到目標(biāo)點(diǎn)所有可行軌跡的上下界,曲線C代表的就是B和D構(gòu)成的可行域范圍內(nèi)任意一條可行軌跡。
結(jié)合圖1易知,曲線B和D分別對(duì)應(yīng)了平均能量的最小值和最大值,也就是最晚到達(dá)飛行時(shí)間和最早到達(dá)飛行時(shí)間。
定義在滿足平衡滑翔條件(飛行路徑角基本保持不變[15])的前提下,以最短航程完成能量調(diào)整任務(wù)的軌跡為最速能量調(diào)整軌跡。曲線B和曲線D所代表的兩條軌跡均由一段最速能量調(diào)整軌跡和一段最大升阻比軌跡結(jié)合而成。
以曲線B中的最速能量調(diào)整軌跡為例,假設(shè)軌跡終點(diǎn)能量為Eshift,速度為Vshift,軌跡長(zhǎng)度微元dS可通過下式計(jì)算:
(6)
聯(lián)立模型(1)、式(4)和式(6),可得飛行軌跡長(zhǎng)度S相對(duì)于飛行器單位質(zhì)量能量E的微分:
(7)
將式(7)積分:
(8)
在平衡滑翔條件下,可近似認(rèn)為高度是能量的線性函數(shù)[16],即H=kE+a,其中k和a可通過初末狀態(tài)求出,則有
(9)
由式(9)可知,軌跡長(zhǎng)度S主要取決于阻力加速度系數(shù)Cd,Cd越大,S越小。
當(dāng)高度差相同時(shí),S越小,水平航程越短。水平航程可進(jìn)一步分解為縱向航程和橫向航程。為了便于分析,不妨假設(shè)飛行器沿赤道向東飛行,目標(biāo)點(diǎn)在其正東方,則經(jīng)度的變化為縱向航程,緯度的變化為橫向航程,期望的偏航角ψ為90°,則能量管理段的縱向航程為
(10)
傾側(cè)角取值對(duì)于阻力的變化影響并不明顯,主要通過飛行路徑角、偏航角影響縱向航程。如果要使能量管理段的縱向航程最短,則應(yīng)使得γ0盡可能小,偏航角ψ盡可能偏離90°,而這都要求傾側(cè)角幅值盡可能大,翻轉(zhuǎn)次數(shù)盡可能少。為了同時(shí)滿足能量管理段結(jié)束時(shí)的橫向航程誤差約束和偏航角誤差約束,至少需要設(shè)置兩次翻轉(zhuǎn)進(jìn)行規(guī)劃[11]。
綜合以上分析,為了實(shí)現(xiàn)最短縱向航程的能量管理,Cd和傾側(cè)角幅值應(yīng)取允許范圍內(nèi)的最大值,且設(shè)置兩次傾側(cè)角符號(hào)的翻轉(zhuǎn)。
(11)
集結(jié)軌跡實(shí)時(shí)規(guī)劃包含兩部分內(nèi)容,一是根據(jù)各飛行器狀態(tài)實(shí)時(shí)確定集結(jié)時(shí)刻,這需要對(duì)各飛行器的可達(dá)時(shí)間范圍的進(jìn)行求解;二是根據(jù)集結(jié)時(shí)刻調(diào)整各飛行器的軌跡。
最慢到達(dá)軌跡對(duì)應(yīng)于圖1中的曲線B,由一段最速能量調(diào)整軌跡與一段最大升阻比軌跡構(gòu)成。
最大升阻比軌跡以目標(biāo)點(diǎn)為終點(diǎn),可以預(yù)先確定。最速能量調(diào)整軌跡則需迭代求解。
4)迭代次數(shù)z=z+1,判斷若超出最大迭代次數(shù),則計(jì)算結(jié)束;未超出則執(zhí)行下一步。
(12)
式中:kS為調(diào)整系數(shù),可控制迭代的速度,在0到1之間取值,越大則航程收斂越快,可根據(jù)航程與誤差需求選取適當(dāng)?shù)闹怠?/p>
(13)
根據(jù)平衡滑翔條件[15]可知,飛行路徑角隨時(shí)間變化率等于零,則傾側(cè)角幅值可通過下式計(jì)算:
(14)
傾側(cè)角翻轉(zhuǎn)位置以及最速能量調(diào)整軌跡航程的求解方法與最慢到達(dá)軌跡相同,此處不再贅述。
(15)
式中:Tf0即為最初確定的集結(jié)時(shí)間。
飛行過程中的集結(jié)軌跡實(shí)時(shí)規(guī)劃共分為兩個(gè)階段。其中第一階段的任務(wù)是確定最終的集結(jié)時(shí)間,第二階段是各飛行器按照集結(jié)時(shí)間調(diào)整自身軌跡。
(16)
進(jìn)入第二階段后,飛行器j需要轉(zhuǎn)入曲線B代表的最慢到達(dá)軌跡模式,消耗多余能量,降低速度,否則將無法與飛行器i的集結(jié)。能量調(diào)整段結(jié)束后,飛行器j必須沿能量最優(yōu)軌跡飛行,不再具備多余能量。飛行器若在此階段遭遇敵對(duì)干擾,需要根據(jù)實(shí)際情況與預(yù)先設(shè)定的規(guī)則,在機(jī)動(dòng)與集結(jié)之間進(jìn)行取舍,因?yàn)檫M(jìn)行機(jī)動(dòng)將導(dǎo)致其到達(dá)時(shí)間延后,抵達(dá)集結(jié)點(diǎn)的速度也將低于集結(jié)要求。
飛行器i則繼續(xù)沿曲線D代表的最快到達(dá)軌跡飛行,保持快速飛行,但必須將多余能量集中在最后的能量調(diào)整段消耗,在此之前不可再做額外機(jī)動(dòng);此時(shí)如果再次遭遇干擾,雖然仍有多余能量,額外的機(jī)動(dòng)不一定影響其終端速度,但會(huì)導(dǎo)致抵達(dá)時(shí)間延后,錯(cuò)過預(yù)定的集結(jié)時(shí)間。
其他飛行器則以此集結(jié)時(shí)刻Tf為目標(biāo),當(dāng)最早到達(dá)飛行時(shí)間大于Tf時(shí),停止額外機(jī)動(dòng),沿最快到達(dá)軌跡飛行;當(dāng)最晚到達(dá)飛行時(shí)間小于Tf時(shí),轉(zhuǎn)入最慢到達(dá)軌跡。
最終,所有飛行器將在Tf時(shí)刻抵達(dá)集結(jié)位置。整個(gè)集結(jié)飛行的流程如圖2所示。
圖2 集結(jié)軌跡實(shí)時(shí)規(guī)劃流程圖Fig.2 Flow chart of gathering trajectory planning algorithm
為了驗(yàn)證本文提出的集結(jié)軌跡規(guī)劃方法,考慮三架升力式飛行器CAV-H[18]進(jìn)行集結(jié)的場(chǎng)景。飛行器分別從不同位置出發(fā),需要在相同的時(shí)間點(diǎn)抵達(dá)各自的集結(jié)點(diǎn)完成集結(jié)任務(wù)。
為了便于觀察軌跡規(guī)劃方法的效果,不妨假設(shè)3架飛行器從初始點(diǎn)出發(fā)和抵達(dá)各自集結(jié)點(diǎn)時(shí)的高度、速度、飛行路徑角、航向角均相同,但是縱向與橫向的航程不同。各飛行器的初始狀態(tài)與目標(biāo)狀態(tài)如表1所示。仿真中涉及的所有時(shí)間、高度、速度、航程已無量綱化處理。不同的是飛行器A會(huì)在飛行過程中遭遇三次未知干擾,飛行器B則不會(huì)。
表1 各飛行器的初始狀態(tài)與集結(jié)狀態(tài)Table 1 The initial state and terminal gathering state of each vehicle
按照本文所提出的方法,計(jì)算三個(gè)飛行器在起滑初始時(shí)刻的最早到達(dá)時(shí)間為:0.666,0.635,0.607。
因此,將三個(gè)飛行器的發(fā)射時(shí)間分別調(diào)整為0,0.031,0.059,此時(shí)三者的最快與最慢到達(dá)軌跡如圖3所示。
圖3 初始時(shí)刻的最快到達(dá)軌跡與最慢到達(dá)軌跡Fig.3 The fastest and slowest trajectories at beginning
所有飛行器在飛行過程中都會(huì)實(shí)時(shí)解算自身的可達(dá)時(shí)間范圍。通過仿真發(fā)現(xiàn),單次解算耗時(shí)不超過5 s,因此可以設(shè)置溝通規(guī)劃集結(jié)時(shí)間的周期為10 s。
在飛行過程中,飛行器可能遭遇敵對(duì)飛行器的干擾,飛行器采用S機(jī)動(dòng)策略進(jìn)行應(yīng)對(duì)。機(jī)動(dòng)期間,飛行器攻角取最大值20°,傾側(cè)角幅值取60°,傾側(cè)角符號(hào)按固定頻率翻轉(zhuǎn),使得飛行器在射面左右搖擺機(jī)動(dòng)。在本文的仿真場(chǎng)景中,假設(shè)飛行器A未遇到干擾,飛行器B于0.375(無量綱化時(shí)間)遭遇一次干擾,飛行器C則于0.25、0.35、0.425和0.45遭遇了四次干擾,如圖4所示。
圖4 飛行器機(jī)動(dòng)期間的攻角與航向角Fig.4 Angle of attack and heading angle of vehicles during maneuvering
這些干擾使得B、C的軌跡逐漸偏離了初始時(shí)刻的最快到達(dá)軌跡,能量也越來越偏離初始能量最優(yōu)軌跡,因此最早到達(dá)時(shí)間漸次增大。同時(shí),飛行器A一直按照最快到達(dá)軌跡飛行,其最晚到達(dá)飛行時(shí)間逐漸減小。最終在0.525,飛行器A的最晚到達(dá)時(shí)間早于飛行器C的最早到達(dá)時(shí)間,集結(jié)時(shí)間確定為0.686,集結(jié)軌跡規(guī)劃第一階段完成,各飛行器轉(zhuǎn)入第二階段飛行。
在第二階段中,飛行器A切換到最慢到達(dá)軌跡,飛行器C繼續(xù)按照最快達(dá)到軌跡飛行,不再執(zhí)行額外機(jī)動(dòng)動(dòng)作。飛行器B繼續(xù)保持能量最優(yōu)軌跡飛行,直到0.545時(shí),其最晚到達(dá)時(shí)間也小于0.686,轉(zhuǎn)入最慢到達(dá)軌跡。最終,三架飛行器基本同時(shí)到達(dá)集結(jié)位置,完成集結(jié),如圖5所示。
圖5 飛行器的實(shí)際集結(jié)軌跡Fig.5 The actual gathering trajectories of vehicles
通過圖5(b)的能量曲線可以看出,本文設(shè)計(jì)的集結(jié)軌跡規(guī)劃方法使得飛行器B與飛行器C的富余能量充分應(yīng)用在了應(yīng)對(duì)突發(fā)干擾的機(jī)動(dòng)中,整個(gè)飛行器集群始終保持能量最優(yōu)的態(tài)勢(shì)飛行,直到集群狀態(tài)抵達(dá)可實(shí)現(xiàn)集結(jié)的邊界,在整個(gè)集群尺度上實(shí)現(xiàn)了能量的優(yōu)化分配。
圖6展示了整個(gè)集結(jié)過程中的路徑約束滿足情況,可以看到所有飛行器的熱流、動(dòng)壓、過載均未超出約束(約束上限均為1)。這是由于飛行器全程采用擬平衡滑翔模式,軌跡變化一直比較平緩,最可能超出約束的是末段的能量調(diào)整段。一旦超過約束,則需要通過改變能量調(diào)整段的攻角,減緩能量調(diào)整的速度,實(shí)現(xiàn)路徑約束的滿足。
圖6 熱流、動(dòng)壓、過載曲線(無量綱)Fig.6 The heat, dynamic pressure and load curve
本文針對(duì)升力式飛行器的集結(jié)問題,提出了一種能夠提高飛行器干擾適應(yīng)能力的實(shí)時(shí)軌跡規(guī)劃方法,并通過仿真驗(yàn)證了算法的有效性。
1)本文提出了一種集結(jié)軌跡規(guī)劃方法,通過實(shí)時(shí)求解可達(dá)時(shí)間范圍協(xié)調(diào)多個(gè)升力式飛行器的集結(jié)時(shí)間。通過仿真分析,證實(shí)這種軌跡規(guī)劃方法能夠?qū)崿F(xiàn)升力式飛行器面對(duì)嚴(yán)重干擾時(shí)的集結(jié)飛行,提升飛行器執(zhí)行任務(wù)的適應(yīng)性。
2)本文分析了在平衡滑翔條件下升力式飛行器的最快到達(dá)軌跡模式與最慢到達(dá)軌跡模式,提出了最速能量調(diào)整軌跡的快速迭代計(jì)算方法,構(gòu)建了多飛行器集結(jié)軌跡規(guī)劃方法,通過仿真驗(yàn)證了方法的可行性。