劉大衛(wèi), 孫景亮, 龍騰, 何鏡, 王曉悅,2
(1.中國兵器科學(xué)研究院, 北京 100089; 2.北京理工大學(xué) 宇航學(xué)院, 北京 100081;3.北京理工大學(xué)重慶創(chuàng)新中心, 重慶 401120)
隨著現(xiàn)代科技的飛速發(fā)展,無人機(jī)、巡航導(dǎo)彈等具備飛行速度快、機(jī)動(dòng)能力強(qiáng)等特點(diǎn)的先進(jìn)飛行器給攔截制導(dǎo)系統(tǒng)帶來了巨大技術(shù)挑戰(zhàn)。傳統(tǒng)的一對(duì)一攔截制導(dǎo)方式已難以滿足低成本、全方位、飽和攻擊能力需求,一定程度上降低了攔截制導(dǎo)系統(tǒng)對(duì)機(jī)動(dòng)目標(biāo)的攔截概率[1]。協(xié)同攔截制導(dǎo)能夠通過彈間信息交互、戰(zhàn)術(shù)配合,完成對(duì)機(jī)動(dòng)目標(biāo)的飽和同時(shí)或者序貫攻擊,對(duì)降低機(jī)動(dòng)目標(biāo)的攔截脫靶量、提升動(dòng)態(tài)環(huán)境下制導(dǎo)系統(tǒng)的魯棒性和可靠性,具有重要的理論和工程價(jià)值。
現(xiàn)有協(xié)同制導(dǎo)方式主要包括隱式協(xié)同制導(dǎo)和顯式協(xié)同制導(dǎo)兩類。隱式協(xié)同制導(dǎo)主要通過預(yù)先設(shè)定協(xié)同變量(攻擊時(shí)間、攻擊角度等)以及各發(fā)導(dǎo)彈獨(dú)立控制的方式進(jìn)行。該協(xié)同制導(dǎo)方式不存在彈間的信息交互與配合,本質(zhì)上屬于一對(duì)一單彈制導(dǎo)[2]。顯式協(xié)同制導(dǎo)主要通過彈間信息的交互與協(xié)調(diào),實(shí)現(xiàn)協(xié)同變量的協(xié)調(diào)一致,達(dá)到同時(shí)攻擊或者序貫攻擊的協(xié)同目的。因此,顯式協(xié)同制導(dǎo)方式得到了國內(nèi)外學(xué)者的廣泛關(guān)注與青睞,并取得了較好的研究成果。
針對(duì)顯式協(xié)同制導(dǎo),文獻(xiàn)[3]針對(duì)地面靜止目標(biāo)提出了導(dǎo)彈剩余時(shí)間一致的分布式協(xié)同制導(dǎo)律。文獻(xiàn)[4]考慮艦炮制導(dǎo)彈藥的協(xié)同攻擊問題,通過設(shè)計(jì)擴(kuò)張狀態(tài)觀測(cè)器,提出了非奇異終端滑模自適應(yīng)控制器,實(shí)現(xiàn)了有限時(shí)間內(nèi)艦炮趨同攻擊,提升了對(duì)機(jī)動(dòng)目標(biāo)的協(xié)同制導(dǎo)性能。進(jìn)一步,為了避免剩余時(shí)間估計(jì)誤差對(duì)協(xié)同制導(dǎo)精度的影響,文獻(xiàn)[5]考慮機(jī)動(dòng)目標(biāo)協(xié)同攔截制導(dǎo)問題,將導(dǎo)彈與目標(biāo)之間的相對(duì)距離設(shè)計(jì)為協(xié)同變量,并基于多智能體一致性理論,設(shè)計(jì)了有限時(shí)間一致收斂的分布式預(yù)設(shè)性能協(xié)同制導(dǎo)律,實(shí)現(xiàn)了多彈對(duì)機(jī)動(dòng)目標(biāo)的協(xié)同打擊。總之,近年來針對(duì)靜止/機(jī)動(dòng)目標(biāo)的多彈協(xié)同制導(dǎo)方法已取得了較好的研究成果[6-8]。但現(xiàn)有大部分方法均關(guān)注于閉環(huán)系統(tǒng)的穩(wěn)定性和協(xié)調(diào)變量的一致性問題,對(duì)協(xié)同制導(dǎo)最優(yōu)性缺乏考慮,降低了協(xié)同制導(dǎo)性能。
基于此,最優(yōu)協(xié)同制導(dǎo)以及微分博弈協(xié)同制導(dǎo)問題得到部分學(xué)者的關(guān)注[9-12]。例如,文獻(xiàn)[9]將協(xié)同制導(dǎo)問題描述為考慮模型不確定的線性多智能體微分博弈問題,基于領(lǐng)航-跟隨協(xié)同控制理論,通過對(duì)標(biāo)稱模型進(jìn)行納什均衡解的解析計(jì)算,獲得近似最優(yōu)的協(xié)同制導(dǎo)律。但上述方法均采用線性化假設(shè),基于線性二次調(diào)節(jié)器理論進(jìn)行推導(dǎo)。在考慮目標(biāo)大機(jī)動(dòng)特性時(shí),該類方法通常難以滿足小擾動(dòng)線性化假設(shè),降低了對(duì)機(jī)動(dòng)目標(biāo)的打擊概率。另一方面,由于復(fù)雜戰(zhàn)場(chǎng)環(huán)境以及目標(biāo)機(jī)動(dòng)干擾導(dǎo)致的協(xié)同制導(dǎo)系統(tǒng)模型部分未知問題,進(jìn)一步降低了協(xié)同制導(dǎo)性能。因此,考慮目標(biāo)機(jī)動(dòng)特性,研究模型部分未知條件下非線性最優(yōu)協(xié)同制導(dǎo)方法,對(duì)提升系統(tǒng)魯棒性、降低協(xié)同制導(dǎo)脫靶量,具有重要工程價(jià)值。但非線性最優(yōu)協(xié)同制導(dǎo)律的設(shè)計(jì)通常涉及耦合偏微分哈密頓-雅可比-貝爾曼(HJB)方程的求解??紤]該HJB方程通常難以獲得其解析解,限制了非線性最優(yōu)協(xié)同制導(dǎo)律的設(shè)計(jì)。
自適應(yīng)動(dòng)態(tài)規(guī)劃(ADP)技術(shù)作為一種類腦智能控制方法,近年來通過與反步控制方法相結(jié)合,已被應(yīng)用于非線性最優(yōu)協(xié)同控制/微分博弈問題的求解[12-14],并展現(xiàn)出較大的發(fā)展?jié)摿ΑT贏DP攔截制導(dǎo)領(lǐng)域,文獻(xiàn)[15-17]研究了攔截制導(dǎo)系統(tǒng)模型部分未知、過載飽和以及狀態(tài)、輸出限制等約束條件下的攔截制導(dǎo)問題,通過將ADP技術(shù)融入反步控制設(shè)計(jì)中,實(shí)現(xiàn)了對(duì)機(jī)動(dòng)目標(biāo)的攔截。但上述研究?jī)H針對(duì)一對(duì)一攔截制導(dǎo)問題,難以滿足多彈協(xié)同一致收斂攔截制導(dǎo)需求。文獻(xiàn)[18]考慮未知機(jī)動(dòng)目標(biāo)的協(xié)同攔截制導(dǎo)問題,設(shè)計(jì)了分布式自適應(yīng)反步最優(yōu)制導(dǎo)律,實(shí)現(xiàn)了過載飽和約束下視線角協(xié)同一致攔截制導(dǎo)。上述研究均將非線性制導(dǎo)控制問題通過反步法設(shè)計(jì)思想轉(zhuǎn)化為等效最優(yōu)制導(dǎo)控制問題,采用ADP技術(shù)實(shí)現(xiàn)了全局最優(yōu)制導(dǎo)控制。但在虛擬控制量的設(shè)計(jì)過程中并未考慮控制量的最優(yōu)化問題?;诖?文獻(xiàn)[19-21]在反步控制設(shè)計(jì)架構(gòu)下,考慮輸入、狀態(tài)約束,通過構(gòu)建執(zhí)行-評(píng)價(jià)網(wǎng)絡(luò),在線逼近了最優(yōu)虛擬和實(shí)際控制量。然而,上述結(jié)果僅適用于單個(gè)非線性系統(tǒng)的最優(yōu)控制問題,尚不能滿足非線性協(xié)同最優(yōu)控制問題的求解??紤]協(xié)同制導(dǎo)問題中目標(biāo)機(jī)動(dòng)干擾導(dǎo)致的模型部分未知、輸出約束受限等問題,如何借鑒該設(shè)計(jì)思想實(shí)現(xiàn)對(duì)非線性協(xié)同制導(dǎo)律的在線求解,估計(jì)非線性模型未知干擾,補(bǔ)償約束受限影響,提升協(xié)同制導(dǎo)問題的魯棒性和可靠性,仍有待進(jìn)一步深入研究與探討。
本文將ADP技術(shù)與反步法有機(jī)融合,構(gòu)建“前饋補(bǔ)償+反饋優(yōu)化”的復(fù)合協(xié)同制導(dǎo)架構(gòu),研究目標(biāo)未知機(jī)動(dòng)下分布式一致誤差約束的協(xié)同攔截制導(dǎo)問題。主要?jiǎng)?chuàng)新點(diǎn)為:
1)設(shè)計(jì)了統(tǒng)一障礙Lyapunov函數(shù)非線性約束映射機(jī)制,放松了對(duì)傳統(tǒng)方法誤差約束存在性的限制,提升了攔截制導(dǎo)系統(tǒng)的魯棒性;
2)設(shè)計(jì)了線性反饋增強(qiáng)的非線性自適應(yīng)最優(yōu)攔截制導(dǎo)律,實(shí)現(xiàn)了虛擬控制量的最優(yōu)在線迭代求解,提升了誤差一致收斂速率。
考慮發(fā)導(dǎo)彈協(xié)同攔截一個(gè)機(jī)動(dòng)目標(biāo)的情形,在二維平面上,其協(xié)同攔截制導(dǎo)幾何關(guān)系如圖1所示。圖1中,Oxy為平面直角坐標(biāo)系,M1,M2,…,MN表示N發(fā)導(dǎo)彈,T表示機(jī)動(dòng)目標(biāo),vi、αi、θi分別表示第i發(fā)導(dǎo)彈的飛行速度、航跡角和視線角,i=1,…,N,ri為第i發(fā)導(dǎo)彈與目標(biāo)在視線方向的相對(duì)距離,ui為第i發(fā)導(dǎo)彈垂直于速度方向的控制輸入,vT、β分別表示目標(biāo)的飛行速度和航跡角,uT表示目標(biāo)垂直于速度方向的控制輸入。假設(shè)所有導(dǎo)彈與目標(biāo)的飛行速度均為常值,且各導(dǎo)彈之間主要依靠拓?fù)渚W(wǎng)絡(luò)進(jìn)行通信,即第i發(fā)導(dǎo)彈只能與其鄰域內(nèi)的導(dǎo)彈進(jìn)行通信。
圖1 多彈協(xié)同制導(dǎo)幾何關(guān)系
協(xié)同攔截相對(duì)運(yùn)動(dòng)學(xué)關(guān)系為
(1)
(2)
(3)
基于以上分析可知,所設(shè)計(jì)分布式協(xié)同攔截制導(dǎo)律需滿足以下3個(gè)條件:
1)保證所有導(dǎo)彈最終能夠擊中目標(biāo),即ri→0 m;
(4)
基于式(4),多導(dǎo)彈協(xié)同制導(dǎo)問題就可以轉(zhuǎn)化為非線性多智能系統(tǒng)的協(xié)同控制問題。本文主要通過設(shè)計(jì)分布式自適應(yīng)最優(yōu)控制律,保證系統(tǒng)中狀態(tài)變量xi一致收斂于0,從而實(shí)現(xiàn)多彈協(xié)同制導(dǎo)。
導(dǎo)彈與目標(biāo)自動(dòng)駕駛儀均為如下1階動(dòng)態(tài)系統(tǒng):
第i發(fā)導(dǎo)彈質(zhì)心運(yùn)動(dòng)方程為
(5)
式中:(xMi,yMi)表示導(dǎo)彈的位置坐標(biāo)信息;ai表示導(dǎo)彈側(cè)向加速度;τMi為第i發(fā)導(dǎo)彈的自動(dòng)駕駛儀時(shí)間常數(shù),τMi=0.1 s。
目標(biāo)質(zhì)心運(yùn)動(dòng)方程為
(6)
式中:(xt,yT)表示機(jī)動(dòng)目標(biāo)位置坐標(biāo)信息;aT為目標(biāo)側(cè)向加速度;τT表示目標(biāo)自動(dòng)駕駛儀時(shí)間常數(shù),τT=0.1 s。
由式(1)可知,當(dāng)導(dǎo)彈接近目標(biāo)即ri→0 m時(shí),非線性動(dòng)力學(xué)趨于無窮大。此時(shí),非線性協(xié)同攔截制導(dǎo)系統(tǒng)式(4)不可控。但考慮到實(shí)際攔截制導(dǎo)系統(tǒng)中由于測(cè)量設(shè)備的物理限制,總是存在一個(gè)彈-目最小距離ε0。當(dāng)攔截制導(dǎo)脫靶量滿足ri≤ε0時(shí)制導(dǎo)過程結(jié)束,之后導(dǎo)彈將以慣性力飛向目標(biāo),實(shí)現(xiàn)攔截。此外,由式(4)可知,當(dāng)|αi-θi|=0°,|β-θi|=0°時(shí),攔截制導(dǎo)系統(tǒng)輸入矩陣為零,目標(biāo)機(jī)動(dòng)輸入矩陣也為零,此時(shí)攔截制導(dǎo)系統(tǒng)已不再滿足可控性條件,無法為其設(shè)計(jì)協(xié)同攔截制導(dǎo)律。因此,本文設(shè)計(jì)的協(xié)同攔截制導(dǎo)律的可行域范圍可定義為
(7)
考慮來襲機(jī)動(dòng)目標(biāo)的物理特性以及推力限制,基于式(4),給出如下普遍性假設(shè)條件:機(jī)動(dòng)目標(biāo)垂直于速度方向的控制輸入uT是有界的,即存在一個(gè)未知正常數(shù)ζv>0,使得不等式|uT|≤ζv成立。
基于式(4),多彈協(xié)同攔截制導(dǎo)問題可描述為一類由N個(gè)跟隨者和1個(gè)領(lǐng)導(dǎo)者組成的嚴(yán)格反饋非線性多智能體系統(tǒng)的協(xié)同控制問題,其中每發(fā)導(dǎo)彈均可看作是一個(gè)獨(dú)立可控的智能體:
(8)
通過對(duì)上述協(xié)同攔截制導(dǎo)問題的描述,制導(dǎo)律的設(shè)計(jì)可轉(zhuǎn)化為設(shè)計(jì)分布式控制律,抑制系統(tǒng)式(8)的輸出信號(hào)違背約束,從而保證系統(tǒng)的閉環(huán)穩(wěn)定性。
考慮協(xié)同攔截制導(dǎo)系統(tǒng)實(shí)際物理特性,結(jié)合式(4),可知gi,q(·)=[0,sin(αi-θi)]T,顯然,gi,q(·)為有界矩陣。此外,rd(t)為參考軌跡,在本文中表示領(lǐng)彈輸出的彈-目攔截軌跡,因此必然為連續(xù)可導(dǎo)的光滑信號(hào)。基于此,本文可給出如下假設(shè)[22]:
為有效補(bǔ)償輸出約束,設(shè)計(jì)如下障礙Lyapunov函數(shù)(BLF):
(9)
傳統(tǒng)形式VCBLF[23]為
(10)
(11)
(12)
通過定義如下動(dòng)態(tài)誤差面,構(gòu)建前饋補(bǔ)償+反饋優(yōu)化的復(fù)合控制架構(gòu):
(13)
式中:λi,q為1階濾波器輸出信號(hào)。濾波器設(shè)計(jì)如下:
(14)
基于復(fù)合控制架構(gòu),分布式控制律設(shè)計(jì)如下。
對(duì)誤差動(dòng)態(tài)面zi,1求導(dǎo),整理可得
(15)
(16)
式中:Θi,q∈RL×m為觀測(cè)器理想權(quán)值;Φi,q(zi,q)∈RL為激勵(lì)函數(shù),L為神經(jīng)元個(gè)數(shù);ζi,q為觀測(cè)誤差,‖ζi,q‖≤ζi,qM,ζi,qM>0。
因此,式(15)可轉(zhuǎn)化為
(17)
定義Lyapunov函數(shù)為
(18)
對(duì)式(18)求1階導(dǎo)數(shù),通過不等式變換,可得
(19)
(20)
(21)
式中:li,1>0為可調(diào)節(jié)參數(shù)。
將式(20)、式(21)代入式(19),整理可得
(22)
(23)
(24)
式中:γi,q,q=1,…,ni為預(yù)先給定的參數(shù)。
(25)
基于最優(yōu)控制理論,定義哈密頓函數(shù)為
(26)
(27)
且相應(yīng)的HJB方程為
(28)
(29)
式中:Wi,1∈RLi,1為理想權(quán)值;σi,1(zi,1)∈RLi,1為激勵(lì)函數(shù);εi,1為評(píng)價(jià)網(wǎng)絡(luò)逼近誤差。
進(jìn)一步考慮理想權(quán)值Wi,1未知,采用估計(jì)值代替:
(30)
因此,估計(jì)的虛擬反饋控制律可表述為
(31)
相應(yīng)估計(jì)的HJB方程變化為
Hi,1(zi,1,i,2,i,1)=
(32)
基于梯度下降法,考慮閉環(huán)系統(tǒng)穩(wěn)定性,設(shè)計(jì)評(píng)價(jià)網(wǎng)絡(luò)權(quán)值自適應(yīng)更新律為
(33)
基于上述設(shè)計(jì),定義式(34)所示Lyapunov函數(shù),分析zi,1子系統(tǒng)的穩(wěn)定性:
(34)
對(duì)式(34)求1階導(dǎo)數(shù),可得
(35)
(36)
(37)
基于式(36)、式(37),式(35)可整理為
(38)
(39)
此時(shí),式(39)可變換為
(40)
式中:λmin(Mi,1)表示矩陣Mi,1的最小特征值。
(41)
(42)
式中:li,q>0、ρi,q>0均為設(shè)計(jì)參數(shù)。
同理,第q步的估計(jì)虛擬反饋控制律i,q+1和評(píng)價(jià)網(wǎng)絡(luò)權(quán)值自適應(yīng)更新律分別設(shè)計(jì)為
i,q+1=
(43)
(44)
此外,考慮zi,q子系統(tǒng)閉環(huán)穩(wěn)定性證明過程與zi,1子系統(tǒng)相似,省略詳細(xì)推導(dǎo)過程,可得Lyapunov函數(shù)的1階導(dǎo)數(shù)形式為
(45)
(46)
(47)
式中:li,ni>0、ρi,ni>0為設(shè)計(jì)參數(shù)。
(48)
(49)
同理,經(jīng)理論推導(dǎo),可得zi,ni子系統(tǒng)的Lyapunov函數(shù)1階導(dǎo)數(shù)形式為
(50)
基于第2節(jié)每個(gè)子系統(tǒng)的理論分析與虛擬和實(shí)際控制輸入設(shè)計(jì),給出如下定理。
定理1針對(duì)非線性多智能體系統(tǒng)式(8),設(shè)計(jì)前饋控制輸入式(46),自適應(yīng)權(quán)值更新律為式(47);同時(shí)設(shè)計(jì)估計(jì)的反饋控制輸入為式(48),評(píng)價(jià)網(wǎng)絡(luò)權(quán)值更新律設(shè)計(jì)為式(49)。通過選擇設(shè)計(jì)參數(shù),可保證閉環(huán)系統(tǒng)協(xié)同一致誤差有界,且輸出信號(hào)滿足約束條件,同時(shí)能夠最小化給定的性能指標(biāo)。
證明選擇Lyapunov函數(shù)為
(51)
(52)
(53)
基于式(53),式(52)可變換為
(54)
(55)
或
(56)
由式(55)、式(56)可知,通過調(diào)整設(shè)計(jì)參數(shù)li,min、C1i,k、C2i,k和ki,k,可保證μi和λi,min(Mi)足夠大且κi足夠小,從而保證閉環(huán)信號(hào)收斂域縮小,實(shí)現(xiàn)協(xié)同跟蹤誤差的最終收斂。然而,在控制律設(shè)計(jì)中需要選取的主要參數(shù)較多,如li,q、γi,q、ki,q、ηi,q、C1i,k、C2i,k等,其中l(wèi)i,q和ki,q為反饋增益系數(shù),較大的li,q和ki,q可保證系統(tǒng)響應(yīng)速度加快,同時(shí)也導(dǎo)致較大的過載要求。γi,q主要用于權(quán)衡收斂誤差和控制輸入,一般可選取為1。ηi,q為學(xué)習(xí)率,取值范圍為ηi,q∈(0,1)。C1i,k、C2i,k為評(píng)價(jià)網(wǎng)絡(luò)權(quán)值更新律參數(shù),為保證矩陣Mi,q正定,通常選取較大的C2i,k和較小的C1i,k。
假設(shè)目標(biāo)機(jī)動(dòng)形式為正弦蛇形機(jī)動(dòng)[28],可表述為aT=100sin(2t)m/s2??紤]由1發(fā)領(lǐng)彈M0和2發(fā)從彈M1、M2對(duì)目標(biāo)進(jìn)行協(xié)同攔截。其中,3發(fā)導(dǎo)彈在攔截過程中可進(jìn)行信息交互,其通信拓?fù)浣Y(jié)構(gòu)如圖2所示。
圖2 彈間信息交互拓?fù)鋱D
各彈初始位置和初始航跡角信息如表1所示。
表1 彈-目初始參數(shù)
領(lǐng)彈采用比例導(dǎo)引法給出彈-目相對(duì)距離參考軌跡,作為從彈1和從彈2的期望輸出軌跡。從彈和目標(biāo)的速度分別為:vi=600 m/s,vT=400 m/s。
對(duì)于從彈1,設(shè)計(jì)參數(shù)選取為:前饋輸入中,l1,1=200,l1,2=1 000,ρ1,1=0.8,ρ1,2=0.4,Σ1,1=I,Σ1,2=0.05I;反饋輸入中,γ1,1=γ1,2=1,k1,1=0.2,k1,2=20,η1,1=η1,2=0.5,C11,1=120·[1,1,1,1]T,C21,1=8I,C11,2=10·[1,1,1,1]T,C21,2=0.2I。
對(duì)于從彈2,設(shè)計(jì)參數(shù)選取為前饋輸入中,l2,1=50,l2,2=1 000,ρ2,1=2,ρ2,2=0.08,Σ2,1=Σ2,2=I;反饋輸入中,γ2,1=γ2,2=1,k2,1=0.5,k2,2=120,η2,1=η2,2=0.5,C12,1=20·[1,1,1,1]T,C22,1=2I,C21,2=200·[1,1,1,1]T,C22,2=0.05I。
仿真結(jié)果如圖3~圖6所示。圖3給出了3發(fā)導(dǎo)彈協(xié)同攔截機(jī)動(dòng)目標(biāo)的軌跡,可直觀看到3發(fā)導(dǎo)彈在不同初始位置上,經(jīng)過協(xié)同調(diào)整,完成了對(duì)蛇形機(jī)動(dòng)目標(biāo)的同時(shí)攔截。由于從彈1和從彈2的初始位置相較于領(lǐng)彈距離目標(biāo)初始位置更近,在勻速飛行狀態(tài)下,攔截時(shí)間更短。因此,為了保證3發(fā)導(dǎo)彈同時(shí)攔截,2發(fā)從彈均通過增加航程的方式調(diào)整軌跡,達(dá)到彈間協(xié)同的目的。圖4給出了各彈與目標(biāo)的相對(duì)距離變化曲線,可直觀地理解對(duì)彈-目剩余距離的調(diào)整。
圖3 多彈協(xié)同攔截軌跡
圖4 彈-目相對(duì)距離
具體脫靶量和攔截時(shí)間參數(shù)見表2。從表2中可知,3發(fā)導(dǎo)彈均能夠?qū)崿F(xiàn)對(duì)目標(biāo)的攔截制導(dǎo),且三者之間的攔截時(shí)間最大誤差為0.01 s,能夠滿足同時(shí)打擊性能要求。當(dāng)然,也可通過調(diào)整設(shè)計(jì)參數(shù),在犧牲一致性的前提下降低攔截制導(dǎo)精度。圖5給出了彈-目相對(duì)速率曲線??紤]從彈1和從彈2的初始位置距離目標(biāo)較近,在導(dǎo)彈速度恒定的前提下,為了實(shí)現(xiàn)3發(fā)導(dǎo)彈的同時(shí)攔截,從彈1和從彈2均通過繞路的方式增加航程。此時(shí),由于從彈1只接收領(lǐng)彈的輸出信號(hào),而從彈2同時(shí)接收領(lǐng)彈和從彈1的輸出信號(hào),2發(fā)從彈通過信息交互,協(xié)調(diào)彈-目相對(duì)距離,導(dǎo)致在制導(dǎo)開始的大約0.8 s內(nèi),彈-目相對(duì)速率發(fā)生了較大抖振,但隨后快速收斂并保持相對(duì)穩(wěn)定的負(fù)值,表明導(dǎo)彈始終朝目標(biāo)方向抵近。圖6 給出了從彈的視線角速率變化曲線。由圖6可以看出,各彈的視線角速率在經(jīng)過制導(dǎo)初始階段的抖振后,始終維持在0 rad/s附近直到制導(dǎo)結(jié)束時(shí)刻,其呈現(xiàn)發(fā)散狀態(tài)。圖7給出了分布式一致鄰域誤差曲線,表明誤差能夠始終滿足輸出約束要求。
表2 協(xié)同制導(dǎo)性能
圖5 彈-目相對(duì)速率
圖6 視線角速率曲線
圖7 一致鄰域誤差曲線
從上述分析結(jié)果可知,本文方法能夠?qū)崿F(xiàn)對(duì)蛇形機(jī)動(dòng)目標(biāo)的同時(shí)攔截,并滿足攔截制導(dǎo)性能需求,同時(shí)能夠保證系統(tǒng)分布式一致鄰域誤差信號(hào)滿足其約束限制,驗(yàn)證了本文設(shè)計(jì)方法的有效性。
本文針對(duì)機(jī)動(dòng)目標(biāo)的協(xié)同攔截制導(dǎo)問題,通過構(gòu)建前饋補(bǔ)償+反饋優(yōu)化復(fù)合制導(dǎo)控制架構(gòu),將ADP技術(shù)融入反步法過程中,實(shí)現(xiàn)了對(duì)虛擬控制輸入的優(yōu)化設(shè)計(jì),并繼承了反步法對(duì)輸出約束、未知干擾補(bǔ)償?shù)葐栴}的處理思想。得出以下主要結(jié)論:
1)本文設(shè)計(jì)的自適應(yīng)最優(yōu)協(xié)同攔截制導(dǎo)律能夠?qū)崿F(xiàn)對(duì)蛇形機(jī)動(dòng)目標(biāo)的同時(shí)攔截制導(dǎo),且攔截精度滿足性能要求,攔截時(shí)間一致性誤差可降低到0.01 s。
2)本文設(shè)計(jì)的自適應(yīng)最優(yōu)協(xié)同攔截制導(dǎo)律能夠從理論上保證了對(duì)存在或不存在輸出約束問題的協(xié)同一致問題處理的有效性,并兼顧了反步法和最優(yōu)控制方法的優(yōu)勢(shì)。
3)本文工作能夠?yàn)榉蔷€性自適應(yīng)最優(yōu)協(xié)同攔截制導(dǎo)方法研究提供借鑒思想。但考慮相關(guān)理論方法尚不完備,文中僅驗(yàn)證了該方法的有效性,其魯棒性和適用性還有待進(jìn)一步深入探討。
4)下一步工作的重點(diǎn)是進(jìn)一步考慮多樣化目標(biāo)機(jī)動(dòng)未知特性,完善和優(yōu)化算法,探索該方法的適用條件和能力邊界。