許山山, 史涯晴, 韓敬利, 簡(jiǎn)開(kāi)宇
(陸軍工程大學(xué) 指揮控制工程學(xué)院,江蘇 南京 210007)
隨著信息技術(shù)的發(fā)展和各國(guó)反導(dǎo)防御系統(tǒng)的演進(jìn),單枚導(dǎo)彈的突防效率已經(jīng)遠(yuǎn)遠(yuǎn)不滿足理想的作戰(zhàn)效能,如何提高導(dǎo)彈的突防性能是亟須解決的一個(gè)重要問(wèn)題。導(dǎo)彈編隊(duì)協(xié)同作戰(zhàn)是采用密集臨空飽和攻擊的方式間接實(shí)現(xiàn)導(dǎo)彈突防能力的提升,為了達(dá)到這一目的,需要應(yīng)用導(dǎo)彈編隊(duì)飛行控制技術(shù)實(shí)現(xiàn)導(dǎo)彈的集群化和協(xié)同化。導(dǎo)彈編隊(duì)飛行控制是在導(dǎo)彈飛向特定目標(biāo)或方向的過(guò)程中,保持導(dǎo)彈之間預(yù)定的幾何形狀(編隊(duì)),同時(shí)適應(yīng)環(huán)境約束(例如避開(kāi)障礙物)[1]?,F(xiàn)有的集群飛行控制研究主要集中在各種無(wú)人機(jī)或機(jī)器人的集群控制方面,與之對(duì)應(yīng)的一些技術(shù)在軍事和民用領(lǐng)域都得到了很好的驗(yàn)證與應(yīng)用。考慮到導(dǎo)彈編隊(duì)飛行控制與無(wú)人機(jī)群編隊(duì)控制在軌跡、姿態(tài)控制、動(dòng)力學(xué)方面具有相似性,所以利用無(wú)人機(jī)群相關(guān)理論和控制算法解決導(dǎo)彈編隊(duì)隊(duì)形和控制是可行的,很大程度上可以提高集群導(dǎo)彈的整體作戰(zhàn)效能,尤其是在導(dǎo)彈的突防方面。
集群導(dǎo)彈編隊(duì)飛行是由多枚導(dǎo)彈組成,采用一定結(jié)構(gòu)編隊(duì)攻擊特定目標(biāo)的作戰(zhàn)方式,可確保導(dǎo)彈與導(dǎo)彈之間在飛行過(guò)程中保持一定的恒定距離[2]。編隊(duì)控制方法大多集中于解決集群導(dǎo)彈系統(tǒng)的幾何問(wèn)題,采用的方法主要有領(lǐng)彈-從彈法、虛擬結(jié)構(gòu)法、基于行為法等[3]。基于虛擬結(jié)構(gòu)編隊(duì)控制方式最主要的缺點(diǎn)是外部環(huán)境需要具有較高的計(jì)算能力和較強(qiáng)的通信能力;而基于行為法的缺點(diǎn)是無(wú)法進(jìn)行系統(tǒng)的穩(wěn)定性分析。但是采取領(lǐng)彈-從彈法,不僅可以降低計(jì)算機(jī)處理數(shù)據(jù)的能力,而且控制效果較好。目前國(guó)內(nèi)外對(duì)編隊(duì)控制器的研究主要集中在航天器和無(wú)人機(jī)飛行方面[2,4],對(duì)導(dǎo)彈方面的研究還比較少。劉高旗等[5]將無(wú)人機(jī)隊(duì)形重構(gòu)的連續(xù)時(shí)間最優(yōu)控制問(wèn)題離散化為非線性規(guī)劃問(wèn)題進(jìn)行求解,但是對(duì)計(jì)算性能要求較高[5]?;谝陨戏椒ǖ膬?yōu)缺點(diǎn),本文采用基于目標(biāo)一致算法[6]研究集群導(dǎo)彈系統(tǒng)的編隊(duì)協(xié)同控制問(wèn)題,其具有查找合適控制器的簡(jiǎn)單性和集群導(dǎo)彈系統(tǒng)網(wǎng)絡(luò)結(jié)構(gòu)的靈活性。首先,對(duì)導(dǎo)彈編隊(duì)控制系統(tǒng)[7]進(jìn)行建模,提出系統(tǒng)的編隊(duì)控制算法;其次,在控制律中應(yīng)用一種領(lǐng)彈-從彈結(jié)構(gòu),使領(lǐng)彈可以向從彈提供其期望狀態(tài)等命令以降低計(jì)算機(jī)對(duì)數(shù)據(jù)的處理能力,如圖1所示。在滿足多導(dǎo)彈組成的網(wǎng)絡(luò)基本假設(shè)的情況下,所提出的控制算法能精確地保持編隊(duì)。最后,根據(jù)模型在MATLAB中進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證了算法的有效性。
圖1 導(dǎo)彈編隊(duì)控制系統(tǒng)
下面介紹將導(dǎo)彈建模為四階系統(tǒng)[6],利用圖論建模集群導(dǎo)彈之間信息傳遞的網(wǎng)絡(luò)結(jié)構(gòu),并定義控制目標(biāo)。
假設(shè)存在運(yùn)動(dòng)特性相同的導(dǎo)彈,每個(gè)導(dǎo)彈具有4個(gè)噴管和1個(gè)控制器,每個(gè)噴管可以單獨(dú)從控制器獲取命令。為簡(jiǎn)化模型,做如下假設(shè):首先,導(dǎo)彈忽略外部空氣動(dòng)力;其次,噴管對(duì)命令響應(yīng)足夠快,可以忽略從控制器給噴管命令到噴管實(shí)際產(chǎn)生改變的時(shí)間延遲;再次,導(dǎo)彈飛行的高度不變,并且不發(fā)生偏航;最后,控制器不給導(dǎo)彈偏航力矩命令。在此假設(shè)下,給出導(dǎo)彈縱向和橫向的線性化模型。
(1)
式中:x和y分別為導(dǎo)彈在x軸、y軸的位置;u和v分別為導(dǎo)彈在x軸、y軸的速度(m/s);φ和θ分別為橫搖姿態(tài)角、俯仰姿態(tài)角(rad);p和q分別為橫搖角速度、俯仰角速度(rad/s);Mφ和Mθ分別為橫搖控制力矩、俯仰控制力矩(N·m);Ixx和Iyy分別為橫搖慣性矩、俯仰慣性矩(kg·m2);g為引力常量(m/s2)。
導(dǎo)彈平衡點(diǎn)是導(dǎo)彈在飛行高度和飛行速度不變的狀態(tài)。
定義新的導(dǎo)彈狀態(tài)變量為
(2)
(3)
利用式(1)~式(3)將新的導(dǎo)彈狀態(tài)空間運(yùn)動(dòng)方程寫為
(4)
繼續(xù)定義新的導(dǎo)彈狀態(tài)變量為
(5)
(6)
上標(biāo)表示變量的順序。利用式(4)~式(6)將新的導(dǎo)彈狀態(tài)空間運(yùn)動(dòng)方程寫為
(7)
結(jié)合具有相同順序的縱向變量和橫向變量,定義新的狀態(tài)變量為
(8)
(9)
式中:下標(biāo)i為導(dǎo)彈i。
利用式(7)~式(9)得到以下導(dǎo)彈模型四階系統(tǒng):
(10)
將導(dǎo)彈系統(tǒng)模型創(chuàng)建為一組信息交互的動(dòng)力系統(tǒng),利用圖論描述集群導(dǎo)彈組成的信息網(wǎng)絡(luò)[6]。
利用圖G=(V,A)建模導(dǎo)彈之間的信息交互,其中V={v1,v2,…,vN}是一組節(jié)點(diǎn),A∈V×V是一組邊。圖G中的邊(vi,vj)為一條從導(dǎo)彈i到導(dǎo)彈j的網(wǎng)絡(luò)路徑,表示導(dǎo)彈j可以從導(dǎo)彈i中獲取信息。
設(shè)A∈RN×N,D∈RN×N和L∈RN×N分別是與圖G相關(guān)的鄰接矩陣、度矩陣和圖拉普拉斯矩陣。鄰接矩陣A=[aij]的分量歸納為
(11)
如果導(dǎo)彈j通過(guò)網(wǎng)絡(luò)從導(dǎo)彈i獲取信息,aij設(shè)置為1,否則aij設(shè)置為0。
度矩陣是一個(gè)入度矩陣,定義為
D=diag[deg(v1),deg(v2),…,deg(vN)]
(12)
式中:deg(vi)為到達(dá)節(jié)點(diǎn)的通信鏈接數(shù)量。
圖拉普拉斯矩陣為
L=D-A
(13)
從彈和領(lǐng)彈編隊(duì)飛行的理想狀態(tài)如圖2所示[6],圖2中顯示了3個(gè)從彈跟隨領(lǐng)彈列隊(duì)飛行。
為實(shí)現(xiàn)從彈跟隨領(lǐng)彈的飛行任務(wù),將控制目標(biāo)[6]定義為:每個(gè)從彈跟隨領(lǐng)彈,并且從彈位置漸近收斂到從彈和領(lǐng)彈之間的一個(gè)期望相對(duì)位置,可表示為
圖2 理想編隊(duì)隊(duì)形
(14)
式中:ri為從彈i的位置;rL為領(lǐng)彈的位置;di為從彈i與領(lǐng)彈之間的期望相對(duì)位置。相關(guān)符號(hào)定義如圖3所示。需要注意的是,從彈的期望相對(duì)位置i與任何其他從彈位置不同。
圖3 相關(guān)符號(hào)定義
為實(shí)現(xiàn)控制目標(biāo),做如下假設(shè)。
假設(shè)1:每個(gè)從彈必須通過(guò)網(wǎng)絡(luò)上的領(lǐng)彈進(jìn)行連接,但并非所有從彈都必須通過(guò)領(lǐng)彈進(jìn)行直接連接。此外,每一對(duì)不同的從彈之間必須有一個(gè)交互式通信鏈路。
假設(shè)2:領(lǐng)彈的運(yùn)動(dòng)必須獨(dú)立于任何導(dǎo)彈,即領(lǐng)彈的運(yùn)動(dòng)不受任何導(dǎo)彈的影響。
筆者提出一種基于目標(biāo)一致算法來(lái)實(shí)現(xiàn)1.3節(jié)中的控制目標(biāo)。
編隊(duì)控制主要是控制率設(shè)計(jì),使導(dǎo)彈編隊(duì)中的從彈能夠到達(dá)期望位置,跟隨領(lǐng)彈遂行完成作戰(zhàn)任務(wù),采用的控制結(jié)構(gòu)[3]如圖4所示。
圖4 編隊(duì)控制框圖
基于目標(biāo)一致算法的主要功能步驟如下。
① 確定作戰(zhàn)任務(wù)目標(biāo),算法將此目標(biāo)認(rèn)定為所有單一智能體的共同目標(biāo)。
② 根據(jù)領(lǐng)彈參考軌跡確定從彈飛行軌跡,通過(guò)計(jì)算獲得從彈距離領(lǐng)彈的期望位置。
③ 領(lǐng)彈在計(jì)算處理完數(shù)據(jù)后,將信息傳遞給連接的從彈,從彈實(shí)現(xiàn)軌跡修正,將修正信息反饋給領(lǐng)彈。
④ 算法將反饋信息數(shù)據(jù)進(jìn)行處理后,正向傳遞給從彈進(jìn)行驗(yàn)證并且繼續(xù)修正飛行軌跡。
為實(shí)現(xiàn)控制目標(biāo),分別考慮一組導(dǎo)彈的共同目標(biāo)和每個(gè)導(dǎo)彈的單獨(dú)目標(biāo),前者采用基于目標(biāo)一致的合作控制算法實(shí)現(xiàn)共同目標(biāo),后者采用領(lǐng)彈-從彈結(jié)構(gòu)實(shí)現(xiàn)單獨(dú)目標(biāo)。領(lǐng)彈提供位置給與自己直接連接的從彈并將理想的位置作為命令傳遞給從彈。該控制算法的優(yōu)點(diǎn)是所有從彈不必直接與領(lǐng)彈連接,滿足假設(shè)1和假設(shè)2的最小網(wǎng)絡(luò)結(jié)構(gòu)就足以實(shí)現(xiàn)控制目標(biāo)。
適用于導(dǎo)彈飛行器的控制律[6]為
(15)
(16)
(17)
式中:Mi(t)為控制力矩;αij為導(dǎo)彈j是否從導(dǎo)彈i獲取信息;βk為控制增益。
設(shè)由N個(gè)(≥1)從彈(表示為式(10))和一個(gè)領(lǐng)彈組成的集群導(dǎo)彈系統(tǒng)滿足假設(shè)1和假設(shè)2。設(shè)由從彈和領(lǐng)彈組成的網(wǎng)絡(luò)的圖拉普拉斯算子的非零最小特征值為λmin。將控制律式(15)應(yīng)用于每個(gè)導(dǎo)彈,當(dāng)控制器增益為βk時(shí),對(duì)k∈{0,1,2,3},使其滿足以下一個(gè)條件,則漸近達(dá)到控制目標(biāo)(式(14))。
βk>0, ?k∈{0,1,2,3}
(18)
(19)
β1β2>β0β3
(20)
滾動(dòng)、俯仰和速度是影響導(dǎo)彈飛行過(guò)程中的重要參數(shù),通過(guò)仿真實(shí)驗(yàn)修改相關(guān)參數(shù)并分析結(jié)果,驗(yàn)證算法的有效性。需要說(shuō)明的是,本文主要以導(dǎo)彈為研究背景,采用的仿真實(shí)驗(yàn)算法均來(lái)自開(kāi)源項(xiàng)目,得到的實(shí)驗(yàn)數(shù)據(jù)均是模擬數(shù)據(jù),與實(shí)際導(dǎo)彈參數(shù)無(wú)直接關(guān)聯(lián),研究的意義在于為導(dǎo)彈編隊(duì)提供技術(shù)參考。
考慮一個(gè)單一的網(wǎng)絡(luò),且在每一對(duì)不同的從彈之間有交互通信鏈路,如圖5所示。其主要特點(diǎn)是只有中繼從彈直接從領(lǐng)彈獲取信息,其他從彈間接從領(lǐng)彈獲取信息。該網(wǎng)絡(luò)的圖拉普拉斯算子的非零最小特征值為λmin= 0.2。
圖5 通信網(wǎng)絡(luò)示意圖
假設(shè)一組導(dǎo)彈編隊(duì)分別由4個(gè)從彈和1個(gè)領(lǐng)彈組成,控制器β=[β0,β1,β2,β3],設(shè)置兩組實(shí)驗(yàn)分別調(diào)整β1、β2,每組實(shí)驗(yàn)設(shè)定4個(gè)仿真方案,具體如表1所示。
表1 兩組實(shí)驗(yàn)的數(shù)值模擬條件
3.2.1 調(diào)整β2實(shí)現(xiàn)對(duì)導(dǎo)彈方向(滾動(dòng)、俯仰)的控制
按照方案一設(shè)定參數(shù)進(jìn)行60 s仿真,模擬領(lǐng)彈(紅色)和從彈的運(yùn)動(dòng)軌跡并得出結(jié)果,如圖6所示。方案二、方案三和方案四的仿真結(jié)果分別如圖7、圖8和圖9所示。
① 使用默認(rèn)值,得到所需的行為(與一些可能的路徑?jīng)_突)如圖6所示,頻繁的滾動(dòng)和傾斜的系統(tǒng)將會(huì)導(dǎo)致更高的碰撞概率。
② 減小β2值,仍然滿足方程中給定的約束條件,但使收斂速度更快,轉(zhuǎn)彎更快(避免了與領(lǐng)彈的路徑?jīng)_突)。
③ 模擬最小約束條件下的β2=3,導(dǎo)致導(dǎo)彈的飛行軌跡會(huì)發(fā)生振蕩,一定時(shí)間內(nèi)會(huì)趨于穩(wěn)定,但是如果β2進(jìn)一步變小,會(huì)導(dǎo)致軌跡不穩(wěn)定。
④ 如果β2進(jìn)一步變小,會(huì)導(dǎo)致軌跡不穩(wěn)定。
3.2.2 調(diào)整β1實(shí)現(xiàn)對(duì)導(dǎo)彈速度的控制
① 當(dāng)β1=0,破壞最小約束,導(dǎo)致從彈繞著領(lǐng)彈飛行的半徑越來(lái)越大,一旦領(lǐng)彈飛行停止,編隊(duì)永遠(yuǎn)不會(huì)聚合,如圖10所示。
② 當(dāng)β1≤4時(shí),跟隨領(lǐng)彈飛行的從彈移動(dòng)速度加快,穿越特定距離前會(huì)出現(xiàn)減速,這樣領(lǐng)彈就可以趕上從彈,從而導(dǎo)致導(dǎo)彈運(yùn)動(dòng)軌跡出現(xiàn)振蕩,也同時(shí)增加了收斂時(shí)間,如圖11所示。
③ 當(dāng)4≤β1≤17時(shí),從彈可以正常跟隨領(lǐng)彈編隊(duì)飛行,如圖12所示。
④ 當(dāng)β1>17時(shí),從彈不會(huì)跟隨領(lǐng)彈編隊(duì)飛行,從實(shí)驗(yàn)結(jié)果來(lái)看,超出這個(gè)范圍都會(huì)造成軌跡的不穩(wěn)定或者不聚合,如圖13所示。
圖6 方案一:β=[1,5,15,3]
圖7 方案二:β=[1,5,7.5,3]
圖8 方案三:β= [1,5,3,3]
圖9 方案四:β=[1,5,1.5,3]
圖10 方案一:β1=0,β=[1,β1,15,3]
圖11 方案二:β1<4,β=[1,1,15,3]
圖12 方案三:4<β1≤17,β=[1,β1,15,3]
圖13 方案四:β1>17,β=[1,β1,15,3]
實(shí)驗(yàn)1結(jié)果表明,隨著β2的減小,導(dǎo)彈編隊(duì)模擬結(jié)果趨于發(fā)散,其值越大,導(dǎo)彈編隊(duì)狀態(tài)越穩(wěn)定。這表明通過(guò)合理調(diào)整控制器增益參數(shù)β2,能夠?qū)崿F(xiàn)控制導(dǎo)彈編隊(duì)的穩(wěn)定性。實(shí)驗(yàn)2結(jié)果表明,當(dāng)β1時(shí)處于[4,17]這個(gè)區(qū)間時(shí),從彈可以正常跟隨領(lǐng)彈編隊(duì)飛行,這表明通過(guò)合理調(diào)整控制器增益參數(shù)β1,也能夠?qū)崿F(xiàn)控制導(dǎo)彈編隊(duì)的穩(wěn)定性。
為實(shí)現(xiàn)導(dǎo)彈編隊(duì)控制,提高導(dǎo)彈編隊(duì)協(xié)同作戰(zhàn)的穩(wěn)定性,實(shí)現(xiàn)密集臨空飽和攻擊,從而提升導(dǎo)彈突防作戰(zhàn)效能,本文將導(dǎo)彈的線性化模型表示為四階系統(tǒng),利用圖論方法對(duì)編隊(duì)導(dǎo)彈之間的信息網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行建模,提出了四階系統(tǒng)的編隊(duì)控制算法。針對(duì)一階不考慮動(dòng)力學(xué)特性的編隊(duì)控制問(wèn)題,直接將編隊(duì)控制算法推廣到四階不考慮動(dòng)力學(xué)特性的編隊(duì)控制系統(tǒng),并采用了領(lǐng)彈-從彈結(jié)構(gòu),使領(lǐng)彈可以為從彈提供編隊(duì)的幾何配置指令。由領(lǐng)彈和從彈組成的編隊(duì)必須滿足一個(gè)從彈直接獲取領(lǐng)彈指令,以及每一對(duì)不同從彈之間具有交互式通信鏈路的要求。編隊(duì)控制算法通過(guò)確定控制器的增益以實(shí)現(xiàn)控制目標(biāo)。根據(jù)相關(guān)假設(shè)和要求進(jìn)行仿真實(shí)驗(yàn),結(jié)果表明,該算法對(duì)于具有四階動(dòng)力學(xué)的導(dǎo)彈編隊(duì)飛行是有效的。