馮 政, 吳 傲, 王謙喆
(1.空軍工程大學(xué)空管領(lǐng)航學(xué)院,西安 710000; 2.陜西省電子信息系統(tǒng)綜合集成重點(diǎn)實(shí)驗(yàn)室,西安 710000)
對于入侵我方領(lǐng)海的以中小型海面艦艇為代表的敵方海面目標(biāo),可采用無人機(jī)集群來打擊。一是因?yàn)樵擃惸繕?biāo)體積大、價(jià)值高、機(jī)動性差,是合適的“靶目標(biāo)”;二是因?yàn)榕炤d防空系統(tǒng)主要是針對各類反艦導(dǎo)彈和飛機(jī),應(yīng)對“低慢小”目標(biāo)能力有限[1]。無人機(jī)集群利用數(shù)量多、雷達(dá)紅外特征弱的特點(diǎn),攜帶多種類型的武器彈藥,從多個(gè)方向?qū)λ媾炌?shí)施飽和攻擊[2],將對敵方高價(jià)值目標(biāo)造成巨大威脅。
隨著未來作戰(zhàn)模式逐漸向協(xié)同化轉(zhuǎn)變,無人機(jī)協(xié)同作戰(zhàn)相關(guān)技術(shù)已成為目前的研究熱點(diǎn)[3]。本文重點(diǎn)研究協(xié)同打擊中的時(shí)空協(xié)同問題。精準(zhǔn)的時(shí)空耦合是集群發(fā)揮協(xié)同優(yōu)勢的關(guān)鍵,從系統(tǒng)控制角度看,可將其視為帶時(shí)間參數(shù)的群系統(tǒng)編隊(duì)控制問題。
編隊(duì)控制方面的研究成果包括有限時(shí)間控制[4]、固定時(shí)間控制[5-9]以及指定時(shí)間控制[10]。有限時(shí)間控制中,系統(tǒng)在有限時(shí)間收斂,但收斂時(shí)間上界與系統(tǒng)的初始狀態(tài)有關(guān)。固定時(shí)間控制中收斂時(shí)間上界不受初始條件影響,只與參數(shù)有關(guān)[11];但是,由于固定時(shí)間控制的收斂時(shí)間與控制參數(shù)有著復(fù)雜的耦合關(guān)系,繁瑣的多調(diào)參變量和函數(shù)關(guān)系限制了固定時(shí)間控制法在集群控制中的應(yīng)用[12];與固定時(shí)間控制相比,指定時(shí)間控制要求收斂時(shí)間能獨(dú)立輸入且自由預(yù)置,具有更大的應(yīng)用潛力。文獻(xiàn)[13]提出了指定時(shí)間一致性問題,研究了多智能體線性系統(tǒng)指定時(shí)間控制,系統(tǒng)可以根據(jù)任務(wù)要求離線預(yù)置收斂時(shí)間,但是系統(tǒng)的期望狀態(tài)是非時(shí)變的;文獻(xiàn)[14]研究了多智能體系統(tǒng)的指定時(shí)間編隊(duì)控制問題,但其指定時(shí)間仍然是上限。
本文以指定時(shí)間協(xié)同控制方法為支撐,主要解決集群指定時(shí)間和指定時(shí)長協(xié)同打擊問題。
無人機(jī)集群對海上目標(biāo)發(fā)起協(xié)同打擊指定時(shí)間構(gòu)型控制包含兩個(gè)控制目標(biāo)。
1) 構(gòu)型生成。無人機(jī)集群在指定的打擊時(shí)刻tf生成打擊構(gòu)型,同時(shí)對目標(biāo)發(fā)起飽和打擊。
2) 構(gòu)型保持。無人機(jī)集群生成打擊構(gòu)型后在指定的時(shí)間段te內(nèi)保持打擊構(gòu)型,持續(xù)對目標(biāo)發(fā)起打擊,如圖1所示。
圖1 無人機(jī)集群指定時(shí)間協(xié)同打擊構(gòu)型控制示意圖Fig.1 Configuration control diagram of UAV swarm for cooperative attacking at designated time
用Ui表示編隊(duì)中編號為i的無人機(jī),其中,i=0,1,2,…,n,U0表示海面目標(biāo)。令epi(t)=[epix(t),epiy(t),epiz(t)]T∈R3,evi(t)=[evix(t),eviy(t),eviz(t)]T∈R3及eui(t)=[euix(t),euiy(t),euiz(t)]T∈R3分別表示慣性系(北東地坐標(biāo)系)中Ui的位置狀態(tài)、速度狀態(tài)及加速度狀態(tài)。接下來定義Ui的狀態(tài)向量為exi(t)=[epix(t),evix(t),epiy(t),eviy(t),epiz(t),eviz(t)]T∈R6。
為了描述無人機(jī)群所期望的時(shí)變編隊(duì),將每架無人機(jī)與海面目標(biāo)的相對狀態(tài)ef(t)定義為慣性坐標(biāo)系下的編隊(duì)參數(shù)向量,有
ef(t)=[ef0(t),ef1(t),…,efn(t)]T
(1)
其中,對于i=0,1,2,…,n有
efi(t)=exi(t)-ex0(t)
(2)
efi(t)=[efix(t),efiy(t),efiz(t)]T
(3)
efix(t)=[efixp(t),efixv(t)]T
(4)
efiy(t)=[efiyp(t),efiyv(t)]T
(5)
efiz(t)=[efizp(t),efizv(t)]T
(6)
efi(t)反映了達(dá)成期望構(gòu)型時(shí)Ui與海面目標(biāo)的期望位置差與速度差,易得ef0(t)=0。那么,編隊(duì)中Ui與Uj之間期望的相對狀態(tài)可以用Δefi j(t)∈R6來表示,即
Δefi j(t)=efi(t)-efj(t)。
(7)
定義1對于tf,te兩個(gè)時(shí)間參數(shù),無人機(jī)集群達(dá)成了指定時(shí)間構(gòu)型控制,當(dāng)且僅當(dāng)對于i,j∈0,1,2,…,n,Ui與Uj滿足下列兩個(gè)條件:
1) 構(gòu)型生成條件
(8)
2) 構(gòu)型保持條件
exi(t)-exj(t)≡Δefi j(t)tf (9) 指定時(shí)間編隊(duì)控制器將被設(shè)計(jì)用于實(shí)現(xiàn)定義1的控制目標(biāo),控制模型如圖2所示。 圖2 無人機(jī)控制模型Fig.2 Control model of UAV 圖2中:外環(huán)為編隊(duì)協(xié)同控制層,負(fù)責(zé)根據(jù)期望構(gòu)型、參考航跡和速度等鄰居個(gè)體的狀態(tài)信息,計(jì)算本機(jī)的期望姿態(tài)角;內(nèi)環(huán)控制根據(jù)外環(huán)得到的控制輸入,結(jié)合自身動力學(xué)特性計(jì)算期望控制量,對本機(jī)油門、電機(jī)轉(zhuǎn)速等進(jìn)行控制,實(shí)現(xiàn)期望的姿態(tài)。在外環(huán)控制層,可將無人機(jī)視為一個(gè)質(zhì)點(diǎn),其運(yùn)動方程可用二階積分器描述為 (10) (11) (12) 式中,ai j根據(jù)通信鄰接關(guān)系取值為0或1。 根據(jù)無人機(jī)動力學(xué)模型,無人機(jī)間的相對狀態(tài)滿足 (13) (14) (15) 令X(t)∈R6(n+1),U(t)∈R6(n+1)及Y(t)∈R6(n+1)分別代表系統(tǒng)的狀態(tài)向量、輸入向量和輸出向量,即 X(t)=[ex0(t),ex1(t),…,exn(t)] (16) U(t)=[eu0(t),eu1(t),…,eun(t)] (17) (18) 那么系統(tǒng)的狀態(tài)空間方程可表示為 (19) (20) e(t)=Yd(t)-Y(t)。 (21) 定義1中的兩個(gè)條件用e(t)來表示,轉(zhuǎn)化為 1) 構(gòu)型生成條件 (22) 2) 構(gòu)型保持條件 e(t)≡0tf (23) 為實(shí)現(xiàn)指定時(shí)間的構(gòu)型控制,將最優(yōu)控制理論中的有限時(shí)間時(shí)變最優(yōu)跟蹤器引入編隊(duì)控制系統(tǒng)。二次代價(jià)函數(shù)的一般形式為 (24) 式中:t0和t1分別表示指定的初始和末端時(shí)刻;F∈R6(n+1)×6(n+1),是一個(gè)表示末端時(shí)刻誤差代價(jià)的對稱非負(fù)時(shí)不變矩陣;Q(t)∈R6(n+1)×6(n+1)和R(t)∈R6(n+1)×6(n+1)均為對稱正定時(shí)變矩陣,分別代表控制過程中實(shí)時(shí)的誤差代價(jià)和控制代價(jià),是連續(xù)的,并且在區(qū)間t∈[t0,t1]內(nèi)有界。 設(shè)計(jì)二次代價(jià)函數(shù)中的F,Q(t)和R(t)??紤]到空間3個(gè)維度方向上的位置誤差和速度誤差是等權(quán)重的,因此,F選擇單位矩陣,即 F=I6(n+1)。 (25) 然而,對于不同的控制階段,控制目標(biāo)是不同的,因此Q(t)和R(t)也是不同的。 1) 構(gòu)型生成階段t∈[0,tf]。 t0=0,t1=tf,要求系統(tǒng)在末端時(shí)刻tf生成期望的編隊(duì)構(gòu)型。R(t)反映的是整個(gè)控制過程中實(shí)時(shí)的控制代價(jià),在構(gòu)型生成階段關(guān)注的是末端時(shí)刻構(gòu)型的生成,因此,越接近末端時(shí)刻tf控制代價(jià)應(yīng)該越大。這意味著在初始階段有較大的控制輸入使得期望構(gòu)型能夠更快速地生成,并且隨著時(shí)間的增長,控制輸入應(yīng)該逐漸減少,直至t=tf時(shí)減少到0。因此在構(gòu)型生成階段,設(shè)計(jì)R(t)為 (26) 構(gòu)型生成階段僅關(guān)注末端時(shí)刻tf的控制誤差,不關(guān)注過程中的構(gòu)型誤差,因此設(shè)計(jì)Q(t)為 Q(t)=0。 (27) 2) 構(gòu)型保持階段t∈(tf,tf+te]。 t0=tf,t1=tf+te,要求系統(tǒng)在t∈(tf,tf+te]時(shí)間段內(nèi)一直保持期望的時(shí)變編隊(duì)構(gòu)型。由于該階段關(guān)注的是整個(gè)控制過程,所以過程誤差應(yīng)該盡可能小。除此之外,控制誤差和控制代價(jià)在構(gòu)型保持時(shí)間段內(nèi)都應(yīng)該是等價(jià)的,因此,Q(t)和R(t)在該階段均被設(shè)計(jì)為單位矩陣,即 R(t)=I6(n+1) (28) Q(t)=I6(n+1)。 (29) 對于最優(yōu)控制理論中的有限時(shí)間跟蹤系統(tǒng),如果矩陣對{A,C}是完全可觀的,那么對于二次代價(jià)函數(shù)式(24)必有唯一的最優(yōu)控制,即 U*(t)=-R-1(t)BT[P(t)X(t)-g(t)] (30) (31) Riccati方程的末端約束為 P(t1)=CTFC (32) Riccati方程中的g(t)∈R6(n+1)是滿足如下向量微分方程的伴隨向量,即 (33) 向量微分方程的末端約束為 g(t1)=CTFYd(t1) (34) 根據(jù)式(31)和式(32)可知,P(t)的求解是獨(dú)立于系統(tǒng)的期望輸出與初始狀態(tài)的,因此對于t∈[t0,t1]的P(t)可以事先離線求解。Yd(t)代表了集群的期望構(gòu)型,對于控制器而言是已知的。因此,伴隨向量g(t)可基于邊界條件式(34)得到 (35) 其中,t∈[t0,t1],Ψ(t,t0)為式(33)的狀態(tài)轉(zhuǎn)移矩陣。 已知P(t)和g(t)可得U*(t),將U*(t)代入系統(tǒng)的開環(huán)狀態(tài)方程式(19)即可得到系統(tǒng)的閉環(huán)狀態(tài)方程為 (36) 式(36)的邊界條件為 X(t0)=X0。 (37) (38) 采用Matlab模擬無人機(jī)集群打擊海上動態(tài)目標(biāo)。 場景設(shè)為5架無人機(jī)打擊海面目標(biāo)。設(shè)海面目標(biāo)編號U0,無人機(jī)編號為Ui,i=1,2,…,5。無人機(jī)初始橫坐標(biāo)為 epix(0)=5i-10 (39) 無人機(jī)其余初始狀態(tài)參數(shù)均為零。 為實(shí)現(xiàn)對海面目標(biāo)的全向飽和打擊,同時(shí)增加自身防御,設(shè)置期望的編隊(duì)構(gòu)型為半徑r=10 m,旋轉(zhuǎn)角速度ω=0.1 rad/s的圓周構(gòu)型。構(gòu)型參數(shù)為 (40) 定義位置誤差向量ep(t)∈R3和速度誤差向量ev(t)∈R3 (41) (42) 設(shè)海面目標(biāo)U0的初始狀態(tài)向量為ex0(0)=[01 0100]T,當(dāng)t∈(0,10]∪(20,50]∪(60,70](單位為s)時(shí),海面目標(biāo)保持速度為1.5 m/s的勻速直線運(yùn)動;當(dāng)t∈(10,20](單位為s)時(shí),海面目標(biāo)按照ω0(t)=-π/20 rad/s的角速度勻速右轉(zhuǎn)彎;當(dāng)t∈(50,60]時(shí),海面目標(biāo)按照ω0(t)=π/30 rad/s的角速度勻速左轉(zhuǎn)彎。 時(shí)間參數(shù)可設(shè)為無人機(jī)群20 s時(shí)在目標(biāo)上空形成打擊構(gòu)型,發(fā)起時(shí)長為50 s的打擊。 采用上文設(shè)計(jì)的控制律,集群編隊(duì)的仿真軌跡見圖3。 圖3 無人機(jī)集群對動目標(biāo)打擊軌跡俯視圖Fig.3 Top view of attack trajectory of UAV swarm against moving target 無人機(jī)集群成功地在t=20 s時(shí)生成了期望的打擊構(gòu)型,并且在接下來的50 s時(shí)間段內(nèi)穩(wěn)定地保持打擊構(gòu)型,同時(shí)跟蹤海面目標(biāo)運(yùn)動。 圖4則展示了打擊過程中的位置誤差和速度誤差,在構(gòu)型生成時(shí)刻誤差正好收斂到向量0,在構(gòu)型保持階段誤差持續(xù)穩(wěn)定在向量0附近。 圖4 無人機(jī)集群位置誤差和速度誤差曲線Fig.4 Curve of position error and velocity error of UAV swarm 仿真實(shí)驗(yàn)結(jié)果證明,在指定的時(shí)間參數(shù)下,無人機(jī)集群能夠成功地生成并保持期望的編隊(duì)構(gòu)型,對動態(tài)目標(biāo)能夠?qū)崿F(xiàn)跟蹤。值得注意的是,圖4所示的誤差曲線與式(22)和式(23)中的控制目標(biāo)是一致的。編隊(duì)誤差恰好在tf時(shí)刻收斂到向量0,說明tf是精準(zhǔn)的構(gòu)型生成時(shí)刻,并且是獨(dú)立的系統(tǒng)輸入,不受控制器參數(shù)的影響,這極大地提高了集群控制的靈活性。 本文所提的方法可以驅(qū)動無人機(jī)群在指定的時(shí)刻精準(zhǔn)地生成打擊構(gòu)型,實(shí)現(xiàn)“同時(shí)到達(dá)”的打擊策略,并在后續(xù)指定時(shí)段內(nèi)保持打擊構(gòu)型,實(shí)現(xiàn)持續(xù)打擊。下一步工作可以采取無人機(jī)集群實(shí)飛來驗(yàn)證。2 指定時(shí)間協(xié)同控制律設(shè)計(jì)及求解
2.1 集群編隊(duì)控制系統(tǒng)描述
2.2 最優(yōu)控制二次代價(jià)函數(shù)設(shè)計(jì)
2.3 基于龍格庫塔法的控制律求解
3 仿真分析
3.1 仿真參數(shù)設(shè)置
3.2 仿真結(jié)果
4 結(jié)論