顧鎮(zhèn)鎮(zhèn),王旭剛,王中原,華思雨
(南京理工大學(xué)能源與動力工程學(xué)院,南京 210094)
多導(dǎo)彈編隊協(xié)同作戰(zhàn)是實現(xiàn)分布式作戰(zhàn)“兵力分散,火力集中”理念的一種重要手段。發(fā)射自不同平臺的導(dǎo)彈,通過通信網(wǎng)絡(luò)相互連結(jié),導(dǎo)彈之間相互支援和協(xié)調(diào),協(xié)同編隊飛行,能夠顯著提高導(dǎo)彈的目標(biāo)搜索識別能力,戰(zhàn)場態(tài)勢構(gòu)建能力,電子干擾對抗能力和突防能力,實現(xiàn)對具有嚴密防空反導(dǎo)系統(tǒng)的敵方高價值軍事目標(biāo)的打擊[1]。
導(dǎo)彈編隊協(xié)同控制是指在彈群飛行的過程中,使彈群成員之間保持一定的空間位置關(guān)系,研究內(nèi)容包括編隊隊形的形成、保持和變換等。根據(jù)彈間信息交流形式的不同,編隊控制系統(tǒng)可以分為分散式、集中式和分布式三種類型。其中分布式的編隊控制方法相較于傳統(tǒng)的分散式和集中式的控制方法,具有計算速度快、控制方法靈活、可靠性高、魯棒性強等優(yōu)點[2]。采用分布式的編隊控制方法,可以使導(dǎo)彈在只獲取相鄰導(dǎo)彈的位置、速度信息的情況下實現(xiàn)編隊飛行,并且在損失部分成員時,仍然能夠繼續(xù)執(zhí)行任務(wù)。常用來實現(xiàn)分布式編隊控制的策略有領(lǐng)航者-跟隨者策略、基于行為策略和虛擬結(jié)構(gòu)策略等,這些控制策略均可以在以圖論為基礎(chǔ)的多智能體一致性理論中得到統(tǒng)一[3]。本文將在領(lǐng)航者-跟隨者策略框架下,基于多智能體一致性理論進行分布式導(dǎo)彈編隊控制器的設(shè)計。
一致性理論在計算機科學(xué)領(lǐng)域有著悠久的歷史,自從Fiedler[4]在1973年將代數(shù)圖論工具引入一致性理論后,一致性理論吸引了大量學(xué)者的關(guān)注,并在無人作戰(zhàn)、深空探測、智能電網(wǎng)等領(lǐng)域有著廣泛的應(yīng)用。對于多智能體一致性問題的研究可以分類為三個方面:第一個方面是針對多智能體系統(tǒng)模型的研究,包括一階、二階和高階系統(tǒng),線性和非線性系統(tǒng),連續(xù)和離散系統(tǒng)等;第二個方面是對于多智能體通信網(wǎng)絡(luò)的研究,包括有向/無向通信拓撲,固定/切換通信拓撲,無時延/有時延通信等;第三個方面是對于一致性算法收斂速度的研究。收斂速度是評價一致性算法性能的重要指標(biāo),目前大多數(shù)關(guān)于多智能體一致性理論的研究成果是基于漸近收斂一致性的[5-6],這意味著一致性的達成需要無限長的時間。雖然漸近收斂一致性在收斂時間方面不占優(yōu)勢,但對其進行研究仍是必要的,其它嚴格時間收斂一致性理論大多是由漸近收斂一致性理論發(fā)展而來的。
對于收斂速度的追求促進了有限時間一致性理論的發(fā)展。與漸近時間一致性結(jié)果相比,有限時間一致性具有更好的動態(tài)特性,更高的精度和更快的收斂速度[7-8]。有限時間一致性理論被廣泛應(yīng)用于工程實踐中,然而由于其一致性達成時間高度依賴于系統(tǒng)狀態(tài)的初始值,因此,當(dāng)系統(tǒng)狀態(tài)的初始值較大或者無法預(yù)先獲得時,有限時間一致性算法并不適用[9-10]。
為了解除上述限制,在有限時間一致性算法的基礎(chǔ)上,開發(fā)了固定時間一致性算法,在該算法的作用下,多智能體系統(tǒng)達到穩(wěn)定的時間與其初始狀態(tài)無關(guān)。目前,已經(jīng)有大量的研究成果證明了固定時間一致性理論在多智能體系統(tǒng)中的有效性。在文獻[11]和文獻[12]中,提出了固定時間一致性跟蹤算法,并將其成功應(yīng)用于多機器人的編隊。文獻[13-14]分別將固定時間控制算法應(yīng)用于二階和高階的動力學(xué)系統(tǒng)中。由于實際的系統(tǒng)都是非線性的,因此對非線性多智能體系統(tǒng)的固定時間一致性協(xié)議進行分析是自然的,文獻[15]提出一種自適應(yīng)固定時間控制協(xié)議,解決了一類具有不對稱輸出約束要求的多輸入多輸出非線性系統(tǒng)的跟蹤一致性問題。文獻[16]通過設(shè)計狀態(tài)觀測器,解決了沒有速度測量的非線性二階多智能體系統(tǒng)的固定時間跟蹤一致性問題。文獻[17]研究了具有輸入延遲的二階多智能體系統(tǒng)的跟蹤一致性問題,通過歸約變換將延遲誤差系統(tǒng)轉(zhuǎn)化為無時延的二階系統(tǒng),提出了一種新的非奇異終端滑模協(xié)議來實現(xiàn)固定時間一致性。在一致性控制算法中,智能體所需的初始控制輸入一般很大,然后就快速衰減,針對該問題,Ning等[18]基于時基生成器開發(fā)了一種新的固定時間一致性框架,顯著降低了控制輸入的初始幅度大小。
在上述的這些工作中,多智能體一致性的達成都依賴于“連續(xù)通信”這一假設(shè),這種假設(shè)要求多智能體系統(tǒng)必須有強大的計算資源和理想的通信環(huán)境支持。在實際的多智能體系統(tǒng)中,智能體一般依靠自身內(nèi)部電源供電,處理器的計算能力和通信帶寬都是有限的,頻繁的通信會帶來延遲和丟包并消耗大量的計算資源,這將導(dǎo)致控制系統(tǒng)的不穩(wěn)定并縮短執(zhí)行任務(wù)的可用時間。此外,當(dāng)系統(tǒng)運行在穩(wěn)定狀態(tài)并且沒有干擾時,相鄰智能體間的持續(xù)通信是不必要的?;谑录|發(fā)機制的一致性算法,為每個智能體的測量誤差設(shè)定了一個閾值,只有當(dāng)智能體的狀態(tài)誤差達到閾值時,才會與相鄰智能體進行通信并進行控制信號的更新,有效解決了有限的計算資源和通信帶寬帶來的問題。Liu等[19]研究了無向通信拓撲條件下,一階多智能體系統(tǒng)基于事件觸發(fā)機制的固定時間一致性,給出了集中式和分布式兩種事件觸發(fā)策略,其中每個智能體只在自身觸發(fā)時刻才與系統(tǒng)進行通信并更新自身的控制輸入,相比文獻[20]中一個智能體觸發(fā),所有智能體都要更新控制輸入的情況,顯著降低了事件觸發(fā)的次數(shù)。Zhou等[21]提出了基于智能體自身狀態(tài)誤差的事件觸發(fā)函數(shù),計算事件觸發(fā)函數(shù)時僅需要智能體自身的狀態(tài)信息和相鄰智能體觸發(fā)時刻的狀態(tài)信息,有效解決了無向通信拓撲條件下,二階多智能體的固定時間一致性問題。但值得注意的是,絕大多數(shù)關(guān)于固定時間和事件觸發(fā)控制的一致性算法僅適用于無領(lǐng)導(dǎo)者的情況,對跟蹤一致性的研究成果極少。在文獻[22]提出的算法中,多智能體的一致性達成之后,閾值函數(shù)接近于零,由于領(lǐng)導(dǎo)者的運動狀態(tài)是不斷變化的,所以測量誤差并不為零,無法排除Zeno行為。Guo等[23]對有向通信拓撲下,基于事件觸發(fā)的二階多智能體的領(lǐng)導(dǎo)跟隨固定時間一致性進行了研究,然而其提出的事件觸發(fā)函數(shù)需要獲取相鄰智能體的實時運動狀態(tài),違背了事件觸發(fā)函數(shù)設(shè)計的初衷。
綜上所述,由于有向拓撲下Laplacian矩陣的不對稱性和事件觸發(fā)通信引入的誤差項對系統(tǒng)穩(wěn)定性分析帶來的困難,目前鮮有適用于有向通信拓撲,帶有領(lǐng)導(dǎo)者的基于個體自身狀態(tài)觸發(fā)事件的固定時間一致性協(xié)議來滿足本文對于多導(dǎo)彈編隊控制的需要。本文對該一致性問題進行了研究,并將其成功應(yīng)用于多導(dǎo)彈編隊控制,主要貢獻有以下兩個方面:
1)在有向通信拓撲下為彈群設(shè)計了固定時間編隊控制協(xié)議。保證了初始位置差距較大、速度較快的導(dǎo)彈成員在較短的時間內(nèi)達到編隊飛行所需的運動狀態(tài),并跟隨領(lǐng)彈進行機動。
2)在有向通信拓撲下設(shè)計了適用于領(lǐng)導(dǎo)跟隨一致性的從彈自身狀態(tài)事件觸發(fā)函數(shù)。從彈事件觸發(fā)函數(shù)的計算僅需要獲取相鄰從彈的觸發(fā)時刻狀態(tài)和領(lǐng)彈的飛行狀態(tài),不需要獲取相鄰從彈實時狀態(tài),降低了從彈通信網(wǎng)絡(luò)中的信息傳遞所需帶寬,節(jié)省了網(wǎng)絡(luò)和計算資源。
有向通信拓撲是無向通信拓撲的一種特殊情況,其優(yōu)勢是可以減小彈間通信所需的帶寬,降低對通信系統(tǒng)的要求。但是,有向通信拓撲的Laplacian矩陣的不對稱性,給系統(tǒng)的穩(wěn)定性分析帶來了挑戰(zhàn)。
本文的剩余部分安排如下,在第1節(jié)中給出了文中常用的符號表示、代數(shù)圖論相關(guān)知識和證明所需的一些引理。第2節(jié)首先對本文研究的作戰(zhàn)場景進行描述,然后用微分幾何線性化方法將導(dǎo)彈運動模型精確線性化,并給出了多導(dǎo)彈編隊的固定時間一致性判定條件。在第3節(jié)中為導(dǎo)彈設(shè)計了固定時間編隊控制協(xié)議和基于事件觸發(fā)機制的固定時間編隊控制器。第4節(jié)通過數(shù)值模擬校驗了兩種算法的有效性。在第5節(jié)中給出本文的結(jié)論。
代數(shù)圖論是研究圖的結(jié)構(gòu)與圖的矩陣表示之間關(guān)系的理論,代數(shù)圖論被用在多智能體系統(tǒng)中最重要的兩個概念是鄰接矩陣和Laplacian矩陣。圖的鄰接矩陣A=[aij]∈RN×N,其對角元素aii=0,當(dāng)圖的兩個頂點之間的聯(lián)系(vj,vi)∈E時,aij>0,當(dāng)(vj,vi)?E時,aij=0。對于有向圖來說,入度矩陣定義為Din=diag(di,in)∈RN×N,di,in=∑j∈Niaij,出度矩陣定義為Dout=diag(di,out)∈RN×N,di,out=∑j∈Fiaji。圖G的Laplacian矩陣可以表示為L=[lij]=Din-A,其中l(wèi)ii=∑j∈Niaij,并且lij=-aij,?i≠j。
引理1[1].此引理給出仿射非線性系統(tǒng)能夠用微分幾何法精確線性化的充要條件。
微分幾何法的適用對象是如下仿射非線性系統(tǒng)。
(1)
對于該非線性系統(tǒng),如果系統(tǒng)初始狀態(tài)x=x0,并且G(x)是列滿秩矩陣,則該非線性系統(tǒng)能進行反饋線性化的充要條件是
1)Gi(0≤i≤N-1)是對合的,并且在初始狀態(tài)x0的鄰域內(nèi)維度不變。
2)GN-1是N維的。
在上述判定條件中,Gi的定義為
(2)
式中:
ri=card(mj|mj≥i,j≥0),
mj=rankGj-rankGj-1,j=1,2,…,N-1,
引理2[19].系統(tǒng)固定時間穩(wěn)定性理論。
1)V(x)=0?x=0。
2)D+V(x)≤-aVp(x)+bVq(x)。
式中:a,b,p,q為正常數(shù),p∈(0,1),q∈(1,+∞)。則系統(tǒng)可以實現(xiàn)全局固定時間的穩(wěn)定,且穩(wěn)定時間T滿足
(3)
引理3[23].a,b∈R+,r(x,y)>0是實值函數(shù),則有
(4)
本文研究的作戰(zhàn)場景是使用導(dǎo)彈武器對具有一定防空力量的敵方軍事目標(biāo)(如敵方艦艇編隊)進行打擊,假設(shè)已獲取的信息只有敵方目標(biāo)的粗略位置。作戰(zhàn)過程如圖1所示,從多個平臺發(fā)射的多枚導(dǎo)彈在預(yù)定的空域內(nèi)集結(jié),彈間形成穩(wěn)定的通信鏈路并以高低彈道編隊隊形向目標(biāo)抵近,一枚導(dǎo)彈在高空飛行,搜索目標(biāo),其余導(dǎo)彈在低空跟隨,以穿透目標(biāo)的遠程和中程防空網(wǎng)絡(luò)。在傳感器發(fā)現(xiàn)目標(biāo)所在位置后,進行協(xié)同制導(dǎo)律的交接,實現(xiàn)多導(dǎo)彈對目標(biāo)的同時打擊,在短時間內(nèi)對目標(biāo)的近程防空系統(tǒng)造成巨大壓力,使其出現(xiàn)過載而無法全部攔截。本文對上述彈群協(xié)同作戰(zhàn)過程中的編隊飛行控制問題進行研究,并采用領(lǐng)航者-跟隨者編隊控制策略來實現(xiàn)具備偵察-打擊一體化功能的彈群編隊控制。
圖1 彈群協(xié)同編隊作戰(zhàn)示意圖Fig.1 Schematic diagram of missile-group cooperative operation
本節(jié)考慮由一枚領(lǐng)彈和N枚從彈組成的群體系統(tǒng)。首先對單枚導(dǎo)彈進行運動學(xué)和動力學(xué)建模,然后基于微分幾何理論對導(dǎo)彈模型進行精確反饋線性化,將描述導(dǎo)彈運動的非線性模型變換為方便控制的線性模型。由于基于微分幾何理論的反饋線性化方法是通過微分同胚進行嚴格的狀態(tài)變換來實現(xiàn)線性化的,在變換的過程中沒有忽略任何高階非線性項,所以從理論上來說該方法不會引入新的線性化誤差。
在編隊飛行過程中,導(dǎo)彈的姿態(tài)變化相較于軌跡變化要小的多,基于“瞬時平衡假設(shè)”,可以將導(dǎo)彈作為一個可操縱質(zhì)點來研究。為了便于編隊控制系統(tǒng)的設(shè)計,將導(dǎo)彈的過載作為編隊控制的輸入量,針對單枚導(dǎo)彈,建立運動方程組如下式所示。
(5)
式中:i={1,2,…,N}∪{l},其中i=1,2,…,N表示編隊中的N枚從彈,i=l表示領(lǐng)彈;Vi,θi和ψVi分別表示第i枚導(dǎo)彈的速度、彈道傾角和彈道偏角;nxi,nyi和nzi分別表示第i枚導(dǎo)彈的過載在彈道坐標(biāo)系o1x1y1z1下的分量;xi,yi和zi表示第i枚導(dǎo)彈在慣性坐標(biāo)系下的空間位置,g為重力加速度。
下面用微分幾何法對上述模型進行反饋線性化。首先選取控制變量和狀態(tài)變量為ui=[nxinyinzi]T和xi=[xiyiziViθiψVi]T。則導(dǎo)彈的運動方程組(5)可以改寫為如下的仿射非線性形式。
(6)
式中:
Kq=diag{g,g/Vi,-g/(Vicosθi)},
根據(jù)引理1,可以驗證Gi,i=0,1,…,5是對合的,其維度在系統(tǒng)的初始狀態(tài)x0的鄰域內(nèi)不變且為6。因此非線性系統(tǒng)(6)滿足全狀態(tài)反饋線性化的充要條件,能夠基于微分幾何法線性化為可控系統(tǒng),且可控指數(shù)為2。由于可控指數(shù)在反饋線性化的過程中是不變的,即存在一個光滑的向量函數(shù)
使得
〈dφi,Crj-2〉=0,j≥i
(7)
選取滿足上式的光滑向量函數(shù)φ(x)和微分同胚τ(x)為
則仿射非線性系統(tǒng)(6)能被精確線性化為如下的可控線性系統(tǒng)
(8)
式中:
Hl和Ml為能控標(biāo)準(zhǔn)型;zi為線性系統(tǒng)的狀態(tài)變量;vi為虛擬控制輸入,與真實控制輸入ui的關(guān)系為
vi=ο(xi)+π(xi)ui
(9)
式中:
至此,導(dǎo)彈的運動模型通過微分幾何方法精確線性化為如下解耦的線性二階積分形式。
(10)
式中:xi,yi和zi為導(dǎo)彈慣性坐標(biāo)系中的空間位置;vxi,vyi和vzi分別為導(dǎo)彈三個通道的虛擬控制輸入。
接下來可以用二階多智能體一致性問題的研究方法來解決多導(dǎo)彈編隊飛行控制問題。
本文的主要目的之一是基于領(lǐng)-從彈編隊策略設(shè)計一個編隊控制器,使彈群中所有的導(dǎo)彈在較短的時間內(nèi)收斂到所需的編隊隊形,并且在領(lǐng)彈進行機動的情況下,編隊的隊形能夠保持穩(wěn)定。領(lǐng)-從彈編隊結(jié)構(gòu)如圖2所示。
圖2 領(lǐng)彈-從彈編隊結(jié)構(gòu)示意圖Fig.2 Schematic diagram of leader-follower missile formation
(11)
用向量di表示第i枚從彈與領(lǐng)彈間的期望相對位置,從彈的期望位置和速度跟蹤誤差可以表示為
(12)
如果在任意的初始條件下,編隊控制器都能使群體系統(tǒng)在時間T (13) 和 (14) 則稱群體系統(tǒng)在固定時間內(nèi)實現(xiàn)了穩(wěn)定編隊。 編隊的實際收斂時間T 為了解決領(lǐng)-從彈編隊結(jié)構(gòu)中,從彈對領(lǐng)彈的協(xié)同跟蹤控制問題,本節(jié)首先基于群體系統(tǒng)周期采樣數(shù)據(jù)進行固定時間編隊控制協(xié)議的設(shè)計,保證具有較大飛行速度的導(dǎo)彈群體系統(tǒng)能夠在較短時間內(nèi)達到穩(wěn)定。然后為了節(jié)省通信帶寬和彈載計算資源,在固定時間編隊控制協(xié)議的基礎(chǔ)上引入了事件觸發(fā)機制,進行基于事件觸發(fā)策略的固定時間編隊控制器設(shè)計。 為滿足多導(dǎo)彈編隊對于隊形收斂時間的嚴格要求,本節(jié)基于多智能體一致性理論,對彈群進行固定時間編隊控制協(xié)議的設(shè)計。由于線性化后的導(dǎo)彈模型具有解耦的線性二階積分形式,故導(dǎo)彈x,y,z三個控制通道是相互獨立的,可以分別進行控制協(xié)議的設(shè)計。本節(jié)以x通道為例,給出其固定時間編隊控制協(xié)議。 考慮群體系統(tǒng)的通信結(jié)構(gòu)為有向拓撲,并且領(lǐng)彈是全局可達的,其運動狀態(tài)獨立。第i枚從彈的編隊控制協(xié)議設(shè)計為 vfxi=hi(t)+sig[hi(t)]a+sig[hi(t)]b+vlx (15) 式中: hi(t)=αpi(t)+βqi(t) (16) (17) 在所設(shè)計的固定時間編隊控制協(xié)議中,hi(t)項被設(shè)計用來實現(xiàn)編隊的漸近穩(wěn)定性;sig[hi(t)]a和sig[hi(t)]b項被設(shè)計用來實現(xiàn)編隊的固定時間穩(wěn)定性;vlx項是為了使群體系統(tǒng)在形成編隊隊形的同時,跟隨領(lǐng)彈的運動軌跡。 則式(17)可以寫成如下矩陣的形式。 (18) 對上式進行微分可得 (19) 領(lǐng)-從彈編隊系統(tǒng)固定時間一致性問題在此轉(zhuǎn)化為系統(tǒng)(19)的固定時間穩(wěn)定性問題,給出如下定理。 定理1.當(dāng)下列條件成立時,在給定的固定時間編隊控制協(xié)議(15)作用下,系統(tǒng)(19)能在固定時間內(nèi)收斂到一致,也即多導(dǎo)彈編隊能夠在固定時間Tmax內(nèi)收斂到穩(wěn)定狀態(tài)。 (20) 式中: μ1為矩陣M+MT的最小特征值。 證.定理1的證明分為三步,首先構(gòu)建包含變量pi(t)和qi(t)的Lyapunov函數(shù);然后證明固定時間編隊控制協(xié)議能實現(xiàn)群體系統(tǒng)的漸近穩(wěn)定性;最后通過構(gòu)建的Lyapunov函數(shù)和其導(dǎo)數(shù)的關(guān)系,證明該控制協(xié)議能實現(xiàn)群體系統(tǒng)的固定時間穩(wěn)定性。 (21) 式中: 所選取Lyapunov函數(shù)V(t)的符號由矩陣Ω決定,當(dāng)且僅當(dāng)矩陣Ω正定時,V(t)≥0。由于領(lǐng)彈是全局可達的,所以矩陣M+MT是對稱矩陣,且所有特征值均為正的實數(shù),即矩陣M+MT為正定矩陣且能被相似對角化,如下式所示。 Γ(M+MT)Γ-1=Λ (22) 矩陣Ω為實對稱矩陣,根據(jù)文獻[21]中引理3,當(dāng)且僅當(dāng)Γdiag(β2μi-α)Γ-1>0時,矩陣Ω正定。從條件(20)可知,該不等式成立,故V(t)≥0。對V(t)進行微分可得 (23) 將式(19)代入上式,可展開為 hTMsig(h)a-hTMsig(h)b (24) 為書寫方便,定義m1,m2,m3,m4分別為上式中等號右側(cè)從左到右四項,對這四項進行分析。 (25) (26) (27) 由引理3可得 (28) 聯(lián)立上述兩式,并化簡得 (29) 取 (30) 則m3可以表示為 (31) 同理,取 (32) 對m4進行放縮可得 (33) 由于定理1中條件(20)的約束,m1和m2項均不大于0,則式(28)可以放縮為如下的形式。 (34) 在編隊的一致性達成之前,有下列不等式成立。 ρT(Θ?IN)ρ>0 (35) 取有界閉集U={χ∈R2N:χTχ},可以得到 (36) 因此 (37) 由式(21)得 (38) 式中:λmax(Ω)為矩陣Ω的最大特征值。 根據(jù)文獻[21]中引理4,式(43)可被改寫為如下形式: (39) 將式(38)代入上式并化簡可得: (40) 式中: k3=k1(2κ/λmax(Ω))(a+1)/2, k4=k2N(1-b)/2(2κ/λmax(Ω))(b+1)/2。 根據(jù)引理2,系統(tǒng)能在固定時間內(nèi)達到穩(wěn)定,且穩(wěn)定時間T與系統(tǒng)的初始狀態(tài)無關(guān)且滿足 (41) 同理,可以設(shè)計y通道和z通道的控制協(xié)議。 上文中的固定時間編隊控制協(xié)議是基于傳統(tǒng)的周期采樣控制設(shè)計的,編隊中的導(dǎo)彈需要連續(xù)不斷的通信和對自身的控制參數(shù)的計算,來達到期望的編隊隊形??紤]在實際的導(dǎo)彈編隊飛行過程中,通信帶寬和彈載計算資源的限制,本節(jié)在固定時間編隊控制協(xié)議的基礎(chǔ)上,克服有向拓撲下Laplacian矩陣的不對稱性和事件觸發(fā)通信引入的誤差項對系統(tǒng)穩(wěn)定性分析帶來的困難,引入事件觸發(fā)機制對彈群進行編隊控制器的設(shè)計。針對每個從彈設(shè)計基于自身狀態(tài)誤差的事件觸發(fā)函數(shù),只有當(dāng)狀態(tài)誤差滿足所設(shè)定的閾值時,導(dǎo)彈才更新并在彈群中傳遞自身的狀態(tài)信息。 同樣考慮彈間通信拓撲是有向的,則第i枚從彈的編隊控制協(xié)議設(shè)計為 (42) 式中: (43) (44) 定義從彈i的時變位置誤差和速度誤差為 (45) 定義位置組合誤差和速度組合誤差為 (46) 為第i枚從彈設(shè)計基于自身狀態(tài)的觸發(fā)函數(shù)為 (47) 有以下矩陣形式的關(guān)系式成立。 (48) 式(43)可以表示為如下的形式。 γp(t)+δq(t) (49) 在控制輸入(42)的基礎(chǔ)上,對式(18)微分可得 (50) 基于事件觸發(fā)機制的固定時間一致性問題在此轉(zhuǎn)化為系統(tǒng)(50)的穩(wěn)定性問題,給出如下定理。 定理2.當(dāng)下列條件成立時,基于事件觸發(fā)機制的固定時間編隊控制協(xié)議能使群體系統(tǒng)(50)在固定時間內(nèi)收斂到穩(wěn)定狀態(tài)。 (51) 式中:σ為矩陣MMT的最大奇異值。 證.定理2的證明分為四步。首先構(gòu)建包含變量pi(t),qi(t)和時變誤差eix,eiv的Lyapunov函數(shù);然后證明在控制協(xié)議(42)的作用下,導(dǎo)彈編隊能夠漸近穩(wěn)定;接著證明系統(tǒng)的固定時間穩(wěn)定性;最后證明所設(shè)計的事件觸發(fā)函數(shù)排除Zeno行為。Zeno行為是指在有限的時間間隔內(nèi),事件函數(shù)被無限次的觸發(fā)。 設(shè)計的Lyapunov函數(shù)和定理1中相同,可知V(t)≥0,t∈[0,+∞)。對V(t)進行微分可得 (52) 將式(49)和式(50)代入上式并展開可得 δqT)M(γex+δev)-(γpT+δqT) (53) 為書寫方便,定義n1,n2,n3,n4分別為上式中等號右端四項,分別對這四項進行分析。 (54) 由事件觸發(fā)函數(shù)(47)可得 (55) 進而有 (56) 即 (57) 利用上述條件對n2進行放縮得 (58) 接下來對n3項進行放縮得 (59) 對上式中等號右端兩項分別進行分析,根據(jù)文獻[21]中引理5可得 (60) 由式(31)可知 (61) 因此 (62) 同理可得 (63) 將n1,n2,n3,n4代入式(53)可得 (64) (65) (66) 將式(66)代入式(65)得 (67) 式中: 由引理2可得,系統(tǒng)能在固定時間內(nèi)達到穩(wěn)定,且穩(wěn)定時間T與系統(tǒng)的初始狀態(tài)無關(guān): (68) 由于在群體系統(tǒng)的一致性達成以后,領(lǐng)彈繼續(xù)保持機動,事件觸發(fā)函數(shù)的閾值大于0,Zeno行為不會出現(xiàn)。接下來證明群體系統(tǒng)在達到穩(wěn)定之前Zeno行為被排除。在群體一致性達成之前有 (69) 定義 (70) 則有 (71) (72) 進而有 (73) (74) (75) 因此在本文所設(shè)計的事件觸發(fā)機制下,群體系統(tǒng)排除Zeno行為,證明完畢。 本節(jié)通過數(shù)值仿真來校驗所設(shè)計編隊控制算法的有效性和穩(wěn)定性分析的正確性??紤]由3枚從彈和1枚領(lǐng)彈組成的群體系統(tǒng),設(shè)計彈間通信拓撲及通信鏈路權(quán)重如圖3所示。彈間的通信拓撲被設(shè)計為有向的,相較于無向通信拓撲而言,可以更有效地節(jié)約通信資源。 圖3 彈間通信拓撲圖Fig.3 Communication topology of the missile formation 圖G的Laplacian矩陣為 (76) 領(lǐng)彈的鄰接矩陣為 (77) 為校驗領(lǐng)彈進行機動時,從彈對領(lǐng)彈的跟蹤情況和編隊隊形的保持情況,設(shè)計領(lǐng)彈的運動狀態(tài)如下。 (78) 領(lǐng)彈按照上式進行機動時,從彈在x方向需要跟蹤一個較大的速度,在y方向跟蹤一個較小的速度,而在z方向上跟蹤的速度為0。由于從彈的三個控制通道是分別進行設(shè)計的,因此在領(lǐng)彈按照上式機動的情況下,可以更好的校驗本文提出的固定時間編隊控制算法對不同大小速度的跟蹤性能。從彈和領(lǐng)彈的初始狀態(tài)信息由表1給出。 表1 導(dǎo)彈編隊初始狀態(tài)Table 1 Initial state of the missile formation 根據(jù)本文研究的作戰(zhàn)場景,設(shè)計適配偵察-打擊一體化功能的高低彈道編隊,導(dǎo)彈編隊的隊形在慣性坐標(biāo)系中給出,從彈與領(lǐng)彈間的期望相對位置為 (79) 固定時間編隊控制協(xié)議(15)中的α,β為要設(shè)計的反饋增益,用于調(diào)整彈群的位置和速度組合狀態(tài)對于編隊狀態(tài)的影響。α,β具有非常靈活的調(diào)整范圍,在保持α不變的情況下,增加β將增加群體系統(tǒng)達到穩(wěn)定的時間,同時減小導(dǎo)彈所需要的控制輸入。在β保持不變的情況下,增加α將提高編隊收斂的速度,同時導(dǎo)彈所需要的控制輸入也更大。a∈(0,1)和b∈(1,+∞)也是要設(shè)計的控制參數(shù),減小a會使編隊的收斂速度加快,但是當(dāng)a∈(0,0.5)時,繼續(xù)減小a,編隊的收斂速度提升的并不明顯,因此在數(shù)值仿真中取a∈(0.5,0.9)。b的選擇一般不大于2,過大的b會導(dǎo)致所需初始控制輸入的快速增大。 基于事件觸發(fā)機制的固定時間編隊控制算法(42)中控制參數(shù)的設(shè)計同固定時間算法(15)類似,事件觸發(fā)函數(shù)(47)中的m要在條件(51)允許的范圍內(nèi)設(shè)計的盡可能大,來避免事件被頻繁觸發(fā)。 結(jié)合上述分析,在本節(jié)的數(shù)值模擬仿真中,取α=γ=2,β=δ=10,a=c=0.8,b=d=1.2,m=0.12,仿真時間t=100 s,采樣間隔為0.001 s。 圖4~9給出了在固定時間編隊控制協(xié)議作用下導(dǎo)彈編隊各成員運動參數(shù)的變化情況。3枚從彈跟隨1枚領(lǐng)彈編隊飛行的三維空間運動軌跡如圖4所示,可以看出,從彈由給定的初始位置逐漸收斂到編隊隊形中的期望位置,并跟隨領(lǐng)彈進行機動。 圖4 固定時間編隊控制協(xié)議下的導(dǎo)彈飛行軌跡Fig.4 Missles’ trajectory based on fixed-time formation algorithm 圖5給出了導(dǎo)彈在x,y,z三個方向上的速度分量變化情況,可以看出,在t=24 s時,從彈的三個方向速度分量同時跟蹤上領(lǐng)彈的速度分量,又由于在t=0時刻,領(lǐng)彈和從彈在x,y,z軸的速度分量大小是不一樣的,由此可以驗證固定時間編隊控制算法的收斂時間與群體系統(tǒng)的初始狀態(tài)無關(guān)。 圖6給出了導(dǎo)彈總的速度變化情況,可以看出,在導(dǎo)彈編隊形成的過程中,從彈1的速度最大達到了960 m/s,其它從彈的速度也都存在短暫的上升。從彈速度的短暫上升主要是由于一致性算法的特性和對編隊穩(wěn)定時間的要求造成的,可以通過調(diào)整控制參數(shù),增大編隊達到穩(wěn)定的時間,來減小從彈在達到編隊穩(wěn)定過程中需要的最大速度。 圖6 固定時間編隊控制協(xié)議下的導(dǎo)彈速度變化Fig. 6 Missles’ velocity based on fixed-time formation algorithm 圖7給出了從彈的期望位置跟蹤誤差和速度跟蹤誤差,二者隨著時間的增加逐漸減小,并且都在t=24 s時收斂到0,說明此時編隊的隊形已經(jīng)形成,并在此后的時刻保持穩(wěn)定。 圖7 固定時間編隊控制協(xié)議下的從彈跟蹤誤差Fig.7 Followers’ tracking error based on fixed-time formation algorithm 以從彈3為例,給出其在編隊過程中x,y,z三個通道的虛擬控制輸入和真實控制輸入如圖8所示??紤]彈載執(zhí)行機構(gòu)的執(zhí)行能力,為虛擬控制輸入設(shè)定了|vf|≤400的閾值,從而將從彈的三個控制通道所需過載均控制在60以內(nèi)。 圖8 固定時間編隊控制協(xié)議下的從彈3的控制輸入Fig.8 Control input for the follower 3# based on fixed-time formation algorithm 圖9~12給出了彈間通信結(jié)構(gòu)為圖3所示的有向權(quán)重拓撲條件時,在基于事件觸發(fā)機制的固定時間編隊算法(42)作用下,導(dǎo)彈編隊中各成員運動參數(shù)的變化情況。 圖9 固定時間事件觸發(fā)機制下的導(dǎo)彈飛行軌跡Fig.9 Missles’ trajectory based on fixed-time event-triggered formation algorithm 圖10 固定時間事件觸發(fā)機制下的導(dǎo)彈速度變化Fig. 10 Missles’ velocity based on fixed-time event-triggered formation algorithm 圖11 固定時間事件觸發(fā)機制下的從彈跟蹤誤差Fig.11 Followers’ tracking error based on fixed-time event-triggered formation algorithm 圖12 固定時間事件觸發(fā)機制下的從彈3的事件觸發(fā)時刻Fig.12 Event time of follower 3 based on fixed-time event-triggered formation algorithm 從圖9~11可以看出,在基于事件觸發(fā)機制的固定時間編隊控制算法的作用下,從彈同樣實現(xiàn)了對期望位置和速度的跟蹤,并在t=24 s時編隊收斂到期望隊形。如圖11所示,由于事件觸發(fā)函數(shù)閾值的存在,在一致性達成之后,從彈的期望位置跟蹤誤差和期望速度跟蹤誤差并不為零,可以通過對事件觸發(fā)函數(shù)閾值的設(shè)置,來調(diào)整從彈的期望位置跟蹤誤差和期望速度跟蹤誤差,進而滿足編隊設(shè)計的精度需求。 以從彈3為例,其三個控制通道的事件觸發(fā)時刻分布如圖12所示。由于從彈在x軸方向跟蹤的位置和速度狀態(tài)變化最大,所以測量誤差最頻繁的達到所設(shè)定的閾值,導(dǎo)致事件的觸發(fā);在y軸方向跟蹤的位置和速度狀態(tài)變化稍小,所以其事件觸發(fā)次數(shù)顯著降低;由于領(lǐng)彈在z軸方向不做機動,所以從彈在z軸方向跟蹤的位置是固定值,速度是零,當(dāng)z軸方向的一致性達成以后,事件便不再觸發(fā)。由此可以得出結(jié)論,基于事件觸發(fā)機制的編隊控制算法可以有效的節(jié)省計算資源和通信帶寬,事件觸發(fā)函數(shù)的觸發(fā)次數(shù)與編隊的機動情況相關(guān)。 對固定時間編隊控制協(xié)議和基于事件觸發(fā)機制的固定時間編隊控制協(xié)議仿真實驗結(jié)果從以下三個方面進行對比分析。 1) 編隊收斂速度。通過合理設(shè)置參數(shù),固定時間編隊控制協(xié)議可以保證具有較大初始狀態(tài)的彈群系統(tǒng)在24 s內(nèi)收斂到穩(wěn)定,在引入事件觸發(fā)機制后,編隊的收斂時間仍為24 s,可見事件觸發(fā)機制的引入并未對編隊的收斂速度產(chǎn)生影響。 2) 編隊飛行誤差。在固定時間編隊控制協(xié)議作用下,導(dǎo)彈編隊隊形收斂到一致后,從彈的期望位置跟蹤誤差和期望速度跟蹤誤差都為0,在引入事件觸發(fā)機制后,由于事件觸發(fā)函數(shù)閾值的存在,從彈的期望位置跟蹤誤差和期望速度跟蹤誤差均不為0,該誤差可以通過相關(guān)參數(shù)的設(shè)置來進行調(diào)節(jié)。 3) 編隊通信頻率。固定時間編隊控制協(xié)議是基于周期采樣控制設(shè)計的,在本文的仿真實驗中采樣間隔設(shè)置為0.001 s,而引入事件觸發(fā)機制后,只有在事件觸發(fā)時刻才會觸發(fā)從彈間通信,從彈的事件觸發(fā)時刻如圖12所示,有效降低了從彈間通信的頻率。 綜上所述,在固定時間編隊控制協(xié)議的基礎(chǔ)上引入事件觸發(fā)機制,可以在保證彈群系統(tǒng)以較快速度達到穩(wěn)定的前提下,有效的節(jié)約通信帶寬和彈載計算資源。 本文結(jié)合實際作戰(zhàn)場景,對多導(dǎo)彈協(xié)同編隊控制問題進行了研究。主要結(jié)論如下: 1) 本文設(shè)計的固定時間一致性編隊控制協(xié)議,能夠保證初始位置差距較大、速度較快的導(dǎo)彈編隊在較短的時間內(nèi)收斂到穩(wěn)定狀態(tài),并跟隨領(lǐng)彈進行機動。 2) 本文設(shè)計的基于從彈自身狀態(tài)觸發(fā)事件的編隊控制器,能有效減少彈群編隊所需的通信帶寬和彈載計算資源。 3) 本文所設(shè)計的編隊控制協(xié)議適用于彈間通信是有向拓撲的情況。相較于無向通信,有向通信對于復(fù)雜的戰(zhàn)場環(huán)境具有更強的適應(yīng)性,并且可以降低對彈載通信設(shè)備的要求。3 事件觸發(fā)機制下多導(dǎo)彈固定時間編隊控制器設(shè)計
3.1 固定時間編隊控制協(xié)議
3.2 事件觸發(fā)機制下固定時間編隊控制器設(shè)計
4 多導(dǎo)彈編隊控制系統(tǒng)仿真
5 結(jié) 論