聶 芬,段曉君,劉易成
(國(guó)防科技大學(xué) 文理學(xué)院, 湖南 長(zhǎng)沙 410073)
近年來,生物科學(xué)、信息科學(xué)、系統(tǒng)與控制科學(xué)等多個(gè)領(lǐng)域的研究者們都在關(guān)注多智能體系統(tǒng)如何合作和協(xié)調(diào),一致性問題作為多智能體系統(tǒng)之間合作協(xié)調(diào)的基礎(chǔ),越來越受到研究者們的關(guān)注。在過去十年中,廣泛研究了二階多智能體系統(tǒng)的一致性問題。對(duì)于連續(xù)系統(tǒng),Ren等[1]提出了二階一致性協(xié)議,得到系統(tǒng)在具有固定拓?fù)浜徒粨Q拓?fù)湎乱恢滦缘某浞謼l件。Xie等[2]解決了二階系統(tǒng)在無向圖具有固定拓?fù)浜颓袚Q拓?fù)鋾r(shí)的平均一致性問題。Yu等[3]、Zhu等[4]建立了一致性協(xié)議充要條件。對(duì)時(shí)滯二階系統(tǒng),Yu等[5]討論了不需要速度測(cè)量的具有位置伴隨跟過去位置伴隨控制的一致性,得到系統(tǒng)無時(shí)滯不能一致,在選擇合適的時(shí)滯可以促成一致性的結(jié)論。Hou等[6]討論了一類二階系統(tǒng),得到無時(shí)滯時(shí)系統(tǒng)一致的充要條件,以及系統(tǒng)達(dá)成一致能容忍的最大時(shí)滯。系統(tǒng)鄰接圖具有有向生成樹時(shí),具有空間坐標(biāo)耦合的系統(tǒng)一致性問題得到解決[7]。劉易成等[8]討論了具有位置伴隨和速度伴隨的二階多智能體系統(tǒng)的三種集群模式。在控制系統(tǒng)中,通常情況下,智能體無法隨時(shí)獲取測(cè)量數(shù)據(jù),通常會(huì)定期更新信息。因此,對(duì)離散系統(tǒng)的研究顯得尤為重要。Zhang等[9]研究了一類二階離散多智能體系統(tǒng),得到系統(tǒng)在固定拓?fù)浜蛶яR爾可夫切換拓?fù)鋾r(shí),系統(tǒng)二階一致性的充要條件。Lin等[10]通過模型變換和應(yīng)用非負(fù)矩陣的性質(zhì),在一定假設(shè)條件下,只要鄰接圖的并集具有有向生成樹,系統(tǒng)可以容忍任意有界時(shí)間延遲,得到了系統(tǒng)二階一致性的充分條件。Xie等[11]利用雙線性變換,將二階離散時(shí)間多智能體系統(tǒng)的一致性問題轉(zhuǎn)化為多項(xiàng)式的Schur穩(wěn)定性問題,得到系統(tǒng)二階一致性成立的充要條件。具有時(shí)變拓?fù)浜蜁r(shí)變時(shí)滯的一致性問題得到了解決[12],對(duì)有限傳輸時(shí)滯的離散系統(tǒng),有限的傳輸時(shí)滯不影響離散二階一致性[13]。Cao等[14]得到了系統(tǒng)具有固定有向拓?fù)浜蜔o向拓?fù)鋾r(shí)的一致性結(jié)果。具有坐標(biāo)耦合的一致性問題,在選取合適采樣周期、阻尼因子和旋轉(zhuǎn)角,可實(shí)現(xiàn)不同的集群運(yùn)動(dòng)[15]。更多參考多智能體系統(tǒng)的一致性研究見隨機(jī)網(wǎng)絡(luò)拓?fù)鋄16-17]、非線性系統(tǒng)[18-20]、有限時(shí)間[18, 21-22]、數(shù)據(jù)采樣[23-25]等方面的研究。旋轉(zhuǎn)矩陣應(yīng)用于一致性的研究很少,旋轉(zhuǎn)矩陣在航天器姿態(tài)問題以及機(jī)器人技術(shù)等多個(gè)方面有著重要的應(yīng)用, 因此研究坐標(biāo)耦合的多智能體系統(tǒng)的一致性具有重要的理論價(jià)值及實(shí)際應(yīng)用價(jià)值。本文在以上基礎(chǔ)上,通過引入時(shí)滯,從連續(xù)系統(tǒng)出發(fā),研究了一類具有坐標(biāo)耦合和處理時(shí)滯的二階離散多智能體系統(tǒng)的一致性,給出了在上一時(shí)刻位移伴隨和速度伴隨的共同作用下,得到具有空間坐標(biāo)耦合的集群系統(tǒng)的二階一致性的充要條件并進(jìn)行了證明。針對(duì)旋轉(zhuǎn)角和離散步長(zhǎng)等特征參數(shù)臨界性與一致性收斂分析的關(guān)系,設(shè)計(jì)案例進(jìn)行了驗(yàn)證,本文證明結(jié)論可為一致性分析提供重要判據(jù)。
本文考慮n個(gè)智能體組成的二階連續(xù)系統(tǒng):
(1)
其中:ri(t),vi(t)∈R3代表t時(shí)刻智能體i的位置和速度;ui(t)∈R3代表控制輸入。 對(duì)系統(tǒng)(1)設(shè)計(jì)控制輸入:
(2)
其中
τP是處理時(shí)滯(智能體處理數(shù)據(jù)的時(shí)間),τT是傳輸時(shí)滯(信息從智能體傳至另一個(gè)智能體的時(shí)間)。為了規(guī)范化處理時(shí)滯,令t=τPs,Ri(s)=xi(τps),Vi(s)=vi(τps),系統(tǒng)(1)約束控制輸入式(2)得到以下形式:
(3)
得到式(3)的離散形式:
(4)
其中:Ri(k)=[xi(k),yi(k),zi(k)]T∈R3;Vi(k)=[vxi(k),vyi(k),vzi(k)]T∈R3,i=1,2,…,n,k=1,2,…;T為離散步長(zhǎng)。 在現(xiàn)代通信條件下,處理時(shí)滯遠(yuǎn)遠(yuǎn)大于傳輸時(shí)滯,即τP?τT,在本文工作中,忽略傳輸時(shí)滯,僅考慮處理時(shí)滯,也就是在式(4)中令τp=τ≠0,τT=0,得到以下系統(tǒng):
(5)
為描述多智能體系統(tǒng)最終形成的樣式,首先給出如下定義。
則稱多智能體系統(tǒng)式(5)二階一致性達(dá)成。
先給出后面會(huì)用到的基本概念和引理。
G=(V,E,A)是由n個(gè)節(jié)點(diǎn)組成的有限非空集合V={v1,v2,…,vn}上的有向圖,E?V×V是邊集,邊eij=(vj,vi)∈E意味著節(jié)點(diǎn)vi可以接受vj節(jié)點(diǎn)的信息。A是加權(quán)鄰接矩陣,A=[aij]n×n定義為aij≠0,如果eij∈E,aij=0;如果eij?E,進(jìn)一步aii=0對(duì)所有i成立。 那么,多智能體系統(tǒng)的拓?fù)浣Y(jié)構(gòu)將由其對(duì)應(yīng)的有向圖G完全決定。 記拉普拉斯矩陣L=D-A,其中D=diag{c1,c2,…,cn},ci=∑j≠iaij,i=1,2,…,n。
對(duì)于拉普拉斯矩陣的性質(zhì),可以總結(jié)為以下引理。
引理1[25]若L為有向圖G對(duì)應(yīng)的拉普拉斯矩陣, 則有向圖G具有有向生成樹,當(dāng)且僅當(dāng)0是矩陣L的單根,并且非零特征值均具有正的實(shí)部。此外,存在各分量非負(fù)的p∈Rn使得pTL=0,pT1n=1,且L1n=0。即p與1n分別為矩陣L的零特征值所對(duì)應(yīng)的左特征向量與右特征向量。
對(duì)于三維空間中的旋轉(zhuǎn)矩陣C∈R3×3,若已知其旋轉(zhuǎn)軸和旋轉(zhuǎn)角分別為a=[a1,a2,a3]T及θ∈[0,2π),以下引理給出旋轉(zhuǎn)矩陣C的特征值和對(duì)應(yīng)的特征向量的關(guān)系。
本節(jié)將通過矩陣特征值分析的方法構(gòu)建多智能體系統(tǒng)式(5)的二階一致性判據(jù)。
記R(k)=[R1(k),R2(k),…,Rn(k)]T,V(k)=[V1(k),V2(k),…,Vn(k)]T, 可將多智能體系統(tǒng)式(5)化為矩陣形式:
令Z(k)=[R(k)T,R(k-1)T,V(k)T,V(k-1)T]T,將多智能體系統(tǒng)式(5)化為矩陣形式:
Z(k+1)=MZ(k)
(6)
其中,M是一個(gè)12n×12n階矩陣,即:
(7)
此外,記
可將多智能體系統(tǒng)式(5)化為誤差系統(tǒng):
(8)
其中,W是一個(gè)12(n-1)×12(n-1)階矩陣,即:
其中
系統(tǒng)式(6)達(dá)成二階一致性當(dāng)且僅當(dāng)系統(tǒng)式(8)是漸進(jìn)穩(wěn)定的。
引理3矩陣M如式(7)所定義,則0是拉普拉斯矩陣L的單根,當(dāng)且僅當(dāng)1是矩陣M的6重根。
證明:計(jì)算矩陣M的特征方程,則
det(λI12n-M)
當(dāng)i=1時(shí),u1=0為矩陣L的單根,則
可知λ=0,1是特征方程的6重根。反過來,當(dāng)λ=1是特征方程的6重根,則
mij(1)=T2τ2uicj=0
由于T,τ,cj≠0,故ui=0為矩陣L的根,由充分性可知,ui=0為矩陣L的單根。
□
證明:引理的第一部分根據(jù)文獻(xiàn)[9]引理1可得,由引理3可知,
(9)
□
引理5若0是拉普拉斯矩陣L的單根,則0是矩陣L?C的3重根,1是矩陣M代數(shù)重?cái)?shù)為6,幾何重?cái)?shù)為3的特征值,1特征值相應(yīng)的右特征向量和廣義右特征向量分別為:
和
1特征值相應(yīng)的廣義左特征向量和左特征向量分別為:
其中,l=1,2,3。
證明:由克羅克內(nèi)積性質(zhì)可知,若0是拉普拉斯矩陣L的單根,則0是矩陣L?C的3重根,由引理4可知,1是矩陣M的特征值,代數(shù)重?cái)?shù)為6。
可得:wa+Tτwc=wa;wa=wb;-TτL?Cwb+wc-TτγL?Cwd=wc;wc=wd。
□
接下來,需要一個(gè)三階復(fù)系數(shù)方程
x3+c1x2+c2x+c3=0
(10)
穩(wěn)定的判據(jù),其中ci=ai+bii,ai,bi∈R,i=1,2,3。
定理1系統(tǒng)式(5)達(dá)成二階一致性,當(dāng)且僅當(dāng)矩陣M的1特征值代數(shù)重?cái)?shù)是6,幾何重?cái)?shù)是3,矩陣M的其余特征值在單位圓內(nèi),特別地,如果二階一致性達(dá)成,則有下式成立:
其中,R∞=(pT?I3)R(0),V∞=(pT?I3)V(0),p=(p1,p2,…,pn)T是拉普拉斯矩陣L的0特征值的左特征向量,且滿足pi≥0,i=1,2,…n,pT1n=1。
證明(充分性):由引理5,存在一個(gè)非奇異矩陣P∈R12n×12n使得:
所以
即
(必要性)通過反證法來證明,假設(shè)矩陣M的1特征值代數(shù)重?cái)?shù)為6,幾何重?cái)?shù)為3,矩陣M的其余特征值在單位圓內(nèi)這一條件不滿足。由于矩陣L至少有一個(gè)0特征值,由引理3,矩陣M至少有6個(gè)1特征值,代數(shù)重?cái)?shù)為6,幾何重?cái)?shù)為3,所以,有以下三種情況需要討論:
第一種情況:矩陣M的1特征值代數(shù)重?cái)?shù)是6,幾何重?cái)?shù)是3,存在至少一個(gè)特征值不在單位圓內(nèi);
第二種情況:矩陣M的1特征值代數(shù)重?cái)?shù)大于6,其余特征值均在單位圓內(nèi);
第三種情況:矩陣M的1特征值代數(shù)重?cái)?shù)大于6,還至少存在一個(gè)1特征值不在單位圓內(nèi)。
對(duì)第一種情況,由引理4,若矩陣M有一個(gè)特征值不在單位圓內(nèi),則矩陣W也有一個(gè)特征值不在單位圓內(nèi),系統(tǒng)式(8)的漸進(jìn)穩(wěn)定性不能達(dá)成,系統(tǒng)式(6)的二階一致性不能達(dá)成,與已知矛盾。同樣可以證明第二、三種情況。
□
定理1中的代數(shù)條件不容易被驗(yàn)證。對(duì)于一個(gè)給定的網(wǎng)絡(luò)結(jié)構(gòu),提出了如下選擇定理來選擇適當(dāng)?shù)目刂茀?shù)和離散步長(zhǎng),確保達(dá)成二階一致性。
定理2令T,τ>0,系統(tǒng)式(5)達(dá)成二階一致性,當(dāng)且僅當(dāng)有向圖G具有有向生成樹,同時(shí)滿足以下條件:
(11)
證明(充分性):若系統(tǒng)式(5)能達(dá)成二階一致性,由定理1可知,矩陣M的1特征值代數(shù)重?cái)?shù)為6,幾何重?cái)?shù)為3,其余特征值均在單位圓內(nèi),由引理3,拉普拉斯矩陣L的0特征值為單根,也就是說,有向圖G具有有向生成樹。
定義
(12)
固定i,容易得到:
由引理4,式(12)所有根具有負(fù)實(shí)部對(duì)i=2,3,…,n,當(dāng)且僅當(dāng)條件式(11)成立,所以充分性成立。
(必要性)若條件式(11)成立,式(12)的所有根在單位圓內(nèi)對(duì)i=2,3,…,n成立,由引理4可知,矩陣M的特征值除0和1以外,都在單位圓內(nèi)。此外,由于有向圖G具有有向生成樹,可知拉普拉斯矩陣L的特征值0是單根,由引理3可知,矩陣M的1特征值的代數(shù)重?cái)?shù)是6,幾何重?cái)?shù)是3,由定理1可知,系統(tǒng)式(5)會(huì)達(dá)成二階一致性。
□
本節(jié)通過數(shù)值模擬驗(yàn)證本文的主要結(jié)論,并對(duì)結(jié)論的應(yīng)用場(chǎng)景進(jìn)行分析。
例1假設(shè)智能體數(shù)n=4,反映系統(tǒng)結(jié)構(gòu)的拉普拉斯矩陣L選取為如下形式:
初始位置R(0)和初始速度V(0)選取如下:
R(0)=(4,2,9,1,4,1,3,4,6,3,6,7)
V(0)=(7,8,7,4,7,2,7,0,3,0,1,8)
經(jīng)過計(jì)算可知,矩陣L的特征值為u1=0,u2=0.952 5,u3=1.673 7+0.469 1i,u4=1.673 7-0.469 1i。矩陣L的0特征值的左特征向量為(0.250 2,0.191 1,0.458 7,0.100 1),由定理1可知,達(dá)成二階一致性后,最終速度值為(5.726 2,3.439 2,4.309 9)。由定理2可知,當(dāng)T=0.01,τ=3,γ=2,θc=57.139 3°為系統(tǒng)臨界值。當(dāng)θ(50°)<θc(57.139 3°)時(shí),計(jì)算可知,當(dāng)i=2,3,4,Ai(0.01,3,2)>0,Bi(0.01,3,2,50)>0,Ci(0.01,3,2,50)>0滿足條件式(11),由定理2可知,系統(tǒng)式(5)將達(dá)成二階一致性,如圖1所示。而當(dāng)θ(60°)>θc(57.139 3°)時(shí),通過直接計(jì)算可知,當(dāng)i=3,C3(0.01,3,2,60)<0不滿足條件式(11),由定理2可知,系統(tǒng)式(5)發(fā)散,如圖2所示。
(a) x軸方向速度(a) Velocity in x-axis
(b) y軸方向速度(b) Velocity in y-axis
(c) z軸方向速度(c) Velocity in z-axis圖1 n=4,θ<θc時(shí)的速度收斂Fig.1 Velocity convergence when n=4,θ<θc
(a) x軸方向速度(a) Velocity in x-axis
(b) y軸方向速度(b) Velocity in y-axis
(c) z軸方向速度(c) Velocity in z-axis
圖2n=4,θ>θc時(shí)的速度收斂
Fig.2 Velocity convergence whenn=4,θ>θc
例2在數(shù)值模擬中假設(shè)智能體數(shù)n=30,構(gòu)建系統(tǒng)結(jié)構(gòu)的拉普拉斯矩陣L選取為如下形式:
初始位置和初始速度?。?/p>
R(0)=(8,9,1,9,6,1,3,5,10,10,2,10,10,5,8,1,4,9,8,10,7,0,8,9,7,8,7,4,7,2,7,0,3,0,1,8,7,3,10,0,4,4,8,8,2,5,4,6,7,8,3,7,7,2,1,5,10,3,6,2,8,3,5,7,9,10,5,1,1,3,8,3,8,2,9,3,2,3,6,5,4,8,6,5,9,3,8,8,4,6)
V(0)=(5,3,7,2,7,2,4,6,8,1,9,8,5,4,4,3,5,5,8,8,6,4,8,5,4,9,9,6,6,6,2,3,5,2,8,2,2,2,2,4,3,9,4,2,9,10,4,1,3,4,6,3,6,7,2,1,3,3,4,5,1,3,8,0,9,7,5,6,2,5,10,5,5,2,5,6,7,4,4,10,0,9,9,8,1,3,3,7,1,7)
經(jīng)過計(jì)算可知,當(dāng)i=1時(shí),矩陣L的特征值u1=0,當(dāng)2≤i≤30時(shí),矩陣L的特征值Re(ui)>0,系統(tǒng)具有有向生成樹,由定理2可知,T=0.01,τ=3,γ=2,θc=40.547 3°為系統(tǒng)臨界值。當(dāng)θ(40°)<θc(40.547 3°)時(shí),計(jì)算可知,當(dāng)i=2,…,30,Ai(0.01,3,2)>0,Bi(0.01,3,2,40)>0,Ci(0.01,3,2,40)>0成立,由定理2可知,系統(tǒng)式(5)將達(dá)成二階一致性,如圖3所示。假設(shè)在執(zhí)行任務(wù)的過程中,智能體7和23損毀,導(dǎo)致系統(tǒng)拉普拉斯矩陣第7、23列數(shù)據(jù)全部變成0,影響智能體16收不到所有智能體所發(fā)的信息,破壞了系統(tǒng)有向生成樹的結(jié)構(gòu),即使與圖3取同樣的參數(shù)值,系統(tǒng)式(5)仍發(fā)散,如圖4所示。另外,如果是智能體6和22損毀,沒有破壞系統(tǒng)有向生成樹的結(jié)構(gòu),則不影響群體的性能。取與圖3同樣的參數(shù)值,系統(tǒng)式(5)收斂,如圖5所示。
(a) x軸方向速度(a) Velocity in x-axis
(b) y軸方向速度(b) Velocity in y-axis
(c) z軸方向速度(c) Velocity in z-axis圖3 n=3,θ<θc時(shí)的速度收斂Fig.3 Velocity convergence when n=3,θ<θc
(a) x軸方向速度(a) Velocity in x-axis
(b) y軸方向速度(b) Velocity in y-axis
(c) z軸方向速度(c) Velocity in z-axis圖4 智能體7,23損毀后的速度發(fā)散Fig.4 Velocity divergence when agent 7 and 23 were damaged
(a) x軸方向速度(a) Velocity in x-axis
(b) y軸方向速度(b) Velocity in y-axis
(c) z軸方向速度(c) Velocity in z-axis圖5 智能體6,22損毀后的速度收斂Fig.5 Velocity convergence when agent 6 and 22 were damaged
本文討論了帶坐標(biāo)耦合和處理時(shí)滯的二階離散多智能體系統(tǒng)的一致性問題,證明了當(dāng)0是拉普拉斯矩陣的單根時(shí),旋轉(zhuǎn)角小于由代數(shù)方程確定的臨界值時(shí),系統(tǒng)會(huì)出現(xiàn)二階一致性;而旋轉(zhuǎn)角、離散步長(zhǎng)大于臨界值時(shí), 系統(tǒng)發(fā)散。本文針對(duì)特征參數(shù)的臨界值結(jié)論,可為控制領(lǐng)域一致收斂分析提供理論支撐。
國(guó)防科技大學(xué)學(xué)報(bào)2020年1期