劉孝琪,康懷祺,曾超
電子科技大學(xué)電子科學(xué)技術(shù)研究院,成都611731
近年來,隨著控制理論的發(fā)展,越來越多的研究者開始轉(zhuǎn)向多智能體系統(tǒng)一致性理論的研究,目前在無人機(jī)編隊(duì)、蜂擁控制、分布式控制中都有著廣泛的應(yīng)用。對(duì)于復(fù)雜系統(tǒng),利用傳統(tǒng)的控制方法來分析和控制是十分困難的,在這種背景下多智能體系統(tǒng)協(xié)調(diào)控制的發(fā)展是必然的。
在多智能體系統(tǒng)的一致性問題研究中,關(guān)鍵問題在于設(shè)計(jì)一致性控制律使得各智能體的狀態(tài)達(dá)到相同。隨著控制理論的發(fā)展,多智能體一致性的研究取得了一系列的成果。Vicsek等人[1]利用局部信息提出了一個(gè)自驅(qū)動(dòng)模型描述平面粒子的運(yùn)動(dòng);Jadbabaie等人[2]對(duì)Vicsek模型進(jìn)行了線性化,分析了拓?fù)浣Y(jié)構(gòu)變化情況下的一致性問題;Ren等人[3]將Jadbabaie等人所得結(jié)果推廣到了有向圖;與Ren等人工作并行,M oreau[4]研究了有向圖非線性多智能體系統(tǒng)一致問題;Hong等人[5]研究了二階多智能體系統(tǒng),基于局部信息提出了一個(gè)二階協(xié)議,將Jadbabaie等人的結(jié)果推廣到二階多智能體系統(tǒng);文獻(xiàn)[6-9]研究了多智能體系統(tǒng)基于有向信息交換的分組一致問題。
目前,多智能體系統(tǒng)的平均一致性研究的比較早,成果也比較多,文獻(xiàn)[10]在考慮通信時(shí)滯和拓?fù)浣Y(jié)構(gòu)變化對(duì)系統(tǒng)狀態(tài)影響的基礎(chǔ)上,研究了平均一致性問題。但是,目前的研究針對(duì)多智能體初始狀態(tài)的一致性問題的還比較少。而現(xiàn)實(shí)中,多智能體系統(tǒng)能否收斂到初始狀態(tài)非常重要,不管是系統(tǒng)中每個(gè)智能體的初始狀態(tài)校準(zhǔn)還是智能體狀態(tài)需要同步達(dá)到初始狀態(tài),這些都需要一種新的系統(tǒng)控制方法。最后,針對(duì)無人機(jī)編隊(duì)中需要初始狀態(tài)一致這一場(chǎng)合,分析了本文研究成果的有效性。
2.1.1 代數(shù)圖論知識(shí)
令G=(v,ξ,A)為一個(gè)n階(n≥2)賦權(quán)有向圖,其中v={v1,v2,…,vn}為非空節(jié)點(diǎn)集合,ξ?v×v為邊的集合,權(quán)值鄰接矩陣A=[aij]的鄰接元素aij為非負(fù)值。節(jié)點(diǎn)指標(biāo)屬于一個(gè)有限指標(biāo)集Γ={1,2,…,n}。G的邊用eij=(vi,vj)表示。與圖的邊對(duì)應(yīng)的鄰接元素為正,例如,eij∈ξ?aij>0。另外,假定對(duì)所有的i∈Γ,aii=0。節(jié)點(diǎn)vi的鄰集由Ni={vj∈v:(vi,vj)∈ξ}表示。集合Ni中元素的數(shù)目稱為節(jié)點(diǎn)vi的出度,,用矩陣D表示出度矩陣。類似地,集合N~i={vj∈v:(vi,vj)∈ξ}中元素的數(shù)目稱為節(jié)點(diǎn)vi的入度,由degin表示。令xi∈R表示節(jié)點(diǎn)vi的值,將拓?fù)洌ɑ蛐畔⒘鳎镚,狀態(tài)值為x∈Rn的網(wǎng)絡(luò)(或代數(shù)圖)表示為Gx=(G,x)。
2.1.2 一致性協(xié)議
假定所考慮的動(dòng)態(tài)智能體網(wǎng)絡(luò)包含n個(gè)智能體。每個(gè)智能體被視為有向圖G中的一個(gè)節(jié)點(diǎn)。每條邊(vj,vi)∈ξ(G(t))對(duì)應(yīng)在時(shí)刻t,智能體i到智能體j之間的可靠信息傳遞。另外,每個(gè)智能體只根據(jù)自身和它鄰居智能體的信息改變目前的狀態(tài)值。考慮單積分器智能體動(dòng)力學(xué)特性,令
其中xi(t)∈R為智能體的信息狀態(tài)值,ui(t)為時(shí)刻t時(shí)的控制輸入(或協(xié)議)。
多個(gè)相互通信的智能體系統(tǒng),每個(gè)智能體只能獲得其鄰居智能體的狀態(tài)值,可以用有向圖G=(v,ξ,A)來描述,多智能體的狀態(tài)方程可由式(1)表示:
例如,無人機(jī)編隊(duì)飛行過程中,機(jī)群整體協(xié)調(diào)才能完成它們所承擔(dān)的共同任務(wù),必須具有相同的初始姿態(tài),由于某些偶然因素干擾,致使無人機(jī)編隊(duì)中的各個(gè)智能體偏離初始姿態(tài),無法繼續(xù)執(zhí)行既定任務(wù)。所以,每個(gè)無人機(jī)(都是一個(gè)智能體)都需要調(diào)正自己的姿態(tài)至初始設(shè)定的姿態(tài)值,如果每個(gè)智能體都只是孤立地調(diào)整自己的姿態(tài),而沒有顧及機(jī)群整體的狀態(tài)值,一旦自己的姿態(tài)調(diào)整好之后就去執(zhí)行整體的任務(wù),而鄰居智能體還沒調(diào)整好,任務(wù)顯然會(huì)失敗。那如何設(shè)計(jì)一種協(xié)議,使得每個(gè)無人機(jī)都能服從機(jī)群整體的狀態(tài)改變,即當(dāng)無人機(jī)群中每個(gè)無人機(jī)(智能體)都調(diào)整到初始姿態(tài)時(shí)才一起執(zhí)行任務(wù),而某一無人機(jī)提前回歸到初始姿態(tài),其他無人機(jī)還未準(zhǔn)備好時(shí),會(huì)繼續(xù)使自身處于姿態(tài)調(diào)整的過程中,不會(huì)去執(zhí)行任務(wù)。為解決類似的初始狀態(tài)一致問題考慮,針對(duì)多智能體系統(tǒng)(1),本文分別從不含時(shí)滯和含有時(shí)滯兩種情況展開了此類問題的研究。
2.2.1 多智能體系統(tǒng)不含時(shí)滯
在多智能體系統(tǒng)不含時(shí)滯的情況下,為使多智能體系統(tǒng)收斂到初始狀態(tài)量,采用以下一致性控制協(xié)議:
將式(2)代入式(1)可得:
x˙(t)=-(D+A)x(t)(3)其中,x=[x1,x1,…,xn]T,D為出度矩陣,A為臨界矩陣。
2.2.2 多智能體系統(tǒng)含有時(shí)滯
在多智能體系統(tǒng)含有時(shí)滯的情況下,在式(2)所表示的協(xié)議基礎(chǔ)上增加時(shí)滯部分,則
其中,0<τ<d為正在通信的兩個(gè)多智能體之間的通信時(shí)滯。
將式(4)代入式(1)可得:
其中x=[x1,x1,…,xn]T,D為智能體間拓?fù)浣Y(jié)構(gòu)所對(duì)應(yīng)的出度矩陣,A為對(duì)應(yīng)的鄰接矩陣。
本章針對(duì)多智能體系統(tǒng)(1)在存在時(shí)滯和不存在時(shí)滯兩種情況下收斂到初始狀態(tài)進(jìn)行分析。為了便于定理推導(dǎo),先給出一個(gè)引理。
引理1[11]給定任意實(shí)可微向量函數(shù)x(t)∈Rn,任意可微標(biāo)量函數(shù)τ(t)∈(0,h]和任意常矩陣0<Q=QT∈Rn×n,如下不等式成立:
其中,h∈R為正實(shí)數(shù),t≥0。
定理1如果存在一個(gè)對(duì)稱矩陣P∈Rn×n,使得
那么由式(3)所確定的一致性協(xié)議能使多智能體一致收斂到初始狀態(tài)。
證明針對(duì)式(1)確定的多智能體系統(tǒng),構(gòu)造如下Lyapunov-K rasovskii泛函:
其中,0<P=PT∈Rn×n。
那么V(t)對(duì)時(shí)間t求導(dǎo)可得:
根據(jù)式(7)中,(D+A)TP+P(D+A)>0,所以(t)<0。由此可得,在滿足式(7)的充分性條件下,由式(3)確定的多智能體系統(tǒng)可達(dá)到初始狀態(tài)一致。
定理2假設(shè)一階固定時(shí)滯多智能體系統(tǒng)滿足以下條件:
其中,0<τ<d,L=D+A,P=PT>0,W=WT>0都是適維的矩陣,那么由式(5)決定的多智能體系統(tǒng)收斂到初始狀態(tài)0。
證明對(duì)于由式(5)確定的多智能體系統(tǒng),構(gòu)造如下Lyapunov泛函:
將式(5)代入可得:
由引理1可推導(dǎo)出:
V˙(t)≤[-(D+A)x(t-τ)]TPx(t)+
xT(t)P[-(D+A)x(t-τ)]+
d[-(D+A)x(t-τ)]TW[-(D+A)x(t-τ)]-
d-1[x(t)-x(t-τ)]TW[x(t)-x(t-τ)](16)
令yT(t)=[xT(t)xT(t-τ)],則上式可化簡(jiǎn)為:
這里給出計(jì)算機(jī)仿真實(shí)例來驗(yàn)證上述定理的正確性。
例1考慮如下多智能體系統(tǒng):
其中xi∈R是第i個(gè)智能體的狀態(tài),ui∈R是第i個(gè)智能體的控制規(guī)則,x(0)i是第i個(gè)智能體偏離初始狀態(tài)后的當(dāng)前狀態(tài)值,i=1,2,…,5。系統(tǒng)所對(duì)應(yīng)的拓?fù)浣Y(jié)構(gòu)如圖1所示。
設(shè)智能體之間信號(hào)傳輸沒有時(shí)滯,選取如下各智能體當(dāng)前狀態(tài)值:
x1(0)=6,x2(0)=3,x3(0)=1,x4(0)=-4,x5(0)=-5
由拓?fù)浣Y(jié)構(gòu)可以得到鄰接矩陣A為:
出度矩陣D=diag(1,1,1,1,1)。
根據(jù)是否含有時(shí)滯分兩種情況進(jìn)行討論。
首先根據(jù)定理1的公式驗(yàn)證此種拓?fù)浣Y(jié)構(gòu)的矩陣表達(dá)式是否滿足條件,利用M atlab的LM I工具箱很容易得出一個(gè)滿足條件的對(duì)稱矩陣P為:
相應(yīng)的各智能體狀態(tài)仿真結(jié)果如圖2所示。
圖1 五個(gè)智能體構(gòu)成的拓?fù)浣Y(jié)構(gòu)
圖2 τ=0時(shí)多智能體狀態(tài)曲線
通過上述仿真可以得到,使用由式(2)確定的一致性協(xié)議,在滿足定理1的情況下,某一個(gè)智能體在提前收斂到初始狀態(tài)而其他智能體尚未調(diào)整到初始狀態(tài)值時(shí)會(huì)繼續(xù)使自己處于調(diào)整狀態(tài)的過程中,最后每個(gè)智能體一起達(dá)到初始狀態(tài),解決了本文第2章提出的問題。
在仿真過上述多智能體系統(tǒng)不含時(shí)滯的基礎(chǔ)上,本文繼而討論含有時(shí)滯τ的情形,此時(shí)的d需要滿足一定的條件,不能很大,因?yàn)檠訒r(shí)量τ的取值范圍不是本文的研究范疇,所以在此為方便仿真取τ為一個(gè)比較小的量0.25,在上述拓?fù)浣Y(jié)構(gòu)和一致性協(xié)議下,引入延時(shí)量,針對(duì)上述假設(shè),進(jìn)行仿真。仿真結(jié)果如圖3所示。
圖3 τ=0.25時(shí)多智能體狀態(tài)曲線
通過上述仿真可得到,經(jīng)過一定量的時(shí)延之后,收斂速度會(huì)變慢,在滿足定理2的條件下,多智能體系統(tǒng)仿真結(jié)果與不含時(shí)滯的情形相同,一同達(dá)到了初始狀態(tài)量,驗(yàn)證了一致性協(xié)議及充分性定理的有效性。
研究了多智能體系統(tǒng)收斂到初始狀態(tài)的一致性問題,在給出一致性控制協(xié)議和定理推導(dǎo)的同時(shí),進(jìn)行了計(jì)算機(jī)仿真。解決了無人機(jī)編隊(duì)飛行中很常見的一個(gè)初始狀態(tài)一致問題,使得無人機(jī)系統(tǒng)在這一局部控制協(xié)議下,只通過獲知鄰居無人機(jī)的狀態(tài)值就可以同步達(dá)到初始狀態(tài)一致。
本文的研究成果還處于初步階段,今后還將在考慮不同通信時(shí)滯,切換拓?fù)浣Y(jié)構(gòu)的基礎(chǔ)上研究多智能體系統(tǒng)的初始狀態(tài)一致性。
[1]Vicsek T,Czirok A,Jacob E B,et al.Novel type of phase transitions in a system of self-driven particles[J].Physics Review Letters,1995,75(6):1226-1229.
[2]Jadbabaie A,Lin J,Morse A S.Coordination of group of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[3]Ren W,Beard R W.Consensus seeking in multi-agent systems under dynamically changing interaction topologies[J].IEEE Transactions on Automatic Control,2005,50(5):655-660.
[4]M oreau L.Stability of multi-agent system s with time dependent communication links[J].IEEE Transactions on Automatic Control,2005,50(2):169-182.
[5]Hong Y,Gao L,Cheng D,et al.Lyapunov-based approach to multiagent systems with swithing jointly connected interconnection[J].IEEE Trans on Autom Control,2007,52(5):943-948.
[6]Yu J Y,Wang L.Group consensus of multi-agent systems with directed information exchange[J].International Journal of Systems Science,2012,43(2):334-348.
[7]Wang Y Z,Zhang C H,Liu Z B.A matrix apprach to graph maximum stable set and coloring problems with application to multi-agent systems[J].Automatica,2012,48(7):1227-1236.
[8]Xia W G,Cao M.Clustering in diffusively coupled networks[J].Automatica,2011,47(11):2395-2405.
[9]Yu J Y,Wang L.Group consensus of multi-agent systems with undirected communication graphs[C]//Proceedings of Asian Control Conference,Beijing,2009:105-110.
[10]Olfati-Sabet R,Murray R M.Consensus problem in networks of agents with switching topology and time-delays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[11]Sun Y,Wang L,Xie G.Average consensus in networks of dynamic agents with switching topologies and multiple time-varying delays[J].System and Control Letters,2008,57(2):175-183.