李 勃,陳增強(qiáng)*,,劉忠信,張 青
(1.南開(kāi)大學(xué)計(jì)算機(jī)與控制工程學(xué)院,天津 300071;2.中國(guó)民航大學(xué)理學(xué)院,天津 300300)
?
含時(shí)延的多智能體系統(tǒng)的多靜態(tài)領(lǐng)導(dǎo)者包容控制
李勃1,陳增強(qiáng)*1,2,劉忠信1,張青2
(1.南開(kāi)大學(xué)計(jì)算機(jī)與控制工程學(xué)院,天津 300071;2.中國(guó)民航大學(xué)理學(xué)院,天津 300300)
摘要:對(duì)基于有向固定拓?fù)涞亩囔o態(tài)領(lǐng)導(dǎo)者的多智能體系統(tǒng)的包容控制問(wèn)題進(jìn)行研究。在系統(tǒng)中智能體之間信息傳遞存在固定通信時(shí)延的情況下,應(yīng)用拉普拉斯變換技術(shù)分別研究一階和二階連續(xù)時(shí)間多智能體系統(tǒng),通過(guò)對(duì)系統(tǒng)傳遞函數(shù)的穩(wěn)定性分析而求取系統(tǒng)狀態(tài)穩(wěn)定條件,并應(yīng)用終值定理,最終得到了保證系統(tǒng)實(shí)現(xiàn)包容控制的時(shí)延限制條件,最后用仿真驗(yàn)證了該結(jié)論的有效性。
關(guān)鍵詞:多智能體系統(tǒng);包容控制;多靜態(tài)領(lǐng)導(dǎo)者;通信時(shí)延;終值定理
0引言
近幾年來(lái),對(duì)多智能體系統(tǒng)控制的研究逐漸成為熱點(diǎn)。多智能體系統(tǒng)是人類在對(duì)自然界中的動(dòng)物和鳥類集體運(yùn)動(dòng)的研究基礎(chǔ)上發(fā)展起來(lái)的,其在無(wú)人機(jī)的編隊(duì)控制、多機(jī)器人協(xié)同工作、通訊網(wǎng)絡(luò)的擁塞控制等領(lǐng)域有著非常廣泛的應(yīng)用,推動(dòng)著多智能體系統(tǒng)建模與分析的研究不斷向前發(fā)展。多智能體系統(tǒng)的控制目標(biāo)主要包括智能體編隊(duì)、群集、聚集等,其中狀態(tài)一致性是研究的核心問(wèn)題之一。多智能體系統(tǒng)的研究始于Reynolds等[1]提出的模仿動(dòng)物集結(jié)的計(jì)算機(jī)模型,在此基礎(chǔ)上Vicsek等[2]從統(tǒng)計(jì)力學(xué)的角度提出一個(gè)非平衡多智能體系統(tǒng)模型,Jadbabaie等[3]對(duì)Vicsek模型線性化,從理論上研究了該模型的角度一致性問(wèn)題。Moreau[4]和Ren等[5]將文獻(xiàn)[3]的結(jié)果推廣到有向網(wǎng)絡(luò),得到了類似的收斂性結(jié)果。
自然中的群體運(yùn)動(dòng)通常都有一個(gè)或多個(gè)“領(lǐng)袖”,受其啟示,研究人員設(shè)計(jì)領(lǐng)航-跟隨控制方案來(lái)實(shí)現(xiàn)多智能體網(wǎng)絡(luò)的協(xié)調(diào)控制,根據(jù)領(lǐng)航者是否實(shí)際存在,可分為虛擬領(lǐng)航和實(shí)際領(lǐng)航,根據(jù)領(lǐng)航者的個(gè)數(shù),可分為單領(lǐng)航和多領(lǐng)航情況。其中包容控制是多領(lǐng)航的一種典型情況,其本質(zhì)是指一組跟隨者在多個(gè)領(lǐng)導(dǎo)者的引領(lǐng)下,從而到達(dá)并保持在由領(lǐng)導(dǎo)者所圍成的最小幾何空間(凸包)中運(yùn)動(dòng)。在實(shí)際應(yīng)用中,包容控制具有大量的潛在應(yīng)用。包容控制問(wèn)題由M. J等[6]提出后,REN等[7]做了大量的研究工作,不但給出了一階、二階系統(tǒng)的包容控制的數(shù)學(xué)描述,還分別研究了固定拓?fù)浜蛣?dòng)態(tài)拓?fù)涞陌菘刂疲蔷€性系統(tǒng)的包容控制問(wèn)題,有限時(shí)間的包容控制問(wèn)題的研究也取得了若干成果。另外對(duì)Lagrangian系統(tǒng)的包容控制研究和輸出包容控制[8]的研究也開(kāi)始起步。由于系統(tǒng)中智能體接收信息必然存在時(shí)間延遲(無(wú)通訊延遲的系統(tǒng)是理想化的系統(tǒng)模型),因此對(duì)時(shí)間延遲系統(tǒng)的研究具有很重要的實(shí)際意義,Reza Olfati-Saber等[9]研究了一階連續(xù)時(shí)延系統(tǒng),給出了保證系統(tǒng)收斂的時(shí)間延遲的界,Yu等[10]研究了二階系統(tǒng)中的時(shí)間延遲問(wèn)題,Yang等[11]研究了離散時(shí)間系統(tǒng)的時(shí)間延遲問(wèn)題,也有研究分別考慮輸入時(shí)延和通訊時(shí)延的系統(tǒng)和更為復(fù)雜的時(shí)變時(shí)延情況,Xia等[12-14]研究時(shí)間延遲問(wèn)題在疾病傳播中影響感染閾值從而促使疾病爆發(fā)等實(shí)際應(yīng)用領(lǐng)域的工作。大量的研究工作對(duì)固定時(shí)延和可變時(shí)延的情況都進(jìn)行了穩(wěn)定性分析研究。
時(shí)延的不可避免性和包容控制問(wèn)題的重要應(yīng)用激發(fā)了對(duì)具有時(shí)間延遲的多智能體系統(tǒng)的包容控制問(wèn)題的研究,目前對(duì)時(shí)延多智能體系統(tǒng)的包容控制的研究較少,Liu等[15]研究二階連續(xù)系統(tǒng)中存在時(shí)變時(shí)延的情況,用LMI形式給出了系統(tǒng)實(shí)現(xiàn)包容控制時(shí)延需要滿足的條件,形式比較復(fù)雜,且為充分條件。本文研究時(shí)延系統(tǒng)的包容控制問(wèn)題,研究的對(duì)象是基于有向固定拓?fù)涞亩囔o態(tài)領(lǐng)導(dǎo)者的多智能體系統(tǒng),假設(shè)系統(tǒng)中智能體之間信息傳遞存在通信時(shí)延且時(shí)延固定的情況下,應(yīng)用拉普拉斯變換技術(shù)分別研究一階和二階連續(xù)時(shí)間多智能體系統(tǒng),通過(guò)求取跟隨者狀態(tài)收斂的限制條件,然后應(yīng)用終值定理得到跟隨者狀態(tài)的極限值。從而得到了保證系統(tǒng)實(shí)現(xiàn)包容控制的時(shí)延的限制條件,本文給出的兩個(gè)條件均為充分必要條件,形式也相對(duì)比較簡(jiǎn)單。
1預(yù)備知識(shí)
假設(shè)1[16]在一個(gè)多智能體系統(tǒng)中,對(duì)每個(gè)跟隨者,都至少有一個(gè)領(lǐng)導(dǎo)者,有一條有向路徑指向它。
定義2[18]Laplacian矩陣L=[lij]∈Rn×n定義為
假設(shè)一個(gè)多智能體系統(tǒng)中有m(m 其中L1∈R(n-m)×(n-m),L2∈R(n-m)×m關(guān)于L1和L2,有引理1和2。 引理2[20](終值定理)若函數(shù)f(t)及其一階導(dǎo)數(shù)都是可拉氏變換的,則函數(shù)f(t)的終值為 根據(jù)文獻(xiàn)[16]中的分析,可以發(fā)現(xiàn),滿足假設(shè)1的系統(tǒng)和具有生成樹(shù)的對(duì)應(yīng)系統(tǒng)(將系統(tǒng)中所有的領(lǐng)導(dǎo)者合并為一個(gè)節(jié)點(diǎn))相比較,前者的Laplacian矩陣中的子矩陣L1和后者的Laplacian矩陣相比,前者的特征值比后者只是少一個(gè)0,其它特征值相同。 2主要結(jié)果 2.1一階連續(xù)系統(tǒng)的包容控制 多靜態(tài)領(lǐng)導(dǎo)者的一階連續(xù)多智能體系統(tǒng)的狀態(tài)方程為 (2)其中,aij為系統(tǒng)對(duì)應(yīng)的鄰接矩陣的元素。矩陣L是該網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)對(duì)應(yīng)的Laplacian矩陣,令XL(t)=[x1(t)Tx2(t)T…xm(t)T]T,XF(t)=[xm+1(t)Txm+2(t)T…xn(t)T]T(假設(shè)系統(tǒng)共有n個(gè)智能體,編號(hào)1到m為領(lǐng)導(dǎo)者,m+1到n為跟隨者)。τ為信息從一個(gè)節(jié)點(diǎn)傳送到另一個(gè)節(jié)點(diǎn)所需要的時(shí)間。如同時(shí)考慮狀態(tài)x為p維矢量,則跟隨者的狀態(tài)方程可寫為 (3) 定理1對(duì)一個(gè)具有相同通訊時(shí)延τ>0的多智能體系統(tǒng)(1),假設(shè)通訊拓?fù)錆M足假設(shè)1,且跟隨者之間的通訊是雙向的。若該系統(tǒng)使用控制協(xié)議(2),那么該系統(tǒng)要取得全局漸近包容控制,當(dāng)且僅當(dāng)滿足條件(4): (4) 證明:對(duì)式(3)做Laplace變換(這里用XF(s)表示XF(t)的Laplace變換),并整理: (5) (6) 要使式(3)系統(tǒng)中跟隨者狀態(tài)收斂,需保證系統(tǒng)的特征方程Zτ(s)=det(sIn-m+e-τsL1)的根具有負(fù)實(shí)部,根據(jù)文獻(xiàn)[9]的研究結(jié)果,滿足式(4)是系統(tǒng)收斂的充要條件。跟隨者狀態(tài)收斂也就是說(shuō)是跟隨者的狀態(tài)是有極限的,可以對(duì)其應(yīng)用終值定理,則有: (7) 2.2二階連續(xù)系統(tǒng)包容控制 對(duì)多靜態(tài)領(lǐng)導(dǎo)者的二階連續(xù)系統(tǒng),狀態(tài)方程如式(8) (8) 這里xi和vi分別是第i個(gè)智能體的位置和速度。另為簡(jiǎn)便起見(jiàn),這里假定系統(tǒng)的位置和速度為標(biāo)量(矢量的情況類似)。假設(shè)通訊時(shí)延是固定的,本文使用控制協(xié)議(9): (9) 其中,式(9)中的參數(shù)α>0,β>0要滿足的條件可以參考文獻(xiàn)[10]。 令X(t)=[x1(t)x2(t)…xn(t)]T,V(t)=[v1(t)v2(t)…vn(t)]T。 將式(9)代入式(8)也可以寫成如式(10)的簡(jiǎn)潔形式。 (10) 對(duì)領(lǐng)導(dǎo)者和跟隨者系統(tǒng),跟隨者的狀態(tài)方程為(XF,XL定義同2.1部分,VF,VL與之類似): (11) 則跟隨者狀態(tài)方程可簡(jiǎn)化寫為 (12) 對(duì)系統(tǒng)(12)的特征方程det(λI2(n-m)-Α-e-λτB1)=0帶入矩陣A和B1并整理得: 引理3[10]假設(shè)系統(tǒng)的通訊拓?fù)渚W(wǎng)絡(luò)具有有向生成樹(shù),則g(λ)=0有一個(gè)純虛根,當(dāng)且僅當(dāng) 其中,0≤θi1<2π且滿足: 其中,lm()表示虛部,Re()表示實(shí)部,ui為矩陣L1的特征值,wi1定義為 當(dāng)(τ1,τ2,…,τm)變化時(shí),當(dāng)且僅當(dāng)一個(gè)零點(diǎn)出現(xiàn)在或穿過(guò)虛軸,多項(xiàng)式P的在開(kāi)放的右半平面的零點(diǎn)的階和才能改變。 引理5[10]假設(shè)系統(tǒng)的通訊拓?fù)渚W(wǎng)絡(luò)具有有向生成樹(shù),λ是方程gi(λ)=0的解,則dλ/dτ在點(diǎn)τ∈Ψ處存在并且滿足: 定理2對(duì)一個(gè)具有相同通訊時(shí)延τ>0的多智能體二階系統(tǒng)(8),假設(shè)通訊拓?fù)涫枪潭ǖ亩覞M足假設(shè)1。若該系統(tǒng)使用控制協(xié)議(9),那么該系統(tǒng)要取得全局漸近包容控制,當(dāng)且僅當(dāng)滿足如式(13)的條件: (13) 證明:對(duì)式(12)做Laplace變換(這里用YF(s)表示YF(t)的Laplace變換),并整理: (14) (15) 當(dāng)系統(tǒng)的網(wǎng)絡(luò)拓?fù)涫枪潭ǖ那覞M足假設(shè)1,可選擇參數(shù)α,β,使τ=0時(shí),系統(tǒng)(12)的特征方程的根均具有負(fù)實(shí)部(因L1無(wú)0特征值,因此特征方程無(wú)0根)。根據(jù)引理3,當(dāng)τ從0變化到τ0時(shí),一個(gè)純虛根出現(xiàn)。根據(jù)引理4和引理5可知,當(dāng)0≤τ<τ0時(shí),特征根全部具有負(fù)實(shí)部;而當(dāng)τ≥τ0時(shí),至少有一個(gè)特征根有正實(shí)部,二階系統(tǒng)不收斂。從而證明條件(13)是系統(tǒng)(12)收斂的充分必要條件。 即時(shí)間延遲τ滿足式(13),則系統(tǒng)(12)收斂,跟隨者狀態(tài)有極限值,可對(duì)其應(yīng)用終值定理: (16) 將式(16)展開(kāi)可得: (17) 此處為靜態(tài)領(lǐng)導(dǎo)者,VL(t)=0。 3仿真實(shí)例 本文采用的網(wǎng)絡(luò)拓?fù)淙鐖D1所示,假設(shè)個(gè)體之間連接權(quán)值為1,互連個(gè)體之間通信時(shí)延為τ。 3.1一階系統(tǒng)實(shí)例 對(duì)一個(gè)由式(1)描述的一階連續(xù)系統(tǒng),其網(wǎng)絡(luò)拓?fù)淙鐖D1a所示,在控制協(xié)議(2)的作用下,使用式(4)計(jì)算可得,τ*=0.392 7。時(shí)間延遲τ分別取0.35和0.40的跟隨者和領(lǐng)導(dǎo)者的時(shí)間軌跡仿真圖分別如圖2a和圖2b。可以看出當(dāng)τ<τ*時(shí),跟隨者的狀態(tài)漸近收斂到領(lǐng)導(dǎo)者所組成的凸包中,而當(dāng)τ≥τ*時(shí),跟隨者的狀態(tài)發(fā)散,與定理1的結(jié)論相符。 3.2二階系統(tǒng)實(shí)例 對(duì)一個(gè)由式(8)描述的二階連續(xù)系統(tǒng),其網(wǎng)絡(luò)拓?fù)淙鐖D1b所示,在控制協(xié)議(9)的作用下(取α=10,β=8),使用式(13)計(jì)算可得τ0=0.057 9。時(shí)間延遲τ取0.055的跟隨者和領(lǐng)導(dǎo)者的位置和速度時(shí)間軌跡仿真圖分別如圖3a和圖3b??梢钥闯霎?dāng)τ<τ0時(shí),跟隨者的位置狀態(tài)漸近收斂到領(lǐng)導(dǎo)者所組成的凸包中,跟隨者的速度狀態(tài)收斂到0,與定理2的結(jié)論相符。 4結(jié)論 本文研究了具有固定通訊時(shí)延的多智能體系統(tǒng)的包容控制問(wèn)題,假設(shè)網(wǎng)絡(luò)拓?fù)涫枪潭ㄓ邢虻?,系統(tǒng)是領(lǐng)導(dǎo)者-跟隨者結(jié)構(gòu)的,多個(gè)領(lǐng)導(dǎo)者是靜態(tài)的。給出了一階、二階連續(xù)時(shí)間系統(tǒng)實(shí)現(xiàn)包容控制的時(shí)間延遲的限制條件并仿真驗(yàn)證了其有效性。下一階段的任務(wù)是研究離散系統(tǒng)和多動(dòng)態(tài)領(lǐng)導(dǎo)者情況下的時(shí)間延遲系統(tǒng)的包容控制問(wèn)題和考慮輸入時(shí)延等情況的包容控制問(wèn)題。 參考文獻(xiàn): [1]Reynolds C W.Flocks,herds and schools a distributed behavioral model[J].Computer Graphics,1987,21(4):25-34. [2]Vicsek T, Czirok A, Ben Jacob E, et al. Novel type ofphase transition in a system of self-driven particles[J].Physical Review Letters,1995,75(6):1226-1229. [3]Jadbabaie A, Lin J, Morse A S. Coordination of groupsof mobile agents using nearest neighbor rules[J]. IEEETranson Automatic Control,2003,48(6):988-1001. [4]Moreau L.Stability of multi-agent systems with timedependent communication links[J].IEEE Trans onAutomatic Control,2005,50(2):169-182. [5]Ren W, Beard R W.Consensus seeking in multi-agentsystems under dynamically changing interactiontopologies[J].IEEE Trans on Automatic Control,2005,50(5):655-661. [6]JiM,Ferrari-Trecate G, Egerstedt M, et al. Containment control in mobile networks[J]. IEEE Transactions onAutomatic Control,2008,53(8):1972-1975. [7]于鏑,白麗娟,李鋮.非線性多智能體網(wǎng)絡(luò)的分布式包容控制[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2013,10(2):63-68. Yu Di, Bai LiJuan, Li Cheng. Distributed containment control of nonlinear multi-agent networks[J]. Complex Systems and Complexity Science,2013,10(2):63-68. [8]Dong X W,Meng F L,Shi Z Y,et al. Output containment control for swarm systems with general lineardynamics: a dynamic output feedback approach[J].Systems & Control Letters,2014(71):31-37. [9] Olfati-Saber R, Murray R M. Consensus problems in networks of agents with switching topology and time-delays[J]. IEEE Transaction on Automatic Control,2004,49(9):1520-1533. [10] Yu W W,Chen G R,Cao M. Some necessary and sufficient conditions for second-order consensus inmulti-agent dynamical systems[J]. Automatica,2010,46(6):1089-1095. [11] 楊洪勇,張嗣瀛. 離散時(shí)間系統(tǒng)的多智能體的一致性[J].控制與決策,2009,24(3):413-416. Yang Hongyong, Zhang SiYing.Consensus of multi-agent system with discrete-time[J].Control and Decision, 2009,24(3):413-416. [12] Xia C Y, Wang Z, Sanz J, et al.Effects of delayed recovery and nonuniform transmission on the spreading of diseases in complex networks[J].Physica A, 2013(392): 1577-1585. [13] Wang L, Sun S W, Xia C Y. Finite-time stability of multi-agent system in disturbed environment[J]. Nonlinear Dynamics,2012,(67):2009-2016. [14] Xia C Y, Wang L, Sun S W,et al.An SIR model with infection delay and propagation vector in complex networks[J].Nonlinear Dynamics,2012(69): 927-934. [15] Liu K E, Xie G M, Wang L.Containment control for second-order multi-agent systems withtime-varying delays[J].Systems & Control Letters,2014(67):24-31. [16] Cao Y C,Ren W,Egerstedt M.Distributed containment control with multiple stationary or dynamic leaders infixed and switching directed networks[J]. Automatica, 2012, 48(8): 1586-1597. [17] Rockafellar R T. Convex Analysis[M]. New Jersey:Princeton University Press,1972. [18] Ren W, Cao Y C.Distributed Coordination of Multi-agent Networks[M].London:Springer, 2011. [19] Liu H, Xie G M, Wang L. Necessary and sufficient conditions for containmentcontrol of networked multi-agent systems[J]. Automatica,2012,48(7):1415-1422. [20] 胡壽松.自動(dòng)控制原理[M].5版.北京:科學(xué)出版社,2006:636-637. (責(zé)任編輯耿金花) Containment Control for Multi-Agent System with Multiple Stationary Leaders and Time-Delays LI Bo,CHEN Zengqiang1,2, LIU Zhongxin1, ZHANG Qing2 (1. College of Computer & Control Engineering, Nankai University, Tianjin 300071, China;2.College of Science, Civil Aviation University of China, Tianjin 300300, China ) Abstract:This paper is concerned with distributed containment control of multi-agent system with multiple stationary leaders under fixed directed network topologies. Under the assumption that communication time-delays in all channels are equal, the Laplace transform is used to study the first-order and second-order multi-agent delayed system with continuous-time. Some sufficient conditions are obtained to ensure the containment of the multi-agent system by stability analysis for transfer function to get conditions and applying final value theorem. Finally,computer simulations show the effectiveness of the conclusion. Key words:multi-agent systems; containment control; multiple stationary leaders; communication time-delays; final value theorem 文章編號(hào):1672—3813(2016)02—0105—06; DOI:10.13306/j.1672-3813.2016.02.013 收稿日期:2014-11-20;修回日期:2015-01-12 項(xiàng)目基金:國(guó)家自然科學(xué)基金(61174094);天津自然科學(xué)基金(14JCYBJC18700,13JCYBJC17400) 作者簡(jiǎn)介:李勃(1972-),男,山東龍口人,博士研究生,主要研究方向?yàn)槎嘀悄荏w系統(tǒng)的包容控制。 中圖分類號(hào):TP273 文獻(xiàn)標(biāo)識(shí)碼:A
復(fù)雜系統(tǒng)與復(fù)雜性科學(xué)2016年2期