董滔 李小麗 趙大端
近些年來(lái),由于多智能體協(xié)同控制在編隊(duì)控制[1]、機(jī)器人網(wǎng)絡(luò)[2]、群集行為[3]、移動(dòng)傳感器[4?5]等方面的廣泛應(yīng)用,多智能體系統(tǒng)的協(xié)同控制問(wèn)題受到了眾多研究者的廣泛關(guān)注.一致性問(wèn)題是多智能體系統(tǒng)協(xié)同控制領(lǐng)域的一個(gè)關(guān)鍵問(wèn)題,其目的是通過(guò)與鄰居之間的信息交換,使所有智能體的狀態(tài)達(dá)成一致.迄今為止,對(duì)多智能體一致性的研究也已取得了豐碩的成果,根據(jù)多智能體的動(dòng)力學(xué)模型分類,主要可以將其分為以下4種情形:一階[6?9]、二階[10?13]、三階[14?15]、高階[16?18].
在實(shí)際應(yīng)用中,由于CPU處理速度和內(nèi)存容量的限制,智能體不能頻繁地進(jìn)行控制以及與其鄰居交換信息.因此,事件觸發(fā)控制策略作為減少控制次數(shù)和通信負(fù)載的有效途徑,受到了越來(lái)越多的關(guān)注.到目前為止,對(duì)事件觸發(fā)控制機(jī)制的研究也取得了很多成果[19?23].Xiao等[19]基于事件觸發(fā)控制策略,解決了帶有領(lǐng)航者的離散多智能體系統(tǒng)的跟蹤問(wèn)題.通過(guò)利用狀態(tài)測(cè)量誤差并且基于二階離散多智能體系統(tǒng)動(dòng)力學(xué)模型,Zhu等[20]提出了一種自觸發(fā)的控制策略,該策略使得所有智能體的狀態(tài)均達(dá)到一致.Huang等[21]研究了基于事件觸發(fā)策略的Lur'e網(wǎng)絡(luò)的跟蹤問(wèn)題.針對(duì)不同的領(lǐng)航者–跟隨者系統(tǒng),Xu等[22]提出了3種不同類型的事件觸發(fā)控制器,包含分簇式控制器、集中式控制器和分布式控制器,以此來(lái)解決對(duì)應(yīng)的一致性問(wèn)題.然而,大多數(shù)現(xiàn)有的事件觸發(fā)一致性成果集中于考慮一階多智能體系統(tǒng)和二階多智能體系統(tǒng),很少有成果研究三階多智能體系統(tǒng)的事件觸發(fā)控制問(wèn)題,特別是對(duì)于三階離散多智能體系統(tǒng),成果更是少之又少.所以,設(shè)計(jì)相應(yīng)的事件觸發(fā)控制協(xié)議來(lái)解決三階離散多智能體系統(tǒng)的一致性問(wèn)題已變得尤為重要.
本文研究了基于事件觸發(fā)控制機(jī)制的三階離散多智能體系統(tǒng)的一致性問(wèn)題,文章主要有以下三點(diǎn)貢獻(xiàn):
1)利用位置、速度和加速度三者的測(cè)量誤差,設(shè)計(jì)了一種新穎的事件觸發(fā)控制機(jī)制.
2)利用不等式技巧,分析得到了保證智能體漸近收斂到一致狀態(tài)的充分條件.與現(xiàn)有的事件觸發(fā)文獻(xiàn)[19?22]不同的是,所得的一致性條件與通信拓?fù)涞腖aplacian矩陣特征值和系統(tǒng)的耦合強(qiáng)度有關(guān).
3)給出了排除類Zeno行為的參數(shù)條件,進(jìn)而使得事件觸發(fā)控制器不會(huì)每個(gè)迭代時(shí)刻都更新.
智能體間的通信拓?fù)浣Y(jié)構(gòu)用一個(gè)有向加權(quán)圖來(lái)表示,記為G={?,?,?}.其中,?={1,2,···,n}表示頂點(diǎn)集,???×?表示邊集,?=(aij)n×n稱作鄰接矩陣,aij表示邊(j,i)∈?的權(quán)值.當(dāng)(j,i)∈?時(shí),有aij>0;否則,有aij=0.aij>0表示智能體i能收到來(lái)自智能體j的信息,反之則不成立.對(duì)任意一條邊j,節(jié)點(diǎn)j稱為父節(jié)點(diǎn),節(jié)點(diǎn)i則稱為子節(jié)點(diǎn),節(jié)點(diǎn)i是節(jié)點(diǎn)j的鄰居節(jié)點(diǎn).假設(shè)通信拓?fù)渲胁淮嬖谧原h(huán),即對(duì)任意i∈?,有aii=0.
考慮多智能體系統(tǒng)由n個(gè)智能體組成,其通信拓?fù)浣Y(jié)構(gòu)由有向加權(quán)圖G表示,其中每個(gè)智能體可看作圖G中的一個(gè)節(jié)點(diǎn),每個(gè)智能體滿足如下動(dòng)力學(xué)方程:
其中,xi(k)∈R表示位置狀態(tài),vi(k)∈R表示速度狀態(tài),zi(k)∈R表示加速度狀態(tài),ui(k)∈R表示控制輸入.
基于事件觸發(fā)控制機(jī)制的控制器協(xié)議設(shè)計(jì)如下:
其中,λ>0,η>0,γ>0表示耦合強(qiáng)度,
觸發(fā)時(shí)刻序列定義為:
Ei(k)為觸發(fā)函數(shù),具有以下形式:
再結(jié)合式(1)和式(2)可得到:
定義1.對(duì)于三階離散時(shí)間多智能體系統(tǒng)(1),當(dāng)且僅當(dāng)所有智能體的位置變量、速度變量、加速度變量滿足以下條件時(shí),稱系統(tǒng)(1)能夠達(dá)到一致.
假設(shè)κ是矩陣Q1的特征值,μi是L的特征值,則有如下等式成立:
則有如下引理:
引理1[15].如果矩陣L有一個(gè)0特征值且其他所有特征值均有正實(shí)部,并且參數(shù)λ,η,γ滿足下列條件:
引理2[23].如果ρ(Q1)<1,那么存在M≥1和0<α<1使得下式成立
定理1.對(duì)于三階離散多智能體系統(tǒng)(1),基于假設(shè)1,如果式(2)中的耦合強(qiáng)度滿足引理1中的條件,觸發(fā)函數(shù)(4)中的參數(shù)滿足0<δ1<1,δ2>0,0<α<β<1,則稱系統(tǒng)(1)能夠?qū)崿F(xiàn)漸近一致.
根據(jù)引理1和引理2可知,存在M≥1和0<α<1使得下式成立.
由觸發(fā)條件可得:
對(duì)上式移項(xiàng)可求解得:
又因?yàn)閗ε(k)k≤kψ(k)k,k?(k)k≤kψ(k)k和kφ(k)k≤kψ(k)k,可得出下列不等式:
接著有如下不等式成立:
于是有
把式(14)代入式(8)可得
接下來(lái)的部分,將證明下列不等式成立.
首先,證明對(duì)任意的ρ>1,下列不等式成立.
利用反證法,先假設(shè)式(17)不成立,則必將存在k?>0使得kψ(k)k≥ρWβk?并且當(dāng)k∈(0,k?)時(shí)kψ(k)k<ρWβk成立.因此,根據(jù)式(17)可得:
根據(jù)以上結(jié)果,式(18)和式(19)都與假設(shè)相矛盾.這說(shuō)明原命題成立,即對(duì)任意的ρ>1,式(17)成立.易知,如果ρ→1,則式(16)成立.根據(jù)式(16)可知,當(dāng)k→+∞時(shí),有l(wèi)imk→∞kψ(k)k=0,則系統(tǒng)(5)是收斂的.由ψ(k)的定義可知,系統(tǒng)(1)能夠?qū)崿F(xiàn)漸近一致.
定理2.對(duì)于系統(tǒng)(1),如果定理1中的條件成立,并且控制器(2)中的設(shè)計(jì)參數(shù)滿足如下條件,
注2.類Zeno行為廣泛存在于基于事件觸發(fā)控制機(jī)制的離散系統(tǒng)中.然而,當(dāng)前極少有文獻(xiàn)研究如何排除類Zeno行為,尤其是對(duì)于三階多智能體動(dòng)態(tài)模型.定理2給出了排除三階離散多智能體系統(tǒng)的類Zeno行為的參數(shù)條件.
本部分將利用一個(gè)仿真實(shí)驗(yàn)來(lái)驗(yàn)證本文所提算法及理論的正確性和有效性.假設(shè)三階離散多智能體系統(tǒng)(1)包含6個(gè)智能體,且有向加權(quán)通信拓?fù)浣Y(jié)構(gòu)如圖1所示,權(quán)重取值為0或1,可以明顯地看出該圖包含有向生成樹(滿足假設(shè)1).
圖1 6個(gè)智能體通信拓?fù)浣Y(jié)構(gòu)圖Fig.1 The communication topology with six agents
通過(guò)簡(jiǎn)單的計(jì)算可得,μ1=0,μ2=0.6852,μ3=1.5825+0.3865i,μ4=1.5825?0.3865i,μ5=3.2138,μ6=3.9360.令M=1,結(jié)合定理1和定理2可得到0.035<δ1<1,δ2>44.0025,0<α<β<1.令δ1=0.2,δ2=200,α=0.6,β=0.9,λ=0.02,η=0.3,γ=0.5,不難驗(yàn)證滿足引理1的條件并且計(jì)算可知ρ(Q1)=0.9958<1.三階離散多智能體系統(tǒng)(1)的一致性結(jié)果如圖2~圖6所示.根據(jù)定理1可知,基于控制器(2)和事件觸發(fā)函數(shù)(4)的系統(tǒng)(1)能實(shí)現(xiàn)一致.從圖2~圖6可以看出,仿真結(jié)果與理論分析符合.
圖2 三階離散多智能體系統(tǒng)的位置軌跡圖Fig.2 The trajectories of position in third-order discrete-time multi-agent systems
圖3 三階離散多智能體系統(tǒng)的速度軌跡圖Fig.3 The trajectories of speed in third-order discrete-time multi-agent systems
圖4 三階離散多智能體系統(tǒng)的加速度軌跡圖Fig.4 The trajectories of acceleration in third-order discrete-time multi-agent systems
圖5 三階離散多智能體系統(tǒng)的控制軌跡圖Fig.5 The trajectories of control in third-order discrete-time multi-agent systems
圖6 100次迭代內(nèi)所有智能體的觸發(fā)時(shí)刻Fig.6 Triggering instants of all agents within 100 iterations
圖2~圖4分別表征了系統(tǒng)(1)中所有智能體的位置、速度和加速度的軌跡,從圖中可以看出以上3個(gè)變量確實(shí)達(dá)到了一致.圖5展示了控制輸入的軌跡.為了更清楚地體現(xiàn)事件觸發(fā)機(jī)制的優(yōu)點(diǎn),圖6給出了0~100次迭代內(nèi)的各智能體的觸發(fā)時(shí)刻軌跡.從圖6可以看出,本文設(shè)計(jì)的事件觸發(fā)協(xié)議確實(shí)達(dá)到了減少更新次數(shù),節(jié)省資源的目的.
針對(duì)三階離散多智能體系統(tǒng)的一致性問(wèn)題,構(gòu)造了一個(gè)新穎的事件觸發(fā)一致性協(xié)議,分析得到了在通信拓?fù)錇橛邢蚣訖?quán)圖且包含生成樹的條件下,系統(tǒng)中所有智能體的位置狀態(tài)、速度狀態(tài)和加速度狀態(tài)漸近收斂到一致狀態(tài)的充分條件.同時(shí),該條件指出了通信拓?fù)涞腖aplacian矩陣特征值和系統(tǒng)的耦合強(qiáng)度對(duì)系統(tǒng)一致性的影響.另外,給出了排除類Zeno行為的參數(shù)條件.仿真實(shí)驗(yàn)結(jié)果也驗(yàn)證了上述結(jié)論的正確性.將文中獲得的結(jié)論擴(kuò)展到拓?fù)浣Y(jié)構(gòu)隨時(shí)間變化的更高階多智能體網(wǎng)絡(luò)是極有意義的.這將是未來(lái)研究的一個(gè)具有挑戰(zhàn)性的課題.