金琬麗, 于志永, 蔣海軍
(新疆大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院, 新疆 烏魯木齊 830017)
自1970年以來,作為協(xié)同控制的一個重要研究方向,多智能體一致性問題受到國內(nèi)外研究者的密切關(guān)注.一致性是指由多個智能體通過相互作用最終行為上達(dá)到一致,通俗來講就是指幾個物體的狀態(tài)通過外界控制或者自身內(nèi)部的調(diào)整最終達(dá)到相同.在實際應(yīng)用中,這個狀態(tài)可以是速度、位置等.多智能體一致性控制問題具有豐富的實際背景和重要的實際應(yīng)用價值,比如機(jī)器人協(xié)同控制[1],飛機(jī)編隊飛行[2],智能電網(wǎng)等.多智能體系統(tǒng)一致性問題的發(fā)展最早追溯到1962年,Degroot[3]將一致性思想應(yīng)用到多傳感器的研究中.直到2004年,Olfati-Saber[4]提出了一致性的準(zhǔn)確定義并建立了一致性研究的基本框架.
然而,早期主要集中研究連續(xù)控制下的多智能體一致性[5-6].由于帶有微型處理器的智能體處理信息能力有限,連續(xù)控制不能應(yīng)用于復(fù)雜的控制環(huán)境.考慮到脈沖控制只需在固定的時間點輸入信息,這樣就可以節(jié)約資源并有效彌補(bǔ)連續(xù)控制的不足,故采用脈沖控制下研究智能體系統(tǒng)的一致性更加符合實際需求.因此,脈沖控制策略被廣泛應(yīng)用于多智能體系統(tǒng)的協(xié)同控制問題[7-11].針對無領(lǐng)導(dǎo)者和有領(lǐng)導(dǎo)者的兩種情況,Can等[7]提出了部分狀態(tài)約束脈沖和完全狀態(tài)約束脈沖這兩種不同的脈沖協(xié)議.再基于代數(shù)圖論的李雅普諾夫穩(wěn)定性理論,矩陣?yán)碚摰玫揭恍┏浞謼l件用于處理非線性多智能體系統(tǒng)的一致性.考慮到網(wǎng)絡(luò)通訊拓?fù)洳⒉皇且恢辈蛔兊?Yang等[8]基于代數(shù)圖論和脈沖穩(wěn)定性理論,利用脈沖控制研究了固定拓?fù)浜颓袚Q拓?fù)湎露A多智能體系統(tǒng)一致性問題.對比文獻(xiàn)[7,8]的脈沖是控制全部智能體,Guo等[9]提出了自適應(yīng)脈沖牽制控制方法來控制部分智能體,再根據(jù)網(wǎng)絡(luò)拓?fù)涫欠駨?qiáng)連通,給出了兩種控制協(xié)議解決了具有不確定擾動的多智能體系統(tǒng)的一致性問題.考慮到之前的收斂都是漸近收斂的,Xu等[10]提出了一種固定時間脈沖控制策略.利用Lyapunov函數(shù),比較原理和平均脈沖間隔,證明系統(tǒng)最終在固定時間內(nèi)達(dá)到一致性.此外,針對離散多智能體系統(tǒng),Li等[11]通過考慮低增益反饋控制,提出了新的分布式脈沖控制策略,利用李亞普諾夫函數(shù)和低增益理論獲得了一些條件,最終實現(xiàn)了系統(tǒng)的半全局一致性.上述這些控制協(xié)議主要利用脈沖控制方法研究多智能體系統(tǒng)一致性,但這一方法存在一個弊端就是需要提前設(shè)定好時間,為了操作簡單,通常選取脈沖控制的時間都是周期的.
在實際應(yīng)用中,周期采樣控制會導(dǎo)致不必要的浪費(fèi).在網(wǎng)絡(luò)通信中,如果能夠減少智能體之間的通訊交流,就可以有效地解決網(wǎng)絡(luò)帶寬的擁擠問題.因此,事件觸發(fā)采樣控制策略應(yīng)運(yùn)而生.事件觸發(fā)控制的原理是當(dāng)智能體間狀態(tài)誤差超過了預(yù)先規(guī)定的閾值,執(zhí)行器才會更新狀態(tài)輸入,否則保持不變,更新狀態(tài)的時刻是預(yù)先未知的.目前,基于事件觸發(fā)采樣控制的多智能體一致性研究取得了很多成果,比如事件觸發(fā)采樣控制[12-15],量化事件觸發(fā)采樣控制[16-19].在文獻(xiàn)[12-14]中,針對一階,二階和高階多智能體系統(tǒng),在事件觸發(fā)采樣控制協(xié)議下推導(dǎo)出合適的充分必要條件,排除Zeno行為的同時也實現(xiàn)了一致性.Han等[15]在事件觸發(fā)采樣控制下,研究了具有時變控制增益的非線性多智能體同步問題.為了實現(xiàn)同步,提出了更具靈活性的狀態(tài)相關(guān)和時間相關(guān)的事件觸發(fā)協(xié)議,利用含時參數(shù)的時滯微分不等式和李雅普諾夫函數(shù)最終證明了所提協(xié)議的有效性.當(dāng)出現(xiàn)網(wǎng)絡(luò)帶寬和數(shù)據(jù)丟失情況時,為了減少網(wǎng)絡(luò)通訊負(fù)擔(dān)和克服網(wǎng)絡(luò)約束,文獻(xiàn)[16-20]將量化和事件觸發(fā)控制結(jié)合起來解決這一類問題.Wu等[16]討論了帶有均一量化器的牽制事件觸發(fā)控制策略,利用非光滑分析和Gronwall不等式方法保證閉環(huán)系統(tǒng)解的存在性,通過量化事件觸發(fā)可以達(dá)到多智能體系統(tǒng)實際的一致性,并收斂到一個一致性集.為了處理不匹配的外部干擾的存在,Yuan等[17]提出了一種新的多面不連續(xù)滑模面,通過考慮構(gòu)造滑模控制律,結(jié)合事件觸發(fā)機(jī)制和動態(tài)量化機(jī)制.在此方案下,證明了所有的狀態(tài)軌跡最終達(dá)到一致,而Wu等[18]則利用帶有均一量化的高增益控制協(xié)議結(jié)合事件觸發(fā)控制方法獲得了多智能體系統(tǒng)的有界一致性,Ma等[19]則將量化改進(jìn)為動態(tài)量化和事件觸發(fā)結(jié)合.這一方法有效解決了在智能體個數(shù)數(shù)量很多時,量化器的量化數(shù)量不會很大的問題,同時保證了多智能體系統(tǒng)達(dá)到了理想的一致性.Lian等[20]結(jié)合事件觸發(fā)采樣控制和量化滑模面設(shè)計方法,提出了兩種不同類型的滑??刂撇呗?基于滑??刂圃?消除了干擾并且證明了不確定切換系統(tǒng)的一致性.
針對傳統(tǒng)的一階多智能體系統(tǒng),Tan等[21]研究了事件觸發(fā)脈沖控制下多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性,并排除了Zeno行為.然而一階系統(tǒng)只能智能體描述系統(tǒng)的一部分信息,在現(xiàn)實生活中,很多智能體都應(yīng)用二階動力學(xué)模型來描述智能體的位置和速度信息,比如扭矩電機(jī)和氣體射流,需要通過加速度來調(diào)整所需的運(yùn)動.因此考慮二階多智能體系統(tǒng)的一致性更具有挑戰(zhàn)性和實際意義.許多學(xué)者也開始研究二階系統(tǒng),比如Zhang等[22]將二階連續(xù)系統(tǒng)的編隊問題轉(zhuǎn)化成了多智能體一致性問題.在沒有生成樹和具有生成樹的時變網(wǎng)絡(luò)拓?fù)湎?Gao等[23]采用了兩種采樣控制方法去設(shè)計控制增益和采樣時刻使得系統(tǒng)達(dá)到一致.Duan等[24]設(shè)計了一種新的帶速度測量和不帶速度測量的分布式事件觸發(fā)控制協(xié)議來確保二階系統(tǒng)的追蹤一致性行為,這一方法的缺點是需要持續(xù)控制.考慮到脈沖控制只需要脈沖瞬間工作的優(yōu)點,本文結(jié)合脈沖采用事件觸發(fā)脈沖控制方法研究二階多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性問題.
基于此,本文運(yùn)用Lyapunov穩(wěn)定性理論和不等式放縮技巧,研究了在事件觸發(fā)脈沖控制下具有領(lǐng)導(dǎo)者的二階多智能體的一致性問題.與連續(xù)控制協(xié)議相比,本文提出的事件觸發(fā)機(jī)脈沖制協(xié)議可以減少智能體之間的通訊,從而節(jié)省有限的資源.
本文中的記號:Rn代表n維列向量,R+表示正實數(shù)集,IN是指N維的單位矩陣.對于任意一個矩陣A,AT,λmin(A),λmax(A)分別代表了矩陣A的轉(zhuǎn)置矩陣,最小和最大特征值.對于任意一個對稱矩陣B,矩陣B>0(B<0)表示矩陣B是個正定(負(fù)定)矩陣.二范數(shù)用‖·‖定義.
定義1如果無向圖G的任意兩個節(jié)點之間都有路徑則稱G是無向連通的.
引理1[23]如果L是無向連通圖G的Laplacian矩陣,則L是具有N個實特征值的對稱矩陣,且滿足0=λ1<λ2<…<λN.此外,特征值0的特征向量為1N,即L1N=0.
假設(shè)1 跟隨者之間的通訊拓?fù)鋱DG是固定無向的.
考慮具有領(lǐng)導(dǎo)者的二階多智能體系統(tǒng),其中領(lǐng)導(dǎo)者的動力學(xué)行為描述為
(1)
式中:x0(t)∈Rn,x0(t)∈Rn分別代表領(lǐng)導(dǎo)者在t時刻的位置、速度;A是具有合適維數(shù)的矩陣.
第i個跟隨者的動力學(xué)描述為
(2)
式中:xi(t)∈Rn,vi(t)∈Rn,ui(t)∈Rn分別代表第i個智能體的位置、速度和控制輸入.
定義2對于二階多智能體系統(tǒng)(1,2)的任意初值,如果有
則稱多智能體系統(tǒng)(1,2)達(dá)到領(lǐng)導(dǎo)跟隨一致性.
設(shè)計如下事件觸發(fā)脈沖控制協(xié)議
bi(x0(t)-xi(t))+
bi(v0(t)-vi(t))i=1,2,…,N
(3)
(4)
由Dirichlet函數(shù)性質(zhì),多智能體系統(tǒng)(1,2)在控制協(xié)議(4)下可以改寫為
(5)
(6)
式中:fi(t)是需要設(shè)計的觸發(fā)函數(shù).由協(xié)議(4)可知,控制器只有在事件觸發(fā)時刻對智能體進(jìn)行脈沖控制,其余時間對系統(tǒng)不發(fā)生控制.因此,可以減少系統(tǒng)采樣信息的頻率.
事件觸發(fā)函數(shù)被定義為
(7)
(8)
注1不同于一般的事件觸發(fā)采樣控制策略,本文提出的協(xié)議中,控制輸入沒有持續(xù)給出.只有系統(tǒng)狀態(tài)符合觸發(fā)條件時,控制器才會工作,其余時間控制器就會進(jìn)入“休眠”狀態(tài),不進(jìn)行脈沖控制.這有效減少了信息交換次數(shù),可以避免網(wǎng)絡(luò)擁堵的風(fēng)險.
在分析中,將所有智能體的觸發(fā)時刻依次從小到大排序?qū)懗墒录|發(fā)矩陣σ(k),由于智能體的觸發(fā)條件不同,每個智能體的觸發(fā)時刻可能不同.在任意觸發(fā)時刻,最少有一個,最多有N個事件被觸發(fā).當(dāng)σi(k)=1時,代表第i個智能體在tk時刻被控制,否則,σi(k)=0.矩陣σ(k)代表不同智能體在不同時刻的控制分情況.由式(5)和式(8)可得
(9)
將式(9)改寫為向量形式
(10)
e(t)=(e1(t)T,e2(t)T,…,eN(t)T)T
矩陣σ(k)定義為
注2由于每個智能體的觸發(fā)時刻依賴其觸發(fā)條件,因此,不同智能體之間的觸發(fā)時刻可能不同.在本文分析中,由于每個智能體的事件觸發(fā)時刻不同,有可能導(dǎo)致觸發(fā)時刻重疊.將所有觸發(fā)時刻按照時間順序排序后引入了矩陣σ(k).如果第一個智能體和第三個智能體在tk時刻被觸發(fā),σ(k)=[1N,0N,1N,…,0N].如果有i(1≤i≤N)個智能體在tk時刻被觸發(fā),則σ(k)=[1N,0N,…,1N,…,0N](1N的數(shù)量為i個).隨著觸發(fā)時刻的變化,1N和0N的位置在不斷變化.利用這種方法,可以簡化向量運(yùn)算.
為了使二階多智能體系統(tǒng)(1,2)在事件觸發(fā)脈沖控制協(xié)議(4)下實現(xiàn)領(lǐng)導(dǎo)跟隨一致性問題,本文給出了如下定理.
定理1若假設(shè)1和假設(shè)2成立,在事件觸發(fā)控制協(xié)議(4)下,如果存在實數(shù)域上的連續(xù)函數(shù)φ(t,t0),正常數(shù)α,β1,μ以及正定矩陣P1∈Rn×n使得下列條件成立
(11)
則二階多智能體系統(tǒng)(1,2)可以達(dá)到領(lǐng)導(dǎo)跟隨一致性,其中P、M、R、Q分別定義為
Vk(ζ)=V(ζ,k)=ζ(t)TPζ(t),k∈N+
(12)
通過計算
結(jié)合式(10)和式(12),對Vk(ζ)求導(dǎo)可得
(13)
其中
由式(13)可知:
對上式積分可得
根據(jù)Gronwall不等式,當(dāng)t∈(tk,tk+1]時,解得
(14)
所以,在事件觸發(fā)脈沖控制(4)下,二階多智能體系統(tǒng)(1,2)可以達(dá)到領(lǐng)導(dǎo)跟隨一致.
要排除Zeno行為,必須保證在有限時間內(nèi)不會發(fā)生無限次觸發(fā).即要保證任意兩次觸發(fā)時間間隔大于正常數(shù)即可.
定理2若定理1的條件都成立,則在事件觸發(fā)脈沖控制策略(4)下,二階主從多智能體系統(tǒng)(1)和系統(tǒng)(2)不存在Zeno行為.
證明令
因此,
Γi(t)+ζTUζ
其中
由事件觸發(fā)函數(shù)(7)可知:
(15)
非空.因此,Zeno行為可以避免.
給出一個例子驗證事件觸發(fā)脈沖控制協(xié)議(4)的有效性.
例1考慮事件觸發(fā)脈沖控制協(xié)議(4)下具有領(lǐng)導(dǎo)者的二階多智能體系統(tǒng)(1,2),其中網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖1所示,0代表領(lǐng)導(dǎo)者,其余的代表追隨者.Laplacian矩陣L,對角矩陣B以及控制輸入矩陣A分別為
圖1 網(wǎng)絡(luò)拓?fù)?/p>
在數(shù)值仿真中,令γ=2,η=0.5,β=0.2.系統(tǒng)的初值為
X0(0)=(4,2.5,3)T
V0(0)=(0.2,-1,-0.3)T
X1(0)=(1,-2,0.1)T
V0(0)=(0.5,2,1.1)T
X2(0)=(-1.4,-1.8,2)T
V2(0)=(-3,1.8,-2)T
X3(0)=(5,1,-1.8)T
V3(0)=(3,2,1.8)T
X4(0)=(5,5,-2)T
V4(0)=(5,3.8,2.4)T
給定α=0.2,β1=0.2,μ=2,利用MATLAB解得矩陣
將矩陣P1帶入滿足定理1中的式(11).在圖2~圖4中繪制了多智能體i(i=0,1,2,3,4)的位置的運(yùn)動軌跡.很容易看出,領(lǐng)導(dǎo)者和跟隨者的狀態(tài)最終趨于一致.每個智能體的事件觸發(fā)時刻如圖5~圖8所示.可以看出,由于初始時刻智能體之間的狀態(tài)誤差比較大,所以智能體之間的觸發(fā)頻繁.在接近t=30 s觸時,觸發(fā)次數(shù)減少,到達(dá)一致后就不再觸發(fā),這說明事件觸發(fā)脈沖控制可以有效地解決有限帶寬的問題.
圖2 智能體i的第1個分量的狀態(tài)
圖3 智能體i的第2個分量的狀態(tài)
圖4 智能體i的第3個分量的狀態(tài)
圖5 第1個智能體的觸發(fā)時刻
圖6 第2個智能體的觸發(fā)時刻
圖7 第3個智能體的觸發(fā)時刻
圖8 第4個智能體的觸發(fā)時刻
本文通過提出一種新的事件觸發(fā)脈沖控制策略,研究了二階多智能體系統(tǒng)的領(lǐng)導(dǎo)跟隨一致性.基于Lyapunov穩(wěn)定性理論和矩陣圖論以及不等式技巧,得到多智能體系統(tǒng)實現(xiàn)一致性的相關(guān)條件并排除了Zeno行為.利用數(shù)值仿真驗證了控制協(xié)議的可行性.