江雨龍,胡文峰,彭 濤,陽春華
(中南大學(xué)自動化學(xué)院,湖南長沙410083)
近年來,隨著計算機(jī)和通信技術(shù)的飛速發(fā)展,多智能體系統(tǒng)協(xié)同控制技術(shù)廣泛應(yīng)用于許多領(lǐng)域,比如智能電網(wǎng)故障診斷[1]、強化學(xué)習(xí)[2]、無人機(jī)編隊飛行[3]等. 因此,多智能體系統(tǒng)協(xié)同控制的研究具有十分重要的理論和實踐意義. 本文研究協(xié)同控制中的無領(lǐng)導(dǎo)者一致性問題,即通過設(shè)計分布式控制器,使得所有智能體的狀態(tài)收斂到一個共同值,目前一些典型的無領(lǐng)導(dǎo)者一致性研究成果包括二階系統(tǒng)[4]、一般線性系統(tǒng)[5]和非線性系統(tǒng)[6]等.
在實際應(yīng)用中,除了穩(wěn)態(tài)性能,閉環(huán)系統(tǒng)的暫態(tài)性能也是關(guān)注的重點,比如收斂速度、超調(diào)等一些性能指標(biāo). 如何提高多智能體系統(tǒng)的暫態(tài)性能,是近年來的研究熱點.Olfati-saber等[7]針對單積分器多智能體系統(tǒng)設(shè)計了一類線性一致性控制協(xié)議,并揭示了拓?fù)涞拇鷶?shù)連通度與收斂速度的關(guān)系,代數(shù)連通度越大,收斂速度越快.Macellari等[8]和Karayiannidis等[9]提出的預(yù)設(shè)性能控制是另一種重點關(guān)注暫態(tài)性能的控制方法,它的原理是將相對誤差限制在一類性能函數(shù)邊界內(nèi)變化,從而達(dá)到任意改變收斂速度和限制超調(diào)的目的. 然而,這種方法通常會導(dǎo)致非自治非線性閉環(huán)系統(tǒng)的產(chǎn)生. 得益于有限時間控制理論的發(fā)展,有限時間控制策略被用于加快多智能體系統(tǒng)的收斂速度[10-11],但這會帶來控制輸入過大的問題. 除了上述控制策略,重置控制近年來逐漸受到人們的關(guān)注.
本文將通過引入重置控制策略來改善多智能體系統(tǒng)的暫態(tài)性能,比如加快收斂速度,減小控制代價. 重置控制最早出現(xiàn)在文獻(xiàn)[12]中,Clegg設(shè)計了一種特殊的積分器,當(dāng)被積變量過零時就將積分器輸出置零,用于解決一類非線性系統(tǒng)的伺服問題,并驗證了該積分器可以提高控制效果. 一般來講,重置控制器包含一個重置部分,當(dāng)滿足某種觸發(fā)條件時,就將該部分重置為零. 例如,Beker等[13]研究了在一類場景下重置積分器可以突破線性反饋的局限性,提高系統(tǒng)的暫態(tài)性能,實現(xiàn)階躍響應(yīng)下沒有超調(diào)的控制目標(biāo).Nesic等[14]設(shè)計了一類一階重置控制器,并實現(xiàn)了L-2 魯棒性. 之后,有更多關(guān)于單系統(tǒng)加入重置機(jī)制的研究結(jié)果出現(xiàn)[15].Yucelen等[16]將重置控制策略首次引入到多智能體系統(tǒng)的研究中,針對單積分器系統(tǒng)設(shè)計了基于準(zhǔn)重置機(jī)制的一致性控制器.Meng等[17-18]分別針對單積分系統(tǒng)的有領(lǐng)導(dǎo)者一致性和無領(lǐng)導(dǎo)者一致性問題提出了基于重置控制策略的控制協(xié)議,并在文獻(xiàn)[18]中考慮了排除芝諾行為.Hu等[19]將重置控制推廣到二階多智能體系統(tǒng),嚴(yán)格證明了正則性和收斂性,并通過理論分析和仿真對比突出重置一致協(xié)議相比其他協(xié)議具有更好的暫態(tài)性能. 目前將重置機(jī)制應(yīng)用于一般線性多智能體系統(tǒng)的研究集中在有領(lǐng)導(dǎo)者一致性問題,均采用混雜系統(tǒng)方法分析系統(tǒng)的收斂性能[20-21].值得注意的是,Cheng等[20]針對每個智能體的動力學(xué)方程,假設(shè)輸入矩陣滿足行滿秩,這限制了該結(jié)果應(yīng)用于許多線性多智能體系統(tǒng).Zhao等[21]對控制器參數(shù)的設(shè)計依賴于一些線性矩陣不等式(LMI)的求解,這甚至帶來了解的存在性問題.
不同于文獻(xiàn)[20-21],本文考慮一般線性系統(tǒng)的無領(lǐng)導(dǎo)者一致性問題,提出了一種新穎的帶有時變增益的重置一致協(xié)議,放寬了對輸入矩陣的限制. 不同于文獻(xiàn)[17-21]中傳統(tǒng)的過零點重置觸發(fā)條件,本文提出了基于耦合誤差的重置環(huán)重置條件,并通過Lyapunov穩(wěn)定性理論證明閉環(huán)系統(tǒng)實現(xiàn)漸近一致. 另外,本文將提出的重置控制器與現(xiàn)存的靜態(tài)控制器以及動態(tài)控制器進(jìn)行了對比分析,證明了重置控制器具有更快的收斂速度,并通過仿真進(jìn)行了驗證.
給定一個實對稱矩陣M,用λmin(M)和λmax(M)分別代表M的最小和最大的特征值.In代表n維單位矩陣;A?B表示矩陣A和B的克羅內(nèi)克積. 公式col{x1,x2,…,xn}代表元素為x1,x2,…,xn的列向量. 符號1N表示元素全為1的N維列向量;符號0N表示元素全為0的N維列向量. 符號0n×n表示一個n階零矩陣.
考慮N個智能體組成的一般線性多智能體系統(tǒng),第i個智能體的動力學(xué)模型如下:
(1)
其中:xi∈Rn是智能體i的狀態(tài)向量,ui∈Rm是智能體i的控制輸入;A∈Rn×n為系統(tǒng)矩陣,B∈Rn×m為輸入矩陣,且A和B均為常值矩陣.
對于無領(lǐng)導(dǎo)者的多智能體系統(tǒng), 智能體i的控制器ui只依賴于自身和鄰居智能體的狀態(tài)信息即
ui=f(xi,xj∈Ni),
(2)
其中f為線性或非線性函數(shù).
在一個多智能體系統(tǒng)中, 如果對于任意的i,j∈V,i≠j,都有
則可以認(rèn)為系統(tǒng)狀態(tài)實現(xiàn)了漸近一致.
我們的目標(biāo)是在無向通信拓?fù)湎?,設(shè)計一類基于重置的一致協(xié)議使得多智能體系統(tǒng)實現(xiàn)一致,改善閉環(huán)系統(tǒng)的暫態(tài)性能.
假設(shè)1(A,B)可鎮(zhèn)定.
在假設(shè)1滿足的前提下,有以下引理:
引理1[23]若(A,B)可鎮(zhèn)定,則下列代數(shù)黎卡提方程存在唯一正定的解矩陣P=PT,
ATP+PA-PBBTP+In=0.
ui=σpKξi+σIKHi(t)ηi,
(3)
其中K∈Rm×n是需要設(shè)計的反饋矩陣,系數(shù)σp>0,σI>0,ηi=col{ηi1,ηi2,…,ηin}∈Rn是智能體i的重置部分.
ηi的設(shè)計如下:
(4)
ηi的初值ηi(0)=0n,Fij和Jij分別表示重置未發(fā)生時的流集和重置觸發(fā)時的跳躍集,這兩個集合定義了重置的觸發(fā)機(jī)制.Fij和Jij設(shè)計如下:
(5)
時變增益矩陣Hi(t)=diag{hi1(t),hi2(t),…,hin(t)}定義如下:
Hi(t)=
(6)
本文所提出的重置機(jī)制具有以下兩個優(yōu)點:
1) 與文獻(xiàn)[18-19]中的一維重置機(jī)制不同,本文中提出的重置機(jī)制是多維的,適用于多輸入多輸出的多智能體系統(tǒng);2) 不同于傳統(tǒng)的零穿越觸發(fā)條件(=0的情況),本文采用誤差進(jìn)入包含0的重置環(huán)時觸發(fā),即誤差絕對值小于某個閾值時觸發(fā). 實際應(yīng)用中檢測零點要求較高,有可能出現(xiàn)檢測失誤的情況,所以本文的觸發(fā)方式更易于應(yīng)用.
首先給出多智能體系統(tǒng)實現(xiàn)一致的條件.
證明將控制器(3)代入系統(tǒng)(1)可以得到:
Axi+σpBKξi+σIBKHi(t)ηi,
因為Hi(t)ηi(t)=βi(t)ξi(t),所以有
(7)
定義向量x=col{x1,x2,…,xN},ξ=col{ξ1,ξ2,…,ξN},不難得到
ξ=-(L?In)x.
定義對角矩陣β=diag{β1(t),β2(t),…,βN(t)},閉環(huán)系統(tǒng)(7)可以寫成如下形式:
σI(IN?BK)(β?In)ξ=(IN?A)x-
σp(L?BK)x+σI(IN?BK)(β?In)ξ.
(8)
選取下列Lyapunov函數(shù):
(9)
定義變量eij=(xi-xj),則有
(10)
因為P為正定矩陣,所以式(9)是關(guān)于變量eij的有效的Lyapunov函數(shù).
σpxT(L?KTBT)+σIξT(β?In)(IN?
2σp(L2?PBBTP)]x+σIxT(L?PBBTP)(β?
[(PA+ATP)-2σpλ2(L)PBBTP])x-σIξT(β?
σIξT(β?PBBTP)ξ.
因為對任意i∈{1,2,…,N}都有βi(t)≥0,所以在任意時刻β的特征值均為非負(fù)實數(shù),已知PBBTP是對稱半正定矩陣或正定矩陣,其特征值均為非負(fù)實數(shù),由克羅內(nèi)克積的性質(zhì)可得β?PBBTP為對稱矩陣且特征值均為非負(fù)實數(shù),所以有-σIξT(β?PBBTP)ξ≤0,因此
(11)
注1Cheng等[20]研究線性多智能體系統(tǒng)的有領(lǐng)導(dǎo)者一致性問題,提出的重置協(xié)議需要輸入矩陣B具有行滿秩,這大大限制了該協(xié)議的適用范圍,本文則取消了這個限制.
注2本文設(shè)計的重置一致控制器(3)可以直接應(yīng)用于單積分器系統(tǒng)和雙積分器系統(tǒng).
對于一個單積分器系統(tǒng)
xi∈R.重置一致控制器設(shè)計如下:
ui=σpξi+σIηi,
(12)
控制器(12)和文獻(xiàn)[18]中的重置控制器觸發(fā)方式不同.
對于一個雙積分器系統(tǒng)
xi∈R.重置一致控制器如下:
ui=σpKξi+σIKHi(t)ηi.
(13)
ui=kζi+μφi+hai,
(14)
其中:
其中:ai為重置部分,ai(0)=0,k,μ,h,?是需要設(shè)計的系數(shù). 可以看出控制器(13)和(14)的形式和重置機(jī)制都不同.
圍繞本文中所研究的線性多智能體系統(tǒng)無領(lǐng)導(dǎo)者一致性問題,已有學(xué)者提出了許多經(jīng)典的控制方法,包括靜態(tài)一致性控制方法[5]和動態(tài)控制方法[25],具體形式如下:
靜態(tài)一致控制器:
ui=σpKξi,
(15)
動態(tài)一致控制器:
ui=σpKξi+σIKzi,
(16)
推論1選取相同的系數(shù)σp,重置一致控制器(3)作用下Lyapunov函數(shù)(9)軌跡變化的上界比靜態(tài)控制器(15)作用下的小.
證明在控制器(15)作用下,系統(tǒng)(1)的閉環(huán)形式如下:
(17)
σIξT(β?PBBTP)ξ=σIxT(LβL?PBBTP)x≥
σIλmin(β)λ2(L)λmin(PBBTP)xT(L?In)x.
令θ(t)=σIλmin(β)λ2(L)λmin(PBBTP)≥0,則
注3通過對Lyapunov函數(shù)V(x(t))軌跡的上界的分析,可以得到靜態(tài)控制器和重置控制器作用下閉環(huán)系統(tǒng)均為指數(shù)收斂,且收斂速度均與1/λmax(P)相關(guān),不過這是一種保守的估計,并不能用來量化系統(tǒng)實際的收斂速度. 針對靜態(tài)控制器,通常的做法是利用無向圖拉普拉斯矩陣L的對稱性質(zhì),將一致性問題轉(zhuǎn)化為整個閉環(huán)系統(tǒng)的鎮(zhèn)定問題,進(jìn)而得到指數(shù)收斂的結(jié)論,且收斂速度是由矩陣A-λ2(L)σpBBTP特征值的最大實部決定. 然而該方法不適用重置控制器的證明中,因為重置控制器通常帶來時變系數(shù),即ui(t)=(σp+σIβi(t))Kξi(t),因此很難描述系統(tǒng)的實際收斂速度,在文獻(xiàn)[18]的Remark6中也指出這一點. 動態(tài)一致控制器與之類似,利用Lyapunov穩(wěn)定性理論和不變集原理可以證明系統(tǒng)實現(xiàn)一致,但是實際收斂速度很難得到.
從控制器的形式出發(fā),可以直接對3種控制策略的收斂速度進(jìn)行比較. 由推論1知,在靜態(tài)控制器(15)作用下多智能體系統(tǒng)可以實現(xiàn)一致,重置控制器(3)比靜態(tài)控制器(15)多了一項σIKHi(t)ηi,重置機(jī)制的存在使得該項可以提供與σpKξi相同方向的控制量,因為Hi(t)ηi(t)=βi(t)ξi(t),βi(t)≥0,這會加速系統(tǒng)朝著一致的方向收斂.
動態(tài)一致控制器則不具備上述特性. 動態(tài)控制器(16)可以寫成如下形式
積分項zi與比例項ξi符號不能一直保持相同,這意味著比例項ξi產(chǎn)生的控制作用會被積分項抵消掉一部分,這會減慢系統(tǒng)朝著一致的方向收斂,而重置控制器(3)會提供很多有效的控制量,加速一致收斂,所以當(dāng)選取相同的σp和σI時,動態(tài)控制器收斂速度比重置一致控制器慢.
本小節(jié)將通過仿真實驗對比3種一致協(xié)議(重置控制器(3)、靜態(tài)控制器(15)以及動態(tài)控制器(16))的控制性能,來證明所提出重置一致協(xié)議的有效性.
考慮一個包含4個智能體的多智能體系統(tǒng),智能體動力學(xué)模型中系統(tǒng)矩陣和輸入矩陣分別為:
代數(shù)黎卡提方程的解為
智能體之間的通信連接為
E={(1,2),(2,1),(2,3),(3,2),(3,4),(4,3)},系統(tǒng)的拉普拉斯矩陣為
代數(shù)連通度λ2(L)=0.585 8.
3種一致控制器參數(shù)設(shè)置相同,均取σp=1.707 1,σI=1,另外重置控制器設(shè)置=0.01.
圖1展示了在重置一致協(xié)議(3)作用下的系統(tǒng)狀態(tài)的變化曲線,xij代表第i個智能體第j維狀態(tài),從圖中可以看出智能體狀態(tài)實現(xiàn)了一致.
圖1 重置一致控制器下系統(tǒng)狀態(tài)軌跡Fig.1System state trajectories with the reset consensus controller
如圖2和圖3所示,另外兩種控制器也可以實現(xiàn)一致.對比3幅圖可以看出,重置控制器作用下閉環(huán)系統(tǒng)收斂最快.圖4展示了重置一致協(xié)議的控制信號,可以明顯看到有重置行為產(chǎn)生.
圖2 靜態(tài)一致控制器下系統(tǒng)狀態(tài)軌跡Fig.2System state trajectories with the static consensus controller
圖3 動態(tài)一致控制器下系統(tǒng)狀態(tài)軌跡Fig.3System state trajectories with the dynamic consensus controller
圖4 重置一致控制器控制信號Fig.4Control signal with the reset consensus controller
從表1中可以得到重置一致控制器的調(diào)節(jié)時間最小,說明其收斂速度最快. 相比靜態(tài)控制器,重置控制器增加了大約12.6%的控制代價,減少了11.9%的調(diào)節(jié)時間.與動態(tài)控制器相比,重置一致控制器減少了71.7%的調(diào)節(jié)時間,卻只需要更小的控制代價,這顯示出重置控制器的優(yōu)越性.綜上對比,說明加入重置機(jī)制能夠加快多智能體系統(tǒng)實現(xiàn)一致,并僅需要較小的控制代價.
表1 不同控制器的調(diào)節(jié)時間和控制代價
本文研究了無向圖下一般線性多智能體系統(tǒng)無領(lǐng)導(dǎo)者一致性問題,提出了基于重置控制策略的一致性協(xié)議. 基于Lyapunov穩(wěn)定性理論證明了給出的一致性協(xié)議能夠保證系統(tǒng)達(dá)到一致. 通過仿真對比表明重置一致協(xié)議可以改善系統(tǒng)的暫態(tài)性能,加快收斂速率的同時只需要相對較少的控制代價.