劉凡 楊洪勇 楊怡澤 李玉玲 劉遠(yuǎn)山
近年來(lái),隨著計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)通信、控制工程等新興產(chǎn)業(yè)的相互融合與促進(jìn),信息物理系統(tǒng)(Cyber-physical system,CPS)隨之出現(xiàn),并朝著大規(guī)模、復(fù)雜化、智能化的方向發(fā)展.多智能體系統(tǒng)分布式協(xié)調(diào)控制問(wèn)題作為CPS系統(tǒng)的典型問(wèn)題,引起了眾多研究者的廣泛關(guān)注.分布式協(xié)同控制因效率高、魯棒性強(qiáng)等優(yōu)點(diǎn),被廣泛應(yīng)用于無(wú)人機(jī)編隊(duì)控制[1]、多機(jī)器人協(xié)同控制[2]、多飛行器系統(tǒng)群集控制[3?4]等領(lǐng)域.
一致性問(wèn)題是多智能體協(xié)同控制領(lǐng)域的基本問(wèn)題,也是協(xié)調(diào)控制中的研究熱點(diǎn)之一[5?13].多智能體系統(tǒng)通過(guò)各智能體之間互相協(xié)調(diào)合作進(jìn)行信息傳遞,按照控制協(xié)議改變自身的狀態(tài),從而使各個(gè)智能體達(dá)到狀態(tài)一致.近年來(lái)諸多學(xué)者已經(jīng)分別針對(duì)一階、二階、混合階以及高階多智能體系統(tǒng)展開(kāi)了深入的研究[5?7].考慮到許多自然現(xiàn)象的動(dòng)力學(xué)特性不能用整數(shù)階方程描述,分?jǐn)?shù)階(非整數(shù)階)動(dòng)力學(xué)的智能個(gè)體合作行為也引起了許多研究者的關(guān)注[8?9].此外,在解決多智能體系統(tǒng)一致性問(wèn)題時(shí),常常會(huì)遇到存在領(lǐng)導(dǎo)者的情況,這被稱為L(zhǎng)eader-follower(領(lǐng)導(dǎo)跟隨型)問(wèn)題[10].在多個(gè)領(lǐng)導(dǎo)者情況下,多智能體系統(tǒng)的跟蹤問(wèn)題就變成包容控制問(wèn)題[11?14].這是領(lǐng)導(dǎo)跟隨型一致性問(wèn)題在多個(gè)領(lǐng)導(dǎo)者情況下的擴(kuò)展,跟隨者在通信協(xié)議的作用下最終收斂到由多個(gè)領(lǐng)導(dǎo)者圍成的某一目標(biāo)區(qū)域內(nèi).文獻(xiàn)[13]分別研究了通信拓?fù)錇閯?dòng)態(tài)聯(lián)合聯(lián)通且存在通信時(shí)延情況下二階網(wǎng)絡(luò)化系統(tǒng)的包容控制問(wèn)題.文獻(xiàn)[14]研究了具有時(shí)延的分?jǐn)?shù)階多智能體系統(tǒng)的包容控制問(wèn)題,利用Laplace變換和頻域定理,提出了無(wú)向網(wǎng)絡(luò)分?jǐn)?shù)階多智能體系統(tǒng)包容控制協(xié)議.
上述研究成果均是假設(shè)多智能體系統(tǒng)中各個(gè)智能體的狀態(tài)漸近達(dá)到穩(wěn)定,即當(dāng)時(shí)間趨于無(wú)窮大時(shí),各個(gè)智能體的狀態(tài)可以達(dá)到某一共同值.然而在實(shí)際應(yīng)用中,特別是某些控制精度比較高的系統(tǒng),往往要求系統(tǒng)在很短的時(shí)間內(nèi)能夠達(dá)成一致.與漸近收斂相比,有限時(shí)間一致性控制法不僅可以保證系統(tǒng)的收斂速度更快,在系統(tǒng)存在外部干擾時(shí)也表現(xiàn)出更好的魯棒性[15].因此研究多智能體系統(tǒng)的有限時(shí)間一致性是很有實(shí)際意義的.目前關(guān)于多智能體系統(tǒng)的有限時(shí)間一致性問(wèn)題已取得比較豐富的研究成果[16?18],文獻(xiàn)[16]研究了二階多智能體系統(tǒng)有限時(shí)間快速收斂問(wèn)題.文獻(xiàn)[17]研究了帶有外部干擾的二階多智能體系統(tǒng)分布式有限時(shí)間包容控制,提出了分布式有限時(shí)間包容控制算法使得跟隨者的狀態(tài)在有限時(shí)間內(nèi)收斂到由領(lǐng)導(dǎo)者組成的動(dòng)態(tài)區(qū)域內(nèi).文獻(xiàn)[18]針對(duì)聯(lián)合連通拓?fù)湎戮哂卸囝I(lǐng)導(dǎo)者的二階多智能體系統(tǒng)群集運(yùn)動(dòng)問(wèn)題,提出了一種有限時(shí)間收斂的包容控制算法.
由于復(fù)雜多變的工作環(huán)境,多智能體系統(tǒng)通常會(huì)受到各種干擾的影響.為了處理系統(tǒng)干擾,研究者提出了許多先進(jìn)的控制方法,包括自適應(yīng)控制[19]、魯棒控制[20],滑??刂芠21?22]等.然而大多數(shù)方法僅考慮匹配干擾,即干擾與控制輸入在同一通道中.在多智能體系統(tǒng)中,常常存在異于控制輸入通道進(jìn)入系統(tǒng)的干擾,即不匹配干擾.不匹配干擾廣泛存在于實(shí)際工程系統(tǒng)中,例如多導(dǎo)彈系統(tǒng)[23]和工業(yè)磁懸浮列車(chē)控制系統(tǒng)[24].由于不匹配干擾無(wú)法直接利用反饋控制器消除,因此對(duì)帶有不匹配干擾系統(tǒng)的協(xié)同控制的研究意義重大.文獻(xiàn)[24]以工業(yè)磁懸浮列車(chē)控制系統(tǒng)為例,詳細(xì)介紹了不匹配干擾的成因和影響,基于干擾觀測(cè)器方法,介紹了狀態(tài)通道和輸出通道不匹配不確定系統(tǒng)干擾主動(dòng)控制方法.文獻(xiàn)[25]提出基于控制的干擾觀測(cè)器(Disturbance observer based control,DOBC)方法,利用干擾前饋補(bǔ)償和輸出反饋復(fù)合控制來(lái)消除干擾.文獻(xiàn)[26]研究了帶有不匹配干擾的高階多智能體系統(tǒng)分布式主動(dòng)抗干擾控制方法,結(jié)合滑??刂评碚摵虳OBC方法,實(shí)現(xiàn)系統(tǒng)的輸出一致性.但文中各智能體的狀態(tài)最終漸近收斂,沒(méi)有考慮有限時(shí)間收斂的情況.文獻(xiàn)[27]研究了不匹配二階多智能體受擾系統(tǒng)的輸出一致性問(wèn)題,文獻(xiàn)[28]研究了帶有不匹配干擾的多智能體系統(tǒng)有限時(shí)間包容控制問(wèn)題.這兩篇文獻(xiàn)對(duì)系統(tǒng)模型作了處理,將不匹配干擾轉(zhuǎn)變成匹配干擾,從而可以利用常規(guī)的處理方式消除干擾.然而在實(shí)際應(yīng)用中存在很多情況不能如此處理,因此該方法有一定的局限性.文獻(xiàn)[29]研究了基于擾動(dòng)觀測(cè)器的復(fù)合積分滑模制導(dǎo)律設(shè)計(jì),給出一種基于積分滑模控制理論和非線性擾動(dòng)觀測(cè)理論的復(fù)合制導(dǎo)律方法,但是該方法沒(méi)有考慮到系統(tǒng)中存在不匹配干擾的情況.
本文以文獻(xiàn)[24]介紹的不匹配干擾為研究對(duì)象,研究帶有不匹配干擾的二階多智能體系統(tǒng)的有限時(shí)間包容控制問(wèn)題.相對(duì)于文獻(xiàn)[27?28],本文的創(chuàng)新點(diǎn)在于設(shè)計(jì)了主動(dòng)有限時(shí)間干擾觀測(cè)器直接估算智能體的不匹配干擾,并在控制協(xié)議中做出干擾補(bǔ)償,提出了較為新穎的復(fù)合分布式積分滑??刂坡?應(yīng)用滑模控制和現(xiàn)代控制等相關(guān)理論,研究了具有不匹配干擾二階多智能體系統(tǒng)的有限時(shí)間包容控制問(wèn)題.
假設(shè)n個(gè)節(jié)點(diǎn)的權(quán)重連接圖用G=(V,E,A)來(lái)表示,其中V={v1,v2,···,vn}為n個(gè)節(jié)點(diǎn)的集合,節(jié)點(diǎn)的下標(biāo)集合N={1,2,···,n},E?V×V為邊的集合,A=[aij]∈Rn×n為圖G的權(quán)重鄰接矩陣,其中矩陣元素aij表示節(jié)點(diǎn)vi與節(jié)點(diǎn)vj的連接權(quán)重.定義Ni={vj∈V|(vi,vj)∈E}為節(jié)點(diǎn)vi的鄰居集合.當(dāng)vj∈Ni時(shí),aij>0,否則aij=0.若對(duì)?i∈N,aij=aji,j∈N,則圖G為無(wú)向拓?fù)鋱D,且鄰接矩陣A為對(duì)稱矩陣.若對(duì)?i∈N,aij6aji,j∈N,則圖G為有向拓?fù)鋱D,且鄰接矩陣A為非對(duì)稱矩陣.假設(shè)圖G中任一節(jié)點(diǎn)無(wú)自環(huán),即對(duì)于?i∈N,aii=0.定義D為圖G的度對(duì)角矩陣D=diag{d1,d2,···,dn},其中節(jié)點(diǎn)vi的度.圖G的Laplacian矩陣定義為L(zhǎng)=D?A.無(wú)向聯(lián)通拓?fù)鋱D的Laplacian矩陣為對(duì)稱矩陣.
引理1(Input-to-state stability theorem,ISS)[30].考慮非線性系統(tǒng),如果系統(tǒng)是全局均一化指數(shù)型穩(wěn)定,當(dāng)limt→∞u(t)=0時(shí),系統(tǒng)的狀態(tài)漸近收斂到0,即limt→∞x(t)=0.
引理2[15].考慮系統(tǒng),f(0)=0,x∈Rn,假設(shè)存在一個(gè)正定連續(xù)函數(shù)V(x):U→R,且實(shí)數(shù)c>0,α∈(0,1),在U0?U的鄰域上滿足,,則V(x)在有限時(shí)間內(nèi)收斂到0.此外有限時(shí)間T滿足T≤.
定義1[12?13].假設(shè)集合X是向量空間的子集,集合X的凸包定義為.
定義2[15,18].考慮連續(xù)非線性系統(tǒng):,x(0)=X0∈Rn,其中連續(xù)向量流f(X)=[f1(x),f2(X),···,fn(x)]T與帶有擴(kuò)張r=[r1,r2,···,rn],ri>0的度κ∈R是齊次的,如果對(duì)于任意的ε>0,x∈Rn都有fi(εr1x1,εr2x2,···,εrnxn)=εκ+rifi(X),i=1,2,···,n.
引理3[15,18].若系統(tǒng), x(0)=X0∈Rn與帶有擴(kuò)張r=[r1,r2,···,rn],ri>0 的度κ∈R是齊次的,函數(shù)f(X)是連續(xù)的,且X=0是其一個(gè)漸近穩(wěn)定平衡點(diǎn).如果齊次度κ<0,則該系統(tǒng)是有限時(shí)間穩(wěn)定的.
定義3.如果網(wǎng)絡(luò)化系統(tǒng)中的一個(gè)自主體至少存在一個(gè)鄰接成員,則稱之為跟隨者,否則稱為領(lǐng)導(dǎo)者.
假設(shè)一個(gè)具有n個(gè)跟隨者和m個(gè)領(lǐng)導(dǎo)者的多智能體系統(tǒng),其中每個(gè)智能體可理解為加權(quán)無(wú)向圖G中的一個(gè)頂點(diǎn),各智能體之間的信息傳遞可理解為圖G的邊.考慮二階多智能體系統(tǒng)未受到干擾時(shí)的動(dòng)力學(xué)模型為
其中,i={1,2,···,n,n+1,···,n+m},n表示跟隨者的個(gè)數(shù),m表示領(lǐng)導(dǎo)者的個(gè)數(shù),跟隨者和領(lǐng)導(dǎo)者集合分別表示為F={1,2,···,n}和L={n+1,n+2,···,n+m}.xi(t)和vi(t)分別表示系統(tǒng)第i個(gè)智能體在t時(shí)刻的位置和速度,ui(t)是控制輸入.假設(shè)領(lǐng)導(dǎo)者為作勻速運(yùn)動(dòng)的動(dòng)態(tài)領(lǐng)導(dǎo)者,對(duì)于?i∈L,其動(dòng)力學(xué)模型為
多Leader-follower型多智能體系統(tǒng)(1)和(2)的通信拓?fù)鋱D可描述成Gn+m=(Vn+m,En+m,An+m),其中m表示領(lǐng)導(dǎo)者的個(gè)數(shù),n表示跟隨者的個(gè)數(shù).圖Gn+m的鄰接矩陣為An+m=[aij]∈R(n+m)×(n+m),Laplacian 矩陣為L(zhǎng)n+m=[lij]∈R(n+m)×(n+m),可描述成,Lf∈Rn×n,Ld∈Rn×m.
假設(shè)1.領(lǐng)導(dǎo)者相互間不通信,領(lǐng)導(dǎo)者與跟隨者之間單向通信,跟隨者之間為雙向通信,且每個(gè)智能體都可接收到它鄰居發(fā)送的狀態(tài)信息和干擾估計(jì)信息.
假設(shè)2.多Leader-follower型多智能體系統(tǒng)的通信拓?fù)銰n+m包含至少一條有向生成樹(shù).
引理4[12].如果假設(shè)2成立,多Leader-follower型多智能體系統(tǒng)的Lf是正定的,此外?L?f1Ld為非負(fù)的且行和為1.
基于上述描述,本節(jié)首先考慮不存在干擾的情況,設(shè)計(jì)分布式控制協(xié)議,使得各個(gè)跟隨者的狀態(tài)在有限時(shí)間內(nèi)實(shí)現(xiàn)包容控制,即xi→Co{xj,j∈L}.
首先令跟蹤誤差為
基于跟蹤誤差(3),設(shè)計(jì)控制器如下:
其中,控制增益k1,k2>0,0<α1<1,α2=2α1/(α1+1).sigα(xi)=|xi|αsgn(xi),sgn(·) 表示符號(hào)函數(shù). 假設(shè) sigα(x)=[sigα(x1),sigα(x2),···,sigα(xn)]T.
定理1.考慮由n個(gè)跟隨者和m個(gè)領(lǐng)導(dǎo)者組成的二階動(dòng)態(tài)多智能體系統(tǒng)(1)和(2),其通信拓?fù)鋱D可描述成Gn+m=(Vn+m,En+m,An+m),如果假設(shè)1和假設(shè)2成立,則多智能體系統(tǒng)基于分布式控制協(xié)議(4)可實(shí)現(xiàn)全局有限時(shí)間包容控制.
證明.由引理4可知,多智能體系統(tǒng)(1)和(2)的Lf是正定的.令,則跟蹤誤差(3)轉(zhuǎn)變成矩陣形式為
構(gòu)造Lyapunov函數(shù)
對(duì)V1函數(shù)沿著式(6)求一次導(dǎo),得
下面分析系統(tǒng)的齊次性.假設(shè)原動(dòng)力學(xué)系統(tǒng)為
取r1=2,r2=1+α1,κ=α1?1,則有
綜上可知,多智能體系統(tǒng)(1)和(2)可實(shí)現(xiàn)有限時(shí)間包容控制.□
本節(jié)考慮二階多智能體系統(tǒng)中存在的不匹配干擾和匹配干擾等多源干擾的情況,假設(shè)二階受擾多智能體系統(tǒng)的動(dòng)力學(xué)模型為
其中,i∈F={1,2,···,n},n表示跟隨者的個(gè)數(shù),xi(t)和vi(t)分別是智能體的位置和速度,ui(t)是控制輸入,di1(t)和di2(t)分別表示不匹配干擾和匹配干擾.
領(lǐng)導(dǎo)者的動(dòng)力學(xué)模型為
其中,j∈L={n+1,n+2,···,n+m},m表示領(lǐng)導(dǎo)者的個(gè)數(shù),xj(t)和vj(t)分別是領(lǐng)導(dǎo)者位置和速度.
為了解決系統(tǒng)(9)中的不匹配干擾并保持系統(tǒng)的標(biāo)稱性能,本節(jié)將結(jié)合積分滑??刂坪头蔷€性干擾觀測(cè)器給出復(fù)合分布式控制協(xié)議.首先,通過(guò)設(shè)計(jì)非線性干擾觀測(cè)器,在有限時(shí)間內(nèi)估算出系統(tǒng)的狀態(tài)和干擾信息.然后,基于干擾估計(jì)值,設(shè)計(jì)出帶有前饋補(bǔ)償項(xiàng)的復(fù)合分布式積分滑模控制協(xié)議.
假設(shè)3.干擾dik(t)和,k=1,2,都是有界的.
注1.假設(shè)3在DOBC領(lǐng)域是很常見(jiàn)的假設(shè).一方面,如果干擾具有很快時(shí)變,那么干擾觀測(cè)器很難進(jìn)行估算;另一方面,在實(shí)際應(yīng)用上,有很多種干擾滿足這種假設(shè),例如:常值干擾,諧波干擾等[27?29].
引理6[31].對(duì)于一般系統(tǒng)
其中,x為狀態(tài)量,u為控制量,d為系統(tǒng)干擾,f,g已知.設(shè)計(jì)的非線性干擾觀測(cè)器如下:
其中,增益λ1,λ2>0,和分別是狀態(tài)x和干擾d的估計(jì)值,則該觀測(cè)器是有限時(shí)間收斂的.
根據(jù)引理6,設(shè)計(jì)干擾觀測(cè)器如下:
其中,i∈F,分別是系統(tǒng)中跟隨者的位置狀態(tài)和速度的估計(jì)值,分別是干擾的估計(jì)量,zi1和zi2為中間量,λi1,λi2,λi3,λi4>0 為觀測(cè)增益.
下面基于上述設(shè)計(jì)的有限時(shí)間干擾觀測(cè)器,結(jié)合滑模控制理論,設(shè)計(jì)復(fù)合分布式控制協(xié)議消除干擾,并使得系統(tǒng)(9)和系統(tǒng)(10)實(shí)現(xiàn)有限時(shí)間包容控制.
首先令跟蹤誤差為
基于跟蹤誤差(15),設(shè)計(jì)復(fù)合分布式控制協(xié)議如下:
其中,0<α1<1,α2=2α1/(1+α1).當(dāng)t=0時(shí),si(0)=0,表示各智能體的狀態(tài)從初始時(shí)刻就位于非線性滑模面(17)上.
定理 2.考慮由n個(gè)跟隨者和m個(gè)領(lǐng)導(dǎo)者組成的二階受擾多智能體系統(tǒng)(9)和(10),其通信拓?fù)鋱D可描述成Gn+m=(Vn+m,En+m,An+m),如果假設(shè)1~3成立,當(dāng)切換增益滿足k0>δ時(shí),基于有限時(shí)間干擾觀測(cè)器(13)和非線性積分滑模面(17)的復(fù)合分布式非線性積分滑??刂茀f(xié)議(16)可使得系統(tǒng)實(shí)現(xiàn)全局有限時(shí)間包容控制.其中,.
證明.首先對(duì)滑模面(17)求一次導(dǎo),得
令S=[s1,s2,···,sn]T,將上式轉(zhuǎn)換成矩陣形式
其中,Lf為系統(tǒng)的Laplacian矩陣,λ1=diag{λ11,λ21,···,λn1},λ2=diag{λ12,λ22,···,λn2},λ3=diag{λ13,λ23,···,λn3},ex=[ex1,ex2,···,exn]T,ev=[ev1,ev2,···,evn]T.
因此,當(dāng)k0>δ時(shí),由引理2可知各智能體狀態(tài)可在有限時(shí)間內(nèi)到達(dá)非線性滑模面(17)上.假設(shè)各智能體狀態(tài)可在t1時(shí)刻到達(dá)滑模面上,由引理2可得
式(20)表明各智能體狀態(tài)從初始時(shí)刻開(kāi)始就一直發(fā)生在非線性滑模面上.
下面證明系統(tǒng)有限時(shí)間包容控制.首先假設(shè)跟隨者的狀態(tài)跟蹤誤差為.
由有限時(shí)間觀測(cè)器(13)可知,存在一個(gè)時(shí)刻T?,當(dāng)t>T?時(shí),exi=edi1=evi=edi2=0.因此,閉合系統(tǒng)(9),(10),(16)的有限時(shí)間穩(wěn)定性可分兩步證明,即[0,T?]上狀態(tài)跟蹤誤差有界,及t>T?時(shí),全局有限時(shí)間收斂.
1)注意到系統(tǒng)的狀態(tài)一直發(fā)生在非線性積分滑模面上,因此
應(yīng)用ISS穩(wěn)定性引理,假設(shè)evi,edi1=0,則系統(tǒng)(22)轉(zhuǎn)變?yōu)?/p>
由定理1可知,系統(tǒng)(23)是有限時(shí)間包容控制的,結(jié)合引理1,系統(tǒng)(22)是ISS穩(wěn)定的.由觀測(cè)器可知,在[0,T?]內(nèi)evi和edi1有界,因此系統(tǒng)(22)狀態(tài)跟蹤誤差有界.而假設(shè)1中說(shuō)明di1是有界的,因此也是有界的,所以速度跟蹤誤差是有界的.
2)(全局有限時(shí)間包容控制)當(dāng)t>T?時(shí),.令,則
由定理1可知,系統(tǒng)可實(shí)現(xiàn)全局有限時(shí)間包容控制,即在有限時(shí)間內(nèi).□
注2.文獻(xiàn)[26]研究了帶有不匹配干擾的高階多智能體系統(tǒng)分布式主動(dòng)抗干擾控制方法,同時(shí)采用了滑??刂评碚摵虳OBC方法,然而文獻(xiàn)[26]設(shè)計(jì)的是常規(guī)的線性滑模面,會(huì)出現(xiàn)抖振現(xiàn)象,而本文設(shè)計(jì)的非線性積分滑模面不僅能有效消除抖振,而且能增強(qiáng)系統(tǒng)的魯棒性能.文獻(xiàn)[27?28]在研究帶有不匹配干擾的多智能體系統(tǒng)時(shí)對(duì)系統(tǒng)模型進(jìn)行了處理,假設(shè)不匹配干擾二階可微,則可將不匹配干擾轉(zhuǎn)變成匹配干擾,然后利用常規(guī)的處理方式消除干擾.但在實(shí)際應(yīng)用中存在很多情況不能如此處理,因此這種方法有一定的局限性.本文則直接對(duì)干擾進(jìn)行觀測(cè),并在控制器中添加干擾補(bǔ)償項(xiàng),可有效抵消干擾的影響,而不影響系統(tǒng)的性能.
考慮4個(gè)跟隨者和3個(gè)領(lǐng)導(dǎo)者組成的網(wǎng)絡(luò),如圖1所示.
圖1 多智能體系統(tǒng)網(wǎng)絡(luò)拓?fù)鋱DFig.1 The network topologies of multi-agent systems
圖1中節(jié)點(diǎn)1~4是無(wú)向連通的跟隨者,節(jié)點(diǎn)5~7是單向發(fā)送信息的領(lǐng)導(dǎo)者.假設(shè)拓?fù)鋱D所有邊的權(quán)重都是1,則系統(tǒng)的Laplacian矩陣為
其中,
假設(shè)4個(gè)智能體都受到干擾影響:智能體1:d1,1=2tanh(2t),d1,2=2;智能體2:d2,1=4tanh(t),d2,2=1;智能體3:d3,1=sigmoid(t),d3,2=2sigmoid(2t);智能體4:d4,1=3sigmoid(t),d4,2=?tanh(t),t>0.其中di1,di2(i=1,2,3,4)分別表示不匹配干擾和匹配干擾.
控制器的參數(shù)設(shè)置為k0=10,k1=20,k2=30,α1=0.8.干擾觀測(cè)器的參數(shù)設(shè)置為λi,1=10,λi,2=20,λi,3=15,λi,4=32,i=1,2,3,4;假設(shè) 4個(gè)跟隨者的初始位置分別為x1=(2,0),x2=(4,0),x3=(0,2),x4=(0,4),領(lǐng)導(dǎo)者的初始坐標(biāo)分別為x5=(6,8),x6=(8,8),x7=(8,6).領(lǐng)導(dǎo)者為動(dòng)態(tài)領(lǐng)導(dǎo)者,其初始速度為v5=(1,1),v6=(1.2,1.2),v7=(1,1).仿真結(jié)果如圖2~4所示.
圖2是干擾觀測(cè)器(13)對(duì)受擾系統(tǒng)(9)中各智能體的不匹配干擾和匹配干擾的觀測(cè)量和估計(jì)誤差,從圖2(a)和2(c)可以看出觀測(cè)器可以快速估計(jì)出智能體所受的干擾,在圖2(b)和2(d)中各智能體所受干擾的觀測(cè)誤差很快的趨于0,說(shuō)明觀測(cè)器可準(zhǔn)確地估算出系統(tǒng)中的干擾,表現(xiàn)出較好的觀測(cè)性能.圖3是智能體的位置和速度狀態(tài)觀測(cè)誤差.從圖3可知,在不到1s的時(shí)間誤差曲線趨于0,直觀地說(shuō)明觀測(cè)器可快速準(zhǔn)確地估算出跟隨者的狀態(tài)信息,從而確??刂破鞯挠行ё饔?
圖4是多智能體系統(tǒng)的位置狀態(tài)軌跡圖,其中星號(hào)表示跟隨者,圓圈表示動(dòng)態(tài)領(lǐng)導(dǎo)者,可以看出3個(gè)動(dòng)態(tài)領(lǐng)導(dǎo)者以一定的速度沿著某一方向移動(dòng),而4個(gè)跟隨者通過(guò)相互作用最終收斂到有領(lǐng)導(dǎo)者組成的幾何體中.特別地,當(dāng)t=5s時(shí),跟隨者還沒(méi)有完全進(jìn)入凸包內(nèi),而當(dāng)t=10s時(shí),各跟隨者均進(jìn)入凸包內(nèi),且跟隨著領(lǐng)導(dǎo)者同步運(yùn)動(dòng).因此,在控制律(16)下各智能體能夠快速地跟蹤到領(lǐng)導(dǎo)者,并進(jìn)入由領(lǐng)導(dǎo)者組成的幾何體中,實(shí)現(xiàn)了包容控制.
文獻(xiàn)[26]研究的是帶有不匹配干擾的多智能體系統(tǒng)滑模控制.為了進(jìn)一步說(shuō)明本文方法的優(yōu)越性,本文將文獻(xiàn)[26]所提方法拓展到多領(lǐng)導(dǎo)者情況.利用上述數(shù)值參數(shù),得到圖5所示的仿真圖.由圖5可知,當(dāng)t=10s時(shí)跟隨者沒(méi)有完全進(jìn)入凸包內(nèi),當(dāng)t=20s時(shí),系統(tǒng)才實(shí)現(xiàn)包容控制.與文獻(xiàn)[26]的實(shí)驗(yàn)結(jié)果比較,說(shuō)明本文方法可以更加快速地達(dá)到一致,取得較好的結(jié)果.
綜上,帶干擾的多智能體系統(tǒng)(9)和(10)通過(guò)有限時(shí)間干擾觀測(cè)器(13)快速地估算干擾,在復(fù)合分布式控制協(xié)議(16)下快速消除干擾,使得各跟隨者的狀態(tài)收斂到由動(dòng)態(tài)領(lǐng)導(dǎo)者組成的動(dòng)態(tài)凸包內(nèi),即xi→Co{xj,j∈L},實(shí)現(xiàn)了包容控制.
本文研究帶有不匹配干擾的二階多智能體系統(tǒng)協(xié)同控制問(wèn)題.設(shè)計(jì)了非線性有限時(shí)間干擾觀測(cè)器,使得智能體的干擾可被觀測(cè)和補(bǔ)償.利用滑??刂评碚摵突诳刂频母蓴_觀測(cè)器方法,提出了復(fù)合分布式非線性積分滑??刂茀f(xié)議.通過(guò)使用Lyapunov穩(wěn)定性理論、代數(shù)圖論、齊次性理論等方法,研究了帶有不匹配干擾的多智能體系統(tǒng)有限時(shí)間包容控制.最后數(shù)值仿真表明了所提控制算法的有效性.
由于復(fù)雜多變的工作環(huán)境,多智能體系統(tǒng)通常會(huì)受到各種干擾的影響.在實(shí)際工程應(yīng)用中,不匹配干擾是十分常見(jiàn)的干擾,因此本文所提方法具有一定的發(fā)展前景,而且更具有普適性.未來(lái)的研究方向?將針對(duì)更為復(fù)雜的環(huán)境,設(shè)計(jì)新型的干擾觀測(cè)器,研究多智能體系統(tǒng)的協(xié)同控制問(wèn)題.
圖2 干擾觀測(cè)器(14)的觀測(cè)值及觀測(cè)誤差Fig.2 The estimations and estimated errors of DO(14)
圖3 各智能體狀態(tài)觀測(cè)誤差Fig.3 The estimated state errors of each agent
圖4 跟隨者與動(dòng)態(tài)領(lǐng)導(dǎo)者的位置關(guān)系Fig.4 The trajectories of position for the followers and dynamic leaders