唐朝君
(重慶理工大學(xué) 理學(xué)院, 重慶 400054)
由于當(dāng)前多智能體系統(tǒng)在分布式傳感器網(wǎng)絡(luò)、編隊(duì)控制、信息融合和蜂擁等問(wèn)題中的廣泛應(yīng)用,對(duì)多智能體系統(tǒng)的研究吸引了不同領(lǐng)域研究學(xué)者的廣泛關(guān)注。一致性是多智能體系統(tǒng)協(xié)調(diào)控制研究的基礎(chǔ),也是多智能體系統(tǒng)研究中最重要和最基本的一個(gè)問(wèn)題。一致性是指通過(guò)設(shè)計(jì)恰當(dāng)?shù)姆植际娇刂茀f(xié)議,使系統(tǒng)中的智能體就某些關(guān)鍵的量趨于一致。根據(jù)系統(tǒng)中是否有領(lǐng)導(dǎo)智能體,可以將一致性分為兩類,即無(wú)領(lǐng)導(dǎo)的一致性和領(lǐng)導(dǎo)跟隨一致性。
1995年,Vicsek等[1]提出了一個(gè)簡(jiǎn)單卻十分有趣的離散時(shí)間多智能體系統(tǒng)模型,通過(guò)仿真演示了系統(tǒng)中所有的智能體最終以共同的方向前進(jìn)。2003年,Jadbabaie等[2]利用矩陣?yán)碚摵痛鷶?shù)圖論的方法首次給出了Vicsek模型的理論解釋。Olfati-Saber和Murray[3]對(duì)連續(xù)時(shí)間多智能體系統(tǒng)的一致性研究做了開(kāi)創(chuàng)性的工作,分別研究了固定和切換網(wǎng)絡(luò)拓?fù)湎碌囊恢滦詥?wèn)題,以及帶有單一時(shí)滯的一致性問(wèn)題。隨后,Ren等[4]研究了更為一般的網(wǎng)絡(luò)拓?fù)?,給出了系統(tǒng)解決一致性所需的最弱的拓?fù)錀l件。隨著一致性問(wèn)題研究的不斷深入,發(fā)展了一系列的重要的子課題,主要包括具有通信時(shí)滯的一致性、帶有測(cè)量噪聲的一致性、有限時(shí)間一致性、基于時(shí)間觸發(fā)機(jī)制的一致性和隨機(jī)網(wǎng)絡(luò)拓?fù)湎碌囊恢滦詥?wèn)題等,具體參見(jiàn)文獻(xiàn)[5]。
在實(shí)際應(yīng)用中,絕大多數(shù)的物理系統(tǒng)本質(zhì)上都是非線性系統(tǒng)。因此,對(duì)非線性多智能體系統(tǒng)一致性的研究具有重要意義。近年來(lái),對(duì)非線性多智能體系統(tǒng)一致性的研究得到了一些有趣的結(jié)果。受同步理論的啟發(fā),文獻(xiàn)[6-7]在一致性協(xié)議中引入了非線性函數(shù)來(lái)描述智能體內(nèi)在的非線性動(dòng)態(tài)。針對(duì)有向網(wǎng)絡(luò)拓?fù)洌岢隽藦V義代數(shù)連通度的概念,并用其得到了一致性的充分條件。文獻(xiàn)[8-9]利用牽制控制(pinning control)研究了二階非線性多智能體系統(tǒng)的領(lǐng)導(dǎo)-跟隨一致性問(wèn)題。文獻(xiàn)[10]研究了非線性多智能體系統(tǒng)的有限時(shí)間一致性問(wèn)題。文獻(xiàn)[11]研究了非線性多智能體系統(tǒng)的包含控制問(wèn)題。
在現(xiàn)有大多數(shù)對(duì)一致性問(wèn)題研究的文獻(xiàn)中, 所給出的一致性協(xié)議中都需要用到網(wǎng)絡(luò)拓?fù)渌鶎?duì)應(yīng)的Laplacian 矩陣特征值的信息, 這是一個(gè)全局的信息,因此這些控制協(xié)議并非嚴(yán)格意義的分布式控制協(xié)議。為了解決這個(gè)問(wèn)題,一些研究學(xué)者提出了基于自適應(yīng)的控制協(xié)議。目前,對(duì)基于自適應(yīng)控制協(xié)議的一致性的研究已經(jīng)得到了一些有趣結(jié)果[12-15]。另外,文獻(xiàn)[6-11]中都是假設(shè)系統(tǒng)中的智能體具有相同的非線性動(dòng)態(tài),而對(duì)具有不同本質(zhì)非線性動(dòng)態(tài)多智能體系統(tǒng)一致性的研究還鮮有報(bào)道?;诜蔷€性動(dòng)態(tài)的參數(shù)化分解,Yu等[16]對(duì)具有不同本質(zhì)非線性動(dòng)態(tài)多智能體系統(tǒng)提出了一種基于自適應(yīng)的控制協(xié)議來(lái)追蹤同樣具有未知非線性動(dòng)態(tài)的領(lǐng)導(dǎo)智能體。受文獻(xiàn)[16]的啟發(fā),本文研究具有不同本質(zhì)非線性動(dòng)態(tài)多智能體系統(tǒng)的一致性問(wèn)題。與文獻(xiàn)[16]相比,本文的創(chuàng)新之處主要體現(xiàn)在兩個(gè)方面:① 本文研究的是無(wú)領(lǐng)導(dǎo)的一致性問(wèn)題,適用于更為一般的多智能體系統(tǒng);② 文獻(xiàn)[16]只研究了無(wú)向網(wǎng)絡(luò)拓?fù)?,本文分別研究了無(wú)向和有向網(wǎng)絡(luò)拓?fù)洹V档米⒁獾氖?,有向網(wǎng)絡(luò)拓?fù)涓臃蠈?shí)際應(yīng)用,而無(wú)向網(wǎng)絡(luò)拓?fù)淇梢暈橛邢蚓W(wǎng)絡(luò)拓?fù)涞奶乩?/p>
考慮由n個(gè)智能體構(gòu)成的多智能體系統(tǒng)。智能體i的動(dòng)力學(xué)模型為
(1)
式中:xi∈R是智能體i的狀態(tài);ui(t)∈R是智能體i的控制輸入;fi(xi,t)∈R是智能體i自身動(dòng)力學(xué)的非線性函數(shù)。
假設(shè)非線性函數(shù)fi(xi,t)滿足如下Lipschitz條件:
|fi(xi,t)-fi(xj,t)|≤l|xi-xj|
(2)
式中:xi,xj∈R;l>0為正常數(shù)。上述條件用于保證系統(tǒng)(1)解的存在性和唯一性。本文研究具有不同非線性動(dòng)態(tài)的多智能體系統(tǒng)一致性問(wèn)題,即對(duì)每個(gè)智能體設(shè)計(jì)分布式的控制協(xié)議ui,使所有智能體的狀態(tài)趨于一致。具體問(wèn)題由如下定義給出:
定義1若系統(tǒng)(1)的解在任意初始條件下滿足
則稱多智能體系統(tǒng)(1)解決一致性問(wèn)題。
本文利用有向圖來(lái)描述系統(tǒng)中智能體之間的拓?fù)浣Y(jié)構(gòu)。有向圖G由一個(gè)頂點(diǎn)集V和邊集E組成,其中V={1,2,…,n},頂點(diǎn)i表示智能體i,E={(i,j)|i,j∈V}。若智能體i能接收到智能體j的信息,則(j,i)∈E,否則(j,i)?E。若(j,i)∈E, 則稱頂點(diǎn)j是頂點(diǎn)i的鄰居或者智能體j是智能體i的鄰居。從vi1到vik的一條路徑是由一系列不同的頂點(diǎn)vi1,vi2,…,vik構(gòu)成,并且這些頂點(diǎn)滿足(vij,vij+1)∈E,j=1,2,…,k-1。如果從G中任一頂點(diǎn)到另外一頂點(diǎn)都有路徑存在,則稱G是強(qiáng)連通的;如果G中至少有一個(gè)頂點(diǎn)到其他頂點(diǎn)都有路徑存在,則稱G包含生成樹(shù)。對(duì)于有向圖G,如果(i,j)∈E蘊(yùn)含著(j,i)∈E,那么稱G是無(wú)向圖;若無(wú)向圖G包含生成樹(shù),則稱G是連通的。
圖G的Laplacian矩陣L=[lij]∈Rn×n定義為
Laplacian矩陣在一致性問(wèn)題的研究中具有非常重要的作用, 它具有下面的性質(zhì)[4]:
引理1 0是L的特征值, 1n=(1,1,…,1)T∈Rn是對(duì)應(yīng)的特征向量,其他非零特征值的實(shí)部全部大于0;0是L代數(shù)簡(jiǎn)單的特征值當(dāng)且僅當(dāng)圖G包含生成樹(shù)。
本節(jié)給出分布式的控制協(xié)議,使系統(tǒng)(1)能解決一致性問(wèn)題。假設(shè)非線性動(dòng)態(tài)fi(xi,t)可進(jìn)行線性參數(shù)化:
式中:φi(xi,t)∈Rm為已知的基函數(shù)向量,θi∈Rm為未知的常數(shù)參數(shù)向量。
注1本文假設(shè)智能體的非線性動(dòng)態(tài)可以進(jìn)行線性參數(shù)化。線性參數(shù)化的模型在經(jīng)典的自適應(yīng)控制中已經(jīng)被廣泛研究[17-18]。文獻(xiàn)[16,19-21]對(duì)線性參數(shù)化的多智能體系統(tǒng)進(jìn)行了研究。
使用如下的分布式控制協(xié)議:
(3)
首先研究固定拓?fù)涞那樾?,此時(shí)系統(tǒng)的通信拓?fù)浔3植蛔?。利用協(xié)議(3),系統(tǒng)(1)可以寫(xiě)成下面的向量形式:
(4)
定理1假設(shè)系統(tǒng)的通信拓?fù)銰連通。利用協(xié)議(3), 系統(tǒng)(1)解決一致性問(wèn)題。
則
G是連通的無(wú)向圖,則L是對(duì)稱陣,而且存在正交陣U=(u1,u2,…,un)∈Rn×n,使得
UTLU=diag{λ1,λ2,…,λn}
eTLe=eTUdiag{λ1,λ2,…,λn}UTe=
對(duì)于有向網(wǎng)絡(luò)拓?fù)洌?容易得到下面的結(jié)論:
定理2假設(shè)系統(tǒng)的通信拓?fù)銰是平衡圖且包含生成樹(shù)。利用協(xié)議(3),系統(tǒng)(1)解決一致性問(wèn)題。
證明使用定理1證明中的記號(hào)。注意到
由于G是平衡圖且包含生成樹(shù), 由引理2可得
在實(shí)際應(yīng)用中,由于障礙物的存在或者個(gè)體之間的相互影響,系統(tǒng)中的通信拓?fù)渫菚r(shí)變的,因此研究時(shí)變拓?fù)湎碌囊恢滦詥?wèn)題更具有實(shí)際意義。設(shè)P={G1,G2,…,Gs}為系統(tǒng)所有可能通信拓?fù)涞募希?其中m<+∞。為了描述時(shí)變拓?fù)洌?定義分段定常切換信號(hào):σ(t):[0,+∞)→J={1,2,…,s}。因此, 時(shí)刻t時(shí)系統(tǒng)的通信拓?fù)錇镚σ(t),簡(jiǎn)記為Gσ。此時(shí),系統(tǒng)(4)變?yōu)?/p>
(5)
定理3假設(shè)系統(tǒng)的通信拓?fù)銰i,?i∈J連通。利用協(xié)議(3),系統(tǒng)(1)解決一致性問(wèn)題。
與定理1的證明方法相同,可得
注意到Gσ為連通的無(wú)向圖,可得
eTLσe≥λ2(Lσ)eTe
本小節(jié)給出2個(gè)實(shí)例來(lái)驗(yàn)證本文理論結(jié)果的正確性??紤]1個(gè)含有5個(gè)智能體的多智能體系統(tǒng),智能體i的非線性動(dòng)態(tài)可以參數(shù)化為
fi(xi,t)=[xisint,xicost]θi,i=1,2,…,5
例1設(shè)系統(tǒng)的通信拓?fù)淙鐖D1所示。為方便起見(jiàn), 設(shè)圖中每條邊的權(quán)值均為1。智能體的初始位置隨機(jī)地選取為x(0)=(2,1,3,5,8)T和x(0)=(1,5,2,4,3)T,在協(xié)議(3)的作用下,智能體的狀態(tài)隨時(shí)間的變化曲線如圖2、3所示。顯然,智能體的狀態(tài)隨著時(shí)間的變化趨于一致,與定理1的結(jié)論相符。
圖1 系統(tǒng)的通信拓?fù)銰1
圖2 智能體的狀態(tài)曲線1
圖3 智能體的狀態(tài)曲線2
例2設(shè)系統(tǒng)的通信拓?fù)淙鐖D4所示。為方便起見(jiàn), 設(shè)圖中每條邊的權(quán)值均為1。顯然G2是平衡圖且包含生成樹(shù)。智能體的初始位置隨機(jī)地選取為x(0)=(2,1,3,5,8)T和x(0)=(1,5,2,4,3)T。在協(xié)議(3)的作用下,智能體的狀態(tài)隨時(shí)間的變化曲線如圖5、6所示。顯然,智能體的狀態(tài)隨著時(shí)間的變化趨于一致,與定理2的結(jié)論相符。
圖4 系統(tǒng)的通信拓?fù)銰2
圖5 智能體的狀態(tài)曲線3
圖6 智能體的狀態(tài)曲線4
針對(duì)具有未知和不同非線性動(dòng)態(tài)的多智能體系統(tǒng),基于非線性動(dòng)態(tài)的線性參數(shù)化分解的方法,給出了基于自適應(yīng)的一致性控制協(xié)議。利用代數(shù)圖論、矩陣?yán)碚摵蚅yapunov的方法進(jìn)行穩(wěn)定性分析。對(duì)于無(wú)向拓?fù)?,?dāng)通信拓?fù)溥B通時(shí),所給的協(xié)議解決一致性問(wèn)題;對(duì)于有向拓?fù)?,?dāng)系統(tǒng)的通信拓?fù)涫瞧胶鈭D且包含生成樹(shù)時(shí),所給的協(xié)議解決一致性問(wèn)題;對(duì)于切換網(wǎng)絡(luò)拓?fù)?,?dāng)系統(tǒng)所有可能的通信拓?fù)溥B通時(shí),所給的協(xié)議解決一致性問(wèn)題。最后通過(guò)仿真實(shí)例驗(yàn)證了理論結(jié)果的正確性和有效性。