秦 波 朱 旭 范永青 高 揚
1.西安郵電大學(xué)自動化學(xué)院 陜西 西安 710121
2.北京航天計量測試技術(shù)研究所 北京 100076
多智能體動態(tài)系統(tǒng)在各種工程領(lǐng)域中有著廣泛應(yīng)用.其中,系統(tǒng)中各智能體之間的協(xié)同控制器設(shè)計已經(jīng)成為學(xué)者們研究的一個熱點問題[1-5].各智能體的狀態(tài)實現(xiàn)一致性是整個系統(tǒng)完成協(xié)同工作任務(wù)的一個重要判斷標(biāo)準(zhǔn),因此,研究一致性控制器設(shè)計是多智能體系統(tǒng)中協(xié)同控制的一個基本問題.關(guān)于同質(zhì)多智能體一致性控制器的設(shè)計已經(jīng)提出多種豐富的研究成果[5-9].在實際應(yīng)用中,每個智能體帶有不同的動態(tài)特性(即,異質(zhì)多智能體)廣泛存在.因此,如何設(shè)計異質(zhì)多智能體系統(tǒng)的一致性控制器是學(xué)者們的研究興趣之一.
諸多學(xué)者提出多種異質(zhì)多智能體系統(tǒng)的控制器設(shè)計方法,如: 事件觸發(fā)/自觸發(fā)策略[10-11]、自適應(yīng)觸發(fā)控制[12]、魯棒自適應(yīng)控制[13]、一致性PI 分布式控制[14]、一致性自適應(yīng)控制[15]等.然而,在這些已有的研究成果中,僅僅考慮了異質(zhì)多智能體系統(tǒng)是線性的情況,使得控制器僅適用于線性多智能體系統(tǒng).針對這一缺點,廣大學(xué)者們開始關(guān)注異質(zhì)非線性多智能體系統(tǒng)的一致性控制器設(shè)計研究,并提出多種控制器設(shè)計方案[16-19].
模糊邏輯系統(tǒng)和神經(jīng)網(wǎng)絡(luò)系統(tǒng)作為常用的萬能逼近器,在解決各種未建模動態(tài)系統(tǒng)和未知非線性函數(shù)中起著舉足輕重的作用,且已經(jīng)被廣泛應(yīng)用在各種控制器設(shè)計過程中[20-25].文獻[26-32]成果中的設(shè)計方法僅對某些特殊結(jié)構(gòu)(如: 維數(shù)相同或嚴(yán)格反饋形式)的異質(zhì)多智能體系統(tǒng)有效.
對于帶有不同維數(shù)的異質(zhì)多智能體系統(tǒng)的輸出一致性控制問題,已經(jīng)有學(xué)者們給出一些系統(tǒng)輸出一致性的控制器設(shè)計方法[33-35].文獻[36]針對一類非仿射非線性多智能體系統(tǒng)的輸出一致性,采用Nussbaum 增益函數(shù)動態(tài)面控制方法,提出一種輸出與給定信號實現(xiàn)一致性的神經(jīng)網(wǎng)絡(luò)控制方法.但是這些方法僅適用于多智能體的輸出一致性,而對于多智能體系統(tǒng)的狀態(tài)一致性就顯得無能為力.由此分析可知,如何設(shè)計出新穎的一致性控制器設(shè)計方法,使得控制器的設(shè)計不僅適用于具有相同維數(shù)的異質(zhì)多智能體系統(tǒng),而且也適應(yīng)于帶有不同維數(shù)的異質(zhì)多智能體系統(tǒng),使得異質(zhì)多智能體系統(tǒng)具有更寬廣的工程應(yīng)用范圍是一個值得研究的問題.
本文試圖設(shè)計出具不同維數(shù)(相同維數(shù)視為特殊情況)的異質(zhì)非線性多智能體系統(tǒng)的一致控制器設(shè)計方法.受文獻[37-43]中大系統(tǒng)和復(fù)雜動態(tài)系統(tǒng)提出的各子系統(tǒng)之間相似特征的啟發(fā),將相似性概念與性質(zhì)引入到維數(shù)不同的異質(zhì)多智能體系統(tǒng)中.如果從多智能體系統(tǒng)之間的連接關(guān)系結(jié)構(gòu)的角度來看,每個智能體被視為網(wǎng)絡(luò)拓?fù)鋱D中的一個節(jié)點,其中,每個節(jié)點的空間維數(shù)相同或不同.通過介紹各異質(zhì)智能體之間的相似特征,研究基于不同維數(shù)且具有相似特性的多智能體系統(tǒng)的一致性自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器設(shè)計方法.
本文與已有成果中的異質(zhì)多智能體系統(tǒng)的一致性控制器設(shè)計方法相比,所提出的控制器設(shè)計方案主要有以下優(yōu)點:
1)提出每個智能體之間的相似性概念和性質(zhì),并且給出一種通過具有相同或不同維數(shù)的異質(zhì)多智能體的性質(zhì)來獲得相似的參量方法.
2)針對異質(zhì)多智能體系統(tǒng)的一致性控制問題,設(shè)計了具有相似參量的分布式狀態(tài)反饋自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制,該控制器不僅適用于帶有相同維數(shù)的異質(zhì)非線性多智能體系統(tǒng),也適用于帶有不同維數(shù)的異質(zhì)非線性多智能體系統(tǒng).
考慮帶有N 個子系統(tǒng)的多智能體系統(tǒng),其中,第i 個智能體可以描述為如下形式:
定義1: 第i 個智能體系統(tǒng)的維數(shù)和第j 個智能體的維數(shù)不同時(即),多智能體系統(tǒng)(1)稱為異維異質(zhì)多智能體系統(tǒng).
注1:由異質(zhì)多智能體系統(tǒng)(1)可知,每個智能體的維數(shù)是不同的(當(dāng)ni和mi分別取相同值時,系統(tǒng)(1)等價于相同維數(shù)的異質(zhì)多智能體系統(tǒng),該情況視為異質(zhì)多智能體系統(tǒng)的特殊情況.文獻[5-9,20-32] 中的系統(tǒng)均屬于本文中各智能體維數(shù)相同的特殊情況).因此,本文研究的異維異質(zhì)多智能體系統(tǒng)相比其他文獻中的異質(zhì)多智能體系統(tǒng)具有更廣泛的應(yīng)用.
假設(shè)1: 在異維異質(zhì)非線性多智能體(1)中,如果存在矩陣和已知矩陣滿足以下條件,稱第i 個智能體和第j 個智能體系統(tǒng)是相似的.
假設(shè)3: 在有限緊集論域Ω 上,未知非線性函數(shù)gi(xi)可以通過徑向基神經(jīng)網(wǎng)絡(luò)的萬能逼近性質(zhì)對其進行逼近,即滿足以下逼近性質(zhì):
在實際應(yīng)用中,權(quán)重Wi的值一般很難獲得,因此,其估計值被用作控制器設(shè)計中,記估計誤差為.
根據(jù)異維異質(zhì)非線性多智能體(1)之間存在的相似性假設(shè)條件,首先定義各智能體之間的一致誤差為,并令表示多智能體系統(tǒng)的一致跟蹤誤差,其為如下形式:
帶有相似參量的分布式反饋自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器設(shè)計為:
控制器ui1為魯棒控制部分,其作用是消除多智能體系統(tǒng)(1)中的外部干擾,設(shè)計形式為:
智能體之間的耦合權(quán)重ci的自適應(yīng)律設(shè)計為:
定理1: 考慮異維異質(zhì)非線性多智能體系統(tǒng)(1),如果各智能體之間滿足假設(shè)1 中的相似條件,則系統(tǒng)在控制器(6~9)的作用下,多智能體系統(tǒng)(1)的一致性誤差可以實現(xiàn)一致有界條件(11),且閉環(huán)系統(tǒng)中的所有信號是有界的.
由閉環(huán)系統(tǒng)(12)可知,各智能體之間的一致性跟蹤誤差滿足如下形式:
選取如下Lyapunov 函數(shù):
函數(shù)(15)沿系統(tǒng)(14)的時間導(dǎo)數(shù)為:
由控制器(6)中的設(shè)計形式,有下式成立:
由于以下不等式成立:
根據(jù)不等式(20)和式(21),不等式(19)等價于:
在不等式(23)兩邊同時對時間進行積分,得
因此,下列不等式成立
由Schur 補引理可知,矩陣不等式(27)可以轉(zhuǎn)變成式(9)的形式.
本章給出兩種類型的異質(zhì)多智能體系統(tǒng)的一致跟蹤控制器仿真來說明本文所設(shè)計方法的有效性.
例1.帶有相同維數(shù)的同質(zhì)非線性多智能體系統(tǒng),即,多智能體系統(tǒng)(1)所描述的每一個智能體都帶有相同的維數(shù),且各智能體的動態(tài)特性完全相同.
考慮如圖1 所示具有5 個智能體的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖.
圖1 5 個智能體的網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱DFig.1 Topological graph of network structure of five agents
由圖1 可知,網(wǎng)絡(luò)圖的Laplace 矩陣為:
在本例子中,智能體的動力學(xué)方程參考文獻[5]中的形式如下:
自適應(yīng)定律(7~8)中的參數(shù)選取為:
在本文所設(shè)計的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器(6~9)的作用下,多智能體系統(tǒng)(28)的所有狀態(tài)實現(xiàn)一致性時間響應(yīng)情況如圖2 中(c)和(d)所示.如果采用文獻[5]中的控制器設(shè)計方法,則系統(tǒng)狀態(tài)的一致性時間響應(yīng)如圖(a)和(b)所示.從圖2 中本文控制器和文獻[5]中的控制器仿真結(jié)果比較,帶有同維同質(zhì)非線性多智能體在本文設(shè)計的控制器作用下,可以快速地實現(xiàn)所有智能體系統(tǒng)的狀態(tài)一致性.并且由圖2(a-b)可以看出,在已有文獻[5]提供的控制器作用下,狀態(tài)的一致性具有超調(diào)和時間反應(yīng)慢的缺點.由此比較可知,本文設(shè)計的控制器方法具有時間響應(yīng)快和低超調(diào)的優(yōu)點.
圖2 智能體(28)中狀態(tài)xi(t)的一致性時間響應(yīng)Fig.2 Consistence time response of state xi(t)in agent(28)
圖3 估計值參數(shù)范數(shù)的時間響應(yīng)Fig.3 Time response of norm of estimated value parameter
圖4 耦合參數(shù)ci 的時間響應(yīng)Fig.4 Time response of coupling parameter
例2.考慮帶有6 個智能體的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖5 所示.
圖5 6 個智能體系統(tǒng)的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)圖Fig.5 Topological graph of network structure of six agent systems
由圖5 可知,其Laplace 矩陣為:
不同于其他具有相同維數(shù)的非線性異質(zhì)多智能體系統(tǒng)的一致性,本例子考慮實際工程應(yīng)用中,二自由度與三自由度的機械臂動態(tài)系統(tǒng)的所有狀態(tài)跟蹤另一子系統(tǒng)的狀態(tài)軌跡,其各運動方程表示為如下形式:
二自由度機械臂系統(tǒng)中的參數(shù)如表1 所示.
表1 第1、第2 和第3 個機械臂系統(tǒng)中的參數(shù)Table 1 The parameters in the first,second and third robot arm systems
其中,各項表達(dá)式有如下:
三自由度機械臂系統(tǒng)中的參數(shù)選取如表2 所示.
表2 第2 和第4 個機械臂系統(tǒng)中的參數(shù)Table 2 The parameters in the second and fourth robot arm systems
系統(tǒng)的狀態(tài)初始值選取為:
在設(shè)計的控制器(6~7)和自適應(yīng)律(8~9)的作用下,其仿真結(jié)果如圖6~圖9 所示.
圖6 智能體(30)中位置狀態(tài)的一致性時間響應(yīng)Fig.6 Consistence time response of position state in agent(30)
盡管各個異質(zhì)非線性智能體的狀態(tài)維數(shù)不同,但在本文設(shè)計的控制器作用下,由圖6 可知,第2個和第4 個智能體系統(tǒng)的所有位置狀態(tài),仍然可以實現(xiàn)一致跟蹤第1 個智能體系統(tǒng)的位置,且第1 個智能體和第4 個智能體的兩個位置狀態(tài)也可實現(xiàn)與第1 個系統(tǒng)的狀態(tài)一致.同理,圖7 中各智能體的速度也可以與第1 個系統(tǒng)的速度實現(xiàn)一致性.從圖8 可以看出,神經(jīng)網(wǎng)絡(luò)中權(quán)重估計值范數(shù)是有界的.圖9 表明各智能體之間的耦合強度也是滿足有界性.
圖7 智能體(30)中速度狀態(tài)的一致性時間響應(yīng)Fig.7 Consistence time response of speed state in agent(30)
圖8 估計值參數(shù) 范數(shù)的時間響應(yīng)Fig.8 Time response of norm of estimated value parameter
圖9 耦合參數(shù)ci 的時間響應(yīng)Fig.9 Time response of coupling parameter ci
針對帶有不同維數(shù)的異質(zhì)非線性多智能體系統(tǒng)的一致跟蹤控制器設(shè)計問題,給出一種帶有相似參量的分布式狀態(tài)反饋自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器設(shè)計方法.該方法充分利用各智能體之間的相似信息,通過相似參量和求解線性矩陣不等式設(shè)計控制增益矩陣,結(jié)合自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器設(shè)計方法,使得不同維數(shù)的異質(zhì)非線性智能體的所有狀態(tài)實現(xiàn)一致性.通過仿真算例可知,本文方法不但可以應(yīng)用于相同維數(shù)的異質(zhì)非線性多智能體系統(tǒng),也可適用于不同維數(shù)的異質(zhì)非線性多智能體的一致性.