馬梓元,萬茹,龔華軍,王新華
(南京航空航天大學(xué)自動化學(xué)院,南京 211106)
多智能體系統(tǒng)(Multi-agent system,MAS)概念的提出旨在解決復(fù)雜控制系統(tǒng)中多個被控對象同時參與多種控制任務(wù)的問題,并且被廣泛應(yīng)用于無人機[1]、航天器[2]和無人船[3]等領(lǐng)域。當(dāng)前,多智能體系統(tǒng)在理論及工程應(yīng)用領(lǐng)域都得到極大關(guān)注,多智能體系統(tǒng)的研究通常針對復(fù)雜條件下一階、二階甚至更高階智能體模型之間的協(xié)同控制[4-5],同時被控對象的自適應(yīng)能力與更好的編隊跟蹤能力也成為研究學(xué)者重點關(guān)注的問題,并在無人飛行器感知及協(xié)同編隊、復(fù)雜航天器協(xié)同自適應(yīng)控制[6]等領(lǐng)域取得了較為矚目的理論及應(yīng)用成果。
MAS 通常由智能體的動力學(xué)模型集合、通信拓撲和分布式控制器3個基本要素構(gòu)成。有關(guān)于分布式控制器的設(shè)計則往往基于通信拓撲下跟蹤誤差的重新整定。一致性控制問題是MAS 的主要研究分支之一,旨在利用通信網(wǎng)絡(luò)拓撲實現(xiàn)MAS 內(nèi)每個智能體向參考指令的一致性跟蹤。每個智能體的跟蹤控制器需考慮通訊拓撲結(jié)構(gòu),即認(rèn)為跟蹤控制器輸出信號的計算依賴于通信網(wǎng)絡(luò)拓撲,以及在該網(wǎng)絡(luò)拓撲下的一致性跟蹤誤差,具有顯著的聚集行為特征。
然而,在多智能體系統(tǒng)一致性跟蹤控制問題的研究中,關(guān)于部分狀態(tài)信息丟失的研究較少,尤其在部分通道信息整體丟失時,如何利用降維輸出變量構(gòu)建基于輸出調(diào)節(jié)的一致性跟蹤控制器,成為MAS 一致性控制問題中的新難點。當(dāng)前,關(guān)于輸出調(diào)節(jié)問題的研究仍多集中于單一被控對象,如文獻[7]在固定翼飛行器的控制律設(shè)計中,運用輸出調(diào)節(jié)模型參考自適應(yīng)方法將飛機的近似開環(huán)線性模型配置到穩(wěn)定的閉環(huán)極點上,而文獻[8]則進一步討論了該方法所采用的輸出變量信號的最小階數(shù)。文獻[9]提出一種基于反步法的輸出調(diào)節(jié)方法,結(jié)合狀態(tài)觀測器設(shè)計輸出調(diào)節(jié)自適應(yīng)控制器。上述方法雖然解決了單一被控對象的輸出調(diào)節(jié)問題,但考慮MAS 一致性控制問題中虛擬誤差變量引入后的控制器實現(xiàn),上述方法仍不能直接應(yīng)用,需要依據(jù)通信拓撲進行進一步改進。
同時,在實際控制系統(tǒng)中,盡管MAS 的開環(huán)動力學(xué)模型中每個智能體的狀態(tài)都為連續(xù)時間狀態(tài),但控制器的實際輸入受到控制回路中執(zhí)行機構(gòu)及硬件電路的影響,往往被視為一類量化的輸入信號。有關(guān)于量化控制信號的概念最早出現(xiàn)于網(wǎng)絡(luò)控制系統(tǒng)的研究中,指控制信號在通信中不可避免地被轉(zhuǎn)化為一類或幾類量化信號,實際控制輸入則由量化信號給出。量化輸入信號的引入將降低閉環(huán)控制系統(tǒng)性能,因此針對量化輸入問題的研究在近年逐漸獲得關(guān)注,并取得一些理論進展??紤]到系統(tǒng)內(nèi)部參數(shù)的不確定性,部分基于自適應(yīng)量化控制的方案也逐漸被提出,但大多基于單一動力學(xué)系統(tǒng)。比較常見的自適應(yīng)量化控制方案大多基于單輸入單輸出系統(tǒng)假設(shè),基于反步法控制架構(gòu)解決嚴(yán)格反饋系統(tǒng)下的控制問題。文獻[10-14]對輸出調(diào)節(jié)及外界擾動抑制問題進行了相應(yīng)的研究。文獻[15-16]采用基于卡爾曼濾波的模型參考魯棒自適應(yīng)控制器,通過卡爾曼濾波器對系統(tǒng)狀態(tài)進行預(yù)估的方式,提高控制系統(tǒng)性能。然而,針對MAS 系統(tǒng)的輸入量化問題卻很少得到研究,其主要原因在于MAS系統(tǒng)在考慮通信拓撲及內(nèi)部智能體參數(shù)耦合后,嚴(yán)格反饋系統(tǒng)假設(shè)可能不成立,同時基于反步法的控制結(jié)構(gòu)導(dǎo)致MAS 系統(tǒng)控制效率顯著降低。因此在MAS框架下研究輸入量化問題也具有較大的難度。
本文提出一種基于一致性理論的輸出調(diào)節(jié)量化自適應(yīng)跟蹤控制算法,用于解決參數(shù)不確定條件下MAS系統(tǒng)的編隊跟蹤問題。并針對無人機-無人船組成的異構(gòu)多智能體系統(tǒng)模型開展數(shù)值仿真,驗證本文提出的控制算法的有效性。
首先針對由N智能體組成的MAS 中每個智能體進行建模。認(rèn)為第i個智能體可以描述為Mi輸入Mi輸出的近似線性時不變系統(tǒng)形式,i=1,2,…,N,MAS系統(tǒng)動力學(xué)模型可描述成下述形式:
在本文中,考慮量化輸入的MAS 閉環(huán)系統(tǒng)的設(shè)計將依賴于下式:
式中:A,B,C為未知的系統(tǒng)狀態(tài)參數(shù)矩陣。由式(4)改寫得到的輸入輸出描述為:
式中:Gi(s)為第i個智能體的輸入-輸出傳遞函數(shù),G(s)則為MAS系統(tǒng)的輸入-輸出傳遞函數(shù)矩陣。
引理 1[17].為便于后續(xù)推導(dǎo),給出如下引理,對于任意M×M的有理嚴(yán)格正實矩陣,即傳遞函數(shù)矩陣Gi(s),存在下三角多項式矩陣ξm(s)為Gi(s)的左乘正交矩陣,其矩陣形式為:
本文控制器的設(shè)計基于如下假設(shè):
假設(shè) 1.系統(tǒng)G(s)=C(sI-A)-1B漸近穩(wěn)定且可觀測。由此保證本文MAS 閉環(huán)系統(tǒng)可控,且狀態(tài)信息全可獲取。
假設(shè) 2.Gi(s)為滿秩矩陣且其左乘正交矩陣ξm已知。
本文利用固定有向拓撲進行MAS 通信網(wǎng)絡(luò)的描述。圖論用于描述MAS 系統(tǒng)中智能體之間的通信流向,詳見參考文獻[17]中的具體解釋。將MAS中的有向拓撲圖表達為G=(V,E,A),其中V={vi,i=1,…,N}為拓撲圖的節(jié)點集合,E?V×V為邊界集合,A=[ai,j]∈RN×N為拓撲圖的鄰接權(quán)值矩陣,且對于(i,j) ∈E,i≠j,aij=1,否則aij=0。同時,定義L=D-A為G=(V,E,A)的Laplacian 矩陣,其中D=diag(d1,…,dn) (n=1,2,…,N),di=
定義一個編號為0 的虛擬領(lǐng)航者,讓其跟隨參考指令輸出ym領(lǐng)航者,則可以將有向拓撲圖G=(V,E,A)擴展為其中為相應(yīng)擴展的邊界集和鄰接權(quán)值矩陣。
本文假定各跟隨者的輸出yi狀態(tài)維數(shù)相同且與ym保持一致,通過設(shè)計控制器使得每個跟隨者的狀態(tài)yi(t)一致性趨近ym(t)。
定義第i個智能體的輸出跟蹤誤差為:
若僅對每個獨立智能體進行控制,則控制目標(biāo)為ei(t)有界。為解決MAS 系統(tǒng)的一致性跟蹤問題,進一步定義針對第i個智能體的一致性輸出跟蹤誤差矩陣?i(t)如下:
上式中,若第j個智能體可獲取領(lǐng)航者的狀態(tài)信息,則di=1,否則di=0。將MAS 跟蹤誤差與一致跟蹤誤差表達為:
則?與e有如下關(guān)系:
編隊跟蹤控制的目標(biāo)為使?有界。運用多變量模型參考自適應(yīng)(MRAC)方案對MAS 進行輸出匹配,即要求被控對象跟蹤下述參考模型:
式中:r∈RM為有界的參考輸入信號,根據(jù)假設(shè)2,容易得出Wm(s)是穩(wěn)定的。
標(biāo)稱控制結(jié)構(gòu)主要用于給出各模型參考已知且不考慮輸入量化前提下的控制器輸出反饋形式。在模型參數(shù)已知的前提下,針對第i個智能體,首先利用系統(tǒng)輸出yi=Cixi觀測系統(tǒng)狀態(tài)并基于觀測狀態(tài)設(shè)計反饋控制結(jié)構(gòu)。給出基于觀測狀態(tài)設(shè)計的標(biāo)稱反饋控制律:
由于需確保設(shè)計的控制器能夠使閉環(huán)系統(tǒng)配置到參考模型上,給出下述標(biāo)稱控制器參數(shù)和匹配條件:
由此,全狀態(tài)觀測器表達為:
求解式(16),容易得到:
式中:εi0(t)代表由初值引起的誤差影響,通??杀缓雎?,Λi(s)=det(sI-+)。將標(biāo)稱控制器的狀態(tài)反饋部分表示為:
在本文探討的控制問題中,狀態(tài)空間參數(shù)矩陣Ai,Bi,Ci均未知,且控制輸入引入了額外的延遲量化信號。在上述條件下,考慮基于自適應(yīng)律估計各反饋增益。然而,對三個狀態(tài)矩陣Ai,Bi,Ci的直接自適應(yīng)估計存在較為復(fù)雜的耦合,因此考慮在頻域內(nèi)對高頻增益矩陣Kpi進行LDS分解,實現(xiàn)自適應(yīng)估計變量的解耦和參數(shù)化。給出如下假設(shè):
假設(shè)3.高頻矩陣Kpi的所有順序主子式Δi,i=1,2,…,M都是非零的,并且它們的符號已知。這樣的Kpi具有非唯一的LDS矩陣分解
考慮到輸出量化問題,對第i個智能體,給定一個虛擬輸入變量vi,引入一個穩(wěn)定的多項式f(s),其次數(shù)等于左交互矩陣ξm(s)的最大次數(shù)。定義濾波器h(s)=1/f(s),將自適應(yīng)編隊跟蹤控制器表述為:
式中:η>0 為待整定系數(shù),m由(32)給出。針對每個智能體的輸出跟蹤誤差,代入控制器(21),將跟蹤誤差改寫為:
利用高頻增益矩陣Kpi的LDS 分解對每個智能體跟蹤誤差中的自適應(yīng)變量實現(xiàn)參數(shù)化求解,同時將式(22)改寫為:
進一步將該方程進行參數(shù)化,利用濾波器h(s)對估計誤差方程進行修正,將等式表示為:
則等式進一步改寫為:
為實現(xiàn)控制對象向參考模型的跟蹤,除了要求跟蹤誤差收斂外,還需實現(xiàn)模型的輸出匹配,即要求高頻增益矩陣及控制器參數(shù)收斂到標(biāo)稱值。基于每個智能體的輸出跟蹤誤差首先構(gòu)建第i個智能體的參數(shù)估計誤差方程:
對本文提出的基于自適應(yīng)律設(shè)計的參數(shù)估計有界性進行分析。定義Lyapunov函數(shù)如下:
考慮量化輸入信號q(u),根據(jù)文獻[11],認(rèn)為:
根據(jù)式(36),式(35)中部分項可改寫為:
根據(jù)Young不等式[16],有:
式中:kd>0為待定系數(shù)。從而將式(38)整理為:
回顧控制器(21),根據(jù)文獻[12],存在下述關(guān)系:
結(jié)合L+D>0,S=ST>0,則有:
式(40)可進一步整理為:
根據(jù)式(43),將式(35)最終化簡為:
為驗證本文提出的編隊控制方法可行性和有效性,在MATLAB 環(huán)境下開展p艘無人船與q架無人機組成的異構(gòu)MAS系統(tǒng)在xoy二維平面內(nèi)的編隊數(shù)值仿真,p≥2,q≥2,p+q=N。對q架無人機的飛行編隊,給出第i架無人機的運動學(xué)方程如下:
式中:xi,yi代表第i架無人機在x,y方向的位置,vi為第i架無人機速度,ψi為第i架無人機的航向角,ωi為第i架無人機的航向角速度。無人機的動力學(xué)方程采用簡化的近似線性狀態(tài)方程,第i架無人機的動力學(xué)方程如下:
式中:Ai,Bi,Ci為第i架無人機的狀態(tài)矩陣,mi=[vi,ωi]T,模型控制 輸入ui=[δTi,δri]T為油門開度與差動副翼舵偏角。無人機動力學(xué)模型表示成式(4)的形式,則第i架無人機狀態(tài)變量表示為=[xi,yi,ψi,vi,ωi]T,模型輸出為=[fi,li]T,其中fi,li分別代表無人機前向與側(cè)向位移,其表達為:
對p艘無人船組成的航行編隊,第j艘無人船的運動學(xué)方程如下:
式中:xj,yj為第j艘無人船位置,ψj為第j艘無人船偏航角,uj,vj,rj分別為無人船在船體坐標(biāo)系下的前向速度、側(cè)向速度及偏航角速度,j=q+1,…,N。無人船的動力學(xué)模型如下:
式中:mu,mv,mr為船體慣性參數(shù),控制輸入uj=[τuj,τrj]T,非線性項fw(w),fv(v),fr(r)定義為
無人機動力學(xué)模型參數(shù)由文獻[18]給出,無人船動力學(xué)模型參數(shù)由文獻[19]給出。無人機數(shù)量為2架,無人船數(shù)量為2艘。輸入量化參數(shù)δ=0.8,umin=0.02。將參考模型選取為:
參考輸入指令選取為:
仿真結(jié)果如圖1~2所示。仿真結(jié)果表明,在無人船控制通道采取量化輸入形式時,各閉環(huán)信號仍能保證對時變參考輸出信號的一致跟蹤,從而驗證了本文所提出的編隊控制算法的有效性。
圖1 各輸出響應(yīng)一致性跟蹤結(jié)果Fig.1 Consensus tracking result of each response
圖2 量化輸入結(jié)果Fig.2 Results of quantized input
本文提出了一種基于輸出調(diào)節(jié)量化自適應(yīng)一致性的編隊跟蹤算法,用于解決硬件在環(huán)假設(shè)下控制輸入量化后的異構(gòu)多智能體一致性跟蹤控制問題?;谳敵稣{(diào)節(jié)思想,認(rèn)為系統(tǒng)內(nèi)部分狀態(tài)整體丟失或不能獲取,利用僅有的降維輸出實現(xiàn)各閉環(huán)信號的一致性有界跟蹤。通過理論分析及數(shù)值仿真分別驗證了所提出方法的有效性。