戴國忠 王懷龍(91655部隊北京100036)
時延約束下多智能體編隊的集結(jié)控制?
戴國忠 王懷龍
(91655部隊北京100036)
對時延影響下多智能體編隊的集結(jié)進行了研究,提出了一種與模型相關(guān)的控制算法。同時,運用Lyapunov穩(wěn)定性理論、代數(shù)圖論和矩陣分析等工具,證明了控制器的穩(wěn)定性。研究結(jié)果表明:多智能體編隊可以在時延約束的無向通信圖下,達到集結(jié)。最后,運用三自由度(Three Degree of Freedom,3-DOF)的無人水下航行器(Unmanned Underwater Vehi?cles,UUV)進行數(shù)值仿真,驗證了控制算法的有效性。
多智能體編隊;集結(jié);時延;UUV
ClassNumber TP242.6
近年來,多智能體編隊的協(xié)同控制已成為國內(nèi)外的研究熱點。當前,一些學(xué)者研究了理想通信條件下[1~3]多智能體編隊的集結(jié)控制,即所有智能體的廣義坐標趨于相同,且廣義速度趨于零。然而,多智能體編隊的信息在傳輸過程中,不可避免地會存在時間延遲,如何利用滯后信息實現(xiàn)多個智能體的集結(jié)[4~7]是一個具有重要現(xiàn)實意義的課題。
針對存在時延的無向通信網(wǎng)絡(luò),本文運用Ly?apunov穩(wěn)定性理論、代數(shù)圖論和矩陣分析等工具,設(shè)計一個時延控制器,研究了多智能體編隊的集結(jié)控制,提出了一個判據(jù),并運用3-DOF的UUV進行數(shù)值仿真實驗,使得多個智能體實現(xiàn)集結(jié)目標。
考慮n個智能體,第i個的動力學(xué)模型可由拉格朗日方程[8~9]描述為
式中:qi?Rp為位置向量;qi?Rp為速度向量;Mi(qi)?Rp′p為對稱的慣性矩陣;Ci(qi,qi)?Rp′p為科氏力和向心力矩陣;gi(qi)?Rp為重力約束向量;τi?Rp為控制輸入。本文的控制目標為:設(shè)計一個分布式控制器,使得隨著t?¥,qi(t)-qi(t)?0,qi(t)?0,i=1,2,…,n,即n個智能體實現(xiàn)了集結(jié)。
首先,提出如下與模型相關(guān)且?guī)в醒a償項的控制器
式中:Hi為待定的正定矩陣;aij30和bij30,i,j=1,2,…,n,分別表示智能體i和智能體j的位置信息及速度信息的交互關(guān)系,且aij>0(bij>0),如果智能體i和j可以進行信息qk(t)(qk(t))的交互,k=i,j,否則aij=0(bij=0)。本文研究的智能體之間的位置向量拓撲圖GA和速度向量拓撲圖GB都是無向的,即aij=aji,bij=bji,i,j=1,2,…,n。位置信息和速度信息的鄰接矩陣分別定義[10~11]為A=[aij]?Rn′n和B=[bij]?Rn′n。相應(yīng)地,Laplacian矩陣定義[12]為LA=[?Rn′n,
在實際應(yīng)用中,由于網(wǎng)絡(luò)擁塞和信道質(zhì)量的影響,信息在傳輸時,不可避免地存在時間延遲。因此,提出如下具有恒定時延的控制器
由式(4)和(5),可得誤差系統(tǒng)
式(6)改寫為
定理對系統(tǒng)(1),運用控制器(3),如果GA和GB都是無向連接,且存在一個正定矩陣H,使得D<0,那么多個智能體實現(xiàn)了集結(jié)控制。其中:
證明:考慮如下Lyapunov-Krasovskii函數(shù)
進一步地,結(jié)合式(9)和(10),可得
同時,由于通信圖GA和GB都是無向連接,則Laplacian LA和LB為半正定矩陣。因此,若存在一個正定矩陣H,使得D<0,那么v<0。也就是說,多智能體實現(xiàn)了集結(jié)。
證畢。
本文研究了多智能體編隊在恒定時延約束下,達到集結(jié)。由于拉格朗日系統(tǒng)的高度非線性等因素的影響,為了實現(xiàn)集結(jié)目標,設(shè)計的控制器引入了兩個非線性補償項,控制器的結(jié)構(gòu)較為復(fù)雜。在下一步的研究中,如何對控制器進行優(yōu)化以及考慮其他通信約束,如量化、丟包以及噪聲等,都將是一項非常具有挑戰(zhàn)性的課題。
通過6個3-DOF的UUV進行數(shù)值仿真實驗,證明控制算法的有效性。假定6個UUV具有相同的位置向量為qi=(qi1,qi2,qi3)T?R3,i=1,…,6。同時,假定6個UUV的位置和速度拓撲圖(GA和GB)是相同的,如圖1所示。
選取如下的UUV基本參數(shù)和初始狀態(tài)
質(zhì)量m=125,水動力系數(shù)Xú=-62,Yv=-62,Nr=-30,Xu=-48,Yv=-48,Nr=-80。同時,初始位置(qi1(0),qi2(0),qi3(0))= (10i,10i,10i),初始速度(qi1(0),qi2(0),qi3(0))= ((i-1)+2,(i-1)+1,(i-1)+2),i=1,…,6。
令r=2,基于Matlab軟件,通過線性矩陣不等式(LinearMatrix Inequality,LMI)工具箱,可得一個正定矩陣Hi=diag{50,55.2,50.7}。圖2~4描述了6個UUV的3個位置分量的誤差軌跡,可以看出:最終6個航行體的位置趨于相同。
相應(yīng)地,圖5~7為6個UUV的3個速度分量的變化軌跡,可以知道:最終6個航行體的速度趨于零。綜上所述,6個UUV實現(xiàn)了集結(jié)。
本文實現(xiàn)了多智能體編隊在時延條件下的集結(jié)控制,提出一種與模型相關(guān)的右邊連續(xù)控制算法,不僅從理論上證明了一致性算法的有效性,而且通過Matlab軟件進行數(shù)值仿真實驗,驗證了理論結(jié)果的正確性。在下一步的工作中,與模型無關(guān)的控制器或通信中的其他約束等都將是一個非常值得研究的方向。
[1]Wang H L.Flocking of networked uncertain Euler-La?grange systems on directed graphs[J].Automatica,2013,49:2774-2779.
[2]Ren W.Distributed leaderless consensus algorithms for networked Euler-Lagrange systems[J].International Jour?nalof Control,2009,82(11):2137-2149.
[3]Ren W.Distributed attitude synchronization formultiple rigid bodies with Euler-Lagrange equations of motion[C]//Proceedings of the 46thIEEE Conference on Decision and Control,New Orleans,LA,USA,2007:2363-2368.
[4]Chopra N,Stipanovic D M,Spong MW.On synchroniza?tion and collision avoidance formechanical systems[C]// Proceedings of the American Control Conference,Westin Seattle Hotel,Seattle,Washington,USA,2008,:3713-3718.
[5]劉源,閔海波,王仕成,等.時延網(wǎng)絡(luò)中Euler-Lagrange系統(tǒng)的分布式自適應(yīng)協(xié)調(diào)控制[J].自動化學(xué)報,2012,38(8):1270-1279.
[6]Chung SJ,Ahsun U,Slotine JJE.Cooperative robotcon?trol and concurrent synchronization of lagrangian systems[J].IEEE Transactions on robotic,2009,25(3):686-700.
[7]Abdessameud A,Polushin IG,Tayebi A.Synchroniza?tion of lagrangian systems with irregular communication delays[J].IEEE Transactions on Automatic Control,2014,59(1):187-193.
[8]Wang H L,Wu X F,Chen Y,et al.Rendezvous for the Lagrange network systems via quantized data exchange[C]//Proceedings of the 28thChinese Control and Decision Conference,Yinchuan,2016:4863-4867.
[9]王懷龍,吳曉鋒,陳云,等.多拉格朗日航行體編隊在量化及噪聲下的集結(jié)[J].華中科技大學(xué)學(xué)報(自然科學(xué)版),2016,44(8):46-51.
[10]Mehyar M,Spanos D,Pongsajapan J,et al.Distributed averaging on asynchronous communication networks[C]//Proceedings of the 44thIEEE Conference on Deci?sion and Control,and the European Control Conference,Spain,2005:7446-7451.
[11]Lewis F L,Jagannathan S,Yesildirek A.Neuralnetwork control of robot manipulators and non-linear systems[M].New York:Taylor&Francis,1998.
[12]吳澤偉.主-從Euler-Lagrange系統(tǒng)同步研究[D].武漢:海軍工程大學(xué),2013.
Rendezvous Control for TheM ulti-agent Form ation w ith Tim e Delay
DA IGuozhong W ANG Huailong
(No.91655 Troopsof PLA,Beijing 100036)
This paper investigates the rendezvous for themulti-agent formation with time delay.Amodel-dependent controlal?gorithm is presented.Meanwhile,the stability of controller is proved bymeans of the Lyapunov stability theory,algebraic graph the?ory,andmatrix.It is shown that the rendezvous is achieved in an undirected graph of time delay.At last,a numerical example for 3-DOFUUV verifies the effectivenessof the controlalgorithms.
multi-agent formation,rendezvous,time delay,UUV
TP242.6 DO I:10.3969/j.issn.1672-9730.2017.05.007
2016年11月27日,
2016年12月20日
戴國忠,男,高級工程師,研究方向:指揮自動化。王懷龍,男,博士,研究方向:復(fù)雜系統(tǒng)協(xié)同控制。