秦補(bǔ)枝
(南京科技職業(yè)學(xué)院自動(dòng)控制系)
一種新型多智能體固定目標(biāo)控制算法①
秦補(bǔ)枝
(南京科技職業(yè)學(xué)院自動(dòng)控制系)
提出一種新型的多智能體固定目標(biāo)控制算法。某個(gè)智能體到達(dá)固定目標(biāo)的附近區(qū)域時(shí),在該智能體與目標(biāo)之間增加反饋控制器,使得智能體與固定目標(biāo)之間的通信量減少。最后通過仿真證明了該算法的有效性。
多智能體 固定目標(biāo) 控制算法
隨著計(jì)算機(jī)技術(shù)和通信網(wǎng)絡(luò)的迅速發(fā)展,復(fù)雜網(wǎng)絡(luò)的研究已經(jīng)滲透到很多方面,如疾病的傳播、交通運(yùn)輸及電力傳輸?shù)取Q芯空邚膹?fù)雜網(wǎng)絡(luò)理論的角度對它們進(jìn)行分析研究,將這些問題歸納為一個(gè)復(fù)雜網(wǎng)絡(luò)系統(tǒng),每一個(gè)執(zhí)行環(huán)節(jié)作為一個(gè)節(jié)點(diǎn),并且為智能節(jié)點(diǎn),具有復(fù)雜動(dòng)力學(xué)行為,由這些節(jié)點(diǎn)組成的網(wǎng)絡(luò)行為就變得異常復(fù)雜。因此,分析和控制這些網(wǎng)絡(luò)的復(fù)雜行為成為研究的熱點(diǎn)之一[1~18]。 由于網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和動(dòng)力學(xué)行為相互影響,使這個(gè)問題更加難以解決。特別是通過對網(wǎng)絡(luò)中的少數(shù)節(jié)點(diǎn)增加線性誤差反饋控制,使得整個(gè)網(wǎng)絡(luò)穩(wěn)定到一個(gè)均勻的平衡點(diǎn)狀態(tài),即網(wǎng)絡(luò)中的每個(gè)節(jié)點(diǎn)的狀態(tài)都穩(wěn)定到單個(gè)節(jié)點(diǎn)的平衡點(diǎn)上[1~3]。這種控制方法增加了每一時(shí)刻節(jié)點(diǎn)之間的通信量,不易實(shí)現(xiàn)。為了減少智能體與固定目標(biāo)之間的及時(shí)通信量,筆者提出了一種基于事件驅(qū)動(dòng)的固定目標(biāo)跟蹤策略,即當(dāng)某個(gè)智能體的狀態(tài)與固定目標(biāo)的狀態(tài)接近時(shí),對該智能體施加反饋控制,使得智能體與固定目標(biāo)之間的通信量減少,跟蹤速度加快,提高跟蹤效率。
假設(shè)一個(gè)網(wǎng)絡(luò)由N個(gè)相同的節(jié)點(diǎn)組成,構(gòu)成了連續(xù)時(shí)間耗散耦合的動(dòng)態(tài)網(wǎng)絡(luò),其中第i個(gè)節(jié)點(diǎn)的狀態(tài)方程為:
(1)
當(dāng)t→∞時(shí):
x1(t)=x2(t)=…=xN(t)=s(t)
(2)
智能體i的事件驅(qū)動(dòng)函數(shù)定義為:
αi(t)=‖xi(t)-s‖-β,i=1,2,…,N
(3)
其中β>0 ,‖·‖ 代表歐幾里德范數(shù)。 筆者設(shè)計(jì)的控制率為:
ui(t)=-γicμ(xi(t)-s)
(4)
其中μ是跟蹤目標(biāo)與智能體之間的耦合強(qiáng)度;γi由事件驅(qū)動(dòng)函數(shù)αi(t) 的符號決定:
(5)
定義矩陣B為:
B={bij}N×N=A-μ·diag[γ1(t),γ2(t),…,γN(t)]
(6)
由文獻(xiàn) [1,2]可知矩陣B是負(fù)定,其特征值可以寫為0≥λ1(B)≥λ2(B)≥…≥λN(B)。因?yàn)槭录?qū)動(dòng)函數(shù)的存在,使得在某些時(shí)刻存在所有的智能體都不在跟蹤目標(biāo)的吸引區(qū)域內(nèi),而不觸發(fā)事件驅(qū)動(dòng)函數(shù),因此有可能使得式(6)的第2項(xiàng)為0,導(dǎo)致矩陣B的最大特征值為0。
定理1 考慮多智能體(1),其控制輸入(4)在事件驅(qū)動(dòng)函數(shù)(5)的作用下,如果矩陣Df(s)+ηIn×n的所有特征值具有負(fù)實(shí)部,則該多智能體系統(tǒng)能夠局部指數(shù)穩(wěn)定到系統(tǒng)的獨(dú)立狀態(tài)(2)中的s。其中In×n為n維單位陣,η<0。有:
cλ1(B)≤η
(7)
證明將式(1)在平衡點(diǎn)s附近進(jìn)行線性化得到:
(8)
其中Df(s)∈Rn×n是函數(shù)f()在s上的雅可比矩陣,φ=(φ1,φ2,…,φN)T,φi(t)=xi(t)-s。
由式(6)知:
Bφi=λi(B)φi,i=1,2,…,N
(9)
將式(9)代入式(8)得到:
=(Df(s)+cλi(B)I)φi
(10)
i=1,2,…,N
由于0≥λ1(B)≥λ2(B)≥…≥λN(B),即只需要滿足(Df(s)+cλ1(B)I)<0即可使得式(10)中的N個(gè)方程式滿足指數(shù)穩(wěn)定的條件。由式(7)可知,對于一個(gè)非線性函數(shù),其雅可比矩陣可以確定得到,這樣選擇合適的節(jié)點(diǎn)之間的耦合強(qiáng)度c可使得N個(gè)方程式滿足指數(shù)穩(wěn)定。
在系統(tǒng)的初期,可能會(huì)存在所有智能體的狀態(tài)都不能觸發(fā)事件驅(qū)動(dòng)函數(shù),即所有的節(jié)點(diǎn)狀態(tài)與所需要達(dá)到的固定目標(biāo)距離比較遠(yuǎn),此時(shí)對應(yīng)的λ1(B)=0,因此式 (7)不能寫成:
(11)
為了能在系統(tǒng)初始時(shí)對選擇智能體之間的耦合強(qiáng)度提供一個(gè)依據(jù),筆者建議系統(tǒng)初始的耦合強(qiáng)度取為:
(12)
其中ν>0為一個(gè)無窮小的正數(shù)。
由于混沌系統(tǒng)存在各態(tài)歷經(jīng)性,隨著時(shí)間的推移,必然有智能體的狀態(tài)接近固定目標(biāo),從而觸發(fā)事件驅(qū)動(dòng)函數(shù),使得整個(gè)系統(tǒng)能夠達(dá)到跟蹤固定目標(biāo)的目的。
復(fù)雜動(dòng)態(tài)網(wǎng)絡(luò)中單個(gè)節(jié)點(diǎn)的狀態(tài)為典型的陳系統(tǒng),其動(dòng)力學(xué)方程為:
(13)
此時(shí),陳系統(tǒng)節(jié)點(diǎn)為一個(gè)混沌系統(tǒng)(圖1)[19]。
圖1 混沌的陳系統(tǒng)示意圖
令式(13)右端等于零,得到陳系統(tǒng)的一個(gè)平衡點(diǎn)(7.9373, 7.9373,21),將它作為本次仿真的固定目標(biāo)。
考慮一個(gè)經(jīng)典的由100個(gè)節(jié)點(diǎn)組成的BA無標(biāo)度網(wǎng)絡(luò)模型,它的生成算法可參考文獻(xiàn)[20],初始節(jié)點(diǎn)為3個(gè),每增加一個(gè)節(jié)點(diǎn)增加3條邊,單個(gè)節(jié)點(diǎn)的動(dòng)力學(xué)為陳系統(tǒng)。
假設(shè)每個(gè)節(jié)點(diǎn)代表一個(gè)智能體,它要跟蹤的目標(biāo)為100個(gè)智能體的平均狀態(tài)。在圖2、3中,采用的是相同的無標(biāo)度網(wǎng)絡(luò)模型,并且節(jié)點(diǎn)和跟蹤目標(biāo)之間的耦合強(qiáng)度都設(shè)為12,每個(gè)智能體的初始狀態(tài)都隨機(jī)分布在[-5,5],只有事件驅(qū)動(dòng)函數(shù)的參數(shù)β發(fā)生了變化。
a. xi1
b. xi2
c. xi3
a. xi1
b. xi2
c. xi3
仿真結(jié)果表明,所有的智能體都能很好地跟蹤固定目標(biāo)。通過對比圖2、3,不難發(fā)現(xiàn)事件驅(qū)動(dòng)函數(shù)的發(fā)生閾值β越大,多智能體越早完成了跟蹤任務(wù)。
提出一種新型的基于事件驅(qū)動(dòng)的多智能體固定目標(biāo)跟蹤算法。理論和仿真結(jié)果表明,隨機(jī)分配系統(tǒng)中所有智能體的初始狀態(tài),經(jīng)過一段時(shí)間的調(diào)整,最后系統(tǒng)能夠跟蹤到目標(biāo),并且進(jìn)入穩(wěn)定狀態(tài)。即該固定目標(biāo)跟蹤控制算法是切實(shí)可行的。
[1] Wang X F, Chen G R.Pinning Control of Scale-free Dynamical Networks[J]. Physica A:Statistical Mechanics and Its Applications,2002, 310(3-4):521~531.
[2] Li X, Wang X F,Chen G R.Pinning a Complex Dynamical Network to Its Equilibrium[J].IEEE Transactions on Circuits and Systems I: Regular Papers,2004, 51(10):2074~2087.
[3] Lu W L, Chen T P. New Approach to Synchronization Analysis of Linearly Coupled Ordinary Differential Systems[J].Physica D:Nonlinear Phenomena, 2006, 213(2):214~230.
[4] Olfati-Saber R,Jalalkamali P.Coupled Distributed Estimation and Control for Mobile Sensor Networks[J].IEEE Transactions on Automatic Control, 2012, 57(10):2609~2614.
[5] Gupta R, Bandyopadhyay B, Kulkarni A M.Power System Stabilizer for Multi-machine Power Systems Using Robust Decentralized Periodic output Feedback[J].IEEE Proceedings of Control Theory and Applications, 2005,152 (1):3~8.
[6] Chen T P, Liu X,Lu W L. Pinning Complex Networks by a Single Controller[J].IEEE Transactions on Circuits and Systems I-Regular Papers,2007, 54(6):1317~1326.
[7] Zhan M, Gao J H,Wu Y,et al.Chaos Synchronization in Coupled Systems by Appling Pinning Control[J].Physical Review E, 2007, 76:36203.
[8] Lu W L. Adaptive Dynamical Networks via Neighborhood Information:Synchronization and Pinning Control[J].Chaos: An Interdisciplinary Journal of Nonlinear Science, 2007, 17(2):23122.
[9] Zhou J, Lu J A,Lu J H. Pinning Adaptive Synchronization of a General Complex Dynamical Network[J].Automatica,2007, 44(4):996~1003.
[10] Sorrentino F,Bernardo M D,Garofalo F,et al. Controllability of Complex Networks via Pinning[J].Physical Review E,2007, 75:46103.
[11] Amaral L A N,Guimera R. Lies, Damned Lies and Statistics[J].Nature Physics,2006, 2(2):75~76.
[12] McGraw P N, Menzinger M. Clustering and the Synchronization of Oscillator Networks[J].Physical Review E,2005, 72:15101.
[13] Kim B J. Performance of Networks of Artificial Neurons: The Role of Clustering[J].Physical Review E,2004, 69:45101.
[14] Li X, Chen G R.A Local-world Evolving Network Model[J].Physica A: Statistical Mechanics and Its Applications,2003, 328(1-2):274~286.
[15] Barrat A, Weigt M. On the Properties of Small-world Network Models[J].European Physical Journal B,2000, 13(3):547~560.
[16] Boccaletti S, Latorab V, Moreno Y,et al.Complex Networks:Structure and Dynamics[J].Physics Reports,2006, 424(4-5):175~308.
[17] Li X, Wang X F.Controlling the Spreading in Small-world Evolving Networks: Stability, Oscillation,and Topology[J].IEEE Transactions on Automatic Control,2006, 51(3):534~540.
[18] Restrepo J G, Ott E,Hunt B R.Onset of Synchronization in Large Networks of Coupled Oscillators[J].Physical Review E,2005, 71:36151.
[19] Chen G, Ueta T.Yet another Chaotic Attractor[J]. International Journal of Bifurcation and Chaos,1999,9(7): 1465~1466.
[20] Barabasi A L. Linked: The New Science of Networks[M]. Massachusetts: Persus Publishing,2002.
ANovelControlAlgorithmforMulti-agentFixedTarget
QIN Bu-zhi
(DepartmentofAutomation,NanjingPolytechnicInstitute)
A novel control algorithm for multi-agent fixed targets was proposed. When an agent reaches the region nearby the fixed target, adding a feedback controller between this agent and the tracking target can reduce communication load there effectively. Simulation result proves effectiveness of this algorithm proposed.
multi-agent, fixed target, control algorithm
TP393
A
1000-3932(2017)03-0258-04
江蘇省2014年青藍(lán)工程資助項(xiàng)目;江蘇省第五期“333高層次人才培養(yǎng)工程”培養(yǎng)對象項(xiàng)目。
秦補(bǔ)枝(1975-),副教授,主要從事非線性控制和復(fù)雜網(wǎng)絡(luò)分析與控制方向的研究,68084819@qq.com。
2016-09-26)