雷琪,文安格
(中南大學 自動化學院,湖南 長沙,410083)
多智能體系統(tǒng)通過本地控制器相互通信形成一種新的控制方式來完成人們期望的任務,有助于合理分配資源,簡化復雜的操作指令,更快更方便地完成控制任務,通過智能體之間的合作解決單個智能體難以解決的復雜問題。多智能體系統(tǒng)一致性是指隨著時間演化,一個多智能體系統(tǒng)中所有智能體的某一個狀態(tài)趨于一致[1]。一致性協(xié)議用于描述各個智能體之間的信息交互過程,智能體通過網(wǎng)絡交換數(shù)據(jù)獲得相鄰智能體的狀態(tài)信息,然后每個智能體相應地更新其當前狀態(tài)以達到一致。
線性多智能體系統(tǒng)相比于其他系統(tǒng),具有易于控制的優(yōu)點,被廣泛應用于編隊控制[2]、分布式傳感器網(wǎng)絡[3]、機器人控制[4]、故障分析[5]等。在實際的應用中,由于通信寬帶的限制,控制器以及傳感器往往只能獲取離散時間相鄰的智能體之間的狀態(tài)信息,因此,在通常情況下,將離散線性多智能體作為研究對象具有重要的現(xiàn)實意義[6-8]。
智能體在通信網(wǎng)絡進行交互的過程中,網(wǎng)絡有限的寬帶和傳播速度會不可避免地產(chǎn)生網(wǎng)絡時滯,網(wǎng)絡時滯不僅使得系統(tǒng)的設計與分析變得困難,還會使系統(tǒng)的控制性能變差,甚至引起系統(tǒng)的不穩(wěn)定。為了在實際的應用中提高系統(tǒng)可靠性,有必要考慮網(wǎng)絡時滯對系統(tǒng)的影響。OLFATISABER 等[9]研究了具有時滯的多智能體系統(tǒng)一致性問題。MUNZ 等[10]給出了同時存在傳輸時滯和輸入時滯的一階多智能體是否能達到一致的判定條件。JIANG 等[11]認為時滯離散多智能體系統(tǒng)能否達到一致性與傳輸時滯無關,只與輸入時滯相關。文獻[12]對微網(wǎng)系統(tǒng)中分布式控制算法進行了擴展,采用基于特征值的分析方法,計算了通信延遲的最大允許上界。但是以上研究都是針對定長時滯的情況,而在實際的應用系統(tǒng)中,時滯往往是以時變形式存在的。考慮一類有上下界且變化規(guī)律已知的時變時滯,文獻[13]給出了在有界通信時變時滯下平均一致性存在的充分條件;在此基礎上,針對相同形式的時變時滯,劉忠信等[14]提出一種基于觀測器的一致性控制算法以實現(xiàn)系統(tǒng)狀態(tài)不可測和時變時延下的多智能體一致性。但以上研究都是針對具有一定變化形式的時變時滯,沒有考慮到隨機變化的時變時滯。
同時,上述時滯處理方法大部分只考慮了時滯對于系統(tǒng)的影響,但不能很好地消除或者補償時滯的消極作用,并且對于時滯都以最大上界處理,而實際時滯往往遠遠小于時滯上界,統(tǒng)一為上界的處理方式具有極大的保守性。因此,學者們對時滯的主動補償方面進行了深入研究,探討消除時滯消極影響的方法。文獻[15-16]中設計了模糊滑??刂破饕灾鲃酉龝r滯的消極影響,但需要提前獲得時滯的準確值。ZHANG等[17]針對輸入時滯設計了一個主動補償時延的輸出反饋控制器。預測控制策略在主動補償網(wǎng)絡引起的時滯方面有較好效果。佟世文等[18-20]提出網(wǎng)絡預測控制策略對時滯進行主動補償,ZHANG等[21]提出了一種預測控制器主動補償通信通道中存在的時滯問題,有效地減少了時滯對于系統(tǒng)的影響。文獻[22]就時滯和丟包問題提出了新的預測控制算法,并給出了穩(wěn)定性分析條件。LIU等[23]針對系統(tǒng)存在定常時滯的情況,給出了預測系統(tǒng)的穩(wěn)定性判據(jù)。
此外,傳統(tǒng)的周期采樣控制方法需要智能體之間進行持續(xù)的更新和通信,但系統(tǒng)里的控制器應該盡可能地減少控制更新的頻率,以減少通信時間和設備磨損成本[24-25]。由此,DING 等[26]提出了事件觸發(fā)機制。相比于周期采樣控制,事件觸發(fā)機制主要基于如下思想:只有滿足預先定義的事件觸發(fā)條件時,智能體之間才會發(fā)生控制的更新和通信,可以在減少通信次數(shù)的基礎上達到與周期采樣控制相同的控制效果。在系統(tǒng)廣泛存在網(wǎng)絡時滯問題的情況下,CHENG等[27]提出了一種基于局部信息的時滯事件觸發(fā)策略并保證了系統(tǒng)的魯棒性。此外,對于時變時滯,WANG 等[28]提出了一個基于事件觸發(fā)的平均一致性協(xié)議以減少控制器之間的通信次數(shù),并且構造Lyapunov-Krasovskii 泛函得到充分條件。MIAO 等[29]提出了針對時滯的一階多智能體系統(tǒng)的事件觸發(fā)算法以減少控制更新。
本文針對通信中存在隨機時變時滯的離散線性多智能體系統(tǒng),將預測控制的思想應用于多智能體時滯問題上,設計一種時變時滯離散線性多智能體系統(tǒng)一致性算法。該一致性算法最大的特點是:一方面,設計一種基于預測控制的分段時變時滯主動補償方法,用預測輸出信息替代原本受時滯影響的輸出信息,以主動補償隨機時變時滯對系統(tǒng)的影響;另一方面,引入事件觸發(fā)機制替代傳統(tǒng)的時間觸發(fā)機制,有效地減少控制器更新和通信的次數(shù),在盡可能少的通信次數(shù)下使得多智能體系統(tǒng)達到穩(wěn)定。然后,利用基于延遲劃分的Lyapunov-Krasovskii泛函穩(wěn)定性分析方法,分析在事件觸發(fā)框架下的具有時變時滯的多智能體系統(tǒng)的穩(wěn)定性與一致性。最后,進行仿真實驗,以驗證所提方法的有效性和優(yōu)越性。
對于由n個智能體組成的系統(tǒng),其拓撲結構可以用圖G=(V,E,A)表示。其中,V={1,…,n},為多 智 能 體 系 統(tǒng) 的 節(jié) 點 集;E={(i,j)|i,j=1,…,n;i≠j}?V×V,為 智 能 體 的 邊 集 合;若(i,j)∈E,則 節(jié) 點i被 稱 為 節(jié) 點j的 鄰 節(jié) 點。A=[aij]n×n,為鄰接矩陣;若智能體i和智能體j之間能進行信息傳輸,則aij>0;反之,則aij=0;L=[lij]n×n,為G的拉普拉斯矩陣,其中:
對于無向圖來說,其L是對稱的,如果圖G中所有的節(jié)點都存在路徑,即aij=aji,則稱圖G是連通的。若圖是連通的,則拉普拉斯矩陣L僅有一個零特征值,除此之外其余特征值均大于零,rank(L) =n-1。
考慮一類由N個離散線性智能體組成的多智能體系統(tǒng),智能體i的離散模型序列可表示為
式中:k為離散采樣時刻;k+1 為下一采樣時刻;yi(k)和ui(k)分別為智能體i在k時刻的輸出和控制輸入信息;z-1為滯后時間;T為采樣周期。
系統(tǒng)離散模型系數(shù)的多項式可表示為
式中:nui和nyi分別為智能體i的輸入階次和輸出階次, 也是多項式Ai(z-1) 和Bi(z-1) 的階次;ai1,ai2,…,ainyi和bi1,bi2,…,binyi為智能體模型系數(shù)。
每個智能體都有自己的控制器以使多智能體系統(tǒng)保持穩(wěn)定,可以根據(jù)控制領域內(nèi)的多種經(jīng)典控制方法設計控制器。記智能體的局部控制器為Gi(z-1) =Di(z-1)/Ci(z-1),離散模型序列可表示為
控制器離散模型系數(shù)的多項式可表示為
式中:nci和ndi分別為控制器的輸入階次和輸出階次;ci1,ci2,…,cinci和di0,di1,…,dindi為 控 制 器 模 型系數(shù)。
假設1離散線性多智能體系統(tǒng)的網(wǎng)絡通信拓撲結構采用無向圖G表示,圖G是連通的且無權重的。
假設2離散線性多智能體系統(tǒng)通信網(wǎng)絡中存在通信時滯,記為τ(k),且通信網(wǎng)絡中的時滯是變化未知的隨機時變時滯,有上下界,滿足h1≤τ(k)≤h2。
為了盡可能地減少控制器的更新次數(shù)和傳輸信息次數(shù),并考慮多智能體系統(tǒng)通信通道中時變時滯,本文設計一種僅取決于智能體自身輸出信息和鄰居智能體輸出信息的事件觸發(fā)閾值函數(shù)fi(k):
在事件觸發(fā)機制下,智能體只需根據(jù)輸出信息判斷是否滿足事件觸發(fā)閾值函數(shù),當滿足fi(k)>0時,控制器才會控制更新和進行信息傳輸;否則,控制器不會進行任何動作。因此,智能體的下一個觸發(fā)時刻定義為
由式(7)知,當智能體i執(zhí)行事件觸發(fā)指令時,ei(k)會被清零,且觸發(fā)時刻之間至少相差一個采樣周期T。
基于上述討論,本文提出基于事件觸發(fā)時滯補償?shù)囊恢滦钥刂茀f(xié)議:
式中:Ki為調(diào)節(jié)參數(shù),表示智能體之間的聯(lián)系的強弱程度,且Ki>0;為已知的外部參考輸入,只有部分智能體可以接收;Γ為帶有外部參考輸入的智能體集合;Ω為不帶有外部參考輸入的智能 體 集 合;為鄰居智能體預測輸出信息;。
注1本文給定一個外部的參考輸入,最終多智能體系統(tǒng)能夠達到外部一致性。外部一致性與以往的平均一致性問題不同,其收斂值由給定的外部參考輸入決定,而與智能體的初始值無關。因此,對于初始值可能為零的智能體系統(tǒng),外部一致性協(xié)議也適用,尤其是在實際控制系統(tǒng)中,研究與初始值相關的一致性控制問題并不合適,外部一致性的研究顯得更有現(xiàn)實意義并且其適用性更廣。
注2與之前的一致性控制協(xié)議相比,引入事件觸發(fā)機制以減少不必要的控制器更新與通信,并且離散系統(tǒng)觸發(fā)時刻之間至少相差一個采樣周期,有效地避免了Zeno 行為的發(fā)生。在此基礎上,本文設計的基于時滯補償?shù)囊恢滦钥刂扑惴?式(8))采用鄰居智能體預測輸出信息替代原來受時變時滯影響的信息,主動補償時變時滯對系統(tǒng)的影響。
在實際通信中,由網(wǎng)絡延遲導致的時滯具有較強的隨機性,且大多時候遠遠小于其上界,將隨機時變時滯統(tǒng)一處理為其上界,顯然具有較強的保守性?;谘舆t劃分的思想,對隨機時變時滯進行分段處理,相比于統(tǒng)一處理為時滯最大上界的情況,可以更靈活地應對時變時滯對于系統(tǒng)的影響,減少計算量,處理也更精確。
當智能體i滿足fi(k)>0,智能體i會更新信息并將信息發(fā)送給鄰居智能體。為了減少時變時滯的影響,設計一種基于事件觸發(fā)機制的分段時滯補償方法,將時滯區(qū)間分成M份(M為正整數(shù)),用于分段預測智能體時刻k-τ(k)+1 到時刻k的輸出序列。
本文考慮將時變時滯等分為M份的情況,即[h1,h12], (h12,h13],…, (h1M,h2],時變時滯τ(k)在某一時刻的值均在這M份中??紤]在τ(k)∈[h1,h12]時刻,預測的輸出為從k-h12+1到時刻k的序列。為了簡便,令
結合式(2)、(8)和式(9),可得向前預測一步的輸出值的計算式:
由(13)可知,智能體向前預測一步的輸出信息可由當前時刻信息與過去時刻可得信息計算得到。由式(10)~(13)繼續(xù)遞推,能夠得到智能體向前預測p步的計算公式(其中p=1,2,…,h12):
由式(14)~(16)可以得到智能體向前預測p步的輸出方程(式(17)),該方程一部分是由預測信息序列組成,一部分是由過去可得信息序列組成。也就是說,對于智能體下一步的預測行為信息的決策不僅基于當前可得的信息,也基于未來時刻的預測信息。
經(jīng)過上述步驟能得到智能體i的預測輸出序列:
依此類推,通過網(wǎng)絡接收到智能體j的信息:
為了主動補償時變時滯所帶來的負面影響,需要從預測序列中分段選擇相對應的預測輸出信息。
式中:S為選擇器,,預測輸出序列通過通訊網(wǎng)絡傳導給其他智能體。
依此類推,可以采用同樣的方法得到余下(M-1)份時變時滯部分對應的的預測輸出信息并選擇對應的預測輸出值。
針對在事件觸發(fā)框架下的具有時變時滯的多智能體系統(tǒng)的穩(wěn)定性與一致性進行研究。為了方便討論,首先提出如下假設。
假設3只有智能體i=1與外部參考輸入相連。
Lyapunov-Krasovskii穩(wěn)定性判據(jù)推導需要用到的相關引理如下。
引理1[30]對于任意的正定常數(shù)矩陣ψ、常數(shù)?≥?0≥1和向量函數(shù)?(i),下面的不等式均成立:
基于Lyapunov-Krasovskii穩(wěn)定性判據(jù)推導,提出如下定理:
注4時滯所分的區(qū)間越多,獲得的理論結果中能保證系統(tǒng)穩(wěn)定的時滯最大值也越大[32],所推導出的結論保守性越低,即所得結論的保守性隨著分段數(shù)增大而降低。然而,這會增大計算量,從計算量和結論保守性之間綜合考慮,把時滯區(qū)間分成二段或三段是比較恰當?shù)?,這同時保證了計算量的簡潔性和結論的較低保守性。
注5對于時變時滯τ(k) ∈[h1,h2],為了簡便起見,仿真實驗中將時變時滯等分為兩段(M=2),即[h1,h12]和(h12,h2]。另外,對于不分段的情況,對于本文構造的泛函V(k),令h12=h13…=h1M=0 即可。推導過程以及證明過程與上文同理。
注6對于選定的h1和h2,若對于任一τ(k)∈[h1,h1+1,…,h12,h12+1,…,h2],都 有ΔV(k)<0,則τ(k)≤h2,選取滿足此條件的最大的h2,即為選擇時變時滯多智能體系統(tǒng)所能容忍的最大時滯上界。
本文針對離散線性多智能體系統(tǒng)通信中存在的隨機時變時滯問題,提出基于預測控制的分段時滯彌補一致性控制算法,減少時變時滯對多智能體系統(tǒng)的影響,并采用事件觸發(fā)機制以減少通信資源的浪費。為了驗證所提方法的有效性與可行性,本節(jié)利用Matlab/Simulink 平臺進行模型搭建與仿真。
用于仿真實驗的多智能體系統(tǒng)包含4 個智能體,分別命名為智能體1、智能體2、智能體3 和智能體4。各個智能體的離散線性模型以及保證無網(wǎng)絡時滯系統(tǒng)能達到穩(wěn)定的局部控制器的離散線性模型分別如下。
智能體1,
智能體2,
智能體3,
智能體4,
根據(jù)式(8)所提的一致性控制算法,給定一個外部輸入,使得多智能體系統(tǒng)能夠達到外部一致性,其中只有部分多智能體能夠接收到外部參考信息的輸入,在本節(jié)的仿真實驗中假設只有智能體1與外部參考輸入相連,并且各個智能體之間相互通信的示意圖如圖1所示。由圖1可見通信拓撲是無向且不加權的。
圖1 多智能體系統(tǒng)通信示意圖Fig. 1 Communication diagram of multi-agent system
本文設計的基于事件觸發(fā)的一致性控制算法中的參數(shù)Ki為大于零的正調(diào)節(jié)系數(shù),用于調(diào)節(jié)智能體之間聯(lián)系的強弱程度。在滿足系統(tǒng)穩(wěn)定性的要求下,應選擇合適的Ki參數(shù)即(K1,K2,K3,K4)=(0.1,4.2,3.0,4.5)。
此外,智能體的觸發(fā)時刻取決于參數(shù)γi,過低的γi將會使得觸發(fā)條件變得苛刻,系統(tǒng)很難滿足事件觸發(fā)的條件,過高的γi則不能達到本文所提的盡可能減少通信次數(shù)的目的;此外,選擇參數(shù)時還需要保證系統(tǒng)的穩(wěn)定,基于此,選擇參數(shù)γ1=γ2=γ3=γ4=0.002,采樣周期T=0.1 s。
為了驗證所提方法的有效性,取時變時滯τ(k)為隨機時變時滯,且滿足上下界要求,但是時變時滯的變化率是未知且隨機的,給定的隨機時變時滯τ(k)的形式如圖2所示。
圖2 隨機時滯形式Fig. 2 Form of time-varying delay
為了測試時滯對系統(tǒng)的影響,經(jīng)過計算和仿真,在不考慮時滯補償?shù)囊话阈问降囊恢滦钥刂扑惴ㄏ?,系統(tǒng)的最大容許時滯上界h2為5T,即系統(tǒng)在通信隨機時變時滯τ(k)∈[0, 5T]時能夠達到漸近穩(wěn)定,如圖3 所示。當τ(k)≥5T時,系統(tǒng)開始產(chǎn)生明顯的震蕩。圖4所示為時滯為h2=6T時多智能體系統(tǒng)的輸出。由此可見,在沒有時滯補償?shù)那闆r下,系統(tǒng)可容許的最大時滯為5T,時滯增大會使得系統(tǒng)產(chǎn)生諸多不穩(wěn)定的情況,甚至可能會造成系統(tǒng)的不穩(wěn)定。因此,考慮時滯的主動補償,有必要消除時滯對于系統(tǒng)的影響。
圖3 隨機時變時滯最大上界h2=5T時無時滯補償多智能體系統(tǒng)的輸出Fig. 3 Output of multi-agent system without delay compensation when the maximum bound of time-varying delay h2=5T
圖4 隨機時變時滯最大上界h2=6T時無時滯補償多智能體系統(tǒng)的輸出Fig. 4 Output of multi-agent system without delay compensation when the maximum bound of time-varying delay h2=6T
圖5所示為系統(tǒng)最大時滯上界h2=6T時,加入預測控制的時滯補償方法后的輸出。由圖5 可見:對被時變時滯影響的輸出信息進行提前預測,可消除隨機時變時滯對系統(tǒng)的震蕩影響,相比無時滯情況系統(tǒng)收斂速度有所下降,但是系統(tǒng)對于時滯的控制效果得到改善,系統(tǒng)不僅能夠達到外部一致性,實現(xiàn)零穩(wěn)態(tài)誤差跟蹤,而且?guī)缀踅咏鼰o網(wǎng)絡時滯時的控制效果。
圖5 隨機時變時滯最大上界h2=6T時有時滯補償多智能體系統(tǒng)的輸出Fig. 5 Output of multi-agent system with delay compensation when the maximum bound of time-varying delay h2=6T
基于時間延遲劃分的思想,本文綜合考慮計算量和保守性,將時變時滯等分為兩部分,即選取M=2,在此基礎上構造基于延遲劃分的Lyapunov-Krasovskii 泛函,選取時變時滯下界h1=0,求解線性矩陣不等式,當時變時滯不分段時,最大容許時滯上界h2=40T,時滯分段后得到的最大容許時滯上界更大,h2=50T,即系統(tǒng)的保守性更小。通過仿真進行比較,當未進行時滯分段,系統(tǒng)時滯最大上界h2=50T時,多智能體系統(tǒng)無法達到一致性,無法實現(xiàn)零誤差跟蹤,波動較大,如圖6所示。進行時滯分段后,多智能體系統(tǒng)的輸出如圖7所示。由圖7可見:在同樣的隨機時變時滯情況下,多智能體系統(tǒng)雖然有一定的波動,但是系統(tǒng)在經(jīng)過適當時間的調(diào)整后,仍然可以實現(xiàn)穩(wěn)定性與一致性,并實現(xiàn)零誤差跟蹤,驗證了所提方法在保守性方面的優(yōu)勢。
圖6 隨機時滯最大上界h2=50T時未分段的時滯方法補償多智能體系統(tǒng)的輸出Fig. 6 Output of multi-agent system with unsegmented delay compensation when the maximum bound of timevarying delay h2=50T
圖7 隨機時滯最大上界h2=50T時分段的時滯補償方法多智能體系統(tǒng)的輸出Fig. 7 Output of multi-agent system with segmented delay compensation when the maximum bound of timevarying delay h2=50T
此外,為了減少設備的損耗以及通信更新的次數(shù),本文采用事件觸發(fā)機制。在仿真過程中采用基于周期采樣框架下的一致性控制算法與基于事件觸發(fā)機制下的一致性控制算法進行對比實驗,各個控制器的動作次數(shù)如表1所示,事件觸發(fā)機制的時間間隔如圖8 所示。由表1 和圖8 可見,在周期采樣下,控制器總共觸發(fā)了4 000次,它在每個采樣周期都進行控制器的更新與通信,而在事件觸發(fā)機制下,智能體控制器僅在滿足觸發(fā)條件時才有所動作,控制器的更新次數(shù)明顯低于周期采樣下的控制器更新次數(shù),這樣能以更少的控制器更新與通信次數(shù)使系統(tǒng)達到穩(wěn)定。由此可見,事件觸發(fā)機制可以有效地提高資源利用率,減少設備的損耗,在應用上具有更大的優(yōu)越性。
表1 觸發(fā)次數(shù)Table 1 Trigger times
圖8 事件觸發(fā)機制下的時間間隔Fig. 8 Time interval under event triggered mechanism
1) 基于延遲劃分思想,設計基于預測控制的時滯分段主動補償?shù)姆椒ǎ穗S機時變時滯的不良影響,并且相比于僅根據(jù)時滯最大上界進行時滯處理的方法,其可以更加靈活地處理隨機時滯問題。
2) 結合事件觸發(fā)機制設計一致性協(xié)議,能夠提高資源利用率,減少設備的損耗。
3) 將多智能體系統(tǒng)一致性分析轉(zhuǎn)化為穩(wěn)定性分析,采用基于延遲劃分的Lyapunov-Krasovskii泛函穩(wěn)定性分析方法,得到多智能體系統(tǒng)實現(xiàn)穩(wěn)定性和一致性的充分條件,相比于未進行延遲劃分的情況,系統(tǒng)保守性降低。
4) 通過Matlab/Simulink 平臺進行仿真實驗,驗證了所提方法的有效性和優(yōu)越性。