張丹丹
(南昌航空大學 信息工程學院,江西 南昌 330063)
多個體網絡由大量個體或節(jié)點相互信息交互耦合而成,每個個體僅能與其周圍鄰居個體進行信息傳遞。由于不需要網絡全局信息,多個體網絡在復雜環(huán)境下具有極強的魯棒性和適應能力,以及節(jié)約成本等優(yōu)點,因而在過去十多年中,多個體網絡的相關研究引起了不同領域學者們的廣泛關注。作為多個體網絡最根本的問題,一致性問題的研究更是受到極大關注,并取得了豐碩成果。在多個體網絡中,一致性是指在沒有中央集總控制情況下,個體間僅通過局部的交互作用使所有個體狀態(tài)趨于相同[1-2],并在多移動機器人編隊控制[3-4]、衛(wèi) 星 姿 態(tài) 同 步[5]等 方 面 具 有 廣 泛 應用。一致性問題的關鍵在于設計合理的一致性協(xié)議,使網絡中的個體能夠就感興趣的狀態(tài)變量達成共識。而作為一致性問題的特例,平均一致性問題則要求最終的一致性值為網絡中所有個體初始狀態(tài)的算術平均。
隨著計算機技術、網絡技術和通信技術的進一步發(fā)展,多個體網絡應用更加廣泛,并涌現(xiàn)出一大批新的更加復雜的應用需求。由于實際通信網絡的數(shù)字通道帶寬有限,從而導致網絡中個體的狀態(tài)信息在發(fā)送給其鄰居個體之前必須進行量化,個體間只能基于量化狀態(tài)信息而非精確狀態(tài)信息進行通信。因而設計有效的量化一致性協(xié)議,使得多個體網絡基于量化信息通信涌現(xiàn)出期望的群體動力學行為,成為近年來多個體網絡研究的一個新熱點課題[6-13]。
常用量化策略主要有均勻量化和對數(shù)量化2類。文獻[6]研究了固定拓撲無向網絡的量化一致性問題,得到了網絡達到平均一致性時量化器參數(shù)與無向網絡拓撲結構參數(shù)間的定量關系。文獻[7]通過設計合適的均勻量化策略,固定拓撲無向網絡中的任意鄰居個體僅需互惠地發(fā)送有限比特量化信息,就足以確保網絡達成平均一致性。但無向網絡要求個體之間必須進行雙向信息傳遞,而不同個體具有不同的信息傳輸能力,因此實際網絡一般都是有向的。因此,基于對數(shù)量化策略,文獻[12]研究了有向平衡網絡的量化一致性問題,并發(fā)現(xiàn)在所提出的量化一致性協(xié)議作用下,所有個體能達成β-平均一致性,即當對數(shù)量化器扇形邊界參數(shù)β趨于0時,網絡中個體漸近地達成平均一致性。但平衡網絡意味著所有個體在網絡中具有同等重要性[2],這一要求在實際應用中過于苛刻。因此,基于均勻量化策略,文獻[9]研究了固定拓撲有向非平衡網絡的量化一致性問題,所提出的量化一致性協(xié)議允許個體之間可以進行單向、非平衡的信息通信。此外,由于一個個體可以進入或離開其他個體的有效感知范圍,這意味著在通信圖中,某些邊被移去或加入了新的邊,從而導致切換拓撲[1-2]。采用自適應均勻量化策略,文獻[8,10]分別研究了無向切換網絡和有向切換網絡的量化一致性問題。
當個體間進行信息交換時,信息傳輸速度通常受到實際通信設備物理性能的限制,這使得發(fā)送方的信息會經過一定時間延遲后才能被接收方收到,從而導致通信時延的產生。因此,研究量化和通信時延共存情形的多個體網絡一致性問題既有極強的實際應用背景,也是非常有必要的。文獻[11]在文獻[7]的基礎上,采用均勻量化策略研究發(fā)現(xiàn)只要無向網絡中個體間的通信時延有上界,則所有個體仍能達成平均一致性。但文獻[11]僅研究了無向網絡情形,從而限制了其應用范圍。
本文在文獻[9,12]的基礎上,采用對數(shù)量化策略研究了量化和時延共存情形下的固定拓撲有向非平衡多個體網絡的一致性問題。結果表明,無論對數(shù)量化信息多么粗糙,只要選取合適的增益參數(shù),則所提出的量化一致性協(xié)議是可接受的,且多個體網絡以指數(shù)速度達成β-加權平均一致性。此外,本文揭示了一致性誤差的上界對對數(shù)量化器扇形邊界參數(shù)β的依賴關系,并用仿真實例驗證了本文理論分析的有效性。本文通過引入時延節(jié)點將系統(tǒng)擴維,將存在通信時延的量化一致性問題轉化為無時延的量化一致性問題,并利用相關強非周期馬爾科夫(Markov)鏈的收斂結論[14]進行一致性分析,而文獻[11]主要運用無向圖的代數(shù)圖譜理論和對稱矩陣分解方法來分析一致性,該方法不適用于本文所考慮的有向網絡。
多個體網絡的通信拓撲通??梢越3捎邢驁DG=(V,ε,W),其中,網絡中個體或節(jié)點集V={1,2,…,N},N 為個體數(shù)目;邊集ε={eij=(i,j)|i,j∈V};與有向網絡相對應的鄰接矩陣W=(wij)∈RN×N,有向邊eji∈ε表示個體j向個體i發(fā)送信息,這時個體j稱為個體i的入度鄰居,此時的有向邊(j,i)對應的邊權wij>0,否則wij=0。若有向圖G中的有序節(jié)點序列(i1,i2,…,ir)滿足eij,ij+1∈ε,j∈{1,…,r-1},則稱該有序節(jié)點序列為有向圖G中的一條有向路徑。如果有向圖G中的任意2個不同節(jié)點i和j之間都存在一條有向路徑,則稱圖G是強連通的。由于每個個體可獲悉自身狀態(tài)信息,本文假定所有個體具有自環(huán)或eii∈ε(i∈V)。如果圖G中任意節(jié)點i的入度和出度都相等,即對任意i∈V,成立,則稱圖G為平衡圖。若W 中的任意元素wij≥0且滿足W1=1,1=(1,1,…,1)T,則W 稱為 (行)隨 機 矩 陣。進 一 步 地,若1TW=1T還成立,則W 稱為雙隨機矩陣,此時網絡對應的有向圖為平衡圖[2]。
對數(shù)量化器可以用非線性函數(shù)q(·):R→Γβ來表示,其作用是將實數(shù)集R映射到離散量化水平集Γβ,并定義為:對任意實數(shù)m,有
對應的離散量化水平集Γβ為:
Γβ= {±vl|vl=ρlv0,l=±1,±2,…}∪ {0}。其中,v0>0為已知常數(shù);0<ρ<1為對數(shù)量化器的密度參數(shù);待設計參數(shù)β=(1-ρ)/(1+ρ)∈(0,1)表示對數(shù)量化器的扇形邊界參數(shù)[12],即對數(shù)量化器滿足:
其中,Δ∈[-β,β]為因對數(shù)量化所導致的誤差。(2)式表明β越大,量化信息越不精確或越粗糙;相反地,β越小則量化信息越接近真實信息。
考慮具有N個個體的多個體網絡,其中個體i∈V具有離散一階動力學[6-11]如下:
其中,xi(k)為個體i在k時刻的狀態(tài);ui(k)為個體i的控制輸入或協(xié)議。
由于個體間信息交換受有限帶寬限制以及通信時延的影響,實際上個體i接收到個體j的信息為:
其中,q(xj(k-τji))為個體i在第k時刻接收到個體j在k-τji時刻的量化狀態(tài);τji為有向邊eji的通信時延。
則由(2)式得:
其中,Δj∈[-β,β];?j∈V。
對網絡拓撲和時延作假設1、假設2。
假設1 有向強連通圖G對應的隨機鄰接矩陣W具有正對角元,即存在一個正數(shù)w滿足;同時wij∈{0}∪[w,1]對任意i≠j成立。
假設2τii=0對任意i∈V成立;當wij=0時,τji=0;存在一個有限正常數(shù)B,對任意i,j∈V滿足0≤τji≤B,即通信時延一致有上界。
對個體i∈V在第k時刻設計的一致性協(xié)議如下:
其中,α∈(0,1]為待定的增益參數(shù);wij為隨機鄰接矩陣W對應位置的元素。由(1)式、(5)式可知,(6)式表明個體i利用了其鄰居個體和自身的量化狀態(tài)信息,因而(6)式由β確定。
利用(4)式,并把(6)式代入(3)式得:
若信息由個體j發(fā)出后經過τji步延遲后到達節(jié)點i,則可以通過在網絡圖G中節(jié)點j和節(jié)
點i之間增加τji個時延節(jié)點來描述時延,而在沒有發(fā)生通信時延的節(jié)點之間則無需增加時延節(jié)點,則整個網絡添加的時延節(jié)點總數(shù)為。 為 敘 述 方 便,本 文 令xN+1(k),…,xb(k)為時延節(jié)點狀態(tài),通過例子說明系統(tǒng)擴維的過程。
例1 設有一個3個節(jié)點的有向強連通圖G,如圖1a所示。設節(jié)點3和節(jié)點1間的時延為2,其他節(jié)點之間無時延,如圖1b所示。
圖1 無時延和存在時延時的網絡圖
設圖1a無時延情況時的隨機矩陣W為:
其各行的行和均為1。
圖1b中,因為節(jié)點3、1間的通信時延為2,故在有向邊e31插入時延節(jié)點和5,這樣節(jié)點3首先發(fā)送信息至第1個時延節(jié)點4,權為34=1,節(jié)點4發(fā)送信息給節(jié)點5,權為54=1,再經由節(jié)點5發(fā)送信息至節(jié)點1,權為15=2/3。從而得到時延情形下的有向圖所對應的鄰接矩陣=j)為:仍為一個隨機矩陣。
由于時延節(jié)點僅傳遞信息而沒有自環(huán),故引入時延節(jié)點后的有向圖所對應的鄰接矩陣所有主對角元素ii不全為正數(shù),表明對應一個不可逆Markov鏈,且該Markov鏈不是強非周期的[12]。因此,目前文獻中許多關于強非周期Markov鏈的收斂結論對本文不再適用。此外,由于不是對稱矩陣,則文獻[9]中對稱矩陣分解方法對本文不再適用。令
其中,ΔN+1(k),…,Δb(k)表示時延節(jié)點所對應的量化不確定性,且滿足:
則通過系統(tǒng)擴維引入時延節(jié)點后,(7)式可寫成為:
其中,迭代矩陣為:
其中,I為適當維數(shù)的單位矩陣。
其中,1=(1,1,…,1)T,同時成立。
根據(jù)(9)式,對迭代矩陣Q(k),πTQ(k)=πT也成立,亦即Q(k)和具有相同的平穩(wěn)分布。因而由(8)式可得:
這意味著在有界時延和量化信息通信情形下,多個體網絡仍保持加權平均一致性不變性[9],當π1=π2=…=πN+b=1/(N+b)時,網絡中所有個體具有同等重要性[2],即退化為平均一致性情形。
令一致性誤差為δ(k)=(I-J)x(k),其中J=1πT。則由(10)式得:
將(11)式帶入(8)式,并利用(9)式可得一致性誤差方程為:
定義1 設個體間基于對數(shù)量化信息通信,若對任意β∈(0,1),在一致性協(xié)議作用下有:
其中,sup表示上確界,則稱一致性協(xié)議為可接受的。進一步地,在可接受一致性協(xié)議作用下,若有:
則稱多個體網絡達成β-加權平均一致性。當扇形邊界參數(shù)β漸近地趨于0時,非時延節(jié)點一致性誤差δ(k)也漸近趨于0。
本文采用對數(shù)量化策略,并給出適當?shù)纳刃芜吔鐓?shù)β設計準則,使得在有界時延與對數(shù)量化信息通信情形下,所提出的一致性協(xié)議能確保多個體網絡達成β-加權平均一致性。
隨機矩陣P描述了一個強非周期Markov鏈,進一步地,定義加性隨機矩陣[14]為:
引理1 隨機矩陣Q描述了一個Markov鏈[14],且具有平穩(wěn)分布π,即,并有:
其中,Qk(i,j)為矩陣Qk第i行第j列位置的元素;1>λ2=λ2(U(P))>0為矩陣U(P)的第二大特征值;πj為滿足(9)式的向量π的第j個分量。
定理1 設假設1、假設2成立,對任意β∈(0,1),若選取,則一致性協(xié)議(6)式是可接受的,且有:
再根據(jù)δ(k)定義,由(18)式可得(12)式,即多個體網絡達成β-加權平均一致性。
證明 對任意β∈(0,1),由于|Δj(k)|≤β<1及0<α≤1/(1+β)<1,因此有‖α(I+Ω(k))‖2≤1,則QT(k)=I-α(I+Ω(k))(I-)T是一個列隨機矩陣(每列的和均為1),且與屬于相同的類[15],并有:
‖Q(k)‖1= ‖QT(k)‖∞=1。
則由(8)式可得:
對向量x(k),‖x(k)‖2≤‖x(k)‖1成立,因而(17)式成立。進一步地,由于x(k)=[x(k),xτ(k)]T,故‖x(k)‖2≤‖x(k)‖2,則由(17)式可得(13)式,即一致性協(xié)議是可接受的。
其中,Ψ∈R(N+b)×(N+b-1)滿足ΨT1=0,并有:
根據(jù)范數(shù)性質和Φ定義,由(16)式和(21)式可得:
進一步地,由于‖Ω(k-s)‖2≤β,則由(17)式、(23)式和(24)式可得:
對任意k≥0,‖~δ2(k)‖2=‖δ(k)‖2成立,當1>λ2>0時,則由(25)式可得(18)式。
定理1表明,只要強連通有向網絡中的通信時延有上界,則對任意β∈(0,1),只要選取α∈(0,1/(1+β)],多個體網絡最終依指數(shù)速度達成β-加權平均一致性,最終所有個體狀態(tài)趨于πTx(0)的鄰域內。且(18)式表明,引入非線性對數(shù)量化過程,一致性誤差上界依賴于個體數(shù)目、通信時延、對數(shù)量化器扇形邊界參數(shù)β和個體初始狀態(tài)值。因此,定理1將無通信時延有向平衡網絡、個體動力學為連續(xù)與采樣一階情形的量化一致性相關結論[12]推廣到存在通信時延有向非平衡網絡、個體動力學為離散一階情形。
考慮如圖1a所示的3個個體有向圖G,個體狀態(tài)初始值x0= (- 2.45 1.57 2.02 )T,并設除自環(huán)外的通信時延τji均為1,且引入的時延個體初始狀態(tài)均設為0,則計算可得基于精確信息通信的多個體網絡一致性值為:
x*= (0. 850 2 0.850 2 0.850 2 )T。仿真中對數(shù)量化器參數(shù)v0取2。
首先令β=0.8∈(0,1),則按照定理1,取α=0.5∈(0,1/(1+β)],迭代40次后的個體狀態(tài)軌跡圖如圖2所示。
圖2 β=0.8,α=0.5時3個個體狀態(tài)軌跡
令β=0.08,取α=0.5,可得迭代40次后的個體狀態(tài)軌跡圖如圖3所示。
圖2和圖3表明,只要強連通網絡中的通信時延有上界,基于任意粗糙量化信息通信的多個體網絡總可以指數(shù)地達成β-加權平均一致性;且對數(shù)量化信息越精確,即β越小,則個體狀態(tài)越趨近于無量化信息通信時的一致性值x*。
圖3 β=0.08,α=0.5時3個個體狀態(tài)軌跡
6 結束語
針對通信時延有界的固定拓撲有向強連通非平衡網絡,本文基于對數(shù)量化策略提出一種量化一致性協(xié)議。進一步利用相關強非周期Markov鏈的收斂結論,證明所提出的量化一致性協(xié)議是可接受的,且無論對數(shù)量化信息多么粗糙,只要選取合適的增益參數(shù),多個體網絡最終以指數(shù)速度達成β-加權平均一致性。此外,解析地揭示了一致性誤差的上界對對數(shù)量化器扇形邊界參數(shù)β的依賴關系,并用仿真例子驗證了本文理論分析的有效性。作為后續(xù)研究,本文將采用對數(shù)量化策略,進一步考慮具有時變通信時延的有向切換網絡量化一致性問題。同時,將本文網絡拓撲的強連通條件弱化為生成樹條件,也將是有待解決的問題之一。
[1] Jadbabaie A,Lin J,Morse A S.Coordination of groups of mobile autonomous agents using nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[2] Olfati-Saber R,Murray R M.Consensus problems in networks of agents with switching topology and time-delays[J].IEEE Transactions on Automatic Control,2004,49(9):1520-1533.
[3] Ou M Y,Du H B,Li S H.Finite-time formation control of multiple nonholonomic mobile robots [J].International Journal of Robust and Nonlinear Control,2014,24(1):140-165.
[4] 蔣建國,夏 娜.基于MAS的分布式智能控制初探[J].合肥工業(yè)大學學報:自然科學版,2005,28(9):1085-1088.
[5] Du H B,Li S H,Qian C J.Finite-time attitude tracking control of spacecraft with application to attitude synchronization[J].IEEE Transactions on Automatic Control,2011,56(11):2711-2717.
[6] Carli R,Bullo F,Zampieri S.Quantized average consensus via dynamic coding/decoding schemes[J].International Journal of Robust and Nonlinear Control,2010,20(2):156-175.
[7] Li T,F(xiàn)u M Y,Xie L H,et al.Distributed consensus with limited communication data rate[J].IEEE Transactions on Automatic Control,2011,56(2):279-292.
[8] Li T,Xie L H.Distributed consensus over digital networks with limited bandwidth and time-varying topologies[J].Automatica,2011,47 (9):2006-2015.
[9] Li D Q,Liu Q P,Wang X F,et al.Consensus seeking over directed networks with limited information communication[J].Automatica,2013,49(2):610-618.
[10] Li D Q,Liu Q P,Wang X F,et al.Quantized consensus over directed networks with switching topologies[J].System and Control Letters,2014,65:13-22.
[11] Liu S,Li T,Xie L H.Distributed consensus for multi-agent systems with communication delays and limited data rate[J].SIAM Journal on Control and Optimization,2011,49(6):2239-2262.
[12] Liu S,Li T,Xie L H,et al.Continuous-time and sampleddata based average consensus with logarithmic quantizers[J].Automatica,2013,49(11):3329-3336.
[13] 李 韜,孟 揚,張紀峰.多自主體量化趨同與有限數(shù)據(jù)率趨同綜述[J].自動化學報,2013,39(11):1805-1811.
[14] Fill J A.Eigenvalue bounds on convergence to stationarity for non-reversible Markov chains,with an application to the exclusion process[J].The Annals of Applied Probability,1991,1(1):62-87.
[15] Wolfowitz J.Products of indecomposable,aperiodic,stochastic matrices[J].Proceedings of the American Mathematical Society,1963,14(5):733-737.
[16] Horn R A,Johnson C R.Matrix analysis[M].Cambridge:Cambridge University Press,1985:33-57.