楊 輝,宗西舉,2?,鄭澤陽,徐秀妮
(1.濟(jì)南大學(xué)自動化與電氣工程學(xué)院,山東濟(jì)南 250022;2.濟(jì)南大學(xué)信息科學(xué)與工程學(xué)院,山東濟(jì)南 250022;3.隴東學(xué)院電氣工程學(xué)院,甘肅慶陽 745000)
隨著傳感器技術(shù)、人工智能技術(shù)和分布式網(wǎng)絡(luò)的迅速崛起,多智能體系統(tǒng)(multi-agent systems,MAS)成為控制科學(xué)和人工智能等領(lǐng)域的研究熱點,引起了廣大學(xué)者的關(guān)注[1].智能體之間的信息交互通過網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)進(jìn)行,相對于單個個體(智能體)而言,多智能體系統(tǒng)具有更強(qiáng)的控制能力和協(xié)調(diào)能力,從而能夠解決單個個體無法實現(xiàn)的功能,因此被廣泛應(yīng)用于電網(wǎng)經(jīng)濟(jì)調(diào)度優(yōu)化、無人機(jī)編隊聯(lián)合偵查與搜索、衛(wèi)星集群通信、智能交通與物流等領(lǐng)域.多智能體系統(tǒng)的協(xié)調(diào)控制研究包括多個方面,如編隊控制、同步穩(wěn)定、蜂擁控制等,而其中最基本的問題是多智能體系統(tǒng)的一致性問題[2-6].
一致性問題的研究成為各類企業(yè)提高生產(chǎn)率的關(guān)鍵,藍(lán)寶石生產(chǎn)工藝便是其中之一.工業(yè)藍(lán)寶石是氧化鋁的晶體,是國民經(jīng)濟(jì)、國防工業(yè)和科學(xué)技術(shù)發(fā)展必不可少的基礎(chǔ)材料和重要的戰(zhàn)略物資[7].在藍(lán)寶石結(jié)晶初期,融融狀態(tài)的藍(lán)寶石引晶點處溫度檢測和控制對后續(xù)整個結(jié)晶過程起到至關(guān)重要的作用,由于工業(yè)藍(lán)寶石的熔點溫度為2050?C,所以目前不存在有效的自動溫度檢測手段與檢測設(shè)備來獲得如此高溫,工程中現(xiàn)行的檢測方法是利用一根細(xì)長的、外部包裹了透明合金材料的晶體深入加熱爐內(nèi),并置細(xì)晶體棒的一端于熔融狀態(tài)的藍(lán)寶石中心上方2 ~3 cm,通過人眼不定期地觀察晶體棒端點來近似估計熔融狀態(tài)藍(lán)寶石中心的溫度.
很多藍(lán)寶石企業(yè),為了提高成產(chǎn)效率,引入了多智能體系統(tǒng).在工業(yè)生產(chǎn)中,將多臺加熱爐聯(lián)接成網(wǎng)絡(luò),通過控制其中部分加熱,利用加熱爐之間的信息傳遞,可以實現(xiàn)自動化與網(wǎng)絡(luò)化同步控制,既能節(jié)約成本又能提高生產(chǎn)效率,這就是本文要研究的網(wǎng)絡(luò)化系統(tǒng)的狀態(tài)一致性控制問題.
目前,一方面由于實際工程中許多系統(tǒng)模型均不能質(zhì)點化,并且一、二階常微分方程(ordinary differential equation,ODE)建模的多智能體系統(tǒng)相對完善,但基于偏微分方程(partial different equation,PDE)建模的多智能體系統(tǒng)的研究沒有得到同樣程度的重視,所以在這方面存在很大的挖掘空間[8-10].一般來說,利用ODE或PDE對一些系統(tǒng)建模都不能完美的接近實際的模型,但ODE與PDE相互耦合的級聯(lián)系統(tǒng)卻能完美的逼近實際系統(tǒng)[11-13].其中,由于大部分實際工程的需要,如水利、鉆井、電加熱爐等常見工業(yè)生產(chǎn)模型,其分布參數(shù)控制系統(tǒng)往往需要在邊界耦合集中參數(shù)控制系統(tǒng).并且大部分都是通過對邊界進(jìn)行控制.正如文獻(xiàn)[14]研究了麥克斯韋方程與熱方程的耦合;文獻(xiàn)[15]用一類ODE與KDV(korteweg-de vries equation)方程邊界級聯(lián)的形式,來簡化存在機(jī)械振動的潛水波模型;文獻(xiàn)[16]利用反映-擴(kuò)散-對流方程對冶金固定床內(nèi)部顆粒發(fā)生化學(xué)反應(yīng)的動力學(xué)行為進(jìn)行建模.所以本文選擇ODE-熱方程級聯(lián)的方式對藍(lán)寶石加熱爐進(jìn)行建模.
另一方面,由于實際傳感器測量速度的限制,網(wǎng)絡(luò)帶寬限制以及系統(tǒng)處理速度等各類因素的限制,顯然連續(xù)時間控制器很難滿足控制要求,而離散信號是很容易獲取的,并且連續(xù)時間控制器的離散和采樣已成為有限維多智能體系統(tǒng)的研究熱點[5,9].雖然出現(xiàn)了許多優(yōu)秀的控制方案,但觸發(fā)頻率較高,仍然可能會造成計算資源和能量的不必要損耗.為了解決上述問題,受到文獻(xiàn)[10,17-18]等文章的啟發(fā),針對ODE-熱方程建模的加熱爐多智能體系統(tǒng),為降低控制器的要求,本文提出了事件觸發(fā)控制方案,并利用Lyapunov函數(shù)驗證在事件觸發(fā)條件下該系統(tǒng)的穩(wěn)定性.
本文所考慮的熱方程左邊界為Neumann邊界條件,與ODE系統(tǒng)耦合,右邊界為絕熱邊界條件,采用這種方式對系統(tǒng)進(jìn)行建模,更加符合實際工程,并且所有智能體通過全聯(lián)通有向拓?fù)溥M(jìn)行通信.設(shè)計了ODE-熱方程級聯(lián)系統(tǒng)的同步控制器與事件觸發(fā)的同步控制器,與之比較,事件觸發(fā)控制值只在觸發(fā)時刻進(jìn)行更新,很大程度上,節(jié)約了計算資源,降低了控制器的負(fù)載.通過Lyapunov穩(wěn)定性分析,證明了誤差系統(tǒng)可以收斂到一致的值,選取5個智能體進(jìn)行仿真驗證,證明了事件觸發(fā)控制器的有效性.
為了便于研究多智能體系統(tǒng),研究學(xué)者引入了圖論知識G=(V,E,A),用于分析所有智能體之間的信息交換,其中節(jié)點集V={1,2,···,N},代表系統(tǒng)中的每個智能體;邊集E=V×V,表示智能體之間的通信連接.Ni={j ∈V:(i,j)∈V},代表智能體i的鄰點集.鄰接矩陣A=[aij]∈Rn×n表示節(jié)點之間的連接關(guān)系,其中aij=1表示節(jié)點j能夠獲取節(jié)點i的信息,否則aij=0.度矩陣D用來描述與之連接的所有節(jié)點的連接度.定義節(jié)點Vi的入度為deginVi=那么在圖G的度矩陣D=[Dij]中,Dij=0,?i≠j且Dii=degoutVi[8,18-19].
在競爭激烈的今天,每個細(xì)節(jié)都能決定企業(yè)的成功與否.其中制藥工程、晶體結(jié)晶、發(fā)酵工藝等都對溫度有嚴(yán)格的要求.正如藍(lán)寶石工藝,在加熱的過程中,會形成固體與液體交接的情況.藍(lán)寶石的溫度分布應(yīng)該保證固體與液體交接點的變化滿足工程實際需要,即固體與液體交接點的變化速度不能過快或者過慢,否則會導(dǎo)致藍(lán)寶石結(jié)晶過程中晶體因受熱不均而發(fā)生炸裂,或者與加熱爐粘連,從而影響晶體質(zhì)量.然而藍(lán)寶石加熱爐是通過給外部的鎢棒網(wǎng)通電進(jìn)行加熱的,所以最終目的是通過改變鎢棒網(wǎng)的電壓來實現(xiàn)溫度控制,從而使固液交接點處的溫度分布均勻,其加熱爐如圖1所示.
圖1中: 1表示CCD攝像機(jī);2表示目鏡;3表示旋轉(zhuǎn)擋板驅(qū)動;4表示旋轉(zhuǎn)擋板把手;5表示擋板;6表示隔熱層;7表示孔洞;8表示提拉桿;9表示坩堝壁;10表示籽晶;11表示鎢加熱器;12表示爐壁;13表示熔融狀藍(lán)寶石.
利用各向同性性質(zhì),歸一化處理后,可以將熔融狀態(tài)的藍(lán)寶石溫度分布用抽象的一維反應(yīng)擴(kuò)散方程近似描述,因此系統(tǒng)模型可表示為
其中:N為智能體的個數(shù),i表示第i個智能體,z(t)表示電源控制器內(nèi)部的狀態(tài)變量和加熱爐內(nèi)鎢棒網(wǎng)的溫度,ω(x,t)為藍(lán)寶石溶液在x位置t時刻的溫度分布,其狀態(tài)空間為H:=L2(0,1),x表示空間坐標(biāo).通過對電源z(t)的控制改變藍(lán)寶石溫度分布ω(x,t)以保證固體與液體交接點x的變化滿足工程實際需要.鎢棒網(wǎng)與溶液邊界直接耦合,由于位置x的對稱性,交接點兩側(cè)的溫度近似相同,所以交接點不存在熱交換,因此可以將另一側(cè)邊界假設(shè)為絕熱條件.
根據(jù)圖論知識,針對具有N個智能體的多智能體系統(tǒng),第i個智能體的狀態(tài)為ωi(x,t),若系統(tǒng)中每個智能體的狀態(tài)都達(dá)到一致,需要滿足
本文目的是通過控制電源,最終使所有狀態(tài)能夠自發(fā)的達(dá)成一致,也就是說,液體熱量最終能夠在各個位置相同.接下來將設(shè)計通信交互協(xié)議,并證明該通信協(xié)議能夠使系統(tǒng)穩(wěn)定,并給出了事件觸發(fā)控制方案,從而能夠節(jié)約成本.
假設(shè)1假設(shè)系統(tǒng)(1)的連接方式由全聯(lián)通有向拓?fù)鋱DG=(V,E)來描述.圖G的拉普拉斯矩陣L可以表示為
或常用L(A)=L(G)來表示圖G的拉普拉斯矩陣.
定義1設(shè)X是線性賦范空間,X上的單參數(shù)強(qiáng)連續(xù)有界線性算子族T(t)稱為算子半群,簡稱C0半群[20].對任何t>0,T(t)都是線性有界算子,且滿足
定義2在線性賦范空間X上滿足‖T(t)‖≤1,?t≥0的C0半群稱為壓縮C0半群.
定義3線性賦范空間X上一線性算子A稱為耗散的,如果對任意x ∈D(A),?x?∈D′(A),使Re〈Ax,x?〉≤0,若A還滿足R(λ-A)=X,?λ>0,則稱A為耗散的[21].
定理1設(shè)A是線性賦范空間X中的一稠定算子,則以下條件等價:
若A是耗散的,且?λ0>0使得R(λ0-A)=X,則A生成X上的壓縮C0半群.
若A生成X上的壓縮C0半群,則A是耗散的,且R(λ-A)=X,?λ>0,此外
由于級聯(lián)系統(tǒng)存在耦合的邊界條件,傳統(tǒng)的ODE或PDE的多智能體一致性控制已不能滿足需求,若繼續(xù)使用傳統(tǒng)的一階多智能體控制器的設(shè)計形式,穩(wěn)定性證明時則會產(chǎn)生不穩(wěn)定的耦合項,因此本文根據(jù)級聯(lián)系統(tǒng)特性重新設(shè)計一致性同步協(xié)議并予以證明.
對于型如系統(tǒng)(1)的多智能體ODE-熱方程級聯(lián)系統(tǒng),設(shè)計控制器
其中:c>0,k>0均是常數(shù),L是拉普拉斯矩陣,I表示單位矩陣,ω(x,t)和z(t)均為N維向量,將控制器(2)代入系統(tǒng)(1),可以得到級聯(lián)系統(tǒng)如下:
引理1(文獻(xiàn)[8]引理3.1) 對于任意的z(t)∈(0,∞),ω0(x)∈H2(0,1),系統(tǒng)(3)存在唯一解ω(x,t),使ω(x,t)∈C1(0,∞;L2(0,1))∩C(0,∞;H2(0,1)).此外,通過H2(0,1)?C[0,1],那么ω(1,t)對于時間t>0是連續(xù)的、有界的.
考慮狀態(tài)空間
定義內(nèi)積如下:
將方程(3)寫為發(fā)展方程形式如下:
定理2算子A在空間H上生成壓縮C0半群.
在式(6)中,計算可以得出
因此得出算子A在空間H上是能量耗散的,由于初值條件給定,其具有唯一解,因此可以得出A-1存在.根據(jù)Sobolev嵌入定理得出A-1在H中是緊的.利用定理1(Lumer-Phillips)可以得出,算子A在空間H上生成壓縮C0半群.
本文的目標(biāo)是使系統(tǒng)同步,分析可知同步的一個充分條件是使邊界無能量流動,同時使得所有狀態(tài)趨近于0.又由于邊界絕熱條件的充分條件是使ODE部分收斂到0,因此初步分析ODE部分特征值需要為負(fù),而熱方程部分系統(tǒng)的特征值所在空間僅有一個零特征值,其余為負(fù).根據(jù)以上思路設(shè)計的控制器(2).
接下來證明在控制器(2)作用下系統(tǒng)的穩(wěn)定性,定義Lyapunov函數(shù)如下:
通過LaSalle不變集原理,可以找出有且僅有一個穩(wěn)定解收斂,即系統(tǒng)狀態(tài)最終可以達(dá)成同步
以上是連續(xù)系統(tǒng)ODE-熱方程級聯(lián)系統(tǒng)的控制器及閉環(huán)系統(tǒng)的證明.下文將設(shè)計事件觸發(fā)控制器的控制規(guī)則,并證明該系統(tǒng)依然保持收斂性能.
上文提到的控制器是時間連續(xù)形式的,但是連續(xù)控制需要在時間尺度上,不間斷的采集并獲取信息,同時需要實時不間斷的對信息進(jìn)行處理.由于目前廣泛應(yīng)用的數(shù)字式執(zhí)行器執(zhí)行測量、運(yùn)算或輸出等操作均有最小時鐘周期限制,因此數(shù)字式執(zhí)行器無法做到無限小時刻采樣并對信息進(jìn)行處理.為解決數(shù)字式控制難以處理連續(xù)性控制的缺點,所以本文提出事件觸發(fā)的ODE-熱方程級聯(lián)系統(tǒng)一致性控制協(xié)議,給出具體的觸發(fā)條件,在達(dá)成觸發(fā)條件時改變控制輸入的值,而其余時刻則保持之前狀態(tài)不變.這樣不僅僅能夠解決連續(xù)性控制的缺點,同時還可以節(jié)約控制器的計算資源.
下面介紹事件觸發(fā)控制器的設(shè)計,以及觸發(fā)條件的確認(rèn).根據(jù)第2.3節(jié)得出的一致性同步協(xié)議可以假設(shè)ODE-熱方程系統(tǒng)事件觸發(fā)控制器如下:
其中:u(t)為ODE-熱方程級聯(lián)系統(tǒng)事件觸發(fā)控制器,t∈[tk,tk+1),?k=0,1,2,···且t0為初始時刻,觸發(fā)間隔時間點tk滿足
其中: argmin表示‖e(1,t)‖和‖?(t)‖達(dá)到最小值時t的取值,?σ1,σ2∈R+滿足條件
為便于證明在事件觸發(fā)控制器作用下系統(tǒng)仍保持穩(wěn)定,首先引入誤差系統(tǒng)
將誤差狀態(tài)(15)代入式(12)中,可以得到控制器在觸發(fā)時刻的誤差表示形式
為了證明控制器(16)能夠使系統(tǒng)(1)的每個子系統(tǒng)保持穩(wěn)定,并能夠使各個子系統(tǒng)最終狀態(tài)達(dá)成一致,利用Lyapunov穩(wěn)定性判據(jù)對事件觸發(fā)系統(tǒng)進(jìn)行穩(wěn)定性判別.
設(shè)計Lyapunov函數(shù)如下:
對上式左右兩邊關(guān)于時間變量求導(dǎo),可得
結(jié)合耦合邊界條件cz(t)=ωx(1,t),可以得出
設(shè)?σ1,σ2>0,滿足以下不等式組條件:
事實上,對于?σ1,σ2∈R+,總是至少存在著一組解滿足不等式組(20),這是很容易得出的,因為前兩個不等式組在出發(fā)時刻‖e(1,t)‖和‖?(t)‖都等于0.所以σ1,σ2>0即可滿足要求.并且由于設(shè)定參數(shù)k>0,所以必然存在σ1+σ2 將假設(shè)的不等式組代入式(19),可以得出 根據(jù)Lyapunov穩(wěn)定性判據(jù)可以得出,該系統(tǒng)是Lyapunov意義下穩(wěn)定的,同時通過計算其穩(wěn)定點所構(gòu)成的不變集,容易得出最終有且僅有一個共同收斂的點,因此該ODE-熱方程級聯(lián)系統(tǒng)事件觸發(fā)控制器最終能夠使得系統(tǒng)(1)中的狀態(tài)達(dá)成一致. 根據(jù)不等式組(20)的條件,對于k=1,2,···,以及σ1,σ2滿足式(20)條件,設(shè)觸發(fā)時刻為 通過上述證明,可以得出控制器u(t)在式(12)的作用下能夠使系統(tǒng)(1)最終狀態(tài)達(dá)成一致.由于PDE部分邊界條件經(jīng)由ODE中的控制器引入了負(fù)實部極點,因此系統(tǒng)具有一定的魯棒性,即存在一定的擾動的情況下,系統(tǒng)仍然可以按照預(yù)期的目標(biāo)達(dá)成一致,下面針對上述事件觸發(fā)一致性協(xié)議設(shè)計計算機(jī)仿真程序來進(jìn)行驗證. 為驗證ODE-熱方程級聯(lián)系統(tǒng)事件觸發(fā)一致性控制協(xié)議的實際有效性,本文采用數(shù)字計算機(jī)平臺進(jìn)行仿真模擬驗證.這里仿真離散格式中,對于空間采用中心差分法進(jìn)行離散,時間采用前向差分方法進(jìn)行離散化,ODE部分采用前向差分離散化.選取仿真步長dt=0.001 s,空間步長dx=0.05 m,仿真總時長T=15 s,PDE選取長度為1 m.設(shè)系統(tǒng)參數(shù)c=5,k=10/3.假設(shè)系統(tǒng)仿真的初值條件如下: 考慮多智能體個數(shù)為5,且為全連通有向拓?fù)?假設(shè)權(quán)重均為1,其連接方式如圖2. 圖2 多智能體連接拓?fù)鋱DFig.2 Multi-agent connection topology 通過上述假設(shè)的參數(shù)進(jìn)行仿真,能夠得出仿真所用控制系統(tǒng)如下: 因此根據(jù)本文所給出的計算方法,設(shè)計控制器 其中選取σ1=0.43,σ2=11.1.仿真結(jié)果如圖3-10所示. 圖3 多智能體系統(tǒng)ODE部分狀態(tài)圖Fig.3 Partial ODE state diagram of multi-agent system 圖3描述了多智能體系統(tǒng)(24)中的ODE部分隨時間趨向于0,其物理含義是為了最終使PDE系統(tǒng)能夠穩(wěn)定在一致溫度下,熱系統(tǒng)邊界隨著時間增加,其熱流動逐漸停止.圖4-8五個多智能體系統(tǒng)的PDE部分在邊界耦合ODE系統(tǒng)的控制下,最終能夠收斂到一致狀態(tài).圖9-10表示了多智能體共同決策得出的觸發(fā)條件,其中觸發(fā)時刻用“*”著重標(biāo)記.根據(jù)仿真結(jié)果可以看出,通過利用本文提出的基于事件觸發(fā)的ODE-熱方程級聯(lián)系統(tǒng)多智能體一致性控制協(xié)議,能夠使系統(tǒng)在大約12 s左右通過較少的觸發(fā)次數(shù)達(dá)到同步,表明事件觸發(fā)控制器具有優(yōu)越的性能,能在很短的時間內(nèi)讓藍(lán)寶石加熱爐達(dá)到一致的工作狀態(tài). 圖4 多智能體系統(tǒng)PDE部分狀態(tài)1Fig.4 Multi-agent system PDE partial State 1 圖5 多智能體系統(tǒng)PDE部分狀態(tài)2Fig.5 Multi-agent system PDE partial State 2 圖6 多智能體系統(tǒng)PDE部分狀態(tài)3Fig.6 Multi-agent system PDE partial State 3 圖7 多智能體系統(tǒng)PDE部分狀態(tài)4Fig.7 Multi-agent system PDE partial State 4 圖8 多智能體系統(tǒng)PDE部分狀態(tài)5Fig.8 Multi-agent system PDE partial State 5 圖9 多智能體系統(tǒng)事件觸發(fā)條件1Fig.9 Multi-agent system event trigger Condition 1 圖10 多智能體系統(tǒng)事件觸發(fā)條件2Fig.10 Multi-agent system event trigger Condition 2 本文研究了基于事件觸發(fā)的ODE-熱方程級聯(lián)系統(tǒng)多智能體一致性控制協(xié)議的設(shè)計,通過控制與PDE部分邊界耦合的ODE系統(tǒng)的輸入,使PDE部分的熱系統(tǒng)最終能夠穩(wěn)定,快速的達(dá)成一致,進(jìn)一步給出了事件觸發(fā)控制的條件,通過仿真驗證可以看出該同步協(xié)議具有一定的魯棒性.相較于之前已有的成果來說,本文的創(chuàng)新在于采用不同的(Neumann)邊界條件,控制輸入和被控對象分別處于不同的系統(tǒng),同步采用邊界反饋,并證明了事件觸發(fā)需要滿足的條件及其穩(wěn)定性,但因本文系統(tǒng)存在耦合項,Zeno現(xiàn)象的避免未能給出嚴(yán)格的證明,這將在后續(xù)的工作中進(jìn)行.4 數(shù)值仿真驗證
5 結(jié)論與展望