黃玲, 施菲菲, 謝文博, 王凱
(哈爾濱理工大學自動化學院,哈爾濱黑龍江150080)
網(wǎng)絡(luò)系統(tǒng)的馬爾科夫時滯預測控制
黃玲, 施菲菲, 謝文博, 王凱
(哈爾濱理工大學自動化學院,哈爾濱黑龍江150080)
針對非線性網(wǎng)絡(luò)控制系統(tǒng)存在網(wǎng)絡(luò)誘導時延的問題,提出一種時滯補償控制方法。首先建立非線性網(wǎng)絡(luò)系統(tǒng)的T-S模糊模型,將網(wǎng)絡(luò)誘導時延視為系統(tǒng)輸入時滯;利用馬爾科夫鏈對網(wǎng)絡(luò)誘導時滯進行建模,在此基礎(chǔ)上計算狀態(tài)轉(zhuǎn)移概率矩陣,依據(jù)最大轉(zhuǎn)移概率法對下一步的時滯進行預測;采用遺傳算法對狀態(tài)反饋控制器進行尋優(yōu),得到T-S模糊模型每個子系統(tǒng)針對各個時滯的最優(yōu)狀態(tài)反饋控制律;通過時滯時間的隸屬度函數(shù)融合得到非線性網(wǎng)絡(luò)控制系統(tǒng)的模糊預測控制器;仿真算例驗證該方法的可行性與有效性。
網(wǎng)絡(luò)控制系統(tǒng);T-S模糊模型;Markov鏈;時延;補償
近年來,隨著信息技術(shù)、遠程控制、分散控制的發(fā)展,致使網(wǎng)絡(luò)控制系統(tǒng)得到不斷發(fā)展和普及,隨著被控對象對控制實時性要求不斷提高,越來越多的學者關(guān)注對網(wǎng)絡(luò)控制系統(tǒng)時滯補償?shù)难芯俊>W(wǎng)絡(luò)控制系統(tǒng)(network control system,NCS)是指分布在不同地理位置的傳感器、執(zhí)行器、控制器和被控對象通過網(wǎng)絡(luò)相互連接,相互通信,形成閉環(huán)控制系統(tǒng)的一種分布式實時反饋控制網(wǎng)絡(luò)。在NCS中,多個網(wǎng)絡(luò)節(jié)點共享網(wǎng)絡(luò)信道。由于網(wǎng)絡(luò)帶寬有限且網(wǎng)絡(luò)中的數(shù)據(jù)流量變化不規(guī)則,當多個節(jié)點通過網(wǎng)絡(luò)交換數(shù)據(jù)時,常常出現(xiàn)數(shù)據(jù)碰撞、連接中斷、網(wǎng)絡(luò)擁塞等現(xiàn)象,因而不可避免的出現(xiàn)信息交換延遲,這種由網(wǎng)絡(luò)引起的時延稱網(wǎng)絡(luò)誘導時延。若該時延過大,超過系統(tǒng)能夠接受的最大傳輸時滯,則無法實現(xiàn)對系統(tǒng)的實時控制,所以對網(wǎng)絡(luò)控制系統(tǒng)進行時滯補償是必要的。
T-S模糊控制系統(tǒng)利用對分段線性系統(tǒng)的隸屬度融合實現(xiàn)對非線性系統(tǒng)的逼近,在處理非線性系統(tǒng)方面具有很大優(yōu)勢。基于T-S模糊控制策略處理網(wǎng)絡(luò)控制系統(tǒng)的非線性是一個既有理論深度又具有廣泛應用前景的方向,吸引了控制理論與應用領(lǐng)域?qū)W者、專家的廣泛關(guān)注。
文獻[1]基于觀測器研究了離散網(wǎng)絡(luò)控制系統(tǒng),在前向和反饋通道時滯建模為常時滯和隨機時滯條件下的網(wǎng)絡(luò)預測控制,利用開關(guān)系統(tǒng)理論研究了閉環(huán)系統(tǒng)穩(wěn)定的充要條件。文獻[2]將前向和反饋通道時滯建立為Markov鏈,利用輸出反饋研究系統(tǒng)的時滯補償控制,錐補線性化用于計算補償控制器的增益。文獻[3]針對T-S模糊系統(tǒng),采用狀態(tài)反饋和輸出反饋研究了網(wǎng)絡(luò)時滯補償問題?;趶V義系統(tǒng)理論,建立了控制器存在的LMI條件,同時給出了控制器的顯式表示。文獻[4-5]在控制器端設(shè)置了觀測器和預估控制產(chǎn)生器,在執(zhí)行器端設(shè)置了網(wǎng)絡(luò)時延補償器。文獻[6]基于狀態(tài)預估的方法,提出了一種預測補償控制方案來解決時延問題。本文首先將網(wǎng)絡(luò)誘導時滯建模為Markov鏈,從而對時滯進行預測,再利用遺傳算法對時滯控制器進行優(yōu)化,從而設(shè)計出時滯預測控制器,對時滯進行預測補償,減小時滯對系統(tǒng)性能的影響。
網(wǎng)絡(luò)控制系統(tǒng)的典型結(jié)構(gòu)如圖1所示。
傳感器從被控對象采集實時信息,通過信號處理單元后經(jīng)控制算法計算得到控制信號,通過網(wǎng)絡(luò)傳輸?shù)綀?zhí)行器作用于被控對象。
考慮存在時滯時的網(wǎng)絡(luò)控制系統(tǒng)建T-S模糊模型。
模糊規(guī)則i:
其中θi(t),i=1,2…,g為系統(tǒng)的前件變量,而Fij,i=1,2,…,r,j=1,2,…,g是模糊集合,r是模糊規(guī)則數(shù)。xi(t)∈Rn是系統(tǒng)的狀態(tài)變量,Adi、Ai是系統(tǒng)矩陣,τ>0是子系統(tǒng)的時滯時間,u(t-τ)是控制輸入。給定一組u,x,t,τ,式(1)經(jīng)過模糊加權(quán)能夠得出式(2):
2.1 時滯建模
在NCS中,將網(wǎng)絡(luò)誘導時滯建成一個Markov鏈隨機序列,符合網(wǎng)絡(luò)控制系統(tǒng)實際,因為某一時刻的時滯,往往只和上一時刻有關(guān),可以用上一時刻的時滯對這一時刻進行預測。預測步驟如圖2所示。
首先生成一組隨機數(shù)據(jù)作為傳輸網(wǎng)絡(luò)中的傳輸時滯,這可以認為是一組實驗的結(jié)果,即先對網(wǎng)絡(luò)時滯作多次測試實驗,得到一段時間內(nèi)的網(wǎng)絡(luò)時滯,再對這組時滯數(shù)據(jù)計算狀態(tài)轉(zhuǎn)移表,從而得到狀態(tài)轉(zhuǎn)移矩陣,再利用這組網(wǎng)絡(luò)時滯和計算得到的狀態(tài)轉(zhuǎn)移矩陣得到一組新的Markov鏈預測時滯。
假設(shè)某一系統(tǒng)或事物只有3個可能狀態(tài)1,2,3。其中的一次狀態(tài)統(tǒng)計數(shù)據(jù)如表1。
問:第16個時刻的狀態(tài)最有可能是什么?
為了得到狀態(tài)轉(zhuǎn)移矩陣,需要先統(tǒng)計狀態(tài)轉(zhuǎn)移概率,可以通過以上數(shù)據(jù)建立表2狀態(tài)轉(zhuǎn)移表。
第一行和第一列分別表示可能的全部狀態(tài),表中數(shù)據(jù)則表示從狀態(tài)i,i=1,2,3轉(zhuǎn)移到下一時刻狀態(tài)j,j=1,2,3的個數(shù),可建立表3的狀態(tài)轉(zhuǎn)移概率矩陣。
從狀態(tài)轉(zhuǎn)移概率矩陣的每行可以看出,符合狀態(tài)轉(zhuǎn)移概率的特性,第15個狀態(tài)是3,從第3行可以看出,轉(zhuǎn)移到狀態(tài)1,2,3的概率分別為2/5,3/5和0/5,按最大概率轉(zhuǎn)移方法,可以預測第16個狀態(tài)是2。這就是一步狀態(tài)轉(zhuǎn)移的計算方法。
2.2 預測控制器設(shè)計
設(shè)計非線性網(wǎng)絡(luò)控制系統(tǒng)的時滯預測模糊控制器時,利用遺傳算法得到每個子系統(tǒng)的最優(yōu)狀態(tài)反饋控制器,利用Markov鏈預測的時滯,得到具有時滯預測的預測模糊控制器。基本模型如公式(3)。
對于第i個子系統(tǒng),在時滯為di時的控制輸入為
其中,0≤di≤dimax表示系統(tǒng)某一時刻存在的時滯,ui(t-di),i=1,2,…,r表示第i個子系統(tǒng)的控制器輸出,ki1,ki2,…,kin為不同系統(tǒng)狀態(tài)在時滯為di情況下的最優(yōu)狀態(tài)反饋控制律,通過遺傳算法尋優(yōu)得出,x1(t-di),x2(t-di),…,xn(t-di)表示系統(tǒng)的狀態(tài)信號傳輸存在時滯,ui(t-di)表示控制器傳輸存在時滯。
系統(tǒng)輸出為
其中,u^(t-di)表示經(jīng)模糊化后,作用于系統(tǒng)的最終控制器輸出序列。
首先設(shè)定子模型i和時滯參數(shù)di,子模型一般為狀態(tài)空間模型,利用遺傳算法對狀態(tài)反饋控制器ki1,ki2,…,ki
n進行編碼、選擇、交叉、變異得到一組新的狀態(tài)反饋控制器,計算目標函數(shù)值,這里根據(jù)預測控制的基本思想,目標軌跡為平衡位置0,因此目標函數(shù)如
其中,xi(t)表示在t時刻第n個狀態(tài)的響應,目標函數(shù)為所有所選擇的狀態(tài)所有時間的響應的平方和,為了明確目標函數(shù)為狀態(tài)和平衡位置的差的概念,這里把平衡位置的表示0寫出。再判斷是否達到收斂條件,收斂條件可以是最大尋優(yōu)次數(shù)或者自定義目標函數(shù)值,如果不滿足則返回遺傳算法模塊繼續(xù)尋優(yōu),如果滿足則得到對應子模型對應時滯的最優(yōu)狀態(tài)反饋控制器,并返回重新設(shè)定子模型和時滯,直到遍歷所有時滯和子模型,得到每個子模型對應于每個可能時滯的最優(yōu)狀態(tài)反饋控制器。這樣就可得式(3)和式(4)的模糊時滯控制器,為了得到具有Markov鏈預測的時滯預測控制器,只需把式(3)中的時滯d給定為Markov鏈預測的時滯,便可以得到具有Markov鏈預測的時滯預測控制器如式(6)。第i個子系統(tǒng)對di=Mdi,預測時滯為Mdi時的控制輸入為
其中Mdi表示Markov鏈預測時滯。
控制器輸出為
其中u^(t-Md)為具有Markov鏈預測時滯的預測控制器輸出。
二級倒立擺系統(tǒng)結(jié)構(gòu)示意圖如圖3所示,假設(shè)該倒立擺通過網(wǎng)絡(luò)進行控制。
其運動過程為:連接在擺桿上的兩個角度編碼器分別檢測兩個擺桿與豎直方向的夾角,連接在小車上的位移編碼器檢測出小車的水平位移,檢測出的信號經(jīng)放大,調(diào)理,把數(shù)據(jù)通過網(wǎng)絡(luò)傳遞給電腦(控制單元),通過一定的算法(這里可以是LQR控制)得出使二級倒立擺向穩(wěn)定方向運動的小車需要的加速度,通過網(wǎng)絡(luò)送給運動控制卡,把信號傳遞給電機,驅(qū)動電機運動,電機通過履帶帶動小車運動,從而帶動兩個擺桿運動,設(shè)計合理的運動算法,可以控制兩個擺桿達到平衡狀態(tài)。在這個過程中,控制信號的延時主要是由在控制網(wǎng)絡(luò)中傳遞引起的,且網(wǎng)絡(luò)誘導時滯不固定,可用Markov鏈預測。
利用拉格朗日方程推導運動學方程再經(jīng)過整理可得二級倒立擺系統(tǒng)的狀態(tài)空間形式:
其中X= [x θ1θ2·x θ1θ2]為系統(tǒng)被控變量。各個參數(shù)的含義如下:x為小車的水平位移;θ1為擺桿1與豎直方向夾角;θ2為擺桿2與豎直方向夾角; A和B為參數(shù)矩陣,且
從參數(shù)矩陣M可以看出,其參數(shù)具有非線性形式。
利用分段線性思想對二級倒立擺系統(tǒng)進行T-S模糊建模,綜合考慮3個變量x,θ1,θ2和參數(shù)矩陣A,B,選擇以下5個位置來分別建立其T-S模糊子模型。
位置1:x=0,θ1=0,θ2=0;
位置2:x=0,θ1=0,θ2=±8°;
位置3:x=0,θ1=±10°,θ2=0;
位置4:x=0,θ1=±10°,θ2=±8°;
位置5:x=0,θ1=禾10°,θ2=±8°。
首先對5個子系統(tǒng)在時滯[0,0.001,0.002,…,0.009]下分別利用遺傳算法得出對應子系統(tǒng)在對應不同時滯的最優(yōu)狀態(tài)反饋控制器,這里目標函數(shù)中的狀態(tài)為位移和兩個擺角。
把遺傳算法的初始值設(shè)定為LQR控制器的狀態(tài)反饋律,并把上一次的尋優(yōu)結(jié)果作為下一次的初始值繼續(xù)尋優(yōu)避免過早收斂于局部最優(yōu)點。圖4為位置1在時滯0.006 s情況下的尋優(yōu)結(jié)果,最終收斂值為2.117 8。
尋優(yōu)前和尋優(yōu)后的兩種狀態(tài)反饋控制律如下:
其中:ko為尋優(yōu)前的狀態(tài)反饋控制律,k10.006為尋優(yōu)后的狀態(tài)反饋控制律。這里只給出時滯0.006 s的平衡位置的子模型的尋優(yōu)結(jié)果,其他位置對應不同時滯的結(jié)果均可按同樣的步驟得出。
時滯的隸屬度函數(shù)如圖5所示。
時滯的隸屬度函數(shù)中包含了預先定義的10種可能的是時滯情況。模糊預測控制器的后件部分為通過遺傳算法尋優(yōu)得出的不同時滯情況下的最優(yōu)狀態(tài)反饋控制器。沒有預測和存在預測的仿真對比結(jié)果如圖6~圖9所示。從圖6~圖9可以看出,兩種控制方法都可以使具有控制器時滯的二級倒立擺系統(tǒng)穩(wěn)定,但加入Markov鏈預測控制的結(jié)果具有較好平穩(wěn)性。
圖6~圖8為被控狀態(tài)的變化對比圖,x1為位移,x2為一級擺角,x3為二級擺角。從圖6中可以看出,有預測控制的情況下,可以更快地達到穩(wěn)定的平衡位置,這從圖9的控制器輸出變化也可以看出,加入預測控制后,系統(tǒng)的控制器輸出平穩(wěn)。加入Markov鏈的預測的控制優(yōu)化了控制效果,使系統(tǒng)平穩(wěn)快速地到達平衡狀態(tài)。
本文首先利用分段線性系統(tǒng)逼近非線性系統(tǒng)的方法,將網(wǎng)絡(luò)控制系統(tǒng)建模為T-S模糊模型,再對系統(tǒng)的時滯進行預測,把預測時滯作為前件變量,利用遺傳算法對每種時滯情況下的子系統(tǒng)分別尋優(yōu),分別得到最優(yōu)控制器,經(jīng)隸屬度函數(shù)融合后,建立具有Markov鏈預測時滯的預測模糊控制器,其輸入為系統(tǒng)狀態(tài)和預測時滯。仿真分析表明,預測控制器可以得到更加平穩(wěn)快速的控制效果,可以減弱原系統(tǒng)因網(wǎng)絡(luò)時滯導致的系統(tǒng)狀態(tài)抖動現(xiàn)象。
[1] LIU Guoping,XIA Yuanqing,CHEN Jie,et al.Networked predictive control of systems with random network delays in both forward and feedback channels[J].IEEE Transactions on Industrial Electronics,2007,54(3):1282-1297.
[2] YANG Rongni,LIU Guoping,SHIPeng,et al.Predictive output feedback control for networked control systems[J].IEEE Transactions on Industrial Electronics.2014,61(1):512-520.
[3] ZHANG Jinhui,SHIPeng,XIA Yuanqing.Fuzzy delay compensa-tion control for T-S Fuzzy systems over network[J].IEEE Transactions on Cybernetics,2013,43(1):259-268.
[4] XIA Yuanqing.,LIU Guoping,F(xiàn)U M,et al.Predictive control of networked systems with random delay and data dropout[J].IET Control Theory Application,2009,3(11):1476-1486.
[5] 李德偉,席裕庚.預估網(wǎng)絡(luò)控制系統(tǒng)的設(shè)計和分析[J].控制與決策,2007,22(9):1065-1069.LIDewei,XIYugeng.Design and analysisof predictive networked control system[J].Control and Decision,2007,22(9):1065-1069.
[6] CHEN Tihung,KUNG ChungChun,LIN Chiheng.T-S fuzzy control for a class of networked control system[J].Fuzzy Theory and Its Applications,2012,16(8):12-17.
[7] 于水情,李俊民.變采樣周期網(wǎng)絡(luò)控制系統(tǒng)的模態(tài)依賴的H∞預測控制[J].西安電子科技大學學報(自然科學版),2012,39(5):147-155.YU Shuiqing,LI Junmin.Mode dependent H∞predictive control of networked control system under variable-period sampling[J].Journal of Xidian University,2012,39(5):147-155.
[8] 劉俊豪,張皓,陳啟軍.具有均勻量化器的非線性網(wǎng)絡(luò)控制系統(tǒng)的一致有界性[J].控制理論與應用,2012,29(11):1388-1396.LIU Junhao,ZHANGHao,CHENQijun.Uniformly-bounded nonlinear network control systems with uniform quantizer[J].Theory and Applications,2012,29(11):1388-1396.
[9] 席裕庚,李德偉,林姝.模型預測控制—現(xiàn)狀與挑戰(zhàn)[J].自動化學報,2013,39(3):222-236.XIYugeng,LI Dewei,LIN Shu.Model predictive control-status and challenges[J].Acta Automatica Sinica,2013,39(3):222-236.
[10] 李興鵬,石慶均,江全元.雙模糊控制法在光伏并網(wǎng)發(fā)電系統(tǒng)MPPT中的應用[J].電力自動化設(shè)備,2012,32(8):113-117.LI Xingpeng,SHI Qingjun,JIANG Quanyuan.Application of double fuzzy control in MPPT of grid-connected photovoltaic generation system[J].Electric Power Automation Equipment,2012,32(8):113-117.
[11] 楊建偉,董軍哲,李捷.基于變論域模糊控制的磁流變半主動懸架多目標優(yōu)化[J].汽車工程,2012,34(3):260-265.YANG Jianwei,DONG Junzhe,LIJie.Multi-objective optimization on MR suspension based on variable universe fuzzy control[J].Automotive Engineering,2012,34(3):260-265.
[12] 王瑞敏,費樹岷,柴琳.網(wǎng)絡(luò)控制系統(tǒng)的預測補償[J].控制理論與應用,2011,28(10):1473-1479.WANG Ruimin, FEI Shumin, CHAI Lin. Predictive compensation for networked control systems[J].Control Theory and Applications,2011,28(10):1473-1479.
[13] 郭超勇,劉建強,游小杰,等.高速動車組列車網(wǎng)絡(luò)控制系統(tǒng)仿真與建模研究[J].系統(tǒng)仿真學報,2012,24(6):1165-1169.GUO Chaoyong,LIU Jianqiang,YOU Xiaojie,et al.Simulation and modeling of train networked control system on high-speed electricmultiple unit[J].Journal of System Simulation,2012,24 (6):1165-1169.
[14] 陳惠英,李祖欣.無線網(wǎng)絡(luò)控制系統(tǒng)研究現(xiàn)狀及方向[J].工礦自動化,2013,39(1):59-63.CHEN Huiying,LIZuxin.Research status and direction ofwireless networked control system[J].Industry and Mine Automation,2013,39(1):59-63.
[15] 肖會芹,何勇,吳敏,等.基于T-S模糊模型非線性網(wǎng)絡(luò)控制系統(tǒng)改進H∞跟蹤控制[J].控制理論與應用,2012,29(1): 71-78.XIAO huiqin,HE Yong,WU Min,et al.Improved H-infinity tracking control for nonlinear networked control systems based on T-S fuzzymodel[J].Control Theory and Applications,2012,29 (1):71-78.
(編輯:劉素菊)
Markov delay predictive control for network systems
HUANG Ling, SHIFei-fei, XIEWen-bo, WANG Kai
(College of Automation,Harbin University of Science and Technology,Harbin 150080,China)
In view of network induced time delay in nonlinear networked control systems,a time delay compensation control theme was proposed.T-S fuzzymodelwas established for nonlinear network control systems firstly.Then the network induced delay wasmodeled as Markov chain,and delay was predicted.In the following,by using genetic algorithm,the optimal state feedback control law for each subsystem with each delay was established.And then fuzzy predictive controller of the nonlinear networked control systemswas obtained throughmembership function.Simulation example shows the effectiveness of the proposed method.
networked control system;T-S fuzzymodel;Markov chain;time delay;compensation
10.15938/j.emc.2015.06.014
TP 13
A
1007-449X(2015)06-0089-06
2014-11-10
國家自然科學基金(61304046);黑龍江省教育廳科技項目(12541118)
黃 玲(1975—),女,博士,教授,碩士生導師,研究方向為網(wǎng)絡(luò)系統(tǒng)分析與控制,信號處理(濾波);
施菲菲(1991—),女,碩士研究生,研究方向為網(wǎng)絡(luò)控制系統(tǒng)的時滯補償及應用;
謝文博(1985—),男,講師,研究方向為模糊系統(tǒng)理論及應用等;
王 凱(1989—),男,碩士,研究方向為模糊建模及模糊控制。
黃 玲