盧潔瑩, 李俊輝, 蘇為洲
(華南理工大學(xué)自動(dòng)化科學(xué)與工程學(xué)院,廣東廣州 510640)
過去十幾年,網(wǎng)絡(luò)化控制在無人機(jī)及其編隊(duì)控制、機(jī)器人遠(yuǎn)程控制、多智能體協(xié)調(diào)控制、工業(yè)網(wǎng)絡(luò)控制等領(lǐng)域得到了廣泛應(yīng)用,并對(duì)這些領(lǐng)域的發(fā)展產(chǎn)生了深遠(yuǎn)的影響[1-3].網(wǎng)絡(luò)化控制系統(tǒng)是指系統(tǒng)組成單元如傳感器、控制器、執(zhí)行裝置等的信號(hào)是通過有線或者無線通信信道來傳輸?shù)囊环N控制系統(tǒng).與傳統(tǒng)控制系統(tǒng)的區(qū)別在于網(wǎng)絡(luò)化控制系統(tǒng)用通訊信道代替了傳統(tǒng)的信號(hào)線,因此控制系統(tǒng)可以通過網(wǎng)絡(luò)獲取更多的信息并且進(jìn)行更有效的信息交換,以完成更加復(fù)雜的任務(wù),同時(shí)在系統(tǒng)構(gòu)建和維護(hù)上具有更大的靈活性和便利性.由于信號(hào)是通過通訊信道進(jìn)行傳輸?shù)?因此信道隨機(jī)時(shí)延[4-5]、隨機(jī)丟包[6-7]、量化誤差[8-11]等不確定性對(duì)反饋系統(tǒng)的穩(wěn)定性和品質(zhì)產(chǎn)生負(fù)面影響.近20年來,人們對(duì)上述不確定性的機(jī)理和應(yīng)對(duì)方法進(jìn)行了深入的研究.Martins等[12]討論了當(dāng)信道中存在噪聲、畸變等信道不確定性的情況下,反饋系統(tǒng)穩(wěn)定性與對(duì)象極點(diǎn)、對(duì)象不確定性以及信道不確定性之間的關(guān)系;Nair等[8]研究了在數(shù)據(jù)率約束下,信道與網(wǎng)絡(luò)化系統(tǒng)均方穩(wěn)定性之間的關(guān)系;Elia等[13]研究了隨機(jī)丟包對(duì)網(wǎng)絡(luò)化反饋系統(tǒng)穩(wěn)定性的約束;Lu等[14]分析了信道中存在信噪比約束以及隨機(jī)丟包、固定時(shí)延等不確定性時(shí),系統(tǒng)均方穩(wěn)定的充分必要條件.
為了更全面地描述通訊信道不確定性的特征,根據(jù)這些特征來分析和設(shè)計(jì)系統(tǒng),本文要對(duì)通訊信道進(jìn)行建模.網(wǎng)絡(luò)控制的最新發(fā)展表明,信道不確定性可以是并行無記憶噪聲通信信道,用零均值的隨機(jī)乘性噪聲可以有效地描述信道不確定性.Elia[6]的研究表明,隨機(jī)乘性噪聲為通訊信道不確定性(如丟包、時(shí)延等)的描述提供了一個(gè)合適框架;Xiao等[7]用乘性噪聲模型來描述多輸入信道丟包產(chǎn)生的不確定性;Sinopoli等[15]研究了通信信道中丟包的Kalman濾波問題,將丟包引起的信道不確定性建模為隨機(jī)乘性不確定性;Su等[4-5]針對(duì)網(wǎng)絡(luò)化反饋系統(tǒng)中具有隨機(jī)時(shí)延的情形用乘性噪聲模型進(jìn)行了描述,并且根據(jù)這一模型采用均方準(zhǔn)則研究了網(wǎng)絡(luò)化反饋控制系統(tǒng)的穩(wěn)定性和其他性能.另一方面,隨機(jī)乘性不確定性線性時(shí)不變系統(tǒng)研究有著很長(zhǎng)的歷史[16-19].在其早期的研究中,Willems和Blankenship[17]針對(duì)單輸入單輸出(single input single output,SISO)隨機(jī)乘性不確定性的線性系統(tǒng)給出了均方穩(wěn)定的充分必要條件,進(jìn)而可知均方可鎮(zhèn)定性可以運(yùn)用H2最優(yōu)控制方法進(jìn)行分析;隨后Lu和Skelton[18]得到了多輸入多輸出(multiple input multiple output,MIMO)系統(tǒng)均方穩(wěn)定的充分必要條件;Su和Qi[20]研究了乘性噪聲系統(tǒng)在多信道下的均方可鎮(zhèn)定性問題,均方可鎮(zhèn)定條件可以轉(zhuǎn)化為求系統(tǒng)閉環(huán)傳遞函數(shù)矩陣譜半徑的優(yōu)化問題,并給出了均方意義下最大的乘性噪聲方差可容許范圍.
對(duì)于網(wǎng)絡(luò)化反饋系統(tǒng)而言,除了均方穩(wěn)定性和均方可鎮(zhèn)定性問題之外,性能的最優(yōu)設(shè)計(jì)是另一個(gè)基礎(chǔ)性研究問題.在過去十幾年里,二次最優(yōu)設(shè)計(jì)問題是性能最優(yōu)設(shè)計(jì)的一個(gè)熱門話題.Nair[21]考慮了在系統(tǒng)量化效應(yīng)下的二次最優(yōu)設(shè)計(jì)問題;Ishii[9]討論了在編碼器約束影響下的二次最優(yōu)問題.對(duì)于隨機(jī)丟包等可擦除信道而言,乘性噪聲是描述這類信道中信道不確定性的有效模型.利用乘性噪聲模型,Elia[6]考慮信道中存在隨機(jī)丟包等情形下的二次最優(yōu)調(diào)節(jié)問題.這一問題可以追隨到上世紀(jì)60年代,Wonham[16]研究了一個(gè)具有隨機(jī)乘性不確定性線性時(shí)不變系統(tǒng)的最優(yōu)二次狀態(tài)反饋調(diào)節(jié)問題,并且根據(jù)一個(gè)廣義代數(shù)黎卡提方程(modified algebraic Riccati equation,MARE)的半正定解得到了最優(yōu)狀態(tài)反饋控制律.但是,這個(gè)狀態(tài)反饋控制律不一定能使得系統(tǒng)均方穩(wěn)定.具有隨機(jī)乘性不確定性的線性時(shí)不變系統(tǒng)的最優(yōu)控制主要有兩個(gè)方面的問題:一方面是設(shè)計(jì)最優(yōu)反饋控制器使得系統(tǒng)能在隨機(jī)乘性不確定性下均方穩(wěn)定,另一方面是使得系統(tǒng)的H2性能最優(yōu).正如Wonham[16]在文中指出的那樣:上述最優(yōu)狀態(tài)反饋控制律并不能完全保證系統(tǒng)穩(wěn)定性.而后,Willems等[22]也研究了類似乘性不確定系統(tǒng)的最優(yōu)設(shè)計(jì)問題.他們發(fā)現(xiàn),若狀態(tài)和控制輸入的二次調(diào)節(jié)的權(quán)重矩陣滿秩,當(dāng)且僅當(dāng)MARE有正定解時(shí),所設(shè)計(jì)的狀態(tài)反饋控制器能使得系統(tǒng)在均方意義下穩(wěn)定.最近,Su等[23]運(yùn)用乘性噪聲模型研究了網(wǎng)絡(luò)化反饋系統(tǒng)的最優(yōu)設(shè)計(jì)問題,并給出了廣義代數(shù)黎卡提方程(MARE)均方鎮(zhèn)定解的充分必要條件,并證明了利用該鎮(zhèn)定解得到的均方最優(yōu)狀態(tài)反饋控制律能保證所得的網(wǎng)絡(luò)化反饋系統(tǒng)系統(tǒng)均方穩(wěn)定.
盡管,過去的研究在網(wǎng)絡(luò)化反饋系統(tǒng)的均方穩(wěn)定性分析、均方鎮(zhèn)定問題以及均方二次最優(yōu)設(shè)計(jì)問題中取得了許多重大的進(jìn)展,但網(wǎng)絡(luò)化反饋系統(tǒng)的均方最優(yōu)跟蹤問題很少人涉獵.對(duì)傳統(tǒng)的反饋系統(tǒng)而言,Davidson[24]提出了內(nèi)模原理,解決了傳統(tǒng)反饋系統(tǒng)的漸近跟蹤問題;Chen等[25]給出了離散二次跟蹤控制問題的最優(yōu)解.對(duì)于網(wǎng)絡(luò)化反饋系統(tǒng)而言,通訊信道不確定性給反饋系統(tǒng)中的信號(hào)帶來了新的非完整性和間隙特性,這些特性給反饋系統(tǒng)漸進(jìn)跟蹤設(shè)計(jì)提出了新的問題[26-27].
本文研究了具有丟包的網(wǎng)絡(luò)化反饋系統(tǒng)的均方最優(yōu)漸近跟蹤問題,運(yùn)用乘性噪聲模型描述丟包這一信道不確定性.根據(jù)網(wǎng)絡(luò)化反饋系統(tǒng)的特點(diǎn),本文提出一種保證網(wǎng)絡(luò)化反饋系統(tǒng)漸近跟蹤特性的控制器結(jié)構(gòu),針對(duì)這種結(jié)構(gòu)討論了網(wǎng)絡(luò)化系統(tǒng)的均方可鎮(zhèn)定性問題和漸近跟蹤控制器存在性之間的等價(jià)關(guān)系.在此基礎(chǔ)上,運(yùn)用隨機(jī)均方最優(yōu)控制理論給出了上述漸近跟蹤控制器的均方最優(yōu)設(shè)計(jì)方法.由于均方最優(yōu)控制器的設(shè)計(jì)取決于廣義代數(shù)黎卡提方程的均方鎮(zhèn)定解,為此提出了一種新的求解算法,該算法簡(jiǎn)化了已有的結(jié)果[23].通過仿真例子,本文驗(yàn)證了運(yùn)用本文提出的最優(yōu)漸近跟蹤設(shè)計(jì)方法得到的網(wǎng)絡(luò)化反饋系統(tǒng)的均方穩(wěn)定性和均方漸近跟蹤特性.
本文的結(jié)構(gòu)如下:第2節(jié)給出問題描述;第3節(jié)提出一種適合網(wǎng)絡(luò)化反饋系統(tǒng)的漸近跟蹤控制器結(jié)構(gòu),并討論實(shí)現(xiàn)漸近跟蹤的條件;第4節(jié)將研究漸近跟蹤控制器的最優(yōu)設(shè)計(jì);第5節(jié)給出仿真例子;最后,總結(jié)本文的主要結(jié)果.
漸近跟蹤問題是反饋控制系統(tǒng)中的一個(gè)經(jīng)典設(shè)計(jì)問題.其基本要求有兩點(diǎn):一是設(shè)計(jì)控制器保證反饋系統(tǒng)的穩(wěn)定性;二是使得系統(tǒng)的輸出能漸近跟蹤外部的指令信號(hào).在傳統(tǒng)的漸近跟蹤問題中,狀態(tài)反饋控制系統(tǒng)的結(jié)構(gòu)如圖1所示,其中外部指令信號(hào)通常為階躍信號(hào).根據(jù)內(nèi)模原理,為了使得系統(tǒng)輸出能漸近跟蹤階躍信號(hào),本文需要在反饋系統(tǒng)的前向通道中加入一個(gè)積分器,積分器的系數(shù)kI為可調(diào)參數(shù).由于控制器的輸出與被控對(duì)象的輸入是由信號(hào)線直接連接,所以控制器輸出信號(hào)u和被控對(duì)象的輸入信號(hào)ud相等.當(dāng)系統(tǒng)達(dá)到漸近跟蹤時(shí),跟蹤誤差e=0,控制信號(hào)u為常值.這里,可以運(yùn)用傳統(tǒng)的二次最優(yōu)設(shè)計(jì)方法設(shè)計(jì)最優(yōu)的積分系數(shù)kI和狀態(tài)反饋增益陣K.
圖1 傳統(tǒng)狀態(tài)反饋控制系統(tǒng)Fig.1 A traditional state feedback control system
對(duì)于網(wǎng)絡(luò)化控制系統(tǒng)而言,其控制信號(hào)u將通過網(wǎng)絡(luò)傳輸?shù)奖豢貙?duì)象輸入端,由于網(wǎng)絡(luò)中傳輸信道的不可靠性,控制信號(hào)在傳輸過程中會(huì)產(chǎn)生畸變,因此信號(hào)u和信號(hào)ud可能不相等.傳統(tǒng)跟蹤控制系統(tǒng)的漸近跟蹤特性和穩(wěn)定性可能因引入網(wǎng)絡(luò)通訊信道而受到損害.本文將著重研究當(dāng)通訊信道中存在隨機(jī)丟包情形下,網(wǎng)絡(luò)化反饋系統(tǒng)的漸近跟蹤問題.如果本文采用如圖1中傳統(tǒng)漸近跟蹤控制器的結(jié)構(gòu),由于通訊信道存在隨機(jī)丟包,當(dāng)信道出現(xiàn)丟包時(shí),被控對(duì)象的輸入信號(hào)ud為0,進(jìn)而導(dǎo)致控制輸出z偏離期望值,使得跟蹤誤差e ?=0,從而破壞了系統(tǒng)的漸近跟蹤特性.如果丟包情況嚴(yán)重,有可能會(huì)影響系統(tǒng)穩(wěn)定性.
為了更加精確地分析信道隨機(jī)丟包對(duì)漸近跟蹤問題產(chǎn)生的影響,本文用序列{α(k),k=0,1,2,··· ,∞}來描述信號(hào)傳輸過程中丟包情形.該序列的第k個(gè)元素α(k)表示k時(shí)刻的信號(hào)u(k)是否傳輸成功.當(dāng)α(k)=1時(shí)表示被控對(duì)象收到了k時(shí)刻的控制信號(hào)u(k),當(dāng)α(k)=0表示信號(hào)丟失,即
ud(k)=α(k)u(k), k=0,1,2,··· ,∞.
進(jìn)一步,本文假設(shè)序列{α(k),k=0,1,2,··· ,∞}滿足下面隨機(jī)特性:
假設(shè)1 信道丟包序列{α(k),k=0,1,2,···,∞}是一個(gè)獨(dú)立同分布的伯努力過程,即i.i.d隨機(jī)過程.對(duì)于所有非負(fù)整數(shù)k,α(k)=0的概率為p.
由假設(shè)1可知序列{α(k),k=0,1,2,··· ,∞}的均值為1?p,即:對(duì)任意非負(fù)整數(shù)k滿足
由上式可知,信號(hào)ud(k)包含兩部分:第1部分是隨機(jī)序列{α(k), k=0,1,2,··· ,∞}的均值1?p和被傳輸信號(hào)乘積;另一部分是信道不確定性ω(k)和被傳輸信號(hào)的乘積.上述均值1?p可以看成是信道的平均增益;信道不確定性ω(k)=α(k)?(1?p)為信道增益的隨機(jī)偏差,也可以看成是系統(tǒng)的一個(gè)乘性噪聲.因?yàn)樾蛄衶α(k), k=0,1,2,··· ,∞}滿足假設(shè)1,所以序列{ω(k), k=0,1,2,··· ,∞}也是一個(gè)獨(dú)立同分布過程.其均值為0,方差為(1?p)p,即
其中:x(k)∈Rn為系統(tǒng)狀態(tài),ud∈R是控制輸入,z∈R是控制輸出.本文研究在網(wǎng)絡(luò)化反饋系統(tǒng)通訊信道存在丟包情形下的控制器設(shè)計(jì),以達(dá)到下面3個(gè)目的:1)閉環(huán)系統(tǒng)均方穩(wěn)定;2)系統(tǒng)控制輸出z在均方意義下漸近跟蹤參考信號(hào)r;3)均方二次性能指標(biāo)達(dá)到最優(yōu).下面將給出系統(tǒng)均方穩(wěn)定性與均方性能指標(biāo)的定義:
定義1 圖1所示的閉環(huán)系統(tǒng),其控制律為K,若其跟蹤參考信號(hào)r(k)≡0且任意初始狀態(tài)有界,對(duì)于任意時(shí)間k,該系統(tǒng)狀態(tài)的協(xié)方差有界且漸近收斂到0,則稱該系統(tǒng)為均方穩(wěn)定.
本文考慮的跟蹤參考信號(hào)r是幅值為1的單位階躍信號(hào),即
設(shè)計(jì)控制器使得閉環(huán)系統(tǒng)達(dá)到均方穩(wěn)定則稱為是均方鎮(zhèn)定問題;若使系統(tǒng)輸出跟蹤誤差的協(xié)方差漸近收斂到零則稱為均方漸近跟蹤問題;若使系統(tǒng)跟蹤誤差的平均能量達(dá)到最小則稱為均方最優(yōu)漸近跟蹤問題.本文將著重討論均方鎮(zhèn)定問題、均方漸近跟蹤問題和均方最優(yōu)漸近跟蹤問題三者之間的關(guān)系,并給出均方最優(yōu)漸近跟蹤問題的控制器設(shè)計(jì)方法.
為了應(yīng)對(duì)上一節(jié)提到網(wǎng)絡(luò)信道中丟包現(xiàn)象對(duì)反饋系統(tǒng)產(chǎn)生的負(fù)面作用,保證系統(tǒng)實(shí)現(xiàn)漸近跟蹤,本文提出了如圖2所示網(wǎng)絡(luò)化反饋系統(tǒng)的結(jié)構(gòu).通過在被控對(duì)象的輸入端加入一個(gè)積分器,使得控制信號(hào)u的穩(wěn)態(tài)值為零以避免信道丟包對(duì)系統(tǒng)漸近跟蹤特性的影響,即當(dāng)系統(tǒng)達(dá)到穩(wěn)態(tài)時(shí),控制器K的輸出信號(hào)u(k)=0,積分器輸入端的信號(hào)ud(k)=0,通過設(shè)計(jì)控制器來調(diào)整積分器的穩(wěn)態(tài)輸出信號(hào)以保證系統(tǒng)對(duì)階躍參考信號(hào)的漸近跟蹤.
圖2 丟包信道上的狀態(tài)反饋控制系統(tǒng)Fig.2 A state feedback system over a channel with packet loss
下面,本文將研究該系統(tǒng)的均方穩(wěn)定性并利用其均方穩(wěn)定性來分析該系統(tǒng)的漸近跟蹤性質(zhì).
在圖2所示系統(tǒng)中,積分器的輸出為v,對(duì)象P和積分器的狀態(tài)方程表示如下:
本節(jié)主要研究如圖2所示的閉環(huán)系統(tǒng)在跟蹤單位階躍參考信號(hào)r(k)時(shí)的均方最優(yōu)漸近跟蹤控制問題.把對(duì)象和積分器看成一個(gè)擴(kuò)展對(duì)象,其狀態(tài)空間模型如下:
其中xe(0)=0.
圖2所示的反饋系統(tǒng)中,控制器K采用參考信號(hào)前饋加狀態(tài)反饋的結(jié)構(gòu),相應(yīng)的控制律如下:
為了研究系統(tǒng)達(dá)到漸近跟蹤時(shí)的性質(zhì),本文定義如下變量x(k),xI(k),v(k),z(k),ud(k),u(k)的穩(wěn)態(tài)值分別為xss,xI,ss,vss,zss,ud,ss,uss.當(dāng)控制器輸出z(k)漸近跟蹤階躍參考信號(hào)時(shí),由式(6)和式(8)可知
另一方面,為了避免在系統(tǒng)達(dá)到漸近跟蹤后,信道丟包對(duì)控制信號(hào)傳輸產(chǎn)生的影響,本文選擇K0使得控制器的輸出uss=0,即K0=?Kxss?KIxI,ss.
令?x(k)=x(k)?xss,?xI(k)=xI(k)?xI,ss,?v(k)=v(k)?vss,?z(k)=z(k)?zss和?u(k)=u(k)?uss.上述變量分別為系統(tǒng)(7)跟蹤階躍信號(hào)r(k)過程中,該系統(tǒng)狀態(tài)、積分器狀態(tài)、積分器輸出和控制器輸出的瞬態(tài)響應(yīng).利用這些變量本文可得到該系統(tǒng)瞬態(tài)響應(yīng)的狀態(tài)方程如下:
由于u(k)和ud(k)的穩(wěn)態(tài)值均為零,所以閉環(huán)系統(tǒng)偏差狀態(tài)方程中,信道的輸入輸出依然可用u(k)和ud(k)之間的關(guān)系(10)來描述.
偏差狀態(tài)方程(14)、狀態(tài)反饋控制器(16)和信道模型(9)-(10)是圖2中網(wǎng)絡(luò)化反饋系統(tǒng)的另一個(gè)等價(jià)模型.其特點(diǎn)是把原系統(tǒng)模型(7)-(8)中的狀態(tài)變量xe(k)、控制輸出z(k)等用相應(yīng)的偏差狀態(tài)?xe(k)、偏差輸出?z(k)來表示.在新的狀態(tài)變量表示下,跟蹤參考信號(hào)r(k)轉(zhuǎn)換為偏差狀態(tài)方程初始狀態(tài)?xe(0)的一個(gè)比例系數(shù).當(dāng)偏差狀態(tài)的協(xié)方差趨向零時(shí),偏差輸出方差也趨向零,系統(tǒng)到達(dá)均方意義下的漸近跟蹤.因此,閉環(huán)系統(tǒng)(7)-(10)均方意義下的跟蹤問題被轉(zhuǎn)化為系統(tǒng)(14)(16)(9)-(10)的均方鎮(zhèn)定問題.
為了研究系統(tǒng)(14)(16)(9)-(10)的均方鎮(zhèn)定問題(即:設(shè)計(jì)狀態(tài)反饋控制器使得閉環(huán)系統(tǒng)達(dá)到均方穩(wěn)定),本文把該系統(tǒng)分解為確定性部分T和乘性噪聲部分ω,如圖3所示.
圖3 具有乘性噪聲的線性系統(tǒng)Fig.3 A Linear feedback system with multiplicative noise
其中確定性部分由方程(14)(16)(10)描述(其傳遞函數(shù)與由方程(7)-(8)和方程(10)描述的系統(tǒng)傳遞函數(shù)相同),T為方程中信號(hào)d(k)到信號(hào)u(k)的傳遞函數(shù),即
假設(shè)系統(tǒng){Ae,Be}可鎮(zhèn)定,記所有鎮(zhèn)定確定性系統(tǒng)T的狀態(tài)反饋控制器組成的集合為ˉK ?K.則上述網(wǎng)絡(luò)化反饋系統(tǒng)均方鎮(zhèn)定問題的可解性(即:存在狀態(tài)反饋控制器使得該系統(tǒng)均方穩(wěn)定)可由均方小增益定理給出:
其中λi,i=1,··· ,m為對(duì)象所有不穩(wěn)定極點(diǎn).
注意到擴(kuò)展對(duì)象(7)和對(duì)象(3)具有相同不穩(wěn)定極點(diǎn).由引理1和等式(19)本文可以得到圖2所示系統(tǒng)均方漸近跟蹤的基本條件.
定理1 若圖2所示網(wǎng)絡(luò)化反饋系統(tǒng)的被控對(duì)象P可鎮(zhèn)定,則該網(wǎng)絡(luò)化反饋系統(tǒng)能達(dá)到均方漸近跟蹤階躍信號(hào)的充要條件為對(duì)象P的不穩(wěn)定極點(diǎn)λi,i=1,··· ,m和信道丟包率p滿足下面不等式:
定理1描述了均方漸近跟蹤問題中對(duì)象特征參數(shù)與信道特征參數(shù)之間的基本約束,即只有當(dāng)不等式(20)成立時(shí),才可能找到使得跟蹤性能指標(biāo)函數(shù)J達(dá)到最小的狀態(tài)反饋控制律.在下一節(jié),本文將進(jìn)一步討論漸近跟蹤的最優(yōu)設(shè)計(jì)問題.
在上一節(jié)中,本文針對(duì)具有丟包現(xiàn)象的網(wǎng)絡(luò)信道提出了保證網(wǎng)絡(luò)化反饋系統(tǒng)漸近跟蹤階躍信號(hào)的控制器結(jié)構(gòu)(如圖2所示).根據(jù)這個(gè)結(jié)構(gòu),通過把由對(duì)象模型(3)、控制器模型(8)和信道模型(2)組成的原系統(tǒng)模型變換為由偏差狀態(tài)方程(14)、狀態(tài)反饋控制器(16)和信道模型(9)-(10)描述的偏差模型,從而把均方漸近跟蹤問題轉(zhuǎn)化為均方鎮(zhèn)定問題.這一節(jié)將根據(jù)偏差模型進(jìn)一步討論該系統(tǒng)的均方最優(yōu)漸近跟蹤控制問題.
由式(11)和式(13)可知,偏差模型(14)的輸出?z表示為參考信號(hào)r與對(duì)象(3)輸出z之差,即
因此,式(5)中的跟蹤性能指標(biāo)J可表示為偏差狀態(tài)的二次函數(shù),
因此,原系統(tǒng)的均方最優(yōu)漸近跟蹤問題可以轉(zhuǎn)化成為偏差模型的均方最優(yōu)調(diào)節(jié)問題.下面引理給出了偏差模型均方最優(yōu)調(diào)節(jié)問題的狀態(tài)反饋解:
引理2 對(duì)于偏差系統(tǒng)(14)(16)(9)-(10),使得性能指標(biāo)J達(dá)到最小的狀態(tài)反饋控制器為
注1引理2中廣義代數(shù)黎卡提方程(23)的均方鎮(zhèn)定解X指的是:若該方程的解X產(chǎn)生的最優(yōu)控制器(22)能鎮(zhèn)定由(14)(16)(9)-(10)組成的偏差系統(tǒng),則X稱為是該方程的均方鎮(zhèn)定解.
正如文獻(xiàn)[22]指出的那樣,狀態(tài)反饋控制器(22)不一定能使得偏差系統(tǒng)(14)(16)(9)-(10)達(dá)到均方穩(wěn)定.只有當(dāng)X為廣義代數(shù)黎卡提方程(23)的均方鎮(zhèn)定解時(shí),狀態(tài)反饋控制器(22)才能均方鎮(zhèn)定該系統(tǒng).廣義代數(shù)黎卡提方程(23)具有均方鎮(zhèn)定解的充要條件由下面引理給出:
引理3[23]若{ω(k),k=0,1,2,··· ,∞}是均值為零、方差為(1?p)p的獨(dú)立同分布隨機(jī)過程,廣義代數(shù)黎卡提方程(23)存在唯一均方鎮(zhèn)定解的充要條件是:
1) 系統(tǒng)
均方可鎮(zhèn)定;2){Ae,Ce}在單位圓上沒有不能觀極點(diǎn).
上述引理給出廣義代數(shù)廣義黎卡提方程(23)具有均方鎮(zhèn)定解的一般條件.對(duì)于單輸入系統(tǒng)來說,其均方可鎮(zhèn)定的充要條件為系統(tǒng)不穩(wěn)定極點(diǎn)和丟包率p滿足不等式(20).進(jìn)而,本文可得到均方漸近最優(yōu)跟蹤設(shè)計(jì)的主要結(jié)果:
定理2 假設(shè)乘性噪聲序列{ω(k),k=0,1,2,··· ,∞}滿足假設(shè)1.對(duì)象P和信道丟包率p滿足以下條件:
1) 對(duì)象P的所有不穩(wěn)定極點(diǎn)λ1,··· ,λm和丟包率p滿足不等式(20);
2){A,B}可鎮(zhèn)定;
3){A,C}在單位圓上沒有不能觀極點(diǎn);
4) 對(duì)象P沒有z=1的零點(diǎn).
則廣義代數(shù)黎卡提方程(23)存在均方鎮(zhèn)定解,狀態(tài)反饋控制器(22)能均方鎮(zhèn)定偏差系統(tǒng)(14)(16)(9)-(10),原系統(tǒng)(7)-(10)能達(dá)到最優(yōu)漸近跟蹤單位階躍信號(hào).此時(shí),跟蹤性能指標(biāo)最小值為
其中xss和xI,ss由式(13)給出.
證 由于假設(shè){A,B}可鎮(zhèn)定,即在單位圓外沒有不可控極點(diǎn),所以對(duì)于單位圓外的任意λ,矩陣[A?λI B]行滿秩.下面將證明在上述假設(shè)下,對(duì)于單位圓外的任意λ矩陣[Ae?λI Be]行滿秩.若對(duì)于單位圓外的某個(gè)λ,存在一個(gè)非零行向量ve滿足
根據(jù)式(28)可得v0(λ ?2)=0.當(dāng)λ ?=2時(shí),v0=0.從而得到v[A ?λI B]=0,即λ是{A,B}的不能控極點(diǎn).這與{A,B}可鎮(zhèn)定的假設(shè)矛盾.另一方面,當(dāng)λ=2時(shí),由式(28)可得v0=0.因此λ=2是{A,B}的不能控極點(diǎn),同樣與{A,B}可鎮(zhèn)定的假設(shè)矛盾.綜上所述,{Ae,Be}在單位圓外沒有不可控極點(diǎn),即擴(kuò)展對(duì)象是可鎮(zhèn)定的.
另一方面,從式(7)和式(3)很容易看出擴(kuò)展對(duì)象(7)和對(duì)象(3)具有相同的不穩(wěn)定極點(diǎn),因此當(dāng)對(duì)象P的所有不穩(wěn)定極點(diǎn)λ1,··· ,λm和丟包率p滿足于不等式(20)時(shí),擴(kuò)展對(duì)象的不穩(wěn)定極點(diǎn)也滿足該不等式.從而由引理1可知,圖2中的閉環(huán)系統(tǒng)均方可鎮(zhèn)定.由于對(duì)
因此,系統(tǒng)(7)-(10)達(dá)到均方漸近跟蹤.
同時(shí)由引理2可知,均方最優(yōu)狀態(tài)反饋控制器(22)使得圖2所示系統(tǒng)的均方二次指標(biāo)函數(shù)J達(dá)到最小.由于擴(kuò)展偏差系統(tǒng)的初始狀態(tài)由式(15)給出,將式(15)代入式(24),可得均方二次指標(biāo)最小值,即式(26)成立.
證畢.
定理2給出了上述系統(tǒng)的均方最優(yōu)跟蹤狀態(tài)反饋控制器的設(shè)計(jì)方法,該設(shè)計(jì)方法的核心問題是求解廣義代數(shù)黎卡提方程(23)的均方可鎮(zhèn)定解,下面將給出該方程均方鎮(zhèn)定解的具體求解算法.
為此,重寫方程(23)如下:
其中X為廣義代數(shù)黎卡提方程(31)的解,則矩陣不等式Q(X)≥0成立.根據(jù)引理4可知,二次矩陣不等式Q(X)≥0的最大解等于代數(shù)黎卡提方程(32)的最大解.因此,本文可以把求解廣義代數(shù)黎卡提方程(23)均方鎮(zhèn)定解問題轉(zhuǎn)化為基于代數(shù)黎卡提方程(32)最大解(或不等式Q(X)≥0最大解)的尋優(yōu)問題,即下面定理成立:
定理3 若信道不確定性模型(9)中的乘性噪聲ω滿足假設(shè)1,對(duì)象P滿足定理2中的假設(shè)1-4.廣義代數(shù)黎卡提方程(23)的均方鎮(zhèn)定解可由下面線搜索方法求得
證 考慮擴(kuò)展黎卡提方程(23).對(duì)任意滿足以下不等式的γ
由引理4可知,線性矩陣不等式(40)的最大解為代數(shù)黎卡提方程(32)的最大解.由于代數(shù)黎卡提方程(32)的最大解隨γ減小而減小,當(dāng)γ取最小時(shí),不等式(36)等號(hào)成立.相應(yīng)的矩陣X+是廣義代數(shù)黎卡提方程(23)的均方鎮(zhèn)定解.證畢.
下面給出定理3的算法流程圖,見圖4.
圖4 MARE的均方鎮(zhèn)定解求解算法流程圖Fig.4 The algorithm flow chart of mean-square stabilization solution
上面算法中γ2搜索區(qū)間[a,b]初始化的原則如下:當(dāng)γ2=a時(shí),線性矩陣不等式(37)的最大解不滿足不等式(36).a=0是一個(gè)簡(jiǎn)單的選擇.另一方面,當(dāng)γ2=b時(shí),線性矩陣不等式(37)的最大解滿足不等式(36).由于廣義代數(shù)黎卡提方程(23)存在均方鎮(zhèn)定解,當(dāng)γ足夠大時(shí),這一條件一定可以滿足.
系統(tǒng)(42)的采樣周期為0.01 s.在仿真中,仿真步長(zhǎng)為200 次.圖4 給出了對(duì)丟包率p分別為0.01,0.02,0.03,0.04,0.05,0.06時(shí),系統(tǒng)跟蹤誤差?z(k)的曲線.
圖5 系統(tǒng)在不同丟包率下的跟蹤誤差曲線Fig.5 Tracking error curve of the system under different packet loss rates
可以看出,丟包率取不同值時(shí),系統(tǒng)跟蹤誤差?z(k)都能收斂到0,但是隨著丟包率變大,跟蹤誤差收斂的速度變慢,同時(shí)響應(yīng)曲線中出現(xiàn)了由于丟包產(chǎn)生的跟蹤誤差“毛刺”.
進(jìn)一步,本文運(yùn)用蒙特卡洛方法,本文對(duì)丟包率p分別為0.01,0.02,0.03,0.04,0.05,0.06的情況進(jìn)行了100000次仿真.因此表1給出了不同丟包率下系統(tǒng)跟蹤誤差平均能量J的仿真計(jì)算結(jié)果.
表1 不同丟包率下的跟蹤誤差平均能量Table 1 The tracking costs under different packet loss rates
從表1中可以看出,隨著丟包率的增大,系統(tǒng)跟蹤誤差的平均能量在不斷增加.
為了更直觀地分析不同丟包率下的跟蹤誤差平均能量,圖6給出了系統(tǒng)跟蹤誤差的平均能量與丟包率的關(guān)系.圖中實(shí)線給出了系統(tǒng)跟蹤誤差平均能量的理論值,即由定理2中的式(26).表1中由運(yùn)用蒙特卡洛方法得到的不同丟包率下系統(tǒng)跟蹤誤差平均能量在圖6中以?表示.圖中實(shí)線給出的系統(tǒng)跟蹤誤差平均能量的理論值和不同丟包率下的仿真值基本一致.
圖6 不同丟包率下跟蹤誤差的平均能量Fig.6 Tracking costs with different packet loss rates
本文研究了網(wǎng)絡(luò)化反饋系統(tǒng)中控制信號(hào)在傳輸過程存在隨機(jī)丟包情形下的均方最優(yōu)漸近跟蹤問題.為了有效地分析信道隨機(jī)丟包對(duì)漸近跟蹤問題產(chǎn)生的影響,運(yùn)用乘性噪聲模型來描述信道丟包產(chǎn)生的不確定性.為了保證系統(tǒng)實(shí)現(xiàn)漸近跟蹤,提出了一種網(wǎng)絡(luò)化反饋系統(tǒng)的結(jié)構(gòu).在該結(jié)構(gòu)下,討論了系統(tǒng)均方可鎮(zhèn)定性、均方漸近跟蹤問題以及均方最優(yōu)漸近跟蹤問題三者之間的關(guān)系和等價(jià)性.在此基礎(chǔ)上,給出系統(tǒng)均方最優(yōu)漸近跟蹤方案,即通過求解廣義代數(shù)黎卡提
方程(MARE)的均方鎮(zhèn)定解來實(shí)現(xiàn).同時(shí)給出了該系統(tǒng)均方鎮(zhèn)定的充分必要條件以及求解廣義代數(shù)黎卡提方程均方鎮(zhèn)定解的新算法.最后的仿真例子說明對(duì)于信道具有隨機(jī)丟包的網(wǎng)絡(luò)化反饋系統(tǒng),本文所提網(wǎng)絡(luò)化反饋系統(tǒng)漸近跟蹤結(jié)構(gòu)以及均方最優(yōu)漸近跟蹤方案的有效性.
附錄