朱 貴,樓旭陽
(江南大學(xué) 物聯(lián)網(wǎng)工程學(xué)院,江蘇 無錫 214122)
多項(xiàng)式系統(tǒng)是一類非常重要的非線性系統(tǒng),在過程控制及系統(tǒng)生物領(lǐng)域都有極其廣泛的應(yīng)用[1]。因此,對多項(xiàng)式系統(tǒng)的控制及其優(yōu)化控制的研究一直是科學(xué)研究領(lǐng)域的一個熱門課題。但是,由于多項(xiàng)式系統(tǒng)是一類特殊的非線性系統(tǒng),求解其最優(yōu)控制下的可行解顯得十分困難,因此對于如何更好地獲得一個求解該系統(tǒng)可行解的方法是多年來科學(xué)家們所研究的一個主要方向。到目前為止,基于哈密頓-雅克比不等式,以及在狀態(tài)反饋控制策略下,學(xué)者們?nèi)〉昧艘欢ǖ倪M(jìn)展,文獻(xiàn)[2-4]給出了對于如何有效地尋找可行解給出了各自的答案。例如,文獻(xiàn)[2]研究了基于非線性矩陣不等式的H∞控制,文獻(xiàn)[3]基于一類二次型Lyapunov函數(shù)和狀態(tài)反饋控制策略成功獲得了一類多項(xiàng)式系統(tǒng)的可行解。但是,以上所提方法的求解復(fù)雜度依舊很高,對于控制器求解不是特別直接方便。因此,本文在前人的基礎(chǔ)上,基于哈密頓-雅克比不等式,在事件觸發(fā)控制策略下,設(shè)計(jì)了一類控制器并運(yùn)用平方和算法,最終得到了該系統(tǒng)最優(yōu)控制下的一個可行解。
本文采用事件觸發(fā)控制,相較于傳統(tǒng)的時間觸發(fā)控制,事件觸發(fā)控制是否執(zhí)行由事先給定的事件觸發(fā)條件所決定,而不是根據(jù)時間周期來決定[5]。假如觸發(fā)條件在某一時刻發(fā)生,則意味著控制器發(fā)出控制信號,執(zhí)行器進(jìn)行相應(yīng)的操作。因此,可以看出,相較于傳統(tǒng)的連續(xù)時間觸發(fā)控制,事件觸發(fā)控制方案可以有效地減少控制任務(wù)執(zhí)行數(shù)量,在保證系統(tǒng)性能的基礎(chǔ)上,有效地節(jié)約計(jì)算資源和通信資源[5]。對于多項(xiàng)式系統(tǒng)來說,之前的研究結(jié)果大多局限于一般的狀態(tài)反饋和輸出反饋等控制器的設(shè)計(jì)[6],基于事件觸發(fā)的最優(yōu)控制器的設(shè)計(jì)研究還很少。因此,本文在這方面進(jìn)行了相關(guān)的研究。
此外對于多項(xiàng)式系統(tǒng)的優(yōu)化控制問題,由于其非凸特性[1],對于求解其全局最優(yōu)解顯得十分困難。所以在求解多項(xiàng)式函數(shù)最優(yōu)控制問題之前,首先需要先將其轉(zhuǎn)化為一個凸優(yōu)化問題[1]。本文采用的是基于哈密頓-雅克比不等式和狀態(tài)依賴模型,將一般的多項(xiàng)式系統(tǒng)優(yōu)化問題轉(zhuǎn)變成求解狀態(tài)依賴線性矩陣不等式問題[1],進(jìn)而采用平方和算法求解狀態(tài)依賴線性矩陣不等式得到其可行解。
(1)
式中:x∈Rn為系統(tǒng)狀態(tài)變量,u∈Rm為系統(tǒng)輸入。Z(x)為一個N維的多項(xiàng)式狀態(tài)向量,且滿足只有當(dāng)x=0時,Z(0)=0才成立;A(x)為多項(xiàng)式矩陣且滿足一定的維數(shù)。B∈Rn×m是一個常數(shù)矩陣。在本文中,定義狀態(tài)空間區(qū)域?yàn)棣?{x∈Rn:Z(x)TBΘZ(x)≤1},其中BΘ>0。
對于控制輸入u,本文采用的是事件觸發(fā)機(jī)制下的狀態(tài)反饋控制器,具體形式為
(2)
(3)
式中:Z(x)表示的是當(dāng)前時刻的狀態(tài)信息;Z(xk-1)表示第k-1次觸發(fā)時刻的狀態(tài)信息,k=1,2,…。具體的事件觸發(fā)條件在式(8)中給出。
此外,本文定義的誤差變量形式為
(4)
由式(4)可以看出,e(x)的具體含義為:當(dāng)事件觸發(fā)時,該控制輸入誤差為0,當(dāng)事件沒有觸發(fā)時,該控制輸入誤差代表上一觸發(fā)時刻的控制輸入減去當(dāng)前時刻的控制輸入所得到的控制輸入誤差。
引入控制輸入誤差變量之后,結(jié)合式(1)和誤差變量式(4),式(1)可以描述成
(5)
本文設(shè)計(jì)的最優(yōu)控制器主要基于如下二次型損失函數(shù)
(6)
假設(shè)損失函數(shù)的最優(yōu)解為J*(x0,u),可以表述成
J*(x0,u)=minJ(x0,u) ?x0∈Θ
此外,本文還定義了該閉環(huán)系統(tǒng)的一個Lyapunov函數(shù)V(x)。結(jié)合Lyapunov函數(shù)V(x),本文定義了該閉環(huán)系統(tǒng)的一個吸引域Ω[7],形式為
Ω={x∈Rn|V(x)≤ρ}
式中:Ω?Θ,ρ為一個正常數(shù)。不失一般性,本文假設(shè)ρ=1。
由上述內(nèi)容可知,為了求解得到最優(yōu)解J*(x0,u)和最優(yōu)控制器u*,需要去求解哈密-雅克比-貝爾曼方程,而直接求解這個方程是非常困難的。因此,本文通過Lyapunov函數(shù)不等式來求解損失函數(shù)的一個有限上界作為其最優(yōu)解,具體的求解過程由下面的引理給出,證明過程可以參考文獻(xiàn)[8]。
引理1[6]假設(shè)存在一個連續(xù)可微函數(shù)V:Θ→Rn和一個函數(shù)u:Θ→Rm,并滿足條件V(x)>0(?x∈Θ{0}),V(0)=0,且有
uTRu≤0 ?x∈Θ
(7)
那么在二次型性能指標(biāo)式(6)下,該系統(tǒng)在原點(diǎn)處達(dá)到了漸近穩(wěn)定,并只要滿足條件Ω∈Θ,則對于任意的初始值x0∈Ω,都有
J*(x0,u)≤J(x0,u)≤V(x0)
可知,找一個合適的Lyapunov函數(shù)V(x)會使求解該控制器的問題成為一個凸優(yōu)化的問題,但是尋找這樣一個合適的Lyapunov函數(shù)V(x)和控制器u還是一件十分困難的事。本文將利用平方和算法給出其設(shè)計(jì)過程。
注1假設(shè)f(0)=0且f(x)可以表示成f(x)=A(x)x,進(jìn)一步可以表示成
定義1[9]對于一個多變量多項(xiàng)式p(x1,…,xn)=p(x),如果存在多項(xiàng)式f1(x),…,fm(x),使得
則稱p(x)是平方和多項(xiàng)式(SOSP)。
引理2[10]多項(xiàng)式p(x)是SOSP,當(dāng)且僅當(dāng)存在一個半正定矩陣H,使得
p(x)=Z(x)THZ(x)
式中:Z(x)是關(guān)于x的單項(xiàng)式向量。
由定義1和引理2可知,若多項(xiàng)式p(x)是SOSP,則p(x)≥0,所以SOS條件是判斷一個多項(xiàng)式是否是非負(fù)定的一個充分條件。雖然只是一個充分條件,然而數(shù)值仿真實(shí)驗(yàn)表明,該方法帶來的保守性很小,也已有學(xué)者證明,在某些情況下,多項(xiàng)式非負(fù)與該多項(xiàng)式SOS二者是等價的[10]。
在設(shè)計(jì)事件觸發(fā)控制器之前,需要先定義一個事件觸發(fā)條件。本文設(shè)計(jì)的事件觸發(fā)條件為
‖e(x)‖≤σ‖K(x)Z(x)‖
(8)
式中:σ為一個正常數(shù),且取值范圍為0<σ<1。
結(jié)合式(8),式(3)可以描述成為
(9)
為了滿足上述引理1中的限制條件,本文選取的Lyapunov函數(shù)V(x)為
V(x)=Z(x)TP-1Z(x)
(10)
式中:P為一個對稱正定矩陣,即P>0。在此基礎(chǔ)上,吸引域Ω可以進(jìn)一步表示成如下形式
Ω={x∈Rn|Z(x)TP-1Z(x)≤1}
此外,定義M(x)是一個N×n的矩陣,其中矩陣每個元素的定義為
結(jié)合上述討論和已知條件,給出本文的主要結(jié)果。
定理1給定Q>0,R>0,若存在一個對稱正定矩陣P>0滿足如下條件
(11)
(12)
(13)
式中
Φ(x)=-(M(x)A(x)P+PA(x)TM(x)T)-
式(12)中I是滿足一定維數(shù)的單位矩陣,則式(1)在式(2)的作用下,使得閉環(huán)系統(tǒng)原點(diǎn)漸近穩(wěn)定,其中,K(x)=-R-1BTM(x)TP-1,λmax(R)和λmin(R)分別表示矩陣R的最大特征值和最小特征值。同時,對于任意的初始值x0∈Ω,滿足
J*(x0,u)≤J(x0,u)≤V(x0)
證明由條件式(11)可知,吸引域Ω滿足條件Ω?Θ。由式(2)和(4)可得u=K(x)Z(x)+e(x)。將Lyapunov函數(shù)式(10)以及K(x)=-R-1BTM(x)TP-1代入式(7)可得
2Z(x)TP-1M(x)(A(x)Z(x)+BK(x)Z(x)+
Be(x))+Z(x)TQZ(x)+(e(x)+K(x)Z(x))T·
R(e(x)+K(x)Z(x))=Z(x)T(2P-1M(x)A(x))·
Z(x)+Z(x)T(2P-1M(x)BK(x))Z(x)+
Z(x)T(2P-1M(x)B)e(x)+Z(x)TQZ(x)+
e(x)T(RK(x))Z(x)+Z(x)T(K(x)TR)e(x)+
Z(x)T(K(x)TRK(x))Z(x)+e(x)TRe(x)=
Z(x)T(2P-1M(x)A(x)+Q)Z(x)-
Z(x)T(P-1M(x)BR-1BTM(x)TP-1)Z(x)+
e(x)TRe(x)
(14)
由式(8)以及K(x)=-R-1BTM(x)TP-1,可得
e(x)Te(x)≤σ2Z(x)TΨZ(x)
(15)
式中:Ψ=P-1M(x)BR-1R-1BTM(x)TP-1。
將式(15)代入式(14),可得
Z(x)T[2P-1M(x)A(x)+Q-P-1M(x)BR-1BTM(x)TP-1]·
Z(x)+e(x)TRe(x)≤Z(x)T[2P-1M(x)A(x)+
Q-P-1M(x)BR-1BTM(x)TP-1]Z(x)+
P-1M(x)BR-1BTM(x)TP-1]Z(x)
(16)
利用Schur補(bǔ)引理以及Φ(x)的定義,式(12)等價于
M(x)A(x)P+PA(x)TM(x)T+PQP+
對上式分別進(jìn)行左乘和右乘矩陣P-1,可得
P-1M(x)BR-1BTM(x)TP-1≤0
(17)
將式(17)代入式(16),可得
uTRu≤0
所以式(7)成立。又由于Z(0)=0,所以V(0)=0。由V函數(shù)定義可知,V(x)>0(?x∈{Θ0})。從而,由引理1知,閉環(huán)系統(tǒng)在原點(diǎn)漸近穩(wěn)定。利用Schur補(bǔ)引理,條件式(13)等價于Z(x0)TP-1Z(x0)≤1,即x0∈Ω,則可得J*(x0,u)≤J(x0,u)≤V(x0)成立。證畢。
注2本文考慮的是多項(xiàng)式系統(tǒng)在事件觸發(fā)下的最優(yōu)控制問題,而沒有考慮一般狀態(tài)反饋控制下的穩(wěn)定性問題。一個最主要的原因是在那種情況下,會得到一個雙線性矩陣不等式(BMI)的充分條件,求解十分困難[11,12]??紤]在二次型損失函數(shù)下最優(yōu)控制時,本文能夠得到一個狀態(tài)依賴線性矩陣不等式(LMI)條件,且能用MTALAB工具箱SOSTOOLS[13]求解得到可行解。
注3相比于連續(xù)時間控制,事件觸發(fā)控制可以節(jié)約大量的控制資源,同時也較為容易的在硬件設(shè)備上實(shí)現(xiàn),有利于工程實(shí)踐中的硬件設(shè)計(jì)和系統(tǒng)控制的實(shí)現(xiàn)。
本節(jié)給出兩個具體的仿真算例來說明所提方法的有效性。
例1下面以Lorenz系統(tǒng)[14]為對象進(jìn)行研究,它是一個典型的混沌系統(tǒng),具體形式為
(18)
式中:x為狀態(tài)變量,a、b和c為系統(tǒng)參數(shù),u1和u2為控制信號。該系統(tǒng)可以轉(zhuǎn)化成式(1)的形式,其中
B=[1,1,0]T
當(dāng)無控制作用時,即u1=u2=0,且a=10,b=28,c=8/3時,式(15)的狀態(tài)相位圖如圖1所示。
由圖1可以看出,Lorenz系統(tǒng)呈現(xiàn)出混沌狀態(tài)。利用定理1,本文設(shè)計(jì)事件觸發(fā)控制器式(2),其中參數(shù)如下,a=10,b=28,c=8/3,Q=I,R=1,BΘ=1.78I,σ=0.5,其中I是3×3的單位矩陣,取初始值x0=[0.456,0.523,0.675]T,則利用平方和算法可得控制器為
u1=u2=-122.5762x1-110.9763x2+0.0004x3
且
在此控制器作用下,可以得到如圖2所示的結(jié)果。由圖中可以看出,在事件觸發(fā)控制下,該系統(tǒng)能很快地趨于穩(wěn)定,說明了所設(shè)計(jì)控制器的有效性。事件觸發(fā)間隔如圖3所示。
為了說明該控制方法的優(yōu)點(diǎn),本文還給出了該系統(tǒng)在時間觸發(fā)控制情況下的系統(tǒng)狀態(tài),在時間觸發(fā)控制下,其控制信號間隔時間由控制總時間和該段時間內(nèi)的觸發(fā)總次數(shù)決定,而時間觸發(fā)控制下的觸發(fā)總次數(shù)與事件觸發(fā)控制下相同控制時間的觸發(fā)總次數(shù)相同,軌跡如圖4所示。比較圖2和圖4可以看出,事件觸發(fā)控制下系統(tǒng)狀態(tài)的收斂速度要快于時間觸發(fā)控制下的收斂速度,進(jìn)一步說明了事件觸發(fā)控制器的優(yōu)勢。
例2下面這個例子是以Chua’s混沌系統(tǒng)[15]為研究對象,其系統(tǒng)狀態(tài)方程為
(19)
式中:x為狀態(tài)變量,α和β為系統(tǒng)參數(shù),u為控制信號,f(z)為一個分段線性函數(shù),具體形式為
f(z)=dz+0.5(d-e)(|z+1|-|z-1|)
式中:d和e為兩個常數(shù),并且滿足d 同樣地,Chua’s系統(tǒng)也可以轉(zhuǎn)換成式(1)的形式,其中 B=[1,0,0]T 不考慮控制作用,即u=0時,取參數(shù)α=9.215 6,β=15.994 6,d=-1.249 05和e=-0.757 35,該系統(tǒng)呈現(xiàn)出混沌狀態(tài),效果如圖5所示。 仿真中,取Q=2.5I,R=1,BΘ=0.9070I,σ=0.09,且I是一個3×3的單位矩陣,初始值x0=[0.15,0.1,0.2]T。由于f(z)是一個分段線性函數(shù)。所以,分三部分進(jìn)行控制器的設(shè)計(jì),當(dāng)x1<-1時,可得控制器u=-24.1084x1-19.0293x2-9.2791x3+47.5972以及 當(dāng)|x1|≤1時,可得控制器u=-65.6889x1-60.1526x2-9.8241x3且矩陣 當(dāng)x1>1時,可得控制器u=-24.1084x1-19.0293x2-9.2791x3-47.5972和 在上述控制器作用下,控制效果如圖6所示。從圖6可以看出,約3.5 s后,系統(tǒng)狀態(tài)收斂到原點(diǎn)。事件觸發(fā)間隔如圖7所示。 同樣地,在時間觸發(fā)控制下,得到圖8的結(jié)果。從圖中可以看出,系統(tǒng)狀態(tài)收斂到原點(diǎn)需要5 s,收斂速度明顯慢于事件觸發(fā)控制下系統(tǒng)的收斂速度,從而說明了事件觸發(fā)控制的優(yōu)勢。 本文以一類輸入仿射多項(xiàng)式系統(tǒng)為研究對象,基于狀態(tài)依賴模型和哈密頓-雅克比不等式成功構(gòu)造了狀態(tài)依賴線性矩陣不等式,與一般狀態(tài)反饋控制不同,本文還采用了能有效減少計(jì)算資源的事件觸發(fā)控制來研究多項(xiàng)式系統(tǒng)的最優(yōu)控制。最后,基于一類事件觸發(fā)控制策略和平方和算法求解得到了一個可行解,并驗(yàn)證了其有效性。4 結(jié)論