郭旭暉,姚志易,馬維軍
(寧夏大學 信息工程學院, 寧夏 銀川 750021)
近年來,遞歸神經(jīng)網(wǎng)絡在組合優(yōu)化、模式識別等領(lǐng)域得到了廣泛的應用[1-3],引起了人們的廣泛關(guān)注.由于神經(jīng)網(wǎng)絡的動力學行為常常受到隨機和時滯等因素的影響,導致系統(tǒng)失穩(wěn)或震蕩.然而在工程應用中要求網(wǎng)絡必須是穩(wěn)定的,因此對于具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡的穩(wěn)定性研究,無論是在理論研究還是實際應用中都十分重要.很多學者對隨機遞歸神經(jīng)網(wǎng)絡進行了大量研究[4-5],然而關(guān)于其優(yōu)化問題的研究結(jié)果相對較少.到目前為止,還沒有關(guān)于具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡逆最優(yōu)控制的相關(guān)研究成果.本文基于逆最優(yōu)方法和Lyapunov函數(shù),針對一類具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡模型,討論了其全局漸近穩(wěn)定性問題.
考慮如下具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡模型
(1)
其中,x(t)=(x1(t),x2(t),…,xn(t))T∈Rn表示狀態(tài)向量,A=diag(δ1,δ2,…,δn)是一對角矩陣且δi>0,i=1,2,…,n,B=(bij)n×n和C=(cij)n×n分別表示反饋矩陣和時滯反饋矩陣,τ(t)表示時變時滯,f(x(t))=(f1(x1(t)),f2(x2(t)),…,fn(xn(t)))T∈Rn表示非線性激勵函數(shù),E是具有適當維數(shù)的控制輸入矩陣,u(t)為控制輸入,σ(t,x(t),x(t-τ(t)))∈Rn×n表示噪聲強度函數(shù),ω(t)∈Rn是一個n維獨立標準的Wiener過程.
假設激勵函數(shù)fj(xj(t)),時變時滯τ(t)和噪聲強度函數(shù)σ(t,x(t),x(t-τ(t)))滿足以下條件.
(A1)?x,y∈R,?kj>0,使得|fj(yj)-fj(xj)|≤kj|yj-xj|;j=1,2,…,n.
(A2)σ(t,x(t),x(t-τ(t)))是全局Lipschitz連續(xù)且滿足Tr{σ(t,x(t),x(t-τ(t)))Tσ(t,x(t),x(t-τ(t)))}≤‖M1x(t)‖2+‖M2x(t-τ(t))‖2,其中,Tr表示矩陣的跡,M1∈Rn×n和M2∈Rn×n為矩陣.
(A3)fj(0)=0;σij(t,0,0)=0;i,j=1,2,…,n.
定義[6]對于一般的隨機非線性系統(tǒng)
dx=F(x)dt+G1(x)udt+G2(x)dω,
(2)
其中,x∈Rn表示n維狀態(tài),u∈Rp表示狀態(tài)輸入,ω∈Rq是一個獨立標準的Wiener過程.
如果存在滿足以下Hamilton-Jacobi-Bellman(HJB)方程的正最優(yōu)值函數(shù)V(x)
(3)
則
(4)
是可以最小化性能函數(shù)的最優(yōu)穩(wěn)定控制
(5)
其中,對于所有的x,q(x)≥0和R(x)≥0.
在開始證明定理之前,先對Lyapunov函數(shù)進行簡單計算.
對系統(tǒng)(1)構(gòu)造如下Lyapunov函數(shù)
(6)
由假設(A1-A4)及不等式2xy≤xTx+yTy,利用It可得
≤-δxT(t)x(t)+xT(t)Eu(t)+
(7)
選擇控制輸入如下
(8)
將(8)代入(7)可得
LV≤-δxT(t)x(t)≤0.
因此,控制輸入(8)是一個穩(wěn)定控制.
根據(jù)非線性最優(yōu)控制,將Lyapunov函數(shù)(6)作為最優(yōu)值函數(shù)代入HJB方程(3)可得
(9)
在穩(wěn)定控制輸入(8)的基礎上,定義了一個新的控制(即對控制輸入(8)進行簡單修正),
(10)
其中,λ>2是一個常數(shù).
由(3)和(7)可得
(11)
則
xT(t)[-Ax(t)+Bf(x(t))+Cf(x(t-τ(t)))+Eu(t)]-
(12)
定理對于系統(tǒng)(1),存在正定函數(shù)q(x)(12)和嚴格正函數(shù)R(x)(11),使系統(tǒng)(1)通過反饋控制律
(13)
在原點達到全局逆最優(yōu),并使性能函數(shù)最小化
(14)
因此,最優(yōu)控制律(即控制輸入)能使系統(tǒng)(1)達到全局漸近穩(wěn)定.
證明根據(jù)Lyapunov函數(shù)(6),系統(tǒng)(1)的無窮小生成元為
(15)
將控制輸入(13)代入(15)可得
≤0,?x≠0.
(16)
系統(tǒng)(1)通過控制器(13)在x=0處達到全局漸近穩(wěn)定狀態(tài).
下面,對q(x)和R(x)進行討論.
由(12)可得
(M2x(t-τ(t)))-xT(t)[-Ax(t)+Bf(x(t))+Cf(x(t-τ(t)))+Eu(t)]-
(17)
在上述中可知,δ>0,λ>2.則q(x)是正定的和徑向無界的.
由(11)可得
(18)
如果|E|≠0,則ETE>0,R(x)>0.通過選擇q(x)(12)和R(x)(11),LV可表示為
LV=-q(x)-uTR(x)u+(u-u*)TR(x)(u-u*).
(19)
由文獻[7]可得
(20)
根據(jù)(16)可得,最優(yōu)控制u=u*是有意義的成本函數(shù)J的最優(yōu)解.
備注1 本文通過構(gòu)造適當?shù)腖yapunov函數(shù),給出了穩(wěn)定控制(10).由于控制器的設計與參數(shù)有很大關(guān)系,在實際應用中,當激勵函數(shù)的權(quán)值和Lipschitz系數(shù)均為常數(shù)時,通過選擇合適的參數(shù)λ,使(11)中的R(x)變?yōu)槌?shù),則控制輸入(11)就變成了易實現(xiàn)的常數(shù)狀態(tài)反饋控制器.
備注2 在控制工程應用中,最優(yōu)系統(tǒng)具有許多良好的特性,如穩(wěn)定性、魯棒性、降低靈敏度等[8].然而一般隨機非線性系統(tǒng)(2)的HJB方程(3)的解很難求得,在很多情況下,HJB方程沒有解或不存在唯一解.因此,逆最優(yōu)方法為求解非線性系統(tǒng)的最優(yōu)控制問題提供了可能,這種方法的優(yōu)點是不需要求解HJB方程.
備注3 文獻[9]和文獻[10]中指出,逆最優(yōu)控制方法是仿生學神經(jīng)網(wǎng)絡領(lǐng)域最有效的方法之一.然而,在特定任務中優(yōu)化確切的成本函數(shù)并不總是清楚的.因此,如何設計合適的控制器使所考慮的系統(tǒng)達到穩(wěn)定狀態(tài),并使系統(tǒng)的成本函數(shù)達到最優(yōu),是研究非線性系統(tǒng)穩(wěn)定性與控制十分重要的課題之一.
本文對一類具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡提出了一種新的全局漸近穩(wěn)定控制方法.因為求解HJB方程十分困難,很難設計出反饋控制器來實現(xiàn)非線性系統(tǒng)的穩(wěn)定性.本文基于Lyapunov函數(shù)和逆最優(yōu)方法,我們得到了在逆最優(yōu)控制下的具有時變時滯的隨機遞歸神經(jīng)網(wǎng)絡的全局漸近穩(wěn)定控制的充分條件.此外,本文的方法也可以推廣到文獻[5]的模型.