徐志超,周玉國,于鳳滿
(青島理工大學 自動化工程學院,山東 青島266033)
近年來,鑒于神經網絡的特性和發(fā)展?jié)摿?,神經網絡成為研究的熱點之一。伴隨著控制對象復雜性的提高,系統(tǒng)存在的不確定因素和難以確切描述的非線性特性也隨之增多,神經網絡的研究和發(fā)展顯得尤為重要。與傳統(tǒng)控制系統(tǒng)狀態(tài)觀測器相比,神經網絡狀態(tài)觀測器具有更強的逼近非線性函數的能力和容錯性,尤其適用于多輸入多輸出系統(tǒng)。
與線性定常系統(tǒng)中的設計[2]相比,本文是在非線性系統(tǒng)中利用前饋神經網絡的函數逼近能力,設計出了一種神經網絡觀測器,并對觀測器的穩(wěn)定性進行了分析。本文采用了LM優(yōu)化算法來改進BP網絡,由于其算法可以比標準梯度下降法網絡訓練速度提高幾十甚至上百倍[3],從而大大提高了工作效率。仿真結果說明了設計的合理性和有效性。
神經網絡觀測器的原理與傳統(tǒng)狀態(tài)觀測器相似,都是利用重構的思想。神經網絡的主要作用是來逼近系統(tǒng)中的非線性函數。首先將輸入量u、狀態(tài)變量x作為BP神經網絡的輸入,對神經網絡進行訓練,使其逼近非線性函數h(x,u);然后將訓練好的網絡用于構成觀測器,并通過神經網絡觀測器的輸出y^與原來系統(tǒng)的輸出y的差值來確定調整BP網絡的權值,使其獲得想要的狀態(tài)估計變量x^。系統(tǒng)只有y可以直接測量。
設計一個神經網絡觀測器關鍵是找一個神經網絡去識別非線性,并且利用傳統(tǒng)的觀測器思想去重構狀態(tài)。因此,神經網絡觀測器模型如圖1所示。
給定如下的非線性系統(tǒng):
其中,x(t)∈Rn狀態(tài)變量,u(t)∈Rq表示輸入變量,y(t)∈Rm表示輸出變量,h(x,u)表示r維未知非線性函數向量,A∈Rn×n、C∈Rm×n為已知定常矩陣,(A,C)是可觀測的。
因此,系統(tǒng)(1)的狀態(tài)觀測器描述為:
給出BP網絡輸入與輸出的關系y=WTf(VTx),依據前饋神經網絡函數具有任意精度逼近的性能,在給定逼近誤差ε(x)>0情況下,一定有三層BP網絡在ε(x)允許的范圍內逼近非線性函數h(x,u)。用η(x)作為一個光滑函數從 Rn→Rm。表示如下:
式中,f(·)是 Sigmoid型函數作為激勵函數,V表示第一層輸入層到第二層隱含層的權值矩陣,即VT=[v21],且第一列包含著閾值向量μ=[μ1,μ2, …,μr];W 表示第二層隱含層到第三層輸出層的權值矩陣,即 WT=[w32];ε(x)是神經網絡逼近誤差,滿足||ε(x)||≤εN。 εN是邊界函數,由隱含層神經元數r決定。假定權值W和V有界限,則有||W||F≤WM和||V||F≤VM。
依據神經網絡逼近性能,在系統(tǒng)(1)中用η(x)來代替光滑非線性函數h(x,u),得:
其中 z=[x u]。
因此,神經網絡函數估計如下:
所以描述觀測器的式(2)被替換為:
其中,eW=W-為神經網絡權值估計誤差,H=A-LC為漸近穩(wěn)定的Hurwitz矩陣,是一個有界的干擾,滿足||ξ(t)||≤,是正常數。
為了訓練神經網絡,在一定條件下定義一個恰當的學習規(guī)則,就是要保證觀測器的穩(wěn)定性。本文神經網絡觀測器穩(wěn)定性的主要思想是采用權值校正機制,通過選擇Lyapunov函數,使其變成負定來達到穩(wěn)定。此外,網絡的權值校正是基于BP算法增加一些修正量來保證觀測器的穩(wěn)定的一種辦法。
定理基于系統(tǒng)模型(1)和觀測器模型(6),對神經網絡參數線性化的權值進行校正:
根據定理得到修正好的神經網絡權值,表示如下:
其中,
η1η2>0是學習率,ρ是一個很小的正數。矩陣 S和 T是控制收斂速度的任意常數矩陣,根據式(10)、式(11)的權值誤差為eW=W-和eV=V-。
所以可以表示為:
選擇正定的Lyapunov函數[5]如下:
其中P=PT>0滿足:
P是Q為正定矩陣時的正定解。
將式(14)求導如下并將式(12)、(13)、(15)代入得:
其次,為了說明式(16)是一個負半定的函數,依據tr(ABT)=BTA和下面的不等式[5]得:
其中 ,WM=sup(W),VM=sup(V),fM=sup(f)。 然后再通過使用fm(1-fm)≤fm,||||=||W-eW||≤WM+||eW||和式(19),得下面不等式為:
定義 K1、K2和 K3為:
然后,在式(16)右側分別加上 K12||eW||2||e||,K22||e||,分別減去||eV||2||e||、K23||e||,得到:
其中,λmin(Q)表示 Q的最小特征值。 假定ρ≥K12且ρ≥1,則式(22)變?yōu)椋?/p>
為了保證τ˙是負半定的即τ˙≤0,能獲得下面的||e||:
因此,根據標準的Lyapunov定理,能說明可觀測的誤差e是一致最終有界。此外,為了表示權值誤差eW的界限,等式(10)可表示為:
其次,由于量ρS||e||是正的,因此有限輸入式(25)系統(tǒng)是穩(wěn)定的,eW有界得到保證。
同理,當將式(11)變成下面的形式:
式(26)代表了一個穩(wěn)定有界輸入的線性系統(tǒng),根據所有它有界的包括f(·)和量ρT||e||是正的,因此eV有界。
綜上所述,通過上面的分析得到了穩(wěn)定的神經網絡觀測器。
本文以一個單機械手的軌跡跟蹤為例,狀態(tài)方程如下:
其中 u(t)=sin(t),t=[0,10]。
本文給出了觀測器設計的過程,具體步驟為:
(1)給出的矩陣對(A,C)是可觀測的,再通過(A-LC)漸進穩(wěn)定求出常增益矩陣L。
(2)通過觀測器的穩(wěn)定性分析,得到相關參數,并在訓練網絡時利用函數trainlm來提高訓練速度。
所以,該系統(tǒng)仿真參數有 L=[400 800],x=[0 0.5]T,=[0.1 0]T,ρ=0.001,S=diag[5×104],T=diag[5×103]。從仿真結果可以看出,神經網絡觀測器對系統(tǒng)狀態(tài)變量有良好的逼近能力,如圖2所示。
本文在非線性系統(tǒng)下建立了神經網絡觀測器,其具有很好的逼近非線性函數的能力。仿真結果說明了其有效性。
[1]周東華,葉銀忠.現(xiàn)代故障診斷與容錯控制[M].北京:清華大學出版社,2000.
[2]田建兵,鄭晟.基于神經網絡的狀態(tài)觀測器設計[J].機械工程與自動化,2008,16(3):22-25.
[3]高雪鵬,叢爽.BP網絡改進算法的性能對比研究[J].控制與決策,2001,16(2):167-172.
[4]LAKHAL A N,TLILI A S,BRAIEK N B.Neural network observer for nonlinear systems application to induction motors[J].International Journal of Control and Automation,2010,3(1).
[5]ABDOLLAHI F,TALEBI H A.A stable neural network observe-based observer with application to flexible joint manipulators[J].IEEE Transaction on Neural Network.2006(1):118-129.
[6]武宏偉,戴瓊海,王普,等.基于神經網絡的非線性系統(tǒng)的觀測器設計[J].清華大學學報,2000,40(3):11-15.
[7]叢爽.面向MATLAB工具箱的神經網絡理論與應用[M].北京:中國科學技術出版社,2009.