李 光 符 浩
湖南工業(yè)大學,株洲,412007
?
無模型機械臂BP神經(jīng)網(wǎng)絡狀態(tài)觀測及反演跟蹤控制
李光符浩
湖南工業(yè)大學,株洲,412007
針對摩擦阻尼及模型參數(shù)不確定的情況,運用反演控制設計策略,針對多連桿機械臂提出了一種基于神經(jīng)網(wǎng)絡觀測器的無模型軌跡跟蹤控制方法。運用帶有修正項的自適應BP神經(jīng)網(wǎng)絡觀測器對不可測狀態(tài)量進行觀測,同時對系統(tǒng)模型進行在線逼近。在此基礎上設計了基于觀測狀態(tài)和逼近模型的反演跟蹤控制器, Lyapunov穩(wěn)定性理論證明了該控制器能夠保證跟蹤誤差的有界和閉環(huán)系統(tǒng)中所有信號的有界。跟蹤給定軌跡的仿真實驗證明了該方法的有效性。
機械臂;狀態(tài)觀測器;BP神經(jīng)網(wǎng)絡;反演控制
多連桿機械臂系統(tǒng)是一個復雜的多輸入多輸出非線性系統(tǒng),具有時變、強耦合和高度非線性的動力學特性。實際工程應用中,系統(tǒng)不可避免地存在大量的干擾與不確定性;同時,考慮成本、硬件安裝等因素,全局狀態(tài)向量可測量也是難以實現(xiàn)的。因此,高魯棒性的控制器一直是機器人控制領域研究的重點。
文獻[1]用一種非線性干擾觀測器觀測系統(tǒng)的不確定性和干擾,設計了自適應反演滑模控制策略,在全局狀態(tài)向量可測、干擾為緩變量(即干擾項對時間的導數(shù)為0)的條件下,實現(xiàn)機械臂位置跟蹤控制。文獻[2]提出了一種基于神經(jīng)網(wǎng)絡的自適應輸出反饋控制方法,控制器由基于動態(tài)補償器的輸出反饋、神經(jīng)網(wǎng)絡自適應和魯棒三個控制項組成,基于系統(tǒng)的名義模型,可以完成對機械臂端點位置和速度的跟蹤控制。文獻[3-4]利用機械臂動力學系統(tǒng)中慣性矩陣正定有界(包括其導數(shù)及逆同樣有界)的特性,分別提出了無模型的機械臂軌跡跟蹤控制策略。文獻[3]將神經(jīng)網(wǎng)絡作為控制器,利用非線性映射能力來逼近各種未知非線性項,同時通過在控制律中加入魯棒項來消除逼近誤差。文獻[4]利用確定學習理論設計了一種新的自適應神經(jīng)網(wǎng)絡控制器,不僅實現(xiàn)了閉環(huán)系統(tǒng)所有信號的最終一致有界,而且在穩(wěn)定的控制過程中保證了部分神經(jīng)網(wǎng)絡權值的收斂以及未知閉環(huán)系統(tǒng)動態(tài)的局部逼近。以上研究均是基于系統(tǒng)全局狀態(tài)可測量的條件。
本文運用反演控制設計方法,充分考慮系統(tǒng)不確定性和擾動的實際情況,提出了一種無模型機械臂輸出反饋控制設計策略。應用非線性系統(tǒng)觀測器的設計方法,首先設計了基于神經(jīng)網(wǎng)絡的輸出反饋速度狀態(tài)觀測器,權值自適應律中修正項的引入提高了神經(jīng)網(wǎng)絡的逼近精度和魯棒性;之后將逼近模型直接運用于反演控制設計過程,為避免反演法中對中間虛擬控制信號進行求導計算而導致的系統(tǒng)方程微分項的膨脹問題,引入了動態(tài)面控制技術[5-8]。
在計及連桿轉動關節(jié)非線性阻尼的情況下,n連桿機械臂動力學行為描述如下[9]:
(1)
機械臂動力學方程(式(1))具有以下性質:矩陣H(q)的逆矩陣存在,并且H(q)和H-1(q)作為q的函數(shù)是一致有界的。
(2)
f(x)=-H-1(x1)[Vm(x1,x2)x2+τ1(x2)+G(x1)]
其中,0∈Rn×n為零矩陣,I∈Rn×n為單位矩陣。
在機械臂的實際工作中,由于負載的變化導致連桿質心和質量的不確定,難以獲得準確的連桿慣性矩陣。同時,連桿轉動關節(jié)處的摩擦因數(shù)未知。因此,以上非線性函數(shù)向量f(·),g(·)是不確定的,在本文中假設完全未知。
2.1狀態(tài)觀測器設計
定義
F(x,τ)=f(x)+g(x)τ-τ
(3)
原系統(tǒng)的狀態(tài)空間表達式(式(2))可改寫為
(4)
分析動態(tài)系統(tǒng)(式(4))可知,矩陣對(A,C)為可觀測對。以BP神經(jīng)網(wǎng)絡對未知非線性函數(shù)F(x,τ)進行逼近,設計以下神經(jīng)網(wǎng)絡狀態(tài)觀測器:
(5)
根據(jù)前饋神經(jīng)網(wǎng)絡具有任意精度的逼近性能,對非線性項的逼近可以獲得相對較為理想的結果。在給定逼近誤差ε(·)>0的情況下,一定存在權值和閾值構成的三層BP神經(jīng)網(wǎng)絡在誤差允許的范圍內(nèi)逼近非線性函數(shù)[10],即
(6)
(7)
(8)
參照文獻[11]選擇如下權值更新律:
(9)
其中,η1,η2為學習率,η1,η2>0;ρ1、ρ2為修正率,取小的正常數(shù)。
由式(4)~式(8)可得狀態(tài)觀測誤差方程:
(10)
其中,ξ(t)為有界誤差項,即‖ξ(t)‖≤ξN。權值更新律(式(9))可以改寫為以下形式:
(11)
為對所設計的觀測器進行穩(wěn)定性分析,構造以下Lyapunov函數(shù):
(12)
其中,P為正定對稱矩陣,并滿足以下方程:
(13)
其中,Q為正定對稱矩陣。
將式(12)對時間求導,得
(14)
將式(10)、式(11)和式(13)代入式(14),得
(15)
根據(jù)矩陣秩的定義和性質,有以下等式和不等式成立:
(16)
(17)
因此有
(18)
l1=‖PB‖ξN
l3=ρ1‖C‖l4=mη2‖CTCA0-1B‖
l6=ρ2‖C‖
其中,λmin(Q)為矩陣Q的最小特征值, li(i=1,2,…,6)均為大于0的常數(shù)。
式(18)進一步可寫為
(19)
進一步分析權值更新律式(11),其中第一式可改寫為
(20)
同理權值更新律(式(11))中第二式可改寫成
(21)
2.2反演控制器的設計
改寫觀測器式(5)第一式:
(22)
(23)
對時間求導得
(24)
利用式(22)第一式,有
(25)
(26)
(27)
式中,k1∈Rn×n為正定對角常數(shù)矩陣。
(28)
其中,β2∈Rn×n為濾波器的時間常數(shù)對角矩陣,且其對角元素均大于0。
因此,式(26)可改寫為
(29)
定義濾波誤差為
(30)
于是,其濾波誤差微分為
(31)
將式(27)、式(29)、式(30)代入式(24),可得
(32)
定義Lyapunov函數(shù):
(33)
對其求導并應用式(32)得
(34)
對式(26)求導,并利用式(22)第二式,得
(35)
定義Lyapunov函數(shù):
(36)
將上式對時間求導,得
(37)
于是,設計控制律為
(38)
其中,k2∈Rn×n為正定常數(shù)矩陣。因此,式(37)可寫成
(39)
(40)
0 因此,有結論Ⅱ:對于多連桿機械臂系統(tǒng)(式(2)),其狀態(tài)變量由觀測器(式(8))獲得,應用控制輸入(式(38)),則:① 狀態(tài)觀測值的跟蹤誤差有界,且收斂到原點的一個小鄰域內(nèi);② 結合結論Ⅰ,系統(tǒng)的實際跟蹤誤差e=y-yd收斂于可調的小鄰域上。 最終控制系統(tǒng)框圖如圖1所示。 圖1 控制系統(tǒng)框圖 為驗證提出的控制策略的有效性,分別以單連桿和二連桿機械臂系統(tǒng)為對象來進行仿真研究。 3.1單連桿機械臂 構建觀測器中的三層BP神經(jīng)網(wǎng)絡,其中隱含層節(jié)點取10,權值更新律(式(9))中的學習率和修正率分別為η=13 000 ,ρ=5。設計極點配置矩陣L,使得Hurwitz矩陣A0=A-LC的極點為P0=[-10+10i-10-10i],正定矩陣Q=diag(50)。 反演控制器參數(shù)設置如下: k1=k2=50,β2=0.8,桿轉角跟蹤連續(xù)信號yd=sint。 3.2二連桿機械臂 對應動態(tài)方程式(1)中各矩陣、向量為 H(q)= G(q)= 構建觀測器中的三層BP神經(jīng)網(wǎng)絡,其中隱含層節(jié)點取20,權值更新律(式(9))中的學習率和修正率分別為η1=η2=100 000,ρ1=ρ2=5。設計極點配置矩陣L,使得Hurwitz矩陣A0=A-LC的極點為P0=[-15+14i-15-14i-13+15i-13-15i],正定矩陣Q=diag(50)。 反演控制器參數(shù)設置如下:k1=k2=diag(50),β2=diag(0.8),桿轉角跟蹤連續(xù)信號yd=[sintcost-0.5]T。 單連桿系統(tǒng)仿真結果如圖2~圖4所示。從圖2可以看出,機械臂轉角能夠跟蹤期望的連續(xù)軌跡,角位移跟蹤誤差一致收斂于一個小的誤差,約為0.1%;圖3所示為對轉角關節(jié)速度的狀態(tài)估計,所設計的觀測器能快速準確地估計出系統(tǒng)不可測量的狀態(tài)向量;圖4所示為有界的關節(jié)控制輸入。 圖2 單連桿系統(tǒng)關節(jié)軌跡跟蹤 圖3 單連桿系統(tǒng)關節(jié)速度觀測值與期望值 圖4 單連桿系統(tǒng)關節(jié)控制輸入 二連桿系統(tǒng)仿真結果如圖5~圖10所示。從圖5、圖6可以看出,角位移跟蹤誤差一致收斂于一個小的誤差,約為2%;圖7、圖8所示為對轉角關節(jié)速度的狀態(tài)估計,所設計的觀測器能快速準確地估計出系統(tǒng)不可測量的狀態(tài)向量;圖9、圖10所示為有界的關節(jié)控制輸入。 圖5 二連桿系統(tǒng)關節(jié)1軌跡跟蹤 圖6 二連桿系統(tǒng)關節(jié)2軌跡跟蹤 圖7 二連桿系統(tǒng)關節(jié)1速度觀測值與期望值 圖8 二連桿系統(tǒng)關節(jié)2速度觀測值與期望值 圖9 二連桿系統(tǒng)關節(jié)1控制輸入 結合圖2~圖10,對比單連桿和二連桿的控制仿真結果,可以看到隨著系統(tǒng)復雜度增加(機械臂自由度的增加),調節(jié)BP神經(jīng)網(wǎng)絡的設計參數(shù),可以保證對不可測狀態(tài)的觀測精度和動力學系統(tǒng)的在線逼近,并達到良好的軌跡跟蹤控制效果,同時觀測和控制的過渡時間并沒有明顯增加。 針對參數(shù)完全未知并存在外界干擾的多連桿機械臂系統(tǒng),提出了一種基于BP神經(jīng)網(wǎng)絡狀態(tài)觀測器的反演控制方案,觀測器和控制器的設計均不依賴系統(tǒng)的模型參數(shù),融合了狀態(tài)觀測、非線性系統(tǒng)逼近和軌跡跟蹤控制,具有較高的控制魯棒性。分別以單連桿和二連桿機械臂為例進行了控制仿真分析,結果表明神經(jīng)網(wǎng)絡觀測器能快速準確地對系統(tǒng)不可測速度向量進行在線觀測,同時完成對系統(tǒng)的逼近,基于觀測狀態(tài)量和逼近系統(tǒng)設計的反演控制器能夠實現(xiàn)對期望軌跡良好的跟蹤。 [1]席雷平,陳自力,齊曉慧.基于非線性干擾觀測器的機器臂自適應反演滑模控制[J].信息與控制,2013,42(4):470-477. Xi Leiping,Chen Zili,Qi Xiaohui.Adaptive Backstepping Sliding Mode Control for Robotic Manipulator with Nonlinear Disturbance Observer[J].Information and Control,2013,42(4):470-477. [2]賈鶴鳴,宋文龍,郭少彬,等.基于神經(jīng)網(wǎng)絡的機械臂自適應輸出反饋控制設計[J].應用科學學報,2013,31(4):427-433. Jia Heming,Song Wenlong,Guo Shaobin,et al.Adaptive Output Feedback Control of Manipulators Based on Neural Network[J].Jounal of Applied Sciences,2013,31(4): 427-433. [3]付濤,王大鎮(zhèn),弓清忠,等.改進神經(jīng)網(wǎng)絡自適應滑模控制的機器人軌跡跟蹤控制[J].大連理工大學學報,2015,54(5):523-530. Fu Tao,Wang Dazhen,Gong Qingzhong,et al.Robitic Trajectory Tracking Control of Improved Neural Network Adaptive Sliding Mode Control[J].Journal of Dalian University of Technology,2015,54(5):523-530. [4]吳玉香,張景,王聰.機械臂的自適應神經(jīng)網(wǎng)絡控制與學習[J].機械工程學報,2013,49(15):42-48. Wu Yuxiang,Zhang Jing,Wang Cong.Adaptive Neural Network Control and Learning for Robot Manipulator[J].Journal of Mechanical Engineering,2013,49(15):42-48. [5]陳偉,盧京潮,袁燎原,等.基于高增益觀測器的航跡角自適應反步控制[J].北京航空航天大學學報,2013,19(9):1414-1420. Chen Wei, Lu Jingchao, Yuan Liaoyuan, et al. Adaptive Backstepping Control for Flight Path Angle Based on High Gain Observer[J].Journal of Beijing University of Aeronautics and Astronautics, 2013,19(9):1414-1420. [6]陳潔,周紹磊,宋召青.高超聲速飛行器迎角觀測器及控制器設計[J].北京航空航天大學學報,2011,37(7):827-832. Chen Jie,Zhou Shaolei,Song Zhaoqing.Nonlinear Modelling and Open-loop Dynamatics Characteristics for One Hypersonic Aircraft[J].Journal of Beijing University of Aeronautics and Astronautics,2011,37(7):827-832. [7]李紅春.基于動態(tài)面技術的自適應神經(jīng)網(wǎng)絡控制研究[D].揚州:揚州大學,2007. [8]Yoo S J, Park J B, Choi Y H.Output Feedback Dynamic Surface Control of Flexible-joint Robots[J].International Journal of Control Automation and System,2008,6(2):223-233. [9]蔡自興.機器人學[M].2版.北京:清華大學出版社,2009. [10]徐志超,周玉國,于鳳滿.基于改進神經(jīng)網(wǎng)絡的非線性系統(tǒng)觀測器設計[J].微型機與應用,2011,30(8):76-78. Xu Zhichao,Zhou Yuguo,Yu Fengman.Design of Observer for Nonlinear Systems Based on Improved Neural-network[J].Technique and Method,2011,30(8):76-78. [11]Abdollahi F,Talebi H A,Patel R V.A Stable Neural Network-based Observer with Application to Flexible-joint Manipulators[J].IEEE Transactions on Neural Networks,2006,17(1):118-129. (編輯陳勇) BP Neural Network State Observation and Backstepping Tracking Control of Model-free Robotic Manipulators Li GuangFu Hao Hunan University of Technology,Zhuzhou,Hunan,412007 A model-free trajectory tracking control algorithm was proposed for multi-link robotic manipulators with friction damping and model parameter uncertainties based on the backsteeping techniques. An adaptive BP neural network state observer with modification items was used to obtain the unmeasured states and approximated the system model online.Then,a backstepping tracking controller was developed, which took advantages of the observed state values and dynamics.Based on Lyapunov stability theory it is proved that presented controller can guarantee the tracking accuracy and all signals involved are bounded. Finally, it demonstrates that the strategy is effective by the simulation of tracking expected trajectory. robotic manipulator; state observer; BP neural network; backstepping control 2015-05-14 國家自然科學基金資助項目(61273157) TP241.3DOI:10.3969/j.issn.1004-132X.2016.07.002 李光,男,1963年生。湖南工業(yè)大學機械工程學院教授、博士。主要研究方向為復雜機電一體化系統(tǒng)建模和控制。符浩(通信作者),男,1988年生。湖南工業(yè)大學機械工程學院碩士研究生。3 仿真分析
4 結語