劉善春,李 鯉(.蘭州城市學(xué)院 培黎工程技術(shù)學(xué)院,蘭州 730070; .蘭州城市學(xué)院 培黎石油工程學(xué)院,蘭州 730070)
用于冗余度機(jī)械臂避障神經(jīng)網(wǎng)絡(luò)控制器
劉善春1,李 鯉2
(1.蘭州城市學(xué)院 培黎工程技術(shù)學(xué)院,蘭州 730070; 2.蘭州城市學(xué)院 培黎石油工程學(xué)院,蘭州 730070)
目前,對(duì)機(jī)械臂避障控制器研究方法有多種,經(jīng)分析現(xiàn)有的PD控制器追蹤誤差較大,效果較差.對(duì)此,提出了神經(jīng)網(wǎng)絡(luò)控制器并對(duì)其運(yùn)動(dòng)過程中避障追蹤誤差進(jìn)行仿真驗(yàn)證.構(gòu)建了機(jī)械臂轉(zhuǎn)動(dòng)關(guān)節(jié)避障的動(dòng)力學(xué)模型,在延伸的笛卡爾空間中定義了未知函數(shù).使用多層感知器神經(jīng)網(wǎng)絡(luò)逼近方法,分析了神經(jīng)元自適應(yīng)控制器系統(tǒng)的閉環(huán)穩(wěn)定性,對(duì)系統(tǒng)的閉環(huán)穩(wěn)定性進(jìn)行了證明,得到了神經(jīng)參數(shù)的自適應(yīng)法則.結(jié)合具體實(shí)例,將機(jī)械臂避障神經(jīng)網(wǎng)絡(luò)控制器進(jìn)行仿真,結(jié)果表明,機(jī)械臂末端執(zhí)行器在移動(dòng)障礙物的環(huán)境下具有優(yōu)良的軌跡追蹤效果.
機(jī)械臂; 神經(jīng)網(wǎng)絡(luò); 控制器; 避障; 自適應(yīng)法則;仿真
冗余度機(jī)械臂誕生于20世紀(jì)80年代末,在90年代得到了快速發(fā)展,廣泛應(yīng)用于醫(yī)療、航空、海洋等各種領(lǐng)域.在實(shí)際應(yīng)用中,冗余度機(jī)械臂的主要優(yōu)點(diǎn)在于它們具有靈巧性和避障能力.這主要由于它們的末端執(zhí)行器的自由度數(shù)目超過了實(shí)現(xiàn)規(guī)定任務(wù)所需的自由度數(shù).但是,冗余度帶來了動(dòng)力學(xué)控制器合成具有復(fù)雜性.PD控制器實(shí)現(xiàn)比較容易,無需系統(tǒng)的模型,在工業(yè)應(yīng)用相對(duì)廣泛,但是系統(tǒng)動(dòng)態(tài)性相對(duì)較差.因此,高性能的機(jī)械臂控制一直是當(dāng)今研究的熱點(diǎn).
當(dāng)前,對(duì)機(jī)械臂控制器的研究方法有多種.例如:文獻(xiàn)[1-3]主要研究了機(jī)械臂神經(jīng)網(wǎng)絡(luò)控制及應(yīng)用.文獻(xiàn)[4-6]對(duì)非完整移動(dòng)機(jī)械臂考慮了一種由動(dòng)力學(xué)條件耦合和輸出反饋實(shí)現(xiàn)的自適應(yīng)運(yùn)動(dòng)和力控制展開研究.文獻(xiàn)[7-9]給出了在有不確定性和干擾存在條件下,對(duì)一個(gè)冗余驅(qū)動(dòng)向移動(dòng)機(jī)械手的魯棒軌跡追蹤問題.以往的研究都沒有很好地解決冗余度機(jī)械臂避障問題.對(duì)此,本文采用了神經(jīng)網(wǎng)絡(luò)控制器對(duì)機(jī)械臂運(yùn)動(dòng)過程中避障進(jìn)行控制.創(chuàng)建了冗余度機(jī)械臂避障數(shù)學(xué)模型,給出了機(jī)械臂避障的不等式.采取神經(jīng)網(wǎng)絡(luò)逼近方法,對(duì)神經(jīng)網(wǎng)絡(luò)控制器的穩(wěn)定性進(jìn)行了推導(dǎo).采取3自由度機(jī)械臂避障控制器進(jìn)行驗(yàn)證,同時(shí)與PD控制器進(jìn)行了對(duì)比.帶有神經(jīng)網(wǎng)絡(luò)控制器的機(jī)械臂在移動(dòng)障礙物的環(huán)境下追蹤誤差較小,自適應(yīng)反應(yīng)時(shí)間較短,效果良好.
轉(zhuǎn)動(dòng)關(guān)節(jié)自由度為n的機(jī)械臂動(dòng)力模型如下:
(1)
(2)
式中:J為雅可比矩陣.
如果機(jī)械臂上所有的點(diǎn)和一個(gè)移動(dòng)障礙物間能一直保持一定間距,則機(jī)械臂在運(yùn)動(dòng)過程中能夠避開該障礙物[10].對(duì)障礙物,更多地采用外凸的形狀(球體、圓柱體等),特別是采用球體,因?yàn)槿菀子?jì)算球體和機(jī)械臂不同段之間的距離.
考慮k個(gè)障礙物被一個(gè)半徑為rj、中心分別為笛卡爾坐標(biāo)xoj=(x1oj,x2oj,x3oj),j=1,2,…,k的圓柱體包圍,如圖1所示.設(shè)dj為機(jī)械臂和障礙物中心j的最小距離.為了避免機(jī)械臂和障礙物相撞,沿著軌跡分布的能足夠滿足約束條件如下:
(3)
式中:Tj為障礙物的中心與機(jī)械臂的距離平方與障礙物半徑平方之差.
圖1 有障礙物的冗余機(jī)械臂Fig.1 A redundant manipulator with obstacles
圖2 多層感知器神經(jīng)網(wǎng)絡(luò)Fig.2 Multilayer perceptron neural network
(4)
(5)
S形函數(shù)φ和它的導(dǎo)數(shù)φ′被劃定了界限.有了式(5),我們便可以確定具有泰勒級(jí)數(shù)的逼近誤差界限為
(6)
式中:c1,c2為誤差系數(shù).
3.1控制器分析
神經(jīng)元自適應(yīng)控制器的目標(biāo)是讓機(jī)器人末端執(zhí)行器在具有移動(dòng)障礙物的情況下,能夠?qū)崿F(xiàn)軌跡追蹤.所需的軌跡便在操作增廣空間給出的維度為n的變量:
e=Xd-X
(7)
式中:e為實(shí)際運(yùn)動(dòng)軌跡與理論運(yùn)動(dòng)軌跡誤差;s和xr為機(jī)械臂誤差控制函數(shù);Λ為一個(gè)正對(duì)角矩陣.
在增廣空間X內(nèi),所建立的控制法則為
(8)
K>0是一個(gè)增益矩陣.之后定義的標(biāo)志ω,被用來補(bǔ)償逼近誤差.神經(jīng)元的自適應(yīng)法則由以下的等式給出:
(9)
在笛卡爾空間內(nèi)的控制法則為
(10)
推導(dǎo)得到的最終公式為
(11)
(12)
(13)
式中:向量εφ為由于在第一階逼近每一個(gè)泰勒級(jí)數(shù)時(shí)由逼近產(chǎn)生的干擾.
通過對(duì)矩陣使用弗羅賓尼斯范數(shù),可以得到:
式中:Y{d,o}為兩個(gè)有界限的標(biāo)志;p{1,2}為Λ的正實(shí)數(shù)函數(shù).
(16)
式中:a{1,2,3}為θmax,Yd,λ,φ的正實(shí)數(shù)常數(shù)函數(shù),也具有使用過的神經(jīng)網(wǎng)絡(luò)θ{M,C,H}的逼近特性.
對(duì)由誤差方程(12)定義的系統(tǒng),有以下的補(bǔ)償項(xiàng):
(17)
有
ρω≥a3
(18)
對(duì)補(bǔ)償項(xiàng)式(17)而言,針對(duì)‖θ‖max的評(píng)估是必須的.
3.2穩(wěn)定性分析
定理1具有由式(9)給定的控制法則、神經(jīng)元參數(shù)自適應(yīng)法則式(10)和補(bǔ)償項(xiàng)式(17)的在閉環(huán)系統(tǒng)中[11]是穩(wěn)定的.
證明考慮以下候選的李雅普諾夫函數(shù):
由式(9)、式(10)、式(13),可得到該函數(shù)對(duì)時(shí)間的導(dǎo)數(shù)為
(19)
因?yàn)?/p>
(20)
可以寫為
(21)
(22)
由式(17)給定的ω的表達(dá)式,可得到以下的不等式:
(23)
如果
(24)
最后一個(gè)表達(dá)式等價(jià)于:
(25)
如果滿足以下條件,則上式成立:
(26)
或者
(27)
用于仿真的機(jī)械臂是一個(gè)在垂直平面內(nèi)進(jìn)化的3自由度機(jī)械臂,如圖3所示,長度為l1,l2和l3,所以n=3,m=2.所提議的控制器用于評(píng)估在XY平面內(nèi)對(duì)橢圓的輪廓跟蹤.機(jī)械臂的第一段被一個(gè)移動(dòng)障礙物所約束,控制器必須能夠避免機(jī)械臂與障礙物產(chǎn)生任何碰撞.
障礙物被限制在一個(gè)半徑r=0.05 m、中心xo=(x1o,x2o)的圓內(nèi).在該圓內(nèi),我們可以認(rèn)為有不止一個(gè)障礙物阻礙該機(jī)械臂在控制器的幫助下規(guī)避與該圓發(fā)生碰撞.障礙物的運(yùn)動(dòng)方程給出如下:
(28)
式中:fo=0.7 Hz.
所需的軌跡由以下的方程給出,它代表一個(gè)橢圓:
(29)
式中:fd=1 Hz.
上式給出了計(jì)算障礙物中心和機(jī)械臂第一部分l1的距離d的方法.有障礙物的機(jī)械臂在圖3中表示.
圖3 有1個(gè)障礙物的3自由度機(jī)械臂Fig.3 Three degrees of freedom manipulatorwith one obstacle
我們定義兩個(gè)向量:v1=OA和v2=OD.障礙物的半徑r由AC給出,距離d由AB給出.可以得到以下的公式:
v1·v2=v1v2cos(ψ)
(30)
從這里,可以得到:
所以可以得到:
(31)
因此,如果|x1ocos(q1)+x2osin(q1)|≤l1,約束不等式為
(32)
將在有障礙物的情況下追蹤所需軌跡,同時(shí)最小化關(guān)節(jié)位移能量作為目的的要優(yōu)化的判據(jù)由以下方程定義:
(33)
式中:α=0.01.
將一個(gè)隱藏層中具有5個(gè)隱藏細(xì)胞的神經(jīng)網(wǎng)絡(luò)和雙曲正切函數(shù)用于激活函數(shù).對(duì)控制法則參數(shù)的選擇如下:
最后采取Matlab/Simulink對(duì)機(jī)械臂神經(jīng)網(wǎng)絡(luò)軌跡追蹤誤差進(jìn)行仿真,并與PD追蹤誤差仿真結(jié)果進(jìn)行了對(duì)比,仿真結(jié)果如圖4所示.
圖4 機(jī)械臂軌跡追蹤誤差Fig.4 Tracking error of mechanical arm trajectory
從仿真結(jié)果可以看出:PD追蹤誤差較大,最大誤差達(dá)到0.11 mm,追蹤誤差自適應(yīng)時(shí)間較長,大約1.2 s;神經(jīng)網(wǎng)絡(luò)追蹤誤差較小,最大誤差達(dá)到0.09 mm,追蹤誤差自適應(yīng)時(shí)間較短,大約1.0 s.因此,神經(jīng)網(wǎng)絡(luò)追蹤效果較好.
本文介紹了機(jī)械臂的動(dòng)力學(xué),結(jié)構(gòu)特點(diǎn)和障礙物避障,解決了神經(jīng)元網(wǎng)絡(luò)逼近.同時(shí),對(duì)自適應(yīng)控制器的設(shè)計(jì)和穩(wěn)定性進(jìn)行了推導(dǎo)和分析.最后,對(duì)神經(jīng)元網(wǎng)絡(luò)追蹤控制器與PD追蹤控制器所產(chǎn)生的誤差進(jìn)行了仿真和比較.神經(jīng)元網(wǎng)絡(luò)追蹤控制器避開障礙物效果較好,有著重要的工業(yè)應(yīng)用價(jià)值,為機(jī)械臂運(yùn)動(dòng)過程避開障礙物的研究提供了參考.
[1] 王良勇,柴天佑,方正.考慮驅(qū)動(dòng)系統(tǒng)動(dòng)態(tài)的機(jī)械手神經(jīng)網(wǎng)絡(luò)控制及應(yīng)用[J].自動(dòng)化學(xué)報(bào),2009,35(5):622-626.
WANG L Y,CHAI T Y,FANG Z.Neural network control and application of robotic manipulators including actuator dynamics[J].Acta Automatica Sinica,2009,35(5):622- 626.
[2] WILAMOWSKI B M,COTTON N J,KAYNAK O.Computing gradient vector and Jacobian matrix in arbitrarily connected neural networks[J].IEEE Transactions on Industrial Electronics,2012,55(10):3784-3790.
[3] KUMARA N,PANWARB V,SUKAVANAMC N,et al.Neural network-based nonlinear tracking control of kinematically redundant robot manipulators[J].Mathematical and Computer Modelling,2011,53:1889-1901.
[4] LI Z,YANG Y,LI J.Adaptive motion force control of mobile under-actuated manipulators with dynamics uncertainties by dynamic coupling and output feedback[J].IEEE Transactions on Control Systems Technology,2010,18(5):1068-1079.
[5] BOUKATTAYA M,DAMAKT,JALLOULI M.Robust adaptive control for mobile manipulators[J].International Journal of Automation and Computing,2011,8(1):8-13.
[6] 王紅旗,王慶林.移動(dòng)機(jī)械手運(yùn)動(dòng)/力魯棒自適應(yīng)軌跡跟蹤[J].控制與決策,2010,25(1):105-109.
WANG H Q,WANG Q L.Motion/force robust and adaptive trajectory tracking of mobile manipulator[J].Control and Decision,2010,25(1):105-109.
[7] XU D,ZHAO D,YI J,et al.Trajectory tracking control of omnidirectional wheeled mobile manipulators:robust neural network-based sliding mode approach[J].IEEE Transactions on Systems,Man,and Cybernetics,2012,39(3):788-799.
[8] 董立紅.基于模糊補(bǔ)償?shù)臋C(jī)械手魯棒自適應(yīng)模糊控制研究[J].計(jì)算機(jī)工程與科學(xué),2012,34(1):169-172.
DONG L H.Research on the robust adaptive fuzzy control of manipulators based on fuzzy compensation[J].Computer Engineering Science,2012,34(1):169-172.
[9] ZHANG L J,LIU J K.Adaptive boundary control for flexible two-link manipulator based on partial differential equation dynamic model[J].IET Control Theory and Applications,2013,7(1):43-51.
[10] 姬偉,程風(fēng)儀,趙德安.基于改進(jìn)人工勢(shì)場的蘋果采摘機(jī)器人機(jī)械手避障方法[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2013,44(11):253-258.
JI W,CHENG F Y,ZHAO D A.Obstacle avoidance method of apple harvesting robot manipulator[J].Transactions of the Chinese Society of Agricultural Machinery,2013,44(11):253-258.
[11] KUMAR N,PANWAR V,SUKAVANAM N,et al.Neural network-based nonlinear tracking control of kinematically redundant robot manipulators[J].Mathematical and Computer Modelling,2011,53(3):1890-1899.
Neuralnetworkcontrollerofredundantrobotarmobstacleavoidance
LIUShanchun1,LILi2
(1.Bailie School of Engineering & Technology,Lanzhou City University,Lanzhou 730070,China; 2.Bailie School of Petroleum Engineering,Lanzhou City University,Lanzhou 730070,China)
At present,there are many ways to study robot arm obstacle avoidance controller.Through the analysis of the existing PD controller tracking error,the error is bigger and the effect is poorer.To this,neural network controller is presented,obstacle avoidance tracking error is simulated in the process of movement.To build the dynamic model of robot arm rotating joint obstacle avoidance,in cartesian space extension defines the unknown functions.Using multilayer perceptron neural network approximation method,the closed-loop stability of the neuron adaptive controller system is analyzed.At the same time,the closed-loop stability of the system was proved,nerve parameter adaptive laws is obtained.Combined with concrete example,the robot arm obstacle avoidance neural network controller is simulated.The results show that the robot arm end executor has excellent effect of trajectory tracking under the environment of mobile obstacles.
robot arm; neural network; controller; obstacle avoidance; adaptive laws; simulation
TF 24
: A
: 1672-5581(2017)03-0267-06
甘肅省教育廳基金資助項(xiàng)目(GS[2013]GHB0894)
劉善春(1966—),女,副教授,碩士.E-mail:yuhl201603@sina.com