徐桂新,宋 齊,于瀟雁,陳 力
(1.福州大學(xué)機(jī)械工程及自動(dòng)化學(xué)院,福建 福州 350116)
(2.流體動(dòng)力與電液智能控制福建省高校重點(diǎn)實(shí)驗(yàn)室(福州大學(xué)),福建 福州 350116)
航天器處在具有高輻射、高溫差、微重力等特點(diǎn)的環(huán)境中,為了實(shí)現(xiàn)其運(yùn)行過程中的維修、加注、回收等操作,空間機(jī)器人得到了越來越廣泛的應(yīng)用。與地面固定機(jī)器人系統(tǒng)相比,空間機(jī)器人具有動(dòng)力學(xué)系統(tǒng)強(qiáng)耦合、非線性控制等特性,需要解決的問題較為復(fù)雜,因此對(duì)其相關(guān)的研究引起了國(guó)內(nèi)外科學(xué)研究人員的廣泛重視[1-2]。許多國(guó)家的科學(xué)家們?cè)O(shè)計(jì)出多種機(jī)械臂控制方法,如PID(proportion,integral,differential)控制[3]、自適應(yīng)和神經(jīng)網(wǎng)絡(luò)結(jié)合控制[4-5]、模糊自適應(yīng)控制[6]、滑模控制[7]、魯棒控制[8]、奇異攝動(dòng)法控制[9]、自適應(yīng)反演控制[10]等方法。Liu等[11]設(shè)計(jì)了一種限定時(shí)間的自適應(yīng)神經(jīng)網(wǎng)絡(luò)反饋控制方法,該方法解決了機(jī)械臂不確定項(xiàng)的補(bǔ)償問題,但是卻強(qiáng)化了外部擾動(dòng)對(duì)系統(tǒng)的魯棒性;洪昭斌等[12]設(shè)計(jì)了一種基于神經(jīng)網(wǎng)絡(luò)的空間機(jī)械臂控制方法,具有不需要測(cè)量、反饋載體位置及移動(dòng)速度和移動(dòng)加速度信號(hào)等特點(diǎn);Zhang等[13]設(shè)計(jì)了一種神經(jīng)變結(jié)構(gòu)控制器,該控制器具有冗余的控制能力,能避免機(jī)械臂末端質(zhì)量改變對(duì)原系統(tǒng)穩(wěn)定性造成破壞,維持其穩(wěn)定性;Zhao等[14]研究了基于對(duì)稱型障礙李雅普諾夫函數(shù)(SBLF)與自適應(yīng)神經(jīng)網(wǎng)絡(luò)的跟蹤問題,控制器采用了反演和自適應(yīng)反饋相結(jié)合的方法。
但是在受到外界干擾的情況下,以往的研究其空間機(jī)械臂的實(shí)際軌跡與期望運(yùn)動(dòng)軌跡有較大的誤差,難以滿足實(shí)際應(yīng)用中對(duì)于機(jī)械臂精確控制的需要。本文提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)(RBFNNs)的空間機(jī)器人魯棒自適應(yīng)軌跡跟蹤滑模控制方法,該方法結(jié)合了滑??刂啤⒆赃m應(yīng)技術(shù)和不同權(quán)值自適應(yīng)律的RBFNNs機(jī)械臂的優(yōu)點(diǎn),實(shí)現(xiàn)了在外太空環(huán)境下的高精度位置跟蹤。
如圖1所示,漂浮基空間機(jī)械臂系統(tǒng)由漂浮載體、兩關(guān)節(jié)機(jī)械臂組成,整個(gè)機(jī)械臂系統(tǒng)滿足動(dòng)量守恒定律。建立平動(dòng)的直角坐標(biāo)系O-XY,各分體沿著平面(X,Y)做平面運(yùn)動(dòng),θ0為本體的姿態(tài)角,θi為機(jī)械臂第i個(gè)關(guān)節(jié)鉸的相對(duì)轉(zhuǎn)角(i=1,2),OCi為各分體Bi的質(zhì)心,ri為OCi的位置矢徑(i=0,1,2),rC為系統(tǒng)的總質(zhì)心C相對(duì)于慣性坐標(biāo)系原點(diǎn)O的矢徑,rP為機(jī)械臂的末端P點(diǎn)相對(duì)O的矢徑。
根據(jù)系統(tǒng)動(dòng)能原理并結(jié)合拉格朗日第二類方程,得到剛性空間機(jī)器人系統(tǒng)載體位置不受控、姿態(tài)受控的動(dòng)力學(xué)方程:
(1)
圖1 剛性單臂空間機(jī)器人系統(tǒng)
假設(shè)單臂空間機(jī)器人載體姿態(tài)角、兩個(gè)關(guān)節(jié)鉸的轉(zhuǎn)角期望軌跡為qd=[θ0d(t),θ1d(t),θ2d(t)]T,是連續(xù)的,則自由漂浮單臂空間機(jī)器人系統(tǒng)的動(dòng)力學(xué)方程具有如下性質(zhì)。
性質(zhì)1v1‖x‖2≤xTD(q)x≤v2‖x‖2,v1,v2為正常數(shù),?x∈R3×1。
利用RBF(radial basis function)神經(jīng)網(wǎng)絡(luò)對(duì)模型的不確定因素進(jìn)行自適應(yīng)補(bǔ)償,以提高建模精度。RBF神經(jīng)網(wǎng)絡(luò)由三層組成,分別為輸入層、隱含層和輸出層,如圖 2所示。
圖2 RBF逼近f(x)
(2)
(3)
實(shí)際軌跡與期望軌跡誤差e為:
e=qd-q
(4)
(5)
取滑模面s:
(6)
式中:λ=diag(λ1,λ2,λ3),為正定矩陣。綜合式(1)、(4)、(5)、(6),得:
(7)
(8)
(9)
(10)
設(shè)計(jì)如下控制器:
(11)
式中:Ks=diag(Ks1,Ks2,Ks3),為正對(duì)角常數(shù)矩陣;τs為待設(shè)計(jì)的魯棒項(xiàng)。
權(quán)值自適應(yīng)率設(shè)置為:
(12)
(13)
式中:FD,F(xiàn)C均為矩陣;KCc,KDd為正常數(shù)。
魯棒項(xiàng):
(14)
式中:Kp為正常數(shù)。為了消除抖振現(xiàn)象,用飽和函數(shù)[15]sat(s)代替符號(hào)函數(shù)sgn(s):
(15)
式中:D為飽和寬度,D、γ均為小的正常數(shù),其中0
(16)
將式(11)代入式(7)得:
(17)
(18)
(19)
對(duì)函數(shù)V(t)求導(dǎo)得:
(20)
由性質(zhì)2,式(20)可寫為:
(21)
將式(17)、(18)代入式(21)得:
(22)
(23)
將自適應(yīng)率式(12)、(13)代入式(23)得:
(24)
(25)
將式(14)、(15)代入式(25)得:
(26)
如果|s|>D,則:
(27)
則
(28)
如果|s| (29) 則 (30) (31) 為了驗(yàn)證本文提出的控制器使得系統(tǒng)具有快速的學(xué)習(xí)能力和快速的收斂性,并且能夠補(bǔ)償結(jié)構(gòu)和非結(jié)構(gòu)的不確定性,與文獻(xiàn)[16]提出的控制方法進(jìn)行了仿真對(duì)比。假設(shè)外部對(duì)機(jī)械臂的干擾為τd=[0.2sint0.2sint0.2sint]T;載體、機(jī)械臂桿1與2的質(zhì)量分別為m0=40 kg,m1=2 kg,m2=1 kg;轉(zhuǎn)動(dòng)慣量分別為J0=34.17 kg·m2,J1=1.5 kg·m2,J2=0.75 kg·m2;桿長(zhǎng)分別為l0=1.5 m,l1=3 m,l2=3 m;其中OC1在x1軸上與O1的距離a1=1.5 m,OC2在x2軸上與O2的距離a2=1.5 m。網(wǎng)絡(luò)初始權(quán)值為0,基函數(shù)寬度選為10,基函數(shù)中心在神經(jīng)網(wǎng)絡(luò)輸入值的值域中選取,設(shè)剛性臂載體姿態(tài)角、機(jī)械臂各關(guān)節(jié)鉸的期望運(yùn)動(dòng)規(guī)律分別為: θ0d=sint MATLAB仿真的載體姿態(tài)角、關(guān)節(jié)角1、關(guān)節(jié)角2初值分別設(shè)置為θ0=0°,θ1=0°,θ2=0°,各個(gè)參數(shù)初值分別設(shè)置為KP=216,Ks=diag(216,216,216),KDd=0.2,KCc=0.2,F(xiàn)D=FC=diag(0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2,0.2),γ=1.3,λ=(13,13,13)。利用本文給出的神經(jīng)網(wǎng)絡(luò)魯棒自適應(yīng)滑??刂品桨笇?duì)系統(tǒng)進(jìn)行數(shù)值模擬仿真運(yùn)算,整個(gè)仿真過程共耗時(shí)15.0 s,方法1為本文設(shè)計(jì)的控制方法,方法2為文獻(xiàn)[16]中的控制方法。 圖3、圖4和圖5分別為兩種算法關(guān)于載體姿態(tài)角、關(guān)節(jié)角1和關(guān)節(jié)角2實(shí)際軌跡追蹤期望軌跡對(duì)比圖。圖6、圖7和圖8分別為載體姿態(tài)角、關(guān)節(jié)角1和關(guān)節(jié)角2實(shí)際軌跡追蹤期望軌跡的誤差對(duì)比圖。由圖可以看出,對(duì)于載體姿態(tài)角,方法1控制系統(tǒng)在0.6 s左右完全跟蹤期望軌跡,最大誤差為6×10-3rad;在2.7 s左右,方法2控制系統(tǒng)完全跟蹤期望軌跡,最大誤差為9×10-2rad。對(duì)于關(guān)節(jié)角1,方法1控制系統(tǒng)在0.5 s左右完全跟蹤期望軌跡,最大誤差為3×10-3rad;方法2控制系統(tǒng)在1.1 s左右完全跟蹤期望軌跡,最大誤差為5×10-2rad。對(duì)于關(guān)節(jié)角2,方法1控制系統(tǒng)在0.6 s左右完全跟蹤期望軌跡,最大誤差為6×10-4rad;方法2控制系統(tǒng)在0.9 s完全跟蹤期望軌跡,最大誤差為1.5×10-2rad。綜上所述,在3個(gè)角的實(shí)際軌跡擬合期望軌跡上,無論是完全擬合期望軌跡所需的時(shí)間還是在精度上,本文設(shè)計(jì)的控制器都要優(yōu)于文獻(xiàn)[16]的神經(jīng)網(wǎng)絡(luò)魯棒控制器,所需時(shí)間更短,也更精確。 圖3 載體姿態(tài)角軌跡跟蹤 圖4 關(guān)節(jié)角1軌跡跟蹤 圖5 關(guān)節(jié)角2軌跡跟蹤 圖6 載體姿態(tài)角誤差 圖9、圖10和圖11分別為控制載體姿態(tài)角、關(guān)節(jié)角1和關(guān)節(jié)角2所需力矩對(duì)比圖,其中圖9為方法1控制系統(tǒng)(含有符號(hào)函數(shù))輸入力矩圖,圖10為改進(jìn)后方法1控制系統(tǒng)(用飽和函數(shù)替代符號(hào)函數(shù)后)輸入力矩圖,圖11為文獻(xiàn)[15]的神經(jīng)網(wǎng)絡(luò)魯棒控制器輸入力矩圖。由圖可以看出,方法1控制系統(tǒng)含符號(hào)函數(shù)時(shí),輸入力矩圖存在很嚴(yán)重的抖振(圖9),而用飽和函數(shù)sat(s)替換符號(hào)函數(shù)sgn(s)后,飽和函數(shù)可有效地抑制系統(tǒng)輸入力矩的抖振,使實(shí)際的控制輸入變得更平滑(圖10)。穩(wěn)定后,方法1控制系統(tǒng)控制載體姿態(tài)角、關(guān)節(jié)角1、關(guān)節(jié)角2所需最大輸入力矩分別為57 N·m、26.5 N·m和5 N·m。圖11顯示,神經(jīng)網(wǎng)絡(luò)魯棒控制器在穩(wěn)定以后控制載體姿態(tài)角、關(guān)節(jié)角1、關(guān)節(jié)角2所需最大輸入力矩分別為116 N·m、53 N·m和10 N·m。由圖可見,方法1控制系統(tǒng)輸入力矩達(dá)到穩(wěn)定所需時(shí)間少,力矩既平滑,又相對(duì)小,耗用能源少。 圖7 關(guān)節(jié)角1誤差 圖8 關(guān)節(jié)角2誤差 圖9 RBFNNs輸入力矩 圖10 改進(jìn)后RBFNNs輸入力矩 圖11 RBF2輸入力矩 針對(duì)空間機(jī)械臂在載體位置不受控、姿態(tài)受控的狀態(tài)下,建立模型誤差與外部干擾同時(shí)存在時(shí)的機(jī)械臂模型,提出了用RBF神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)進(jìn)行基于模型分塊逼近的自適應(yīng)魯棒控制,通過與文獻(xiàn)[16]的控制方法進(jìn)行對(duì)比可以看出,本文所提出的基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的魯棒自適應(yīng)控制方案在實(shí)際軌跡追蹤期望軌跡方面,無論是載體姿態(tài)角,關(guān)節(jié)角1還是關(guān)節(jié)角2,明顯比文獻(xiàn)[16]的控制方法更快,誤差更小,具有控制性能穩(wěn)定、輸入力矩更小且更平滑的優(yōu)點(diǎn)。3 計(jì)算仿真與比較
4 結(jié)束語