蔡 軍,羅 成,謝 薇,方志遠(yuǎn)
(重慶郵電大學(xué)自動化學(xué)院,重慶 400065)
隨著科學(xué)技術(shù)的迅猛發(fā)展,機(jī)械臂的控制技術(shù)已經(jīng)涉及機(jī)械,電氣,自動化等眾多的科研領(lǐng)域[1]。但是,在一些特殊的工況條件下,傳統(tǒng)的剛性機(jī)械臂由于能耗高、運(yùn)行速度慢、操作空間有限等原因,已經(jīng)無法滿足要求。因此,具有輕質(zhì)、重載、高靈活性特點(diǎn)的柔性機(jī)械臂成為當(dāng)今機(jī)器人研究的熱點(diǎn)。柔性機(jī)械臂的動力學(xué)系統(tǒng)非常復(fù)雜,具有非線性、強(qiáng)耦合的特點(diǎn),并且在操作柔性機(jī)械臂的過程中,由于臂桿自身的材料屬性,會有剛?cè)狁詈犀F(xiàn)象產(chǎn)生[2]。這給柔性機(jī)械臂的控制帶來了挑戰(zhàn)。文獻(xiàn)[3]中采用了自適應(yīng)PID控制器,自動在線調(diào)整控制增益,解決了單連桿柔性機(jī)械臂在執(zhí)行器失效后的情況下的控制問題。文獻(xiàn)[4-5]中研究了自適應(yīng)徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)滑??刂破鳎蒙窠?jīng)網(wǎng)絡(luò)來自適應(yīng)逼近補(bǔ)償系統(tǒng)建模過程中的不確定項(xiàng),然后,在此基礎(chǔ)上設(shè)計(jì)了滑??刂破鱽韺?shí)現(xiàn)軌跡跟蹤。文獻(xiàn)[6]中針對柔性機(jī)械臂參數(shù)不確定性問題,提出了利用卡爾曼濾波在線估計(jì)的方法來逼近模型的動態(tài)。
迭代學(xué)習(xí)控制適用于具有重復(fù)運(yùn)動性質(zhì)的對象,僅通過足夠多次的重復(fù)迭代,就可以使執(zhí)行對象達(dá)到期望的要求[7-9]。因此,對于具有重復(fù)運(yùn)動性質(zhì)的柔性機(jī)械臂系統(tǒng)很適用。迭代學(xué)習(xí)控制的初始狀態(tài)問題一直是迭代學(xué)習(xí)控制理論的一個研究熱點(diǎn)。早在1991年,Lee等[10]提出:如果每次迭代時,系統(tǒng)的初始狀態(tài)不相等或者系統(tǒng)的初始狀態(tài)存在很小的偏差都會導(dǎo)致系統(tǒng)發(fā)散。原因是信號的偏差會隨著迭代次數(shù)的增加而累加。迭代學(xué)習(xí)的初始狀態(tài)問題可以分為3類:第1類是系統(tǒng)設(shè)定初值等于期望初值;第2類是系統(tǒng)設(shè)定初值等于任一固定值(但不等于期望值);第3類是系統(tǒng)設(shè)定初值等于任意值[11-13]。孫明軒等[14-15]提出在進(jìn)行系統(tǒng)控制輸入迭代學(xué)習(xí)的同時,初態(tài)也進(jìn)行迭代學(xué)習(xí)的控制算法。這樣就放寬了初始定位的條件,提高了控制系統(tǒng)的魯棒性。呂慶等[16-17]針對一類非線性系統(tǒng),在時間軸上設(shè)計(jì)了一個隨迭代次數(shù)增加而縮短的修正區(qū)間,在該時間段內(nèi)對初始偏差進(jìn)行修正,該時間段外實(shí)現(xiàn)系統(tǒng)輸出跟蹤期望輸出。
本文基于文獻(xiàn)[18]中的二連桿柔性機(jī)械臂系統(tǒng)模型,提出了初態(tài)偏差加速修正的PD型迭代學(xué)習(xí)控制算法,解決了該系統(tǒng)迭代學(xué)習(xí)控制方案中因柔性材質(zhì)屬性使得系統(tǒng)每次迭代初始狀態(tài)不同,造成的被控系統(tǒng)控制精度不夠高的問題。
二連桿柔性機(jī)械臂系統(tǒng)各變量定義如圖1所示:τ1和τ2分別為兩個伺服電動機(jī)逆時針方向產(chǎn)生的力矩;m1和m2分別為連桿1、2的質(zhì)量;l1和l2分別為連桿1、2的長度;θ1和θ2分別為兩個伺服電動機(jī)產(chǎn)生的伺服角;q1和q2分別為連桿1、2運(yùn)動過程中產(chǎn)生的偏轉(zhuǎn)角,表征柔性桿的振動情況;XOOYO為地面參考坐標(biāo)系,X1OY1和X2O′Y2分別為連桿1、2的局部坐標(biāo)系。文中柔性連桿1、2的長度均遠(yuǎn)大于橫截面的寬度,因此將該柔性機(jī)械臂視為歐拉-伯努利梁,只考慮柔性連桿彎曲引起的變形。并且該系統(tǒng)只在水平面旋轉(zhuǎn)運(yùn)動,因此忽略重力因素的影響。
二連桿柔性機(jī)械臂系統(tǒng)的動力學(xué)方程為[18]
圖1 二連桿柔性機(jī)械臂
式中:θ=[θ1;θ2]分別為兩個伺服電動機(jī)產(chǎn)生的伺服角;q=[q1;q2]分別為連桿1、2 運(yùn)動過程中產(chǎn)生的偏轉(zhuǎn)角;τ = [τ1,τ2]為系統(tǒng)的輸入矩陣;M∈R4×4為慣性矩陣;D∈R4×4為離心力和哥氏力矩陣;K∈R4×4為剛度矩陣;G∈R4×1為重力矩陣。
對矩陣進(jìn)行分塊處理有:
式中:Mij∈R2×2;Dij∈R2×2;Kf∈R2×2;Gij∈R2×1,i,j=1,2,均為對應(yīng)的塊矩陣。
考慮到二連桿柔性機(jī)械臂的動力學(xué)方程(1)中包括伺服角θ和偏轉(zhuǎn)角q兩部分變量。在柔性機(jī)械臂系統(tǒng)軌跡跟蹤控制中偏轉(zhuǎn)角q無法直接測得,方程(1)可寫為以下兩式:
由式(3)可見,機(jī)械臂內(nèi)部的偏轉(zhuǎn)角q是受伺服角θ影響而產(chǎn)生的變化。由式(3)可進(jìn)一步得到:
雖然方程(5)在形式上與剛性機(jī)械臂的動力學(xué)方程相似,H1類似于剛性機(jī)械臂的慣性矩陣,H2類似于剛性機(jī)械臂的離心力和哥氏力組成的矩陣,H3類似于剛性機(jī)械臂的重力矩陣。但是,通過觀察H1,H2,H3矩陣可以發(fā)現(xiàn)兩者的區(qū)別在于:柔性機(jī)械臂系統(tǒng)的H1,H2,H3矩陣較剛性機(jī)械臂系統(tǒng)的慣性矩陣、離心力和哥氏力組成的矩陣、重力矩陣而言,除了含有伺服角變量θ還有偏轉(zhuǎn)角變量q。
為了便于實(shí)現(xiàn)系統(tǒng)的軌跡跟蹤這一目標(biāo),將方程(5)化為標(biāo)準(zhǔn)的非線性仿射系統(tǒng)。由于機(jī)械臂內(nèi)部的偏轉(zhuǎn)角q是受伺服角θ影響而產(chǎn)生的變化,因此令系統(tǒng)的狀態(tài)量X(t)=[θ]T,得到系統(tǒng)的狀態(tài)方程:
針對在有限時間間隔[0,T]內(nèi)重復(fù)運(yùn)行的二連桿柔性機(jī)械臂系統(tǒng),設(shè)計(jì)了迭代學(xué)習(xí)控制器。假設(shè)該系統(tǒng)每一次迭代學(xué)習(xí)過程中,初始狀態(tài)都不相同,第k次的迭代初態(tài)可表示為xk(0)。
定義系統(tǒng)的跟蹤誤差為:
式中:yd(t)表示系統(tǒng)期望軌跡;yk(t)表示第k 次迭代時系統(tǒng)的輸出。
圖2 初態(tài)加速修正控制器結(jié)構(gòu)框圖
圖2是初態(tài)加速修正的PD型迭代學(xué)習(xí)控制器結(jié)構(gòu)框圖。當(dāng)前次的控制量是由上一次迭代時的控制量、跟蹤誤差值、跟蹤誤差值的變化率及實(shí)時初值偏差,利用該算法的定義(在時間軸上設(shè)計(jì)了一個隨迭代次數(shù)而縮減的修正區(qū)間,該區(qū)間內(nèi)對初始狀態(tài)偏差進(jìn)行修正,修正區(qū)間外實(shí)現(xiàn)跟蹤期望輸出)并通過簡單的代數(shù)組合構(gòu)成的。其形式如下:
式中:a>1,0<h<T,kp為比例學(xué)習(xí)增益;kd為微分學(xué)習(xí)增益,下標(biāo)k為迭代的次數(shù)。
通過將學(xué)習(xí)算法式(9)用于系統(tǒng)式(6)、(7)施行迭代學(xué)習(xí)控制,則系統(tǒng)第k次迭代對應(yīng)的狀態(tài)方程為
系統(tǒng)第k次迭代對應(yīng)的輸出方程為
上述算法計(jì)算步驟如下:①利用方程(8)計(jì)算ek(t);②利用方程(10)計(jì)算φk(t);③利用方程(12)計(jì)算Xk(0);④利用方程(9)計(jì)算uk+1(t);⑤將控制輸入uk+1(t)帶入到系統(tǒng)控制器,并進(jìn)行下一次迭代,重復(fù)①~④。
所提的迭代學(xué)習(xí)算法意義如下:
(1)當(dāng)時間t∈[0,h/ak)時,由于存在初始狀態(tài)值偏差,系統(tǒng)的輸出不能跟蹤上期望軌跡。
可以發(fā)現(xiàn):當(dāng)a>1,迭代次數(shù)k趨于無窮大時,t∈[0,h/ak)→[0,0),初態(tài)偏差修正的時間區(qū)間正在縮短。
(2)當(dāng)時間t∈(h/ak,T]時,被控系統(tǒng)的跟蹤誤差會被限制到一個可控的范圍內(nèi)。
為了驗(yàn)證本文所提算法的有效性,被控對象選用文獻(xiàn)[18]中的二連桿柔性機(jī)械臂系統(tǒng)模型。系統(tǒng)各參數(shù)[18]如下:m1=1.0 kg,J21=9.4 ×10-3kg·m2,m2=0.9 kg,J12= 0.230 4 kg·m2,l1= 0.349 3 m,J22=0.010 7 kg ·m2,l2= 0.297 5 m,E1I1= 9.0 N·m·rad-1,J11= 0.011 1 kg ·m2,E2I2= 4.0 N·m·rad-1。
系統(tǒng)所要跟蹤的期望軌跡為
迭代學(xué)習(xí)控制器的參數(shù)為:
期望軌跡的初態(tài)為
每次迭代的初態(tài)由rand函數(shù)自動隨機(jī)生成。
圖3給出了控制器在20次迭代學(xué)習(xí)下關(guān)節(jié)角1、2的軌跡跟蹤過程圖??梢钥闯觯弘S著迭代的次數(shù)增加,時間軸上的修正區(qū)間在逐漸縮短。圖4給出了控制器在第20次迭代學(xué)習(xí)下關(guān)節(jié)角1、2的軌跡跟蹤圖。
圖3 20次迭代學(xué)習(xí)后關(guān)節(jié)角跟蹤過程
圖4 第20次迭代學(xué)習(xí)的關(guān)節(jié)角跟蹤
圖5 20次迭代學(xué)習(xí)角誤差收斂圖
圖5給出了控制器在20次迭代學(xué)習(xí)下關(guān)節(jié)角1、2在t∈(h/ak,T]時間段內(nèi)軌跡跟蹤誤差收斂圖??梢钥闯觯S著迭代次數(shù)的增加,關(guān)節(jié)角1、2的軌跡跟蹤誤差在逐漸收斂。所提算法有效地抑制了隨機(jī)初態(tài)誤差對系統(tǒng)軌跡跟蹤的不良影響。
在非線性、強(qiáng)耦合的柔性機(jī)械臂系統(tǒng)軌跡跟蹤迭代學(xué)習(xí)控制中,針對因柔性材質(zhì)屬性使得系統(tǒng)每次迭代初始狀態(tài)不同,所造成的被控系統(tǒng)控制精度不夠高的問題,提出了一種初態(tài)加速修正的PD型迭代學(xué)習(xí)算法,在時間軸上設(shè)計(jì)了一個隨迭代次數(shù)而縮減的修正區(qū)間,通過在該區(qū)間內(nèi)對初始狀態(tài)偏差進(jìn)行修正,有效地抑制了隨機(jī)初態(tài)誤差對系統(tǒng)軌跡跟蹤控制的不良影響,實(shí)現(xiàn)了對期望軌跡的跟蹤。