管海娃
1.浙江工業(yè)大學(xué) 信息工程學(xué)院,杭州 310023
2.溫州科技職業(yè)學(xué)院,浙江 溫州 325006
迭代學(xué)習(xí)控制技術(shù)適用于有限時間區(qū)間上重復(fù)作業(yè)的控制對象。這種控制技術(shù)利用前次或前幾次運行結(jié)果來修正本次控制輸入,只要足夠多次的運行,可實現(xiàn)在整個作業(yè)區(qū)間上的完全跟蹤。在實際應(yīng)用場合,機器人系統(tǒng)經(jīng)常需要執(zhí)行重復(fù)性工作任務(wù)(例如執(zhí)行搬運、裝配等任務(wù)的工業(yè)機械臂),鑒于機器人運動的重復(fù)性特點和迭代學(xué)習(xí)控制的特性,自1984年提出以來,迭代學(xué)習(xí)控制技術(shù)已被廣泛應(yīng)用于機器人運動控制[1-5]。
近年來,類Lyapunov方法下迭代學(xué)習(xí)控制技術(shù)已經(jīng)成為研究的熱點[6-11]。目前的研究成果主要集中于不確定系統(tǒng),包括參數(shù)化情形和非參數(shù)化情形的學(xué)習(xí)控制,非一致軌跡跟蹤問題以及初值問題。文獻(xiàn)[12]針對具有時變和時不變參數(shù)不確定系統(tǒng),提出一種新的迭代學(xué)習(xí)控制方法,能有效地跟蹤不同的期望軌跡。文獻(xiàn)[13]提出的魯棒自適應(yīng)迭代學(xué)習(xí)控制方法能夠處理離散非線性系統(tǒng)中的參數(shù)和非參數(shù)不確定。文獻(xiàn)[14]通過迭代學(xué)習(xí)控制算法,解決了一類多輸入多輸出系統(tǒng)的非參數(shù)不確定性。文獻(xiàn)[15]針對在任意初值和可變軌跡下,研究了一類離散不確定系統(tǒng)的自適應(yīng)迭代學(xué)習(xí)控制方法。文獻(xiàn)[16]利用障礙Lyapunov函數(shù)設(shè)計控制器,實現(xiàn)控制過程中的輸出約束。文獻(xiàn)[17]借助文獻(xiàn)[16]的思想,構(gòu)造二次分式型障礙Lyapunov函數(shù)函數(shù),提出實現(xiàn)狀態(tài)約束的迭代學(xué)習(xí)控制算法。文獻(xiàn)[18]通過自適應(yīng)迭代學(xué)習(xí)控制,處理高階非線性多智能系統(tǒng)的一致跟蹤問題。
初始定位是應(yīng)用迭代學(xué)習(xí)控制技術(shù)的一個必要條件,它要求在每次迭代開始時系統(tǒng)的初值要和期望軌跡的初值一致。大量較早的文獻(xiàn)研究機器人系統(tǒng)的迭代學(xué)習(xí)控制方法,往往假定系統(tǒng)初始誤差為零[19-21]。但由于實際精度的限制,初始定位誤差難以避免,上述假設(shè)很難滿足。因此,研究在任意初態(tài)下的迭代學(xué)習(xí)控制算法具有重要的理論與實際意義。針對連續(xù)系統(tǒng)的Lyapunov方法,解決初值問題的方案有時變邊界層、誤差跟蹤、有限時間吸引子和初始修正等。文獻(xiàn)[22]基于Lyapunov方法研究了迭代學(xué)習(xí)控制中的五種不同初始條件。文獻(xiàn)[23]在非零初始誤差條件下,引入時變邊界層,構(gòu)造模糊自適應(yīng)迭代學(xué)習(xí)控制器。文獻(xiàn)[24]借助初始修正吸引子的概念,提出有限時間迭代學(xué)習(xí)控制方法,實現(xiàn)在預(yù)先指定的區(qū)間上零誤差跟蹤。文獻(xiàn)[25]研究在任意初始條件下非線性系統(tǒng)的誤差跟蹤學(xué)習(xí)算法。近年來,人們提出重復(fù)學(xué)習(xí)控制方法處理機器人系統(tǒng)的初值問題,這種控制方法在實施時不需要進(jìn)行定位操作,而以上一周期終點時刻系統(tǒng)狀態(tài)信息作為下一周期系統(tǒng)的初值。文獻(xiàn)[26]針對不確定機器人的軌跡跟蹤問題,提出了一種自適應(yīng)重復(fù)學(xué)習(xí)控制方法。文獻(xiàn)[27]通過設(shè)計重復(fù)學(xué)習(xí)控制方案,處理時變機器人系統(tǒng)的定常和時變參數(shù)不確定性。文獻(xiàn)[28]提出一種新的非線性分散重復(fù)學(xué)習(xí)控制,處理非線性機器人系統(tǒng)的軌跡跟蹤問題,實現(xiàn)全局漸近收斂。文獻(xiàn)[29]構(gòu)造新型Barrier函數(shù),實現(xiàn)機器人系統(tǒng)位置約束的重復(fù)學(xué)習(xí)控制算法。重復(fù)學(xué)習(xí)控制,回避了迭代學(xué)習(xí)控制的初始定位問題,但要求參考軌跡是光滑閉合的。針對非零初始誤差,文獻(xiàn)[30]通過修正參考軌跡,提出機器人系統(tǒng)變軌跡問題的迭代學(xué)習(xí)控制算法。這種方法,在每次實現(xiàn)時,需要設(shè)計起始段軌跡。本文借助初始吸引子概念。以回避這一問題。它在任意初態(tài)條件下,實現(xiàn)機器人系統(tǒng)在有限時間內(nèi)對期望軌跡的完全跟蹤問題。
本文通過構(gòu)造一個含有初始修正項的誤差變量,采用Lyapunov-like方法,設(shè)計迭代學(xué)習(xí)控制器處理系統(tǒng)中不確定性,并進(jìn)行性能分析。所提的方法在任意初始條件下,實現(xiàn)跟蹤誤差在預(yù)先指定區(qū)間收斂于零。本文分別針對定常/時變機器人系統(tǒng),采用未含/含限幅學(xué)習(xí)機制,保證閉環(huán)系統(tǒng)各變量的一致有界性。仿真實例中,以三自由度刨床機械臂系統(tǒng)和二自由度的時變機器人系統(tǒng),來說明方法的有效性。本文主要由以下幾個貢獻(xiàn)點:(1)針對非零初始條件,將初始吸引子方法運用于定常/時變機器人系統(tǒng),實現(xiàn)跟蹤誤差在預(yù)先指定區(qū)間收斂于零。(2)本文構(gòu)造一個修正誤差信號,并給出兩種新的ζ(t)函數(shù)的構(gòu)造方案,改進(jìn)了現(xiàn)有的同類設(shè)計方案。文中所給出的修正誤差構(gòu)造方案,具有結(jié)構(gòu)簡單和實施便捷的特點。
考慮下述n自由度剛性定常機器人系統(tǒng):
其中,q,q?,q?∈Rn分別是關(guān)節(jié)的位置、速度和加速度向量,τ∈Rn是輸入力矩向量,D(q)∈Rn×n是慣性矩陣,C(q,q?)是向心力和哥氏力矩陣,g(q)∈Rn是重力向量。
機器人系統(tǒng)(1)具有如下三個重要的性質(zhì):
性質(zhì)1D(q)是對稱正定的矩陣。
性質(zhì) 2D?(q)-2C(q,q?)是反對稱矩陣。
性質(zhì)3動態(tài)方程(1)可線性參數(shù)化成如下形式:
其中,p 是未知的定常參數(shù)向量,φp(q,q?,q?)是相應(yīng)的回歸矩陣。
在實際情況下,許多機器人系統(tǒng)的載荷會隨時間變化,針對時變不確定性,考慮下述時變機器人系統(tǒng):
其中,?∈R?是參數(shù)向量,D(q,?)∈Rn×n是慣性矩陣,C(q,q?,?)是向心力和哥氏力矩陣,g(q,?)∈Rn是重力向量,F(xiàn)(q,?)是由于引入時變參數(shù)?而增加的相關(guān)項,其他量的定義同系統(tǒng)(1)。
時變機器人系統(tǒng)(3)同樣具有三個重要的性質(zhì):
性質(zhì)4D(q,?)是對稱正定的矩陣。
性質(zhì)5D?(q,?)-2C(q,q?,?)-F(q,??)是反對稱矩陣。
性質(zhì)6動態(tài)方程(3)可線性參數(shù)化成如下形式:
D(q,?)q?+C(q,q?,?)q?+F(q,??)q?+g(q,?)=
其中,?=[p,θ(t)]T,p是未知的定常參數(shù)向量,θ(t)是未知的時變參數(shù)向量,φp(q,q?,q?)和 φθ(q,q?,q?)是相應(yīng)的回歸矩陣。
當(dāng)系統(tǒng)在區(qū)間[ ]0,T 上重復(fù)執(zhí)行任務(wù)時,下標(biāo)k記重復(fù)運行次數(shù)。給定二階連續(xù)可導(dǎo)的期望軌跡qd()t,定義跟蹤誤差ek=qd-qk。
本文的控制任務(wù)是,在任意初態(tài)的情形下,即ek(0)≠0,分別針對定常/時變機器人系統(tǒng)設(shè)計迭代學(xué)習(xí)控制器τk,使得跟蹤誤差ek能夠在預(yù)先設(shè)定的區(qū)間上實現(xiàn)完全跟蹤(0<Δ 對于微分方程:其中,α>0,其解可表示為: 方程(5)有唯一的吸引子 χ=0。顯然,對于非零χ0,這是無窮時間吸引子,當(dāng)時間趨于無窮大時,χ收斂于該吸引子,即在迭代學(xué)習(xí)控制器的設(shè)計中,一種更誘人的控制性能是有限時間收斂性。 定義1[24]對于微分方程: 其中,α>0,如果存在初始修正作用r=r(χ0,t),使得對于給定的Δ>0,有: 那么,稱 χ=0為 χ?=-αχ-r的初始修正吸引子。 下面給出一種初始修正作用: 式中,ζ(t)是關(guān)于t的函數(shù),滿足: 由于引入初始修正作用(8),微分方程(7)的解為: 由上式可知,方程的解具有有限時間收斂性。對式(10)求導(dǎo),可得: 由 ζ- 函數(shù)的定義可知,ζ(Δ)=0 ,可使得 χ?(Δ)=0 ,因此,χ(t)在Δ時刻可光滑對接。 鑒于上述初始修正吸引子的概念,本文針對非零初始誤差情形,為了實現(xiàn)有限時間完全跟蹤性能,構(gòu)造修正誤差變量: 其中,c>0是可調(diào)整的參數(shù),rk是為處理非零初態(tài)條件而引入的修正作用,其可表示為: 其中,ek(0)是初始誤差。為了設(shè)計迭代學(xué)習(xí)控制器,選取的ζ(t)在滿足式(9)的前提下,要使得下式恒成立: 注2本文系統(tǒng)初始誤差ek(0)≠0,不滿足常規(guī)迭代學(xué)習(xí)控制算法的要求。為了解決這個問題,構(gòu)造修正誤差變量σk(t),并要滿足σk(0)=0。 當(dāng)e?k(0)=0時,本文給出一種ζ(t)函數(shù)的構(gòu)造方案: 其中,0 當(dāng)c=3,d=0.2,Δ=0.3,ζ1(t)函數(shù)圖像如圖1。 圖1 ζ1(t)函數(shù) ζ(t)函數(shù)的構(gòu)造方案有很多種,類似的,本文給出另一種ζ(t)函數(shù):其中,0 注3現(xiàn)有的幾種ζ(t)函數(shù),在t=0,t=Δ處不連續(xù),或在t=Δ處不可導(dǎo)。本文給出兩種新的ζ(t)函數(shù)的構(gòu)造方案,由式(15)、(16)可以看出,構(gòu)造的兩種 ζ(t)函數(shù)在(0 ,T ]上是連續(xù)可微的,相應(yīng)的,rk在(0 ,T]上是連續(xù)可微的。由式(12)可知σk在[0 , T]上也是連續(xù)可微的。 若當(dāng)σk(t)=0,t∈[0 , T ]成立,式(12)可寫成: 由定義1可知,ek(t)=0,t∈[Δ ,T ],并且可得 e?k(t)=0,t∈[Δ ,T]。 由上面的分析可得,設(shè)計迭代學(xué)習(xí)控制器,經(jīng)過足夠多次迭代后,若能實現(xiàn)在整個作業(yè)區(qū)間[0 , T]上,σk(t)=0,即可實現(xiàn)在[Δ ,T ],ek(t)=0 和 e?k(t)=0 。這是下一章控制器設(shè)計的策略所在。 引入新的變量: 修正誤差變量可轉(zhuǎn)換為: 建立修正誤差變量的動態(tài)方程: 將式(1)代入式(20),并利用性質(zhì)3可得: 其中,Yp(qk,q?k,q?σ,k,q?σ,k)是相應(yīng)的相容矩陣,記為Yp,k。 為設(shè)計迭代學(xué)習(xí)控制器,考慮正定函數(shù): 對Vk求導(dǎo): 通過上面的推導(dǎo),本文可采取如下控制器: 其中,p?k是對 p的估計,p?k的更新律由下式給出: 其中,Q,Γ是對角正定矩陣。應(yīng)用力矩輸入式(24),并結(jié)合性質(zhì)2,式(23)可寫成: 為分析閉環(huán)系統(tǒng)的收斂性和穩(wěn)定性,考慮下述Lyapunov-like函數(shù): 容易得到Vk()0=0。Lk在第k次的迭代差分為: 由分部積分,可得: 將式(26)、(29)代入式(28)得: 應(yīng)用參數(shù)更新律(25),式(30)可寫成: 由于: 那么: 由于 p?k(0)=p?k-1(T),再令 t=T ,得到: 依據(jù)式(34),容易證明下述定理。 定理1對于在任意初態(tài)情形下的機器人系統(tǒng)(1),采用力矩輸入(24),以及參數(shù)更新律(25),可以保證: (1)閉環(huán)系統(tǒng)中的所有變量在[ ]0,T上一致有界。 (2)當(dāng)k→∞時,跟蹤誤差在[ ]Δ,T 上一致收斂于零,即: 證明 首先對L0(t)求導(dǎo): 因此,Lk(t)在上是有界的,由式(27)可知Vk(t),p?k(t)和 σk(t)在上都是有界的。由σk的有界性可得 ek和 e?k在上是有界的。由qd,q?d和rk的有界性,可得上也是有界的。進(jìn)而,由 式(24),可知 τk(t)在上也是有界的。因此,閉環(huán)系統(tǒng)的所有信號都是有界的。 為證明誤差σk(t)一致收斂,對式(34)進(jìn)行累加: 由Lk(T)≥0和L0(T)的有界性,得到: 同上一章,引入變量 q?σ,k,q?σ,k,利用時變機器人系統(tǒng)的性質(zhì)6,建立修正誤差變量的動態(tài)方程: 給出如下控制器: 其中,p?k和 θ?k分別是對 p 和 θ 的估計,p?k和 θ?k的更新律由如下式子給出: 定理2對于在任意初態(tài)情形下的時變機器人系統(tǒng)(3),采用力矩輸入(37)以及參數(shù)更新律(38)、(39),可以保證: 其中,Q,Γ1和Γ2是對角正定矩陣。sat為飽和函數(shù),本文sat(?)定義為,對于a∈R: (2)有界性證明。首先對L0(t)求導(dǎo): 由 θ 和 θˉ-1的有界性可知是有界的,類似于定理1的有界性證明過程,可是有界的,進(jìn)而可得上是都是有界的。由式(37),可知τk(t)在[ ]0,T上是有界的,因此閉環(huán)系統(tǒng)的所有信號都是有界的。進(jìn)一步可得上一致收斂于零。由前面的分析可知,上一致收斂于零。 例1考慮如下三自由度的機械臂系統(tǒng)[31],其模型為: 其中,D(q)=[Dij],C(q,q?)=[Cij],g(q)=[gi],具體各值具體各值可參考文獻(xiàn)[31],q1,q2,q3分別表示各關(guān)節(jié)的位置,q?1,q?2,q?3分別表示各關(guān)節(jié)的速度,l1,l2,l3分別是各關(guān)節(jié)長度,m1,m2,m3分別是各關(guān)節(jié)的重量,i1,i2和i3是三個和慣性有關(guān)的定常參數(shù),g表示重力加速度。對機械臂系統(tǒng)進(jìn)行參數(shù)化,有p=[m1,m2,m3,i1,i2,i3]T,Yp是相應(yīng)的相容矩陣,給定如下: 采用式(13)所示的初始修正作用,其中,ζ(t)選取為式(15)的形式,其中參數(shù)取值為:T=2 s,Δ=0.3 s,d=0.2 s,t1=1 s,c=2。 采用力矩輸入式(24)以及參數(shù)更新律式(25)。參數(shù)取值為Q=diag[8 , 6,6],Γ=diag[17]。其他數(shù)值取為: 仿真結(jié)果由圖2~圖9所示。由圖2~圖5可看出,在非零初始誤差下,引入初始修正作用,設(shè)計的迭代學(xué)習(xí)控制器,經(jīng)過足夠多次迭代,可實現(xiàn)關(guān)節(jié)的位置和速度軌跡在時間區(qū)間[0 . 3,2]上完全跟蹤上相應(yīng)的期望軌跡。圖6給出了在k=10時的關(guān)節(jié)力矩輸入。圖7表示關(guān)節(jié)1的兩個性能指標(biāo)隨迭代次數(shù)的變化情況,其定義為:分別表示在[Δ ,T ]上關(guān)節(jié)1的位置和速度誤差絕對值的最大值。圖8表示關(guān)節(jié)2的兩個性能指標(biāo)隨迭代次數(shù)的變化情況,定義為:分別表示在 [Δ ,T ]上關(guān)節(jié)2的位置和速度誤差絕對值的最大值。圖9表示關(guān)節(jié)3的兩個性能指標(biāo)隨迭代次數(shù)的變化情況,定義為分別表示在[Δ ,T]上關(guān)節(jié)3的位置和速度誤差絕對值的最大值。 例2考慮二自由度的剛性機械臂系統(tǒng)[27],假設(shè)機械臂的載荷是時變的,其系統(tǒng)模型為: 圖2 當(dāng)k=0時,系統(tǒng)位置q和期望軌跡qd 圖3 當(dāng)k=0時,系統(tǒng)速度q?和期望軌跡q?d 圖4 當(dāng)k=10時,系統(tǒng)位置q和期望軌跡qd 圖5 當(dāng)k=10時,系統(tǒng)速度q?和期望軌跡q?d 圖6 當(dāng)k=10時,力矩輸入τ 圖7 指標(biāo)Jp1,k和Jv1,k 圖8 指標(biāo)Jp2,k和Jv2,k 圖9 指標(biāo)Jp3,k和Jv3,k 期望軌跡設(shè)計同例1。采用式(13)所示的初始修正作用,其中,ζ(t)選取為式(15)的形式,其中參數(shù)取值為:T=2 s,Δ=0.3 s,d=0.2 s,c=2。采用力矩輸入式(37)和參數(shù)更新律式(38)、(39)。參數(shù)取值為Q=diag[2 0,10],其他數(shù)值取為: 由圖10和圖11分別表示k=0時,機械臂關(guān)節(jié)1和關(guān)節(jié)2的位置和速度軌跡。迭代20次后,仿真結(jié)果由圖12~16所示。由圖12和圖13可看出,經(jīng)過足夠多次迭代,關(guān)節(jié)的位置和速度軌跡在時間區(qū)間[ ]0.3,2上完全跟蹤上相應(yīng)的期望軌跡。關(guān)節(jié)力矩輸入在第20次迭代期間的取值情況見圖14。圖15表示關(guān)節(jié)1的兩個性能指標(biāo)Jp1,k和Jv1,k隨迭代次數(shù)的變化情況。圖16表示關(guān)節(jié)2的兩個性能指標(biāo)Jp2,k和Jv2,k隨迭代次數(shù)的變化情況。指標(biāo)Jp1,k、Jv1,k、Jp2,k和Jv2,k的定義同例1。 圖10 當(dāng)k=0時,系統(tǒng)位置q和期望軌跡qd 圖11 當(dāng)k=0時,系統(tǒng)速度q?和期望軌跡q?d 圖12 當(dāng)k=20時,系統(tǒng)位置q和期望軌跡qd 圖13 當(dāng)k=20時,系統(tǒng)速度q?和期望軌跡q?d 圖14 力矩輸入τ 圖15 指標(biāo)Jp1,k和Jv1,k 圖16 指標(biāo)Jp2,k和Jv2,k 本文提出定常/時變機器人系統(tǒng)的有限時間迭代學(xué)習(xí)控制方法,解決在任意初態(tài)下的完全跟蹤問題。通過構(gòu)造修正誤差變量,利用Lyapunov-like方法,分別設(shè)計迭代學(xué)習(xí)控制器處理系統(tǒng)中的不確定性,經(jīng)過足夠多次迭代后,修正誤差變量在整個作業(yè)區(qū)間上一致收斂于零。借助初始修正作用,實現(xiàn)跟蹤誤差在預(yù)先指定區(qū)間上的完全跟蹤。最后的仿真實驗驗證了這種學(xué)習(xí)控制方法的有效性。3 修正誤差信號的構(gòu)造
4 定常機器人系統(tǒng)的控制器設(shè)計與性能分析
5 時變機器人系統(tǒng)的控制器設(shè)計與性能分析
6 仿真算例
7 結(jié)束語