席萬強(qiáng),宋 瑩,宋長坡,王堯堯
(1.南京信息工程大學(xué)濱江學(xué)院自動化學(xué)院,江蘇 無錫 214105;2.南京航空航天大學(xué)機(jī)電學(xué)院,南京 210016)
隨著工業(yè)技術(shù)的發(fā)展,工廠生產(chǎn)車間從半自動化逐步向全自動化發(fā)展,機(jī)器代人成為趨勢[1-2]。由于多數(shù)操作都是重復(fù)性的工作,這就需要機(jī)器人在面對重復(fù)運動的作業(yè)任務(wù)具有較好的控制性能。迭代學(xué)習(xí)控制(ILC)對執(zhí)行周期性任務(wù)的系統(tǒng)具有不錯的控制效果[3-4]。
迭代學(xué)習(xí)控制是Arimoto S等[5]在1984年正式提出的一種學(xué)習(xí)控制的重要分支。經(jīng)過30年的發(fā)展,已經(jīng)在理論和應(yīng)用方面取得了豐碩的成果。按照其學(xué)習(xí)率的不同,又可分為PID學(xué)習(xí)率[6](包括P型,PD型,PID型)、高階學(xué)習(xí)率[7]、最優(yōu)學(xué)習(xí)率[8]、前饋-反饋學(xué)習(xí)律[9]、動態(tài)學(xué)習(xí)律[10]、濾波器型學(xué)習(xí)律[11]以及與其他算法相結(jié)合的學(xué)習(xí)律(自適應(yīng)、模糊控制、神經(jīng)網(wǎng)絡(luò))等。PID學(xué)習(xí)率因其簡單形式廣泛應(yīng)用于控制領(lǐng)域。Luo A等[12]提出一種前饋-反饋PI型迭代學(xué)習(xí)控制律,在PI型控制器的基礎(chǔ)上加入D型迭代學(xué)習(xí)控制器作為其前饋環(huán)節(jié),并將其應(yīng)用到注入式混合型有源電力濾波器中,結(jié)果表明該方法不僅計算和使用方便,而且可以有效地提高濾波器的性能。為了提高閥控非對稱缸(VCAC)的控制精度,Wang S K等[13]提出了一種PD型迭代學(xué)習(xí)控制方法,并應(yīng)用于液壓驅(qū)動的6自由度并聯(lián)平臺。Simba K R等[14]提出了一種由經(jīng)典PD控制器和擾動觀測器組成的迭代學(xué)習(xí)輪廓控制器,可以提高跟蹤能力。然而,在實際工業(yè)作業(yè)環(huán)境中,機(jī)器人的負(fù)載通常是未知可變的,這將會對系統(tǒng)造成較大的非線性擾動,影響機(jī)器人的控制性能。單獨的ILC對抑制系統(tǒng)的各種擾動,尤其是非重復(fù)性擾動的作用是有限的,必須將其他控制技術(shù)與迭代學(xué)習(xí)控制技術(shù)結(jié)合起來,而滑模控制(SMC)對于提升系統(tǒng)的魯棒性有很好的效用[15]。
為此,本文提出了一種基于ILC技術(shù)的自適應(yīng)魯棒控制策略。該策略的核心思想是將滑模函數(shù)作為控制變量,添加迭代自適應(yīng)滑模等速趨近律項,以應(yīng)對不確定位置參數(shù)和未知擾動。算法前期主體部分為滑模函數(shù)的比例增益,等同于PD控制,輔助部分為迭代自適應(yīng)控制,算法后期兩者主次顛倒。其基本思想為充分利用系統(tǒng)的先驗信息,對系統(tǒng)中的不確定參數(shù)以及控制器中的未知控制增益進(jìn)行自適應(yīng)迭代學(xué)習(xí)。最后,通過仿真軟件針對兩種工況對控制算法的性能進(jìn)行了實驗驗證。
迭代學(xué)習(xí)下的機(jī)器人動力學(xué)方程可寫為[16]:
(1)
機(jī)器人動力學(xué)方程需滿足如下特性:
(1)M(qk(t))為對稱正定的有界矩陣;
定義滑模控制函數(shù)如下:
(2)
則機(jī)器人的自適應(yīng)ILC技術(shù)的控制器可設(shè)計如下:
(3)
其中,
(4)
(5)
由于滑模控制本身的缺陷以及實際工程應(yīng)用中控制信息的延遲與滯后,使得系統(tǒng)的滑動模態(tài)出現(xiàn)抖震現(xiàn)象。對于連續(xù)系統(tǒng),通常采用準(zhǔn)滑動模態(tài)的方法來抑制這種現(xiàn)象的發(fā)生,即通過設(shè)定理想滑動模態(tài)的某一Δ鄰域,并使系統(tǒng)的運動軌跡限制在該鄰域內(nèi)。通常采用以下準(zhǔn)滑動模態(tài)控制方法:
將理想滑動模態(tài)中的符號函數(shù)sgn(s)用飽和函數(shù)sat(s)代替。
(6)
其中,Δ稱為邊界層。在邊界層外,飽和函數(shù)采用線性化反饋控制,而邊界層內(nèi)則采用切換控制。
本節(jié)將對基于ILC技術(shù)的自適應(yīng)滑??刂破鞯拈]環(huán)系統(tǒng)穩(wěn)定性進(jìn)行分析,主要過程分為以下3個步驟。
①Vk(t)的有界性證明:首先定義Lyapunov能量函數(shù),然后通過證明ΔVk(t)≤0,得出Vk(t)為非遞增序列;
②V0(t)的連續(xù)性和有界性證明:首先證明V0(t)的有界性,然后根據(jù)一致連續(xù)性判定定理,證明V0(t)在[0,T]上一致連續(xù),再根據(jù)閉區(qū)間上連續(xù)函數(shù)的有界定理,證明V0(t)在[0,T]上有界;
在證明過程之前,需要先給出2個定理以及4個假設(shè)條件,以用于下文的證明過程。
定理1:一致連續(xù)性判定定理:若函數(shù)f(x)在區(qū)間[a,b]上的導(dǎo)數(shù)有界,則f(x)在[a,b]上一致連續(xù)。
定理2:閉區(qū)間有界定理:若函數(shù)f(x)在閉區(qū)間[a,b]上連續(xù),則它在[a,b]上有界。
機(jī)器人動力學(xué)方程滿足如下假設(shè)條件:
②不確定項和干擾項dk(t)在任意t∈[0,T]及任意k次迭代中都有界;
(1)Vk(t)的遞增性證明
選取如下Lyapunov函數(shù):
(7)
式中,
(8)
(9)
對Wk(t)求一階導(dǎo)數(shù),然后對兩邊積分可得:
(10)
(11)
為便于等式化簡,可將式(1)寫為:
(12)
結(jié)合式(2)可得:
(13)
將式(13)代入上式得:
(14)
將控制律式(3)代入上式得:
(15)
根據(jù)假設(shè)①~假設(shè)④,可得:
(16)
令δ=α+β,則上式可寫為:
(17)
根據(jù)假設(shè)條件③可知Wk(0)=0,并將式(17)代入式(11)可得:
(18)
將式(18)代入式(9)可得:
(19)
由式(4)可得:
(20)
(21)
從而可以看出Vk是非遞增序列,下面只需證明V0有界,就能說明Vk也是有界的。
(2)V0(t)的有界性證明
在證明之前,需給出如下不等式,該不等式在下文的證明中將會用到。
對于ρ>0,有下列不等式成立:
(22)
由公式(7)可以得到:
(23)
對上式求導(dǎo)可得:
(24)
參考式(18)可以得到:
(25)
第0次迭代時,由公式(20)可知:
(26)
代入上式到式(25)可得:
(27)
將上式代入到公式(24)得:
(28)
由公式(22)可知:
(29)
(30)
代入上式到式(28)可得:
(31)
(3)誤差收斂性證明
Vk可寫為:
(32)
由式(21)可知ΔVk≤-Wk-1,并根據(jù)式(8)可得到:
(33)
代入上式到公式(32)得:
(34)
從而有:
(35)
因為V0有界,則在區(qū)間[0,T]上可得到:
(36)
為了驗證上述提出算法的正確性,現(xiàn)以兩自由度機(jī)械臂作為仿真對象,如圖1所示。
圖1 兩自由度機(jī)械臂
依據(jù)式(1)得出其動力學(xué)方程:
其中,
其中,si=sin(qi),ci=cos(qi),cij=cos(qi+qj),連桿參數(shù)如表1所示,設(shè)系統(tǒng)的期望的跟蹤軌跡為:
qd=[0.5sin(4t) 0.8cos(πt)]T0≤t≤2
表1 兩自由度機(jī)器人參數(shù)
仿真實驗分為兩種工況,其中工況1為無干擾狀況下,用飽和函數(shù)(6)代替控制律(3)中的符號函數(shù)(5),比較兩種函數(shù)對基于ILC的自適應(yīng)滑模算法(簡稱ILC-ASM)控制效果的影響;工況2為添加隨機(jī)干擾,ILC-ASM與ILC兩種算法的控制效果比較。
設(shè)定K=[1000 0;0 1000],σ=[1000 0;0 1000],λ=2,即式(2)表示為:
(37)
圖2~圖5為控制率(3)是符號函數(shù)時,算法ILC-ASM對位置精度、滑模函數(shù)s以及收斂情況的仿真曲線。由圖2、圖3可知:第25次迭代后,位置軌跡盡管能跟蹤期望軌跡,但偏差有毛刺,不夠平滑。由圖4中可知:滑模函數(shù)在第9次迭代后,收斂至最小值,隨著迭代次數(shù)增加,反而呈現(xiàn)發(fā)散趨勢,這主要是因為符號函數(shù)的添加,導(dǎo)致了控制器出現(xiàn)了顫振現(xiàn)象,如圖5所示。為了消除這種顫振現(xiàn)象,使得系統(tǒng)控制器控制軌跡更平滑些,將式(5)代替為式(6),并設(shè)定Δ=0.2,仿真結(jié)果如圖6~圖9所示。由圖6、圖7可知:替換為飽和函數(shù)的控制率之后,系統(tǒng)的偏差軌跡變得更為平滑;最大絕對值滑模函數(shù)曲線呈現(xiàn)收斂趨勢,如圖8所示,說明隨著迭代次數(shù)的增加,系統(tǒng)的精度將會越來越高;并且相比于圖5,滑模函數(shù)軌跡變得更為平滑,抑制了顫振,如圖9所示。
圖2 控制率為符號函數(shù)的第25次迭代位置跟蹤曲線
圖3 控制率為符號函數(shù)的第25次迭代誤差曲線
圖4 控制率為符號函數(shù)的最大滑模函數(shù)絕對值收斂曲線
圖5 控制率為符號函數(shù)的第25次迭代滑模函數(shù)曲線
圖6 控制率為飽和函數(shù)的第25次迭代位置跟蹤曲線
圖7 控制率為飽和函數(shù)的第25次迭代誤差曲線
圖8 控制率為飽和函數(shù)的最大滑模函數(shù)絕對值收斂曲線
圖9 控制率為飽和函數(shù)的第25次迭代滑模函數(shù)曲線
工況2為在工況1的基礎(chǔ)之上添加了隨機(jī)干擾τd
τd=[d1d2]T
(38)
設(shè)定隨機(jī)干擾τd為:
(39)
由于隨機(jī)干擾的添加,會影響系統(tǒng)的穩(wěn)定性。為了使系統(tǒng)的穩(wěn)定裕度變得更大,調(diào)節(jié)飽和函數(shù)的Δ=0.3,為提高其收斂速度,調(diào)節(jié)σ=[30000 0;0 30000],其它參數(shù)與工況1保持一致。仿真結(jié)果如圖10~圖13所示。
圖10 第90次迭代位置跟蹤曲線
圖11 第90次迭代位置誤差曲線
圖12 滑模函數(shù)最大絕對值收斂曲線
圖13 第90次迭代滑模函數(shù)曲線
可以看出,相比于ILC,算法ILC-ASM具有較好的魯棒性能以及較高的軌跡精度。隨機(jī)干擾會使得最大絕對值滑模函數(shù)曲線收斂到一定的精度之后,|s|max保持在一定的范圍內(nèi)變動,精度將不會再提高,當(dāng)然,隨機(jī)干擾也使得系統(tǒng)的滑模函數(shù)呈現(xiàn)隨機(jī)擾動的模式,分別如圖12、圖13所示。圖11比較的是ILC與ILC-ASM的軌跡跟蹤精度,在迭代次數(shù)增加到90次后,ILC-ASM的軌跡精度才較好于ILC,可見ILC-ASM雖對非線性隨機(jī)擾動具有較好的魯棒性能,但需要迭代的次數(shù)卻增加了,不可避免地降低了系統(tǒng)的控制效率。圖13中的波形圖中出現(xiàn)的幾個較大的脈沖,可通過調(diào)節(jié)算法的Δ與σ來抑制,例如,增大Δ的值或減小σ的值,但也會導(dǎo)致軌跡精度變低,收斂變慢,故而Δ與σ的設(shè)置,有一個尋優(yōu)的過程。
針對非線性干擾控制問題,考慮到滑??刂苾?yōu)越的抗干擾性能,提出了基于ILC的自適應(yīng)滑??刂啤榱蓑炞C該控制器的特性以及對隨機(jī)干擾的抗干擾性能,分別基于兩種工況對其進(jìn)行了仿真實驗,結(jié)果表明:
(1) 基于迭代學(xué)習(xí)的自適應(yīng)滑??刂?,既繼承了迭代學(xué)習(xí)對重復(fù)任務(wù)軌跡追蹤較高的控制性能,又繼承了滑??刂戚^高的魯棒性能;
(2) 相比于普通的PD型迭代學(xué)習(xí)控制,雖然調(diào)節(jié)的參數(shù)增加了,但其優(yōu)點是魯棒性更強(qiáng)、軌跡精度更高、且更平滑,缺點是收斂速度較慢,需要多次迭代才能達(dá)到所需要的精度。