王元生,楊書根
(1.鹽城工業(yè)職業(yè)技術(shù)學(xué)院 汽車工程學(xué)院, 江蘇 鹽城 224005;2.江蘇大學(xué) 機(jī)械工程學(xué)院,江蘇 鎮(zhèn)江 212013;3.江蘇高精機(jī)電裝備有限公司,江蘇 鹽城 224053)
隨著現(xiàn)代科技的不斷發(fā)展,高端數(shù)控機(jī)床在裝備制造業(yè)領(lǐng)域發(fā)揮越來越重要的作用?,F(xiàn)代數(shù)控機(jī)床已向高精度和高速化的方向不斷發(fā)展,但是想要實現(xiàn)高精度運動控制并不容易,由于X-Y數(shù)控工作臺廣泛用于機(jī)械制造過程中,系統(tǒng)總是受到多種非線性影響,如非線性摩擦、輸入飽和、齒隙和外部擾動等,其中以摩擦非線性對系統(tǒng)的運動控制的影響最為明顯,因此,研究設(shè)計一種高效的控制器來實現(xiàn)摩擦補(bǔ)償,對提高X-Y工作臺的控制性能具有重要意義[1-5]。
摩擦導(dǎo)致伺服系統(tǒng)在零速附近表現(xiàn)出很強(qiáng)的非線性特征,會使系統(tǒng)的控制效果在低速和速度轉(zhuǎn)向時惡化。學(xué)者們研究了多種摩擦補(bǔ)償?shù)姆椒╗6-7]。文獻(xiàn)[8]提出了一種基于輸出反饋的自適應(yīng)反步控制器。文獻(xiàn)[9]設(shè)計了基于滑模觀測器的自適應(yīng)控制器,采用滑模觀測器估計LuGre模型內(nèi)部的摩擦狀態(tài),再基于估計的摩擦狀態(tài),設(shè)計自適應(yīng)控制器來實現(xiàn)未知的摩擦和負(fù)載轉(zhuǎn)矩的補(bǔ)償。文獻(xiàn)[10]設(shè)計自適應(yīng)魯棒控制器來實現(xiàn)摩擦補(bǔ)償。除了非線性摩擦的影響外,其他不確定非線性包括外部擾動等都對高精度的系統(tǒng)設(shè)計帶來困難和挑戰(zhàn),因此需要同時考慮這些問題。對于文獻(xiàn)[10],當(dāng)外部擾動逐漸增大時,設(shè)計強(qiáng)增益的非線性魯棒反饋項來補(bǔ)償擾動,這種控制器的保守性就會逐級暴露出來,越強(qiáng)的外部擾動會導(dǎo)致越差的跟蹤性能,最終會帶來系統(tǒng)的失穩(wěn)。
由于神經(jīng)網(wǎng)絡(luò)的設(shè)計不需要被控對象的數(shù)學(xué)模型,且具有很強(qiáng)的自學(xué)習(xí)和自適應(yīng)能力,故在不確定性補(bǔ)償上面取得了很好的效果[11-13];同時,神經(jīng)網(wǎng)絡(luò)可以對任意未知非線性函數(shù)進(jìn)行任意精度的逼近。因此,可設(shè)計神經(jīng)網(wǎng)絡(luò)觀測器用來補(bǔ)償外部擾動。本文結(jié)合自適應(yīng)魯棒控制和神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)能力的思想,提出一種基于非線性雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,以顯著提高伺服系統(tǒng)的跟蹤性能;通過設(shè)計非線性雙觀測器用來逼近LuGre模型內(nèi)部不可測量的摩擦狀態(tài),同時設(shè)計神經(jīng)網(wǎng)絡(luò)觀測器用來補(bǔ)償外部擾動;通過李雅普諾夫函數(shù)驗證了系統(tǒng)的穩(wěn)定性和對位置和速度的期望信號的漸近跟蹤。為驗證這種方法的有效性,對伺服系統(tǒng)進(jìn)行跟蹤仿真,通過仿真結(jié)果驗證所提出的控制策略的高性能。
本文所考慮的X-Y數(shù)控工作臺的結(jié)構(gòu)示意圖如圖1所示,主要由控制器、伺服驅(qū)動器、伺服電機(jī)、編碼器和執(zhí)行機(jī)構(gòu)等組成。
圖1 X-Y數(shù)控工作臺系統(tǒng)示意圖
根據(jù)牛頓第二定律,X-Y工作臺的動力學(xué)方程如下:
(1)
其中,j是轉(zhuǎn)動慣量;x是電機(jī)輸出軸的位置;U是控制量;F是摩擦力矩;TL是負(fù)載扭矩;d是模型的其它不確定項,包括外部擾動。
采用動態(tài)LuGre摩擦模型,能夠比較全面的描述摩擦力現(xiàn)象,故摩擦力矩表示如下:
(2)
(3)
(4)
定義新函數(shù)N(x2)=α(x2) |x2|,將方程(2)、(3)代入到方程(1)中,因此X-Y工作臺的系統(tǒng)模型可表示為:
(5)
假設(shè)1:給定所期望的運動軌跡x1d(t)是有界的,且有二階有界導(dǎo)數(shù)。
假設(shè)2:參數(shù)θ和時變擾動d分別滿足:
θ∈Ωθ={θ:θmin≤θ≤θmax}
(6)
|d|≤δ
(7)
其中,θmin=[θ1min,…,θ5min]T,
θmax=[θ1max,…,θ5max]T是已知的;δ是已知的有界正函數(shù)。
(8)
其中,i=1、2、3、4、5,·i代表矩陣·的第i項。設(shè)計參數(shù)自適應(yīng)律為:
(9)
(10)
(11)
由于LuGre模型中的鬃毛平均變形狀態(tài)Z不可以測量,為了觀測到狀態(tài)Z以及處理其非線性, 設(shè)計非線性雙觀測器估計摩擦狀態(tài)。非線性雙觀測器方程設(shè)計如下:
(12)
定義投影映射為:
(13)
其中,觀測器的范圍為:Zmax=Fs,Zmin=-Fs。上述觀測器具有以下性能:
(14)
(15)
(16)
一個典型的RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)如圖2所示。
圖2 RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)圖
由于神經(jīng)網(wǎng)絡(luò)的萬能逼近特性,設(shè)計RBF神經(jīng)網(wǎng)絡(luò)觀測器去估計時變擾動,其網(wǎng)絡(luò)算法為:
(17)
(18)
式中,x為網(wǎng)絡(luò)的輸入,j為網(wǎng)絡(luò)隱含層第j個節(jié)點,h=[hj]T為網(wǎng)絡(luò)的高斯基函數(shù)輸出,W*為網(wǎng)絡(luò)的理想權(quán)值;εapprox為網(wǎng)絡(luò)的逼近誤差,
(19)
網(wǎng)絡(luò)輸入取xv=[x1,x2]T,則網(wǎng)絡(luò)輸出為:
(20)
設(shè)計權(quán)值自適應(yīng)律為:
(21)
(22)
步驟1:定義期望的位置信號x1d,e1=x1-x1d表示位置跟蹤誤差信號。e2=x2-x2eq表示輸入誤差,由此可得:
(23)
根據(jù)方程(23),設(shè)計虛擬控制函數(shù)x2eq為:
(24)
其中,k1是正的反饋增益。將(24)帶入(23)中,則可得誤差動力學(xué)方程為:
(25)
步驟2:在這一步中設(shè)計實際的控制律u。e2的導(dǎo)數(shù)可以表示為:
(26)
則設(shè)計系統(tǒng)的控制量u為:
(27)
其中,u為所設(shè)計的控制量,u2為非線性魯棒項。將上述方程帶入方程(26)中,e2的導(dǎo)數(shù)可以表示為:
(28)
步驟3:在這一步中,非線性魯棒反饋項U2被設(shè)計為:
(29)
其中,hs是所有誤差的上限,且是滿足下列條件的任何光滑函數(shù):
(30)
εs是一個正實數(shù),它具有以下性質(zhì):
(31)
e2·U2≤0
(32)
定義Lyapunov方程V1(t)為:
(33)
由方程(28)我們可以得到:
(34)
由不等式(31)上述方程可以簡化為:
(35)
(36)
其中,λ=2k2/θ1min,故當(dāng)e→∞,V1(t)=εs/λ,且:
(37)
(38)
因此,基于非線性雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器能夠保證規(guī)定的輸出跟蹤瞬態(tài)性能和最終跟蹤精度。一段有限的時間后,通過減小參數(shù)可以將跟蹤誤差調(diào)整到規(guī)定的范圍內(nèi)。
結(jié)論1:對于X-Y數(shù)控工作臺的系統(tǒng)(5),可以通過使用雙觀測器(12)來估計內(nèi)部摩擦狀態(tài);自適應(yīng)控制器(27)保證了位置和速度信號漸近跟蹤期望的軌跡,且跟蹤誤差是有界的。
因為系統(tǒng)只存在參數(shù)的不確定性, 設(shè)計以下的李雅普諾夫函數(shù):
(39)
由前述V1(t)的導(dǎo)數(shù),可以得到:
(40)
由方程(11)、(15)和(32)化簡的導(dǎo)數(shù)得:
(41)
基于雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,可以在系統(tǒng)只存在參數(shù)不確定性存在下,實現(xiàn)漸近輸出跟蹤。
結(jié)論2:如果一段有限時間后,系統(tǒng)只存在參數(shù)不確定性,d=W*Th(x)即一段有限的時間后εapprox=0除了在結(jié)論1的結(jié)果,還可以實現(xiàn)漸進(jìn)輸出跟蹤。即e→0ast→∞,其中e=[e1,e2〗T。
本文設(shè)計的控制器參數(shù)選取為:自適應(yīng)控制器的參數(shù)k1=160,k1=50,自適應(yīng)率的參數(shù)Γ1=diag{0.04,0.2,0.03,0.005,0.005}。雙觀測器的參數(shù)選取為:γ1=0.05,γ2=0.04。神經(jīng)網(wǎng)絡(luò)參數(shù):c=0.5[-2-1012]T,b= 3,Γ2=0.03。而PID控制器的參數(shù)選取為:kp=250,ki=80,kd=30。
為了證明所提出的控制器的有效性,對基于雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器(ARCDO)和PID控制進(jìn)行了比較。外部擾動是時變的,即擾動d=0.004x1x2,仿真結(jié)果如圖3~圖6所示。圖3表示系統(tǒng)分別在ARCDO和PID這兩個控制器下的位置跟蹤誤差。圖3a顯示,PID控制器的跟蹤誤差約為0.032rad,而圖3b顯示,ARCDO控制器的跟蹤誤差為1×10-4rad。顯而易見,使用ARCDO控制器的最終跟蹤誤差和瞬態(tài)性能比PID控制要好得多,并且系統(tǒng)對外部擾動以及摩擦力矩變化的抑制能力非常強(qiáng),穩(wěn)態(tài)跟蹤誤差幾乎不受外部擾動和摩擦力矩變化的影響。采用非線性雙觀測器估計摩擦狀態(tài),其估計值和實際值如圖4和圖5所示。圖6為外部擾動的估計值和實際值。
(a)PID控制器的位置跟蹤誤差
(b)控制器的位置跟蹤誤差
圖4 摩擦狀態(tài)的實際值和估計值
圖5 摩擦狀態(tài)的實際值和估計值
圖6 外部擾動的實際值和估計值
本文提出一種基于雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制器,以補(bǔ)償非線性摩擦和擾動對伺服系統(tǒng)的影響。設(shè)計非線性觀測器估計LuGre模型內(nèi)部不可測量的摩擦狀態(tài),神經(jīng)網(wǎng)絡(luò)用來補(bǔ)償外部擾動,同時設(shè)計自適應(yīng)控制器以估計系統(tǒng)中不確定的參數(shù)。通過李雅普諾夫函數(shù)驗證了閉環(huán)系統(tǒng)的穩(wěn)定性。研究結(jié)果表明,利用基于雙觀測器的自適應(yīng)神經(jīng)網(wǎng)絡(luò)控制方法可以滿足X-Y工作臺在摩擦和擾動的影響下具有較高的跟蹤精度要求,同時使系統(tǒng)具有較好的魯棒性能。仿真結(jié)果驗證了所設(shè)計控制器的有效性。