缸明義, 陳立辛 , 喬印虎, 夏興國
(1.馬鞍山職業(yè)技術(shù)學(xué)院 電氣工程系,安徽 馬鞍山 243031;2.安徽科技學(xué)院 機(jī)械工程學(xué)院,安徽 鳳陽 233100)
機(jī)器人是智能控制技術(shù)的主要應(yīng)用領(lǐng)域之一,發(fā)展歷史最悠久同時在工業(yè)中應(yīng)用最為廣泛的機(jī)器人是工業(yè)機(jī)械手,它是個復(fù)雜的動力學(xué)系統(tǒng),由多個連桿和關(guān)節(jié)組成,具有多個輸入和輸出,存在著復(fù)雜的耦合關(guān)系和嚴(yán)重的非線性,傳統(tǒng)的基于模型的機(jī)械手控制方法不能保證設(shè)計(jì)系統(tǒng)在復(fù)雜環(huán)境下的穩(wěn)定性、魯棒性和整個系統(tǒng)的動態(tài)性能。PID控制算法簡單,但是其控制系統(tǒng)的動態(tài)性能卻不好。魯棒控制和自適應(yīng)控制等控制算法的動態(tài)性能很好,但都要求已知機(jī)械手系統(tǒng)數(shù)學(xué)模型的精確信息。
逆控制方法在許多領(lǐng)域都有著廣泛的應(yīng)用,實(shí)踐證明它的控制精度和跟蹤性極好。但是大多數(shù)系統(tǒng)呈現(xiàn)出的非線性使得其解析式難以描述,逆控制中很難求解系統(tǒng)模型的逆。由于神經(jīng)網(wǎng)絡(luò)可以充分地利用它可在任意的精度水平上對所有各類非線性函數(shù)進(jìn)行逼近的優(yōu)勢以及十分出色的學(xué)習(xí)能力,使求解逆系統(tǒng)方面所存在的一系列難題得到有效的解決,從而相應(yīng)地拓展了逆系統(tǒng)方法的實(shí)際應(yīng)用。在當(dāng)前的工作中,主要基于逆控制的相關(guān)基礎(chǔ)理論,同時與神經(jīng)網(wǎng)絡(luò)自身所具有的優(yōu)點(diǎn)進(jìn)行充分的融合,并且在兩關(guān)節(jié)的機(jī)械手系統(tǒng)上進(jìn)行應(yīng)用探索,由此成功地構(gòu)建了逆系統(tǒng),進(jìn)而串聯(lián)相關(guān)的被控系統(tǒng),實(shí)現(xiàn)了偽線性系統(tǒng)的構(gòu)建。由此,之前關(guān)于如何控制非線性系統(tǒng)的問題將會被轉(zhuǎn)變?yōu)橐活惻c線性系統(tǒng)相關(guān)的科學(xué)問題,最終成功地達(dá)到了關(guān)于此類機(jī)械手系統(tǒng)的神經(jīng)網(wǎng)絡(luò)逆控制目標(biāo)。
該類模型主要是對機(jī)械手系統(tǒng)中所包含關(guān)節(jié)的運(yùn)動過程動態(tài)關(guān)系以及作用力矩等進(jìn)行深入的研究,在設(shè)計(jì)高性能控制器以及探頭先進(jìn)控制方法等方面起到了十分重要的作用。對于機(jī)械手系統(tǒng)來說,關(guān)于其動力學(xué)逆問題主要是利用它所包含關(guān)節(jié)自身的具體運(yùn)動信息(包括加速度、速度以及位置等方面的信息),從而將關(guān)節(jié)所需力矩及驅(qū)動力等求出來。通過對逆問題的求解來有效實(shí)時控制機(jī)械手系統(tǒng)的運(yùn)動,達(dá)到預(yù)期的軌跡跟蹤效果,并獲得良好的動態(tài)性能和最優(yōu)指標(biāo)。圖1是兩自由度機(jī)械手的物理結(jié)構(gòu),具體參數(shù)見表1。
圖1 兩關(guān)節(jié)機(jī)械手模型Fig.1 Two-joint manipulator model
表1 兩關(guān)節(jié)機(jī)械手系統(tǒng)參數(shù)Table 1 Two-joint manipulator system parameters
以圖1所示兩關(guān)節(jié)機(jī)械手為研究對象,在不考慮機(jī)械手系統(tǒng)中的摩擦、間隙、變形與干擾因素的情況下,應(yīng)用Lagrange方法建立兩自由度機(jī)械手的動力學(xué)模型為:
(1)
其中
將多輸入多輸出兩自由度機(jī)械手動力學(xué)方程變形為:
(2)
它主要是基于函數(shù)逼近的科學(xué)理論,可在任意的精度水平上對所有的連續(xù)函數(shù)進(jìn)行逼近,主要包含了輸出層、隱含層以及輸入層等,詳見圖2。
圖2 RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 RBF neural network structure
有關(guān)的信號源節(jié)點(diǎn)構(gòu)成了輸入層,其中的各個神經(jīng)元均和某個特定的輸入變量相互對應(yīng),尤其向隱含層來進(jìn)行信息的有效傳遞。而隱含層則以徑向基函數(shù)來用作其所需的激活函數(shù),由此實(shí)現(xiàn)對輸入向量的變換,如果輸入信號與其基函數(shù)中央?yún)^(qū)域比較接近,則處于隱含層之中的節(jié)點(diǎn)其輸出將會形成比較大。而輸出層則是由隱含層所具有的激活函數(shù)對輸入信號進(jìn)行加權(quán)之后再進(jìn)行求和而得。
徑向基函數(shù)采用高斯基函數(shù),其表達(dá)式為:
(3)
R
(x
)為第i
隱含層節(jié)點(diǎn)所對應(yīng)的具體輸出值;x
=[x
,x
,…,x
]代表了輸入樣本;σ
與c
各自代表了標(biāo)準(zhǔn)化常數(shù)(對徑向基函數(shù)繞c
寬度起到?jīng)Q定性的作用)以及徑向基函數(shù)所對應(yīng)的中心;而h
則代表了在隱含層中所包含的節(jié)點(diǎn)總數(shù)。根據(jù)式(3)可以知道,在x
∈R
的所有給定輸入之中,僅有那些和x
中心接近的某些會得以最終激活。逆系統(tǒng)模型構(gòu)建及辨識在神經(jīng)網(wǎng)絡(luò)逆控制器中起到了十分重要的核心作用。由于該類系統(tǒng)無需對精確數(shù)學(xué)模型及參數(shù)產(chǎn)生強(qiáng)烈的依賴性,所以將會十分有利于逆系統(tǒng)基本科學(xué)理論以及實(shí)際應(yīng)用的發(fā)展。通過式(1)已經(jīng)對可逆機(jī)械手系統(tǒng)進(jìn)行了充分的論證,在當(dāng)其的工作中,將會通過直接逆模型的構(gòu)建方法來實(shí)現(xiàn)其神經(jīng)網(wǎng)絡(luò)逆模型的構(gòu)建。圖3詳細(xì)地展示了它的具體結(jié)構(gòu)形式:
圖3 RBF神經(jīng)網(wǎng)絡(luò)的機(jī)械手逆控制模型Fig.3 Reverse control model of manipulator based on RBF neural netword
設(shè)RBF神經(jīng)網(wǎng)絡(luò)逆辨識的指標(biāo)函數(shù)為:
(4)
辨識結(jié)果使得神經(jīng)網(wǎng)絡(luò)逆模型的性能指標(biāo)函數(shù)為任意小的正數(shù)。
以受控系統(tǒng)所對應(yīng)的逆模型來用作其所研究系統(tǒng)自身的控制器模型,從而確保其期望輸出和真實(shí)的輸出之間存在著同樣的映射關(guān)系,此時,逆模型所具有的精確度將會具有十分關(guān)鍵性的作用。在這一問題上,對神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法進(jìn)行有效的辨識又是非常重要的。目前有很多RBF神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法。但是,對于動態(tài)輸入模式的在線學(xué)習(xí),大多學(xué)習(xí)算法無法實(shí)現(xiàn),而且在學(xué)習(xí)前RBF神經(jīng)網(wǎng)絡(luò)隱含層單元數(shù)需要人為確定。在文中的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)中,主要通過在線自適應(yīng)最近鄰聚類的學(xué)習(xí)算法來進(jìn)行,一方面,將會實(shí)現(xiàn)在線學(xué)習(xí)的目標(biāo),另一方面,在進(jìn)行學(xué)習(xí)之前將無需使隱含層中的單元數(shù)詳細(xì)地確定下來。關(guān)于神經(jīng)網(wǎng)絡(luò)算法的一些細(xì)節(jié)見表2:
STEP 1:需要確定參數(shù),詳見表2。
表2 在線自適應(yīng)學(xué)習(xí)算法所需確定參數(shù)Table 2 Parameters needed for online adaptive learning algorithm
STEP 2:第1樣本數(shù)據(jù)對為(x
,y
),而第1類所對應(yīng)的中心則是c
=x
,d
=y
,此處取A
(1)=y
以及B
(1)=1。因?yàn)樵谠?p>RBF神經(jīng)網(wǎng)絡(luò)中,其隱含層單元數(shù)量僅有一個,它的中心則是(c
,d
),而從隱含層至輸出層所對應(yīng)的權(quán)值表達(dá)如下:W
(1)=A
(1)/B
(1)。STEP 4:第i
個樣本數(shù)據(jù)對(x
,y
),其中i
=3,4,…,N
,如果聚類中心的數(shù)量為M
個,則其各自中心點(diǎn)將是(c
,d
),(c
,d
),…,(c
,d
),那么有數(shù)量共計(jì)M
個的隱含層單元存在于之前的RBF神經(jīng)網(wǎng)絡(luò)之中,則有:(5)
計(jì)算出(x
,y
)到這M
個聚類中心的距離。設(shè)最小距離為H
(k
),即 (c
,d
)為(x
,y
)的最近鄰聚類。若H
(k
)≤r
,計(jì)算:A
(k
)=A
(k
)+y
,B
(k
)=B
(k
)+1,保持A
(i
)和B
(i
)(i
=1,…,M
且i
≠k
)值不變;若H
(k
)>r
,則令M
=M
+1,c
=x
,d
=y
,A
(M
)=y
,B
(M
)=1,(x
,y
)作為新的聚類中心,對前M
-1個類的A
(i
)和B
(i
)值保持不變,同時原有RBF神經(jīng)網(wǎng)絡(luò)再添加第M
個隱含層單元。隱層單元到輸出層的權(quán)值為W
(i
)=A
(i
)/B
(i
)(i
=1,…,M
)。STEP 5:考慮過所有輸入樣本后,根據(jù)式(5)計(jì)算RBF神經(jīng)網(wǎng)絡(luò)的輸出:
(6)
神經(jīng)網(wǎng)絡(luò)的誤差性能指標(biāo)為:
(7)
其中,x
為輸入樣本矢量,y
為輸出樣本。當(dāng)E
<閾值E
時,在線最近鄰聚類學(xué)習(xí)結(jié)束;當(dāng)E
≥閾值E
時,用r
=r
-h
修正聚類半徑返回到STEP2。θ
1和θ
代表了在該系統(tǒng)中首個關(guān)節(jié)所對應(yīng)的期望輸出以及實(shí)際輸出。對于第一關(guān)節(jié)而言,NNC1是其所對應(yīng)的神經(jīng)網(wǎng)絡(luò)逆控制器,而逆辨識器則為NNI1。依圖所示,NNC1與NNI1具有完全相同的結(jié)構(gòu)和參數(shù)。由此將兩關(guān)節(jié)機(jī)械手系統(tǒng)的非線性變換成了動態(tài)偽線性系統(tǒng)。為了解決直接逆控制開環(huán)控制性能差的問題,將PD與直接逆控制器NNC1構(gòu)成復(fù)合控制器,從而提高其控制性能。機(jī)械手的第二關(guān)節(jié)與第一關(guān)節(jié)控制原理相同。在此逆模型的求取過程中,動態(tài)獲取了隱層節(jié)點(diǎn)個數(shù)、隱層單元到輸出層的權(quán)系數(shù)和聚類半徑。圖4 RBF神經(jīng)網(wǎng)絡(luò)的機(jī)械手逆控制系統(tǒng)Fig.4 Inverse control system of manipulator based on RBF neural network
兩關(guān)節(jié)機(jī)械手的模型見式(1),具體參數(shù)見表3。
表3 兩關(guān)節(jié)機(jī)械手模型物理參數(shù)Table 3 Physical parameters of two-joint manipulator model
采樣周期T
=0.005 s。辨識神經(jīng)網(wǎng)絡(luò)和控制神經(jīng)網(wǎng)絡(luò)的初始聚類半徑先根據(jù)經(jīng)驗(yàn)取r
=1,再根據(jù)聚類結(jié)果來修正。3.2.1 跟蹤能力驗(yàn)證 此處設(shè)余弦信號θ
2=cos(2πt
)以及正弦信號θ
1=sin(2πt
)為所給定的期望軌跡,圖5~6詳細(xì)地給出了該類系統(tǒng)所具有的軌跡跟蹤效果,而圖7~8則全面地展示了所形成的誤差。圖5 關(guān)節(jié)1正弦信號軌跡跟蹤效果Fig.5 Track tracking effect of joint 1 sinusoidal signal
圖6 關(guān)節(jié)2余弦信號軌跡跟蹤效果Fig.6 Track tracking effect of joint 2 sinusoidal signal
圖7 關(guān)節(jié)1正弦信號軌跡跟蹤誤差Fig.7 Trajectory tracking error of joint 1 sinusoidal signal
圖8 關(guān)節(jié)2余弦信號軌跡跟蹤誤差Fig.8 Trajectory tracking error of joint 2 sinusoidal signal
結(jié)合圖5~6正余弦軌跡跟蹤效果圖和圖7~8正余弦信號軌跡跟蹤誤差曲線圖,可以看出,在仿真的初始時刻,關(guān)節(jié)1的期望輸出與實(shí)際輸出僅有小于0.1 rad的誤差,關(guān)節(jié)2的期望輸出與實(shí)際輸出僅有小于0.5 rad的誤差。隨后,兩者的期望輸出與實(shí)際輸出曲線幾乎完全重合,即誤差接近于0。由此說明了采用具有在線學(xué)習(xí)能力的最近鄰聚類學(xué)習(xí)算法,控制系統(tǒng)響應(yīng)很快,能夠迅速的跟蹤給定的期望軌跡。
3.2.2 抗干擾性驗(yàn)證 出于對該類系統(tǒng)在進(jìn)行了RBF神經(jīng)網(wǎng)絡(luò)逆控制之后所具備的抗干擾能力進(jìn)行全面驗(yàn)證的目的,將脈沖干擾信號(具有0.1 rad幅值)增加到t=3 s時的第一及第二關(guān)節(jié)之上。圖9~10詳細(xì)地示出了所得的仿真結(jié)果。
圖9 脈沖干擾的關(guān)節(jié)1的正弦信號跟蹤效果Fig.9 The pulse interfered with the sinusoidal signal tracking effect of joint 1
圖10 脈沖干擾的關(guān)節(jié)2的余弦信號跟蹤效果Fig.10 The pulse interference with the cosine signal tracking effect of joint 2
由圖9~10脈沖干擾的兩關(guān)節(jié)跟蹤效果圖可知,兩個關(guān)節(jié)的期望輸出和實(shí)際輸出只在初始時刻有小于0.5 rad的誤差,隨后能夠迅速而準(zhǔn)確的跟蹤期望軌跡。在3 s時刻增加的0.1幅值的脈沖干擾,兩個關(guān)節(jié)并未有明顯的變化??梢娫摽刂葡到y(tǒng)具有十分良好的抗干擾性。
對兩關(guān)節(jié)機(jī)械手所對應(yīng)的RBF神經(jīng)網(wǎng)絡(luò)逆控制策略進(jìn)行了深入的設(shè)計(jì)及研究,基于RBF神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了逆辨識系統(tǒng)的構(gòu)造,成功地對機(jī)械手的逆動力學(xué)模型進(jìn)行了動態(tài)性的辨識。利用最近鄰聚類的自適應(yīng)在線學(xué)習(xí)算法保證機(jī)械手逆模型的精確度。仿真結(jié)果表明,當(dāng)給兩關(guān)節(jié)機(jī)械手系統(tǒng)施加正余弦信號時,除在初始時刻有很小的誤差外,能夠迅速準(zhǔn)確跟蹤期望軌跡,并且在任意時刻施加0.1幅值的脈沖干擾信號,也并未對系統(tǒng)造成影響。可見該控制策略的軌跡跟蹤性能好,穩(wěn)態(tài)精度高,抗干擾能力強(qiáng)。