岳曉峰 陽建峰 馬國元 曹 斌
(長春工業(yè)大學(xué)機(jī)電工程學(xué)院 長春 130012)
近年來,機(jī)器人視覺伺服控制成為了機(jī)器人領(lǐng)域內(nèi)一大熱點(diǎn)[1~4]。機(jī)器人視覺伺服的概念最早是由HILL 和PARK 提出的,指利用視覺圖像系統(tǒng)采集并處理圖像,構(gòu)造反饋信息來實(shí)現(xiàn)對機(jī)器人的控制,形成機(jī)器人閉環(huán)控制[5]。根據(jù)目標(biāo)函數(shù)中所選擇的反饋信號可分為基于位置的視覺伺服(position based visual servoing,PBVS)、基于圖像的視覺伺服(image based visual servoing,IBVS)以及混合視覺伺服(homography based visual servoing,HBVS)[6]。機(jī)器人視覺伺服研究大都集中在通過標(biāo)定攝像機(jī)模型和機(jī)器人模型來實(shí)現(xiàn)控制,但在某些特定環(huán)境中難以實(shí)現(xiàn)對視覺伺服控制系統(tǒng)的精確標(biāo)定。國內(nèi)外研究人員提出了無標(biāo)定視覺伺服控制方法,無標(biāo)定視覺伺服是指在攝像機(jī)和機(jī)器人的部分或全部參數(shù)未知的情況下,直接通過圖像誤差信息來設(shè)計(jì)控制規(guī)律,控制機(jī)器人運(yùn)動[7]。
機(jī)器人無標(biāo)定視覺伺服最重要的問題是對于復(fù)合雅克比矩陣的求解,常用的方法是采用非線性優(yōu)化方法求解機(jī)器人末端執(zhí)行器與目標(biāo)圖像的特征之間的二次誤差函數(shù),從而得到復(fù)合雅克比矩陣。文獻(xiàn)[8]基于智能算法的機(jī)器人無標(biāo)定視覺伺服問題,提出了一種新的基于最小二乘支持向量回歸的機(jī)器人無標(biāo)定視覺免疫控制方法;文獻(xiàn)[9]提出了一種基于圖像雅克比模型辨識的微裝配機(jī)器人無標(biāo)定視覺伺服結(jié)構(gòu)和控制算法;文獻(xiàn)[10]提出了一種基于自適應(yīng)kalman 濾波的機(jī)器人無標(biāo)定6自由度視覺定位方法;文獻(xiàn)[11]基于動態(tài)BFGS(Broyden-Fletcher-Goldfarb-Shanno)法,研究了一種針對運(yùn)動目標(biāo)進(jìn)行實(shí)時跟蹤的無標(biāo)定視覺伺服控制方案;文獻(xiàn)[12]提出一種適用于移動機(jī)械手無關(guān)節(jié)狀態(tài)反饋情況的基于人-機(jī)-機(jī)協(xié)作(HRRC)的無標(biāo)定視覺伺服控制系統(tǒng);文獻(xiàn)[13]將圖像雅可比矩陣作為系統(tǒng)狀態(tài),采用kalman 濾波器對系統(tǒng)進(jìn)行觀測,同時采用同步擾動隨機(jī)逼近算法優(yōu)化濾波器參數(shù),估計(jì)出圖像雅可比矩陣,實(shí)現(xiàn)機(jī)器人的無標(biāo)定視覺定位;文獻(xiàn)[14~15]分別針對動態(tài)目標(biāo)和離散情況下的機(jī)器人無標(biāo)定視覺伺服系統(tǒng)進(jìn)行仿真驗(yàn)證。已有的研究多集中在傳統(tǒng)的逆雅可比矩陣方法的優(yōu)化改進(jìn)上,雅可比矩陣本質(zhì)上是一種局部的和線性的求解方式,本文提出了一種基于遺傳優(yōu)化的RBF 神經(jīng)網(wǎng)絡(luò)的機(jī)器人無標(biāo)定視覺伺服控制方法。利用RBF 神經(jīng)網(wǎng)絡(luò)具有全局性和非線性最佳估計(jì)的特征,學(xué)習(xí)圖像特征變化速度和機(jī)器人關(guān)節(jié)角變化速度之間的非線性關(guān)系,擬合復(fù)合雅可比矩陣,采用遺傳算法對RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)優(yōu)化,提高訓(xùn)練效率,較已有的逆雅可比矩陣方法更精確。
基于圖像的視覺伺服控制系統(tǒng)與基于位置的視覺伺服控制系統(tǒng)相比,可以避免基于位置的視覺伺服控制系統(tǒng)中目標(biāo)在三維空間中的位姿估計(jì)環(huán)節(jié),降低計(jì)算時延,消除了基于位置的視覺伺服控制系統(tǒng)的缺點(diǎn)?;趫D像的視覺伺服控制系統(tǒng)因?yàn)槠鋬?yōu)越性被應(yīng)用更廣泛,如圖1 所示。而要依據(jù)圖像中包含的信息來控制機(jī)器人末端執(zhí)行器達(dá)到期望位姿,先需要采集圖像并對目標(biāo)圖像進(jìn)行特征提取,通過計(jì)算期望圖像特征與當(dāng)前圖像特征之間的誤差,通過視覺控制器的映射關(guān)系,將該誤差轉(zhuǎn)換為機(jī)器人關(guān)節(jié)角的值,輸入到機(jī)器人控制器,從而產(chǎn)生對應(yīng)的伺服命令來控制機(jī)器人末端執(zhí)行器到達(dá)理想位置。
圖1 基于圖像的視覺伺服控制
基于圖像的機(jī)器人無標(biāo)定視覺伺服系統(tǒng)通常是基于圖像雅克比矩陣的方法獲得反映圖像特征變化量與機(jī)械手位姿變化之間的對應(yīng)映射關(guān)系,得到從關(guān)節(jié)空間到圖像特征空間的直接映射。
手眼無標(biāo)定視覺伺服控制系統(tǒng)大多采用圖像雅可比矩陣的方法,圖像雅可比矩陣描述了機(jī)器人空間中的運(yùn)動與圖像特征空間中的運(yùn)動之間的關(guān)系,可表示為:
而機(jī)器人關(guān)節(jié)角速度q?與手爪位姿變化率r?之間有下式雅可比矩陣關(guān)系,可得:
由上可知,圖像特征變化率f?與關(guān)節(jié)角速度q?間也有圖像雅克比矩陣關(guān)系,即:
其中式(2)、式(6)是圖像雅克比矩陣的兩種表達(dá)方式,構(gòu)造出機(jī)器人手眼無標(biāo)定視覺伺服控制的基礎(chǔ)。
視覺伺服控制系統(tǒng)中的核心問題在于對視覺控制器的設(shè)計(jì)。本文設(shè)計(jì)了一種基于遺傳算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)視覺控制器,通過輸入的圖像特征變化速度值以及輸出機(jī)器人關(guān)節(jié)角度變化速度值的樣本,對其學(xué)習(xí)訓(xùn)練,擬合出視覺控制器的映射關(guān)系,避免了傳統(tǒng)的逆雅可比矩陣方法中存在的求解過程復(fù)雜、奇異性等問題。
RBF 神經(jīng)網(wǎng)絡(luò)是一種具有全局逼近性能和最佳逼近能力的前向網(wǎng)絡(luò)。能夠消除BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程中收斂過分取決于初值和可能會導(dǎo)致的局部收斂問題,具有更快的運(yùn)算速度、更強(qiáng)的非線性映射能力以及更好的預(yù)報效能,RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本與測試樣本均由機(jī)器人運(yùn)動和攝像機(jī)圖像特征提取得出。RBF 神經(jīng)網(wǎng)絡(luò)構(gòu)型為具有三層的網(wǎng)絡(luò)結(jié)構(gòu),即輸入層、隱層、輸出層。設(shè)計(jì)該網(wǎng)絡(luò)輸入層節(jié)點(diǎn)為8,隱含層節(jié)點(diǎn)為10,輸出節(jié)點(diǎn)為6。本文以空間矩形為目標(biāo),選取4 個頂點(diǎn)作為圖像特征點(diǎn),圖像空間的特征向量是8 維的。RBF 神經(jīng)網(wǎng)絡(luò)的輸入為當(dāng)前圖像特征與期望圖像特征之間的誤差:[ ]Δx1,Δy1;Δx2,Δy2;Δx3,Δy3;Δx4,Δy4,輸出為相應(yīng)的機(jī)器人關(guān)節(jié)角的變化:[Δq1,Δq2,Δq3,Δq4,Δq5,Δq6]。
圖2 徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)
GA-RBF神經(jīng)網(wǎng)絡(luò)算法的核心思想:對RBF神經(jīng)網(wǎng)絡(luò)訓(xùn)練之前,先用遺傳算法在可用群體內(nèi)優(yōu)化網(wǎng)絡(luò)權(quán)值w、高斯函數(shù)h 的中心矢量c 和基寬向量b 的初值。而后通過樣本集對遺傳優(yōu)化過參數(shù)的RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練。遺傳優(yōu)化過的參數(shù)可以降低RBF 神經(jīng)網(wǎng)絡(luò)實(shí)際輸出和期望輸出之間的誤差,從而提高訓(xùn)練效率,避免因?yàn)檫@些參數(shù)初值選擇不合理造成精度下降。
遺傳優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)算法流程:
第一步:對RBF神經(jīng)網(wǎng)絡(luò)與遺傳算法參數(shù)初始化,將需要優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行編碼;
第二步:初始化種群,將二進(jìn)制表示的參數(shù)轉(zhuǎn)化為實(shí)數(shù),求每個個體的總誤差,對誤差排序,求出適應(yīng)度值,得出最佳適應(yīng)度值及最佳個體;
第三步:進(jìn)行選擇、交叉、變異操作,得出遺傳優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)參數(shù);
第四步:取遺傳優(yōu)化的RBF 神經(jīng)網(wǎng)絡(luò)參數(shù),設(shè)定學(xué)習(xí)系數(shù),對RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,擬合出圖像特征變化速度與機(jī)器人關(guān)節(jié)角變化速度間的非線性關(guān)系。
遺傳優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)流程圖如圖3所示。
圖3 GA-RBF算法流程圖
根據(jù)圖1 建立仿真模型,利用遺傳優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)視覺控制器實(shí)現(xiàn)圖像空間到關(guān)節(jié)空間的變換,進(jìn)而控制機(jī)器人的運(yùn)動,對三維空間中的一個固定的正方體進(jìn)行定位。機(jī)器人型號采用Puma560,它有6 個自由度,模型見圖4。整體系統(tǒng)包含逆雅可比矩陣求解,神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練以及機(jī)器人視覺伺服控制三部分。
1)先依據(jù)圖1 所示基于圖像的視覺伺服控制圖建立傳統(tǒng)逆雅可比矩陣視覺控制器的圖像視覺伺服仿真系統(tǒng),進(jìn)而完成機(jī)器人視覺平面跟蹤。其中J+是用來計(jì)算圖像特征和關(guān)節(jié)角之間的關(guān)系。該仿真模型中的分別采用puma560 機(jī)器人正運(yùn)動學(xué)模塊、針孔模型攝像機(jī)、圖像雅可比矩陣模塊、機(jī)器人雅克比矩陣模塊、增益模塊、積分變換模塊。運(yùn)行仿真模型時,記錄圖像特征的誤差和相應(yīng)關(guān)節(jié)角的變化作為訓(xùn)練樣本。
2)圖4 所示仿真模型中的基本參數(shù)設(shè)置:目標(biāo)四個點(diǎn)在機(jī)器人基坐標(biāo)系的位置坐標(biāo)為;期望的圖像特征為Puma560 的 初 始 關(guān) 節(jié) 角q0=[0 0.7854 3.1416 0 0.7854-0.7854]T。攝像機(jī)采用針孔模型,焦距f 為8mm ,圖像中心點(diǎn)為(512,512)??刂圃鲆鏋?.25。
3)根據(jù)圖2 中RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和圖3 建立GA-RBF 神經(jīng)網(wǎng)絡(luò)模型。將上述仿真模型中記錄的圖像特征誤差和相應(yīng)關(guān)節(jié)角的變化中400 組樣本訓(xùn)練網(wǎng)絡(luò),以102 組樣本測試網(wǎng)絡(luò)性能,與傳統(tǒng)的基于逆雅可比矩陣方法得出的圖像特征誤差比較。
如圖5 所示為圖像特征運(yùn)動軌跡??梢钥闯鰣D 像 特 征 的 最 終 位 置 的 像 素 值 為[611 412;411 413;412 613;612 612]。
圖4 基于圖像的無標(biāo)定視覺伺服控制仿真結(jié)構(gòu)圖
圖5 圖像特征運(yùn)動軌跡
圖6 所示為基于逆雅克比矩陣方法六自由度機(jī)器人各關(guān)節(jié)角軌跡。圖7 所示為基于逆雅克比矩陣關(guān)節(jié)速度變化。
圖8 所示為GA-RBF 中遺傳算法迭代過程,圖9所示為三種算法輸出值二范數(shù)的比較,圖10所示為GA-RBF與RBF算法輸出值誤差二范數(shù)的比較,可知GA-RBF 算法比RBF 算法具有更好的擬合逼近效果。本文提出的GA-RBF 方法可以有效避免傳統(tǒng)的基于逆雅可比矩陣方法中求解逆雅克比矩陣存在的問題,實(shí)現(xiàn)機(jī)器人無標(biāo)定視覺伺服控制。
圖6 基于逆雅克比矩陣方法關(guān)節(jié)角軌跡
圖7 基于逆雅克比矩陣方法關(guān)節(jié)速度變化
圖8 GA-RBF中遺傳迭代過程
圖9 輸出值二范數(shù)
圖10 輸出值誤差二范數(shù)
在機(jī)器人無標(biāo)定視覺伺服控制中,由于求解復(fù)合雅可比矩陣計(jì)算過程復(fù)雜,本文提出一種遺傳優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的視覺控制器,采用遺傳優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)逼近復(fù)合雅可比矩陣的方法,從而控制六自由度機(jī)器人完成視覺跟蹤任務(wù)。仿真結(jié)果表明,所提算法相比于逆雅可比矩陣求解而言,可以保證精度以及RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速率,從而使系統(tǒng)在很短的時間內(nèi)達(dá)到理想的位置,說明此方法簡單有效。