陳小靜,彭培成,張高峰,王裕清
(河南理工大學(xué) 機(jī)械與動(dòng)力工程學(xué)院,河南 焦作 454000)
在生活中,人手可根據(jù)物體的形狀、尺寸等特征選擇不同的手指接觸組合,并對(duì)不同的接觸點(diǎn)施加力以形成不同的抓取模式,對(duì)目標(biāo)物執(zhí)行抓握操作[1-2]。這一抓握行為過程為機(jī)器人手的抓握行為提供了良好的操作示范。為了復(fù)制人手抓握行為,許多學(xué)者研制了多指靈巧手以模擬人手的抓握模式選擇過程[3-4]。多指靈巧手抓握模式的擬人化雖然在一定程度上提高了抓握作業(yè)的靈活性,但是與其相適應(yīng)的抓握模式的復(fù)雜性導(dǎo)致機(jī)器人多指靈巧手抓握的智能化控制難度增大,使機(jī)器人多指靈巧手難以走向?qū)嵱?。與多指靈巧手相比,兩指末端執(zhí)行器的結(jié)構(gòu)及控制更為簡(jiǎn)單,在工業(yè)和農(nóng)業(yè)中有較為廣泛的應(yīng)用[5],但由于擬人化程度不高,多被用于針對(duì)特定物體的操作。因此,對(duì)人手拇指-食指抓握模式選擇過程進(jìn)行模擬,有利于機(jī)器人兩指末端執(zhí)行器擬人化程度的提高,也可為機(jī)器人手穩(wěn)定抓握控制策略提供重要的參考依據(jù)。
目前,研究者主要采用人工神經(jīng)網(wǎng)絡(luò)等算法建立多指/三指靈巧手抓握模式選擇模型并完成人手/機(jī)器人手抓握模式選擇的模擬。在國(guó)內(nèi),熊蔡華等[6]根據(jù)物體的幾何特征和姿態(tài)特征,采用人工神經(jīng)網(wǎng)絡(luò)建立機(jī)器人三指手抓握模式選擇算法;駱敏舟等[7]根據(jù)人的抓取經(jīng)驗(yàn)將欠驅(qū)動(dòng)手爪的抓取模式分為精確平行、精確對(duì)心、包絡(luò)平行、包絡(luò)對(duì)心4種,并采用粗糙集和模糊神經(jīng)網(wǎng)絡(luò)進(jìn)行抓取模式?jīng)Q策;丁祥峰等[8]將IM-2機(jī)械手將抓取模式分為強(qiáng)力抓取、夾握、側(cè)捏、對(duì)握抓取、三指對(duì)捏共5種,并采用基于專家系統(tǒng)的抓取模式規(guī)劃,根據(jù)物體不同的形狀及尺寸選擇不同的抓取模式;王從慶等[9]針對(duì)機(jī)器人多指手自身的特點(diǎn),將被抓目標(biāo)物樣本的幾何特征、姿態(tài)及任務(wù)要求等作為輸入,研究物體的幾何特征與抓取模式之間的復(fù)雜非線性映射,然后分別采用基函數(shù)為高斯核函數(shù)的RBF神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和二叉樹聚類以及改進(jìn)的模糊C均值聚類算法,實(shí)現(xiàn)了抓取模式的自主分類,并逐步提高了模型的正確率和有效性[10-11];陳輝等[12]通過模仿人手的抓握模式選擇過程,根據(jù)物體姿態(tài)、幾何特征和任務(wù)建立了反向傳播的BP神經(jīng)網(wǎng)絡(luò)模型,對(duì)機(jī)械手進(jìn)行了抓握姿態(tài)決策。
國(guó)外的一些學(xué)者亦對(duì)人手抓握模式的選擇進(jìn)行了研究,N.Rezzoug等[13-14]提出了多層神經(jīng)網(wǎng)絡(luò)架構(gòu),該架構(gòu)由2個(gè)階段組成:第一階段用于手指反向運(yùn)動(dòng)學(xué)習(xí);第二神經(jīng)模型用于搜索手部姿勢(shì)空間并對(duì)評(píng)估函數(shù)進(jìn)行優(yōu)化。該網(wǎng)絡(luò)架構(gòu)對(duì)于各種目標(biāo)物的抓握模式均具有良好的預(yù)測(cè)效果;C.R.MASON等[15]將人手抓取模式簡(jiǎn)化為5種,即強(qiáng)力抓取、強(qiáng)力提升抓取、精密抓取、模擬強(qiáng)力抓取和模擬精密抓取。對(duì)接近和抓握物體過程中手指關(guān)節(jié)位置變化進(jìn)行3D重構(gòu),并通過奇異值分解(SVD)演算了5種抓取模式的手指關(guān)節(jié)位置關(guān)系;N.Jarque-Bou等[16]采用主成分分析法對(duì)手指抓取運(yùn)動(dòng)學(xué)降維,對(duì)不同直徑及質(zhì)量的圓柱抓握模式進(jìn)行了研究。
上述文獻(xiàn)中的抓取模式預(yù)測(cè),輸入特征為目標(biāo)物的特征,均未考慮人體或機(jī)器人本身的特征參數(shù)。目前,還未有針對(duì)兩指抓握模式預(yù)測(cè)的研究,機(jī)器人兩指末端執(zhí)行器穩(wěn)定抓握策略仍缺乏參考依據(jù)。因此,采用合適的神經(jīng)網(wǎng)絡(luò)方法建立手部特征及目標(biāo)物特征與兩指抓握模式之間的非線性映射關(guān)系,并對(duì)兩指抓握模式進(jìn)行有效預(yù)測(cè),從仿生學(xué)角度實(shí)現(xiàn)對(duì)機(jī)器人兩指末端執(zhí)行器抓握模式的預(yù)測(cè),可以為仿人兩指機(jī)器人智能穩(wěn)定抓握控制提供重要的決策依據(jù)。
依據(jù)T.Feix等[17]的抓握模式分類經(jīng)驗(yàn),將試驗(yàn)中人類拇指-食指抓握目標(biāo)物所用抓握模式歸為精密捏和強(qiáng)力握2種。試驗(yàn)時(shí),如果試驗(yàn)人員僅用拇指與食指的遠(yuǎn)節(jié)指骨指面抓握-移動(dòng)-釋放目標(biāo)物,該抓握模式記為精密捏(圖1(a));如果試驗(yàn)人員用拇指和食指的多個(gè)指骨的指面抓握-移動(dòng)-釋放目標(biāo)物,該抓握模式記為強(qiáng)力握(圖1(b))。
為了構(gòu)建兩指抓握模式選擇神經(jīng)網(wǎng)絡(luò)模型,把人手拇指-食指抓握釋放試驗(yàn)作為訓(xùn)練樣本集:將待抓握目標(biāo)物預(yù)先放置于桌面a點(diǎn),指導(dǎo)試驗(yàn)人員坐于實(shí)驗(yàn)桌前的中心線位置,一只手固定其上臂,肘部放置于桌面,小臂自然向前伸展;桌面上區(qū)域a和區(qū)域b與桌子的中線對(duì)稱,兩區(qū)域之間的中心距約為30 cm,以便于不同身高的試驗(yàn)人員對(duì)目標(biāo)物進(jìn)行接觸和抓握操作(圖1(c));最后,試驗(yàn)人員自然地使用右手的拇指和食指將目標(biāo)物從區(qū)域a移動(dòng)至區(qū)域b,然后,使用左手的拇指和食指將目標(biāo)物從區(qū)域b移動(dòng)到區(qū)域a。試驗(yàn)前,試驗(yàn)人員用香皂清洗雙手,待雙手完全干燥后逐個(gè)測(cè)定試驗(yàn)人員的身高并記錄;將標(biāo)定標(biāo)簽貼于試驗(yàn)人員雙手的食指,使用數(shù)碼相機(jī)(Canon IXUS 95IS)從手掌的正上方位置進(jìn)行拍照,將拍攝的手部照片傳輸至電腦后,使用圖像分析軟件(Digimizer Version 4.2.6.0)分別對(duì)食指與拇指指長(zhǎng)進(jìn)行測(cè)量;其中拇指指長(zhǎng)Lt、食指指長(zhǎng)Li均為由遠(yuǎn)指指骨指尖到掌指關(guān)節(jié)處膚紋的距離(圖1(d)),并計(jì)算拇指-食指指長(zhǎng)之和Lfs,而后執(zhí)行抓握釋放任務(wù)。試驗(yàn)過程中中指、無名指、小指及手掌的其他部分均不能觸碰目標(biāo)物,如果抓握-釋放過程穩(wěn)定并且食指/拇指和目標(biāo)物之間沒有發(fā)生相對(duì)滑動(dòng),則該抓握試驗(yàn)記為成功,并記錄試驗(yàn)人員所用的抓握模式;否則,記為失敗。本試驗(yàn)共有6 390次抓握(213名志愿者×2手×5個(gè)形狀×3個(gè)大小),其中有5 554次成功抓握。
圖1 拇指-食指抓握操作試驗(yàn)Fig.1 Grasp experiments of human thumb-index finger manipulation
利用3D打印機(jī)(MakerBot Replicator Mini+,Makerbot Industries,美國(guó))打印5種不同的幾何體:四棱柱、三棱錐、圓錐、橢球、圓柱,作為抓握目標(biāo)物,所用材料為Polylactic Acid(PLA)。每種幾何體有小、中、大3個(gè)不同的尺寸等級(jí)。試驗(yàn)過程中,兩指從每個(gè)幾何體的過質(zhì)心平面抓取,并采用紅色標(biāo)記線表示抓握截面的位置。定義5種不同形狀的幾何體抓握截面處的等效直徑,以作為后續(xù)神經(jīng)網(wǎng)絡(luò)的尺寸輸入變量,對(duì)于四棱柱和三棱錐利用抓握截面的內(nèi)接圓直徑作為等效直徑de統(tǒng)一描述不同抓握截面的幾何尺寸,其他形狀均以抓握截面的直徑作為等效直徑de。使用高精度電子天平(精度0.01 g)對(duì)每個(gè)目標(biāo)物的質(zhì)量進(jìn)行測(cè)量并記錄。
試驗(yàn)人員是從河南理工大學(xué)及其附屬幼兒園和鶴翔小學(xué)招募的志愿者。每名志愿者均身體健康,四肢靈活,無肢體傷病歷史,且均為右利手。共有213名志愿者參與了抓握釋放操作,其中男性104人,女性109人;試驗(yàn)人員的特征如下(平均值(標(biāo)準(zhǔn)偏差)):年齡16(8)歲;身高147.0(25.7)cm;拇指指長(zhǎng)46.0(9.25)mm;食指指長(zhǎng)60.5(11.3)mm。
人類在使用拇指-食指對(duì)目標(biāo)物進(jìn)行抓握時(shí),通常由視覺感知目標(biāo)物特征,結(jié)合人自身的特征(指長(zhǎng))信息,經(jīng)過大腦的中樞神經(jīng)系統(tǒng)處理,對(duì)拇指-食指抓握模式進(jìn)行決策。為了模擬這一過程,本研究選擇等效直徑de、形狀So、質(zhì)量Mo等目標(biāo)物特征和手部特征食指與拇指指長(zhǎng)之和Lfs作為自變量,將人手拇指-食指抓握模式作為因變量,得到目標(biāo)物特征及手部特征與拇指-食指抓握模式之間的神經(jīng)網(wǎng)絡(luò)模型,通過該神經(jīng)網(wǎng)絡(luò)模型,對(duì)仿人兩指末端執(zhí)行器的抓握模式選擇進(jìn)行預(yù)測(cè),具體過程如圖2所示。
圖2 仿人兩指末端執(zhí)行器抓握模式選擇過程Fig.2 The grasp type selection process of humanoid two-finger end-effector
BP神經(jīng)網(wǎng)絡(luò)模型是一種前饋神經(jīng)網(wǎng)絡(luò)模型,強(qiáng)調(diào)網(wǎng)絡(luò)采用誤差反向傳播的學(xué)習(xí)算法,修正權(quán)值時(shí),沿著減少誤差的方向,從輸出層向前逐層進(jìn)行修正。如圖3所示,BP神經(jīng)網(wǎng)絡(luò)由輸入層、隱藏層和輸出層構(gòu)成[18],其中輸入層包含預(yù)測(cè)變量即自變量xi,本研究中分別為目標(biāo)物等效直徑de、質(zhì)量Mo、形狀So以及食指與拇指指長(zhǎng)之和Lfs;隱藏層bm(一層或多層)包含無法觀察的節(jié)點(diǎn)或單元,每個(gè)隱藏單元的值均為某預(yù)測(cè)變量的函數(shù),本研究中隱藏層為一層;輸出層為因變量yn,本次研究拇指-食指抓握模式,即強(qiáng)力握和精密捏。BP神經(jīng)網(wǎng)絡(luò)的計(jì)算過程如下[18]。
圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.3 BP neural network structure
假設(shè)BP神經(jīng)網(wǎng)絡(luò)模型的輸入層有I個(gè)單元,隱藏層采用tansig函數(shù)為傳遞函數(shù),相應(yīng)的隱藏層的輸入為
(1)
隱藏層的輸出為
bm=f(am)=2/(1+e-2am)-1,
(2)
式中:xi為輸入向量的第i個(gè)元素;ωim為連接從神經(jīng)元i和神經(jīng)元m的突觸權(quán)值;am為神經(jīng)元m的誘導(dǎo)局部域;f為隱藏層輸出處的激活函數(shù);βm為神經(jīng)元m處的偏置;bm為神經(jīng)元m處的輸出信號(hào)。
輸出層同樣采用tansig作為傳遞函數(shù),則前向傳導(dǎo)到輸出層,傳導(dǎo)公式為
(3)
yn=g(an)=2/(1+e-2an),
(4)
式中:an為輸出神經(jīng)元的誘導(dǎo)局部域;g為輸出層的激活函數(shù);yn為輸出層的信號(hào)。
自變量中目標(biāo)物的形狀是分類變量,有四棱柱、三棱錐、圓錐、橢球、圓柱共5個(gè)水平,因此,在構(gòu)建模型之前,設(shè)定4個(gè)啞變量So1、So2、So3和So4,并對(duì)5種形狀進(jìn)行編碼:四棱柱編碼“0000”;三棱錐編碼“0001”;圓錐體編碼“0010”;橢球體編碼“0100”;圓柱體編碼“1000”。因變量拇指-食指抓握模式也是分類變量,共有2種水平,即精密捏和強(qiáng)力握,分別編碼為“0”和“1”。
BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練時(shí),通過輸入學(xué)習(xí)樣本集,得到網(wǎng)絡(luò)輸出,然后根據(jù)網(wǎng)絡(luò)的目標(biāo)輸出值與實(shí)際輸出值計(jì)算誤差,從輸出層開始向前逐層進(jìn)行計(jì)算并修正權(quán)值和閾值,直到誤差達(dá)到極小值,完成訓(xùn)練過程。L-M神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法是高斯-牛頓法的改進(jìn),也是高斯-牛頓法和梯度下降法的結(jié)合,由于傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法存在收斂速度慢、易陷入局部極小值的缺點(diǎn),故采用收斂速度更快,且訓(xùn)練精度更高的L-M學(xué)習(xí)算法進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,以提高抓握模式預(yù)測(cè)準(zhǔn)確率。L-M學(xué)習(xí)算法的計(jì)算過程如下[18-19]。
設(shè)神經(jīng)網(wǎng)絡(luò)第n個(gè)輸出節(jié)點(diǎn)的誤差函數(shù)為
en(W)=dn-yn,
(5)
式中:dn為第n個(gè)輸出節(jié)點(diǎn)的期望值,W為網(wǎng)絡(luò)權(quán)值、閾值所組成的向量。
則神經(jīng)網(wǎng)絡(luò)的總誤差
(6)
從而誤差性能函數(shù)的Hessian矩陣可近似表示為
H=JT(W)J(W),
(7)
其中,J(W)為雅可比矩陣,
梯度為
G=JT(W)e(W),
(8)
根據(jù)高斯-牛頓法,可得迭代公式為
W(h+1)=W(h)-W-1(h)W(h),
(9)
其中,h為第h次迭代。
對(duì)高斯-牛頓法進(jìn)行改進(jìn),可得
W(h+1)=W(h)-[JT(W)J(W)+
μI]-1J(W)e(W),
(10)
式中:μ為比例系數(shù);I為單位矩陣。
當(dāng)比例系數(shù)μ為0時(shí),式(10)轉(zhuǎn)變?yōu)楦咚?牛頓法;當(dāng)μ很大時(shí),式(10)轉(zhuǎn)變?yōu)樘荻认陆捣ǎ矣捎谘趴杀染仃嚨挠?jì)算比Hessian矩陣容易,因此,可以獲得較快的訓(xùn)練速度。
根據(jù)L-M算法的BP神經(jīng)網(wǎng)絡(luò)原理,使用MATLAB軟件進(jìn)行編程。使用抓握釋放試驗(yàn)中5 554次抓握成功的試驗(yàn)數(shù)據(jù)作為訓(xùn)練樣本集,誤差目標(biāo)設(shè)為0.05,通過改變隱含層的節(jié)點(diǎn)數(shù)以及最大訓(xùn)練次數(shù)來訓(xùn)練網(wǎng)絡(luò),最終選取隱含節(jié)點(diǎn)數(shù)為700個(gè),最大訓(xùn)練次數(shù)為10 000次,得到較好的預(yù)測(cè)精度。
經(jīng)過訓(xùn)練,網(wǎng)絡(luò)的誤差曲線如圖4(a)所示,隨著訓(xùn)練次數(shù)的增大,誤差值逐漸降低;當(dāng)訓(xùn)練次數(shù)達(dá)到8 000次以后,誤差線開始趨近水平;在整個(gè)收斂過程中振蕩較小。結(jié)果顯示,L-M算法的BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本預(yù)測(cè)正確率為90%,預(yù)測(cè)精度較高,預(yù)測(cè)值與實(shí)側(cè)值的相關(guān)系數(shù)為0.83(圖4(b)),呈高度相關(guān)。
圖4 L-M算法的BP神經(jīng)網(wǎng)絡(luò)誤差曲線以及網(wǎng)絡(luò)預(yù)測(cè)值與實(shí)測(cè)值的相關(guān)性Fig.4 Error curve and correlation between predicted value and observed value of BP neural network with L-M algorithm
為了對(duì)仿人兩指末端執(zhí)行器的抓握模式進(jìn)行預(yù)測(cè),選用10種生活中的常見物品作為抓握目標(biāo)物(表1),以各目標(biāo)物質(zhì)心位置處截面作為抓握截面,以抓握截面的內(nèi)接圓直徑作為等效直徑,而當(dāng)抓握截面為長(zhǎng)方形時(shí),取截面的內(nèi)接橢圓短軸作為等效直徑,并使用游標(biāo)卡尺(精度0.1 mm)對(duì)這些等效直徑進(jìn)行測(cè)量,作為目標(biāo)物的尺寸參數(shù)。以抓握質(zhì)心截面±20 mm范圍的形狀特征作為抓握目標(biāo)物的形狀并記錄。使用高精度電子天平(精度0.01 g)對(duì)目標(biāo)物質(zhì)量進(jìn)行測(cè)量并記錄。抓握目標(biāo)物的特征參數(shù)如表1所示。
表1 目標(biāo)物特征參數(shù)Tab.1 The characteristic parameters of target objects
試驗(yàn)所采用的仿人兩指末端執(zhí)行器如圖5所示,與人手拇指和食指相似,為一長(zhǎng)一短的搭配。較短的手指1具有2個(gè)關(guān)節(jié)即2個(gè)自由度,指長(zhǎng)Lt為85 mm,較長(zhǎng)的手指2具有3個(gè)自由度,指長(zhǎng)Li為120 mm,兩指指長(zhǎng)和為205 mm。
圖5 仿人兩指末端執(zhí)行器Fig.5 Humanoid two-finger end-effector
將10個(gè)目標(biāo)物的特征、仿人兩指末端執(zhí)行器指長(zhǎng)和特征作為訓(xùn)練好的L-M算法的BP神經(jīng)網(wǎng)絡(luò)的輸入,結(jié)合人手抓握不同目標(biāo)物的抓握模式選擇經(jīng)驗(yàn),對(duì)仿人兩指末端執(zhí)行器進(jìn)行抓握模式預(yù)測(cè),預(yù)測(cè)結(jié)果如表2所示。對(duì)于螺絲刀、遙控器、玻璃瓶、乒乓球、抽紙和筆等目標(biāo)物宜采用精密捏的抓握模式,對(duì)于洗手液、茶葉盒、膠帶、杯子等目標(biāo)物宜采用強(qiáng)力握的抓握模式。結(jié)果表明,對(duì)于等效直徑小且質(zhì)量輕的目標(biāo)物多采用精密捏的模式,反之,多采用強(qiáng)力握的模式。在仿人兩指末端執(zhí)行器穩(wěn)定抓握控制過程中,應(yīng)根據(jù)以上抓握模式分類對(duì)各目標(biāo)物的抓握模式進(jìn)行決策,再根據(jù)抓握穩(wěn)定性準(zhǔn)則對(duì)抓握力進(jìn)行控制,完成對(duì)目標(biāo)物的穩(wěn)定抓握。
表2 仿人兩指末端執(zhí)行器的抓握模式預(yù)測(cè)結(jié)果Tab.2 The predicted results of grasp type for two-finger end-effector
采用基于L-M算法的BP神經(jīng)網(wǎng)絡(luò)建立了手部特征及物體特征與拇指-食指抓握模式的非線性映射關(guān)系,對(duì)兩指抓握模式進(jìn)行了預(yù)測(cè)。結(jié)果表明,該神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)正確率為90%,具有較高的預(yù)測(cè)精度。對(duì)于等效直徑較小且質(zhì)量較輕的目標(biāo)物多采用精密捏的模式,反之,多采用強(qiáng)力握的模式。根據(jù)該網(wǎng)絡(luò)模型完成了對(duì)仿人兩指末端執(zhí)行器的抓握模式的預(yù)測(cè),為仿人兩指末端執(zhí)行器的抓握穩(wěn)定控制提供了決策依據(jù)。