王健發(fā),王耀南,陳文銳,刁 強
(湖南大學(xué)電氣與信息工程學(xué)院,機器人視覺感知與控制技術(shù)國家工程實驗室,湖南長沙 410082)
隨著機械臂技術(shù)的飛速發(fā)展,機械臂的應(yīng)用在各個行業(yè)得到了廣泛的推廣.相應(yīng)地,機械臂作業(yè)任務(wù)的復(fù)雜性不斷增大,這都對其規(guī)劃和控制提出了更高的要求.而示教學(xué)習(xí)方法通過建模學(xué)習(xí)人類的操作技能,可以高效地應(yīng)用于不同的機械臂本體[1],有效減少機械臂軌跡規(guī)劃的難度,近年來逐漸發(fā)展為機器人學(xué)中的重要研究內(nèi)容之一[2-4].
目前典型的機械臂軌跡示教學(xué)習(xí)方法主要包括基于樣條[5-6]、基于統(tǒng)計模型[7-10]、基于仿射變換[11-12]和基于動態(tài)運動基元[13-14]的軌跡學(xué)習(xí)方法4類.其中基于樣條的軌跡學(xué)習(xí)方法是通過樣條函數(shù)擬合采集到的人體運動數(shù)據(jù)實現(xiàn)的,規(guī)劃生成的軌跡平滑性好,但泛化能力不足.基于統(tǒng)計模型的軌跡學(xué)習(xí)方法主要是利用高斯混合模型或隱馬爾可夫模型擬合運動的各個特征進(jìn)行學(xué)習(xí)的軌跡規(guī)劃方法,計算效率相對較低,且生成的軌跡不連續(xù).基于仿射變換的軌跡學(xué)習(xí)方法是依據(jù)人體運動的仿射不變性開發(fā)的軌跡規(guī)劃方法,其不依賴于具體模型,可以直接變換關(guān)節(jié)角時間序列.但是由于人體與機械臂在結(jié)構(gòu)和運動能力上的差異性,該方法無法快速的將人體運動映射成機械臂運動.
與上述方法相比,Ijspeert等[13]于2002年首次提出的(dynamic movement primitives,DMPs)是一種以非線性微分方程形式的動態(tài)系統(tǒng)來編碼運動的策略,其計算效率高、生成的軌跡連續(xù)、泛化簡單[14],被廣泛用于機械臂的移動與操作上.Ude等[15]在DMPs中引入了查詢子的概念來同時考慮任務(wù)參數(shù)和模型參數(shù),并依據(jù)任務(wù)變化進(jìn)行參數(shù)調(diào)整,該方法在扔球?qū)嶒炆系玫搅蓑炞C.Gaspar等[16]將運動中的空間信息和時間信息分開表示,提出了弧長參數(shù)化的DMPs模型,解決了示教中運動速度差異大的問題,該方案在類人機器人CB-i 上臂的移動與動作識別上得到了驗證.Kober等[17]在DMPs系統(tǒng)中耦合了感知單元,提高了系統(tǒng)的抗干擾能力.此外,他們還依據(jù)強化學(xué)習(xí)方法對權(quán)重進(jìn)行了探索,優(yōu)化了系統(tǒng)的控制策略,該方案在模擬的SARCOS機器人手臂學(xué)習(xí)Ball-in-a-Cup游戲上性能良好.Li等[18]利用DMPs學(xué)習(xí)關(guān)節(jié)軌跡、PI2算法學(xué)習(xí)帶有操作不確定性軌跡的策略,實現(xiàn)了機械臂與機械手關(guān)節(jié)空間軌跡的同步優(yōu)化,該方案在移動機器人的抓取操作上得到了驗證.Zeng等[19]在DMPs的基礎(chǔ)上,引入了柔順適應(yīng)模塊,使得機械臂可以在與物理環(huán)境接觸時學(xué)習(xí)復(fù)雜的操作技能,在Baxter機器人倒水、鋸木頭等實驗上得到了驗證.
盡管DMPs算法已經(jīng)得到了廣泛的應(yīng)用,但其仍然存在一些問題.在動力學(xué)模型中,沒有明確區(qū)分位置與姿態(tài)軌跡方案,無法做到姿態(tài)的無奇異表示.對于跨零點問題欠缺考慮,即目標(biāo)與初始狀態(tài)差值項近似為0時,目標(biāo)狀態(tài)小的波動容易產(chǎn)生加速度抖動.差值項等于0時,加速度恒等于0.差值項變號時,軌跡會發(fā)生翻轉(zhuǎn).此外,機械臂避障行為過早發(fā)生,會造成過多的消耗.目前,針對上述問題的研究相對較少,主要包括以下幾種方法.Hoffmann等[20]改進(jìn)了現(xiàn)有位置DMPs中的轉(zhuǎn)換系統(tǒng),解決了位置上的跨零點問題,但對姿態(tài)軌跡則欠缺考慮.此外,在動力學(xué)模型中耦合了偏角避障因子,實現(xiàn)了避障控制,但由于忽視了機械臂與障礙間距離因素,避障行為過早出現(xiàn).Ude等[21-22]提出了四元數(shù)DMPs模型,無奇異地編碼了姿態(tài)軌跡,然而忽略了跨零點問題.
針對上述問題,本文提出了基于改進(jìn)DMPs的6D軌跡規(guī)劃方法.在動力學(xué)模型中以四元數(shù)的方式明確區(qū)分了位置與姿態(tài)軌跡,實現(xiàn)了6D軌跡的無奇異表示.此外,改進(jìn)了轉(zhuǎn)換系統(tǒng),克服了跨零點引起的抖動、軌跡翻轉(zhuǎn)等問題.最后,依據(jù)機械臂和障礙物間的距離與偏角建立虛擬阻抗關(guān)系,實現(xiàn)了機械臂的避障控制,消除了過早的避障行為.
依據(jù)Hoffmann等[20]對標(biāo)準(zhǔn)DMPs的改進(jìn),一維運動的DMP可以表示為
其中:α >0是預(yù)定義的常數(shù),g是目標(biāo)位置,y0是初始位置,x是相變量,z是縮放后的速度,τ=tT是表征運動持續(xù)時間的縮放因子,可以用于軌跡加速度、速度和時間的縮放而不改變其形狀.kv是彈性常數(shù),dv是阻尼常數(shù).當(dāng)系數(shù)4kv=,就可以得到臨界阻尼系統(tǒng).其中,f(x)是由n個力場線性組合得到的力場綜合中心點與相變量的乘積,與標(biāo)準(zhǔn)DMP中強迫函數(shù)不同的是其不再直接關(guān)聯(lián)差值項(g ?y0),
其中:wi是力場中心點,ψi(x)是鐘型脈沖函數(shù).函數(shù)f(x)并不直接取決于時間變量,而是相變量x,積分正則系統(tǒng)τ=?αx得
注意:為了與標(biāo)準(zhǔn)DMP統(tǒng)一稱呼,在下文中,f(x)也稱為強迫函數(shù),wi也稱為權(quán)值系數(shù),ψi(x)也稱為徑向基函數(shù).
機械臂的軌跡規(guī)劃不僅需要考慮其3D位置變化,也需要考慮其運動過程中的3D姿態(tài)變化.
在位置軌跡上,常用的DMPs規(guī)劃方案是將多維的運動解耦成多個獨立的一維運動,然后分別在每個維度上進(jìn)行學(xué)習(xí),計算各自的轉(zhuǎn)換系統(tǒng),最后計算各個維度上的運動軌跡.為保證各獨立的一維運動間的同步,整個過程由同一個正則系統(tǒng)驅(qū)動,相應(yīng)的多維位置DMPs可以定義為
式中相關(guān)參數(shù)與式(1)-(3)中類似,gp,p,p0分別表示多維的目標(biāo)位置、當(dāng)前位置和初始位置矢量.v是速度矢量.K和D分別表示彈性系數(shù)矩陣和阻尼系數(shù)矩陣.相應(yīng)的強迫函數(shù)fp(x)定義如下:
其中R3是位置權(quán)值系數(shù)矢量.
與多維位置DMPs不同,由于姿態(tài)集SO(3)是一個三維流形,具有特殊的流形結(jié)構(gòu),無法用3個參數(shù)無奇異表示[21],因此上述解耦方案就不適用了.本文選擇單位四元數(shù)q=u+v ∈S3(u ∈R3,v ∈R)對姿態(tài)進(jìn)行描述,并在更高維的空間對q的計算添加額外的約束,以確保其沒有偏離SO(3)結(jié)構(gòu).與Ude等[21]的姿態(tài)DMPs不同的是,本文算法中強迫函數(shù)不再關(guān)聯(lián)姿態(tài)間距,避免了跨零點問題.
式中:go,q和q0分別表示目標(biāo)姿態(tài)、當(dāng)前姿態(tài)和初始姿態(tài)矢量;K和D分別對應(yīng)彈性系數(shù)矩陣和阻尼系數(shù)矩陣.強迫函數(shù)fo(x)定義如下:
則姿態(tài)q2到q1的距離度量對應(yīng)的旋轉(zhuǎn)矢量可以表示為
則dt時間對應(yīng)的平均角速度可以表示為
由式(16)可知,當(dāng)限制其定義域為S3/([0 0 0]T?1)時,四元數(shù)對數(shù)映射是一對一且連續(xù)可微的.因此,相應(yīng)的逆映射,即,指數(shù)映射exp:R3→S3可以定義為
這里限制‖r‖≤π.依據(jù)式(19),從角速度到四元數(shù)的映射χ可以表示為
式中Δtω表示以角速度ω旋轉(zhuǎn)時間間隔Δt對應(yīng)的旋轉(zhuǎn)矢量.
在機械臂運動的在某個時刻,障礙物位置o與機械臂末端位置e之間的矢量(o ?e)和機械臂末端速度矢量v的偏角為φ,如圖1所示.依據(jù)虛擬阻抗思想,虛擬接觸力f(t)定義為機械臂末端與障礙物間距離的函數(shù),虛擬阻抗定義為接觸力-偏角與偏轉(zhuǎn)加速度之間的動態(tài)關(guān)系.由此,在原有位置DMPs的基礎(chǔ)上,引入一個偏轉(zhuǎn)加速度,使得機械臂末端的運行軌跡發(fā)生偏轉(zhuǎn),避開障礙物.相應(yīng)的虛擬接觸力大小‖f(t)‖定義為
其中:常數(shù)a和b是輔助參數(shù),d(t)是障礙物與機器人之間的距離,且滿足‖f(t)‖=a ?bdmax=0.機械臂運動方向與障礙物之間的偏角φ定義如下:
在避障控制算法中,當(dāng)虛擬接觸力‖f(t)‖大于0且偏角φ小于π/2時,可以將虛擬接觸力分解為速度方向的力fv以及垂直運動方向的力fr,如圖1所示,偏轉(zhuǎn)加速度p(e,v)定義為
圖1 機械臂與障礙物之間位置和虛擬力的關(guān)系Fig.1 The relationship of the position and virtual force between the manipulator and the obstacle
式中:k是虛擬彈性系數(shù),sgn(·)是符號函數(shù).
為了方便計算,式(23)可以重寫為
其中R表示繞旋轉(zhuǎn)軸ra=(o ?e)×v旋轉(zhuǎn)π/2得到的旋轉(zhuǎn)矩陣.相比Hoffmann等[20]只考慮了偏角φ的避障模型p(e,v)=Rv,本文算法耦合了偏角與距離的綜合作用,避免了避障行為過早的缺陷.
對于多個障礙物的避障控制,可以疊加各個偏轉(zhuǎn)加速度實現(xiàn),即
式中:pm(e,v)表示存在多個障礙物情況下的避障加速度,下標(biāo)i表示障礙物序號.綜上,考慮到避障偏轉(zhuǎn),位置軌跡動力學(xué)系統(tǒng)式(7)可以重寫為
本章節(jié)將根據(jù)李雅普諾夫理論對所提算法的穩(wěn)定性進(jìn)行分析.由于算法中常數(shù)τ不影響軌跡的穩(wěn)定性,這里設(shè)定τ=1.此外,當(dāng)t →∞時,依賴于相變量的各項?K(gp ?p0)x+Kfp(x)和?K2 log(go ?)x+Kfo(x)趨近于0,在進(jìn)行穩(wěn)定性分析時不再考慮.
對于式(26)表示的位置軌跡動力學(xué)系統(tǒng),根據(jù)單位質(zhì)量線性彈簧系統(tǒng)的能量函數(shù)構(gòu)建相應(yīng)的李雅普諾夫能量函數(shù)V(p,v)
上式對時間進(jìn)行求導(dǎo),令式(26)中τ=1,將其代入可得
同理,對于式(11)描述的姿態(tài)軌跡動力學(xué)系統(tǒng),依據(jù)單位轉(zhuǎn)動慣量的線性扭簧系統(tǒng)能量函數(shù)構(gòu)建相應(yīng)的李雅普諾夫能量函數(shù)V(q,ω)
上式中,旋轉(zhuǎn)矢量rg=2 loggo對應(yīng)目標(biāo)姿態(tài),r=2 logq表示當(dāng)前姿態(tài),則當(dāng)0,式(29)對時間進(jìn)行求導(dǎo),并將式(11)代入可得
此外,當(dāng)ω=0時,仿照位置部分的反證法,可得q=go.因此,姿態(tài)系統(tǒng)也是穩(wěn)定的.
在動態(tài)運動基元算法中,軌跡規(guī)劃是在訓(xùn)練獲得相應(yīng)權(quán)值后,得到轉(zhuǎn)換系統(tǒng),然后依據(jù)任務(wù)需求的機械臂狀態(tài),利用轉(zhuǎn)換系統(tǒng)計算新軌跡的過程.相應(yīng)的流程如圖2所示.由于姿態(tài)表示無法拆分的特殊性,模型中需要兩套轉(zhuǎn)換系統(tǒng),分別保證位置上每個維度的運動與姿態(tài)的獨立性.而整個運動的時間耦合特性則由同一個正則系統(tǒng)來保證,相關(guān)描述如圖3所示.
圖2 動態(tài)運動基元算法流程圖Fig.2 The flow chart of dynamic movement primitives algorithm
圖3 6D軌跡算法原理圖Fig.3 The principle diagram of 6D trajectories algorithm
在軌跡規(guī)劃環(huán)節(jié)中,權(quán)值計算是其中的重要一環(huán).Ijspeert等[14]針對標(biāo)準(zhǔn)一維DMP的強迫函數(shù)
通過局部加權(quán)回歸的方式,將權(quán)值wi的計算表示為
上式中,s是空間縮放項與不同時刻相變量組成向量的乘積,Ψi是不同時間對應(yīng)的徑向基函數(shù)組成的對角矩陣,是由示教數(shù)據(jù)計算得到的強迫函數(shù)向量.
訓(xùn)練樣本數(shù)據(jù)求得權(quán)值,得到轉(zhuǎn)換系統(tǒng)后,依據(jù)新的狀態(tài),歐拉積分位置DMPs方程組就可以獲得位置軌跡.而對于姿態(tài)軌跡,歐拉積分式(11)獲得角速度,然后依據(jù)四元數(shù)的附加約束,利用四元數(shù)乘積計算(t+Δt)時刻對應(yīng)的姿態(tài),
由此,就可以規(guī)劃生成期望的位置與姿態(tài)軌跡.
為了對所提算法進(jìn)行有效性驗證,本文分別設(shè)計了6D軌跡的仿真實驗、避障仿真實驗和UR5的倒水實驗.其中DMPs相關(guān)參數(shù)設(shè)定如下:彈性系數(shù)矩陣K設(shè)置為對角元素kii=576的3×3 對角矩陣,阻尼系數(shù)矩陣D設(shè)置為對角元素dii=48的3×3對角矩陣.徑向基函數(shù)的數(shù)目n=125,相應(yīng)的中心設(shè)置為ci=exp(?αi/(n ?1)),帶寬設(shè)置為hi=1/(ci+1?ci)2,hn?1=hn?2,i=0,1,···,n ?1.正則系統(tǒng)中的常數(shù)項設(shè)置為α=2.避障模塊中k=100,a=0.9,b=3,dmax=0.3.
通過本文的改進(jìn)DMPs模型,可以規(guī)劃生成6D位置和姿態(tài)軌跡,本章節(jié)設(shè)計了(a)起-終點狀態(tài)相同、起-終點狀態(tài)接近等跨零點情況下無避障機制的軌跡規(guī)劃與(b)單障礙、多障礙避障的仿真實驗進(jìn)行相關(guān)驗證.
在起-終點狀態(tài)相同情況下,觀察圖4左側(cè)可以發(fā)現(xiàn),采用Ude等[21]的DMPs模型生成的軌跡數(shù)據(jù)(雙劃線)沒有變化,而采用本文模型生成的軌跡(實線)基本與示教軌跡(虛線)重合,驗證了所提算法在初始與目標(biāo)狀態(tài)差值項為0時的可行性.這主要得益于強迫函數(shù)與差值項成功解耦,避免了起-終點狀態(tài)差值項等于0,強迫函數(shù)也等于0的情況,解決模型喪失學(xué)習(xí)能力的缺陷.
圖4 起-終點相同/接近情況的軌跡Fig.4 The trajectories of the same/close initial-target point
在示教軌跡中起-終點狀態(tài)非常接近的情況下,從相同起點出發(fā),終點狀態(tài)一個小的變化會導(dǎo)致狀態(tài)差值項的急劇變化,可能導(dǎo)致軌跡規(guī)劃失敗,如圖4中間和右側(cè)所示.其中軌跡的起-終點狀態(tài)偏差如表1所示,“同向”表示待規(guī)劃軌跡的終點相對于起點的方向與示教軌跡相同,“反向”表示待規(guī)劃軌跡的終點相對于起點的方向與示教軌跡相反.在圖4中,Ude等[21]的DMPs模型獲得的“同向”位置和姿態(tài)軌跡(雙劃線)相比示教軌跡(虛線)存在很大的波動,“反向”位置和姿態(tài)軌跡(雙劃線)相比示教軌跡(虛線)存在翻轉(zhuǎn)的情況,但本文模型生成的“同向”與“反向”位置和姿態(tài)軌跡(實線)卻能很好的跟蹤示教軌跡,驗證了起-終點狀態(tài)差值項接近0時模型的有效性.這主要得益于強迫函數(shù)與差值項成功解耦,避免了起-終點狀態(tài)差值項急劇變化對強迫函數(shù)的直接影響,消除了軌跡出現(xiàn)大幅度波動和翻轉(zhuǎn)等情況.
表1 起-終點狀態(tài)偏差Table 1 State deviation of initial-target points
在避障實驗中,為了簡化實驗以及避開強迫函數(shù)的影響,選擇動力學(xué)系統(tǒng)τ=K(gp ?p)?Dz+.對于單個障礙物的避障控制,分別設(shè)計了3組實驗,如圖5中上圖所示.在無障礙的情況下,從起點到終點是雙劃線表示的直線軌跡,但在雙劃線軌跡附近添加“*”表示的單個障礙物后,Hoffmann等[20]算法和本文算法軌跡都發(fā)生了偏轉(zhuǎn).對于多個障礙物的避障情況如圖5中下圖所示,與單個障礙物的情況類似,在3組軌跡平面添加了“*”表示的障礙后,軌跡很好的避過了所有障礙物.此外,相比Hoffmann等的避障算法,本文算法在接近障礙物時才開始偏轉(zhuǎn)軌跡,從而避障總時間和軌跡總長度更短,這樣有利于減少運動消耗.出現(xiàn)這種差別的原因是Hoffmann等的避障模型中直接檢測偏角大小進(jìn)行避障控制,忽視了機械臂和障礙物之間的距離,而本文避障算法機制中存在一個虛擬接觸力估算模塊,當(dāng)機械臂和障礙物之間的距離較大時,虛擬接觸力為0,避障因子也是0,軌跡不進(jìn)行偏轉(zhuǎn).
圖5 避障仿真實驗結(jié)果Fig.5 Simulation experiment results of obstacle avoidance
此外,為了更好的體現(xiàn)本文避障算法相比Hoffmann等算法的優(yōu)勢,針對z=0平面內(nèi)的單障礙和多障礙分別進(jìn)行了100次測試.每次測試中隨機生成1個障礙(x ∈(0,0.3),y ∈(0,1))和10個障礙(xi ∈(0,1),yi ∈(0,1),i=1,2,···,10),相應(yīng)結(jié)果如表2所述.由于避障環(huán)節(jié)在某些情況下不連續(xù),不方便統(tǒng)計避障開始時間和結(jié)束時間,在表2中不做記錄.可以發(fā)現(xiàn)在100次測試中,對于單障礙,本文算法軌跡更短的概率為96%,時間更短的概率為81%.對于多障礙,本文算法軌跡更短的概率為100%,時間更短的概率為80%.即,本文避障算法避免了避障行為時間過長、軌跡過長問題,有利于減少運動消耗.
表2 Hoffmann等避障算法與本文避障算法仿真實驗統(tǒng)計表Table 2 Simulation experiment statistics of Hoffmann’s obstacle avoidance algorithm and the proposed algorithm
為了驗證所提算法在真實機械臂上的有效性,本文在UR5機械臂上設(shè)計了倒水(以泡沫球代替水)實驗,針對表3所述的軌跡初始與目標(biāo)狀態(tài),分別驗證其在原目標(biāo)有無避障與新目標(biāo)有無避障情況下軌跡的運行情況,結(jié)果如圖6-7所示.其中障礙物位置估算是通過在障礙物表面粘貼ArUco碼,利用視覺算法識別定位ArUco碼實現(xiàn)的,而UR5機械臂的控制是在ROS框架下通過Socket通訊機制以C++編程實現(xiàn)的.在圖6-7兩圖中,上圖是無避障的軌跡測試,下圖是帶避障功能(乒乓球或泡沫圓柱)的軌跡測試,主要區(qū)別在于圖7中目標(biāo)狀態(tài)對應(yīng)的鍋移到了實驗臺邊緣.對比觀察發(fā)現(xiàn),在避障測試中位置軌跡發(fā)生了很大的偏移,而姿態(tài)軌跡沒有發(fā)生偏移,這與模型期望是對應(yīng)的,相關(guān)的位置軌跡、姿態(tài)軌跡和偏轉(zhuǎn)加速度如圖8-10所示.
表3 倒水實驗初始/目標(biāo)狀態(tài)Table 3 Initial and target state of pouring-water experiment
圖6 原目標(biāo)運動示意圖Fig.6 Diagram of movement to the original target
圖7 新目標(biāo)運動示意圖Fig.7 Diagram of movement to the new target
圖8 位置軌跡對比圖Fig.8 Comparison chart of the position trajectories
觀察圖9可知,前5.7 s的時候,UR5完成從初始狀態(tài)到圖6-7中步驟3所示的倒水動作,停留2.7 s左右完成倒水,然后再回到步驟4所示的回正狀態(tài).整個過程中,機械臂的姿態(tài)軌跡發(fā)生了很大的變化,驗證了姿態(tài)算法的泛化能力.在圖9的局部放大圖中,“原目標(biāo)-無避障”軌跡是示教軌跡,“原目標(biāo)-有避障”是存在障礙情況下算法對原目標(biāo)的泛化軌跡,因此兩者之間存在微小的偏差,而“新目標(biāo)-無避障”和“新目標(biāo)-有避障”都是算法對新目標(biāo)的泛化軌跡,兩者重合是因為避障算法不對姿態(tài)進(jìn)行調(diào)整.此外,由于新目標(biāo)與原目標(biāo)的姿態(tài)差異小,所以4種情況下姿態(tài)軌跡差別不大.
圖9 姿態(tài)軌跡對比圖Fig.9 Comparison chart of orientation trajectories
觀察圖10可以發(fā)現(xiàn),機械臂運動過程中,偏轉(zhuǎn)加速度先增大后減少,在大概1.65 s時,偏轉(zhuǎn)加速度達(dá)到了峰值,即此時UR5和障礙物間的距離-偏角產(chǎn)生的虛擬阻抗最大,因此避障模塊生成最大的偏轉(zhuǎn)加速度促使UR5迅速遠(yuǎn)離障礙物.
圖10 避障加速度Fig.10 The accelerations of obstacle avoidance
本文針對標(biāo)準(zhǔn)DMPs存在的問題,提出了適用于機械臂6D軌跡的DMPs算法,主要工作和創(chuàng)新點如下:
1) 采用四元數(shù)的方式編碼姿態(tài)軌跡,實現(xiàn)姿態(tài)軌跡的無奇異表示.通過跨零點仿真實驗,測試Ude等的DMPs對軌跡起-終點狀態(tài)敏感性.最后引入Hoffmann等的序列化力場激勵思想,改進(jìn)了DMPs的轉(zhuǎn)換系統(tǒng),避免了算法在跨零點情況下的失敗情況.
2) 基于虛擬阻抗的思想,設(shè)計了機械臂末端和障礙物之間的阻抗關(guān)系,綜合考慮了兩者之間距離和偏角的影響,實現(xiàn)了機械臂末端的避障控制,避免避障行為過早的缺陷,有利于減少運動消耗.
在本文中,機械臂的避障行為考慮的是末端避障,對于機械臂的整體避障,可以尋找機械臂各連桿與障礙物之間距離最近點M用于計算虛擬接觸力,然后應(yīng)用本文避障算法生成作用于M的偏轉(zhuǎn)加速度,經(jīng)過積分運算以及該最近點M對應(yīng)的雅可比矩陣轉(zhuǎn)換后,得到關(guān)節(jié)空間避障速度,方便與其他運動學(xué)系統(tǒng)整合.此外,運動技能的學(xué)習(xí)是通過一個動態(tài)運動基元序列實現(xiàn)的,對于復(fù)雜任務(wù)的學(xué)習(xí)泛化存在一定的局限性.因此,在未來的工作中,研究的重點是嘗試建立多個動態(tài)運動基元序列庫,依據(jù)實際情況拆分復(fù)雜任務(wù),選擇合適的動態(tài)運動基元序列去分別完成各個子任務(wù).另外,后期也可以嘗試將機械臂的柔順控制以及感知模塊加入本文模型,提升機械臂的性能.