胡永贊 胡凱 吳佳勝 陳旭 黃志成
隨著科學(xué)技術(shù)的不斷發(fā)展,機器人技術(shù)取得了非常顯著的進步,己經(jīng)被廣泛應(yīng)用于工業(yè)生產(chǎn)、家庭服務(wù)等諸多領(lǐng)域.當(dāng)前實際應(yīng)用中的機器人多為硬質(zhì)機械結(jié)構(gòu),由剛體部件構(gòu)建而成.剛性機器人一直是機器人發(fā)展的重點,它能夠提高生產(chǎn)效率并且具有極強的可控性.但是,傳統(tǒng)的剛性機器人不易在復(fù)雜的地形條件下運動且缺乏靈活性[1].近年來,隨著機器人應(yīng)用領(lǐng)域的不斷擴大,對機器人的柔順性提出了更高的要求.國際機器人協(xié)會對軟體機器人的定義[2]是:1)由某種特殊的柔軟彈性材料制成的機械裝置;2)由多個剛性部件構(gòu)成,但能展現(xiàn)出類似軟體機器人變形特性的機電裝置.軟體機器人本體采用柔性材料加工而成,從原理上具有無限自由度,彌補了剛性機器人在這一方面的不足.因此,很多科學(xué)家開始致力于由柔軟材料或可變形材料制作的剛?cè)狁詈蠙C器人的研究工作.本文將從剛?cè)狁詈蠙C器人的國內(nèi)外發(fā)展現(xiàn)狀、內(nèi)置驅(qū)動、機器人運動分析建模[3]、控制方法等方面進行綜述,并對剛?cè)狁詈蠙C器人的發(fā)展趨勢和研究方向做出展望.
近年來,由于醫(yī)療、地質(zhì)勘察、野外探險、水質(zhì)監(jiān)測等領(lǐng)域的迫切需求,剛?cè)狁詈蠙C器人的發(fā)展速度相當(dāng)迅速.2008年,河北工業(yè)大學(xué)的高鐵紅[4]研發(fā)了仿生水黽機器人,其本體用碳纖維材料,支撐腿和連接機構(gòu)采用不銹鋼絲,以三個微型電磁鐵作為驅(qū)動器(圖1),通過控制系統(tǒng)驅(qū)動機器人運動,實現(xiàn)仿生水黽的運動以及轉(zhuǎn)彎.該仿生水黽在水質(zhì)檢測、水面巡檢等領(lǐng)域有著廣闊的應(yīng)用前景.2017年,中國科學(xué)技術(shù)大學(xué)的張林飛[5]研發(fā)了仿生的章魚腕足機械臂,并且以當(dāng)下熱門的驅(qū)動材料形狀記憶合金(Shape Memory Alloys,SMA)作為驅(qū)動器,通過對SMA的電加熱和冷卻可以完成蜷縮和抓取動作,機械臂外部采用軟性材料制作而成,可以實現(xiàn)抓取物體而無任何形態(tài)損害.這種對不同形態(tài)大小物體抓取的普適性,在工業(yè)制造、醫(yī)療康復(fù)[6]、海洋巡檢等領(lǐng)域應(yīng)用廣泛.2018年,中國海洋大學(xué)的譚俊哲等[7]制作出了仿生的水母機器人,實現(xiàn)了在海洋中的運動,它同樣采用了SMA作為驅(qū)動器,驅(qū)動器分為上下兩段控制,分別完成收縮和擴張運動,在制作完成的樣機中設(shè)置了冷卻室,以達到快速冷卻的目的,從而實現(xiàn)快頻率的收縮擴張運動(圖2).2018年,東南大學(xué)宋愛國教授團隊[8]以醫(yī)療輔助康復(fù)為目的,利用基于表面肌電圖像的手勢識別算法能自如控制假手完成8種手勢動作(圖3).
圖1 仿生水黽機器人[4]Fig.1 Bionic water strider robot [4]
圖2 仿生水母機器人結(jié)構(gòu)[7]Fig.2 Structure of the bionic jellyfish robot [7]
圖3 東南大學(xué)與丹陽假肢廠聯(lián)合研發(fā)的多指靈巧肌電假手[8]Fig.3 Multi-finger smart muscle electric prosthesis jointly developed by Southeast University and Danyang Prosthetic Factory [8]
美國麻省理工學(xué)院(MIT)的RUS課題組[9]研發(fā)了一種自主游動的軟體機器魚(圖4),用流體彈性驅(qū)動器(Fluidic Elastomer Actuator,FEA)作為魚尾驅(qū)動,實現(xiàn)了水下自由游動和快速逃逸.2015年,哈佛大學(xué)的WOOD課題組[10]采用3D打印技術(shù),研制了一種彈跳機器人,將不同剛度梯度的材料組合到一起.該機器人包含了剛性驅(qū)動部件的可靠性和柔性材料的自由度高等特性,因此提高了自身的跳躍性能(圖5).同時,該機器人采用爆破能來驅(qū)動,雖然不可控,但是擺脫了傳統(tǒng)氣缸驅(qū)動的束縛,為機器人的小型化設(shè)計提供了新的方案.2020年,北卡州立大學(xué)Tang等[11]因受到獵豹的脊背柔軟且富有彈性,可以通過拉伸背部肌肉來控制脊背的快速彎曲以及伸長來實現(xiàn)高速奔跑的啟發(fā),設(shè)計了柔性脊背柔性機器人(圖6),其速度達每秒2.7個身長(187.5 mm/s).同時,它既可以實現(xiàn)水下軟機器人的快速游動,速度達每秒0.8個身長(117 mm/s),又可以用于可調(diào)節(jié)抓力的柔性器人抓手(可抓取易碎的生雞蛋,也可提起10 kg的啞鈴).
圖4 軟體機器魚[9]Fig.4 Soft robotic fish[9]
圖5 彈跳機器人[10]Fig.5 Bouncing robot [10]
圖6 仿獵豹柔性機器人[11]Fig.6 Flexible robot imitating cheetah[11]
驅(qū)動器是剛?cè)狁詈蠙C器人實現(xiàn)運動的必需的運動執(zhí)行機構(gòu),因此研究適用于機器人內(nèi)置驅(qū)動的驅(qū)動器至關(guān)重要.
剛?cè)狁詈蠙C器人本體的關(guān)鍵在于剛性材料和柔性材料的結(jié)合,柔性驅(qū)動器的設(shè)計[12-15]作為柔性機器人應(yīng)用的關(guān)鍵技術(shù),決定了柔性機器人的工作機理,如能設(shè)計出優(yōu)良而順滑的驅(qū)動方式,則會提高仿生機器人與人類的相容性.剛?cè)狁詈蠙C器人是模仿大自然中動物的肌肉組織或靜水骨骼結(jié)構(gòu)來建立它的驅(qū)動器結(jié)構(gòu)的[16].其驅(qū)動方式主要包括:氣動驅(qū)動、電活性聚合物(Electro Active Polymer,EAP)驅(qū)動或者形狀記憶合金(SMA)驅(qū)動等.
氣動驅(qū)動[17-18]是通過改變氣體壓強產(chǎn)生壓強差,來驅(qū)動機器人從而實現(xiàn)變形運動的,它具有反應(yīng)速度快、功率大、運動平滑、易于控制等優(yōu)點.氣動驅(qū)動的特點在于,它需要外部設(shè)備如空氣壓縮機來提供動力,通過壓縮的氣體釋放到缸體內(nèi),從而為缸體運動提供驅(qū)動力.目前,應(yīng)用較多的是氣動人工肌肉,如文獻[18]研制了人工肌肉氣動驅(qū)動的仿生青蛙(圖7),其外殼采用3D樹脂打印,減輕了機器人機身的質(zhì)量.在機器人軀干上安裝了兩個容積分別為2 L的可反復(fù)充氣的氣瓶作為驅(qū)動氣源,并且通過滑模變結(jié)構(gòu)控制進行測試實驗,結(jié)果表明控制系統(tǒng)穩(wěn)定可靠,實現(xiàn)了仿生青蛙在水中的游動.
圖7 氣動驅(qū)動仿生青蛙[18]Fig.7 Pneumatic driven bionic frog[18]
電活性聚合物(EAP)[19-20]一般將電源作為驅(qū)動源,它是一種新型智能高分子材料,在外部電場的作用下,電活性聚合物內(nèi)部結(jié)構(gòu)發(fā)生改變,在薄膜表面的導(dǎo)電層之間的靜電引力促使薄膜發(fā)生壓縮與形變.根據(jù)電活性聚合物的致動機理,一般將EAP分為離子型EAP和電子型EAP兩類.因為電子型EAP如果想要發(fā)生形變,一般需要千伏級的驅(qū)動電壓,而離子型EAP在較低電壓下就可以發(fā)生形變(圖8),在電流的作用下可以改變EAP的外觀和大小,從左到右為初始狀態(tài)變化到通電狀態(tài),它具有比較大的彎曲響應(yīng)的特點.另外,電活性聚合物的應(yīng)變高、質(zhì)量輕以及柔軟性好的特點,使其在仿肌領(lǐng)域得以飛速發(fā)展.EAP具有很好的機電性能以及較高的機電轉(zhuǎn)換效率,被廣泛應(yīng)用在機器人領(lǐng)域.
圖8 離子型EAP變形[19]Fig.8 Ionic EAP deformation[19]
由于能量更容易以電能方式存儲,以電子電路的形式來計算,直接應(yīng)用電能來驅(qū)動軟體驅(qū)動器更為方便.因此,有大量的學(xué)者致力于開發(fā)由電活性聚合物組成的電激活軟體驅(qū)動器.如文獻[19]提出了由兩個柔性桿組成“L”形軟體機器人驅(qū)動器,針對驅(qū)動器的輸入電壓和輸出位移,建立了由電化學(xué)和電動機械模型組成的多重物理量動態(tài)模型,應(yīng)用瑞雷-里茲-邁羅維奇方法對軟體機器人的控制方程進行了求解,應(yīng)用拉普拉斯算子獲得了軟體機器人的傳遞函數(shù),為精密控制奠定了基礎(chǔ).
形狀記憶合金[21]是一種特殊的合金.通過人為作用,可以使其記憶任何形狀,經(jīng)過加熱到某一溫度,它就會變長,遇冷就會收縮回到它所記憶的形態(tài),因此稱之為形狀記憶合金.根據(jù)形狀記憶合金這種受熱能伸縮的特點而制成的驅(qū)動器成為形狀記憶合金驅(qū)動器.常用的記憶合金是Ti Ni合金.圖9為意大利圣安娜高等學(xué)校Laschi等[22]研制的仿章魚機器人.這種仿章魚機器人采用形狀記憶合金驅(qū)動,形狀記憶合金可以在溫度不同的情況下恢復(fù)設(shè)定的形狀.Laschi等通過電阻絲熱量來實現(xiàn)這種溫度的變化,針對章魚的不同運動姿態(tài),可以設(shè)定形狀記憶合金的不同初始姿態(tài),實現(xiàn)仿章魚機器人的不同的運動狀態(tài).
圖9 仿章魚機器人[22]Fig.9 A new robotic octopus tentacle[22]
形狀記憶合金是利用合金的相變來進行能量轉(zhuǎn)換的,記憶合金做成的驅(qū)動器具有以下優(yōu)點:選擇適當(dāng)規(guī)格的記憶合金可以將驅(qū)動器體型最小化,特別是仿生體型較小的動物;結(jié)構(gòu)簡單、質(zhì)量輕、柔順性好.但是,形狀記憶合金也有其存在的缺點:變形響應(yīng)較慢、輸出力較小,難以供給爆發(fā)的輸出力,所以其工作效率較低,例如Laschi等[22]所設(shè)計的仿章魚機器人,通過相變產(chǎn)生的驅(qū)動力,機器人確實是做到了仿章魚的基本運動形態(tài),但眾所周知,海洋中的章魚游行時爆發(fā)力十足,而由SMA驅(qū)動器制成的仿生機器人難以與其媲美.SMA驅(qū)動的機器人做到了機器人輕量化,占用空間更小,但是,如何使得SMA驅(qū)動器產(chǎn)生更高的能量爆發(fā)還需要進一步研究.
表1為三種驅(qū)動方式的優(yōu)點及工作原理比較.
表1 驅(qū)動方式比較
機器人的柔性部分的建模研究是一個難題,也是剛?cè)狁詈蠙C器人研究的重要部分.
軟體機器人的運動學(xué)不同于傳統(tǒng)的機器人,軟體機器人變形連續(xù)且自由度高度冗余,對于它們的運動學(xué)描述只能采用連續(xù)體方程.基于軟體機器人變形后各部分曲率恒定或者分段恒定的現(xiàn)象,學(xué)者們在傳統(tǒng)的D-H變換的基礎(chǔ)上研究出一套分段常曲率(Piecewise Constant Curvature,PCC)理論模型[23].該模型用長度、曲率和偏轉(zhuǎn)角來描述一條曲線在構(gòu)型空間下的位姿,通過改進的D-H轉(zhuǎn)換將曲線末端點映射到工作空間中,給出了從構(gòu)型空間轉(zhuǎn)換到工作空間的通用齊次矩陣.而從軟體機器人的驅(qū)動空間到構(gòu)型空間的映射因機器人本體的結(jié)構(gòu)而異.通過變形后的幾何關(guān)系可得到構(gòu)型空間下的位姿參數(shù)和三條驅(qū)動線纜長度的關(guān)系[24];用系統(tǒng)辨識的方法可建立輸入氣壓和構(gòu)型空間參數(shù)的關(guān)系[25].但是PCC模型只適用于固定曲率的運動學(xué)求解,對于變曲率的軟體機器人運動學(xué)問題,需要新的方法,如將軟體連續(xù)臂分為多段,每段近似曲率恒定[26-27].對于流體驅(qū)動彈性體和纖維增強制動器等超彈性材料軟體機器人,因其本構(gòu)關(guān)系比較復(fù)雜,學(xué)者們多采用有限元分析來研究幾何參數(shù)對運動學(xué)的影響[28-29].從變形前后的幾何關(guān)系來分析其變形機理,也是一個很好的嘗試.
和剛體機器人相比,軟體機器人的逆運動學(xué)問題(通過控制曲率使機器人到達指定位置)具有更多的挑戰(zhàn).機器人自動避障、非結(jié)構(gòu)環(huán)境下作業(yè)、自動抓取和放置物體等任務(wù)都離不開逆運動學(xué)問題的求解.目前,對于這方面的研究也展開了一些工作.如MIT的RUS團隊,在給定軟體機器人的起始點、終止點和期望的姿態(tài)后,通過級聯(lián)反饋曲率控制算法,迭代雅可比矩陣計算每一步需要的曲率并控制其達到期望值[30],并利用視覺反饋完成了二維平面內(nèi)抓取[31]和在限制空間下運動規(guī)劃[32]等復(fù)雜任務(wù).RUS團隊還建立了三維軟體機械臂的動力學(xué)模型,并完成了空間抓持任務(wù)[33].上海交通大學(xué)的Wang等[34]也利用視覺伺服控制軟體機械臂定位目標(biāo)物體.
表2為柔性機器人建模方法比較.
表2 柔性機器人建模方法比較
在研究機器人的剛?cè)狁詈蠁栴}上,對機器人的建模是至關(guān)重要的.下面以形狀記憶合金(SMA)驅(qū)動的機器人為例,分析其建模問題.因SMA材料質(zhì)量輕、靈活性高,2019年,Liu等[35]設(shè)計了仿人柔性機器人單元,其設(shè)計靈感來自于脊椎的工作方式,設(shè)計了一個柔性機器人結(jié)構(gòu),機器人外觀如圖10所示.
圖10 模型外觀結(jié)構(gòu)[35]Fig.10 Structure of the soft robot proposed in Ref.[35]
假設(shè)機器人以低速勻速運動,考慮建立其運動學(xué)模型.如圖11所示,以機器人的兩個單元為例,由SMA驅(qū)動的上下6個關(guān)節(jié)點(T1,T2,T3,B1,B2,B3)做共球面運動,6個關(guān)節(jié)點兩兩對應(yīng)分為3組,B1T1為整個機器人其中一個機械分支,根據(jù)柔性機器人建模方法,B1T1數(shù)學(xué)模型可表示為
圖11 形狀記憶合金模型[35]Fig.11 Model of SMA[35]
(1)
B2T2分支的數(shù)學(xué)模型方程為
(rsinθ2cosφ2+rsin 0)2+(rcosθ2-rcos 0)2,
(2)
B3T3分支的模型方程為
(3)
其中,r為運動球面的半徑,θ,φ為機器人的旋轉(zhuǎn)角度.
然后根據(jù)機構(gòu)的幾何形狀,可以推導(dǎo)出點與點之間的函數(shù)關(guān)系,最終建立完整的數(shù)學(xué)模型:
(4)
關(guān)于T2T3和T1T3的另外兩個模型方程也可以用同樣的方法得到.
根據(jù)未知數(shù)的個數(shù)與方程的個數(shù)之間的關(guān)系,方程組有唯一解.該模型上下共分為2個單元,SMA作為對人體肌肉的模擬,機器人本體單元則用于脊柱單元的模擬,各個單元之間關(guān)節(jié)被設(shè)計成骨骼的關(guān)節(jié).各關(guān)節(jié)角作為模型的輸入,因此,根據(jù)上述幾何運動學(xué)關(guān)系,可以推導(dǎo)出對應(yīng)于不同頂面位置的3個SMA彈簧的長度.
對機器人建模是機器人研究中非常重要的一環(huán),特別是對于SMA柔性機器人,因為其具有無限多自由度,使得建模具有一定的難度,但通過適當(dāng)?shù)慕S嬎惴椒ńK究可以克服.
控制算法在機器人中也是不可或缺的.近年來,結(jié)合深度學(xué)習(xí)和強化學(xué)習(xí)的控制算法已經(jīng)應(yīng)用于剛?cè)狁詈蠙C器人,并且取得不少成果.為使問題簡單化并且獲得良好的控制效果,大多數(shù)機器人采用單回路閉環(huán)控制.在研究機器人的控制系統(tǒng)時,如何保證機器人有足夠高的精度和系統(tǒng)的穩(wěn)定性成為最大的難點,因此需要相應(yīng)的控制算法才能實現(xiàn)對機器人運動的精確控制.常用的控制算法有PID控制、模糊控制、自適應(yīng)控制、滑模控制和神經(jīng)網(wǎng)絡(luò)控制等.
PID控制是線性系統(tǒng)理論中的控制算法,對于線性系統(tǒng)能夠達到精確的控制效果,在工業(yè)中也應(yīng)用最多.PID控制就目前來說是一種較為簡單的控制方法,在小型的機器人系統(tǒng)中也是應(yīng)用最為普遍的控制方法.Dehghani等[36]設(shè)計了一種PID控制器用于單連桿柔性關(guān)節(jié)機器人中,實現(xiàn)了具有柔性關(guān)節(jié)機器人的基本運動.為了實現(xiàn)低的超調(diào)值,他們又設(shè)計了FLST-PID(Fuzzy Logic Self-Tuning PID),FLST-PID是一種比較實用的系統(tǒng)優(yōu)化方法,具有克服不確定性和改變系統(tǒng)參數(shù)的能力.結(jié)果表明,經(jīng)此改進的單連桿柔性關(guān)節(jié)機器人控制速度快、超調(diào)量為零,使得柔性關(guān)節(jié)機器人的控制準(zhǔn)確率有所提高.
模糊控制是一種智能控制方法,它本質(zhì)上是一種非線性控制,適用于對難以建模的對象實施魯棒性控制,最終控制形式簡單、易于實現(xiàn).此外,對于不確定的控制系統(tǒng)得不到它精確的數(shù)學(xué)模型的問題,模糊控制就可以解決.
Kha等[37]設(shè)計了一種自適應(yīng)模糊PID控制器成功地應(yīng)用于SMA驅(qū)動器的位置控制.實驗結(jié)果表明,自整定模糊PID控制器能夠較好地實現(xiàn)對不同輸入信號的跟蹤,從而補償了SMA執(zhí)行器的滯后現(xiàn)象.文獻[38]采用模糊PID控制器對氣動柔性球關(guān)節(jié)進行控制,克服了氣動人工肌肉結(jié)構(gòu)數(shù)學(xué)模型不精確的缺點,實驗結(jié)果表明模糊PID控制基本可以滿足對該柔性機器人彎曲關(guān)節(jié)的精確控制和響應(yīng)速度的需求.王斌銳等[39]使用模糊控制結(jié)合PI控制器對氣動肌肉肘關(guān)節(jié)(圖12)進行控制,以提高位置精度為目標(biāo),使用模糊控制對氣動肌肉肘關(guān)節(jié)的上、下臂角度比例K和PI參數(shù)進行實時調(diào)整.實驗結(jié)果表明,相對于PI控制而言,結(jié)合了模糊控制的PI控制使得肘關(guān)節(jié)的轉(zhuǎn)動角更大,而且跟蹤精度更高,實現(xiàn)了氣動驅(qū)動肘關(guān)節(jié)有效而且精確的控制.
圖12 氣動肌肉仿生肘關(guān)節(jié)[39]Fig.12 Pneumatic muscle bionic elbow joint[39]
自適應(yīng)控制根據(jù)系統(tǒng)參數(shù)或運行指標(biāo)的變化改變控制參數(shù),從而使控制對象工作達到最優(yōu)狀態(tài),多用于具有一定不確定性的非線性系統(tǒng)控制中.自適應(yīng)控制不完全依靠數(shù)學(xué)模型,需要不斷對控制模型的數(shù)據(jù)信息進行采集,然后不斷去完善它的數(shù)學(xué)模型,最終達到控制系統(tǒng)的性能指標(biāo).此特點決定了自適應(yīng)控制在運動控制方面的優(yōu)越性.
一種典型魯棒自適應(yīng)PID控制算法流程如下:
基于局部學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),因為其學(xué)習(xí)速度較快,有較好的逼近性能,在控制領(lǐng)域受到了廣泛的關(guān)注,其逼近函數(shù)可以表示為
(5)
式中,w為可調(diào)權(quán)值向量,v為權(quán)系數(shù)選擇向量.設(shè)計神經(jīng)網(wǎng)絡(luò)在線學(xué)習(xí)系統(tǒng)不確定性和非線性:
(6)
設(shè)計魯棒自適應(yīng)控制器為
u=upid+uad=
(7)
ATP+PA=-Q,
(8)
神經(jīng)網(wǎng)絡(luò)權(quán)值調(diào)整規(guī)則為
(9)
(10)
至此,得到最終的控制系統(tǒng),之后即可構(gòu)造李雅普諾夫函數(shù)證明系統(tǒng)的穩(wěn)定性.
在控制領(lǐng)域中,經(jīng)典的控制方法如PID控制等,智能控制如滑??刂?、自適應(yīng)控制、神經(jīng)網(wǎng)絡(luò)控制等,它們在單獨應(yīng)用在系統(tǒng)中,往往不能達到預(yù)期的控制要求,而多數(shù)情況下,兩種控制算法或者幾種控制算法結(jié)合,可以達到更穩(wěn)定、更精確的控制效果.
在控制系統(tǒng)中,超調(diào)量較大會導(dǎo)致控制系統(tǒng)不穩(wěn)定,達不到預(yù)期的機器人控制效果.為了降低控制系統(tǒng)的超調(diào)量,Wang等[40]在魯棒自適應(yīng)PID控制算法中加入了小腦模型關(guān)節(jié)控制器(Cerebellar Model Articulation Controller,CMAC)神經(jīng)網(wǎng)絡(luò),CMAC是一種基于局部學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),學(xué)習(xí)速度快,具有較好的逼近效果,控制結(jié)構(gòu)是對氣球的方位系統(tǒng)進行控制,結(jié)合PID控制循環(huán)反饋給控制器實現(xiàn)自適應(yīng)方位控制,利用逼近效果減少系統(tǒng)的超調(diào)量,實現(xiàn)精確的方位控制.
滑??刂频膬?yōu)點是能夠克服系統(tǒng)的不確定性,對干擾和未建模動態(tài)具有很強的魯棒性,尤其是對非線性系統(tǒng)的控制具有良好的控制效果.由于變結(jié)構(gòu)控制系統(tǒng)算法簡單、響應(yīng)速度快,對外界噪聲干擾和參數(shù)攝動具有魯棒性,在機器人控制領(lǐng)域得到了廣泛的應(yīng)用.滑模控制屬于非線性的控制方法,它的優(yōu)勢是不需要精確的數(shù)學(xué)模型,可以估計出不確定的干擾因素.滑??刂凭哂幸韵聝?yōu)點:控制響應(yīng)速度快、不需要模型的在線辨識能力、對參數(shù)變化及外界擾動不是很敏感以及結(jié)構(gòu)實現(xiàn)簡單.
針對人工肌肉驅(qū)動器模型控制策略較為復(fù)雜、控制參數(shù)較多、調(diào)節(jié)過程較為繁瑣、通用性較差等問題,楊輝等[41]基于梯度法設(shè)計了無模型自適應(yīng)滑??刂破?驅(qū)動器的動態(tài)方程可表示為
(11)
e=qd-q.
(12)
由人工肌肉驅(qū)動的柔性機器人系統(tǒng)是一種非線性系統(tǒng),而滑??刂茖Ψ蔷€性系統(tǒng)有著較好的控制效果,故取滑模控制器的滑模面函數(shù)為
(13)
其中c1,c2為常系數(shù),e為誤差.為保證運動點能夠在有限時間內(nèi)到達滑模面,且到達滑模面時避免出現(xiàn)抖振現(xiàn)象,故取指數(shù)趨近律為
(14)
Rsetam等[42]提出了一種分層滑??刂品椒☉?yīng)用在柔性關(guān)節(jié)機械手.利用兩個子系統(tǒng)對柔性關(guān)節(jié)機械手進行建模;根據(jù)非線性系統(tǒng)性質(zhì),構(gòu)造了兩個子系統(tǒng)的誤差滑模面,位于第一級滑模態(tài).對于柔性機械手,滑模面子系統(tǒng)S1的目的是控制由機械手的柔性引起的幾何非線性項,滑模面子系統(tǒng)S2的目的是抑制滑模控制所帶來的抖振項,從而提高控制系統(tǒng)的性能:
(15)
通過對柔性關(guān)節(jié)機器人的跟蹤性能、減振效果等控制目標(biāo)的比較研究,表明該方法具有優(yōu)于傳統(tǒng)滑模控制的性能.
提高跟蹤性能、減小振動效果是滑模控制領(lǐng)域一直追求的性能.2019年,Wang等[43]基于李雅普諾夫函數(shù)設(shè)計了一種自適應(yīng)滑??刂破鱽硖幚磔斎爰s束、模型不確定性和外部干擾.為了控制機器人的位置和姿態(tài)角,實現(xiàn)機器人的軌跡跟蹤控制系統(tǒng),所設(shè)計的控制算法在仿真中得到了廣泛的驗證.
滑??刂茖ο到y(tǒng)動態(tài)的模型以及動態(tài)模型中不確定因素的要求較高.然而滑??刂频娜秉c是在控制軌跡到達滑??刂频幕C鏁r很難沿著滑模面向平衡點移動,而是在面的兩側(cè)來回穿梭,這一現(xiàn)象被稱為抖振現(xiàn)象,所以在使用滑??刂茣r減少抖振現(xiàn)象是至關(guān)重要的.對于滑??刂浦谐霈F(xiàn)的抖振現(xiàn)象,較為常用的解決方法有:邊界層法、趨近律法和遺傳優(yōu)化等.
神經(jīng)網(wǎng)絡(luò)控制是智能控制的一部分,它主要是將人工神經(jīng)網(wǎng)絡(luò)理論與控制理論兩者有機地結(jié)合起來.人工神經(jīng)網(wǎng)絡(luò)控制的實現(xiàn)主要是把神經(jīng)網(wǎng)絡(luò)作為控制系統(tǒng)結(jié)構(gòu)中的辨識器或者主控器用于對數(shù)學(xué)模型不確定的控制系統(tǒng).
多層感知器(Multi-Layer Perceptron,MLP)神經(jīng)網(wǎng)絡(luò)對非線性系統(tǒng)具有良好的直接控制性能.對于某些非線性動態(tài)系統(tǒng)的控制,采用神經(jīng)網(wǎng)絡(luò)控制器是有益的.彭濟根等[44]在關(guān)節(jié)柔性較弱的情況下,對柔性關(guān)節(jié)機器人操作手的軌跡跟蹤問題提出了一種基于奇異攝動理論的機器人神經(jīng)網(wǎng)絡(luò)控制設(shè)計方法,結(jié)果表明,基于奇異攝動理論的神經(jīng)網(wǎng)絡(luò)控制算法能夠有效地克服參數(shù)未知、模型未知等不確定因素,使得跟蹤誤差可以任意地小,如此,柔性機械手便可以減少控制誤差,使其控制更加準(zhǔn)確.但該控制算法存在一種“微分爆炸”的現(xiàn)象.對于這一現(xiàn)象,劉金琨等[45]針對柔性關(guān)節(jié)機器人系統(tǒng),提出了一種自適應(yīng)神經(jīng)網(wǎng)絡(luò)動態(tài)面控制,在神經(jīng)網(wǎng)絡(luò)動態(tài)面控制的設(shè)計過程中,仿照反演控制的“遞進式”設(shè)計方法,控制器設(shè)計分為4步,分別定義了4個誤差表面,其中,第4誤差面的輸出作為控制器的輸入,實現(xiàn)控制效果,而第3個誤差面到第4個誤差面的過程中使用低通濾波,其作用是在克服“微分爆炸”的同時克服外界干擾,第2個誤差面是為第3個誤差面提供經(jīng)神經(jīng)網(wǎng)絡(luò)逼近后的狀態(tài)輸入,第1個誤差面為第2個誤差面提供帶有一階低通濾波的輸入,作用是克服“微分爆炸”.
Si=xi-xid,i=1,2,3,4,
(16)
一般來說,神經(jīng)網(wǎng)絡(luò)控制中,不管是MLP網(wǎng)絡(luò)還是徑向基函數(shù)(Radial Basis Function,RBF)網(wǎng)絡(luò),其作用都是用來逼近計算,而RBF網(wǎng)絡(luò)是近幾年應(yīng)用較多的網(wǎng)絡(luò),它是一種高效的前饋式網(wǎng)絡(luò),具有其他網(wǎng)絡(luò)所不具有的最佳逼近性能和全局最優(yōu)特性,而且結(jié)構(gòu)簡單、訓(xùn)練速度快.2017年,Wang等[46]針對柔性并聯(lián)機器人參數(shù)的不確定性,采用RBF神經(jīng)網(wǎng)絡(luò)進行逼近計算,結(jié)合李雅普諾夫穩(wěn)定性理論,分析了系統(tǒng)的穩(wěn)定性,并且設(shè)計了控制律減小近似誤差,柔性并聯(lián)機器人運行良好,驗證了方法的可行性和可靠性.2019年,Kim等[47]提出了一種神經(jīng)網(wǎng)絡(luò)動態(tài)表面控制算法用于柔性機器人的軌跡跟蹤,相對于神經(jīng)網(wǎng)絡(luò)控制,結(jié)合了動態(tài)面的神經(jīng)網(wǎng)絡(luò)可消除微分項的膨脹,使控制器和參數(shù)設(shè)計簡單,還能減少用于建模的神經(jīng)網(wǎng)絡(luò)及模糊系統(tǒng)輸入變量的數(shù)目.
近年的深度學(xué)習(xí)(Deep Learning,DL)和強化學(xué)習(xí)(Reinforcement Learning,RL)不僅在人工智能領(lǐng)域是個熱門,而且結(jié)合控制算法也將是全新的研究方向.在控制工程領(lǐng)域,強化學(xué)習(xí)是傳統(tǒng)控制理論與自適應(yīng)控制算法之間的橋梁.強化學(xué)習(xí)的基本思想是:智能體可以通過學(xué)習(xí)來解決不同的行為,而學(xué)習(xí)的結(jié)果對于特定的情形是最優(yōu)的.由于RL是一種端到端的學(xué)習(xí)方法,不需要知道機器人的模型,因此控制算法的設(shè)計者可以節(jié)省大量的工作,只需要提供反饋形式的獎勵函數(shù)即可.
為了驗證強化學(xué)習(xí)可以解決SMA模型的柔性機器人位置控制問題,Liu等[35]提出了一種柔性機器人位置控制深度確定性策略梯度算法(Soft robot Position Control based on Deep Deterministic Policy Gradient,SPC-DDPG),應(yīng)用在SMA驅(qū)動的柔性機器人中,將RL控制算法運用到SMA位置控制(圖13)中,在RL控制問題上,使用了Q函數(shù)來表示獎勵和期望值.Q函數(shù)的作用是通過智能體與環(huán)境之間的反饋進行學(xué)習(xí)并強化學(xué)習(xí),Q函數(shù)使SMA機器人根據(jù)實時情況做出動態(tài)規(guī)劃,Q函數(shù)表示如下:
圖13 形狀記憶合金扭轉(zhuǎn)示意圖[35]Fig.13 Torsional diagram of SMA[35]
(17)
SPC-DDPG算法是一種可行的控制算法,根據(jù)目標(biāo)達成任務(wù),設(shè)計獎勵函數(shù),該算法在不同的學(xué)習(xí)參數(shù)下都能很好地完成任務(wù).
強化學(xué)習(xí)與控制算法的交叉融合逐漸發(fā)展成為一種新的風(fēng)向標(biāo).Subudhi等[48]對在NIT Rourkela電氣部門工業(yè)電子與機器人中心使用的quanser雙連桿柔性機械手進行了仿真研究,結(jié)果顯示,基于強化學(xué)習(xí)的直接自適應(yīng)控制,其誤差小于0.01%,遠(yuǎn)優(yōu)于仿真結(jié)果顯示的固定增益最優(yōu)控制.盡管所采用的解耦模型減小了葉頂質(zhì)量對整個系統(tǒng)的影響,與其他自適應(yīng)控制相比,該自適應(yīng)控制不依賴于系統(tǒng)動力學(xué),計算復(fù)雜度較低,但是基于強化學(xué)習(xí)的控制算法不能進行機器人移動過程中的點穩(wěn)定運動控制,限制了人工智能控制算法在運動控制中的應(yīng)用.
為了解決點穩(wěn)定的運動控制問題,2019年,Gao等[49]將深度強化學(xué)習(xí)應(yīng)用到機器人點穩(wěn)定的運動控制,他們建立了兩個深度神經(jīng)網(wǎng)絡(luò),并且復(fù)制為目標(biāo)網(wǎng)絡(luò),分別由策略網(wǎng)絡(luò)和值網(wǎng)絡(luò)組成,當(dāng)機器人的點穩(wěn)定訓(xùn)練完成后,目標(biāo)網(wǎng)絡(luò)中的策略網(wǎng)絡(luò)參數(shù)和值網(wǎng)絡(luò)參數(shù)會分別隨著實時網(wǎng)絡(luò)中的策略網(wǎng)絡(luò)參數(shù)和值網(wǎng)絡(luò)參數(shù)進行更新.Gao等[49]提出的一種新的基于深度確定性策略梯度算法的點穩(wěn)定控制律,使移動機器人能夠通過移動機器人與環(huán)境的信息流成功地學(xué)習(xí)機器人的運動控制規(guī)律,該方法提供了一種新的運動控制方法.
手術(shù)機器人固有的非線性和模型的不確定性,使得柔性手術(shù)機器人的運動控制變得具有挑戰(zhàn)性.針對這一問題,Chen等[50]提出了一種將演示編程與強化學(xué)習(xí)相結(jié)合的混合框架,采用高斯混合模型從人體模型中學(xué)習(xí)機械手的逆運動學(xué)模型,而強化學(xué)習(xí)通過實時最大化獎勵函數(shù)來解決不確定環(huán)境下的最優(yōu)決策,結(jié)合強化學(xué)習(xí)算法計算獎勵函數(shù),從而更新模型.設(shè)計過程中,采用基于E-M的強化學(xué)習(xí)算法,同時使用IK模型作為標(biāo)準(zhǔn)模型來計算柔性手術(shù)機器人機械手的輸出軌跡.實驗結(jié)果表明,結(jié)合了基于E-M強化學(xué)習(xí)的標(biāo)準(zhǔn)模型,可以解決非線性和模型不確定性的問題,而且對機械手的運動控制性能良好,所以強化學(xué)習(xí)是解決機器人軌跡控制問題的一種智能方法.人工智能算法用于機器人控制不僅可以解決模型不確定性的軌跡運動控制,而且從圖像的角度來說,同樣可以訓(xùn)練機器人的運動學(xué)習(xí)和高維狀態(tài)動作空間中的位置控制問題.
Wu等[51]讓一個機器人執(zhí)行一次任務(wù)運動來獲取電機和圖像數(shù)據(jù),然后使用卷積自動編碼器從原始圖像數(shù)據(jù)中提取圖像特征,圖像特征提取模塊采用了卷積自動編碼器(Convolutional Auto-Encoder,CAE),其結(jié)構(gòu)如圖14所示.將提取的圖像特征與運動數(shù)據(jù)相結(jié)合,訓(xùn)練遞歸神經(jīng)網(wǎng)絡(luò) (Recurrent Neural Network,RNN),通過對圖像數(shù)據(jù)的深度學(xué)習(xí)來進行運動學(xué)習(xí)(圖15),使得機器人能夠獲取環(huán)境信息,并利用自身被動適應(yīng)的優(yōu)勢來完成需要考慮環(huán)境變化的任務(wù).
圖14 CAE結(jié)構(gòu)[51]Fig.14 Structure of CAE[51]
圖15 利用圖像數(shù)據(jù)的運動學(xué)習(xí)系統(tǒng)[51]Fig.15 Motor learning system[51]
隨著人工智能算法的發(fā)展,將其應(yīng)用到控制算法中是一個新興而熱門的研究方向.機器人的設(shè)計思路是,先物理建模然后對模型設(shè)計控制算法,而具有智能算法的控制器將大大提高機器人的控制精度和工作效率.
本文首先介紹了國內(nèi)外剛?cè)狁詈蠙C器人的研究現(xiàn)狀和研究成果;其次根據(jù)機器人的驅(qū)動器類型,分別介紹了氣動、電活性聚合物、形狀記憶合金等驅(qū)動方式在剛?cè)狁詈蠙C器人上的應(yīng)用;然后著重對機器人的控制方法進行了綜述,從簡單的PID控制到模糊控制再到滑??刂谱詈蟮缴窠?jīng)網(wǎng)絡(luò)控制,并重點介紹深度學(xué)習(xí)和強化學(xué)習(xí)在控制算法中的應(yīng)用.
目前,傳統(tǒng)的剛性機器人和柔性機器人是較為普遍的,而由剛性部件和柔性部件結(jié)合而成的剛?cè)狁詈蠙C器人則是一個新的研究方向,其包括兩個主要研究內(nèi)容:
1)剛?cè)狁詈蠙C器人的建模問題.剛性機器人結(jié)構(gòu)固定,通過D-H模型和齊次變換可以建立各關(guān)節(jié)變量和機器人末端的運動學(xué)模型.雖然軟體機器人通過模型可以建立其構(gòu)型空間和操作空間的轉(zhuǎn)換關(guān)系,但是因其本體的變形是非線性的,各驅(qū)動變量之間又相互耦合,建立驅(qū)動空間和構(gòu)型空間的關(guān)系十分困難.柔性部件的逆運動學(xué)問題很難找到解析解,只能通過數(shù)值分析和非線性優(yōu)化來求解,這對軟體機器人的控制提出了更高的要求.
2)人工智能結(jié)合控制算法的問題.近年來,隨著人工智能技術(shù)的發(fā)展,人工智能中的網(wǎng)絡(luò)架構(gòu)結(jié)合控制算法將會是一個在控制算法領(lǐng)域中的突破,傳統(tǒng)的MLP網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)都已應(yīng)用到神經(jīng)網(wǎng)絡(luò)控制中.深度學(xué)習(xí)和強化學(xué)習(xí)不僅在人工智能領(lǐng)域是個熱門,而且結(jié)合控制算法也將是一個重要的研究方向.目前國內(nèi)外將人工智能算法在機器剛?cè)狁詈蠁栴}上的應(yīng)用研究沒有得到很好的發(fā)展,因此這將是一個新的研究熱點.