雙臂機(jī)器人的協(xié)調(diào)控制算法綜述

2021-01-11 09:11閔華松

計(jì)算機(jī)工程與應(yīng)用 2021年1期

王琪，閔華松

武漢科技大學(xué) 機(jī)器人與智能系統(tǒng)研究院，武漢430080

盡管傳統(tǒng)的單臂機(jī)器人已經(jīng)在工業(yè)領(lǐng)域的各個方面得到了越來越廣泛的應(yīng)用。但是，隨著機(jī)器人應(yīng)用范圍的不斷擴(kuò)大，各種新的操作任務(wù)和工作環(huán)境對機(jī)器人的性能提出了更高的要求。單臂機(jī)器人在操作能力、控制等方面的不足限制了其應(yīng)用。與之相比，擁有協(xié)調(diào)操作能力的雙臂機(jī)器人具有巨大的優(yōu)越性和更廣泛的應(yīng)用場合。尤其面對一些復(fù)雜的操作任務(wù)，例如搬運(yùn)重物、柔性裝配等，雙臂機(jī)器人的優(yōu)勢更加明顯。雙臂機(jī)器人不是兩個單臂機(jī)器人簡單疊加，而是在同一系統(tǒng)中相互配合，雙臂操作相對于單臂操作擴(kuò)展了兩臂之間的配合作用，因此對雙臂操作的規(guī)劃和控制的研究受到了越來越多的關(guān)注。

在人類環(huán)境中，通常需要雙手之間進(jìn)行各種類型的運(yùn)動協(xié)調(diào)，根據(jù)生物力學(xué)的研究（如圖1所示），Park等[1]提出擴(kuò)展-協(xié)作-任務(wù)空間（Extended-Cooperative-Task Space，ECTS）的概念，通過指定兩個運(yùn)動變量（絕對和相對速度變量）和兩個ECTS 系數(shù)（協(xié)調(diào)系數(shù)β 和平衡系數(shù)α）以達(dá)到指定目標(biāo)的期望運(yùn)動，其中β 系數(shù)用于雙臂之間的協(xié)調(diào)，α系數(shù)用來修改協(xié)調(diào)運(yùn)動過程中相對運(yùn)動任務(wù)的分布。雙手操作運(yùn)動大致可分為非協(xié)調(diào)運(yùn)動和協(xié)調(diào)運(yùn)動，協(xié)調(diào)運(yùn)動包括對稱運(yùn)動（如搬運(yùn)物體[2]）和非對稱協(xié)調(diào)運(yùn)動（如孔內(nèi)組裝[3]）。

圖1 雙臂操作分類

雙臂機(jī)器人的協(xié)調(diào)操作任務(wù)也可如此劃分，其中非協(xié)調(diào)操作指機(jī)器人雙臂在同一操作空間內(nèi)分別執(zhí)行各自無關(guān)的任務(wù)，協(xié)調(diào)操作則指機(jī)器人雙臂在同一操作空間內(nèi)執(zhí)行同一或多項(xiàng)相關(guān)操作任務(wù)。與非協(xié)調(diào)操作相比，協(xié)調(diào)操作任務(wù)中機(jī)械臂之間存在更加嚴(yán)格的運(yùn)動約束和力約束，可進(jìn)一步劃分為對稱協(xié)調(diào)操作和非對稱協(xié)調(diào)操作[4]。

（1）非協(xié)調(diào)操作，雙臂獨(dú)立進(jìn)行規(guī)劃操作，相當(dāng)于兩個單臂操作，不考慮雙臂之間的運(yùn)動和力的約束關(guān)系，僅考慮運(yùn)動規(guī)劃中雙臂之間的避障問題。

（2）協(xié)調(diào)操作，需要雙臂同步運(yùn)動，由于雙臂與物體之間的空間關(guān)系，這些操作可進(jìn)一步劃分為：對稱協(xié)調(diào)操作，動約束關(guān)系，且雙臂末端執(zhí)行器之間是相對運(yùn)動的關(guān)系。非對稱協(xié)調(diào)操作，為雙臂操作不同的雙臂操作同一物體，雙臂與被操作物體之間構(gòu)成一個封閉的運(yùn)動鏈，協(xié)調(diào)運(yùn)動過程中雙臂與被操作物體之間始終保持一定的運(yùn)物體。雙臂末端執(zhí)行器不相互接觸，僅存在運(yùn)動約束，例如倒水操作；或有瞬時的碰撞接觸，雙臂末端執(zhí)行器之間存在相對運(yùn)動和力約束關(guān)系，例如軸孔裝配操作。

從控制方式的角度分析，雙臂機(jī)器人協(xié)調(diào)控制可以分為運(yùn)動學(xué)與動力學(xué)控制，基于運(yùn)動學(xué)的協(xié)調(diào)控制集中在機(jī)械臂冗余特性的研究，基于動力學(xué)的協(xié)調(diào)控制集中在機(jī)械臂末端力控制的研究。協(xié)調(diào)運(yùn)動主要包括運(yùn)動學(xué)動力學(xué)模型、雙臂機(jī)器人運(yùn)動中的約束關(guān)系分析、運(yùn)動規(guī)劃策略研究。運(yùn)動學(xué)逆解的求解由于雙臂系統(tǒng)的冗余自由度與單臂運(yùn)動學(xué)有較大差異，雙臂構(gòu)型不同也決定了逆解求解方法的差異性，逆解的不確定性也影響了動力學(xué)模型的建立方式，雙臂運(yùn)動速度、加速度的變化與末端相對力的差異，因此對雙臂系統(tǒng)運(yùn)動學(xué)和動力學(xué)模型建立方式的不同，雙臂協(xié)調(diào)運(yùn)動控制的方式也不同。力控制方式主要包括主從控制、位置/力控制、阻抗控制以及自適應(yīng)控制方法等。在非結(jié)構(gòu)化環(huán)境下，雙臂機(jī)器人系統(tǒng)無法獲取運(yùn)動學(xué)、動力學(xué)的全部信息，機(jī)器人如何感知外部環(huán)境，包括操作對象的位置、速度、接觸力等參數(shù)，以及外部環(huán)境信息如何參與雙臂協(xié)調(diào)控制成為新的研究熱點(diǎn)。正是由于傳感器研究的進(jìn)步，發(fā)現(xiàn)不僅外部環(huán)境信息可以獲得，人類雙手操作也可以作為參考應(yīng)用到雙臂協(xié)調(diào)控制中，即模仿學(xué)習(xí)，這種學(xué)習(xí)方式極大地提高了雙臂操作的擬人性。人類不斷參與到雙臂協(xié)調(diào)控制過程中，以交互的方式進(jìn)行技能傳遞，人/機(jī)器人根據(jù)交互反饋信息對其運(yùn)動進(jìn)行修正，以滿足不同的任務(wù)要求。

本文針對近年來雙臂機(jī)器人協(xié)調(diào)控制算法的主要研究展開討論，整體框架如圖2 所示，分別從協(xié)調(diào)運(yùn)動的控制方式、感知傳感器的集成，特別是視覺傳感器在雙臂研究中的應(yīng)用，模仿學(xué)習(xí)中如何體現(xiàn)雙臂操作的擬人性，人機(jī)交互協(xié)作控制，最后總結(jié)全文研究內(nèi)容，并闡述目前研究的不足以及未來展望方向。

圖2 整體框架圖

1 協(xié)調(diào)運(yùn)動方式

1.1 運(yùn)動學(xué)和動力學(xué)研究現(xiàn)狀

冗余自由度給機(jī)器人運(yùn)動學(xué)逆解求解帶來了不確定性，即末端位姿確定時，雙臂各關(guān)節(jié)的位姿具有不唯一性。逆運(yùn)動學(xué)求解問題，可以使用數(shù)值法或解析法來解決。利用冗余自由度優(yōu)化機(jī)械臂的運(yùn)動即數(shù)值求解法，在雅克比矩陣的零空間中考慮子任務(wù)，常見的優(yōu)化目標(biāo)函數(shù)有增強(qiáng)可操作度、避關(guān)節(jié)極限和避奇異位形。Zheng等[5]提出了一種基于位置的閉環(huán)逆運(yùn)動學(xué)（CLIK）算法，利用偽逆矩陣求解數(shù)值解，采用位置+速度方案，同時考慮了期望的姿態(tài)限制，能避免奇異點(diǎn)的影響。

解析求解法，對冗余自由度進(jìn)行參數(shù)化，基于該參數(shù)建立額外的任務(wù)約束，從而消除冗余性，保證運(yùn)動的唯一解。一種是直接指定一個冗余關(guān)節(jié)角作為冗余變量，推導(dǎo)剩余關(guān)節(jié)的封閉解法，另一種是通過引用其他變量來反映冗余特性，推導(dǎo)各關(guān)節(jié)角相對于引用變量的封閉解法。對擬人機(jī)械臂的冗余自由度的參數(shù)化一般考慮機(jī)械臂的生理特性，從宏觀上描述擬人臂的臂形。Oh等[6]通過臂角限制冗余度，考慮聯(lián)合極限、自碰撞、奇異性等子任務(wù)的冗余問題的求解方法，即通過引入臂角的單變量優(yōu)化問題求解。從各子任務(wù)可行臂角中選擇能量消耗最小的最優(yōu)解，只考慮臂角這個變量。基于對偶臂角參數(shù)化的解析解法，Yan 等[7]利用兩個正交向量作為兩個參考向量，定義兩個絕對參考平面，得到了滿足一定條件的兩個臂角，由于腕部點(diǎn)不能同時位于兩個參考矢量上，所以至少存在一個合理的參考平面和一個對應(yīng)的臂角，可以作為冗余參數(shù)，算法避免了奇異性問題。Zou等[8]通過定義臂角為附加約束參數(shù)來控制關(guān)節(jié)空間中的雙臂，能夠保證擬人雙臂機(jī)器人執(zhí)行同一目標(biāo)時運(yùn)動的一致性。為了得到冗余機(jī)器人的最優(yōu)解，需要添加附加約束，Jin等[9]將解析法與數(shù)值法結(jié)合的思想應(yīng)用于機(jī)器人的逆運(yùn)動學(xué)求解，提高算法效率，通過優(yōu)化算法確定肘關(guān)節(jié)的運(yùn)動方向。

采用傳統(tǒng)的數(shù)值法或解析法存在耗時較長、通用性較差等缺點(diǎn)，啟發(fā)式算法用于不同機(jī)械手的逆運(yùn)動學(xué)求解優(yōu)化問題，如神經(jīng)網(wǎng)絡(luò)算法[10]、差分進(jìn)化算法[11]、人工蜂群算法[12]、粒子群優(yōu)化[13]、螢火蟲算法[14]等，這種算法不需要對雅可比矩陣進(jìn)行求逆，避免了奇異點(diǎn)構(gòu)型。

Almusawi 等[10]提出了基于人工神經(jīng)網(wǎng)絡(luò)（ANN）的逆運(yùn)動學(xué)控制方案，將機(jī)械臂當(dāng)前關(guān)節(jié)角度配置的反饋以及所需的位置和定向包含到神經(jīng)網(wǎng)絡(luò)的輸入模式中，可以提高ANN 在估算關(guān)節(jié)角度輸出的準(zhǔn)確性。Antonio-Gopar 等[11]基于差分進(jìn)化算法（DE），找到冗余臂的最優(yōu)構(gòu)型，解決了末端執(zhí)行器姿態(tài)的估計(jì)問題。Dereli等[12]提出基于人工蜂群算法（ABC）計(jì)算運(yùn)動學(xué)逆解，得到最優(yōu)關(guān)節(jié)角。Alkayyali 等[13]利用粒子群算法（PSO）通過搜索六維空間來生成運(yùn)動學(xué)逆解，利用正運(yùn)動學(xué)來構(gòu)造末端執(zhí)行器姿態(tài)，目標(biāo)是找到最優(yōu)的關(guān)節(jié)角。利用多目標(biāo)適應(yīng)度函數(shù)來測量所生成解的位置和方向誤差，該算法能有效地解決末端執(zhí)行器位姿誤差最小的逆運(yùn)動學(xué)問題。為了找到一個以上的解，可以將逆運(yùn)動學(xué)作為多模態(tài)約束優(yōu)化問題，找到全局最優(yōu)和多個局部最優(yōu)，這些多重解代表了逆運(yùn)動學(xué)解的多重?zé)o碰撞關(guān)節(jié)構(gòu)型，Hernandez 等[14]基于螢火蟲算法（FA）為逆運(yùn)動學(xué)問題提供一個或多個解。

雙臂協(xié)調(diào)動力學(xué)模型[15]主要有兩種：一是兩臂捕捉目標(biāo)物體形成閉鏈系統(tǒng)的研究。利用目標(biāo)物體與機(jī)械臂之間相互作用力形成閉環(huán)約束關(guān)系，建立目標(biāo)物體與機(jī)械臂的聯(lián)系，主要分析夾持物體運(yùn)動的作用力和夾持內(nèi)力。二是兩機(jī)械臂末端相對力的研究。將雙臂末端的相對運(yùn)動視為單機(jī)械臂的運(yùn)動，基于單機(jī)械臂動力學(xué)模型求解兩機(jī)械臂末端絕對運(yùn)動參數(shù)，主要分析兩臂末端接觸瞬間作用力與操作物體裝配時接觸碰撞力，目前相關(guān)研究較少，建立的模型不完善。

1.2 雙臂約束關(guān)系

當(dāng)單臂系統(tǒng)的自由度n（關(guān)節(jié)數(shù)目）大于執(zhí)行給定任務(wù)所需的變量m（任務(wù)的維數(shù)）時，被定義為運(yùn)動學(xué)冗余，即n＞m。由于雙臂系統(tǒng)是兩個單臂系統(tǒng)操縱一個剛性物體形成一個閉環(huán)的運(yùn)動鏈，雙臂系統(tǒng)的自由度變?yōu)?n，因此雙臂系統(tǒng)被認(rèn)為是冗余的，其中任務(wù)的維數(shù)通常為操作物的運(yùn)動變量維數(shù)（位置和姿態(tài)，6DOF）。但雙臂機(jī)器人相比于單臂機(jī)器人在本質(zhì)上的區(qū)別是雙臂具有其固有的協(xié)調(diào)特性，即雙臂之間存在一定的約束關(guān)系，如圖3所示。

圖3 閉鏈系統(tǒng)

根據(jù)坐標(biāo)變換關(guān)系可得兩臂末端執(zhí)行器和操作物質(zhì)心相對于坐標(biāo)原點(diǎn)的變換矩陣為：

由于不考慮兩臂之間的相對運(yùn)動，雙臂末端速度相等，由式（3）（4）可以得到兩臂末端的速度約束關(guān)系：

式中，J(qL)、J(qR)分別表示左臂和右臂的雅可比矩陣，Jv(q)、Jw(q)分別表示機(jī)械臂的位置雅可比矩陣和姿態(tài)雅可比矩陣。

保持雙臂系統(tǒng)的協(xié)調(diào)操作中的一種常用方法是相對雅克比矩陣[16]，該方法允許將雙臂系統(tǒng)考慮為唯一的冗余機(jī)械手，其關(guān)節(jié)數(shù)量等于每個機(jī)械手相對關(guān)節(jié)的總和。此外，用相對雅可比矩陣建模的雙臂系統(tǒng)可以用與單臂系統(tǒng)相同的算法進(jìn)行控制。然后，將相對雅可比矩陣推廣到雅克比零空間保護(hù)中，以實(shí)現(xiàn)協(xié)同任務(wù)。

雙臂機(jī)器人非對稱協(xié)調(diào)示意圖如圖4所示，在非對稱協(xié)調(diào)操作任務(wù)中，需要實(shí)現(xiàn)兩個末端執(zhí)行器的位姿協(xié)調(diào)，在接觸力的作用下調(diào)節(jié)兩個末端執(zhí)行器的相對跟蹤誤差[17]，以實(shí)現(xiàn)目標(biāo)期望軌跡的跟蹤。假設(shè)左右臂分別夾住物體，運(yùn)動過程中末端執(zhí)行器與各自物體之間沒有相對運(yùn)動，從而整個系統(tǒng)形成閉環(huán)運(yùn)動學(xué)。其中所需位置顯示為虛線，實(shí)際位置顯示為實(shí)線，ΔeR和ΔeL表示雙臂末端在Y-Z平面上跟蹤誤差（期望軌跡與實(shí)際軌跡之差）的控制域，Δe表示雙臂末端在Y-Z平面上的最大相對誤差域（主臂實(shí)際軌跡根據(jù)雙臂間約束關(guān)系得到的從臂期望軌跡與從臂實(shí)際軌跡之差），Δe=ΔeR+ΔeL。

圖4 雙臂非對稱協(xié)調(diào)坐標(biāo)圖

非對稱協(xié)調(diào)操作任務(wù)需要在工作空間進(jìn)行任務(wù)分解，每個手臂在任務(wù)空間中執(zhí)行各自的子任務(wù)，而雙臂運(yùn)動受到協(xié)調(diào)約束，即兩個末端執(zhí)行器按照期望軌跡控制兩個操作物實(shí)現(xiàn)位置和姿態(tài)對齊。從運(yùn)動規(guī)劃的角度看，非對稱協(xié)調(diào)的關(guān)鍵問題是如何分解單臂和雙臂的運(yùn)動約束，然后根據(jù)約束條件，左右臂按照各自規(guī)劃的運(yùn)動軌跡達(dá)到期望位姿。

1.3 雙臂協(xié)調(diào)運(yùn)動規(guī)劃方法

雙臂的運(yùn)動規(guī)劃是雙臂控制的基礎(chǔ)，目前的雙臂協(xié)作運(yùn)動規(guī)劃方法主要有主從式運(yùn)動規(guī)劃、基于避障策略的運(yùn)動規(guī)劃、多優(yōu)先級運(yùn)動規(guī)劃以及其他規(guī)劃方法。

Wang等[18]將機(jī)器人和被操作對象視為閉合運(yùn)動學(xué)鏈，提出了任務(wù)的運(yùn)動和力的統(tǒng)一動態(tài)控制方法，分為獨(dú)立模式、從屬模式和半從屬模式三種。

申浩宇等[19]引入用于描述協(xié)調(diào)操作任務(wù)的絕對位姿變量和相對位姿變量，構(gòu)造雅克比矩陣，根據(jù)實(shí)時最小距離的變化實(shí)現(xiàn)雙臂末端的軌跡跟蹤和避障運(yùn)動之間的主從任務(wù)優(yōu)先級轉(zhuǎn)換。王巍等[20]基于虛擬力的改進(jìn)方法，采用修改引力場函數(shù)方法調(diào)整雙機(jī)械臂運(yùn)動規(guī)劃中的位置，完成避障運(yùn)動規(guī)劃。王安琪等[21]利用構(gòu)形平面的方法，通過空間矢量引導(dǎo)、避障路徑的比較，實(shí)現(xiàn)多目標(biāo)冗余機(jī)械臂空間軌跡規(guī)劃方法。

Hu等[22]基于任務(wù)層優(yōu)先級關(guān)系之間的協(xié)調(diào)提出了一種相對雅可比矩陣方法，將兩個機(jī)械臂等價(jià)成一個高冗余度的機(jī)械臂，通過相對雅可比矩陣和末端相對速度分量，求出兩條機(jī)械臂的關(guān)節(jié)角。

Tang 等[23]采用深度確定性策略梯度（DDPG）算法通過誤差訓(xùn)練模型來優(yōu)化其規(guī)劃策略以得到最優(yōu)路徑，并能保證優(yōu)化策略的規(guī)劃效率。Wang等[24]提出基于約束粒子群優(yōu)化（PSO）算法，解決了在自由漂浮模式下雙臂空間機(jī)器人的協(xié)調(diào)軌跡規(guī)劃問題，避免了動態(tài)奇點(diǎn)。魏源鑫[25]采用神經(jīng)網(wǎng)絡(luò)算法更新障礙物信息，獲得目標(biāo)點(diǎn)與障礙物關(guān)系，分離各關(guān)節(jié)變量，使用混合交叉粒子群算法規(guī)劃局部路徑，得到局部最優(yōu)解。熊志金等[26]采用RBF神經(jīng)網(wǎng)絡(luò)算法對滑?？刂破鬏敵稣`差進(jìn)行逼近，用于控制冗余機(jī)械臂運(yùn)動軌跡。Wu等[27]提出了一種具有兩個隱藏層的前饋神經(jīng)網(wǎng)絡(luò)的無模型強(qiáng)化學(xué)習(xí)策略，通過模擬環(huán)境中的在線軌跡規(guī)劃實(shí)驗(yàn)將狀態(tài)映射到動作，應(yīng)用于空間機(jī)器人快速調(diào)度和執(zhí)行動作。

2 控制方式

移動雙臂機(jī)器人為了實(shí)現(xiàn)更為靈活的操作，其雙臂系統(tǒng)一般有14 個以上自由度，是一個高維度高冗余的系統(tǒng)，雙臂系統(tǒng)具有其固有的協(xié)調(diào)特性，即雙臂之間存在一定的運(yùn)動約束關(guān)系，因此其運(yùn)動學(xué)逆解計(jì)算較為復(fù)雜。有兩種思路用來解決雙臂的控制問題，一種思路是將雙臂建立為完整統(tǒng)一的封閉運(yùn)動鏈，另一種思路是采用主從控制的方式，將其中一條臂作為主臂，另一條臂作為從臂進(jìn)行分別控制。

統(tǒng)一封閉運(yùn)動鏈的控制方式，基本采用基于概率的搜索方法來進(jìn)行處理。Yang 等[28]基于近似雅可比矩陣（AJM）和自適應(yīng)模糊邏輯系統(tǒng)（FLS）方案，使得雙臂機(jī)器人在動態(tài)不確定性環(huán)境下可以得到很好控制。這類方法比較好沿用單機(jī)械臂基于采樣的搜索算法，但是缺點(diǎn)也較為明顯，高維度高冗余運(yùn)動鏈的計(jì)算過程十分復(fù)雜，而且容易出現(xiàn)運(yùn)動奇點(diǎn)[29]。

2.1 主從控制

對于雙臂協(xié)調(diào)操作，更常用的方法是主從控制方式[1]，這種方法的原理是將一條機(jī)械臂設(shè)為主臂（Master），另一條機(jī)械臂設(shè)為從臂（Slaver）。根據(jù)控制目標(biāo)預(yù)先規(guī)劃主臂的運(yùn)動軌跡，從臂跟隨主臂運(yùn)動，主從臂滿足一定的約束關(guān)系，根據(jù)運(yùn)動約束關(guān)系推導(dǎo)從臂運(yùn)動軌跡。

Gharbi等[30]根據(jù)雙臂末端約束條件，在初始位置和目標(biāo)位置之間構(gòu)成多個流形，使用概率路線圖算法（Probabilistic Road Map，PRM）在這些流形中搜索一條連續(xù)的軌跡，缺點(diǎn)就是規(guī)劃時間較長，生成的末端軌跡不光滑。Liu 等[31]以雙臂搬運(yùn)方塊為研究對象，在雙臂末端與物體之間分別設(shè)置位置約束、速度約束和加速度約束進(jìn)行優(yōu)化，以減小在運(yùn)動過程中雙臂與物體之間產(chǎn)生的內(nèi)力，實(shí)現(xiàn)了雙臂協(xié)調(diào)運(yùn)動分解，實(shí)時補(bǔ)償了運(yùn)動誤差，這種方法由于較強(qiáng)的約束導(dǎo)致雙臂運(yùn)動范圍極其有限。

Cohen 等[32-33]在高維度空間采用啟發(fā)式搜索算法，利用雙臂構(gòu)造搜索空間后，采用Anytime Repairing A*算法進(jìn)行搜索得到雙臂協(xié)調(diào)的軌跡。該方法雖然解決了雙臂末端軌跡光滑問題，但雙臂關(guān)節(jié)運(yùn)動軌跡仍不太光滑，有時會產(chǎn)生抖動現(xiàn)象。

對于孔內(nèi)裝配任務(wù)，Huang 等[3]受人類在組裝過程中協(xié)調(diào)行為的啟發(fā)，提出基于機(jī)器人左右臂交替移動的主從協(xié)調(diào)控制方案，固定臂和移動臂分別為從動臂和主動臂。

主從式控制方法，其從臂是通過傳感器或根據(jù)主從臂約束關(guān)系來跟蹤、輔助主臂的運(yùn)動規(guī)律，這就要求從臂能夠具有快速的響應(yīng)速度。在機(jī)器人運(yùn)動速度較低、操作對象不易變形的情況下控制效果較好，適合于復(fù)雜度較低的工作，但是沒有直接采用雙臂同時從被操作物體的目標(biāo)運(yùn)動軌跡，結(jié)合逆運(yùn)動學(xué)封閉算法進(jìn)行運(yùn)動規(guī)劃來得直觀和有效。此外該方法是基于運(yùn)動學(xué)模型的控制方法，沒有考慮機(jī)器人質(zhì)量、慣性參量等對機(jī)器人實(shí)際運(yùn)動的影響。容易因?yàn)樗惴ㄌ幚硭俣?、效率不高等問題帶來從臂獲取信息延遲現(xiàn)象，控制不當(dāng)會導(dǎo)致雙臂系統(tǒng)不穩(wěn)定。因此對主臂僅采用位置控制難以完成雙臂協(xié)調(diào)操作任務(wù)，雙臂協(xié)調(diào)操作需要雙臂末端執(zhí)行器都進(jìn)行作用力控制，力控制可以用來解決在運(yùn)動過程中從臂可能滯后主臂的問題。

2.2 位置/力控制

混合位置/力控制改善了主從控制方法的不足，同時考慮位置和力控制的雙重特性。位置/力控制方法是基于末端執(zhí)行器的坐標(biāo)空間（任務(wù)空間），按其是否被環(huán)境約束而分為位置控制子空間和力控制子空間，兩個子空間獨(dú)立控制，雙臂均采用位置/力控制，在自由空間采用位置控制，在約束空間采用力控制。并根據(jù)不同的任務(wù)要求，通過實(shí)時切換控制律使機(jī)械臂在兩個子空間內(nèi)進(jìn)行切換，使得運(yùn)動時實(shí)現(xiàn)位置控制，在接觸物體時實(shí)現(xiàn)力控制。由于機(jī)械臂末端執(zhí)行器與操作對象之間的作用力屬于整個操作系統(tǒng)的內(nèi)力，只要末端執(zhí)行器的位置不變，內(nèi)力的大小并不能改變被操作物體的位置。位置/力控制方法通過控制末端執(zhí)行器在位置子空間的位置和在力子空間的力來實(shí)現(xiàn)順應(yīng)控制，這種方法的優(yōu)點(diǎn)是可以分別設(shè)計(jì)雙臂協(xié)調(diào)操作系統(tǒng)的位置控制環(huán)和力控制環(huán)，較好地控制末端執(zhí)行器的位置和物體間的相互作用力，使得機(jī)器人能勝任零件裝配等復(fù)雜作業(yè)。

經(jīng)典的位置/力協(xié)調(diào)控制策略框圖如圖5所示，其中引入“選擇矩陣”將任務(wù)空間正交解耦為位置自由子空間和力約束子空間，設(shè)S 為位置自由子空間選擇矩陣，I-S 為力約束子空間選擇矩陣，系統(tǒng)的輸入為被操作對象的期望位置和期望力。

圖5 位置/力協(xié)調(diào)控制框圖

王美玲[34]將雙臂協(xié)調(diào)操作分為雙臂獨(dú)立、雙臂部分約束和雙臂全約束這三種情況，分別給出了雙臂之間、雙臂與被操作物體之間的相對位姿約束關(guān)系和動力學(xué)約束關(guān)系。這種主從控制方式，將物體設(shè)為Master，雙臂設(shè)為Slaver，在雙臂末端安裝六維力矩傳感器，針對雙臂協(xié)調(diào)系統(tǒng)組成的動力學(xué)耦合問題，根據(jù)任務(wù)使用最小范數(shù)和加權(quán)偽逆對雙臂內(nèi)力進(jìn)行分配，在動力學(xué)層面上可以提高雙臂協(xié)調(diào)的效果。力分配后，采用阻抗控制進(jìn)行力控制，這種控制方法屬于主動控制方法，控制效果依賴于精確的檢測。如果采用關(guān)節(jié)扭矩傳感器，會極大增加成本，而僅采用末端六維力矩傳感器，會存在模型不精確和非線性等問題難以解決，尋找一種低成高檢測精度的機(jī)械臂力控制方法尤為重要。

段晉軍等[35]將任務(wù)空間正交解耦為外環(huán)的位置自由子空間和內(nèi)環(huán)的力約束子空間，對位置子空間中的外部干擾采用阻抗模型進(jìn)行軌跡跟蹤，對于力約束空間中的內(nèi)力約束采用變阻抗模型進(jìn)行力跟蹤，有效地解決了雙臂協(xié)調(diào)搬運(yùn)過程中同時存在外部干擾和內(nèi)力約束的問題。

該控制方式在協(xié)調(diào)任務(wù)中需要不斷地在不同的控制空間中進(jìn)行切換，在自由空間向約束空間過渡過程中不能保證系統(tǒng)的柔順性，難以在高效的場合中使用。而且，控制過程中所選矩陣的切換會導(dǎo)致系統(tǒng)穩(wěn)定性問題，且對外部干擾的抑制能力較差。另外該控制方式適用于力矩接口控制的機(jī)器人，而大部分工業(yè)機(jī)器人并沒有提供力矩接口，因此并不適用于現(xiàn)有的控制系統(tǒng)。

2.3 阻抗控制

結(jié)合環(huán)境約束對雙臂機(jī)器人協(xié)調(diào)操作帶來的影響，阻抗控制方法可以被應(yīng)用到雙臂機(jī)器人協(xié)調(diào)控制中[36-37]，通過雙臂末端點(diǎn)位置和力的變換關(guān)系實(shí)現(xiàn)期望的運(yùn)動控制。阻抗控制將機(jī)械臂等效為一個阻抗控制約束模型，即通過調(diào)節(jié)末端執(zhí)行器的位置和接觸力以及力矩之間的動態(tài)關(guān)系[38]來描述當(dāng)前的控制模型，深層次實(shí)現(xiàn)雙臂的順應(yīng)控制。這種方法實(shí)現(xiàn)了軌跡跟蹤控制和力控制中的動態(tài)統(tǒng)一關(guān)系，適用于在線規(guī)劃，對系統(tǒng)擾動和環(huán)境不確定性有很好的魯棒性，能實(shí)現(xiàn)系統(tǒng)由無約束到有約束運(yùn)動的穩(wěn)定轉(zhuǎn)換，因此被認(rèn)為更適合裝配工作。

機(jī)器人末端接觸力偏差與位置偏差之間的關(guān)系稱為期望阻抗模型，設(shè)e,e˙,e¨ ∈Rm表示末端執(zhí)行器的實(shí)際軌跡與期望軌跡之間的位置、速度和加速度的跟蹤誤差，Md表示笛卡爾空間中機(jī)械臂阻抗系統(tǒng)的目標(biāo)慣性矩，Bd表示阻抗系統(tǒng)的阻尼矩陣，Kd表示阻抗系統(tǒng)的剛度系數(shù)矩陣，F(xiàn)是環(huán)境對末端執(zhí)行器施加的力/末端的期望接觸力和實(shí)際接觸力之差，一般采用式（7）的線性二階微分方程，可以得到阻抗關(guān)系。

由此可得位置偏差與力偏差之間的對應(yīng)關(guān)系為：

阻抗控制根據(jù)任務(wù)空間的不同分為關(guān)節(jié)空間阻抗控制以及笛卡爾空間阻抗控制。按照控制系統(tǒng)內(nèi)環(huán)回路的不同可以分為基于力矩的阻抗控制（TBIC）和基于位置的阻抗控制（PBIC）[39]，又可分別簡稱為阻抗控制和導(dǎo)納控制。基于力的阻抗控制是通過控制關(guān)節(jié)驅(qū)動力矩來實(shí)現(xiàn)對末端接觸力與位移之間動態(tài)關(guān)系的調(diào)整，其本質(zhì)是基于位置反饋的力控制器；而基于位置的阻抗控制是根據(jù)機(jī)器人與環(huán)境的接觸力偏差調(diào)整機(jī)器人末端的位置/速度偏差來實(shí)現(xiàn)，其本質(zhì)是基于力反饋的位置控制器。

2.3.1 基于力的阻抗控制方法

基于力的阻抗控制由力控制內(nèi)環(huán)和阻抗控制外環(huán)組成，其基本框架如圖6 所示，力指末端與環(huán)境的接觸力，力矩指關(guān)節(jié)中可控的力矩輸入。這種方法實(shí)時檢測機(jī)器人末端位置和接觸力，控制系統(tǒng)外環(huán)為阻抗計(jì)算環(huán)節(jié)，根據(jù)機(jī)器人實(shí)際位置x和期望位置xr之間偏差e通過期望阻抗特性Gd(s)計(jì)算出期望力，末端與環(huán)境之間的接觸力通過力控制內(nèi)環(huán)使得實(shí)際作用力跟蹤期望力，從而實(shí)現(xiàn)期望阻抗動力學(xué)特性。其中使用機(jī)器人動力學(xué)模型作為前饋輸入，實(shí)現(xiàn)的是前向阻抗方程，這種控制策略基于精確的機(jī)器人動力學(xué)模型，以實(shí)現(xiàn)期望的阻抗模型和接觸力精確控制。

圖6 基于力矩的阻抗控制框圖

2.3.2 基于位置的阻抗控制方法

基于位置的阻抗控制由位置控制內(nèi)環(huán)和阻抗控制外環(huán)組成，其基本框架如圖7 所示，通過機(jī)械臂末端力傳感器檢測機(jī)器人末端與環(huán)境的實(shí)際交互力F，并對比期望力Fr得到力偏差，阻抗控制外環(huán)通過期望阻抗特性計(jì)算出位置偏差的修正量Δx，將期望位置xr、實(shí)際位置x和位置修正量Δx同時輸入到位置控制內(nèi)環(huán)，使得末端的實(shí)際位置跟蹤期望位置，從而實(shí)現(xiàn)期望的軌跡跟蹤柔順控制。

圖7 基于位置的阻抗控制框圖

這種方法不依賴于動力學(xué)模型。由于位置控制器的大增益會帶來關(guān)節(jié)的高剛度，這種方法的缺點(diǎn)是當(dāng)機(jī)器人的實(shí)際位置和模型理想位置矢量不同時將帶來大的阻抗誤差，從而將這種方法限制在簡單任務(wù)中。

阻抗控制方法是通過調(diào)解阻抗參數(shù)以維持機(jī)器人末端的位置與環(huán)境接觸力之間的動態(tài)關(guān)系來實(shí)現(xiàn)雙臂協(xié)調(diào)控制。這種方法需要精確的機(jī)械臂動力學(xué)模型和復(fù)雜的動力學(xué)計(jì)算，末端接觸力的大小取決于末端執(zhí)行器的參考軌跡、環(huán)境的位置和剛度等參數(shù)，而這些參數(shù)在實(shí)際中難以準(zhǔn)確獲得且隨著環(huán)境變化需要實(shí)時修正，從而無法準(zhǔn)確實(shí)現(xiàn)位置和力的控制。所以阻抗控制方法實(shí)現(xiàn)的困難在于需要精確的了解環(huán)境信息，如果在機(jī)械臂末端安裝力傳感器，控制器能檢測出末端執(zhí)行器和被操作物體的接觸狀態(tài)，可以使得機(jī)器人在不確定的環(huán)境下實(shí)行與環(huán)境相應(yīng)的控制，這稱為柔順（compliance）控制。

2.3.3 基于改進(jìn)阻抗控制方法

傳統(tǒng)的阻抗控制與其他智能方法[38-42]結(jié)合，如阻抗控制與自適應(yīng)控制、神經(jīng)網(wǎng)絡(luò)、學(xué)習(xí)控制等方法結(jié)合。

阻抗控制調(diào)節(jié)機(jī)器人與環(huán)境之間的相互作用力，為了減少阻抗控制參數(shù)對未知環(huán)境阻抗模型和機(jī)器人動力學(xué)模型的依賴，提出了自適應(yīng)阻抗控制方法。Li等[40]考慮了人機(jī)協(xié)作過程中的接觸力，基于強(qiáng)化學(xué)習(xí)提出自適應(yīng)阻抗控制策略，通過線性二次調(diào)節(jié)（LQR），最小化運(yùn)動跟蹤誤差并獲得最佳的人體阻抗模型，最優(yōu)阻抗參數(shù)在不同的人機(jī)交互任務(wù)中根據(jù)不同的交互作用力變化，從而以最佳性能和接觸力輔助操作員執(zhí)行人機(jī)協(xié)作任務(wù)。Duan 等[41]采用面向?qū)ο蟮碾p臂合作機(jī)器人運(yùn)動規(guī)劃方法，通過閉環(huán)約束計(jì)算系統(tǒng)中單臂的運(yùn)動。將物體上的力分解為外力和內(nèi)力，通過負(fù)載分配策略將力轉(zhuǎn)換到末端執(zhí)行器，為了跟蹤所期望的位置和力，提出基于跟蹤誤差在線調(diào)整導(dǎo)納參數(shù)來補(bǔ)償未知軌跡偏差的雙臂協(xié)調(diào)對稱自適應(yīng)導(dǎo)納控制。基于阻抗控制的自適應(yīng)控制方法優(yōu)勢在于能夠在控制對象參數(shù)或自身工作狀態(tài)變化時自動修改系統(tǒng)參數(shù)來適應(yīng)這種變化，在一定程度上實(shí)現(xiàn)了機(jī)器人與環(huán)境的高效交互，但這種自適應(yīng)能力并不是交互控制最優(yōu)的解決方案，在高復(fù)雜度、強(qiáng)耦合、非線性時變系統(tǒng)中計(jì)算復(fù)雜，比較難以滿足實(shí)時性要求。

神經(jīng)網(wǎng)絡(luò)無需建立精確模型，其強(qiáng)魯棒性能夠有效地逼近未知量和非線性函數(shù)，可用于解決機(jī)器人與環(huán)境交互過程中的不確定因素。He等[42]提出了自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法來識別不確定參數(shù)，引入了阻抗學(xué)習(xí)實(shí)現(xiàn)機(jī)器人與環(huán)境的期望交互目標(biāo)。

與阻抗控制相結(jié)合的學(xué)習(xí)控制方法有迭代學(xué)習(xí)和強(qiáng)化學(xué)習(xí)等。人機(jī)物理交互中的阻抗控制，阻抗參數(shù)需要根據(jù)人類的動態(tài)行為調(diào)整，Li等[43]采用迭代學(xué)習(xí)控制（ILC）進(jìn)行阻抗參數(shù)的學(xué)習(xí)，并采用一種新的迭代長度一致的方法來處理迭代長度的變化。李超等[44]提出強(qiáng)化學(xué)習(xí)算法用于變阻抗控制最優(yōu)調(diào)節(jié)策略，使用高斯過程模型作為系統(tǒng)的動力學(xué)模型，允許概率化的推理與規(guī)劃，減少了交互次數(shù)與時間。

2.3.4 雙臂協(xié)調(diào)阻抗控制方法

在雙臂阻抗控制中，雙臂間由于約束關(guān)系會產(chǎn)生雙臂間的相對誤差，e*,e˙*,e¨*∈Rm表示兩個末端執(zhí)行器之間位置、速度和加速度的相對誤差，空間并聯(lián)彈簧和一端執(zhí)行器阻尼的模型如圖8所示[45]，Bd*、Kd*表示左臂（右臂）的相對阻尼-剛度系數(shù)，雙臂間的阻抗關(guān)系式為：

圖8 空間并聯(lián)彈簧和阻尼模型

齊春麗等[46]引入變加權(quán)矩陣求得最優(yōu)抓取矩陣，設(shè)計(jì)基于雙臂廣義動量的擾動觀測器觀測外部擾動力矩，以合理分配載荷，減小協(xié)調(diào)操作時操作物的跟蹤誤差。Zhang等[45]將雙臂非對稱協(xié)調(diào)控制分為主要任務(wù)和次要任務(wù)，主要任務(wù)在笛卡爾空間末端執(zhí)行器位置/力控制（末端執(zhí)行器的跟蹤誤差、兩個物體之間的相對誤差和兩個末端執(zhí)行器的接觸力之間的阻抗關(guān)系），次要任務(wù)在零空間冗余關(guān)節(jié)運(yùn)動的控制（建立零跟蹤誤差與零接觸力之間的阻抗關(guān)系），雙臂間協(xié)調(diào)阻抗關(guān)系圖如圖9所示。在笛卡爾位置誤差和笛卡爾力之間建立質(zhì)量-阻尼-彈簧關(guān)系，然后通過阻抗關(guān)系[47]和機(jī)器人動力學(xué)模型，將笛卡爾力轉(zhuǎn)化為所需的關(guān)節(jié)扭矩，從而得到機(jī)器人關(guān)節(jié)電機(jī)的目標(biāo)轉(zhuǎn)矩。在兩臂與物體之間建立虛擬空間彈簧與阻尼模型[48]，通過阻抗模型將力偏差轉(zhuǎn)化為運(yùn)動偏差，在雙臂協(xié)調(diào)阻抗中引入多優(yōu)先級控制，實(shí)現(xiàn)基于位置的相對力/阻抗控制。類似方法也有在雙臂外骨骼方面的研究，Li等[49]提出在交互過程中反映的肌肉力量被用來檢測人體操作者動作的意圖，提出阻抗參數(shù)近似的方法，通過瞬時測量力和雙臂末端執(zhí)行器的位置來估計(jì)可變剛度，考慮位置和速度約束，實(shí)現(xiàn)了一種雙臂阻抗參數(shù)自適應(yīng)在線估計(jì)控制方法。

圖9 雙臂協(xié)調(diào)阻抗關(guān)系圖

Huang等[50]提出人體阻抗轉(zhuǎn)移控制與自適應(yīng)控制結(jié)合來控制雙臂康復(fù)外骨骼機(jī)器人的魯棒協(xié)調(diào)控制方案，主臂提取阻抗剛度和位置輪廓，優(yōu)勢對抗性肌肉對的肌肉活動被用來解決手臂端點(diǎn)僵硬行為的有效計(jì)算模型。Shiratot 等[51]通過檢測操作員手部運(yùn)動的時間序列變化來估計(jì)操作員的任務(wù)類型，基于阻抗控制執(zhí)行相應(yīng)的輔助控制。Yan等[52]為雙臂機(jī)器人開發(fā)了一種協(xié)調(diào)控制方法，利用阻抗控制實(shí)現(xiàn)所需軌跡和內(nèi)力的精確跟蹤。該控制器不僅考慮了末端執(zhí)行器與目標(biāo)的阻抗關(guān)系，還考慮了目標(biāo)與環(huán)境的阻抗關(guān)系，實(shí)現(xiàn)了兩種順應(yīng)控制方法：主從力控制策略與共享力控制策略。Yang等[53]充分考慮了人的阻抗特性，監(jiān)測人體的上肢肌肉活動，實(shí)時提取可變剛度，并將估計(jì)的人體手臂端點(diǎn)剛度映射到機(jī)器人阻抗控制器中，使技能更像人，既考慮了機(jī)器人的位置軌跡，又考慮了機(jī)器人的剛度軌跡，實(shí)現(xiàn)了更完整的技能轉(zhuǎn)移過程。Han 等[54]基于動量觀測器的無力/力矩傳感器，通過每個手臂和物體的阻抗控制來實(shí)現(xiàn)雙臂機(jī)器人碰撞檢測與協(xié)調(diào)順從控制方法，充分考慮了雙臂機(jī)器人與人、環(huán)境和被操縱對象之間的相互作用。

2.4 自適應(yīng)控制

由于機(jī)械臂系統(tǒng)的動力學(xué)模型是一個高復(fù)雜度、強(qiáng)耦合、非線性的時變系統(tǒng)。因此，機(jī)械臂在建模過程中總會存在一些誤差，包括外界的擾動以及某些未知參數(shù)帶來的不確定性。自適應(yīng)控制方法指根據(jù)當(dāng)前系統(tǒng)的運(yùn)行狀態(tài)，通過一定的在線估計(jì)方法和策略對系統(tǒng)中未知的參數(shù)進(jìn)行估計(jì)，然后按照期望的閉環(huán)控制系統(tǒng)的性能指標(biāo)，根據(jù)所得到的估計(jì)值即時修正系統(tǒng)。自適應(yīng)控制方法的優(yōu)勢在于能夠在控制對象參數(shù)或自身工作狀態(tài)變化時自動修改系統(tǒng)參數(shù)來適應(yīng)這種變化，以提高控制器的性能。

Kyrarini 等[55]提出一種實(shí)時的自適應(yīng)算法，能夠識別在新環(huán)境中需要執(zhí)行的動作序列，以適應(yīng)人為因素導(dǎo)致的環(huán)境變化，如演示對象的位置和方向與實(shí)際操作不同。Yi 等[56]基于自適應(yīng)混合力/位控制器，結(jié)合了被抓物體質(zhì)心的自收斂參數(shù)估計(jì)和接觸力估計(jì)。通過將具有適當(dāng)?shù)牧憧臻g投影和旋轉(zhuǎn)變換的位置跟蹤公式并入位置跟蹤公式，可以同時實(shí)現(xiàn)內(nèi)力和接觸力跟蹤目標(biāo)。Benali 等[57]提出了將混合力/位置控制和自適應(yīng)主/從控制方法相結(jié)合，根據(jù)目標(biāo)期望軌跡進(jìn)行協(xié)調(diào)操作，用于抓取倉庫中不同尺寸的箱子。

Chen等[58]融合力/位置誤差和迭代學(xué)習(xí)控制用于機(jī)械手基于力/位置的附加補(bǔ)償，進(jìn)行雙臂目標(biāo)操作（抓取和移動）的混合控制策略。王勇等[59]基于三流聯(lián)合深度卷積神經(jīng)網(wǎng)絡(luò)模型的多模態(tài)融合方法，其中每個流分別處理其對應(yīng)的輸入模態(tài)，利用改進(jìn)的單極回歸算法進(jìn)行抓取位置預(yù)測。

2.5 控制方式對比

GB/T 38559-2020 工業(yè)機(jī)器人力控制技術(shù)規(guī)范對被動柔順機(jī)構(gòu)、主動柔順控制、力控制策略、自適應(yīng)力控制、基于末端力/力矩傳感器的力控制技術(shù)等術(shù)語定義進(jìn)行了明確的界定，并按照力控制策略、傳感方式對機(jī)器人力控制進(jìn)行分類，詳細(xì)介紹了動態(tài)力控制技術(shù)、恒力控制技術(shù)、零力控制技術(shù)、碰撞保護(hù)技術(shù)4 種力控制應(yīng)用技術(shù)及其應(yīng)用條件。面對機(jī)器人應(yīng)用場景多樣化、復(fù)雜性的挑戰(zhàn)，以視覺、力反饋為依托的機(jī)器人控制方法具有更多的應(yīng)用空間，目前應(yīng)用于機(jī)械臂的控制方式主要有主從控制方式和阻抗控制方式，表1是目前控制方式在控制過程中的優(yōu)缺點(diǎn)以及應(yīng)用場合對比。

表1 控制方式對比

3 感知傳感器

針對雙臂協(xié)調(diào)操作的環(huán)境感知問題，研究人員將感知傳感器引入到機(jī)器人系統(tǒng)的應(yīng)用中，機(jī)器人系統(tǒng)可以利用外部環(huán)境感知的結(jié)果，以適應(yīng)動作規(guī)劃和操作任務(wù)要求。Clark等[60]使用觸覺設(shè)備在力反饋中提高平均交互作用力，用于提高雙臂機(jī)器人遙操作盒子放置任務(wù)的成功率。視覺傳感器應(yīng)用于農(nóng)業(yè)中采摘水果[61]、雙臂自主執(zhí)行裝配任務(wù)[62]等。利用外部傳感器對目標(biāo)物體進(jìn)行測量，實(shí)現(xiàn)機(jī)器人半自主控制的方法。

視覺傳感器被廣泛應(yīng)用于機(jī)器人感知環(huán)境信息，運(yùn)用視覺控制雙臂協(xié)調(diào)工作。Shirato 等[51]利用機(jī)器人的傳感器對目標(biāo)物體進(jìn)行測量，實(shí)現(xiàn)從機(jī)器人半自主控制的方法，只考慮到達(dá)動作，不考慮其他操作。視覺信息不參與的機(jī)器人閉環(huán)控制中，對機(jī)械臂末端位姿進(jìn)行一次觀察，此時機(jī)械臂是“盲”運(yùn)動，不做任何的修正。視覺信息不反饋給機(jī)器人閉環(huán)控制器，只觀察一次機(jī)械臂末端位姿，此時機(jī)械臂是“無反饋”運(yùn)動，不做任何的修正。視覺信息反饋到機(jī)器人的閉環(huán)控制器中，可以在未知環(huán)境下自動地校正位置，稱為機(jī)器人視覺伺服，其控制目標(biāo)是使目標(biāo)誤差最小化，其數(shù)學(xué)表達(dá)式：

e(t)=s(m(t))-s*（10）其中，m(t)表示圖像數(shù)據(jù)，s稱作視覺特征量，是一系列可被量化的視覺特征值，而s*則是這些視覺特征量的目標(biāo)值。

雙臂機(jī)器人的視覺伺服通常是單臂機(jī)器人視覺伺服控制方法的擴(kuò)展，通常分為三類：基于圖像（如圖10）、基于位置（如圖11）和混合方法。

圖10 基于圖像的視覺伺服控制結(jié)構(gòu)框圖

圖11 基于位置的視覺伺服控制結(jié)構(gòu)框圖

基于圖像的視覺伺服（2D 視覺伺服，IBVS）利用了在二維圖像平面上選擇特征位置，其觀測值和期望值之間的差異。在不進(jìn)行姿態(tài)估計(jì)的情況下，運(yùn)行速度快。利用圖像的雅克比矩陣來控制雙手操作，Cruciani 等[63]基于分析物體形狀信息獲得正確的手推操作順序，改變抓取配置而不釋放物體。Qu等[64]建立兩個對象的位置和方向之間的視覺約束，利用多任務(wù)IBVS 方法對兩個對象進(jìn)行了排序子任務(wù)以實(shí)現(xiàn)姿態(tài)對齊。Wang等[65]通過將笛卡爾空間中的控制任務(wù)轉(zhuǎn)換為圖像空間來選擇基于圖像的視覺伺服（IBVS），然后基于分散控制策略設(shè)計(jì)了雙目視覺軌跡跟蹤控制器。Chang等[66]將立體視覺相機(jī)固定機(jī)械臂末端附近構(gòu)成雙目EIH 視覺系統(tǒng)測量目標(biāo)點(diǎn)的3D坐標(biāo)信息，并采用IBVS控制機(jī)械臂完成裝配任務(wù)。Lippiello等[67]提出基于圖像的視覺阻抗控制律，可以根據(jù)視覺信息用于調(diào)節(jié)手眼攝像機(jī)相對于操作任務(wù)的臂運(yùn)動，另一只裝有力/力矩傳感器的機(jī)械臂與環(huán)境進(jìn)行物理交互和釘入孔操作的協(xié)調(diào)。

基于位置的視覺伺服（PBVS）利用跟蹤對象在三維空間相對于攝像機(jī)的觀測姿態(tài)和期望姿態(tài)之間的差異。基于所提取的特征重建物體的三維模型，利用預(yù)先捕獲的模型信息（用于單目視覺系統(tǒng)）或考慮深度信息（用于提供深度的視覺傳感器）計(jì)算物體在笛卡爾空間中的位姿。Gan等[68]提出一種用于高精度抓取和協(xié)同任務(wù)的PBVS 方法，將視覺系統(tǒng)的傳感器數(shù)據(jù)流、力/力矩傳感器和聯(lián)合編碼器融合在一起，可以得到機(jī)械手的關(guān)節(jié)速度值和在線運(yùn)動軌跡，從而對固定目標(biāo)的抓取和在線跟蹤有較好的效果。Peng等[69]提出了一種雙臂空間機(jī)器人系統(tǒng)的虛擬立體視覺建模和位姿測量方法，每只手臂只攜帶一個單目攝像機(jī)來觀察不同物體，被映射到一個立體測量范圍，分別識別的幾何特征被轉(zhuǎn)換成一個等效的“虛擬共同特征”，進(jìn)一步確定非協(xié)作目標(biāo)的位姿。

為了測量操作物的位姿信息，通常采用兩種類型的視覺傳感器：（1）RGB-D相機(jī)，Medjram等[70]采用RGB-D相機(jī)獲取視覺信息進(jìn)行處理以估計(jì)物體的位置；Kinect帶有深度傳感器以及紅外傳感器可以直接獲得目標(biāo)的深度信息，在人機(jī)運(yùn)動直接示教研究中，王朝陽等[71]利用Kinect獲取人臂特征點(diǎn)在笛卡爾空間的運(yùn)動信息，即各關(guān)節(jié)在相機(jī)坐標(biāo)系中的空間位置坐標(biāo)；Abadianzadeh等[72]采用Kinect 傳感器對目標(biāo)點(diǎn)的3D 坐標(biāo)進(jìn)行測量，通過模糊混合控制器控制機(jī)械臂趨近期望目標(biāo)。（2）基于視差原理的雙目視覺定位：雙目立體攝像機(jī)，通過兩臺平行放置的單目相機(jī)，利用視差原理來測量目標(biāo)位置信息，Ling等[61]結(jié)合了雙目立體視覺傳感器和雙臂用于番茄采摘系統(tǒng)，集成了番茄檢測、目標(biāo)定位、運(yùn)動計(jì)劃和用于雙臂運(yùn)動的實(shí)時控制，應(yīng)用于機(jī)器人水果采摘的雙臂協(xié)作；Fan 等[73]基于雙目視覺的多自由度機(jī)械臂自主操作方法，提取目標(biāo)特征點(diǎn)并結(jié)合雙目定位原理獲得目標(biāo)對象的空間位置，在關(guān)節(jié)空間采用遺傳算法規(guī)劃機(jī)械臂的運(yùn)動軌跡。

根據(jù)機(jī)械臂伺服任務(wù)的目的，從視覺定位和視覺跟蹤兩方面分析雙臂的操作任務(wù)。雙臂視覺跟蹤任務(wù)中，目標(biāo)在圖像空間的期望狀態(tài)是運(yùn)動的，即圖像空間的期望路徑是一條隨時間變化的軌跡，如雙臂搬運(yùn)類的協(xié)調(diào)任務(wù)，采用基于圖像的視覺伺服方法。這種方法不需要姿態(tài)估計(jì)，減少了機(jī)器人控制信號的計(jì)算。雙臂視覺定位任務(wù)中，目標(biāo)在圖像空間的期望狀態(tài)是靜止的或是相對靜止的，需要控制機(jī)械臂末端位姿使得目標(biāo)圖像特征到達(dá)期望特征，如雙臂裝配類的協(xié)調(diào)任務(wù)，采用基于位置的視覺伺服方法。

場景與手眼攝像機(jī)組合視覺系統(tǒng)，屬于雙目相機(jī)，但無法使用視差原理，只能通過對位姿特征進(jìn)行解耦，在各自的圖像空間實(shí)現(xiàn)各方向測量。手眼攝像機(jī)被剛性固定在機(jī)器人末端執(zhí)行器附近，場景攝像機(jī)固定于機(jī)器人工作空間附近用來觀測機(jī)器人操作，多攝像機(jī)的組合配置可以允許機(jī)器人接受互補(bǔ)傳感器信息源來完成任務(wù)。Lippiello等[74]通過場景和手眼攝像機(jī)的組合視覺系統(tǒng)實(shí)時觀測和估計(jì)操作物位姿信息，并采用3D 視覺伺服和卡爾曼濾波方法實(shí)現(xiàn)雙臂機(jī)器人操作。Shauri等[75]通過位置伺服控制和安裝在末端執(zhí)行器上的攝像機(jī)實(shí)現(xiàn)螺栓與螺母擰緊的雙臂裝配任務(wù)。Kruse等[76]通過兩臺手眼攝像機(jī)實(shí)時觀測操作物的2D 特征，兩個機(jī)械臂被同時控制來抓取一個體積較大的物體。PR2 的兩個機(jī)械臂采用場景和手眼的混合視覺系統(tǒng)，F(xiàn)leurmond 等[77]采用2D 視覺伺服控制來實(shí)現(xiàn)筆和筆帽的位姿對齊任務(wù)。Wang等[65]提出了一種基于視覺感知的雙臂機(jī)器人裝配環(huán)境狀態(tài)感知方法，將三維點(diǎn)云處理、模型數(shù)據(jù)庫、知識表示與物體識別、姿態(tài)估計(jì)相結(jié)合。首先生成裝配場景的原始數(shù)據(jù)庫，將裝配工作空間中的對象與數(shù)據(jù)庫中的對應(yīng)模型進(jìn)行匹配，工作完成后，利用獲得的所有信息生成環(huán)境狀態(tài)圖，用于雙手手動裝配行為自動生成。Nicolis等[78]一個采用遙操作控制方式，另一個自主配備了手眼攝像頭傳感器，通過自主調(diào)整攝像頭以執(zhí)行無遮擋任務(wù)。

4 模仿學(xué)習(xí)

為了實(shí)現(xiàn)雙臂機(jī)器人在非結(jié)構(gòu)化環(huán)境中自主操作的目標(biāo)，有必要讓機(jī)器人具備適應(yīng)周圍環(huán)境的能力。在這種環(huán)境中僅依靠外部傳感器控制，手動規(guī)劃機(jī)器人運(yùn)動的所有方面是無法適應(yīng)動態(tài)環(huán)境的。為了使雙臂機(jī)器人具備適應(yīng)環(huán)境的能力，模仿學(xué)習(xí)（Imitation Learning，IL），基于對人類演示的真實(shí)運(yùn)動作為參考，通過離線對人類運(yùn)動過程進(jìn)行觀測并分析，通過學(xué)習(xí)模型分析并獲得運(yùn)動特征或操作特征，以便在規(guī)劃階段后期應(yīng)用，減少運(yùn)動規(guī)劃的復(fù)雜性以及實(shí)現(xiàn)機(jī)器人的擬人化操作。

劉乃軍等[79]將機(jī)器人操作技能學(xué)習(xí)方法按照對訓(xùn)練數(shù)據(jù)的使用方式分為強(qiáng)化學(xué)習(xí)、模仿學(xué)習(xí)和小數(shù)據(jù)學(xué)習(xí)。有許多研究人員對模仿學(xué)習(xí)進(jìn)行不同的分類，李帥龍等[80]按照學(xué)習(xí)策略的不同分為行為克隆（Behavioral Cloning，BC）和逆強(qiáng)化學(xué)習(xí)（Inverse Reinforcement Learning，IRL）。Fang 等[81]按照操作示教方式的不同分為間接示教和直接示教。殷聰聰?shù)萚82]按照傳感器的類型不同分為：動覺模仿、視覺模仿、遙操作模仿，或者按照其學(xué)習(xí)信息的邏輯層次可以分為基于運(yùn)動的模仿學(xué)習(xí)和基于任務(wù)的模仿學(xué)習(xí)。

在多數(shù)文獻(xiàn)中，將機(jī)械臂通過分析人類操作數(shù)據(jù)所學(xué)到的知識稱為技能獲取。這些方法大多是針對單一機(jī)械手的，在某些情況下，可以將這些方法簡單地?cái)U(kuò)展到兩個手臂，只需對每個手臂重復(fù)該過程，但雙臂操作的一些特性需要進(jìn)行修改。相關(guān)的問題包括運(yùn)動的認(rèn)知、姿態(tài)估計(jì)、姿態(tài)跟蹤、身體的一致性、從外部空間到自身空間的坐標(biāo)轉(zhuǎn)換。

從技能學(xué)習(xí)的角度，通過視覺傳感器等獲得人臂運(yùn)動數(shù)據(jù)，如動作模擬任務(wù)，可以稱為運(yùn)動技能的學(xué)習(xí)；機(jī)械臂末端與環(huán)境之間或者被操作物體與環(huán)境之間存在物理交互作用，需要采用力傳感器獲得機(jī)械臂與環(huán)境之間的接觸信息，可以稱為操作技能的學(xué)習(xí)。技能學(xué)習(xí)通常分為三個部分：數(shù)據(jù)獲取、技能學(xué)習(xí)和任務(wù)再現(xiàn)，如圖12所示，其中雙臂協(xié)調(diào)操作模型包括位置/力協(xié)調(diào)參數(shù)。常見的基本建模方法包括動態(tài)運(yùn)動原語（Dynamical Movement Primitives，DMP）、高斯混合模型（Gaussian Mixture Model，GMM）和隱馬爾可夫模型（Hidden Markov Model，HMM）等。

圖12 機(jī)械臂協(xié)作技能學(xué)習(xí)策略

Batinica等[83]演示了順應(yīng)性運(yùn)動原語（CMP）如何結(jié)合期望的關(guān)節(jié)運(yùn)動軌跡和相應(yīng)的關(guān)節(jié)轉(zhuǎn)矩信號，從需要順應(yīng)性的人類演示雙臂運(yùn)動中學(xué)習(xí)，應(yīng)用于重復(fù)完全相同的任務(wù)。Nemec等[84]通過演示學(xué)習(xí)，底層的協(xié)同任務(wù)使用速度縮放的動態(tài)運(yùn)動原語表示，提出了一種在路徑操作空間中實(shí)現(xiàn)剛度自適應(yīng)的方法，考慮了多次執(zhí)行的運(yùn)動方差和當(dāng)前速度。Yang等[53]擴(kuò)展了DMPs模型，實(shí)現(xiàn)了運(yùn)動（位置）軌跡和剛度分布的同步編碼，實(shí)現(xiàn)了更完整的技能轉(zhuǎn)移過程。Silverio 等[85]將任務(wù)參數(shù)化高斯混合模型（Task Parameterized Gaussian Mixture Model，TP-GMM）擴(kuò)展到雅可比矩陣和零空間結(jié)構(gòu)，從不同坐標(biāo)系角度對末端執(zhí)行器運(yùn)動進(jìn)行概率編碼，同時學(xué)習(xí)操作空間和配置空間的約束，解決雙臂操作潛在沖突任務(wù)之間的優(yōu)先級問題。

Suarez 等[86]計(jì)算擬人雙臂機(jī)器人構(gòu)形空間的協(xié)同效應(yīng)，將協(xié)同作用的概念擴(kuò)展到速度空間（即構(gòu)型軌跡的一階導(dǎo)數(shù)空間），分析自由度速度之間的相關(guān)性，通過姿勢捕捉進(jìn)行雙臂機(jī)器人的訓(xùn)練學(xué)習(xí)。Garcia等[87]利用人類演示在解決不同任務(wù)時獲得的協(xié)同效應(yīng)來定義兩個任務(wù)之間的相似性指數(shù)，根據(jù)人類操作者手臂解決任務(wù)的動作來評估兩個任務(wù)之間的相似性，允許將任務(wù)分類或集群到子集中，從而進(jìn)一步改進(jìn)規(guī)劃過程，并且提出了一種基于采樣的規(guī)劃器[88]，考慮不同類型的抓取，描述人類抓取動作中存在的協(xié)同效應(yīng)，識別抓取運(yùn)動中的不同階段，獲得一個通用的預(yù)抓取協(xié)同集和一個針對每種抓取類型的抓取協(xié)同集。

Shin等[89]在雙臂操作中使用模仿學(xué)習(xí)的方法，利用主成分分析方法（Principal Component Analysis，PCA）采集人體運(yùn)動數(shù)據(jù)來生成與人類相似的運(yùn)動達(dá)到臂形控制的效果，這種方法在每次執(zhí)行新任務(wù)時需要重新學(xué)習(xí)。Qu等[90]通過學(xué)習(xí)人類手臂操作過程中雙手的相對位置和方向之間的關(guān)系，即手臂間的協(xié)調(diào)特性，可以得到兩臂間的可變協(xié)調(diào)約束，使得機(jī)器人雙臂操作更加順暢。利用人體手臂教學(xué)數(shù)據(jù)中特征點(diǎn)的笛卡爾坐標(biāo)求出人體手臂運(yùn)動的關(guān)節(jié)數(shù)據(jù)，求出關(guān)節(jié)角度。利用PCA方法從教學(xué)數(shù)據(jù)集中去除不相關(guān)的維度，將數(shù)據(jù)映射到潛在空間。關(guān)節(jié)數(shù)據(jù)的平均相關(guān)值表示人體手臂各關(guān)節(jié)之間的臂內(nèi)協(xié)調(diào)特征，推導(dǎo)出類人協(xié)調(diào)運(yùn)動方程，采用高斯混合回歸模型（GMR）方法對編碼軌跡進(jìn)行泛化。

Zhu等[91]總結(jié)了模仿學(xué)習(xí)在機(jī)器人裝配操作中的應(yīng)用。Kyrarini等[55]通過多次人類演示學(xué)習(xí)裝配任務(wù)的動作順序（高級學(xué)習(xí)），根據(jù)對象操作的需要學(xué)習(xí)每條路徑（低級學(xué)習(xí)），基于高斯混合模型的修改算法能夠適應(yīng)學(xué)習(xí)的路徑，能夠完成工業(yè)裝配任務(wù)中的人機(jī)協(xié)作。Duque 等[92]使用TP-GMM 和Petri 網(wǎng)進(jìn)行零件裝配操作，任務(wù)演示由Kinect 運(yùn)動傳感器識別場景中的對象，Petri網(wǎng)根據(jù)工作空間上的可用對象自動生成工作計(jì)劃。Suomalainen 等[93]將阻抗控制和模仿學(xué)習(xí)結(jié)合，從人類演示中學(xué)習(xí)順應(yīng)性的接觸運(yùn)動，通過同時測量運(yùn)動方向和作用在末端執(zhí)行器上的力可以為運(yùn)動方向構(gòu)造一組約束，來自多次演示的約束被投影到二維角坐標(biāo)系中，其中的交點(diǎn)即可行的期望運(yùn)動方向。Suomalainen 等[94]之后提出在存在方向誤差的情況下如何從人類演示中學(xué)習(xí)遵從性參數(shù)（阻抗控制器的運(yùn)動參數(shù)和柔度參數(shù)）用于裝配任務(wù)。觀察柔順的滑動運(yùn)動中，總是有一定的方向扇區(qū)，機(jī)器人可以從其中施加力來執(zhí)行觀察到的運(yùn)動。通過一個或多個演示，在三維運(yùn)動中獲取這些扇區(qū)的交點(diǎn)，從而學(xué)習(xí)動態(tài)線性柔順運(yùn)動的參數(shù)。

由于回報(bào)函數(shù)設(shè)計(jì)困難和示教質(zhì)量不佳兩種情況，單純的強(qiáng)化和模仿學(xué)習(xí)都難以應(yīng)用，因此提出新的機(jī)制。（1）借助示教的強(qiáng)化學(xué)習(xí)（RLfD）。（2）借助專家偏好的模仿學(xué)習(xí)。Yang 等[95]提出超越模仿學(xué)習(xí)的不同方面和應(yīng)用，Caccavale等[96]提出將模仿學(xué)習(xí)和注意監(jiān)督結(jié)合來學(xué)習(xí)一組運(yùn)動原語和相關(guān)的任務(wù)結(jié)構(gòu)，用于雙臂結(jié)構(gòu)化任務(wù)。Ficuciello等[97]將模仿學(xué)習(xí)與強(qiáng)化學(xué)習(xí)相結(jié)合，用擬人化手臂機(jī)器人系統(tǒng)抓取物體。

5 人機(jī)交互

人機(jī)協(xié)作任務(wù)，主要解決四類問題：（1）需要根據(jù)不同的任務(wù)參數(shù)，例如操作物相對于抓取，障礙物在工作空間中的位置等，對人類示教數(shù)據(jù)進(jìn)行編碼。（2）在協(xié)作行為重建階段中的機(jī)器人期望狀態(tài)提取。（3）隨著時間變化的不同柔順級別估計(jì)。（4）與人類安全的交互。曾超等[98]根據(jù)不同的交互接口，將人機(jī)技能傳遞方式歸納為四種形式：基于視覺（vision-based）、基于遙操作（teleoperation-based）、人機(jī)物理接觸交互（physical Human-Robot Interaction，pHRI）、多模態(tài)。

（1）基于視覺的人機(jī)交互

此過程與模仿學(xué)習(xí)類似，這種交互方式只能獲取運(yùn)動信息，而無法獲取示教者的動作信息。Rozo等[99]從動覺演示數(shù)據(jù)中提取任務(wù)的位置、速度和力約束，建立任務(wù)參數(shù)的函數(shù)，并提出模型結(jié)合最優(yōu)控制器，來利用演示中所觀察的變化，進(jìn)而不斷適應(yīng)一個反饋控制律。機(jī)器人系統(tǒng)在非結(jié)構(gòu)化環(huán)境中面對更復(fù)雜的任務(wù)，Sepulveda 等[100]提出智能感知系統(tǒng)，由高分辨率RGB 相機(jī)和飛行時間相機(jī)組成。Cruciani等[63]通過深度相機(jī)提高物體形狀和姿態(tài)的部分信息來實(shí)現(xiàn)雙手操作規(guī)劃，利用雙臂機(jī)器人的冗余性來執(zhí)行對物體的非纏繞推力，并調(diào)整其在夾具內(nèi)的姿態(tài)，適用于需要交互感知的操作任務(wù)。

（2）基于遙操作的人機(jī)交互

示教過程與基于視覺的人機(jī)交互類似，但不再直接記錄示教者肢體的運(yùn)動信息，而是記錄主端操作桿或從端機(jī)器人的運(yùn)動狀態(tài)。由于操作桿與機(jī)器人的機(jī)理結(jié)構(gòu)不同，在示教過程中需要對工作空間進(jìn)行匹配。Rozo等[72]提出了基于高斯混合模型和高斯混合回歸的概率框架，分別對機(jī)器人協(xié)作行為進(jìn)行編碼和重建。在人機(jī)協(xié)作的抬舉任務(wù)中人類通過遙操作設(shè)備控制機(jī)械臂來實(shí)現(xiàn)演示。Peternel 等[101]提出一種在線學(xué)習(xí)策略，人類通過遙操作機(jī)器人進(jìn)行循環(huán)運(yùn)動。

（3）基于物理接觸的人機(jī)交互

Cohen等[33]將基于搜索的啟發(fā)式算法應(yīng)用于人機(jī)交互的運(yùn)動規(guī)劃，使機(jī)器人能夠針對人類行為及周圍環(huán)境做出安全交互。Roveda等[102]使用神經(jīng)網(wǎng)絡(luò)優(yōu)化機(jī)器人協(xié)作優(yōu)化控制參數(shù)的基礎(chǔ)上，采用內(nèi)笛卡爾阻抗控制器實(shí)現(xiàn)機(jī)器人的順從行為，限制人機(jī)交互中力/速度以加強(qiáng)安全性。Duan等[103]同時在笛卡爾空間和關(guān)節(jié)空間中同時學(xué)習(xí)技能的模仿學(xué)習(xí)中避免障礙的問題，設(shè)計(jì)適當(dāng)?shù)膭輬鲆岳@過障礙物，在避開障礙物的過程中調(diào)整軌跡時，要遵守關(guān)節(jié)極限，以及確定適當(dāng)?shù)臋C(jī)器人控制命令，以潛在的人機(jī)交互安全問題。

雙臂示教是一種較為特別的物理交互示教方法，即利用雙臂機(jī)器人的特點(diǎn)，以其中一機(jī)械臂為主端，以另一機(jī)械臂為從端。示教者操作主端引導(dǎo)從端機(jī)械臂完成作業(yè)任務(wù)，這種示教方式可以使得示教者直接操作機(jī)械臂，有物理交互的特點(diǎn)。Ureche等[104]從人類演示中提取非對稱任務(wù)的參數(shù)化，應(yīng)用于三種執(zhí)行案例：雙手保持身體接觸同時自主協(xié)調(diào)；一只手臂執(zhí)行輔助功能，另一只手臂進(jìn)行主動操作；人類協(xié)作執(zhí)行輔助或主動角色的單個機(jī)械臂協(xié)作執(zhí)行。Yang等[105]為了提高示教的質(zhì)量，可以在雙臂示教系統(tǒng)中的主從兩端引入基于虛擬阻抗的觸覺反饋機(jī)制，同時在觸覺和視覺反饋的幫助下，以提高人機(jī)交互的臨場感。Mario等[106]將觸覺引導(dǎo)與共享控制算法相結(jié)合，用于自主方向控制和避碰，進(jìn)一步提高了抓取任務(wù)的性能。

（4）多模態(tài)人機(jī)交互

隨著智能機(jī)器人可裝配的傳感器種類越來越多，融合不同類型傳感器數(shù)據(jù)的多模態(tài)交互方法可以進(jìn)一步提高機(jī)器人的感知與交互能力。Behrens等[107]針對一類集成任務(wù)和運(yùn)動規(guī)劃（ITAMP）問題，提出了基于自然語言和演示的多模態(tài)輸入法，使用所有相關(guān)約束描述要調(diào)度的任務(wù)并演示其相對位置。Pavlichenko 等[108]提出自動完成雙臂拾取任務(wù)的集成方法，包括目標(biāo)識別和語義分割、目標(biāo)姿態(tài)估計(jì)、可變形模型配準(zhǔn)、抓取規(guī)劃和手臂軌跡規(guī)劃和優(yōu)化。Kitagawa 等[109]將雙臂抓取作為另一種可能的策略，并提出一種利用卷積神經(jīng)網(wǎng)絡(luò)（CNN）進(jìn)行抓取點(diǎn)預(yù)測和語義分割的多階段選擇性雙臂抓取學(xué)習(xí)方法。Amor等[110]提出基于DMP的概率編碼方法，基于部分觀測的人類意圖預(yù)測，來適應(yīng)和機(jī)器人交互。根據(jù)人類動作，使用動態(tài)時間規(guī)整來構(gòu)造預(yù)測動作。Matsuzaka等[111]提出了基于預(yù)測操作者在特定任務(wù)中的運(yùn)動的半自主控制（聯(lián)合操作控制和自主控制），通過眼動跟蹤和預(yù)測人類行為的手眼協(xié)調(diào)的輔助系統(tǒng)，人機(jī)協(xié)作中，將分析的模式應(yīng)用于實(shí)際的操作輔助和操作預(yù)測的研究中。

6 總結(jié)與展望

隨著機(jī)器人應(yīng)用場景多樣化和操作任務(wù)復(fù)雜化，雙臂機(jī)器人會得到越來越多的應(yīng)用及研究，由于其冗余特性，運(yùn)動學(xué)逆解求解方法趨向與智能啟發(fā)式算法結(jié)合來尋找最優(yōu)構(gòu)型，傳統(tǒng)的主從控制和位置/力控制不能滿足雙臂機(jī)器人柔順控制的要求，阻抗控制和自適應(yīng)控制更適應(yīng)動態(tài)環(huán)境中的協(xié)調(diào)控制。視覺伺服控制通過位置或圖像等信息傳遞給雙臂系統(tǒng)，實(shí)現(xiàn)機(jī)器人半自主控制。隨著擬人機(jī)械臂的發(fā)展，模仿學(xué)習(xí)通過分析人類操作數(shù)據(jù)使雙臂機(jī)器人也具有擬人協(xié)調(diào)特性。在人類環(huán)境中工作的雙臂機(jī)器人，人機(jī)協(xié)作將大幅增加，其更關(guān)注安全問題以及與環(huán)境之間的交互協(xié)作。

機(jī)器人操作技能學(xué)習(xí)得到了越來越多地重視[112]，人工智能技術(shù)的發(fā)展為機(jī)器人操作技能的學(xué)習(xí)提供了新的方法，開拓了新的思路[79，98]。

（1）擬人雙臂逆解考慮其生理特性，通過引入臂角變量，避免奇異性；或者結(jié)合啟發(fā)式算法求解最優(yōu)構(gòu)型。另一種獲得雙臂逆解的方法是通過學(xué)習(xí)人類手臂運(yùn)動的關(guān)節(jié)數(shù)據(jù)，再生成與人類相似的運(yùn)動，這種臂形控制的方法適合雙臂協(xié)調(diào)性較高的操作，通過臂角變量如何使雙臂協(xié)調(diào)操作更穩(wěn)定是值得研究的問題。

（2）傳統(tǒng)工業(yè)機(jī)器人由于缺少力反饋等信息容易造成任務(wù)失敗，機(jī)械臂末端與物體之間接觸產(chǎn)生作用力，由于機(jī)器人剛度很大，需要對機(jī)器人進(jìn)行柔順控制，系統(tǒng)是采用被動柔順方法進(jìn)行控制，還是通過力傳感器實(shí)時反饋的接觸力的信息進(jìn)行控制，或是采用自適應(yīng)力控制策略，對于在力控制中出現(xiàn)的動態(tài)力、恒力、零力以及碰撞等情況，雙臂協(xié)調(diào)控制方法需要不同的控制策略。

（3）基于視覺、觸覺或其他傳感器的信息分析人類行為的方法，以及推理系統(tǒng)，確定任務(wù)的哪些方面是相關(guān)的，并傳達(dá)給機(jī)器人系統(tǒng)，需要有效的控制系統(tǒng)來實(shí)現(xiàn)這些目標(biāo)。將人類的操作任務(wù)映射到不同的機(jī)械手，需要不同的控制策略確定任務(wù)的目標(biāo)。

（4）模仿學(xué)習(xí)方法雖然解決了機(jī)器人學(xué)習(xí)控制的效率問題，但其控制方式不總是最優(yōu)策略，一方面示教者與機(jī)器人的運(yùn)動學(xué)和動力學(xué)在機(jī)理模型上不完全相同，從外部空間到自身空間需要進(jìn)行數(shù)據(jù)信息的分析變換以適應(yīng)任務(wù)的需求。對機(jī)器人演示運(yùn)動進(jìn)行分析以動態(tài)預(yù)測機(jī)器人姿態(tài)，或從機(jī)器人姿態(tài)運(yùn)動軌跡來推測機(jī)器人的姿態(tài)，可以構(gòu)造基本運(yùn)動集或抓取集，用于先驗(yàn)?zāi)Ｐ蛻?yīng)用于運(yùn)動規(guī)劃和姿態(tài)估計(jì)中。這種控制方式在動態(tài)環(huán)境中需要聯(lián)合學(xué)習(xí)，從感知傳感器學(xué)習(xí)應(yīng)用到操作中，動作會反饋給感知傳感器，以適應(yīng)非結(jié)構(gòu)化環(huán)境。

（5）人機(jī)交互方式過于單一、感知信息不足，人機(jī)融合程度不高，示教者缺乏臨場感，從而影響示教性能。針對這一問題，未來會集中在尋找更加直觀、自然、友好的示教方式。首先，多種交互方式相結(jié)合是發(fā)展趨勢，將先進(jìn)的交互技術(shù)引入到機(jī)器人技能示教學(xué)習(xí)領(lǐng)域是確實(shí)可行的辦法。多模態(tài)信息融合也將是改善人機(jī)交互性能的發(fā)展方向。通過將物理的或者生理的多種形式的信號（如空間位置、交互力、觸覺、視覺、肌電信號等）在更高層次上融合，納入到人機(jī)技能傳遞過程中，可以更直觀地表達(dá)出人的技能特征。

在高級協(xié)作控制任務(wù)中，所有這些問題都需要解決，然后機(jī)器人才能在非結(jié)構(gòu)化環(huán)境中具有高協(xié)調(diào)性和智能化。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡