国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

空間機械臂智能規(guī)劃與控制技術(shù)

2022-03-17 07:24:10高賢淵趙治愷黃澤遠(yuǎn)符穎卓費軍廷
關(guān)鍵詞:軌跡機械規(guī)劃

陳 鋼,高賢淵,趙治愷,黃澤遠(yuǎn),符穎卓,費軍廷

(北京郵電大學(xué)自動化學(xué)院,北京 100876)

隨著空間技術(shù)的快速發(fā)展和人類太空活動的日趨頻繁,空間操控任務(wù)日益增多。空間機械臂作為空間操控自主化和智能化的關(guān)鍵設(shè)備之一,正在改變著人類載人航天、深空探測等太空探索活動的方式[1]。由于太空環(huán)境具有微重力、高溫差、強輻射等特點,嚴(yán)重威脅執(zhí)行出艙任務(wù)的宇航員生命安全,空間機械臂因其運動靈活、有效作業(yè)空間大等特點,展現(xiàn)出人類宇航員不具備的強大在軌作業(yè)能力,可降低宇航員出艙活動的頻率。另外,空間機械臂也是星表科學(xué)探測最有效的裝備之一[2?3]。鑒于此,近些年來空間機械臂被廣泛用于航天器在軌組裝、在軌輔助宇航員艙外活動、空間碎片清理、空間實驗以及星表探測等任務(wù),不僅提高了太空作業(yè)效率,避免了宇航員艙外活動的潛在風(fēng)險,還節(jié)省了大量人力物力[4?5]。

空間機械臂在執(zhí)行空間操控任務(wù)時,或脫離了地球引力的約束,或面臨著星表環(huán)境與地表環(huán)境之間的巨大差異,這導(dǎo)致空間機械臂的動力學(xué)特性與地面機械臂有很大不同,并且操作任務(wù)的對象大多都是高價值的航天器。所以,空間機械臂執(zhí)行任務(wù)時的穩(wěn)定性與安全性對于空間操控任務(wù)至關(guān)重要。如何在考慮空間機械臂的復(fù)雜運動規(guī)律以及操作過程中力與力矩的變化的情況下,實現(xiàn)規(guī)劃出可執(zhí)行的空間機械臂動作序列與軌跡序列,是實現(xiàn)空間機械臂的可靠穩(wěn)定運行、確??臻g操控任務(wù)的順利執(zhí)行的關(guān)鍵。因此,廣大學(xué)者開展了對空間機械臂規(guī)劃與控制技術(shù)的研究。

本文概述了空間機械臂的發(fā)展情況及其關(guān)鍵技術(shù),重點介紹了國內(nèi)外專家在任務(wù)規(guī)劃、運動規(guī)劃與運動控制中的研究成果與貢獻,并對未來空間機械臂智能規(guī)劃與控制技術(shù)的發(fā)展提出了建議。

1 空間機械臂發(fā)展及相關(guān)技術(shù)概述

1.1 國內(nèi)外空間機械臂發(fā)展現(xiàn)狀

世界上最早應(yīng)用的空間機械臂系統(tǒng)是1981 年加拿大研制的SRMS(Shuttle remote manipulator system),如圖1 所示。該臂具有6 個自由度,采用“肩關(guān)節(jié)?肘關(guān)節(jié)?腕關(guān)節(jié)”構(gòu)型,可通過遙操作控制方式進行大負(fù)載操作任務(wù),完成了捕獲哈勃太空望遠(yuǎn)鏡、空間站裝配和維修等任務(wù)[6]。在此基礎(chǔ)之上,加拿大為國際空間站開發(fā)了移動服務(wù)系統(tǒng)(Mobile service system,MSS),如圖2 所示。該系統(tǒng)由空間站遠(yuǎn)程操作臂系統(tǒng)SSRMS、專用靈巧機械臂SPDM、活動基座系統(tǒng)MBS 組成。其中SS?RMS 由兩個七自由度長臂桿組成,主要功能是搬運和組裝大型物體,SPDM 是安裝在SSRMS 末端的靈巧手,用于執(zhí)行一些精細(xì)操作任務(wù),靈巧手的本體裝配在遠(yuǎn)程操作臂系統(tǒng)的末端來代替宇航員的出艙活動。隨后,歐洲一些國家和日本也展開了空間機械臂技術(shù)的研究工作。德國開展了空間機械臂技術(shù)試驗(Space robot technology experiment,ROTEX),如圖3 所示。ROTEX 機械臂具有6 個自由度,臂桿展開長度為1 m,在哥倫比亞號航天飛機上進行的飛行演示,執(zhí)行了桁架裝配等任務(wù),驗證了宇航員在軌遙操作、地面遙操作等操作模式[7]。國際空間站日本艙段裝配的日本臂JEM?RMS(Japanese experiment module remote manipu?lator system),如圖4 所示。該機械臂采用宏微機械臂串聯(lián)構(gòu)型,由主臂和小臂串聯(lián)構(gòu)成,主臂由6個關(guān)節(jié)和兩個臂桿組成,小臂由6 個關(guān)節(jié)、兩個臂桿和一個末端執(zhí)行器組成,主要用于載荷照料、物資搬運和ORU 更換[8]。國際空間站俄羅斯艙段裝配的歐洲機械臂(European robotic arm,ERA)具有7 個自由度,如圖5 所示。該機械臂完全對稱且可重定位,臂長約9.5 m,質(zhì)量650 kg,最大有效載荷80 t,用于對艙段進行裝配和維護[9]。美國研制的機器人宇航員R2(Robo?naut2)系統(tǒng),如圖6 所示。具備頭部、頸部、腰部、雙臂、靈巧手等類人特征,可以模仿人類宇航員的工作能力,完成國際空間站艙內(nèi)輔助宇航員操作技術(shù)驗證[10]。

圖1 空間機械臂系統(tǒng):SRMSFig.1 Space manipulator system—SRMS

圖2 空間站遙操作機械臂系統(tǒng):MSSFig.2 Space station teleoperated manipulator system—MSS

圖3 機器人技術(shù)試驗系統(tǒng)Fig.3 Robot technology experiment system

圖4 日本實驗艙遠(yuǎn)程機械臂Fig.4 Japanese experiment module remote manipulator system

圖5 空間站七自由度機械臂:ERAFig.5 Space station seven degrees of freedom robotic arm—ERA

圖6 機器人宇航員R2Fig.6 Robo?naut 2

中國空間機械臂技術(shù)研究相較于國外起步較晚,但追趕速度很快。天宮二號機械臂系統(tǒng)主要用于驗證在軌人機協(xié)作關(guān)鍵技術(shù)和在軌遙操作技術(shù)[12],如圖7 所示。嫦娥五號月球表面采樣機械臂完成了月面采樣返回任務(wù)[13?14],如圖8 所示。中國空間站機械臂系統(tǒng)承擔(dān)空間站建造、運營和維修等任務(wù)[15],空間站配備了核心艙機械臂和實驗艙機械臂兩套機器人系統(tǒng),如圖9、10 所示。兩個機械臂展開長度分別約為10 和5 m,最大有效載荷分別為25 000 kg 和3 000 kg,都為七自由度機械臂,由3 個肩關(guān)節(jié)、1 個肘關(guān)節(jié)和3 個腕關(guān)節(jié)組成。核心艙機械臂主要負(fù)責(zé)完成空間站艙段轉(zhuǎn)位、輔助對接、宇航員輔助支持等任務(wù),實驗艙機械臂主要負(fù)責(zé)暴露載荷照料、光學(xué)實驗平臺照料和輔助支持宇航員等任務(wù)。兩個機械臂可以獨立工作,也可以串聯(lián)形成組合臂協(xié)同工作。

圖7 天宮二號機械臂和宇航員Fig.7 The Tiangong?2 robotic arm and astronauts

圖8 月面采樣機械臂Fig.8 Lunar surface surface sampling manipulator

圖9 核心艙機械臂Fig.9 Core cabin manipulator

圖10 實驗艙機械臂Fig.10 Experimental cabin manipulator

1.2 空間機械臂規(guī)劃與控制技術(shù)概述

空間操控任務(wù)按照航天器環(huán)繞地球與否,分為在軌服務(wù)與深空探測兩類。在軌服務(wù)主要包括在軌裝配與在軌維護。在軌裝配可以實現(xiàn)航天器的組裝及其功能擴展,具體指在太空中將部組件組裝起來構(gòu)建成復(fù)雜的空間結(jié)構(gòu)。在軌維護可以保障并延長空間系統(tǒng)壽命,具體指對空間系統(tǒng)提供檢查、維修以及軌道清理等活動。深空探測指對地球以外的天體展開的探索活動,具體包括對行星表面物質(zhì)的勘測與研究,以及星表建筑的建造與維護等空間探索任務(wù)。

空間機械臂是上述各項空間操控任務(wù)的關(guān)鍵設(shè)備,在任務(wù)開展的過程中到了至關(guān)重要的作用。在在軌服務(wù)任務(wù)中,空間機械臂通過對操作目標(biāo)的逼近、抓取、搬運等基本操作,完成裝配或維修任務(wù)。在深空探測任務(wù)中,空間機械臂配合不同的末端執(zhí)行器,可以完成對星表巖石、土壤的勘測、取樣任務(wù),通過移動、組裝完成星表基地、太陽能電站的建造任務(wù)。在任務(wù)執(zhí)行的過程中,機械臂操作通常分為“感知—規(guī)劃—控制”3 層。先通過傳感器獲得機械臂自身及環(huán)境的信息,然后在考慮空間機械臂運動特性和環(huán)境約束的情況下,規(guī)劃出空間機械臂的動作序列和軌跡序列,驅(qū)動電機執(zhí)行操作任務(wù)。

1.2.1 感知技術(shù)

空間機械臂感知技術(shù)決定了空間機械臂系統(tǒng)對環(huán)境的感知與測量,輔助展開任務(wù)執(zhí)行過程中的規(guī)劃與控制。空間機械臂可以通過各種類型的傳感器測量系統(tǒng)本身和所處環(huán)境數(shù)據(jù),再通過對數(shù)據(jù)的處理實現(xiàn)后續(xù)的建模與分析。感知技術(shù)使得空間機械臂可以完成對自身工況的讀取、對目標(biāo)狀態(tài)的識別以及對環(huán)境約束的判斷,從而為后續(xù)的規(guī)劃與控制提供更多的信息輸入。視覺感知技術(shù)和觸覺/力覺感知技術(shù)目前是在空間機械臂領(lǐng)域應(yīng)用最為廣泛的感知技術(shù)。

利用視覺傳感器獲取到圖像數(shù)據(jù)后,需要對圖像數(shù)據(jù)進行處理和計算,比較常見的應(yīng)用有視覺測量和目標(biāo)檢測。視覺測量一般用于對合作目標(biāo)的位姿測量,通過視覺傳感器對視場范圍內(nèi)的標(biāo)志器(如靶標(biāo)、反射器等)的識別,計算目標(biāo)與機械臂末端執(zhí)行器之間的相對位置與相對姿態(tài),作為后續(xù)規(guī)劃和控制的輸入。技術(shù)關(guān)鍵在于利用特征點間的約束關(guān)系和相機的空間配置關(guān)系,求解空間特征點相對相機光心的距離。目標(biāo)檢測一般用于對非合作目標(biāo)的紋理及形狀等特征的提取,繼而計算其位姿。若目標(biāo)的幾何和結(jié)構(gòu)特征參數(shù)已知,則可將目標(biāo)模型簡化為可觀測特征的點模型,再利用基于點特征的視覺測量技術(shù)實現(xiàn)位姿計算。若目標(biāo)的幾何和結(jié)構(gòu)特征參數(shù)未知,先對圖像數(shù)據(jù)進行邊緣匹配,再通過位姿非線性優(yōu)化算法求解非合作目標(biāo)位姿參數(shù)。若沒有目標(biāo)模型,可以分解目標(biāo)特征作為識別對象,提取邊緣線條與實際形狀對比,從而計算目標(biāo)位姿。

觸覺/力覺感知是空間機械臂與環(huán)境直接交互的方式之一,被廣泛應(yīng)用于空間在軌裝配、空間載荷實驗或空間目標(biāo)抓捕等接觸作業(yè)中。觸覺感知通常用來獲取空間機械臂末端執(zhí)行器與環(huán)境的作用信息和測量被接觸物體的特征信息。比如獲取靈巧手、抓取工具在抓取過程中的接觸力信息,實現(xiàn)目標(biāo)剛度、幾何特征的測量。力覺感知主要用來檢測末端執(zhí)行器與被操作對象間的作用力、反作用力大小,比如保證機械臂與宇航員的安全交互,輔助機械臂對環(huán)境輸出主動柔順控制。

目前視覺感知的技術(shù)難點在于提高目標(biāo)檢測與位姿估計的技術(shù)水準(zhǔn),以能夠處理視場內(nèi)覆蓋大量已知對象、光照條件較差或圖像對比度強烈的問題,做到準(zhǔn)確、高效估計快速翻滾的非合作目標(biāo)的六維位姿。觸覺/力覺傳感器的性能及相關(guān)算法非常依賴材料、電子學(xué)等其他學(xué)科的發(fā)展,距離類人級的水平還有一定的距離。此外,基于視覺、觸覺、力覺等多傳感器的信息融合與特征突破了單一類型感知信息的限制,使機械臂的環(huán)境感知能力大大提升。但是,多類型感知信息的內(nèi)在關(guān)聯(lián)的提取十分依賴數(shù)據(jù)驅(qū)動的方法,基于此的多類型感知信息的計算模型需要更多深入的研究。

1.2.2 規(guī)劃技術(shù)

為了規(guī)劃出使得機械臂有效完成操控任務(wù)的運動狀態(tài)序列與選擇合適的控制策略,需要充分掌握空間機械臂的運動規(guī)律以及操作過程中的作用力與力矩的變化,即空間機械臂運動學(xué)與動力學(xué)建模是空間機械臂規(guī)劃與控制的基礎(chǔ)。其中,運動學(xué)模型從幾何學(xué)角度描述機械臂連桿與基座運動隨時間的變化規(guī)律,動力學(xué)模型研究機械臂在力、力矩作用下的運動特性。通過機械臂運動學(xué)與動力學(xué)模型,根據(jù)機械臂系統(tǒng)相關(guān)參數(shù)與外部作用力,可以確定機械臂的運動過程;并且,機械臂系統(tǒng)可以根據(jù)機械臂末端位姿、速度或者力,通過運動學(xué)與動力學(xué)模型反解機械臂系統(tǒng)自身的狀態(tài)參數(shù)。由此可見,空間機械臂運動學(xué)與動力學(xué)模型的建立直接決定了后續(xù)機械臂執(zhí)行任務(wù)中的規(guī)劃過程與控制策略的選擇。

在空間機械臂運動學(xué)、動力學(xué)模型基本完善并成熟的基礎(chǔ)之上,規(guī)劃空間機械臂的運動過程??臻g機械臂的規(guī)劃技術(shù)總的來說是按照空間操控任務(wù)的需求和約束,規(guī)劃機械臂的運動過程,可細(xì)分為任務(wù)規(guī)劃、路徑規(guī)劃、軌跡優(yōu)化3 個層級。任務(wù)規(guī)劃指將任務(wù)需求、空間機械臂自身與環(huán)境作為約束條件,將機械臂的初始狀態(tài)和規(guī)劃目標(biāo)狀態(tài)所確定的規(guī)劃問題作為輸入,合理規(guī)劃出機械臂完成任務(wù)所需的行為決策和動作序列。路徑規(guī)劃指規(guī)劃出一條以指定位姿或期望構(gòu)型到達目標(biāo)點的末端執(zhí)行器路徑,是一個僅包含中間位置和姿態(tài)的幾何信息的集合。一般分為關(guān)節(jié)空間路徑規(guī)劃和笛卡爾空間路徑規(guī)劃,關(guān)節(jié)空間規(guī)劃一般使用基于梯形速度插值函數(shù)、基于多項式插值函數(shù)、基于樣條曲線等幾種插值函數(shù)生成軌跡,笛卡爾空間路徑規(guī)劃包含直線路徑規(guī)劃、圓弧路徑規(guī)劃、約束曲線等幾種規(guī)劃形式。軌跡的定義是指在幾何信息的基礎(chǔ)之上增加時間信息,即位置矢量和姿態(tài)角度對時間的微分信息,軌跡優(yōu)化一般指在路徑規(guī)劃基礎(chǔ)之上對路徑點的位置、速度、加速度進行優(yōu)化,進而達到對空間機械臂運動性能、任務(wù)執(zhí)行效率等指標(biāo)的優(yōu)化。軌跡優(yōu)化的典型應(yīng)用有避障軌跡規(guī)劃、避奇異軌跡規(guī)劃和非完整軌跡規(guī)劃3 種。

傳統(tǒng)的軌跡規(guī)劃方法大多依賴系統(tǒng)的運動學(xué)、動力學(xué)建模,計算量大,效率低下。并且,因為難以實現(xiàn)空間機械臂的自動建模、自動求解、自動控制,因此使得空間機械臂的應(yīng)用過程中缺乏可靠性與智能化。近年來隨著基于機器學(xué)習(xí)的人工智能算法的發(fā)展,將空間機械臂直接抽象為智能體,既能考慮到執(zhí)行任務(wù)所經(jīng)歷的中間路徑、速度、加速度對任務(wù)執(zhí)行效率的影響,也能結(jié)合機械臂自身約束及環(huán)境障礙約束,實現(xiàn)了輸入目標(biāo)狀態(tài)從而直接規(guī)劃出一條包含時間信息的機械臂關(guān)節(jié)角序列或者末端執(zhí)行器的軌跡序列。因此,機器學(xué)習(xí)類算法模糊了傳統(tǒng)路徑規(guī)劃和軌跡優(yōu)化的界限,使兩者融合為一種廣義的運動規(guī)劃過程。

1.2.3 控制技術(shù)

空間機械臂的控制技術(shù)指的是將規(guī)劃系統(tǒng)規(guī)劃出的期望動作作為輸入,結(jié)合傳感器采集的自身工況和環(huán)境感知信息,經(jīng)過控制算法計算后,輸出機械臂各個執(zhí)行機構(gòu)的控制信號,驅(qū)動機械臂完成期望動作。控制算法的性能直接決定了機械臂任務(wù)執(zhí)行的效率。

學(xué)術(shù)界有大量的空間機械臂控制方法被提出,經(jīng)典的控制方法主要有PID 控制、自適應(yīng)控制、滑模變結(jié)構(gòu)控制以及相關(guān)衍生方法。比例?積分?微分控制(Proportional?integral?derivative control,PID)是最早發(fā)展起來的控制策略,其應(yīng)用廣泛遍布于各個控制領(lǐng)域,其結(jié)構(gòu)簡單,只根據(jù)期望值和實際輸出值構(gòu)成控制偏差對被控對象進行控制,但易忽略系統(tǒng)中的非線性因素,難以實現(xiàn)高精度的控制。自適應(yīng)控制方法主要針對被控對象的數(shù)學(xué)模型、結(jié)構(gòu)參數(shù)的不確定性,修正自己的特性以適應(yīng)對象和擾動的動態(tài)特性的變化,在空間機械臂領(lǐng)域也有較多的應(yīng)用,但是在一些高度復(fù)雜、存在非線性時變的系統(tǒng)上的表現(xiàn)并不理想?;?刂剖且环N非線性控制方法,根據(jù)系統(tǒng)狀態(tài)偏離“滑動模態(tài)”的程度來切換控制器,由于該控制器的效果主要取決于滑模面的設(shè)計,因此對外界干擾、模型參數(shù)攝動和未建模動態(tài)特性有很強的魯棒性,但是當(dāng)狀態(tài)軌跡在切換面兩側(cè)來回切換時會產(chǎn)生振動。

空間機械臂作為一類典型的非線性、強耦合多體系統(tǒng),其對控制方法的穩(wěn)定性、精確性有著較高的要求。大量學(xué)者以基本控制方法為基礎(chǔ),針對某一特定場景或任務(wù),提出了許多典型控制方法,例如柔順控制、視覺伺服控制、軌跡跟蹤控制、協(xié)調(diào)控制等。這幾種典型的智能控制方法解決了經(jīng)典控制在面對復(fù)雜任務(wù)時的局限性,極大地豐富了空間機械臂可執(zhí)行的任務(wù)種類與提高了任務(wù)執(zhí)行的效率。

2 空間機械臂智能規(guī)劃

傳統(tǒng)空間機械臂操控主要采用預(yù)編程和遙操作兩種工作模式,前一模式下,空間機械臂按照預(yù)先編制的程序執(zhí)行任務(wù),會限制可執(zhí)行任務(wù)種類;后一模式下,人類在地面端對機械臂實施操控,會由于通訊延時導(dǎo)致任務(wù)執(zhí)行效率低下。近年來,隨著在軌服務(wù)與深空探測的不斷深入,空間機械臂需要執(zhí)行的任務(wù)種類增多,任務(wù)復(fù)雜程度增高,兩種傳統(tǒng)的工作模式難以滿足使用需求,因而其作業(yè)方式逐漸向“半自主”或“全自主”轉(zhuǎn)變,這一過程驅(qū)動著智能決策與規(guī)劃方法的進一步發(fā)展[16?18]。

2.1 任務(wù)規(guī)劃

空間機械臂的各種單一動作難以實現(xiàn)比如替換、轉(zhuǎn)移操作物這種復(fù)雜任務(wù),此類任務(wù)有較強的邏輯約束,因此需要引入任務(wù)規(guī)劃技術(shù)。任務(wù)規(guī)劃包含任務(wù)約束、規(guī)劃目標(biāo)與優(yōu)化原理3 個核心要素。任務(wù)約束包含機械臂自身約束與環(huán)境約束,機械臂自身約束指機械臂運動學(xué)、動力學(xué)模型、關(guān)節(jié)限位以及關(guān)節(jié)驅(qū)動能力等,環(huán)境約束指觀測設(shè)備視場、工作空間內(nèi)障礙物約束等;規(guī)劃目標(biāo)包含任務(wù)執(zhí)行策略、任務(wù)執(zhí)行時間以及末端行程要求等;優(yōu)化原理指的是在任務(wù)約束的條件下,結(jié)合規(guī)劃目標(biāo)求解空間機械臂高效完成操作任務(wù)過程中由初始狀態(tài)向目標(biāo)狀態(tài)轉(zhuǎn)移所經(jīng)歷的中間狀態(tài)序列的過程。任務(wù)規(guī)劃技術(shù)是實現(xiàn)智能化、自主化在軌操控的頂層,在任務(wù)的決策到最終執(zhí)行過程中起到了至關(guān)重要的作用。

最開始的機械臂任務(wù)規(guī)劃技術(shù)主要研究動作序列的自主生成過程。樊濱溫等[19]提出了一種基于環(huán)境模型的空間機械臂任務(wù)規(guī)劃算法,通過對三自由度空間機械臂捕獲靜態(tài)物體并在指定位置放置物體的任務(wù)研究,指出任務(wù)規(guī)劃的結(jié)果是機器人及其手爪在空間運動的目標(biāo)位置的序列,采用拓?fù)浣稻S法通過分解旋轉(zhuǎn)映射圖、構(gòu)造特征網(wǎng)、搜索聯(lián)通路徑進行路徑規(guī)劃得到機械臂執(zhí)行任務(wù)時的關(guān)節(jié)角度序列。

在早期的人工智能領(lǐng)域,F(xiàn)ikes 等[20]針對智能規(guī)劃問題提出了STRIPS 規(guī)劃方法,這也是最早的規(guī)劃建模語言,是其他規(guī)劃建模語言的雛形。進一步,Ghallab 等[21]提出了規(guī)劃領(lǐng)域定義語言(Plan?ning domain definition language,PDDL),該語言具有較完備的建模能力,形成了系統(tǒng)的任務(wù)描述形式。閻慧等[22]在PDDL 語言基礎(chǔ)之上,考慮空間機械臂太空作業(yè)的特殊性,根據(jù)空間機械臂任務(wù)規(guī)劃的特點,拓展了對資源和活動實例定義、活動的持續(xù)時間和活動效果屬性,提高了描述的準(zhǔn)確性以及規(guī)劃的效率。

基于STRIPS、PDDL 等格式語言描述的任務(wù)規(guī)劃方法只適用于假設(shè)的任務(wù)場景,難以適用于繁雜且不定的太空操作任務(wù)。為了更好地描述任務(wù)規(guī)劃過程,Blum 等[23]將STRPIS 型問題轉(zhuǎn)變?yōu)橥ㄟ^搜索可以解決的規(guī)劃問題,提出了圖規(guī)劃方法。該算法簡潔、拓展性強,但搜索效率較低,實際工作中會結(jié)合A*算法、模擬退火算法等提高其規(guī)劃效率。Likhachev 等[24]提出了啟發(fā)式搜索算法,通過啟發(fā)項在空間中搜索可行規(guī)劃解,避免狀態(tài)空間的完全遍歷。黃旭東[25]建立了空間機械臂任務(wù)規(guī)劃的通用框架,該框架采用分層模式規(guī)劃空間機械臂操作任務(wù),基于改進圖規(guī)劃算法實現(xiàn)任務(wù)剖面分析以獲得任務(wù)動作子序列,其中針對移動任務(wù),引入啟發(fā)式算法,將不能直接規(guī)劃的路徑分解為多段簡單路徑的組合。

隨著太空探索任務(wù)的開展,空間機械臂待執(zhí)行任務(wù)的復(fù)雜度逐步提升,這一特點對任務(wù)規(guī)劃算法提出了更高需求,如復(fù)雜環(huán)境下更高的任務(wù)規(guī)劃效率等。為適應(yīng)任務(wù)發(fā)展,任務(wù)規(guī)劃的研究向著群體化與智能化的方向繼續(xù)發(fā)展。劉曉瑩等[26]將正交混沌蟻群算法首次應(yīng)用于群機器人的任務(wù)規(guī)劃中,成功解決了中大規(guī)模任務(wù)規(guī)劃問題,提高了多機器人執(zhí)行任務(wù)的效率。余伶俐等[27]提出一種交互式仿生群協(xié)進化混合算法體系框架,求解速度較快,求解質(zhì)量較優(yōu)。Mokhtari 等[28]提出了一種可以使機器人根據(jù)以往經(jīng)驗進行學(xué)習(xí)的任務(wù)規(guī)劃方法,賦予機器人獲取知識、執(zhí)行各種任務(wù)和交互、適應(yīng)開放環(huán)境的能力,但難以適用于多機器人協(xié)同工作,且容易出現(xiàn)過擬合的情況。

任務(wù)規(guī)劃常在機械臂狀態(tài)空間中搜索可行解,然而一旦遇到規(guī)模龐大且復(fù)雜的任務(wù)場景,機械臂狀態(tài)空間維度可能會出現(xiàn)指數(shù)爆炸。分層任務(wù)網(wǎng)絡(luò)規(guī)劃(Hierarchical task network planning,HTN)的提出[29]很好地解決了這類問題,HTN 將目標(biāo)狀態(tài)用抽象的目標(biāo)任務(wù)替代,極大簡化了規(guī)劃過程的復(fù)雜度。Stock 等[30]以HTN 為基礎(chǔ),解決復(fù)雜服務(wù)機器人的任務(wù)規(guī)劃問題。Tomás 等[31]提出了一種用于解決多模態(tài)操控問題的HTN?DARRTH 框架,用于解決機械臂移動物體任務(wù)。王一帆等[32]針對空間機械臂在軌環(huán)境復(fù)雜、約束繁多、任務(wù)多樣的特點,提出了一種基于分層結(jié)構(gòu)的多約束任務(wù)規(guī)劃方法,將任務(wù)規(guī)劃過程劃分為任務(wù)剖面分析與任務(wù)中間點規(guī)劃兩個層次分別進行。劉茜等[33]針對月面著陸姿態(tài)、工作環(huán)境和機械臂變形等多種不確定因素,提出了月面采樣機械臂的動態(tài)任務(wù)規(guī)劃方法;設(shè)計了包括任務(wù)整體規(guī)劃、采樣策略規(guī)劃和運動控制規(guī)劃在內(nèi)的3 層規(guī)劃體系,將復(fù)雜月面采樣作業(yè)任務(wù)規(guī)劃問題分解為空間約束、時序推理和運動控制3 個維度分別求解。

上述的任務(wù)規(guī)劃算法大多針對特定任務(wù)場景,面對復(fù)雜、動態(tài)的場景泛化性較差,基于強化學(xué)習(xí)(Reinforcement learning,RL)的任務(wù)規(guī)劃算法在未來空間操控項目中的部署是一種必然趨勢。目前基于強化學(xué)習(xí)的任務(wù)規(guī)劃算法在地面工業(yè)、家用機器人系統(tǒng)中蓬勃發(fā)展,但是由于空間機械臂的操作對象一般是高價值的航天器,容錯率低,相關(guān)規(guī)劃策略仍處于研究驗證階段。因此,如何將仿真場景中訓(xùn)練好的任務(wù)規(guī)劃策略網(wǎng)絡(luò)遷移至空間機械臂系統(tǒng)中,是今后空間機械臂任務(wù)規(guī)劃技術(shù)研究的關(guān)鍵。

2.2 運動規(guī)劃

為使空間機械臂以最優(yōu)的性能穩(wěn)定地完成操作任務(wù),既要規(guī)劃出空間機械臂的工作路徑,也要規(guī)劃出滿足運行時間、能耗、避障等多方面約束的軌跡,即對空間機械臂進行運動規(guī)劃。星表機械臂一般固定在移動設(shè)備上,基座固定,其軌跡規(guī)劃方法可以沿用地面機械臂的軌跡規(guī)劃方法。但是,在軌服務(wù)狀態(tài)下的空間機械臂處于失重狀態(tài),基座不固定且受到機械臂運動的影響,導(dǎo)致整個系統(tǒng)存在非完整性約束,無法使用地面機械臂軌跡規(guī)劃方法求解。并且基座與機械臂之間存在動力學(xué)耦合,導(dǎo)致規(guī)劃過程中易出現(xiàn)動力學(xué)奇異問題[34]。

為解決上述問題,傳統(tǒng)方法先對空間機械臂系統(tǒng)進行動力學(xué)耦合分析,在此基礎(chǔ)之上對機械臂進行軌跡規(guī)劃。Yoshida等[35]采用求廣義雅可比逆矩陣的方式進行軌跡規(guī)劃。Xi等[36]回避了對系統(tǒng)廣義雅可比矩陣的逆運動學(xué)解算,利用機械臂的雅可比矩陣提出了3 種避免動態(tài)奇異點的方法:隱式近似?線性規(guī)劃方法(Implicit approximate?linear?programming,IALP)和兩種加速隱式近似?線性規(guī)劃方法(Accel?erated implicit approximate?linear?programming mothods)AIALPA 和AIALPB,但算法精度較低。劉厚德[37]通過建立“基座質(zhì)心等效機械臂模型”,分析等效機械臂位置級逆運動學(xué),求解平衡臂的運動軌跡,從而回避了雅可比奇異問題。徐文福[38]使用多項式函數(shù)對關(guān)節(jié)角進行參數(shù)化,通過參數(shù)化的關(guān)節(jié)軌跡得到末端位姿相對于待定參數(shù)之間的函數(shù)關(guān)系,再使用牛頓迭代法求解待定參數(shù)。黃興宏等[39]使用最優(yōu)控制策略,將軌跡規(guī)劃問題轉(zhuǎn)換為最優(yōu)控制問題,設(shè)計了一種全程恒定基座姿態(tài)零擾動的末端位姿軌跡規(guī)劃方法。

隨著群體智能算法的興起,Lin[40]提出一種基于粒子群算法和K?means 聚類的方法來求解最小加速度關(guān)節(jié)軌跡的近似最優(yōu)解,計算速度快,方法統(tǒng)一。劉勇[41]針對大負(fù)載點到點的空間機械臂軌跡優(yōu)化問題,提出了一種基于多目標(biāo)粒子群優(yōu)化的軌跡優(yōu)化算法,有效提升了空間機械臂的最大負(fù)載能力。隨后,有學(xué)者提出基于快速擴展隨機樹(Rapidly?exploring random trees,RRT)的機械臂全局規(guī)劃方法,基于RRT 的算法在一定程度上解決了奇點問題[42]。關(guān)英姿等[43]提出一種改進RRT算法,在機械臂接近捕獲目標(biāo)的過程中,若目標(biāo)運動狀態(tài)估計的精度不夠高,則使用此改進RRT 算法規(guī)劃安全軌跡。閆碩[44]針對任務(wù)目標(biāo)可變的空間機械臂路徑重規(guī)劃任務(wù),提出了一種結(jié)合概率人工勢場法的RRT 優(yōu)化策略,使機械臂執(zhí)行采樣任務(wù)時可以適應(yīng)任務(wù)環(huán)境和目標(biāo)的變化。

上述針對空間機械臂的軌跡規(guī)劃大多基于多體動力學(xué)模型來實現(xiàn),若是遇到柔性部件的航天器,動力學(xué)模型難以確立,群體智能算法又通常會陷入局部最優(yōu)解。隨著人工智能技術(shù)研究的興起,廣大學(xué)者將深度學(xué)習(xí)、強化學(xué)習(xí)等學(xué)習(xí)類算法運用到機械臂的運動規(guī)劃過程中。深度學(xué)習(xí)(Deep learning,DL)適合歸納與總結(jié)經(jīng)驗、知識,強化學(xué)習(xí)利用智能體與環(huán)境交互獲得的樣本信息為深度學(xué)習(xí)提供經(jīng)驗數(shù)據(jù)。因此,將深度學(xué)習(xí)與強化學(xué)習(xí)結(jié)合起來的深度強化學(xué)習(xí)(Deep reinforcement learning,DRL)可以實現(xiàn)機械臂從感知到?jīng)Q策控制的端到端的學(xué)習(xí)。Actor?Critic 框架是目前深度強化學(xué)習(xí)的一種通用架構(gòu),包括策略網(wǎng)絡(luò)(Actor)和評價網(wǎng)絡(luò)(Critic)。

徐帷等[45]針對實現(xiàn)空間機械臂目標(biāo)跟蹤及避障的規(guī)劃問題,使用Sarsa(λ)強化學(xué)習(xí)方法,基于目標(biāo)偏差和障礙距離設(shè)計獎勵函數(shù),進行機械臂轉(zhuǎn)動動作的強化訓(xùn)練,更新機械臂關(guān)節(jié)的狀態(tài)?動作值函數(shù)表,用于自主路徑規(guī)劃與智能決策。解永春等[18]使用標(biāo)準(zhǔn)Actor?Critic 算法框架,研究在軌燃料補加的自主規(guī)劃問題,將仿真場景中訓(xùn)練好的策略網(wǎng)絡(luò)遷移到現(xiàn)實物理試驗系統(tǒng)中,使機械臂具備端到端的視覺伺服能力。

捕獲任務(wù)的規(guī)劃目前是強化學(xué)習(xí)在空間機械臂應(yīng)用中的研究熱點之一。Liang 等[46]設(shè)計了一種基于Actor?Critic 算法的機器人深度強化學(xué)習(xí)運動控制模型,通過三角函數(shù)變換獎勵函數(shù),統(tǒng)一了距離和角度的評價標(biāo)準(zhǔn),極大提高了收斂效率,并且在仿真平臺中實現(xiàn)了六自由度空間機械臂對目標(biāo)的捕獲。Wu 等[47]針對目標(biāo)相對于自由漂浮空間機械臂有相對運動的情況,提出一種無模型強化學(xué)習(xí)策略,即深度確定性策略梯度算法(Deep de?terministic policy gradient,DDPG),在不建立空間機械臂動力學(xué)和運動學(xué)模型的情況下訓(xùn)練在線軌跡規(guī)劃策略,使空間機械臂能夠快速調(diào)度和執(zhí)行動作。趙毓等[48]針對空間機械臂對勻速運動目標(biāo)捕捉問題,提出了一種改進深度確定性策略梯度算法,基于機械臂與目標(biāo)相對距離以及任務(wù)操作的總時間設(shè)計獎勵函數(shù),建立了“線下集中學(xué)習(xí),線上分布執(zhí)行”的目標(biāo)捕捉訓(xùn)練系統(tǒng)。曹鈺雪等[49]基于DDPG 框架分別提出了使用雙估值網(wǎng)絡(luò)和策略參數(shù)噪聲的改進算法及基于后見經(jīng)驗回放(Experience replay)的多目標(biāo)算法,實現(xiàn)了針對固定或者隨機目標(biāo)的抓捕操作。孫康等[50]使用DDPG 框架,結(jié)合關(guān)節(jié)控制力矩、抓捕距離以及相對速度設(shè)計獎勵函數(shù),實現(xiàn)對空間漂浮基機械臂的快速抓捕控制,且能有效降低接觸碰撞力的大小。俞志成[51]使用DDPG 框架學(xué)習(xí)冗余機械臂雙臂路徑規(guī)劃策略,實現(xiàn)了空間球形旋轉(zhuǎn)球形(Spherical?revolute?spherical,SRS)冗余機械臂對目標(biāo)衛(wèi)星的捕獲。杜德嵩[52]分別使用傳統(tǒng)捕獲控制方法、無模型深度強化學(xué)習(xí)方法和基于模型的強化學(xué)習(xí)算法展開了對空間機械臂智能捕獲策略的研究,對比3 種方法的優(yōu)劣,得出:傳統(tǒng)控制方法不需要訓(xùn)練,捕獲位置精度高于其他方法,但是對控制器參數(shù)非常敏感;而另外兩種基于強化學(xué)習(xí)方法的捕獲策略對于不同參數(shù)的控制器適應(yīng)能力較強,但是完成任務(wù)耗時低于傳統(tǒng)方法。Yan 等[53]使用Soft?Q 算法來訓(xùn)練基于隨機能量場的空間機械臂運動規(guī)劃策略,首先基于最大熵目標(biāo)構(gòu)造了Soft?Q 網(wǎng)絡(luò)和狀態(tài)條件隨機策略網(wǎng)絡(luò),然后構(gòu)建經(jīng)驗重放池來存儲在SQL 過程下訓(xùn)練兩個網(wǎng)絡(luò)的訓(xùn)練樣本,接著訓(xùn)練策略,使累積獎勵和策略熵最大化,最后在仿真環(huán)境中實現(xiàn)了單臂和雙臂自由漂浮空間機械臂的目標(biāo)捕獲。

空間機械臂實現(xiàn)自主運動規(guī)劃能力的一個關(guān)鍵在于從以往的操作任務(wù)經(jīng)驗中學(xué)習(xí),實現(xiàn)對已有知識的更新和推理,并通過不斷地自學(xué)習(xí)或互學(xué)習(xí)獲取新知識,提升自主運動規(guī)劃的性能以能夠處理將來會遇到的任務(wù)需求。使用深度強化學(xué)習(xí)方法進行空間機械臂運動規(guī)劃的優(yōu)點在于:面對不同的環(huán)境約束算法的泛化性較強;回避了空間機械臂的運動學(xué)和動力學(xué)建模;不易陷入局部最優(yōu)解;降低了實時計算量。但是,現(xiàn)階段大多數(shù)基于強化學(xué)習(xí)的運動規(guī)劃算法都在仿真場景中學(xué)習(xí)、訓(xùn)練,向真實環(huán)境中的移植與遷移略顯匱乏。

3 空間機械臂運動控制

空間機械臂在不同的應(yīng)用場景下或不同的任務(wù)背景下,其約束、指標(biāo)等也會有所區(qū)別。例如自由漂浮或者自由飛行狀態(tài)下的空間機械臂基座不固定,并且關(guān)節(jié)運動時會與基座產(chǎn)生耦合運動。因此,相關(guān)學(xué)者基于基本控制方法,提出了專門針對特定任務(wù)場景的空間機械臂控制技術(shù)。

3.1 柔順控制

利用空間機械臂執(zhí)行接觸型操作任務(wù)時,機械臂末端會因為與目標(biāo)載荷發(fā)生接觸碰撞產(chǎn)生碰撞力或碰撞擾動。例如,當(dāng)空間機械臂進行裝配工作時,控制誤差會導(dǎo)致機械臂裝配過程中擠壓到目標(biāo)物體的管壁從而產(chǎn)生較大的應(yīng)力,通過六維力傳感器讓機械臂感應(yīng)到與目標(biāo)物體之間的相互作用力,柔順控制會針對受力方向?qū)σ?guī)劃好的路徑進行修正,使裝配任務(wù)正常進行,防止機械臂和目標(biāo)物體在碰撞過程中損壞。

傳統(tǒng)柔順控制方式主要分3 種:力/位混合控制、阻抗控制和自適應(yīng)控制。力/位混合控制可以直接實現(xiàn)對接觸力的控制,徐文福等[54]針對空間機械臂在軌更換ORU 模塊過程中提出了一種改進的力位混合控制方法,采用加權(quán)選擇矩陣代替經(jīng)典力/位混合控制中原有的選擇矩陣,實現(xiàn)了位置、力混合控制的平滑切換。阻抗控制對于機械臂與環(huán)境接觸狀態(tài)的切換有很強的適應(yīng)性,Hogan[55]提出了阻抗控制用來處理機械臂和環(huán)境的動力學(xué)耦合;Stolfi 等[56]采用力矩控制的阻抗控制方法進行機器人裝配,通過末端的力、速度、加速度這些間接量來控制機械臂輸出力矩的大小。周昱城[57]針對空間機械臂大負(fù)載自主裝任務(wù)的力接觸問題,結(jié)合空間機械臂動力學(xué)方程與離散和連續(xù)碰撞力的分析,先對自主裝系統(tǒng)閉鏈?zhǔn)浇Y(jié)構(gòu)進行動力學(xué)建模,再設(shè)計阻抗控制策略實現(xiàn)任務(wù)過程中的力接觸跟蹤。Wang 等[58]針對機械臂末端與自旋目標(biāo)之間發(fā)生接觸的場景,先消除基座加速度項對關(guān)節(jié)運動和基座運動解耦,再構(gòu)建空間雙臂機器人協(xié)調(diào)操作系統(tǒng)的統(tǒng)一動力學(xué)模型,設(shè)計了一種協(xié)調(diào)操作柔順控制策略,實現(xiàn)了對接觸力的精確控制。Pan等[59]基于滑模阻抗控制律,建立了一種改進的等效剛度模型,設(shè)計了接觸擾動的最優(yōu)補償項,有效地減輕了由于接觸力的突然變化而引起的碰撞。但上述方法無法對外界的干擾進行修正,且控制精度會受控制模型影響。因此在此基礎(chǔ)上引入自適應(yīng)控制方法,通過對比任務(wù)要求性能指標(biāo)和實際性能指標(biāo)獲得的信息來修正控制器,減小模型參數(shù)與實際參數(shù)不匹配的問題。Love 等[60]較早使用了遞歸最小二乘法來辨識環(huán)境剛度,從而調(diào)整柔順控制器的參數(shù)。Colton 等[61]使用了指數(shù)加權(quán)遞歸最小二乘法辨識非線性模型,實現(xiàn)對非線性系統(tǒng)的精確控制。自適應(yīng)控制不需要精確的動力學(xué)模型,并且可以根據(jù)動力學(xué)特征和環(huán)境特征自適應(yīng),但是自適應(yīng)算法的計算量較大。這3 種柔順控制方法都需要建立機械臂動力學(xué)方程,但是空間機械臂的工作環(huán)境復(fù)雜、耦合關(guān)系復(fù)雜、不確定性強,其動力學(xué)模型難以精確描述。

為解決這一問題,有人提出將智能算法引入柔順控制的想法,利用智能算法高度非線性逼近映射的能力解決上述問題。Touati 等[62]將神經(jīng)網(wǎng)絡(luò)引入力/位混合控制,可以在沒有準(zhǔn)確的系統(tǒng)動力學(xué)模型的情況下實現(xiàn)力/位控制完成軸孔裝配任務(wù)。Tsuji 等[63]針對特定的接觸型操作任務(wù),提出了一種使用神經(jīng)網(wǎng)絡(luò)調(diào)節(jié)機械臂末端執(zhí)行器阻抗參數(shù)的方法。該方法在自由運動過程中訓(xùn)練用于位置和速度控制的神經(jīng)網(wǎng)絡(luò),在接觸運動過程中訓(xùn)練用于力控制和環(huán)境識別的神經(jīng)網(wǎng)絡(luò),從而減少位置和力的控制誤差,以達到更好的柔順控制效果。

在柔順控制中的不確定因素主要來源于兩個方面,一方面是太空中碰撞模型復(fù)雜難以描述,另一方面是環(huán)境信息難以測量和辨識。利用以神經(jīng)網(wǎng)絡(luò)為代表的智能算法可以有效地逼近真實的碰撞模型,對模型中的未知項進行描述,提高控制模型的精度,從而提升柔順控制的效果。

3.2 視覺伺服控制

為了增強空間機械臂對環(huán)境的感知能力,引入了視覺伺服控制。視覺伺服可以為機器臂提供自身定位、目標(biāo)物體的位姿和環(huán)境信息,給空間機械臂系統(tǒng)規(guī)劃和控制提供依據(jù)。視覺伺服按相機安裝位置可分為手眼相機(Eye?in?hand)、全局相機(Eye?to?hand)兩種,按特征類型可分為基于位置的視覺伺服(Position?based visual servo,PBVS)、基于圖像特征的視覺伺服(Image?based visual ser?vo,IBVS)兩種,其中基于圖像特征的手眼相機系統(tǒng)的視覺伺服研究最為廣泛[64]。

基于位置的視覺伺服需要將視覺信息轉(zhuǎn)換到笛卡爾空間,在3D 笛卡爾空間構(gòu)成閉環(huán)控制系統(tǒng)。在空間機械臂的研究中,有許多基于位置的視覺伺服方案,例如SPDM 完成的在軌燃料加注實驗中,地面操作人員利用機械臂自帶的相機觀察工具槽上的視覺標(biāo)記作為視覺反饋。Nagamatsu 等[65]提出了一種針對翻滾衛(wèi)星的捕獲任務(wù)的視覺伺服控制策略,利用安裝在基座的相機,結(jié)合卡爾曼濾波方法,根據(jù)圖像信息去估計目標(biāo)衛(wèi)星的位姿,但是目標(biāo)特征點可能會被機械臂遮擋。劉冬雨等[66]為完成空間機械臂系統(tǒng)在軌擰松螺釘任務(wù),提出了一種基于人機協(xié)同的空間機械臂在軌維修視覺伺服操控策略,修正了微重力環(huán)境和機械臂、模擬維修單機在軌安裝導(dǎo)致的位姿偏差,并通過了在軌實施。胡碩等[67]提出了一種基于加速魯棒特征(Speeded up robust features,SURF)的靜態(tài)目標(biāo)識別算法,通過對目標(biāo)圖像提取SURF 與目標(biāo)圖像特征點匹配,然后利用先驗知識求解目標(biāo)的位置信息,實現(xiàn)伺服定位。

基于圖像特征的視覺伺服方法利用視覺信息獲得被觀測對象在2D 圖像空間的特征,與期望的圖像特征相比較形成誤差,根據(jù)該誤差設(shè)計控制律。通常利用圖像雅克比矩陣設(shè)計機器人的控制律,具有較好的局部穩(wěn)定性以及較高的精度。有很多視覺伺服任務(wù)中通常使用的方法是復(fù)合視覺伺服,即先通過基于位置的方法進行初步的對準(zhǔn),再通過基于圖像的方法進行精確的趨近。Hafez等[68]提出了一種用于雙臂空間機械臂的IBVS 策略,以視覺伺服為主要任務(wù),以姿態(tài)干擾最小化為次要任務(wù),采用基于增廣廣義雅可比矩陣的控制和任務(wù)函數(shù)的方法,實現(xiàn)了機械臂末端執(zhí)行器的對齊。Alepuz 等[69]提出了一種IBVS 控制策略來實現(xiàn)自由漂浮機器人的制導(dǎo),該控制策略結(jié)合了空間機械臂系統(tǒng)運動學(xué)和動力學(xué),獲得了被觀測對象的期望位置,實現(xiàn)了對其的軌跡跟蹤。Marchionne等[70]將兩種IBVS 策略依次使用,一種只關(guān)注末端執(zhí)行器的線性運動,一種只關(guān)注末端執(zhí)行器的旋轉(zhuǎn),有效緩解了特征識別和匹配過程中的小誤差在控制計算中產(chǎn)生大誤差的現(xiàn)象,提高了機械臂執(zhí)行任務(wù)的成功率。徐昊[71]提出了一種空間機械臂在軌捕獲過程中,自由漂浮機械臂手眼相機構(gòu)型下的一種IBVS 控制策略,推導(dǎo)了深度獨立視覺雅可比矩陣、設(shè)計了目標(biāo)特征點運動估計器,從而估計目標(biāo)的運動以及特征點的深度信息。張國亮等[72]提出了一種復(fù)合視覺伺服控制策略,通過在線估計目標(biāo)的深度和旋轉(zhuǎn)姿態(tài)來選擇PBVS 和IBVS 控制器,涉及旋轉(zhuǎn)伺服的大范圍運動時選擇PBVS 控制器,小范圍運動時則使用IBVS 控制器,同時保留了兩種伺服方法的優(yōu)點。

基于位置的視覺伺服具有3 大缺陷:由相機標(biāo)定引入的測量誤差、視野范圍內(nèi)特征點丟失以及對特征點的幾何信息的先驗知識,因此無法實現(xiàn)高精度的控制?;趫D像的視覺伺服在參數(shù)求解時容易出現(xiàn)的多解問題以及圖像雅克比矩陣奇異問題導(dǎo)致其在全局性能上表現(xiàn)不好,容易丟失目標(biāo)。基于深度學(xué)習(xí)的IBVS 控制器以更優(yōu)秀的特征提取能力、去噪能力獲得很多研究人員的青睞,但是由于模型參數(shù)規(guī)模和計算量巨大的問題難以實現(xiàn)在軌驗證。

3.3 軌跡跟蹤控制

空間機械臂軌跡跟蹤控制是在軌服務(wù)完成特定任務(wù)的關(guān)鍵技術(shù),軌跡跟蹤控制就是采用對應(yīng)的控制算法解算,生成機械臂關(guān)節(jié)的控制力矩,使空間機械臂在關(guān)節(jié)空間和笛卡爾空間中隨期望的路徑運動。

由于漂浮空間機械臂系統(tǒng)的高度非線性、非完整性、強耦合性,使軌跡跟蹤的控制問題變得十分復(fù)雜,傳統(tǒng)的控制算法如分解運動速率控制(Re?solved motion rate control,RMRC)和分解加速度控 制(Resolved motion acceleration control,RMAC)無法滿足機械臂控制中的不確定性,也沒考慮整體機器人系統(tǒng)的強耦合性,在此基礎(chǔ)上加入了自適應(yīng)算法來解決軌跡控制過程中的不確定性。Walker 等[73]對空間機械臂系統(tǒng)慣性參數(shù)不確定性問題提出了一種全局穩(wěn)定的自適應(yīng)軌跡跟蹤方法,該方法可以實現(xiàn)對機械臂和基座衛(wèi)星姿態(tài)角的穩(wěn)定跟蹤。Gu 等[74]針對自由漂浮空間機械臂提出了擴展機器人模型,并基于此模型設(shè)計了一個自適應(yīng)控制策略,克服了動力學(xué)方程參數(shù)化及笛卡爾空間轉(zhuǎn)到關(guān)節(jié)空間的不確定性問題。自適應(yīng)算法可以有效處理系統(tǒng)中的不確定項,但其計算復(fù)雜、收斂時間慢,無法滿足機械臂控制系統(tǒng)的實時性。除了自適應(yīng)算法,魯棒控制方法也是常用的處理系統(tǒng)中不確定項的常用方法之一。Chu 等[75]提出了一種自由漂浮空間機械臂軌跡跟蹤控制方法,該方法將空間機械臂動力學(xué)中的關(guān)節(jié)耦合項和模型不確定性統(tǒng)一看作集中干擾,并采用觀測器對干擾進行觀測。Tang 等[76]對雙臂自由漂浮空間機械臂,提出了一種魯棒反步控制方法,有效地克服了系統(tǒng)不確定性。但魯棒控制方法的精度較低,在空間機械臂進行精細(xì)操作的時候無法滿足任務(wù)要求。

近幾年隨著機器學(xué)習(xí)的興起,通過將智能控制算法與主流控制算法結(jié)合來解決自適應(yīng)算法計算復(fù)雜、收斂速度慢和魯棒控制算法精度低的問題。吳愛國等[77]針對多自由度機械臂在實現(xiàn)軌跡跟蹤控制時過于依賴機械臂的精確數(shù)學(xué)模型和跟蹤精度低等問題,提出了一種將自適應(yīng)神經(jīng)網(wǎng)絡(luò)、局部模型與積分型終端滑模相結(jié)合的控制方法,提高了系統(tǒng)的收斂速度和控制精度,實現(xiàn)機械臂高精度軌跡跟蹤。劉元基等[78]設(shè)計了基于強化學(xué)習(xí)的機械臂輸入飽和固定時間軌跡跟蹤控制方法,賦予控制器對模型不確定性的在線學(xué)習(xí)能力,以適應(yīng)太空中的不確定因素。但是,算法依舊存在一些問題,比如其控制系統(tǒng)需要大量的時間訓(xùn)練,經(jīng)過大量的試錯才能達到比較精確的控制效果,而這些條件在太空上是難以滿足的。

在軌跡跟蹤控制中,限制空間機械臂軌跡跟蹤精度的因素主要有兩個方面,一方面是機械臂動力學(xué)模型中的不確定項,另一方面是太空環(huán)境干擾所帶來的不確定因素。智能算法可以通過神經(jīng)網(wǎng)絡(luò)的在線學(xué)習(xí)能力使實際控制輸出量越來越接近目標(biāo)輸出,并對太空之中不定項進行擬合,提高軌跡跟蹤控制的精度和魯棒性,且控制器的控制參數(shù)會隨環(huán)境改變而變化,以提高空間機械臂對環(huán)境的適應(yīng)性。

3.4 協(xié)調(diào)控制

多臂機器人比單臂機器人具有更高的工作效率和更多樣的任務(wù)能力,可以適應(yīng)更多的應(yīng)用場景而受到關(guān)注。多臂機器人的協(xié)同控制就是根據(jù)任務(wù)需求,多機械臂之間配合工作提升工作效率,防止競爭的產(chǎn)生。目前的協(xié)調(diào)算法主要分成兩種:把軌跡作為約束條件的主從控制和在約束環(huán)境不同方向上進行位置和力控制的位置/力混合控制算法。主從控制是先規(guī)劃出主機械臂的軌跡將其作為從機械臂的約束條件。位置/力混合控與單臂的位置/力混合控制方法類似但更加復(fù)雜[79]。

趙閣等[80]用拓?fù)鋵W(xué)的知識,定義主從機械臂間同步誤差,基于無向圖放松約束條件,設(shè)計同步控制算法,減小主從機械臂間的同步誤差。李樹榮等[81]對受柔性關(guān)節(jié)和時間滯后影響的多機械臂位置/力控制問題,提出了一種自適應(yīng)位置/力控制策略來保證閉環(huán)系統(tǒng)穩(wěn)定性和多機械臂的運動跟蹤性能,通過利用神經(jīng)網(wǎng)絡(luò)的擬合能力來避免多機械臂系統(tǒng)建模對穩(wěn)定性的影響,并考慮了位置誤差和力誤差對控制算法的影響。Ge 等[82]出了一種阻抗控制算法,該算法允許多個機械臂協(xié)調(diào)控制捕獲目標(biāo),通過在機械臂末端引入?yún)⒖甲杩?,使末端?zhí)行器能像質(zhì)量阻尼?彈簧系統(tǒng)一樣響應(yīng)末端執(zhí)行器與非合作目標(biāo)之間的任何接觸力,該方法具有良好的控制性能。傳統(tǒng)的協(xié)調(diào)控制算法大多采用的控制方法基于機械臂復(fù)雜的數(shù)學(xué)模型,這導(dǎo)致算法對環(huán)境模型有很強的依賴性。控制算法的精度會隨工作環(huán)境的改變而降低。

相比于傳統(tǒng)的控制算法,基于智能學(xué)習(xí)的協(xié)調(diào)控制算法不依賴環(huán)境模型具有良好的有魯棒性、通用性。劉錢源[83]設(shè)計了一種基于深度強化學(xué)習(xí)的多智能體協(xié)同算法,該算法能夠自主探索動作空間,減少智能體之間的競爭,增加整體協(xié)作能力。周順[84]將強化學(xué)習(xí)算法應(yīng)用到三機械臂抓取長方體物塊的任務(wù)中,提高了三機械臂機器人的控制算法的泛化性?;谥悄軐W(xué)習(xí)的協(xié)調(diào)控制算法雖然有良好的魯棒性、通用性,但每當(dāng)多臂系統(tǒng)更換工作環(huán)境的時候都需要較長的時間訓(xùn)練控制器參數(shù),才能達到滿足任務(wù)需求的操作精度和工作效率。

在協(xié)調(diào)跟蹤控制中,由于多臂系統(tǒng)比單臂系統(tǒng)的控制參數(shù)更多,受外界干擾的影響更大,神經(jīng)網(wǎng)絡(luò)可以有效地應(yīng)對外界的干擾并且依靠其強大的非線性擬合能力擬合多臂系統(tǒng)的動力學(xué)模型,對動力學(xué)模型中的未知項進行更準(zhǔn)確的描述,避免通過多臂系統(tǒng)中復(fù)雜的耦合關(guān)系解算控制輸出量,減小算法的運算量,從而提高控制效率。但是智能算法需要更長的時間對控制參數(shù)進行訓(xùn)練,才能達到相應(yīng)的控制精度,并且在訓(xùn)練過程中有可能造成機械臂的損壞。

4 發(fā)展趨勢與展望

空間機械臂技術(shù)是實現(xiàn)空間操控自主化和智能化關(guān)鍵技術(shù)之一,人工智能技術(shù)將極大地提升空間機械臂的自主能力和協(xié)作能力。隨著人工智能的發(fā)展和計算機性能的不斷提高,空間機械臂有望在復(fù)雜、非結(jié)構(gòu)化環(huán)境中的感知、規(guī)劃和控制,以及處理突發(fā)、復(fù)雜情況等方面獲得突破。一方面可提高空間機械臂靈活性以應(yīng)對復(fù)雜的環(huán)境和操作任務(wù);另一方面提高空間機械臂系統(tǒng)的穩(wěn)定性以實現(xiàn)長期可靠服役。基于此,本文總結(jié)了以下幾點對空間機械臂技術(shù)的發(fā)展趨勢,并對其應(yīng)用進行了展望。

4.1 多模態(tài)感知融合

人工智能算法可以將視覺、觸覺、聽覺、力覺等多種傳感器的信息進行融合處理,提高空間機械臂感知的可靠性、魯棒性以及可信度,為機械臂后續(xù)的決策、規(guī)劃提供更加可靠的依據(jù)。然而,現(xiàn)階段空間機械臂系統(tǒng)配備的各種類型的傳感器主要還是獨立使用??紤]到控制系統(tǒng)應(yīng)該更有效地對多種類型的感知信息進行綜合利用,后續(xù)的研究應(yīng)當(dāng)從數(shù)據(jù)層、特征層、決策層3 個層級對多類型感知信息進行融合。數(shù)據(jù)層融合是初級的信息融合,雖然能保留大量的原始信息數(shù)據(jù),但數(shù)據(jù)量過于龐大、冗余。中間級別的特征層融合通過降維操作提取了原始感知數(shù)據(jù)的特征向量,為后續(xù)分類、匹配打下基礎(chǔ)。最高級別的決策層融合了每種傳感器數(shù)據(jù)經(jīng)過特征層提取的特征后,決策出一致的最優(yōu)值。

4.2 技能遷移

在軌裝配、在軌維護與星表建設(shè)是執(zhí)行長期空間操控任務(wù)的重要保證,其中充斥著大量的搬運、組裝等同質(zhì)化的勞動。傳統(tǒng)的作業(yè)編程方式在面對簡單機械式的重復(fù)勞動時效率較高。但是,在面對復(fù)雜、非重復(fù)性勞動時,傳統(tǒng)作業(yè)編程方式難以遷移至新的任務(wù)環(huán)境中或者適應(yīng)新的環(huán)境約束。技能遷移與示教學(xué)習(xí)方法通過降低搜索策略空間的復(fù)雜度,使機器人獲得任務(wù)快速學(xué)習(xí)能力和技能優(yōu)化能力,在面對空間操控任務(wù)中的不同約束下的同質(zhì)化操作時,能夠準(zhǔn)確快速地對任務(wù)進行識別與復(fù)現(xiàn),從而達到技能遷移的目的。然而,技能遷移需要采集大量人類示教數(shù)據(jù)并進行訓(xùn)練,對數(shù)據(jù)集的要求以及計算能力要求較高。在未來將示教學(xué)習(xí)方法運用到空間機械臂規(guī)劃算法的過程中,最大的難點是如何在小規(guī)模的訓(xùn)練樣本下,實現(xiàn)對任務(wù)特征的提取與建模。

4.3 自適應(yīng)控制

自適應(yīng)控制方法可以辨識隨復(fù)雜、非線性系統(tǒng)的動力學(xué)模型,傳統(tǒng)的自適應(yīng)控制有穩(wěn)定性差、收斂速度慢等問題。空間機械臂作為一種高度復(fù)雜的非線性系統(tǒng),系統(tǒng)建模誤差和外界擾動無法避免,這對基于模型的傳統(tǒng)控制方法提出了很高的要求。與神經(jīng)網(wǎng)絡(luò)或強化學(xué)習(xí)結(jié)合的自適應(yīng)控制方法,在模型未知、沒有先驗經(jīng)驗的條件下,能夠快速適應(yīng)對象動態(tài)特性的變化,并通過神經(jīng)網(wǎng)絡(luò)調(diào)整控制策略,由此提高軸孔裝配、目標(biāo)捕獲等任務(wù)執(zhí)行的可靠性。但是,空間機械臂特殊的作業(yè)環(huán)境導(dǎo)致其對控制系統(tǒng)穩(wěn)定性的要求較高,基于學(xué)習(xí)的自適應(yīng)控制方法目前仍然面臨訓(xùn)練久、收斂難的問題,難以在理論上保證控制穩(wěn)定性。上述問題均需要在未來研究中著重解決。

4.4 多智能體與多臂協(xié)同

當(dāng)單臂系統(tǒng)難以完成甚至無法完成復(fù)雜的空間操控任務(wù)時,需要依靠多智能體協(xié)同的決策與規(guī)劃技術(shù),因此亟須針對不同類型的操作任務(wù)及空間機械臂系統(tǒng),發(fā)展多智能體協(xié)同任務(wù)的集群智能規(guī)劃與控制技術(shù)。雖然相對于單機械臂系統(tǒng),多機械臂協(xié)同系統(tǒng)對于規(guī)劃管理的難度呈指數(shù)級上升,增加了系統(tǒng)協(xié)調(diào)管理的難度、系統(tǒng)整體狀態(tài)的不確定性等,但是通過多條機械臂共同完成任務(wù),可以從根本上突破單機械臂運動空間與運動控制的限制,完成更高難度的操作任務(wù)。多臂協(xié)同系統(tǒng)已有在軌應(yīng)用的實例但尚未成熟,許多協(xié)同操作任務(wù)仍處于地面試驗階段。

5 結(jié)束語

隨著空間技術(shù)的不斷發(fā)展,人類探索太空的活動獲得了進一步的延伸,空間機械臂作為空間操控任務(wù)的重要裝備,擁有廣闊的應(yīng)用前景??臻g機械臂技術(shù)具有技術(shù)發(fā)展的“需求效應(yīng)”,對機械、電子、通信、信息等行業(yè)有著強烈的牽引作用,可帶動相關(guān)產(chǎn)業(yè)技術(shù)的進步和升級??臻g機械臂技術(shù)更是衛(wèi)星應(yīng)用、太空農(nóng)業(yè)、太空工業(yè)等領(lǐng)域的重要技術(shù)裝備,極大地推動了國家經(jīng)濟與科研水平的發(fā)展。此外,隨著人工智能、大數(shù)據(jù)、人機共融等前沿技術(shù)的興起,許多新技術(shù)、新思想被引入空間機械臂系統(tǒng)的設(shè)計,為其發(fā)展帶來新的可能與機遇。

現(xiàn)階段空間機械臂的操作任務(wù)對象仍多為合作目標(biāo),但是空間操控任務(wù)復(fù)雜多變,以非合作為目標(biāo)的操作對象的任務(wù)越來越多,亟須加強推進空間機械臂系統(tǒng)智能化的研究。本文介紹了空間機械臂關(guān)鍵技術(shù)中的任務(wù)規(guī)劃、運動規(guī)劃以及運動控制技術(shù),這些技術(shù)在空間機械臂自主化、智能化道路上扮演了重要角色,極大地提升了空間機械臂的工作能力。設(shè)計高度智能化、自主化的,能夠獨立汲取經(jīng)驗、判斷思考、自主決策的空間機械臂系統(tǒng)是未來研究的關(guān)鍵。雖然空間操控技術(shù)已發(fā)展將近40 年,但是空間機械臂系統(tǒng)在智能化道路上仍有許多阻礙。深度學(xué)習(xí)作為一種數(shù)據(jù)驅(qū)動的方法,需要大量高質(zhì)量的數(shù)據(jù)集,但是天地數(shù)據(jù)傳輸成本大,且地面難以模擬真實空間環(huán)境,小樣本數(shù)據(jù)訓(xùn)練的問題需要攻克。空間機械臂系統(tǒng)的復(fù)雜以及環(huán)境的多變,導(dǎo)致強化學(xué)習(xí)方法中獎勵函數(shù)設(shè)計非常困難,直接影響到學(xué)習(xí)的快慢以及模型的收斂效果。學(xué)習(xí)類算法對硬件存儲和計算的要求十分高,但是空間中受輻射、低溫的影響,計算設(shè)備的能力上限相比地面大打折扣,深度學(xué)習(xí)在宇航級的硬件實現(xiàn)對計算機硬件技術(shù)提出了很高的要求。所以,將人工智能更深入地與空間機械臂相結(jié)合,需要更多的科研工作者的付出。

猜你喜歡
軌跡機械規(guī)劃
軌跡
軌跡
調(diào)試機械臂
軌跡
規(guī)劃引領(lǐng)把握未來
簡單機械
快遞業(yè)十三五規(guī)劃發(fā)布
商周刊(2017年5期)2017-08-22 03:35:26
進化的軌跡(一)——進化,無盡的適應(yīng)
中國三峽(2017年2期)2017-06-09 08:15:29
多管齊下落實規(guī)劃
機械班長
泸定县| 新源县| 江达县| 山西省| 通榆县| 余姚市| 永兴县| 新干县| 昌邑市| 蒙阴县| 庄河市| 思茅市| 长沙县| 新晃| 德州市| 湟源县| 湖口县| 太白县| 准格尔旗| 荥阳市| 柳州市| 桐梓县| 和静县| 娱乐| 鹿泉市| 霍州市| 闸北区| 成安县| 临洮县| 河东区| 本溪| 济宁市| 丽水市| 五峰| 武宣县| 凤城市| 深圳市| 班戈县| 明水县| 惠来县| 城固县|