張 辰,周樂來,李貽斌
(1.山東大學控制科學與工程學院,濟南250061;2.智能無人系統(tǒng)教育部工程研究中心,濟南250061)
機器人在人類生產(chǎn)生活中扮演重要的角色,極大提高了生產(chǎn)效率。隨著機器人技術(shù)的飛速發(fā)展,多機器人系統(tǒng)相關(guān)技術(shù)不斷涌現(xiàn),多機器人系統(tǒng)逐漸在工農(nóng)業(yè)生產(chǎn)、高危環(huán)境作業(yè)、水下與空間環(huán)境探測、衛(wèi)星協(xié)同控制等領(lǐng)域大量應(yīng)用。相對于單機器人系統(tǒng)而言,多機器人系統(tǒng)適應(yīng)更加復雜多變的動態(tài)環(huán)境,對環(huán)境中的干擾和機器人故障具備更好的魯棒性;通過多個結(jié)構(gòu)簡單、成本較低的機器人組建團隊,能夠達到甚至超越成本高昂的單機器人所能產(chǎn)生的效果;多個機器人組成協(xié)作團隊,能夠并行執(zhí)行更加復雜的分布式任務(wù),效率更高。因此多機器人系統(tǒng)及其協(xié)調(diào)控制成為機器人技術(shù)的研究熱點之一。
多機器人系統(tǒng)的導航作為一項關(guān)鍵技術(shù),是多機器人系統(tǒng)正常執(zhí)行設(shè)計功能的基礎(chǔ)。多機器人通過協(xié)同定位方法,獲取當前各機器人的位置;通過路徑規(guī)劃方法對每一個機器人的行進路徑進行規(guī)劃計算,并完成協(xié)調(diào)控制;通過任務(wù)分配方法,對多機器人多任務(wù)進行最優(yōu)化分配,提高整體團隊的協(xié)同效率。
單一機器人受限于傳感器種類、感知范圍和信息處理能力,其定位精度有限,且對于環(huán)境中的擾動和自身的故障缺乏魯棒性。多機器人系統(tǒng)通過融合各個機器人的定位信息,提高機器人團隊的整體定位精度,增強抗干擾能力和魯棒性。
定位信息的獲取是實現(xiàn)協(xié)同定位的基礎(chǔ)。目前多機器人系統(tǒng)可以通過多種方式獲取環(huán)境信息和機器人之間的相對信息,這些方式可以劃分為絕對式與相對式兩類[1]。絕對式定位技術(shù)是通過計算實時獲取機器人在環(huán)境中的絕對位置,與機器人初始狀態(tài)和歷史信息無關(guān)。相對式定位技術(shù)則需要根據(jù)初始狀態(tài)和歷史信息,估計當前的位置,即本地測量;或者借助某種技術(shù)估算自身相對于多機器人團隊中其他機器人的位置,即外感測量。根據(jù)測量的相對信息種類不同,可分為基于相對距離、相對方位、相對航向等類型[2]。常用的絕對式和相對式定位技術(shù)如表1和表2所示。
表1 絕對式定位技術(shù)Table 1 The absolute positioning technology
表2 相對式定位技術(shù)Table 2 The relative positioning technology
根據(jù)多機器人協(xié)同定位的結(jié)構(gòu),可以分為主從式和并行式兩類。在主從式協(xié)作定位系統(tǒng)中,由攜帶高精度導航傳感器的機器人作為主節(jié)點,其他攜帶低成本低精度導航傳感器的機器人作為從節(jié)點。在協(xié)同定位過程中,主節(jié)點為團隊提供高精度的導航參考信息,從節(jié)點在自身定位基礎(chǔ)上,通過接收主節(jié)點的導航數(shù)據(jù),或?qū)χ鞴?jié)點進行觀測獲得相對位姿數(shù)據(jù),對自身定位結(jié)果進行校正[3]。主從式結(jié)構(gòu)簡單,通信拓撲明確,系統(tǒng)成本低,但是對于主機器人的定位精度依賴較高,要求主機器人具備較好的穩(wěn)定性和魯棒性。當主機器人發(fā)生故障時,容易導致整個團隊的定位精度下降,甚至定位失敗。
在并行式協(xié)作定位系統(tǒng)中,各個機器人搭載相同的傳感設(shè)備,在團隊中地位相同。在定位過程中,通過融合各機器人的定位數(shù)據(jù),實現(xiàn)互相校正。并行式結(jié)構(gòu)沒有主從之分,不依賴于某一個機器人的定位精度,在機器人節(jié)點發(fā)生故障或者通信失敗時,仍可保證其余個體的準確定位,具備更好的魯棒性。但是去中心化的并行網(wǎng)絡(luò)結(jié)構(gòu)拓撲復雜,各機器人之間互相校正機制容易導致狀態(tài)相關(guān)性問題,融合算法更為復雜。
概率估計方法是將每個機器人的位置視為概率分布,通過對機器人的位置進行優(yōu)化估計,獲得各機器人的準確定位。常用的概率估計方法有濾波類方法、極大似然估計法、最大后驗概率估計法等。
目前常見的基于濾波的多機器人協(xié)同定位方法包括擴展卡爾曼濾波(EKF)[4]、無跡卡爾曼濾波(UKF)[5]、容積卡爾曼濾波(CKF)[6]、粒子濾波(PF)[7]、信息濾波(IF)[8]方法,以及上述方法的改進算法等。
EKF、UKF、CKF是針對基于高斯假設(shè)的非線性系統(tǒng)狀態(tài)估計問題提出的方法,是在卡爾曼濾波框架下,通過對系統(tǒng)非線性的不同處理實現(xiàn)狀態(tài)估計。在多機器人系統(tǒng)中,非線性卡爾曼濾波框架包括以下4 個步驟:(1)系統(tǒng)建模:分析系統(tǒng)運動模型,構(gòu)建運動方程和觀測方程。(2)時間更新:依據(jù)前一時刻的最佳狀態(tài)估計值,結(jié)合機器人線速度、角速度等運動信息,在運動方程中進行一步預(yù)測,計算當前時刻機器人的預(yù)測位置,并對預(yù)測協(xié)方差進行一步預(yù)測。(3)量測更新:根據(jù)機器人外部感知獲取的當前時刻相對數(shù)據(jù),結(jié)合時間更新過程得到的當前時刻預(yù)測位置,對機器人位置進行最優(yōu)估計,并計算當前時刻的估計協(xié)方差。(4)循環(huán)(2)、(3)步,遞歸地進行最優(yōu)估計。
基于以上框架,經(jīng)典的EKF算法通過對非線性函數(shù)的線性化,將非線性函數(shù)進行泰勒展開,忽略高階項部分,保留一階項部分以實現(xiàn)線性化近似。經(jīng)典EKF 算法由于忽略了高階項,引入了線性誤差,容易導致算法發(fā)散。經(jīng)典的UKF算法不再對非線性函數(shù)進行逼近,而是通過選擇一定數(shù)量的確定的采樣點對非線性函數(shù)的概率分布進行逼近,獲得了更好的精度。CKF 算法基于三階球面徑向準測,通過容積積分近似高斯加權(quán)積分,利用容積點逼近非線性系統(tǒng)的概率分布,是近年來新出現(xiàn)的一種濾波方法。
與以上三種使用近似思想解決非線性系統(tǒng)估計問題的濾波方法不同,PF 方法拋棄高斯假設(shè),基于蒙特卡洛法思想,通過大量的隨機采樣點對非線性模型和非高斯分布進行模擬。PF 方法理論上能夠適應(yīng)任意形狀的分布,但是需要的粒子數(shù)量巨大,計算負擔較重。
最大后驗概率方法通過最大化后驗概率的狀態(tài)位置作為機器人位置的最佳估計,來求解多機器人定位問題。機器人i通過本地測量獲取自身線速度與角速度,組成向量u=[v,ω]T,通過外感測量獲取相對于機器人j的相對距離和角度數(shù)據(jù)z=[d,θ]T,通過迭代方法求解使后驗概率函數(shù)P(x|u,z) 取得最大值的,即為機器人位置的估計[9]。
極大似然估計通過最大化似然函數(shù)的狀態(tài)位姿作為機器人位姿的估計[10]。通過機器人之間的相對觀測結(jié)果和機器人本地測量數(shù)據(jù)構(gòu)建似然函數(shù)P(z|x),通過求解使似然函數(shù)取得最大值的,作為機器人位姿的估計。
優(yōu)化方法采用了與濾波方法不同的思想。濾波方法通過前一時刻各機器人的位姿估計當前時刻各機器人的位姿。優(yōu)化方法通過建立約束方程和目標函數(shù),通過優(yōu)化求解目標函數(shù)極值,來計算各機器人的位姿。研究人員提出了一系列的優(yōu)化方法,包括滾動時域法、粒子群優(yōu)化法、梯度下降法[2]等。
滾動時域估計(Moving Horizon Estimation,MHE)方法近年來逐漸在許多領(lǐng)域開展應(yīng)用,取得了良好的效果。MHE 是一種動態(tài)滾動式的最優(yōu)估計方法,通過建立固定時間域長度的優(yōu)化計算窗口,設(shè)置先入先出的狀態(tài)滾動更新機制,引入多機器人系統(tǒng)狀態(tài)約束條件,使用時間窗開始時刻的多機器人位姿數(shù)據(jù)組成系統(tǒng)狀態(tài)向量、時間窗內(nèi)各時刻的狀態(tài)噪聲序列和到達代價函數(shù),構(gòu)建性能指標函數(shù)。通過最小化性能指標函數(shù),估計時間窗結(jié)束時刻的各機器人的位姿數(shù)據(jù)[11]。MHE 方法的滾動時間窗如圖1所示。由于MHE 方法的實時性和動態(tài)性特點,算法對于計算能力要求較高。
圖1 滾動時間窗口示意圖Fig.1 The moving horizon of MHE
梯度下降法作為一種經(jīng)典的估計目標函數(shù)極小值的算法,近年來在深度學習等領(lǐng)域廣泛應(yīng)用,研究人員也將梯度下降方法引入到多機器人協(xié)同定位中,對機器人的位姿進行優(yōu)化求解。測量每個機器人與鄰居機器人的局部距離信息或相對方位信息,通過每個機器人的位姿估計值計算對應(yīng)的相對距離或相對方位,構(gòu)造測量值與估計值的均方差目標函數(shù)。通過梯度下降法求解目標函數(shù)的最小值,獲得機器人位置的最佳估計[12]。梯度下降法示意圖如圖2所示,其中錨點機器人用于確定多機器人團隊的全局坐標。
圖2 梯度下降法協(xié)同定位過程示意圖Fig.2 Co-localization process with gradient descent method
基于地圖匹配的方法常用于對無人飛行器進行導航。提前建立飛行器航線經(jīng)過地區(qū)的地圖,在無人機飛行過程中通過感知地形地貌,與提前建立的地圖進行匹配,并結(jié)合飛行器的慣性導航系統(tǒng),以確定飛行器當前的位置。飛行器可搭載相機系統(tǒng),對地形地貌進行拍攝,并與實景地圖進行匹配;或者搭載測距傳感器,對地面起伏進行建模,并與地圖進行匹配。
基于地圖匹配的思想近年來也在多機器人協(xié)同定位問題中廣泛使用,尤其在空地異構(gòu)機器人協(xié)同定位中,地圖匹配成為聯(lián)系空地不同視角的橋梁:將無人機俯拍視角與地面機器人平視全景視角進行匹配,可以實現(xiàn)二者的協(xié)同定位。通過無人機單目相機搜索地面機器人,并觸發(fā)SLAM,通過雷達點云建立地面機器人周圍2.5D 地圖;地面機器人搭載全景相機,將全景圖像中的特征點與2.5D地圖進行匹配,以估計自身在地圖中的位置和朝向[13]?;诘貓D匹配的空地協(xié)同定位示意圖如圖3所示。
路徑規(guī)劃是多機器人團隊實現(xiàn)移動和順利執(zhí)行任務(wù)的關(guān)鍵技術(shù),相對于單機器人路徑規(guī)劃問題,多機器人路徑規(guī)劃問題存在以下幾個特點:(1)機器人團隊存在更多約束,例如需要保持一定隊形,或者需要滿足運動的先后順序約束,即某機器人的行動完成作為另一機器人開始行動的條件。(2)機器人團隊內(nèi)部存在規(guī)劃沖突問題,即在執(zhí)行規(guī)劃路徑過程中兩機器人可能在同一時刻到達同一位置,導致碰撞。因此多機器人路徑規(guī)劃的研究成為多機器人系統(tǒng)的研究重點之一。
圖3 基于地圖匹配的空地協(xié)同定位示意圖Fig.3 Air-ground cooperative positioning based on map matching method
多機器人路徑規(guī)劃技術(shù)可以分為耦合式方法和解耦式方法。耦合式方法是將多機器人視為一個整體,將各機器人的所有自由度整合成一個多自由度空間,對其進行搜索和規(guī)劃。解耦式方法是對每個機器人進行獨立的路徑規(guī)劃,之后再通過協(xié)調(diào)方法對多個獨立路徑進行協(xié)調(diào)和修改,以解決沖突問題。
在耦合方法中,許多單機器人路徑規(guī)劃的經(jīng)典方法被擴展到多機器人路徑規(guī)劃中。人工勢場法是機器人路徑規(guī)劃問題的經(jīng)典方法,通過在機器人的運行空間中構(gòu)建勢能場,目標點對機器人產(chǎn)生引力,障礙物對機器人以及機器人之間產(chǎn)生斥力,通過合力引導機器人走向目標點。由于引入機器人之間的斥力,人工勢場法能夠較好地解決多機沖突問題,廣泛應(yīng)用于解決多機編隊中的路徑規(guī)劃問題[14]。但是在復雜環(huán)境中容易出現(xiàn)合力為零情況,陷入“死鎖”狀態(tài),因此研究者提出了多種改進方法,通過加入偏向力使機器人跳出“死鎖”狀態(tài),繼續(xù)行進。多機器人通過人工勢場法繞過障礙物的過程示意圖如圖4所示。
概率類規(guī)劃方法通過隨機采樣的方法,在復雜環(huán)境中規(guī)劃路徑,計算量小且速度較快,具備概率完備性,尤其適合在高維系統(tǒng)中進行可行路徑的規(guī)劃。常見的概率類方法有概率路線圖法(Probabilistic Roadmap,PRM)、快速搜索隨機樹(Rapid-exploration Random Tree,RRT)等。將m個機器人在某時刻的位置組合成m維空間的一點(起始點),將m個目標位置組合成m維空間內(nèi)的路徑規(guī)劃目標點,通過對該m維空間進行隨機采樣,建立隨機路線圖或生成隨機擴展樹,建立起始點與目標點的連接線路[15]??焖偎阉麟S機樹方法的規(guī)劃示意圖如圖5所示。
圖4 人工勢場法示意圖Fig.4 Formation control with artificial potential field method
圖5 RRT方法的規(guī)劃過程Fig.5 The planning process of rrt method
耦合式規(guī)劃方法能夠在全局范圍內(nèi)進行優(yōu)化搜索,但是多機器人組合形成的多自由度空間維度高,尤其對于機器人團隊中機器人數(shù)目較多的情況,計算和搜索的復雜度將會呈指數(shù)增長,嚴重影響規(guī)劃的速度和實時性。
解耦式方法中,首先對各機器人進行單獨的路徑規(guī)劃,再通過協(xié)調(diào)算法將發(fā)生沖突的機器人路徑進行調(diào)整。因此經(jīng)典的面向單機器人的路徑規(guī)劃方法可以用于生成每個機器人的路徑。
研究者們提出了許多不同的路徑協(xié)調(diào)方法。M*算法[16]使用亞維展開框架,以經(jīng)典的A*算法作為底層路徑規(guī)劃器。在多機器人系統(tǒng)空間中創(chuàng)建一維的搜索空間,通過A*算法為每個機器人單獨規(guī)劃最優(yōu)路徑;在規(guī)劃過程中若發(fā)現(xiàn)兩機器人碰撞,則局部增加搜索空間的維數(shù),以協(xié)調(diào)機器人之間的運動。
基于沖突的搜索算法[17](Conflict Based Search,CBS),采用兩級算法結(jié)構(gòu),底層使用A*算法對單機器人進行路徑規(guī)劃搜索,在頂層建立基于單個機器人的時間、位置約束的二叉約束樹。當多機器人之間的路徑產(chǎn)生沖突時,對樹執(zhí)行節(jié)點搜索,實現(xiàn)沖突調(diào)節(jié)。
基于保留區(qū)域的方法[18-19]考慮了機器人在未來幾個時間步的運動過程,在柵格地圖中對單個機器人進行獨立路徑規(guī)劃,同時根據(jù)運動方向計算未來幾個時間步內(nèi)機器人將要到達的柵格位置,稱為保留區(qū)域。當兩機器人保留區(qū)域重疊,則形成多機器人沖突描述,交由中央模塊進行任務(wù)分配和協(xié)調(diào)。
以上多機器人路徑規(guī)劃方法都是針對短生命周期過程的一次路徑規(guī)劃,機器人數(shù)量和目標點數(shù)量基本對等且固定不變,各個機器人到達各自的目標點后,路徑規(guī)劃過程隨即結(jié)束。針對短生命周期的路徑規(guī)劃方法不具備持續(xù)性和時變性問題,有研究者提出了長生命周期的路徑規(guī)劃概念[20]。長生命周期的路徑規(guī)劃方法面向變化的多目標點,團隊中某機器人在到達某一目標點后會再次獲得新的目標點任務(wù),規(guī)劃過程長期運行,提高了方法的動態(tài)性,更加符合實際應(yīng)用需求。
解耦式方法將路徑規(guī)劃分散到單機器人尺度,通過協(xié)調(diào)算法調(diào)解沖突,問題復雜度較低,動態(tài)性較好。但是解耦式方法難以獲得全局最優(yōu)解,容易陷入局部極小值或者陷入“死鎖”狀態(tài)。
任務(wù)分配技術(shù)是多機器人協(xié)同控制系統(tǒng)中的關(guān)鍵技術(shù)之一,在傳感器覆蓋問題、兵器多目標打擊、以及無人機多點任務(wù)分配等場景中處于基礎(chǔ)性的地位。任務(wù)分配問題是組合優(yōu)化問題,目標是找到機器人和任務(wù)之間的最佳匹配,實現(xiàn)完成任務(wù)耗時最少,機器人整體移動路徑長度最短,機器人團隊總體能量消耗最低等優(yōu)化目標,最大限度地提高團隊的整體效能。
任務(wù)分配問題的解決方法主要有基于行為的分配方法、市場機制方法、群體智能方法等。
基于行為的任務(wù)分配算法[21]是較早提出的任務(wù)分配方法之一,通過找到一個具有最大效用的機器人-任務(wù)對,將任務(wù)分配給機器人。
典型的基于行為的任務(wù)分配方法包括ALLIANCE 方法、本地資格廣播(Broadcast of Local Eligibility,BIE)方法等。對于每個任務(wù),每個機器人都有能夠執(zhí)行該任務(wù)的行為。針對對應(yīng)的任務(wù),每個機器人對每個任務(wù)維持效用評估,用于描述自身解決該任務(wù)的效能和成本。在運行過程中,各機器人定期進行任務(wù)重新分配的規(guī)劃,每個機器人向其他機器人傳播它對每個任務(wù)的效用值。在收到其他機器人的效用后,每個機器人中執(zhí)行貪婪策略,針對一個任務(wù),將其自身的效用評價與其他每個機器人的效用評價進行比較,選擇自身效用最高的為高優(yōu)先級任務(wù),實現(xiàn)任務(wù)分配。
在效用值傳播過程中,借助通信的傳播方法對于通信的要求較高,研究人員提出了相對觀測的分散計算方式:通過維持包含“默許”和“耐心”的離散效能評估方法,當某機器人正在執(zhí)行一項任務(wù)時,隨著時間的推移,其自身對于該任務(wù)的默許值逐漸增加,而其他機器人對于該任務(wù)的耐心程度下降,導致該機器人對于該任務(wù)的效用評價逐漸降低。各個機器人在通信心跳幀作用下同步且獨立地刷新各機器人的效能評估,降低通信壓力。
基于行為的方法實時性、容錯性和魯棒性好,但只能求得局部最優(yōu)解,無法實現(xiàn)全局的優(yōu)化求解。
市場機制方法[22-23]是一種基于協(xié)商思想的任務(wù)分配方法,多機器人系統(tǒng)在某種協(xié)議基礎(chǔ)上通過機器人之間的相互協(xié)商、談判來完成任務(wù)分配。
市場機制方法包括多種分配方法,其中最典型的是基于合同網(wǎng)協(xié)議的方法。該方法基于市場拍賣模型,主要包括任務(wù)發(fā)布、任務(wù)投標和任務(wù)分配三個階段。首先對任務(wù)和機器人的能力進行建模,建立機器人的能力集和環(huán)境中的任務(wù)集。
在任務(wù)發(fā)布階段,當系統(tǒng)被指定一個新的任務(wù),或某機器人根據(jù)當前局勢發(fā)現(xiàn)一個新的任務(wù)時,任務(wù)中心通過通信網(wǎng)絡(luò)將任務(wù)廣播至每一個機器人中。在任務(wù)投標階段,接收到任務(wù)的機器人根據(jù)自身的能力,對任務(wù)進行評價,計算完成任務(wù)需要花費的代價,以及預(yù)計的完成時間等要素,組合成投標信息發(fā)送給任務(wù)中心。在任務(wù)分配階段,任務(wù)中心收到各機器人的投標信息之后,根據(jù)投標信息中的要素計算各機器人或機器人組的投標收益,選擇投標收益最高的機器人或機器人組作為該任務(wù)的贏家,向其分配任務(wù)。
基于市場的方法適合于在任務(wù)和機器人狀態(tài)可知的中小規(guī)模異構(gòu)機器人中進行分布式問題的協(xié)作求解,能夠?qū)崿F(xiàn)全局最優(yōu)任務(wù)分配。
群體智能(Swarm Intelligence,SI)是仿照自然界生物體的自組織行為,通過對鳥群、蟻群、蜂群等生物群體系統(tǒng)的行為進行研究和模擬,提出的用于解決群機器人行為自組織和規(guī)劃的智能方法。該類方法沒有中央控制單元,由相互作用的簡單獨立自主個體,按照一定的規(guī)律,通過涌現(xiàn)的方法求解某一類問題。
在群體智能方法中,蟻群算法[24]是最為典型的代表之一,在各個領(lǐng)域獲得了廣泛的應(yīng)用。通過模仿自然界螞蟻的覓食行為,對機器人的任務(wù)空間進行優(yōu)化求解。機器人從完成某任務(wù)轉(zhuǎn)移到下一個任務(wù)過程中,根據(jù)完成任務(wù)的代價,在兩任務(wù)之間的路徑上留下不同濃度的信息素。通過信息素累加和蒸發(fā)因子作用,更新路徑上的信息素濃度。信息素濃度影響任務(wù)轉(zhuǎn)移概率函數(shù)的值,機器人根據(jù)轉(zhuǎn)移概率函數(shù)選擇下一步將要執(zhí)行的任務(wù),直到所有任務(wù)被多機器人團隊執(zhí)行完成。
近年來,許多基于人機協(xié)同的多機器人協(xié)作系統(tǒng)出現(xiàn),多機器人系統(tǒng)不再僅僅由機器人構(gòu)成,人在閉環(huán)的人-多異構(gòu)機器人協(xié)作模式成為新的研究熱點。
2018年,Chowdhury等[25]提出了一種基于距離、剩余能量、機器人的能力和可用性的異構(gòu)機器人選擇算法,通過建立任務(wù)請求-任務(wù)應(yīng)答-代價評估-擇優(yōu)分配-故障實時監(jiān)測,在網(wǎng)絡(luò)協(xié)議層集成本地和非本地任務(wù)分配,解決如何有效地將給定的人工任務(wù)分配給合適的機器人、如何低成本求解任務(wù)分配和非本地任務(wù)分配的問題。
Anima等[26]研究了基于層次任務(wù)計劃的人機協(xié)同任務(wù)執(zhí)行問題,將人-機器人協(xié)同任務(wù)以樹狀結(jié)構(gòu)表示,并針對重疊和非重疊子任務(wù)的沖突進行了不同處理,提高了人-機器人團隊中任務(wù)的動態(tài)分配能力和不同環(huán)境條件下的機會式任務(wù)執(zhí)行能力。
Talebpour 等[27]提出了一種在多機器人任務(wù)分配環(huán)境下的基于風險的自適應(yīng)重新規(guī)劃策略,基于社會風險和人類運動預(yù)測不確定性的變化,實時動態(tài)的調(diào)整任務(wù)分配,以處理局部感知的局限性和不可預(yù)測的人類行為。
以上的成果能夠?qū)⑷诉@一因素加入到多機器人任務(wù)分配過程中,但人仍在任務(wù)分配回環(huán)以外,通過指令或任務(wù)下達的方式對多機器人任務(wù)分配形成干預(yù)。伴隨著機器人任務(wù)的復雜化,尤其在多機器人協(xié)作團隊在有人存在的復雜環(huán)境中作業(yè),作為增強人機共融協(xié)作環(huán)境適應(yīng)能力,提高人-群機器人協(xié)作工作效率的關(guān)鍵,人機共融的多機器人任務(wù)分配研究具有重要意義。
本文針對多機器人協(xié)同導航技術(shù)的研究進行了綜合評述,重點針對多機器人系統(tǒng)導航過程中涉及到的三個關(guān)鍵問題:協(xié)同定位、路徑規(guī)劃和任務(wù)分配問題,分析了多機器人系統(tǒng)的特點和面臨的挑戰(zhàn)??偨Y(jié)并比較了多機器人定位數(shù)據(jù)獲取技術(shù),重點評述了協(xié)同定位算法和技術(shù)的種類及特點;總結(jié)了多機器人路徑規(guī)劃的方法,以及避免機器人之間沖突的協(xié)調(diào)方法;總結(jié)并比較了多機器人任務(wù)分配常用的方法,針對有人存在的多機器人協(xié)同環(huán)境,總結(jié)了現(xiàn)有的方法。
多機器人協(xié)同導航技術(shù)經(jīng)過多年的發(fā)展,已經(jīng)取得巨大的進步。但仍面臨一些挑戰(zhàn):
(1)如何實現(xiàn)更加高效可靠的多機器人通信、更加簡潔的系統(tǒng)結(jié)構(gòu)、更加智能的協(xié)調(diào)策略等基礎(chǔ)技術(shù),仍需進一步研究。
(2)目前的多機器人協(xié)同導航技術(shù)涉及的機器人數(shù)量較少,在大規(guī)模多機器人協(xié)同方面成果較少,存在一定困難。如何擴展機器人團隊數(shù)量需要深入研究。
(3)如何將人這一要素引入多機器人協(xié)同導航過程中,突破人以簡單命令下達或參數(shù)設(shè)定方式對多機器人導航過程進行干預(yù)的現(xiàn)狀,實現(xiàn)真正的人在回環(huán)內(nèi)的協(xié)同控制,具有重要的研究價值。