曹 凱陳陽(yáng)泉高 嵩*黨海鑫張嘉豪
(1.西安工業(yè)大學(xué)機(jī)電工程學(xué)院,陜西 西安 710021;2.西安工業(yè)大學(xué)電子信息工程學(xué)院,陜西 西安 710021;3.加州大學(xué)默塞德分校工程學(xué)院,美國(guó) 加州 95343)
近年來,機(jī)器人在軟、硬件能力方面變得越來越復(fù)雜。隨著傳感器系統(tǒng)、機(jī)載計(jì)算平臺(tái)、能量存儲(chǔ)和其他控制技術(shù)的進(jìn)步,以及各方面成本的降低,使得使用多機(jī)器人在一系列不同場(chǎng)景環(huán)境中執(zhí)行任務(wù)成為可能。例如森林火災(zāi)監(jiān)測(cè)和探測(cè)[1-3]、環(huán)境監(jiān)測(cè)、污染源監(jiān)測(cè)控制[4-7]和環(huán)境覆蓋[8-9]。由于環(huán)境任務(wù)特性和對(duì)機(jī)器人性能的影響,在這種場(chǎng)景任務(wù)下的多機(jī)器人覆蓋控制中,需要多個(gè)機(jī)器人的高效合作與協(xié)調(diào),以實(shí)現(xiàn)任務(wù)目標(biāo)。然而由于協(xié)同控制的復(fù)雜性和直接人工控制每個(gè)機(jī)器人的花銷,所以需要具有高度自主性和穩(wěn)定性的多機(jī)器人控制系統(tǒng)。近年來,多機(jī)器人系統(tǒng)的自主任務(wù)規(guī)劃和控制作為一個(gè)熱門的研究領(lǐng)域[10-12],雖然已經(jīng)有了許多進(jìn)展和貢獻(xiàn),這些努力也在多機(jī)器人系統(tǒng)中固有的一些復(fù)雜性問題上取得了重大突破和進(jìn)展,但在這一領(lǐng)域仍有許多未解決的問題。
本文針對(duì)多機(jī)器人覆蓋控制中考慮多機(jī)器人系統(tǒng)健康管理和最優(yōu)分布的問題展開研究。例如在上述任務(wù)場(chǎng)景中,使用者往往更注重總體任務(wù)的完成度和機(jī)器人的性能表現(xiàn),但由于各種惡劣環(huán)境因素對(duì)機(jī)器人的影響,會(huì)使得機(jī)器人產(chǎn)生故障或者性能退化,從而對(duì)任務(wù)的完成度和機(jī)器人健康造成重大影響[13],因此作為一個(gè)智能的控制系統(tǒng)必須考慮到這些異常的可能性,才能最大限度地提高整體機(jī)器人性能和任務(wù)完成度。
針對(duì)多機(jī)器人最優(yōu)分布問題,Chen等人[14]提出了一種移動(dòng)機(jī)器人網(wǎng)絡(luò)的分布式控制律,通過驅(qū)動(dòng)每個(gè)機(jī)器人向其Voronoi細(xì)胞的質(zhì)心移動(dòng)來覆蓋當(dāng)前任務(wù)區(qū)域。Chen等人[15]使用質(zhì)心維諾劃分(Centroidal Voronoi Tessellation,CVT)來檢測(cè)并控制區(qū)域中的擴(kuò)散污染源,并隨后提出復(fù)雜環(huán)境下的多機(jī)器人覆蓋策略來完成污染源的檢測(cè)與處理問題。Hatleskog等人[16]研究了基于Voronoi的離散時(shí)間多智能體動(dòng)態(tài)系統(tǒng)在多維靜態(tài)凸多面體環(huán)境中覆蓋的分散控制方案,并使用局部控制律將每個(gè)機(jī)器人導(dǎo)向其相關(guān)時(shí)變Voronoi鄰域的Chebyshev中心,揭示了機(jī)器人子集之間對(duì)鄰居內(nèi)距離達(dá)成一致的機(jī)制。為了避免多協(xié)作機(jī)器人進(jìn)行覆蓋路徑規(guī)劃時(shí)的任務(wù)兩重性,Vishnu G[17]采用Voronoi分區(qū)來實(shí)現(xiàn)機(jī)器人之間的自然被動(dòng)合作,結(jié)合了基于測(cè)地距離的Voronoi分區(qū)和基于曼哈頓距離的Voronoi分區(qū)以解決存在障礙時(shí)分區(qū)的連續(xù)性。
上述關(guān)于多機(jī)器人協(xié)同覆蓋控制的大多數(shù)工作都假設(shè)了環(huán)境和機(jī)器人狀態(tài)為理想狀態(tài)。然而,在現(xiàn)實(shí)世界中,機(jī)器人執(zhí)行任務(wù)期間可能會(huì)出現(xiàn)各種各樣的健康退化情況,例如傳感能力效率下降、通信丟失或延遲、能量不足、移動(dòng)能力受損以及團(tuán)隊(duì)中機(jī)器人的損失,使得這種假設(shè)在現(xiàn)實(shí)世界的廣泛應(yīng)用中難以實(shí)現(xiàn)。針對(duì)上述問題,Cortés等人[18]將廣義Voronoi劃分的思想用于面積約束覆蓋問題,分配給每個(gè)機(jī)器人的細(xì)胞面積假定為預(yù)先指定的數(shù)量。然后使用雅可比迭代算法為滿足面積約束的廣義Voronoi劃分分配權(quán)重。Sharifi等人[19-20]針對(duì)團(tuán)隊(duì)中不同機(jī)器人驅(qū)動(dòng)能力對(duì)覆蓋任務(wù)影響的問題,提出了一種使用在線、分布式的方式學(xué)習(xí)機(jī)器人之間的相對(duì)驅(qū)動(dòng)性能變化的算法,以確保機(jī)器人收斂到最佳配置,而不會(huì)因多機(jī)器人中的個(gè)別機(jī)器人的故障而導(dǎo)致任務(wù)失敗。Turanli等人[21]利用Hopfield Neural Network在機(jī)器人事先不知道彼此性能情況下,根據(jù)不同的驅(qū)動(dòng)性能學(xué)習(xí)并計(jì)算每個(gè)機(jī)器人的功率以及Voronoi圖權(quán)值自主實(shí)現(xiàn)最優(yōu)配置,同時(shí)利用節(jié)能的最優(yōu)控制方案,可以在時(shí)間和機(jī)器人的能耗之間進(jìn)行權(quán)衡。但是上述在線學(xué)習(xí)方法難以保證機(jī)器人執(zhí)行任務(wù)時(shí)的實(shí)時(shí)性需求,并且對(duì)原有算法改動(dòng)較大,未曾考慮到機(jī)器人的計(jì)算負(fù)載與實(shí)時(shí)性要求。
針對(duì)上述問題,研究了使用一組機(jī)器人覆蓋感興趣任環(huán)境的問題,其中機(jī)器人可能具有可變的健康。首先使用健康優(yōu)化管理算法在對(duì)原有機(jī)器人控制框架改動(dòng)較小的前提下,使得系統(tǒng)更好地應(yīng)對(duì)機(jī)械故障和突發(fā)狀況等不可預(yù)見損壞。其次,將機(jī)器人的健康退化納入位置優(yōu)化問題,使用加權(quán)質(zhì)心維諾劃分(Weighted Centroidal Voronoi Tessellation,W-CVT)來劃分維諾區(qū)域,為不同健康的機(jī)器人提供符合其健康特性的維諾細(xì)胞,然后提供分布式覆蓋控制規(guī)律,保證機(jī)器人收斂到最優(yōu)配置,并給予相關(guān)收斂性證明。最后,通過常見的覆蓋情況,對(duì)所提算法做出數(shù)值仿真和實(shí)驗(yàn),驗(yàn)證本文所提算法的有效性,并做出總結(jié)。
維諾劃分作為一種空間劃分方案,當(dāng)以機(jī)器人位置為生成點(diǎn)進(jìn)行維諾劃分時(shí),能夠?yàn)槎鄼C(jī)器人覆蓋提供良好的避碰能力,使得每個(gè)細(xì)胞內(nèi)的任意獨(dú)立點(diǎn)q到該細(xì)胞生成點(diǎn)p的距離最小,給定一個(gè)有界凸區(qū)域Q??N,以及Q中的任意獨(dú)立點(diǎn)q,用P=(p1,…,pn)表示該區(qū)域內(nèi)每個(gè)維諾細(xì)胞的生成點(diǎn)即機(jī)器人的位置的集合,用ρ(q)表示區(qū)域Q內(nèi)的密度函數(shù),該密度函數(shù)給場(chǎng)中的每個(gè)點(diǎn)q分配一個(gè)優(yōu)先級(jí)屬性,表示該點(diǎn)需要優(yōu)先處理的級(jí)別,這意味著機(jī)器人應(yīng)更加優(yōu)先關(guān)注ρ(q)更高的區(qū)域。若且則可生成區(qū)域Q的維諾劃分其中生成點(diǎn)pi對(duì)應(yīng)維諾細(xì)胞vi,使用‖·‖表示歐式距離。其中維諾細(xì)胞表示為:
圖1(a)、(b)分別為維諾劃分和質(zhì)心維諾劃分,圖1中的十字表示維諾細(xì)胞質(zhì)心,點(diǎn)與不規(guī)則的多邊分別代表生成點(diǎn)和對(duì)應(yīng)的維諾細(xì)胞。
圖1 維諾細(xì)胞示意圖
多機(jī)器人在區(qū)域上形成最優(yōu)配置的代價(jià)函數(shù)(即待優(yōu)化目標(biāo)函數(shù))可以表示為:
該代價(jià)函數(shù)通過區(qū)域的密度函數(shù)來估計(jì)生成點(diǎn)與Voronoi細(xì)胞質(zhì)心的誤差。從式(3)也可以看出,當(dāng)維諾細(xì)胞中的點(diǎn)在維諾質(zhì)心時(shí),可以保證整個(gè)區(qū)域代價(jià)函數(shù)最小,即可將多機(jī)器人覆蓋控制問題轉(zhuǎn)化為關(guān)于移動(dòng)機(jī)器人的多目標(biāo)優(yōu)化問題。在多機(jī)器人覆蓋控制中,機(jī)器人的目標(biāo)位置由CVT算法劃分維諾細(xì)胞的質(zhì)心給出,所有機(jī)器人移動(dòng)至對(duì)應(yīng)維諾細(xì)胞的質(zhì)心位置,直到算法收斂,最終得到多機(jī)器人覆蓋在環(huán)境中的分布。
CVT算法在不考慮機(jī)器人健康損耗的情況下,能夠保證代價(jià)函數(shù)最優(yōu),并且保證所有機(jī)器人收斂到最佳配置。但是在實(shí)際運(yùn)動(dòng)過程中難以避免機(jī)器人正常的健康損耗,以及環(huán)境中意外情況對(duì)機(jī)器人健康的影響。此時(shí),應(yīng)該針對(duì)機(jī)器人的健康進(jìn)行實(shí)際分析,并對(duì)控制規(guī)律做出優(yōu)化,根據(jù)機(jī)器人的健康情況進(jìn)行區(qū)域劃分,以提高多機(jī)器人在健康損耗下的適應(yīng)性和最優(yōu)覆蓋能力。
在優(yōu)化算法部分,首先將機(jī)器人的健康情況進(jìn)行量化。假設(shè)ui為第i個(gè)機(jī)器人的控制輸入,針對(duì)上述問題,特引入hi(t)來描述機(jī)器人i在t時(shí)刻的健康狀況,hi(t)可表示為:
hi(0)為機(jī)器人的初始健康狀況,di(t)為每個(gè)時(shí)刻機(jī)器人的健康損耗,kd,i為使用量增益系數(shù),fd,i(t)為外部環(huán)境對(duì)機(jī)器人的負(fù)面影響,例如外部碰撞引起的損壞。假設(shè)每個(gè)機(jī)器人的健康狀況會(huì)隨著對(duì)其運(yùn)動(dòng)控制的進(jìn)行和可能遭受到的外部損壞而下降,式(4)中的di(t)為其控制累計(jì)和可能遇到的任何外部損壞的函數(shù),控制累計(jì)意味著快速移動(dòng)和轉(zhuǎn)彎的機(jī)器人比緩慢運(yùn)動(dòng)或者靜止的機(jī)器人健康狀況損耗更快,從物理意義上可以簡(jiǎn)化成剩余能量和結(jié)構(gòu)健康的結(jié)合。
在引入健康優(yōu)化管理后,使用fi,t[q,hi(t)]表示第i輛機(jī)器人覆蓋(或感知)點(diǎn)q的成本,hi(t)是第i個(gè)機(jī)器人的健康變量。隨著目標(biāo)點(diǎn)與機(jī)器人的距離增加,相應(yīng)機(jī)器人的覆蓋成本也會(huì)增加。此外,機(jī)器人的健康因各種原因而不同。雖然不同機(jī)器人的覆蓋成本函數(shù)fi,t[q,hi(t)]不一定相同,但在均勻密度函數(shù)下,對(duì)于與機(jī)器人距離相同的一組點(diǎn),函數(shù)fi,t[q,hi(t)]都是相同的。即對(duì)于ρ(q)=k,?pj,pk∈Q,若‖pi-pj‖=‖pi-pk‖,則fi,t[qj,hi(t)]=fi,t[qk,hi(t)]。
本文的目的是開發(fā)一種合適的機(jī)器人覆蓋算法,以使以下覆蓋性能函數(shù)最小化:
在函數(shù)F中,如果所有的機(jī)器人的健康值hi(t)都是相同的,那么對(duì)于一組到達(dá)同一點(diǎn)q的所有機(jī)器人的代價(jià)函數(shù)fi,t[q,hi(t)]是相同的,此時(shí),可以使用傳統(tǒng)的質(zhì)心維諾劃分為該組機(jī)器人提供最優(yōu)化分。然而,當(dāng)fi,t[q,hi(t)]考慮到機(jī)器人的健康值hi(t)時(shí),即所有的機(jī)器人的hi(t)不盡相同時(shí),傳統(tǒng)的CVT劃分便不再適用,對(duì)于所有機(jī)器人的最優(yōu)化分也產(chǎn)生了一定的困難。所以為了方便解決該問題,本文給出了以下假設(shè)。
假設(shè)在本文中所有的機(jī)器人的代價(jià)函數(shù)fi,t(q,hi(t))具有以下形式:
式中:hi(t)代表機(jī)器人i在t時(shí)刻的健康值。在假設(shè)其他變量不變的情況下,較小的hi(t)導(dǎo)致第i個(gè)機(jī)器人的覆蓋成本較大(假設(shè)hi(t)=1對(duì)應(yīng)于完全健康的機(jī)器人,0<hi(t)<1表示存在健康損耗的機(jī)器人,hi(t)≤0對(duì)應(yīng)于無法工作的故障機(jī)器人)。因此,機(jī)器人健康退化會(huì)影響整體覆蓋性能。此外,假設(shè)機(jī)器人健康值的大小可以通過相應(yīng)的機(jī)器人檢測(cè)與故障診斷方法得出。
具有上述代價(jià)函數(shù)的覆蓋性能函數(shù)將由F(P,V)表示。在hi(t)不盡相同時(shí),機(jī)器人的最佳位置是待覆蓋區(qū)域的質(zhì)心,只是,此時(shí)的空間劃分不再是傳統(tǒng)的CVT,而應(yīng)根據(jù)每個(gè)機(jī)器人的hi(t)進(jìn)行劃分,即在劃分維諾區(qū)域時(shí),要加入健康值作為權(quán)重,作為判斷依據(jù),將傳統(tǒng)的覆蓋優(yōu)化問題轉(zhuǎn)到不同且時(shí)變的健康情況下進(jìn)行研究。
假設(shè)有界凸區(qū)域Q??N的一組機(jī)器人可表示為P=(p1,…,pn),機(jī)器人pi的權(quán)重用wi表示,wi≥0,wi=hi。
引入權(quán)重后的CVT被稱為加權(quán)質(zhì)心維諾劃分(Weighted Centroidal Voronoi Tessellation,W-CVT),若其中?wvi為加權(quán)維諾細(xì)胞邊界,即兩個(gè)相鄰的加權(quán)維諾細(xì)胞只有相鄰邊為公共區(qū)域,且則可生成區(qū)域Q的維諾劃分其中生成點(diǎn)pi對(duì)應(yīng)加權(quán)維諾細(xì)胞wvi,得到加權(quán)維諾劃分:
圖2中描繪了一組10個(gè)加權(quán)生成點(diǎn)的CVT和W-CVT的示例,圖2(a)中十個(gè)機(jī)器人所單獨(dú)覆蓋的子細(xì)胞面積大致相等,并且每個(gè)維諾細(xì)胞的邊界都處于相鄰機(jī)器人的中垂平分線上,符合CVT特性;而圖2(b)中左上角和右下角機(jī)器人的wi較大,達(dá)到最終配置時(shí)所占細(xì)胞相對(duì)其他機(jī)器人較大,左下角wi較小的機(jī)器人所占細(xì)胞便相對(duì)較小,且每個(gè)維諾細(xì)胞邊界偏向于wi較小的機(jī)器人,符合的WCVT特性。本文后續(xù)利用W-CVT開發(fā)了多機(jī)器人系統(tǒng)的分布式覆蓋算法。
圖2 加權(quán)維諾示意圖
本論文以差速小車為例,假設(shè)輪式機(jī)器人為一個(gè)可以自由轉(zhuǎn)動(dòng)的剛體,其簡(jiǎn)化的運(yùn)動(dòng)模型如圖3所示。
圖3 機(jī)器人運(yùn)動(dòng)學(xué)模型
設(shè)定C(x,y)為輪式機(jī)器人質(zhì)心,θ是前進(jìn)方向角。機(jī)器人的狀態(tài)信息用P=(x,y,θ)T來表示。[v,w]為機(jī)器人的線速度和角速度。2L為兩輪之間的長(zhǎng)度,2r為輪子的直徑。可得到其運(yùn)動(dòng)學(xué)狀態(tài)空間方程如式(8)所示:
根據(jù)機(jī)器人運(yùn)動(dòng)學(xué)模型和控制規(guī)律,需要保持零動(dòng)態(tài)的控制輸入即ui=0,可以得到機(jī)器人的位置控制律:
式中:ui是第i個(gè)機(jī)器人的控制輸入。機(jī)器人的運(yùn)動(dòng)可以用雙積分器動(dòng)態(tài)模型來表示,本文更加注重強(qiáng)調(diào)多個(gè)機(jī)器人的協(xié)同控制,而不是每個(gè)機(jī)器人的姿態(tài)控制,在這種情況下,需要更詳細(xì)的機(jī)器人動(dòng)態(tài)模型。此外,許多機(jī)器人的動(dòng)力學(xué)可以反饋線性化為雙積分器形式。本文使用以下假設(shè)推導(dǎo)分布式覆蓋控制器,移動(dòng)機(jī)器人能夠以分布式方式計(jì)算自己的加權(quán)Voronoi細(xì)胞。每個(gè)機(jī)器人都可以與鄰近的加權(quán)Voronoi細(xì)胞的其他機(jī)器人進(jìn)行通信。
假設(shè)為第i個(gè)機(jī)器人提出了以下形式的位置控制律:
式中:h*(t)∈[0,1]且隨時(shí)間遞減,kh,i(t)表示機(jī)器人改變移動(dòng)覆蓋健康優(yōu)化管理系統(tǒng)獲得的增益,ei(t)表示機(jī)器人i和整體平均健康水平h*(t)的差異,khp、khd表示覆蓋健康優(yōu)化管理算法的增益系數(shù)。
以下定理給出了收斂結(jié)果。通過式(10)可得李雅普諾夫函數(shù)為:
通過化簡(jiǎn)可得:
因此可以得出Lyapunov函數(shù)是半負(fù)定的,可根據(jù)LaSalle不變性原理得到機(jī)器人會(huì)收斂到W-CVT配置。
在每個(gè)時(shí)間步驟,機(jī)器人i檢測(cè)其相鄰機(jī)器人,并與它們交換位置信息。然后,機(jī)器人i構(gòu)建其WCVT單元并計(jì)算其質(zhì)心以便構(gòu)造控制輸入(9),機(jī)器人在該控制輸入端下向移動(dòng)。在每個(gè)時(shí)間步長(zhǎng),該組中的所有機(jī)器人同時(shí)遵循上述步驟,直到兩個(gè)連續(xù)時(shí)間步長(zhǎng)t和t-1的覆蓋代價(jià)函數(shù)F最小,并且機(jī)器人之間的誤差小于規(guī)定閾值ε,具體算法流程見表1。
表1 分布式覆蓋算法流程
在這一部分中,通過仿真驗(yàn)證了所提出的分布式機(jī)器人覆蓋算法的有效性。仿真中使用的環(huán)境是10×10的待覆蓋區(qū)域,部署了一組10個(gè)具有相同運(yùn)動(dòng)學(xué)模型的地面移動(dòng)機(jī)器人,用以覆蓋環(huán)境中的密度較大的點(diǎn)。后續(xù)中考慮了幾種常見的不同場(chǎng)景。在前兩個(gè)場(chǎng)景中分別以常密度函數(shù)下的CVT和WCVT算法對(duì)任務(wù)區(qū)域進(jìn)行覆蓋為例,主要為了凸顯W-CVT算法在劃分區(qū)域時(shí)能夠以機(jī)器人的健康值為劃分依據(jù),進(jìn)行位置優(yōu)化,提供存在機(jī)器人健康損耗時(shí)的最優(yōu)覆蓋方案。
在第一種場(chǎng)景下,假設(shè)所有的地面機(jī)器人都不存在健康損耗,即h1=h2=…=h10=1,所有的機(jī)器人都在CVT算法的控制下對(duì)任務(wù)區(qū)域進(jìn)行覆蓋,圖4(a)表示該任務(wù)區(qū)域的密度函數(shù)ρ(q)=1,即所有位置的優(yōu)先級(jí)相同。10個(gè)機(jī)器人從任務(wù)區(qū)域的左下角開始移動(dòng),如圖4(b)~(d)所示,10個(gè)不存在健康損耗的機(jī)器人用代表健康值良好的淺灰色圓圈表示,曲線代表不同機(jī)器人的運(yùn)動(dòng)軌跡,加號(hào)表示該細(xì)胞的質(zhì)心位置,黑色線條表示每個(gè)機(jī)器人所在維諾細(xì)胞的邊緣部分。在迭代次數(shù)k=83時(shí),所有機(jī)器人在CVT算法的控制下,收斂到如圖4(d)所示的最優(yōu)配置下,即所有的機(jī)器人對(duì)區(qū)域進(jìn)行了均勻劃分,每個(gè)機(jī)器人都處于各自維諾細(xì)胞的質(zhì)心位置,所有的維諾細(xì)胞邊緣都處于相鄰機(jī)器人的中垂線上,形成對(duì)稱劃分,每個(gè)細(xì)胞的面積基本相等,即可認(rèn)為相同健康值下的每個(gè)機(jī)器人的任務(wù)量基本相等。圖4(e)是在整個(gè)過程中10個(gè)機(jī)器人的當(dāng)前位置和質(zhì)心位置的誤差值曲線,可以看出在k=83次時(shí),所有機(jī)器人的位置誤差都趨于0,即表示所有的機(jī)器人都在覆蓋算法的控制下,達(dá)到了最終的期望位置。圖4(f)展示了整個(gè)過程中的代價(jià)函數(shù),CVT的代價(jià)函數(shù)由式(3)構(gòu)建,在k=83次之后,代價(jià)函數(shù)達(dá)到最小值,由本算法中判斷覆蓋系統(tǒng)達(dá)到最優(yōu)的條件,即機(jī)器人的當(dāng)前位置與質(zhì)心之間誤差err(pi)=pi-p*i小于閾值ε,并且代價(jià)函數(shù)F達(dá)到最小值,來認(rèn)定覆蓋系統(tǒng)達(dá)到最優(yōu)。
在第二種場(chǎng)景下,假設(shè)在k=20次之前所有的地面機(jī)器人都不存在健康損耗,即h1=h2=…=h10=1,在k=20次之時(shí),有兩個(gè)機(jī)器人存在突然的健康損耗,即d1=d2=d3=d4=d5=d8=d9=d10=0、d6=d7=0.2。所有的機(jī)器人都在W-CVT算法的控制下對(duì)任務(wù)區(qū)域進(jìn)行覆蓋,任務(wù)區(qū)域的密度函數(shù)ρ(q)=1,如圖4(a)所示,即所有位置的優(yōu)先級(jí)相同。10個(gè)機(jī)器人從任務(wù)區(qū)域的左下角開始移動(dòng),如圖5(a)所示,10個(gè)機(jī)器人中d=0即健康的機(jī)器人用淺灰色圓圈表示,d=0.2即有突然的健康損耗的機(jī)器人用深灰色圓圈表示。圖5(a)~(b)展示了在k=20次之前10個(gè)機(jī)器人的運(yùn)動(dòng)軌跡,可以看出所有機(jī)器人所在維諾細(xì)胞的邊緣都處于機(jī)器人之間的中垂線上,呈對(duì)稱分布。在迭代次數(shù)k=20次后,所有機(jī)器人在W-CVT算法的控制下的運(yùn)動(dòng)軌跡如圖5(c)~(d)所示,最終收斂到如圖5(d)所示的最優(yōu)配置下,可以看出淺灰色機(jī)器人即健康值沒有損耗的機(jī)器人所負(fù)責(zé)的維諾細(xì)胞較大,而深灰色機(jī)器人即健康值有損耗的機(jī)器人負(fù)責(zé)的細(xì)胞相對(duì)較小,維諾細(xì)胞的劃分呈不對(duì)稱劃分,細(xì)胞壁偏向于健康值有損耗的機(jī)器人一側(cè),相比于圖4(d)形成了較為明顯的對(duì)比。圖5(e)是在整個(gè)過程中10個(gè)機(jī)器人的當(dāng)前位置和質(zhì)心位置的誤差值曲線,可以看出在k=20次時(shí),所有機(jī)器人的位置誤差都有著明顯的變化,這是因?yàn)樵赪-CVT算法的控制下,所有的機(jī)器人負(fù)責(zé)的細(xì)胞相比于普通的質(zhì)心維諾劃分細(xì)胞引入了健康值的影響,從而形成了新的劃分,也就產(chǎn)生了新的細(xì)胞質(zhì)心,相比于k=20次之前,位置誤差都有了明顯的變化;最終在k=93次時(shí)所有機(jī)器人的位置誤差都趨于0,即表示所有的機(jī)器人都在覆蓋算法的控制下,達(dá)到了最終的期望位置。圖5(f)展示了整個(gè)過程中的覆蓋代價(jià)函數(shù),W-CVT的代價(jià)函數(shù)由式(5)、式(6)所構(gòu)建,可以看出,代價(jià)函數(shù)在k=20左右的時(shí)候,有些許的增長(zhǎng),這是由于從此刻開始代價(jià)函數(shù)開始考慮健康退化的機(jī)器人,在維諾劃分時(shí)根據(jù)健康值進(jìn)行位置優(yōu)化,重新進(jìn)行區(qū)域劃分;在k=20之后,上述機(jī)器人才開始收斂到最優(yōu)配置;最終在k=93次之后,代價(jià)函數(shù)也收斂到最優(yōu)。
圖4 基于CVT的均勻密度函數(shù)下的多機(jī)器人區(qū)域覆蓋
圖5 基于W-CVT的均勻密度函數(shù)下的多機(jī)器人區(qū)域覆蓋
圖6(a)為場(chǎng)景二下10個(gè)機(jī)器人未加入健康優(yōu)化管理之前的健康值hi(t)損耗曲線??梢钥闯鲈趉=20次之前,10個(gè)機(jī)器人健康值損耗較??;在k=20次時(shí),6、7號(hào)機(jī)器人健康值在設(shè)定的情況下驟然下降;直達(dá)k=110次時(shí),10個(gè)機(jī)器人的健康值都由于覆蓋過程的進(jìn)行而有了一些損耗,健康值未驟然衰減的8個(gè)機(jī)器人的健康值平均下降到0.43左右。圖6(b)為場(chǎng)景二下10個(gè)機(jī)器人加入健康優(yōu)化管理之后的健康值hi(t)損耗曲線??梢钥闯鰇=93次時(shí),10個(gè)機(jī)器人的健康值都由于健康優(yōu)化管理算法的進(jìn)行,損耗得到了一定幅度的減小,健康值未驟然衰減的8個(gè)機(jī)器人的健康值平均下降到0.59左右,達(dá)到最優(yōu)配置時(shí)的健康值提升了16%左右。從圖6可以看出,在加入健康優(yōu)化管理前后,相同初始健康值的機(jī)器人在達(dá)到最終配置時(shí)的健康值是有差異的。這是由于每個(gè)機(jī)器人每次迭代時(shí)的步長(zhǎng),以及到達(dá)最終穩(wěn)定時(shí)的迭代次數(shù)有所差異,即每個(gè)機(jī)器人的運(yùn)動(dòng)時(shí)間和控制增益有所差異。所以導(dǎo)致最終最健康有所差異。
圖6 場(chǎng)景二下的機(jī)器人健康損耗圖
根據(jù)前兩種場(chǎng)景下的仿真可以看出,W-CVT算法作為針對(duì)機(jī)器人存在健康損耗時(shí)的空間覆蓋方案,可以以機(jī)器人的健康值大小為劃分依據(jù),為健康值損耗較大的機(jī)器人劃分更小的維諾細(xì)胞,提供最優(yōu)配置方案。在迭代次數(shù)上相比于傳統(tǒng)CVT算法不會(huì)有額外的耗費(fèi),并且最終的代價(jià)函數(shù)收斂到最優(yōu)。
(1)場(chǎng)景三
在第三種場(chǎng)景下,假設(shè)在k=20次之前所有的地面機(jī)器人都不存在健康損耗,即h1=h2=…=h10=1,在k=20次時(shí)有4個(gè)機(jī)器人存在突然的健康損耗,即d1=d2=d3=d4=d5=d10=0、d6=d7=d8=d9=0.2,例如機(jī)器人正常工作過程中遇見的一些突發(fā)性故障,從而導(dǎo)致機(jī)器人的健康情況驟然惡化。
所有的機(jī)器人都在W-CVT算法的控制下對(duì)任務(wù)區(qū)域進(jìn)行覆蓋,圖7(a)表示該任務(wù)區(qū)域的密度函數(shù),密度函數(shù)如式(14)所示,其中(xc,yc)=(7,7),黑色越深表示該區(qū)域優(yōu)先級(jí)越高。如10個(gè)機(jī)器人從任務(wù)區(qū)域的隨機(jī)位置開始移動(dòng),如圖7(b)所示,10個(gè)機(jī)器人中d=0和d=0.2的機(jī)器人分別用淺灰色圓圈和深灰色圓圈表示。圖7(b)~(c)展示了在k=20次之前10個(gè)機(jī)器人的運(yùn)動(dòng)軌跡,所有機(jī)器人呈對(duì)稱分布。在迭代次數(shù)k=20次后,所有機(jī)器人運(yùn)動(dòng)軌跡如圖7(c)~(d)所示,最終收斂到如圖7(d)所示的最優(yōu)配置下,淺灰色機(jī)器人所負(fù)責(zé)的維諾細(xì)胞相較于深灰色機(jī)器人更大維諾細(xì)胞的劃分。從圖7(e)可以看出相比于k=20次之前位置誤差都有了明顯的變化,這是因?yàn)樵赪-CVT算法的控制下,維諾細(xì)胞形成了新的劃分,也就產(chǎn)生了新的細(xì)胞質(zhì)心;最終在k=110次時(shí)所有機(jī)器人的位置誤差都趨于0,達(dá)到了最終的期望位置。從圖7(f)可以看出代價(jià)函數(shù)在k=20左右的時(shí)候,代價(jià)函數(shù)由于考慮到機(jī)器人的健康衰減,所以有些許的增長(zhǎng),在k=20之后,上述機(jī)器人才開始重新收斂到最優(yōu)配置;最終在k=73次之后,代價(jià)函數(shù)也收斂到最優(yōu),直到k=110次時(shí),代價(jià)函數(shù)和位置誤差趨于零,程序停止迭代,系統(tǒng)達(dá)到最優(yōu)覆蓋配置。
圖7 基于W-CVT的非均勻密度函數(shù)下的多機(jī)器人區(qū)域覆蓋(場(chǎng)景三)
圖8(a)為場(chǎng)景三下10個(gè)機(jī)器人未加入健康優(yōu)化管理之前的健康值hi(t)損耗曲線??梢钥闯鲈趉=20次之前,10個(gè)機(jī)器人健康值損耗較?。辉趉=20次時(shí),6、7、8、9號(hào)機(jī)器人健康值在設(shè)定的情況下驟然下降;直達(dá)k=110次時(shí),10個(gè)機(jī)器人的健康值由于覆蓋過程的進(jìn)行都有了一些損耗,健康值未驟然衰減的6個(gè)機(jī)器人和健康值驟然衰減的4個(gè)機(jī)器人的健康值分別平均下降到0.36和0.18左右。圖8(b)為場(chǎng)景三下10個(gè)機(jī)器人加入健康優(yōu)化管理之后的健康值hi(t)損耗曲線。可以看出k=110次時(shí),10個(gè)機(jī)器人的健康值損耗得到了一定幅度的減小,健康值未驟然衰減的6個(gè)機(jī)器人和健康值驟然衰減的4個(gè)機(jī)器人的健康值平均下降到0.53和0.34左右,達(dá)到最優(yōu)配置時(shí)的健康值提升了16%左右。
圖8 場(chǎng)景三下的機(jī)器人健康損耗圖
(2)場(chǎng)景四
在第四種場(chǎng)景下,假設(shè)在k=20次之前所有的地面機(jī)器人都不存在健康損耗,即h1=h2=…=h10=1,在k=20次之后有4個(gè)機(jī)器人存在突然的健康損耗,即d1=d2=d3=d1=d5=d10=0、d6=d7=d8=d9=0.2。圖9(a)表示該任務(wù)區(qū)域的密度函數(shù),密度函數(shù)如式(14)所示,其中(xc,yc)={(2,8)、(8,2)}。10個(gè)機(jī)器人的初始位置如圖9(b)所示,機(jī)器人的顏色和健康損耗值的大小與第三種場(chǎng)景相同。圖9(b)~(c)展示了在k=20次之前10個(gè)機(jī)器人的運(yùn)動(dòng)軌跡。在迭代次數(shù)k=20次之后,所有機(jī)器人的運(yùn)動(dòng)軌跡如圖9(c)~(d)所示,最終收斂到如圖9(d)所示的最優(yōu)配置下。從圖9(e)可以看出在k=20次時(shí),所有機(jī)器人的位置誤差相比于k=20次之前位置誤差都有了明顯的變化;最終在k=64次時(shí)所有機(jī)器人的位置誤差都趨于0,即表示所有的機(jī)器人都在覆蓋算法的控制下,達(dá)到了最終的期望位置。從圖9(f)可以看出代價(jià)函數(shù)在k=20左右的時(shí)候,由于引入健康值的影響,代價(jià)函數(shù)有些許的增長(zhǎng),在k=20之后,上述機(jī)器人才重新收斂到最優(yōu)配置;最終在k=64次之后,代價(jià)函數(shù)也收斂到最優(yōu)。而由于每個(gè)機(jī)器人在每次迭代過程中的控制增益和到達(dá)穩(wěn)定時(shí)的迭代次數(shù)有所差異,導(dǎo)致相同健康初始值的機(jī)器人最終健康值有所差異。
圖9 基于W-CVT的非均勻密度函數(shù)下的多機(jī)器人區(qū)域覆蓋(場(chǎng)景四)
圖10(a)為場(chǎng)景四下10個(gè)機(jī)器人未加入健康優(yōu)化管理之前的健康值hi(t)損耗曲線。在k=20次之前,10個(gè)機(jī)器人健康值損耗較??;在k=20次之后,6、7、8、9號(hào)機(jī)器人健康值在設(shè)定的情況下驟然下降;直達(dá)k=64次時(shí),健康值未驟然衰減的6個(gè)機(jī)器人和健康值驟然衰減的4個(gè)機(jī)器人的健康值分別平均下降到0.5和0.35左右。圖10(b)為場(chǎng)景四下10個(gè)機(jī)器人加入健康優(yōu)化管理之后的健康值hi(t)損耗曲線。在k=64次時(shí),10個(gè)機(jī)器人的健康值損耗得到了一定幅度的減小,健康值未驟然衰減的6個(gè)機(jī)器人和健康值驟然衰減的4個(gè)機(jī)器人的健康值平均下降到0.71和0.52左右,達(dá)到最優(yōu)配置時(shí)的健康值提升了19%左右。
圖10 場(chǎng)景四下的機(jī)器人健康損耗圖
在上述四種情況下,基于加權(quán)維諾的分布式覆蓋控制方法能夠很好地應(yīng)對(duì)有健康損耗的機(jī)器人時(shí)的分布式覆蓋配置,使得維諾細(xì)胞的大小根據(jù)機(jī)器人的健康狀況做調(diào)整。將機(jī)器人的健康狀況納入覆蓋控制中的位置優(yōu)化問題,同時(shí)最小化覆蓋代價(jià)函數(shù)。而健康優(yōu)化管理的增加使健康值最低的機(jī)器人壽命時(shí)間大幅增加,而對(duì)現(xiàn)有框架的調(diào)整很小。健康優(yōu)化管理確保覆蓋能夠長(zhǎng)時(shí)間運(yùn)行,并防止長(zhǎng)時(shí)間的過度磨損。由表2可得,通過將智能健康平衡應(yīng)用于每個(gè)機(jī)器人,整體的健康值能提升17%左右,多機(jī)器人對(duì)由許多非常合理的情況引起的健康變化更加穩(wěn)健。該系統(tǒng)可以更好地應(yīng)對(duì)碰撞、機(jī)械故障或維護(hù)不足造成的意外損壞。
表2 加入健康優(yōu)化管理算法前后在三種場(chǎng)景下的仿真結(jié)果對(duì)比
本論文在實(shí)驗(yàn)室場(chǎng)景下的實(shí)驗(yàn)基于Turtlebot3機(jī)器人,Turtlebot3機(jī)器人是一種成本低,開源的基于ROS(Robot Operating System)的移動(dòng)機(jī)器人平臺(tái),每一臺(tái)Turtlebot3可獨(dú)自通過ROS提供的相關(guān)功能包和激光雷達(dá)來建立自己所在周圍環(huán)境的局部地圖,并與鄰近的機(jī)器人進(jìn)行通信。本文使用光源代替仿真中的密度函數(shù)分布,并在機(jī)器人上搭建光源數(shù)據(jù)采集模塊,機(jī)器人和相關(guān)的光源采集模塊如圖11所示。
圖11 實(shí)驗(yàn)平臺(tái)
將采集到的光強(qiáng)數(shù)據(jù)與機(jī)器人當(dāng)前位置進(jìn)行匹配,在覆蓋過程中得到的區(qū)域光強(qiáng)分布如圖12所示,以模擬多機(jī)器人對(duì)感興趣區(qū)域的覆蓋。
圖12 光強(qiáng)分布圖
在真實(shí)的實(shí)驗(yàn)場(chǎng)景下,機(jī)器人的運(yùn)動(dòng)模型為二階動(dòng)力學(xué)模型,將實(shí)驗(yàn)室3.6 m×3.6 m的環(huán)境作為機(jī)器人編隊(duì)的指定區(qū)域Q,區(qū)域右上角放置光源以模擬需要覆蓋的感興趣區(qū)域,設(shè)定該區(qū)域不存在障礙物,如圖13(a)所示。在t=0 s時(shí),在地圖上左下角隨機(jī)放置了5臺(tái)Turtlebot3機(jī)器人,直到t=40 s時(shí),機(jī)器人利用光源數(shù)據(jù)采集模塊結(jié)合本文的覆蓋算法完成光源的最優(yōu)覆蓋的結(jié)果如圖13(c)所示,可見機(jī)器人在光源最強(qiáng)區(qū)域?qū)崿F(xiàn)了最優(yōu)的覆蓋分布,對(duì)本文的覆蓋算法做出了進(jìn)一步的驗(yàn)證。
圖13 多機(jī)器人覆蓋實(shí)驗(yàn)環(huán)境
本文針對(duì)傳統(tǒng)覆蓋控制未曾考慮到不同健康的機(jī)器人對(duì)覆蓋成本的影響,提出了一種基于健康優(yōu)化管理的多機(jī)器人覆蓋控制算法。首先在傳統(tǒng)基于CVT算法的多機(jī)器人覆蓋控制下,引入多機(jī)器人健康管理辦法,將機(jī)器人的健康情況進(jìn)行量化,構(gòu)造健康優(yōu)化管理器,從而提高不健康機(jī)器人的續(xù)航耐力,使得系統(tǒng)更好地應(yīng)對(duì)機(jī)械故障和突發(fā)狀況等不可預(yù)見損壞,以提高覆蓋在不同場(chǎng)景下執(zhí)行任務(wù)時(shí)的健壯性。其次引入基于加權(quán)維諾的分布式覆蓋控制方法,將機(jī)器人的健康退化納入位置優(yōu)化問題,為機(jī)器人提供最優(yōu)配置的同時(shí)最小化覆蓋代價(jià)函數(shù),最終通過理論證明和數(shù)值仿真以及實(shí)驗(yàn),驗(yàn)證了所提算法的有效性。
本文的方法可以應(yīng)用在不同維度的機(jī)器人系統(tǒng)中,以及應(yīng)用在具有不同性能和運(yùn)動(dòng)模型的異構(gòu)團(tuán)體中;以及針對(duì)不同健康的機(jī)器人進(jìn)行更加精確化的判斷,最大程度地增強(qiáng)其性能和群體的覆蓋性能。這些都將在未來的工作中繼續(xù)展開研究。