黃 兵,肖云飛,馮 元,于秀萍
(1.哈爾濱工程大學(xué)水下機(jī)器人技術(shù)國(guó)防科技重點(diǎn)實(shí)驗(yàn)室,黑龍江哈爾濱 150001;2.哈爾濱工程大學(xué)智能科學(xué)與工程學(xué)院,黑龍江哈爾濱 150001)
近年來(lái),隨著陸地資源的日益匱乏,海洋資源的開發(fā)和利用逐漸進(jìn)入人們的視野,多艘無(wú)人艇(unmanned surface vehicles,USV)協(xié)同作業(yè)作為未來(lái)海上裝備發(fā)展的重要方向,受到越來(lái)越多國(guó)家的高度關(guān)注,成為各國(guó)爭(zhēng)相研制的“熱點(diǎn)兵器”[1].在復(fù)雜的海洋環(huán)境下,多USV協(xié)同作業(yè)在石油和天然氣探測(cè)、環(huán)境監(jiān)測(cè)和遠(yuǎn)洋在航補(bǔ)給等海上任務(wù)中,具有廣泛的應(yīng)用前景和潛在的應(yīng)用優(yōu)勢(shì)[2].控制器設(shè)計(jì)作為集群系統(tǒng)的核心技術(shù),保證了上述水面任務(wù)的成功率.然而,艇體的高度自動(dòng)化和海洋環(huán)境的復(fù)雜性給協(xié)同控制器設(shè)計(jì)帶來(lái)了嚴(yán)峻的挑戰(zhàn).在此背景下,國(guó)內(nèi)外學(xué)者提出了多種USV編隊(duì)控制研究方法,包括領(lǐng)航者-跟隨者策略[3]、基于行為方法[4]、虛擬結(jié)構(gòu)法[5-6].其中,虛擬結(jié)構(gòu)法具有控制精度高、穩(wěn)定性好的優(yōu)勢(shì),使之成為當(dāng)下USV協(xié)同跟蹤方向的研究熱點(diǎn).
在虛擬結(jié)構(gòu)法中,所有編隊(duì)成員被視為一個(gè)整體,通過共享的通信網(wǎng)絡(luò)進(jìn)行信息交換.傳統(tǒng)的通信方案以周期的方式對(duì)數(shù)據(jù)進(jìn)行采樣、處理和執(zhí)行,即所謂的時(shí)間觸發(fā)控制[7].從資源利用的角度看,這種控制方案在實(shí)際應(yīng)用中可能會(huì)造成不必要的通信資源浪費(fèi).為了解決這一問題,一種非周期性控制策略,即事件觸發(fā)控制引起了國(guó)內(nèi)外學(xué)者的關(guān)注.所謂事件觸發(fā)控制,是指只有當(dāng)實(shí)際測(cè)量誤差范數(shù)大于一個(gè)允許界限閾值或系統(tǒng)狀態(tài)范數(shù)時(shí)才更新控制協(xié)議.因此,基于事件觸發(fā)的控制方法(包括靜態(tài)和動(dòng)態(tài)),在減少通信頻率和節(jié)約能源方面具有很大的優(yōu)勢(shì).特別地,無(wú)論是靜態(tài)還是動(dòng)態(tài)事件觸發(fā)都要避免出現(xiàn)Zeno現(xiàn)象,即控制行為在有限的時(shí)間內(nèi)被無(wú)限次觸發(fā).這種現(xiàn)象會(huì)使相應(yīng)的控制行為無(wú)法執(zhí)行,甚至導(dǎo)致系統(tǒng)不穩(wěn)定.鑒于此,在設(shè)計(jì)觸發(fā)機(jī)制時(shí)應(yīng)排除Zeno行為.
文獻(xiàn)[8-10]深入研究靜態(tài)事件觸發(fā)通信方案,在保證一致性協(xié)同控制的同時(shí)降低通信頻率.其中文獻(xiàn)[9]設(shè)計(jì)了一種多水面無(wú)人分布式事件觸發(fā)軌跡跟蹤控制器,利用狀態(tài)誤差條件控制領(lǐng)導(dǎo)者與跟隨者之間的通信.作為該方案的技術(shù)擴(kuò)展,文獻(xiàn)[10]引入了固定時(shí)間控制方法,使得設(shè)計(jì)的分布式事件觸發(fā)編隊(duì)控制器能夠在預(yù)設(shè)的時(shí)間內(nèi)收斂.雖然上述靜態(tài)事件觸發(fā)通信方案降低了通信負(fù)擔(dān),但是信息更新的次數(shù)和事件觸發(fā)間隔仍有提升空間.與靜態(tài)事件觸發(fā)相比,包含內(nèi)部動(dòng)態(tài)變量的動(dòng)態(tài)事件觸發(fā)控制策略不僅能夠增加兩個(gè)執(zhí)行時(shí)刻的間隔時(shí)間,而且可保證最小時(shí)間間隔至少為一個(gè)采樣周期.基于多智能體系統(tǒng),文獻(xiàn)[11-12]分別提出了涉及內(nèi)部動(dòng)態(tài)變量的分布式和全分布式動(dòng)態(tài)事件觸發(fā)控制策略,以降低每個(gè)智能體向其鄰居傳輸信息的頻率;不同于分布式控制策略,文獻(xiàn)[13]首次提出集中式動(dòng)態(tài)事件觸發(fā)機(jī)制來(lái)解決領(lǐng)導(dǎo)者-跟隨者的一致性問題.結(jié)果表明,動(dòng)態(tài)事件觸發(fā)機(jī)制能夠增加任意兩個(gè)連續(xù)觸發(fā)時(shí)刻之間的最小時(shí)間間隔.然而,由于USV動(dòng)力學(xué)模型的高度非線性和海洋環(huán)境的復(fù)雜性,上述方法無(wú)法直接應(yīng)用于多無(wú)人艇協(xié)同系統(tǒng).
鑒于以上分析,本文致力于解決基于動(dòng)態(tài)事件觸發(fā)機(jī)制的USV編隊(duì)控制問題.主要貢獻(xiàn)如下: 首先,針對(duì)通信資源受限問題,提出一種動(dòng)態(tài)事件觸發(fā)通信方案以降低USV之間的數(shù)據(jù)傳輸頻率;然后,在事件觸發(fā)機(jī)制的基礎(chǔ)上將滑模控制策略與自適應(yīng)算法相結(jié)合,設(shè)計(jì)了一種可實(shí)現(xiàn)USV協(xié)同軌跡跟蹤的全分布式編隊(duì)控制器.本文設(shè)計(jì)的算法不需要每個(gè)跟隨者獲取領(lǐng)導(dǎo)者的相對(duì)速度信息和通信網(wǎng)絡(luò)的全局信息.
本文研究多USV協(xié)同軌跡跟蹤控制問題.首先給出地面坐標(biāo)系OXEYE和船體坐標(biāo)系OXBYB以描述USV的二維運(yùn)動(dòng).在地面坐標(biāo)系中,O表示坐標(biāo)原點(diǎn),OXE為正東方向,OYE為正北方向.在船體坐標(biāo)系中,O表示USV的質(zhì)心,OXB沿USV中線指向船艏,OYB指向USV的左舷.USV模型的運(yùn)動(dòng)學(xué)方程和動(dòng)力學(xué)方程為[14]
其中:ηi=[xi yi ψi]T指USV在地面坐標(biāo)系下的位置向量,由位置(xi,yi)和艏搖角ψi組成;vi=[ui vi ri]T指USV在船體坐標(biāo)系下的速度向量,由前進(jìn)速度,橫漂速度(ui,vi)和艏搖角速度ri組成;R(ψi)表示從船體坐標(biāo)系到地面坐標(biāo)系的旋轉(zhuǎn)矩陣,其形式為
此外,在式(1)中:di=[dui dvi dri]T表示外部擾動(dòng)(風(fēng)、浪、流等)作用在USV上的力或力矩;τi=[τui τvi τri]T表示USV執(zhí)行機(jī)構(gòu)輸出的控制信號(hào);gi=[gui gvi gri]T表示USV的未建模動(dòng)力學(xué);慣性矩陣Mi∈R3×3,科里奧利矩陣Ci(vi)∈R3×3和水動(dòng)力阻尼矩陣Di(vi)∈R3×3的具體表達(dá)式見文獻(xiàn)[14].
為了使所有編隊(duì)成員在保持預(yù)設(shè)隊(duì)形的同時(shí)能夠跟蹤期望軌跡ηd(t)∈R3,本文引入隊(duì)形變量?i∈R3以推導(dǎo)出跟蹤誤差e1i和e2i,即
其中:e1i為位置跟蹤誤差;e2i為速度跟蹤誤差.
控制目標(biāo):在考慮外界干擾的情況下,為跟隨者USV設(shè)計(jì)控制器τi,使得: 1)編隊(duì)成員能夠跟蹤期望的軌跡;2)編隊(duì)成員能夠保持預(yù)設(shè)的隊(duì)形.因此,本文的控制目標(biāo)可概括為其中Ξ1,Ξ2為正常數(shù).
本文采用無(wú)向連通圖描述編隊(duì)成員的通信拓?fù)渚W(wǎng)絡(luò).該連通圖用符號(hào)G=(N,E,A)表示,其中:N={n1,n2,···,nn}為節(jié)點(diǎn)集;E ?N×N為邊集.在無(wú)向圖中,對(duì)于任意的節(jié)點(diǎn)i和節(jié)點(diǎn)j,有(i,j)=(j,i);A=[aij]∈Rn×n為鄰接矩陣.其中aij為鄰接矩陣第i行、第j列的元素.如果(ni,nj)∈E,則aij>0;否則,aij=0.值得注意的是,每一個(gè)節(jié)點(diǎn)不與自身進(jìn)行信息交換,即aij=0,(=j).對(duì)于無(wú)向圖,A是對(duì)稱矩陣,即aij=aji.圖G的拉普拉斯矩陣定義為L(zhǎng)=D-A,其中:···,n,對(duì)于Leader-follower編隊(duì),fi=1表示無(wú)人艇可以接受Leader的狀態(tài)信息.=L+F是正定矩陣,其中F=diag{f1,···,fn}.
引理1參考文獻(xiàn)[15],如果無(wú)向圖Gu是連通的,那么它的拉普拉斯矩陣L是半正定的.
假設(shè)1假設(shè)虛擬領(lǐng)導(dǎo)者的參考軌跡ηd(t)二階可導(dǎo),并且ηd,,都是有界的.
假設(shè)2外界環(huán)境擾動(dòng)di是有界的,滿足‖Midi‖≤Di,其中Di是未知的正常數(shù).
假設(shè)3假設(shè)存在正常數(shù)和,使得Mi滿足≤‖Mi‖≤.
假設(shè)4本文采用無(wú)向連通圖描述USV編隊(duì)成員之間的通信拓?fù)渚W(wǎng)絡(luò).
本節(jié)提出了一種基于滑??刂坪妥赃m應(yīng)策略的全分布式動(dòng)態(tài)事件觸發(fā)編隊(duì)控制方案以實(shí)現(xiàn)控制目標(biāo).首先,設(shè)計(jì)動(dòng)態(tài)事件觸發(fā)機(jī)制,降低USV之間的通信頻率.然后,通過Lyapunov穩(wěn)定性分析證明跟蹤誤差的收斂性.最后,證明閉環(huán)系統(tǒng)在所提出控制器的作用下不存在Zeno行為.為了更直觀地展示控制算法,圖1給出了動(dòng)態(tài)事件觸發(fā)通信框架下的閉環(huán)系統(tǒng)框圖.
圖1 動(dòng)態(tài)事件觸發(fā)框架下的USV編隊(duì)控制系統(tǒng)框圖Fig.1 Dynamic event-triggered communication framework for formation control of USV
為了便于控制器的設(shè)計(jì)和閉環(huán)系統(tǒng)的穩(wěn)定性分析,根據(jù)性質(zhì)RTR=I,將編隊(duì)成員的數(shù)學(xué)模型進(jìn)一步描述為
基于本文定義的協(xié)同跟蹤誤差(3),可設(shè)計(jì)輔助變量qri和Si,即
式中:k1∈R3×3為正定矩陣,fi為比例參數(shù).如果跟隨者可以接收到虛擬領(lǐng)導(dǎo)者的狀態(tài)信息,則fi=1;否則,fi=0.
對(duì)式(6)中的Si求導(dǎo),并將式(3)-(5)代入,可得
其中Yi(vi)滿足‖Yi(vi)‖≤Yi,i=1,2,···,n,Yi是未建模動(dòng)態(tài)Yi(vi)的未知上界,且Yi>0.復(fù)雜海況下,模型信息Ci(vi),Di(vi)和gi難以精確獲悉,導(dǎo)致設(shè)計(jì)者無(wú)法對(duì)Yi(vi)進(jìn)行描述.因此,本文采用自適應(yīng)算法對(duì)未知上界參數(shù)Yi進(jìn)行在線估計(jì)和補(bǔ)償以抵消未建模動(dòng)態(tài)對(duì)系統(tǒng)的影響.
控制律以及自適應(yīng)律設(shè)計(jì)如下:
事件觸發(fā)誤差函數(shù)定義為
本文采用基于誤差信息的動(dòng)態(tài)事件觸發(fā)機(jī)制(12)以減少USV之間信息傳輸次數(shù),從而降低控制器的更新頻率.通過引入一個(gè)動(dòng)態(tài)變量ξi,設(shè)計(jì)觸發(fā)條件為
式中:αi,βi均為正常數(shù),動(dòng)態(tài)變量ξi滿足以下等式:
其中ρi+1>0.根據(jù)比較引理,可得
由式(17)可知,動(dòng)態(tài)事件觸發(fā)方案的觸發(fā)條件(14)更嚴(yán)格.因?yàn)閯?dòng)態(tài)變量ξi(t)>0,所以,在保證系統(tǒng)控制性能前提下,動(dòng)態(tài)事件觸發(fā)策略產(chǎn)生觸發(fā)時(shí)間間隔會(huì)更長(zhǎng).
注2參考文獻(xiàn)[16],在本文設(shè)計(jì)的事件觸發(fā)控制框架下,每個(gè)USV只需要與它的鄰居間歇通信.事實(shí)上,當(dāng)時(shí),第i個(gè)USV達(dá)到觸發(fā)條件.此時(shí),第i個(gè)USV的狀態(tài)信息被允許傳輸給他的鄰居并且基于狀態(tài)的測(cè)量誤差γi(t)將立即重置為零.換而言之,當(dāng)t∈時(shí),第i個(gè)USV不向其鄰居發(fā)送自身信息狀態(tài),此時(shí)不更新控制協(xié)議.此外,每個(gè)USV的測(cè)量誤差只取決于其自身的采樣狀態(tài)和實(shí)際狀態(tài).因此,所有編隊(duì)無(wú)人艇的事件觸發(fā)序列都是異步的,更有效的利用了通信網(wǎng)絡(luò)帶寬.
注3本文所提出的動(dòng)態(tài)事件觸發(fā)機(jī)制(14)包含一個(gè)動(dòng)態(tài)變量ξi(t).由于該動(dòng)態(tài)變量總是非負(fù)的,因此在選擇相同參數(shù)前提下,動(dòng)態(tài)事件觸發(fā)機(jī)制的測(cè)量誤差‖γi(t)‖會(huì)更晚達(dá)到預(yù)設(shè)閾值,這意味著動(dòng)態(tài)事件觸發(fā)方案具有更大的觸發(fā)時(shí)間間隔.更重要的是,基于式(16)-(17),包含動(dòng)態(tài)變量ξi(t)的動(dòng)態(tài)事件觸發(fā)方案在排除Zeno行為方面起著重要作用.
定理1對(duì)于由多USV組成的編隊(duì)系統(tǒng)(1),在假設(shè)1-4成立的條件下,則本文設(shè)計(jì)的控制律(9)-(11)和事件觸發(fā)機(jī)制(12)-(13)能夠完成對(duì)USV編隊(duì)期望軌跡的跟蹤和預(yù)設(shè)隊(duì)形的保持.同時(shí),輔助變量Si、自適應(yīng)估計(jì)誤差和將收斂到原點(diǎn)附近的微小鄰域.
證選擇Lyapunov候選函數(shù)VL,即
證明步驟如下.
步驟1將V1對(duì)時(shí)間求導(dǎo)并代入式(7),可得
根據(jù)控制律式(9)和自適應(yīng)律式(10)-(11),式(22)可化簡(jiǎn)為
步驟2將V2對(duì)時(shí)間求導(dǎo)得
步驟3將V3對(duì)時(shí)間求導(dǎo)得
步驟4由式(18)(27)-(29)可知,VL對(duì)時(shí)間的導(dǎo)數(shù)滿足
將式(30)中的事件觸發(fā)誤差項(xiàng)γi(t)合并整理可得
代入事件觸發(fā)誤差條件式(14)到式(31)中,合并同類項(xiàng)整理得
根據(jù)式(18)-(21)可知,式(33)中:
根據(jù)式(6),可直接得到e1i有界且滿足
因?yàn)樵谟邢薜臅r(shí)間內(nèi)USV之間的信息交互頻率是有限的,所以論述上述控制算法不會(huì)發(fā)生Zeno行為.對(duì)于第i個(gè)USV,定義為任意兩個(gè)連續(xù)觸發(fā)事件之間的時(shí)間間隔.隨后,通過證明T>0來(lái)說(shuō)明系統(tǒng)不會(huì)產(chǎn)生Zeno現(xiàn)象.
Zeno現(xiàn)象是指控制行為在有限時(shí)間內(nèi)被無(wú)限次觸發(fā)的現(xiàn)象.Zeno現(xiàn)象的發(fā)生會(huì)使對(duì)應(yīng)的控制行為無(wú)法執(zhí)行,甚至?xí)鹣到y(tǒng)不穩(wěn)定.要證明不存在Zeno現(xiàn)象,只需要證明觸發(fā)時(shí)間間隔存在某個(gè)大于零的下界,即存在一個(gè)正常數(shù)Γ1使得對(duì)于?k=0,1,2,···,n成立.
定理2在本文設(shè)計(jì)控制算法的作用下,USV協(xié)同系統(tǒng)無(wú)Zeno現(xiàn)象且事件觸發(fā)時(shí)間間隔下界為正常數(shù).
證根據(jù)式(35)可知,滑模變量Si可以收斂至以下區(qū)域C??,其中
根據(jù)事件觸發(fā)條件式(14)和式(38)-(39)可知
因此,事件觸發(fā)時(shí)間間隔嚴(yán)格大于零.在所提出的事件觸發(fā)編隊(duì)控制器的作用下,閉環(huán)系統(tǒng)不表現(xiàn)出Zeno行為.
證畢.
本節(jié)給出了多USV協(xié)同系統(tǒng)所設(shè)計(jì)控制算法作用下的仿真結(jié)果,說(shuō)明了控制算法的有效性.編隊(duì)系統(tǒng)中有3個(gè)跟隨者和1個(gè)虛擬領(lǐng)導(dǎo)者,相應(yīng)的通信鄰接矩陣為
USV模型的質(zhì)量為23.8 kg,長(zhǎng)度為1.255 m,寬度為0.29 m.USV模型參數(shù)如表1所示[15].虛擬領(lǐng)導(dǎo)者的期望軌跡、初始狀態(tài)向量和期望隊(duì)形如表2所示.根據(jù)定理1,所有的跟隨者都將跟蹤虛擬領(lǐng)導(dǎo)者且構(gòu)成預(yù)設(shè)隊(duì)形.為了達(dá)到滿意的控制性能,控制器和事件觸發(fā)函數(shù)的參數(shù)選擇如表3所示.
表1 USV模型參數(shù)Table 1 The model parameters of USV
表2 初始值和期望編隊(duì)配置Table 2 The initial and desired formation configuration
表3 控制器和事件觸發(fā)函數(shù)參數(shù)配置Table 3 The parameters in controller and event-triggered function
此外,為了更好地說(shuō)明所提控制器的魯棒性.風(fēng)、浪和洋流等引起的外部干擾設(shè)置如下:
詳細(xì)的數(shù)值仿真結(jié)果如圖2-7所示.
圖2 編隊(duì)系統(tǒng)二維軌跡圖Fig.2 Formation trajectories of USV
圖2為編隊(duì)系統(tǒng)在二維平面上的跟蹤軌跡圖.其中,3個(gè)跟隨者能夠在保持等腰三角形隊(duì)形的情況下準(zhǔn)確跟蹤虛擬領(lǐng)導(dǎo)者.圖3給出了每個(gè)USV位置跟蹤誤差的時(shí)間響應(yīng)曲線.從圖中可知,即使在80 s時(shí)加入時(shí)變外部干擾,位置跟蹤誤差依然可以收斂至原點(diǎn)附近.控制輸入信號(hào)如圖4所示.觀察圖4可知,跟隨者的控制輸入信號(hào)在系統(tǒng)穩(wěn)定后穩(wěn)定于常值.圖5描述了動(dòng)態(tài)變量ξi(t)的時(shí)間響應(yīng)曲線.從圖中可知,ξi(t)總是非負(fù)的,并最終收斂于零.
圖3 編隊(duì)系統(tǒng)位置跟蹤誤差Fig.3 Trajectory tracking errors of USV
圖4 編隊(duì)系統(tǒng)執(zhí)行器控制輸入Fig.4 Control input of USV
圖5 動(dòng)態(tài)變量ξi(t)Fig.5 The dynamic variable of ξi(t)
圖6為3個(gè)USV的觸發(fā)時(shí)間間隔統(tǒng)計(jì)圖.通過計(jì)算可得,動(dòng)態(tài)事件觸發(fā)平均時(shí)間間隔為0.8 s,由圖6可知,最大觸發(fā)時(shí)間間隔為控制系統(tǒng)穩(wěn)定到加入外部干擾之間的仿真時(shí)間,在最大觸發(fā)時(shí)間間隔前由于需要不斷更新控制協(xié)議使編隊(duì)系統(tǒng)穩(wěn)定,加入干擾后需要更新控制協(xié)議克服擾動(dòng),因此在這兩個(gè)時(shí)間段的觸發(fā)頻率比較頻繁.
圖6 動(dòng)態(tài)事件觸發(fā)條件下3個(gè)跟隨USV的觸發(fā)次數(shù)和觸發(fā)時(shí)間間隔Fig.6 Trigger numbers and Trigger interval of three USV under dynamic event-triggering condition
圖7 為USV 之間通信傳輸數(shù)據(jù)大小統(tǒng)計(jì)圖.在數(shù)值模擬中,模擬時(shí)間選擇為150 s,采樣時(shí)間為0.125 s.假設(shè)每個(gè)數(shù)據(jù)的存儲(chǔ)大小為4字節(jié),那么在現(xiàn)有的連續(xù)時(shí)間觸發(fā)控制方案中[18],每個(gè)USV 在仿真時(shí)間內(nèi)通過通信信道發(fā)送的數(shù)據(jù)大小高達(dá)38400 字節(jié),而采用本文提出的動(dòng)態(tài)事件觸發(fā)控制方案,USV 之間發(fā)送的數(shù)據(jù)大小僅為5920,5890,6020 字節(jié).與時(shí)間觸發(fā)控制方案相比,通信數(shù)據(jù)分別減少84.6%,84.7%和84.3%.
圖7 USV之間通信傳輸數(shù)據(jù)大小Fig.7 Date size of communication transmission among USV
本文針對(duì)通信受限的無(wú)人艇協(xié)同跟蹤控制問題,提出了一種非周期性的動(dòng)態(tài)事件觸發(fā)信息傳輸策略,使每個(gè)USV可以間歇性向其鄰居發(fā)送信息,從而避免了USV之間頻繁的信息通訊,在保證系統(tǒng)收斂時(shí)間以及控制性能的前提下,動(dòng)態(tài)事件觸發(fā)策略能夠更大的增加觸發(fā)時(shí)間間隔,從而更有效的降低了通信資源消耗.在此基礎(chǔ)上,結(jié)合滑??刂撇呗耘c自適應(yīng)控制方法,本文提出了一種不需要通信網(wǎng)絡(luò)全局信息的控制方案.最后,仿真結(jié)果驗(yàn)證了編隊(duì)控制器的有效性.未來(lái),筆者將重點(diǎn)研究最小時(shí)間間隔的事件觸發(fā)控制問題,使得控制系統(tǒng)能夠在保證瞬態(tài)以及穩(wěn)態(tài)性能的同時(shí),更有效的節(jié)省通信資源.