王修業(yè),汪會明,孫芹芹
(1. 南京理工大學(xué)機械工程學(xué)院,南京 210018;2. 南京航空航天大學(xué)能源與動力學(xué)院,南京 210016)
隨著多智能體技術(shù)、人工智能技術(shù)和通信網(wǎng)絡(luò)技術(shù)的迅速完善和發(fā)展,無人機和無人車的應(yīng)用也越來越廣泛,如無人機環(huán)境偵察系統(tǒng)、無人機編隊作戰(zhàn)系統(tǒng)、無人車作戰(zhàn)系統(tǒng)、無人車運輸系統(tǒng)等[1-2]。為了將無人機和無人車應(yīng)用于更復(fù)雜的場景,越來越多的研究人員致力于由多個無人機和無人車組成的空地?zé)o人集群系統(tǒng)控制的研究。該系統(tǒng)能夠?qū)o人機的偵察能力和無人車的重型運載能力結(jié)合起來,能夠?qū)η閳笫占?、自主目?biāo)打擊和協(xié)同搜救等任務(wù)的執(zhí)行產(chǎn)生重大影響。因此,空地?zé)o人集群系統(tǒng)控制的研究具有重要的現(xiàn)實意義[3]。
空地協(xié)同、碰撞避免、不確定性處理是空地?zé)o人集群系統(tǒng)控制的三項重要控制任務(wù)。近年來,國內(nèi)外眾多學(xué)者對這三項控制任務(wù)的相關(guān)技術(shù)問題進行了研究。在空地協(xié)同控制方面,馬亞杰等基于虛擬領(lǐng)航-跟隨法的拓撲結(jié)構(gòu),提出了一種基于分布式自適應(yīng)觀測器的容錯編隊控制算法,實現(xiàn)了通信鏈路故障下多無人機-多無人車空地一體協(xié)同控制[4]。周思全等針對無人機-無人車異構(gòu)系統(tǒng)時變編隊控制與擾動抑制問題,設(shè)計了具有分層架構(gòu)的分布式時變編隊控制器[5]。朱旭等針對通信時延下的高維異構(gòu)無人機-無人車混合編隊控制系統(tǒng),提出了系統(tǒng)穩(wěn)定充分必要條件和時延邊界計算方法[6]。在碰撞避免控制方面,尹鳳儀等提出了一種基于改進人工勢場法的多無人車編隊路徑規(guī)劃方法,實現(xiàn)了無人車編隊對障礙的避碰[7]。蔡澤等提出了一種基于深度強化學(xué)習(xí)的自動導(dǎo)引車避障方法[8]。Chen 等提出了一種基于微分同胚變換的避碰控制方法[9-15]。在不確定性處理方面,孫芹芹等提出了一種自適應(yīng)有限時間容錯控制方案,能夠?qū)ο到y(tǒng)中存在的不確定性進行有效抑制[16-18]。本文對空地協(xié)同不定義某一固定場景,而是將空地協(xié)同這一類控制任務(wù)抽象出來,進行控制設(shè)計的研究。
同時,針對具有不確定性的空地?zé)o人集群系統(tǒng)控制設(shè)計了一種多任務(wù)協(xié)同的自適應(yīng)魯棒控制方法。首先,根據(jù)多個控制任務(wù)分別建立相關(guān)的伺服約束。然后,建立約束跟隨誤差,將空地協(xié)同問題轉(zhuǎn)化為一類近似約束跟隨問題。最后,提出了一種自適應(yīng)魯棒控制方法,以驅(qū)動無人集群系統(tǒng)在存在不確定性的情況下仍能遵循約束條件,從而實現(xiàn)無人集群系統(tǒng)空地協(xié)同控制中跟隨、避碰和不確定性抑制等多種控制任務(wù)。仿真結(jié)果表明,所提控制方法能夠有效實現(xiàn)預(yù)期空地?zé)o人集群系統(tǒng)的控制目標(biāo),并具有良好的性能。
考慮一個空地?zé)o人集群系統(tǒng),包括N架無人機和一輛無人車。定義N={1,2,…,N}為無人機的序號集,Γ={N+ 1}是無人車的序號集,?={1,2,…,N,N+ 1}為分配給所有無人單位(無人機和無人車)的序號集。在該系統(tǒng)中,無人機和無人車之間的相互作用和動力學(xué)是非常復(fù)雜的,需要復(fù)雜的控制策略來確保其相互協(xié)同和控制性能。令qi=[xi,yi,zi]T為無人單位在慣性坐標(biāo)系中的位置坐標(biāo),τi=[τxi,τyi,τzi]T為控制輸入,其中i∈?。無人系統(tǒng)的動力學(xué)模型為[19]
式中,t∈R 為時間,σi∈Σi?RPi為不確定性參數(shù), 代表無人集群系統(tǒng)的不確定性,Mi(qi,σi,t) >0 為慣性矩陣,Ci(qi,q?i,σi,t)q?i為 離 心 力 ,gi(qi(t),σi(t),t) 為 引 力 ,F(xiàn)i(qi,q?i,σi,t)為系統(tǒng)中的摩擦、空氣阻力或其他外部擾動。無人集群系統(tǒng)中的函數(shù)均為連續(xù)函數(shù)。
本文針對空地?zé)o人集群系統(tǒng)的控制目標(biāo)為:無人車進行跟蹤目標(biāo)軌跡,同時無人機群在運動時保持與無人車的期望距離,且不發(fā)生碰撞,如圖1所示。因此,預(yù)期有四方面的性能:(1)無人機之間避免碰撞;(2)無人機與地面之間避免碰撞;(3)無人機跟蹤無人車;(4)無人車軌跡跟蹤。
圖1 空地?zé)o人集群系統(tǒng)控制示意圖Fig.1 Schematic diagram of cross-domain control for airground unmanned swarm systems
第一,考慮無人機在相互飛行時的避碰性能。定義函數(shù)
表征兩架無人機k和j之間的距離關(guān)系,其中k,j∈N,k≠j,s>0表示無人機的最大半徑。
定義 1. (無人機之間避免碰撞)對于任意安全初始條件(即dkj(t0)>0),在所有t>t0的情況下,dkj(t) >0。
第二,考慮無人機在飛行過程中與地面的避碰性能。定義函數(shù)
表征無人機k與地面之間的距離關(guān)系,其中hk>0是無人機與地面的最小安全距離。同時,定義無人車最高點到地面的距離為hc>0,且hk>hc。
定義 2. (無人機避免與地面碰撞)對于任何初始安全條件(即dkh(t0)>0),在所有t>t0情況下,dkh(t) >0。
注 1. 由于hk>hc,在定義2 的條件下,無人機能夠避免與無人車相撞。
第三,考慮無人機與無人車之間的空地協(xié)同問題。定義函數(shù)
表征無人機k與無人車o之間的距離關(guān)系,基于距離關(guān)系,定義空地協(xié)同誤差
式中,?ko∈R表示無人機k和無人車o之間的期望距離。
定義 3. (無人機跟蹤無人車)對于無人機k的任何初始狀態(tài)qk(t0),存在時間Tk<∞,使得
式中,t≥Tk,?ko>0是任意小的常量。
第四,考慮無人車的軌跡跟蹤性能。定義軌跡跟蹤誤差
表征無人車o和期望軌跡之間的距離的誤差,其中為目標(biāo)軌跡。
定義 4. (無人車軌跡跟蹤)對于無人車o的任何初始位置狀態(tài)qo(t0),存在時間To<∞使得
式中,t≥To,ψ>0為無窮小常量。
第一,進行無人機相互間避碰約束的約束跟隨分析。對于系統(tǒng)中的任意兩個無人機k,j(k,j∈N,k≠j),定義
式中,dkj為式(2)顯示的距離關(guān)系函數(shù)。將無人機k上的避碰約束構(gòu)造為e?kj= 0,構(gòu)造其二階形式e?kj= 0。令
第二,進行無人機與地面避碰約束的約束跟隨分析。定義誤差函數(shù)
第三,進行無人機對無人車跟蹤約束的約束跟隨分析。構(gòu)造無人機跟蹤約束并求得其二階形式
第四,進行無人車軌跡跟蹤約束的約束跟隨分析。構(gòu)造無人車軌跡跟蹤并求得其二階形式
基于上述約束跟隨分析,本節(jié)將四個不同的任務(wù)整合,并設(shè)計一個控制器同時完成四種控制任務(wù),實現(xiàn)無人系統(tǒng)空地協(xié)同控制。首先進行約束整合,當(dāng)i∈N時
當(dāng)i∈Γ時
則每個無人單位i(i∈?)的約束跟隨誤差可表示為
在不確定性方面,考慮空地協(xié)同控制中的復(fù)雜時變不確定性,包括系統(tǒng)本身不確定性、外界干擾、測量誤差和初始狀態(tài)等。此類不確定性時變有界,但界限未知,相比以往單純的系統(tǒng)其不確定性更難控制。因此,為了便于后續(xù)進行不確定性估計,將和分解為
定理 1. 基于標(biāo)稱系統(tǒng)式(25) 和約束式(20),得到約束力為
該約束力遵循拉格朗日形式的達朗貝爾原理[20],使標(biāo)稱系統(tǒng)在模型已知和不存在不確定性的情況下滿足約束條件。然而,在實際工程中,該模型在大多數(shù)情況下是未知的(即存在不確定性)。因此,當(dāng)不確定性存在時,則需要對整個不確定系統(tǒng)進行更全面的控制設(shè)計,令
假設(shè)1. (1) 存在一個未知的常數(shù)向量αi∈(0,∞)ki,以及一個已知函數(shù)Πi(·,qi,q?i,t):(0,∞)ki× Rn× Rn× R →R+,對任意σi∈Σi有
(2) 對任意(qi,q?i,t) ∈Rn× Rn× R,函數(shù)Πi(·,qi,q?i,t): (0,∞)ki→R+有以下性質(zhì):(i) 一階連續(xù)可導(dǎo);(ii) 函數(shù)Πi為凹函數(shù),且對任意αi1,αi2∈(0,∞ki)有
(3)函數(shù)Πi相對于其自變量αi的每一個分量都是不遞減的。由于ρiE>-1,因此 1 +ρiE>0。Πi(·)與不確定性的邊界有關(guān)。常數(shù)向量αi與邊界集合Σi有關(guān),因此也可能是未知的。
在假設(shè)1. (2)的一種特殊情況下,函數(shù)Πi(·)可以對常數(shù)向量αi進行線性分解,即存在函數(shù)使得
這為選擇滿足假設(shè)1. (2)要求的Πi(·)提供了一種簡單可靠的方法。
式中,κi為設(shè)計參數(shù),Pi∈Rm×m為設(shè)計矩陣,γi(·)為控制設(shè)計函數(shù),Πi(·)為不確定性邊界函數(shù)[15]。定義自適應(yīng)律
注2. 在本控制方法中,pi1用于確保受控系統(tǒng)的標(biāo)稱部分緊密遵循約束,pi2使得系統(tǒng)狀態(tài)迅速接近期望值,pi3用于使得系統(tǒng)在存在不確定性的情況下,控制τi具有良好的魯棒性,以減少不確定性對系統(tǒng)性能的影響。
證明:為驗證定理2,選取函數(shù)
為合理的李雅普諾夫備選函數(shù)。其導(dǎo)函數(shù)為
接下來進行單獨分析,首先分析式(36)右端第一項
當(dāng)系統(tǒng)中不存在不確定性,即σi≡0 時,ΔMi= ΔCi= Δgi= ΔFi= 0,Qci=pi1,且
根據(jù)式(28)得
根據(jù)式(31)得
由于ΔDi=DiEi,結(jié)合式(32)可得
根據(jù)假設(shè)1及瑞利原理可得
聯(lián)立式(43)及式(44)可得
然后,根據(jù)假設(shè)1. (2)可得
將式(50) 代入式(48),并聯(lián)立式(49)可得
因此
式中,
基于以上分析,定理2 所描述的系統(tǒng)性質(zhì)成立,具體表現(xiàn)為
(1)一致有界性
(2)一致最終有界性
式中,
因為函數(shù)γi是嚴(yán)格遞增的,因此通過調(diào)整控制器參數(shù)κi,,εi可以選擇任意小的。至此,基于以上分析,證明所設(shè)計的約束跟隨控制方法能夠使得受控空地?zé)o人協(xié)同系統(tǒng)達到預(yù)期的跟蹤和避碰性能。
為了進一步驗證所提控制方法的性能水平,本節(jié)在仿真過程中將所提出的自適應(yīng)魯棒控制與線性二次型調(diào)節(jié)器(Linear Quadratic Regulator,LQR)控制進行比較。選取仿真參數(shù)m1,2,3,4= 10,s= 0.25,h1,2,3= 0.2,?14,24,34= 4,l14,24,34=3.6,l4= 3.6,g1,2,3,4= 9.81,κ1,2,3,4= 15,P1,2,3,4= 0.8,,,k1= 0.1,k2= 1.2。選擇1 倍不確定的大小為(1倍描述為 1x, 100 倍描述為 100x)Fi=[0.1sin10t, 0.1sin10t, 0.1sin10t]T以及初始狀態(tài)q1(0) =[0,2,2.8]T,q2(0) =[-1,1,3.3]T,q3(0) =[1,0,2.5]T,q4(0) =[1,0,0]T,。仿真參數(shù)的選用原則為:(1)無人機不處于危險碰撞狀態(tài),即無人機之間保持安全的距離;(2)為了驗證在系統(tǒng)初始狀態(tài)不處于目標(biāo)約束下時控制器的控制性能,無人車的初始位置選擇在目標(biāo)軌跡上;(3)無人機與無人車初始距離不處于目標(biāo)距離內(nèi);(4)為大于0的隨機值;(5)不確定性符合時變、有界等特性。上述兩種控制器在不同不確定性干擾下的比較結(jié)果如圖2~9所示。
圖2 自適應(yīng)魯棒控制下的運動軌跡Fig.2 Motion trajectories under the adaptive robust control
圖2、圖3 為在這兩種方法控制下不同不確定性干擾時每個無人單位的運動軌跡情況。圖4 為任意兩架無人機之間的距離關(guān)系, 其中d12,d23,d31始終大于0,且采用自適應(yīng)魯棒控制的任意兩架無人機之間的距離比LQR 控制時更快地穩(wěn)定在安全值。圖5 為每架無人機與地面之間的距離關(guān)系,其距離d1h,d2h,d3h始終大于所設(shè)最小安全距離h1,2,3,且相較于LQR控制,自適應(yīng)魯棒控制可使無人機更快地到達穩(wěn)定的飛行高度。圖6 為空地協(xié)同誤差e14,24,34,可以看出,相較于LQR 控制,所提出的控制方法可以使空地誤差更快地接近期望鄰域。圖7 為無人車的軌跡跟蹤誤差,在所提出的自適應(yīng)魯棒控制策略下,跟蹤誤差接近于期望鄰域,而LQR 控制無法將跟蹤誤差穩(wěn)定到期望鄰域。圖8、圖9 給出了不同不確定性干擾下的自適應(yīng)參數(shù)的變化趨勢,二者都在10 s左右近似收斂至0。結(jié)合圖2~9 在100 倍不確定性干擾下的圖線,其所顯示兩種控制方法的各方面控制性能可以表明,當(dāng)加大不確定性干擾時,所設(shè)計的自適應(yīng)魯棒控制器受到不確定性干擾較小,能夠使得系統(tǒng)穩(wěn)定運行。相比之下,LQR 控制下的無人系統(tǒng)受到了較大干擾,控制效果也隨之下降,各類誤差均無法收斂至穩(wěn)定值。因此,本文所提自適應(yīng)魯棒控制方法有更好的魯棒性,對不確定性干擾的抑制效果更好。
圖3 LQR控制下的運行軌跡Fig.3 Motion trajectories under the LQR control
圖4 無人機之間的距離Fig.4 Distance between UAVs
圖5 無人機與地面的距離Fig.5 Distance between UAVs and ground
圖6 空地協(xié)同誤差Fig.6 Air-ground cross-domain coordinated errors
圖7 無人車的軌跡跟蹤誤差Fig.7 Trajectory tracking errors of UGVs
圖8 自適應(yīng)律的變化趨勢(1x)Fig.8 Change tendencies of the adaptive laws(1x)
圖9 自適應(yīng)律的變化趨勢(100x)Fig.9 Change tendencies of the adaptive laws(100x)
本文針對多任務(wù)空地?zé)o人集群系統(tǒng)控制問題,提出了一種同時解決多種任務(wù)的自適應(yīng)魯棒控制方法。通過創(chuàng)造性的轉(zhuǎn)換,將四個控制任務(wù)分別轉(zhuǎn)化為伺服約束,并將其整合在一個約束方程中,并建立了約束跟隨誤差χ表征系統(tǒng)性能,將空地協(xié)同控制問題轉(zhuǎn)化為一類近似約束跟隨問題。在此基礎(chǔ)上,提出自適應(yīng)魯棒控制方案,并建立自適應(yīng)律,使得系統(tǒng)在包含不確定性條件下呈現(xiàn)一致有界性和一致最終有界性。最后通過仿真分析,驗證了所提控制方法能夠?qū)崿F(xiàn)具有避碰、軌跡跟蹤和不確定性抑制性能的無人機-無人車空地集群控制。在未來的研究中,將進一步探究具有外部環(huán)境避碰性能的空地?zé)o人集群系統(tǒng)的控制方法。此外,還將搭建物理實驗平臺,進一步驗證控制方法在實踐中的有效性。