孫曉明,徐 慶,鄭興偉,霍海波,田中旭
(1.上海海洋大學(xué) 工程學(xué)院,上海 201306;2.北京航空航天大學(xué) 自動(dòng)化科學(xué)與電氣工程學(xué)院,北京 100191)
隨著人們對(duì)新的油氣資源、生物資源的關(guān)注,對(duì)海洋資源的探索和開發(fā)已是一種必然趨勢(shì)。海洋貿(mào)易、海洋運(yùn)輸以及海岸作戰(zhàn)登陸已是一個(gè)國(guó)家話語(yǔ)權(quán)的一種體現(xiàn)。不論海洋資源的開發(fā)還是海上作戰(zhàn)部署,動(dòng)態(tài)復(fù)雜環(huán)境下海洋水面船舶的控制策略研究都是當(dāng)前的研究熱點(diǎn)[1-4]。
綜合考慮船舶節(jié)能、航行安全、減排等重要控制因素,以及船舶運(yùn)動(dòng)的非線性、模型不確定性、外界未知干擾存在的情況下,為實(shí)現(xiàn)海上作業(yè)任務(wù),對(duì)船舶跟蹤控制的研究皆具有重要意義[5-7]。當(dāng)前船舶控制研究主要有設(shè)定點(diǎn)跟蹤、路徑跟蹤和軌跡跟蹤[8-13]。定點(diǎn)控制研究中,船舶的目標(biāo)位置為一固定點(diǎn)。在路徑跟蹤控制中,需要預(yù)先設(shè)定靜態(tài)幾何位置目標(biāo)點(diǎn),與時(shí)間無(wú)關(guān)。而在軌跡跟蹤控制中,船舶需要跟蹤時(shí)變目標(biāo)期望軌跡,達(dá)到軌跡實(shí)時(shí)跟蹤的控制目的。
非常有趣的是,從人類的很多作業(yè)任務(wù)中,我們發(fā)現(xiàn)移動(dòng)到達(dá)的最終目標(biāo)往往是一個(gè)區(qū)域而非目標(biāo)點(diǎn),比如汽車停泊、投籃、飛鏢游戲等等。區(qū)域到達(dá)控制近年來(lái)被提出[14-17],其控制目標(biāo)由設(shè)定點(diǎn)變?yōu)槠谕繕?biāo)空間區(qū)域,具備計(jì)算量小、快速性好、魯棒性和實(shí)時(shí)性強(qiáng)等特性。文獻(xiàn)[15]針對(duì)機(jī)器人系統(tǒng)首次提出了區(qū)域到達(dá)控制的概念,它是對(duì)設(shè)定點(diǎn)到達(dá)控制算法的一種擴(kuò)展。文獻(xiàn)[16]針對(duì)多機(jī)器人系統(tǒng),研究了多個(gè)目標(biāo)區(qū)域機(jī)器人協(xié)同到達(dá)控制算法,大量的機(jī)器人群體,最終分別到達(dá)不同的目標(biāo)區(qū)域內(nèi)。此外,區(qū)域到達(dá)控制可被同時(shí)應(yīng)用于微觀/宏觀系統(tǒng),通過(guò)引入目標(biāo)區(qū)域,作為宏觀系統(tǒng)的水下機(jī)器人可以更加靈活地調(diào)整自身位置,而作為微觀系統(tǒng)的機(jī)械臂可以執(zhí)行各種各樣的水下作業(yè)任務(wù)[17]。
反演法的設(shè)計(jì)思想是將復(fù)雜非線性系統(tǒng)降階分解為若干子系統(tǒng),按照從前往后依次遞推的方式,為每一個(gè)子系統(tǒng)構(gòu)造李雅普諾夫函數(shù),設(shè)計(jì)中間虛擬反饋控制量,使所有的子系統(tǒng)都能夠漸進(jìn)穩(wěn)定,最后,設(shè)計(jì)整個(gè)控制系統(tǒng)的控制律。對(duì)于不確定性系統(tǒng),該方法往往與自適應(yīng)控制結(jié)合使用,以實(shí)現(xiàn)魯棒性控制。
由于傳統(tǒng)的反演法要求系統(tǒng)模型結(jié)構(gòu)及參數(shù)精確已知,而船舶系統(tǒng)具有非線性強(qiáng)、時(shí)滯、慣性大的特性,且外界擾動(dòng)未知,速度不易測(cè)量,因此對(duì)船舶的跟蹤控制問題具備一定的挑戰(zhàn)性。在過(guò)去的數(shù)十年里,已被普遍證實(shí),神經(jīng)網(wǎng)絡(luò)和模糊逼近方法可以以任意精度實(shí)時(shí)逼近不確定的復(fù)雜非線性系統(tǒng)[18-19]。
神經(jīng)網(wǎng)絡(luò)方法已被廣泛應(yīng)用于逼近非線性系統(tǒng)數(shù)學(xué)模型中的未知項(xiàng),因而,不再需要花費(fèi)太多的精力在系統(tǒng)建模上,這尤其適用于建模非常困難的應(yīng)用場(chǎng)合。在考慮海風(fēng)、海浪以及海流等外界干擾影響比較大的情況下,精確的船舶模型很難得到,模型中往往存在著一定的不確定性,故而可以采用神經(jīng)網(wǎng)絡(luò)方法來(lái)逼近以及補(bǔ)償船舶系統(tǒng)模型中存在的任意不確定項(xiàng)。
針對(duì)全驅(qū)動(dòng)海洋水面船舶系統(tǒng),提出了一種基于反演的自適應(yīng)區(qū)域到達(dá)控制算法。利用RBF神經(jīng)網(wǎng)路較強(qiáng)的自學(xué)習(xí)能力,可無(wú)需船舶的精確模型,在線實(shí)時(shí)逼近控制器中的未知非線性部分。由于引入了目標(biāo)區(qū)域函數(shù),目標(biāo)區(qū)域可設(shè)定為任意形狀,因此,區(qū)域到達(dá)控制算法具有節(jié)省能源以及優(yōu)化船舶性能等優(yōu)勢(shì)。通過(guò)李雅普諾夫理論證明了所提出的船舶區(qū)域到達(dá)控制算法的穩(wěn)定性。最終,通過(guò)仿真驗(yàn)證了所提出的船舶區(qū)域到達(dá)控制算法的有效性。
在考慮模型參數(shù)不確定和外部干擾存在的情況下,建立三自由度多輸入多輸出的全驅(qū)動(dòng)海洋水面船舶數(shù)學(xué)模型如下[20]:
(1)
其中:η=[x,y,ψ]T∈3,是由大地坐標(biāo)系下船舶的位置坐標(biāo)(x,y)和航向角ψ所構(gòu)成的向量;v=[u,v,r]T∈3,是船舶速度向量,分別由縱向前進(jìn)速度、橫漂速度和艏搖角速度組成;d(η,v,t)∈3是由不確定的橫向、縱向和艏向擾動(dòng)項(xiàng)構(gòu)成的向量,分別來(lái)自外部環(huán)境、未建模的動(dòng)態(tài)等等;τ∈3為船舶控制輸入向量。
J(η)∈3×3為三自由度雅可比轉(zhuǎn)換矩陣,其數(shù)學(xué)表達(dá)式為:
這里,狀態(tài)轉(zhuǎn)換矩陣J(η)滿足JT(η)Jη=I以及J-1(η)=JT(η)的特性。M∈3×3為系統(tǒng)慣性矩陣,并且M=MT>0,C(v)∈3×3為科氏向心力矩陣,D(v)為阻尼參數(shù)矩陣,g(η)為未知恢復(fù)力和力矩向量。
區(qū)別于傳統(tǒng)的點(diǎn)到達(dá)控制,在船舶區(qū)域到達(dá)控制概念中,控制目標(biāo)為期望的目標(biāo)空間區(qū)域而非設(shè)定點(diǎn)。本文的控制目的是設(shè)計(jì)控制器τ,使船舶能夠從任意初始位置,收斂到達(dá)至預(yù)先設(shè)定的目標(biāo)區(qū)域,如圖1所示,區(qū)域到達(dá)控制中期望的目標(biāo)區(qū)域可以用不等式函數(shù)來(lái)設(shè)定。船舶實(shí)際位置用向量=[x,y]T來(lái)表示,取任意參考點(diǎn)0=[0,x,0,y]T為期望目標(biāo)區(qū)域的中心點(diǎn)。定義不等式函數(shù)ζ(δ0):
ζ(δ0)≤0
(2)
為期望的目標(biāo)區(qū)域,其中δ0=-0,ζ(δ0)∈為一階連續(xù)可微的標(biāo)量函數(shù)。期望的目標(biāo)區(qū)域可以設(shè)定為任意形狀,因此,為方便描述,目標(biāo)區(qū)域可設(shè)定為一個(gè)以0為中心,半徑為r0的圓,則目標(biāo)區(qū)域不等式函數(shù)可寫為如下形式:
(3)
其中:ζ(δ0)∈2→為船舶的目標(biāo)區(qū)域函數(shù),該目標(biāo)區(qū)域函數(shù)具有如下性質(zhì):
1)船舶與目標(biāo)區(qū)域的距離有界性決定了目標(biāo)區(qū)域函數(shù)的有界性;
2)目標(biāo)區(qū)域函數(shù)是關(guān)于船舶與目標(biāo)區(qū)域的距離變量,δ0,連續(xù)并可微的。
很顯然,假如設(shè)定目標(biāo)區(qū)域的半徑為零,控制目標(biāo)區(qū)域?qū)⒖s小為一個(gè)目標(biāo)點(diǎn),因而可以得出區(qū)域到達(dá)控制概念是對(duì)設(shè)定點(diǎn)到達(dá)控制算法的擴(kuò)展。
圖1 船舶區(qū)域到達(dá)控制原理圖
(4)
其中:δη0=η-η0,η0=[0,x,0,y,ψ0]。構(gòu)造船舶目標(biāo)勢(shì)能函數(shù):
(5)
其中:k為正常數(shù),該目標(biāo)勢(shì)能函數(shù)具有如下性質(zhì):
1)如果ζ(δ0)≤0,此時(shí)船舶已收斂到達(dá)至目標(biāo)區(qū)域內(nèi),則P(δη0)=0,勢(shì)能函數(shù)關(guān)閉,不產(chǎn)生作用;
2)如果ζ(δ0)>0,即船舶位于目標(biāo)區(qū)域外,尚未進(jìn)入目標(biāo)區(qū)域,則P(δη0)>0,勢(shì)能函數(shù)產(chǎn)生作用,使船舶不斷收斂跟蹤至目標(biāo)區(qū)域;
3)如果ζ(δ0)>0,則P(δη0)隨著的增加而單調(diào)遞增,即船舶距離目標(biāo)區(qū)域越遠(yuǎn),勢(shì)能函數(shù)值越高,船舶的收斂速度越快;
4)如果ζ(δ0)→∞,則P(δη0)→∞,也就是當(dāng)船舶距離目標(biāo)區(qū)域無(wú)窮遠(yuǎn)時(shí),目標(biāo)勢(shì)能函數(shù)產(chǎn)生的作用值也趨于無(wú)窮大,以實(shí)現(xiàn)船舶的區(qū)域到達(dá)控制目標(biāo)。
在實(shí)際應(yīng)用中,系統(tǒng)模型往往存在不確定函數(shù)性。神經(jīng)網(wǎng)絡(luò)具有較好的自學(xué)習(xí)能力,可以以任一精度實(shí)時(shí)在線逼近任一未知非線性函數(shù)。從函數(shù)逼近方式上看,神經(jīng)網(wǎng)絡(luò)方法可分為全局和局部逼近兩種,而局部逼近具有學(xué)習(xí)速度快的特性,RBF(徑向基)函數(shù)就是一種局部逼近的神經(jīng)網(wǎng)絡(luò),下文將對(duì)其進(jìn)行詳細(xì)介紹。
在控制工程中,RBF神經(jīng)網(wǎng)絡(luò)已被廣泛用于逼近未知連續(xù)函數(shù)[21]:
fnn(Z)=WTS(Z)
(6)
其中:W=[w1,w2,…,wl]T∈Rl為權(quán)值向量,l為神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù),Z=[z1,z2,…,zq]T∈Rq為輸入向量,S(Z)=[s1(Z),s2(Z),…,sl(Z)]T∈Rl為已知連續(xù)基函數(shù)向量,通常取si(Z)為高斯函數(shù):
(7)
其中:μi=[μi1,…,μiq]T為徑向基函數(shù)的中心向量,ηi為基寬參數(shù)。在緊集ΩZ?Rq上,RBF神經(jīng)網(wǎng)絡(luò)已被證明,其能夠以任意精度逼近非線性連續(xù)函數(shù):
f(Z)=W*TS(Z)+ε(Z),?Z∈Ωz
(8)
其中:W*為最優(yōu)常數(shù)權(quán)值向量,ε為逼近誤差并且滿足|ε(Z)|≤ε*,?Z∈Ωz,未知常數(shù)ε*>0。由于W*為自定義量,對(duì)所有的Z∈Ωz?Rq,通常將其定義為能夠使|ε|最小的量,也就是:
(9)
基于第一部分所提出的控制目標(biāo),在考慮參數(shù)不確定性和時(shí)變未知干擾的情況下,聯(lián)合反演算法、神經(jīng)網(wǎng)絡(luò)逼近和二次李雅普諾夫函數(shù)等工具,設(shè)計(jì)了一種船舶區(qū)域到達(dá)控制器,預(yù)先設(shè)定期望的參考向量η0,使船舶能夠最終收斂到達(dá)至目標(biāo)區(qū)域。在反演遞歸步驟一中,通過(guò)引入勢(shì)能函數(shù)可以實(shí)現(xiàn)目標(biāo)區(qū)域跟蹤這一控制目標(biāo),并且會(huì)給定一個(gè)虛擬反饋間接控制量α,用以實(shí)現(xiàn)特定的期望性能;而第二步則嚴(yán)格按照迭代方法,采用自適應(yīng)技術(shù),實(shí)時(shí)更新神經(jīng)網(wǎng)絡(luò)權(quán)值,提出關(guān)于總的李雅普諾夫函數(shù)V2的控制律τ,進(jìn)而保證閉環(huán)系統(tǒng)的穩(wěn)定性,具體設(shè)計(jì)過(guò)程如下:
步驟1 定義誤差變量:
z1=η-η0
(10)
對(duì)其求導(dǎo)可得:
(11)
這里,v可以看作式(11)中z1子系統(tǒng)的虛擬控制量,選α=v,并設(shè)計(jì)李雅普諾夫函數(shù):
(12)
其中:k>0,為正常數(shù),將目標(biāo)跟蹤勢(shì)能函數(shù)引入至李雅普諾夫函數(shù)中,可以保證船舶收斂跟蹤至目標(biāo)區(qū)域中。
由于v為虛擬控制量,不是z1子系統(tǒng)的實(shí)際控制量,故而定義誤差量:
z2=v-α
(13)
并設(shè)定虛擬控制信號(hào)量:
(14)
其中:k1>0為設(shè)計(jì)參數(shù)。則:
(15)
步驟2 對(duì)變量求導(dǎo)得:
M-1d(η,v,t)-M-1g(η)
(16)
為穩(wěn)定整個(gè)閉環(huán)系統(tǒng)(z1,z2),定義李雅普諾夫函數(shù):
(17)
設(shè)計(jì)控制律和自適應(yīng)更新律如下:
(18)
(19)
(20)
引理1 如果函數(shù)V(t)為定義在時(shí)間t∈R+上的連續(xù)可微函數(shù),并滿足V(t)大于等于0且V(0)是有界的,假如滿足如下不等式關(guān)系:
這里,c1>0,c2為常量,則認(rèn)為函數(shù)V(t)是有界的。
定理1 對(duì)于具有動(dòng)力學(xué)模型為公式(1)形式的海洋水面船舶系統(tǒng),在設(shè)計(jì)區(qū)域到達(dá)控制律為公式(18)以及神經(jīng)網(wǎng)絡(luò)權(quán)值更新律為公式(19)的情況下,如果存在足夠大的緊集Ωi,i=1,2,滿足Zi∈Ωi,?t≥0,則對(duì)于起始于任意緊急Ω0的有界初始條件下,滿足:
1)閉環(huán)系統(tǒng)中的所有變量都是有界的,系統(tǒng)狀態(tài)量以及神經(jīng)網(wǎng)絡(luò)權(quán)系數(shù)向量將最終收斂到某一有界緊集中;
證明:
1)首先,對(duì)V2進(jìn)行求導(dǎo)得:
(21)
將控制律表達(dá)式(18)和更新律表達(dá)式(19)代入公式(21),根據(jù)楊氏不等式,整理可得:
(22)
其中:ρ,c,d1>0,并且:
2)通過(guò)求解式(22),可得:
0≤V2(t)<δ+(V2(0)-δ)exp(-ρt)
(23)
其中:δc/ρ>0,可進(jìn)一步得到:
V1<δ+V2(0)exp(-ρt),
(24)
因此,假如給定:
則存在T,使得如下不等式成立:
?t≥T
(25)
則:
(26)
這里,μ的大小取決于參數(shù)k,k1,k2,σi,Γi和逼近誤差ε,因而增加增益參數(shù)和神經(jīng)網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)可以得到較好的跟蹤性能。
本節(jié)采用CyberShip II全驅(qū)動(dòng)無(wú)人船模型進(jìn)行船舶區(qū)域到達(dá)控制算法的仿真驗(yàn)證,該船模是挪威科技大學(xué)海洋控制實(shí)驗(yàn)室根據(jù)1∶70的比例所構(gòu)建的。
該模型船的動(dòng)力學(xué)模型可以用式(1)來(lái)描述,式中矩陣M,C(v)和D(v)的數(shù)學(xué)表達(dá)式分別為:
這里,
c13=-m22v-m23r,c23=m11u
d22=-Yv-Yv|v|v|-Y|r|v|r|,
d23=-Yr-Yv|r|v|-Y|r|r|r|,
d32=-Nv-Nv|v|v|-N|r|v|r|,
d33=-Nr-Nv|r|v|-N|r|r|r|.
表1 無(wú)人船主要參數(shù)列表
為了便于仿真實(shí)驗(yàn)驗(yàn)證,設(shè)定期望目標(biāo)區(qū)域?yàn)榘霃絩0=2的圓,中心位置0=[5,-8],并隨機(jī)指定船舶初始位置為(0)=[0,0]。所采用的RBF神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為20個(gè),即l=20,高斯函數(shù)的中心矢量,μi的每一分量均勻分布在[-5,5],基寬取1,網(wǎng)絡(luò)的初始權(quán)值取0,仿真中采用控制律式(18)和自適應(yīng)律式(19),得到仿真結(jié)果如圖2~3所示。
圖2 船舶在平面內(nèi)的運(yùn)動(dòng)軌跡
全驅(qū)動(dòng)海洋水面艦船在整個(gè)XY平面內(nèi)的運(yùn)動(dòng)曲線如圖2所示,可以清楚地觀察到,本文所提出的基于RBF神經(jīng)網(wǎng)絡(luò)的自適應(yīng)區(qū)域到達(dá)控制算法能夠快速地使無(wú)人模型船很好地趨近并收斂至以目標(biāo)點(diǎn)為中心的目標(biāo)空間區(qū)域內(nèi)。
圖3表明,船舶的目標(biāo)勢(shì)能函數(shù)隨著時(shí)間增加,最終趨近于零,由目標(biāo)勢(shì)能函數(shù)的性質(zhì)(1)可知,當(dāng)勢(shì)能函數(shù)的值為零時(shí),勢(shì)能函數(shù)關(guān)閉不再發(fā)揮作用,此時(shí)船舶已收斂到達(dá)至目標(biāo)區(qū)域內(nèi),證明了對(duì)全驅(qū)動(dòng)海洋水面船舶的區(qū)域到達(dá)控制得以實(shí)現(xiàn),進(jìn)一步闡述了該控制算法的有效性。
圖3 目標(biāo)跟蹤勢(shì)能函數(shù)曲線
本文針對(duì)三自由度全驅(qū)動(dòng)海洋水面船舶,在考慮了模型不確定和外部環(huán)境擾動(dòng)未知的情況下,提出了一種基于神經(jīng)網(wǎng)絡(luò)的自適應(yīng)區(qū)域到達(dá)控制算法,綜合了RBF神經(jīng)網(wǎng)絡(luò)、魯棒反演技術(shù)和李雅普諾夫穩(wěn)定性理論等方法。選擇設(shè)計(jì)合適的李雅普諾夫函數(shù),通過(guò)閉環(huán)系統(tǒng)的穩(wěn)定性分析,證明所有信號(hào)都具有一致最終有界性。仿真驗(yàn)證實(shí)驗(yàn)結(jié)果表明,船舶能夠趨近并收斂到達(dá)至目標(biāo)空間區(qū)域,所設(shè)計(jì)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器是簡(jiǎn)潔并有效的。