国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于狀態(tài)可行域約束的單輸入極值搜索系統(tǒng)自適應(yīng)控制?

2018-01-04 01:33王佩飛李海燕
艦船電子工程 2017年12期
關(guān)鍵詞:極值約束軌跡

王佩飛 李海燕

1 引言

控制系統(tǒng)中,系統(tǒng)的參考輸出量和參考輸入量之間一般存在某種關(guān)系,這種關(guān)系我們可以稱之為參考軌跡。顯然,在參考輸入的作用下,控制系統(tǒng)的輸出軌跡中存在一個全局最優(yōu)極值點(diǎn)[1~2]。而在實(shí)際控制系統(tǒng)中,因?yàn)槲覀儾⒉荒軌驕?zhǔn)確知曉控制系統(tǒng)的具體結(jié)構(gòu)以及每個參數(shù)都存在不準(zhǔn)確性,這就讓我們很難精確地了解系統(tǒng)參考軌跡的形式,這也給我們對未知參考軌跡進(jìn)行尋優(yōu)的過程帶來了很大的難度[3~4]。進(jìn)入 20世紀(jì)后,為了能夠找到未知參考軌跡的最優(yōu)值,人們孜孜不倦地探索研究,提出了如粒子群算法[5~6]、模擬退火算法[8]等多種最優(yōu)化方法,這些方法都能夠有效地實(shí)現(xiàn)極值搜索功能,但這些都是從數(shù)值計(jì)算的角度來對參考軌跡進(jìn)行尋優(yōu)的,而且還需要知道或者至少知道部分系統(tǒng)參考軌跡[9]。進(jìn)入21世紀(jì)后,針對不等式約束問題的研究逐漸增多,文獻(xiàn)[11]利用障礙罰函數(shù)構(gòu)造新的目標(biāo)函數(shù)使?fàn)顟B(tài)避開不可行域,并利用基于激勵信號的極值搜索方法進(jìn)行仿真研究。文獻(xiàn)[12]針對嚴(yán)格反饋系統(tǒng)的輸出約束問題,在反演控制器設(shè)計(jì)過程中引入重構(gòu)障礙型Lyapunov函數(shù)進(jìn)行虛擬控制量設(shè)計(jì),再通過滑模控制方法確保系統(tǒng)穩(wěn)定。文獻(xiàn)[13]針對嚴(yán)格反饋系統(tǒng)的狀態(tài)約束問題,利用障礙罰函數(shù)處理約束情況,利用自適應(yīng)反演控制器確保系統(tǒng)穩(wěn)定。截止目前,針對極值搜索系統(tǒng)的狀態(tài)可行域約束的研究仍然較少,需進(jìn)一步深入研究。

2 問題描述

考慮如下形式的單輸入極值搜索系統(tǒng):其中,x=[x1,x2,…xn]T∈Rn為系統(tǒng)狀態(tài)向量,u∈R為系統(tǒng)輸入量,y∈R為系統(tǒng)輸出量;y=J(x1)為目標(biāo)函數(shù);xˉi=[x1,x2,…,xi]T∈Ri為由系統(tǒng)狀態(tài) x1到系統(tǒng)狀態(tài)xi構(gòu)成的狀態(tài)向量,狀態(tài)量xi是可測的;函數(shù) fi(?),gi(?),?i(?),(i ∈ [1 , 2,…,n] )是連續(xù)有界的光滑函數(shù)。

控制目標(biāo)如下:設(shè)計(jì)自適應(yīng)控制輸入u,使得系統(tǒng)(1)中的目標(biāo)函數(shù) y=J(x1)能夠搜索到其對應(yīng)的全局極值處,且保證閉環(huán)系統(tǒng)中的所有信號全局有界。

我們先做如下假設(shè):

假設(shè)1:存在常數(shù) fi0>0,使得 | fi(?)|>fi0成立,(i∈[1 , 2,…,n] )。

通過假設(shè)1的限制,可知 fi(?)始終是嚴(yán)格正或是嚴(yán)格負(fù)的,并且 fi(?)的絕對值始終為正,即系統(tǒng)(1)是狀態(tài)可控的。不失一般性地,本文設(shè)定fi(?)>0。

假設(shè)2:當(dāng) x1=x1*時目標(biāo)函數(shù)存在唯一極值點(diǎn)y=J*(x*),目標(biāo)函數(shù)滿足

3 基于狀態(tài)可行域約束極值參考軌跡設(shè)計(jì)

針對如式(1)所示的極值搜索系統(tǒng),是在x1∈(- ∞,+∞ )的范圍內(nèi)搜索目標(biāo)函數(shù)的極值,但在工程應(yīng)用中常常需要在S(x1)≤0所對應(yīng)的某個區(qū)間范圍內(nèi)搜索目標(biāo)函數(shù)的全局極值。因此針對狀態(tài)量x1的可行域進(jìn)行約束,我們構(gòu)造新的極值搜索系統(tǒng)

其中,各個變量和所有參數(shù)與如式(1)所示系統(tǒng)一致,且滿足假設(shè)1和假設(shè)2。本文的狀態(tài)量x1可行域約束是針對x1的穩(wěn)定狀態(tài)而言,此時使目標(biāo)函數(shù)最終能夠搜索到狀態(tài)量x1滿足可行域約束S()x1≤0時所對應(yīng)區(qū)間內(nèi)的全局極值。

我們假設(shè)設(shè)計(jì)的控制器可以實(shí)現(xiàn)狀態(tài)量對極值參考軌跡的有效跟蹤,則對狀態(tài)量的可行域約束即是對極值參考軌跡的約束,故考慮對極值參考軌跡 x1,d滿足約束條件 S( )x1,d≤0 的情況進(jìn)行處理。設(shè)存在可行域約束時的狀態(tài)量x1的極值參考軌跡為x?

1,d,引入經(jīng)典對數(shù)型罰函數(shù)對 x?1,d滿足≤0進(jìn)行處理。

當(dāng)目標(biāo)函數(shù)含唯一極大值時采用的對數(shù)型罰函數(shù)為

當(dāng)目標(biāo)函數(shù)含唯一極小值時采用的對數(shù)型罰函數(shù)為

通過引入如式(4)和式(5)所示的罰函數(shù),構(gòu)造存在可行域約束時新的目標(biāo)函數(shù)為

通過新目標(biāo)函數(shù)的構(gòu)造,將狀態(tài)約束S(x1)≤0時搜索目標(biāo)函數(shù)Jθ)最值的問題變?yōu)樗阉餍履繕?biāo)函數(shù)最值的問題。因此,我們現(xiàn)在只需針對入式(6)設(shè)計(jì)極值參考軌跡即可。考慮因 滿足S(?≤0而可能引起的可行域包含若干無交集區(qū)間的問題,現(xiàn)做補(bǔ)充假設(shè):?

1,d考慮到引入的對數(shù)型罰函數(shù)(4)和(5)可知需滿足 S()≠0,同時考慮到極值參考軌跡 設(shè)計(jì)需對罰函數(shù)進(jìn)行求微分處理,故針對可行域約束函數(shù)做補(bǔ)充假設(shè):

假設(shè)4:約束函數(shù)S(x1)在滿足S(x1(0 ) )<0的定義域內(nèi)是有界連續(xù)光滑函數(shù)。

控制目標(biāo)為:使得系統(tǒng)(3)搜索到如式(6)所示的新目標(biāo)函數(shù)的最大值或最小值的較小有界鄰域內(nèi),且閉環(huán)系統(tǒng)中的所有信號有界。

不失一般性的,以目標(biāo)函數(shù)含唯一極大值情況為例,構(gòu)造目標(biāo)函數(shù)(6)與狀態(tài)量x1和極值參考軌跡x? 的Lyapunov函數(shù)

由式(8)可得狀態(tài)量x1的參考軌跡應(yīng)滿足

其中,kd∈R+為設(shè)計(jì)常數(shù)。

將式(9)代入式(8)可得

由式(7)可得VJS≥0,由式(10)可得當(dāng)極值參考軌跡 x? 如式(9)所示時,≤0 。當(dāng)狀態(tài)量 x1,dJS1沿著極值參考軌跡x? 向 lim =0 的方向趨近1,dt→+∞JS時,最終可到達(dá)對應(yīng)的最大值點(diǎn)x1*處,此時新目標(biāo)函數(shù)穩(wěn)定在對應(yīng)區(qū)間最值的較小有界鄰域內(nèi)。由假設(shè)4可知,極值參考軌跡(9)是可行的,且極值參考軌跡及其高階導(dǎo)數(shù)t),(i ∈ [1 , 2,…,n]) 是有界光滑的。

下面分類討論一下當(dāng)狀態(tài)量x1存在可行域約束S(x1)≤0時的極值搜索問題。不失一般性的,我們假設(shè)目標(biāo)函數(shù)J(x)存在唯一的極大值J*(x*),此時對應(yīng)的狀態(tài)滿足x1*∈(a3,+∞ ),假設(shè)狀態(tài)量 x1存在的可行域約束范圍為x1∈[a1,a2] ∪ [a3, +∞ ),其中a1<a2<a3。采用本文方法,狀態(tài)量x1的初始值不受可行域約束的限制,即x1(0)∈(- ∞,+∞ ),而極值參考軌跡的初始值受可行域約束的限制,需滿足(0)∈(a ,a)∪ (a ,+∞ )。下面,以此為例123討論目標(biāo)函數(shù)搜索到最優(yōu)值的過程:

情況二、當(dāng) (0)∈(a3,+∞ ) 時,x1將沿著極值參考軌跡?收斂至處,此時目標(biāo)函數(shù)達(dá)到可行域約束范圍(a3,+∞ ) 內(nèi)唯一極大值),即新目標(biāo)函數(shù)穩(wěn)定在對應(yīng)區(qū)間內(nèi)的最大值處。

以此類推,狀態(tài)量x1存在可行域約束S(x1)<0、S(x1)≥0、S(x1)>0時可以根據(jù)以上的討論情況進(jìn)行分析。同時,需要特別強(qiáng)調(diào)的是,本文涉及到的狀態(tài)量x1的可行域可以是單個連續(xù)的區(qū)間,也可以是若干個沒有交集的連續(xù)區(qū)間的并集。狀態(tài)量x1滿足的可行域約束的實(shí)質(zhì),是求取(0)所在的可行域約束范圍內(nèi)的某個區(qū)間的對應(yīng)目標(biāo)函數(shù)的最大值或最小值,而狀態(tài)量x1初始值x1(0)可以是全局的,但最終將在自適應(yīng)控制器作用下收斂到狀態(tài)量x1滿足S(x1)≤0的可行域的某個區(qū)間中可使目標(biāo)函數(shù)取得區(qū)間內(nèi)最值所對應(yīng)的狀態(tài)量。本文引入了經(jīng)典對數(shù)罰函數(shù),故目標(biāo)函數(shù)可能達(dá)到真實(shí)的最值的極小鄰域內(nèi),這取決于控制參數(shù)和罰因子δ等因素的影響。

4 仿真驗(yàn)證

現(xiàn)選取幅值和頻率都為1的正弦信號作為激勵信號進(jìn)行仿真。采用圖1中的算法結(jié)構(gòu),選取目標(biāo)函數(shù)為

可行域約束為

目標(biāo)函數(shù)h()z軌跡如圖2所示。由圖2可知,h()

z在z=-5處存在局部極大值91.7,在z=-2處存在極小值-25.3,在z=3處存在全局極大值433。

引入的經(jīng)典對數(shù)型罰函數(shù)為

構(gòu)造新的目標(biāo)函數(shù)為

狀態(tài)量z的可行區(qū)間為(- ∞,-4 ]∪[0 ,+∞ ) ,當(dāng)z?(0 )滿足 z?(0)∈(- ∞,-4)時采用本文設(shè)計(jì)方dd法可使z最終穩(wěn)定在z=-5處,此時目標(biāo)函數(shù)無限趨近于狀態(tài)在區(qū)間(- ∞,-4)內(nèi)對應(yīng)的最大值h*(z*)=91.7的較小有界鄰域內(nèi);當(dāng) z?d(0)滿足z?(0)∈(0 ,+∞ )時采用本文設(shè)計(jì)方法可使z最終穩(wěn)d定在z=3處,此時目標(biāo)函數(shù)取得狀態(tài)在區(qū)間內(nèi)對應(yīng)的最大值h*(z*)=433。

設(shè)計(jì)極值參考軌跡z?為(0 ,+∞)d

選取 δ=0.01,kd=1,k=0.1,r=12,ωh=1,ωl=0.1,對系統(tǒng)進(jìn)行仿真,仿真結(jié)果如圖3~圖6所示: ?

當(dāng) 初 始 值 zd(0)=-5.2時 , 可 知?(0)∈(- ∞,-4 ),仿真結(jié)果如圖3,可得z將沿著極值參考軌跡z?d收斂至tl→im+∞z=z*=-5處的較小鄰域內(nèi),此時目標(biāo)函數(shù)達(dá)到可行域約束范圍(- ∞,-4)內(nèi)唯一極大值91.7,即新型目標(biāo)函數(shù)穩(wěn)定在對應(yīng)區(qū)間內(nèi)的最大值處。

當(dāng)初始值 z?(0)=2 時,可知 z?(0)∈(0 ,+∞ ),dd仿真結(jié)果如圖5,可見z將沿著極值參考軌跡zd收斂至tl→im+∞z=z*=3 處,此時目標(biāo)函數(shù)達(dá)到可行域約束范圍(0 ,+∞ )內(nèi)唯一極大值433,即新型目標(biāo)函數(shù)穩(wěn)定在對應(yīng)區(qū)間內(nèi)的最大值處。

由圖4和圖6可知:目標(biāo)函數(shù)分別收斂至局部最大值h*(z)=91.7和h*(z)=433處;由圖3和圖5可知:狀態(tài)量z能夠有效跟蹤極值參考軌跡z?最d終收斂至z*=-5處和z*=3的較小有界鄰域內(nèi)。通過仿真分析可知:本文設(shè)計(jì)的存在狀態(tài)可行域約束下的極值參考軌跡和自適應(yīng)控制方法可以實(shí)現(xiàn)控制目標(biāo),并能取得較好效果。

5 結(jié)語

針對單輸入極值搜索系統(tǒng)的控制問題,在狀態(tài)量存在可行域約束的情況設(shè)計(jì)極值參考軌跡,選取適當(dāng)?shù)腖yapunov函數(shù)進(jìn)行極值參考軌跡設(shè)計(jì),并結(jié)合幅值自適應(yīng)控制,使系統(tǒng)搜索到目標(biāo)函數(shù)的極值處且閉環(huán)系統(tǒng)穩(wěn)定。仿真實(shí)驗(yàn)結(jié)果證明了該方法的有效性。

[1]Krstic M,Wang H H.Stability of Extremum Seeking Feedback for General Nonlinear DynamicSystems[J].Automatica,2000,36(4):595-601.

[2]Blackman B F.Extremum-seeking Regulators[C]//An Exposition of Adaptive Control.New York,USA:IEEE,1962:36-50.

[3]Adetola V,Guay M.Parameter Convergence in Adaptive Extremum-Seeking Control[J].Automatica,2007,43(1):105-110.

[4]左斌,胡云安,施建洪.極值搜索算法的研究與進(jìn)展[J].海軍航空工程學(xué)院學(xué)報(bào),2006,21(6):611-617.

[5]高立群,李若平,鄒德旋.全局粒子群優(yōu)化算法[J].東北大學(xué)學(xué)報(bào)(自然科學(xué)版),2011,32(11):1538-1541.

[6]雷翻翻,高岳林.約束優(yōu)化問題的改進(jìn)粒子群優(yōu)化算法[J].蘭州理工大學(xué)學(xué)報(bào),2011,37(4):84-89.

[7]劉慶波,余躍慶.基于遺傳算法的欠驅(qū)動機(jī)器人模糊控制器設(shè)計(jì)[J].系統(tǒng)仿真學(xué)報(bào),2008,20(8):2097-2100.

[8]梁毓明,徐立鴻.基于改進(jìn)模擬退火混合算法的移動機(jī)器人全局路徑規(guī)劃[J].控制與決策,2010,25(2):237-240.

[9]張雷,胡云安,張楊,王佩飛.基于Backstepping的嚴(yán)格反饋極值搜索系統(tǒng)控制器設(shè)計(jì)[J].海軍航空工程學(xué)院學(xué)報(bào),2016,31(4):401-406.

[10]左斌,李靜,胡云安.極值搜索算法研究及其應(yīng)用[M].北京:國防工業(yè)出版社,2014:1-2.

[11]Y.Tan,Y.P,I.M.Y.Mareels.Extremum Seeking for Constrained Inputs[J].IEEE Transactions on Automatic Control,2013,58(9):2405-2410.

[12]吳春,齊蓉,陳曉雷.基于障礙Lyapunov函數(shù)的輸出有界全局收斂魯棒控制[J].控制與決策,2014,30(3):448-454.

[13]劉勇華.一類不確定非線性系統(tǒng)的預(yù)定性能自適應(yīng)控制[J].控制理論與應(yīng)用,2014,31(8):1123-1127.

[14] Yongming Li,Shaocheng Tong.Prescribed performance adaptive fuzzy output-feedback dynamic surface control for nonlinear large-scale systems with time delays[J].Information Sciences,2015,292(3):125-142.

[15] ShuaiSui,ShaochengTong,YongmingLi.Observer-based fuzzy adaptive prescribed performance tracking control for nonlinear stochastic systems with input saturation[J].Neurocomputing,2015,158(2):100-108.

猜你喜歡
極值約束軌跡
解析幾何中的軌跡方程的常用求法
通過函數(shù)構(gòu)造解決極值點(diǎn)偏移問題
例談解答極值點(diǎn)偏移問題的方法
極值點(diǎn)偏移問題的解法
軌跡
軌跡
馬和騎師
也談?wù)剺O值點(diǎn)偏移問題
適當(dāng)放手能讓孩子更好地自我約束
CAE軟件操作小百科(11)