国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

正則系統(tǒng)在Lebesgue-p范數(shù)意義下的快速迭代學習控制

2018-10-16 08:29李艷東王妍瑋
計算機應(yīng)用 2018年9期
關(guān)鍵詞:收斂性范數(shù)正則

曹 偉,李艷東,王妍瑋

(1.齊齊哈爾大學 計算機與控制工程學院,黑龍江 齊齊哈爾 161006; 2.哈爾濱石油學院 機械工程學院,哈爾濱 150027)

0 引言

迭代學習控制算法與神經(jīng)網(wǎng)絡(luò)和自適應(yīng)控制等其他學習類算法不同,迭代學習控制是針對在有限時間區(qū)間上具有重復(fù)運行特性的被控系統(tǒng),利用系統(tǒng)存儲的跟蹤誤差對控制輸入進行逐次修正,從而實現(xiàn)完全跟蹤期望軌跡的目的。由于不需要精確模型信息便可以設(shè)計迭代學習控制器,且結(jié)構(gòu)簡單等優(yōu)點,因此迭代學習控制[1]自提出以來,無論是在理論研究方面還是在實際應(yīng)用中都取得了大量研究成果[2-3]。

到目前為止,關(guān)于迭代學習控制大多數(shù)相關(guān)文獻都是在λ范數(shù)度量意義下研究算法的收斂性,并指出在λ足夠大時算法的收斂性才能夠得到保證[4-5]。由于λ范數(shù)是有上確界的負指數(shù)函數(shù)型范數(shù),因此不能客觀量化誤差的本質(zhì)特征。文獻[6]研究發(fā)現(xiàn),當λ參數(shù)值取得較大時,雖然學習算法在理論上是收斂的,但在系統(tǒng)運行初始階段誤差的上確界值往往會超出實際工程允許的誤差范圍。為避免λ范數(shù)上述缺陷,文獻[7]在上確界范數(shù)度量意義下對比例微分(Proportional-Derivative, PD)型迭代學習控制算法的收斂性進行了研究,發(fā)現(xiàn)學習算法只能在系統(tǒng)運行時間區(qū)間的某個子區(qū)間內(nèi)是收斂的。文獻[8]為使迭代學習控制算法在上確界范數(shù)度量意義下是收斂的,研究了運行時間區(qū)間可調(diào)整和學習律可子區(qū)間化進行修正的算法,但算法結(jié)構(gòu)相當復(fù)雜,在實際工程系統(tǒng)中很難得到應(yīng)用。進一步,由于Lebesgue-p范數(shù)同時考慮了函數(shù)f在整個時間區(qū)間上的上確界值和各個運行時刻函數(shù)值的p次方積分,因此Lebesgue-p范數(shù)在量化和反應(yīng)函數(shù)f的性態(tài)方面顯得更為合理。基于此文獻[9]利用Lebesgue-p范數(shù)討論了迭代學習控制的跟蹤性能,但沒有涉及算法的收斂性。文獻[10]研究了多狀態(tài)時滯線性系統(tǒng)迭代學習控制的穩(wěn)定性,并利用Lebesgue-2 范數(shù)來評估學習算法的跟蹤性能。文獻[11]針對線性時不變系統(tǒng),在Lebesgue-p范數(shù)度量意義下對具有反饋信息的PD型迭代學習控制進行了收斂性分析。文獻[12-13]在Lebesgue-p范數(shù)意義下分析了分數(shù)階迭代學習控制律的收斂性。文獻[14]針對一類線性系統(tǒng)在Lebesgue-p范數(shù)意義下,分析了加速修正初態(tài)誤差的迭代學習控制算法的收斂性。進一步,文獻[15]在Lebesgue-p范數(shù)意義下,討論了變增益迭代學習控制算法的收斂性。分析文獻[10-15]可以發(fā)現(xiàn),雖然這些研究成果避免了采用λ范數(shù)度量跟蹤誤差的缺陷,但這些研究成果都是針對D=0的完全非正則系統(tǒng)進行收斂性分析的,其結(jié)論不適用于D≠0的正則系統(tǒng)。原因就在于,對于完全非正則系統(tǒng),迭代學習控制律中必須有跟蹤誤差的導(dǎo)數(shù),即微分(Derivative, D)型或比例積分微分(Proportional-Integration-Derivative, PID)型迭代學習律,而對于正則系統(tǒng)則只能使用跟蹤誤差來修正控制律,即比例(Proportional, P)型迭代學習律。由于傳統(tǒng)P型迭代學習算法只利用以往跟蹤誤差來修正控制律,因此跟蹤速度較低。為提高傳統(tǒng)P型迭代學習算法的收斂速度,文獻[16]提出了一種迭代學習控制算法,但對其收斂性分析仍然采用了λ范數(shù)。

鑒于以上分析,本文針對一類正則系統(tǒng),為提高傳統(tǒng)P型迭代學習算法的收斂速度,同時克服采用λ范數(shù)度量跟蹤誤差的缺陷,提出了一種充分利用系統(tǒng)以往存儲的跟蹤誤差和當前跟蹤誤差信息以及迭代軸上相鄰兩次誤差的差分信號,對控制輸入進行逐次修正的快速迭代學習控制算法,給出了Lebesgue-p范數(shù)意義下的收斂條件。

1 問題描述

考慮如下一類具有重復(fù)運行特性的正則系統(tǒng):

(1)

其中:k為迭代次數(shù),t∈[0,T]為系統(tǒng)運行的有限時間,xk(t)∈Rn為系統(tǒng)第k次運行時的狀態(tài)向量,uk(t)∈Rr和yk(t)∈Rm分別為系統(tǒng)第k次運行時的控制輸入向量和輸出向量,A、B、C、D為適當維數(shù)的矩陣。

假設(shè)1 每次迭代時系統(tǒng)初始狀態(tài)與期望初始狀態(tài)保持一致,即xk(0)=xd(0),k=0,1,2,…。

假設(shè)2 存在唯一的理想輸入ud(t)使式(2)成立:

(2)

其中:yd(t)為期望軌跡,xd(t)為期望狀態(tài)。

1.1 控制目標

本文的控制目標:針對正則系統(tǒng)(1),為克服傳統(tǒng)P型迭代學習控制算法收斂速度較低的不足,設(shè)計出一種快速迭代迭代學習控制算法,同時利用Lebesgue-p范數(shù)對其收斂性進行分析,克服采用λ范數(shù)度量跟蹤誤差的缺陷。

針對這一控制目標,快速迭代學習控制算法設(shè)計如下:

uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)+Lp2ek+1(t)+

Ld2Δek+1(t)

(3)

其中:ek(t)=yd(t)-yk(t)為第k次運行的跟蹤誤差,ek+1(t)=yd(t)-yk+1(t)為第k+1次運行的跟蹤誤差。Δek(t)=ek-1(t)-ek(t)和Δek+1(t)=ek(t)-ek+1(t)為迭代軸上相鄰兩次誤差的差分信號,其中Δek(t)稱為上一次的差分信號,Δek+1(t)稱為當前次的差分信號。Lp1為第k次跟蹤誤差的學習增益,Lp2為第k+1次跟蹤誤差的反饋增益,Ld1和Ld2分別為差分信號的學習增益和反饋增益。

由算法(3)可知,當Lp2和Ld2取零時,算法(3)即為開環(huán)迭代學習控制算法:

uk+1(t)=uk(t)+Lp1ek(t)+Ld1Δek(t)

(4)

當Ld1、Lp2和Ld2都取零時,算法(3)則變?yōu)閭鹘y(tǒng)P型迭代學習控制算法:

uk+1(t)=uk(t)+Lp1ek(t)

(5)

現(xiàn)在的問題是針對正則系統(tǒng)(1),采用算法(3)控制,當Ld1、Lp2和Ld2滿足什么條件時,系統(tǒng)是收斂的。

1.2 數(shù)學基礎(chǔ)

為便于分析控制算法的收斂性,給出如下定義和引理:

定義1 向量值函數(shù)f:[0,T] →Rn的λ范數(shù)定義[1]為:

向量值函數(shù)f的上確界范數(shù)[10]和Lebesgue-p范數(shù)[21]定義為:

文獻[17]中給出了一個重要結(jié)論就是:上確界范數(shù)是Lebesgue-p范數(shù)的特例,即:

引理1[17]如果向量值函數(shù)g,h:[0,T] →R是Lebesgue可積的,那么推廣的卷積Young不等式為:

‖(g*h)(·)‖r≤‖g(·)‖q‖h(·)‖p

2 收斂性分析

定理1 利用設(shè)計的算法(3)控制滿足假設(shè)條件1~2的系統(tǒng)(1),如果下列條件滿足:

1)ρ-1>0;

證明 由系統(tǒng)(1)可知:

ek+1(t)=yd(t)-yk+1(t)=ek(t)-[Cexp(At)xk+1(0)-

(6)

根據(jù)假設(shè)1,并把式(3)代入式(6)可得:

D(Ld1Δek(t)+Lp2ek+1(t)+Ld2Δek+1(t))=

(7)

整理式(7)可得:

(8)

式(8)兩邊取Lebesgue-p范數(shù),并應(yīng)用Young不等式,則得:

‖I+DK2‖‖ek+1(·)‖p≤‖I-DK1‖‖ek(·)‖p+‖Cexp(A·(·))BLd1‖1‖ek-1(·)‖p+‖Cexp(A·(·))BK1‖1‖ek(·)‖p+

‖Cexp(A·(·))BK2‖1‖ek+1(·)‖p+

‖DLd1‖‖ek-1(·)‖p

(9)

整理式(9)得:

(‖I+DK2‖-‖Cexp(A·(·))BK2‖1)‖ek+1(·)‖p≤(‖DLd1‖+‖Cexp(A·(·))BLd1‖1)‖ek-1(·)‖p+(‖I-

DK1‖+‖Cexp(A·(·))BK1‖1)‖ek(·)‖p

(10)

即:

ρ‖ek+1(·)‖p≤ρ1‖ek-1(·)‖p+ρ2‖ek(·)‖p≤

(ρ1+ρ2)max{‖ek-1(·)‖p,‖ek(·)‖p}

(11)

整理式(11)可得:

‖ek+1(·)‖p≤ρ-1(ρ1+ρ2)max{‖ek-1(·)‖p,

‖ek(·)‖p}

(12)

3 仿真實驗

為驗證本文算法的有效性,考慮如下一類線性正則系統(tǒng)

(13)

其中,t∈[0,2]。利用算法(3)控制系統(tǒng)(13),設(shè)期望軌跡yd(t)=sin(5t),系統(tǒng)初始狀態(tài)為x1(0)=0,x2(0)=0,初始控制取u(t)=0,在滿足收斂條下分別取LP1=0.3,Ld1=0.1,LP2=0.2,Ld2=0.1。為驗證本文提出算法(3)的有效性,分別與開環(huán)算法(4)和傳統(tǒng)P型算法(5)進行仿真比較,仿真結(jié)果如圖1~3所示。其中:圖1為算法(3)控制時不同迭代次數(shù)的輸出跟蹤曲線;圖2為在上確界范數(shù)和Lebesgue-2范數(shù)意義下跟蹤誤差曲線;圖3為在Lebesgue-2范數(shù)意義下算法(3)和算法(4)及算法(5)的跟蹤誤差曲線。

圖1 期望軌跡為正弦時算法(3)的跟蹤效果

圖2 控制算法(3)的跟蹤誤差曲線

圖3 控制算法(3)、(4)和(5)的跟蹤誤差曲線

從圖1可以看出,在第20次迭代后,系統(tǒng)輸出在有限時間內(nèi)已經(jīng)完全跟蹤上了期望軌跡。由圖2可看出算法(3)的Lebesgue-2范數(shù)和上確界范數(shù)都收斂于0。而從圖3可看出,算法(3)的收斂速度最高,算法(4)次之,算法(5)的收斂速度最低。其原因就在于,算法(4)是在算法(5)的基礎(chǔ)上增加了相鄰兩次迭代時誤差的差分信號;算法(3)則是當前誤差和以前誤差構(gòu)成差分信號,而算法(4)只是利用以前誤差構(gòu)成差分信號,算法(3)相比算法(4)充分利用了當前誤差信息。為更好說明本文設(shè)計的算法(3)的有效性,下面給出算法(3)、算法(4)和算法(5)在不同迭代次數(shù)下跟蹤誤差的數(shù)值,如表1所示。

由表1可以看出,算法(3)、算法(4)和算法(5)在第1次迭代時跟蹤誤差都是0.999 6,經(jīng)過20次迭代后,算法(5)的誤差為0.029 9,算法(4)的誤差為0.002 0,算法(3)的誤差為0.001 8。從表1的列向數(shù)據(jù)來看,隨迭代次數(shù)增加這3種算法的跟蹤誤差也都能逐次減小,但從表1的橫向數(shù)據(jù)來看,在相同迭代次數(shù)下,算法(3)的跟蹤誤差最小,其次是算法(4),算法(5)的跟蹤誤差最大。因此,由表1可看出本文設(shè)計的快速迭代學習控制算法(3)的收斂速度明顯高于算法(4)和算法(5)的收斂速度。

表1 算法(3)、(4)和(5)在不同迭代次數(shù)下的跟蹤誤差

圖4 期望軌跡為方波時算法(3)的跟蹤效果

由圖1和圖4可以看出對于緩變和突變的期望軌跡,本文設(shè)計的控制算法(3),隨迭代次數(shù)的增加都能在有限時間區(qū)間內(nèi)實現(xiàn)對不同期望軌跡的完全跟蹤。

4 結(jié)語

本文針對一類具有輸入輸出直接傳輸項的線性正則系統(tǒng),提出了一種快速迭代學習控制算法,并在Lebesgue-p范數(shù)意義下證明了算法的收斂性,給出了使算法收斂的范數(shù)形式的充分條件。該算法不僅取得了比傳統(tǒng)P型算法較高的收斂速度,而且還避免了采用λ范數(shù)度量跟蹤誤差的缺陷,增大了學習增益選取的自由度。本文也存在一定的不足之處,由于受引理1的卷積限制,本文算法只適用于線性正則系統(tǒng)。因此,在以后研究工作中,可進一步分析非線性正則系統(tǒng)在Lebesgue-p范數(shù)意義下的收斂性。

[14] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下對初態(tài)誤差進行加速修正的迭代學習控制[J]. 控制與決策, 2016, 31(3): 429-434.(LAN T Y, LIN H. Accelerated modify approach for initial state error iterative learning control in sense of Lebesgue-pnorm [J]. Control and Decision, 2016, 31(3): 429-434.)

[15] 蘭天一, 林輝. Lebesgue-p范數(shù)意義下區(qū)間可調(diào)節(jié)的變增益加速迭代學習控制[J]. 控制與決策, 2017, 32(11): 2071-2075.(LAN T Y, LIN H. Accelerated iterative learning control algorithm with variable gain and adjustment of interval in sense of Lebesgue-pnorm [J]. Control and Decision, 2017, 32(11): 2071-2075.)

[16] 王洪斌,王艷.機械臂帶角度修正的開閉環(huán)迭代學習軌跡跟蹤控制[J].自動化學報,2010,36(12):1758-1765.(WANG H B, WANG Y. Open-closed loop ILC corrected with angle relationship of output vectors for tracking control of manipulator [J]. Acta Automatica Sinica, 2010, 36(12): 1758-1765.)

[17] PINSKY M A. Introduction to Fourier Analysis and Wavelets [M]. Pacific Grove: Brooks/Cole, 2002: 169-175.

猜你喜歡
收斂性范數(shù)正則
基于同倫l0范數(shù)最小化重建的三維動態(tài)磁共振成像
π-正則半群的全π-正則子半群格
Virtually正則模
向量范數(shù)與矩陣范數(shù)的相容性研究
帶低正則外力項的分數(shù)次阻尼波方程的長時間行為
任意半環(huán)上正則元的廣義逆
基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析
西部地區(qū)金融發(fā)展水平的收斂性分析
我國省域經(jīng)濟空間收斂性研究
情緒波動、信息消費發(fā)散與福利分化效應(yīng)