国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

帶參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)迭代學(xué)習(xí)控制方法

2019-12-23 02:50黃靜鄭華義李宏李國(guó)岫邱成
兵工學(xué)報(bào) 2019年11期
關(guān)鍵詞:收斂性模擬器向量

黃靜, 鄭華義, 李宏, 李國(guó)岫, 邱成

(1.北京交通大學(xué) 機(jī)械與電子控制工程學(xué)院, 北京 100044; 2.北京精密機(jī)電控制設(shè)備研究所, 北京 100076)

0 引言

在航空航天領(lǐng)域中,飛行器空氣舵的主要作用是控制飛行器的飛行姿態(tài)以及調(diào)整與改變飛行軌跡,其性能好壞直接影響飛行器的控制精度和穩(wěn)定性。

空氣舵負(fù)載模擬器是空氣舵的重要地面試驗(yàn)設(shè)備,用于模擬空氣舵在飛行過(guò)程中所承受的載荷,為空氣舵地面試驗(yàn)提供可靠的試驗(yàn)保障和技術(shù)支持。隨著我國(guó)航天和國(guó)防事業(yè)的大力發(fā)展,對(duì)飛行器提出了更高的要求,研究能夠精確復(fù)現(xiàn)飛行過(guò)程中力學(xué)條件的空氣舵負(fù)載模擬器勢(shì)在必行。而空氣舵負(fù)載模擬器在加載試驗(yàn)中,會(huì)經(jīng)常加載一些連續(xù)性、周期性負(fù)載,例如正弦信號(hào)、三角波信號(hào)、方波信號(hào)等。在加載過(guò)程中,除了加載系統(tǒng)的運(yùn)動(dòng)以外,空氣舵本身也會(huì)進(jìn)行獨(dú)立的運(yùn)動(dòng),二者運(yùn)動(dòng)是通過(guò)某些連接件耦合在一起的,因此給加載端控制帶來(lái)了極大的挑戰(zhàn)和難度。

本文研究的負(fù)載模擬器結(jié)構(gòu)示意圖如圖1所示。從圖1中可以看出,加載系統(tǒng)和承載系統(tǒng)(空氣舵作動(dòng)器)通過(guò)搖臂連接在一起,在空氣舵作動(dòng)器獨(dú)立運(yùn)動(dòng)過(guò)程中,需要加載系統(tǒng)加載上所要求的模擬載荷。針對(duì)空氣舵負(fù)載模擬器所加載的負(fù)載具備周期性特點(diǎn),期望找到一種帶有學(xué)習(xí)能力的智能型控制方法,以適應(yīng)空氣舵地面負(fù)載試驗(yàn)的要求。

圖1 系統(tǒng)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of load simulator structure

在控制領(lǐng)域中,日本學(xué)者Uchiyama[1]最早于1978年基于迭代學(xué)習(xí)思想提出迭代學(xué)習(xí)控制(ILC)方法,隨后在1984年Arimoto等[2]正式提出該方法的理論框架并發(fā)展至今,如今迭代控制方法依然是智能控制領(lǐng)域的一個(gè)重要研究領(lǐng)域[3-6]和研究熱點(diǎn)[7-11]。

但是在ILC理論中,雖然理論上能夠證明其控制誤差最終收斂,但是對(duì)中間過(guò)程的誤差卻沒(méi)有限制和要求。而在實(shí)際工程應(yīng)用中,即使誤差最終收斂,若是中間過(guò)程的誤差過(guò)大,也是不能接受的[12]。將傳統(tǒng)ILC方法應(yīng)用于空氣舵負(fù)載模擬器的液壓控制系統(tǒng)中,嘗試跟蹤一個(gè)正弦信號(hào),其系統(tǒng)輸出如圖2所示。

圖2 傳統(tǒng)迭代學(xué)習(xí)實(shí)際系統(tǒng)輸出Fig.2 Traditional iterative learning output in real system

從圖2中可以看出,系統(tǒng)在第2個(gè)周期后,誤差越來(lái)越大,系統(tǒng)逐漸失控。究其原因,主要有兩點(diǎn):一是迭代學(xué)習(xí)控制理論中,一般都要求或假設(shè)每個(gè)周期的初始狀態(tài)是嚴(yán)格一致的,但是這一點(diǎn)在實(shí)際系統(tǒng)中很難做到;二是因?yàn)閷?shí)際控制系統(tǒng)中,輸入信號(hào)和輸出信號(hào)之間存在一定的相位延遲,傳統(tǒng)ILC一般都未考慮相位因素的影響,在實(shí)際應(yīng)用過(guò)程中,相位延遲也會(huì)對(duì)“經(jīng)驗(yàn)學(xué)習(xí)”有重要影響。

針對(duì)以上問(wèn)題,本文嘗試保留ILC的優(yōu)點(diǎn),即智能性和實(shí)現(xiàn)簡(jiǎn)單性,提出部分改進(jìn),希望解決傳統(tǒng)迭代控制方法中中間過(guò)程誤差較大、系統(tǒng)不受控的問(wèn)題,同時(shí)使得新的ILC方法具備更快的收斂速度和更好的控制效果。

1 引導(dǎo)信號(hào)ILC方法的提出

控制系統(tǒng)一般有多種數(shù)學(xué)表示方法,若采用狀態(tài)方程表示方法,則離散的控制系統(tǒng)可以寫(xiě)為(1)式的形式:

(1)

式中:k=1,2,3,…表示迭代次數(shù);xk(t)、uk(t)、yk(t)分別表示系統(tǒng)第k次的狀態(tài)向量、輸入向量和輸出向量;xki(t)表示第k次迭代時(shí)系統(tǒng)的第i個(gè)狀態(tài);A、B、C為系統(tǒng)的系數(shù)矩陣。

傳統(tǒng)ILC方法表達(dá)式如(2)式所示:

(2)

式中:ek(t)為系統(tǒng)第k次迭代的控制誤差向量;yd(t)為系統(tǒng)的期望信號(hào)向量;f(·)函數(shù)代表某種迭代學(xué)習(xí)律。

利用誤差向量ek(t)和輸入向量uk(t),通過(guò)設(shè)計(jì)或構(gòu)建的學(xué)習(xí)律,便可以產(chǎn)生第k+1次的輸入向量uk+1(t)。從(2)式中可以看出,傳統(tǒng)ILC的學(xué)習(xí)對(duì)象是系統(tǒng)的輸入信號(hào)。為了解決系統(tǒng)控制過(guò)程中不受控的問(wèn)題,結(jié)合傳統(tǒng)比例、積分、微分(PID)控制方法,提出一種新的控制信號(hào)即引導(dǎo)信號(hào)。讓系統(tǒng)的跟蹤信號(hào)不再直接跟蹤期望信號(hào),而是跟蹤引導(dǎo)信號(hào),迭代學(xué)習(xí)的對(duì)象也不再是輸入信號(hào),而是引導(dǎo)信號(hào)。由引導(dǎo)信號(hào)和系統(tǒng)反饋輸出信號(hào)形成閉環(huán)PID控制,便能解決之前系統(tǒng)的不受控問(wèn)題。

系統(tǒng)的引導(dǎo)信號(hào)ILC方法可以表示為如下形式:

(3)

式中:rk(t)為系統(tǒng)第k次迭代的引導(dǎo)信號(hào);p為系統(tǒng)PID控制中的比例系數(shù);L為N×N階迭代學(xué)習(xí)增益矩陣,N為一個(gè)周期內(nèi)的采樣次數(shù)。

該方法應(yīng)用于實(shí)際系統(tǒng)中,系統(tǒng)的輸出與傳統(tǒng)ILC的輸出對(duì)比圖如圖3所示。從圖3中可以看出,采用引導(dǎo)信號(hào)ILC方法以后,系統(tǒng)不再出現(xiàn)失控的情況,并且控制效果隨著迭代學(xué)習(xí)過(guò)程的進(jìn)行逐漸得到改善。表明在引導(dǎo)信號(hào)ILC方法的作用下,系統(tǒng)不僅具備了學(xué)習(xí)的智能特性,并且解決了中間過(guò)程不受控的問(wèn)題。

圖3 引導(dǎo)信號(hào)ILC實(shí)際控制效果Fig.3 Actual control effect of guiding signal iterative learning control algorithm

2 引導(dǎo)信號(hào)雙重學(xué)習(xí)控制方法的提出

(3)式中控制方法中的學(xué)習(xí)參數(shù)L為一個(gè)固定參數(shù),為了提高學(xué)習(xí)效率,使控制系統(tǒng)具備更快的收斂速度,考慮針對(duì)學(xué)習(xí)參數(shù)進(jìn)行一定的改進(jìn),充分利用系統(tǒng)的控制誤差,在每個(gè)迭代周期根據(jù)系統(tǒng)的誤差及控制效果,進(jìn)行參數(shù)的自我調(diào)整,使系統(tǒng)具備更好的智能性和學(xué)習(xí)能力。為此針對(duì)上述控制方法,做出如下改進(jìn):即通過(guò)對(duì)比同一時(shí)刻,最近2個(gè)迭代周期的誤差大小以及變化趨勢(shì)對(duì)學(xué)習(xí)參數(shù)進(jìn)行優(yōu)化和改進(jìn)。其基本思路是:通過(guò)迭代學(xué)習(xí),如果當(dāng)前誤差比之前的誤差有減小的趨勢(shì),則表明當(dāng)前系數(shù)是有效的,并且增大下一次的學(xué)習(xí)參數(shù),使得學(xué)習(xí)的速度變快,直至誤差滿足精度要求,則停止參數(shù)學(xué)習(xí)過(guò)程。具體參數(shù)學(xué)習(xí)和改進(jìn)過(guò)程如(4)式:

(4)

式中:pL為學(xué)習(xí)系數(shù);eh為設(shè)置的學(xué)習(xí)誤差門(mén)限值,eh>0;當(dāng)?shù)`差ek(t)小于誤差門(mén)限時(shí),停止學(xué)習(xí)過(guò)程,此時(shí)引導(dǎo)信號(hào)rk(t)沿用前一次迭代的rk-1(t)信號(hào);Lk(t)為第k次迭代的學(xué)習(xí)增益矩陣。

在迭代學(xué)習(xí)過(guò)程中,當(dāng)系統(tǒng)輸出逐漸逼近期望信號(hào)的過(guò)程中,系統(tǒng)誤差ek(t)會(huì)越來(lái)越小,甚至可能是一個(gè)接近于0的值,因此為了防止學(xué)習(xí)參數(shù)Lk(t)突然間劇烈變化、導(dǎo)致系統(tǒng)不穩(wěn)定,在學(xué)習(xí)過(guò)程中設(shè)置了誤差門(mén)限eh,只有當(dāng)系統(tǒng)誤差超出ek(t)>eh時(shí),系統(tǒng)才需要進(jìn)行迭代學(xué)習(xí)。

3 收斂性分析及證明

收斂性分析的核心理念主要是依賴于壓縮映射原理[13]和不動(dòng)點(diǎn)原理[14-15]。因?yàn)榈鷮W(xué)習(xí)具有重復(fù)性的特點(diǎn),所以研究人員總是要求或期望系統(tǒng)每次都從同一初始狀態(tài)開(kāi)始進(jìn)行學(xué)習(xí)。初始狀態(tài)對(duì)于學(xué)習(xí)方法收斂性的證明有著重要作用,因此在大部分的收斂性證明中總是假設(shè)或設(shè)定系統(tǒng)的初始狀態(tài)都保持不變基[16-20],但是這一假設(shè)在實(shí)際過(guò)程中幾乎是不可能實(shí)現(xiàn)的。針對(duì)這一情況,本文提出的帶參數(shù)學(xué)習(xí)引導(dǎo)信號(hào)迭代學(xué)習(xí)方法需要在初始狀態(tài)不一致的情況下進(jìn)行數(shù)學(xué)證明。

針對(duì)(4)式中提出的參數(shù)學(xué)習(xí)迭代控制方法,需要進(jìn)行系統(tǒng)的收斂性分析和證明。根據(jù)(1)式,系統(tǒng)第k次迭代時(shí)的輸出yk(t)可以表示為(5)式:

(5)

式中:xk(0)是第k次迭代時(shí)的系統(tǒng)初始狀態(tài)。

則系統(tǒng)第k次迭代時(shí)輸出和輸入之間的向量表達(dá)式(5)式可以改寫(xiě)為(6)式:

yk=Guk+Dxk(0).

(6)

本文研究的空氣舵負(fù)載模擬器加載系統(tǒng),在周期信號(hào)控制作用下具備一個(gè)基本特性:系統(tǒng)控制引導(dǎo)信號(hào)為連續(xù)的周期性信號(hào)時(shí),當(dāng)系統(tǒng)穩(wěn)定后的輸出也呈現(xiàn)出周期性特性,該特性如圖4所示。

圖4 系統(tǒng)周期特性圖Fig.4 Periodic characteristics diagram

這一周期特性用數(shù)學(xué)表達(dá)式可以表示為

當(dāng)rk(t)=rk-1(t)時(shí),有

yk(t)=yk-1(t),

(7)

相應(yīng)地,可以推導(dǎo)出如下等式:

當(dāng)rk(t)=rk-1(t)時(shí),有

uk(t)=uk-1(t).

(8)

根據(jù)系統(tǒng)時(shí)間上的連續(xù)性xk+1(0)=xk(N)和重復(fù)性xk+1(0)=xk(0),有

xk+1(0)=xk(0)=xk(N).

(9)

根據(jù)(1)式將xk(N)展開(kāi),可以得到如下等式:

xk(0)=ANxk(0)+Quk-1,

(10)

式中:向量Q=[AN-1B,AN-2B,AN-3B,…,AB,B],為1個(gè)參數(shù)矩陣。

(10)式就是連續(xù)性、周期性信號(hào)作用下系統(tǒng)狀態(tài)變量所具備的特性。在此特性基礎(chǔ)上,可以進(jìn)一步分析系統(tǒng)在新提出迭代學(xué)習(xí)律下的收斂性。

系統(tǒng)第k+1次的誤差ek+1可以寫(xiě)為如下表達(dá)式:

ek+1=yd-yk+1=yd-Guk+1-Dxk+1(0)=
rd-pG(rk+1-yk+1)-Dxk+1(0)=
yd-pG(rk+Lkek-yk+1)-Dxk+1(0)=
yd-pG(rk-yk+Lkek-yk+1+yk)-Dxk+1(0)=
yd-pG(rk-yk)-Dxk(0)-pG(Lkek+yk-yk+1)-
Dxk+1(0)+Dxk(0)=
yd-pGuk-Dxk(0)-pG(Lkek+yk-yk+1)-
Dxk+1(0)+Dxk(0)=
ek-pG(Lkek+(yd-yk+1)-(yd-yk))-
Dxk+1(0)+Dxk(0)=
ek-pG(Lkek+ek+1-ek)-D(xk+1(0)-xk(0)),

(11)

式中:ek=[ek(1),ek(2),…,ek(N)]T為系統(tǒng)第k次迭代時(shí)的誤差向量;Lk=[Lk(1),Lk(2),…,Lk(N)]T為系統(tǒng)第k次迭代時(shí)的學(xué)習(xí)增益矩陣;yd為期望信號(hào)。

由(11)式可以推導(dǎo)出

ek+1=ek-pG(Lkek+ek+1-ek)-
D(xk+1(0)-xk(0)).

(12)

根據(jù)(1)式,將xk(t+1)=Axk(t)+Buk(t)展開(kāi),可得

xk+1(0)=xk(N)=ANxk(0)+Quk,

(13)

根據(jù)uk(t)=p(rk(t)-yk(t)),可以推導(dǎo)出uk和uk-1之間的關(guān)系如下:

uk=uk-1+pLkek-1+pek-pek-1.

(14)

(13)式代入(12)式中,可得

xk+1(0)=ANxk(0)+Quk-1+pQek+
pQ(L-I)ek-1.

(15)

再根據(jù)(10)式,(14)式可以進(jìn)一步化簡(jiǎn)為

xk+1(0)=xk(0)+pQek+pQ(L-I)ek-1.

(16)

根據(jù)(15)式可以將(11)式進(jìn)一步寫(xiě)為如下等式:

(I+pG)ek+1=ek+[-pG(Lk-I)-pDQ]ek-
pDQ(Lk-I)ek-1,

(17)

矩陣I+pG可逆,(17)式兩端同時(shí)左乘逆矩陣(I+pG)-1可得如下表達(dá)式:

ek+1=(I+pG)-1[I-pG(Lk-I)-pDQ]ek-
p(I+pG)-1DQ(Lk-I)ek-1.

(18)

(4)式中

由此可得

(19)

|ek-1(t)|>eh,因此由(19)式可以推導(dǎo)出如下不等式:

(20)

在實(shí)際系統(tǒng)中,系統(tǒng)誤差總是存在邊界的,即ek+1

(21)

(21)式代入(18)式中,可得(22)式

(22)

對(duì)不等式(21)式兩邊同時(shí)取范數(shù),并根據(jù)范數(shù)的相容性可得(23)式:

(23)

為了進(jìn)一步證明系統(tǒng)的收斂性,特引入引理1.

根據(jù)引理1,如果(23)式中滿足如下條件(24)式:

(24)

至此,系統(tǒng)在迭代學(xué)習(xí)方法即(4)式作用下,系統(tǒng)的收斂性證明完畢。(24)式即系統(tǒng)在參數(shù)學(xué)習(xí)方法下收斂的充分條件??梢赃x取合適的參數(shù)L1、p、pL使得不等式(24)式成立,從而保證系統(tǒng)的收斂性。

4 對(duì)比實(shí)驗(yàn)及驗(yàn)證

為了對(duì)本文提出方法進(jìn)行驗(yàn)證,設(shè)計(jì)并進(jìn)行了仿真對(duì)比實(shí)驗(yàn)。在仿真對(duì)比實(shí)驗(yàn)中,應(yīng)用了傳統(tǒng)迭代學(xué)習(xí)方法、不帶參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC方法和帶參數(shù)學(xué)習(xí)的引導(dǎo)ILC方法。引導(dǎo)信號(hào)在第1個(gè)迭代周期的取值為期待信號(hào),即r1(t)=yd(t),取pL=-0.6,p=0.003.

將選定的3種方法分別用于仿真系統(tǒng),針對(duì)輸入為0.5 Hz、幅值為1 000 N·m的正弦信號(hào),系統(tǒng)誤差收斂情況對(duì)比如圖5所示。

圖5 收斂速度對(duì)比圖Fig.5 Comparison of convergence speeds

從圖5中可以看出,在3種控制方法作用下系統(tǒng)都能收斂,并使系統(tǒng)的控制誤差落入5%的誤差區(qū)間之內(nèi)。但是從收斂速度來(lái)看,本文提出的方法具有最快的收斂速度,在第6次迭代時(shí)就使系統(tǒng)的控制誤差到達(dá)設(shè)定要求。而傳統(tǒng)ILC方法和無(wú)參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC方法分別需要9次迭代和11次迭代。其對(duì)比結(jié)果如表1所示。

表1 收斂速度對(duì)比對(duì)表

從表1可以看出,帶有參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC具有更快的收斂速度和更好的控制效果。

針對(duì)參數(shù)學(xué)習(xí)過(guò)程中的某一時(shí)刻,以t=500 ms時(shí)刻為例,其前15次迭代過(guò)程中該時(shí)刻點(diǎn)的學(xué)習(xí)參數(shù)Lk(500)的變化曲線如圖6所示。

圖6 學(xué)習(xí)參數(shù)變化曲線圖Fig.6 Changing curve of learning parameter

從圖6中可以看出,在迭代過(guò)程中,該時(shí)刻點(diǎn)的誤差呈現(xiàn)減小的趨勢(shì),表明該點(diǎn)當(dāng)前的參數(shù)調(diào)整是有效的,因此學(xué)習(xí)參數(shù)一直呈現(xiàn)增長(zhǎng)趨勢(shì),期望該點(diǎn)的控制誤差能夠盡快減小到門(mén)限值。當(dāng)該點(diǎn)誤差在第6次迭代達(dá)到設(shè)定的門(mén)限值以后,該點(diǎn)停止迭代學(xué)習(xí),學(xué)習(xí)參數(shù)變?yōu)?并維持不變。

4 結(jié)論

1)針對(duì)傳統(tǒng)迭代學(xué)習(xí)在實(shí)際控制系統(tǒng)中出現(xiàn)的系統(tǒng)發(fā)散問(wèn)題,本文提出了帶參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC方法。該方法充分結(jié)合了PID控制和迭代控制的優(yōu)點(diǎn),使系統(tǒng)在完全受控的情況進(jìn)行迭代學(xué)習(xí),并讓系統(tǒng)具備了一定的智能型。為了增強(qiáng)系統(tǒng)的智能型,提出的改進(jìn)方法使得系統(tǒng)的學(xué)習(xí)參數(shù)本身也具備學(xué)習(xí)能力。

2)在收斂性分析和證明中,針對(duì)實(shí)際情況中每個(gè)迭代周期初始狀態(tài)不一致的情況,本文證明了帶參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC方法的收斂性并給出了收斂的充分條件,說(shuō)明了該方法的實(shí)用性。

3)將改進(jìn)后的的控制方法同傳統(tǒng)ILC方法和不帶參數(shù)學(xué)習(xí)的引導(dǎo)信號(hào)ILC方法進(jìn)行對(duì)比,從實(shí)驗(yàn)對(duì)比結(jié)果可以看出,改進(jìn)后的控制方法具備更快的收斂速度和更好的控制效果,充分說(shuō)明了本文方法的有效性和優(yōu)越性。

猜你喜歡
收斂性模擬器向量
向量的分解
駕駛模擬器轉(zhuǎn)向系統(tǒng)的設(shè)計(jì)與研究
了不起的安檢模擬器
盲盒模擬器
聚焦“向量與三角”創(chuàng)新題
劃船模擬器
西部地區(qū)金融發(fā)展水平的收斂性分析
我國(guó)省域經(jīng)濟(jì)空間收斂性研究
向量垂直在解析幾何中的應(yīng)用
向量五種“變身” 玩轉(zhuǎn)圓錐曲線
上虞市| 驻马店市| 白银市| 昭苏县| 阳新县| 福贡县| 高碑店市| 驻马店市| 米林县| 荃湾区| 舟曲县| 灵武市| 遂川县| 云安县| 曲阳县| 衢州市| 双鸭山市| 宁乡县| 锦屏县| 广安市| 蓬莱市| 东乌珠穆沁旗| 石阡县| 阳东县| 繁昌县| 中西区| 广宁县| 铁力市| 双流县| 北京市| 永修县| 米林县| 虹口区| 贺兰县| 榆树市| 烟台市| 广河县| 阿拉尔市| 新竹市| 拉萨市| 皮山县|