李 勇,王玉川,陳曉雷,王游司
(重慶郵電大學(xué)工業(yè)物聯(lián)網(wǎng)與網(wǎng)絡(luò)化控制教育部重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
迭代學(xué)習(xí)控制(Iterative learning control,ILC)是一種適用于在有限時(shí)間內(nèi)重復(fù)完成給定任務(wù)的智能控制策略[1]。自Arimoto 于1984 年提出ILC以來(lái)[2],受到廣大學(xué)者的關(guān)注。經(jīng)過(guò)30 余年的發(fā)展,ILC 被廣泛應(yīng)用于機(jī)械臂[3]、智能交通系統(tǒng)[4]、鑄造[5]等重復(fù)過(guò)程[6]的控制應(yīng)用中。ILC 作為一種簡(jiǎn)單且功能強(qiáng)大的控制策略[7],經(jīng)過(guò)不斷發(fā)展,已經(jīng)不再局限于微分方程描述的集總參數(shù)系統(tǒng)[8],而是擴(kuò)展到由偏微分方程所描述的分布參數(shù)系統(tǒng)[9],并在分布參數(shù)系統(tǒng)得到廣泛使用。如文獻(xiàn)[10]建立了以雙曲型、拋物型或橢圓型分布參數(shù)系統(tǒng)的迭代學(xué)習(xí)控制的設(shè)計(jì)與分析框架,能夠處理參數(shù)或者非參數(shù)的不確定性。文獻(xiàn)[11]針對(duì)一類系數(shù)矩陣不確定但有界的拋物型分布參數(shù)系統(tǒng),提出閉環(huán)P型ILC 算法。與集總參數(shù)系統(tǒng)不同,分布參數(shù)系統(tǒng)的狀態(tài)變量除了時(shí)間之外,還有空間變量,這使得其研究更具有挑戰(zhàn)性。
現(xiàn)有的大部分ILC 文獻(xiàn)研究的批次長(zhǎng)度固定不變,使得ILC 在實(shí)際工程應(yīng)用受到一定的條件限制,阻礙了ILC 的發(fā)展與應(yīng)用。而在實(shí)際應(yīng)用中,批次長(zhǎng)度可能是隨機(jī)變化的,這就意味著學(xué)習(xí)的過(guò)程可能提前結(jié)束或者推遲。例如人形機(jī)器人的步態(tài)問(wèn)題[12]和生物醫(yī)學(xué)中上肢運(yùn)動(dòng)功能電刺激等實(shí)際應(yīng)用[13]。 最近幾年,一些學(xué)者針對(duì)批次長(zhǎng)度隨機(jī)變化的ILC 問(wèn)題做了大量研究[14?16]。其中文獻(xiàn)[17]采用帶有Arimoto?like 增益的P型ILC 算法,使得離散時(shí)間線性系統(tǒng)在批次長(zhǎng)度隨機(jī)變化的情況下,誤差仍能夠沿迭代軸漸進(jìn)收斂。文獻(xiàn)[18]則針對(duì)批次長(zhǎng)度隨機(jī)變化的離散線性系統(tǒng)中的ILC問(wèn)題,提出了一種基于迭代平均算子的新型ILC 算法。Zhang 等將批次長(zhǎng)度隨機(jī)變化的ILC 首次運(yùn)用于分布參數(shù)系統(tǒng)[19]。然而,現(xiàn)有文獻(xiàn)中尚未有非線性分布參數(shù)系統(tǒng)的批次長(zhǎng)度隨機(jī)變化的ILC研究。
本文針對(duì)一類離散的非線性拋物型分布參數(shù)系統(tǒng),根據(jù)該系統(tǒng)的性質(zhì)和邊值條件設(shè)計(jì)了P 型迭代學(xué)習(xí)控制器,給出了輸出誤差的收斂充分條件,證明所提控制方法在范數(shù)意義下跟蹤誤差的收斂性,并通過(guò)仿真驗(yàn)證了算法的有效性。
本文主要研究類離散的非線性拋物型分布參數(shù)系統(tǒng)批次長(zhǎng)度隨機(jī)變化的迭代學(xué)習(xí)控制問(wèn)題??紤]如下的非線性分布參數(shù)系統(tǒng)
式中:n和t分別為空間和時(shí)間的離散變量,1≤n≤N,0≤t≤T,N和T是給定的整數(shù);k=0、1、2…表示迭代次數(shù);A、C和D為已知系統(tǒng)參數(shù);xk、uk、yk∈R 分別表示系統(tǒng)(1)的系統(tǒng)狀態(tài)、系統(tǒng)輸入和系統(tǒng)輸出。f:R×R×[0,T]→R,g:R×[0,T]→R均為非線性函數(shù),且滿足一致全局Lipschitz 條件
假設(shè)1 對(duì)于系統(tǒng)(1),任意的期望輸出軌跡yd(n,t),存在唯一的系統(tǒng)輸入ud(n,t)∈R 使得
假設(shè)2 滿足相同的初始條件,即xk(n,0)=xd(n,0)。在實(shí)際應(yīng)用中,初始狀態(tài)的每次迭代可能不會(huì)被精確地重置,但偏差在小范圍內(nèi)變化。
本文主要研究迭代學(xué)習(xí)控制中批次長(zhǎng)度隨機(jī)變化的問(wèn)題,因此必須考慮期望批次長(zhǎng)度Td與實(shí)際批次長(zhǎng)度Tk之間的關(guān)系。當(dāng)Tk<Td時(shí),輸出信號(hào)yk(n,t)不包含t∈[Tk+1,Td]上的信息,這意味著系統(tǒng)輸出信號(hào)不完整。當(dāng)Tk≥Td時(shí),系統(tǒng)可以輸出整個(gè)批次長(zhǎng)度信號(hào),但是Td之后的信號(hào)對(duì)于學(xué)習(xí)而言是冗余和無(wú)用的,所以在本文中視Tk≥Td為Tk=Td。
設(shè)計(jì)系統(tǒng)(1)的ILC 方案的難點(diǎn)在于系統(tǒng)的實(shí)際批次長(zhǎng)度可能與期望的批次長(zhǎng)度不同,即批次長(zhǎng)度隨機(jī)變化。在批次長(zhǎng)度隨機(jī)變化的情況下,為了描述系統(tǒng)誤差在每一時(shí)刻發(fā)生的概率,本文考慮用隨機(jī)批次長(zhǎng)度發(fā)生的概率來(lái)定義系統(tǒng)誤差。
定義1 隨機(jī)變量Tk的概率事件分布為
式中:Tm為系統(tǒng)(1)最小迭代長(zhǎng)度,Ti為最大迭代長(zhǎng)度。
此外,當(dāng)t∈{Tk+1,…,Td}時(shí),隨機(jī)變量γk(t)服從伯努利分布,用于表示第k次迭代輸出信息的有無(wú)。若γk(t)=1,表示系統(tǒng)輸出在t時(shí)刻可測(cè)且輸出在{0,1,…,Tk}之間有效。Ρ{γk(t)=1 }=q(t)表示系統(tǒng)誤差信息在t時(shí)刻可測(cè)量的概率。若γk(t)=0,則表示無(wú)法獲取t時(shí)刻系統(tǒng)輸出誤差的有用信息。此種情況發(fā)生概率為Ρ{γk(t)=0 }=1-q(t)。結(jié)合定義1 可得
為了便于后續(xù)的收斂性分析,本文給出了以下的引理。
引理1[20]設(shè){v(i)},{B(i)},{D(i)}為實(shí)數(shù)序列,且i≥0,由
圖1 為系統(tǒng)期望輸出曲面,圖2~4 分別對(duì)應(yīng)在迭代3、5、12 次后跟蹤誤差曲面。為了解變批次長(zhǎng)度的ILC 算法對(duì)非線性拋物型分布參數(shù)系統(tǒng)的控制效果,本文將其與經(jīng)典迭代學(xué)習(xí)控制算法[21]相比較。圖2~4 的(a)圖和圖2~4 的(b)圖分別是變批次長(zhǎng)度的ILC 算法和經(jīng)典ILC 在迭代3、5、12 次后的跟蹤誤差曲面。圖5(a,b)分別是變批次長(zhǎng)度的ILC 算法和經(jīng)典ILC 在迭代第3 次和第12 次后的跟蹤誤差曲線。從圖中可以看出,隨著迭代次數(shù)的增加,兩種算法的輸出跟蹤誤差都逐漸減小,趨近于零。但是本文算法在迭代第5 次后跟蹤誤差幾乎趨近于0,而此時(shí)經(jīng)典算法的跟蹤誤差仍然相對(duì)較大。在迭代12 次后,本文算法的跟蹤誤差可以收斂到4×10-6,遠(yuǎn)遠(yuǎn)優(yōu)于經(jīng)典算法的5×10-3。
圖1 期望輸出yd(n,t)Fig.1 Desired output
圖2 誤差曲面(k=3)Fig.2 Error surface (k=3)
圖3 誤差曲面(k=10)Fig.3 Error surface (k=10)
圖4 誤差曲面(k=12)Fig.4 Error surface (k=12)
圖5 誤差曲線Fig.5 Error curves
圖6 是在迭代到第15 次時(shí)系統(tǒng)輸出,與期望輸出幾乎一致,說(shuō)明本文的變批次長(zhǎng)度的ILC 算法可用于控制非線性拋物型分布參數(shù)系統(tǒng)。圖7 是本文ILC 算法和經(jīng)典ILC 算法的歷次迭代最大誤差曲線,通過(guò)圖7 可知,所提控制算法收斂速度明顯優(yōu)于經(jīng)典ILC 算法,驗(yàn)證了算法對(duì)系統(tǒng)(1)的有效性。因此通過(guò)對(duì)比,可以看出本文采用的算法明顯優(yōu)于經(jīng)典迭代學(xué)習(xí)算法,不僅收斂速度更快,而且跟蹤精度更高。
圖6 迭代15 次系統(tǒng)輸出Fig.6 The fifteenth iterative output
圖7 迭代誤差最大變化曲線Fig.7 Curves of iterative number-max tracking error
本文將批次長(zhǎng)度隨機(jī)變化的ILC 算法應(yīng)用于離散的非線性拋物型分布參數(shù)系統(tǒng)的控制,擴(kuò)寬了ILC 算法在非線性分布參數(shù)系統(tǒng)上的應(yīng)用,對(duì)分布參數(shù)系統(tǒng)迭代學(xué)習(xí)控制具有重要的理論和實(shí)際意義。此外,本文實(shí)現(xiàn)對(duì)期望輸出的漸進(jìn)跟蹤,并通過(guò)嚴(yán)格的分析證明系統(tǒng)的跟蹤誤差在范數(shù)意義下的收斂。與傳統(tǒng)迭代算法相比,變批次迭代算法收斂速度更快。未來(lái)將進(jìn)一步考慮改進(jìn)算法,以提高迭代學(xué)習(xí)控制在非線性分布參數(shù)系統(tǒng)中的可實(shí)施性。