張政煊 ,楊翊卓 ,代 偉?,周 平 ,楊春雨
(1.中國礦業(yè)大學信息與控制工程學院,江蘇徐州 221008;2.北京科技大學自動化學院,北京 100083;3.東北大學流程工業(yè)綜合自動化國家重點實驗室,遼寧沈陽 110819)
非線性系統(tǒng)的控制是控制理論與應用中的重要研究課題,在實際應用中非線性系統(tǒng)普遍存在,如煤炭洗選過程[1]、無人機姿態(tài)控制[2]、工業(yè)機器人操縱系統(tǒng)[3]等.尤其針對復雜工業(yè)過程,如冶金、選礦等,其大多是一個氣、液、固多相共存的連續(xù)化復雜物質轉化過程,不確定干擾眾多,工況動態(tài)變化,難以根據(jù)其機理結構建立精確的數(shù)學模型[4].隨著自動控制領域的專家和學者的不斷研究,在模仿生物適應能力的基礎上建立了自適應控制方法[5].自適應控制方法針對具有不確定性的被控對象,根據(jù)系統(tǒng)的變化自動調節(jié)控制器的參數(shù)[6].對具有復雜動態(tài)特性的非線性系統(tǒng)而言,建立精確且便于控制器設計的模型是其自適應控制的基礎和亟待解決的關鍵問題.
近年來,控制領域的學者深入研究了復雜工況下的非線性系統(tǒng)的系統(tǒng)辨識及控制問題[7–9].隨著神經(jīng)網(wǎng)絡可以任意精度逼近非線性函數(shù)的特性不斷被推廣,神經(jīng)網(wǎng)絡被認為是辨識非線性系統(tǒng)模型參數(shù)和優(yōu)化控制的新途徑.譚永紅[10]提出利用Specialised learning算法在BP(back propagation)神經(jīng)網(wǎng)絡框架下對被控對象進行在線辨識和控制,實現(xiàn)自適應控制.上述方法利用神經(jīng)網(wǎng)絡辨識非線性系統(tǒng)時,其網(wǎng)絡結構難以確定,參數(shù)迭代過程復雜,不利于在線辨識和控制器設計.
Chen和Narendra[11]首先提出了將一類離散時間非線性動態(tài)系統(tǒng)表示成線性模型與高階非線性項(未建模動態(tài))的組合模型.在此基礎上,文獻[12]采用徑向基函數(shù)神經(jīng)網(wǎng)絡逼近輸入–輸出非線性模型,并利用李雅普諾夫分析方法證明了閉環(huán)系統(tǒng)中所有信號都是半全局一致最終有界.文獻[13]研究了一種由改進的投影算法與基于BP神經(jīng)網(wǎng)絡的未建模動態(tài)估計算法構造非線性系統(tǒng)的交替辨識方案.文獻[14]提出在交替辨識的估計模型基礎上開發(fā)非線性自適應控制器,嚴格進行了穩(wěn)定性及收斂性的分析,并放寬了系統(tǒng)零動態(tài)漸近穩(wěn)定的條件,使得交替辨識非線性系統(tǒng)的方案在自適應控制中得到了推廣.文獻[15]在未建模動態(tài)的增長率不超過其數(shù)據(jù)向量所在的緊集的輸入向量的假設下,將非線性系統(tǒng)表示為線性部分和未建模動力學的組合,利用ANFIS(adaptive-networkbased fuzzy inference system)對未建模的動力學進行了估計.在實際應用時,考慮到控制器采用其他控制策略如滑模控制器時,其抖振會擴大控制系統(tǒng)的未建模動態(tài)產(chǎn)生的影響,從而惡化系統(tǒng)的控制性能[16],一般直接使用離散時間的PI控制器設計虛擬未建模動態(tài)補償?shù)淖赃m應控制系統(tǒng).文獻[17]利用前一時刻虛擬未建模動態(tài)可測的特點,采用虛擬未建模動態(tài)補償?shù)囊徊阶顑?yōu)PI控制策略設計供水溫度控制器,通過理論分析和半實物仿真實驗結果表明方法的有效性.文獻[18]提出了一種改進的非線性系統(tǒng)交替辨識的智能建模方法,采用帶遺忘因子的遞推最小二乘法辨識低階模型的未知參數(shù),然后利用隨機配置網(wǎng)絡進行估計高階非線性部分.上述方法交替辨識非線性系統(tǒng)的組合模型,并設計帶未建模動態(tài)補償?shù)姆蔷€性自適應控制方法.然而,交替辨識的模型參數(shù)[19]將產(chǎn)生計算損耗,且難以確保整體系統(tǒng)的殘差收斂,進而影響自適應控制系統(tǒng)的性能.
本文針對基于交替辨識算法的自適應控制方法研究存在的非線性系統(tǒng)辨識精度低的問題,提出一種基于整體辨識策略的非線性自適應控制方法.首先,利用低階線性模型與未建模動態(tài)項組成的模型類量化非線性系統(tǒng),建立隨機向量函數(shù)(random vector function link,RVFL)網(wǎng)絡模型與量化后的非線性系統(tǒng)數(shù)學模型之間的等價關系,并融入權值偏差懲罰項,設計網(wǎng)絡模型參數(shù)在線更新算法;其次,根據(jù)控制輸出的一步預報的最小方差指標計算線性控制器參數(shù),并利用未建模動態(tài)項的補償?shù)窒]環(huán)系統(tǒng)中復雜動態(tài)的影響;最后,在數(shù)值仿真研究和工業(yè)應用仿真研究中與基于交替辨識算法的自適應控制方法對比,驗證所提的非線性自適應控制方法跟蹤控制和穩(wěn)定控制能力的優(yōu)越性.
本文的被控對象為一類單輸入單輸出(single input single output,SISO)離散的非線性系統(tǒng),即
其中:u(k)和y(k)分別是系統(tǒng)的輸入和輸出;f(·)∈R是未知的非線性函數(shù);nA和nB為系統(tǒng)的階次;原點是平衡點.由非線性系統(tǒng)的特性分析可知,y(k+1)與過去時刻的輸入、輸出數(shù)據(jù)存在某種映射關系,令
其中p=nA+nB+1.則式(1)中的非線性系統(tǒng)可由包含非線性系統(tǒng)當前及歷史時刻的輸入、輸出p維向量X(k)表示,即
針對上述這一類非線性被控對象,控制目標是要求被控輸出跟蹤參考輸入,參考輸入往往在工作點附近.因此可將系統(tǒng)作簡化處理,在工作點附近將被控對象線性化可以得到線性模型.簡化后得到的工作點附近的線性模型使得系統(tǒng)部分動態(tài)特性的丟失,往往達不到理想的要求,有時甚至還產(chǎn)生振蕩和發(fā)散.因此,可在工作點附近,將非線性系統(tǒng)表示為低階線性模型和未建模動態(tài)的組合形式,且低階線性模型用時延算子z-1的多項式A(z-1),B(z-1)表示,即
其中:ai(i=1,···,nA)和bj(j=1,···,nB)為非線性系統(tǒng)在工作點處的一階Taylor系數(shù);v([X(k)])是虛擬未建模動態(tài)項,v([X(k)])有界,即|v([X(k)])|≤M.
進一步變換可得
隨機向量函數(shù)鏈接(RVFL)網(wǎng)絡由Pao和Takefuji[21]于1992年首次提出,其主要特點是: 1)輸入層權值和隱含層偏置在特定范圍內(nèi)隨機選取,與基于梯度的學習算法不同,不需要事先預設定過多參數(shù)和耗費大量的時間使算法收斂;2)輸入數(shù)據(jù)做非線性變換后的增強層與輸入層共同連接至輸出層,使得增強節(jié)點的計算分擔更小,所需節(jié)點數(shù)更少.RVFL網(wǎng)絡憑借離線建模速度快、泛化能力強的優(yōu)點使其在非線性系統(tǒng)回歸建模和控制問題中得到廣泛應用[22].
給定N組離線數(shù)據(jù)集Z={x(k),y(k+1)},x(k)∈Rm,y(k+1)∈Rn,k=1,2,···,N.xi,yi分別為n維輸入向量和m維輸出向量,則具有L個隱含層節(jié)點,且激活函數(shù)為Sigmoid函數(shù)的RVFL網(wǎng)絡訓練所得的預報模型可以表示為
其中:ωj和bj為增強節(jié)點的輸入權值和偏置;w1,i為直接鏈接的輸出權值;w2,j為增強鏈接的輸出權值;hj為激活函數(shù),表示增強特征的非線性映射.
RVFL網(wǎng)絡是在固定范圍內(nèi)隨機分配隱藏層的權值與偏差后保持不變,在線學習中唯一不確定的參數(shù)就是最小二乘法求解的輸出權值.為避免完全隨機分配的輸入權值與隱藏層的偏差值導致模型的性能和穩(wěn)定性出現(xiàn)波動,本文將改進了輸出權值學習的目標函數(shù),提高了RVFL網(wǎng)絡辨識非線性系統(tǒng)參數(shù)的準確性.
針對交替辨識算法存在辨識誤差限增長的問題,本文利用一種帶有輸出權值偏差約束的RVFL網(wǎng)絡,提出一種具有數(shù)值穩(wěn)定性的非線性系統(tǒng)辨識方案.設計思想是: 利用低階線性模型的輸出辨識RVFL網(wǎng)絡的直鏈輸出權值,即線性模型參數(shù);根據(jù)網(wǎng)絡的輸出殘差e′構建RVFL網(wǎng)絡的增強鏈接.避免了交替辨識導致的誤差限上升的風險,與交替辨識的方案對比如圖1所示.
圖1 交替辨識算法與基于隨機向量函數(shù)鏈接(RVFL)網(wǎng)絡辨識算法的對比Fig.1 Comparison between alternating identification algorithm and network identification algorithm based on random vector function linking(RVFL)network
對階次如式(1)所示的非線性系統(tǒng),將以[y(k)···y(k-nA+1)u(k)···u(k-nB)]作為RVFL網(wǎng)絡輸入,故將式(8)進一步改寫為
基于RVFL網(wǎng)絡的整體辨識策略通過網(wǎng)絡輸出殘差逼近非線性系統(tǒng),確保辨識結果收斂于非線性系統(tǒng)輸出的實際值.
非線性自適應控制的控制性能依賴于模型的精度.當系統(tǒng)輸入發(fā)生變化時,實際非線性模型的參數(shù)也會發(fā)生變化.考慮到工業(yè)過程普遍存在的慢時變特性[23],故本文在RVFL網(wǎng)絡模型參數(shù)在線學習中引入輸出權值的偏差約束,以下給出RVFL網(wǎng)絡輸出權值的在線學習過程.
RVFL網(wǎng)絡輸出權值學習的目標函數(shù)[21]為
可視作非線性系統(tǒng)實際值與估計值之間的誤差辨識準則.
在線學習中引入輸出偏差懲罰項和正則化項后的目標函數(shù)[23]為
考慮到在實際非線性系統(tǒng)中,低階線性模型與未建模動態(tài)項具有不同的特性,對RVFL直鏈與增強鏈接的輸出權值偏差懲罰項的系數(shù)矩陣分開設計,定義如下:
式(12)對Wk求導得
注1由于RVFL網(wǎng)絡具有萬能逼近性[24],因此,只要選擇合適的增強節(jié)點數(shù),則對任意的正數(shù)ε>0,必存在一個理想的網(wǎng)絡模型使得估計誤差可以任意小,使估計誤差e′(k)滿足|e′(k)|=|y(k)-(k)|<ε.
本文采用一種帶虛擬未建模動態(tài)補償?shù)目刂葡到y(tǒng)框架[24],根據(jù)線性模型參數(shù)設計線性控制器,同時,通過虛擬未建模動態(tài)項設計補償器,消除虛擬未建模動態(tài)對閉環(huán)系統(tǒng)的影響.控制系統(tǒng)的結構如圖2所示.
圖2 基于RVFL模型的未建模動態(tài)補償自適應控制結構圖Fig.2 Structure diagram of adaptive control method for virtual unmodeled dynamic compensation
線性控制器采用PI控制器[25],進行移項及合并同類項得
其中:kP,kI為PI 控制器的比例、積分系數(shù);K(z-1)和H(z-1)是z-1的多項式;e(k)為跟蹤誤差;e(k)=ysp(k)-y(k),ysp(k)為理想輸出.
將式(15)改寫為
其中:G(z-1)為z-1的時延算子G(z-1)=g0+g1z-1,g0=kP+kI,g1=kP.
本文的自適應控制方法的基礎是非線性系統(tǒng)的辨識.通過式(14)獲得RVFL 網(wǎng)絡的權值向量Wk,結合一步超前最優(yōu)控制策略求解最優(yōu)控制律[14].
將PI控制器的控制輸入式(16)代入RVFL網(wǎng)絡辨識所得的非線性系統(tǒng)式(11),并由(k)=W2THv可得到閉環(huán)方程為
為消除非線性動態(tài)項的影響,可令H(z-1)-B(z-1)K(z-1)=0,即可得到K(z-1)為
為求解G(z-1)引入一步超前最優(yōu)控制策略,將下一時刻的輸出y(k+1)與理想輸出y?(k+1)的誤差滿足方差最小情況時的輸入看作是最優(yōu)的控制輸入,具體步驟如下:
步驟1設計未建模動態(tài)項補償.引入Diophantine方程
對式(16)等式兩邊同乘以F(z-1),則有
其中P(z-1),H(z-1)均為關于z-1的加權多項式.
步驟2設計控制性能指標.定義廣義輸出誤差為
定義性能指標為被控對象輸出的理想誤差eg×(k+1)的方差,即
步驟3求解最優(yōu)控制律u(k).顯然使得誤差eg×(k+1)的方差最小時,使式(23)極小的最優(yōu)控制.F(z-1)已知的條件下,G(z-1)由Diophantine 方程(19)唯一確定.將式(20)代入式(23),并令J=0,得到非線性系統(tǒng)的最優(yōu)控制律為
由式(16)和式(24)可得,F(z-1)可通過如下對應關系求解:
根據(jù)Jury判據(jù),需離線選擇P(z-1)和Q(z-1)使得下式成立:
選定P(z-1)=1,通過式(20)(26)計算可得G(z-1),可得PI控制器參數(shù)如下:
為了消除未建模動態(tài)v(k)對閉環(huán)系統(tǒng)的影響,通過選定的Q(z-1),由式(18)(21)(25)以及式(27)可知選擇(z-1)應滿足
因此,PI控制器式(15)中的K(z-1)可表示為
以下將給出本文所述的自適應控制方法的穩(wěn)定性分析.
引理1根據(jù)RVFL網(wǎng)絡模型參數(shù)描述的非線性系統(tǒng)(11),系統(tǒng)的輸入輸出動態(tài)特性方程如下,式中省去了多項式z-1,即
采用類似于文獻[25]的方法可證明引理1.
定理1假定系統(tǒng)(4)滿足如下假設條件:
1) 系統(tǒng)的未建模動態(tài)項v(X(k))有界;
2)b0>bmin>0,B(1)0;
3) 選擇合適的Q(z-1)使其滿足
則有
a) 閉環(huán)系統(tǒng)有界輸入和有界輸出(bounded input bounded output,BIBO)穩(wěn)定,即
b) 當k→∞時,系統(tǒng)的跟蹤誤差有界.即
其中:ysp(k)為系統(tǒng)的期望輸出;ξ=2εδM,ε為任意小的正數(shù),δ為大于0的常數(shù).
由文獻[23]得證定理1條件3)的a)項成立.
定理1條件3)的b)項證明如下.
證當k→∞時,有
本文的非線性自適應控制方法的步驟如下:
步驟1初始化RVFL網(wǎng)絡.設置RVFL網(wǎng)絡的最大節(jié)點數(shù)和網(wǎng)絡初始殘差值,計算直鏈的輸出權值;
步驟2構建RVFL網(wǎng)絡離線模型.不斷地加入增強節(jié)點逼近非線性系統(tǒng)的輸出,若輸出誤差小于設定的殘差值,記錄下離線訓練所得的網(wǎng)絡輸出權重,作為在線學習過程的初始權重,并執(zhí)行下一步;
步驟3初始化線性控制器與未建模動態(tài)補償器.根據(jù)網(wǎng)絡的初始權重、離線選擇的Q(z-1)并計算F(z-1),由式(21)(24)和式(29)–(30)計算線性控制器kP和kI的初始值,根據(jù)式(32)計算未建模動態(tài)補償器增益K(z-1)初始值;
步驟4在線采集被控制系統(tǒng)的輸入輸出數(shù)據(jù).構建k時刻的網(wǎng)絡輸入,根據(jù)式(14)在線學習k+1時刻的網(wǎng)絡輸出權值Wk;
步驟5根據(jù)k+1時刻的直鏈與增強鏈接的輸出權值,按照步驟3的過程調整k+1時刻的線性控制器參數(shù)和建模動態(tài)補償器增益;
步驟6若模型精度不能達到性能要求,則調整殘差容忍度的設定值,并返回步驟2,否則返回步驟4.
根據(jù)上述方法步驟進行仿真研究,并選取合適的輸出權值懲罰系數(shù)C和輸出權值偏差懲罰項系數(shù)k1和k2以及時延算子多項式P(z-1)和Q(z-1).
為驗證本文提出的控制方法的有效性,考慮如下的離散時間非線性系統(tǒng):
顯然,系統(tǒng)的階次nA=2,nB=1.系統(tǒng)的參數(shù)多項式為
非線性系統(tǒng)數(shù)值模型的未建模動態(tài)項為0.02 sin(0.5y(t)u(t)+2y(t-1)u(t-1))全局有界,滿足定理1的條件1).
控制目標是: 使得系統(tǒng)輸出y(t)分別跟蹤參考軌跡w(t)=2(0≤t≤100,200 基于整體辨識策略的非線性自適應控制方法中包含若干重要的參數(shù),令離線數(shù)據(jù)的維數(shù)N=5000組,設置網(wǎng)絡的最大節(jié)點數(shù)Lmax=1000,網(wǎng)絡的殘差為4.5×e-3.離線選擇時延算子多項式P(z-1)=1,Q(z-1)=0.2. 在仿真中,采用設定值跟蹤均方根誤差(root mean square error,RMSE)作為控制的性能指標,記作AC(adaptive control)–RSME,采用非線性系統(tǒng)模型估計值與實際值均方根誤差驗證辨識算法的性能指標記作MI(model identification)–RSME,表達式如下: 可以看出,所提基于RVFL網(wǎng)絡整體辨識策略的非線性自適應控制方法,能夠對離散時間的非線性系統(tǒng)進行有效的控制.將基于投影算法和隨機配置網(wǎng)絡(stochastic configuration networks,SCNs)交替辨識的模型[18]應用于非線性自適應控制方法中與本文方法進行對比,仿真結果如圖3–5和表1所示.相比較,所提方法的設定值跟蹤性能更好,并且具有更好的動態(tài)跟蹤和穩(wěn)態(tài)性能.這是由于所提方法的辨識模型通過整體的非線性系統(tǒng)輸出殘差e′與設定的殘差容忍度不斷迭代計算,使得離線模型小于設定精度逼近數(shù)值模型(39).基于投影算法和SCNs的非線性自適應控制方法需要更長的時間達到滿意的跟蹤控制效果,且在設定值發(fā)生變化后的一段時間內(nèi)仍會有較大幅度的跟蹤誤差,是由交替辨識的算法不能夠保證對非線性系統(tǒng)模型的逼近性能導致的. 圖3 基于不同模型自適應控制方法的輸出Fig.3 Output of adaptive control methods based on different models 圖4 基于不同模型自適應控制方法的輸出誤差Fig.4 Output error of adaptive control methods based on different models 圖5 模型辨識誤差對比Fig.5 Comparison of model identification errors 重介質選煤控制系統(tǒng)在實際生產(chǎn)過程中,主要是通過調整重介質懸浮液密度控制分選效果,而灰分含量是評價煉焦精煤產(chǎn)品質量的重要的運行指標.利用式(4)的非線性模型描述重介質選煤灰分含量控制回路的動態(tài)過程,辨識此回路過程的線性模型參數(shù)和估計未建模動態(tài)項,并設計線性控制器和補償器. 如圖6所示,重介質選煤過程[26]主要涉及混料、重介質旋流器分選以及重介質回收,主要過程為:首先,將原煤與重介質懸浮液充分混合;其次,在重介質旋流器中分離混合礦漿;最后,回收稀釋的重介質液.主要涉及的參數(shù)包括重介質懸浮液介質流量Qm,合格介質桶中加入水的密度ρw,回收礦漿中重介質的密度,向合格介質桶中加入高濃介質的密度ρmm,磁選機出口處重介質的密度ρrm,合格介質桶中重介質懸浮液的體積Vcor,加水閥門系數(shù)Cw,參考實際重介質選煤過程采用文獻[24]的數(shù)據(jù)設計上述過程參數(shù)并搭建模型采集輸入輸出數(shù)據(jù),具體如表2所示. 表2 重介質選煤過程工藝參數(shù)Table 2 Dense medium coal separation process parameters 圖6 重介質選煤過程工藝流程圖Fig.6 Dense medium coal separation process flow chart 令網(wǎng)絡輸入數(shù)據(jù)向量的維數(shù)N=6000,設置網(wǎng)絡的最大節(jié)點數(shù)Lmax=1000,網(wǎng)絡的殘差容忍度為8.3×e-2.得到離線辨識的低階線性模型參數(shù)如下: 將初始的控制信號重介質懸浮液的密度u(0)=1530 kg/m3;運行指標精煤灰分含量的初始值設為y(0)=14%.根據(jù)煉焦煤產(chǎn)品按照灰分指標的不同分級,驗證本文方法在不同設定值工況下的跟蹤控制性能,初始時刻精煤規(guī)格為3級,其他用煉焦精煤(14%);20 min時,調整為10級冶煉用煉焦精煤(10%);40 min時調整為6級冶煉用煉焦精煤(8%).給煤量為8 kg/s,同時設定[-1,1]的隨機動態(tài)變化量,在此工況下對灰分含量進行跟蹤控制. 設定值跟蹤控制仿真的研究中基于不同模型的控制方法效果如圖7–9所示.基于各模型的控制方法的性能指標如表3所示.本文方法中通過試湊法選擇輸出權值懲罰系數(shù)C=85,偏差懲罰項系數(shù)k1=104,k2=10-2. 表3 基于不同模型的灰分含量跟蹤控制性能對比Table 3 Comparison of ash content control perfor-mance 圖7 重介質選煤灰分含量跟蹤控制輸出Fig.7 Tracking control output of ash content in dense medium coal separation 圖8 重介質選煤灰分含量跟蹤控制輸出誤差Fig.8 Output error of ash content tracking control in dense medium coal separation 圖9 重介質選煤灰分含量控制回路的模型估計誤差Fig.9 Comparison of model identification errors 對比3種控制方法,其中基于交替辨識模型的自適應控制方法引入了未建模動態(tài)項的補償,性能指標AC–RSME和MI–RSME優(yōu)于基于線性模型的自適應控制方法.但交替辨識所得的模型無法保證收斂于實際的模型輸出.而本文基于RVFL網(wǎng)絡的非線性自適應控制方法,利用RVFL網(wǎng)絡根據(jù)整體辨識策略迭代計算網(wǎng)絡的增強節(jié)點參數(shù),能夠保證灰分含量控制系統(tǒng)的輸出誤差上界為ξ=2εδM.最后,得出對灰分含量設定值跟蹤控制滿意的輸出. 本文提出了一種基于整體辨識策略的非線性自適應控制方法.主要貢獻是: 1)針對低階線性模型與未建模動態(tài)項的非線性系統(tǒng)組合模型,提出利用RVFL網(wǎng)絡的直鏈與增強結構特性進行整體辨識;2)針對具有慢時變特征的非線性系統(tǒng),提出一種輸出權值偏差約束的在線學習方法;3)根據(jù)RVFL網(wǎng)絡在線辨識的模型參數(shù),設計未建模動態(tài)項補償?shù)姆蔷€性自適應控制方法.所提方法在數(shù)值仿真和工業(yè)應用仿真研究中驗證了有效性和優(yōu)越性. 針對實際應用中面臨的潛在問題,需要進一步開展下列研究:1)實際應用中難以測量大滯后以及非高斯變量的統(tǒng)計特性,應考慮基于輸出變量概率密度函數(shù)設計控制律;2)該方法依賴于模型的辨識精度,應結合實際生產(chǎn)過程建立具有魯棒性的RVFL網(wǎng)絡模型,克服離群點干擾.此外,未來在理論上考慮從放松未建模動態(tài)有界條件的方面開展工作.6 工業(yè)應用仿真研究
7 結論與展望