臧玉萍 張 洋 孫 博
(長春工業(yè)大學(xué) a.人文信息學(xué)院;b.基礎(chǔ)科學(xué)學(xué)院,長春 130122)
基于神經(jīng)網(wǎng)絡(luò)的非線性時變對象自適應(yīng)控制方法研究
臧玉萍a張 洋a孫 博b
(長春工業(yè)大學(xué) a.人文信息學(xué)院;b.基礎(chǔ)科學(xué)學(xué)院,長春 130122)
針對工業(yè)控制中的非線性、時變和滯后被控對象,將神經(jīng)網(wǎng)絡(luò)辨識器和PID控制技術(shù)有機(jī)結(jié)合,構(gòu)建自適應(yīng)PID控制器,并引入知識先導(dǎo)學(xué)習(xí)算法,提高時間效率。仿真分析表明:該自適應(yīng)PID控制器能夠自動辨識被控對象模型、自整定控制參數(shù),在辨識誤差、響應(yīng)時間及超調(diào)量等指標(biāo)上均有良好表現(xiàn)。
自適應(yīng)PID控制 單神經(jīng)元 神經(jīng)網(wǎng)絡(luò)辨識器 知識先導(dǎo)學(xué)習(xí)算法 系統(tǒng)辨識 參數(shù)自整定
在工業(yè)過程控制中,許多被控對象隨負(fù)荷、環(huán)境的改變或不確定擾動的影響,表現(xiàn)出非線性、時變及滯后等特征,過程參數(shù)甚至模型結(jié)構(gòu)都會發(fā)生變化。傳統(tǒng)PID控制器方法簡單,可以解決工程實踐中大量的一般性問題,但缺點是無法辨識被控對象模型變化,參數(shù)整定依賴于對象的數(shù)學(xué)模型,缺乏在線調(diào)整能力,因此限制了其在具有非線性、時變及滯后等特征的工業(yè)過程控制領(lǐng)域中的應(yīng)用。人工神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射、信息綜合、學(xué)習(xí)記憶和自學(xué)習(xí)自適應(yīng)能力,已經(jīng)在非線性時變系統(tǒng)辨識和控制問題上得到了研究與應(yīng)用[1~5]。在此,筆者將神經(jīng)網(wǎng)絡(luò)和PID有機(jī)結(jié)合,利用三層前向神經(jīng)網(wǎng)絡(luò)自動辨識被控過程參數(shù),采用知識先導(dǎo)學(xué)習(xí)算法提高時間效率,利用單神經(jīng)元自適應(yīng)PID技術(shù)自動整定控制參數(shù),構(gòu)建一個具有自適應(yīng)能力的PID控制系統(tǒng),并以燃油加熱器為例進(jìn)行仿真實驗分析。
1.1 系統(tǒng)描述與神經(jīng)網(wǎng)絡(luò)模型
離散非線性系統(tǒng)可描述為:
y(k)=f[y(k-1),y(k-2),…,y(k-ny),
u(k-1),u(k-2),…,u(k-nu)]
(1)
式中f[·]——非線性函數(shù);
nu、ny——u、y的階次;
u(k)、y(k)——由第k次采樣得到的系統(tǒng)輸入、輸出。
1.2網(wǎng)絡(luò)權(quán)值學(xué)習(xí)算法
(2)
可建立指標(biāo)函數(shù):
(3)
并由此得到權(quán)值系數(shù)的調(diào)整算法:
(4)
α——動量系數(shù),α∈[0,1];
η——學(xué)習(xí)速率,η∈[0,1];
在此,引入動量系數(shù)是為了加快搜索過程,使其快速收斂于全局最小。
1.3知識先導(dǎo)學(xué)習(xí)算法
對于實時在線辨識的應(yīng)用目標(biāo)而言,時間效率的提高具有重要意義。神經(jīng)網(wǎng)絡(luò)辨識器工作過程中,首先需要對網(wǎng)絡(luò)權(quán)值系數(shù)進(jìn)行初始化賦值。通常情況下,可采用一組非零的隨機(jī)數(shù)作為網(wǎng)絡(luò)權(quán)值系數(shù)的初值,顯而易見,由隨機(jī)起點收斂到接近次優(yōu)解(或滿意解)所在位置需要一段時間,考慮到導(dǎo)致部分系統(tǒng)模型變化的主要原因為外部環(huán)境條件的變化,而一般情況下此時變過程為緩變過程,因此筆者提出一種利用前次辨識得到的系統(tǒng)模型參數(shù)作為先驗知識來初始化網(wǎng)絡(luò)權(quán)值系數(shù)的知識先導(dǎo)學(xué)習(xí)算法,即在辨識器上增加一個用于保存前次辨識得到的系統(tǒng)模型參數(shù)的知識庫模塊,如圖1所示。
圖1 具有知識先導(dǎo)學(xué)習(xí)算法的辨識器結(jié)構(gòu)
2.1單神經(jīng)元神經(jīng)網(wǎng)絡(luò)PID控制器
經(jīng)典增量式離散PID控制模型可以表述為:
Δu(k)=KPΔe(k)+KIe(k)+KD[Δe(k)-Δe(k-1)]
(5)
構(gòu)建一個具有參數(shù)自整定能力的PID控制器的核心問題是實現(xiàn)對控制參數(shù)KP、KI和KD的實時在線調(diào)整,此問題本質(zhì)上是一個優(yōu)化搜索問題,因此必須建立一個具有搜索能力、可以自動調(diào)整控制參數(shù)的控制模型。神經(jīng)網(wǎng)絡(luò)模型為解決此問題提供了一種有效途徑。圖2所示為一種由一個神經(jīng)元組成的三輸入神經(jīng)網(wǎng)絡(luò)模型。
圖2 單神經(jīng)元組成的三輸入神經(jīng)網(wǎng)絡(luò)模型
該模型由一個輸入向量、一個累加器和一個傳輸函數(shù)組成,其輸入、輸出關(guān)系為:
a=f(wp+b)
p={x1,x2,x3}
w={w1,w2,w3}
(6)
式中a——網(wǎng)絡(luò)輸出;
b——偏值系數(shù);
f(·)——傳輸函數(shù);
p——輸入向量;
w——權(quán)值系數(shù)向量。
將式(6)中累加器輸出改寫成標(biāo)量形式,有:
n=w1x1+w2x2+w3x3+b
x1(k)=Δe(k)
x2(k)=e(k)
x3(k)=Δe(k)-Δe(k-1)
(7)
式(5)可改寫為:
Δu(k)=KPx1(k)+KIx2(k)+KDx3(k)
(8)
比較式(7)、(8)可見,單神經(jīng)元三輸入神經(jīng)網(wǎng)絡(luò)模型的累加器輸出與增量式離散PID控制模型具有相同的輸入、輸出關(guān)系。由此可得單神經(jīng)元神經(jīng)網(wǎng)絡(luò)PID控制器模型[6,7]:
Δu(k)=w1x1(k)+w2x2(k)+w3x3(k)+b
(9)
式中b——神經(jīng)網(wǎng)絡(luò)控制器偏置系數(shù);
w1、w2、w3——神經(jīng)網(wǎng)絡(luò)控制器權(quán)值系數(shù);
Δu(k)——PID控制器增量輸出。
2.2單神經(jīng)元PID控制器權(quán)值系數(shù)學(xué)習(xí)算法
控制系數(shù)的調(diào)整過程本質(zhì)上是一個優(yōu)化搜索過程,即在一個由無窮組解構(gòu)成的w1、w2、w3三維解空間中搜尋一組可以對當(dāng)前目標(biāo)系統(tǒng)實行有效控制的滿意解的過程。最小均方(Least Mean Square,LMS)算法是最簡捷有效的搜索算法之一[8]。
LMS算法采用二次型性能指標(biāo),即:
(10)
式(10)中常數(shù)1/2的引進(jìn)是為了求導(dǎo)后消除導(dǎo)數(shù)中的常系數(shù)。權(quán)值系數(shù)wi(k)的調(diào)整應(yīng)沿著Jc減小的方向,即對wi(k)的負(fù)梯度方向進(jìn)行搜索調(diào)整。由此可得權(quán)值系數(shù)的調(diào)整量為:
(11)
2.3神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器
神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器(圖3)主要由給定單元、調(diào)節(jié)單元、系統(tǒng)辨識單元及輸出與執(zhí)行單元等組成。核心技術(shù)是NNI和NNC兩個模塊。NNI的主要功能是實時在線辨識被控目標(biāo)系統(tǒng),并以辨識器輸出預(yù)報值對辨識器輸入偏導(dǎo)數(shù)的形式提供辨識結(jié)果,供神經(jīng)網(wǎng)絡(luò)控制器調(diào)整修正控制參數(shù)用。NNC是一個具有自適應(yīng)能力的PID控制器,可以根據(jù)被控目標(biāo)系統(tǒng)的變化情況,實時在線整定控制器的比例、微分、積分控制參數(shù),同時實施對被控目標(biāo)系統(tǒng)的控制。
圖3 神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器結(jié)構(gòu)
3.1神經(jīng)網(wǎng)絡(luò)辨識器的仿真分析
以某燃油加熱器為被控對象,其特性隨負(fù)載、環(huán)境溫度變化而變化,具有典型的非線性、時變和滯后特征。圖4所示是在-10℃未開車內(nèi)暖風(fēng)條件下的某燃油加熱器的開環(huán)輸入、輸出響應(yīng)曲線,具有S形特征,用三階函數(shù)描述為:
(12)
圖4 燃油加熱器開環(huán)輸入、輸出響應(yīng)曲線
表1 辨識器Simulink仿真結(jié)果
(續(xù)表1)
圖5 辨識器輸入、輸出曲線
圖6 辨識誤差曲線
分析NNI仿真數(shù)據(jù)可知,NNI辨識器可以很好地實現(xiàn)對燃油加熱器的系統(tǒng)辨識任務(wù),最大辨識誤差不大于1%,優(yōu)于加熱器設(shè)計精度要求。
兩種初始化條件下的辨識誤差曲線如圖7所示。由圖7可知,基于知識先導(dǎo)學(xué)習(xí)算法的網(wǎng)絡(luò)權(quán)值系數(shù)初始化模型對辨識器性能有明顯改善作用;知識先導(dǎo)模型的最大辨識誤差降低至隨機(jī)模型的30%左右;辨識響應(yīng)速度明顯提高。
a. 隨機(jī)算法初始化網(wǎng)絡(luò)權(quán)值系數(shù)
b. 知識先導(dǎo)學(xué)習(xí)算法初始化網(wǎng)絡(luò)權(quán)值系數(shù)
3.2單神經(jīng)元自適應(yīng)PID的仿真分析
a. 經(jīng)典PID控制器
b. 單神經(jīng)元自適應(yīng)PID控制器
3.3神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器的仿真分析
構(gòu)建神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器Matlab-Simulink,仿真過程中,由隨機(jī)函數(shù)發(fā)生器產(chǎn)生周期為5s、幅值為[0,5]的隨機(jī)階躍信號作為NNC系統(tǒng)的輸入。圖9所示為6組自適應(yīng)PID控制器的輸入、輸出響應(yīng)曲線,表2為該組實驗數(shù)據(jù)的分析結(jié)果。最大超調(diào)量σ為階躍響應(yīng)曲線中穩(wěn)態(tài)值的最大超出量與穩(wěn)態(tài)值之比;峰值時間tp為階躍響應(yīng)曲線超過其穩(wěn)態(tài)值第一次達(dá)到峰值的時間;調(diào)節(jié)時間th為階躍響應(yīng)曲線進(jìn)入穩(wěn)態(tài)值±5%誤差帶而不再超出的最小時間。結(jié)果表明,控制器超調(diào)量平均不大于10%,峰值時間、調(diào)整時間不大于2s,技術(shù)指標(biāo)表現(xiàn)良好,均滿足系統(tǒng)設(shè)計要求。
圖9 神經(jīng)網(wǎng)絡(luò)自適應(yīng)PID控制器輸入、輸出響應(yīng)曲線
序號最大超調(diào)量σ%峰值時間tps調(diào)節(jié)時間ths112.401.631.82210.731.421.5434.221.211.4245.341.331.5255.471.151.3465.661.251.45
筆者將神經(jīng)網(wǎng)絡(luò)辨識器NNI和單神經(jīng)元自適應(yīng)PID控制器有機(jī)結(jié)合,并引入知識先導(dǎo)學(xué)習(xí)算法,實現(xiàn)了對非線性、時變、時滯對象的參數(shù)在線辨識和PID控制參數(shù)自整定。仿真分析結(jié)果表明,該控制器辨識精度高,響應(yīng)速度快,超調(diào)量小,是實現(xiàn)非線性、時變、時滯對象自適應(yīng)控制的一種有效方法。
[1] 于開平,牟曉明.基于前向神經(jīng)網(wǎng)絡(luò)的非線性時變系統(tǒng)辨識改進(jìn)EKF算法[J].振動與沖擊,2010,29(8):5~8.
[2] 宋哲,陳文卿,徐志偉.基于神經(jīng)網(wǎng)絡(luò)的懸臂梁在線辨識與振動主動控制[J].振動與沖擊,2013,32(21):204~208.
[3] 韓冰,韓敏.基于動態(tài)BP算法的非線性滯后系統(tǒng)辨識[J].大連理工大學(xué)學(xué)報,2010,50(5):777~781.
[4] 田一鳴,黃友銳,高志安,等.基于GA與CSA-RBF神經(jīng)網(wǎng)絡(luò)辨識的自適應(yīng)PID控制器[J].系統(tǒng)仿真學(xué)報,2008,20(17):4618~4621.
[5] Mazalan N A,Malek A A,Wahid M A,et al.Review of Control Strategies Employing Neural Network for Main Steam Temperature Control in Thermal Power Plant[J].Jurnal Teknologi,2014,66(2):73~76.
[6] Zheng Z Q,Wang X J,Zhang Y H,et al.Research on Neural Network PID Quadratic Optimal Controller in Active Magnetic Levitation[J].The Open Mechanical Engineering Journal,2014,8:42~47.
[7] He Y,Fei S,Li J L,et al.Multi-motor Synchronous Control Method Based on Single Neuron Adaptive PID Controller[J].Journal of Computational Information Systems,2012,21(8):8917~8927.
[8] 修海燕,閆德勤.基于神經(jīng)網(wǎng)絡(luò)控制的LMS算法及其仿真[J].微型機(jī)與應(yīng)用,2011,30(5):103~106.
ResearchonSelf-adaptiveControlMethodforNonlinearTime-varyingObjectBasedonNeuralNetworks
ZANG Yu-pinga, ZHANG Yanga, SUN Bob
(a.CollegeofHumanities&Information; b.SchoolofBasicSciences,ChangchunUniversityofTechnology,Changchun130122,China)
Aiming at the nonlinearity, time-varying and delay of the controlled object in the industrial control, having neural networks and PID control combined to build an adaptive PID controller was proposed, including the introduction of knowledge leading learning algorithm to improve time efficiency. The simulation result indicates that this controller can identify the controlled object’s model automatically and self-tune the controller parameters together with better performance in the error identification, quick response and overshoot.
self-adaptive PID control, single neural element, neural networks identifier, knowledge leading learning algorithm, system identification,self-tuning parameter
TH862+.6
A
1000-3932(2016)01-0006-06
2015-12-18(修改稿)基金項目:吉林省教育廳“十二五”科學(xué)技術(shù)研究項目(吉教科合字[2013]第525號)