張 皓,高瑜翔,唐 軍,黃天賜,馬 騰,吳美霖
(1. 成都信息工程大學通信工程學院,四川 成都 610225; 2. 氣象信息與信號處理四川省高校重點實驗室,四川 成都 610225;3. 宜賓職業(yè)技術(shù)學院電子信息與人工智能學院,四川 宜賓 644000)
由于傳統(tǒng)PID算法存在超調(diào)量大、調(diào)節(jié)時間長,模型自適應(yīng)能力差等缺陷,已無法滿足現(xiàn)代工農(nóng)業(yè)生產(chǎn)中,經(jīng)常存在的非線性、純滯后、多模型等復(fù)雜的控制過程[1-3]。因此,將智能算法與傳統(tǒng)算法相結(jié)合,是解決上述問題的有效方法之一,也是當下智能控制領(lǐng)域研究的熱點之一。文獻[1-2]將模糊算法與PID算法相結(jié)合,提出模糊PID控制,在一定程度上彌補傳統(tǒng)PID算法的不足。但模糊控制不具備自學習能力,如果沒有正確的知識和豐富的經(jīng)驗,其控制效果仍然難以滿足要求。神經(jīng)網(wǎng)絡(luò)具有強大的自學習能力和非線性處理能力,在系統(tǒng)辨識和控制領(lǐng)域得到廣泛研究[3-4]。文獻[3-5]均提出神經(jīng)網(wǎng)絡(luò)PID控制,通過自學習的方式得到P、I、D三個參數(shù),但無法利用模糊系統(tǒng)所具有的知識推理能力。文獻[6-7]提出基于粒子群優(yōu)化的模糊PID控制,利用優(yōu)化算法選擇出最佳量化因子,但粒子群優(yōu)化算法存在搜索精度低的問題。文獻[8-9]將遺傳算法和模糊PID相結(jié)合,利用遺傳算法找到PID的最優(yōu)初始參數(shù),但遺傳算法容易出現(xiàn)編碼不規(guī)范問題。文獻[10]提出基于Mamdani模糊推理的BP神經(jīng)網(wǎng)絡(luò)PID控制,文獻[11]提出基于Mamdani模糊推理的RBF神經(jīng)網(wǎng)絡(luò)PID控制。文獻[10-11]均采用Mamdani模糊推理系統(tǒng),與Sugeno型模糊推理系統(tǒng)相比,其輸出平滑性更低。文獻[12]提出基于Sugeno型模糊推理的神經(jīng)網(wǎng)絡(luò)控制,但對網(wǎng)絡(luò)結(jié)構(gòu)沒有進行嚴格的理論推導(dǎo)和分析,且沒有明確描述Sugeno型模糊系統(tǒng)的階數(shù)。
綜上所述,本文將一階Sugeno型模糊推理系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,并采用雙模訓練的方式,提出一種基于一階Sugeno型模糊神經(jīng)網(wǎng)絡(luò)訓練的雙模推理控制系統(tǒng),簡稱自適應(yīng)模糊神經(jīng)網(wǎng)絡(luò)推理系統(tǒng)即:ANFIS (adaptive neuro fuzzy inference system)。不僅能夠利用Sugeno型模糊系統(tǒng)進行規(guī)則推理,將輸出作為輸入的線性表達式,還能利用BP神經(jīng)網(wǎng)絡(luò)對模糊系統(tǒng)的隸屬度函數(shù)參數(shù)等進行自學習。并以溫度控制為例,將兩個溫度被控對象的訓練集和測試集整合為一體,同時送入ANFIS進行訓練。將訓練好的ANFIS作為兩個溫度模型的控制器,分別與PID、模糊PID、BP神經(jīng)網(wǎng)絡(luò)等控制器,進行仿真實驗對比,以驗證其各項性能指標和模型自適應(yīng)能力。
經(jīng)典的模糊推理算法為Mamdani推理,與PID算法結(jié)合,能夠彌補傳統(tǒng)PID超調(diào)量大、參數(shù)無法自整定等不足。模糊PID控制系統(tǒng)如圖1所示。
圖1 模糊PID控制系統(tǒng)
模糊PID系統(tǒng)雖然能夠有效彌補傳統(tǒng)PID控制的不足,但只能依靠已有的經(jīng)驗和知識來進行模糊推理,不具備自學習能力。因此,如果缺乏正確的知識和豐富的經(jīng)驗,則很難達到滿意的控制效果。
神經(jīng)網(wǎng)絡(luò)能夠根據(jù)有效的輸入、輸出數(shù)據(jù)對,通過強大的自學習能力,獲得較好的控制器模型。本文采用誤差反向傳播神經(jīng)網(wǎng)絡(luò)即BP(back propagation)模型作為控制器,其控制框圖如圖2所示。
圖2 神經(jīng)網(wǎng)絡(luò)控制系統(tǒng)
分別采集501組,兩個被控對象G01(s)和G02(s)的偏差e1(s)、e2(s)以及偏差變化率 ec1(s)、 e c2(s),及其分別所對應(yīng)的控制量u1(s)、u2(s)。并將e1(s)、e2(s)組合為e12(s),e c1(s)、 e c2(s)組合為 ec12(s),u1(s)、u2(s)組 合 為u12(s),形 成u12(s)=f(e12(s),ec12(s))。一個包含1002組雙輸入單輸出的數(shù)據(jù)集,送入一個網(wǎng)絡(luò)模型進行離線學習。
實現(xiàn)雙模訓練的條件是:所采集的兩種模型輸入、輸出數(shù)據(jù)集的變化趨勢類似,且在沒有干擾或噪聲即“異常點”的環(huán)境下進行采集。當訓練樣本中的數(shù)據(jù)存在交疊時,網(wǎng)絡(luò)訓練的效果將變差甚至造成訓練失敗。因此,在采集訓練樣本時,應(yīng)盡量避免采到數(shù)據(jù)交疊的部分。例如,若采到同一輸入存在多個不同輸出的數(shù)據(jù)對時,應(yīng)將其剔除或重新采集。數(shù)據(jù)集變化趨勢,如圖3所示。
圖3 G01 (s)、G02 (s)數(shù)據(jù)集變化趨勢
由圖3所示,根據(jù)測試可知,本文中e1(s)、e2(s)僅在1 7 5.507~175.527 s 時段,即 0 .02 s內(nèi),存在數(shù)據(jù)交疊。偏差變化率 e c1(s)、 e c2(s)在42.601~42.615 s和308.401~308.405 s 兩個時段,即 0 .014 s 和 0 .04 s內(nèi),存在數(shù)據(jù)交疊。而本文在采集訓練樣本時,跳過了數(shù)據(jù)交疊的時段。
采用帶動量的梯度下降法作為學習算法,并選取2-3-1結(jié)構(gòu)的3層網(wǎng)絡(luò)作為訓練模型如圖4所示。
圖4 神經(jīng)網(wǎng)絡(luò)訓練模型圖
圖4中網(wǎng)絡(luò)的輸入量為x1、x2,激活函數(shù)采用雙曲正切函數(shù)則隱藏層的輸入輸出為:
[·]——網(wǎng)絡(luò)層數(shù)。
同理可知,網(wǎng)絡(luò)輸出層的輸入輸出為:
將1002組數(shù)據(jù)集輸入到Matlab神經(jīng)網(wǎng)絡(luò)工具箱中,并隨機分配為訓練集、測試集以及驗證集進行訓練。設(shè)均方誤差E=0.1,學習率 η與慣性系數(shù)α采用系統(tǒng)默認值。經(jīng)過4000次迭代,得到實際均方誤差E=0.135,雙模同時訓練效果如圖5所示。
圖5 雙模BP訓練回歸圖
從圖5可知,訓練集、驗證集、測試集中的回歸值R分別為 0 .998 56、 0 .996 27、 0 .998 3,總體回歸值R=0.998 33,說明目標值u(t)j與實際值之間的相關(guān)度非常高。但神經(jīng)網(wǎng)絡(luò)無法利用模糊語言進行知識表達和推理,在訓練過程中常常容易陷入局部最小值。
將一階Sugeno型模糊推理系統(tǒng)與BP神經(jīng)網(wǎng)絡(luò)結(jié)合起來,便可同時具備模糊推理和自學習能力。ANFIS控制框圖如圖6所示。
圖6 ANFIS控制系統(tǒng)
與1.2節(jié)的訓練方法相同,將分別采集的501組,兩個溫度模型的數(shù)據(jù)對,組合成1002組數(shù)據(jù)集,送入一個ANFIS進行離線訓練。再分別采集并組合成另一包含1002組的數(shù)據(jù)對作為測試集,對訓練后的網(wǎng)絡(luò)模型進行測試,以驗證模型的匹配度。選取5層網(wǎng)絡(luò)作為訓練模型,其結(jié)構(gòu)如圖7所示。
圖7 ANFIS訓練模型圖
利用Matlab中的模糊神經(jīng)網(wǎng)絡(luò)工具箱,先加載1002組訓練集,采取網(wǎng)格分割法生成初始模糊推理系統(tǒng),并對上述ANFIS結(jié)構(gòu)和類型進行配置,設(shè)置均方誤差E=0.1,學習率η 采用系統(tǒng)默認值。經(jīng)過3695次迭代,得到實際均方誤差E=0.099 999。再加載1002組測試集進行驗證,如圖8所示。
圖8 雙模ANFIS測試集結(jié)果
由圖8可知,紅色雙模測試集基本與藍色雙模訓練集重合,且經(jīng)過訓練后雙模系統(tǒng)的輸入輸出與測試集的平均誤差為0.099904。說明雙模訓練效果較好,將其作為控制器驗證控制性能。
針對溫度控制中,一階系統(tǒng)的兩個被控對象進行訓練,其被控模型常用帶有純滯后的一階慣性環(huán)節(jié)來表示,其傳遞函數(shù)為:
式中:s——復(fù)變量;
K0——靜態(tài)增益;
T0——時間常數(shù);
τ0——滯后時間。
設(shè)定目標溫度為35 ℃,控制誤差為 ± 0.01 ℃。在25 ℃以下時采用全功率加熱,在25~35 ℃的范圍內(nèi),采用控制算法進行加熱。選取仿真時間為3000 s,使用采集BP與ANFIS數(shù)據(jù)集時整定的參數(shù)KP=5,KI=0.017,KD=5,作為PID的參數(shù)和模糊PID的初始參數(shù)。同時比較ANFIS、BP、模糊PID以及PID四種控制器,共同控制兩種被控模型時的性能指標。
根據(jù)式(35),設(shè)被控對象的具體參數(shù)模型為:
4種控制器的系統(tǒng)動態(tài)響應(yīng)曲線如圖9所示。
圖9 4種控制器共同控制G01 (s)的動態(tài)響應(yīng)曲線
當被控模型為G01(s)時,根據(jù)圖9利用Matlab測量和計算4種控制器的性能指標如表1所示。
表1 4種算法共同控制G01 (s)的性能對比
從表1中可知,當被控模型是G01(s)時,ANFIS控制器的系統(tǒng)超調(diào)量 σ最小,動態(tài)過程的穩(wěn)定性最好。調(diào)節(jié)時間ts最快,則反映系統(tǒng)的暫態(tài)過程最短,說明系統(tǒng)總體的快速性最好。延遲時間td與上升時間tr,只反映系統(tǒng)在響應(yīng)初始階段的反應(yīng)快慢[15],雖然沒有明顯提升,但對系統(tǒng)整體的穩(wěn)定性和快速性沒有影響。
當被控對象的具體參數(shù)模型變?yōu)椋?/p>
在4種控制器的參數(shù)不變時,系統(tǒng)動態(tài)響應(yīng)曲線如圖10所示。
圖10 4種控制器共同控制G02 (s)的動態(tài)響應(yīng)曲線
從表2可知,當被控模型是G02(s)時,ANFIS控制器的系統(tǒng)超調(diào)量 σ最小,調(diào)節(jié)時間ts最快,整體性能指標最好,在規(guī)定仿真時間內(nèi)滿足控制要求。而其余3種控制器在規(guī)定仿真時間內(nèi),不能滿足控制要求。
表2 4種控制器共同控制G02 (s)的性能對比
基于雙模訓練的ANFIS控制器,將BP神經(jīng)網(wǎng)絡(luò)與一階Sugeno型模糊推理系統(tǒng)結(jié)合起來,不僅能發(fā)揮一階Sugeno型模糊推理系統(tǒng)所具有的知識推理能力和線性表達特性,使輸出更為平滑。還能利用BP神經(jīng)網(wǎng)絡(luò)強大的自學習功能和非線性處理能力,使模糊系統(tǒng)的推理過程具有理論依據(jù),更符合客觀性。在控制兩種溫度被控模型時,采取兩種被控對象的訓練樣本組合,并進行同時訓練的方式。不僅能實現(xiàn)模型自適應(yīng),相較于其他傳統(tǒng)控制器以及智能控制器,其控制系統(tǒng)的整體性能指標最優(yōu)。