姚莉娟
(蘇州高等職業(yè)技術(shù)學(xué)校機(jī)電工程系,江蘇 蘇州 215011)
隨著現(xiàn)代工業(yè)的不斷發(fā)展,生產(chǎn)過程復(fù)雜程度逐步加深,系統(tǒng)建模方法越來越多樣化。集中式建模控制方法[1-3]考慮了系統(tǒng)的整體性,但會出現(xiàn)模型結(jié)構(gòu)相對復(fù)雜、模型精度難以保證和計(jì)算繁瑣等諸多問題。分散式建模方法降低了模型的復(fù)雜度[4-5],但由于其沒有考慮到各子系統(tǒng)間的相互作用,系統(tǒng)的全局性無法得到滿足,分布式建模方法能較好地克服這些問題。本文提出了一種基于核典型相關(guān)分析(nuclear canonical correlation analysis,KCCA)和動態(tài)偏最小二乘(dynamic partial least squares,DPLS)的分布式建模方法。
胡蓓蓓等[6]提出了一種基于典型相關(guān)分析(canonical correlation analysis,CCA)[7]的系統(tǒng)分解方法。在分解過程中,該方法考慮了變量之間的關(guān)聯(lián)性。但該方法只針對線性系統(tǒng)。由于目前實(shí)際工業(yè)過程以非線性為主,所以本文采用KCCA對系統(tǒng)進(jìn)行分解。分解前,將非線性過程線性化,分解后的子系統(tǒng)有多種建模方式。趙曌[8]采用偏最小二乘(partial least squares,PLS)進(jìn)行建模,能夠降低大系統(tǒng)的維數(shù),消除共線性。然而PLS只是純代數(shù)結(jié)構(gòu),無法應(yīng)對實(shí)際工業(yè)過程中的動態(tài)性能。為了滿足動態(tài)系統(tǒng)的模型精度要求,更真實(shí)地描述系統(tǒng)的動態(tài)性能,本文采用DPLS方法[9]。該方法對分解后的關(guān)聯(lián)子系統(tǒng)進(jìn)行動態(tài)建模,降低了系統(tǒng)的建模難度,同時提高了建模精度。
KCCA是一種非線性數(shù)據(jù)分析算法[10-11]。數(shù)據(jù)集通過核函數(shù)進(jìn)行隱式非線性映射,將輸入空間的非線性關(guān)系轉(zhuǎn)化為特征空間的線性關(guān)系,并通過核函數(shù)在核函數(shù)空間進(jìn)行關(guān)聯(lián)分析。KCCA具有很強(qiáng)的線性擬合能力,其原理如圖1所示。
圖1 KCCA原理圖 Fig.1 Principle of KCCA
圖1中:φ(X)和φ(Y)分別為隨機(jī)變量組X和Y通過核函數(shù),從觀測空間R映射到高維特征空間F的隱式映射。
(1)
則核函數(shù)為:
K(X,Y)=[φ(X),ψ(Y)]
(2)
建立線性CCA模型:
u=cTφ(X)
v=dTψ(Y)
(3)
式中:cT和dT為兩組投影向量,使得u和v的相關(guān)系數(shù)達(dá)到最大。
(4)
(5)
分別利用Lagrangian函數(shù)對c和d進(jìn)行求導(dǎo),可得:
(6)
式中:α和β分別為與高維空間中的權(quán)重c和d相對應(yīng)的權(quán)重。
將式(6)代入式(3),可得:
(7)
分別計(jì)算u和v的方差和協(xié)方差:
(8)
最后可以得到相關(guān)系數(shù)ρ:
(9)
式中:Kx=XXT;Ky=YYT。
使相關(guān)系數(shù)ρ達(dá)到最大值,求解如下優(yōu)化問題:
(10)
根據(jù)Lagrangian函數(shù),可得:
(11)
分別對α、β進(jìn)行求導(dǎo),可得:
(12)
由上式可得λ=λα=λβ,引入核函數(shù)后,得:
(13)
即:
(14)
令:
式(14)可化簡為:
B-1Aw=λw
(15)
只需求解B-1A的最大特征值λmax,即可得到α、β以及相關(guān)系數(shù)ρ。
通過將ARX動態(tài)模型應(yīng)用到PLS內(nèi)模型的動態(tài)描述中,系統(tǒng)的輸入和輸出變量之間采用動態(tài)回歸的方式,形成一種動態(tài)建模算法。PLS內(nèi)部模型采用的動態(tài)ARX模型形式為:
y=H(t)
(16)
DPLS建模流程如圖2所示。
圖2 DPLS建模流程圖 Fig.2 DPLS modeling process
圖2中:Wx和Wy為PLS建模之前的對角縮放矩陣;R為映射矩陣,將原始變量X轉(zhuǎn)換成得分向量t;Q為u的負(fù)載矩陣。
DPLS模型為:
(17)
系統(tǒng)的優(yōu)化目標(biāo)函數(shù)為:
(18)
將N轉(zhuǎn)化為隱空間的優(yōu)化目標(biāo)函數(shù):
(19)
式中:u(k)為k時刻隱變量空間中的實(shí)際輸出;uDPLS(k)為ARX-PLS內(nèi)模型的輸出。
uDPLS=φ(k)θ(k)
(20)
φ(k)=[u(k-1),u(k-2),…,u(k-n),
t(k-1),t(k-2),…,t(k-m)]
θ(k)=[-a1(k),-a2(k),…,-an(k),
-b1(k),-b2(k),…,-bm(k)]T
(21)
式中:t(k)為當(dāng)前時刻對應(yīng)的輸入;φ(k)為輸入和輸出的當(dāng)前及前一段時刻的信息;m和n為輸入向量、輸出向量維數(shù);θ(k)為k時刻所建ARX模型的系統(tǒng)回歸參數(shù)。
將θ(k)代入式(18)中,可得優(yōu)化目標(biāo)函數(shù)為:
(22)
利用最小二乘(least squares,LS)辨識方法,可得:
θ(k)=[φT(k)φ(k)]-1φT(k)u(k)
(23)
將變量投影到PLS隱空間,逆矩陣求解時的病態(tài)問題得到了消除。
然后通過將內(nèi)模型的輸出投影到原始空間,確定原始空間內(nèi)系統(tǒng)的模型辨識誤差是否超過了允許的閾值ε,即:
(24)
uDPLS(k)QT]≤ε
(25)
當(dāng)輸出誤差超過了允許范圍(即E>ε),則辨識過程被重新啟動,直到輸出誤差E≤ε。
模型更新流程如圖3所示。
圖3 模型更新流程圖 Fig.3 Process of model updating
KCCA和DPLS的分布式建模算法分為兩個階段:基于KCCA的非線性大系統(tǒng)分解和基于DPLS的各子系統(tǒng)動態(tài)建模。算法流程如下。
①分析工業(yè)過程質(zhì)量指標(biāo),選擇與質(zhì)量指標(biāo)密切相關(guān)的關(guān)鍵變量作為輸入、輸出變量,采集相應(yīng)的數(shù)據(jù)得到輸入變量集X和輸出變量集Y。
②對輸入輸出數(shù)據(jù){X,Y}進(jìn)行歸一化處理,利用KCCA方法得到各輸入變量、輸出變量間的權(quán)值系數(shù)ρ。
③設(shè)定門檻值ζi和ζj,選擇ρ大于等于門檻值ζi的輸入變量為子系統(tǒng)的獨(dú)立輸入變量,小于ζi且大于等于ζj的作為子系統(tǒng)的相互作用輸入變量,對大系統(tǒng)進(jìn)行劃分,得到若干子系統(tǒng)。
④根據(jù)所分解后的子系統(tǒng)相應(yīng)的輸入輸出變量,對每個子系統(tǒng)收集輸入輸出數(shù)據(jù)集{Xi,Yi},采用ARX-PLS方法建模。
⑤確定原始空間內(nèi)系統(tǒng)的模型辨識誤差E是否超過了允許的閾值ε。若在允許范圍內(nèi),則建模結(jié)束,否則返回步驟④。
根據(jù)上述步驟,得到基于KCCA和DPLS的分布式建模算法的基本結(jié)構(gòu)如圖4所示。
圖4 分布式建模算法結(jié)構(gòu)圖 Fig.4 Structure of distributed modeling algorithm
田納西-伊士曼(Tennessee-Eastman,TE)化工過程是一個基于實(shí)際化工過程的仿真模擬[11],它滿足工業(yè)過程的非線性特點(diǎn)。TE過程由反應(yīng)器、冷凝器、氣液分離器、汽提塔、循環(huán)壓縮機(jī)5個操作單元組成。4種氣態(tài)物進(jìn)料分別為A、C、D和E(C中含有少量惰性氣體B),經(jīng)反應(yīng)后生成G、H兩種主產(chǎn)物和副產(chǎn)品F。反應(yīng)方程式如下:
(26)
整個TE過程分為反應(yīng)器溫度、氣液分離器溫度、G/H產(chǎn)率比3個子系統(tǒng),相應(yīng)的輸出變量分別為反應(yīng)器溫度、氣液分離器溫度、G/H產(chǎn)率比。采用KCCA方法對上述過程進(jìn)行系統(tǒng)分解。對所有變量數(shù)據(jù),采用徑向基函數(shù)(radial basis function,RBF)進(jìn)行非線性映射:
(27)
所有的變量通過RBF函數(shù)映射到KCCA空間,利用CCA建立線性模型,然后計(jì)算每個輸出變量與所有輸入變量的最大相關(guān)系數(shù)以及對應(yīng)某輸入變量在特征提取時的權(quán)值系數(shù)。確定門檻值為0.5 和0.8,以此確定各子系統(tǒng)的變量。
采集的工業(yè)數(shù)據(jù)經(jīng)處理后得到300個樣本點(diǎn),取其中前150個樣本點(diǎn)作為建模訓(xùn)練數(shù)據(jù),后150個作為模型測試數(shù)據(jù)。對每個子系統(tǒng)分別采用DPLS算法和傳統(tǒng)PLS算法建立子模型進(jìn)行比較。比較結(jié)果如圖5~圖7所示。AV為系統(tǒng)實(shí)際輸出值;PV為預(yù)測輸出值。
圖5 反應(yīng)器溫度建模對比圖 Fig.5 Comparison of reactor temperature modelings
采用均方根誤差(root mean squared error,RMSE)和最大絕對誤差(maximum absolute error,MAXE),描述兩種建模方法的精度。
圖6 分離器溫度建模對比圖 Fig.6 Comparison of separator temperature modelings
圖7 G/H 產(chǎn)率比建模對比圖 Fig.7 Comparison of G/H ratio modelings
(28)
(29)
式中:yi為測試樣本的實(shí)際值;f(xi)為測試樣本的模型預(yù)測值;n為測試樣本數(shù)目。
RMSE、MAXE對比結(jié)果如表1所示。
表1 RMSE、MAXE對比結(jié)果Tab.1 Comparison of RMSE、MAXE
傳統(tǒng)的PLS建模雖然簡化了模型結(jié)構(gòu),降低了計(jì)算難度,但這只是單純的數(shù)據(jù)結(jié)構(gòu)模型,無法適應(yīng)實(shí)際工業(yè)過程的動態(tài)性能,所以仿真效果較差。從RMSE和MAXE兩個性能指標(biāo)的對比中可以看出,采用DPLS的分布式建模算法所建的模型精度更高。因此,分布式DPLS建模算法比傳統(tǒng)PLS建模方法更有優(yōu)勢。
本文針對實(shí)際化工過程復(fù)雜多變、非線性強(qiáng)等特點(diǎn),提出了一種KCCA和DPLS方法相結(jié)合的分布式建模算法。采用KCCA方法進(jìn)行變量間的相關(guān)分析,將復(fù)雜的大系統(tǒng)分解為多個子系統(tǒng)。然后采用DPLS算法在隱空間得到子系統(tǒng)模型。通過對TE過程的仿真研究表明,所提出的算法降低了復(fù)雜大系統(tǒng)的模型維數(shù),簡化了模型結(jié)構(gòu),滿足了非線性系統(tǒng)的模型需求,更好地適應(yīng)模型的動態(tài)性能。同時,模型的精度也有了提高,系統(tǒng)的整體性能得到提升。但是本文對系統(tǒng)模型的穩(wěn)定性還未作研究,這將是下一階段的研究重點(diǎn)。
參考文獻(xiàn):
[1] RICCARDO SCATTOLINI.Architectures for distributed and hierarchical model predictive control-a review[J].Journal of Process Control,2009,19(5):723-731.
[2] RAVINDRA D,GUDI,AMES B.RAWLINGS.Identification for decentralized model predictive control[J].American Institute of Chemical Engineers,2006(52):2198-2210.
[3] BEN C,JURICE K,DALE E.Identificationof the tennessee eastman challenge process with subspace methods[J].Control Engineering Practice,2001,9(12):1337-1351.
[4] BRETT T.STEWAR T,ASWIN N,et al.Cooperative distributed model predictive control[J].Systems & Control Letters,2010,59(8):460-469.
[5] SAWADOGO S,FAYE R M,MALATERRE P,et al.Decentralized predictive controller for delivery canals[C]//Proceedings of the 1998 IEEE International on Systems,San Diego,USA,1998:3880-3884.
[6] 胡蓓蓓,李麗娟,熊路.基于相關(guān)分析與最小二乘支持向量機(jī)的TE過程多模型建模[J].計(jì)算機(jī)測量與控制,2015,23(1):60-63.
[7] 梁志平.多變量時間序列相關(guān)分析及建模預(yù)測研究[D].大連:大連理工大學(xué),2010.
[8] 趙曌.基于PLS方法的建模及控制器設(shè)[D].杭州:浙江大學(xué),2012.
[9] DONG Y N,QIN S.Dynamic-inner partial least squares for dynamic data modeling[J].IFAC-Papers On Line ,2015,48(8):117-122.
[10]李太福,易軍,蘇盈盈,等.基于KCCA虛假鄰點(diǎn)判別的非線性變量選擇[J].儀器儀表學(xué)報(bào),2012,33(1):213-220.
[11]RICKER N L.Optimal teady-state operation of the Tennessee Eastman challenge process[J].Computers and Chemical Engineering,2005,19(9):949-959.