徐圓,張明卿
?
基于主元獨(dú)立性分析與混合核RVM的復(fù)雜過程區(qū)間預(yù)測方法研究及應(yīng)用
徐圓,張明卿
(北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,北京100029)
近年來,隨著化工過程日趨復(fù)雜,對過程監(jiān)控及關(guān)鍵變量預(yù)測提出了更高的要求。傳統(tǒng)意義上的點(diǎn)預(yù)測已不能滿足化工過程上的實(shí)際需求,且點(diǎn)預(yù)測無法描述過程上的不確定性問題,因此不能很好地把握預(yù)測變量的趨勢。由此,提出了一種基于主元獨(dú)立性分析(principal component independent analysis, PCIA)與混合核相關(guān)向量機(jī)(RVM)的區(qū)間預(yù)測方法。首先,結(jié)合核主元成分分析(KPCA)和獨(dú)立元分析(ICA)對復(fù)雜過程原始變量進(jìn)行主元成分提取和獨(dú)立性分析,形成獨(dú)立主元;其次,將高斯核函數(shù)與多項(xiàng)式核函數(shù)相結(jié)合形成混合核,與RVM結(jié)合對得到的獨(dú)立主元進(jìn)行回歸建模預(yù)測,并運(yùn)用T分布對預(yù)測值進(jìn)行區(qū)間估計;然后,構(gòu)造區(qū)間評價綜合函數(shù)對區(qū)間估計結(jié)果進(jìn)行優(yōu)劣分析,在分析預(yù)測區(qū)間覆蓋率(PICP)及預(yù)測區(qū)間寬度(NMPIW)的基礎(chǔ)上,引入累積偏差(AD)提高區(qū)間評判的合理性。最后,將所提方法應(yīng)用到TE仿真過程進(jìn)行區(qū)間預(yù)測分析,仿真結(jié)果表明,提出的區(qū)間預(yù)測方法對實(shí)際生產(chǎn)過程具有較高的預(yù)測精度和區(qū)間估計質(zhì)量,可以有效地預(yù)測關(guān)鍵變量的趨勢。
核主元分析;獨(dú)立主元分析;相關(guān)向量機(jī);預(yù)測模型;區(qū)間評價
當(dāng)今,實(shí)際化工過程日趨復(fù)雜,對其過程監(jiān)控以及關(guān)鍵變量預(yù)測有了更高的要求。傳統(tǒng)意義上的點(diǎn)預(yù)測模型已不能很好地反映復(fù)雜過程關(guān)鍵變量的趨勢,而區(qū)間預(yù)測不僅可以預(yù)測對象的不確定性,而且能增強(qiáng)對象的可靠性以及安全性。在預(yù)測過程中,區(qū)間預(yù)測指的是預(yù)測變量以某一概率落入某區(qū)間范圍內(nèi),其不僅可以包含點(diǎn)預(yù)測,而且能預(yù)測出變量的整體趨勢,預(yù)測效果較好。
目前,常見的區(qū)間預(yù)測的方法有兩類:一類是利用點(diǎn)預(yù)測得到預(yù)測值后,根據(jù)數(shù)據(jù)特性分布或者比例系數(shù)法來構(gòu)建區(qū)間。常見的預(yù)測方法有時間序列法[1-2]、貝葉斯[3]、MVE[4]、Bootstrap[5-7]、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(SVM)等。時間序列法依據(jù)時間的順序進(jìn)行排列,在固定時間間隔下進(jìn)行采樣,通過擬合曲線和參數(shù)估計對所建立的模型進(jìn)行描述[1-2];Bootstrap方法基于重抽樣方法,通過從原始數(shù)據(jù)中抽取多個bootstrap樣本,從而對整體的分布進(jìn)行統(tǒng)計[5-7],但兩種方法操作比較耗費(fèi)時間。神經(jīng)網(wǎng)絡(luò)方法,以極限學(xué)習(xí)機(jī)為例[8-10],研究者利用構(gòu)造比例系數(shù)來獲得區(qū)間,但區(qū)間估計結(jié)果依賴于優(yōu)化過程,若優(yōu)化局部收斂,會影響區(qū)間估計結(jié)果。支持向量機(jī)(SVM)[11-13]利用核函數(shù)將輸入空間映射到高維空間,在高維空間里求解一個最優(yōu)分類面,進(jìn)而得到輸入與輸出之間的關(guān)系,但是核參數(shù)以及懲罰因子較難選擇。有些學(xué)者還提出了基于最小二乘的SVM[14-15],以及相關(guān)向量機(jī)(RVM)方法。另一類方法是直接得到預(yù)測區(qū)間,如神經(jīng)網(wǎng)絡(luò)上下限(LUBE)方法,通過構(gòu)造多輸入雙輸出的神經(jīng)網(wǎng)絡(luò)模型,直接得到預(yù)測區(qū)間的上下限,并將LUBE與智能優(yōu)化算法結(jié)合,通過優(yōu)化區(qū)間評價綜合函數(shù)實(shí)現(xiàn)區(qū)間估計,但區(qū)間估計結(jié)果過分依賴于優(yōu)化過程[16-23]。
針對以上問題,本文提出了一種基于主元獨(dú)立性分析(principal component independent analysis, PCIA)與混合核相關(guān)向量機(jī)(RVM)的區(qū)間預(yù)測方法。核主元成分分析(KPCA)[24-25]方法可以針對復(fù)雜非線性問題進(jìn)行降維以及解決數(shù)據(jù)變量相關(guān)性的問題,但是得到的主元之間容易存在耦合度較大的問題。KPCA本身雖然考慮了數(shù)據(jù)之間相關(guān)性的問題,但并未對其獨(dú)立性進(jìn)行分析。而ICA[26-27]雖然也能實(shí)現(xiàn)降維,并進(jìn)行獨(dú)立性分析,但并未考慮到變量之間本身相關(guān)性的問題。由此,本文將KPCA與ICA方法進(jìn)行結(jié)合,對原始變量進(jìn)行處理,不僅可以從數(shù)據(jù)中提取到主元成分,而且能進(jìn)一步提取到互為獨(dú)立的信息元,這樣更能夠從本質(zhì)上描述過程的特征。
RVM[28-30]是SVM的一種改進(jìn)方法,極大地減少了核函數(shù)的計算量,同時也克服了核函數(shù)必須滿足Mercer的條件。大部分實(shí)際過程常選用高斯核函數(shù)作為RVM的核函數(shù)。高斯核函數(shù)屬于典型的局部核函數(shù),其具有較強(qiáng)的學(xué)習(xí)能力;而多項(xiàng)式核函數(shù)是全局核函數(shù)的典型代表,其具有很強(qiáng)的推廣能力,因此,本文選取高斯核函數(shù)和多項(xiàng)式核函數(shù)結(jié)合的混合核函數(shù)用于RVM中。
考慮到實(shí)際工業(yè)過程數(shù)據(jù)方差2的估計值與真實(shí)值存在偏差,若仍利用正態(tài)分布構(gòu)建區(qū)間會產(chǎn)生較大誤差,而T分布不依附于方差的估計,構(gòu)建的區(qū)間無須運(yùn)用智能優(yōu)化算法進(jìn)行優(yōu)化,減少了算法上的復(fù)雜性。同時,本文采用預(yù)測區(qū)間覆蓋率(PICP)、預(yù)測區(qū)間寬度(NMPIW),并引入累積偏差(AD)構(gòu)造區(qū)間評價綜合函數(shù),對區(qū)間估計結(jié)果進(jìn)行綜合評判。最后,運(yùn)用TE過程進(jìn)行仿真實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果表明本文所提的區(qū)間預(yù)測方法,區(qū)間模型預(yù)測精度較高,區(qū)間評價指標(biāo)較好。
1.1 PCIA
將輸入數(shù)據(jù)(1,2,…,x∈R)映射到高維空間中。在空間內(nèi)進(jìn)行主元分析,對應(yīng)的協(xié)方差矩陣是
假設(shè)特征值為,特征向量為
v=(2)
那么所有滿足≠0的特征向量為
將式(1)和式(3)代入式(2)中,得到
〈,〉= 〈,v〉
=(x)=1,2,…,(4)
引入核函數(shù):采用徑向基核函數(shù)。
求解特征值和特征向量,式(4)轉(zhuǎn)化為
n==[1,2,…,]T(5)
在對數(shù)據(jù)進(jìn)行主元分析之前,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理得到
式(6)中為系數(shù)為1/與×的單位陣相乘。所以,求解特征值就等價于在狀態(tài)空間中進(jìn)行主元提取。求解特征向量時,需要滿足
〈,〉=1,=1,2,…,(7)
為主元個數(shù)。
在此基礎(chǔ)上計算樣本在空間上的映射為
()為的第個主元分量。主元數(shù)量選擇依照貢獻(xiàn)率大于等于0.85的原則。然后對經(jīng)過KPCA處理的主元分量,構(gòu)建ICA模型,()T=,=-1()T,為獨(dú)立元矩陣,為變換陣,引入分離矩陣,使得=-1()T=T,利用微分熵準(zhǔn)則獲得估計矩陣,從而推出獨(dú)立元的估計。
1.2 混合核相關(guān)向量機(jī)(RVM)模型
對于給定的樣本集(x,t)(=1,…,),為樣本數(shù),則RVM定義的輸出為
其中(,x)是核函數(shù),本文采用混合核函數(shù),選擇要求
=0.1 (10)
w為權(quán)重,服從均值為零、方差為2的高斯分布,樣本的極大似然函數(shù)定義為
其中
=(1,2,…,t)T;=(1,2,…,w)T;
()=((1),(2),…,(x))T;(x)=(1,(1,x),…,(x,x))T
由貝葉斯理論可得,條件概率為
其中,(·)為條件概率分布函數(shù);(·)為條件概率密度函數(shù)。超參數(shù)=[1,2,…,]T,使得
(13)
因此,式(12)可改寫為
對式(14)整理,得到后驗(yàn)分布概率密度為
(15)
式中,=(-2T+a)-1,=diag(1,2,…,),=-2T。
采用極大似然得到和2的估計值。假設(shè)給定的輸入值為*,且(|,,2|)滿足高斯分布,其中輸出為
*=(*)(16)
1.3 驗(yàn)證實(shí)驗(yàn)
為驗(yàn)證基于PCIA的混合核RVM的有效性,本文選取UCI數(shù)據(jù)集中Concrete Compressive Strength數(shù)據(jù)進(jìn)行實(shí)證,采集800個數(shù)據(jù)樣本進(jìn)行實(shí)驗(yàn),其中選取600個數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),200個數(shù)據(jù)作為測試數(shù)據(jù),以模型測試的均方根誤差RMSE、平均相對誤差MAPE以及提取到的元數(shù)量(NE)作為評判驗(yàn)證指標(biāo)。為表明PCIA的優(yōu)勢,將PCIA與KPCA、ICA進(jìn)行比較(采用混合核RVM預(yù)測),結(jié)果如表1所示。
通過表1的比較結(jié)果可以看出,本文提出的PCIA方法在預(yù)測精度上明顯優(yōu)于其他方法。
表1 降維處理性能指標(biāo)對比
2.1 T分布區(qū)間構(gòu)建
對于樣本(x,t),預(yù)測輸出y。t為樣本真實(shí)值;定義誤差=t-y,如果得到的滿足(0,2)的分布,且每個元素都相互獨(dú)立,那么滿足
此時,依照參數(shù)的區(qū)間估計可以得到,當(dāng)給定置信度為1-(這里取=0.1)時
(||≤/2)=1-(18)
構(gòu)建區(qū)間形式為
2.2 預(yù)測區(qū)間評價指標(biāo)
本文采用預(yù)測區(qū)間覆蓋率(PICP),預(yù)測區(qū)間寬度(NMPIW),以及在兩者基礎(chǔ)上引入累積偏差(AD)提高區(qū)間評判的合理性。
(1)預(yù)測區(qū)間覆蓋率(PICP)
表示真實(shí)值落在預(yù)測區(qū)間內(nèi)的概率。值越大,說明預(yù)測區(qū)間效果越好。
(21)
式中,(X)、(X)分別為第時刻預(yù)測區(qū)間的上下限。
(2)預(yù)測區(qū)間寬度(NMPIW)
將MPIW標(biāo)準(zhǔn)化,得到
NMPIW=MPIW/(23)
式中,=max(Real)-min(Real)。
(3)構(gòu)造預(yù)測區(qū)間寬度范圍綜合評價函數(shù)(PICWC)
上述兩個指標(biāo)互相獨(dú)立,只考慮了區(qū)間評價的某一特征,由此,構(gòu)造預(yù)測區(qū)間寬度范圍綜合評價函數(shù)(PICWC),以綜合考慮PICP與NMPIW兩者的共同影響作用。
PICWC=NMPIW×(1+(PICP)×e-(PICP-)) (24)
其中
進(jìn)行必要的簡化和一定的夸張,在寫實(shí)的形象中尋找內(nèi)在結(jié)構(gòu)的抽象意味。使他的作品更加貼近生活。在進(jìn)行創(chuàng)作時,不能丟棄傳統(tǒng),他需要傳統(tǒng)的繪畫精神作為支撐,需要對民族的各個方面進(jìn)行了解才能使少數(shù)民族題材的工筆人物在真正意義上得到創(chuàng)新和發(fā)展。
式中,和都是常數(shù),=1-(a取0.1)。根據(jù)實(shí)踐經(jīng)驗(yàn)取50。當(dāng)PICP小于時,PICWC將迅速變大,導(dǎo)致預(yù)測區(qū)間不可行。當(dāng)PICP大于時,指數(shù)項(xiàng)的作用將減小,甚至可以忽略,得到PICWC=NMPIW,由此不會受到指數(shù)項(xiàng)的干擾而影響預(yù)測區(qū)間。
(4)引入累積偏差(AD)
考慮到預(yù)測區(qū)間覆蓋的真實(shí)值偏離預(yù)測上限(或下限)的程度不同,要求真實(shí)值應(yīng)盡量均勻分布在區(qū)間之中。觀察圖1與圖2發(fā)現(xiàn),圖1的偏離程度明顯高于圖2,因此圖2構(gòu)建的區(qū)間預(yù)測要優(yōu)于圖1。但若僅用式(24)的綜合評價函數(shù)進(jìn)行評價,如上兩個區(qū)間將被看作等效區(qū)間,并不能對其二者做出判斷。
針對這一問題,引入累積偏差(AD)指標(biāo)
(25)
式中,為預(yù)測值偏離預(yù)測區(qū)間的程度,該值越小越好。
本文采用TE過程進(jìn)行仿真實(shí)驗(yàn),驗(yàn)證所提方法的有效性。TE過程是一個經(jīng)典的化工過程,主要包含反應(yīng)器、壓縮機(jī)、冷凝器、解析塔和分離器5個部分,含有41個測量變量和12個操作變量。實(shí)驗(yàn)過程:運(yùn)行TE仿真模型,時間設(shè)置為24 h,得到仿真數(shù)據(jù),選取其中反應(yīng)器溫度作為目標(biāo)變量。取仿真過程中2200個數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),選取200個數(shù)據(jù)作為測試數(shù)據(jù)。首先,運(yùn)用雙變量相關(guān)分析得出與目標(biāo)變量顯著相關(guān)的多變量;其次,將得到的多變量利用PCIA進(jìn)行降維與獨(dú)立性分析;然后,將獨(dú)立元利用混合核RVM進(jìn)行回歸預(yù)測,構(gòu)建T分布區(qū)間,并計算PICP,NMPIW,PICWC與AD指標(biāo)。為了表明所提出方法的有效性,與基于PCIA 的RVM方法、混合核RVM方法、RVM、SVM方法進(jìn)行比較,測試過程如圖3~圖7所示。
為了進(jìn)一步對比區(qū)間預(yù)測效果,本文還與BP以及正態(tài)分布構(gòu)建方法進(jìn)行對比。測試過程如圖8、圖9所示。
上述7種方法區(qū)間預(yù)測性能指標(biāo)結(jié)果如表2所示。
表2 區(qū)間預(yù)測性能指標(biāo)對比
從圖3~圖6可以看出,本文提出的區(qū)間預(yù)測方法能夠有效地包含真實(shí)值,其上下波動趨勢與實(shí)際真實(shí)值基本一致,通過表2各種評價指標(biāo)結(jié)果可以得出,所提方法區(qū)間寬度最窄,綜合作用效果最好,與PCIA-RVM、混合核RVM、RVM相比,平均區(qū)間寬度、累積偏差都得到了改善;由圖7、圖8可以看出基于SVM以及基于PCIA-BP這兩種方法不能很好地包含真實(shí)值,不能很好地反映預(yù)測趨勢,而且通過表2也可以看出兩種方法區(qū)間覆蓋率太低,故其他區(qū)間指標(biāo)不做計算;由圖9可以看出基于正態(tài)分布的PCIA-混合核RVM預(yù)測區(qū)間方法大體上能夠覆蓋真實(shí)值,但存在部分真實(shí)值散落在預(yù)測區(qū)間之外,且區(qū)間覆蓋、平均寬度以及累計偏差均比本文所提方法差。綜上所述,基于PCIA與混合核RVM的區(qū)間預(yù)測方法可以很好地實(shí)現(xiàn)復(fù)雜過程變量區(qū)間預(yù)測,并描述關(guān)鍵變量的變化趨勢。
針對復(fù)雜工業(yè)過程要求在早期就能預(yù)測出問題的這一發(fā)展趨勢,區(qū)間預(yù)測不僅可以包含點(diǎn)預(yù)測的優(yōu)點(diǎn),而且還可以較好地描述出問題的不確定性與趨勢。本文提出了一種基于PCIA與混合核RVM的預(yù)測模型,通過回歸預(yù)測、T分布區(qū)間構(gòu)造并進(jìn)行區(qū)間估計綜合評價,并將此方法應(yīng)用到TE過程進(jìn)行區(qū)間預(yù)測仿真。通過與幾種常用方法的對比以及結(jié)果分析,可以看出本文提出的方法不僅預(yù)測精度和區(qū)間估計質(zhì)量上有明顯的提高,而且能夠較好地描述復(fù)雜過程變量變化趨勢,較好地滿足了實(shí)際復(fù)雜工業(yè)過程的應(yīng)用要求。
[1] FARUK D O. A hybrid neural network and ARIMA model for water quality time series prediction[J]. Engineering Applications of Artificial Intelligence, 2010, 23(4): 586-594.
[2] XIONG T, BAO Y, HU Z,. Forecasting interval time series using a fully complex-valued RBF neural network with DPSO and PSO algorithms[J]. Information Sciences, 2015, 305: 77-92.
[3] KHOSRAVI A, MAZLOUMIE, NAHAVANDI S,Prediction intervals to account for uncertainties in travel time prediction[J]. IEEE Transactions on Intelligent Transportation Systems, 2011, 12(2): 537-547.
[4] NIX DA, WEIGEMD A S. Estimating the mean and variance of the target probability distribution[C]// IEEE World Congress on IEEE International Conference on Neural Networks. 1994: 55-60
[5] LI P, DIMITRIS N. Bootstrap prediction intervals for linear, nonlinear and nonparametric autoregressions[J]. Journal of Statistical Planning and Inference, 2014, 177: 1-27.
[6] TRUCIOS C, HOTTA L K. Bootstrap prediction in univariate volatility models with leverage effect[J]. Mathematics and Computers in Simulation, 2016, 120:91-103.
[7] 黨宏濤, 杜祖良, 任宏文, 等. 基于Bootstrap方法的平臺慣導(dǎo)系統(tǒng)標(biāo)定參數(shù)重復(fù)性區(qū)間預(yù)測[J]. 中國慣性技術(shù)學(xué)報, 2013, 21(3): 411-414. DANG H T, DU Z L, REN H W,. Repeatability interval prediction for calibrated parameters of INS based on Bootstrap method[J]. Journal of Chinese Inertial Technology, 2013, 21(3): 411-414.
[8] WANG C, NIU M, SONG Y H,Pareto optimal prediction intervals of electricity price[J]. IEEE Transactions on Power Systems, 2016, 32: 1.
[9] 李知藝, 丁劍鷹, 吳迪, 等. 電力負(fù)荷區(qū)間預(yù)測的集成極限學(xué)習(xí)機(jī)方法[J]. 華北電力大學(xué)學(xué)報, 2014, 41(2): 78-88. LI Z Y, DING J Y, WU D,An ensemble model of the extreme learning machine for load interval prediction[J]. Journal of North China Electric Power University, 2014, 41(2): 78-88.
[10] WAN C, XU Z, PINSON P,. Probabilistic forecasting of wind power generation using extreme learning machine[J]. IEEE Transactions on Power Systems, 2014, 29(29): 1033-1044.
[11] VAPNIK V N. The Nature of Statistical Learning Theory[M]. New York: Springer-Verlag, 1995: 52-123.
[12] SHRIVASTAVA N A, KHOSRAVI A, PANIGRAHI B K. Prediction interval estimation of electricity prices using PSO-tuned support vector machines[J]. IEEE Transactions on Industrial Informatics, 2015, 11(2): 322-331.
[13] ZHAO J H, DONG Z Y, XU Z,. A statistical approach for interval forecasting of the electricity price[J]. IEEE Transactions on Power Systems, 2008, 23(2): 267-276.
[14] DE B K, DE B J, SUYKENS J A. Approximate confidence and prediction intervals for least squares support vector regression[J]. IEEE Transactions on Neural Networks, 2010, 22(1): 110-120.
[15] CHENG Q, TEZCAN J, CHENG J. Confidence and prediction intervals for semiparametric mixed-effect least squares support vector machine[J]. Pattern Recognition Letters, 2014, 40(40): 88-95.
[16] KHOSRAVI A, NAHAVANDI S, CREIGHTON D,Lower upper bound estimation method for construction of neural network-based prediction intervals[J]. IEEE Transactions on Neural Networks, 2011, 22(3): 337-46.
[17] HAO Q, SRINIVASAN D, KHOSRAVI A. Uncertainty handling using neural network-based prediction intervals for electrical load forecasting[J]. Energy, 2014, 73(7): 916-925.
[18] ZHANG G, WU Y, WONG K P,. An advanced approach for constructionof optimal wind power prediction intervals[J]. IEEE Transactions on Power Systems, 2015, 30(5): 2706-2715.
[19] HAO Q, SRINIVASAN D, KHOSRAVI A. Short-Term load and wind power forecasting using neural network-based prediction intervals[J]. IEEE Transactions on Neural Networks & Learning Systems, 2014, 25(2): 303-315.
[20] KAVOUSI-FARD A, KHOSRAVI A, NAHAVANDI S. A New fuzzy-based combined prediction intervalfor wind power forecasting[J]. IEEE Transactions on Power Systems, 2015, 31(1): 1-9.
[21] WAN C, XU Z, PINSON P,. Optimal prediction intervals of wind power generation[J]. IEEE Transactions on Power Systems, 2014, 29(3): 1166-1174.
[22] HOSEN M, KHOSRAVI A, NAHAVANDI S,Prediction interval-based neural network modelling of polystyrene polymerization reactor—a new perspective of data-based modelling[J]. Chemical Engineering Research & Design, 2014, 92(11): 2041-2051.
[23] 韓帥, 李樹剛. 基于區(qū)間預(yù)測模型的流感趨勢預(yù)測[J]. 計算機(jī)仿真, 2014, 31(9): 237-242. HAN S, LI S G. Influenza trends forecast based on interval prediction model[J]. Computer Simulation, 2014, 31(9): 237-242.
[24] SCHLKOPF B, SMOLA A, MULLER K. Nonlinear component analysis as a kernel eigenvalue problem[J]. Neural Computation, 1998, 10(5): 1299-1319.
[25] 李海波, 柴天佑, 岳恒. 浮選工藝指標(biāo)KPCA-ELM軟測量模型及應(yīng)用[J]. 化工學(xué)報, 2012, 63(9): 2892-2898. LI H B, CHAI T Y, YUE H. Soft sensor of technical indices based on KPCA-ELM and application for flotation process[J]. CIESC Journal, 2012, 63(9): 2892-2898.
[26] STEFATOS G, HAMZA A B. Dynamic independent component analysis approach for fault detection and diagnosis[J]. Expert Systems with Applications, 2010, 37(12): 8606-8617.
[27] KANO M, HASEBE S, HASHIMOTO I,. Evolution of multivariate statistical process control: application of independent component analysis and external analysis[J]. Computers and Chemical Engineering, 2004, 28(6/7): 1157-1166.
[28] MIANJI F A, ZHANG Y. Robust hyperspectral classification using relevance vector machine[J]. IEEE Transactions on Geoscience & Remote Sensing, 2011, 49(6): 2100-2112.
[29] TIPPING M. Sparse Bayesian learning and the relevance vector machine[J]. Journal of Machine Learning Research, 2001, 1(3): 211-244.
[30] 楊樹仁, 沈洪遠(yuǎn). 基于相關(guān)向量機(jī)的機(jī)器學(xué)習(xí)算法研究與應(yīng)用[J]. 計算技術(shù)與自動化, 2010, 29(1): 43-47. YANG S R, SHEN H Y. Research and application of machine learning algorithm based on relevance vector machine[J]. Computing Technology and Automation, 2010, 29(1): 43-47.
Research and application of interval prediction method for complex processes based on principal component independent analysis and mixed kernel RVM
XU Yuan, ZHANG Mingqing
(School of Information Science & Technology, Beijing University of Chemical Technology, Beijing100029, China)
In recent years, higher requirements have been put forward to process monitoring and key variable prediction with increasing complexity of chemical processes. Traditional point predictions do not meet these actual needs nor describe uncertainty concern, so that they could not predict variable trending well. An interval prediction method was proposed from principal component independent analysis and mixed kernel RVM. First, kernel principal component analysis (KPCA) and independent element analysis (ICA) were combined to extract principal components from original variables in complex process and to form independent principal components by independent analysis. Second, mixed kernel from Gauss and polynomial kernel functions and RVM were combined to generate a regression prediction model for the independent principal components, and T distribution was used to make interval estimation on predicted values of the model. Third, comprehensive interval evaluation function was constructed to analyze quality of the interval estimation results. Based on prediction interval coverage probability (PICP) and normal mean prediction interval width (NMPIW), accumulative deviation (AD) was introduced to improve rationality of the interval evaluation. The interval prediction analysis on TE simulation process showed that the proposed interval prediction method had better prediction accuracy and interval estimation quality, which could effectively predict trending of key variables in actual production process.
kernelprincipal component analysis; independent component analysis; relevance vector machine; prediction model; interval evaluation
10.11949/j.issn.0438-1157.20161559
TP 29
A
0438—1157(2017)03—0925—07
國家自然科學(xué)基金項(xiàng)目(61573051,61472021);軟件開發(fā)環(huán)境國家重點(diǎn)實(shí)驗(yàn)室開放課題(SKLSDE-2015KF-01);中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)資金項(xiàng)目(PT1613-05)。
2016-11-04收到初稿,2016-11-08收到修改稿。
聯(lián)系人及第一作者:徐圓(1983—),女,博士,副教授。
2016-11-04.
XU Yuan, associate professor, xuyuan@mail. buct.edu.cn
supported by the National Natural Science Foundation of China (61573051,61472021), the Open Fund of the State Key Laboratory of Software Development Environment (SKLSDE-2015KF-01) and the Fundamental Research Funds for Central Universities ofChina (PT1613-05)