周平 張麗 李溫鵬 戴鵬 柴天佑
高爐煉鐵是鋼鐵工業(yè)的重要生產(chǎn)環(huán)節(jié).高爐煉鐵時,鐵礦石、焦炭及溶劑按一定比例配成爐料,從爐頂進(jìn)料口加入到爐內(nèi).鐵礦石在高溫、高壓下,經(jīng)過一系列復(fù)雜物理化學(xué)反應(yīng)最終被還原成鐵,以鐵水的形式從高爐出鐵口流出.鐵水的質(zhì)量(鐵水溫度、硅含量等)對后續(xù)轉(zhuǎn)爐煉鋼影響很大,因此有必要實時準(zhǔn)確地監(jiān)測高爐狀態(tài),來保障高爐的平穩(wěn)運(yùn)行以生產(chǎn)出質(zhì)量合格的鐵水.然而高爐煉鐵是一個包含氣、固、液三相混合和耦合交錯,物理化學(xué)反應(yīng)極其復(fù)雜的過程,其爐內(nèi)環(huán)境極其惡劣,這些導(dǎo)致了操作人員難以對其內(nèi)部運(yùn)行狀態(tài)的變化進(jìn)行實時監(jiān)測.因此有必要建立準(zhǔn)確可靠的鐵水質(zhì)量模型來反映高爐當(dāng)前和預(yù)期的內(nèi)部溫度和指標(biāo)參數(shù)變化,為現(xiàn)場操作人員提供爐況和鐵水質(zhì)量信息[1?4].
目前常見的鐵水質(zhì)量模型有機(jī)理模型、知識推理模型和數(shù)據(jù)驅(qū)動模型[1?11].機(jī)理模型主要依賴于高爐煉鐵過程的內(nèi)部機(jī)理,從化學(xué)反應(yīng)動力學(xué)和流體動力學(xué)的角度構(gòu)建高爐內(nèi)部的反應(yīng)場,對反應(yīng)場內(nèi)的溫度分布、物料運(yùn)動狀態(tài)等進(jìn)行仿真,從而建立數(shù)學(xué)模型對高爐整個生產(chǎn)過程進(jìn)行預(yù)測和控制[5?7].機(jī)理模型只能應(yīng)用于相對平穩(wěn)的爐況環(huán)境,且基于機(jī)理模型的高爐往往需要在實際應(yīng)用中配備先進(jìn)的測量儀器.但高爐為一大型密閉爐體,冶煉過程極其復(fù)雜,工況變化較大,現(xiàn)有檢測設(shè)備水平有限,爐內(nèi)過程難以直接測量.且機(jī)理模型描述的是鐵水質(zhì)量的靜態(tài)特性,而高爐煉鐵是一個極為復(fù)雜、大時滯、高度耦合的非線性動態(tài)時變系統(tǒng),因此機(jī)理模型難以準(zhǔn)確應(yīng)用到實際高爐生產(chǎn)中.知識推理模型在應(yīng)用過程中,完全依賴于系統(tǒng)集成的有限專家知識,無法應(yīng)對復(fù)雜多樣的實際冶煉過程[8?10].我國中小高爐很多,冶煉條件復(fù)雜多樣,因此推理模型在我國大部分高爐上難以取得有效應(yīng)用.數(shù)據(jù)驅(qū)動的鐵水質(zhì)量參數(shù)建模方法,不需要了解高爐內(nèi)部發(fā)生的復(fù)雜變化,僅通過數(shù)學(xué)工具和智能算法對過去時間的數(shù)據(jù)進(jìn)行處理,就可以建立鐵水質(zhì)量的預(yù)測模型,因此數(shù)據(jù)驅(qū)動鐵水質(zhì)量建模成為近年高爐煉鐵過程建模研究的熱點(diǎn)[1?4,11?20].
神經(jīng)網(wǎng)絡(luò)(Neural network,NN)是一種較為常見的數(shù)據(jù)驅(qū)動建模方法,它是對人腦神經(jīng)系統(tǒng)進(jìn)行抽象、簡化和模仿所得到的復(fù)雜信息處理系統(tǒng),具有能夠以任意精度逼近連續(xù)函數(shù)的特性,特別適用于處理多因素、不精確的復(fù)雜信息[14].而高爐煉鐵系統(tǒng)內(nèi)部反應(yīng)極其復(fù)雜,內(nèi)部狀態(tài)未知,僅可獲得過程的輸入輸出數(shù)據(jù).因此NN作為一種“黑箱建?!狈椒ê苓m合應(yīng)用于高爐系統(tǒng)的建模研究,即模型在構(gòu)建時將僅依賴于系統(tǒng)的輸入和輸出數(shù)據(jù),并直接探尋輸入輸出之間的關(guān)系,而不再關(guān)注高爐內(nèi)部復(fù)雜的物理化學(xué)反應(yīng)過程.常見的NN算法主要包括BP(Back propagation)神經(jīng)網(wǎng)絡(luò)和RBF(Radial basis function)神經(jīng)網(wǎng)絡(luò)[14?15],但是這些算法普遍存在著“過擬合”、易陷入局部極小的問題.另外,基于批學(xué)習(xí)的網(wǎng)絡(luò)權(quán)值和偏差迭代調(diào)整造成網(wǎng)絡(luò)訓(xùn)練時間長、網(wǎng)絡(luò)學(xué)習(xí)前許多參數(shù)需要提前設(shè)定的問題[17].為此很多文獻(xiàn)提出改進(jìn)的神經(jīng)網(wǎng)絡(luò)建模方法,如文獻(xiàn)[14]采用遺傳算法優(yōu)化NN參數(shù),提高了模型精度并能避免算法陷入局部極小值,但是算法收斂速度較慢且仍存在過擬合問題.
近年,具有學(xué)習(xí)速度極快且泛化能力好的隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)(Random vector functional-link networks,RVFLNs)及其改進(jìn)算法有效克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的上述缺點(diǎn),被廣泛用于高爐煉鐵過程的建模與控制[3,16?18].文獻(xiàn)[16]采用經(jīng)典RVFLNs算法對鐵水質(zhì)量進(jìn)行建模,大大加快了計算速度,但是存在最優(yōu)隱層節(jié)點(diǎn)數(shù)的選擇問題,且易出現(xiàn)過擬合問題;文獻(xiàn)[17]進(jìn)一步采用在線序貫學(xué)習(xí)型RVFLNs實現(xiàn)多元鐵水質(zhì)量的在線軟測量建模,但是當(dāng)隱層節(jié)點(diǎn)選擇不當(dāng)時,會出現(xiàn)過擬合現(xiàn)象;文獻(xiàn)[18]提出的增量型RVFLNs一定程度解決隱層節(jié)點(diǎn)的選擇問題和過擬合問題,但是該方法中隱層節(jié)點(diǎn)數(shù)較多,網(wǎng)絡(luò)結(jié)構(gòu)過于復(fù)雜,計算效率低.毫無疑問,RVFLNs比BP等常規(guī)神經(jīng)網(wǎng)絡(luò)具有更高的計算效率,且RVFLNs及其改進(jìn)算法都具有較高的模型精度,但這些算法仍然存在如下兩方面問題:
問題1.傳統(tǒng)RVFLNs的輸入權(quán)值和隱層偏置在限定范圍內(nèi)隨機(jī)選取,完全獨(dú)立于建模數(shù)據(jù),參數(shù)選取具有一定的盲目性,不能有效反映和利用建模數(shù)據(jù)的特性和內(nèi)在關(guān)系;
問題2.現(xiàn)有RVFLNs算法仍然存在過擬合問題.過擬合是指模型學(xué)習(xí)時結(jié)構(gòu)過于復(fù)雜,以至于模型對已知訓(xùn)練數(shù)據(jù)具有很好的學(xué)習(xí)效果,而對未知數(shù)據(jù)表現(xiàn)較差.過擬合會導(dǎo)致模型泛化能力差、魯棒性不足,使模型在應(yīng)用階段不能很好地推廣.
針對上述兩方面問題,集成自編碼(Autoencoder)和主成分分析(Principle component analysis,PCA)技術(shù)[21?25],提出一種新型的改進(jìn)隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)算法,即AE-P-RVFLNs算法,并在此基礎(chǔ)上建立高爐煉鐵過程的NARX(Nonlinear autoregressive exogenous)模型,用于對難測多元鐵水質(zhì)量進(jìn)行在線、可靠估計.首先,為了更好地揭示高爐煉鐵過程的非線性動態(tài)特性以及更全面地反映鐵水質(zhì)量信息,預(yù)測模型采用NARX多輸出動態(tài)結(jié)構(gòu);其次,為了在RVFLNs建模時盡可能反映和利用建模數(shù)據(jù)的特性和內(nèi)在關(guān)系,引入Autoencoder前饋隨機(jī)網(wǎng)絡(luò)設(shè)計技術(shù)對輸入數(shù)據(jù)進(jìn)行訓(xùn)練,得到充分包含輸入數(shù)據(jù)特性信息的AE-PRVFLNs輸入權(quán)值;然后,利用PCA技術(shù)在保證不丟失原有大部分信息的前提下對AE-P-RVFLNs隱層輸出矩陣進(jìn)行降維,去除網(wǎng)絡(luò)中無用的隱層節(jié)點(diǎn),簡化網(wǎng)絡(luò)結(jié)構(gòu),提高模型泛化性能和計算效率;最后,基于我國華南某大型高爐實際數(shù)據(jù)建立基于AE-P-RVFLNs的多元鐵水質(zhì)量NARX模型,并和其他幾類RVFLNs算法進(jìn)行對比.結(jié)果表明,相對于其他鐵水質(zhì)量RVFLNs軟測量模型,本文方法不僅具有更高的模型精度和更快的計算速度,還解決了RVFLNs存在的過擬合和泛化性能差的問題.
針對常規(guī)RVFLNs及其改進(jìn)算法的上述缺點(diǎn),提出一種集成自編碼和PCA技術(shù)的新型隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)算法,即AE-P-RVFLNs算法.如圖1所示,AE-P-RVFLNs算法主要包括兩個階段:Autoencoder前饋隨機(jī)網(wǎng)絡(luò)對輸入數(shù)據(jù)的訓(xùn)練階段和PCA對隱層輸出矩陣的降維階段.1)針對前述問題1,采用Autoencoder前饋隨機(jī)網(wǎng)絡(luò),實現(xiàn)輸入樣本X→X網(wǎng)絡(luò)映射,以此求得充分體現(xiàn)輸入數(shù)據(jù)中特征信息和內(nèi)在關(guān)系的X→X網(wǎng)絡(luò)輸出權(quán)值β.2)針對問題2,在構(gòu)造輸入空間X到輸出空間Y,即X→Y的RVFLNs網(wǎng)絡(luò)時,首先將βT作為X→Y映射RVFLNs網(wǎng)絡(luò)的輸入權(quán)值,然后采用PCA技術(shù)在不丟失原有大部分信息的前提下對RVFLNs隱層輸出矩陣H進(jìn)行降維,去除網(wǎng)絡(luò)中無用隱層節(jié)點(diǎn),避免隱層輸出矩陣多重共線性問題,從而解決由于隱層節(jié)點(diǎn)過多導(dǎo)致模型過擬合和泛化能力差的問題;原高維隱層輸出矩陣H經(jīng)PCA降維后得到降維后的隱層輸出矩陣,在此基礎(chǔ)上計算輸出矩陣降維后的輸出權(quán)值.
傳統(tǒng)RVFLNs的輸入權(quán)值和隱層偏置在限定范圍內(nèi)隨機(jī)選取,完全獨(dú)立于建模數(shù)據(jù),因而參數(shù)選取具有一定盲目性,不能有效反映和充分利用建模數(shù)據(jù)的有用信息.所提AE-P-RVFLNs將首先采用Autoencoder技術(shù)來確定網(wǎng)絡(luò)的輸入權(quán)值.Autoencoder最早由Rumelhart等于1986年提出,之后被廣泛應(yīng)用于圖像和語音識別等領(lǐng)域[21?23].經(jīng)典Autoencoder是一種無監(jiān)督學(xué)習(xí)方法,通過反向傳播算法讓目標(biāo)值等于輸入值,即Autoencoder嘗試逼近一個恒等函數(shù),使得網(wǎng)絡(luò)輸出值等于輸入值[21],即Autoencoder將輸入樣本壓縮到隱含層,然后再在輸出端重建樣本,并在需要的時候用信息損失盡量小的方式將數(shù)據(jù)恢復(fù)出來.實際上,利用Autoencoder對無類標(biāo)數(shù)據(jù)進(jìn)行訓(xùn)練,可有效提取樣本中的有用信息,顯著改善后續(xù)計算效果.近年,文獻(xiàn)[23]改變傳統(tǒng)基于反向傳播計算權(quán)值的Autoencoder方法,采用前饋隨機(jī)網(wǎng)絡(luò)設(shè)計思想,提前固定輸入權(quán)值和隱層偏置隨機(jī)選擇范圍,只需計算所構(gòu)造網(wǎng)絡(luò)的輸出權(quán)值β即可.與傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的反向傳播算法相比,Autoencoder的前饋隨機(jī)網(wǎng)絡(luò)設(shè)計避免大量重復(fù)的迭代訓(xùn)練,加快訓(xùn)練速度,其原理如圖2所示,計算方法如下.
給定N組任意樣本集合一個帶有L個隱層節(jié)點(diǎn),以φ(x)為激勵函數(shù)的標(biāo)準(zhǔn)單隱層前饋神經(jīng)網(wǎng)絡(luò)可以表示為
式中,ω j=[ωj1,···,ωjn]和bj為圖2所示Autoencoder前饋隨機(jī)網(wǎng)絡(luò)的輸入權(quán)值和隱層偏置,βj=[βj1,···,βjn]T為圖 2 所示網(wǎng)絡(luò)的輸出權(quán)值.
當(dāng)fL以0誤差逼近連續(xù)系統(tǒng)的N個樣本時,即,則式(1)可以寫成:
將式(2)寫成矩陣形式:
圖1 AE-P-RVFLNs結(jié)構(gòu)Fig.1 The structure of AE-P-RVFLNs
圖2 Autoencoder前饋隨機(jī)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Autoencoder feedforward random network structure
其中
通常網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)會比訓(xùn)練樣本少很多,從而H0不是方陣,顯然式(3)所示方程組沒有解.為了選取最合適的β盡量使式(3)成立,那么就需要采用最小二乘的方法求解上述方程組,如式(4)所示.
由式(4)可看出β包含建模輸入數(shù)據(jù)的眾多有用信息.因此,輸入數(shù)據(jù)經(jīng)過Autoencoder的前饋隨機(jī)網(wǎng)絡(luò)訓(xùn)練,并將得到的β作為后續(xù)隨機(jī)網(wǎng)絡(luò)的輸入權(quán)值,將有效改善后續(xù)網(wǎng)絡(luò)的計算效果和性能.注意到無論隱層節(jié)點(diǎn)數(shù)L大于等于輸入變量個數(shù)n(即L≥n),還是L 在基本RVFLNs中,由于輸入權(quán)值和隱層偏置的隨機(jī)性,隱層輸出矩陣可能出現(xiàn)多重共線性問題,導(dǎo)致網(wǎng)絡(luò)中存在很多無用神經(jīng)元節(jié)點(diǎn),使網(wǎng)絡(luò)結(jié)構(gòu)變得復(fù)雜,從而嚴(yán)重制約網(wǎng)絡(luò)的計算效率.針對該問題,基于文獻(xiàn)[24]的思想,采用PCA技術(shù)對隱層高維輸出矩陣進(jìn)行降維,如圖3所示. 圖3 P-RVFLNs結(jié)構(gòu)Fig.3 The structure of P-RVFLNs 如圖3所示,基于PCA的RVFLNs輸出矩陣降維基本思想是將原來高維隱層變量重新組合成一組互不相關(guān)的低維隱層變量,這些低維隱層變量盡可能多地反應(yīng)原高維隱層變量所包含的信息,并丟掉一些次要的信息,從而在一定程度上經(jīng)過隱層降維處理,大大簡化RVFLNs的網(wǎng)絡(luò)結(jié)構(gòu),提高計算效率.基于PCA的RVFLNs輸出矩陣降維算法如下: 1)計算原高維隱層輸出矩陣H的協(xié)方差矩陣: 2)計算特征值λi和特征向量1,2,···,L,并根據(jù)特征值λi大小按降序λ1>λ2>···>λL排列. 一般取累計貢獻(xiàn)率達(dá)85%~95%的特征值λ1,λ1,···,λD所對應(yīng)的D(D≤L) 個主成分,如式(6)所示: 將上式表示成矩陣形式: 構(gòu)造新的神經(jīng)網(wǎng)絡(luò)來實現(xiàn)X→Y的映射.用前述Autoencoder前饋隨機(jī)網(wǎng)絡(luò)計算得到的βT作為映射網(wǎng)絡(luò)的輸入權(quán)值,隱層偏置仍為bj,計算得到隱層輸出矩陣H: 具有L個隱層節(jié)點(diǎn)的神經(jīng)網(wǎng)絡(luò),按上述PCA降維方法求取轉(zhuǎn)移矩陣G∈RL×D,則新的隱層輸出矩陣為.經(jīng)過PCA 降維后,新的隱層節(jié)點(diǎn)數(shù)由L變?yōu)镈,新網(wǎng)絡(luò)的輸入權(quán)值通過下式求取: 注1.所提AE-P-RVFLNs算法,X→Y網(wǎng)絡(luò)中的輸入權(quán)值不是隨機(jī)產(chǎn)生,而是由X→X的Autoencoder前饋隨機(jī)網(wǎng)絡(luò)訓(xùn)練得到.因而,相比于常規(guī)RVFLNs,AE-P-RVFLNs輸入權(quán)值的選擇更有依據(jù)性,能更好地提取輸入數(shù)據(jù)的有效信息.經(jīng)PCA將隱層輸出矩陣降維后,去掉一些無用隱層節(jié)點(diǎn),簡化了網(wǎng)絡(luò)結(jié)構(gòu),在不損失模型精度的前提下不但可提高計算效率,更為重要的是可有效避免過擬合問題. 第一階段(X→X):采用Autoencoder前饋隨機(jī)網(wǎng)絡(luò)設(shè)計完成輸入樣本訓(xùn)練,得到AE-PRVFLNs網(wǎng)絡(luò)的輸入權(quán)值β: 1)給定X→X網(wǎng)絡(luò)的輸入權(quán)值為w、隱層偏置b、激活函數(shù)(x)和隱層節(jié)點(diǎn)數(shù)L; 2)計算X→X網(wǎng)絡(luò)隱層輸入矩陣H0; 3)根據(jù)式(4)計算X→X網(wǎng)絡(luò)權(quán)值矩陣β. 第二階段(X→Y):基于PCA的AE-PRVFLNs網(wǎng)絡(luò)隱層輸出矩陣降維: 1)用第一階段求得的βT作為X→Y網(wǎng)絡(luò)的輸入權(quán)值,隱層偏置仍為b,據(jù)式(8)計算隱層輸出矩陣H; 2)根據(jù)式(5)~(7)計算轉(zhuǎn)移矩陣G和降維后網(wǎng)絡(luò)的隱層輸出矩陣; 高爐煉鐵工藝流程如圖4所示,由爐喉、爐身、爐腰、爐腹、爐缸5部分組成.高爐煉鐵時,將礦石和焦炭按一定比例配成爐料,從爐頂進(jìn)料口加入爐內(nèi),同時把煤粉和加熱到1200?C的富氧空氣從爐腹底部的送風(fēng)口鼓入爐內(nèi).在送風(fēng)口附近,煤粉和熱空氣在高溫作用下反應(yīng)生成大量還原性氣體,熾熱的還原性氣體在上升過程與下降鐵礦石和焦炭在高溫、高壓作用下發(fā)生一系列復(fù)雜化學(xué)物理反應(yīng),最終將鐵從鐵礦石中還原出來.鐵以高溫(1500?C)鐵水形式從出鐵口流出,鐵礦石中的脈石、焦炭以及噴吹物中的灰分與石灰石等溶劑結(jié)合形成爐渣,隨鐵水一同排出.大量還原性氣體在上升過程中經(jīng)過一系列復(fù)雜反應(yīng),最終形成高爐煤氣從爐頂回收,經(jīng)重力除塵后作為熱風(fēng)爐、加熱爐、焦?fàn)t等的燃料[1?4]. Fig.4 高爐煉鐵工藝示意圖Fig.4 Diagram of a typical BF ironmaking process 高爐煉鐵的最終目的是高效率、低成本地生產(chǎn)出盡可能多的優(yōu)質(zhì)鐵水.為了實現(xiàn)這一目標(biāo),就應(yīng)實時準(zhǔn)確地監(jiān)測高爐內(nèi)部狀態(tài),來保障高爐平穩(wěn)運(yùn)行,以生產(chǎn)出質(zhì)量合格的鐵水.然而高爐煉鐵中不僅存在著諸多的操作工序、數(shù)百項的影響參數(shù),且高爐內(nèi)部環(huán)境極為惡劣,氣、固、液三相并存,不同相態(tài)之間進(jìn)行著復(fù)雜的動量、能量傳遞和復(fù)雜物理化學(xué)變化,因此很難監(jiān)測高爐內(nèi)部狀態(tài)和實現(xiàn)高爐優(yōu)化控制.實際生產(chǎn)中,通常采用鐵水溫度(Molten iron temperature,MIT)、硅含量([Si])、磷含量([P])和硫含量([S])來間接反映高爐內(nèi)部狀態(tài)和綜合衡量鐵水質(zhì)量指標(biāo).鐵水溫度是表征高爐熱狀態(tài)、能量消耗和鐵水質(zhì)量的重要參數(shù),鐵水[Si]是反映鐵水化學(xué)熱的重要指標(biāo),而P和S是鐵水中的有害元素.日常操作中應(yīng)及時監(jiān)測和掌握這4個質(zhì)量指標(biāo)數(shù)值及其變化趨勢,預(yù)見性地采取調(diào)控措施.這對于穩(wěn)定高爐熱制度和出鐵指標(biāo)、減少爐況波動,提高生鐵質(zhì)量和降低焦比等都具有重要意義[1,3].由于鐵水質(zhì)量指標(biāo)難以直接在線檢測且離線化驗過程滯后,必須建立鐵水質(zhì)量模型以實現(xiàn)鐵水質(zhì)量的在線軟測量,這也是實現(xiàn)高爐鐵水質(zhì)量控制與運(yùn)行優(yōu)化的關(guān)鍵. 為了實現(xiàn)多元鐵水質(zhì)量的準(zhǔn)確估計,提高模型泛化能力,避免過擬合,本文采用提出的AE-PRVFLNs算法建立多元鐵水質(zhì)量的動態(tài)軟測量模型.高爐系統(tǒng)是個大時滯、強(qiáng)耦合的復(fù)雜非線性動態(tài)系統(tǒng),常規(guī)的靜態(tài)神經(jīng)網(wǎng)絡(luò)并不能很好地描述這一動態(tài)過程.由于NARX模型包含了輸入輸出變量的時序及時滯關(guān)系,能更好地逼近高爐煉鐵系統(tǒng)的非線性動態(tài)特性[3],因此建立如下NARX模型: 式中,X為建模輸入變量集,Y為待估計的鐵水質(zhì)量指標(biāo)集,p和q分別為過程輸入輸出時序系數(shù),根據(jù)所研究的高爐煉鐵過程時序和時滯關(guān)系以及大尺度的鐵水質(zhì)量采樣頻率值,確定p=1,q=1. 采用我國華南某大型高爐2013年10月份的高爐本體數(shù)據(jù)與鐵水質(zhì)量數(shù)據(jù)(采樣間隔為1h)進(jìn)行仿真實驗,根據(jù)該高爐煉鐵工藝及相關(guān)儀器儀表設(shè)置,確定影響多元鐵水質(zhì)量指標(biāo)的16個關(guān)鍵過程變量為:富氧率、透氣性、爐腹煤氣指數(shù)、鼓風(fēng)動能、送風(fēng)比、阻力系數(shù)、理論燃燒溫度、熱風(fēng)溫度、熱風(fēng)壓力、富氧流量、爐腹煤氣量、鼓風(fēng)濕度、冷風(fēng)流量、設(shè)定噴煤量、實際風(fēng)速、爐頂壓力等.考慮上述16個變量間具有很強(qiáng)的相關(guān)性,并且過多的建模變量會加大建模復(fù)雜度,影響模型預(yù)測性能,因此同樣采用PCA技術(shù)對建模輸入變量進(jìn)行降維[14,17],計算分析結(jié)果如表1所示.可以看出,當(dāng)選取累計方差貢獻(xiàn)率大于98%為界限時,前6項成份的累計方差貢獻(xiàn)率為98.723%,可以反映原來影響鐵水質(zhì)量指標(biāo)的絕大部分信息,因而選取該6項成分為主成分. 經(jīng)PCA降維后得到的主成分是原始高維物理變量的綜合函數(shù),沒有實際物理意義,因此降維得到的主成分不能用于實際高爐系統(tǒng)質(zhì)量建模與控制.在PCA分析體系中,因子載荷矩陣或正交旋轉(zhuǎn)后的因子載荷矩陣反映了原始物理變量與各主成分的相互關(guān)系,因子數(shù)值越大表示相關(guān)的密切程度越高.因此通過計算因子載荷矩陣可選取因子數(shù)值較大的幾個物理變量作為最終建模輸入變量.由表2所示6個主成分的因子載荷矩陣可以確定選擇爐腹煤氣量x1(kg/t)、熱風(fēng)溫度x2(?C)、熱風(fēng)壓力x3(kPa)、富氧率x4、鼓風(fēng)濕度x5(RH)和設(shè)定噴煤量x6(m3/h)作為最終NARX建模的輸入變量.NARX模型結(jié)構(gòu)確定后,采用提出的AE-PRVFLNs算法訓(xùn)練式(10)所示多元鐵水質(zhì)量在線估計的NARX模型. 表1 PCA求取的各主成分特征值、方差貢獻(xiàn)率以及累積方差貢獻(xiàn)率Table 1 PCA to obtain the principal component eigenvalues,variance contribution rate and cumulative variance contribution rate 表2 因子載荷矩陣(由PCA提取的6個主成分)Table 2 Factor load matrix(Six principal components extracted by PCA) 圖5 基于AE-P-RVFLNs的多元鐵水質(zhì)量NARX模型建模結(jié)果Fig.5 Modeling results of multicomponent hot metal mass NARX model based on AE-P-RVFLNs 為了驗證模型的可行性,將建立的基于AE-PRVFLNs的鐵水質(zhì)量模型在某大型高爐進(jìn)行測試.圖5為所提方法在訓(xùn)練集上的建模效果,可以看出基于實際數(shù)據(jù),建立的NARX模型取得良好的建模效果,模型輸出值與實際值擬合非常好,且趨勢基本一致.圖6為所提方法基于新的過程數(shù)據(jù)對多元鐵水質(zhì)量的在線效果.為了從直觀上說明所提方法的優(yōu)越性,將其與其他類似方法進(jìn)行對比研究.在這里,選用常規(guī)RVFLNs算法、單純采用Autoencoder前饋隨機(jī)網(wǎng)絡(luò)進(jìn)行輸入權(quán)值確定的AE-RVFLNs算法以及單純采用PCA進(jìn)行網(wǎng)絡(luò)輸出矩陣降維的P-RVFLNs算法,進(jìn)行相同數(shù)據(jù)集的預(yù)測對比實驗,且各算法網(wǎng)絡(luò)隱層節(jié)點(diǎn)均限定為50,并采用Sigmoidal函數(shù)作為激勵函數(shù).從圖6可以看出,所提方法建立的模型在所有模型中獲得了最好的預(yù)測結(jié)果和精確度,同時相對于其他3種對比方法,基于AE-P-RVFLNs的方法建立的模型預(yù)測曲線形狀與實際曲線匹配最好,并且趨勢基本一致. 基于工藝現(xiàn)場數(shù)據(jù),計算所提AE-P-RVFLNs算法及三種對比算法的運(yùn)算效率,并采用標(biāo)準(zhǔn)統(tǒng)計公式中的均方根誤差(Root mean square error,RMSE)和平均絕對百分誤差(Mean absolute percent error,MAPE)來對4種算法的估計性能和泛化性能進(jìn)行定量評估,結(jié)果如表3所示.可以看出,所提AE-P-RVFLNs算法由于對輸入權(quán)值預(yù)計算和對隱層輸出矩陣進(jìn)行降維處理,模型結(jié)構(gòu)得到優(yōu)化,使得最終建立的AE-P-RVFLNs模型具有較好的運(yùn)算效率和更高的估計精度.同時,通過比較AE-PRVFLNs、P-RVFLNs、AE-RVFLNs、RVFLNs 4種算法的運(yùn)算效率,可以看出通過引入PCA進(jìn)行輸出矩陣降維比通過采用Autoencoder進(jìn)行輸入權(quán)值確定更能改善RVFLNs算法的運(yùn)算效率. 為了檢驗所提算法的泛化性能和解決過擬合問題的能力,進(jìn)一步研究在逐一增加隱層節(jié)點(diǎn)數(shù)時,訓(xùn)練集和測試集均方根誤差(RMSE)的變化情況,如圖7所示.可以看到,當(dāng)剛開始增加網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)時,所提AE-P-RVFLNs算法的訓(xùn)練集和測試集RMSE均呈現(xiàn)明顯下降趨勢,而當(dāng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)繼續(xù)增加時,訓(xùn)練集和測試集RMSE趨于平穩(wěn),未出現(xiàn)明顯曲線交叉的過擬合現(xiàn)象.作為對比,本文又研究了常規(guī)RVFLNs算法以及AE-RVFLNs算法和P-RVFLNs算法的訓(xùn)練集和測試集RMSE隨隱層節(jié)點(diǎn)數(shù)增加時的變化情況,分別如圖8~10所示.可以看出,隨著隱層節(jié)點(diǎn)數(shù)的增加,三種對比算法的訓(xùn)練集RMSE都呈現(xiàn)下降趨勢,而測試集RMSE則不同程度呈現(xiàn)上升趨勢,因此三種對比算法均出現(xiàn)不同程度過擬合現(xiàn)象,即模型對已知訓(xùn)練數(shù)據(jù)具有較好的學(xué)習(xí)效果,而對未知的測試數(shù)據(jù)表現(xiàn)較差.另外,通過該三種對比算法的比較分析也可看出,相對于常規(guī)RVFLNs算法和AE-RVFLNs算法,P-RVFLNs算法的過擬合問題最弱.實際上,PRVFLNs算法只是在[P]建模時出現(xiàn)較明顯過擬合和[Si]建模時出現(xiàn)輕微過擬合,而對其他兩個鐵水質(zhì)量指標(biāo)建模未出現(xiàn)過擬合問題.這顯然應(yīng)該得益于P-RVFLNs算法引入的PCA技術(shù)降低了高維隱層輸出矩陣,避免隱層輸出矩陣多重共線性問題. 圖6 不同模型的多元鐵水質(zhì)量預(yù)測結(jié)果Fig.6 Comparison of multicomponent hot metal quality for different models 表3 不同算法相關(guān)統(tǒng)計指標(biāo)比較Table 3 Comparison of statistical indicators for different algorithms 通過以上實驗及其分析表明:所提AE-PRVFLNs算法通過采用Autoencoder前饋隨機(jī)網(wǎng)絡(luò)對輸入數(shù)據(jù)進(jìn)行訓(xùn)練而獲得優(yōu)化的網(wǎng)絡(luò)結(jié)構(gòu)參數(shù),可最大程度提取和反應(yīng)輸入數(shù)據(jù)的特性信息;進(jìn)一步引入PCA技術(shù)對高維隱層輸出矩陣進(jìn)行降維,避免隱層輸出矩陣多重共線性問題,大大降低網(wǎng)絡(luò)中的無用隱層結(jié)點(diǎn)個數(shù),避免由于隱層節(jié)點(diǎn)過多導(dǎo)致模型過擬合和運(yùn)算效率差的問題.即采用所提方法建立的模型具有較好的泛化性能、魯棒性和運(yùn)算效率,能夠較好地進(jìn)行實際工程應(yīng)用. 注2.注意到,由于隨機(jī)權(quán)神經(jīng)網(wǎng)絡(luò)隱層偏置等參數(shù)是在一定范圍內(nèi)隨機(jī)選取的,為了保證實驗結(jié)果更具說服力,以上對比實驗的結(jié)果都是取10次實驗的平均值作為最終的結(jié)果.另外,在研究RVFLNs和AE-RVFLNs的隱層節(jié)點(diǎn)與訓(xùn)練集RMSE、測試集RMSE的關(guān)系試驗中,隱層節(jié)點(diǎn)增加到200時,測試集的RMSE過大導(dǎo)致圖8和圖9不能很清楚的展示訓(xùn)練集誤差的變化情況,因此在這兩個試驗中(對應(yīng)圖8和圖9)將最大隱層節(jié)點(diǎn)個數(shù)減小為100. 圖7 逐一增加隱層節(jié)點(diǎn)數(shù)時所提AE-P-RVFLNs訓(xùn)練集和測試集RMSE變化曲線Fig.7 The RMSE curve of the training set and test set of the proposed AE-P-RVFLNs when the number of hidden nodes is increased one by one 圖8 逐一增加隱層節(jié)點(diǎn)數(shù)時RVFLNs訓(xùn)練集和測試集RMSE變化曲線Fig.8 The RMSE curve of training set and test set of RVFLNs when the number of hidden nodes is increased one by one 圖10 逐一增加隱層節(jié)點(diǎn)數(shù)時P-RVFLNs訓(xùn)練集和測試集RMSE變化曲線Fig.10 The RMSE curve of training set and test set of P-RVFLNs when the number of hidden nodes is increased one by one 為了解決傳統(tǒng)RVFLNs建模存在的過擬合和泛化能力差的問題,并在網(wǎng)絡(luò)輸入權(quán)值確定時充分利用建模輸入數(shù)據(jù)信息,本文集成Autoencoder和PCA技術(shù),提出一種新型的AE-P-RVFLNs算法,用于建立高爐煉鐵過程多元鐵水質(zhì)量在線估計的動態(tài)NARX模型.相對于常規(guī)RVFLNs,所提AE-PRVFLNs算法實現(xiàn)時增加了兩個關(guān)鍵設(shè)計步驟,即采用Autoencoder前饋隨機(jī)網(wǎng)絡(luò)對輸入數(shù)據(jù)的訓(xùn)練階段和采用PCA對隱層輸出矩陣的降維階段.所提算法的網(wǎng)絡(luò)參數(shù)由于充分利用了輸入數(shù)據(jù)信息、并顯著優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu),因而能夠在保證模型精度的同時,有效提高網(wǎng)絡(luò)運(yùn)行效率.更為重要的是,所提AE-P-RVFLNs算法有效避免了RVFLNs存在的過擬合問題和多重共線性問題,因而基于所提方法建立的模型泛化性能好、魯棒性強(qiáng),能夠在實際煉鐵生產(chǎn)中進(jìn)行工程應(yīng)用.1.2 基于PCA的RVFLNs隱層高維輸出矩陣降維
1.3 算法實現(xiàn)步驟
2 基于AE-P-RVFLNs的多元鐵水質(zhì)量NARX建模
2.1 高爐煉鐵過程及鐵水質(zhì)量建模的必要性
2.2 多元鐵水質(zhì)量建模過程
2.3 建模效果及過擬合測試
3 結(jié)論