郭京承 嚴愛軍,3 湯 健
焚燒可以實現(xiàn)城市固體廢物(Municipal solid waste,MSW)的減量化、無害化和資源化,是MSW處理的主要方式之一[1-2].在MSW 焚燒過程中,爐溫是評估焚燒過程運行合格與否的關(guān)鍵指標之一.為了保證焚燒過程中二噁英氣體被完全分解,爐溫需要持續(xù)控制在850 ℃以上[3].然而,在焚燒爐內(nèi)的高溫環(huán)境下,爐內(nèi)熱電偶存在易損壞和精度低等問題,并且由于焚燒過程具有滯后性,操作人員難以及時判斷爐溫變化情況.因此,構(gòu)建爐溫預(yù)測模型,對指導(dǎo)與優(yōu)化MSW 焚燒過程穩(wěn)定運行,具有現(xiàn)實意義.
目前,爐溫預(yù)測模型主要包括機理模型和數(shù)據(jù)驅(qū)動模型兩類.機理模型是根據(jù)焚燒過程中固、氣相反應(yīng)的物理化學(xué)變化以及能量、動量守恒等先驗知識,確定爐排速度、一次和二次風(fēng)機風(fēng)量等操作變量與爐溫的映射關(guān)系[4-5].雖然這類模型在可靠性和解釋性方面具有優(yōu)勢,但焚燒過程機理的復(fù)雜性和MSW 熱值的不確定性導(dǎo)致機理模型的預(yù)測精度無法保證.而以人工神經(jīng)網(wǎng)絡(luò)為代表的數(shù)據(jù)驅(qū)動模型,無需獲取焚燒過程中的復(fù)雜機理和先驗知識,通過運行數(shù)據(jù),學(xué)習(xí)輸入變量與爐溫之間的映射關(guān)系[6-7].這類模型的訓(xùn)練算法普遍采用誤差反向傳播算法,存在收斂速度慢和容易陷入局部最優(yōu)等問題.隨機學(xué)習(xí)技術(shù)通過隨機分配隱含層輸入權(quán)重和偏置,將神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練問題轉(zhuǎn)化為求解線性優(yōu)化問題[8],可以實現(xiàn)神經(jīng)網(wǎng)絡(luò)的快速訓(xùn)練.Wang 等[9]引入一種依賴于數(shù)據(jù)的監(jiān)督機制,遞增式地快速構(gòu)建神經(jīng)網(wǎng)絡(luò)模型,從而獲得了具有萬能逼近性質(zhì)的隨機配置網(wǎng)絡(luò)(Stochastic configuration network,SCN)模型.該模型在參數(shù)建模領(lǐng)域的成功應(yīng)用,為構(gòu)建焚燒過程爐溫預(yù)測模型提供了技術(shù)支持[10-12].然而,焚燒過程數(shù)據(jù)存在異常值和特征變量維度高的現(xiàn)象,使得SCN 模型的準確性和泛化能力仍有待提升.
在提升SCN 模型對異常值的魯棒性方面,文獻[13]將核密度估計方法與M估計相結(jié)合,并采用加權(quán)最小二乘法計算模型輸出權(quán)重,提升了SCN模型對異常值的魯棒性.文獻[14]使用最大相關(guān)熵準則度量訓(xùn)練樣本的懲罰權(quán)重,在提升SCN 模型魯棒性方面,有不錯的效果.此外,工業(yè)過程的復(fù)雜性和不確定性導(dǎo)致單一分布難以恰當描述樣本中異常值的分布情況,文獻[15]和文獻[16]分別采用將高斯分布與若干個拉普拉斯分布的混合分布以及混合t分布,作為訓(xùn)練樣本的異常值分布,均在不同程度上緩解了異常值對建模性能的影響.但隨著特征變量維度的增加,單個SCN 模型的泛化能力難以保證.
在具有高維特征變量情況下,雖然特征選擇與特征提取技術(shù)通過選擇部分重要特征或提取高維數(shù)據(jù)中的主成分來構(gòu)建數(shù)據(jù)驅(qū)動模型[17-18],但可能損失高維特征數(shù)據(jù)中蘊含的部分信息,從而影響模型準確性.文獻[19]提出一種異構(gòu)特征神經(jīng)網(wǎng)絡(luò)集成的框架,該框架以SCN 為基模型,并通過負相關(guān)學(xué)習(xí)(Negative correlation learning,NCL)策略[20],實現(xiàn)了基模型之間的同步訓(xùn)練,在高維特征數(shù)據(jù)建模方面,具有不錯的應(yīng)用前景.但該方法未考慮各組異構(gòu)特征對輸出變量的重要性以及異常值對模型準確性的影響.
基于上述分析,本文綜合考慮MSW 焚燒過程數(shù)據(jù)中同時存在異常值和高維特征變量兩種情況,提出一種用于構(gòu)建MSW 焚燒過程爐溫預(yù)測模型的魯棒加權(quán)異構(gòu)特征集成建模方法.本文主要貢獻如下: 1)綜合焚燒過程運行機理以及焚燒爐排構(gòu)造,將高維特征變量劃分為異構(gòu)特征集合,應(yīng)用后續(xù)集成建模;2)在異構(gòu)特征集成框架的基礎(chǔ)上,采用互信息和皮爾遜相關(guān)系數(shù)(后續(xù)簡稱“相關(guān)系數(shù)”),確定每組異構(gòu)特征對輸出變量的貢獻度,從而明確每個基模型的重要性;3)采用文獻[16]的魯棒SCN構(gòu)建基模型,并綜合各個基模型的訓(xùn)練過程確定樣本懲罰權(quán)重;4)設(shè)計一種魯棒加權(quán)NCL 策略,實現(xiàn)基模型之間的魯棒同步訓(xùn)練.采用焚燒過程的爐溫歷史數(shù)據(jù),驗證了本文方法的有效性和優(yōu)越性.
MSW 焚燒過程的工藝流程如圖1 所示.MSW焚燒過程由固體廢物儲運系統(tǒng)、固體廢物焚燒系統(tǒng)、余熱鍋爐系統(tǒng)、蒸汽發(fā)電系統(tǒng)和煙氣處理系統(tǒng)5 個系統(tǒng)組成,各系統(tǒng)的具體功能如下:
圖1 MSW 焚燒過程工藝流程圖Fig.1 MSW incineration process flow chart
1)固體廢物儲運系統(tǒng).生活中產(chǎn)生的MSW 由固體廢物清運車送至固體廢物儲蓄池內(nèi).MSW 具有高水分、低熱值的特點,需要在儲蓄池內(nèi)靜置3~10 天,以完成MSW 的脫水、發(fā)酵環(huán)節(jié),并由抓手送至焚燒爐的進料器,進行焚燒.
2)固體廢物焚燒系統(tǒng).預(yù)處理后的MSW 由進料器送入干燥爐排.在一次風(fēng)對流換熱以及爐內(nèi)高溫輻射的作用下,完成MSW 的水分干燥過程;干燥后的MSW 經(jīng)過2 段燃燒爐排,在高溫作用下,析出揮發(fā)分,并與一次風(fēng)中的氧氣在一燃室燃燒,未充分燃燒的揮發(fā)分氣體在二次風(fēng)的作用下,進一步燃燒;MSW 中的固定碳在燃燼段爐排燃燒.
3)余熱鍋爐系統(tǒng)和蒸汽發(fā)電系統(tǒng).由MSW 焚燒產(chǎn)生的高溫氣體在煙氣通道內(nèi),依次通過過熱器、蒸發(fā)器和省煤器,實現(xiàn)煙氣余熱回收,回收的熱量將冷卻水轉(zhuǎn)化為主蒸汽,用于汽輪機發(fā)電,從而實現(xiàn)焚燒過程的資源化.
4)煙氣處理系統(tǒng).焚燒過程產(chǎn)生的煙氣將分別通過脫酸反應(yīng)、布袋除塵設(shè)備實現(xiàn)煙氣處理,并在引風(fēng)機的作用下,由煙囪排出.
在焚燒工藝流程中,爐溫通常指一燃室煙氣的平均溫度,是衡量焚燒過程運行是否正常的關(guān)鍵指標之一.目前,現(xiàn)場采用熱電偶實時測量爐溫的變化情況.然而,在爐內(nèi)高溫環(huán)境下,熱電偶存在精度低和易損壞等問題.并且,爐溫變化具有滯后性,即調(diào)整過程變量后,爐內(nèi)的熱電偶難以及時反映爐溫的變化情況.基于上述爐溫的特點可知,構(gòu)建爐溫預(yù)測模型,對保證焚燒過程安全穩(wěn)定運行,具有現(xiàn)實意義.
從構(gòu)建爐溫預(yù)測模型的角度看,影響爐溫的機理反應(yīng)主要包括水分干燥、揮發(fā)分析出、揮發(fā)分燃燒等多階段的物理化學(xué)變化[21].這導(dǎo)致構(gòu)建爐溫預(yù)測模型涉及的特征變量數(shù)量眾多,變量明細如表A1所示.采用特征選擇或特征提取方法可以降低預(yù)測模型的輸入變量維度,提升模型的泛化能力,但降低特征維度會損失過程數(shù)據(jù)中蘊含的部分信息.另外,焚燒過程數(shù)據(jù)中包含的異常值會導(dǎo)致爐溫預(yù)測的準確性降低.因此,本文的研究重點是在焚燒過程數(shù)據(jù)具有高維特征變量和異常值的情況下,提升爐溫預(yù)測模型的準確性和泛化能力.
針對焚燒過程數(shù)據(jù)同時存在異常值和高維特征變量的特點,提出一種魯棒加權(quán)異構(gòu)特征集成建模方法,著重提升MSW 焚燒過程爐溫預(yù)測模型的準確性和泛化能力.下面分別介紹該方法的建模策略和實現(xiàn)過程.
魯棒加權(quán)異構(gòu)特征集成建模方法的建模策略如圖2 所示.首先,依據(jù)焚燒過程機理和爐排結(jié)構(gòu),將MSW 焚燒過程爐溫的高維特征變量訓(xùn)練集劃分為異構(gòu)特征集合,并以互信息和相關(guān)系數(shù)綜合評估每組異構(gòu)特征對爐溫的貢獻度;其次,采用文獻[16]的魯棒SCN 建模方法,構(gòu)建每組異構(gòu)特征對應(yīng)的基模型,并綜合所有基模型的訓(xùn)練情況,確定訓(xùn)練樣本的懲罰權(quán)重;最后,根據(jù)訓(xùn)練樣本的懲罰權(quán)重和每組異構(gòu)特征的貢獻度,設(shè)計一種魯棒加權(quán)NCL策略,實現(xiàn)基模型間的同步訓(xùn)練,從而獲得最終的爐溫預(yù)測模型.
圖2 建模策略圖Fig.2 Diagram of the modeling strategy
圖2 中,D表示爐溫的高維特征訓(xùn)練集,d表示輸入變量維度,N表示訓(xùn)練樣本數(shù)量;Dp表示第p組異構(gòu)特征對應(yīng)的訓(xùn)練子集,dp表示第p組異構(gòu)特征的維度,p=1,2,···,12,所有訓(xùn)練集的輸出變量保持一致;表示第p組異構(gòu)特征對爐溫的貢獻度,由輸入變量和輸出變量的互信息和相關(guān)系數(shù)綜合確定;ep表示第p個基模型的損失函數(shù),Φ 是訓(xùn)練樣本的懲罰權(quán)重,Hp和βp分別表示第p個基模型的隱含層輸出矩陣和輸出權(quán)重矩陣,H和β分別由所有基模型隱含層輸出矩陣和輸出權(quán)重矩陣組成;μ為NCL 懲罰因子,Y為相應(yīng)的輸出矩陣.
基于上述建模策略,本節(jié)分別介紹異構(gòu)特征劃分與貢獻度評估、基模型訓(xùn)練和魯棒加權(quán)同步訓(xùn)練的實現(xiàn)過程,并在最后給出算法偽代碼.
2.2.1 異構(gòu)特征劃分與貢獻度評估
從焚燒過程運行機理看,爐溫受水分干燥、揮發(fā)分析出、揮發(fā)分燃燒等階段影響[21-22].另外,從爐排上方熱電偶分布情況看,爐排上方安裝了12 組K 型鎧裝熱電偶,分布情況如圖3 所示.綜合考慮各階段的運行機理和爐排上方熱電偶分布,將表A1中的特征變量劃分為12 組異構(gòu)特征,每組異構(gòu)特征包括當前段的爐排速度、一次風(fēng)量、爐排出口溫度、一次風(fēng)溫度、一次風(fēng)機壓力、二次風(fēng)量和當前爐溫7 個變量.此時,異構(gòu)特征對應(yīng)的訓(xùn)練集記為Dp={Xp,Y},其中p=1,2,···,12,Xp為第p個訓(xùn)練集的輸入矩陣.
圖3 爐排上方熱電偶分布情況Fig.3 The distribution diagram of thermocouple on the grate
首先,對第p個訓(xùn)練集Dp,分別計算每個輸入變量與爐溫的互信息和相關(guān)系數(shù):
式中,x i∈R1×N表示第i個輸入變量,Y∈R1×N表示輸出矩陣即爐溫;p x(x) 和p y(y) 分別表示x和y的邊緣概率分布;p(x,y) 表示x和y的聯(lián)合概率分布;i=1,2,···,dp,dp為第p組異構(gòu)特征的特征數(shù)量,p=1,2,···,12;Cov(xi,Y) 表示xi與Y之間的協(xié)方差;Var(xi) 和 Var(Y) 分別表示xi與Y之間的方差.然后,采用互信息和相關(guān)系數(shù)的乘積作為每個特征變量與輸出變量相關(guān)性的評估指標,并以所有變量與爐溫相關(guān)性的平均值表示第p組異構(gòu)特征的貢獻度:
式中,ai表示第i個特征變量與爐溫的相關(guān)性;Ap表示第p組異構(gòu)特征的貢獻度,故Ap越大,表示該異構(gòu)特征對爐溫影響越大.
最后,對每組異構(gòu)特征的貢獻度進行歸一化處理:
2.2.2 基模型訓(xùn)練
焚燒過程數(shù)據(jù)中的異常值會降低基模型準確性,因此,本節(jié)采用基于混合t分布的魯棒SCN[16],實現(xiàn)基模型的訓(xùn)練過程.該方法實現(xiàn)步驟如下:
步驟1.初始化基模型的最大隱含層神經(jīng)元數(shù)量、最大隨機配置次數(shù)和混合t分布的位置參數(shù)、尺度參數(shù)和自由度;
步驟2.采用SC-III 算法,確定基模型的網(wǎng)絡(luò)結(jié)構(gòu)和連接權(quán)重;
步驟3.計算基模型輸出權(quán)重在給定訓(xùn)練集下的期望值;
步驟4.使步驟3 中的期望值最大化,從而確定模型輸出權(quán)重和混合t分布的位置參數(shù)、尺度參數(shù)和自由度;
步驟5.判斷算法是否收斂? 若達到收斂條件,基模型訓(xùn)練結(jié)束;否則,返回步驟3.
因此,訓(xùn)練完成的基模型Mp可以表示為:
來該院治療的糖尿病患者90例,其中男65例,年齡 32~75 歲,平均(40±10.3)歲,女 25 例,年齡 44~67歲,平均((50±9.7歲)根據(jù)隨機分組的原則,分為對照組和觀察組各45例,其中對照組男30例,年齡32~70歲,平均(47.6±2.3)歲,女 15 例,年齡 45~65 歲,平均(47.6±2.3)歲,觀察組其中男 38 例,年齡 35~75 歲,平均(40+7.5)歲,女 10 例,年齡 45~67 歲,平均(48.5±2.4)歲。對兩組患者分別采取常規(guī)尿液檢查和生化檢驗的診斷方式。
式中,Hp和βp分別表示第p個基模型的隱含層輸出矩陣和輸出權(quán)重矩陣;φ(·) 是Sigmoid 激活函數(shù);Lp表示第p個基模型的隱含層神經(jīng)元數(shù)量,p=1,2,···,12.為了后續(xù)表述簡潔,令H=[H1,···,H12]表示由所有基模型隱含層輸出和貢獻度乘積構(gòu)成的矩陣;β=[β1,···,β12] 表示所有基模型輸出權(quán)重構(gòu)成的矩陣.在上述訓(xùn)練過程中,每個基模型均可獲得一組訓(xùn)練樣本的懲罰權(quán)重矩陣,綜合考慮所有基模型的訓(xùn)練結(jié)果,將所有懲罰權(quán)重矩陣的均值作為最終訓(xùn)練集的懲罰權(quán)重,記為 Φ.此時,基模型訓(xùn)練過程結(jié)束.
注1.本節(jié)采用基于混合t分布的魯棒SCN[16]構(gòu)建基模型,其優(yōu)勢在于混合t分布具有重尾特性,且通過調(diào)整自由度可以使其概率密度曲線適應(yīng)不同類型的異常值分布,故該方法構(gòu)建的基模型對訓(xùn)練數(shù)據(jù)中的異常值具有較強的魯棒性.此外,在基模型訓(xùn)練過程中,可以獲得訓(xùn)練樣本的懲罰權(quán)重,這為后續(xù)魯棒加權(quán)同步訓(xùn)練奠定了基礎(chǔ).
2.2.3 魯棒加權(quán)同步訓(xùn)練
NCL 策略是實現(xiàn)神經(jīng)網(wǎng)絡(luò)集成模型同步訓(xùn)練的重要方法,該方法通過在神經(jīng)網(wǎng)絡(luò)集成的損失函數(shù)中,引入基模型間的相關(guān)懲罰項,實現(xiàn)基模型輸出之間的負相關(guān),從而降低基模型輸出之間的協(xié)方差[20].文獻[19]和文獻[23]均采用了NCL 策略,實現(xiàn)了隨機學(xué)習(xí)模型間的同步訓(xùn)練,從而提升了神經(jīng)網(wǎng)絡(luò)集成模型的準確性.然而,在MSW 焚燒過程中,由于運行數(shù)據(jù)中存在服從未知分布的異常值,導(dǎo)致NCL 策略的魯棒性難以保證.因此,本節(jié)設(shè)計一種魯棒加權(quán)NCL 策略,來實現(xiàn)基模型之間的魯棒同步訓(xùn)練.
在每個基模型的代價函數(shù)中引入訓(xùn)練樣本的懲罰權(quán)重矩陣 Φ,則第p個基模型的訓(xùn)練代價函數(shù)為:
此時,魯棒異構(gòu)特征集成模型的目標函數(shù)可以表示為:
式中,β*表示同步訓(xùn)練后集成模型的隱含層輸出權(quán)重矩陣.
式中,N表示訓(xùn)練樣本數(shù)量,Lp表示第p個基模型的隱含層神經(jīng)元數(shù)量.
對于p=1,2,···,12,采用線性矩陣運算形式,可將式(9)表示為:
式中,H定義如下:
根據(jù)式(10),可得基模型隱含層輸出權(quán)重的解析解:
此時,MSW 焚燒過程爐溫的魯棒異構(gòu)特征集成模型構(gòu)建完畢.基于上述分析,魯棒異構(gòu)特征集成算法偽代碼見算法1.
算法1.魯棒加權(quán)異構(gòu)特征集成算法
輸入.訓(xùn)練子集D={D1,···,D12}.
輸出.魯棒加權(quán)異構(gòu)特征集成模型.
1)初始化.魯棒SCN 的超參數(shù)、基模型的最大隱含層神經(jīng)元數(shù)量Lmax、NCL 的懲罰因子μ;
2) for {p ←1 to 12};
3)用式(1)和式(2)計算每組異構(gòu)特征與爐溫的互信息和相關(guān)系數(shù);
5)依據(jù)文獻[16]的魯棒SCN,構(gòu)建基模型Mp;
6) end;
7)用式(11)計算H;
8)用式(12)更新集成模型輸出權(quán)重;
9)返回魯棒加權(quán)異構(gòu)特征集成模型.
注2.本文提出的魯棒加權(quán)異構(gòu)特征集成建模方法以異構(gòu)特征集成框架為基礎(chǔ),采用基于混合t分布的魯棒SCN 構(gòu)建基模型,保證了基模型對訓(xùn)練數(shù)據(jù)的魯棒性.通過設(shè)計魯棒加權(quán)NCL 策略,實現(xiàn)了基模型的同步訓(xùn)練,并依據(jù)每組異構(gòu)特征的貢獻度,將各個基模型輸出的加權(quán)平均值作為集成模型的最終輸出.該方法對訓(xùn)練數(shù)據(jù)中的異常值具有較強的魯棒性,并且通過將表A1 中的高維特征變量劃分為 12 組異構(gòu)特征,降低了基模型的復(fù)雜程度,從而保證了爐溫預(yù)測模型的泛化能力.
本節(jié)采用MSW 焚燒過程的歷史數(shù)據(jù),驗證魯棒加權(quán)異構(gòu)特征集成建模方法的有效性,并將結(jié)果與其他典型集成建模方法進行比較.
本文采用的實驗數(shù)據(jù)為2020 年10 月北京某焚燒發(fā)電廠的歷史運行數(shù)據(jù),其中樣本采樣間隔為5 min 且所有數(shù)據(jù)經(jīng)過歸一化處理.訓(xùn)練集樣本數(shù)量為700,測試集樣本數(shù)量為200,驗證集樣本數(shù)量為100,均由隨機采樣獲得.輸入特征變量維度為42,輸出變量為10 min 后的爐溫預(yù)測值,詳細信息見表A1.在本文提出的魯棒加權(quán)異構(gòu)特征集成爐溫預(yù)測模型中,依據(jù)第2.2.1 節(jié)內(nèi)容,異構(gòu)特征共劃分為12 組,其中第1~4 組對應(yīng)干燥段爐排,第5~8 組對應(yīng)燃燒1 段爐排,第9~12 組對應(yīng)燃燒2 段爐排.每組異構(gòu)特征包含對應(yīng)段的爐排速度、一次風(fēng)量、爐排出口溫度、一次風(fēng)溫度、一次風(fēng)機壓力、二次風(fēng)量以及當前爐溫.本文實驗采用的性能評價指標為均方根誤差(Root mean square error,RMSE)和平均絕對誤差(Mean absolute error,MAE),計算公式如下:
式中,N表示樣本數(shù)量,yi表示爐溫的真值,是爐溫的預(yù)測值.為了避免隨機參數(shù)對實驗結(jié)果的影響,所有實驗結(jié)果均為50 次獨立重復(fù)實驗結(jié)果的均值和標準差.
為了突顯模型對訓(xùn)練數(shù)據(jù)中異常值的魯棒性,在訓(xùn)練樣本中,分別隨機選擇0%、10%和20%比例的樣本作為異常樣本,并將這些樣本的輸出進行異?;幚?具體處理方式為:
式中,yi和y i,outlier分別表示爐溫的真實值和處理后的異常值,rand(0,1)表示0 和1 之間的隨機數(shù),max(yi) 和 min(yi) 分別表示正常工況下爐溫的最大值和最小值.為了使異常值分布更加不平衡,正偏差異常值(sign=1)和負偏差異常值(sign=-1)的比例設(shè)置為2:1.
本節(jié)對基于魯棒加權(quán)異構(gòu)特征集成的爐溫預(yù)測模型開展性能測試.為了后續(xù)表述簡潔,將本文方法命名為Mt-RSCNE.由圖4 的異構(gòu)特征集合對爐溫的互信息、相關(guān)系數(shù)和貢獻度的對比可以看出,第1~4 組的貢獻度較高,說明干燥段爐排對應(yīng)的特征變量對爐溫變化的影響較大.其原因在于MSW具有高水分、低熱值的特點,隨著焚燒過程運行,在水分干燥過程中吸收的熱量差異較大.因此,結(jié)果與焚燒過程的運行機理存在一致性.
圖4 每組異構(gòu)特征集合對爐溫的互信息、相關(guān)系數(shù)和貢獻度對比Fig.4 Comparison of mutual information,correlation coefficient,and contribution of each heterogeneous feature set to furnace temperature
基模型隱含層神經(jīng)元數(shù)量Lmax和NCL 懲罰因子μ是Mt-RSCNE 模型中的兩個重要參數(shù).為了驗證模型對上述超參數(shù)的魯棒性,圖5 和圖6 分別為Lmax和μ取不同數(shù)值時,模型測試誤差的分布情況.其中,Lmax的取值為10~50,間隔數(shù)量為5;μ的取值為0.1~0.9,間隔數(shù)量為0.1.由圖5可以看出,隨著基模型隱含層神經(jīng)元數(shù)量的增加,爐溫預(yù)測模型50 次實驗的測試誤差均值變化較小,但測試誤差的標準差變化較大,說明當Lmax較大時,爐溫預(yù)測模型可能出現(xiàn)過擬合現(xiàn)象.因此,在后續(xù)實驗中,基模型隱含層神經(jīng)元數(shù)量設(shè)置為15.由圖6 可以看出,μ的取值對爐溫預(yù)測模型的測試性能有輕微影響,但影響并不顯著,說明本文方法對參數(shù)μ具有較好的魯棒性.
圖5 Lmax 取值為10~50 時,爐溫預(yù)測模型在驗證集上的誤差分布Fig.5 Error distribution of the furnace temperature prediction model on the verification set with Lmax from 10~50
圖6 μ 取值為0.1~0.9 時,爐溫預(yù)測模型在驗證集上的誤差分布Fig.6 Error distribution of the furnace temperature prediction model on the verification set withμfrom 0.1~0.9
為了驗證本文提出的Mt-RSCNE 模型在準確性和泛化能力方面的優(yōu)越性,本節(jié)將該方法與典型建模方法構(gòu)建的爐溫預(yù)測模型的預(yù)測結(jié)果進行對比分析.為表達簡潔,使用如下縮寫表示各建模方法:MoGL-SCNE 表示基于混合高斯分布和拉普拉斯分布的集成SCN 建模方法[15],SCNE 表示基于SCN的經(jīng)典異構(gòu)特征集成方法[19],DNNE 表示快速去相關(guān)神經(jīng)網(wǎng)絡(luò)集成方法[23],BESCN 表示基于Bootstrap 集成的SCN[24].
本文的Mt-RSCNE 方法的實驗參數(shù)設(shè)置如下:基模型隱含層神經(jīng)元數(shù)量為15,基模型最大配置次數(shù)為50,混合t分布的組分數(shù)量為3,權(quán)重分別為0.5、0.3 和0.2,位置參數(shù)均為0,尺度參數(shù)分別為0.12、0.11 和0.10,自由度均為4,NCL 懲罰因子μ為0.1.對比方法參數(shù)設(shè)置如下: 1) DNNE 方法.基模型數(shù)量為12,基模型隱含層神經(jīng)元數(shù)量為15,隨機權(quán)重選擇范圍為[-1,1].2) SCNE 方法.與本文方法一致.3) MoGL-SCNE 方法.基模型數(shù)量為12,基模型隱含層神經(jīng)元數(shù)量為15,混合分布由高斯分布和兩個拉普拉斯分布組成.其中高斯分布的權(quán)重為0.8,均值為0,方差為0.2,兩個拉普拉斯分布權(quán)重均為0.1,尺度參數(shù)均為0.1.4) BESCN 方法.基模型數(shù)量為12,基模型隱含層神經(jīng)元數(shù)量為15,誤差分布和輸出權(quán)重先驗分布的方差分別為1和0.5.上述實驗參數(shù)均采用驗證集測試獲得.
在訓(xùn)練數(shù)據(jù)輸出中,分別引入0%、10%和20%比例的異常值時,上述5 種建模方法構(gòu)建的爐溫預(yù)測模型的RMSE 和MAE 分布如圖7 所示.由圖7可以看出,采用異構(gòu)特征集成框架的爐溫預(yù)測模型(Mt-RSCNE 和SCNE)的測試誤差明顯低于其他方法,這說明異構(gòu)特征集成可以緩解高維特征變量對模型準確性和泛化能力的影響.當訓(xùn)練集引入10%和20%的異常值時,本文提出的Mt-RSCNE 的測試誤差變化幅度較小,說明本文設(shè)計的魯棒加權(quán)NCL策略可以提升爐溫預(yù)測模型對異常數(shù)據(jù)的魯棒性.表1 和表2 為上述對比結(jié)果的具體數(shù)值.
表1 在不同異常值比例下,各集成爐溫預(yù)測模型的測試RMSE (均值 ± 標準差) (℃)Table 1 Test RMSE of each ensemble furnace temperature prediction model under different percentages of abnormal value (mean ± standard deviation) (℃)
表2 在不同異常值比例下,各集成爐溫預(yù)測模型的測試MAE (均值 ± 標準差) (℃)Table 2 Test MAE of each ensemble furnace temperature prediction model under different percentages of abnormal value (mean ± standard deviation) (℃)
圖7 在不同異常值比例下,各集成模型對爐溫預(yù)測的性能對比Fig.7 Performance comparison of ensemble models for furnace temperature prediction under different percentages of abnormal value
為了更直觀地表現(xiàn)本文Mt-RSCNE 方法對訓(xùn)練數(shù)據(jù)中異常值的魯棒性,圖8 繪制了上述5 種集成爐溫預(yù)測模型在20%的異常值情況下的散點圖.由圖8 可以看出,Mt-RSCNE 方法對應(yīng)點的位置更加靠近對角線,說明該方法得到爐溫預(yù)測模型的結(jié)果更接近真實值.再次驗證了本文方法在爐溫預(yù)測準確性和泛化能力方面的優(yōu)越性,同時也說明了本文方法在工業(yè)過程參數(shù)建模領(lǐng)域中,具有一定的應(yīng)用價值.
圖8 在20%異常值情況下,各集成模型輸出的散點圖Fig.8 Scatter diagram of the output of each ensemble model under 20% abnormal value
為了提升MSW 焚燒過程爐溫預(yù)測模型的準確性和泛化能力,本文提出一種魯棒加權(quán)異構(gòu)特征集成建模方法,并采用焚燒過程歷史運行數(shù)據(jù)驗證了該方法的有效性.本文的主要貢獻如下:
1)針對焚燒過程數(shù)據(jù)具有高維特征變量的特點,依據(jù)MSW 焚燒過程的機理和爐排結(jié)構(gòu),將高維特征劃分為異構(gòu)特征集合,并采用互信息與相關(guān)系數(shù),綜合確定每組異構(gòu)特征對爐溫的貢獻度;
2)針對焚燒過程數(shù)據(jù)具有異常值的特點,采用基于混合t分布的魯棒SCN 構(gòu)建基模型,并綜合基模型的訓(xùn)練過程確定樣本懲罰權(quán)重,從而保證了基模型對數(shù)據(jù)中異常值的魯棒性;
3)設(shè)計一種魯棒加權(quán)NCL 策略,實現(xiàn)了基模型之間的魯棒同步訓(xùn)練,從而提升了爐溫預(yù)測模型的準確性和泛化能力.
實驗結(jié)果表明,與典型集成建模方法相比,本文構(gòu)建的MSW 焚燒過程爐溫預(yù)測模型在準確性和泛化能力方面具有優(yōu)勢,說明該方法在工業(yè)過程參數(shù)建模領(lǐng)域具有應(yīng)用價值.值得注意的是,該方法的訓(xùn)練模式為離線批量訓(xùn)練,這導(dǎo)致模型的訓(xùn)練效率會隨訓(xùn)練樣本數(shù)量的增加而降低.因此,針對提升模型訓(xùn)練效率或模型在線自適應(yīng)學(xué)習(xí)能力的研究,是未來研究的主要方向.
附錄A
表A1 爐溫預(yù)測模型過程變量明細Table A1 Process variable details of furnace temperature prediction model