李雅晶,辛妍麗
(華南理工大學(xué) 電力學(xué)院,廣州 510640)
煤炭燃燒是造成我國大氣污染的主要原因,也是出現(xiàn)霧霾天氣的主要原因[1],影響人體健康[2]。燃煤電廠是我國煤炭主要消耗源[3],因此對燃煤電廠進(jìn)行除塵、脫硫、脫硝等控污方法很重要。火電廠脫硝主要用選擇性催化還原(SCR)方式,即在催化劑催化下,用氨或其他還原劑將氮氧化物(NOX)還原為氮?dú)夂退,F(xiàn)場存在著因NOX測量不準(zhǔn)確而導(dǎo)致還原劑用量不正確,造成脫硝不完全或還原劑浪費(fèi)。需要的噴氨量根據(jù)反應(yīng)器入口NOX含量與反應(yīng)器出口NOX含量差值計(jì)算出,因此噴氨量大小需要及時并準(zhǔn)確地測量。但是常規(guī)分析儀測量的NOX需要40~60 s的時間,并不能滿足電廠脫硝的要求[4]。為解決上述問題,可以通過尋找測量量之間的相關(guān)關(guān)系,采用間接測量的方法,建立NOX排放量的預(yù)測模型。此方法為軟測量技術(shù)的應(yīng)用。
Brosillow在1978年首次提出了由估計(jì)器和控制器組成的推斷控制思想[5]。而軟測量技術(shù)就源于推斷估計(jì)器[6]:即通過分析變量間數(shù)學(xué)關(guān)系來建立目標(biāo)函數(shù)值的預(yù)測模型,實(shí)現(xiàn)對目標(biāo)函數(shù)值的準(zhǔn)確預(yù)測,進(jìn)而有效控制系統(tǒng)。近些年隨著軟測量技術(shù)的迅速發(fā)展,在工業(yè)領(lǐng)域的應(yīng)用逐漸廣泛。軟測量問題的解決過程主要分為3個步驟[7]:采集及處理數(shù)據(jù)、選取輔助變量、建立和校正模型。軟測量建模是軟測量的重要步驟,近幾年主要的建模方法有機(jī)理建模[8-10]、回歸分析建模[11]、狀態(tài)分析建模[12]、神經(jīng)網(wǎng)絡(luò)建模[13-15]、支持向量機(jī)建模[16-17]等。
本文以火電廠燃煤鍋爐NOX含量作為研究對象,建立了基于回歸支持向量機(jī)(SVR)的軟測量模型。不使用硬件檢測,預(yù)測NOX排放濃度。首先通過對SCR反應(yīng)器生成NOX的過程機(jī)理分析,并結(jié)合相關(guān)性分析、主成分分析等數(shù)據(jù)處理方法選取輔助變量,然后基于SVR算法建立軟測量模型,最后通過電廠鍋爐不同工況下的運(yùn)行數(shù)據(jù)建模測試,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)對模型效果進(jìn)行對比檢驗(yàn)。
本模型的主導(dǎo)變量為脫硝SCR反應(yīng)器入口的NOX含量,要確定影響此主導(dǎo)變量的輔助變量,首先分析電廠鍋爐NOX生成過程的影響因素:
1) 燃料特性:燃料中氮的存在形式不同,NOX生成量也相應(yīng)變化;煤揮發(fā)成分中的各種元素比也是一個重要影響因素。
2) 過量空氣系數(shù):當(dāng)空氣分級時,可降低NOX排放量,隨著一次風(fēng)量減少,二次風(fēng)量增加,氮被氧化的速度降低,NOX排放量也隨之下降。
3) 燃燒溫度:爐內(nèi)燃燒溫度越高,NOX排放量越大。
4) 一次風(fēng)率:為了有效控制NOX的含量,減弱NOX生成環(huán)境,二次風(fēng)送入點(diǎn)上部應(yīng)維持富氧區(qū),下部應(yīng)維持富燃料區(qū)。
5) 負(fù)荷率:負(fù)荷率越大,給煤量越大,燃燒室及尾部受熱面處的煙溫也相應(yīng)提高,揮發(fā)分氮生成的NOX相應(yīng)增加[18]。
6) 風(fēng)煤比:即總風(fēng)量與總煤量的比值,反映了送粉的效率。
7) A、B、C、D、E、F 磨的單臺磨風(fēng)煤比:即給煤機(jī)的瞬時流量和磨煤機(jī)的入口一次風(fēng)流量,反映了單臺磨的給煤效率。
8) 燃盡風(fēng)門開度與所有風(fēng)門開度總和比值:反映了空氣在爐膛內(nèi)的流動情況。
結(jié)合電廠現(xiàn)場的實(shí)際測量數(shù)據(jù),挑選出相關(guān)變量作為備選的輔助變量。
本文所用數(shù)據(jù)均采自某火電廠現(xiàn)場運(yùn)行7日的數(shù)據(jù)。由于數(shù)據(jù)在火電廠分布式控制系統(tǒng)(DSC)中已經(jīng)進(jìn)行了濾波處理,因此在建模前不需要對其進(jìn)行濾波。接下來,對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,在建模過程中,避免因數(shù)據(jù)大小對樣本造成的影響,用以下公式對其進(jìn)行標(biāo)準(zhǔn)化處理:
(1)
其中:
(2)
(3)
首先對備選的輔助變量原始變量和主導(dǎo)變量進(jìn)行相關(guān)分析。相關(guān)系數(shù)公式如下:
(4)
式中,x是備選輔助變量的測量值,y是該輔助變量對應(yīng)的主導(dǎo)變量,即NOx含量的值。Cov(x,y)是兩者的協(xié)方差。D(x),D(y)分別是兩者的方差。
選取相關(guān)系數(shù)大于0.4的變量作為原始輔助變量,結(jié)果如表1所示。
表1 原始輔助變量
由表1可看出,NOX的生成影響因素復(fù)雜,影響主導(dǎo)變量的原始輔助變量較多。
由于表1中篩選出的12個原始輔助變量之間的相關(guān)性很強(qiáng),而且變量的個數(shù)較多。如果直接采用這些原始輔助變量作為軟測量模型的輔助變量,不但會增加訓(xùn)練的成本,而且會造成信息的重疊,影響預(yù)測結(jié)果的客觀性。為了將上述的相關(guān)性很高的變量轉(zhuǎn)化成彼此互相獨(dú)立或不相關(guān)的變量,并且減少變量個數(shù)降低訓(xùn)練成本,考慮對原始輔助變量進(jìn)行主成分分析。
通過Matlab軟件對12個原始輔助變量進(jìn)行主成分分析,分析其相關(guān)系數(shù)矩陣,前幾個特征根及其貢獻(xiàn)率見表2。
表2 原始輔助變量主成分分析結(jié)果
從表2可以看出,前3個特征根的累積貢獻(xiàn)率超過90%,主成分分析的效果明顯。前6個主成分的主成分達(dá)到98%以上,因此選取前6個主成分作為本文軟測量模型的輔助變量。
為具體說明選取的6個輔助變量與原始輔助變量的關(guān)系,表3列出了標(biāo)準(zhǔn)化變量的前6個特征根對應(yīng)的特征向量。其中,x1,x2,...,x12表示表1中的12個原始變量標(biāo)準(zhǔn)化后的數(shù)值,p1,p2,...,p6表示選取的輔助變量,即前6個主成分。
表3 前6個主成分(輔助變量)對應(yīng)的特征向量
每個選取作為輔助變量的主成分pi是12個原始的輔助變量xj的線性組合,具體系數(shù)為對應(yīng)的特征向量,如表3所示??梢钥闯觯?主成分主要反映了總風(fēng)量、總煤量、燃盡風(fēng)門開度與所有風(fēng)門開度總和的比值和鍋爐氧量,第2主成分主要反映了風(fēng)煤比和燃凈風(fēng)門開度與所有風(fēng)門開度總和的比值以及鍋爐氧量,第3主成分主要反映了D磨風(fēng)煤比,第4主成分主要反映了C磨風(fēng)煤比,第5主成分主要反映了空預(yù)器二次風(fēng)溫、B磨風(fēng)煤比以及一次風(fēng)率和二次風(fēng)率,第6主成分主要反映了機(jī)組負(fù)荷、風(fēng)煤比、燃凈風(fēng)門開度與所有風(fēng)門開度總和的比值以及鍋爐氧量。
由此可得,選取的前6個主成分作為軟測量模型的輔助變量,既全面的反映了原始的12個輔助變量,又消除了原始變量之間的相關(guān)性,而且減少了變量的個數(shù)節(jié)約了訓(xùn)練的成本。因此,本文NOX軟測量模型輔助變量的選擇恰當(dāng)。
SVR是在支持向量機(jī)分類的基礎(chǔ)上,引入ε線性不敏感損失函數(shù),其基本思想是尋找一個最優(yōu)分面,使所有訓(xùn)練樣本離這個分類面的誤差最小。如圖1所示。
圖1 回歸型支持向量機(jī)(SVR)基本思想
通過非線性映射函數(shù)φ(·)將訓(xùn)練集樣本{(xi,yi),i=1,2,…,l}的輸入列向量x映射到高維特征空間Rd,建立SVR的線性回歸函數(shù):
f(x)=ωφ(x)+b
(5)
其中:ω為法向量,b是位移項(xiàng),f(x)即為回歸函數(shù)返回的預(yù)測值。
定義ε線性不敏感損失函數(shù)L(f(x),y,ε),如圖2所示。表示如果預(yù)測值f(x)與真實(shí)值y的差不大于ε,則損失為0。
圖2 ε線性不敏感損失函數(shù)
尋找最優(yōu)的分類面轉(zhuǎn)化為尋找最優(yōu)的ω和b,引入松弛變量ξi、ξi*,可把優(yōu)化的目標(biāo)函數(shù)具體表示為:
(6)
其中:C是懲罰因子,表示訓(xùn)練誤差超過誤差要求ε的懲罰系數(shù);ω2是置信區(qū)間,與模型的復(fù)雜度有關(guān);l是訓(xùn)練樣本個數(shù)。
可引入拉格朗日函數(shù)并轉(zhuǎn)化為對偶形式求解,最終得到最優(yōu)的線性回歸函數(shù)即為SVR預(yù)測函數(shù):
因此,得到的回歸函數(shù)即軟測量模型為:
(7)
式中,只有部分參數(shù)(αi-αi*)不等于零,其對應(yīng)的樣本xi即為本模型中的支持向量。其中核函數(shù)K(xi,xj)=φ(xi)φ(xj)應(yīng)滿足Mercer條件,核函數(shù)不同,構(gòu)造的支持向量機(jī)不同。常用核函數(shù)有多項(xiàng)式核函數(shù)、RBF核函數(shù)、線性核函數(shù)、Sigmoid核函數(shù)。
此外,由式(7)可以看出,SVR最終的函數(shù)形式的結(jié)構(gòu)如圖3所示。
在圖3中,每個支持向量對應(yīng)一個中間節(jié)點(diǎn),中間節(jié)點(diǎn)的線性組合即為輸出。
圖3 回歸型支持向量機(jī)(SVR)的結(jié)構(gòu)
SCR反應(yīng)器入口NOX含量的訓(xùn)練數(shù)據(jù)來源是火電廠現(xiàn)場DCS采集到每秒的數(shù)據(jù),共201 600組。為減少軟測量模型的訓(xùn)練成本和時間,以20 s為長度等間隔取值,構(gòu)成10 080個新數(shù)組,使數(shù)據(jù)的變化更明顯。然后對標(biāo)準(zhǔn)化后原始的輔助變量進(jìn)行主成分分析,取前六個主成分作為最終的輔助變量,為不失一般性,選取前6 500組數(shù)據(jù)作為樣本產(chǎn)生訓(xùn)練集,剩余的3 580組數(shù)據(jù)作為產(chǎn)生測試集的樣本,來對模型的測試集進(jìn)行評價。
首先對于作為輔助變量的前6個主成分?jǐn)?shù)據(jù)集,進(jìn)行再次歸一化。不同的核函數(shù)和模型參數(shù)對SVR模型的性能影響很大。因此,合適的核函數(shù)及參數(shù)組合的選擇在SVR模型建立中極為重要。本模型需要選取的參數(shù)有兩個,分別是懲罰因子C和RBF核函數(shù)中的方差g。懲罰因子C和RBF核函數(shù)中的方差g的取值對SVR軟測量模型的性能有著重要影響,懲罰因子C用來控制樣本偏差和機(jī)器泛化能力之間的關(guān)系,RBF核函數(shù)中的方差g太大或太小會造成對樣本數(shù)據(jù)的過學(xué)習(xí)或欠學(xué)習(xí)。
對于核函數(shù)的選擇,本文采用RBF核函數(shù)。對于選擇最優(yōu)的參數(shù)g(即RBF核函數(shù)中的方差),和參數(shù)C(即懲罰因子),本文采用交叉驗(yàn)證的方法。特別說明的是,因?yàn)閼土P因子參數(shù)C越大,最終得到的支持向量越多,計(jì)算量也就隨之增大。因此,當(dāng)模型的性能相同時,為了節(jié)約運(yùn)算時間,優(yōu)先選擇懲罰因子參數(shù)C較小的參數(shù)組合。
本文選取的工具是Matlab中l(wèi)ibsvm軟件包,對SVR進(jìn)行仿真測試,得到測試集和訓(xùn)練集的預(yù)測值,并且計(jì)算測試集的均方誤差E和決定系數(shù)R2,具體計(jì)算的公式如式(8)、(9)所示:
(8)
(9)
式中,l是測試集的樣本個數(shù),yi表示第i個樣本預(yù)測值,yi*表示第i個樣本真實(shí)值
均方誤差E表示測量的精密度,E越接近零測量的精度越高;決定系數(shù)R2表示模型的泛化能力,R2越接近1,表明模型對樣本的依賴性越低,泛化能力越強(qiáng)。
此外,還要特別說明的是,在仿真測試時,對于直接得到的訓(xùn)練集和樣本集的預(yù)測值,即主導(dǎo)變量NOX的預(yù)測量,因?yàn)橹皩?shù)據(jù)已經(jīng)做過了歸一化處理,所以這里最后的預(yù)測結(jié)果還要進(jìn)行反歸一化處理。
因?yàn)殡S機(jī)產(chǎn)生訓(xùn)練集和測試集,所以每次運(yùn)行的結(jié)果會略有差異。由于SVR算法最終轉(zhuǎn)化為一個二次規(guī)劃問題,理論上可以避免陷入局部最優(yōu),得到全局最優(yōu)解。因此,每次運(yùn)行的結(jié)果雖略有不同,但結(jié)果基本穩(wěn)定。某一次運(yùn)行的訓(xùn)練集、測試集結(jié)果分別如圖4~圖5所示。
圖4 SVR模型訓(xùn)練集結(jié)果對比
圖5 SVR模型測試集結(jié)果對比
訓(xùn)練集均方誤差的計(jì)算結(jié)果是0.009 75,結(jié)合圖4可知,訓(xùn)練過程中的精密度很高;訓(xùn)練集決定系數(shù)的計(jì)算結(jié)果是0.889 56,表明訓(xùn)練的結(jié)果對訓(xùn)練樣本的依賴性很小,泛化能力很好。
測試集預(yù)測值和真實(shí)值具體對比結(jié)果如圖5所示,測試集的均方誤差是0.013 40,表示該軟測量預(yù)測模型的精密度高;訓(xùn)練集的決定系數(shù)是0.857 95,表明模型的預(yù)測的結(jié)果對樣本的依賴性很小,該模型的泛化能力理想。
軟測量模型的建模方法中,神經(jīng)網(wǎng)絡(luò)也是做回歸擬合預(yù)測問題的選擇之一,下面用BP神經(jīng)網(wǎng)絡(luò)的建模方法對該SVR軟測量模型結(jié)果進(jìn)行檢驗(yàn),并進(jìn)行兩種方法的性能對比。
建立的BP神經(jīng)網(wǎng)絡(luò)模型對測試集預(yù)測的結(jié)果如圖6所示,與4.1節(jié)對應(yīng)的結(jié)果為同一次運(yùn)行所得。
經(jīng)計(jì)算本次BP神經(jīng)網(wǎng)絡(luò)模型運(yùn)行的均方根誤差為0.025 72,結(jié)合圖6可以看出精度較高,說明此次的運(yùn)行結(jié)果沒有陷入局部最優(yōu),結(jié)果有效。
對比圖6和圖5發(fā)現(xiàn),SVR的均方根誤差小于BP神經(jīng)網(wǎng)絡(luò),說明在NOX軟測量的問題中SVR的精度較高;SVR的決定系數(shù)大于BP神經(jīng)網(wǎng)絡(luò)的0.816 81,說明對于此問題,SVR的泛化能力優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
圖6 BP神經(jīng)網(wǎng)絡(luò)測試集結(jié)果對比
從SVR的原理可知,不同核函數(shù)性能對軟測量模型性能的影響不同。本文之前的工作中,選取的是RBF核函數(shù),為了檢驗(yàn)核函數(shù)選擇的準(zhǔn)確性,這里用某次隨機(jī)產(chǎn)生的測試機(jī)和訓(xùn)練集進(jìn)行對比試驗(yàn),具體結(jié)果如表4所示。
表4 不同核函數(shù)對軟測量模型的性能影響
如表4所示,RBF核函數(shù)對應(yīng)的模型泛化能力最好,和Sigmoid及線性核函數(shù)相比,雖然多項(xiàng)式對應(yīng)的模型訓(xùn)練性能較好,但泛化能力較差。因此,本文選取的RBF核函數(shù)較為合適。
本文利用相關(guān)分析、機(jī)理分析和主成分分析選出影響電站鍋爐NOX含量的輔助變量,使得輔助變量的選取更加具有統(tǒng)計(jì)意義。由于現(xiàn)場檢測NOX含量分析儀具有一定的延時特性,在數(shù)據(jù)處理時增加時序變換,使建立的模型更加符合實(shí)際情況。仿真結(jié)果顯示利用回歸型支持向量機(jī)(SVR)建立的預(yù)測模型具有很好的精度和泛化能力。本文提出的軟測量模型能夠及時反映并預(yù)測NOX含量,為解決火電廠SCR反應(yīng)器入口NOX含量難以實(shí)時在線測量的問題提供了參考,而且可以拓展應(yīng)用到火電廠煙氣含氧量、鍋爐爐膛溫度、排放煙氣含濕量等問題,甚至可以應(yīng)用到工業(yè)上,尤其是小樣本數(shù)據(jù)的,很多難以實(shí)時在線測量數(shù)據(jù)的問題。