牛培峰, 劉 超, 李國強(qiáng), 張維平, 陳科
(1.燕山大學(xué)工業(yè)計算機(jī)控制工程河北省重點(diǎn)實驗室,河北秦皇島066004;2.國家冷軋板帶裝備及工藝工程技術(shù)研究中心,河北秦皇島066004;3.秦皇島職業(yè)技術(shù)學(xué)院機(jī)電工程系,河北秦皇島066100)
基于雙層聚類與GSA-LSSVM的汽輪機(jī)熱耗率多模型預(yù)測
牛培峰1,2, 劉超1, 李國強(qiáng)1, 張維平3, 陳科1
(1.燕山大學(xué)工業(yè)計算機(jī)控制工程河北省重點(diǎn)實驗室,河北秦皇島066004;2.國家冷軋板帶裝備及工藝工程技術(shù)研究中心,河北秦皇島066004;3.秦皇島職業(yè)技術(shù)學(xué)院機(jī)電工程系,河北秦皇島066100)
針對單模型難以精確描述具有復(fù)雜非線性特性的汽輪機(jī)熱耗率的問題,提出一種新的熱耗率多模型建模方法。首先應(yīng)用GK算法分析出最優(yōu)聚類個數(shù)以及初始聚類中心,避免了聚類數(shù)確定的盲目性;然后利用核模糊C均值算法對熱耗率樣本集做出聚類劃分,在每個子空間中利用最小二乘支持向量機(jī)(LSSVM)辨識出相應(yīng)子模型,同時,為了保證子模型精確度,采用引力搜索算法來解決LSSVM參數(shù)優(yōu)化問題;最后,將子模型通過隸屬度值加權(quán)融合得到精確的熱耗率預(yù)測模型。以某600MW超臨界汽輪機(jī)組為研究對象,基于現(xiàn)場數(shù)據(jù)建立汽輪機(jī)熱耗率預(yù)報模型,仿真結(jié)果驗證了提出的多模型建模方法具有較高的預(yù)報精確度和泛化能力。
多模型;熱耗率;引力搜索算法;最小二乘支持向量機(jī);聚類
精確的汽輪機(jī)熱耗率值對于火電廠安全、穩(wěn)定、高效運(yùn)行具有重要意義。針對熱耗率及其影響因素之間的非線性關(guān)系,一種可行的方法是采用回歸方法來計算熱耗率。文獻(xiàn)[1]采用偏最小二乘算法預(yù)測熱耗率值,文獻(xiàn)[2]采用BP神經(jīng)網(wǎng)絡(luò)分析汽輪機(jī)特性,王雷等人提出基于支持向量機(jī)的熱耗率預(yù)測模型[3-4],這些方法在一定程度上取得了較好的預(yù)報精確度。然而,隨著機(jī)組工作在變負(fù)荷狀態(tài)下,且具有周期性重復(fù)運(yùn)行特點(diǎn),單一模型很難精確描述其特性[5]。近來,基于分解-合成的多模型建模策略在解決復(fù)雜工業(yè)過程控制問題中取得了成功應(yīng)用[6]。因此,采用多模型建模策略建立熱耗率模型無疑是非常適宜的。
核模糊C均值(kernel fuzzy c-means,KFCM)是一種常用的聚類方法[7],然而,KFCM一般要求事先給定聚類個數(shù)c,c的大小和初始聚類中心直接影響聚類精度。由于Gustafson-Kessel(G-K)算法是基于協(xié)方差矩陣加權(quán)的自適應(yīng)距離度量,它對初始聚類中心敏感性較差?;诖耍疚奶岢龌贕-K算法的KFCM雙層聚類算法,以解決KFCM的不足。
針對各個子系統(tǒng),采用最小二乘支持向量機(jī)(least square support vector machine,LSSVM)[8]建立局部模型,然而,正規(guī)化參數(shù)和核參數(shù)是影響LSSVM模型精度的關(guān)鍵參數(shù)。引力搜索算法(gravitational search algorithm,GSA)[9]是一種新的智能優(yōu)化技術(shù),因其具有結(jié)構(gòu)簡單、易于實現(xiàn)、優(yōu)化速度快的優(yōu)點(diǎn)而得到廣泛應(yīng)用[10-11],因此,本文采用GSA算法解決LSSVM參數(shù)優(yōu)化問題。最后,建立了某600MW超臨界汽輪機(jī)組熱耗率,仿真結(jié)果驗證了該方法的有效性。
1.1核模糊C均值聚類
假設(shè)樣本集xi∈Rm,(i=1,2,…,N),樣本分類數(shù)為c,利用高斯核函數(shù)將樣本從輸入空間映射到特征空間F進(jìn)行聚類。高斯核函數(shù)定義為
式中,σ為核函數(shù)寬度,其K(x,x)=1。
在F空間,聚類損失函數(shù)定義如下
式中:vi為第i個聚類中心;m>1為常數(shù);μik表示第k個樣本屬于第i類的隸屬度,滿足約束條件
以式(3)為約束條件,利用拉格朗日乘數(shù)法求解minJ,得到隸屬度μik和聚類中心v的迭代式
1.2雙層聚類算法
KFCM對聚類個數(shù)和初始聚類中心比較敏感。而G-K算法是基于協(xié)方差矩陣加權(quán)的自適應(yīng)距離度量,它對聚類中心初始值敏感性較差。因此,提出基于G-K算法的雙層聚類。首先利用G-K算法根據(jù)聚類有效性指標(biāo)初始分析數(shù)據(jù)樣本,計算出最優(yōu)聚類個數(shù)c和初始聚類中心vi;然后,利用KFCM算法將整個樣本集劃分為不同工況的子系統(tǒng)。聚類性能指標(biāo)partition idex(SC)[12]和Xie-Beni(XB)[13]可以定義為
式中:SC指標(biāo)反映了分類簇的緊湊程度,SC越小意味著劃分越緊湊;XB指標(biāo)反映了簇內(nèi)的緊致性和簇間的分離性;分子用于評價簇內(nèi)的緊致性,分母用于評價簇間的分離性;XB越小,表明聚類效果越好。
2.1模型結(jié)構(gòu)
采用LSSVM建立子模型,模型表達(dá)式為
式中:K(xi,x)為核函數(shù),b為偏置。
常見核函數(shù)有多項式核函數(shù)、sigmoidal核函數(shù)、RBF核函數(shù)等。選用RBF核函數(shù),其表示為
式中σ為核寬度。
2.2GSA優(yōu)化的LSSVM
正規(guī)化參數(shù)C和核參數(shù)σ2是影響LSSVM模型精確度的關(guān)鍵參數(shù),采用GSA算法解決LSSVM參數(shù)選擇的問題,其具體優(yōu)化步驟如下:
2)計算質(zhì)點(diǎn)的適應(yīng)值fiti(t),i=1,…,N;
3)選取fitness={fiti}向量中值最小的質(zhì)點(diǎn),并記錄其位置Lbest和適應(yīng)值Fbest;
4)依據(jù)式(10)計算每個質(zhì)點(diǎn)的質(zhì)量
5)計算質(zhì)點(diǎn)的加速度。t時刻,在第d維上,質(zhì)點(diǎn)j對質(zhì)點(diǎn)i的引力為
式中:Mi(t)和Mj(t)為質(zhì)點(diǎn)i和j的質(zhì)量;ε為較小常量;Rij(t)=‖Xi(t),Xj(t)‖2;G(t)為引力常量。
質(zhì)點(diǎn)i在d維空間受到總的引力為
式中:randj的范圍是[0,1]。質(zhì)點(diǎn)i的加速度為
6)各質(zhì)點(diǎn)按式(14)、式(15)進(jìn)行位置更新
7)返回步驟2),直到達(dá)到最大循環(huán)次數(shù)max_it結(jié)束循環(huán)。Lbest中保持著最優(yōu)的C和σ2。
考慮熱耗率樣本集:D={Xk,Y|Xk∈Rm},Xk為第k個輸入向量,m為向量的特征數(shù);Y為熱耗率。圖1為熱耗率建模流程圖,其建模步驟如下:
1)初始化聚類參數(shù)c和vi。vi為KFCM的初始聚類中心,其值為GK聚類得到的聚類中心;
2)通過KFCM優(yōu)化聚類中心和隸屬度μik,進(jìn)行熱耗率樣本的聚類劃分:按式(4)、式(5)更新隸屬度和聚類中心,直至隸屬度穩(wěn)定,并保存隸屬度μik;
3)建立局部模型。對聚類子樣本Cluster samples采用引力搜索算法優(yōu)化的LSSVM建立c個子模型;
4)采用隸屬度值ui融合子模型。
5)利用多模型建模方法對測試樣本進(jìn)行辨識。
圖1 熱耗率多模型建模流程Fig.1 Flow chart of multi-models modeling for heat rate
4.1熱耗率數(shù)據(jù)
汽輪機(jī)熱耗率是指汽輪發(fā)電機(jī)組每發(fā)1kWh的電能所消耗的熱量。影響汽輪機(jī)熱耗率有兩大因素:1)汽輪機(jī)“健康狀況”,2)機(jī)組的運(yùn)行參數(shù)。汽輪機(jī)運(yùn)行數(shù)據(jù)中充分包含了在不同工況范圍內(nèi)的動態(tài)特性信息,也蘊(yùn)含有汽輪機(jī)“健康狀況”信息。以某火電廠600 MW超臨界汽輪機(jī)組(CLN600-24. 2/566/566 MW)為研究對象,其中289組數(shù)據(jù)樣本是由集散控制系統(tǒng)中每隔1小時采樣一次而得,數(shù)據(jù)樣本是在312.4 MW到564.9 MW之間,表1為部分?jǐn)?shù)據(jù)列表。將其中覆蓋機(jī)組各種典型運(yùn)行工況的217組樣本用來訓(xùn)練模型,另外72組樣本用來預(yù)測模型。汽輪機(jī)熱耗率非線性模型為:
Hr=f(Pe,Pzk,P0,T0,D0,Pzl,…,Tzj,Dzj)。(17)其中,Hr為熱耗率,KJ/kWh;Pe為發(fā)電機(jī)輸出功率,MW;Pzk為凝汽器真空值,KPa;(P0,T0,D0)、(Pzl,Tzl,Dzl)、(Pzr,Tzr,Dzr)、(Pfw,Tfw,Dfw)、(Pgl,Tgl,Dgl)和(Pzj,Tzj,Dzj)分別為主蒸汽、再熱蒸汽入口、再熱蒸汽出口、給水、過熱減溫水和再熱減溫水壓力(MPa),溫度(℃),流量(t/h)。
4.2數(shù)據(jù)聚類
通過聚類有效性指標(biāo)來優(yōu)化確定最佳聚類數(shù)c,即給定樣本的聚類數(shù)范圍c∈[2,14],針對不同聚類數(shù)c分別對熱耗率樣本進(jìn)行聚類,并計算出相應(yīng)指標(biāo)SC和XB。在G-K算法中,設(shè)定m=2,ε= 0.001,圖2為有效性指標(biāo)曲線。
表1 熱耗率回歸建模部分原始數(shù)據(jù)Table 1 Part of the original data of heat rate regression modeling
圖2 有效性指標(biāo)曲線Fig.2 Curve of validity index
圖3 損失函數(shù)J的曲線Fig.3 Curve of loss function J
從圖2中可知,當(dāng)c=5時,有效性指標(biāo)SC趨于穩(wěn)定,XB幾乎沒有下降,于是確定最優(yōu)聚類個數(shù)c=5,并保存初始聚類中心v。圖3是損失函數(shù)J的曲線,在循環(huán)60次時,J基本保持穩(wěn)定。最終將熱耗率數(shù)據(jù)集按負(fù)荷聚類為 488 MW、527 MW、440 MW、375 MW、320 MW 5種子集。
4.3熱耗率預(yù)測結(jié)果分析
采用提出的多模型建模方法預(yù)測汽輪機(jī)熱耗率,圖4為多模型建模方法預(yù)測熱耗率結(jié)果,不難發(fā)現(xiàn)該方法能夠較好的預(yù)測多工況熱耗率。圖5為多模型與單一LSSVM模型預(yù)測誤差,多模型誤差范圍在[-40,40]/(kJ/kWh),波動比較小;單一模型誤差范圍在[-70,70]/(kJ/kWh),誤差比多模型大,并且離散程度也大于多模型,很明顯熱耗率多模型建模方法優(yōu)于單一LSSVM模型。
圖4 多模型辨識輸出曲線Fig.4 Multi-model identification output curve
圖5 基于多模型與單一LSSVM模型的熱耗率預(yù)測誤差Fig.5 Heat rate prediction errors based on the multimodel and the single LSSVM methods
為了進(jìn)一步驗證建模方法的有效性,采用標(biāo)準(zhǔn)LSSVM與雙層聚類多模型預(yù)測熱耗率,記為多模型A;采用GSA優(yōu)化的LSSVM與KFCM進(jìn)行熱耗率多模型建模,記為多模型B;同時,LSSVM單模型和BP神經(jīng)網(wǎng)絡(luò)也用于熱耗率建模。將提出的多模型建模方法與上述4種建模方法進(jìn)行仿真實驗對比,結(jié)果如表2、表3所示。其中mre/%為最大相對誤差、maxe/(kJ/kWh)為最大絕對誤差、mse/(kJ/kWh)為標(biāo)準(zhǔn)差。
表2 針對訓(xùn)練集的模型測試結(jié)果比較Table 2 Comparison of the model test results for training set
表3 針對測試集的模型測試結(jié)果比較Table 3 Comparison of the model test results for testing set
針對訓(xùn)練集,從表2中可以看出多模型三個性能指標(biāo)分別為0.434 9%、35.682 1 kJ/kWh、5.650 9 kJ/kWh,均優(yōu)于其它4個熱耗率預(yù)測模型,尤其是最大絕對誤差maxe指標(biāo),未經(jīng)GSA優(yōu)化的多模型A為54.566 1 kJ/kWh,未經(jīng)雙層聚類分析樣本的多模型B為51.445 59 kJ/kWh,單一LSSVM模型為66.895 1 kJ/kWh,BP網(wǎng)絡(luò)高達(dá)97.498 5 kJ/kWh。
表3為5個模型辨識測試樣本的性能指標(biāo),多模型預(yù)測誤差最小,特別是mse僅為9.33 kJ/kWh,泛化能力最好;由于多模型A沒有經(jīng)過GSA優(yōu)化處理,多模型B沒有經(jīng)過雙層聚類事先分析出最優(yōu)聚類個數(shù),其泛化能力次之;單一LSSVM模型和BP網(wǎng)絡(luò)模型的預(yù)測能力較差。表3中多模型預(yù)測的3個誤差指標(biāo)分別為0.489 4%、37.571 7 kJ/kWh和9.33 kJ/kWh,與表2中數(shù)據(jù)比較,并未有較大增加,從而說明提出的建模方法更適合復(fù)雜非線性熱耗率建模。
為更好說明雙層聚類和GSA優(yōu)化LSSVM參數(shù)的優(yōu)越性,采用三種多模型建模方法分別預(yù)測72組測試樣本,結(jié)果如圖6所示??梢钥闯?,在子模型建模中,如果沒有采用GSA優(yōu)化LSSVM參數(shù)(多模型A),或者采用模型B預(yù)測熱耗率,其預(yù)測誤差均明顯大于多模型建模方法。從圖6中看出多模型預(yù)測誤差的波動范圍也是最小的。因此,提出的多模型建模方法能夠有效的預(yù)測汽輪機(jī)熱耗率。
圖6 熱耗率預(yù)測誤差曲線Fig.6 Curves of heat rate prediction errors
針對汽輪機(jī)熱耗率建模中的多變量、非線性、工況范圍廣的特點(diǎn),提出一種基于雙層聚類與GSA優(yōu)化的LSSVM汽輪機(jī)熱耗率多模型建模方法。該方法的優(yōu)化建模過程如下:1)基于G-K雙層聚類算法將熱耗率樣本集劃分為5類子系統(tǒng);2)對各個子系統(tǒng),采用GSA優(yōu)化的LSSVM建立局部模型;3)根據(jù)隸屬度值,將各局部模型進(jìn)行加權(quán)組合便得出汽輪機(jī)熱耗率的辨識模型。最后以某600 MW超臨界汽輪機(jī)組熱耗率為建模對象,仿真結(jié)果驗證了提出的多模型建模方法的有效性,該方法為復(fù)雜非線性、多工況的熱耗率建模提供了一個可行思路。
[1]張文琴,付忠廣,靳濤,等.基于偏最小二乘算法的熱耗率回歸分析[J].現(xiàn)代電力,2009,26(5):56-59. ZHANG Wenqin,F(xiàn)U Zhongguang,JIN Tao,et al.Heat rate regression analysis based on partial least squares algorithm[J].Modern Electric Power,2009,26(5):56-59.
[2]李勇,王海榮.基于BP網(wǎng)絡(luò)的汽輪機(jī)運(yùn)行特性方程[J].熱能動力工程,2002,17(3):268-270. LI Yong,WANG Hairong.Steam turbine operation characteristics equation based on BP neural network[J].Journal of Engineering for Thermal Energy&Power,2002,17(3):268-270.
[3]王雷,張欣剛,王洪躍.基于支持向量回歸算法的汽輪機(jī)熱耗率模型[J].動力工程,2007,27(1):19-23. WANG Lei,ZHANG Xingang,WAHG Hongyue.Model for the turbine heat rate based on the support vector regression[J].Journal of Power Engineering,2007,27(1):19-23.
[4]NIU Peifeng,ZHANG Weiping.Model of turbine optimal initial pressure under off-design operation based on SVR and GA[J]. Neurocomputing,2012,78(1):64-71.
[5]孫建平,苑一方.復(fù)雜過程的多模型建模方法研究[J].儀器儀表學(xué)報,2011,32(1):132-137. SUN Jianping,YUAN Yifang.Multi-model modeling approach for complex process[J].Chinese Journal of Scientific Instrument,2011,32(1):132-137.
[6]李衛(wèi),楊煜普,王娜.基于核模糊聚類的多模型LSSVM回歸建模[J].控制與決策,2008,23(5):560-563. LI Wei,YANG Yupu,WANG Na.Multi-model LSSVM regression modeling based on kernel fuzzy clustering[J].Control and Decision,2008,23(5):560-563.
[7]WANG Ping,TIAN Jinwen,GAO Chenqiang.Infrared small target detection using directional highpass filters based on LS-SVM[J]. Electronics Letters,2009,45(3):156-158.
[8]張曉平,趙珺,王偉,等.轉(zhuǎn)爐煤氣柜位的多輸出最小二乘支持向量機(jī)預(yù)測[J].控制理論與應(yīng)用,2010,27(11):1463 -1470. ZHANG Xiaoping,ZHAO Jun,WANG Wei,et al.Multi-output least squares support vector machine for level prediction in Linz Donaniz gas holder[J],Control Theory&Applications,2010,27 (11):1463-1470.
[9]RASHEDI E,NEZAMABADI-POUR H,SARYAZDI S.GSA:A gravitational search algorithm[J].Information Sciences,2009,179(13):2232-2248.
[10]DUMAN S,YUSUF S.Optimal power flow using gravitational search algorithm[J].Energy Conversion and Management,2012,59:86-95.
[11]HOSSEINABADI A R,YAZDANPANAH M.A new search algorithm for solving symmetric traveling salesman problem based on gravity[J].World Applied Sciences Journal,2012,16(10):1387 -1392.
[12]BENSAID A M,HALL L O,BEZDEK J C,et al.Validity-guided (Re)clustering with applications to image segmentation[J]. IEEE Transactions on Fuzzy Systems,1996,4(2):112-123.
[13]李超順,周建中,肖劍,等.基于引力搜索核聚類算法的水電機(jī)組振動故障診斷[J].中國電機(jī)工程學(xué)報,2013,33(2):98 -104. LI Chaoshun,ZHOU Jianzhong,XIAO Jian,et al.Vibration fault diagnosis of hydroelectric generating unit using gravitational search based kernel clustering method[J].Proceedings of the CSEE,2013,33(2):98-104.
(編輯:賈志超)
Multi-model for turbine heat rate forecasting based on double layer clustering algorithm and GSA-LSSVM
NIU Pei-feng1,2, LIU Chao1, LI Guo-qiang1, ZHANG Wei-ping3, CHEN Ke1
(1.Key Lab of Industrial Computer Control Engineering of Hebei Province,Yanshan University,Qinhuangdao 066004,China;2.National Engineering Research Center for Equipment and Technology of Cold Strip Rolling,Qinhuangdao 066004,China;3.Department of Electromechanical Engineering,Qinhuangdao Institute of Technology,Qinhuangdao 066100,China)
Aiming at the issue that the characteristic of complex nonlinearity of heat rate for steam turbine which was difficult to be descript accurately by the single-model,a new multi-model modeling method for heat rate was presented.Firstly,the initial cluster centers and optimized cluster numbers were obtained by the G-K algorithm.Then,the data set was clustered into several local regions with kernel-based fuzzy C-means clustering algorithm.In addition,the sub-model was built by least square support vector machine(LSSVM).Moreover,in order to guarantee accuracy of each sub-model,gravitational search algorithm was employed to solve parameter optimization problem of LSSVM.Finally,towards obtaining accurate predictions over the entire operating range,a degree of membership composition strategy to aggregate the local model predictions was proposed.A 600 MW steam turbine unit was used as the identification object,and multi-model for heat rate was established based on field data.Simulation results show that the multi-model modeling method has well regression precision and generalization ability.
multi-model;heatrate;gravitationalsearchalgorithm;leastsquaresupportvector machine;cluster
10.15938/j.emc.2016.03.014
TP 18
A
1007-449X(2016)03-0090-06
2014-07-18
國家自然科學(xué)基金(61403331,61573306);河北省自然科學(xué)基金(F2010001318)
牛培峰(1963—),男,教授,博士生導(dǎo)師,研究方向為復(fù)雜工業(yè)系統(tǒng)的建模、控制與燃燒優(yōu)化;
劉超(1986—),男,博士研究生,研究方向為復(fù)雜工業(yè)系統(tǒng)的智能建模與優(yōu)化控制;
李國強(qiáng)(1984—),男,博士,研究方向為人工智能與燃燒優(yōu)化;
張維平(1980—),女,博士,研究方向為汽輪機(jī)運(yùn)行優(yōu)化;
陳科(1990—),男,碩士研究生,研究方向為汽輪機(jī)初壓優(yōu)化。
劉超