牛培峰, 劉 超, 李國強, 馬云飛, 陳貴林, 張先臣
(1.燕山大學工業(yè)計算機控制工程河北省重點實驗室,河北秦皇島066004;2.國家冷軋板帶裝備及工藝工程技術(shù)研究中心,河北秦皇島066004)
汽輪機熱耗率多模型建模方法研究
牛培峰1,2, 劉 超1, 李國強1, 馬云飛1, 陳貴林1,2, 張先臣1,2
(1.燕山大學工業(yè)計算機控制工程河北省重點實驗室,河北秦皇島066004;2.國家冷軋板帶裝備及工藝工程技術(shù)研究中心,河北秦皇島066004)
針對汽輪機熱耗率難以準確計算的問題,提出了核模糊c均值與混合蛙跳算法優(yōu)化最小二乘支持向量機(LS-SVM)的汽輪機熱耗率多模型建模方法,用來計算不同工況下的熱耗率。該方法利用核模糊c均值算法對熱耗率數(shù)據(jù)聚類,采用5折交叉驗證平均誤差作為LS-SVM參數(shù)選擇的適應度值,利用混合蛙跳算法優(yōu)化參數(shù)并建立局部模型,采用開關(guān)切換得到模型輸出,以此實現(xiàn)熱耗率的多模型建模。與單一的LS-SVM模型和BP網(wǎng)絡(luò)熱耗率預測模型比較,結(jié)果表明該多模型方法有更高的預測精確和更好的泛化能力,能更準確地計算汽輪機熱耗率。
計量學;汽輪機熱耗率;混合蛙跳算法;多模型建模;最小二乘支持向量機;核模糊c均值
汽輪機組的熱耗率是衡量火電機組運行經(jīng)濟性的重要技術(shù)指標,降低機組的熱耗率在建立發(fā)電廠安全、經(jīng)濟、可靠運行系統(tǒng)以及在電力市場化,競價上網(wǎng)的成本核算體系中有重要的指導作用。核心問題便是如何精確地計算機組熱耗率。一種可行辦法是利用回歸方法得到各個運行工況下熱耗率與有關(guān)熱力參數(shù)之間的關(guān)系模型,在運行中將某工況的有關(guān)參數(shù)代入已建立好的模型中,即可得到汽輪機熱耗率的實時計算值[1]。
回歸建模方法主要有神經(jīng)網(wǎng)絡(luò)、支持向量機等。人工神經(jīng)網(wǎng)絡(luò)[2,3]由于是基于經(jīng)驗風險最小化,存在著難以克服的缺點,在缺少樣本的情況下,訓練的模型泛化能力不強。而支持向量機(SVM)是建立在結(jié)構(gòu)風險最小理論基礎(chǔ)上的學習機[4~6],相對神經(jīng)網(wǎng)絡(luò),SVM具有嚴格的理論和數(shù)學基礎(chǔ),能較好地解決小樣本等實際問題。最小二乘支持向量機(Least square support vector machine,LS-SVM)是標準SVM的一種變體[7],它將求解二次規(guī)劃問題轉(zhuǎn)化為求解線性方程以提高運算速度。采用混合蛙跳算法[8]調(diào)整LS-SVM的正規(guī)化參數(shù)和核參數(shù),可以提高模型預測精度。由于機組的負荷率有較大的動態(tài)變化范圍,采用單一LS-SVM模型難以精確描述熱耗率特性;而多模型建模時,各個子模型是相對獨立的,無論在模型精度還是預測精度均要優(yōu)于單模型[9]。
根據(jù)上述分析,本文提出汽輪機熱耗率多模型建模方法。首先采用核模糊c均值對熱耗率樣本進行聚類劃分;然后,用蛙跳算法優(yōu)化的LS-SVM對各子類分別建立局部模型;最后,采用開關(guān)切換得到模型輸出。仿真實驗表明,該方法能有效預測汽輪機熱耗率。
模糊c均值是一種廣泛應用的聚類算法,由于其對邊緣點和對非線性問題處理不是很理想,計算過程易陷入局部最優(yōu),本文采用核模糊c均值對熱耗率數(shù)據(jù)在高維空間進行聚類劃分。
假設(shè)數(shù)據(jù)樣本{(x1,y1),…,(xn,yn)}?Rm× R,n為樣本數(shù)量。數(shù)據(jù)樣本通過一個非線性映射φ:x→F,將輸入空間Rm映射為高維特征空間F:(x∈Rm→φ(x)∈Rq,q>m),并在特征空間F內(nèi)進行模糊c均值聚類,把熱耗率數(shù)據(jù)聚類劃分成c類。
在特征空間F中定義核函數(shù)K(x,y),文中核函數(shù)選用高斯核函數(shù)。則F空間中點積就用輸入空間的核K(x,y)函數(shù)來表示
其K(x,x)=1,F(xiàn)空間的歐式距離為
在F空間的聚類價值函數(shù)可以表示為
式中,m∈[1,∞)為一個加權(quán)指數(shù);φ(xk)和φ(vi)為映射到高維空間的數(shù)據(jù)樣本和聚類中心;uik為第k個樣本屬于第i類的隸屬度,uik必須滿足
在式(5)的約束下,令?Jm/?vi=0和?Jm/?ui(xk)=0,可得u、v的更新式
支持向量機是建立在VC維理論和結(jié)構(gòu)風險最小原理上的學習機,它能夠有效地抑制模型建立過程中欠學習和過學習現(xiàn)象。LS-SVM是標準SVM的一種變體,LS-SVM以等式約束代替?zhèn)鹘y(tǒng)支持向量機的不等式約束,將求解二次規(guī)劃問題轉(zhuǎn)化為求解線性方程組。LS-SVM優(yōu)化目標可表示為
式中,w為權(quán)向量;b為偏置;φ(x)為將輸入空間映射到高維特征空間的非線性映射。
定義拉格朗日函數(shù)為
式中,ai為Lagrange乘子。
分別求L(w,b,a,ξ)對w,b,a,ξ的偏微分,可以得到式(10)的最優(yōu)條件
優(yōu)化問題最終轉(zhuǎn)化為求解方程組
式中,y=[y1,…,yn]T,I=[1,…,1]T,a=[a1,…,an]T,Z=[φ(x1),…,φ(xn)]T。
解方程(11)可以得到最小二乘支持向量機系數(shù)w和b,進而得到LS-SVM回歸函數(shù)
核函數(shù)的引入,巧妙地消除了高維空間直接求內(nèi)積的“維數(shù)災難”的問題。本文選用RBF核函數(shù)
由上可見,模型的精度和預測能力主要由參數(shù)C和核參數(shù)δ2決定。其中,C在于調(diào)節(jié)置信范圍和經(jīng)驗風險的比例,核參數(shù)δ2主要影響樣本數(shù)據(jù)在高維特征空間中的分布復雜程度。
LS-SVM參數(shù)選擇過程本質(zhì)上是一個優(yōu)化搜索過程,搜索空間的每個點均為最佳參數(shù)的一個潛在解。本文利用混合蛙跳算法強勁的全局搜索能力實現(xiàn)模型參數(shù)的優(yōu)化。
4.1 蛙跳算法
蛙跳算法(SFLA)是Eusuff和Lansey提出的一種全新的后啟發(fā)優(yōu)化算法[8]。局部搜索和全局信息交換使該算法具有高效的計算性能和優(yōu)良的全局搜索能力。假設(shè)由N個青蛙構(gòu)成的種群{Xi|Xi=(xi1,…,xis)},其中s為解空間的維數(shù)。根據(jù)式(14)計算適應度f(xi)
將個體按適應度降序排序,然后將整個種群按式(15)劃分為m個子群,每個子群包含n=N/m只青蛙。
然后,在每個子群中分別執(zhí)行局部搜索策略,按照式(16)和(17)更新子群中適應度最差的個體。
式中,Xb和Xw為適應度最好和最差的個體;di為個體的調(diào)整矢量;dmax為允許青蛙個體最大步長。在迭代中,如果更改后的new Xw的適應度比old Xw好,則其取代最差的個體;否則,用全局適應度最好的個體Xg替換式(16)中的Xb,重新執(zhí)行式(16)、(17)。如果適應度還未提高,則隨機產(chǎn)生一個個體。
執(zhí)行完局部搜索后,將各子群個體混合在一起,更新全局最優(yōu)個體,并按照式(15)重新劃分,重復上述的局部進化搜索,直到終止條件滿足為止。
4.2 SFLA優(yōu)化LS-SVM的參數(shù)
SFLA算法采用實值編碼,本文選用5折交叉驗證平均誤差作為LS-SVM參數(shù)選擇的適應度值。圖1為用混合蛙跳算法優(yōu)化LS-SVM參數(shù)的示意圖。
(1)設(shè)置初始值:種群規(guī)模、迭代次數(shù)、終止條件、(C,δ2)取值范圍分別設(shè)為[0.1,1000]和[0.1,1000]。
(2)將具有n個熱耗率訓練樣本(xi,i=1,2,…,n),隨機分成5個數(shù)據(jù)集合S1,…,S5。
(3)計算5折交叉驗證誤差:初始化i=1,取第i個集合Si作校驗集合,其余合并作訓練集合,根據(jù)當前的(C,δ2)訓練LS-SVM,按式(18)計算泛化誤差
圖1 混合蛙跳算法優(yōu)化LS-SVM的參數(shù)
式中,yj和fj分別為真實值和預測值;m為校驗集中數(shù)據(jù)樣本的個數(shù)。令i=i+1,重復直至i=5。
(4)5次泛化誤差的平均值作為混合蛙跳算法的適應度值J(xi),然后利用SFLA搜索更好的(C,δ2)。
5.1 熱耗率多模型思路
熱耗率多模型建??傮w結(jié)構(gòu)見圖2。算法分為3層:第1層把采集到的汽輪機熱耗率數(shù)據(jù)用核模糊c均值算法聚類,得到聚類中心v和隸屬度U,然后再按照各個樣本的隸屬度大小將數(shù)據(jù)劃分成c個子類樣本;第2層用混合蛙跳算法優(yōu)化的LS-SVM對各個子類建立局部模型;第3層根據(jù)開關(guān)切換準則得到最終模型的輸出。在對測試集預測時,首先在n維空間中定義測試樣本點與聚類中心v的歐式距離
式中,Dij為測試樣本xj與聚類中心vi的歐式距離。
按式(19)計算測試樣本與聚類中心的歐式距離,根據(jù)最小歐式距離判別各個測試樣本所屬類。最后將測試樣本點送到所屬類對應的局部模型預測輸出。
圖2 開關(guān)切換方式的熱耗率多模型結(jié)構(gòu)
5.2 熱耗率多模型預測實例及精度驗證
5.2.1 多模型的輸入與輸出
汽輪機熱耗率及影響熱耗率的參數(shù)之間存在著強非線性關(guān)系。文獻[10]指出了超臨界凝汽式汽輪機組熱耗率計算公式,式中焓值可以通過介質(zhì)的壓力和溫度求解,故根據(jù)該公式確定熱力參數(shù)。根據(jù)這個原則選擇:Pe(發(fā)電機輸出功率,MW)和P0,T0,D0,Pzl,Tzl,Dzl,Pzr,Tzr,Dzr,Pfw,Tfw,Dfw,Pgl,Tgl,Dgl,Pzj,Tzj,Dzj等19個參數(shù)作為輸入,下標0、zl、zr、fw、gl、zj分別表示主蒸汽、再熱蒸汽入口、再熱蒸汽出口、給水、過熱減溫水、再熱減溫水的壓力 P/Mpa、溫度T/℃、流量D/t·h-1。輸出則為汽輪機熱耗率RH/kJ·(kW·h)-1。
5.2.2 熱耗率預測實例分析
表1 為在多工況下采集的某火電廠超臨界汽輪機組(CLN600-24.2/566/566 MW)的289組原始數(shù)據(jù),將其中的217組數(shù)據(jù)用來訓練模型,72組數(shù)據(jù)用來預測模型,建立多模型預測模型。核模糊聚類個數(shù)c為5,局部模型最優(yōu)的參數(shù)對見表2。為了驗證多模型的性能,與單一LS-SVM模型和BP網(wǎng)絡(luò)模型進行比較。BP網(wǎng)絡(luò)采用3層網(wǎng)絡(luò)結(jié)構(gòu):第1層19個輸入,第3層1個輸出,含有14個神經(jīng)元的隱層,訓練函數(shù)為traingdm。具體各預測模型預測結(jié)果與精度分析見圖3、圖4、圖5和表3。精度指標定義為
表1 某火電廠超臨界汽輪機組運行參數(shù)
表2 參數(shù)選擇結(jié)果
表3 各模型預測結(jié)果精度分析
圖3~圖5為各模型對測試集的預測結(jié)果,由圖可以發(fā)現(xiàn),多模型方法的預測精度高于單模型和BP網(wǎng)絡(luò)。圖6為測試集的各模型預測誤差曲線,由圖可以看出,多模型預測誤差明顯小于單模型預測誤差和BP神經(jīng)網(wǎng)絡(luò)預測誤差。表3數(shù)據(jù)顯示,無論對訓練樣本還是測試樣本,文中提出的方法的emax、emean和es均優(yōu)于單一LS-SVM和BP網(wǎng)絡(luò)。尤其是es指標,表明多模型預測誤差波動范圍小,更能適合工況范圍大的建模。實驗結(jié)果表明,文中提出的多模型建模方法能進一步提高軟測量模型的精度,能較好地預測熱耗率。
圖3 單LS-SVM模型預測結(jié)果
圖4 BP網(wǎng)絡(luò)模型預測結(jié)果
圖5 多模型預測結(jié)果
熱耗率與影響它的因素之間是一種高度非線性關(guān)系,其工況變換范圍較大,基于核模糊c均值和SFLA優(yōu)化的LS-SVM的熱耗率多模型能根據(jù)測試樣本所屬類進行對測試數(shù)據(jù)的輸出預測,并且多模型可以為各個工況建立子模型,這樣提高了整體的預測精度。仿真實驗充分表明:該方法能更加有效、精確地描述熱耗率特性,能夠滿足工業(yè)生產(chǎn)的需求,具有很好的推廣價值。
]
[1] 王雷,張欣剛,王洪躍,等.基于支持向量回歸算法的汽輪機熱耗率模型[J].動力工程,2007,27(1):19-23.
[2] 陳鴻偉,劉煥志,李曉偉,等.雙循環(huán)流化床顆粒循環(huán)流率試驗與BP神經(jīng)網(wǎng)絡(luò)預測[J].中國電機工程學報,2010,30(32):25-29.
[3] 李巖,王東風,焦嵩鳴,等.采用微分進化算法和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的熱工過程模型辨識[J].中國電機工程學報,2010,30(8):110-116.
[4] Vapnik V.The nature of statistical learning theory[M].New York:Springer,1995.
[5] 葉林,劉鵬.基于經(jīng)驗模態(tài)分解和支持向量機的短期風電功率組合預測模型[J].中國電機工程學報,2011,31(31):102-108.
[6] Liu G H,Zhou DW,Xu H X,etal.Model optimization of SVM for a fermentation soft sensor[J].Expert Systems with Applications,2010,37(4):2708-2713.
[7] Wang P,Tian J W,Gao C Q.Infrared small target detection using directional highpass filters based on LSSVM[J].Electronics Letters,2009,45(3):156-158.
[8] Eusuff M,Lansey K,Pasha F.Shuffled frog-leaping algorithm:a memetic meta-heuristic for discrete optimization[J].Engineering Optimization,2006,38(2):129-54.
[9] 王洋課.基于聚類的多模型軟測量技術(shù)的研究[D].南京:東南大學,2010.
[10] Niu P F,Zhang W P.Model of turbine optimal initial pressure under off-design operation based on SVR and GA[J].Neurocomputing,2012,78(1):64-71.
Investigation on Multi-modelModeling Method of Steam Turbine Heat Rate
NIU Pei-feng1,2, LIU Chao1, LIGuo-qiang1, MA Yun-fei1, CHEN Gui-lin1,2, ZHANG Xian-chen1,2
(1.Key Lab of Industrial Computer Control Engineering of Hebei Province,Yanshan University,Qinhuangdao,Hebei066004,China;2.National Engineering Research Center for Equipment and Technology of Cold Strip Rolling,Qinhuangdao,Hebei066004,China)
Taking into account the problem that the heat rate of steam turbine is difficult to accurately calculate,a novel heat rate multi-model soft measurement methodology based on kernel fuzzy c-means and shuffled frog-leaping algorithm optimized least squares support vectormachine(LS-SVM is proposed),which is employed to calculate the heat rate under differentworking conditions.Thismethod applies kernel fuzzy c-means algorithm clustering heat rate data.Taking themean error of5-fold cross-validation as fitness value of parameters selection for LS-SVM,LS-SVM based on SFLA is trained and established localmodel for each cluster,and then themodel output is obtained by the switch way,so as to realize the heat ratemulti-modelmethod.Compared with the single LS-SVM model and BP network heat rate prediction model,the multimodel has a higher prediction accuracy and better generalization ability.
Metrology;Heat rate of steam turbine;Shuffled frog-leaping algorithm;Multi-model modeling;Least square support vectormachine;Kernel fuzzy c-means algorithm
TP941
:A
:1000-1158(2015)03-0251-05
10.3969/j.issn.1000-1158.2015.03.07
2012-08-25;
:2015-02-13
國家自然科學基金(60774028);河北省自然科學基金(F2010001318)
牛培峰(1958-),男,吉林舒蘭人,燕山大學教授,博士生導師,主要研究方向為復雜工業(yè)系統(tǒng)的智能建模與智能控制及流程工業(yè)綜合自動化。npf882000@163.com