張 艦,李郁俠
(西安理工大學 水利水電學院,西安710048)
齒輪箱溫度是風力發(fā)電機組狀態(tài)監(jiān)測十分重要的監(jiān)測項目,而齒輪箱溫度預測性監(jiān)測是近幾年新興的監(jiān)測方法,它對齒輪箱溫度監(jiān)測及預警起到了更好的效果,是未來齒輪箱監(jiān)測的發(fā)展趨勢[1].
在齒輪箱溫度預測的過程中,輸入變量的選擇直接關系到預測的準確性.在國內外文獻中,對于溫度預測過程中的輸入變量選擇問題研究較少,一般都是通過直接選取來確定.如文獻[2]中在建模時直接通過經驗選取了機組功率、環(huán)境溫度、齒輪箱軸承溫度以及機艙溫度作為建模的輸入變量;文獻[3]中在建模時選擇了齒輪箱軸承溫度、發(fā)電機功率以及機艙溫度直接作為建模的輸入變量,這樣選擇的輸入變量在預測時存在局限性,并不能適應所有機組的狀況,所得出的預測結果必然不是最優(yōu)的,因此通過經驗直接選取輸入變量并不具有科學性;文獻[4]也僅僅應用了相關分析法這種比較簡單的輸入變量選擇方法,容易漏選一些重要的輸入變量.因此,在齒輪箱溫度預測中引入科學的輸入變量選擇方法,是當前應該主要解決的問題.目前輸入變量選擇的方法十分繁多,相關分析法[5]、相空間嵌入法[6]、回歸分析法[7]、正交最小二乘法[8]都是行之有效的方法.這幾種方法各有優(yōu)缺點,其中相關分析法和回歸分析法是常規(guī)的方法,它們可以從眾多的備選影響因素集中選出一些與期望輸出相關度大的因素作為輸入變量,由于選出的輸入變量之間一般相關度較大,可能會漏選一些重要的相關變量,因而難以取得理想的效果;相空間嵌入法則只能在負荷序列中尋找預測時刻最大的負荷點,對于環(huán)境溫度、風速等隨機的相關變量處理比較困難,需要增加時間變量和環(huán)境變量來改善預測效果.相較以上方法,文中利用正交最小二乘法(Orthogonal Leasdt Squares,OLS)對各輸入變量進行正交變化,得出各輸入變量對輸出變量的單獨貢獻,適合齒輪箱溫度預測中輸入變量的選擇.
OLS法在線性回歸模型回歸算子選擇方面具有優(yōu)異性能,已經成功應用于徑向基函數神經網絡RBF節(jié)點中心選?。?]和模糊系統(tǒng)輸入空間劃分[10]中.
輸入向量組合成的矩陣P是回歸矩陣,輸入變量的選擇為一個線性回歸模型為
式中:pi(t)為期望輸出,也稱相關變量;θi為參數;pi(t)為回歸算子.輸入變量選擇問題即在一個給定的M個備選回歸算子集合中,選擇出一組重要的回歸算子.式(1)寫成矩陣形式為
式中:A為M×M上三角矩陣,且對角元為1,A=
W為M×M矩陣,其各列正交:WTW=H,H為對角元素為h1的對角陣;
由這組正交基矢量w1張成的空間與pi張成的空間相同,故式(2)為
正交LS解為
與一般的LS方法相比,OLS方法具有一些優(yōu)越的數值性質.在實踐中,備選的輸入變量點x(t)的數量一般很龐大,輸入變量應選作數據集的一個子集;也就是說,可選用的回歸算子個數M可以很大,而我們可能只需Ms(Ms?M)個重要的回歸算子就可以得到性能令人滿意的模型了.下面介紹的一種前傳回歸方式的OLS算法就是來選擇這些重要回歸算子的,對于i=j,wi和wj正交,y(t)的能量為
在風電機組齒輪箱溫度預測的建模中,所使用的數據為SCADA系統(tǒng)中的監(jiān)測數據,SCADA系統(tǒng),即風電機組數據采集與監(jiān)視控制系統(tǒng),它是近幾年應用于風電機組的狀態(tài)監(jiān)測系統(tǒng),其主要功能為定期采集并記錄風電機組各部件或子系統(tǒng)的狀態(tài)數據,每10min記錄一次機組的參數,所記錄的參數多達幾十種.在風電機組齒輪箱的溫度預測中的輸入變量就需要在該數據庫中選擇出來.
將SCADA系統(tǒng)中所有M個監(jiān)測數據組合成OLS算法回歸算子集合P,那么在風電機組數據采集與監(jiān)視控制系統(tǒng)中選擇出合適的齒輪箱溫度預測輸入變量的問題,可以看成在擁有M個回歸算子的集合P中選出有限個算子Ms的問題.這樣便可以依照上節(jié)將OLS法應用于風電機組齒輪箱輸入變量選擇.
運用SCADA系統(tǒng)中的監(jiān)測數據,OLS法選擇齒輪箱溫度預測輸入變量的具體過程為
①在SCADA系統(tǒng)中確定所有的備選輸入變量集,針對要學習的目標形成一組包含期望輸出變量及所有備選輸入變量的樣本集.
② 確定容差ρ和輸入變量初始個數Ms.由所有備選輸入變量形成回歸算子矩陣P.
③用OLS法選擇Ms個最顯著的回歸算子,具體步驟參見上節(jié).
④檢查壓縮比是否滿足容差ρ,若滿足則停止計算,轉步驟⑤;否則,Ms=Ms+1,轉步驟③,繼續(xù)選擇回歸算子.
⑤得到Ms個回歸算子即選出的輸入變量.
以甘肅省某風電場的一臺機組在2013年2月的SCADA運行數據為基礎,進行OLS法與相關系數法在齒輪箱溫度預測輸入變量選擇的比較.從SCADA眾多監(jiān)測參數中初選出備選輸入變量集,最終選擇出29個備選的輸入變量.選擇2013年2月5、6日兩個典型日的數據作為研究對象.
相關系數法的計算公式為
計算SCADA系統(tǒng)中29個輸入變量與輸出變量即齒輪箱油溫相關系數,部分相關系數見表1.
表1 齒輪箱溫度與部分相關變量的相關系數Tab.1 Correlation coefficient between gearbox temperature and other variables
表1中選擇相關系數最大的若干個神經網絡變量作為神經網絡的輸入,選擇結果為:齒輪箱軸承溫度(0.954 5)、網側電感溫度(0.907 7)、機側半導體溫度(0.896 6)、網測半導體溫度(0.887 9)
設初始輸入變量數Ms=4,容差ρ=0.000 1,OLS選擇輸入變量結果見表2.
表2 OLS法輸入變量選擇結果Tab.2 OLS method using input variable selection
為比較兩種輸入變量選擇方法對齒輪箱溫度預測精度的影響,選擇甘肅某風電場2月5日正常運行的144個監(jiān)測數據點作為神經網絡訓練數據,2月6日的144個數據點作為神經網絡測試數據,在相同的訓練集和測試集的基礎上,運用相同的神經網絡來學習和比較2種方法的結果.在這里選擇BP神經網絡,訓練的最大迭代次數為100次,訓練目標為0.000 04,OLS法神經網絡的輸入為表2中四個輸入變量,相關系數法神經網絡的輸入為表1中的四個輸入變量.OLS法選出的輸入變量進行預測的效果與相關系數法選出的輸入變量預測效果對比圖如圖1所示.
圖1 OLS法與相關系數法的輸入變量預測效果對比圖Fig.1 Prediction between OLS and Correlation Coefficient
從圖1的對比中知道,二者的預測效果有著明顯的區(qū)別.
兩種方法預測的誤差對比圖如圖2所示.
圖2 兩種方法預測的誤差對比圖Fig.2 Error between two methods
從圖2的對比中知道,二者的預測效果有著明顯的區(qū)別.此外,本文還選取了均方誤差(MSE)、均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)來作為預測結果的評價指標.每種方法連續(xù)運行十次取三種誤差的平均值,兩種方法預測的精度見表3.
表3 OLS法與相關系數法預測精度對比圖Tab.3 Prediction accuracy between OLS and Correlation Coefficient
從表3看出,在輸入變量、隱含層節(jié)點數、訓練次數全都相同的條件下,OLS法選擇出來的輸入變量精度明顯好于相關系數法選擇出來的變量,驗證了OLS法選擇風電機組齒輪箱溫度預測輸入變量的有效性.
從表3看出,在輸入變量、隱含層節(jié)點數、訓練次數全都相同的條件下,OLS法選擇出來的輸入變量精度明顯好于相關系數法選擇出來的變量,驗證了OLS法選擇風電機組齒輪箱溫度預測輸入變量的有效性.
本文提出了正交最小二乘法用于風電機組齒輪箱溫度預測輸入變量的選擇,通過正交最小二乘法與相關系數法仿真結果的對比,證實了正交最小二乘法的仿真結果優(yōu)于相關系數法,驗證了正交最小二乘法用于風電機組齒輪箱溫度預測輸入變量選擇的有效性.最小正交二乘法在選擇輸入變量的過程中也存在著無法準確解釋輸入變量各負荷間的變化關系的缺點,建立輸入變量各負荷間的變化關系,是正交最小二乘法用于輸入變量選擇今后需要解決的問題.
[1] KIM K,PARTHASARATHY G,ULUYOL O,et al.Use of SCADA Data for Failure Detection in Wind Turbines [C ]//Proceedings of 2011Energy Sustainbility Conference an Fuel Cell Conference,Washington,2011:7.
[2] MESQUITA BRANDAO R F,J.A.Beleza Carvalho.Forecast of Faults in a Wind Turbine[J].IEEE Conference Publications,2012:170.
[3] ZAHER A,MCARHTUR S D J,INFIELD D G.Onlion Wind Turbine Fault Detection through Automated SCADA Data Analysis[J].Wind Energy,2009,12:574.
[4] 郭鵬,David Infield,楊錫運.風電機組齒輪箱溫度趨勢狀態(tài)監(jiān)測及分析方法[J].中國電機工程學報,2011,31(32):129.GUO Peng,David Infield,YAng Xi-Yun.Wind Turbine Gearbox Condition Monitoring Using Temperature Trend Analysis[J].Proceedings of the CSEE,2011,31(32):129.(in Chinese)
[5] 吉小軍,李世中,李霆.相關分析在特征選擇中的應用[J].華北工學院測試技術學報,2001,15(1):15.JI Xiao-Jun,LI Shi-zhong,LI Ting.Application of the Correlation Analysis [J].Journal of Test and Measurement Technology,2001,15(1):15.(in Chinese)
[6] DREZGA I,RAHMAN S.Input Variable Selection for ANN-Based Short-Term Load Forecasting[J].IEEE Transactions on Power Systems,1998,13(4):1238.
[7] 閆闖.多元回歸模型中變量選擇問題研究[D].哈爾濱:黑龍江大學,2011.YAN Chuang.Variables in a Multiple Regression Model Selection Study[D].Harbin:Heilongjiang University,2011.(in Chinese)
[8] 高山,單淵達.神經網絡短期負荷預測變量選擇新方法[J].電力系統(tǒng)自動化,2001,25(22):1.GAO Shan,SHAN Yuan-da.Novel Input Variable Selection for Ann Short-Term Load Forecasting[J].Automation of Electric Power Systems,2001,25(22):1.(in Chinese)
[9] CHEN S,COWAN C F N,GRANT P M.Orthogonal Least Squares Learning Algorithm for Radial Basis Functions Networks[J].IEEE Trans On Neural Net-Works,1991,2(2):302.
[10] MASTOROCOSTAS P A,THE OCHARIS J B,BAKIRTZIS A G.Fuzzy Modeling for Short Term Load Forecasting Using the Orthogonal Least Squares Method[J].IEEE Trans On Power Systems,1999,14(1):29.(in Chinese)
[11] 徐秉鋒,張百靈,韋崗.神經網絡理論與應用[M].廣州:華南理工大學出版社,1994.XU Bing-feng,ZHANG Bai-ling,WEI Gang.Artificial Neural Network and Its Application[M].Guangzhou:South China University of Technology Press,1994.(in Chinese)