宋聚眾,蘭杰,林淑,莫爾兵
(東方電氣風(fēng)電有限公司,四川德陽,618000)
基于K-均值聚類分析的風(fēng)力機(jī)功率曲線統(tǒng)計應(yīng)用
宋聚眾,蘭杰,林淑,莫爾兵
(東方電氣風(fēng)電有限公司,四川德陽,618000)
風(fēng)力機(jī)相關(guān)數(shù)據(jù)的處理對風(fēng)力機(jī)能否正常發(fā)電無影響,但對風(fēng)力機(jī)性能的分析卻至關(guān)重要。文章以風(fēng)力機(jī)的功率曲線為研究對象,把SCADA數(shù)據(jù)記錄分為兩類,采用模式識別的K-均值聚類分析方法排除掉無效數(shù)據(jù)點(diǎn),能夠以統(tǒng)一的算法處理不同類型的散點(diǎn)圖,通過.NET平臺有效地結(jié)合EXCEL的數(shù)據(jù)統(tǒng)計功能和VB語言的邏輯和流程控制功能,準(zhǔn)確、快速地開發(fā)出可視化軟件,繪制好的功率曲線有助于用戶直觀地分析風(fēng)力機(jī)的發(fā)電性能,為用戶在風(fēng)電場發(fā)電性能改進(jìn)方面提供重要依據(jù)。
功率曲線,聚類分析,K-均值,數(shù)據(jù)處理,.NET平臺,VB
隨著化石能源日益稀缺,全球環(huán)境的惡化,風(fēng)能作為一種儲量大、分布廣、綠色環(huán)保的新能源和可再生能源,目前被世界各國大力利用。我國疆域遼闊,多數(shù)地區(qū)的風(fēng)能資源豐富,陸上和海上能開發(fā)利用的風(fēng)能儲量近似為10億千瓦。近年來,風(fēng)力發(fā)電技術(shù)迅速發(fā)展,風(fēng)電機(jī)組的功率曲線,對風(fēng)電場的運(yùn)行經(jīng)濟(jì)效益有著至關(guān)重要的影響。
風(fēng)力發(fā)電機(jī)組在運(yùn)行過程中的數(shù)據(jù)會通過SCADA系統(tǒng)記錄到遠(yuǎn)程數(shù)據(jù)庫中,以便進(jìn)行相應(yīng)統(tǒng)計分析,其中功率曲線是常用到的統(tǒng)計結(jié)果,它是風(fēng)力機(jī)發(fā)電性能的直接表征。因此需要通過原始記錄數(shù)據(jù)提取有效數(shù)據(jù),以便進(jìn)行功率曲線繪制。但是在SCADA系統(tǒng)中記錄的數(shù)據(jù),往往包含受風(fēng)力機(jī)起停機(jī)過程、風(fēng)湍流過大、限功率運(yùn)行等影響的數(shù)據(jù)點(diǎn),使風(fēng)力機(jī)實(shí)際發(fā)電功率與風(fēng)速不匹配,造成對應(yīng)該條數(shù)據(jù)記錄無效,從而導(dǎo)致SCADA系統(tǒng)在統(tǒng)計功率曲線時,常使統(tǒng)計結(jié)果有偏差,難以準(zhǔn)確評價風(fēng)力機(jī)發(fā)電性能。若對單臺風(fēng)力機(jī)進(jìn)行人工處理,手動剔除無效統(tǒng)計數(shù)據(jù)點(diǎn),理論上是可行的,但不同風(fēng)力機(jī)無效數(shù)據(jù)記錄情況不盡相同,難以采用統(tǒng)一的定量方法進(jìn)行處理,因此在面臨多臺風(fēng)力機(jī)、大量數(shù)據(jù)的情況下,人工處理的辦法是不可取的。故針對風(fēng)電場,研究功率曲線處理辦法,實(shí)現(xiàn)快速、準(zhǔn)確、有效地繪制風(fēng)力機(jī)功率曲線是十分必要的。
本文以風(fēng)電場實(shí)測數(shù)據(jù)為基礎(chǔ),把SCADA功率曲線數(shù)據(jù)記錄分為兩類,采用模式識別的K-means聚類分析方法,通過.NET平臺有效地結(jié)合EXCEL的數(shù)據(jù)統(tǒng)計功能和VB語言的邏輯和流程控制功能,快速開發(fā)出可視化軟件,準(zhǔn)確、快速地繪制出風(fēng)力機(jī)功率曲線。
根據(jù)IEC61400-12-1標(biāo)準(zhǔn)的定義,風(fēng)力發(fā)電機(jī)組的功率曲線是機(jī)組輸出功率隨10 min平均風(fēng)速變化的關(guān)系曲線,表示風(fēng)力機(jī)在不同的風(fēng)速下有多大的功率輸出[1-2]。
功率曲線確定了風(fēng)力發(fā)電機(jī)組的發(fā)電性能,是風(fēng)力發(fā)電設(shè)備整機(jī)廠商(廠家)進(jìn)行機(jī)組研發(fā)設(shè)計時的重要性能指標(biāo),也是設(shè)備運(yùn)行商(業(yè)主)招標(biāo)、計算經(jīng)濟(jì)性和投資回報率的重要參考指標(biāo)。機(jī)組進(jìn)行型式認(rèn)證時,其也是認(rèn)證的主要內(nèi)容之一。在風(fēng)電場投運(yùn)以后,功率曲線是廠家進(jìn)行評估和后期優(yōu)化的依據(jù),也是業(yè)主進(jìn)行產(chǎn)品考核、質(zhì)保交機(jī)驗收的重要內(nèi)容。因此,如何準(zhǔn)確、快速統(tǒng)計風(fēng)力機(jī)功率曲線是十分重要的。
聚類分析常用于模式識別、數(shù)據(jù)挖掘等人工智能領(lǐng)域,其基本思想是把數(shù)據(jù)對象按照一定的標(biāo)準(zhǔn)劃分為幾類,使同類數(shù)據(jù)具有相同的特性,不同類數(shù)據(jù)特性不同。目前常用的聚類分析算法有:K-means聚類算法、凝聚型層次聚類算法、神經(jīng)網(wǎng)絡(luò)聚類算法[3-4]。
本文采用的K-means算法是比較經(jīng)典的聚類算法,只要數(shù)據(jù)對象具有比較明顯的區(qū)域特征,均可采用此方法。該算法具有效率高、實(shí)現(xiàn)簡單、運(yùn)行速度快的特點(diǎn),在大規(guī)模樣本分析方面,具有廣泛的應(yīng)用[5]。
K-means算法的主要思想是:首先選定分類數(shù)目K,指定對應(yīng)的K個初始中心,再將其余的數(shù)據(jù)對象按照一定的優(yōu)化準(zhǔn)則劃分到某一類中,其劃分原則以減小目標(biāo)函數(shù)為依據(jù)。其目標(biāo)函數(shù)常采用樣本對象到聚類中心的歐幾里得距離,則可定義為:
其中:k為聚類類數(shù);Ci為第i個聚類;xj為類Ci中的數(shù)據(jù)對象;μi為類Ci的質(zhì)心。
K-means的算法可以分為兩個階段:
第一階段為批量計算階段,基本流程如下:
(1)指定初始K個聚類中心;
(2)把每個數(shù)據(jù)歸到距離中心最近的一類;
(3)重新計算該類的中心;
(4)重復(fù)步驟2、3一定次數(shù),獲得較合理的初始聚類中心;
第二階段為單獨(dú)計算階段,基本流程如下:
(1)選取上一階段計算的結(jié)果,將其作為初始聚類中心;
(2)循環(huán)計算每個點(diǎn)所屬分類,以減小優(yōu)化準(zhǔn)則函數(shù)為標(biāo)準(zhǔn),重新確定該點(diǎn)分類,并更新該類中心;
(3)重復(fù)第2步,直至每一類不再發(fā)生改變或優(yōu)化函數(shù)值趨于收斂。
本文以國內(nèi)某個風(fēng)電場實(shí)測數(shù)據(jù)為基礎(chǔ)進(jìn)行分析,得到如圖1、圖2所示的結(jié)果。
圖1 含有起停機(jī)、不同限功率運(yùn)行狀態(tài)(1#機(jī)組)
圖2 含有起停機(jī)過程及湍流強(qiáng)度過大(2#機(jī)組)
從圖1、圖2可以看出,同一風(fēng)電場兩臺風(fēng)力機(jī)一年的功率散點(diǎn)圖卻含有不同類型的無效數(shù)據(jù)點(diǎn)組合,從而很難進(jìn)行統(tǒng)一定量分析。用戶很難根據(jù)圖形直觀地評價風(fēng)力機(jī)發(fā)電狀況的好壞。
本文通過分析功率曲線散點(diǎn)圖可以發(fā)現(xiàn)具有如下特點(diǎn):
(1)有效數(shù)據(jù)點(diǎn)具有聚合性,即都在一定范圍內(nèi)分布;
(2)有效數(shù)據(jù)點(diǎn)遠(yuǎn)遠(yuǎn)多于無效數(shù)據(jù)點(diǎn)。
從(1)可以得出具有聚類分析所定義的特點(diǎn),數(shù)據(jù)具有聚合性,相同特性聚集在一定范圍內(nèi);從(2)可以看出無效數(shù)據(jù)點(diǎn)的存在對有效數(shù)據(jù)點(diǎn)的聚合性影響不大,因此可以把整個數(shù)據(jù)分為兩個集合{有效數(shù)據(jù)點(diǎn)集合}、{無效數(shù)據(jù)點(diǎn)集合}。集合劃分依據(jù)采用有效數(shù)據(jù)點(diǎn)集合均值一定半徑內(nèi)的點(diǎn)為有效數(shù)據(jù)點(diǎn)集合,半徑之外為無效集合。而初始集合的選取,由于有效數(shù)據(jù)點(diǎn)遠(yuǎn)遠(yuǎn)多于無效數(shù)據(jù)點(diǎn),因此可以簡單設(shè)置初始有效數(shù)據(jù)點(diǎn)集合為全部數(shù)據(jù)點(diǎn)、無效數(shù)據(jù)點(diǎn)集合為空集,當(dāng)?shù)絻蓚€集合數(shù)據(jù)點(diǎn)穩(wěn)定以后即可得到結(jié)果,而有效半徑可以通過風(fēng)電場選址數(shù)據(jù)的湍流強(qiáng)度,通過仿真計算得出合理值。因此采用K-means聚類分析方法可以獲得具體程序流程圖(見圖3)。
圖3 K-means程序流程圖
按照圖3所示的方法,考慮到常見的數(shù)據(jù)庫系統(tǒng)可以導(dǎo)出EXCEL格式的數(shù)據(jù)記錄,雖然EXCEL具有良好的數(shù)據(jù)統(tǒng)計能力和廣泛的應(yīng)用基礎(chǔ),但卻沒有很好的邏輯和流程控制能力,因此,采用.NET平臺[6-7],編譯了相應(yīng)程序。.NET平臺是微軟公司推出的新一代軟件開發(fā)平臺,其主要特點(diǎn)是運(yùn)行于.NET框架下,各種編程語言只要支持.NET編譯器,就可以和其他類型.NET編程語言之間相互調(diào)用,其內(nèi)建提供了良好的EXCEL操作方法,能夠集EXCEL的數(shù)據(jù)統(tǒng)計功能和VB的邏輯和流程控制功能于一體,快速開發(fā)出所需軟件,且很容易編寫出可視化圖形界面,便于操作,開發(fā)完成的軟件界面如圖4所示。
圖4 功率曲線可視化圖形界面
通過已得的可視化圖形界面很容易得到圖5~圖8所示的結(jié)果。
圖5 1#機(jī)組處理后散點(diǎn)圖
圖7 2#機(jī)組處理后散點(diǎn)圖
圖6 1#機(jī)組處理前后功率曲線偏差
圖8 2#機(jī)組處理前后功率曲線偏差
通過對以上圖形的分析,可知采用本文所提出的方法進(jìn)行處理后的功率曲線散點(diǎn)圖能夠有效剔除掉無效數(shù)據(jù)點(diǎn),有助于用戶直觀、快速地分析風(fēng)力機(jī)的發(fā)電狀況,有效地提高工作效率。
本文采用K-means聚類分析方法對風(fēng)電場SCADA記錄的功率曲線數(shù)據(jù)進(jìn)行處理,通過可視化圖形界面,可以快速、準(zhǔn)確、有效地繪制出風(fēng)力機(jī)功率曲線,用戶可以很直觀地分析風(fēng)力機(jī)的發(fā)電狀況,也為用戶在風(fēng)電場發(fā)電性能改進(jìn)方面提供了重要的依據(jù)。
[1]郎斌斌,穆剛,嚴(yán)干貴.聯(lián)網(wǎng)風(fēng)電機(jī)組風(fēng)速-功率特性曲線的研究[J].電網(wǎng)技術(shù),2008,32(12):70-74.
[2]Wind turbine generator systems-Part 12:Wind turbine power performance testing[S].International Electro Technical Commission,2005.
[3]J F Manwell,J G McGowan,A L Rogers.Wind energy explained[M].British:John Wiley&sons,Ltd.,2002.
[4]李楠.基于強(qiáng)化學(xué)習(xí)算法的多智能體學(xué)習(xí)問題的研究[D].無錫:江南大學(xué),2006.
[5]李永森,楊善林,馬溪駿.空間聚類算法中的K值優(yōu)化問題研究[J].系統(tǒng)仿真學(xué)報,2006,18(3):573-576.
[6]周羽明,劉元婷..NET平臺與C#面向?qū)ο蟪绦蛟O(shè)計[M].北京:電子工業(yè)出版社,2010.
[7]嚴(yán)月浩.基于.NET平臺的web開發(fā)[M].北京:北京大學(xué)出版社,2011.
Application of Wind Turbine Power Curve Based on K-means Clustering Analysis
Song Juzhong,Lan Jie,Lin Shu,Mo Erbing
(Dongfang Electric Wind Power Co.,Ltd.,Deyang Sichuan,618000)
Data processing of wind turbine has no effect on wind turbine normal power generation,but it is critical to wind turbine performance analysis.This paper takes the power curve of wind turbine as the study object,the SCADA data records are divided into two categories,the pattern recognition of K-means clustering analysis method is used to exclude invalid data points,and the different types of scatter plots can be handled by the unified algorithm.Through.NET platform which effectively combines with the statistic function of EXCEL and the logic and flow control function of VB language,the visual software is developed accurately and rapidly,the power curve is plotted to help users analyse the power generation performance of wind turbine,and provide an important basis for users to improve the performance of wind farm.
power curve,clustering analysis,K-means,data processing,.NET platform,VB
TP311
A
1674-9987(2017)02-0046-05
10.13808/j.cnki.issn1674-9987.2017.02.011
基金編號:四川省科技支撐計劃項目資助項目(2014GZ0084)
宋聚眾(1978-),男,工學(xué)碩士,工程師,2007年畢業(yè)于汕頭大學(xué)機(jī)械設(shè)計專業(yè),現(xiàn)從事風(fēng)電電控設(shè)計工作。