国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)在風(fēng)力發(fā)電中的應(yīng)用綜述

2019-04-09 05:06:04曾文珺呂麗霞
儀器儀表用戶 2019年4期
關(guān)鍵詞:風(fēng)力數(shù)據(jù)挖掘風(fēng)電

曾文珺,呂麗霞

(華北電力大學(xué) 自動(dòng)化系,河北 保定 071003)

0 引言

風(fēng)能作為可再生能源中的一種,利用到電力生產(chǎn)行業(yè)中已有30多年的歷史。近10年來(lái),由于化石能源危機(jī),風(fēng)力發(fā)電的需求迅速增大,風(fēng)電機(jī)組全球裝機(jī)容量從21世紀(jì)初的24GW,發(fā)展到如今的539GW,關(guān)于風(fēng)力發(fā)電各方面研究逐步推進(jìn),已由粗放向精細(xì)化轉(zhuǎn)變。

目前,在風(fēng)力發(fā)電領(lǐng)域中,已有多種研究手段和分析方法。在風(fēng)電機(jī)組的故障診斷中,有通過(guò)提取振動(dòng)信號(hào)做頻譜分析確定故障形式的方法,通過(guò)聲發(fā)射技術(shù)診斷故障的方法[1];對(duì)傳動(dòng)機(jī)械的狀態(tài)監(jiān)測(cè)和預(yù)警以測(cè)量傳感器為基礎(chǔ),現(xiàn)有機(jī)械振動(dòng)、熱紅外、超聲和聲發(fā)射、潤(rùn)滑油光譜鐵譜、溫度和噪聲監(jiān)測(cè)[2];風(fēng)力發(fā)電功率預(yù)測(cè)有多種研究方法,有對(duì)于功率直接預(yù)測(cè)和通過(guò)預(yù)測(cè)風(fēng)速來(lái)間接預(yù)測(cè),有通過(guò)參考地形、天氣等建立預(yù)測(cè)模型的方法,還有通過(guò)風(fēng)電場(chǎng)測(cè)量數(shù)據(jù)和功率建立映射關(guān)系的統(tǒng)計(jì)模型預(yù)測(cè)法[3]。在風(fēng)力發(fā)電系統(tǒng)最大功率跟蹤的研究中,傳統(tǒng)方法有葉尖速比法、爬山法和最佳特性曲線法[4]。學(xué)者通常在非線性控制律設(shè)計(jì)基礎(chǔ)上引入觀測(cè)器法、模糊推理法、卡爾曼濾波法、支持向量機(jī)等辨識(shí)技術(shù),建立一個(gè)基于辨識(shí)的復(fù)合控制模型[5]。

在研究過(guò)程中,學(xué)者發(fā)現(xiàn)風(fēng)電機(jī)組復(fù)雜多變的工況、模型的多參數(shù)非線性特性和龐大的運(yùn)行數(shù)據(jù)量是研究的難題,并開(kāi)始思考解決這些難題的方法。由此數(shù)據(jù)挖掘技術(shù)引起了學(xué)者們的注意,研究人員開(kāi)始通過(guò)數(shù)據(jù)挖掘技術(shù),探索風(fēng)力發(fā)電機(jī)組海量運(yùn)行數(shù)據(jù)中蘊(yùn)含的信息。本文詳細(xì)敘述了數(shù)據(jù)挖掘的概念及其算法,討論了其在風(fēng)力發(fā)電領(lǐng)域的應(yīng)用,并對(duì)未來(lái)研究的發(fā)展方向進(jìn)行了展望。

圖1 數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)過(guò)程Fig.1 Knowledge discovery process in a database

1 數(shù)據(jù)挖掘的概念及主要算法

數(shù)據(jù)收集和存儲(chǔ)技術(shù)的進(jìn)步促使商業(yè)和科研領(lǐng)域產(chǎn)生了海量數(shù)據(jù)集,從數(shù)據(jù)中提取有用的信息的想法促進(jìn)了數(shù)據(jù)挖掘技術(shù)的產(chǎn)生和發(fā)展[6]。數(shù)據(jù)挖掘技術(shù)是數(shù)據(jù)庫(kù)中知識(shí)發(fā)現(xiàn)(knowledge discovery in database, KDD)中重要的一部分,參與了將未加工的數(shù)據(jù)轉(zhuǎn)換為有用信息的過(guò)程,如圖1所示。它結(jié)合了傳統(tǒng)數(shù)據(jù)分析方法與處理大量數(shù)據(jù)的復(fù)雜算法,任務(wù)可以分為預(yù)測(cè)任務(wù)和描述任務(wù)兩大類。預(yù)測(cè)任務(wù)是根據(jù)其他特征屬性的值,預(yù)測(cè)特定屬性的值,相關(guān)算法有分類、回歸算法;描述任務(wù)的目標(biāo)為導(dǎo)出概括數(shù)據(jù)中潛在聯(lián)系的模式,聚類、關(guān)聯(lián)算法通常被用于描述任務(wù)。

數(shù)據(jù)挖掘算法在功率預(yù)測(cè)建模、故障分類及預(yù)測(cè)中皆有應(yīng)用,表1歸納了風(fēng)力發(fā)電相關(guān)研究文獻(xiàn)中常見(jiàn)的算法及其類別,后文根據(jù)類別詳細(xì)敘述了數(shù)據(jù)挖掘的算法。

1)分類算法,通過(guò)對(duì)數(shù)據(jù)訓(xùn)練集的分析研究,發(fā)現(xiàn)分類規(guī)則,從而具備預(yù)測(cè)新數(shù)據(jù)類型的能力[7]。其算法分為兩個(gè)階段:構(gòu)建模型階段和使用模型階段。在第一階段中,將已知的訓(xùn)練數(shù)據(jù)集進(jìn)行分析和學(xué)習(xí),構(gòu)建一個(gè)準(zhǔn)確率較為滿意的模型來(lái)用于描述特定的數(shù)據(jù)類集;后一個(gè)階段則是對(duì)第一階段中構(gòu)建好的模型,加入未知的數(shù)據(jù)對(duì)象,使模型對(duì)其進(jìn)行分類。

決策樹(decision tree)分類法是一種簡(jiǎn)單但使用廣泛的分類技術(shù),它使數(shù)據(jù)由根結(jié)點(diǎn)出發(fā),經(jīng)過(guò)內(nèi)部結(jié)點(diǎn)的層層分枝分類,最終將數(shù)據(jù)分到相應(yīng)的根結(jié)點(diǎn)類別中,隨機(jī)森林(Random Forest,RF)算法則是許多個(gè)決策樹分類器進(jìn)行投票組合,從而提高分類準(zhǔn)確率。K-近鄰(K-nearest neighbor,K-NN)通過(guò)計(jì)算每一個(gè)測(cè)試樣例與所有訓(xùn)練樣例間的距離,找出與其最近的樣例進(jìn)行分類。人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Networks,ANN)算法模擬了生物神經(jīng)系統(tǒng)而研發(fā),通過(guò)訓(xùn)練樣本學(xué)習(xí)獲得參數(shù)建立模型,繼而對(duì)樣本中的其余數(shù)例分類。支持向量機(jī)(support vector machine,SVM)算法基于統(tǒng)計(jì)學(xué)理論,在類似超平面的高維空間計(jì)算求最優(yōu)分類超平面[7]。樸素貝葉斯(Naive Bayes,NB)分類法基于貝葉斯公式理論,依據(jù)樣本先驗(yàn)概率與類條件概率計(jì)算屬于各分類類別的概率來(lái)劃分其確定類。

2)聚類分析研究把相似的事物歸位為一類,通過(guò)靜態(tài)分類的方法把相似的對(duì)象分為不同的組別和或子集,同一個(gè)子集中的對(duì)象都有相似的一些屬性,不同子集中的對(duì)象是不同的。

常用的K均值(K-means)聚類算法,指定K個(gè)初始質(zhì)心,樣本被分派到最近的質(zhì)心形成簇,基于簇中樣本點(diǎn)的中心更新質(zhì)心,重復(fù)分派直到簇不變,得到的K個(gè)聚類中每個(gè)樣本點(diǎn)都屬于離它最近的類。模糊C-均值聚類算法步驟與K-均值相仿,但其簇的邊界是模糊劃分的,簇中每個(gè)點(diǎn)擁有一個(gè)權(quán)值,表示其屬于該簇的權(quán)重。

3)關(guān)聯(lián)分析,發(fā)掘隱藏在數(shù)據(jù)集中有意義的聯(lián)系,通過(guò)關(guān)聯(lián)規(guī)則或頻繁項(xiàng)集的形式表現(xiàn)。風(fēng)力發(fā)電應(yīng)用中常見(jiàn)的Apriori算法是一種挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的算法[8],通過(guò)逐層搜索迭代獲得頻繁項(xiàng)集。FP-增長(zhǎng)(Frequentpattern growth)算法將頻繁項(xiàng)集的數(shù)據(jù)庫(kù)壓縮到頻繁模式樹中并保留關(guān)聯(lián)信息[9],F(xiàn)P-樹被分化成條件庫(kù)進(jìn)行挖掘,將數(shù)據(jù)庫(kù)頻繁模式的挖掘問(wèn)題轉(zhuǎn)換成挖掘FP-樹的問(wèn)題。

2 數(shù)據(jù)挖掘在風(fēng)力發(fā)電中的應(yīng)用現(xiàn)狀

目前,數(shù)據(jù)挖掘技術(shù)在風(fēng)力發(fā)電中的應(yīng)用主要在故障診斷和發(fā)電功率預(yù)測(cè)方面,在狀態(tài)監(jiān)測(cè)、預(yù)警和最大功率跟蹤方面則應(yīng)用得較少。

2.1 故障診斷

早些年數(shù)據(jù)挖掘技術(shù)在風(fēng)電機(jī)組故障診斷中的應(yīng)用還不是特別成熟,僅局限于理論研究和仿真模擬。彭安群[10]建立了一種改進(jìn)粗糙集理論的C4.5決策樹模型對(duì)風(fēng)電機(jī)組齒輪箱系統(tǒng)進(jìn)行故障診斷,準(zhǔn)確率達(dá)88.5%,與單獨(dú)的C4.5算法診斷的時(shí)間相比大大減少,提高了診斷速度。王小鵬[11]對(duì)一組風(fēng)電機(jī)組故障數(shù)據(jù)采用決策樹算法驗(yàn)證了數(shù)據(jù)挖掘在風(fēng)機(jī)故障診斷中的有效性。

從近幾年的文獻(xiàn)可以看出,數(shù)據(jù)挖掘技術(shù)在風(fēng)電機(jī)組故障診斷中的應(yīng)用研究越來(lái)越多,Zhigang Chen等人[12]提出了一種模糊聚類的方法,利用聚類結(jié)果構(gòu)建目標(biāo)函數(shù),將模糊傳輸閉包和目標(biāo)函數(shù)結(jié)合挖掘敏感尺寸,以此來(lái)獲得能夠用于齒輪箱故障診斷的特征向量。通過(guò)實(shí)驗(yàn)證明挖掘出的旋轉(zhuǎn)部件振動(dòng)信號(hào)的敏感特征參數(shù)被用作最佳特征向量來(lái)診斷齒輪箱的故障,且有較高的可靠性。

Jae Yoon等人[13]提出了一種用于風(fēng)電機(jī)組行星齒輪箱(PGB)和單個(gè)振動(dòng)傳感器的故障診斷方法,提取PGB的振動(dòng)故障特征作為故障診斷的條件指標(biāo)(CI),CI又作為行星齒輪箱故障診斷分類器的輸入。其中,分類器的訓(xùn)練分別使用了K-NN,BP神經(jīng)網(wǎng)絡(luò)與大內(nèi)存存儲(chǔ)和檢索(LAMSTAR)網(wǎng)絡(luò)3種數(shù)據(jù)挖掘方法。K-NN表現(xiàn)出了其較高的診斷準(zhǔn)確率,LAMSTAR網(wǎng)絡(luò)除較高的準(zhǔn)確率外,還對(duì)局部最小值的敏感度更低。

葉春霖等人[14]將幾種分類數(shù)據(jù)挖掘算法應(yīng)用在風(fēng)電機(jī)組葉片結(jié)冰故障的診斷中,從SCADA數(shù)據(jù)中提取為期1個(gè)月的風(fēng)速、風(fēng)向、發(fā)電機(jī)轉(zhuǎn)速、有功功率、齒輪箱溫度、軸承溫度、變槳角度、傳動(dòng)加速度等表征風(fēng)電機(jī)組運(yùn)行工況及運(yùn)行環(huán)境的特征參數(shù),結(jié)合不同的預(yù)處理方法與K-NN、NB、RF和AdaBoost 4種數(shù)據(jù)挖掘算法建立風(fēng)電機(jī)組葉片結(jié)冰故障診斷模型,比較4種算法的優(yōu)劣,RF的表現(xiàn)最佳,故障診斷的準(zhǔn)確率能達(dá)到99%。

Yanting Li等人[15]使用高斯過(guò)程分類器(GPC)的數(shù)據(jù)挖掘方法,對(duì)愛(ài)爾蘭南部一臺(tái)3MW直驅(qū)式風(fēng)力發(fā)電機(jī)組進(jìn)行在線故障診斷和故障預(yù)測(cè)。GPC方法是一種遠(yuǎn)離輸入輸出關(guān)系的假設(shè),屬于貝葉斯非參數(shù)分類方法。文獻(xiàn)[15]比較了不同核函數(shù)下GPC的分類性能,其中自動(dòng)相關(guān)性確定指數(shù)核(EXP ARD)有較好的魯棒性。比較指數(shù)內(nèi)核的GPC與SVM的分類性能,得出GPC方法在診斷無(wú)故障、饋送故障、電源故障、風(fēng)冷故障中都優(yōu)于SVM;當(dāng)SVM錯(cuò)誤識(shí)別電源故障時(shí)GPC仍有50%的精度;在發(fā)電機(jī)故障診斷中兩種方法都表現(xiàn)出高精度;在激勵(lì)故障診斷中SVM的表現(xiàn)優(yōu)于GPC;在預(yù)測(cè)性故障診斷中,GPC的短期預(yù)測(cè)準(zhǔn)確率優(yōu)于SVM,隨著預(yù)測(cè)時(shí)間長(zhǎng)度的增加GPC的準(zhǔn)確率稍有下降但整體性能仍然很好。評(píng)估分類性能的4項(xiàng)性能指標(biāo)有準(zhǔn)確率、查準(zhǔn)率、查全率和F1,GPC的整體分類性能指標(biāo)表明其良好的綜合分類特性。

Hasmat Malik等人[16]利用近端支持向量機(jī)(PSVM)方法強(qiáng)大的分類能力,基于風(fēng)電機(jī)組發(fā)電機(jī)電流信號(hào)識(shí)別發(fā)電機(jī)的不平衡故障。在仿真實(shí)驗(yàn)臺(tái)中構(gòu)建風(fēng)電機(jī)組模型,并在6種不同條件下模擬仿真以獲得運(yùn)行數(shù)據(jù),用經(jīng)驗(yàn)?zāi)J椒纸猓‥MD)方法預(yù)處理定子電流信號(hào),分解后的內(nèi)部模式函數(shù)(IMF)作為PSVM的輸入變量。實(shí)驗(yàn)結(jié)果證明PSVM方法在診斷中具有更高的準(zhǔn)確率且訓(xùn)練和測(cè)試時(shí)間較少。

張建美[17]開(kāi)發(fā)了能對(duì)風(fēng)電機(jī)組數(shù)據(jù)庫(kù)進(jìn)行管理和對(duì)機(jī)組設(shè)備進(jìn)行故障監(jiān)測(cè)與診斷的系統(tǒng),研究對(duì)象為風(fēng)機(jī)系統(tǒng)的齒輪箱云模型。依據(jù)改進(jìn)粗糙集算法和決策樹生成的診斷規(guī)則對(duì)齒輪箱云模型進(jìn)行故障診斷。通過(guò)改進(jìn)粗糙集的屬性約簡(jiǎn)算法獲得最佳決策約簡(jiǎn)集,簡(jiǎn)化了后續(xù)決策樹的建立工作。將改進(jìn)的粗糙決策樹算法和未改進(jìn)的算法比較,兩種算法的診斷準(zhǔn)確率都較高,但未改進(jìn)的算法有一處誤診。

孫鶴旭等人[18]使用MpApriori算法獲取風(fēng)機(jī)故障規(guī)則,實(shí)現(xiàn)多種故障的故障診斷,該算法集合了MapReduce技術(shù)的屬性約簡(jiǎn)和Apriori算法的并行化處理方式,正確率在80%以上。

2.2 發(fā)電功率預(yù)測(cè)

Meik Schlechtingen等人[23]建立功率曲線模型,對(duì)現(xiàn)代變槳調(diào)節(jié)風(fēng)力發(fā)電機(jī)組數(shù)據(jù)進(jìn)行性能研究。實(shí)驗(yàn)建立了集群中心模糊邏輯(CCFL)、神經(jīng)網(wǎng)絡(luò)和K-NN模型,開(kāi)發(fā)了自適應(yīng)神經(jīng)模糊干擾系統(tǒng)(ANFIS)模型,該模型可在訓(xùn)練階段調(diào)整隸屬函數(shù)(MF)參數(shù)來(lái)學(xué)習(xí)非線性信號(hào)關(guān)系,依據(jù)風(fēng)電機(jī)組的SCADA系統(tǒng)參數(shù)進(jìn)行發(fā)電功率預(yù)測(cè)。分別建立單輸入模型和多輸入模型,單輸入模型以風(fēng)速為輸入,多輸入模型以風(fēng)速、風(fēng)向和環(huán)境溫度為輸入,輸出均為功率。比較每種數(shù)據(jù)挖掘方法在兩種模型中的平均絕對(duì)誤差和實(shí)際有效值。在單輸入模型中,幾種方法差距不大,預(yù)測(cè)的結(jié)果擬合效果一般;而在多輸入模型中,神經(jīng)網(wǎng)絡(luò)和ANFIS展現(xiàn)出了其優(yōu)越的非線性建模的性能,預(yù)測(cè)曲線與實(shí)際功率非常擬合。

文獻(xiàn)[23]證明風(fēng)速、環(huán)境溫度和風(fēng)向是建立風(fēng)力發(fā)電機(jī)功率曲線監(jiān)測(cè)數(shù)據(jù)挖掘模型的重要參數(shù),且后兩者作為附加輸入來(lái)強(qiáng)化算法模型能提升模型提早檢測(cè)異常功率輸出的性能。在4種算法中,ANFIS算法具有最佳的度量性能,且其異常功率輸出檢測(cè)方面的性能也為最佳。文獻(xiàn)[23]最后提出未來(lái)這個(gè)課題的研究方向應(yīng)集中在如何進(jìn)一步減少預(yù)測(cè)誤差的方差上。

Cunbin Li等人[24]使用了一種基于數(shù)據(jù)挖掘技術(shù)的改進(jìn)支持向量機(jī)方法對(duì)中國(guó)西北地區(qū)的風(fēng)電場(chǎng)進(jìn)行短期發(fā)電功率預(yù)測(cè),使用數(shù)據(jù)挖掘技術(shù)對(duì)原始樣本錯(cuò)誤和丟失的風(fēng)力數(shù)據(jù)通過(guò)曲線擬合的方法替換和補(bǔ)足。風(fēng)速和風(fēng)向兩個(gè)參量作為輸入到改進(jìn)的SVM模型中,改進(jìn)SVM的內(nèi)核參數(shù)和懲罰因子用鵑搜索(CS)算法優(yōu)化,模型輸出預(yù)測(cè)功率曲線與實(shí)際功率曲線擬合精度達(dá)到90%。

Olivier Janssens 等人[26]分別采用了由DE安裝的5PL、KNN、隨機(jī)森林回歸、極度隨機(jī)樹(ERTs)、隨機(jī)梯度提升回歸樹(SGBRT)和箱柜方法(MOB)6種算法對(duì)海上風(fēng)電機(jī)組功率曲線進(jìn)行建模。在使用風(fēng)速作為單輸入時(shí),K-NN和SGBRT算法以較小的平均絕對(duì)誤差(MAE)、均方根誤差(RMSE)和學(xué)習(xí)時(shí)間,展示了其建模優(yōu)勢(shì);在使用風(fēng)速、轉(zhuǎn)子每分鐘轉(zhuǎn)數(shù)、偏航、風(fēng)向和俯仰5個(gè)變量作為輸入建立多輸入模型時(shí),用K-NN算法建模的預(yù)測(cè)性能指標(biāo)較差,SGBRT算法的模型的預(yù)測(cè)性能指標(biāo)大幅改善。

Jing Yan等人[27]通過(guò)兩個(gè)階段進(jìn)行功率預(yù)測(cè),第一階段建立風(fēng)力發(fā)電功率曲線的主要模型來(lái)獲得預(yù)測(cè)趨勢(shì),并提取主要模型的錯(cuò)誤并將其視為第二階段的研究對(duì)象;第二階段用具有建模優(yōu)勢(shì)的數(shù)據(jù)挖掘算法構(gòu)建糾正模型。使用NN、SVM、RF和二叉樹(BT)4種算法對(duì)第二階段的誤差預(yù)測(cè)進(jìn)行訓(xùn)練建模比較,結(jié)果表明,SVM算法的誤差分布估計(jì)值最好,但MAE和RMSE及對(duì)應(yīng)系統(tǒng)誤差的平均誤差(BIAS)較差,RF算法在此3種性能指標(biāo)衡量下,為最優(yōu)算法。結(jié)合RF誤差預(yù)測(cè)與物理預(yù)測(cè)建立的風(fēng)電功率預(yù)測(cè)模型,各項(xiàng)性能指標(biāo)比單獨(dú)的物理模型、NN、SVM、BT和RF算法建立的預(yù)測(cè)模型好,以較大的數(shù)值差距顯示出其優(yōu)越性。

Majid Morshe-dizadeh[28]提出一種提高數(shù)據(jù)集質(zhì)量的方法,該方法將決策樹概念用于替換缺失值。通過(guò)識(shí)別數(shù)據(jù)集中的缺失值,將數(shù)據(jù)集分為完整和不完整數(shù)據(jù)集,通過(guò)完整數(shù)據(jù)集構(gòu)建決策樹,其所有葉節(jié)點(diǎn)的子集反推來(lái)識(shí)別缺失值及其特征,對(duì)不完整數(shù)據(jù)集進(jìn)行插補(bǔ),兩個(gè)數(shù)據(jù)集組合后形成完整的數(shù)據(jù)集。此方法可降低誤報(bào)率,改善曲線功率監(jiān)控,提高系統(tǒng)的可靠性。

吳布托[29]應(yīng)用模糊C-均值算法剔除風(fēng)速-功率散點(diǎn)圖中受干擾和污染的數(shù)據(jù),預(yù)處理后的數(shù)據(jù)預(yù)測(cè)精度提高10%。

再選取Adaboost-BP網(wǎng)絡(luò)和最小二乘支持向量機(jī)建立最優(yōu)模型,從風(fēng)速時(shí)間的相關(guān)性分析入手,進(jìn)行預(yù)測(cè)。運(yùn)用貝葉斯后驗(yàn)對(duì)數(shù)比和自適應(yīng)檢測(cè)法檢測(cè)測(cè)量值與預(yù)測(cè)值的殘差序列中的異常殘差信息,確定異常值的時(shí)刻位置。得到自適應(yīng)檢測(cè)法比貝葉斯后驗(yàn)對(duì)數(shù)比的檢測(cè)時(shí)間短,且精度高15%。

2.3 監(jiān)測(cè)和預(yù)警

Verma.A等人[19]利用SCADA系統(tǒng)上收集的數(shù)據(jù),對(duì)風(fēng)力發(fā)電機(jī)的電刷故障進(jìn)行早期預(yù)測(cè)。風(fēng)力發(fā)電機(jī)組的SCADA系統(tǒng)上記錄的參數(shù)有100多個(gè),文中使用領(lǐng)域知識(shí),將初始維度減少到50維,又通過(guò)卡方統(tǒng)計(jì)、增強(qiáng)樹和具有遺傳搜索的包裝算法分別對(duì)10種參數(shù)進(jìn)行計(jì)算簡(jiǎn)單平均值,評(píng)估所選參數(shù)在分類故障和正常情況中的作用,以對(duì)選擇加入到故障預(yù)測(cè)的參數(shù)進(jìn)行降維。使用基于Tomek鏈接的采樣方法和基于隨機(jī)森林的數(shù)據(jù)抽樣方法,對(duì)大量的SCADA數(shù)據(jù)中存在的類別不平衡度進(jìn)行降低,使輸出類的正常和故障實(shí)例的比例較為接近。然后使用多層感知器(MLP)、增強(qiáng)樹、K-NN和SVM數(shù)據(jù)挖掘的算法,構(gòu)建時(shí)間戳的預(yù)測(cè)模型,結(jié)果增強(qiáng)樹算法顯示出對(duì)輸入類不平衡的良好的魯棒性,優(yōu)于其他3種算法。再利用增強(qiáng)樹算法對(duì)故障進(jìn)行預(yù)測(cè),在37個(gè)故障中能正確預(yù)測(cè)31個(gè),127個(gè)正常情況正確預(yù)測(cè)101個(gè)。在增強(qiáng)樹算法的優(yōu)異表現(xiàn)下,將其分別和Tomek連接、Tomek連接結(jié)合隨機(jī)森林的數(shù)據(jù)抽樣方法結(jié)合,結(jié)果顯示,第二種數(shù)據(jù)預(yù)處理方法的故障預(yù)測(cè)具有更高的準(zhǔn)確度。

Iury Valente de Bessa等人[20]提出了一種故障檢測(cè)和隔離(FDI)的方法,通過(guò)模糊聚類將風(fēng)電機(jī)組傳感器信號(hào)的時(shí)間序列在反泊松過(guò)程中變換,再通過(guò)吉布斯采樣獲得沿時(shí)間序列發(fā)生變化點(diǎn)的概率,將此概率作為模糊貝葉斯網(wǎng)絡(luò)的輸入,在其中模糊化變化點(diǎn)的概率,模糊證據(jù)和條件概率表被模糊貝葉斯推理用于對(duì)故障進(jìn)行分類,能夠正確識(shí)別和隔離文獻(xiàn)[20]中模擬的5種傳感器故障。

童超[21]使用改進(jìn)Apriori關(guān)聯(lián)規(guī)則算法,分析了變槳故障前后的大量連續(xù)報(bào)警信息,根據(jù)機(jī)組和變槳系統(tǒng)的運(yùn)行機(jī)理,發(fā)掘某些故障之間的聯(lián)系,過(guò)濾冗余信息,提高運(yùn)行人員工作效率。劉旭[22]用K-均值聚類法做輸入數(shù)據(jù)的預(yù)處理,應(yīng)用優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí),然后進(jìn)行故障預(yù)測(cè),與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)訓(xùn)練學(xué)習(xí)對(duì)比預(yù)測(cè)準(zhǔn)確率提高3.5%。

數(shù)據(jù)挖掘技術(shù)應(yīng)用在風(fēng)力發(fā)電機(jī)組故障的監(jiān)測(cè)和預(yù)警中,涵蓋前期的大數(shù)據(jù)集群和分析、數(shù)據(jù)清洗和預(yù)處理、特征選擇、模型實(shí)現(xiàn)和評(píng)價(jià),所得的模型運(yùn)用到實(shí)際的風(fēng)力發(fā)電機(jī)中能得到較好的結(jié)果。

2.4 其它應(yīng)用

數(shù)據(jù)挖掘技術(shù)在風(fēng)電機(jī)組最大功率跟蹤中的應(yīng)用較少,目前有關(guān)研究?jī)H在劉姝等人[30]的文獻(xiàn)中體現(xiàn),該文獻(xiàn)運(yùn)用粗糙集數(shù)據(jù)挖掘方法實(shí)現(xiàn)風(fēng)電機(jī)組最大功率點(diǎn)跟蹤。利用粗糙集的分類能力,約簡(jiǎn)消除冗余的條件屬性及屬性值,精簡(jiǎn)知識(shí)庫(kù)獲得決策表和決策規(guī)則,通過(guò)決策規(guī)則的篩選繪制功率曲線,很快地跟蹤機(jī)組當(dāng)前最大輸出功率點(diǎn)。Maik Reder等[31]運(yùn)用Apriori關(guān)聯(lián)規(guī)則挖掘故障與環(huán)境之間的邏輯關(guān)系,采用監(jiān)督標(biāo)記、無(wú)監(jiān)督單輸入K-均值聚類和無(wú)監(jiān)督多輸入K-均值聚類3種算法預(yù)處理數(shù)據(jù)后,對(duì)比實(shí)時(shí)天氣和故障數(shù)據(jù)。通過(guò)關(guān)聯(lián)分析獲得環(huán)境參數(shù)與5大主要風(fēng)力發(fā)電機(jī)組組件故障之間的關(guān)系。

文獻(xiàn)[25,32-34]利用數(shù)據(jù)挖掘技術(shù)辨識(shí)風(fēng)電機(jī)組的發(fā)電模型,文獻(xiàn)[25]分別運(yùn)用分類回歸樹(CR樹)、提升樹、支持向量機(jī)回歸和神經(jīng)網(wǎng)絡(luò)4種數(shù)據(jù)挖掘方法,訓(xùn)練歷史數(shù)據(jù),辨識(shí)風(fēng)電機(jī)組的運(yùn)行模型。神經(jīng)網(wǎng)絡(luò)辨識(shí)的模型誤差最小,CR樹最大。選擇較好的辨識(shí)模型應(yīng)用進(jìn)化策略(ES)優(yōu)化葉片槳距和偏航角,進(jìn)而優(yōu)化輸出功率。文獻(xiàn)[32]中,結(jié)合三角函數(shù)和數(shù)據(jù)挖掘預(yù)測(cè)風(fēng)向,利用正弦余弦函數(shù)將風(fēng)向轉(zhuǎn)換為線性變量。應(yīng)用SVM、MLP網(wǎng)絡(luò)、隨機(jī)森林算法(RFA)和梯度升壓回歸樹(GBRT)4種數(shù)據(jù)挖掘算法在4個(gè)季節(jié)和4個(gè)不同采樣頻率下,辨識(shí)風(fēng)機(jī)偏航系統(tǒng)的預(yù)測(cè)模型,RFA和MLP網(wǎng)絡(luò)辨識(shí)的預(yù)測(cè)模型具有較高的精度。文獻(xiàn)[33]使用神經(jīng)網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)集成、SVM、KNN、回歸樹和隨機(jī)森林回歸6種數(shù)據(jù)挖掘算法,分別建立風(fēng)力發(fā)電機(jī)組的發(fā)電模型、動(dòng)力傳動(dòng)系統(tǒng)振動(dòng)模型和塔架振動(dòng)模型。神經(jīng)網(wǎng)絡(luò)算法建立的發(fā)電模型的屬性較好,神經(jīng)網(wǎng)絡(luò)集成算法在傳動(dòng)系統(tǒng)振動(dòng)模型和塔架振動(dòng)模型的建立中優(yōu)于其他5種算法,神經(jīng)網(wǎng)絡(luò)算法在風(fēng)速預(yù)測(cè)模型的建立方面有很好的性能,所建立的模型可進(jìn)一步用于優(yōu)化控制實(shí)驗(yàn)。文獻(xiàn)[34]用數(shù)據(jù)挖掘算法開(kāi)發(fā)了智能風(fēng)力發(fā)電機(jī)控制系統(tǒng),從SCADA系統(tǒng)的數(shù)據(jù)庫(kù)中辨識(shí)風(fēng)機(jī)模型,從風(fēng)力數(shù)據(jù)中辨識(shí)時(shí)間序列模型,結(jié)合當(dāng)前機(jī)組的狀態(tài)組成模型預(yù)測(cè)控制(MPC)模型,用于風(fēng)電機(jī)組動(dòng)態(tài)控制的研究。

3 總結(jié)與展望

本文系統(tǒng)地概述了數(shù)據(jù)挖掘技術(shù)及其常用算法,通過(guò)總結(jié)國(guó)內(nèi)外相關(guān)文獻(xiàn)中的研究,介紹了數(shù)據(jù)挖掘在風(fēng)力發(fā)電的應(yīng)用現(xiàn)狀與研究進(jìn)展。從研究?jī)?nèi)容上看,數(shù)據(jù)挖掘與風(fēng)力發(fā)電的結(jié)合已經(jīng)取得了一些成果。

利用數(shù)據(jù)挖掘技術(shù)進(jìn)行風(fēng)電機(jī)組的故障診斷,能在保證故障診斷正確率的基礎(chǔ)上同時(shí)有著較高的運(yùn)算性能,實(shí)現(xiàn)海量監(jiān)測(cè)數(shù)據(jù)下診斷對(duì)實(shí)時(shí)性和準(zhǔn)確性的要求。在風(fēng)力發(fā)電機(jī)組的故障預(yù)測(cè)方面,數(shù)據(jù)挖掘方法可以參與故障預(yù)測(cè)的參數(shù)提取、預(yù)處理、建模過(guò)程,具有一定的靈活性和創(chuàng)新性。在進(jìn)行發(fā)電功率預(yù)測(cè)時(shí),數(shù)據(jù)挖掘方法表現(xiàn)出其捕捉實(shí)際風(fēng)電發(fā)展趨勢(shì)的高確定性,且能建立高精度預(yù)測(cè)模型。數(shù)據(jù)挖掘技術(shù)在風(fēng)力發(fā)電機(jī)組模型建立方面的應(yīng)用的良好結(jié)果非常值得關(guān)注,這對(duì)后續(xù)風(fēng)力發(fā)電的研究有深刻的意義。在查閱文獻(xiàn)時(shí),從文獻(xiàn)數(shù)量上可以看出,數(shù)據(jù)挖掘技術(shù)在風(fēng)力發(fā)電領(lǐng)域的相關(guān)研究呈上升趨勢(shì),且已有一定的理論基礎(chǔ)和初步應(yīng)用,這說(shuō)明了該領(lǐng)域的研究向著更深入的方向發(fā)展。

未來(lái)研究工作可在以下方面展開(kāi):

1)風(fēng)電的最大功率跟蹤。所呈現(xiàn)的文獻(xiàn)中運(yùn)用粗糙集理論的分類屬性辨識(shí)功率曲線實(shí)現(xiàn)最大輸出功率點(diǎn)的跟蹤,后續(xù)研究可以借鑒光伏發(fā)電中最大功率跟蹤的相關(guān)研究的數(shù)據(jù)挖掘方法,在風(fēng)電功率跟蹤中探索更多的方法。

2)風(fēng)電機(jī)組模型的辨識(shí)。文獻(xiàn)[25,32-34]中,數(shù)據(jù)挖掘技術(shù)在模型辨識(shí)方面得到較好地的應(yīng)用。文獻(xiàn)[32]中建立精度較高的預(yù)測(cè)模型,說(shuō)明數(shù)據(jù)挖掘技術(shù)在模型辨識(shí)方面研究的價(jià)值性。模型的辨識(shí)對(duì)未來(lái)風(fēng)電機(jī)組的仿真研究有重大的意義。

3)邁向大數(shù)據(jù)時(shí)代的數(shù)據(jù)挖掘。在物聯(lián)網(wǎng)的時(shí)代,海量的風(fēng)電機(jī)組的運(yùn)行數(shù)據(jù)若能共享,則能根據(jù)不同環(huán)境的風(fēng)電機(jī)組運(yùn)行參數(shù),挖掘某一環(huán)境下的一般模型,用相似的方法來(lái)解決同一環(huán)境下的相同問(wèn)題。

猜你喜歡
風(fēng)力數(shù)據(jù)挖掘風(fēng)電
走進(jìn)風(fēng)力發(fā)電
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
海上風(fēng)電躍進(jìn)隱憂
能源(2018年6期)2018-08-01 03:42:00
分散式風(fēng)電破“局”
能源(2018年6期)2018-08-01 03:41:56
風(fēng)電:棄風(fēng)限電明顯改善 海上風(fēng)電如火如荼
能源(2018年8期)2018-01-15 19:18:24
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
大型風(fēng)力發(fā)電設(shè)備潤(rùn)滑概要
重齒風(fēng)電
風(fēng)能(2016年12期)2016-02-25 08:46:38
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
基于GPGPU的離散數(shù)據(jù)挖掘研究
普格县| 白水县| 芦溪县| 精河县| 方城县| 本溪| 永安市| 阳山县| 甘谷县| 通榆县| 兴山县| 本溪| 六安市| 菏泽市| 年辖:市辖区| 武隆县| 措美县| 本溪| 宝鸡市| 通江县| 灵山县| 平邑县| 武清区| 尼木县| 芜湖市| 多伦县| 横山县| 德安县| 敖汉旗| 东兰县| 万全县| 湘乡市| 庆城县| 通辽市| 烟台市| 东乡族自治县| 永兴县| 伽师县| 壤塘县| 潜江市| 奉化市|