王麗杰,唐宏芬,張真真,張路娜
(中國大唐集團(tuán)新能源科學(xué)技術(shù)研究院有限公司,北京 100052)
近年來,風(fēng)力發(fā)電機(jī)在全球范圍內(nèi)得到大量推廣,在滿足電力需求降低電價的同時減少了溫室氣體的排放,極大的推動了全球綠色能源可持續(xù)發(fā)展的進(jìn)程。預(yù)計未來風(fēng)力發(fā)電量將繼續(xù)增加,以實現(xiàn)2030年可再生能源占總發(fā)電量50%的能源目標(biāo)[1]。但是如果沒有采取適當(dāng)?shù)拇胧?,如電力精?zhǔn)預(yù)測、建立儲能系統(tǒng)等,那么風(fēng)力發(fā)電的性能劣化可能會嚴(yán)重破壞供電可靠性、安全性和經(jīng)濟(jì)性[2]。建立儲能系統(tǒng)雖然可以起到降低風(fēng)力發(fā)電性能劣化的作用,但是在處理過程中所需面臨的環(huán)境問題、土地使用問題以及費用問題極大的增加了投入成本。發(fā)電功率預(yù)測模型是一種環(huán)保經(jīng)濟(jì)的解決方案,可以協(xié)助管理部門對風(fēng)電機(jī)組的運行狀態(tài)進(jìn)行評價判斷。當(dāng)風(fēng)電機(jī)組出現(xiàn)發(fā)電性能劣化時,發(fā)出預(yù)警并提醒工作人員關(guān)注風(fēng)電機(jī)組運行狀態(tài),同時指導(dǎo)維護(hù)人員完成相關(guān)設(shè)備維護(hù),杜絕發(fā)電性能劣化的持續(xù)發(fā)生,保證風(fēng)電機(jī)組發(fā)電效率,有效提高風(fēng)電機(jī)場的運行水平[3]。
目前,風(fēng)電機(jī)組發(fā)電性能判斷主要依賴發(fā)電功率曲線進(jìn)行判斷。具體而言,通過設(shè)備采集到的運行數(shù)據(jù),建立機(jī)組發(fā)電功率曲線模型,并通過該模型實時監(jiān)測風(fēng)電機(jī)組發(fā)電功率變化,準(zhǔn)確發(fā)出風(fēng)電機(jī)組性能劣化預(yù)警[4]。然而,由于自然環(huán)境中的風(fēng)速具有非線性特征且有高變化率,且大氣溫度和壓力等也會影響風(fēng)電機(jī)組發(fā)電功率,使得發(fā)電功率預(yù)測模型準(zhǔn)確性較差[5]?,F(xiàn)階段,還沒有典型的風(fēng)電功率預(yù)測模型。因此如何通過提前調(diào)度來提取特征和建立準(zhǔn)確預(yù)測發(fā)電功率的模型以確保電力系統(tǒng)可靠、安全運行成為國內(nèi)外專家研究的重點。
預(yù)測風(fēng)電機(jī)組發(fā)電功率的預(yù)測方法有很多,包括物理模型、統(tǒng)計模型、混合人工神經(jīng)網(wǎng)絡(luò)模型等[6-7]。物理模型方法主要在考慮初始值和邊界條件的基礎(chǔ)上通過物理和大氣的水動力和熱力學(xué)模型進(jìn)行預(yù)測,該方法的發(fā)電功率預(yù)測性能較差[8-9]。常見的統(tǒng)計學(xué)方法如概率自回歸模型和概率質(zhì)量偏差模型等,可建立風(fēng)力發(fā)電與解釋變量之間的關(guān)系,但該方法存在適應(yīng)性和學(xué)習(xí)能力較差的問題,并其性能隨著預(yù)測時間段的增加而降低[10-11]。人工神經(jīng)網(wǎng)絡(luò)具有映射非線性關(guān)系、自學(xué)習(xí)能力強(qiáng)等優(yōu)點,在風(fēng)力發(fā)電預(yù)測中得到廣泛的應(yīng)用[12-14]。該技術(shù)的主要優(yōu)點是不需要任何數(shù)學(xué)模型來建立輸入和輸出數(shù)據(jù)之間的關(guān)系,雖然人工神經(jīng)網(wǎng)絡(luò)在預(yù)測風(fēng)力發(fā)電功率方面表現(xiàn)出了良好的性能,但它也存在著模型過擬合和欠擬合的問題以及在更新隱藏層權(quán)重和偏差方面效率低下[15]。針對這些缺點,Lu等提出了一種使用支持向量機(jī)(Support Vector Machine,SVM)算法預(yù)測短期風(fēng)電發(fā)電功率的框架,即在支持向量機(jī)模型中采用灰狼算法調(diào)整核函數(shù)的參數(shù)[16]。Li等提出了一種支持向量機(jī)與改進(jìn)蜻蜓算法相結(jié)合的風(fēng)力發(fā)電預(yù)測模型,其中采用自適應(yīng)學(xué)習(xí)因子和微分進(jìn)化方法改進(jìn)的蜻蜓算法,對支持向量機(jī)的參數(shù)進(jìn)行優(yōu)化選擇[17]。
深度學(xué)習(xí)模型因其具備較高預(yù)測準(zhǔn)確性,且能克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)缺點如訓(xùn)練時間長和收斂速度慢等而受到國內(nèi)外學(xué)者的廣泛關(guān)注。Abedinia 等提出了一種二維卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN),用于預(yù)測短期和長期風(fēng)力發(fā)電功率,其中小波變換方法用于分解數(shù)據(jù),粒子群優(yōu)化算法用于調(diào)整CNN的權(quán)重以提高模型的預(yù)測精度[18]。
Li等通過使用梯度下降法訓(xùn)練LSTM(long short-term memory,LSTM)神經(jīng)網(wǎng)絡(luò)來預(yù)測短期風(fēng)力發(fā)電功率[19]。Sun等提出了一種由LSTM、小波分解和主成分分析法組成的超短期概率預(yù)測方法,通過建立正態(tài)分布模型以解釋預(yù)測中的不確定誤差[20]。Wang等設(shè)計了一種貝葉斯平均和集合學(xué)習(xí)的混合模型來預(yù)測短期風(fēng)電機(jī)組發(fā)電功率[21]。Niu等提出了一種基于注意力的門控循環(huán)單元(Attention-based Gated Recurrent Unit,AGRU),并開發(fā)一種識別基本輸入變量的注意力機(jī)制作為功能選擇方法用于預(yù)測短期風(fēng)力發(fā)電功率[22]。
He等通過小波變換分解風(fēng)速序列,并使用深度置信網(wǎng)絡(luò)提取特征,開發(fā)了深度學(xué)習(xí)和集成學(xué)習(xí)的組合以預(yù)測風(fēng)力發(fā)電功率。然而,通過機(jī)器學(xué)習(xí)等方法建立的風(fēng)電機(jī)組發(fā)電功率預(yù)測模型需要通過大量數(shù)據(jù)進(jìn)行訓(xùn)練,其中輸入數(shù)據(jù)為監(jiān)測系統(tǒng)采集到的影響發(fā)電功率和性能的相關(guān)因素[23]。郭鵬等基于風(fēng)電機(jī)組的運行原理,分析了環(huán)境因素、變槳系統(tǒng)、偏航系統(tǒng)和控制系統(tǒng)對風(fēng)電機(jī)組性能和發(fā)電功率的影響[24]。謝生清等在上述研究基礎(chǔ)上對風(fēng)向標(biāo)、風(fēng)速儀、葉片機(jī)械對零等幾個影響發(fā)電功率的外部因素進(jìn)行了分析總結(jié)[25]。馬東等考慮了風(fēng)速、槳距角、偏航誤差、葉輪轉(zhuǎn)速等其他變量對發(fā)電功率的影響[5]。但是上述文獻(xiàn)并沒有將影響風(fēng)電機(jī)組發(fā)電功率的所有因素全部考慮進(jìn)去,因此構(gòu)建的發(fā)電功率預(yù)測模型存在一定偏差。
綜上所述,現(xiàn)有文獻(xiàn)針對風(fēng)電機(jī)組發(fā)電功率預(yù)測模型的研究存在以下問題:預(yù)測輸入變量種類多需求量大,同時這些變量需要進(jìn)行預(yù)測,導(dǎo)致附加誤差;通過公式將預(yù)測風(fēng)速轉(zhuǎn)換為風(fēng)力發(fā)電功率時會導(dǎo)致累積誤差;由于技術(shù)局限性,無法使用數(shù)據(jù)分解技術(shù)處理大量數(shù)據(jù)如季節(jié)性影響的數(shù)據(jù);忽略預(yù)測模型的參數(shù)調(diào)整等。
針對現(xiàn)有預(yù)測模型的局限性,本文設(shè)計了一種新型混合深度學(xué)習(xí)預(yù)測模型提高對風(fēng)電機(jī)組發(fā)電功率的預(yù)測準(zhǔn)確性。該預(yù)測模型由卷積層(convolution layers),門控循環(huán)單元(gated recurrent units,GRU)和神經(jīng)網(wǎng)絡(luò)(neural network)組成,首先通過卷積層提取復(fù)雜數(shù)據(jù)集的高維特征,然后使用這些特征訓(xùn)練門控循環(huán)單元以獲取基本特征的長期存儲,最后通過神經(jīng)網(wǎng)絡(luò)建立由前一層處理的輸出和輸入數(shù)據(jù)集之間的關(guān)系。新型混合深度學(xué)習(xí)預(yù)測模型的參數(shù)通過網(wǎng)格搜索技術(shù)進(jìn)行系統(tǒng)調(diào)整,以提高預(yù)測準(zhǔn)確性。
傳統(tǒng)風(fēng)力發(fā)電功率預(yù)測模型中,首先需要通過其他預(yù)測方法對影響風(fēng)力發(fā)電功率的影響因素如風(fēng)速,風(fēng)向,氣溫,氣壓數(shù)據(jù)等進(jìn)行預(yù)測估計,然后依據(jù)這些預(yù)測數(shù)據(jù)通過預(yù)測模型對發(fā)電功率進(jìn)行預(yù)測,因此會導(dǎo)致更多的預(yù)測誤差。本文設(shè)計的基于混合深度學(xué)習(xí)預(yù)測模型通過時間序列法預(yù)測風(fēng)力發(fā)電功率,不需要對影響風(fēng)力發(fā)電功率的影響因素進(jìn)行先驗預(yù)測,只需要通過分析過去數(shù)據(jù)的模式來預(yù)測風(fēng)力發(fā)電量。時間序列法中X=x1,x2,……xt是一段時間范圍內(nèi)的觀察序列,其中表示在時間t處的觀察數(shù)據(jù)值,X表示觀察數(shù)值的總數(shù)目?;旌仙疃葘W(xué)習(xí)模型的輸入和輸出數(shù)據(jù)集通過滑動窗口方法從時序數(shù)據(jù)中獲得,如圖1所示。其中,Sw代表滑動窗口,fh代表預(yù)測范圍區(qū)間,d(t)代表在時間t處的時間序列,Y代表輸出數(shù)據(jù)。在滑動窗口范圍內(nèi)的時間序列作為模型的輸入數(shù)據(jù),預(yù)測范圍區(qū)間內(nèi)的數(shù)據(jù)為輸出數(shù)據(jù),滑動窗口每次移動一個單位時間步長。圖1展示了用于訓(xùn)練和測試模型的數(shù)據(jù)集,其中n代表輸出數(shù)據(jù)集中的時間步長。
圖1 滑動窗口方法獲取數(shù)據(jù)
混合深度學(xué)習(xí)模型架如圖2所示。
圖2 混合深度學(xué)習(xí)模型框架
卷積神經(jīng)網(wǎng)絡(luò)CNN由卷積層,池化層和全連接層組成,具有捕獲相同數(shù)據(jù)模式的能力,可以成功用于復(fù)雜較高的數(shù)據(jù)格式。CNN主要用于的網(wǎng)格狀拓?fù)浣Y(jié)構(gòu),例如視覺圖像的二維或三維數(shù)據(jù),但同時它也可用于一維的數(shù)據(jù),例如作為單變量時間序列數(shù)據(jù)。在本文中,一維CNN用于提取短期風(fēng)力發(fā)電的非線性輸入和輸出數(shù)據(jù)集之間復(fù)雜關(guān)系的特征。
卷積層的功能是通過數(shù)學(xué)卷積算子和求解交叉相關(guān)對輸入數(shù)據(jù)進(jìn)行特征提取,卷積運算公式如下:
(1)
在卷積層進(jìn)行特征提取后,輸出的特征圖會被傳遞至池化層(pooling layer)進(jìn)行特征選擇和信息過濾,通過將混合一層的神經(jīng)元簇輸出到下一層中的單個神經(jīng)中來減小數(shù)據(jù)的大小。
池化層包含預(yù)設(shè)定的池化函數(shù),其功能是將特征圖中單個點的結(jié)果替換為其相鄰區(qū)域的特征圖統(tǒng)計量。上一層中每個神經(jīng)元簇的最大值用于最大池,而神經(jīng)元簇的平均值用于平均池,在本文基于深度學(xué)習(xí)模型中使用平均池。每個特征圖都分類為一組子區(qū)域,并且每個子區(qū)域通過下采樣進(jìn)行組合以生成新元素。通過順序向下采樣可以創(chuàng)建一個新的低維特征圖,其表示如下:
(2)
GRU由Kyunghyun Cho在2014年提出的循環(huán)網(wǎng)絡(luò)的門控機(jī)制,是LSTM的簡化版本。GRU解決了梯度消失的問題,即長期依賴關(guān)系中的梯度傳播失敗,類似于LSTM模型,但參數(shù)較少。GRU網(wǎng)絡(luò)的主要思想是利用具有簡單結(jié)構(gòu)的特定神經(jīng)元在長時間內(nèi)存儲和傳輸信息,以獲得永久性記憶,減少信息破壞的速度,捕獲長期依賴性。在GRU架構(gòu),只有兩個柵極,復(fù)位柵極和更新柵極,如圖2中所示。數(shù)學(xué)建??梢员硎救缦拢?/p>
zt=σ(Wzg[ht-1,xt]+bz)
(3)
rt=σ(Wrg[ht-1,xt]+br)
(4)
(5)
(6)
通過使用輸入和輸出數(shù)據(jù)集訓(xùn)練網(wǎng)絡(luò)來執(zhí)行這些操作,從而建立它們之間的關(guān)系。提供輸入數(shù)據(jù)后,將經(jīng)過訓(xùn)練的網(wǎng)絡(luò)用作預(yù)測輸出的模型。在訓(xùn)練中,網(wǎng)絡(luò)會更新其權(quán)重以盡可能準(zhǔn)確地了解這種關(guān)系。為了學(xué)習(xí)輸入和輸出數(shù)據(jù)之間的復(fù)雜關(guān)系,本研究使用ReLU激活函數(shù)來簡化訓(xùn)練并獲得更好的性能。
對于任何大于零的值,ReLU都是線性的,但是對于任何負(fù)值,ReLU仍然是非線性的。由于該函數(shù)對于任何正值都是線性的,因此在使用反向傳播訓(xùn)練網(wǎng)絡(luò)期間,可以輕松更新其權(quán)重。
本節(jié)通過分析預(yù)測風(fēng)力發(fā)電功率來驗證混合深度學(xué)習(xí)模型的預(yù)測結(jié)果以及對風(fēng)電機(jī)組發(fā)電性能劣化的預(yù)警情況。首先,對混合深度學(xué)習(xí)網(wǎng)絡(luò)的超參數(shù)調(diào)整,以確定最佳預(yù)測模型。通過網(wǎng)格搜索方法,從可能的參數(shù)設(shè)置中選擇最佳參數(shù)。然后,針對同樣的算例,對比不同預(yù)測方法LSTM、SVM、GRU、RNN下的預(yù)測結(jié)果,通過對比預(yù)測結(jié)果驗證本文所提模型的有效性。預(yù)測模型和算例實驗在處理器Intel Core i7 9th,主頻3.00 GHz,內(nèi)存16 G的測試平臺上進(jìn)行,編程語言環(huán)境為Python 3.7。
由于SCADA數(shù)據(jù)取自實際風(fēng)電場,這些數(shù)據(jù)容易受到噪聲,異常值和丟失數(shù)據(jù)的影響,進(jìn)而影響到模型的準(zhǔn)確度。通信失敗是丟失數(shù)據(jù)的主要原因,數(shù)據(jù)的異常值被簡單地刪除并視為缺失值。
缺失值:風(fēng)力發(fā)電的缺失值由缺失數(shù)據(jù)的前三個和下一個時間步的平均值填充;
數(shù)據(jù)轉(zhuǎn)換:由于通過捕獲風(fēng)電機(jī)組發(fā)電記錄的數(shù)據(jù)種類繁多,存在不同種類數(shù)據(jù)描述風(fēng)電機(jī)組同一個屬性特征的情況,首先要將關(guān)于風(fēng)電機(jī)組同一屬性特征的不同種類數(shù)據(jù)進(jìn)行合并,在降低數(shù)據(jù)維度的同時可以得到更為全面的數(shù)據(jù)信息。故首先通過數(shù)據(jù)聚合技術(shù)對捕獲的數(shù)據(jù)樣本進(jìn)行數(shù)據(jù)聚合。然后對聚合后的數(shù)據(jù)進(jìn)行歸一化處理,以消除參數(shù)間不同數(shù)量級對機(jī)器學(xué)習(xí)模型的差異性影響。
數(shù)據(jù)結(jié)構(gòu):為了在接下來的步驟中預(yù)測風(fēng)電場的風(fēng)力發(fā)電功率,通過使用移動窗口方法將輸入時間序列轉(zhuǎn)換為輸入-輸出對,將數(shù)據(jù)分為輸入和輸出格式,如下所示:
[xt+1,xt+2,…,xt+h]=f(xt,xt-1,…,xt-w)
(8)
式中:w輸入數(shù)據(jù)的窗口大?。粁t時間序列數(shù)據(jù);h預(yù)測范圍;f通過訓(xùn)練建立的深度學(xué)習(xí)模型。
通過網(wǎng)格搜索方法對混合深度學(xué)習(xí)模型進(jìn)行的調(diào)整,以實現(xiàn)風(fēng)力發(fā)電預(yù)測的最佳預(yù)測模型。由于混合深度學(xué)習(xí)模型是隨機(jī)的,需要對模型進(jìn)行多次評估以獲得在預(yù)測方面的可靠配置,本文在校驗參數(shù)時進(jìn)行10次評估,并選擇樣本結(jié)果的中位數(shù)作為參數(shù)的最佳配置的標(biāo)準(zhǔn)。通過算例實驗得出各個超參數(shù)的最佳標(biāo)準(zhǔn):GRU層2層,神經(jīng)網(wǎng)絡(luò)層2層,卷積層中卷積核大小為3,過濾器尺寸為64。
通過使用平均絕對誤差(Mean Absolute Error,MAE)指標(biāo)對所提出模型的性能進(jìn)行不同預(yù)測方法對比評價。MAE是指實際值和預(yù)測值之間的絕對誤差的平均值,MAE可用作性能指標(biāo),可以避免數(shù)據(jù)集中的異常值(極值)的影響,MAE的較小值表示預(yù)測的準(zhǔn)確性較高。
(9)
收集某地風(fēng)電機(jī)場的1個自然年的數(shù)據(jù)樣本用于訓(xùn)練和測試預(yù)測模型,樣本時間間隔為5min,其中95%的數(shù)據(jù)用于訓(xùn)練預(yù)測模型,剩余5%的數(shù)據(jù)用于測試所提模型的有效性。該預(yù)測模型在5%數(shù)據(jù)下的測試結(jié)果如圖3所示。
圖3 模型預(yù)測結(jié)果
其中圖3(a)是整體預(yù)測結(jié)果,圖3(b)是為進(jìn)一步清晰展示預(yù)測結(jié)果,截取第600~1000的樣本數(shù)據(jù)及其預(yù)測結(jié)果??梢钥闯鲱A(yù)測值接近實際值,且在圖所示的預(yù)測數(shù)據(jù)中存在幾個峰值之后,預(yù)測值的誤差也非常低。在預(yù)測測試數(shù)據(jù)時,預(yù)測值與實際值之間的平均絕對差為2.48,同時也沒有出現(xiàn)過度擬合和擬合不足的問題。
在本節(jié)中通過預(yù)測某地風(fēng)電場的風(fēng)力發(fā)電功率,進(jìn)一步評估了預(yù)測模型對風(fēng)電機(jī)組發(fā)電性能劣化判斷的可行性。選取實驗機(jī)組為期1年的數(shù)據(jù)并對數(shù)據(jù)進(jìn)行預(yù)處理。其中95%的數(shù)據(jù)用于訓(xùn)練預(yù)測模型,5%的數(shù)據(jù)用于測試驗證。通過與對比預(yù)測模型LSTM、SVM、GRU、RNN進(jìn)行比較,可以得到MAE性能指標(biāo)的結(jié)果,如圖4所示。
從圖4可知,LSTM模型的MAE指數(shù)為2.34,GRU模型的MAE指數(shù)為2.35,SVM模型的MAE指數(shù)為2.37,RNN模型的MAE指數(shù)為2.37,而本文所提預(yù)測模型的MAE指數(shù)為2.32,性能最好。
圖4 不同預(yù)測模型預(yù)測結(jié)果比較
圖5展示了本文所提預(yù)測模型對該地風(fēng)電機(jī)組發(fā)電功率的預(yù)測曲線與實際發(fā)電功率曲線。
圖5 基于混合深度學(xué)習(xí)預(yù)測模型預(yù)測結(jié)果
通過觀察圖5中(a)圖可得:在統(tǒng)計數(shù)據(jù)時間剛開始時,發(fā)電機(jī)組運行正常,預(yù)測模型預(yù)測發(fā)電功率數(shù)據(jù)與實際發(fā)電功率數(shù)據(jù)高度吻合,但是存在部分時段實際發(fā)電功率數(shù)據(jù)與預(yù)測發(fā)電功率數(shù)據(jù)出現(xiàn)偏差,將圖5(a)中虛線框內(nèi)的偏差數(shù)據(jù)結(jié)果放大如圖5中(b)圖所示,此時預(yù)測數(shù)值大于實際數(shù)值。
同時對該部分樣本數(shù)據(jù)進(jìn)行統(tǒng)計指數(shù)加權(quán)移動平均值控制圖法(Exponentially Weighted Moving-Average,EWMA)殘差分析[5]可以得出此時超出EWMA控制圖的上下控制限,如圖6所示。
圖6 EWMA殘差分析
WMA統(tǒng)計量在該時間段內(nèi)出現(xiàn)多次持續(xù)超過控制圖下限,則此時說明發(fā)電機(jī)組出現(xiàn)性能劣化情況,系統(tǒng)發(fā)出警報。風(fēng)電機(jī)組維護(hù)小組維護(hù)后,實際發(fā)電功率數(shù)據(jù)與預(yù)測發(fā)電功率數(shù)據(jù)重新高度吻合,此時風(fēng)電機(jī)組性能得到恢復(fù)。
(1)提出了一種新型混合深度學(xué)習(xí)模型預(yù)測風(fēng)電機(jī)組發(fā)電功率,該模型由卷積層,門控循環(huán)單元層和神經(jīng)網(wǎng)絡(luò)層組成。卷積層提取數(shù)據(jù)特征,門控循環(huán)單元將信息保留在內(nèi)存中,提高了預(yù)測準(zhǔn)確性。通過風(fēng)電場中實際風(fēng)力發(fā)電的數(shù)據(jù)樣本對預(yù)測模型進(jìn)行訓(xùn)練和測試,系統(tǒng)地調(diào)整預(yù)測模型的參數(shù),確保了預(yù)測模型的準(zhǔn)確度。最后通過對比其他現(xiàn)有文獻(xiàn)的預(yù)測模型,驗證了本文所提預(yù)測模型的有效性。
(2)未來將考慮不同的大氣條件的情況下,將短期風(fēng)電功率預(yù)測的準(zhǔn)確性與短期風(fēng)能預(yù)測的準(zhǔn)確性進(jìn)行比較,進(jìn)一步研究混合模型的有效性。