李秀昊?,劉懷西,張智勇,張敏,吳迪,苗得勝
(1.明陽智慧能源集團(tuán)股份公司, 廣東 中山 528437;2.中國(guó)南方電網(wǎng)廣東中山供電局, 廣東 中山 528437)
在風(fēng)力發(fā)電中,偏航系統(tǒng)依據(jù)風(fēng)向進(jìn)行對(duì)風(fēng)操作,準(zhǔn)確對(duì)風(fēng)可以降低風(fēng)力發(fā)電機(jī)組的載荷、提高風(fēng)能利用率,進(jìn)而提高發(fā)電量,直接影響機(jī)組的經(jīng)濟(jì)性和安全性[1]。而風(fēng)向卻是隨機(jī)的、不穩(wěn)定的,這使得偏航系統(tǒng)的對(duì)風(fēng)存在一定的誤差和滯后性,繼而導(dǎo)致偏航系統(tǒng)偏航動(dòng)作頻繁。因此,風(fēng)向的準(zhǔn)確預(yù)測(cè)可以提高偏航系統(tǒng)的對(duì)風(fēng)精度、減小偏航滯后性,有利于風(fēng)電場(chǎng)結(jié)合風(fēng)向變化趨勢(shì)制定偏航控制策略,進(jìn)而對(duì)偏航優(yōu)化提供保障,對(duì)風(fēng)電企業(yè)經(jīng)濟(jì)、安全生產(chǎn)具有較大的工程實(shí)踐指導(dǎo)意義。
風(fēng)向建模方法主要分為物理建模法、統(tǒng)計(jì)建模法和數(shù)據(jù)驅(qū)動(dòng)建模法。物理建模法通常利用數(shù)值天氣預(yù)報(bào)(Numerical Weather Prediction,NWP)數(shù)據(jù)進(jìn)行建模[2],模型計(jì)算量大,主要用于長(zhǎng)期預(yù)測(cè)。統(tǒng)計(jì)建模法一般使用時(shí)間序列建模,主要包括自回歸移動(dòng)平均模型(Autoregressive Moving Average model,ARMA)[3]、自回歸差分移動(dòng)平均模型(Autoregressive Integrated Moving Average model, ARIMA)[4]、自回歸條件異方差模型(Autoregressive Conditional Heteroskedasticity model, ARCH)[5]等,相比于物理模型,統(tǒng)計(jì)建模法不用求解復(fù)雜的物理模型,計(jì)算效率高,常用于短期預(yù)測(cè),但無法準(zhǔn)確地描述非線性數(shù)據(jù)。由于風(fēng)向數(shù)據(jù)具有非線性、非平穩(wěn)性、隨機(jī)性等特點(diǎn),數(shù)據(jù)驅(qū)動(dòng)模型可有效地處理復(fù)雜時(shí)序預(yù)測(cè),BP神經(jīng)網(wǎng)絡(luò)[6]、支持向量機(jī)[7]等模型都取得不錯(cuò)的效果。張亞超[8]等提出一種基于VMD-SE和基模型的自適應(yīng)多層級(jí)綜合預(yù)測(cè)模型,可實(shí)現(xiàn)短期風(fēng)電功率3步預(yù)測(cè)。但傳統(tǒng)的淺層神經(jīng)網(wǎng)絡(luò)難以充分挖掘數(shù)據(jù)的深層特征,導(dǎo)致模型預(yù)測(cè)精度受限。深度學(xué)習(xí)以其強(qiáng)大的特征提取能力,在時(shí)序預(yù)測(cè)等任務(wù)上取得巨大的成功。唐振浩[9]等提出一種基于數(shù)據(jù)解析的混合建模算法(Data Analytics based Hybrid Algorithm,DAHA),可實(shí)現(xiàn)風(fēng)向的單步預(yù)測(cè)。林濤[10]等提出1種變分模態(tài)分解(VMD)和蝙蝠算法(Bat Algorithm,BA)優(yōu)化長(zhǎng)短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的短期風(fēng)向預(yù)測(cè)模型,可提前預(yù)測(cè)未來 5 min、15 min 和 30 min 的風(fēng)向。向玲[11]等提出一種變分模態(tài)分解(VMD)-模糊信息?;‵uzzy Information Granulation, FIG)和參數(shù)優(yōu)化門控循環(huán)單元(Gate Recurrent Unit,GRU)的風(fēng)速多步區(qū)間預(yù)測(cè)方法,可實(shí)現(xiàn)風(fēng)速3步區(qū)間預(yù)測(cè)。由于風(fēng)向具有強(qiáng)波動(dòng)性和隨機(jī)性等特點(diǎn),但現(xiàn)有文獻(xiàn)進(jìn)行超短期風(fēng)向預(yù)測(cè)時(shí)多為單步預(yù)測(cè),且風(fēng)向多步預(yù)測(cè)中預(yù)測(cè)步長(zhǎng)較短,難以滿足風(fēng)電場(chǎng)的實(shí)際生產(chǎn)需求。
為此,針對(duì)超短期風(fēng)向多步準(zhǔn)確預(yù)測(cè),本文提出一種基于VMD-LSTM的風(fēng)向多步預(yù)測(cè)算法,準(zhǔn)確預(yù)測(cè)未來4 h的風(fēng)向。首先,通過自相關(guān)函數(shù)計(jì)算風(fēng)向不同時(shí)期之間的相關(guān)性,以選取模型最佳的風(fēng)向序列輸入長(zhǎng)度;然后,針對(duì)風(fēng)向數(shù)據(jù)波動(dòng)性、隨機(jī)性的特點(diǎn),采用變分模態(tài)分解法將風(fēng)向序列分解為相對(duì)穩(wěn)定的模態(tài)信號(hào),通過最小樣本熵確定分解的子模態(tài)數(shù),并對(duì)分解后的模態(tài)信號(hào)分別建立超短期風(fēng)向預(yù)測(cè)模型進(jìn)行預(yù)測(cè);最后,重構(gòu)風(fēng)向序列,疊加各分量預(yù)測(cè)結(jié)果,實(shí)現(xiàn)超短期風(fēng)向24步預(yù)測(cè)。
明陽智能某風(fēng)電場(chǎng)3個(gè)風(fēng)電機(jī)組(1#、2#、3#)1年風(fēng)向數(shù)據(jù)的風(fēng)玫瑰圖如圖1所示。其中,扇形區(qū)域的顏色表示不同的風(fēng)速大小,長(zhǎng)度表示風(fēng)向的頻率。
由圖1所示及統(tǒng)計(jì)可知,1#、2#號(hào)風(fēng)機(jī)的主導(dǎo)風(fēng)向?yàn)闁|,3#號(hào)風(fēng)機(jī)的主導(dǎo)風(fēng)向?yàn)闁|南偏東;1#、2#、3#號(hào)風(fēng)機(jī)的盛行風(fēng)向區(qū)間為(67.5°,112.5°),盛行風(fēng)頻率分別為40.31%、39.96%、40.61%。雖然1#、2#、3#號(hào)風(fēng)機(jī)同處一風(fēng)場(chǎng),但受風(fēng)機(jī)排布位置及尾流的影響[12],同一風(fēng)場(chǎng)不同風(fēng)機(jī)的風(fēng)向也有所差別。由此可見,風(fēng)向存在較大的隨機(jī)性與不穩(wěn)定性,進(jìn)一步增大了風(fēng)向預(yù)測(cè)的難度。
圖1 全年風(fēng)向玫瑰圖Fig.1 Year-round wind rose map
不同的序列輸入長(zhǎng)度對(duì)模型的預(yù)測(cè)結(jié)果有一定的影響。模型輸入的序列長(zhǎng)度過短,難以表征序列特征,降低模型預(yù)測(cè)的準(zhǔn)確率;輸入序列過長(zhǎng)導(dǎo)致信息冗余,降低模型的建模效率。本文采用自相關(guān)函數(shù)計(jì)算前k個(gè)時(shí)刻(k> 0 )的風(fēng)向xt?k與當(dāng)前時(shí)刻的風(fēng)向xt之間的相關(guān)性,以選取最佳的風(fēng)向序列輸入長(zhǎng)度。
自相關(guān)函數(shù)(Autocorrelation Function, ACF)用于度量同一事件在不同時(shí)期之間的相關(guān)性程度。對(duì)于時(shí)間序列 {Xt} ,ACF度量時(shí)間序列中每隔k個(gè)時(shí)間單位(xt和xt?k)的觀測(cè)值之間的相關(guān)性,計(jì)算公式如下:
式中:
如圖2所示,橫坐標(biāo)表示時(shí)間滯后長(zhǎng)度,縱坐標(biāo)表示滯后為k個(gè)時(shí)刻的風(fēng)向序列與當(dāng)前序列的相關(guān)性。本文計(jì)算了72個(gè)樣本點(diǎn)的相關(guān)性,隨著k的增大,歷史風(fēng)向與當(dāng)前風(fēng)向的相關(guān)性逐漸減弱,當(dāng)k>35↖時(shí)其自相關(guān)系數(shù)小于0.6。為了兼顧模型的預(yù)測(cè)精度與效率,選擇自相關(guān)系數(shù)大于0.6的序列。此外,輸入序列長(zhǎng)度應(yīng)不少于預(yù)測(cè)序列長(zhǎng)度,本文中預(yù)測(cè)未來4 h的風(fēng)向,即輸入序列長(zhǎng)度應(yīng)不少于24個(gè)樣本點(diǎn)。因此,本文選取自相關(guān)系數(shù)大于0.6的前24個(gè)采樣點(diǎn)的風(fēng)向作為模型的輸入序列。
圖2 風(fēng)向自相關(guān)性Fig.2 The autocorrelation coefficient of wind direction
變分模態(tài)分解(Variational Mode Decomposition,VMD)是一種完全內(nèi)在、自適應(yīng)、非遞歸的信號(hào)分解技術(shù)[13],通過求解約束變分問題,將信號(hào)轉(zhuǎn)換到頻域內(nèi)分解為K個(gè)有限帶寬的本征模函數(shù)(Intrinsic Mode Function, IMF),這種方法可以有效避免經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition, EMD)和局部均值分解(Local Mean Decomposition, LMD),在分解中由于遞歸分解模式所造成的包絡(luò)線估計(jì)誤差,具備強(qiáng)大的非線性和非平穩(wěn)性信號(hào)處理能力,相比于EMD和集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)等信號(hào)分解方法,它在解決信號(hào)噪聲和避免模態(tài)混疊的問題上有顯著優(yōu)勢(shì)。但VMD分解的IMF子模態(tài)數(shù)K對(duì)分解結(jié)果有很大的影響:當(dāng)K太小時(shí),分解后的序列會(huì)丟失過多信息從而導(dǎo)致模態(tài)混疊;當(dāng)K太大時(shí),會(huì)出現(xiàn)過度分解的問題。
為了評(píng)估序列數(shù)據(jù)的復(fù)雜性,Richman和Moornan等[14]提出樣本熵(Sample Entropy, SE),通過度量信號(hào)中產(chǎn)生新模式的概率大小來衡量時(shí)間序列的復(fù)雜性,時(shí)間序列越復(fù)雜,樣本熵的值越大。
針對(duì)風(fēng)向數(shù)據(jù)波動(dòng)性、隨機(jī)性的特點(diǎn),本文采用VMD對(duì)風(fēng)向序列進(jìn)行分解,得到多個(gè)穩(wěn)定的子信號(hào),通過最小SE值對(duì)VMD進(jìn)行優(yōu)化[15],以獲取合適的K值。
長(zhǎng)短期記憶(Long Short-Term Memory, LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),主要為了解決長(zhǎng)序列訓(xùn)練過程中的梯度消失和梯度爆炸問題[16]。相比于RNN,LSTM能夠在更長(zhǎng)的序列中有更好的表現(xiàn)。LSTM由多個(gè)單元組成,每個(gè)LSTM單元包括3個(gè)門控系統(tǒng)和1個(gè)記憶單元,具體為:
遺忘門:
輸入門:
輸出門:
記憶單元狀態(tài)值:
LSTM記憶單元在t時(shí)刻的輸出:
式(2)~式(6)中,w(Ft,It,Ot,Ct)和b(Ft,It,Ot,Ct)為三個(gè)門控單元和記憶單元的權(quán)重和偏置值。
本文采用兩層的LSTM網(wǎng)絡(luò)挖掘風(fēng)向時(shí)序序列的深層特征,每層的神經(jīng)元個(gè)數(shù)為100,學(xué)習(xí)率為0.001,優(yōu)化器為Adam,迭代次數(shù)為10,激活函數(shù)為ReLU,如圖3所示。
圖3 LSTM結(jié)構(gòu)Fig.3 The structure of LSTM
本文采用明陽智能某風(fēng)電場(chǎng)數(shù)據(jù)采集與監(jiān)視控制系統(tǒng)(SCADA)提供的2021年風(fēng)向數(shù)據(jù)。風(fēng)向數(shù)據(jù)來源于3個(gè)風(fēng)力發(fā)電機(jī)(1#、2#、3#),時(shí)間粒度為10 min,按季度分為4組。為保證時(shí)間樣本的順序性,使用樣本總量前70%的序列作為訓(xùn)練集,后30%的時(shí)間序列作為測(cè)試集,具體如表1所示。
表1 數(shù)據(jù)集信息Tab.1 Dataset information
根據(jù) GB/T 37523-2019[17]對(duì)風(fēng)向數(shù)據(jù)進(jìn)行合理范圍篩選,剔除異常數(shù)據(jù)值,使用滑動(dòng)平均法對(duì)缺失數(shù)據(jù)進(jìn)行插補(bǔ);采用最大-最小歸一化方法對(duì)風(fēng)向數(shù)據(jù)進(jìn)行處理,將風(fēng)向數(shù)據(jù)映射到[0,1]內(nèi),歸一化計(jì)算如下:
式中:
yt′?t時(shí) 刻歸一化后的風(fēng)向數(shù)據(jù);
yt?t時(shí) 刻的原始風(fēng)向數(shù)據(jù);
ymax?風(fēng)向序列的最大值;
ymin?風(fēng)向序列的最小值。
本文采用絕對(duì)平均誤差(Mean Absolute Error,MAE)、均方根誤差(Root Mean Square Error, RMSE)、平 均 絕 對(duì) 百 分 比 誤 差 (Mean Absolute PercentageError, MAPE)作為評(píng)價(jià)指標(biāo),衡量預(yù)測(cè)值與真實(shí)值的偏離程度、評(píng)價(jià)數(shù)據(jù)的變化程度、定量評(píng)價(jià)預(yù)測(cè)模型,其表達(dá)式分別為:
式中:
ytrue?真實(shí)值;
ypre?預(yù)測(cè)值;
n?樣本個(gè)數(shù)。
本文算法流程圖如圖4所示。
圖4 算法流程圖Fig.4 Algorithm flowchart
具體步驟如下:
1) 采集風(fēng)向序列并對(duì)其進(jìn)行預(yù)處理。
2) 繪制風(fēng)向玫瑰圖,分析風(fēng)向特征。
3) 基于ACF計(jì)算風(fēng)向不同時(shí)期之間的相關(guān)性,選取自相關(guān)系數(shù)大于0.6的前24個(gè)采樣點(diǎn)的風(fēng)向作為模型的輸入序列。
4) 采用VMD將風(fēng)向序列分解為相對(duì)穩(wěn)定的模態(tài)信號(hào),通過最小樣本熵確定分解的子模態(tài)數(shù)K。
5) 對(duì)分解后的K個(gè)模態(tài)信號(hào)分別建立預(yù)測(cè)模型,進(jìn)行超短期風(fēng)向多步預(yù)測(cè)。
6) 重構(gòu)風(fēng)向序列,疊加各分量預(yù)測(cè)結(jié)果。
3.4.1 基于 SE 的 VMD 分解模態(tài)數(shù)確定
VMD分解的子模態(tài)數(shù)K直接決定了風(fēng)向信號(hào)分解的好壞,對(duì)預(yù)測(cè)結(jié)果有一定的影響。本文利用VMD對(duì)風(fēng)向數(shù)據(jù)進(jìn)行分解得到K個(gè)IMF,計(jì)算每個(gè)IMF的SE值,以獲得具有最小SE的序列作為趨勢(shì)項(xiàng),通過對(duì)比不同K值的最小SE值以確定子模態(tài)數(shù)。本文令K取值為2~10,如圖5顯示了在取不同K值時(shí)最小SE值和預(yù)測(cè)絕對(duì)平均誤差的變化趨勢(shì)。
圖5 最小樣本熵和絕對(duì)平均誤差的變化趨勢(shì)Fig.5 Variation trend of minimum sample entropy and absolute mean error
由圖5可知,隨著VMD分解的子模態(tài)數(shù)K的增加,最小樣本熵的值減小,風(fēng)向預(yù)測(cè)模型的絕對(duì)平均誤差MAE減小,并且兩者衰減的變化趨勢(shì)基本保持一致,表明最小樣本熵的值能夠有效地表征信號(hào)分解能力。當(dāng)子模態(tài)數(shù)K較小時(shí),原始風(fēng)向信號(hào)分解不足,序列趨勢(shì)項(xiàng)中混入了其他干擾項(xiàng),使得SE值較大。隨著K值的增大,SE值逐漸變小,當(dāng)取得適當(dāng)?shù)腒值時(shí),SE值驟減,此時(shí)再增大分解次數(shù)K,SE值變化較小,并且逐漸趨于穩(wěn)定。因此,將SE驟減趨于穩(wěn)定的轉(zhuǎn)折點(diǎn)作為VMD分解的次數(shù),以避免過度分解。在本文中,取K=9,即利用VMD將原始風(fēng)向信號(hào)分解為9個(gè)子序列,如圖6所示。
圖6 原始風(fēng)向信號(hào)VMD分解Fig.6 Original wind direction decomposition by VMD
3.4.2 基于 VMD-LSTM 的風(fēng)向多步預(yù)測(cè)
為驗(yàn)證VMD分解對(duì)預(yù)測(cè)結(jié)果的影響,進(jìn)行VMD分解前后對(duì)比算法建模預(yù)測(cè)結(jié)果的比較。由表2、圖7和圖8可知,VMD-LSTM在4個(gè)季度的24步風(fēng)向預(yù)測(cè)的平均 MAE、RMSE、MAPE為 8.430°、16.870°、9.155,比未分解的LSTM模型平均減少77.91%、69.30%、69.42%,因此,VMD將原始風(fēng)向序列分解為相對(duì)穩(wěn)定的模態(tài)信號(hào),可以有效地降低風(fēng)向的非線性、非平穩(wěn)性和隨機(jī)性,提高風(fēng)向序列預(yù)測(cè)的準(zhǔn)確性。
圖7 LSTM與VMD-LSTM預(yù)測(cè)結(jié)果對(duì)比Fig.7 Comparison of LSTM and VMD-LSTM forecast results
圖8 基于VMD-LSTM的風(fēng)向多步預(yù)測(cè)結(jié)果Fig.8 Wind direction multistep forecast results based on VMD-LSTM
表2 基于VMD-LSTM的風(fēng)向多步預(yù)測(cè)結(jié)果Tab.2 Wind direction multistep forecast results based on VMD-LSTM
預(yù)測(cè)誤差隨著預(yù)測(cè)時(shí)間的增加而累加,進(jìn)而導(dǎo)致誤差逐步增大,LSTM模型平均每步誤差增長(zhǎng)約為1.26°,VMD-LSTM模型誤差穩(wěn)步增長(zhǎng),增長(zhǎng)幅度較小,平均每步誤差增長(zhǎng)約為0.29°,說明VMD-LSEM模型可以有效地降低誤差的增長(zhǎng)速度,穩(wěn)定誤差增長(zhǎng)幅度。
3.4.3 風(fēng)向預(yù)測(cè)方法比較
不同的預(yù)測(cè)方法對(duì)超短期風(fēng)向多步預(yù)測(cè)有一定的影響。本文基于不同季度的風(fēng)向分別構(gòu)建ARMA、RF、VMD-RF、LSTM、VMD-LSTM模型。
由表3和圖9可知,VMD-LSTM在每個(gè)季度的各個(gè)誤差評(píng)價(jià)指標(biāo)均優(yōu)于其他算法。VMD-LSTM模型較表現(xiàn)次好的VMD-RF模型,其平均MAE、RMSE、MAPE分別減少37.19%、23.80%、26.85%。通過不同建模算法的試驗(yàn),結(jié)果表明,VMD-LSTM在不同季度下的風(fēng)向具有更高的準(zhǔn)確性和較好的預(yù)測(cè)能力。此外,VMD-LSTM和VMD-RF比未分解的模型LSTM和RF的MSE分別降低了77.91%和57.86%,說明經(jīng)過分解后的建模精度有較大幅度的提高,VMD在提取風(fēng)向趨勢(shì)信息方面具有較好的能力。
圖9 不同方法的風(fēng)向預(yù)測(cè)結(jié)果Fig.9 Wind direction forecast results of different methods
表3 不同方法的風(fēng)向預(yù)測(cè)結(jié)果Tab.3 Wind direction forecast results of different methods
3.4.4 不同風(fēng)機(jī)預(yù)測(cè)結(jié)果
為檢驗(yàn)該方法對(duì)不同風(fēng)機(jī)的風(fēng)向預(yù)測(cè)效果,本文對(duì)比分析了同一風(fēng)場(chǎng)1#、2#、3#號(hào)風(fēng)機(jī),絕對(duì)平均誤差MAE見表4。
表4 不同風(fēng)機(jī)的風(fēng)向預(yù)測(cè)結(jié)果MAETab.4 MAE of wind direction forecast for different wind turbines (°)
雖然1#、2#、3#號(hào)風(fēng)機(jī)同處一風(fēng)場(chǎng),但受風(fēng)機(jī)排布位置及尾流的影響,導(dǎo)致不同風(fēng)機(jī)在每個(gè)季度的預(yù)測(cè)結(jié)果也有所差異,但不同風(fēng)機(jī)的預(yù)測(cè)總體誤差差距較小,說明VMD-LSTM可適用于同一風(fēng)場(chǎng)不同風(fēng)機(jī)的預(yù)測(cè),具有良好的泛化能力。
由于風(fēng)向具有強(qiáng)波動(dòng)性和隨機(jī)性等特點(diǎn),目前的超短期風(fēng)向預(yù)測(cè)步長(zhǎng)較短,難以滿足風(fēng)電場(chǎng)的實(shí)際生產(chǎn)需求。為此,本文提出1種基于VMD-LSTM的風(fēng)向多步預(yù)測(cè)算法,通過算例分析,得到以下主要結(jié)論:
1)VMD將原始風(fēng)向序列分解為相對(duì)穩(wěn)定的模態(tài)信號(hào),可以有效地降低風(fēng)向的非線性、非平穩(wěn)性和隨機(jī)性,提高風(fēng)向序列預(yù)測(cè)的準(zhǔn)確性。利用最小樣本熵的值確定VMD分解的子模態(tài)數(shù),可優(yōu)化VMD的風(fēng)向信號(hào)分解性能,提高VMD的風(fēng)向趨勢(shì)信息提取能力。
2)針對(duì)不同的預(yù)測(cè)方法對(duì)超短期風(fēng)向多步預(yù)測(cè)的影響,分別構(gòu)建 ARMA、RF、VMD-RF、LSTM、VMD-LSTM預(yù)測(cè)模型。比較發(fā)現(xiàn),VMD-LSTM在4個(gè)季度的24步風(fēng)向預(yù)測(cè)的平均MAE、RMSE、MAPE為 8.430°、16.870°、9.155,在每個(gè)季度不同時(shí)間尺度的各個(gè)誤差評(píng)價(jià)指標(biāo)均優(yōu)于其他算法,所提算法可滿足風(fēng)電場(chǎng)的實(shí)際生產(chǎn)中優(yōu)化控制偏航角的要求。
3)由于風(fēng)向數(shù)據(jù)具有較大的隨機(jī)性和不穩(wěn)定性等特點(diǎn),且受風(fēng)機(jī)排布位置及尾流的影響,進(jìn)一步增大了風(fēng)向預(yù)測(cè)的難度。通過對(duì)比不同風(fēng)機(jī)的預(yù)測(cè)結(jié)果,證明了模型的魯棒性,具有良好的泛化能力。