王 超,陳 奇,谷新梅,姜 湖,郭 芳,鄧尚云,嚴海賢
(1.廣州南方投資集團有限公司,廣州 510663;2.中國能源建設集團廣東省電力設計研究院有限公司,廣州 510663;3.廣東科諾勘測工程有限公司,廣州 510663;4.佛山科學技術學院 機電工程與自動化學院,廣東 佛山 528000)
在電力市場中,電能可以像其他普通商品一樣在市場環(huán)境下自由交易,因此能夠反映電力供求關系的電價成為電力市場的重要因素之一[1-2]。近年來,許多研究人員已經(jīng)證明,要實現(xiàn)電價精準預測的難度很大,因為電價在很大程度上取決于多種因素[3]。精準的電價預測不僅可以提升市場在調(diào)節(jié)能源資源配置上的效率、提高電網(wǎng)的優(yōu)化調(diào)度能力,還能為各方市場參與者制定和調(diào)整市場決策提供重要依據(jù)[4]。因此,準確的電價預測對于整個電力系統(tǒng)和市場參與者來說具有十分重要的參考意義[5-6]。
電價預測的方法有很多,主要可以分為統(tǒng)計學方法、計算智能方法和混合模型方法。統(tǒng)計學方法大多依賴于線性回歸,主要有自回歸移動平均模型(Autoregressive Moving Average Model,ARMA)[7]、自回歸積分移動平均模型(Autoregressive Integrated Moving Average Model,ARIMA)[8]以及廣義自回歸條件異方差(Generalized Auto Regressive Conditional Heteroskedasticity,GARCH)[9-10]等。統(tǒng)計學方法在捕捉電價的非線性和高波動特征方面的能力有限,難以處理復雜的非線性時間序列問題[11]。計算智能方法通過在線更新期間調(diào)整權重的方式將多元函數(shù)逼近到所需的準確度,并且可以捕捉電價的復雜且動態(tài)的非線性特征[12],因此在電價預測問題上具有優(yōu)越的性能。在眾多計算智能方法中,長短期記憶神經(jīng)網(wǎng)絡(Long Short-Term Memory,LSTM)因其能夠有效發(fā)掘時間序列的內(nèi)部規(guī)律以及擬合非線性數(shù)據(jù)的優(yōu)點,在預測領域得到眾多學者的關注[13-15]。
在過去的幾年中,受到學術界關注最多的方法是混合模型。然而單一的計算智能方法仍然忽略了電價序列中所包含的一些重要信息,其處理電價序列中的非線性及高波動性特征的能力還有提升的空間?;旌夏P头椒ň哂袕姶蟮臄?shù)據(jù)處理能力和挖掘電價數(shù)據(jù)特征信息的能力,一般由數(shù)據(jù)分解方法與預測模型組合而成[16]。在數(shù)據(jù)分解方法中,小波變換(Wavelet Transform,WT)[17-18]、經(jīng)驗模態(tài)分解(Empirical Mode Decomposition,EMD)[19]以及一些改進的方法如快速集成經(jīng)驗模態(tài)分解(Fast Integrated Empirical Mode Decomposition,F(xiàn)IEMD)[20]等已被廣泛使用。雖然EMD 可以取得比WT 更好的結果,但它存在末端效應以及模態(tài)混疊的問題,影響EMD 的分解精度[21]。變分模態(tài)分解(Variational Mode Decomposition,VMD)能夠?qū)崿F(xiàn)自適應分解,很好地解決了EMD 末端效應和模態(tài)混疊問題[22]。在預測模型方面,LSTM成為眾多學者們的選擇,但LSTM只能從單方向上獲取時序信息,被LSTM遺忘的信息中可能存在著重要的時序特征信息。
為了有效處理電價序列中的非線性以及高波動性特征,改善LSTM 只能從單向獲取時序信息的問題,本文實現(xiàn)了一種由VMD和WOA-ATT-BiLSTM組成的混合電價預測模型。該模型結合了VMD 在數(shù)據(jù)分解方面以及雙向長短期記憶神經(jīng)網(wǎng)絡(Bidirectional Long Short-Term Memory,BiLSTM)在處理時間序列方面的優(yōu)勢。針對電價序列存在的非線性、高波動性特征,本文使用VMD 分解將原始的電價序列分解成多個子序列以便使預測模型能夠更容易提取到電價序列中的特征信息;并且采用了能夠從正反兩個方向提取時序信息的BiLSTM作為預測模型。另外,在BiLSTM 中加入了能夠?qū)斎胩卣鬟M行動態(tài)加權從而突出重要特征的注意力機制(Attention Mechanism,ATT),以提高模型的收斂速度和訓練效率。最后采用鯨魚算法(Whale Optimization Algorithm,WOA)對ATT-BiLSTM 模型的超參數(shù)進行迭代尋優(yōu),以提高模型的整體預測效果。
文獻[23]證明了將原始序列分解為多個子序列的方法有助于提高預測結果的準確性。同理,將該思想應用到電價預測問題中,將電價序列分解成多個子序列后再進行預測重構,可以提高最終的預測精度。VMD是一種完全非遞歸的自適應分解方式,該方法認為信號是由多個子信號疊加而成的,在獲取序列信號的子序列過程中,通過搜尋變分模型最優(yōu)解來確定每個子序列的頻率中心和帶寬,從而能夠?qū)⒃夹蛄行盘栍行У亍⒆赃m應地分離成多個不同頻率的子序列。原始電價序列經(jīng)過VMD 分解后便能夠轉(zhuǎn)化為一組相對穩(wěn)定且更為規(guī)律的子序列,原始電價序列中所含有的非線性、高波動性特征也隨分解過程轉(zhuǎn)化為子序列中相對平穩(wěn)的、更為清晰的特征。因此,神經(jīng)網(wǎng)絡能夠更容易地去捕捉、學習這些特征,從而增強預測效果。VMD模型的具體構造步驟為:
(1)利用Hilbert 變換獲取每個模態(tài)函數(shù)uk( )
t的解析信號,得到其單邊頻譜。
(2)將各模態(tài)解析信號與對應的中心頻率e-jwk混合,以將其頻譜調(diào)制到相應的基頻帶。
(3)根據(jù)高斯平滑度和梯度二次方準則對信號進行解調(diào),計算梯度的二次方L2 范數(shù),獲得各分解模態(tài)的帶寬,得到分解后各模態(tài)分量變分約束模型為:
式中:uk—模態(tài)分量;
wk—中心頻率;
K—分解后模態(tài)分量個數(shù);
?t—偏導運算;
δt—Dirac分布函數(shù);
1/(πt) —沖擊響應;
f(t)—原始序列信號。
為求解上述模型,引入懲罰參數(shù)α和Lagrange乘法算子λ將上述問題轉(zhuǎn)化為非約束性變分問題,表達式為:
式中:L({uk} ,{wk} ,λ) —uk、wk、λ的拉格朗日表達式;
λ(t)—拉格朗日乘子。
利用交替方向乘子法來處理式(2),并通過持續(xù)交替更新unk+1(w)、wnk+1來求解式(1)中的變分模型最優(yōu)解。新的uk、中心頻率wk的更新公式為:
式中:ω—頻率;
+1(ω)—在頻域中第n+1次迭代計算時的第k個模態(tài)函數(shù);
—第n+1 次迭代計算時第k 個模態(tài)函數(shù)的中心頻率;
(ω)、(ω)、(ω)—f(t)、ui(t)、λ(t)的傅里葉變換(ui(t)為i≠t時的模態(tài)函數(shù));
n—迭代次數(shù)。
1.2.1 BiLSTM
LSTM 是循環(huán)神經(jīng)網(wǎng)絡(Recurrent Neural Network,RNN)的一種變體,通過引入記憶單元來控制信息的傳遞,解決了RNN 存在長期時序依賴的問題,并且能夠計算時間序列中各個觀測值之間的依賴性,從而在長時間序列的預測問題中得到廣泛應用。
記憶單元能夠根據(jù)當前的輸入和前一個隱藏狀態(tài)來決定允許通過的信息概率,并以此來實現(xiàn)整個網(wǎng)絡對數(shù)據(jù)的記憶和遺忘功能,這使得LSTM 在處理電價預測這一長時間序列問題時具有很大優(yōu)勢。LSTM 神經(jīng)元結構如圖1 所示,在LSTM 神經(jīng)元內(nèi),有3 個門結構負責信息的保存和遺忘。遺忘門能夠根據(jù)選擇來遺忘來自上一個神經(jīng)元的信息;輸入門控制著當前時刻的輸入保存到神經(jīng)元狀態(tài)中;輸出門控制著當前神經(jīng)元的輸出。
圖1 LSTM神經(jīng)元結構圖Fig.1 Structure of LSTM neuron
LSTM神經(jīng)元的狀態(tài)更新公式為:
式中:ft—t時刻的遺忘門狀態(tài);
Wf、Wi、Wo—遺忘門、輸入門和輸出門的權重矩陣;
WC—神經(jīng)元狀態(tài)更新權重矩陣;
bf、bi、bo—遺忘門、輸入門和輸出門的偏差矩陣;
—神經(jīng)元內(nèi)部候選狀態(tài);
bc—神經(jīng)元狀態(tài)更新偏差矩陣。
BiLSTM 在LSTM 的基礎上針對雙向輸入進行了改進。LSTM只能在一個方向上處理電價序列數(shù)據(jù),而BiLSTM 增加了一個反方向的LSTM 模型,如圖2所示,這種結構使得BiLSTM能夠從正反兩個方向?qū)W習電價序列的特征,從而獲取到被LSTM 忽略的信息。正反兩個方向的LSTM 之間參數(shù)獨立,共享網(wǎng)絡輸入,兩者的輸出合并后即為當前時刻網(wǎng)絡的輸出。利用雙向輸入,BiLSTM可以從更多角度學習電價特征信息并提高預測精度。
圖2 BiLSTM網(wǎng)絡結構圖Fig.2 Structure of BiLSTM network
BiLSTM 的正、反向更新公式及組合輸出公式為:
式中:htl、htr—當前時刻向前、向后的隱含層向量;
h、h—前一時刻向前和后一時刻向后的隱含層向量;
W1、W2、W3、W4—權重矩陣;
bhl、bhr—隱藏層向前、向后的偏移向量;
by—輸出層偏移向量。
1.2.2 注意力機制(ATT)
注意力機制的思想借鑒了人類的視覺注意力機制,是一種分配注意力資源的手段。在人類視覺觀察過程中,視覺系統(tǒng)可以快速掃描全局并篩選出有用的信息,即所謂的視覺焦點,同時忽略不相關信息。同理,ATT 能夠?qū)⒂邢薜挠嬎隳芰械街攸c信息上,從而幫助BiLSTM 更快速有效地從電價序列中獲得想要的信息,忽略干擾信息。ATT 的核心原理是根據(jù)輸入元素對輸出的影響對其分配不同的權重,從而篩選出重要的特征,提高BiLSTM模型的訓練效率和收斂速度。本文采用Bahdanau Attention機制,其具體原理如圖3所示。
圖3 注意力機制原理圖Fig.3 Schematic diagram of attention mechanism
定義當前時刻BiLSTM 的隱藏狀態(tài)和輸出為St和yt,St的計算公式為:
式中:St-1、yt-1—前一時刻BiLSTM 的隱藏狀態(tài)和輸出;
ct—包含前后信息的環(huán)境向量,由隱含層輸出加權求得。
其中,hj—第j個隱含層輸出向量;
αt,j—當前時刻各個隱含層輸出的權重,其計算公式為:
式中:etj、etk—t時刻隱含層j和k的注意力分布值。
由于ATT-BiLSTM 模型框架中存在許多超參數(shù),這些超參數(shù)會對模型的整體預測效果產(chǎn)生巨大影響。因此,為準確預測電價,本文采用鯨魚算法來優(yōu)化ATT-BiLSTM 模型框架中的超參數(shù),以提高模型的預測效果。WOA 是一種模擬座頭鯨捕食獵物行為的新型元啟發(fā)式優(yōu)化算法,包含圍獵、攻擊、尋獵三個階段。設定鯨魚種群數(shù)量為N,定義p 為[0,1]范圍內(nèi)的隨機數(shù)。
1.3.1 圍獵
這時p<0.5 且 |A|<1(A 為系數(shù)向量)。該算法將距離目標獵物最近或目標獵物的位置定義為種群最優(yōu)的鯨魚個體位置。其他鯨魚個體將嘗試向當前種群最優(yōu)位置靠近,位置更新公式為:
式中:D—當前鯨魚個體與最優(yōu)位置之間的距離;
X*(T)—當前最優(yōu)解位置向量;
X(T)—當前鯨魚個體所處的位置向量;
X(T+1) —第T+1 次迭代時鯨魚個體所處的位置向量;
T—迭代次數(shù);
C—系數(shù)向量。
A 和C 的計算公式為:
r —[0,1]之間的隨機向量;
Tmax—最大迭代次數(shù)。
1.3.2 攻擊
這時p≥0.5。鯨魚在狩獵時會以螺旋運動的方式向獵物游去,用公式表示為:
式中:D'—鯨魚個體與最優(yōu)位置之間的距離,
D'= |X*(T)-X(T)|;
b—定義對數(shù)螺線形狀的常數(shù);
l—均勻分布的隨機向量[-1,1]。
鯨魚種群會在一個不斷縮小的圓圈內(nèi),同時沿螺旋路線游動來圍繞獵物。因此,假設Pi為選擇收縮包圍方法的概率,1-Pi則為螺旋模型更新鯨魚個體位置的概率。數(shù)學模型為:
當 |A |∈[- 1,1] 的值在時,鯨魚的新位置為當前它與獵物位置之間的任意位置。當 |A |<1 時,鯨魚會攻擊獵物。
1.3.3 尋獵
這時p<0.5 且 ||A >1。鯨魚執(zhí)行隨機搜索獵物的行為。通過隨機選取一個鯨魚個體的位置,并以該位置為基礎來更新其他鯨魚個體的位置,使得整個鯨魚種群偏離該獵物,從而能夠選擇更為合適的獵物。這種方式能夠提高WOA 的探索能力。數(shù)學模型為:
式中:Xrand—隨機選取的鯨魚個體位置的向量。
本文所提出的模型中ATT-BiSTM 部分的結構如圖4 所示,由數(shù)據(jù)輸入、BiLSTM 層、ATT 層、全連接層和輸出層構成。ATT層的加入能夠保留編碼器輸入序列的中間輸出結果,然后訓練模型選擇性地學習這些輸入。ATT 層可以對BiLSTM 層從正反兩個方向捕獲的序列特征進行適當?shù)募訖啵⒏鶕?jù)權重進行求和,使得整個模型得到更低的損失函數(shù)和更高的模型正確率。
圖4 ATT-BiLSTM模型網(wǎng)絡層結構Fig.4 Network layer structure of ATT-BiLSTM model
圖5 為VMD-WOA-ATT-BiLSTM 模型的整體預測框架及流程,從左到右依次是WOA優(yōu)化超參數(shù)部分、模型預測部分和數(shù)據(jù)處理部分。以模型預測部分為主線,原始電價序列經(jīng)VMD自適應分解后獲得多個具有不同中心頻率的子序列,隨后經(jīng)數(shù)據(jù)歸一化輸入到ATT-BiLSTM 模型中。同時初始化WOA 種群并對ATT-BiLSTM 模型的超參數(shù)進行迭代尋優(yōu)尋找最優(yōu)參數(shù)。隨后按比例將輸入的數(shù)據(jù)劃分為訓練集和測試集,并將WOA輸出的最優(yōu)參數(shù)組合作為ATT-BiLSTM模型的參數(shù)進行預測得到各個子序列的預測結果,最后經(jīng)反歸一化再累加重構得到最終的預測值。
圖5 VMD-WOA-ATT-BiLSTM模型預測流程框圖Fig.5 Flowchart of VMD-WOA-ATT-BiLSTM model prediction
本文算例以法國電力市場2021年1月10日至2月20日共6周的日前現(xiàn)貨電價數(shù)據(jù)作為數(shù)據(jù)集,包含42 d、1008個時段的電價數(shù)據(jù),如圖6所示。其中前五周作為訓練集,最后一周共168 個觀測點作為測試集,該數(shù)據(jù)可以從北歐電力市場公開的數(shù)據(jù)集Nordpool 獲取。在輸入到預測模型之前,原始電價序列經(jīng)過VMD分解后得到多個子序列,分解得到的子序列經(jīng)數(shù)據(jù)歸一化后輸入到模型中進行訓練和測試。
圖6 原始電價序列Fig.6 Original electricity price series
為使數(shù)據(jù)更好地擬合模型,提高預測模型的預測效果,需要對分解后的各模態(tài)分量進行數(shù)據(jù)標準化處理。本文采用Min-Max 歸一化方法將數(shù)據(jù)集歸一化至0~1的范圍。Min-Max歸一化方法是對原始數(shù)據(jù)進行線性變換,令minx 為數(shù)據(jù)集的最小值,maxx 為最大值,x 的原始值x0通過Min-Max 歸一化至區(qū)間[0,1]中的x'。歸一化的公式為:
經(jīng)過模型預測之后得到每個子序列的預測結果,需經(jīng)過反歸一化后再進行累和重構得到最終的預測結果。反歸一化公式為:
式中:y —反歸一化前子序列預測值;
Y —反歸一化后子序列預測值。
為評估本文方法的預測效果,采用平均絕對誤差XMAE、平均絕對百分比誤差XMAPE和均方根誤差XRMSE來檢驗各預測模型的預測結果。各指標的計算公式見式(27)—(29),預測誤差指標的值越小說明預測效果越好。
式中:yi—真實值;
—預測值;
n—測試集樣本大小。
為更好地評估模型的預測效果,本文采用了LSTM、BiLSTM 以及ATT-BiLSTM 模型作為對比進行預測實驗,并且使用EMD 和VMD 分解比較它們在提高預測效果方面的幫助。其中LSTM模型設置了兩層隱含層和一層全連接層,節(jié)點數(shù)分別為32、32、10;BiLSTM模型設置了BiLSTM層、全連接層,節(jié)點數(shù)分別為32、32、10;ATT-BiLSTM模型在BiLSTM模型的基礎上增加了注意力機制層。3種神經(jīng)網(wǎng)絡模型的超參數(shù)模型的學習率均為0.001,迭代次數(shù)為100,超參數(shù)batchsize 為16。另外,EMD 和VMD 的分解個數(shù)均為6。
6 種模型的預測結果如圖7 所示。從圖中可以看到,相較于其他對比模型,VMD-WOA-ATT-BiLSTM模型的預測曲線能夠很好地擬合實際值曲線,說明VMD-WOA-ATT-BiLSTM 能夠更好捕捉到實際電價的走勢,具有更高的預測精度。在對比模型中,LSTM模型與實際值曲線的擬合程度較差,且在尖峰電價時刻與實際值偏離較大。BiLSTM 模型相較于LSTM 模型具有更好的預測效果。此外,在加入了注意力機制層后,ATT-BiLSTM 模型相比于BiLSTM能更好地擬合實際值曲線,說明注意力機制層的加入有助于提高模型預測精度。同時,在添加了EMD 和VMD 分解的對比模型中可以看出,經(jīng)過分解后再預測的方式能夠明顯提高預測的精度,并且VMD比EMD更能提高最終的預測精度。
圖7 預測結果對比曲線Fig.7 Comparison curve of prediction results
為更清晰地展示各個模型的預測效果,計算了每個模型的XMAE、XMAPE、XRMSE如表1所示。VMD-WOA-BiLSTM 模型預測值在ATT-BiLSTM 模型的基礎上有了顯著的提升,其中XMAPE降低了3.52%,XRMSE降低了1.94 歐元/MWh,XMAE降低了1.38歐元/MWh。
表1 不同模型的預測誤差指標對比Tab.1 Comparison of prediction error indicators of different models
電價預測是一項具有挑戰(zhàn)性的工作,而精準的電價預測能夠為市場參與者們制定市場策略提供重要的依據(jù),以便在市場交易中降低風險或最大化利益。為有效處理電價序列中存在的非線性與高波動性特征,本文通過將VMD分解和WOA-ATTBiLSTM結合構成一個混合電價預測模型,并采用了法國電力市場的電價數(shù)據(jù)進行實驗驗證。通過與其他模型的對比可以得出以下結論:
(1)引入了電價序列分解方法將原始序列分解為多個子序列后能夠降低電價序列的非線性特征與高波動性特征,并提高預測模型的預測效果;并且通過EMD與VMD兩種分解方式的對比也說明更好的分解方式能夠進一步處理電價非線性與高波動性特征。
(2)在BiLSTM 神經(jīng)網(wǎng)絡層中增加注意力機制能夠使得神經(jīng)網(wǎng)絡對電價序列的中特征信息有更好的提取效果,進而改善模型的預測精度。
將分解與預測模型相結合的混合模型相較于單一的預測方法有著更為優(yōu)越的預測性能,說明將不同數(shù)據(jù)處理方式與更優(yōu)秀的模型相結合能夠在電價預測問題上取更好的效果。