吳福疆 范晟 王振達 王爍
摘? ?要:日峰值負荷作為非線性、非平穩(wěn)且波動的時間序列,難以準確預測。提出了一種結合動態(tài)時間規(guī)整(DTW)的門控遞歸神經網絡(GRNN)用于準確預測日峰值負荷。利用DTW距離用于匹配最相似的負荷曲線,可以捕捉負荷變化趨勢。采用熱編碼方案對離散變量進行編碼,擴展其特征從而表征對負荷曲線的影響。提出了一種基于DTW的門控遞歸單元(DTW-GRU)算法用于日峰值負荷預測,并在歐洲智能技術網絡(EUNITE)數(shù)據集上進行了測試。仿真結果表明,與其他算法相比,該算法的MAPE僅為1.01%。
關鍵詞:峰值負荷預測;動態(tài)時間規(guī)整;熱編碼;門控遞歸單元
中圖分類號:TP181;TM715? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A
Daily Peak Load Forecasting Based on Gating Recurrent Neural Network
WU Fu-jiang?覮,F(xiàn)AN Sheng,WANG Zhen-da,WANG Shuo
(Shantou Power Supply Bureau,Guangdong Power Grid Co.,Ltd.,Shantou,Guangdong 515000,China)
Abstract:As a non-linear,non-stationary and fluctuating time series,daily peak load is difficult to predict accurately. A gated recurrent neural network (GRNN) combined with dynamic time warping (DTW) is proposed to predict daily peak load accurately. DTW distance is used to match the most similar load curve,which can capture the trend of load change. The thermal coding scheme is used to encode the discrete variables and extend their characteristics to represent the influence on the load curve. A DTW-GRU algorithm based on DTW is proposed for daily peak load forecasting,and it is tested on the European Intelligent Technology Network (EUNITE) dataset. Simulation results show that the MAPE of this algorithm is only 1.01% compared with other algorithms.
Key words:peak load forecasting;dynamic time regulation;thermal coding;gated recursive unit
日峰值負荷預測是電力系統(tǒng)運行規(guī)劃決策的重要工具。負荷預測可分為短期負荷預測、中期負荷預測和長期負荷預測[1]。日峰值負荷預測作為一種中期負荷預測,可作為評估電力系統(tǒng)備用容量、日負荷率以及制定峰谷電價的重要依據[2]。大多數(shù)預測模型都是基于相似性原理和各種優(yōu)化算法且可以分為兩類[3]:經典的預測算法和智能預測算法。
對于經典的預測算法,其主要優(yōu)點是計算速度快、魯棒性強。文獻[4]和文獻[5]分別利用頻域分量法和小波分析法從頻域角度研究負荷,但沒有考慮社會因素、氣象因素等其他因素對峰值負荷的影響。衡量兩個時間序列之間相似性的常用的方法有歐氏(Euc)距離、曼哈頓(Manh)距離、余弦角(Cos)和相關系數(shù)(Cor)距離[6]。然而,這些方法只能描述兩個序列整體的相似度,并且容易掩蓋很多局部信息。
對于智能預測算法,其優(yōu)勢在于篩選和處理影響負荷曲線的主要因素。基于人工神經網絡(ANN)和支持向量機(SVM)可衍生出主成分分析人工神經網絡(PCA-ANN)[7]、最小二乘支持向量機(LS-SVM)[8]、經驗模式分解支持向量機(EMD-SVM)[9]和混沌支持向量機(Chaos-SVM)[10]來提高日峰值負荷預測的精度。然而,這些傳統(tǒng)的神經網絡方法沒有考慮負荷曲線的時間序列特性,容易陷入局部最優(yōu)和過擬合。與傳統(tǒng)的神經網絡相比,遞歸神經網絡(RNN)引入了方向環(huán)來處理輸入之間的上下文關聯(lián)。文獻[11]基于長期短期記憶(LSTM)的深度學習預測框架來預測負荷趨勢。與LSTM相比,門控遞歸單元(GRU)參數(shù)少,并且更易于收斂[12]。
為了克服傳統(tǒng)預測算法的不足,提出了一種基于門控遞歸神經網絡(GRNN)和動態(tài)時間規(guī)整(DTW)的預測算法。利用自相關系數(shù)確定日峰值負荷曲線段的長度,采用DTW方法對最相似的負荷曲線進行匹配。與上述傳統(tǒng)的測量距離方法不同,DTW距離不僅可以捕捉負荷曲線的變化趨勢,而且可以捕捉負荷曲線的局部信息。在日歷信息上應用熱點編碼方案以擴展預測功能,從而進一步表征其對負荷預測的影響。提出了一種基于DTW的門控遞歸單元(DTW-GRU)算法用于日峰值負荷預測。
1? ?DTW-GRU算法
2? ?負荷預測的實現(xiàn)步驟
設計開發(fā)了一種新的DTW-GRU算法用于日峰值負荷預測。所提出的DTW-GRU算法流程圖,如圖4所示。該算法分為四個階段:(1)選擇N個日峰值負荷;(2)利用DTW距離匹配負荷曲線;(3)編碼相關影響因素;(4)利用GRNN預測日峰值負荷。
2.1? ?選擇N個日峰值負荷
日峰值負荷曲線段的長度由自相關系數(shù)決定。自相關系數(shù)用來描述不同時期數(shù)據本身的關聯(lián)程度,即衡量歷史數(shù)據對當前的影響。對于時間序列{xt},xt和xt - 1之間的相關系數(shù)稱為間隔l為xt 的自相關系數(shù)。自相關系數(shù)表示為:
ρl = ■? ? ? (8)
其中,Cov(xt,xt-1)為自方差,Var(xt)和Var(xt-1)為方差。自相關系數(shù)越大,歷史數(shù)據對當前的影響越大。對于自相關系數(shù)序列{ ρl },其最大值為ρN。則最優(yōu)時間間隔N是ρN的下標值。
2.2? ?使用DTW距離匹配負荷曲線
為了得到最相似的日峰值負荷,考慮到電力系統(tǒng)負荷具有一定的規(guī)律性和周期性,采用最小DTW距離的日峰值負荷相似匹配方法。首先,將原始數(shù)據集分為歷史數(shù)據集和預測數(shù)據集。然后將原始數(shù)據集的每個區(qū)段與歷史數(shù)據集進行匹配,得到最相似的區(qū)段。根據經驗法則,如果兩個區(qū)段相似,則對應的下一個區(qū)段也相似[16],則得到最相似的日峰值負荷。最相似日峰值負荷的曲線匹配,如圖5所示。
歷史數(shù)據集中有n個區(qū)段,原始數(shù)據集中有 個區(qū)段(0 < n < m)。每個區(qū)段為1 × l的向量,其中,l為每個區(qū)段的長度,其值在階段1中獲得。對于原始數(shù)據集中的任何區(qū)段元素(第1區(qū)段除外),第i + 1個區(qū)段中的第p個元素定義為預測目標(i,p > 0)。采用DTW匹配方法找出歷史數(shù)據集中第i個區(qū)段中最相似的區(qū)段。假設第i個區(qū)段的最小DTW距離是歷史數(shù)據集中的第j個區(qū)段(i≠j,j > 0),則歷史數(shù)據集中第j + 1個區(qū)段的第p個元素是最相似的日峰值負荷。
2.3? ?編碼相關影響因素
為了對相關影響因子進行編碼,假定影響日峰值負荷的因素分為兩個方面:一是氣象因素,如溫度和降水;二是社會因素,如日歷信息。
對于氣象因素等連續(xù)變量進行歸一化處理,然后采用自然編碼方法對其進行編碼。歸一化公式為:
xc = ■? ? ? (9)
其中,xc為歸一化的結果,xo為原始輸入數(shù)據,xmax和xmin分別為原始數(shù)據的最大值和最小值。
對于離散變量,采用了熱編碼方案[17]。熱編碼使用N位狀態(tài)寄存器來編碼N個狀態(tài)。每個狀態(tài)都有自己獨立的寄存器位,并且在任何時候,只有一個是有效的。即對于任何狀態(tài),只有一個位是1,其他位是0。不同的日歷信息編碼結果,如圖6所示。
從圖6可以看出,該編碼方案為每天定義兩個屬性:第一個屬性為它是否是假日。每天定義三個條件,(1)首先是假日;(2)節(jié)前和節(jié)后(過渡日);(3)工作日。工作日的自然編碼結果為0,其熱編碼結果為[1 0 0]。過渡日的自然編碼結果為0.5,其熱編碼結果為[0 1 0]。假日的自然編碼結果為1,其熱編碼結果是[0 0 1]。第二個屬性用來標記它屬于一周中的哪一天。從周日到周六,它們的自然編碼為0至6,對于其熱編碼,分別設計了兩種編碼方案:全熱編碼方案和獨熱編碼方案。對于全熱編碼方案,使用 7位編碼方案來區(qū)分一周中的7天。對于獨熱編碼方案,只使用2位編碼方案來區(qū)分工作日和周末,這樣既節(jié)省了計算資源,又能區(qū)分其本質特征。
2.4? ?利用GRNN預測日峰值負荷
采用GRNN對日峰值負荷進行預測包括4個步驟:(1)數(shù)據預處理;(2)模型構建;(3)模型訓練和測試;(4)結果評估。
(1)數(shù)據預處理:為了利用深度學習模型進行負荷預測,將構建適當格式的訓練集和測試集。對于訓練集和測試集的每個元素都有兩個部分,即GRNN的輸入矩陣X和輸出矩陣Y。矩陣X由[ A? B? C ]三個部分組成,其中A,B和C是從上述三個階段獲得的子矩陣。子矩陣A是階段1的輸出,即目標預測日前N天的日峰值負荷。子矩陣B是階段2的輸出,這是通過DTW匹配方法得到的最相似的日峰值負荷。子矩陣C是階段3的輸出,它是相關影響因素(包括氣象數(shù)據和日歷數(shù)據)的編碼結果。矩陣Y是需要預測的日峰值負荷。
(2)模型構建:為了選擇適用于負荷預測的深度學習模型。由于GRU獨特的復位門和更新門結構,使得輸入數(shù)據的長度可變。對于深度學習模型,文獻[18]的研究表明,網絡的性能對層數(shù)和層大小的任何組合都相對不敏感。根據文獻[19]中的發(fā)現(xiàn),多層比單層計算結果更好,隱藏節(jié)點的數(shù)量應該足夠大。模型結構包含三層GRNN和一層FNN。
(3)模型訓練和測試:模型建立后,利用預處理訓練集對模型進行訓練。然后使用測試集對模型進行測試。
(4)結果評價:對預測日峰值負荷結果進行評估。
3? ?DTW-GRU算法的實現(xiàn)
3.1? ?數(shù)據源
采用歐洲智能技術網絡(EUNITE)競賽負荷預測樣本數(shù)據,數(shù)據資料主要包含:(1)1997年1月至1999年1月,每30分鐘一次的電力負荷數(shù)據;(2)1997年1月至1999年1月的日平均溫度;(3)1997年至1999年的假日。其中,1997年至1998年的日峰值負荷,如圖7所示,1997年至1998年的日平均溫度,如圖8所示。
以761天的日峰值負荷為原始數(shù)據,共占據109周。由于109周中共有763天,超過761天,因此使用0來填補空白。前104周作為歷史數(shù)據集,后5周作為預測數(shù)據集。
3.2? ?數(shù)據分析
(1)初步分析:對于電力負荷這類隨機過程,利用自相關系數(shù)來確定其合適的模型階數(shù)。以不同的間隔天數(shù)計算自相關系數(shù)。結果如圖9所示。
從圖9可以看出,自相關系數(shù)的最大值為7天,這與人類一周7天的社會活動周期相一致。因此,7天的倍數(shù)適用于負載區(qū)段。
(2)詳細分析:日歷信息從圖7可以看出,周末(周六和周日)的負荷通常低于工作日(周一到周五)。此外,結合地區(qū)的假日情況,假日對負荷也有影響。假日的負荷通常低于非假日。因此,有必要利用包括周末和假日在內的日歷信息來預測日峰值負荷。
在溫度信息數(shù)據集中,樣本數(shù)據提供的唯一氣象信息是日平均溫度。通過圖7和圖8相比,較高的溫度對應較低的負荷,負荷與日平均溫度呈負相關,計算值為-0.868。因此,日平均溫度是建立預測模型的重要指標。
3.3? ?硬件和軟件平臺
設計在高性能的曙光I620-G15服務器上實現(xiàn),該服務器配備了Ubuntu 14.04操作系統(tǒng)和2臺NVIDIA GTX 1080設備。深度學習過程使用Keras神經網絡庫和Theano后端來構建,利用Theano平臺和統(tǒng)一計算設備架構(CUDA)[20]實現(xiàn)了訓練RNN的GPU加速。使用數(shù)據科學中常用的Python編程語言。
3.4? ?實驗設置
為了實現(xiàn)DTW-GRU算法的最佳性能,結合文獻[12]設計的GRU訓練配置參數(shù),將DTW-GRU算法的所有實驗參數(shù)設置如下:
輸入向量∈{10,13,17,18,20,25}
輸出向量∈{1}
隱藏神經元數(shù)∈{200}
訓練批量大小∈{10,20,30,50}
訓練方法∈{自適應矩估計優(yōu)化算法}
學習率∈{0.1,0.05,0.02,0.01}
訓練停止策略∈{早停法}
損失函數(shù)∈{RMSE}
4? ?實驗分析
將DTW距離與Euc距離、Manh距離、Cos距離和Cor距離4種常用距離類型來衡量負荷曲線的相似性,將原始數(shù)據集的108周(最后一周除外)與歷史數(shù)據集的103周(最后一周除外)進行匹配。此外,在測試數(shù)據集的輸入中使用了最相似的日峰值負荷。
利用Kupiec測試和典型誤差指標對負載預測結果與其他算法進行比較。首先,通過Kupiec測試來驗證模型性能,Kupiec測試的基本思路是計算測試期間與故障率相對應的統(tǒng)計值,以確定模型是否有效。預測誤差定義如下:
fe = ■ × 100%? ? ? (10)
其中,■t為預測值,yt為實際值。
失效天數(shù)是預測誤差超過給定誤差的天數(shù)。假設周期為P天,其中Q天失效,計算出失效率為:
f = ■? ? ? ? ?(11)
同樣,假設時間獨立,并且失效天數(shù)Q遵循二項分布B(P,f)。對于顯著性水平α,似然比檢驗(LR)服從自由度為1的卡方分布:
LR = 2ln[(1-f)P - Q f Q ] - 2ln[(1-α)P - QαQ ]? ? (12)
在α = 5%的顯著性水平下,當LR > 5.02時,則拒絕該模型。其次,為了評估所提出的方法在進行負荷預測方面的性能,使用了三個常使用的指標:平均絕對百分比誤差(MAPE)、最大誤差(ME)和均方根誤差(RMSE),它們的定義如下:
MAPE = ■■■ × 100%? ? ? (13)
ME = max■t - yt,t = 1,2,…,N? ? ? (14)
RMSE = ■? ? ? ?(15)
其中,N為預測集大小。從三個方面比較日峰值負荷預測的結果:不同的距離、不同的編碼方案和不同算法結構。
4.1? ?不同距離類型比較
對不同距離類型進行比較的LR值,如表1所示。
符號“√”表示此距離類型在a = 5%顯著性水平下通過Kupiec檢驗。隨著誤差率的增加,越來越多的距離類型通過了Kupiec檢驗。當預測誤差率閾值為1.75%時,DTW距離和Euc距離均通過Kupiec檢驗。當預測誤差率閾值為2.50%時,Manh距離和Cos距離均通過Kupiec檢驗。當預測誤差率閾值為3.00%時,Cor距離通過Kupiec檢驗??傊?,DTW距離和Euc距離優(yōu)于Manh距離、Cos距離和Cor距離。
從表2可以看出,使用各種距離匹配方法的結果是:DTW>Euc>Manh>Cos>Cor,DTW距離與性能次優(yōu)的Euc距離相比,MAPE、ME和RMSE的預測精度分別提高了12.17%、23.41%和21.13%。與性能最差的預測方法Cor距離相比,MAPE、ME和RMSE的預測精度分別提高了28.87%、34.21%和51.59%。
日峰值負荷作為非平穩(wěn)的時間序列,獲得最相似曲線的常用距離計算方法主要集中在任意兩點之間的最短距離。這種方法忽略了曲線變化的趨勢,難以解決負荷預測的非平穩(wěn)性問題。然而,DTW距離可以捕獲負荷曲線的變化趨勢,從而在一定程度上獲得負荷曲線的非平穩(wěn)信息。此外,GRU獨特的復位門和更新門結構可以存儲和學習DTW距離匹配得到的負荷變化趨勢。
4.2? ?不同編碼方案比較
符號“√”表示此編碼方案在α = 5%顯著性水平下通過了Kupiec檢驗。當預測誤差率閾值為1.75%時,只有獨熱編碼方案通過了Kupiec檢驗。當預測誤差率閾值為2.00%時,自然編碼方案通過了Kupiec檢驗。當預測誤差率閾值為2.50%時,全熱編碼方案通過了Kupiec檢驗。綜上所述,使用各種編碼方案的結果是:獨熱編碼>自然編碼>全熱編碼。
從表4可以看出,與自然編碼方案相比,使用獨熱編碼方案和全熱編碼方案,均可以有效地提高負荷預測的準確性。與自然編碼相比,獨熱編碼方案的MAPE、ME和RMSE的預測精度分別提高了15.83%、25.51%和26.03%。與全熱編碼方案相比,獨熱編碼方案對MAPE、ME和RMSE的預測精度分別提高了6.48%、12.00%和16.78%。這是由于使用獨熱編碼方案可以起到擴展離散變量特征的作用,擴展后的特征能夠有效地刻畫負荷變化的類型,有利于解決負荷預測中的波動性問題。相對于獨熱編碼方案,采用全熱編碼方案的預測結果較差。這是由于全熱編碼方案擴展了太多的特征,而有用的特征占比下降了。因此,獨熱編碼方案可以得到最好的預測效果。
4.3? ?不同算法比較
為了進一步證明所提出的DTW-GRU算法的有效性,與其他4種負荷預測算法在EUNITE測試集上的結果進行了比較,如表5所示。
從表5可見,傳統(tǒng)GRU算法優(yōu)于PCA-ANN算法[7]、LS-SVM算法[8]和Chaos-SVM算法[10],得到的MAPE為1.49%。由于GRU的特殊結構,并且EMD夠處理非線性時間序列,因此,EMD-GRU算法[9]優(yōu)于傳統(tǒng)GRU算法。最終結果表明,提出的DTW-GRU算法優(yōu)于其他4種算法,且MAPE僅為1.01%。將獨熱編碼方案與DTW距離匹配方法相結合,對改進傳統(tǒng)的GRNN非常有效。
5? ?結? ?論
將DTW距離與GRNN相結合對日峰值負荷進行預測。DTW距離可以有效地捕捉負荷變化趨勢,獨熱編碼方案可以擴展離散變量的特征,將它們作為RNN的額外輸入可以使預測更加準確。在EUNITE數(shù)據集上的仿真結果表明,DTW-GRU算法能夠顯著提高日峰值負荷的預測精度,并且優(yōu)與其他預測算法。
參考文獻
[1]? ? 鄧永生,焦豐順,張瑞鋒,等. 配電網規(guī)劃中電力負荷預測方法研究綜述[J]. 電器與能效管理技術,2019,14(01):1-7.
[2]? ? 朱俊丞,楊之樂,郭媛君,等. 深度學習在電力負荷預測中的應用綜述[J]. 鄭州大學學報(工學版),2019,40(05):13-22.
[3]? ? 辛苗苗,張延遲,解大. 基于電力大數(shù)據的用戶用電行為分析研究綜述[J]. 電氣自動化,2019,41(01):1-4.
[4]? ? 謝毓廣,張金金,陳凡,等. 基于頻域分解的短期負荷預測[J]. 電工技術,2019(21):42-44.
[5]? ? 黃青平,鄒曉明,劉楚群,等. 基于小波分解與隨機森林的短期負荷預測[J]. 電力信息與通信技術,2019,17(09):24-29.
[6]? ? 李正欣,張鳳鳴,張曉豐,等. 多元時間序列相似性搜索研究綜述[J]. 控制與決策,2017,32(04):577-583.
[7]? ? YU Z,NIU Z,TANG W,et al. Deep learning for daily peak load forecasting-a novel gated recurrent neural network combining dynamic time warping[J].? IEEE Access,2019,7(1):184-194.
[8]? ? XIA C,ZHANG M,CAO J. A hybrid application of soft computing methods with wavelet SVM and neural network to electric power load forecasting[J].? Journal of Electrical Systems and Information Technology,2018,5(3):681-696.
[9]? ? JUN W,LINGYU T,YUYAN L,et al. A weighted EMD-based prediction model based on TOPSIS and feed forward neural network for noised time series[J].? Knowledge-Based Systems,2017,132(12):167-178.
[10]? YU Z,NIU Z,TANG W,et al. Deep learning for daily peak load forecasting-a novel gated recurrent neural network combining dynamic time warping[J].? IEEE Access,2019,7(01):184-194.
[11]? 王曉霞,徐曉鐘,張彤,等. 基于集成深度學習算法的燃氣負荷預測方法[J]. 計算機系統(tǒng)應用,2019,28(12):47-54.
[12]? 魏海文,郭業(yè)才. 門控遞歸單元神經網絡坐標變換盲均衡算法[J]. 微電子學與計算機,2019,36(09):89-93.
[13]? 張振球. 一種改進時間效率的動態(tài)規(guī)劃算法的設計與實現(xiàn)[J]. 電子制作,2019,(24):76-77.
[14]? 劉永利,武帥,楊立身. 基于快速動態(tài)時間規(guī)劃的模糊聚類算法[J]. 河南理工大學學報(自然科學版),2017,36(06):111-116.
[15]? 孫曉麗,郭艷,李寧,等. 基于改進RNN的多變量時間序列缺失數(shù)據填充算法[J]. 信息技術與網絡安全,2019,38(11):47-53.
[16]? 周馳,李智,徐燦. 基于DTW算法的空間目標結構識別研究[J]. 計算機仿真,2019,36(09):98-102.
[17]? 梁杰,陳嘉豪,張雪芹,等. 基于獨熱編碼和卷積神經網絡的異常檢測[J]. 清華大學學報(自然科學版),2019,59(07):523-529.
[18]? ISLAM M M,LAM A,F(xiàn)UKUDA H,et al. An intelligent shopping support robot:understanding shopping behavior from 2D skeleton data using GRU network[J].? Robomech Journal,2019,6(1):18-29.
[19]? ZHANG Y,WANG X,F(xiàn)RIEDMAN E G. Memristor-based circuit design for multilayer neural networks[J].? IEEE Transactions on Circuits and Systems I:Regular Papers,2017,65(2):677-686.
[20]? 李丹丹,楊燦. 基于GPU并行的功能腦網絡屬性分析方法[J]. 計算機工程與設計,2017,38(06):1614-1618.