楊躒 鐘力強 殷豪
摘 要:隨著電力系統(tǒng)的飛速發(fā)展,電力負荷數據的規(guī)模也愈加龐大,以往基于小規(guī)模數據的電力負荷預測算法可能無法容納大量數據集。為改善預測模型的工程實用性,本文提出了一種新型的機器學習模型,該模型將卷積神經網絡(CNN)與縱橫交叉優(yōu)化算法(CSO)結合起來,應用于短期負荷預測。從大規(guī)模的負荷數據中收集到橫向相鄰日和縱向的相似日負荷數據,設置橫向預測和縱向預測的權值系數,再用CSO優(yōu)化算法去找最優(yōu)系數,得到最后的二維組合預測結果,并與其它機器學習算法比較。通過實驗證明,模型可以快速有效地處理大規(guī)模的負荷數據,具有較強的泛化能力。
關鍵詞:大數據壓縮;卷積神經網絡;縱橫交叉算法;組合預測;相似日負荷
中圖分類號:TP183;TM715 文獻標識碼:A 文章編號:2096-4706(2019)04-0160-03
Research on Two-dimensional Combined Short-term Load Forecasting Method
Based on Convolution Neural Network and Crosswise Algorithm
YANG Luo1,ZHONG Liqiang2,YIN Hao1
(1.Guangdong University of Technology,Guangzhou 510006,China;
2.Guangdong Electric Power Research Institute,Guangzhou 510030,China)
Abstract:With the rapid development of power system,the scale of power load data is becoming larger and larger. In the past,power load forecasting algorithms based on small-scale data may not be able to accommodate large data sets. In order to improve the engineering practicability of the predictive model,a new machine learning model is proposed which combines the Convolutional Neural Network (CNN) with the Cross and Cross Optimization Algorithm (CSO) for short-term load forecasting. Collecting similar daily load data from horizontally adjacent days and verticals from large-scale load data,setting the weight coefficients of lateral prediction and longitudinal prediction,and then using CSO optimization algorithm to find the optimal coefficient to obtain the final two-dimensional combined prediction,the result is compared to other machine learning algorithms. Experiments show that the model can quickly process large-scale load data and has strong generalization ability.
Keywords:large data compression;convolutional neural network;crossover algorithm;combination forecasting;similar daily load
0 引 言
在電力領域中,電力負荷預測在電力系統(tǒng)調度、電力市場和制定發(fā)電廠檢修計劃等方面一直是關鍵問題[1]。負荷預測問題是一個復雜的非線性問題,通常包含天氣、地理、社會經濟等因素[2]。文獻[3]認為通過對智能電網大數據的處理和分析,電力公司可以準確預測用戶的電力負荷,及時發(fā)現異常和故障,并加以處理?;趥鹘y(tǒng)機器學習算法的短期負荷預測模型顯示了它在預測負荷方面的有效性,特別是在解決負荷非線性特征擬合方面的有效性,其中人工神經網絡(ANN)和支持向量機(SVM)是構建預測模型中最常見的機器學習方法[4-6]。隨著學習樣本的增多,ANN的計算量會急劇增加,并且容易陷入局部最優(yōu)或過度擬合[7]。雖然支持向量機(SVM)的kernel函數和正則化技術可以有效解決過擬合問題[8],但是基于kernel函數的SVM在處理大數據預測模型時所耗費的時間過多,以至于失去了工程實用性[9]。這些算法都在各自的實驗環(huán)境中取得了不錯的實驗結果,但是這些研究都是基于小規(guī)模數據來進行設計和驗證的。此外,上述預測算法也很難發(fā)現與電力負荷不相關的壞數據。針對部分已有算法存在的問題,本文提出了一種新的方法,結合CSO優(yōu)化算法和深度學習模型(卷積神經網絡CNN)來進行短期負荷預測,并基于實際數據進行了提前24小時負荷預測實驗。結果表明,新方法結合了CSO算法強大的全局搜索能力和CNN算法的矩陣處理能力,能有效處理大規(guī)模數據,提高預測的準確性。
1 CNN卷積神經網絡
卷積神經網絡由一個或多個卷積層和頂端的全連通層(對應經典的神經網絡)組成,同時也包括關聯權重和池化層(Pooling Layer)[10]。卷積層是深度學習神經網絡的核心部分,卷積運算的目的是提取輸入的不同特征;池化層會不斷地減小數據的空間大小,因此參數的數量和計算量也會下降,這在一定程度上控制了過度擬合[11,12]。CNN的運行與局部輸入區(qū)域的基本操作(包括卷積、激活函數和池化)僅依賴于相關的空間坐標,這一結構使卷積神經網絡能夠利用輸入數據的二維結構[13]。相比較其他深度、前饋神經網絡,卷積神經網絡需要的參數更少,同時CNN在實現上采用GPU并行計算,計算速度和效率得到提高[14]。
本文使用CNN進行預訓練,典型的CNN結構如圖1所示。它包含5個卷積層和2個全連接層,部分卷積層的后面還添加了池化層,每層濾波器尺寸和卷積步長略有不同。如圖1所示,CNN的最后一個卷積層(Convolutional Layer,CONV)CONV5輸出256通道的特征圖(Feature Map),全連接層(Fully connected layer,FC)FC6將256個通道內的全部特征進行串聯,生成一個4096維的高維特征向量。不同類別的數據集在深層特征上的差異很大,對經過CONV5、FC6、FC7輸出的特征向量使用分類器(這里使用的是支持向量機SVM),能夠輸出較好的預測結果。
2 CSO縱橫交叉算法
縱橫交叉算法[15](Crisscross Optimization,CSO)不同于其他人工智能算法之處在于,CSO由雙搜索機制組成,分別是橫向交叉算子和縱向交叉算子,兩種算子在與競爭算子的同步配合下完成搜索任務。本文采用CSO智能算法優(yōu)化橫向預測和縱向預測的權值系數ra和rb,目標函數為預測誤差,優(yōu)化后的加權系數ra為0.3231,rb為0.6769。
2.1 橫向交叉算子
橫向交叉算子是一種在不同個體中所有維進行交叉的一種運算。假設種群用X表示,種群在更新過程中,橫向交叉所產生的解用MShc表示。假設父代種群中兩個個體X(i)和X(j)的第d維進行橫向交叉運算,則它們的子代產生公式如下所示:
式(1)和式(2)中,r1和r2是介于0~1之間的隨機數;c1和c2是介于-1~1之間的隨機數;D為粒子的維度;M為粒子的規(guī)模;X(i,d)和X(j,d)分別是種群中第i和j個個體的第d維。
從式(1)和式(2)可以看出,橫向交叉運算是以較大的概率在父代X(i)和X(j)所產生的超立方體空間內的對角頂點產生子代X(i,d)和X(j,d),并且以較小的概率在超立方體邊緣進行搜索,這種跨界搜索方式可以提升算法的全局搜索能力。
2.2 縱向交叉算子
CSO算法的特點在于縱向交叉算子,這種算子是一種在一個個體之間的不同維進行的一種交叉運算,假設種群中第i個體的d1維和d2維進行縱向交叉運算,則公式為:
式(3)中,X(i,d1)和X(i,d2)分別是X(i)的第d1維和d2維;r是分布在0~1之間的隨機數;MSvc(i,d1)是縱向交叉算子所產生的子代。
3 仿真實驗
3.1 仿真環(huán)境
為驗證本文所使用的算法在負荷預測中的有效性,在PC機上進行了仿真實驗,深度學習采用CNN框架進行網絡訓練,訓練時間共22小時。使用隨機梯度下降法進行網絡微調訓練,初始學習率為10-4,動量項為0.9,權值衰減系數為0.0005。
初次訓練耗時較多,如果數據更新需要重新訓練CNN網絡結構,把新的CNN網絡和舊CNN網絡共享的那些卷積層的學習率設置為0,僅更新網絡特有的網絡層。這樣兩個網絡就共享了所有公共的卷積層,使得網絡訓練幾乎不花時間,有效縮短了算法耗時。
3.2 實驗數據重構與誤差評價指標
從澳大利亞AEMO電力公司下載了大量電力負荷數據集,其中2012年至2017年的電力負荷記錄超過100萬次。數據集包括許多字段:負荷、日類型、溫濕度、天氣。樣本參數用矩陣表示為:
(4)
式(4)中,xt,i為預測時刻負荷,縱向數據(xt-n,i~xt,i)為n個相似日同一時刻的負荷;橫向數據xt,1~xt,96為相鄰日負荷。相似日的選取以綜合氣象指數為標準,其公式為:
式(5)中,{D=1,2,3}為天氣因子,3個等級代表肉眼可見云層的遮蔽程度;T為溫度因子,這里以攝氏度為單位;H為濕度因子,采用天氣預報中的相對濕度。計算出每天固定12個時刻的THI的平均值作為相似日的評價指標。訓練神經網絡時選出THI最接近的n日的數據作為相似日矩陣輸入訓練集中。誤差評價指標為平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)。
4 實驗結果分析
實驗結果由兩部分組成。因為本文首先針對CSO優(yōu)化算法參與預測的效果進行了實驗對比,然后用CNN-CSO算法與常見預測方法進行了比較,驗證了CNN-CSO算法的優(yōu)點和不足。
(1)本文在CNN的基礎上構造了CNN-CSO算法。因此,本文首先比較了CNN-CSO算法和CNN算法,詳細結果如表1所示。在夏季和冬季負荷預測中,本方法獲得的最優(yōu)MAPE值分別為3.0554和7.4102,這意味著在CSO優(yōu)化算法的幫助下,CNN-CSO算法優(yōu)于基于CNN的負荷預測算法??紤]到RMSE,也就是說,將常規(guī)時間序列數據擴展為優(yōu)化了權重系數后的二維數據矩陣,可以明顯地提高預測的性能。
(2)將本文的方法與基于線性回歸、支持向量機和神經網絡等常見負荷預測方法進行比較,結果如表2所示。與表2所示的結果相比,CNN-CSO算法的大多數評價結果都高于常規(guī)算法。此外,對數據集進行重構可以更有效地提高傳統(tǒng)機器學習方法的性能。例如,在夏季和冬季負荷預測中,將時間序列數據擴展為二維數據矩陣可有效提高預測的效果,因為MAPE值分別提高了84%和12%。
5 結 論
本文提出了一種基于CNN和CSO聯合算法的短期負荷預測方法。具體來說,CSO算法用于優(yōu)化重構后的數據矩陣的橫向、縱向數據的權值,以便更有效地構建模型。由評價指標MAPE和RMSE驗證,該模型在基于大規(guī)模數據的負荷預測上具有良好的效果。
參考文獻:
[1] 廖旎煥,胡智宏,馬瑩瑩,等.電力系統(tǒng)短期負荷預測方法綜述 [J].電力系統(tǒng)保護與控制,2011,39(1):147-152.
[2] FAN S,CHEN L. Short-Term Load Forecasting Based on an Adaptive Hybrid Method [J].IEEE Transactions on Power Systems,2006,21(1):392-401.
[3] Diamantoulakis P D ,Kapinas V M ,Karagiannidis G K . Big Data Analytics for Dynamic Energy Management in Smart Grids [J]. Big Data Research,2015,2(3):94-101.
[4] 李龍,魏靖,黎燦兵,等.基于人工神經網絡的負荷模型預測 [J].電工技術學報,2015,30(8):225-230.
[5] 吳倩紅,高軍,侯廣松,等.實現影響因素多源異構融合的短期負荷預測支持向量機算法 [J].電力系統(tǒng)自動化,2016,40(15):67-72+92.
[6] 楊再鶴,向鐵元,鄭丹.基于小波變換和SVM算法的微電網短期負荷預測研究 [J].現代電力,2014,31(3):74-79.
[7] Hernández,Luis,Baladrón,Carlos,Aguiar J M ,et al. Artificial neural networks for short-term load forecasting in microgrids environment [J].Energy,2014,75(1):252-264.
[8] 王崗,姜杰,唐昆明,等.基于自適應雙向加權最小二乘支持向量機的超短期負荷預測 [J].電力系統(tǒng)保護與控制,2010,38(19):142-146.
[9] 吳潤澤,包正睿,王文韜,等.Hadoop架構下基于模式匹配的短期電力負荷預測方法 [J].電工技術學報,2018,33(7):1542-1551.
[10] [7] Hernández,Luis,Baladrón,Carlos,Aguiar J M ,et al. Artificial neural networks for short-term load forecasting in microgrids environment [J].Energy,2014,75(1):252-264.
[11] X.Wang,Y.Shi,J.Zhang,L.Bo,C.Cheng. Computation services and applications of electricity big data based on Hadoop Power Syst Technol,2015,39(11):3128-3133.
[12] GIRSHICK R,DONAHUE J,DARRELL T,et al. Rich Feature Hierarchies for Accurate Object Detection and Semantic Segmentation[C]// Computer Vision and Pattern Recognition (CVPR),2014 IEEE Conference on. S.l.:s.n.,2014:580-587.
[13] Geoffrey E. Hinton,Nitish Srivastava,Alex Krizhevsky,et al. Improving neural networks by preventing co-adaptation of feature detectors [J].CoRR,2012.
[14] Xishuang Dong,Lijun Qian and Lei Huang.[IEEE 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)-Jeju Island,South Korea (2017.2.13-2017.2.16)] 2017 IEEE International Conference on Big Data and Smart Computing (BigComp)-Short-term load forecasting in smart grid:A combined CNN and K-means clustering approach[C]//IEEE International Conference on Big Data & Smart Computing.IEEE,2017:119-125.
[15] 孟安波,胡函武,劉向東.基于縱橫交叉算法優(yōu)化神經網絡的負荷預測模型 [J].電力系統(tǒng)保護與控制,2016,44(7):102-106.
作者簡介:楊躒(1993-),男,漢族,河南駐馬店人,碩士研究生,研究方向:人工智能在電力系統(tǒng)中的應用;鐘力強(1984-),男,漢族,廣東廣州人,博士,高級工程師,研究方向:電機驅動與控制;殷豪(1972-),女,漢族,重慶人,副教授,研究方向:人工智能在電力系統(tǒng)中的應用。