李金穎,馬天陽
(華北電力大學 經(jīng)濟管理系,河北 保定 071003)
在“雙碳”目標下,風力、光伏、水力等波動性較大的清潔能源供電比例不斷上升,所以電力負荷預測顯得尤為重要。
短期電力負荷的影響因素眾多,對預測模型的準確性、靈敏性要求較高[1]。
關(guān)于短期電網(wǎng)負荷預測模型的應用研究發(fā)展大致經(jīng)歷了2個階段。
第一階段為傳統(tǒng)數(shù)學模型的應用,常見的有時間序列法、灰色預測和回歸分析法等。文獻[2]構(gòu)建了一種基于二乘估計的多方程時間序列模型,取得了較高的預測精度。文獻[3]提出了時間序列數(shù)據(jù)深度挖掘模型,對解決短期電力負荷預測存在數(shù)據(jù)時間序列紊亂具有良好效果。文獻[4]基于累積法構(gòu)建了灰色模型,并對電力負荷進行了預測,解決了傳統(tǒng)灰色模型擬合度較差的問題。文獻[5]應用灰色理論對電力系統(tǒng)的負荷預測進行了研究。文獻[6]構(gòu)建了基于K最鄰近和K-means的多元線性回歸負荷預測模型,取得了較好的擬合效果。文獻[7]分別通過時間序列與灰色模型對短期電力負荷預測效果進行了對比,結(jié)果表明2種模型下的預測結(jié)果精度較高且各具優(yōu)點,應根據(jù)實際情景選擇合適的模型。這一階段預測方法原理簡單,對于線性預測精度高、速度快。但是,此類方法對于數(shù)據(jù)條件要求較高;當數(shù)據(jù)處于非線性時,預測結(jié)果的誤差較大。
第二階段為人工智能算法的應用,以機器學習算法為主流。神經(jīng)網(wǎng)絡(luò)模型因具有較強的學習和識別能力、較強的適應性而受到關(guān)注,其應用方面在電力負荷預測領(lǐng)域取得大量成果。文獻[8]提出了改進的神經(jīng)網(wǎng)絡(luò)負荷預測模型;該模型在擬合精度、學習能力上優(yōu)于原始BP(Back-propagation)模型。文獻[9]提出了一種基于K均值和 FCM(Fuzzy clustering model)-BP的短期電力負荷預測模型;實證結(jié)果證明,模型的準確性高于傳統(tǒng)的BP、RBF和廣義回歸神經(jīng)網(wǎng)絡(luò)模型。除此之外,國內(nèi)外學者對于神經(jīng)網(wǎng)絡(luò)的優(yōu)化進行了大量的研究。例如文獻[10]通過小波變換方法對神經(jīng)網(wǎng)絡(luò)進行優(yōu)化并應用于短期電力負荷預測,結(jié)果表明其精確性優(yōu)于傳統(tǒng)神經(jīng)預測結(jié)果。文獻[11]提出了一種尖峰神經(jīng)網(wǎng)絡(luò)短期負載預測模型(SNNSTLF),對某地區(qū)短期電力負荷進行預測;結(jié)果表明該模型優(yōu)于傳統(tǒng)模型。文獻[12]將小波分析與神經(jīng)網(wǎng)絡(luò)方法結(jié)合起來,將實際歷史負荷數(shù)據(jù)分解為高低頻負荷序列,最終的預測效果良好。文獻[13]將改進的卷積神經(jīng)網(wǎng)絡(luò)和長短時記憶網(wǎng)絡(luò)2個深度學習神經(jīng)網(wǎng)路模型應用于光伏電站的短期負荷預測中。文獻[14]提出一種用于預測的集成深度隨機網(wǎng)絡(luò),通過一種逐層調(diào)諧算法來優(yōu)化傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),其模型結(jié)果優(yōu)于傳統(tǒng)模型。文獻[15]提出一種改進鯨魚算法優(yōu)化最小二乘支持向量機(Least squares support vector machine,LSSVM)模型,其預測結(jié)果優(yōu)于傳統(tǒng)LSSVM模型。這些文獻的研究結(jié)果表明,神經(jīng)網(wǎng)絡(luò)及其改進優(yōu)化模型的預測效果較為理想,對數(shù)據(jù)平整度要求比傳統(tǒng)模型低,在非線性預測上優(yōu)勢明顯。針對神經(jīng)網(wǎng)絡(luò)易陷入局部最優(yōu)等缺點,一種新型的反向神經(jīng)網(wǎng)絡(luò)——極限學習機(Extreme learning machine,ELM)被提出。ELM可以克服傳統(tǒng)神經(jīng)網(wǎng)絡(luò)算法的缺點,通過優(yōu)化輸入層權(quán)值和隱含層閾值的獲取,即可快速獲得最優(yōu)解;但是,ELM 也存在易出現(xiàn)過擬合現(xiàn)象等缺點[16]。文獻[17]將支持向量機(Support vector machine,SVM)中的核函數(shù)思想引入ELM,提出核極限學習機算法(Kernel based extreme learning machine,KELM);該算法不僅有 ELM算法同樣優(yōu)秀的運行速度,同時還具有更加穩(wěn)定的性能以及和SVM一樣的泛化能力。文獻[18]將基于改進的EEMD方法與KELM相結(jié)合,并進行了電力負荷預測。文獻[19]通過混沌多目標蟻獅優(yōu)化算法對KELM進行了優(yōu)化。文獻[20]提出一種智能優(yōu)化算法;該算法具有全局搜索范圍廣、收斂速度快、易實現(xiàn)和改進等優(yōu)點。
本文提出一種基于混沌精英優(yōu)化的哈里斯鷹算法(Harris hawks optimizer,HHO),結(jié)合 KELM進行電力負荷回歸預測:通過引入精英等級制度策略,用Tent混沌映射機制對HHO算法進行優(yōu)化,構(gòu)建混沌精英改進的哈里斯鷹算法(CEHHO);再通過CEHHO算法對影響KELM性能的正則化系數(shù)C和核函數(shù)參數(shù)S進行優(yōu)化,在得到最佳參數(shù)后建立電力負荷回歸預測模型(CEHHO-KELM)。
影響短期電力負荷的因素眾多,例如電網(wǎng)本身結(jié)構(gòu)、時間特點、經(jīng)濟水平、氣候變化等。在分析總結(jié)相關(guān)文獻資料基礎(chǔ)上,本文主要從經(jīng)濟、時間、氣候以及電網(wǎng)自身特點4個方面入手,開展電力負荷影響因素分析,魚骨圖如圖1所示。
圖1 負荷影響因素魚骨圖Fig. 1 Fishbone diagram of load impact factors
通過分析可知,在該指標體系中,某些影響因素數(shù)據(jù)樣本規(guī)律性較差,例如氣象數(shù)據(jù)。本文采用灰色關(guān)聯(lián)度方法對影響指標數(shù)據(jù)進行篩選。
灰色關(guān)聯(lián)分析的具體計算步驟如下。
第1步,確定分析數(shù)列。
將電力負荷數(shù)據(jù)作為參考序列,F(xiàn)={F(k)|k=1,2,···,n};將各影響因素數(shù)列確定為比較序列,f=fi(k),i=1,2,···,n。
第2步,變量的無量綱化。
電力負荷及其影響因素之間的數(shù)量級和量綱不同;所以,若直接利用原始數(shù)據(jù)進行分析,結(jié)果可靠性會較低。因此,需要對原始數(shù)據(jù)進行標準化處理,將處理后的數(shù)據(jù)用于灰色關(guān)聯(lián)度分析。
本文采用Z-score標準化方法:
式中:x為原始數(shù)據(jù);μ為均值;σ為標準方差;Z為標準化后的數(shù)據(jù)。
第3步,計算關(guān)聯(lián)系數(shù)。
F(k)與fi(k)的關(guān)聯(lián)系數(shù)為:
式中:Δi(k)=|F(k)–fi(k)|;ρ∈(0,1);ηi(k)為關(guān)聯(lián)系數(shù)。
第4步,計算關(guān)聯(lián)度。
將參考序列與比較序列間的管理系數(shù)集中為一個值,對其求平均并將其作為2序列間的關(guān)聯(lián)度:
式中:ri為關(guān)聯(lián)度值。
第5步,關(guān)聯(lián)度排序。
將關(guān)聯(lián)度結(jié)果進行排序。關(guān)聯(lián)系數(shù)越大,則該影響因素與電力負荷之間關(guān)系越密切。
ELM是一種簡單易用且性能強大的單隱藏層前向神經(jīng)網(wǎng)絡(luò)。相比于傳統(tǒng)神經(jīng)網(wǎng)絡(luò),其計算速度較快,所以被廣泛用于負荷預測中。ELM結(jié)構(gòu)如圖2所示。
圖2 KELM網(wǎng)絡(luò)結(jié)構(gòu)Fig. 2 The network structure of KELM
圖2中,ELM輸入權(quán)重ω∈RXY(X和Y分別為輸入層和隱藏層神經(jīng)網(wǎng)絡(luò))和偏差是隨機生成的。將電力負荷數(shù)據(jù)的n個影響因素作為輸入訓練集,則電力負荷回歸預測量為:
式(4)的具體訓練機理如下:
式中:Y為訓練樣本實際輸出;H為隱藏層輸出矩陣;β為輸出層權(quán)重矩陣;ωi和bi分別為隱藏層第i個神經(jīng)元的權(quán)重和偏置。
將 ELM 神經(jīng)網(wǎng)絡(luò)的訓練轉(zhuǎn)化為求解線性系統(tǒng)Y=Hβ,同時通過求解其最小范數(shù)最小二乘解得到一個最優(yōu)β值β′:
式中:矩陣H+由矩陣H經(jīng)Moore-Penrose廣義逆變換而來。
ELM神經(jīng)網(wǎng)絡(luò)在實際應用中易出現(xiàn)訓練結(jié)果不穩(wěn)定以及泛化能力不理想的問題。本文將支持向量機(SVM)中的核函數(shù)思想引入ELM,提出核極限學習機算法(KELM)。該算法不僅有ELM神經(jīng)網(wǎng)絡(luò)同樣優(yōu)秀的運行速度,同時還具有更加穩(wěn)定的性能以及和SVM一樣的泛化能力。
用核函數(shù)矩陣Ω=HHT代替ELM神經(jīng)網(wǎng)絡(luò)隨機矩陣HHT?;趍ercer條件的定義可得:
將正則化系數(shù)C和核函數(shù)Ω引入ELM神經(jīng)網(wǎng)絡(luò)隨機矩陣HHT中,此時β′求值計算公式為:
基于以上公式,可得KELM神經(jīng)網(wǎng)絡(luò)的輸出函數(shù)為:
KELM 通過引入核函數(shù),以內(nèi)積的形式確定隱含層映射核函數(shù),隱含層節(jié)點個數(shù)無需設(shè)定;其結(jié)果是加快了模型學習速度,有效提高了基于KELM的電力負荷預測模型的泛化能力和穩(wěn)定性。
HHO算法是一種仿生智能算法,其思想是通過模擬哈里斯鷹捕獵行為,利用突襲圍捕策略實現(xiàn)全局尋優(yōu)。
尋優(yōu)過程可以劃分為3個階段。第1個階段為搜索階段:在這個階段,哈里斯鷹處于搜尋獵物階段狀態(tài)。第2個階段為搜索和開發(fā)階段:在這個階段,哈里斯鷹處于發(fā)現(xiàn)獵物的狀態(tài)。第 3個階段為開發(fā)階段:在這個階段,哈里斯鷹處于對獵物進行捕捉的狀態(tài)。
HHO算法具有尋優(yōu)性能較好、算法參數(shù)較少等特點,并在圖像分割、數(shù)值優(yōu)化、神經(jīng)網(wǎng)路等領(lǐng)域得到廣泛應用。與其他群智能算法一樣,在求解復雜組合優(yōu)化問題上,該算法也存在一些不足,比如種群多樣性低、尋優(yōu)性能低等。
2.2.1 搜索階段
式中:hrand為當前種群中隨機選擇的個體;hrab為當前最優(yōu)個體;hm為當前種群的平均位置;r1、r2、r3、r4為0至1之間的隨機數(shù);bu、bL為搜索空間的上下界限;M為種群數(shù)量。
2.2.2 搜索與開發(fā)階段
哈里斯鷹依靠能量因子E和逃逸能量因子El實現(xiàn)從全局搜索轉(zhuǎn)變?yōu)榫植克阉?,計算公式如下?/p>
式中:E0為[–1,1]的隨機數(shù);t為當前迭代次數(shù);T為最大迭代次數(shù)。
2.2.3 開發(fā)階段
針對實際捕獵過程,利用4個策略進行開發(fā)階段的位置更新,以更好地模擬狩獵行為。
(1)軟圍攻
當0.5≤|El|≤1且r≥0.5時,獵物有充足的體力,但只有很小的機會能夠逃離哈里斯鷹的包圍。此時哈里斯鷹會選擇軟圍攻的方式進行狩獵:
式中:J為當前獵物的跳躍距離;Δh(t)為迭代次數(shù)t時獵物位置向量與哈里斯鷹個體當前位置向量的差值;rs為[0,1]內(nèi)的隨機變量。
(2)硬圍攻
當|El|≤0.5且r≥0.5時,獵物沒有充足的體力使其逃脫哈里斯鷹的圍捕。哈里斯鷹選擇硬圍攻方式對獵物進行捕捉:
(3)軟包圍
當 0.5≤|El|<1且r<0.5時,獵物有充足的體力逃跑且獵物有很大的機會從哈里斯鷹包圍中逃脫。此情況下,在對獵物進行捕捉之前,哈里斯鷹會對獵物進行更加嚴密的軟圍攻,以此來防止獵物逃脫。
通過引入 Levy飛行函數(shù)來實現(xiàn)對獵物更加嚴密的軟包圍:
式中:s(·)為適應度函數(shù);n為問題維度;S為n維隨機向量;LF(n)為萊維飛行函數(shù)表達式。
(4)硬包圍
當|El|>0.5且r<0.5時,此時獵物有可能逃逸,但逃逸能量不足。此時,哈里斯鷹會在進攻時形成一個智能的硬包圍圈,以縮小和獵物的平均距離。該策略位置更新如下:
HHO算法存在一定缺點:(1)過于依賴現(xiàn)有個體。因個體間的交流少,所以多樣性不足。(2)尋優(yōu)時易于陷入早熟,無法跳出局部最優(yōu)。(3)開發(fā)與研究過程中,HHO算法的能量指標關(guān)系是線性變化的,而HHO算法的搜索過程則是非線性變化。
借鑒文獻[21]方法對HHO算法進行改進:(1)為增加群體的交互,引入精英等級制度策略;充分利用優(yōu)勢種群來預測物種最好的發(fā)展方式,以提高算法種群多樣性。(2)在迭代過程中增加次優(yōu)解的數(shù)量。選擇3個最優(yōu)位置來替代最優(yōu)預測解,以誘導其他個體的追隨。
式中:Xj,best為當前種群優(yōu)勢個體;f(Xz,best)為當前種群優(yōu)勢個體適應度值。
利用Tent混沌映射調(diào)整哈里斯鷹算法的關(guān)鍵參數(shù)r的取值。r更新公式如下:
在改進的HHO算法中,為了克服算法后期只進行局部搜索的不足,提出一種新的能量因子E1的更新方式。
式中:t為當前迭代次數(shù);tmax為最大迭代次數(shù)。
當算法陷入局部最優(yōu)時,引進高斯隨機游走策略:通過函數(shù)G調(diào)整高斯函數(shù)隨機游走步長。在迭代前期施加較大擾動,迭代后期擾動迅速減小。進而平衡了算法的探索和開發(fā)能力,更新位置,跳出局部最優(yōu);
式中:X′為從優(yōu)勢種群中隨機選擇的一個個體。
最后采用貪婪策略保留優(yōu)勢個體,加快收斂,CEHHO流程圖如圖3所示。
圖3 CEHHO流程圖Fig. 3 The flow chart of CEHHO
采用改進的哈里斯鷹算法對核極限學習機正則化系數(shù)C和核函數(shù)參數(shù)S進行優(yōu)化,進而提高其網(wǎng)絡(luò)的分類識別正確率。
在得到最佳參數(shù)后,建立電力負荷綜合預測模型。CEHHO-KELM具體步驟如下:
(1)建立分類數(shù)據(jù)庫,將其分為訓練集和測試集并進行歸一化。
(2)將訓練集作為 KELM 的輸入向量,對KELM 進行訓練。
(3)利用CEHHO算法對 KELM中的正則化系數(shù)C和核函數(shù)S優(yōu)化,選擇最優(yōu)C與S,重構(gòu)KELM。
(4)將優(yōu)化后的 KELM 算法重新訓練,對比結(jié)果。
(5)判斷是否滿足終止條件。若滿足則退出循環(huán),輸出預測結(jié)果;否則,重新帶入計算。
(6)將測試集輸入優(yōu)化后的 KELM 中,輸出預測結(jié)果。
根據(jù)上述步驟,其相應流程圖如圖4所示。
圖4 CEHHO-KELM基本流程圖Fig. 4 The basic flow chart of CEHHO-KELM
本文選取某省數(shù)據(jù)進行實證分析。以2015—2019年數(shù)據(jù)為基礎(chǔ),選取1 700組負荷數(shù)據(jù)以及影響負荷的相關(guān)因素進行模型檢驗。
通過灰色關(guān)聯(lián)度分析,得到影響因素與電力負荷關(guān)聯(lián)系數(shù)如表1所示。
表1 影響因素關(guān)聯(lián)度Tab. 1 Correlation of influencing factors
根據(jù)灰色關(guān)聯(lián)度分析結(jié)果,選擇灰色關(guān)聯(lián)度大于0.85的6個因素作為電力負荷預測模型的輸入向量,即GDP、最高溫度、最低溫度、降雨量、是否節(jié)假日、前一天負荷數(shù)據(jù)。
將改進的HHO算法CEHHO用于核極限學習機的參數(shù)優(yōu)化,初始參數(shù)設(shè)置為:Pop=50,Tmax=30,邊界范圍[0.1,50]。利用改進的哈里斯鷹算法迭代尋優(yōu),最終得到的最優(yōu)參數(shù)組合為:正則化系數(shù)C=0.238 8,核函數(shù)參數(shù)S=1.154 7。CEHHO的收斂曲線如圖5所示。
圖5 CEHHO收斂曲線Fig. 5 The convergence curve of CEHHO
根據(jù)最優(yōu)參數(shù)對KELM模型進行重新訓練得到預測模型。為了進一步檢驗CEHHO-KELM模型在電力負荷預測中的有效性和優(yōu)越性,選擇4種模型KELM、LSSVM、HHO-KELM、CEHHO-KELM進行比較。為了對比 KELM、LSSVM、HHOKELM、CEHHO-KELM的預測效果,以均方誤差作為衡量標準。訓練集和測試集的誤差分別如圖6、圖7所示。
圖6 訓練集誤差對比Fig. 6 Train set error comparison
圖7 測試集誤差對比Fig. 7 Test set error comparison
通過計算,CEHHO-KELM 訓練集與測試集的均方誤差分別為0.012 799和0.226 19,均小于其他預測模型。
由圖6、圖7可以看到,各算法誤差排序從大到小依次為:LSSVM,KELM,HHO-KELM,CEHHO-KELM。與其他算法相比,CEHHO-KELM算法訓練集與測試集誤差明顯最小。該結(jié)果說明,CEHHO優(yōu)化后的KELM模型預測效果較好。
為進一步檢驗模型預測效果,且考慮到圖像的清晰,本文選取KELM、HHO-KELM、CEHHOKELM 的預測結(jié)果和真實數(shù)據(jù)進行對比,對于誤差最大的LSSVM模型預測結(jié)果不再展示。
訓練集與測試集預測結(jié)果如圖8與圖9所示。考慮到圖8與圖9的圖像數(shù)據(jù)繁瑣,不易觀察,所以:截取圖8紅框部分進行細節(jié)展示,如圖10所示;截取圖9紅框部分,如圖11所示。
圖8 測試集負荷預測對比Fig. 8 Test set load forecast comparison
圖9 訓練集預測結(jié)果對比Fig. 9 Comparison of forecast results of train set
圖10 測試集負荷預測對比細節(jié)展示Fig. 10 The detail display of test set load forecast comparison
圖11 訓練集負荷預測對比細節(jié)展示Fig. 11 The detail display of train set load forecast comparison
從圖8~11中可以直觀地看出,CEHHOKELM 的預測效果最好,其預測結(jié)果與實際值基本一致,且相對誤差最小。CEHHO優(yōu)化 KELM參數(shù)模型優(yōu)于其他3種模型,主要是由于:將哈里斯鷹算法和核極限學習機算法的優(yōu)點相結(jié)合,使得CEHHO-KELM模型對電網(wǎng)負荷的預測效果更接近真實值。
通過CEHHO-KELM模型對某省短期電力負荷進行回歸預測,結(jié)果表明,該模型能夠結(jié)合CEHHO與KELM模型的優(yōu)勢,具有尋優(yōu)性能較好、算法參數(shù)較少、搜索速度快的特點;混沌精英策略的引進,又彌補了HHO算法易陷入局部最優(yōu)的缺點,使模型在短期電力負荷預測應用上具有一定優(yōu)勢。