雷炳銀,王子馳,蘇雨晴,孫煒哲,楊靈藝
(平高集團(tuán)有限公司,平頂山 467000)
電力系統(tǒng)運(yùn)行的一個(gè)重要方面是系統(tǒng)性能滿足負(fù)荷要求[1]。負(fù)荷供需平衡是電力系統(tǒng)穩(wěn)定運(yùn)行的基本要求,精確的負(fù)荷預(yù)測(cè)對(duì)保證電力系統(tǒng)經(jīng)濟(jì)、安全、可靠運(yùn)行起著至關(guān)重要的作用[2-3]。
針對(duì)短期負(fù)荷預(yù)測(cè)的研究,國(guó)內(nèi)外學(xué)者提出了許多行之有效的方法[4],可概括為3類。第1類是基于數(shù)學(xué)統(tǒng)計(jì)的建模預(yù)測(cè)方法,例如線性回歸法[5]和時(shí)間序列建模方法,此類方法具有模型簡(jiǎn)單、計(jì)算速度快、易于釋因等優(yōu)點(diǎn),但在處理非線性數(shù)據(jù)時(shí)對(duì)數(shù)據(jù)穩(wěn)定性要求高,預(yù)測(cè)精度變低。第2類是基于機(jī)器學(xué)習(xí)的預(yù)測(cè)方法,包括人工神經(jīng)網(wǎng)絡(luò)、強(qiáng)化學(xué)習(xí)和支持向量機(jī)SVM(support vector machine)[6-7]等,此類方法可構(gòu)建復(fù)雜非線性高維模型,在非線性系統(tǒng)分析方面具有優(yōu)越性。文獻(xiàn)[8]在深度學(xué)習(xí)框架中構(gòu)建了長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)來(lái)預(yù)測(cè)電力負(fù)荷。最小二乘支持向量回歸機(jī)LSSVM(least squares support vector machine)是SVM的改進(jìn)體,主要通過任意的精度對(duì)非線性系統(tǒng)擬合,在非線性建模和預(yù)測(cè)方面具有優(yōu)勢(shì)[9]。第3類是組合預(yù)測(cè)方法,此類方法針對(duì)電力負(fù)荷預(yù)測(cè)面臨的多重問題,分別將具有針對(duì)性的預(yù)測(cè)模型進(jìn)行組合以提升預(yù)測(cè)精度。針對(duì)電力負(fù)荷強(qiáng)非線性與波動(dòng)性特征,直接利用負(fù)荷歷史數(shù)據(jù)進(jìn)行訓(xùn)練與預(yù)測(cè),難以實(shí)現(xiàn)高精度預(yù)測(cè)。因此文獻(xiàn)[10]提出EEMD-GRU-MLR組合預(yù)測(cè)方法,采用集合經(jīng)驗(yàn)?zāi)J椒纸釫EMD(ensem?ble empirical mode decomposition)方法分解原始負(fù)荷序列;高頻分量利用門控循環(huán)單元GRU(gated re?current unit)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練預(yù)測(cè),網(wǎng)絡(luò)輸入為預(yù)測(cè)時(shí)刻前24 h內(nèi)(每0.5 h)的負(fù)荷高頻分量值,每次輸出1個(gè)預(yù)測(cè)值,即該預(yù)測(cè)時(shí)刻(0.5 h)的負(fù)荷高頻分量值;低頻分量采用多元線性回歸MLR(multiple linear regression)進(jìn)行預(yù)測(cè),但該方法未針對(duì)預(yù)測(cè)模型的關(guān)鍵參數(shù)進(jìn)行優(yōu)化。文獻(xiàn)[11]提出一種脈沖神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,有效提高了預(yù)測(cè)精度。
現(xiàn)有研究表明LSSVM在解決非線性系統(tǒng)建模方面具有優(yōu)勢(shì)[6],但由于電力負(fù)荷序列含有多種頻率特征,現(xiàn)有研究在LSSVM預(yù)測(cè)模型中難以選取同時(shí)適用于所有頻率特征的核函數(shù),同時(shí)也缺少針對(duì)LSSVM關(guān)鍵參數(shù)的優(yōu)化配置,LSSVM預(yù)測(cè)精度恰受核函數(shù)類型和關(guān)鍵參數(shù)配置影響較大。因此,本文首先采用EEMD將負(fù)荷序列分解為高頻分量、隨機(jī)分量和低頻分量3類,進(jìn)而采用具有不同核函數(shù)的LSSVM模型進(jìn)行訓(xùn)練和預(yù)測(cè),同時(shí)利用布谷鳥搜索CS(cuckoo search)算法優(yōu)化LSS?VM預(yù)測(cè)模型的關(guān)鍵參數(shù),最后通過算例驗(yàn)證本文所提方法能有效提高短期電力負(fù)荷的預(yù)測(cè)精度。
本文提出的EEMD-CS-LSSVM預(yù)測(cè)方法流程如圖1所示。電力負(fù)荷歷史數(shù)據(jù)進(jìn)行EEMD,將電力負(fù)荷數(shù)據(jù)的各分量分別進(jìn)行歸一化處理并輸入到具有不同核函數(shù)特征的LSSVM網(wǎng)絡(luò)進(jìn)行訓(xùn)練,同時(shí)利用CS算法進(jìn)行LSSVM參數(shù)尋優(yōu),最后將各個(gè)LSSVM預(yù)測(cè)分量進(jìn)行疊加得出最終預(yù)測(cè)值,具體方法如下。
步驟1對(duì)電力負(fù)荷歷史數(shù)據(jù)進(jìn)行EEMD,依據(jù)文獻(xiàn)[10]提出的過零率指標(biāo),將分解后的各分量定義為高頻分量、隨機(jī)分量和低頻分量3類。
步驟2對(duì)電力負(fù)荷各分量及溫度分別進(jìn)行歸一化處理。利用已有歷史數(shù)據(jù)計(jì)算電力負(fù)荷分量與天氣狀態(tài)、溫度、濕度的皮爾遜相關(guān)系數(shù),其中,溫度的相關(guān)系數(shù)超過0.8視為強(qiáng)相關(guān)關(guān)系,因而選用溫度作為電力負(fù)荷預(yù)測(cè)變量。
步驟3將歸一化的電力負(fù)荷高頻分量和隨機(jī)分量及溫度變量輸入到具有徑向基函數(shù)RBF(radi?al basis function)核函數(shù)的LSSVM中進(jìn)行訓(xùn)練;低頻分量和溫度數(shù)據(jù)輸入到具有線性核函數(shù)的LSSVM網(wǎng)絡(luò)中訓(xùn)練。
步驟4利用CS算法分別對(duì)各分量的LSSVM預(yù)測(cè)模型關(guān)鍵參數(shù)進(jìn)行優(yōu)化,獲得最優(yōu)參數(shù)配置。
步驟5將經(jīng)CS訓(xùn)練的LSSVM預(yù)測(cè)模型用于電力負(fù)荷各分量預(yù)測(cè),并輸出各分量的預(yù)測(cè)值。
步驟6將所有LSSVM模型預(yù)測(cè)的分量值疊加,還原得到電力負(fù)荷預(yù)測(cè)值。
圖1 EEMD-CS-LSSVM流程Fig.1 Flow chart of EEMD-CS-LSSVM
經(jīng)驗(yàn)?zāi)B(tài)分解法EMD(empirical mode decom?position)作為一種基于自適應(yīng)正交基的時(shí)頻信號(hào)處理方法,可直接分解非線性平穩(wěn)時(shí)間序列,減少了復(fù)雜的信號(hào)分析過程。但當(dāng)實(shí)際信號(hào)中存在間歇性信號(hào)時(shí),EMD會(huì)導(dǎo)致模式混疊現(xiàn)象,即1個(gè)固有模態(tài)函數(shù)IMF(inherent modal function)分量中存在多個(gè)尺度分量,或者多個(gè)IMF分量中存在1個(gè)尺度分量,使得各IMF的代表性不夠清晰。EEMD通過加入白噪聲,改變極值點(diǎn)結(jié)構(gòu),獲得滿足要求的信號(hào)特征,解決了EMD混疊問題[12]。具體方法如下。
步驟1將n組符號(hào)相反的噪聲信號(hào)加到原信號(hào)上,即
式中:x(t)為原始信號(hào);n+i(t)為正噪聲;ni(t)為負(fù)噪聲;分別為正、負(fù)模態(tài)函數(shù)。
步驟2具有正、負(fù)噪聲的模態(tài)函數(shù)被含噪聲的經(jīng)驗(yàn)?zāi)B(tài)分解成多個(gè)分量。
步驟3利用EEMD得到第j階IMF分量,即
LSSVM為支持向量機(jī)的擴(kuò)展,基本原理是將非線性函數(shù)把數(shù)據(jù)映射到高維空間[13-14]后,再進(jìn)行線性回歸,其回歸函數(shù)為
式中:ω為權(quán)值向量;b為偏置值;x為輸入值;φ()為映射函數(shù)。
通過結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,尋優(yōu)目標(biāo)函數(shù)為
式中:yi為第i個(gè)輸出值;C為誤差懲罰系數(shù);ξi為松弛變量。
式中:ai為第i維拉格朗日乘數(shù);L為拉格朗日函數(shù);xi為第i個(gè)輸入值。根據(jù)KKT條件可得
將式(8)消去 ω 和 ξi可得
根據(jù)Mercer條件可以確定核函數(shù),即
則LSSVM的擬合函數(shù)為
用于電力負(fù)荷低頻分量預(yù)測(cè)的線性核函數(shù)為
用于電力負(fù)荷高頻和隨機(jī)分量預(yù)測(cè)的RBF核函數(shù)為
式中:x和xi分別為m維輸入向量和m維第i個(gè)徑向基函數(shù)的中心;‖x-xi‖為x與xi之間的距離,具有范數(shù)含義;σ為核函數(shù)寬度。
CS算法屬于啟發(fā)式尋優(yōu)算法,相關(guān)研究驗(yàn)證了該算法比其他群體算法更有效[15]。本文利用CS算法優(yōu)化LSSVM預(yù)測(cè)模型的兩個(gè)關(guān)鍵參數(shù):懲罰系數(shù)C與核函數(shù)寬度σ。
布谷鳥目標(biāo)函數(shù)定義為
式中:N為樣本范圍;Ji為真實(shí)值;Qi為預(yù)測(cè)值,由LSSVM擬合函數(shù)式(11)計(jì)算得到,其值受懲罰系數(shù)與核函數(shù)寬度的影響。
CS算法具體步驟如下。
步驟1設(shè)定CS算法目標(biāo)函數(shù)為式(14),其中,種群規(guī)模為N,維數(shù)為nd,被宿主鳥發(fā)現(xiàn)的最大概率為 pa。
步驟2全局搜索。布谷鳥在迭代前期會(huì)進(jìn)行全局搜索,通過比較目標(biāo)函數(shù)值,保留上一代最優(yōu)鳥巢方位,并通過下式對(duì)鳥巢方位進(jìn)行更新:
式中:Xit為第i個(gè)鳥巢第t代的方位;Xibest為鳥巢第t代最佳方位;為萊維飛行隨機(jī)搜索路徑,其中β=1.5,u服從正態(tài)分布;Γ()為伽瑪函數(shù)。
步驟3局部搜索。利用式(15)調(diào)整方位后,每個(gè)解產(chǎn)生1個(gè)隨機(jī)數(shù)R,R為布谷鳥鳥蛋被宿主鳥發(fā)現(xiàn)的概率。將R與 pa比較,若R
式中:R∈[0 , 1];Xjt、Xit為隨機(jī)鳥窩方位。
步驟4當(dāng)算法滿足收斂精度和收斂條件后,得到適應(yīng)度最高的LSSVM模型參數(shù)。
由于負(fù)荷數(shù)據(jù)與溫度數(shù)據(jù)的量綱不同,因此分別進(jìn)行在[0,1]區(qū)間內(nèi)的歸一化處理。(1)負(fù)荷數(shù)據(jù)歸一化可表示為
式中:xnorm為歸一化后電力負(fù)荷;xmin和xmax分別為歷史電力負(fù)荷的最小值和最大值;x為原始電力負(fù)荷。
(2)溫度歸一化可表示為
式中:Tnorm為歸一化后的溫度;T為原始溫度;Tmin和Tmax分別為歷史溫度的最小值和最大值。
實(shí)測(cè)獲得河南某地區(qū)2018年6月1日—2018年8月29日共計(jì)90 d電力負(fù)荷數(shù)據(jù)及溫度數(shù)據(jù),時(shí)間間隔為1 h,共計(jì)2 160個(gè)數(shù)據(jù)點(diǎn)。將前89 d數(shù)據(jù)為訓(xùn)練數(shù)據(jù),預(yù)測(cè)第90 d的電力負(fù)荷數(shù)據(jù)。
電力負(fù)荷歷史數(shù)據(jù)如圖2所示,可以看出,該負(fù)荷具有強(qiáng)烈的非線性特性。因此,本文利用EEMD方法對(duì)電力負(fù)荷歷史序列進(jìn)行分解,得到電力負(fù)荷IMF分量。分解出的電力負(fù)荷分量中IMF1~I(xiàn)MF4分量波動(dòng)周期短、波動(dòng)頻繁,屬于高頻分量,如圖3所示;IMF5和IMF6分量隨機(jī)性較強(qiáng),屬于隨機(jī)分量,如圖4所示;IMF7、IMF8及余量Res具有一定的周期性和線性特征,屬于低頻分量,如圖5所示。依據(jù)各電力負(fù)荷分量的不同特征,IMF1~I(xiàn)MF6分量采用基于RBF核函數(shù)的LSSVM網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),RBF核函數(shù)如式(13)所示;IMF7、IMF8和Res分量采用基于線性核函數(shù)的LSSVM網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),線性核函數(shù)如式(12)所示。
圖2 歷史負(fù)荷數(shù)據(jù)Fig.2 Historical load data
圖3 EEMD高頻分量Fig.3 High-frequency components obtained by EEMD
圖4 EEMD隨機(jī)分量Fig.4 Random components obtained by EEMD
圖5 EEMD低頻分量Fig.5 Low-frequency components obtained by EEMD
分別應(yīng)用本文提出的EEMD-CS-LSSVM方法、以及CS-LSSVM、反向傳播BP(back propagation)神經(jīng)網(wǎng)絡(luò)和差分整合移動(dòng)平均自回歸ARIMA(autore?gressive integrated moving average)模型共4種預(yù)測(cè)方法,對(duì)算例地區(qū)的電力負(fù)荷數(shù)據(jù)進(jìn)行預(yù)測(cè),得到日內(nèi)24 h的負(fù)荷預(yù)測(cè)結(jié)果,如圖6所示。從圖6可以看出,4種預(yù)測(cè)模型都能較好地反映出電力負(fù)荷變化趨勢(shì)。
圖6 4種模型預(yù)測(cè)結(jié)果Fig.6 Prediction results of four models
由于電力負(fù)荷具有不確定性和隨機(jī)性,4種預(yù)測(cè)方法都無(wú)法避免出現(xiàn)誤差。本文采用平均絕對(duì)百分比誤差作為各模型的誤差評(píng)價(jià)指標(biāo),即
式中:MAPE為平均絕對(duì)百分比誤差;yi為真實(shí)值;yj為預(yù)測(cè)值;N為預(yù)測(cè)總數(shù)。
4種預(yù)測(cè)方法的預(yù)測(cè)誤差如表1所示。ARIMA模型的預(yù)測(cè)誤差指標(biāo)最大,BP神經(jīng)網(wǎng)絡(luò)模型較ARIMA下降0.8%,表明針對(duì)電力負(fù)荷數(shù)據(jù)的非線性特點(diǎn)BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果優(yōu)于ARIMA模型;CS-LSSVM的預(yù)測(cè)誤差指標(biāo)低于BP神經(jīng)網(wǎng)絡(luò),表明應(yīng)用CS算法優(yōu)化預(yù)測(cè)模型的關(guān)鍵參數(shù)可以提高預(yù)測(cè)精度;而本文提出的EEMD-CS-LSSVM方法相比于CS-LSSVM方法,誤差指標(biāo)進(jìn)一步下降0.6%,表明針對(duì)不同頻率特征的電力負(fù)荷分量選用具有不同核函數(shù)的LSSVM模型進(jìn)行預(yù)測(cè)可以進(jìn)一步提升電力負(fù)荷的預(yù)測(cè)精度。
表1 4種模型預(yù)測(cè)誤差對(duì)比Tab.1 Comparison of prediction error among four models
電力負(fù)荷預(yù)測(cè)是電網(wǎng)調(diào)度人員合理安排發(fā)電計(jì)劃的主要依據(jù),精確的負(fù)荷預(yù)測(cè)可提高調(diào)度準(zhǔn)確性,進(jìn)而提高系統(tǒng)運(yùn)行效率、降低發(fā)電成本。由于電力負(fù)荷具有非線性及波動(dòng)特征,為提高短期電力負(fù)荷預(yù)測(cè)精度,本文應(yīng)用EEMD方法分析了電力負(fù)荷在不同頻率分量上的波動(dòng)特征,提出了基于EEMD-CS-LSSVM短期負(fù)荷預(yù)測(cè)方法。本文首先通過EEMD算法把負(fù)荷數(shù)據(jù)進(jìn)行分解為多個(gè)高頻分量、隨機(jī)分量和低頻分量,針對(duì)負(fù)荷分量的波動(dòng)特點(diǎn)分別采用RBF核函數(shù)和線性核函數(shù)的LSSVM模型進(jìn)行電力負(fù)荷分量預(yù)測(cè)。同時(shí)采用了CS算法對(duì)EEMD-LSSVM預(yù)測(cè)模型的關(guān)鍵參數(shù)進(jìn)行優(yōu)化。將本文預(yù)測(cè)方法與BP神經(jīng)網(wǎng)絡(luò)模型、ARIMA模型及CS-LSSVM算法進(jìn)行對(duì)比,誤差分析結(jié)果顯示本文提出的方法具有最小的平均絕對(duì)百分比誤差。研究表明,針對(duì)不同頻率特征的電力負(fù)荷分量選用具有不同核函數(shù)的LSSVM預(yù)測(cè)模型,以及針對(duì)預(yù)測(cè)模型的關(guān)鍵參數(shù)進(jìn)行優(yōu)化均可以有效提升電力負(fù)荷的預(yù)測(cè)精度。