張 寧
(閩江學(xué)院 物理與電子信息工程學(xué)院,福建 福州 350108)
電價能夠有效體現(xiàn)電能的供需變化,并可具體反映電力市場運營情況。對電價數(shù)據(jù)進(jìn)行精準(zhǔn)的預(yù)測將有助于售電企業(yè)決定市場報價,并能及時地規(guī)避市場風(fēng)險。然而,由于短期電價受到天氣、日?;顒?、商務(wù)交易、供給側(cè)報價等多種因素的綜合影響,導(dǎo)致其具有典型的非平穩(wěn)性與非線性的特點。由于很難準(zhǔn)確擬定顧及諸多影響因素的數(shù)學(xué)模型,采用經(jīng)典的因果關(guān)系回歸模型進(jìn)行短期電價預(yù)測往往精度較低。近年來,另一種將歷史電價作為時間序列進(jìn)行建模預(yù)測的方式得到了廣泛的研究。常用的時間序列預(yù)測方法有自回歸滑動平均模型(autoregressive moving-average model,ARMA模型)[1],廣義自回歸條件異方差模型(generalized autoregressive conditional heteroskedasticity model,GARCH模型)[2]等,但這些方法都是基于線性序列進(jìn)行建模分析,其對于捕捉電價序列中的非線性特征能力有限,這也導(dǎo)致其預(yù)測結(jié)果的精度并不高。隨著人工智能技術(shù)的飛速發(fā)展,人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、支持向量機(jī)(support vector machine,SVM)等非線性方法在電價預(yù)測領(lǐng)域中已取得了較為成功的應(yīng)用[3-5]。
為了進(jìn)一步提高電價時間序列預(yù)測的精度,目前一種基于“分解-預(yù)測-集成”思想的混合預(yù)測方法被廣泛的關(guān)注和研究[6-8]。其預(yù)測思路為:首先采用小波變換(wavelet transform,WT)、經(jīng)驗?zāi)B(tài)分解(empirical mode decomposition,EMD)等信號分解方法將電價序列分解為多個分量,進(jìn)而對每個分量采用ANN、SVM等非線性方法進(jìn)行獨立預(yù)測,最后將所有分量預(yù)測進(jìn)行重構(gòu)集成。該類方法已經(jīng)證實可以有效提高預(yù)測精度[8];但是,小波變換需要對小波基函數(shù)、分解層數(shù)進(jìn)行預(yù)先設(shè)置,所以小波變換并不是一種自適應(yīng)的分解方法,而EMD方法也難以避免模態(tài)混疊現(xiàn)象的發(fā)生。另外,ANN方法存在有訓(xùn)練速度慢、易陷入局部極小等問題;SVM方法也存在難以合理選擇模型參數(shù)的缺點。特別地,對于該類混合預(yù)測方法,由于分解后的最高頻分量的隨機(jī)性最強(qiáng),其獨立預(yù)測的難度也最大。文獻(xiàn)[7]提出將最高頻分量舍去后對其余分量進(jìn)行預(yù)測集成,但是這種舍去方式顯然也會影響最終的預(yù)測精度。
為了有效解決上述問題,本文提出CEEMD-SSA-ELM模型,并以澳大利亞昆士南州和新南威爾士州的電力市場某月的電價數(shù)據(jù)作為研究對象,進(jìn)行了電價預(yù)測。實驗取得了較高的預(yù)測精度,也驗證了所提方法的有效性。
由于應(yīng)用EMD方法對信號分解所獲得的固有模態(tài)函數(shù)(instrinsic mode function,IMF)會存在模態(tài)混疊問題,WU等[9]基于輔助白噪聲分析提出了一種集成經(jīng)驗?zāi)B(tài)分解(ensemble empirical mode decomposition,EEMD)方法以避免該現(xiàn)象的發(fā)生,但是,EEMD方法也存在有難以消除重構(gòu)信號中的殘余輔助白噪聲的缺陷。YEH等[10]在EEMD的基礎(chǔ)上,以采用正、負(fù)成對的形式加入輔助白噪聲,提出了CEEMD方法。該方法的計算效率較高,并可在重構(gòu)信號時完全消除殘余輔助噪聲,其計算流程為:
(1)向原始信號S中加入N組正、負(fù)成對的輔助白噪聲X,得到
(1)
式中:M1為添加正噪聲后的信號;M2為添加負(fù)噪聲后的信號。由式(1)可以得到2N個集成信號。
(2)對每個信號使用EMD進(jìn)行分解,將第i個信號的第j個IMF分量記為IMFij。
(3)對每個信號分解后的對應(yīng)分量取均值以得到最終分解結(jié)果為
(2)
SSA是一種可以對信號進(jìn)行趨勢或準(zhǔn)周期成分的降噪與提取的方法。其具體處理步驟為[11-13]:
(1)將一維時間序列[X1,X2,…,XN]映射為L×K軌跡矩陣
(3)
式中: 2≤L≤N;K=N-L+1。
(2)對XXT進(jìn)行奇異值分解,得到L個降序排列的非負(fù)特征值λ1≥λ2≥…≥λL≥0,以及對應(yīng)的特征向量U1,U2,…,UL,則矩陣X為
X=X1+X2+…+Xd。
(4)
(3)分組:將集合{1,2,…,d}分割成p個不相交的子集I1,I2,…,Ip,則式(4)為
X=XI1+XI2+…+XIp。
(5)
X=XI1+XI2。
(6)
(7)
本文對矩陣XI1應(yīng)用式(7)重建時間序列,以實現(xiàn)將噪聲從原始序列中分離。
ELM是HUANG等在2006年提出的一種進(jìn)化神經(jīng)網(wǎng)絡(luò)方法[14],可以避免傳統(tǒng)ANN方法存在的訓(xùn)練速度慢、易陷入局部極小等缺陷。ELM數(shù)學(xué)模型為
Hβ=Y。
(8)
式中:H為隱含層的輸出矩陣;Y為目標(biāo)輸出矩陣;β為連接隱層神經(jīng)元和輸出節(jié)點的權(quán)值矩陣。
ELM的訓(xùn)練目標(biāo)是尋找最優(yōu)權(quán)值W=(w,b,β),以使下式成立:
minE(W)=min‖Hβ-Y‖,
(9)
其中,隱含層節(jié)點的輸入權(quán)值w和偏置b被隨機(jī)賦值。此時,ELM的訓(xùn)練過程即為求解式(8)的線性方程組,其最小二乘解為
β=H+Y。
(10)
式中:H+為隱層輸出矩陣H的Moore-Penrose廣義逆,則ELM網(wǎng)絡(luò)輸出
F=Hβ。
(11)
對電價序列{X(t),t=1,2,…,N}采用CEEMD方法進(jìn)行自適應(yīng)分解,可以分解出j個IMF分量和1個殘余分量R,則X(t)為
(12)
由于第1個最高頻分量IMF1變化劇烈、隨機(jī)性強(qiáng),直接建模預(yù)測的效果較差,且將會影響整體的預(yù)測精度,因此,利用SSA對其去噪處理并提取趨勢項,記為IMF1′。
對于短期電價序列,假定t時刻的電價X(t)可以由(t-1,t-2,…,t-m)時刻的歷史電價X(t-1),X(t-2),…,X(t-m)來進(jìn)行預(yù)測,則預(yù)測模型為
X(t)=f[X(t-1),X(t-2),…,X(t-m)]。
(13)
式中:f(·)為映射函數(shù);m為嵌入維數(shù)。原始電價序列在經(jīng)過CEEMD-SSA處理后,其第1個最高頻分量預(yù)測模型根據(jù)式(13)可變?yōu)?/p>
IMF1′(t)=f[IMF1′(t-1),IMF1′(t-2),…,IMF1′(t-m)],
(14)
其余j-1個IMF分量的預(yù)測模型為
IMFi(t)=f[IMFi(t-1),IMFi(t-2),…,
IMFi(t-m)],
(15)
殘余分量的預(yù)測模型為
R(t)=f[R(t-1),R(t-2),…,R(t-m)]。
(16)
綜上,將CEEMD-SSA-ELM應(yīng)用于某地區(qū)電價預(yù)測中,可得到CEEMD-SSA-ELM模型的流程圖,如圖1所示。
為了定量評價電價預(yù)測模型的精度,本文選取2種評價指標(biāo):
圖1 CEEMD-SSA-ELM預(yù)測模型流程Fig.1 Structure of CEEMD-SSA-ELM prediction model
(1)均方根誤差
(2)平均絕對百分誤差
本文以澳大利亞昆士蘭州2016年6月1日00:30:00至2016年7月1日00:00:00共30 d的電價數(shù)據(jù)為研究對象,每半小時采集一次,共計1 440個短期電價時間序列。澳大利亞昆士蘭州原始電價數(shù)據(jù)序列如圖2所示。
為了減少數(shù)據(jù)量綱對建模的影響,采用下式將原始電價序列數(shù)據(jù)歸一到[-1,1]區(qū)間:
X′(t)=2(X(t)-Xmin)/(Xmax-Xmin)-1。
(17)
式中:X′(t)為歸一化后的電價序列;Xmin、Xmax分別為原序列中的最小值、最大值。在建模計算結(jié)束后,對輸出的訓(xùn)練與預(yù)測數(shù)據(jù)進(jìn)行反歸一化處理,可將其還原至原始區(qū)間。
對歸一化處理后的電價序列{X′(t),t=1,2,…,n}應(yīng)用CEEMD方法進(jìn)行自適應(yīng)分解,其中,集成次數(shù)N=100,噪聲標(biāo)準(zhǔn)差設(shè)為0.2。分解后可得到10個IMF分量以及1個殘余分量。
圖2 澳大利亞昆士蘭州原始電價數(shù)據(jù)序列 (0.5 h)Fig.2 The original electricity price series of Queensland, Australia (0.5 h)
對IMF1使用SSA方法進(jìn)行去噪處理。在此過程中需確定其窗口長度L和重構(gòu)選取的特征值個數(shù)k。文獻(xiàn)[12]建議L不大于N/2,且如果原序列總存在整數(shù)周期的分量,L應(yīng)取與該周期成正比的數(shù)值。在本例中,采樣周期為1 d(48個采樣點),故經(jīng)測試后設(shè)置L=12。圖3給出了最高頻分量IMF1的奇異譜圖。
圖3 最高頻分量IMF1的奇異譜圖Fig.3 Singular spectrum of maximum frequency component IMF1
從圖3可以看出:將SSA方法中的矩陣XXT特征值由大到小排列,自第7個特征值開始,下降速率增大,且前7個的貢獻(xiàn)率為81.7%;根據(jù)設(shè)置的貢獻(xiàn)率閾值(80%),即可將k選為7。圖4給出了經(jīng)SSA處理前后的最高頻分量,其中,紅色虛線即為提取的趨勢項。
圖4 SSA處理前后的最高頻分量Fig.4 Maximum frequency component before and after SSA Processing
對經(jīng)CEEMD-SSA處理后的第一分量和其余分量序列設(shè)置嵌入維數(shù),構(gòu)建樣本數(shù)據(jù)集。本文嵌入維數(shù)都設(shè)置為8,即由前8個數(shù)據(jù)預(yù)測第9個數(shù)據(jù)。由此,總樣本數(shù)目可構(gòu)建為1 432個,統(tǒng)一以最后240個電價為預(yù)測對象,則訓(xùn)練樣本數(shù)目設(shè)置為1 192個。在此基礎(chǔ)上,對每個分量序列分別建立ELM模型,其中,隱層神經(jīng)元節(jié)點數(shù)均設(shè)置為14,激活函數(shù)均選擇為“Sig”函數(shù)。由于ELM采用了隨機(jī)權(quán)值和偏置的獲取方式,將會使模型預(yù)測單次結(jié)果出現(xiàn)不穩(wěn)定現(xiàn)象。為此,在進(jìn)行預(yù)測時,各循環(huán)操作了100次,并取其預(yù)測均值作為最終預(yù)測結(jié)果。
為了與本文方法進(jìn)行對比,還建立了另外2種預(yù)測模型:(1)不使用SSA處理最高頻分量的CEEMD-ELM模型;(2)直接對電價數(shù)據(jù)進(jìn)行預(yù)測的ELM模型。為了對比的公平性,這2種模型的參數(shù)均與本文所提模型設(shè)置完全一致。各種模型的預(yù)測結(jié)果如圖5所示。
從圖5可以看出:CEEMD-SSA-ELM模型的預(yù)測結(jié)果曲線與真實電價曲線的吻合度較高,充分表明了該模型具有良好的預(yù)測精度;CEEMD-ELM模型和ELM模型的預(yù)測曲線明顯偏離真值。3種模型精度指標(biāo)統(tǒng)計結(jié)果見表1。
圖5 澳大利亞昆士蘭州實際電價與預(yù)測電價對比Fig.5 Comparison betweenpractical price and predicted price of Queensland, Australia
表1 3種模型預(yù)測精度指標(biāo)對比Tab.1 Comparison of three models for forecasting precision index
從表1可以發(fā)現(xiàn):CEEMD-SSA-ELM模型的預(yù)測精度最優(yōu),ELM模型預(yù)測性能最差;與CEEMD-ELM模型相比,CEEMD-SSA-ELM模型僅增加使用SSA對最高頻分量處理并提取趨勢項進(jìn)行預(yù)測,但是,均方根誤差與平均絕對百分誤差分別減少了46.3%和44.8%,說明了SSA處理的必要性和有效性。
為了進(jìn)一步驗證本文方法的有效性,第2個實例是以澳大利亞新南威爾士州在相同的時間段的電價數(shù)據(jù)為研究對象,即2016年6月1日00:30:00至2016年7月1日00:00:00共30 d,每半小時采集一次,共計1 440個短期電價時間序列。澳大利亞新南威爾士州原始電價數(shù)據(jù)序列如圖6所示。
應(yīng)用CEEMD方法對上述數(shù)據(jù)進(jìn)行自適應(yīng)分解,對最高頻分量進(jìn)行SSA處理。圖7給出了最高頻分量IMF1的奇異譜圖。從圖7可以看出:矩陣XXT的特征值從第8個開始,下降速率明顯增大,且前8個的貢獻(xiàn)率已超過80%,因此將k選為8。
圖6 澳大利亞新南威爾士州原始電價數(shù)據(jù)序列Fig.6 The original electricity price series of New South Wales, Australia
圖7 最高頻分量IMF1的奇異譜圖Fig.7 Singular spectrum of maximum frequency component IMF1
在本例中,各種預(yù)測模型的數(shù)據(jù)集構(gòu)造、參數(shù)設(shè)置與實例1完全一致。3種模型的預(yù)測結(jié)果如圖8所示。從圖8可以看出:CEEMD-SSA-ELM模型的預(yù)測結(jié)果曲線與真實電價曲線的吻合度較高,CEEMD-ELM模型和ELM模型的預(yù)測曲線明顯偏離真值。這與實例1的預(yù)測分析結(jié)果完全一致。精度指標(biāo)統(tǒng)計結(jié)果見表2。
從表2可以看出: CEEMD-SSA-ELM模型的預(yù)測精度最高,CEEMD-ELM模型的預(yù)測精度次之,而ELM模型的預(yù)測精度最低。這與實例1的預(yù)測分析結(jié)果完全一致。
圖8 澳大利亞新南威爾士州實際電價 與預(yù)測電價對比Fig.8 Comparison between practical price and predicted price of New South Wales, Australia
表2 3種模型預(yù)測精度指標(biāo)對比Tab.2 Comparison of three models forforecasting precision index
(1)本文提出將一種CEEMD-SSA-ELM模型應(yīng)用于短期電價序列預(yù)測中,取得了較高的預(yù)測精度,2個實例的分析結(jié)果充分表明該模型在短期電價預(yù)測中應(yīng)用的可行性。
(2)與不加入SSA處理的CEEMD-ELM模型相對比,本文所提模型的均方根誤差與平均絕對百分誤差分別減少了40%與30%以上,充分說明了SSA對最高頻分量處理的必要性和有效性。
(3)本文對各分量建模采用ELM方法,而其輸入權(quán)值和偏置為隨機(jī)給定,并非最優(yōu)。為此,下一步的研究計劃是采用優(yōu)化算法、優(yōu)化參數(shù)以進(jìn)一步提高預(yù)測精度。