鮑海波,吳陽晨,張國應(yīng),李江偉,郭小璇,黎靜華
(1.廣西電網(wǎng)有限責(zé)任公司南寧供電局,南寧市 530031;2.廣西電力系統(tǒng)最優(yōu)化與節(jié)能技術(shù)重點(diǎn)實(shí)驗(yàn)室(廣西大學(xué)),南寧市 530004;3.廣西電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,南寧市 530023)
隨著大規(guī)模新能源尤其是分布式新能源在用戶側(cè)接入電網(wǎng),通常采用實(shí)際用電負(fù)荷減去新能源出力后的負(fù)荷功率(以下稱為“凈負(fù)荷”)進(jìn)行預(yù)測、調(diào)度方面的研究[1]。準(zhǔn)確預(yù)測凈負(fù)荷對于新型電力系統(tǒng)的規(guī)劃、優(yōu)化運(yùn)行和控制具有重要意義。
目前,已有不少學(xué)者對凈負(fù)荷預(yù)測開展了研究工作。根據(jù)是否組合多個預(yù)測模型來進(jìn)行預(yù)測,現(xiàn)有凈負(fù)荷預(yù)測方法可分為單一預(yù)測方法和集成預(yù)測方法[2-3]。
凈負(fù)荷的單一預(yù)測方法主要包括時間序列預(yù)測法、神經(jīng)網(wǎng)絡(luò)預(yù)測法、支持向量機(jī)預(yù)測法等。文獻(xiàn)[4]采用差分整合移動平均自回歸模型(autoregressive integrated moving average model, ARIMA)建立凈負(fù)荷預(yù)測模型,利用自適應(yīng)預(yù)測策略優(yōu)化模型參數(shù),并通過仿真分析證明該方法適用于含風(fēng)電的凈負(fù)荷預(yù)測。然而,由于ARIMA為線性預(yù)測模型,其挖掘凈負(fù)荷非線性變化規(guī)律的能力有限。文獻(xiàn)[5]提出一種基于經(jīng)驗(yàn)?zāi)B(tài)分解和深度信念網(wǎng)絡(luò)的預(yù)測方法,首先將凈負(fù)荷時序數(shù)據(jù)分解為頻率、幅值不一的時序分量,然后用深度信念網(wǎng)絡(luò)建立各時序分量的預(yù)測模型。該方法僅考慮凈負(fù)荷的時序規(guī)律,忽略了氣象等因素對凈負(fù)荷的影響,因此預(yù)測精度有限。文獻(xiàn)[6]提出基于最小二乘支持向量機(jī)(least squares support vector machine,LSSVM)的預(yù)測方法,適用于凈負(fù)荷樣本數(shù)量較少的情況。然而,由于LSSVM的網(wǎng)絡(luò)結(jié)構(gòu)相對簡單,其面對特性復(fù)雜的凈負(fù)荷時預(yù)測能力有限。
由以上分析可知,單一預(yù)測方法在凈負(fù)荷預(yù)測中具有一定的局限性。這是因?yàn)閱我活A(yù)測方法僅從某一特定角度挖掘負(fù)荷的變化規(guī)律,而凈負(fù)荷具有強(qiáng)波動性和不確定性,單一方法通常難以對凈負(fù)荷進(jìn)行全面、準(zhǔn)確的建模[5]。針對單一預(yù)測方法的不足,有學(xué)者提出了集成預(yù)測方法。集成預(yù)測方法通過集成學(xué)習(xí)理論將多個預(yù)測模型進(jìn)行結(jié)合,綜合了不同模型的預(yù)測優(yōu)勢,通??色@得比單一預(yù)測模型更優(yōu)越的預(yù)測性能。
負(fù)荷預(yù)測中比較成熟的集成預(yù)測方法主要有Boosting方法和Stacking集成方法。文獻(xiàn)[7]提出了Boosting集成原理的XGBoost預(yù)測模型,實(shí)現(xiàn)了對日高峰負(fù)荷的準(zhǔn)確預(yù)測。Boosting方法屬于串行集成學(xué)習(xí)算法,其對同一類算法進(jìn)行多次迭代訓(xùn)練,每次迭代結(jié)束時產(chǎn)生一個學(xué)習(xí)器,由此獲得多個學(xué)習(xí)器。因此,Boosting方法的學(xué)習(xí)器之間存在較強(qiáng)的依賴關(guān)系,導(dǎo)致該方法在預(yù)測任務(wù)中的泛化能力有限。
Stacking集成方法則采用并行學(xué)習(xí)方式,采用不同類型算法(稱為“初級學(xué)習(xí)器”)獲得初步預(yù)測值,并采用元學(xué)習(xí)器進(jìn)一步優(yōu)化初步預(yù)測值,得到最終的預(yù)測結(jié)果。文獻(xiàn)[8]提出一種基于多模型融合Stacking集成學(xué)習(xí)方式的負(fù)荷預(yù)測方法,采用長短期記憶神經(jīng)網(wǎng)絡(luò)(long short-term memory, LSTM)、梯度決策樹、隨機(jī)森林、支持向量機(jī)等作為集成學(xué)習(xí)的初級學(xué)習(xí)器,然后通過元學(xué)習(xí)器對初級學(xué)習(xí)器的預(yù)測結(jié)果進(jìn)一步優(yōu)化。該方法充分發(fā)揮各個模型優(yōu)勢,對常規(guī)負(fù)荷的預(yù)測效果良好。文獻(xiàn)[9]構(gòu)建了基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)和LSTM的Stacking集成負(fù)荷預(yù)測方法,兼顧了CNN和LSTM網(wǎng)絡(luò)模型優(yōu)點(diǎn),預(yù)測效果較好。
然而,文獻(xiàn)[8-9]均采用傳統(tǒng)的Stacking集成學(xué)習(xí)框架,在模型訓(xùn)練過程中將不同初級學(xué)習(xí)器的輸出結(jié)果平均加權(quán)以構(gòu)造元學(xué)習(xí)器的訓(xùn)練數(shù)據(jù)。換言之,傳統(tǒng)Stacking集成方法的訓(xùn)練過程不考慮初級學(xué)習(xí)器之間的差異性。當(dāng)某一初級學(xué)習(xí)器的預(yù)測誤差較大時,將給元學(xué)習(xí)器的訓(xùn)練過程引入較大的誤差特征,進(jìn)而影響到整體模型的預(yù)測準(zhǔn)確性。
基于以上分析,本文提出一種改進(jìn)的Stacking集成凈負(fù)荷預(yù)測方法。首先,通過對不同算法預(yù)測性能的差異性分析,優(yōu)選出LSTM模型[10-12]、隨機(jī)森林樹(random forest,RF)[13-14]、Elman網(wǎng)絡(luò)[15]、LSSVM[16-18]作為Stacking集成學(xué)習(xí)的初級學(xué)習(xí)器。其次,針對傳統(tǒng)Stacking集成學(xué)習(xí)訓(xùn)練過程因忽略初級學(xué)習(xí)器差異性導(dǎo)致的問題,根據(jù)預(yù)測效果對初級學(xué)習(xí)器賦予相應(yīng)的權(quán)值,從而對初級學(xué)習(xí)器的預(yù)測誤差進(jìn)行修正,一定程度上摒棄各個算法中預(yù)測效果較差的部分,最終提升整體預(yù)測精度。最后,為了檢驗(yàn)本文方法在不同場景下的預(yù)測效果,分別對周末、晴天、多云、多雪、多雨等場景下的凈負(fù)荷進(jìn)行預(yù)測。算例分析結(jié)果表明,本文所提出的集成預(yù)測方法相較于單一預(yù)測方法和傳統(tǒng)Stacking集成預(yù)測方法具有更高的精度,而且能適應(yīng)晴天、多云、多雨等不同環(huán)境場景。
Stacking集成預(yù)測的框架如圖1所示,包含兩層預(yù)測模型,第一層預(yù)測模型稱為初級學(xué)習(xí)器,第二層預(yù)測模型稱為元學(xué)習(xí)器。Stacking集成預(yù)測方法首先將原始數(shù)據(jù)輸入到各初級學(xué)習(xí)器中,獲得初級學(xué)習(xí)器的預(yù)測結(jié)果。然后將初級學(xué)習(xí)器的預(yù)測結(jié)果作為元學(xué)習(xí)器的輸入,得到最終的預(yù)測結(jié)果。Stacking集成預(yù)測方法通過對多個初級學(xué)習(xí)器的集成,結(jié)合了不同學(xué)習(xí)器的優(yōu)勢,使預(yù)測模型具有較強(qiáng)的泛化能力;進(jìn)一步采用元學(xué)習(xí)器優(yōu)化初級學(xué)習(xí)器的輸出結(jié)果,提升整體的預(yù)測精度[19]。
圖1 Stacking集成預(yù)測框架過程
在Stacking集成預(yù)測的模型訓(xùn)練過程中,通常采用k折交叉驗(yàn)證法進(jìn)行數(shù)據(jù)劃分和模型訓(xùn)練,以減少出現(xiàn)過擬合的風(fēng)險[20]。k折交叉驗(yàn)證法的流程如圖2所示。首先,將原始數(shù)據(jù)集D平均劃分為k個互斥子集,分別為D1,D2,…,Dk。然后,分別選擇其中k-1個子集的并集作為訓(xùn)練集,余下的1個子集作為測試集,構(gòu)造初級學(xué)習(xí)器的訓(xùn)練集和測試集。這樣可獲得k組訓(xùn)練集和測試集。對于Stacking集成預(yù)測中的每一個初級學(xué)習(xí)器,都采用這k組訓(xùn)練集和測試集進(jìn)行學(xué)習(xí)器的訓(xùn)練和測試,并獲得k個測試結(jié)果S1,S2,…,Sk。這一過程稱為“交叉驗(yàn)證”。
圖2 k折交叉驗(yàn)證流程圖
以上是基于k折交叉驗(yàn)證法的Stacking集成預(yù)測模型訓(xùn)練過程。值得注意的是,k折交叉驗(yàn)證法的效果很大程度上取決于k的取值。k常用的取值有5、10、20等。
已有研究表明,元學(xué)習(xí)器訓(xùn)練數(shù)據(jù)集的屬性特征對于Stacking集成預(yù)測的性能有較大影響[21]。元學(xué)習(xí)器輸入數(shù)據(jù)的誤差成分越少,其訓(xùn)練效果則越好,Stacking集成預(yù)測的精度也越高[22]。由第1節(jié)可知,傳統(tǒng)的Stacking集成預(yù)測方法在構(gòu)造元學(xué)習(xí)器的訓(xùn)練樣本時,直接將多個初級學(xué)習(xí)器的輸出結(jié)果作為元學(xué)習(xí)器的輸入。然而,各個初級學(xué)習(xí)器的性能不盡相同,當(dāng)某些初級學(xué)習(xí)器的輸出結(jié)果誤差較大時,直接構(gòu)造輸入樣本將給元學(xué)習(xí)器的訓(xùn)練過程引入較大的誤差特征,進(jìn)而影響到整體模型的預(yù)測準(zhǔn)確性。
針對該問題,本文提出一種特征加權(quán)法用于改進(jìn)傳統(tǒng)Stacking集成算法的不足。根據(jù)各學(xué)習(xí)器自身的預(yù)測精度,為初級學(xué)習(xí)器生成的訓(xùn)練數(shù)據(jù)賦予相應(yīng)的權(quán)值,再代入元學(xué)習(xí)器進(jìn)行訓(xùn)練。所提出的改進(jìn)方法對各初級學(xué)習(xí)器的預(yù)測誤差進(jìn)行了修正,從而在一定程度上摒棄各個算法中預(yù)測效果較差的部分,生成更有利于元學(xué)習(xí)器訓(xùn)練的數(shù)據(jù)集。
本文提出的基于特征加權(quán)的Stacking集成方法,其核心在于根據(jù)各初級學(xué)習(xí)器的預(yù)測效果賦予不同的權(quán)值。具體計算方法如下:
1)選取均方根誤差(root mean square error, RMSE)作為評估初級學(xué)習(xí)器預(yù)測精度的指標(biāo)。RMSE公式如下:
(1)
2)將數(shù)據(jù)集按8∶2劃分為訓(xùn)練集和驗(yàn)證集。采用訓(xùn)練集對各初級學(xué)習(xí)器進(jìn)行訓(xùn)練,并計算各個初級學(xué)習(xí)器在驗(yàn)證集上的均方根誤差。對均方根誤差進(jìn)行標(biāo)準(zhǔn)化處理,標(biāo)準(zhǔn)化公式為:
(2)
式中:wl為第l個初級學(xué)習(xí)器的權(quán)重,l=1,2,…,T;T為初級學(xué)習(xí)器的個數(shù);ERMSE,l為第l個初級學(xué)習(xí)器的均方根誤差;ERMSE,h為第h個初級學(xué)習(xí)器的均方根誤差。
(3)
式中:Si,1,Si,2,…,Si,T分別為T個初級學(xué)習(xí)器在第i折交叉驗(yàn)證中的輸出;w1,w2,…,wT分別為T個初級學(xué)習(xí)器的權(quán)重。
Stacking集成預(yù)測方法中學(xué)習(xí)器的選擇直接決定集成預(yù)測效果。對于初級學(xué)習(xí)器的選擇,應(yīng)遵循“好而不同”的原則,即各初級學(xué)習(xí)器要有較高的預(yù)測精度,同時各學(xué)習(xí)器間應(yīng)具有差異性,即各學(xué)習(xí)器由不同的算法生成[2]。這是因?yàn)轭A(yù)測能力較強(qiáng)的模型有助于提升整體的預(yù)測精度,而模型之間差異性較大,有助于從更廣泛的角度來學(xué)習(xí)數(shù)據(jù)中蘊(yùn)藏的規(guī)律,從而提升整體預(yù)測方法的泛化能力。
據(jù)此,本文基于對不同模型預(yù)測能力和模型差異性的分析,優(yōu)選出Stacking集成預(yù)測的初級學(xué)習(xí)器。其中,采用Pearson相關(guān)系數(shù)對各模型的誤差關(guān)聯(lián)性進(jìn)行計算,以此分析不同初級學(xué)習(xí)器的差異性。各模型預(yù)測能力和差異性的分析過程將在本文第3.3節(jié)中具體討論。最終,本文優(yōu)選出LSTM算法、RF算法、Elman網(wǎng)絡(luò)和LSSVM算法作為Stacking集成預(yù)測的初級學(xué)習(xí)器。
其中,LSTM是一種深度循環(huán)神經(jīng)網(wǎng)絡(luò),可以學(xué)習(xí)長時間尺度的時序特性,在負(fù)荷預(yù)測領(lǐng)域得到廣泛應(yīng)用,其建模過程見參考文獻(xiàn)[11]。RF是結(jié)合決策樹和Bagging集成的一種預(yù)測方法,具有抗噪力和適應(yīng)力強(qiáng)等優(yōu)點(diǎn),被廣泛應(yīng)用于各領(lǐng)域,其實(shí)現(xiàn)過程見參考文獻(xiàn)[13]。Elman網(wǎng)絡(luò)是一種具有局部記憶單元和局部反饋連接的神經(jīng)網(wǎng)絡(luò),能夠挖掘數(shù)據(jù)中的短期時序特性并進(jìn)行預(yù)測,其建模過程見參考文獻(xiàn)[15]。LSSVM在解決小樣本、非線性及高維度的預(yù)測問題上具有獨(dú)特優(yōu)勢,在負(fù)荷預(yù)測中有良好的實(shí)踐效果。LSSVM算法實(shí)現(xiàn)過程見參考文獻(xiàn)[16]。
對于Stacking集成預(yù)測的元學(xué)習(xí)器,本文選擇訓(xùn)練高效、非線性擬合能力強(qiáng)的LSSVM作為元學(xué)習(xí)器,對初級學(xué)習(xí)器的預(yù)測結(jié)果做進(jìn)一步的優(yōu)化。
本文提出的基于特征加權(quán)Stacking集成的凈負(fù)荷預(yù)測方法流程如圖3所示。
圖3 基于特征加權(quán)Stacking集成凈負(fù)荷預(yù)測方法
基于特征加權(quán)的Stacking集成凈負(fù)荷預(yù)測方法的主要步驟如下:
1)對原始數(shù)據(jù)進(jìn)行歸一化處理,將歸一化后數(shù)據(jù)劃分為訓(xùn)練集和測試集。
2)采用訓(xùn)練集,對Stacking集成預(yù)測的各個初級學(xué)習(xí)器進(jìn)行訓(xùn)練,并計算各個初級學(xué)習(xí)器的均方根誤差。根據(jù)式(1)、式(2),計算出各個初級學(xué)習(xí)器的特征權(quán)重。
3)取k=5,采用5折交叉驗(yàn)證法對數(shù)據(jù)集進(jìn)行劃分,并對Stacking集成預(yù)測的模型進(jìn)行訓(xùn)練。將5折交叉驗(yàn)證中初級學(xué)習(xí)器的輸出結(jié)果,按式(3)進(jìn)行特征加權(quán),獲得含特征加權(quán)的元學(xué)習(xí)器訓(xùn)練數(shù)據(jù)集。
4)使用含特征加權(quán)的數(shù)據(jù)集對元學(xué)習(xí)器進(jìn)行訓(xùn)練。訓(xùn)練過程中,元學(xué)習(xí)器LSSVM的輸入為圖3中各個權(quán)值與預(yù)測結(jié)果乘積的并集,輸出為圖3中未使用數(shù)據(jù)集的并集。
5)對于待預(yù)測數(shù)據(jù)集,將各初級學(xué)習(xí)器的預(yù)測結(jié)果按式(3)進(jìn)行加權(quán),輸入到訓(xùn)練好的元學(xué)習(xí)器中,輸出最終的預(yù)測結(jié)果。
本文采用德國TENNET區(qū)域2016年的凈負(fù)荷數(shù)據(jù)和氣象數(shù)據(jù)進(jìn)行仿真分析(采樣周期為1 h)。其中,凈負(fù)荷數(shù)據(jù)由用電負(fù)荷減去光伏發(fā)電功率得到,數(shù)據(jù)來源見文獻(xiàn)[23]。氣象數(shù)據(jù)來源見文獻(xiàn)[24]。預(yù)測模型的輸入特征量包括時間、降雨量、溫度、表面輻照度、大氣輻照度、降雪量、云量、氣壓。
為了驗(yàn)證所提出的基于特征加權(quán)Stacking集成學(xué)習(xí)方法的有效性和先進(jìn)性,采用以下方法作為對比方法:1)單一預(yù)測模型,包括LSTM網(wǎng)絡(luò)、RF模型、Elman網(wǎng)絡(luò)、RBF神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)、LSSVM模型、決策樹;2)無特征加權(quán)的傳統(tǒng)Stacking集成學(xué)習(xí)方法。
為了檢驗(yàn)本文方法對不同場景下凈負(fù)荷預(yù)測的適應(yīng)性,設(shè)置了如表1所示的仿真場景。其中,連續(xù)1個月的預(yù)測場景用于檢驗(yàn)本文方法的整體預(yù)測水平。同時,考慮到日類型、降雨量、降雪量、云量等氣象因素對凈負(fù)荷的影響[1],分別對周末、晴天、多云、多雪、多雨等5種類型的凈負(fù)荷進(jìn)行預(yù)測。其中,周末區(qū)別于工作日,用戶用電行為具有特殊性,因此采用周末預(yù)測場景檢驗(yàn)本文方法對特殊日類型場景下的預(yù)測效果;設(shè)置晴天、多云、多雪、多雨等天氣場景,則是為了檢驗(yàn)本文方法對不同天氣場景下的凈負(fù)荷預(yù)測效果。通過設(shè)置6種類型的凈負(fù)荷預(yù)測場景,對比分析不同情況下各個預(yù)測方法的預(yù)測效果,以檢驗(yàn)本文方法的適應(yīng)性和有效性。
表1 仿真場景
將2016年1月1日至11月30日的凈負(fù)荷及相關(guān)氣象數(shù)據(jù)作為訓(xùn)練樣本集,用于確定各初級學(xué)習(xí)器的權(quán)重系數(shù)以及對模型進(jìn)行訓(xùn)練。不同仿真場景下測試集劃分如下:在連續(xù)1個月凈負(fù)荷預(yù)測的仿真場景中,測試集為整個12月份的凈負(fù)荷相關(guān)數(shù)據(jù);在周末凈負(fù)荷預(yù)測場景中,測試集為12月10日、11日(分別為周六、周日)的數(shù)據(jù);在晴天凈負(fù)荷預(yù)測場景中,測試集為12月7日、8日的數(shù)據(jù);在多云凈負(fù)荷預(yù)測場景中,測試集為12月2日、16日的數(shù)據(jù);在多雪凈負(fù)荷預(yù)測場景中,測試集為12月19日、20日的數(shù)據(jù);在多雨凈負(fù)荷預(yù)測場景中,測試集為12月1日、25日的數(shù)據(jù)。其中,以上不同天氣類型下測試集對應(yīng)的日期由氣象預(yù)報確定。
采用平均絕對百分比誤差(mean absolute percentage error, MAPE)作為預(yù)測誤差指標(biāo)[25],其計算公式為:
(4)
為說明本文優(yōu)選Stacking集成預(yù)測初級學(xué)習(xí)器的過程及其合理性,本節(jié)首先對不同單一模型的預(yù)測性能和差異性進(jìn)行分析。
選擇LSTM、RF、Elman網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、LSSVM、決策樹等7種單一預(yù)測模型,作為初級學(xué)習(xí)器的待選項(xiàng),設(shè)計實(shí)驗(yàn)對各個初級學(xué)習(xí)器單獨(dú)預(yù)測的結(jié)果進(jìn)行比較。將凈負(fù)荷數(shù)據(jù)按5折交叉驗(yàn)證的方式進(jìn)行劃分,產(chǎn)生5組訓(xùn)練集和測試集。各單一預(yù)測模型在5個測試集上的MAPE數(shù)值如表2所示。
表2 各單一預(yù)測模型的MAPE
進(jìn)一步,為了分析各個預(yù)測模型的預(yù)測差異性,計算各個模型預(yù)測誤差的Pearson相關(guān)系數(shù),結(jié)果如圖4所示。
由表2可知,LSTM模型、LSSVM模型和RF模型的預(yù)測精度相對較高。由圖4可知,各模型的誤差相關(guān)性普遍較高,這是由于各模型的學(xué)習(xí)能力較強(qiáng),訓(xùn)練所得的訓(xùn)練誤差分布也較為相似引起的。其中,Elman網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和BP網(wǎng)絡(luò)均屬于神經(jīng)網(wǎng)絡(luò)算法,雖然從預(yù)測精度上來看,RBF網(wǎng)絡(luò)的預(yù)測性能優(yōu)于Elman網(wǎng)絡(luò)和BP網(wǎng)絡(luò),但是Elman網(wǎng)絡(luò)與其他算法相關(guān)性較低。綜上考慮,最終選擇LSTM模型、Elman網(wǎng)絡(luò)、RF模型、LSSVM模型作為Stacking集成預(yù)測的初級學(xué)習(xí)器。
圖4 各模型預(yù)測誤差的相關(guān)性分析
3.3.1 連續(xù)1個月的凈負(fù)荷預(yù)測結(jié)果分析
表3為不同預(yù)測方法對2016年12月整月的凈負(fù)荷預(yù)測誤差統(tǒng)計結(jié)果。從預(yù)測誤差平均值來看,本文方法的EMAPE為6.83%,優(yōu)于BP網(wǎng)絡(luò)(EMAPE為7.43%)、LSSVM模型(EMAPE為7.15%)、RF模型(EMAPE為7.79%)和LSTM模型(EMAPE為8.33%),證明了本文的集成預(yù)測方法比單一預(yù)測方法具有更高的預(yù)測精度。
表3 不同預(yù)測方法對12月凈負(fù)荷預(yù)測的MAPE
無加權(quán)Stacking集成方法的EMAPE為7.28%,其預(yù)測精度高于BP網(wǎng)絡(luò)、LSTM、隨機(jī)森林算法,而低于Elman神經(jīng)網(wǎng)絡(luò)和LSSVM算法,表明直接采用無加權(quán)Stacking集成方法的效果未必優(yōu)于所有單一預(yù)測方法。同時,本文方法優(yōu)于無加權(quán)Stacking集成方法,表明對初級學(xué)習(xí)器進(jìn)行特征加權(quán)可以提高Stacking 集成預(yù)測方法的精度。
圖5為不同預(yù)測方法對2016年12月不同時間點(diǎn)(24個時刻)的凈負(fù)荷預(yù)測絕對誤差百分比統(tǒng)計結(jié)果的折線圖,所采用的分析數(shù)據(jù)為12月整月的凈負(fù)荷預(yù)測誤差數(shù)據(jù)。分析不同時間段各預(yù)測方法的預(yù)測精度,可發(fā)現(xiàn)對于所有預(yù)測方法,06:00—16:00時間段內(nèi)預(yù)測誤差相對于其他時段更大。這是因?yàn)樵摃r間段內(nèi)存在光伏發(fā)電,凈負(fù)荷的隨機(jī)性和波動性增強(qiáng),負(fù)荷預(yù)測難度增大。同時可發(fā)現(xiàn),該時間段內(nèi)本文方法預(yù)測精度高于與其他方法。
圖5 不同預(yù)測方法對12月24 h凈負(fù)荷預(yù)測的MAPE
3.3.2 對周末凈負(fù)荷預(yù)測結(jié)果的分析
在周末,用戶用電的模式通常與工作日不同。因此周末凈負(fù)荷的變化規(guī)律往往更難把握,預(yù)測難度更大。圖6展示了不同預(yù)測方法對12月份2個周末日的凈負(fù)荷預(yù)測結(jié)果。
由圖6可看到,相比于Elman網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)、LSSVM算法、RF模型、決策樹、LSTM模型、無加權(quán)Stacking集成方法,本文方法的預(yù)測曲線更接近于實(shí)際凈負(fù)荷曲線。
進(jìn)一步統(tǒng)計不同預(yù)測方法對周末日的凈負(fù)荷預(yù)測誤差。其中,本文方法(EMAPE為6.23%)和無加權(quán)Stacking集成方法(EMAPE為6.25%)預(yù)測精度高于Elman網(wǎng)絡(luò)(EMAPE為7.04%)、BP 網(wǎng)絡(luò)(EMAPE為8.87%)、RBF網(wǎng)絡(luò)(EMAPE為9.75%)、LSSVM模型(EMAPE為6.69%)、RF模型(EMAPE為6.34%)、決策樹模型(EMAPE為10.18%)、LSTM模型(EMAPE為7.80%)等單一預(yù)測方法,表明對于周末凈負(fù)荷的預(yù)測,集成預(yù)測方法比單一預(yù)測方法更有優(yōu)勢。同時可看到,本文方法的預(yù)測精度高于無加權(quán)Stacking集成方法,表明本文方法更適合用于周末的凈負(fù)荷預(yù)測。
3.3.3 對晴天凈負(fù)荷預(yù)測結(jié)果的分析
圖7為不同方法在晴天條件下的2天凈負(fù)荷預(yù)測曲線。觀察圖7中的實(shí)際凈負(fù)荷曲線可發(fā)現(xiàn),在中下午時段凈負(fù)荷曲線向下凹陷,峰谷差變大,負(fù)荷爬坡明顯。這是因?yàn)橹邢挛鐣r段光伏出力較大的緣故。
觀察圖7中的各預(yù)測曲線可發(fā)現(xiàn),Elman網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、RBF神網(wǎng)絡(luò)、LSSVM算法、RF、決策樹和LSTM的預(yù)測曲線與實(shí)際凈負(fù)荷曲線偏差較大。無加權(quán)Stacking集成方法和本文方法的預(yù)測曲線更接近于實(shí)際凈負(fù)荷曲線。
圖7 不同預(yù)測方法對晴天凈負(fù)荷的預(yù)測結(jié)果
表4為各個預(yù)測方法對晴天凈負(fù)荷預(yù)測的平均絕對百分比誤差。由表4中數(shù)據(jù)可以看出,本文方法(EMAPE為6.13%)和無加權(quán)Stacking集成方法(EMAPE為6.62%)預(yù)測精度高于Elman網(wǎng)絡(luò)(EMAPE為6.78%)、BP神經(jīng)網(wǎng)絡(luò)(EMAPE為7.86%)、RBF神經(jīng)網(wǎng)絡(luò)(EMAPE為7.78%)和LSSVM算法(EMAPE為7.29%)、隨機(jī)森林樹(EMAPE為6.95%)、決策樹(EMAPE為10.81%)、LSTM(EMAPE為8.57%)。表明Stacking集成預(yù)測對晴天凈負(fù)荷的預(yù)測精度更高。
對比表4和表3可發(fā)現(xiàn),對于晴天凈負(fù)荷預(yù)測,本文方法、無加權(quán)集成的Stacking、Elman算法、隨機(jī)森林樹算法的預(yù)測精度都有所提升。這是因?yàn)榍缣鞎r光伏出力較穩(wěn)定,光伏發(fā)電對凈負(fù)荷的影響較小,凈負(fù)荷的變化規(guī)律較容易把握,因此預(yù)測精度有所提高。
表4 不同預(yù)測方法對晴天凈負(fù)荷的預(yù)測誤差
3.3.4 對多云天氣凈負(fù)荷預(yù)測結(jié)果的分析
圖8為不同方法在多云天氣下2天凈負(fù)荷預(yù)測曲線??煽吹奖疚姆椒ǖ念A(yù)測曲線與實(shí)際凈負(fù)荷曲線最為靠近,表明本文方法可以較為準(zhǔn)確地跟蹤多云天氣下的凈負(fù)荷變化,實(shí)現(xiàn)較高的預(yù)測精度。
圖8 不同預(yù)測方法對多云日凈負(fù)荷的預(yù)測結(jié)果
表5為各個預(yù)測方法對多云凈負(fù)荷預(yù)測的平均絕對百分比誤差。由表5可看到,本文方法(EMAPE為2.45%)預(yù)測精度高于Elman網(wǎng)絡(luò)(EMAPE為4.76%)、BP網(wǎng)絡(luò)(EMAPE為4.23%)、RBF網(wǎng)絡(luò)(EMAPE為4.11%)和LSSVM算法(EMAPE為3.39%)、RF模型(EMAPE為2.66%)、決策樹(EMAPE為6.85%)、LSTM(EMAPE為6.26%)等單一預(yù)測方法,同時也高于傳統(tǒng)的無加權(quán)Stacking集成預(yù)測方法(EMAPE為2.53%)。表明本文所提出的基于特征加權(quán)的Stacking集成預(yù)測方法更適合于多云場景下的凈負(fù)荷預(yù)測。
對比表5和表3可發(fā)現(xiàn),各方法對多云天氣凈負(fù)荷的預(yù)測精度高于整月的平均預(yù)測精度。這是因?yàn)槎嘣铺鞖庀鹿夥隽^少且相對平穩(wěn),光伏發(fā)電對凈負(fù)荷的影響較小。此外,多云天氣對人類的生產(chǎn)生活影響較小,因此用電負(fù)荷模式也會遵循一定的歷史規(guī)律。綜上,多云天氣下凈負(fù)荷的隨機(jī)性和波動性較低,凈負(fù)荷預(yù)測精度普遍較高。
表5 不同預(yù)測方法對多云天氣凈負(fù)荷的預(yù)測誤差
3.3.5 對多雪天氣凈負(fù)荷預(yù)測結(jié)果的分析
圖9為不同方法在多雪天氣下的2天凈負(fù)荷預(yù)測曲線??煽吹奖疚姆椒ǖ念A(yù)測曲線與實(shí)際凈負(fù)荷曲線最為靠近,表明本文方法可以較為準(zhǔn)確地跟蹤多雪天氣下的凈負(fù)荷變化,實(shí)現(xiàn)較高的預(yù)測精度。表6為各個預(yù)測方法對多雪凈負(fù)荷預(yù)測的平均絕對百分比誤差。
圖9 不同預(yù)測方法對多雪日凈負(fù)荷的預(yù)測結(jié)果
由表6可看到,本文方法預(yù)測精度高于各單一預(yù)測模型,也高于傳統(tǒng)Stacking集成預(yù)測。表明本文所提出的基于特征加權(quán)的Stacking集成預(yù)測方法更適合于多雪場景下的凈負(fù)荷預(yù)測。
對比表6和表3可發(fā)現(xiàn),各方法對多雪天氣凈負(fù)荷的預(yù)測精度高于整月的平均預(yù)測精度。這是因?yàn)槎嘌┨鞖獾臍庀笠蛩夭粡?fù)雜,同時光伏出力很小且相對平穩(wěn),多雪天氣下凈負(fù)荷的隨機(jī)性和波動性較低,凈負(fù)荷預(yù)測精度普遍較高。
表6 不同預(yù)測方法對多雪天氣凈負(fù)荷的預(yù)測誤差
3.3.6 對多雨天氣凈負(fù)荷預(yù)測結(jié)果的分析
圖10為不同方法在多雨天氣下的2天凈負(fù)荷預(yù)測曲線,可看到本文方法的預(yù)測曲線與實(shí)際凈負(fù)荷曲線最為靠近。
圖10 不同預(yù)測方法對多雨凈負(fù)荷的預(yù)測結(jié)果
表7為各個預(yù)測方法對多雨凈負(fù)荷預(yù)測的平均絕對百分比誤差。可看到,本文方法預(yù)測精度高于Elman網(wǎng)絡(luò)、BP網(wǎng)絡(luò)、RBF網(wǎng)絡(luò)和LSSVM算法、隨機(jī)森林樹、決策樹、LSTM等單一預(yù)測方法,同時也高于Stacking集成預(yù)測。表明本文所提出的基于特征加權(quán)的Stacking集成預(yù)測方法更適合于多雨場景下的凈負(fù)荷預(yù)測。
對比表7和表3可發(fā)現(xiàn),各方法對多雨天氣凈負(fù)荷的預(yù)測精度高于整月的平均預(yù)測精度。這是由于降雨量較大時,原光伏出力不大的時間段預(yù)測精度較高。
表7 不同預(yù)測方法對多雨天氣凈負(fù)荷的預(yù)測誤差
對比不同方法在表6和表7中的預(yù)測誤差,可發(fā)現(xiàn)各方法在表7中的預(yù)測誤差更高。這是因?yàn)槎嘤甑奶鞖獠粌H會導(dǎo)致氣溫降低而且伴隨著云量變化。此外,人們的生產(chǎn)生活也會受到降雨量的影響,光伏出力的影響因素變得更加復(fù)雜,預(yù)測難度也相應(yīng)提高。
準(zhǔn)確的凈負(fù)荷預(yù)測對于新能源并網(wǎng)電力系統(tǒng)的規(guī)劃、優(yōu)化運(yùn)行與控制具有重要意義。為了克服單一預(yù)測方法的局限性、提升凈負(fù)荷的預(yù)測精度,提出了基于Stacking集成學(xué)習(xí)的凈負(fù)荷預(yù)測方法?;谀P皖A(yù)測性能及差異性分析,優(yōu)選出Stacking集成的初級學(xué)習(xí)器。針對傳統(tǒng)Stacking集成學(xué)習(xí)忽略初級學(xué)習(xí)器差異性導(dǎo)致的預(yù)測精度不高問題,提出了基于特征加權(quán)改進(jìn)的Stacking集成學(xué)習(xí)預(yù)測方法。
基于德國TENNET區(qū)域2016年的凈負(fù)荷數(shù)據(jù)進(jìn)行仿真分析,結(jié)果表明所提出的基于特征加權(quán)Stacking集成預(yù)測方法與單一預(yù)測方法和傳統(tǒng)無加權(quán)Stacking集成預(yù)測方法相比,具有更高的預(yù)測精度,并適合于不同天氣條件和日類型的凈負(fù)荷預(yù)測。同時也發(fā)現(xiàn),不同天氣條件下的預(yù)測精度差別較大。因此,未來將考慮對不同天氣類型凈負(fù)荷分別建立Stacking集成預(yù)測模型。