卿會(huì),郭軍紅,李薇,亢朋朋,王金明,潘張榕
(1.華北電力大學(xué) 環(huán)境科學(xué)與工程學(xué)院,北京 102206;2.華北電力大學(xué) 資源環(huán)境系統(tǒng)優(yōu)化教育部重點(diǎn)實(shí)驗(yàn)室,北京 102206;3.國網(wǎng)新疆電力有限公司,新疆 烏魯木齊 830002;4.國網(wǎng)新疆電力有限公司 阿勒泰供電公司,新疆 阿勒泰 836500)
2020年9月,國家主席習(xí)近平在第七十五屆聯(lián)合國大會(huì)一般性辯論會(huì)上宣布,我國二氧化碳排放力爭(zhēng)于2030年前達(dá)到峰值,努力爭(zhēng)取2060年前實(shí)現(xiàn)碳中和.為實(shí)現(xiàn)這一目標(biāo),最主要的路徑是使用可再生能源、減少碳排放,提升電氣化水平.太陽能是可再生能源的重要部分,利用太陽能發(fā)電是實(shí)現(xiàn)碳中和目標(biāo)的重要路徑.然而,太陽能獨(dú)特的隨機(jī)性、間歇性和波動(dòng)性,隨著光伏裝機(jī)容量需求逐漸增大,給電網(wǎng)安全帶來了諸多考驗(yàn).精準(zhǔn)的光伏發(fā)電出力預(yù)測(cè)對(duì)光伏電站制定發(fā)電計(jì)劃、保證電網(wǎng)穩(wěn)定運(yùn)行有著重要作用.
國內(nèi)外諸多學(xué)者在光伏發(fā)電出力預(yù)測(cè)上展開了大量研究,如BP(back propagation)神經(jīng)網(wǎng)絡(luò)[1-2]、梯度下降決策樹(gradient boosting decision tree,GBDT)[3].de Giorgi等[4]采用多元線性回歸方法,以光伏發(fā)電系統(tǒng)的太陽能輻射等氣象因素來預(yù)測(cè)發(fā)電功率;Ahmad等[5]提出了基于隨機(jī)森林算法和額外樹算法組合光伏發(fā)電預(yù)測(cè)模型,以氣象因素預(yù)測(cè)下一小時(shí)的光伏輸出功率.支持向量機(jī)(support vector machine,SVM)以結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則為優(yōu)勢(shì)取代了傳統(tǒng)機(jī)器學(xué)習(xí)中的經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化,廣泛應(yīng)用于光伏出力預(yù)測(cè).如姜恩宇等[6]基于支持向量機(jī)以某一天數(shù)據(jù)為訓(xùn)練樣本預(yù)測(cè)出力,結(jié)果表明,支持向量機(jī)能夠明顯提高小樣本預(yù)測(cè)精度;張雨金等[7]引入集成學(xué)習(xí)的思想和方法,提出Stacking-SVM短期光伏發(fā)電預(yù)測(cè)方法,通過次級(jí)SVM對(duì)多個(gè)預(yù)測(cè)結(jié)果輸出耦合得到最終預(yù)測(cè)結(jié)果.
循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)具有跨多時(shí)間步長(zhǎng)傳遞信息的能力,被廣泛應(yīng)用于各領(lǐng)域[8].Du等[9]證明了RNN具有較強(qiáng)記憶性且圖靈完備.然而,在實(shí)際應(yīng)用中,RNN模型對(duì)變量序列間的時(shí)間依賴關(guān)系較強(qiáng),使得其對(duì)于具有關(guān)聯(lián)性的點(diǎn)序列輸入具有好的預(yù)測(cè)效果,造成偏差較大.為了解決RNN模型的這個(gè)問題,以RNN為基礎(chǔ)的長(zhǎng)短期記憶網(wǎng)絡(luò)(long short-term memory,LSTM)模型應(yīng)運(yùn)而生[10].LSTM以記憶單元取代傳統(tǒng)人工神經(jīng)元,目前已被應(yīng)用于空氣質(zhì)量指數(shù)[11]、語音識(shí)別[12]等領(lǐng)域,并表現(xiàn)出良好的預(yù)測(cè)性能.陳卓等[13]基于LSTM以電力負(fù)荷為短期預(yù)測(cè)對(duì)象,效果良好,該算法有望用于預(yù)測(cè)光伏發(fā)電功率.Hintion在2006年提出深度信念網(wǎng)絡(luò)(deep belief network,DBN).該算法具有強(qiáng)大的特征提取能力,并可通過玻爾茲曼機(jī)(restricted Boltzmann machine,RBM)的預(yù)訓(xùn)練有效解決局部最優(yōu)等問題[14].Yun[15]和耿博等[16]的研究表明,對(duì)影響光伏出力特征信息進(jìn)行有效挖掘,并結(jié)合混合模型仿真,可有效提高預(yù)測(cè)精度.
基于上述分析,本文利用DBN耦合SVM和LSTM模型,提出一種新的光伏功率組合預(yù)測(cè)方法,根據(jù)實(shí)際出力和預(yù)測(cè)結(jié)果的誤差利用DBN動(dòng)態(tài)調(diào)整以獲得最優(yōu)值,并驗(yàn)證SVM-LSTM-DBN模型的有效性和準(zhǔn)確性.
采用新疆某光伏電站2019年2月16日-9月7日的每日15 min實(shí)測(cè)氣象數(shù)據(jù),如表1所示.表1中:θ為溫度;φ為相對(duì)濕度;Dth為太陽散射強(qiáng)度;Hth為太陽直接輻射強(qiáng)度;P為實(shí)時(shí)發(fā)電功率.
表1 某光伏電站的部分歷史實(shí)測(cè)數(shù)據(jù)
模型構(gòu)建中,初始數(shù)據(jù)通過z-score進(jìn)行標(biāo)準(zhǔn)化處理,從而消除不同特征的量綱的影響和提高模型的計(jì)算能力和收斂速度.具體計(jì)算公式為
(1)
式(1)中:x為標(biāo)準(zhǔn)化前的數(shù)據(jù);z為標(biāo)準(zhǔn)化后的數(shù)據(jù);μ為樣本的均值;σ為樣本的標(biāo)準(zhǔn)差.
數(shù)據(jù)經(jīng)過z-score標(biāo)準(zhǔn)化后呈標(biāo)準(zhǔn)正態(tài)分布,預(yù)測(cè)模型完成訓(xùn)練后,對(duì)預(yù)測(cè)的輸出數(shù)據(jù)進(jìn)行反標(biāo)準(zhǔn)化處理,即x=zσ+μ,則可得到預(yù)測(cè)功率數(shù)據(jù).
光伏出力與氣象因素間具有一定的相關(guān)性,即使是相同天氣狀態(tài)下也會(huì)因?yàn)樵茖拥淖兓瘜?dǎo)致光伏板受太陽輻射的面積與強(qiáng)度產(chǎn)生變化.光伏組件僅在太陽升起至降落的時(shí)間段內(nèi)工作,為了避免大量光伏出力零值數(shù)據(jù)對(duì)分析造成影響,考慮到光伏組件的敏感程度,結(jié)合該光伏電站所在新疆省當(dāng)?shù)氐膶?shí)際氣候情況.因此,文中以正午時(shí)刻(12:00)為例,對(duì)溫度、相對(duì)濕度、太陽直接輻射強(qiáng)度、太陽散射強(qiáng)度等4種氣象參數(shù),在不同時(shí)間點(diǎn)采集的數(shù)據(jù)分別進(jìn)行相關(guān)性分析.
光伏出力數(shù)據(jù)與各氣象因素經(jīng)預(yù)處理后的結(jié)果,如圖1所示.圖1中:θ為溫度;φ為相對(duì)濕度;Dth為太陽散射強(qiáng)度;Hth為太陽直接輻射強(qiáng)度;Pout為光伏出力.
(a)太陽散射強(qiáng)度 (b)太陽直接輻射強(qiáng)度
從圖1可知:太陽散射強(qiáng)度、太陽直接輻射強(qiáng)度與出力值變化的擬合性較高,散點(diǎn)圖分布較為集中,正相關(guān)較明顯,其中太陽直接輻射強(qiáng)度與出力的相關(guān)性更強(qiáng);同一時(shí)刻,相對(duì)濕度、溫度與出力值的關(guān)系較為分散.從圖1還可知:當(dāng)出力值較大時(shí),相對(duì)濕度偏低而溫度偏高.整體來看相對(duì)濕度的擬合曲線呈負(fù)相關(guān),溫度與出力值的擬合曲線較為平緩,相關(guān)性較不明顯.
對(duì)溫度、相對(duì)濕度、太陽散射強(qiáng)度、太陽直接輻射強(qiáng)度與光伏出力進(jìn)行協(xié)方差和Pearson相關(guān)性分析,得到結(jié)果見表2.表2中:θ為溫度;φ為相對(duì)濕度;Dth為太陽散射強(qiáng)度;Hth為太陽直接輻射強(qiáng)度;r為Pearson相關(guān)系數(shù).
表2 相關(guān)性計(jì)算結(jié)果
從表2可知:協(xié)方差與Pearson相關(guān)系數(shù)所得相關(guān)性結(jié)果趨勢(shì)大致相同,與圖1初步分析結(jié)果一致.結(jié)合圖1、表1分析可知:在所有影響因素中,太陽直接輻射強(qiáng)度、太陽散射強(qiáng)度、相對(duì)濕度與光伏出力顯現(xiàn)出較明顯的相關(guān)性,其中太陽直接輻射強(qiáng)度正相關(guān)性最強(qiáng).太陽散射強(qiáng)度和太陽直接輻射強(qiáng)度反映了太陽熱輻射能,當(dāng)太陽熱輻射能較強(qiáng)時(shí),半導(dǎo)體材料在界面層獲得的能量較強(qiáng),產(chǎn)生更多的電子-空穴對(duì),進(jìn)而光伏出力較大;相對(duì)濕度與光伏出力表現(xiàn)出負(fù)相關(guān)性,相對(duì)濕度較高往往是陰雨天氣,太陽熱輻射能較弱,光伏發(fā)電受到影響出力變小,相關(guān)系數(shù)計(jì)算結(jié)果與物理解釋一致.
為驗(yàn)證模型的預(yù)測(cè)精度,采用均方根誤差(RMSE)和平均絕對(duì)誤差(MAE)作為模型性能的評(píng)價(jià)指標(biāo),其具體計(jì)算公式[17]為
(2)
(3)
設(shè)xλ∈Rn為訓(xùn)練樣本中的各項(xiàng)氣象參數(shù),yλ∈Rn為光伏出力,兩者共同組成樣本集合(xλ,yλ)∈Rn×R.其中,n為樣本的個(gè)數(shù),λ=1,2,…,n.通過線性回歸函數(shù)對(duì)樣本集合擬合,可得
f(x)=ωTφ(x)+b.
(4)
式(4)中:ω為權(quán)值矢量;φ(x)為非線性映射關(guān)系;b為閾值.
核函數(shù)的選擇對(duì)預(yù)測(cè)效果起重要作用,常用的核函數(shù)有線性核函數(shù)、多項(xiàng)式核函數(shù)、高斯徑向基核函數(shù)等.其中,高斯核函數(shù)具有計(jì)算效率高和計(jì)算結(jié)果可靠等優(yōu)點(diǎn),較適合表示氣象參數(shù)與光伏出力間的復(fù)雜非線性關(guān)系.其具體表達(dá)形式為
(5)
式(5)中:σ為高斯核函數(shù)的核寬度.
由此,構(gòu)建以高斯徑向基為核函數(shù)的SVM單項(xiàng)預(yù)測(cè)模型,采用滾動(dòng)預(yù)測(cè),Lookback取值為7,Delay取值為1,以序列號(hào)前50個(gè)預(yù)測(cè)點(diǎn)為例,比較SVM的單項(xiàng)預(yù)測(cè)值與實(shí)際出力值之間的偏差,結(jié)果如圖2所示.圖2中:Pout為光伏出力.從圖2可知:支持向量機(jī)在不同時(shí)刻顯示出不同的預(yù)測(cè)精度,整體有一定的重合度,但預(yù)測(cè)精度有一定的提升空間.
圖2 某地區(qū)光伏發(fā)電SVM預(yù)測(cè)結(jié)果
LSTM常見的塊結(jié)構(gòu)包含輸入、遺忘、輸出三個(gè)門,以及塊輸入、塊輸出、記憶細(xì)胞、輸出激活函數(shù)和窺視孔連接,而塊輸出反復(fù)連接塊輸入和所有門,如圖3所示.LSTM訓(xùn)練過程包括信息的向前傳遞和誤差的反向傳播.
圖3 RNN網(wǎng)絡(luò)隱層中的LSTM塊
1)信息向前傳遞.設(shè)t時(shí)刻的輸入向量為xt,LSTM塊的數(shù)量為N,輸入數(shù)量為M.即一個(gè)LSTM網(wǎng)絡(luò)層的各權(quán)值向量為
zt=g(Wzxt+Rzyt-1+bz),
(6)
(7)
ft=σ(Wfxt+Rfyt-1+pfect-1+bf),
(8)
ct=zteit+ct-1eft,
(9)
ot=σ(Woxt+Royt-1+poect+bo),
(10)
yt=h(ct)eot.
(11)
2)誤差反向傳播.LSTM塊內(nèi)部的增量δ,其計(jì)算式為
(12)
(13)
(14)
(15)
(16)
(17)
式(12)中:Δt為上一層向下傳遞的增量向量.
與經(jīng)典神經(jīng)網(wǎng)絡(luò)相比,LSTM訓(xùn)練最大區(qū)別在于若預(yù)測(cè)t時(shí)刻的值pt,則前面的n個(gè)樣本{pt-n,…,pt-1}都需要通過網(wǎng)絡(luò)訓(xùn)練.因此,在設(shè)置網(wǎng)絡(luò)時(shí)對(duì)時(shí)間步數(shù)n進(jìn)行定義來滿足預(yù)測(cè)精度,記憶細(xì)胞將根據(jù)訓(xùn)練狀態(tài)存儲(chǔ)并輸出預(yù)測(cè)值pt.
LSTM模型結(jié)構(gòu)的搭建與參數(shù)的設(shè)置,對(duì)于樣本訓(xùn)練過程的優(yōu)化、訓(xùn)練時(shí)耗、預(yù)測(cè)精度起關(guān)鍵性作用.通過大量迭代過程,對(duì)2~6層隱層的網(wǎng)絡(luò)進(jìn)行對(duì)比分析,最終確定最佳的網(wǎng)絡(luò)深度.比較不同隱層模型訓(xùn)練完成時(shí)間與訓(xùn)練后的評(píng)價(jià)指標(biāo)MAE和RMSE,如表3所示.隱層層數(shù)增加與訓(xùn)練時(shí)間的關(guān)系,如圖4所示.表3,圖4中:N為隱層層數(shù);t為訓(xùn)練時(shí)間;γRMSE,γMAE分別為RMSE值和MAE值.
圖4 隱層層數(shù)與訓(xùn)練時(shí)長(zhǎng)增加關(guān)系圖
表3 不同隱層模型訓(xùn)練后的評(píng)價(jià)指標(biāo)
從表3可知:當(dāng)隱層層數(shù)少于4層時(shí),MAE和RMSE值隨隱層數(shù)目增加而減??;而當(dāng)隱層層數(shù)大于4時(shí),MAE和RMSE值隨隱層層數(shù)增大而增大.隨著隱層層數(shù)的逐漸增加,訓(xùn)練時(shí)長(zhǎng)呈指數(shù)型增加,當(dāng)隱層層數(shù)為4時(shí),模型訓(xùn)練時(shí)長(zhǎng)較長(zhǎng)并出現(xiàn)過擬合現(xiàn)象.綜上所述,當(dāng)隱層數(shù)目為4時(shí),MAE和RMSE值均最小,訓(xùn)練時(shí)間較合理,預(yù)測(cè)精度最高.因此,文中選用隱層為4層的LSTM網(wǎng)絡(luò).
通過支持向量機(jī)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)分別建立單項(xiàng)預(yù)測(cè)模型,以氣象參數(shù)相對(duì)濕度、太陽散射強(qiáng)度、太陽直接輻射強(qiáng)度等為特征向量輸入,以光伏出力為輸出.單項(xiàng)模型的預(yù)測(cè)結(jié)果進(jìn)一步深度信念網(wǎng)絡(luò)訓(xùn)練,優(yōu)化后輸出.圖5為光伏發(fā)電出力預(yù)測(cè)組合模型示意圖.圖5中:V為DBN顯層;H為隱層;W為V和H的連接權(quán)重.
圖5 光伏發(fā)電出力預(yù)測(cè)組合模型示意圖
光伏發(fā)電出力預(yù)測(cè)具體流程,如圖6所示.單項(xiàng)預(yù)測(cè)模型構(gòu)建完成后,通過DBN對(duì)預(yù)測(cè)結(jié)果優(yōu)化,具體過程有如下3個(gè)方面.
圖6 光伏發(fā)電出力預(yù)測(cè)流程圖
1)以各單項(xiàng)模型的預(yù)測(cè)值作為DBN的輸入向量,分別由X1,X2,X3表示.
2)通過枚舉法[18]選取DBN隱層的層數(shù)及單元數(shù),然后通過訓(xùn)練樣本確定各單項(xiàng)模型的最優(yōu)權(quán)重.此訓(xùn)練過程有兩步:
(a)通過無監(jiān)督的逐層訓(xùn)練來訓(xùn)練DBN中的RBM.設(shè)RBM中的顯層、隱層神經(jīng)元的數(shù)目分別為n,n,而vi,hj分別為顯層第i個(gè)、隱層第j個(gè)神經(jīng)元的狀態(tài),它們對(duì)應(yīng)的偏置分別為ai,bj;wi,j為顯層第i個(gè)、隱層第j個(gè)神經(jīng)元之間的連接權(quán)重.設(shè)β=(wi,j,ai,bj)為RBM的參數(shù);則RBM在狀態(tài)(v,h)上的能量函數(shù)可表示為
(18)
當(dāng)顯層單元向量v=(v1,…,vi,…,vn)隨機(jī)給定后,隱層第j個(gè)單元hj被激活的概率為
(19)
式(19)中:Sigmoid(x)=(1+e-x)-1為激活函數(shù).
當(dāng)隱層單元向量h=(h1,…,hi,…,hn)(x)隨機(jī)給定后,顯層第i個(gè)單元vi被激活的概率為
(20)
采用對(duì)比散度法對(duì)RBM的參數(shù)β=(wi,j,ai,bj)尋優(yōu).
(21)
Δai=σCD(〈vi〉-〈vi′〉),
(22)
Δbj=σCD(〈hj〉-〈hj′〉).
(23)
式(21)~(23)中:σCD為對(duì)比散度法的學(xué)習(xí)速率;〈·〉為變量的數(shù)學(xué)期望.
(b)根據(jù)BP算法進(jìn)行反向微調(diào),以DBN的輸出值反向更新其網(wǎng)絡(luò)和權(quán)重.
3)將待測(cè)日的氣象數(shù)據(jù)代入算法訓(xùn)練,輸出預(yù)測(cè)值Pi.
使用Python語言(V3.6)編寫,運(yùn)行環(huán)境前端為Keras,谷歌第二代人工智能學(xué)習(xí)系統(tǒng)TensorFlow為后端[19],以新疆某光伏發(fā)電站為例,將預(yù)處理后的樣本代入SVM,LSTM和SVM-LSTM-DBN模型中.2019年2月16日-9月7日的全時(shí)間序列光伏發(fā)電的組合預(yù)測(cè)結(jié)果,如圖7所示.不同算法模型的光伏發(fā)電功率預(yù)測(cè)結(jié)果逐點(diǎn)(序列號(hào)前50預(yù)測(cè)點(diǎn))對(duì)比,如圖8所示.圖7,8中:Pout為光伏出力.
圖7可知:SVM-LSTM-DBN組合預(yù)測(cè)模型具有一定的預(yù)測(cè)精度,其預(yù)測(cè)曲線與實(shí)際曲線變化趨勢(shì)基本一致,具有較好的預(yù)測(cè)效果.由圖8可知:LSTM模型的預(yù)測(cè)精度與SVM-LSTM-DBN組合模型相比較低,SVM模型預(yù)測(cè)精度最低.
圖7 全時(shí)間序列光伏發(fā)電預(yù)測(cè)結(jié)果 圖8 不同算法光伏發(fā)電功率預(yù)測(cè)結(jié)果逐點(diǎn)對(duì)比
不同預(yù)測(cè)模型的光伏發(fā)電功率預(yù)測(cè)性能比較,如表4所示.表4中:γRMSE,γMAE分別為RMSE值和MAE值.從表4可知:文中所提出的SVM-LSTM-DBN組合預(yù)測(cè)模型具有最小的MAE值及RMSE值,分別為1.073及1.840,即具有最高預(yù)測(cè)精度,降低了整體預(yù)測(cè)誤差.
表4 不同預(yù)測(cè)模型預(yù)測(cè)性能比較
文中利用DBN提出SVM-LSTM-DBN組合模型進(jìn)行短期光伏出力預(yù)測(cè).以新疆某光伏電站實(shí)測(cè)數(shù)據(jù)為例,將SVM-LSTM-DBN模型與單一模型實(shí)驗(yàn)效果對(duì)比,得出如下3點(diǎn)主要結(jié)論.
1)文中提出的SVM-LSTM-DBN模型將SVM與LSTM模型采用枚舉法加權(quán)組合,修正單一模型中誤差較大的時(shí)序值,以降低誤差.實(shí)驗(yàn)結(jié)果表明,SVM-LSTM-DBN模型能有效提高短期光伏出力預(yù)測(cè)精度.
2)通過SVM-LSTM-DBN模型與單一模型實(shí)驗(yàn)效果對(duì)比,表明單一模型的出力預(yù)測(cè)精度是組合模型精度有效提高的前提,因此正確選擇或調(diào)節(jié)參與組合的單一模型參數(shù)至關(guān)重要.
3)數(shù)據(jù)基礎(chǔ)是實(shí)現(xiàn)預(yù)測(cè)精準(zhǔn)的基石.在后續(xù)研究中,應(yīng)重點(diǎn)關(guān)注光伏電站運(yùn)行的穩(wěn)定性,有利于挖掘更多有效信息,從而提升預(yù)測(cè)精度以制定發(fā)電計(jì)劃,進(jìn)一步提高太陽能利用率,減少碳排放的同時(shí)保證電網(wǎng)穩(wěn)定運(yùn)行.