趙從杰 潘文林
(1.云南民族大學(xué)電氣信息工程學(xué)院 昆明 650500)(2.云南民族大學(xué)數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院 昆明 650500)
電力工業(yè)對(duì)于我國(guó)經(jīng)濟(jì)建設(shè)、國(guó)家安全、社會(huì)穩(wěn)定、生活質(zhì)量具有至關(guān)重要的作用,為了提高電力行業(yè)的安全性和經(jīng)濟(jì)性需要對(duì)電力負(fù)荷進(jìn)行預(yù)測(cè)。經(jīng)過(guò)多年的研究,電力負(fù)荷預(yù)測(cè)方法也越來(lái)越成熟,電力負(fù)荷預(yù)測(cè)方法主要有電力彈性系數(shù)法、負(fù)荷密度、基于時(shí)間序列的ARMA 模型、回歸分析法、人工神經(jīng)網(wǎng)絡(luò)(ANN)、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)和混合技術(shù)等[1]。Ferlito等利用一種比較法引入了多種數(shù)據(jù)驅(qū)動(dòng)技術(shù)來(lái)解決電網(wǎng)中的預(yù)測(cè)問(wèn)題[2]。Heydari 等提出了一種人工神經(jīng)網(wǎng)絡(luò)方法實(shí)現(xiàn)對(duì)微電網(wǎng)中的風(fēng)能和太陽(yáng)能發(fā)電量預(yù)測(cè)[3]。Moradzadeh等提出了一種基于支持向量回歸(SVR)和長(zhǎng)-短期記憶(LSTM)模型的混合預(yù)測(cè)方法,對(duì)微電網(wǎng)進(jìn)行了短期負(fù)荷預(yù)測(cè)[4]。在文獻(xiàn)[5]中,提出了一種季節(jié)性調(diào)整支持向量機(jī)(SSA-SVM)的機(jī)器學(xué)習(xí)應(yīng)用混合技術(shù)進(jìn)行短期電力負(fù)荷預(yù)測(cè)。Wen 等[6]使用各種深度學(xué)習(xí)算法、多層感知器(MLP)和支持向量機(jī)(SVM)對(duì)微電網(wǎng)進(jìn)行了負(fù)荷預(yù)測(cè)。在其他一些研究中,也提出了將機(jī)器學(xué)習(xí)模型與優(yōu)化算法相結(jié)合的負(fù)荷預(yù)測(cè)方法。在文獻(xiàn)[7]中,采用支持向量機(jī)和粒子群優(yōu)化算法(PSO)的混合模型對(duì)微電網(wǎng)負(fù)荷進(jìn)行短期預(yù)測(cè)。在文獻(xiàn)[8]中,提出了一種將小波變換(WT)與果蠅優(yōu)化(FFO)算法相結(jié)合的短期負(fù)荷預(yù)測(cè)方法。在大多數(shù)情況下,這類混合模型由于輸入數(shù)據(jù)的高維性以及相關(guān)數(shù)據(jù)的時(shí)間序列特征無(wú)法識(shí)別出合適的數(shù)據(jù)模式,因而存在過(guò)擬合等問(wèn)題。在最近的研究中,深度學(xué)習(xí)技術(shù)被用作一種強(qiáng)有力的工具。它們?cè)陬A(yù)處理、處理和從原始數(shù)據(jù)中提取特征以及解決短期預(yù)測(cè)問(wèn)題[9]中表現(xiàn)出色。在以往的研究中,人們提出了一些用于處理和預(yù)測(cè)時(shí)間序列數(shù)據(jù)的深度學(xué)習(xí)技術(shù),如卷積神經(jīng)網(wǎng)絡(luò)(CNNs)、深度自動(dòng)編碼器(DAEs)、遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)和深度信念神經(jīng)網(wǎng)絡(luò)(DBNNs)。但DAE和DBNN 技術(shù)在理解與預(yù)期時(shí)間相關(guān)的時(shí)間序列樣本中的長(zhǎng)依賴性方面存在困難[10],而CNN 方法具有最少的單元數(shù)和內(nèi)存,可以提取時(shí)間序列數(shù)據(jù)的基本特征。但是,過(guò)濾器選擇和層數(shù)是一些問(wèn)題,如果選擇不當(dāng),可能會(huì)導(dǎo)致訓(xùn)練階段的過(guò)度擬合等問(wèn)題?;赗NN 的LSTM 和GRU 等技術(shù)在時(shí)間序列數(shù)據(jù)處理中表現(xiàn)良好,能夠?qū)?fù)雜的非線性參數(shù)進(jìn)行建模。GRU 網(wǎng)絡(luò)主要提取LSTM 網(wǎng)絡(luò)不能獲得的特征,并且比LSTM 網(wǎng)絡(luò)復(fù)雜。然而,一些研究表明,由于前向訓(xùn)練,LSTM 算法在識(shí)別大容量數(shù)據(jù)模式時(shí)遇到了數(shù)據(jù)缺失和過(guò)度擬合等問(wèn)題[11]。
為了預(yù)測(cè)微電網(wǎng)的短期負(fù)荷,解決現(xiàn)有方法存在的問(wèn)題,提出了一種稱為雙向LSTM(bilstm)的深度學(xué)習(xí)方法。雙向LSTM 是一種基于時(shí)間序列的技術(shù),它考慮了一段時(shí)間內(nèi)的所有數(shù)據(jù)行為,影響網(wǎng)絡(luò)負(fù)荷的數(shù)據(jù)具有長(zhǎng)期的互聯(lián)行為和模式。因此,該方法的雙向運(yùn)動(dòng)及其層間相互關(guān)聯(lián)的結(jié)構(gòu)消除了訓(xùn)練階段的數(shù)據(jù)丟失和過(guò)度擬合等問(wèn)題。
本文從歐洲互聯(lián)電網(wǎng)下載了相關(guān)數(shù)據(jù)(https://transparency.entsoe.eu/generation/r2/dayAheadAggregatedGeneration/show),以2019 年1 月1 日至2020年1 月1 日的瑞士電網(wǎng)負(fù)荷數(shù)據(jù)為案例,數(shù)據(jù)以每個(gè)小時(shí)整點(diǎn)記錄一次,共計(jì)8760 條數(shù)據(jù),負(fù)荷數(shù)據(jù)分布圖如圖1所示。
圖1 瑞士2019年負(fù)荷分布圖
很多外界因素都會(huì)影響電力負(fù)荷數(shù)據(jù),進(jìn)而影響電力負(fù)荷預(yù)測(cè)的精準(zhǔn)度??紤]到瑞士的環(huán)境因素和人文因素,將瑞士當(dāng)?shù)匕l(fā)電能源種類及占比,家庭人口數(shù)量及占比,電價(jià),日期等因素作為電力負(fù)荷預(yù)測(cè)的重要影響因子。如圖2 所示為2019 年瑞士不同能源發(fā)電占比分布圖,圖3為2019年瑞士電價(jià)分布圖。
圖2 2019年瑞士能源發(fā)電分布圖
1)數(shù)據(jù)補(bǔ)全
在下載數(shù)據(jù)過(guò)程中發(fā)現(xiàn)由于記錄數(shù)據(jù)設(shè)備故障或一些人為操作有部分電等原因?qū)е码娏ω?fù)荷數(shù)據(jù)缺失,為了達(dá)到較為準(zhǔn)確的預(yù)測(cè)效果,需要對(duì)缺失的數(shù)據(jù)進(jìn)行補(bǔ)全。本文采用雙線性插值法進(jìn)行數(shù)據(jù)補(bǔ)全。
2)歸一化處理
由于單價(jià)、負(fù)荷量、發(fā)電能源種類及占比等因素是不同量綱的,且雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)對(duì)數(shù)據(jù)的敏感度較高,數(shù)據(jù)尺度過(guò)大也會(huì)影響負(fù)荷預(yù)測(cè)結(jié)果。故對(duì)數(shù)據(jù)進(jìn)行如式(1)的歸一化處理。
式中xnorm為數(shù)據(jù)歸一化處理后的負(fù)荷數(shù)據(jù),在0~1之間。x為原始數(shù)據(jù),xmin最小電荷值,xmax為最大電荷值。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)是在循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的基礎(chǔ)上演化而來(lái),主要解決了梯度消失或梯度爆炸的問(wèn)題[12]。LSTM將RNN的輸入數(shù)據(jù)x(t)和隱藏層信息a(t-1) 變?yōu)檩斎霐?shù)據(jù)x(t),隱藏層信息a(t-1) 和記憶單元c(t-1) 。參數(shù)的求解方法也發(fā)生了變化。雙向長(zhǎng)短時(shí)記憶(BiLSTM)是在LSTM的基礎(chǔ)上結(jié)合了輸入序列在前向和后向兩個(gè)方向上的信息。對(duì)于t時(shí)刻的輸出,前向LSTM 層具有輸入序列中t時(shí)刻以及之前時(shí)刻的信息,而后向LSTM 層中具有輸入序列中t時(shí)刻以及之后時(shí)刻的信息。前向LSTM 層t時(shí)刻的輸出記作h→t,后向LSTM 層t時(shí)刻的輸出結(jié)果記作h←t,兩個(gè)LSTM 層輸出的向量可以使用相加、平均值或連接等方式進(jìn)行處理。如圖4 所示為雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)圖。
圖4 雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)結(jié)構(gòu)圖
輸入數(shù)據(jù)主要包括真實(shí)電荷值,發(fā)電能源種類及占比,家庭人口數(shù)量及占比,電價(jià),日期;輸出層為電力負(fù)荷值。
利用第1 節(jié)中的數(shù)據(jù)對(duì)本文提出的基于雙向長(zhǎng)短時(shí)電網(wǎng)負(fù)荷預(yù)測(cè)方法進(jìn)行驗(yàn)證。此外還跟文獻(xiàn)[13]提出雙循環(huán)神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)方法進(jìn)行對(duì)比,實(shí)現(xiàn)對(duì)一天、一周的電網(wǎng)負(fù)荷預(yù)測(cè)。本文用相關(guān)系數(shù)(R)、均方誤差(MSE)和均方根誤差(RMSE)等指標(biāo)來(lái)評(píng)價(jià)Bi-LSTM 網(wǎng)絡(luò)的性能。R 指數(shù)顯示了預(yù)測(cè)值與實(shí)際值之間的一種相關(guān)性,R 的最大值表明了網(wǎng)絡(luò)的高精度。MSE 和RMSE 指標(biāo)顯示了為每個(gè)樣本計(jì)算的這些指標(biāo)的預(yù)測(cè)誤差。一天負(fù)荷預(yù)測(cè)的R 值為0.9987,MSE 和RMSE 分別為0.0799 和0.2826。如圖5為雙循環(huán)神經(jīng)網(wǎng)絡(luò)一天的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果,圖6 為雙長(zhǎng)短時(shí)記憶一天的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果,圖7 為雙循環(huán)神經(jīng)網(wǎng)絡(luò)一周的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果,圖8 為雙長(zhǎng)短時(shí)記憶一周的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果。
圖5 雙循環(huán)神經(jīng)網(wǎng)絡(luò)一天的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果
圖6 雙長(zhǎng)短時(shí)記憶一天的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果
圖7 雙循環(huán)神經(jīng)網(wǎng)絡(luò)一周的電網(wǎng)負(fù)荷預(yù)測(cè)結(jié)果
圖8 雙長(zhǎng)短時(shí)記憶一周的電網(wǎng)負(fù)荷預(yù)測(cè)
本文為了實(shí)現(xiàn)對(duì)瑞士電網(wǎng)的點(diǎn)和預(yù)測(cè),提出了一種稱為雙向長(zhǎng)短時(shí)記憶的深度學(xué)習(xí)算法。與其他深度學(xué)習(xí)技術(shù)不同,bilstm 方法由于其獨(dú)特的結(jié)構(gòu)和雙向的訓(xùn)練程序,提供了處理大量時(shí)間序列數(shù)據(jù)的強(qiáng)大能力。此外,在訓(xùn)練階段避免數(shù)據(jù)丟失和過(guò)度擬合的問(wèn)題。利用輸入數(shù)據(jù)對(duì)bilstm 網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并以1h 為間隔對(duì)微網(wǎng)負(fù)荷進(jìn)行預(yù)測(cè)。通過(guò)相關(guān)系數(shù)(R)、均方誤差(MSE)、均方根誤差(RMSE)等性能評(píng)價(jià)指標(biāo)對(duì)預(yù)測(cè)結(jié)果進(jìn)行分析。將雙長(zhǎng)短時(shí)記憶法與循環(huán)神經(jīng)網(wǎng)絡(luò)進(jìn)行比較評(píng)價(jià),結(jié)果表明本文提出的深度學(xué)習(xí)方法在電網(wǎng)短期負(fù)荷預(yù)測(cè)中具有較好的效果。