李 濤,姚 婧,呂雪濤
(1.國網(wǎng)湖北省電力有限公司荊州供電公司,湖北 荊州 434000;2.武漢大學(xué) 計算機學(xué)院,湖北 武漢 430072)
近年來,由于經(jīng)濟發(fā)展和人口增長,全球電力消耗不斷增加[1]。電力能源是影響地區(qū)社會經(jīng)濟發(fā)展的重要因素,對地區(qū)經(jīng)濟的改善作出了重大貢獻。因此,推動經(jīng)濟發(fā)展離不開電力系統(tǒng)的建設(shè)與完善。短期電力負荷預(yù)測(STLF)是電力系統(tǒng)需求側(cè)改革的一個重要方面,也是實現(xiàn)電力系統(tǒng)安全穩(wěn)定運行的重要前提。
現(xiàn)有的短期負荷預(yù)測方法大致可分為傳統(tǒng)統(tǒng)計和機器學(xué)習(xí)2類[2]。傳統(tǒng)統(tǒng)計方法包括線性回歸(LR)分析[3]、指數(shù)平滑[4]和自回歸坐標移動正態(tài)分布(ARIMA)[5]。由于負荷數(shù)據(jù)存在許多固有的非線性特征,傳統(tǒng)統(tǒng)計方法不能很好地學(xué)習(xí)這些非線性數(shù)據(jù)[6],無法滿足STLF對負荷預(yù)測精度的要求?;跈C器學(xué)習(xí)的預(yù)測方法包括模糊推理系統(tǒng)[7]、支持向量機(SVM)[8]和人工神經(jīng)網(wǎng)絡(luò)[9],都具有學(xué)習(xí)非線性特征的能力,其中反向傳播神經(jīng)網(wǎng)絡(luò)(BPNN)與基于K-最近鄰(K-NN)和K-means的多標簽算法的組合模型在解決STLF方面能獲得更好的表現(xiàn)。然而,BPNN 是一種前饋神經(jīng)網(wǎng)絡(luò),不能很好地學(xué)習(xí)電力系統(tǒng)中的時序數(shù)據(jù)。為解決這一問題,研究者們將深度學(xué)習(xí)的方法應(yīng)用到負荷預(yù)測領(lǐng)域,處理復(fù)雜的非線性模式。Shi等[10]提出了一種新的基于時間序列的深度遞歸神經(jīng)網(wǎng)絡(luò)(PDRNN),將一組用戶的負荷分布批量輸入到一個輸入池中,使用聚合智能計量數(shù)據(jù)消除不確定性,通過增加數(shù)據(jù)多樣性和數(shù)據(jù)量來解決過度擬合問題。但是,傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)由于時間深度過大,隱藏層簡單,在進行誤差反向傳播時,會出現(xiàn)梯度消失的問題。針對此類問題,Hochreiter 等[11]提出了長短期記憶(LSTM)循環(huán)神經(jīng)網(wǎng)絡(luò),通過門控制將短期記憶與長期記憶相結(jié)合,克服了傳統(tǒng) RNN 的不足。Kong等[12]提出了一種基于密度的聚類分析方法,采用LSTM捕捉負荷曲線中持續(xù)存在的微妙的時間消耗模式,大多數(shù)情況下能產(chǎn)生最佳預(yù)測。門控循環(huán)單元(GRU)是一種特殊類型的基于優(yōu)化 LSTM 的循環(huán)神經(jīng)網(wǎng)絡(luò),其內(nèi)部單元類似于 LSTM,具有更強的收斂性。Jung等[13]提出了一種短期負荷預(yù)測模型,使用GRU更加關(guān)注關(guān)鍵變量,提升負荷預(yù)測精度。然而,電力系統(tǒng)中不僅有時序數(shù)據(jù),還有時空矩陣、圖像信息等高維數(shù)據(jù),GRU 模型并不能很好地處理這些高維數(shù)據(jù)。卷積神經(jīng)網(wǎng)絡(luò) (CNN)廣泛應(yīng)用于圖像識別和預(yù)測領(lǐng)域,是處理高維數(shù)據(jù)的理想選擇。陸繼翔等[14]提出了一種結(jié)合門控循環(huán)單元和卷積神經(jīng)網(wǎng)絡(luò)的GRU-CNN混合神經(jīng)網(wǎng)絡(luò)模型,其GRU模塊提取時間序列數(shù)據(jù)的特征向量,CNN模塊提取高維數(shù)據(jù)的特征向量。
電網(wǎng)中的負載變化具有高度隨機性和周期性,小樣本數(shù)據(jù)的預(yù)測精度差。因此,提出一種基于集合經(jīng)驗?zāi)B(tài)分解(EEMD)和門控循環(huán)單元(GRU)的短期負荷預(yù)測方法(EEMD-GRU),以提高短期電力負荷預(yù)測的預(yù)測精度,實現(xiàn)電力系統(tǒng)安全穩(wěn)定運行。
經(jīng)驗?zāi)B(tài)分解(EMD)是一種自適應(yīng)信號時頻處理方法,可以將原始復(fù)雜數(shù)據(jù)信號集自動分解為有限個固有模態(tài)函數(shù)(IMF),分解后的每個IMF信號分量代表原始信號中不同頻率的特征信號,廣泛應(yīng)用于自適應(yīng)時間序列數(shù)據(jù)信號分析模型[15]。如果原始信號的各種頻率成分混合,EMD在進行信號處理時可能會出現(xiàn)模態(tài)混疊現(xiàn)象,致使固有模態(tài)函數(shù)無法有效分離。因此,為了避免模態(tài)混疊的發(fā)生,采用EEMD對信號進行處理。
為了反映原始信號的全部和局部特征,將高斯白噪聲添加到原始信號中,找到原始時間序列的所有最大值和最小值點,使用三次樣條插值函數(shù)擬合曲線,其中最大值點對應(yīng)曲線的上包絡(luò)線,最小值點對應(yīng)下包絡(luò)線。第1步,計算上下包絡(luò)線的平均值m1;第2步,用給定原始信號X(t)減去m1,得到本征模函數(shù)f1,公式為:
X(t)-m1=f1
(1)
如果f1不滿足固有模式功能的要求,則f1作原始信號,重復(fù)第1步和第2步得到f2,公式為:
f1-m2=f2
(2)
繼續(xù)判斷f2是否滿足固有模式功能的要求,若滿足作為結(jié)果輸出,如果仍不滿足,則執(zhí)行下一次迭代。假設(shè)K次迭代,滿足固有模態(tài)函數(shù)要求的第1個函數(shù)為:
fk+ 1=fk+mk+1
(3)
則,其余部分為:
X(t)-c1=R1(t)
(4)
通過多次加入高斯白噪聲,最終得到的平均值即為EEMD分解后的負荷序列。
zt=σ(WZxt+UZht-1)
(5)
rt=σ(Wrxt+Urht-1)
(6)
(7)
(8)
式(5~8)中,WZ和UZ為更新門的權(quán)重;Wr和Ur為重置門的權(quán)重;W和U是形成防止內(nèi)存的網(wǎng)絡(luò)權(quán)重;σ為sigmoid函數(shù)。
由于負荷數(shù)據(jù)具有高度復(fù)雜性、隨機性和非平穩(wěn)性,傳統(tǒng)預(yù)測會受到很大的影響和限制。本文提出一種基于集合經(jīng)驗?zāi)B(tài)分解的門控循環(huán)單元(EEMD-GRU)預(yù)測模型進行電力負荷預(yù)測,EEMD- GRU模型如圖1所示。該模型主要包括負荷數(shù)據(jù)預(yù)處理、EEMD-GRU模型預(yù)測和最終預(yù)測結(jié)果累加3個模塊,具體過程如下。
1)對原始數(shù)據(jù)的缺省值和異常值進行預(yù)處理,剔除異常數(shù)據(jù),將缺省數(shù)據(jù)用前后數(shù)據(jù)的均值代替,得到完整負荷數(shù)據(jù)。
2)利用EEMD對數(shù)據(jù)進行分解,將原始數(shù)據(jù)信號分解為有限個本征模函數(shù)(IMF)和殘差分量,在每次分解中加入均勻分布的高斯白噪聲,得到平均值并進行歸一化處理。
3)GRU模型預(yù)測每個分量,依次得到每個分量的預(yù)測結(jié)果。
4)將每個分量的預(yù)測結(jié)果進行線性疊加,得到最終的預(yù)測結(jié)果。
圖1 EEMD-GRU模型
為了評估預(yù)測模型的性能,引入平均絕對百分比誤差(MAPE)和均方根誤差(RMSE),MAPE和RMSE公式為:
(9)
(10)
選取北美公用事業(yè)ISO-NE數(shù)據(jù)集(數(shù)據(jù)集的時間范圍為2003年3月至2014年12月)和荊州電網(wǎng)實際數(shù)據(jù)為研究對象,將EEMD-GRU與GRU,LSTM進行比較,以MAPE和RMSE為評價指標,驗證該模型的有效性。
在ISO-NE數(shù)據(jù)集中預(yù)測2003年3月至2004年3月的每日負荷數(shù)據(jù)。ISO-NE數(shù)據(jù)集每1 h采樣1次,共8 760條數(shù)據(jù)。取前7 008條負荷數(shù)據(jù)作為訓(xùn)練集,剩下1 752條數(shù)據(jù)作為測試集進行模型評估。
1)由于原始數(shù)據(jù)的隨機性、不確定性和非平穩(wěn)性,在進行EEMD算法之前,需要對電網(wǎng)的負荷序列進行預(yù)處理。剔除一些異常數(shù)據(jù)點,提高預(yù)測的準確性,同時利用前后數(shù)據(jù)的平均值填充缺省數(shù)據(jù)。
2)采用EEMD方法對電力負荷曲線進行分解,在EMD的基礎(chǔ)上加入均勻分布的高斯白噪聲,將原始信號分解為10個IMF分量和1個殘差分量。ISO-NE原始負荷數(shù)據(jù)及其EEMD分解的IMF分量和剩余殘差分量如圖2所示。
圖2 ISO-NE原始負荷數(shù)據(jù)及其EEMD分解的IMF分量和剩余殘差分量
圖2中,IMF1~IMF6是序列頻率分解后的較高部分,對應(yīng)電網(wǎng)中較快的切換負載行為;IMF7~IMF10是序列頻率分解后的較低部分,對應(yīng)電網(wǎng)中較慢的開關(guān)負載行為;RES表示從原始信號中減去 IMF1~IMF10 分量后的剩余分量。
3)使用GRU模型進行分量預(yù)測。對原始分量數(shù)據(jù)進行最大最小歸一化處理,設(shè)置GRU模型的參數(shù)時間步長為1,即從前一個負荷數(shù)據(jù)中預(yù)測下一個時間的數(shù)據(jù)。GRU 神經(jīng)網(wǎng)絡(luò)使用均方誤差 (MSE) 作為損失函數(shù),并在訓(xùn)練過程中通過自適應(yīng)矩估計 (Adam) 算法優(yōu)化 GRU 神經(jīng)網(wǎng)絡(luò)。對每個分量(IMFt+1,i,i=1,2,…,n)的預(yù)測結(jié)果及趨勢項rt+1的預(yù)測值進行線性累加,得到最終預(yù)測結(jié)果。ISO-NE中IMF4和IMF7預(yù)測結(jié)果分別如圖3和圖4所示。
圖3 IMF4預(yù)測結(jié)果
圖4 IMF7預(yù)測結(jié)果
在荊州供電公司2020年7月31日至2021年3月19日共計232 d的實測負荷數(shù)據(jù)中,選擇前218 d作為訓(xùn)練集,最后14 d作為測試集。按測試用例1的方法進行預(yù)處理和分量預(yù)測。荊州某臺區(qū)原始負荷數(shù)據(jù)及其EEMD分解的IMF分量和剩余殘差分量如圖5所示。
圖5 荊州某臺區(qū)的原始負荷數(shù)據(jù)及其EEMD分解的IMF分量和剩余殘差分量
采用平均絕對百分比誤差(MAPE)和均方根誤差(RMSE)作為評價指標,將EEMD- GRU模型與LSTM,GRU模型進行比較。負荷預(yù)測結(jié)果見表1。
表1 負荷預(yù)測結(jié)果
由表1可以看出,EEMD- GRU模型與LSTM,GRU相比預(yù)測結(jié)果存在較大差距。與LSTM相比,在ISO-NE數(shù)據(jù)集上, EEMD -GRU模型的MAPE降低了23.91%,RMSE降低了56.07%;在荊州某臺區(qū)數(shù)據(jù)上,MAPE降低了26.85%,RMSE降低了72.04%。與GRU相比,在ISO-NE數(shù)據(jù)集上,EEMD -GRU模型的MAPE降低了11.96%,RMSE降低了44.83%;在荊州某臺區(qū)數(shù)據(jù)上,MAPE降低了13.21%,RMSE降低了63.44%,驗證了EEMD -GRU模型的有效性和準確性。
基于集合經(jīng)驗?zāi)B(tài)分解的GRU模型在原始信號中加入了高斯白噪聲,將負載數(shù)據(jù)分解為有限個IMF和殘差分量,有效避免了EMD可能存在的模態(tài)混疊問題,進一步降低了原始負荷序列的非平穩(wěn)性。同時,利用RNN的改進模型GRU進行序列預(yù)測,不僅具有遠距離歷史信息記憶的能力,還具有超過LSTM的預(yù)測速度。通過在ISO-NE公開數(shù)據(jù)集和荊州電網(wǎng)實際數(shù)據(jù)上進行試驗,驗證了EEMD -GRU模型比GRU和LSTM模型具有更強的非線性擬合能力和更高的預(yù)測精度。