田英杰 蘇 運 郭乃網 姚 博 龐 悅 周向東
1(國網上海市電力公司電力科學研究院 上海 200437)2(復旦大學計算機科學技術學院 上海 200433))
為了提高發(fā)電和配電效率,盡量減少能源浪費,確保可持續(xù)發(fā)展,我們的電網正向智能電網轉變[1-2]。智能電網能夠根據需求的變化,動態(tài)調整電力生產和分配的方案,為能源管理提供前所未有的靈活性[3-4];為了實現這一轉變,預測未來需求的能力非常重要[5]。智能的能源管理方案不僅能在電網的聚合層級上,根據需求的變化做出動態(tài)調整;在個體層級上,也應具有動態(tài)調整的能力[6]。智能電表的出現使得個體層級電力負荷的采集成為可能,進而針對個體層級的負荷需求預測和方案動態(tài)調整也成為可能[3]。
電力負荷預測的難點在于個體層級的負荷具有高度的波動性和不確定性[7, 24-26]。通過聚合(抵消波動性和不確定性)能夠避開這一難點;針對聚合層級負荷預測的問題,已有許多工作提出了有效的預測方法[8-23]。然而,由于存在高度的波動性和不確定性[24-26],在個體層級上的負荷預測仍具有挑戰(zhàn)性[7];相關的工作數量有限,且預測的精度不高[6-8, 24-32]。在個體層級上,一條電力時間序列(如圖1(a)所示)可以分解成三個部分:(1) Regular Pattern(如圖1(b)所示);(2) Uncertainty(如圖1(c)所示);(3) Noise(或Volatility,如圖1(d)所示)。其中:Regular Pattern是電力負荷固有的周期性部分(以日、周、年等為周期);Uncertainty是受天氣、偶然事件等外部因素影響的非周期性部分;Noise(或Volatility)是不能從物理上解釋的剩余部分[8-9]。
(a)
(b)
(c)
(d)圖1 電力時間序列的分解
事實上,周期性部分Regular Pattern是容易預測的。但非周期性部分Uncertainty的預測是困難的,原因在于:(1) 外因數據的采集是困難的,甚至是不可行的;(2) 非周期性部分固有的隨機性是不可預測的。此外,噪聲Noise(或波動性Volatility)也是不可預測的。在個體層級上,非周期性部分Uncertainty和噪聲Noise具有相對高的占比,使得電力負荷的預測具有挑戰(zhàn)性[7, 24-26];現有的工作[6-8, 24-32]不能有效解決高度的不確定性和波動性帶來的困難,預測的精度不高。
個股股價也具有高度的不確定性和波動性,文獻[33]運用自動編碼器AE(Autoencoder)生成股價時間序列的嵌入,使用嵌入而非原始序列預測未來的股價。在滬深兩市部分股票上進行的對比實驗表明,相比于傳統方法,AE生成的嵌入能夠提取股價時間序列深度的特征,過濾其噪聲,進而提升預測的精度。然而,由于股價時間序列沒有明顯的周期性,直接采用這一方法預測個體層級的電力負荷,生成的嵌入捕捉負荷周期特性的能力有限,預測精度的提升不大。
針對現有方法存在的不足,提出一種基于時間序列嵌入的電力負荷預測方法。根據電力負荷固有的周期特性(以日、周、年等為周期),設計周期自動編碼器PAE,按周期將電力時間序列嵌入一個統一的向量空間。在嵌入空間中,可以采用多種深度神經網絡模型,來預測未來的電力負荷。實驗結果表明,PAE生成的嵌入能夠捕捉電力負荷固有的周期特性,過濾其不確定性和波動性。因此,相比于傳統方法,本文提出的預測方法具有更高的預測精度。
針對聚合層級負荷預測的問題,已有許多工作提出了相對準確的預測方法[8-23]。文獻[10]提出在負荷預測之前,使用聚類識別具有類似負荷消費模式的消費者,進而提高系統層級日內負荷預測的精度。文獻[11]認為天氣是電力需求的主要驅動因素,氣象站的選擇對電力負荷的預測起重要作用。因此,提出一個氣象站選擇框架,以確定某個感興趣的地區(qū)使用哪個氣象站。實驗結果表明,這一框架可以提高負荷預測的精度。文獻[13]也認為溫度在驅動電力需求方面起著關鍵的作用;他們采用心理學術語“近因效應”來表示電力需求受前幾小時氣溫影響的事實,據此,建立負荷預測模型。文獻[14]等提出一種基于層次結構的預測方法,捕捉不同層次節(jié)點的負荷特性,利用父節(jié)點與其子節(jié)點之間的模式相似性,檢測異常,提高預測的精度。文獻[15]提出一種基于貢獻因子的方法來預測低壓變電站的日常峰值負荷;貢獻因子由聚類加權約束回歸確定,描述了不同消費者對變電站峰值的貢獻程度。文獻[17]提出一個共享相似模型結構但基于不同變量選擇過程的模型簇,在2014全球能源預測大賽上,這一模型簇的預測精度顯著高于基準方法。
針對個體層級負荷預測的問題,相關的工作數量有限,且預測的精度不高[6-8, 24-32]。文獻[6]等提出一種基于深度神經網絡的電力負荷預測方法,針對標準長短期記憶網絡LSTM存在的不足,設計基于LSTM的S2S結構,有效提升預測的精度。文獻[7]提出一種池化負荷曲線的深度學習方法,來預測個體層級的電力負荷。這一方法能夠緩解深度學習過度擬合的問題,進而獲得更高的預測精度。文獻[24]提出一種基于馬爾可夫鏈的人類行為實踐理論抽樣技術,能夠降低預測對歷史數據的需求。歷史數據不夠充分的情況下,這一方法能夠顯著提升預測精度。文獻[25]針對在低壓網絡中注入能量會導致高電壓限制的問題,提出一種短期功耗時間序列預測的方法。實驗結果表明,這一方法能夠提升短期預測的精度,幫助平衡低壓網絡的供需。文獻[32]提出一種基于情境信息和日程安排模式分析的個體短期負荷預測方法,分析日常電力時間序列,得到不同的日常行為模式類型,并收集各種來源的情景特征,以建立負荷預測模型。
針對個體層級負荷預測的問題,如圖2所示,本文提出的方法首先運用周期自動編碼器PAE,按周期將這一層級的電力時間序列嵌入向量空間。隨后將生成的嵌入(而非原始序列)輸入預測器,預測未來的電力負荷。事實上,可以選擇多種深度神經網絡模型作為預測器,本文以多層感知器MLP為例,具體介紹提出的負荷預測方法。
圖2 基于時間序列嵌入的電力負荷預測方法
給定N個個體的歷史電力時間序列:
X=(x1,x2,…,xN)′=(x1,x2,…,xT)∈RN×T
(1)
本文研究的問題是:給定上述歷史電力時間序列X,如何準確預測未來一段時間內,這N個個體的電力負荷:
Y=(y1,y2,…,yN)′=(y1,y2,…,yQ)∈RN×Q
(2)
事實上,這一問題的本質是:針對某個個體n,如何學習一個從xn到yn的非線性映射f:RT→RH,使得預測精度的評價指標(例如,均方根誤差RMSE、平均絕對百分比誤差MAPE等)盡可能地好;針對N個個體,如何學習N個這樣的映射,使得總體的預測精度的評價指標盡可能好。文獻[7]發(fā)現:如果上述非線性映射f:RT→RH用深度神經網絡實現;這N個個體共享同一個映射(即采用同一種預測模型且個體間共享模型參數) 能夠緩解深度學習過度擬合的問題,進而獲得更高的預測精度。因此,在本文提出的方法中,這N個個體也共享同一個映射。
個體層級負荷預測的難點在于這一層級的負荷具有高度的波動性和不確定性[7, 24-26]?,F有的工作[6-8, 24-32]不能克服這一難點,預測的精度不高。文獻[33]等針對個股股價高度的波動性和不確定性,先運用自動編碼器AE,去生成歷史股價時間序列的嵌入;再使用生成的嵌入(而非原始的歷史序列)去預測未來的股價。生成的嵌入不僅能提取歷史股價時間序列深度的特征,還能過濾其噪聲。因此,與直接使用原始的歷史序列做預測的方法相比,這一方法具有更高的預測精度。然而,由于股價時間序列沒有明顯的周期性,直接采用這一方法去預測個體層級的電力負荷,生成的嵌入捕捉負荷周期特性的能力有限,預測精度的提升不大。
針對現有方法存在的不足,根據電力負荷固有的周期特性,提出周期自動編碼器PAE,其結構如圖3所示。
圖3 周期自動編碼器
(3)
根據電力負荷固有的周期特性(設其周期為T0),PAE按周期(歷史窗口的長度T取kT0,k∈N+)將上述N個個體的歷史電力時間序列X嵌入向量空間RH。為了緩解過擬合,這N個個體共享同一個PAE網絡(即共享同一個映射);訓練模型的損失函數是均方根誤差RMSE:
(4)
(5)
(6)
實驗結果表明,PAE生成的嵌入不僅能捕捉電力負荷固有的周期特性,還能過濾其不確定性和波動性。因此,與傳統方法相比,本文提出的方法具有更高的預測精度。
(1) 實驗數據 實驗使用的數據集來自英國能源需求研究項目EDRP(Energy Demand Research Project)[34]。這一項目旨在幫助英國政府更好地了解國內家庭用戶的能源消費模式,并據此做出相應的能源政策調整。我們使用了其中152個家庭用戶110天的電力時間序列(從2009年5月9日至2009年8月24日;每半小時采集一次電力負荷,每日48個點,110天共計5 280個點)?;跁r間序列嵌入的電力負荷預測。
(2) 基于嵌入的負荷預測 為了表明使用嵌入(而非原始序列)去預測未來的電力負荷,能夠提升預測的精度,我們在EDRP數據集上進行了對比實驗:除了預測器的輸入不同外(分別為嵌入和原始序列),其他可能影響預測精度的因素均保持一致(例如,預測器均采用多層感知器MLP,目標函數均為RMSE,優(yōu)化算法均為Adam等)。實驗中,針對每個家庭用戶,首先使用其第1天的48個點去預測第2天的48個點;隨后使用其第1天和第2天的96個點去預測第3天的48個點,實驗的結果如表1所示。
表1 嵌入與非嵌入的預測精度對比
此外,圖4展示了在訓練預測器的過程中,隨著訓練輪數的增加,測試集均方根誤差RMSE的變化曲線;其橫軸為訓練的輪數,其縱軸為RMSE的值。從表1和圖4中可以看出,PAE生成的嵌入能過濾電力負荷高度的不確定性和波動性。因此,使用PAE生成的嵌入(而非原始序列)去預測未來的電力負荷,不僅能獲得更高的預測精度,還能使訓練過程更加穩(wěn)定且不易過擬合(預測模型不易學習到歷史序列中,隨機波動的噪聲的特征)。
(a) 48點預測48點
(b) 96點預測48點圖4 測試集的RMSE的變化曲線
(3) 基于周期特性的嵌入生成預測 為了表明周期自動編碼器PAE生成的嵌入能捕捉電力負荷固有的周期特性,進而能提高預測的精度,我們在EDRP數據集上進行了另一組對比實驗:PAE按周期將歷史電力時間序列嵌入向量空間,傳統的嵌入方法不按周期生成嵌入;其余影響因素均保持一致。類似地,針對每個家庭用戶,首先,PAE使用其第1天的48個點去預測第2天的48個點(傳統的嵌入方法使用前50個點去預測后48個點)。隨后,PAE使用該用戶第1天和第2天的96個點去預測第3天的48個點(傳統的嵌入方法使用前100個點去預測后48個點),實驗的結果如表2所示??梢钥闯鰝鹘y的嵌入方法沒有捕捉到對于電力負荷預測十分重要的周期特性,盡管增加了歷史用電的信息,預測的精度反而不高。與之相比,PAE生成的嵌入能捕捉電力負荷固有的周期特性,進而能獲得更高的精度。
表2 周期與非周期的預測精度對比
針對個體層級負荷預測的問題,本文總結了現有方法存在的不足,提出一種基于時間序列嵌入的電力負荷預測方法。根據電力負荷固有的周期特性(以日、周、年等為周期),設計周期自動編碼器PAE,按周期將電力時間序列嵌入向量空間。在嵌入空間中,可以采用多種深度神經網絡模型,來預測個體層級的電力負荷。實驗結果表明,PAE生成的嵌入能夠捕捉電力負荷固有的周期特性,過濾其不確定性和波動性。因此,相比于傳統方法,本文提出的預測方法具有更高的預測精度。