向德軍,張維靜,馮歆堯,楊秋勇,蔡元紀
(1. 廣東電網(wǎng)有限責任公司,廣州 510000;2. 清華大學 電機系,北京 100084)
隨著新一輪電力體制改革的推進,電力市場化交易環(huán)境逐步形成,基于我國國情,計劃與市場的“雙軌制”運行方式成為當前電力市場運營的主要模式,可能導致市場電與計劃電存在實際執(zhí)行與合約計劃不匹配、產(chǎn)生不平衡資金、影響市場公平有序運行等問題。準確的負荷預測可有效減少兩者的偏差電量,在計劃合約電量分解及市場調(diào)度運行中通過準確的負荷邊界生成更貼近實際運行的調(diào)度生產(chǎn)計劃,從而減少不同交易成分、交易時段的不匹配性。同時,準確的負荷預測還有助于建立良好的市場秩序、穩(wěn)定市場電價,支撐市場主體準確預估市場收益、合理安排用電計劃、制定交易策略等。
為了提升短期負荷預測精度,國內(nèi)外專家和學者做了大量研究,基本預測方法分為兩類:一是分析負荷時序特性,通過趨勢外推進行預測,包括回歸模型預測法[1—2]、卡爾曼濾波法[3]、box-jenkins法[4]等時間序列預測法;二是利用負荷隨機性及趨勢性的特點建立非線性映射關(guān)系模型,例如混沌灰色理論預測法[5]、基于人工智能的神經(jīng)網(wǎng)絡[6]、隨機森林[7]、以及機器學習預測法[8]等。在這些方法的基礎上,有學者考慮負荷易受外界因素的影響,建立了單一預測模型,包括將氣象預測數(shù)據(jù)應用于負荷預測[9],基于產(chǎn)業(yè)結(jié)構(gòu)調(diào)整預測負荷趨勢[10],利用市場電價與負荷的關(guān)聯(lián)關(guān)系進行預測[11]等,通過特定場景下特定因素的影響預測負荷整體趨勢變化,預測準確度隨場景波動,不具廣適性。為了更全面地考慮不同因素對負荷的影響,有學者提出分層綜合預測模型,文獻[12]構(gòu)建了溫度、濕度、電價等9 個影響特征的雙層多核SVM學習,文獻[13—14]均設定了單一特征值預測后加和的綜合模型,先利用聚類或者經(jīng)驗將電力負荷數(shù)據(jù)分離處理,后針對各預測分量的不同特點單獨建模預測,最后組合重構(gòu)形成整體預測結(jié)果。相較于單一變量預測模型,綜合模型考慮因素更為全面,同樣面臨著更多復雜的問題,其中合理確定不同因素之間的交互影響,避免重復建模最為關(guān)鍵。
針對上述難題,本文提出基于影響因素相關(guān)度拆分特征值的方法,利用廣義加性模型(generalized additive model,GAM)內(nèi)化處理特征值之間相關(guān)性[15—17],建立綜合因素細分特征的半?yún)?shù)可加短期負荷預測模型,并利用最小二乘法對特征變量函數(shù)進行樣條擬合,最終得到短期負荷預測值。將該方法應用于廣東省2019年短期負荷預測,通過樣本數(shù)據(jù)的比較,該模型預測精度良好,預測性能穩(wěn)定。
在影響負荷波動的諸多變量中對短期負荷影響較大的因素可以總結(jié)為3類。一是氣象類因素,包括溫度、濕度、降雨等;二是日期類因素,包括工作日、周六日、節(jié)假日等;三是負荷自身波動特性。本文以廣東省2018年負荷及氣象資料為例,研究分析特征值。
濕度、降雨等氣象因素對負荷的影響通常通過溫度體現(xiàn),集中體現(xiàn)為夏季空調(diào)負荷、冬季供暖負荷等積溫效應[18]。為了避免考慮多種氣象因素導致氣候影響作用疊加,本文選取溫度作為關(guān)鍵特征值,并細分預測日前n日的逐日96 時刻溫度值的特征變量,分別構(gòu)建不同特征變量與實時負荷的相關(guān)模型,相關(guān)系數(shù)越大,表示該特征變量對負荷的影響越大。
相關(guān)系數(shù)采用皮爾遜函數(shù)計算,可以表示為
圖1展示了廣東省各地市2018年7月8日—22日實時溫度的平均值與系統(tǒng)負荷的關(guān)系。
圖1 2018年7月8日—22日負荷與溫度曲線關(guān)系Fig.1 Load and temperature curves from 8th July,2018 to 22th July,2018
由圖1 不難看出,兩者的波動周期與幅度均展示出較為一致的步調(diào),體現(xiàn)為實時溫度、最高溫度、最低溫度與負荷相關(guān)性較強。下一步,以全年為單位,逐日逐時測算實時溫度與負荷的相關(guān)系數(shù)。并考慮積溫效應,測算包括前n日溫度、前m時刻溫度、前一日最大溫度、最小溫度、前7 日平均溫度等指標與負荷的相關(guān)性。溫度特征值與負荷的相關(guān)性系數(shù)如表1所示。
表1 溫度特征值與負荷的相關(guān)性Table 1 Correlation between temperature eigenvalue and load%
受篇幅限制,表1 僅羅列了與負荷相關(guān)性超過60%的指標,篩選基于溫度的細分特征變量包括實時溫度、前1日最大溫度、前1日最小溫度、前7日實時溫度以及前6個時刻的溫度。
分析負荷曲線的波動趨勢可知,節(jié)假日前后系統(tǒng)用電負荷較平時有所降低,在節(jié)假日期間負荷到達最低值。該特性在春節(jié)期間最為明顯,春節(jié)前后的緩沖期也更長。為此,本文依據(jù)不同假期類型,首先將日期為一般節(jié)假日、春節(jié)、星期類型以及其在全年的位置分別分析,再依據(jù)影響范圍篩選關(guān)鍵特征值。
1.2.1 節(jié)假日
考慮普通節(jié)假日以3 天假期為主,前后都是工作日,緩沖期不會太長,為此選取節(jié)日、假日、節(jié)假日前1天、節(jié)假日后1天負荷、節(jié)假日前2天、節(jié)假日后2 天負荷,分別計算各指標與其上周同類型日負荷的變化。分析結(jié)果如表2所示。
表2 不同日負荷波動對比Table 2 Comparison of fluctuations on different daily loads%
由表2可見,節(jié)假日前后負荷開始降低,節(jié)日當天負荷通常最低,假日有所緩解。因此,本文標識節(jié)日、假日(包括調(diào)休放假時間、不包括春節(jié))、節(jié)日前1日及節(jié)日后1日作為細分節(jié)假日特征值。
1.2.2 春節(jié)
圖2為2018年春節(jié)前后負荷波動情況。由圖2可知,負荷從農(nóng)歷十二月二十開始下降,春節(jié)前后達到最低點,至正月十五回歸正常用電水平。假期效應延續(xù)了25 天左右,將該時段日歷劃分為春節(jié)前、春節(jié)、春節(jié)后3個時段,作為細分春節(jié)特征值。
圖2 2018年春節(jié)前后負荷波動Fig.2 Load fluctuation before and after the Spring Festival of 2018
1.2.3 星期類型
工作日用電負荷通常高于周末,國內(nèi)外學者建立了相關(guān)模型,將工作日與周末拆分后分別預測以提升預測精度[19],,此處不再贅述,設置星期類型特征值為星期一至星期日,分別建模。
1.2.4 日期位置
日期位置是協(xié)助鎖定相似日,加強相似日之間信息耦合以提升預測精度,該思路已被廣泛應用,此處不再對比計算,設置日負荷所在日期位置作為關(guān)鍵特征值單獨建模。
電力負荷的變化規(guī)律對負荷未來趨勢的預測具有重要影響,因此很多專家以趨勢外推和時間序列類方法對負荷進行預測[20]。本文結(jié)合兩類預測方法的數(shù)據(jù)訓練序列,將負荷特征值分為逐96 點負荷、預測日前m時刻負荷、預測日前n日96 點負荷、預測日前1 日最大負荷及最小負荷、前7 日平均負荷等,并測算上述特征值與預測負荷的相關(guān)系數(shù),選取相關(guān)度較高的指標作為細分特征值。
表3展示了相關(guān)系數(shù)較大的指標分析結(jié)果。根據(jù)分析,選取前1日最大負荷、前1日最小負荷、前7日平均負荷作為細分特征值。
表3 負荷特征值與負荷的相關(guān)性Table 3 Correlation between load eigenvalue and load%
在滯后時刻方面,選取相關(guān)系數(shù)相對較大的滯后時刻指標作為疊加滯后影響特征值,即預測前10個時刻的實時負荷;在滯后日期方面,對比預測前n日的負荷與預測日負荷的相關(guān)性,結(jié)合負荷的星期屬性,選取預測日前6日實時負荷,將兩者的累計值作為負荷細分特征值。
GAM模型是通過“加性”的假設,將一些與反應變量間存在復雜非線性關(guān)系的預測變量以不同函數(shù)加和的形式表達并擬合到模型中[21—23]。
GAM模型的數(shù)學表達式為
式中:g(μ) 為連接函數(shù),可依據(jù)驅(qū)動變量與預測變量之間的關(guān)系自定義函數(shù)形式;μ為期望;xi為不同驅(qū)動變量;n為驅(qū)動變量個數(shù);f(xi)為針對驅(qū)動變量xi的單變量函數(shù);ε為截距。
在此基礎上,考慮多種復雜影響因素的短期負荷預測模型,原理如圖3 所示。首先利用歷史數(shù)據(jù)做相關(guān)性分析,篩選細分特征值;其次結(jié)合負荷波動特性確定基本連接函數(shù),并初步確定特征變量影響函數(shù)以及模型參數(shù);第三利用最小二乘法進行模型評估,將所有變量函數(shù)做擬合殘差,迭代直至殘差不再收斂,得到最優(yōu)解。預測流程如圖3所示。
圖3 預測流程Fig.3 Forecasting process
考慮負荷與影響因子之間的關(guān)系具有泊松分布特性,設置對數(shù)函數(shù)作為預測模型的連接函數(shù),整體預測模型可表示為
式中:xd,t為d日t時刻的預測負荷,t=1,2,...,96;Td,t(w)為溫度w對d日t時刻負荷的影響;Hd,t( )D為節(jié)假日D對d日t時刻負荷的影響;Ld,t( )xd-,t-為負荷特征值對d日t時刻預測負荷的影響;xd-,t-為d日t時刻之前的負荷值。
溫度與負荷為非線性關(guān)系,利用3 次樣條函數(shù)估計,溫度對負荷的影響可以表示為
式中:ad,t、bd,t、cd,t、ed,t、fd,t分別為不同溫度w對d日t時刻負荷的影響函數(shù);n為實時溫度w影響滯后天數(shù),最大滯后天數(shù)N=7;wd-n,t為d-n日t時刻溫度;m為實時溫度w影響滯后時刻,最大滯后時刻M=10;wd,t-m為d日t-m時刻溫度;-1,t為d-1日t時刻溫度w的最大值;-1,t為d-1日t時刻溫度w的最小值;wˉd-7,t為d-7 日t時刻溫度w的平均值。
節(jié)假日對負荷的影響可以表示為
式中:fd,t(Dp)為以年為周期,負荷所在日的日歷位置Dp對d日t時刻負荷的影響函數(shù);gd,t(Dw)為星期類型Dw,包括星期一至星期日每日特性對d日t時刻負荷的影響函數(shù);hd,t(Dh)為節(jié)假日Dh對d日t時刻負荷的影響函數(shù),依據(jù)1.2節(jié)分析分別對節(jié)日、假日、節(jié)日前1天、節(jié)日后1天分別標識并擬合其對負荷的影響;id,t(Ds)為春節(jié)Ds對d日t時刻負荷的影響函數(shù)。所有函數(shù)使用三次樣條估計,其中g(shù)d,t(Dw)的樣條依據(jù)每周7天選取結(jié)點數(shù)為7。
負荷特征值的預測模型可表示為
式中:jd,t、kd,t、pd,t、qd,t、rd,t分別為不同負荷特征值x對d日t時刻負荷的影響函數(shù);n為預測模型中考慮的滯后天數(shù),最大滯后天數(shù)N=7;xd-n,t為d-n日t時刻負荷;m為預測模型中考慮的滯后時刻的最大數(shù)量,最后滯后時刻M=10;xd,t-m為d日t-m時刻負荷;-1,t為d-1 日t時刻負荷的最大值;-1,t為d-1 日t時刻負荷的最小值;xˉd-7,t為d-7 日t時刻負荷的平均值。
本文以目前調(diào)度運行需要的數(shù)據(jù)顆粒,采集廣東電網(wǎng)2016 年1 月至2019 年8 月逐日96 點負荷及溫度,將數(shù)據(jù)切分為訓練集(2016 年1 月至2018 年12 月逐日96 點信息)和驗證集(2019 年1 月至8 月逐日96點信息),通過對驗證集逐日96點負荷分別預測,并選取平均絕對百分誤差(mean absolute percent error,MAPE)考量其準確率,表達式如下
式中:Preal、Ppredict分別為負荷實際值和預測值;N為數(shù)據(jù)集長度。
為進一步對比該模型的優(yōu)劣,選取人工神經(jīng)網(wǎng)絡模型(artificial neural network,ANN)以及不考慮精細化特征變量的綜合預測模型分別針對溫度、節(jié)假日、負荷特征值建模,生成各月平均MAPE 誤差見表4。其中,ANN 模型采用包括輸入層、隱含層和輸出層的BP神經(jīng)網(wǎng)絡,輸入層各輸入單元分別為本文第1節(jié)選出的細分特征變量,隱含層和輸出層采用sigmoid激活函數(shù),經(jīng)過網(wǎng)絡學習訓練調(diào)整權(quán)重和預測計算后,輸出2019年1月至8月逐日96點負荷預測值。綜合對比看出,基于特征值細分的GAM 模型MAPE誤差為0.017 9,優(yōu)于其他兩種方法。
表4 不同預測模型的MAPE值對比Table 4 Comparison of MAPE values for different predictive models
此外,區(qū)別于神經(jīng)網(wǎng)絡“黑匣子”預測體系,GAM模型可進一步量化分析不同特征變量對負荷的影響,以協(xié)助用戶調(diào)整、完善特征變量,提升預測精度。
節(jié)假日對負荷的影響選用estimate估計法,estimate 越接近于0,表征該特征變量對預測負荷的影響越大。節(jié)假日特征變量對負荷的estimate 估計如表5所示,春節(jié)與星期特性是影響負荷波動的關(guān)鍵。
表5 節(jié)假日特征變量對負荷的estimate估計Table 5 Estimate of characteristic variable to load during holidays
圖4以典型日某一時刻為例展示了星期類型、實時溫度與預測負荷的三維關(guān)系。同一溫度下,星期一、星期二的負荷更高,星期三呈現(xiàn)拐點用電需求開始下降;同一星期類型下,實時負荷隨著溫度升高而升高。
負荷預測作為關(guān)乎發(fā)、用電平衡的基礎,對支撐電力市場穩(wěn)定運行、保障市場主體經(jīng)濟利益有著重要的意義。本文針對綜合預測模型難以厘清變量間交互影響的問題,提出在常規(guī)特征值基礎上進一步細分特征變量,并基于GAM模型內(nèi)化處理不同因素的交互作用,形成考慮特征值細分的廣義加性短期負荷預測模型。通過實際算例表明,相較綜合預測模型及神經(jīng)網(wǎng)絡模型,該方法預測精度更優(yōu),且可直觀展示各細分特征值對負荷的影響,為進一步支撐特征值篩選和預測模型調(diào)優(yōu)提供了有效依據(jù)。隨著電力市場深化,模型中可增加考慮電動汽車、市場電價等特征變量,進一步完善預測理論和模型,為提升負荷預測精度提供支撐。D