徐久益,李自明,姚劍峰,楊曉雷,屠一艷,李 杰
(1.國(guó)網(wǎng)浙江桐鄉(xiāng)市供電有限公司,浙江 桐鄉(xiāng) 314500;2.國(guó)網(wǎng)嘉興供電公司,浙江 嘉興 314000)
電力系統(tǒng)規(guī)劃設(shè)計(jì)和運(yùn)行管理依賴(lài)用電量數(shù)據(jù)。同時(shí),用電量又是經(jīng)濟(jì)變化的“風(fēng)向標(biāo)”。因此,月度用電量的準(zhǔn)確預(yù)測(cè)既是實(shí)現(xiàn)電網(wǎng)安全、經(jīng)濟(jì)運(yùn)行的基礎(chǔ),也對(duì)把握宏觀經(jīng)濟(jì)發(fā)展趨勢(shì)起到至關(guān)重要的作用[1-2]。
月度用電量預(yù)測(cè)是電力需求側(cè)管理重要的市場(chǎng)預(yù)測(cè)技術(shù)手段,精確的用電量預(yù)測(cè)對(duì)于平衡區(qū)域電力電量、精準(zhǔn)的電網(wǎng)投資、電力現(xiàn)貨市場(chǎng)交易、有效實(shí)施電力需求側(cè)管理和節(jié)能降耗戰(zhàn)略等[2]都有著十分重要的意義。
傳統(tǒng)的電量預(yù)測(cè)方法如回歸分析法、時(shí)間序列預(yù)測(cè)法、灰色預(yù)測(cè)、神經(jīng)網(wǎng)絡(luò)等預(yù)測(cè)方法[3-6],其預(yù)測(cè)精度已經(jīng)不能滿(mǎn)足當(dāng)前電網(wǎng)發(fā)展需求。目前,電量預(yù)測(cè)技術(shù)和理論不斷涌現(xiàn),一些學(xué)者對(duì)月度用電量的預(yù)測(cè)方法進(jìn)行研究,在傳統(tǒng)預(yù)測(cè)方法上面不斷改進(jìn),也取得新的成果。文獻(xiàn)[7]在傳統(tǒng)時(shí)間序列預(yù)測(cè)模型基礎(chǔ)上,提出了考慮經(jīng)濟(jì)因素時(shí)滯效應(yīng)的月度電量預(yù)測(cè)方法。文獻(xiàn)[8]從影響月度用電量的因素出發(fā),利用計(jì)量經(jīng)濟(jì)學(xué)中的協(xié)整檢驗(yàn)以及格蘭杰因果檢驗(yàn)來(lái)分析經(jīng)濟(jì)因素與用電量的關(guān)系,提出一種基于協(xié)整-格蘭杰因果檢驗(yàn)和季節(jié)分解的月電量預(yù)測(cè)方法。近年來(lái),中國(guó)的經(jīng)濟(jì)發(fā)展進(jìn)入轉(zhuǎn)型期,各地區(qū)月度用電量的變化也呈現(xiàn)差異性和多樣性,因此,這些預(yù)測(cè)方法的運(yùn)用也存在一定的局限性?;诖?,通過(guò)對(duì)區(qū)域歷史數(shù)據(jù)的研究分析,挖掘其發(fā)展的規(guī)律和特點(diǎn),并結(jié)合兩種算法優(yōu)勢(shì)建立電量預(yù)測(cè)模型,創(chuàng)新性地提出了一種計(jì)及經(jīng)濟(jì)因素的混合模型電量預(yù)測(cè)新方法,為地區(qū)月度用電量預(yù)測(cè)提供了一種新選擇。
電量預(yù)測(cè)的核心是根據(jù)區(qū)域用電量的歷史數(shù)據(jù)以及對(duì)用電量產(chǎn)生影響的經(jīng)濟(jì)、氣候等因素的歷史數(shù)據(jù),建立數(shù)學(xué)模型來(lái)表述用電量發(fā)展變化規(guī)律。因此,在建立數(shù)學(xué)模型之前,首先需要對(duì)歷史數(shù)據(jù)進(jìn)行分析和處理,研究和挖掘出歷史數(shù)據(jù)發(fā)展的內(nèi)在規(guī)律性[9]。
所用數(shù)據(jù)來(lái)源于中國(guó)中西部某區(qū)域電網(wǎng)公司,如表1和表2所示。
通過(guò)分析半年度電量與半年度經(jīng)濟(jì)總量的關(guān)系可以發(fā)現(xiàn),電量以及相關(guān)4類(lèi)經(jīng)濟(jì)數(shù)據(jù)具有較強(qiáng)的時(shí)序特征,但2015年和2016年上半年的電量與經(jīng)濟(jì)總量的增長(zhǎng)率存在明顯的不一致性,其余年份對(duì)應(yīng)的電量與經(jīng)濟(jì)總量增長(zhǎng)率基本保持一致。
針對(duì)以上非一致性問(wèn)題,將對(duì)原始數(shù)據(jù)進(jìn)行預(yù)處理,主要是數(shù)據(jù)清洗,即對(duì)原始數(shù)據(jù)中的明顯錯(cuò)誤值、缺失值、異常值、可疑數(shù)據(jù),選擇合適的方法進(jìn)行“清理”,使“臟”數(shù)據(jù)變?yōu)椤案蓛簟睌?shù)據(jù),也包括對(duì)重復(fù)記錄進(jìn)行刪除。這里通過(guò)比較多種方法進(jìn)行數(shù)據(jù)預(yù)處理,鑒于篇幅,僅介紹最終選擇的箱形圖檢測(cè)方法,箱形圖原理如圖1所示,即對(duì)于一組數(shù)據(jù),計(jì)算中位數(shù)、上下四分位數(shù)和上下限,若數(shù)值超過(guò)上下限則為異常值。下、中、上四分位數(shù)的位置計(jì)算方法為
f(Qi)=i(n+1)/4
(1)
圖1 箱形圖檢測(cè)法的基本原理
式中,n=12,表示數(shù)據(jù)個(gè)數(shù)。經(jīng)電量數(shù)據(jù)檢測(cè)發(fā)現(xiàn),存在異常的月份有2014年7月,2015年2月、8月,2016年2月、8月和12月,共6個(gè)月份。
檢測(cè)出異常值后,需要通過(guò)分箱法對(duì)異常值進(jìn)行平滑處理,具體實(shí)現(xiàn)方法:若存在縱向兩個(gè)數(shù)據(jù)則取縱向兩個(gè)數(shù)據(jù)的均值a,再取橫向兩個(gè)數(shù)據(jù)的均值b,再取a、b的均值作為異常點(diǎn)的替代值。最終將上述存在異常的6個(gè)月用電量數(shù)據(jù)依次替換為 5082、5021、5821、5518、6194、5822 GWh。
表1 中西部某區(qū)域電網(wǎng)公司近年各月電量情況 單位:GWh
表2 中西部某區(qū)域相關(guān)經(jīng)濟(jì)數(shù)據(jù)
建立合適的電量預(yù)測(cè)模型,是電量預(yù)測(cè)核心,針對(duì)本項(xiàng)目原始數(shù)據(jù)分析,2014—2018年電量曲線波動(dòng)不大、趨勢(shì)平穩(wěn),且原始樣本數(shù)據(jù)量小。而現(xiàn)代預(yù)測(cè)方法如神經(jīng)網(wǎng)絡(luò)、時(shí)間序列[10]等需要大量數(shù)據(jù)進(jìn)行訓(xùn)練才能得到比較準(zhǔn)確的模型,對(duì)于本項(xiàng)目數(shù)據(jù)量較小的情況下,預(yù)測(cè)效果不好。
研究采用傳統(tǒng)的回歸分析法和指數(shù)平滑法[11]相結(jié)合來(lái)建立電量值的預(yù)測(cè)模型,優(yōu)點(diǎn)是這兩種預(yù)測(cè)方法比較成熟,模型參數(shù)設(shè)置較少,幾乎不需要人為調(diào)參,且在數(shù)據(jù)量較小的情況下仍能得到比較準(zhǔn)確的結(jié)果。本項(xiàng)目所提模型和算法的整體流程如圖2所示。
圖2 月用電量預(yù)測(cè)模型流程
1)區(qū)域用電量曲線具有一定的周期性、時(shí)序性,一般以年為單位,每年電量曲線變化趨勢(shì)相同。選取同樣次數(shù)的多項(xiàng)式分別擬合2014—2017年的用電量曲線,多項(xiàng)式的系數(shù)采用最小二乘法[12]原則確定,即誤差平方和最小,得到用電量與時(shí)間的關(guān)系式。多項(xiàng)式次數(shù)的選擇采用自動(dòng)尋優(yōu),選擇效果最好的值。自動(dòng)尋優(yōu)找出最優(yōu)擬合次數(shù)9次。
2)指數(shù)平滑法是一種數(shù)據(jù)預(yù)測(cè)方法,利用預(yù)測(cè)數(shù)據(jù)的變化在短期內(nèi)保持歷史數(shù)據(jù)的慣性特征,當(dāng)前的數(shù)據(jù)與歷史數(shù)據(jù)有關(guān),且離現(xiàn)在時(shí)刻越近,對(duì)當(dāng)前數(shù)據(jù)影響越大。本模型采用線性指數(shù)平滑模型:
Ft+m=at+btm
(2)
式中:
(3)
將步驟1中得到的2014—2017年的多項(xiàng)式函數(shù)的系數(shù)運(yùn)用指數(shù)平滑法外推,得到2018年用電量與月份的關(guān)系:
f(x)=0.000 081 38x9-0.004 741 82x8+
0.116 814 56x7-1.584 389 12x6+
12.920 345 13x5- 65.031 307 13x4+
199.920 938 01x3-358.480 374 09x2+
337.644 679 21x-62.318 446 43
(4)
然后便可計(jì)算出2018年1—12月電量預(yù)測(cè)值,這是一個(gè)初始預(yù)測(cè)值,后續(xù)需要做修正。
3)采用多元線性回歸法[13],將用電量與其影響因素(即4類(lèi)經(jīng)濟(jì)因素)進(jìn)行擬合。用多元線性表達(dá)式來(lái)擬合半年電量和與這些經(jīng)濟(jì)數(shù)據(jù)的關(guān)系,表達(dá)式為
h(x1,x2,x3,x4)=ax1+bx2+cx3+dx4
(5)
式中:h(x1,x2,x3,x4)為半年電量和;x1、x2、x3、x4分別為規(guī)模以上工業(yè)增加值、固定資產(chǎn)投資、社會(huì)消費(fèi)品零售總額和出口總值。2018年上下半年的經(jīng)濟(jì)數(shù)據(jù)與用電總量關(guān)系擬合表達(dá)式為
f(x)= 0.043 239 8x1+ 0.014 314 24x2+
0.072 597 81x3-0.326 030 59x4-46.704 427 381
(6)
4)作為一個(gè)多輸入系統(tǒng)而言,考慮越多輸入量對(duì)系統(tǒng)的輸出預(yù)測(cè)越準(zhǔn)確,但是為了簡(jiǎn)化電量預(yù)測(cè)模型,需要找到影響程度較大的因素,這就需要進(jìn)行相關(guān)性分析。
相關(guān)性分析是指對(duì)兩個(gè)或多個(gè)具備相關(guān)性的變量元素進(jìn)行分析,從而衡量?jī)蓚€(gè)變量因素的相關(guān)密切程度。相關(guān)性的元素之間需要存在一定的聯(lián)系或者概率才可以進(jìn)行相關(guān)性分析[14]。分析不同元素的相關(guān)性需要計(jì)算它們之間的相關(guān)系數(shù),其定義為
(7)
式中:r為樣本相關(guān)系數(shù);n為樣本總數(shù);x、y為樣本觀測(cè)值,在本項(xiàng)目中x為電量,y為經(jīng)濟(jì)性因素。
需要計(jì)算各經(jīng)濟(jì)指標(biāo)因素與電網(wǎng)電量的相關(guān)系數(shù),找出對(duì)電網(wǎng)電量的影響大且影響較為穩(wěn)定的因素,相關(guān)性結(jié)果如表3所示。
表3 4類(lèi)經(jīng)濟(jì)因素與電量的相關(guān)性
從表3可以看出,4類(lèi)經(jīng)濟(jì)數(shù)據(jù)與電網(wǎng)電量的相關(guān)度均較高,相關(guān)系數(shù)均大于0.95,其中社會(huì)消費(fèi)品零售總額相關(guān)度最高,因此,將4類(lèi)經(jīng)濟(jì)數(shù)據(jù)作為電量預(yù)測(cè)建模研究的關(guān)鍵因素。
5)用半年電量和修正初始預(yù)測(cè)值,如果經(jīng)濟(jì)數(shù)據(jù)得到的2018年上半年電量和與步驟2中得到的初始預(yù)測(cè)數(shù)據(jù)的2018年上半年電量和相比,更接近實(shí)際數(shù)據(jù),那么經(jīng)濟(jì)數(shù)據(jù)得到的2018年下半年電量和也會(huì)更接近,故用經(jīng)濟(jì)數(shù)據(jù)得到的電量和對(duì)步驟2得到的初始預(yù)測(cè)數(shù)據(jù)做修正。如果經(jīng)濟(jì)數(shù)據(jù)得到的2018年上半年電量和更不接近于實(shí)際數(shù)據(jù),則不對(duì)初始電量預(yù)測(cè)數(shù)據(jù)進(jìn)行修正。
修正的具體方法為整體倍數(shù)法:
β=(S1+S2)/2
(8)
式中:S1為經(jīng)濟(jì)數(shù)據(jù)得到的2018年下半年電量和;S2為步驟2中得到的2018年下半年電量和,對(duì)于2018年8—12月的初始預(yù)測(cè)數(shù)據(jù)都乘以β,得到本模型最終的預(yù)測(cè)結(jié)果。
為了驗(yàn)證所提方法的實(shí)際運(yùn)用效果,對(duì)給定的中國(guó)中西部某區(qū)域電網(wǎng)公司2018年1—7月的月用電量進(jìn)行了預(yù)測(cè),與目前使用最廣泛的BPNN預(yù)測(cè)、灰色預(yù)測(cè)進(jìn)行比對(duì),并計(jì)算平均絕對(duì)百分誤差(mean absolute percentage error,MAPE)。三者預(yù)測(cè)結(jié)果見(jiàn)表4。
表4 不同預(yù)測(cè)方法預(yù)測(cè)結(jié)果對(duì)比
由表4可以看出,所提方法預(yù)測(cè)平均絕對(duì)百分誤差最小,為0.83%,由此可見(jiàn),所提方法預(yù)測(cè)精度得到了有效提高,且具有更高的穩(wěn)定性。
所建模型對(duì)未知的2018年8—12月的電量進(jìn)行預(yù)測(cè),并用經(jīng)濟(jì)數(shù)據(jù)對(duì)預(yù)測(cè)結(jié)果進(jìn)行修正,結(jié)果如表5所示。
表5 2018年8—12月的電量預(yù)測(cè)結(jié)果修正 單位:GWh
3.2.1 力助電力部門(mén)輔助決策
在已知浙江嘉興地區(qū)月用電量數(shù)據(jù)與4類(lèi)經(jīng)濟(jì)數(shù)據(jù)的前提下,將所建模型運(yùn)用于與中西部區(qū)域電量波動(dòng)、氣候條件以及經(jīng)濟(jì)結(jié)構(gòu)完全不同的嘉興地區(qū),對(duì)預(yù)測(cè)精度及通用性進(jìn)行驗(yàn)證。表6為浙江嘉興地區(qū)2018年8—12月份月用電量預(yù)測(cè)值。
表6 嘉興2018年8—12月月用電量預(yù)測(cè)值 單位:GWh
經(jīng)計(jì)算,所建模型預(yù)測(cè)的MAPE為2.31%,證明其具有較高的預(yù)測(cè)精度且通用性強(qiáng),可適用于不同地區(qū)的電量預(yù)測(cè)。
通過(guò)月用電量預(yù)測(cè),進(jìn)一步勾勒出嘉興地區(qū)電量預(yù)測(cè)曲線,如圖3所示,可更加精準(zhǔn)地對(duì)地區(qū)用電量特性進(jìn)行分析,為電網(wǎng)公司或電力部門(mén)提供輔助決策[15],包括:為發(fā)展策劃部門(mén)提供規(guī)劃、決策、投資的依據(jù);為財(cái)務(wù)部門(mén)提供電力現(xiàn)貨交易市場(chǎng)的清晰判斷;為營(yíng)銷(xiāo)部門(mén)提供增供擴(kuò)銷(xiāo)形勢(shì)的判斷。
圖3 嘉興地區(qū)月用電量預(yù)測(cè)曲線
3.2.2 提升主動(dòng)服務(wù)能力
所建模型運(yùn)用于某水泥廠大用戶(hù)月用電量預(yù)測(cè),可以了解用戶(hù)電力消耗發(fā)展趨勢(shì),預(yù)測(cè)曲線如圖4所示。
圖4 大用戶(hù)月用電量預(yù)測(cè)曲線
通過(guò)大用戶(hù)電量預(yù)測(cè)曲線分析,供電公司可以為企業(yè)客戶(hù)提升主動(dòng)服務(wù)能力[16],包括提前感知客戶(hù)的容量變化需求、有的放矢地為客戶(hù)提供增容等業(yè)務(wù)支持、輔助企業(yè)確定節(jié)能方法、為用戶(hù)提供有競(jìng)爭(zhēng)力的差異化服務(wù)等用途。
將回歸分析法和指數(shù)平滑法這兩種預(yù)測(cè)方法相結(jié)合,建立電量預(yù)測(cè)模型,模型中所有參數(shù)都采用算法自動(dòng)尋優(yōu),減少了人工干預(yù)帶來(lái)的誤差。通過(guò)對(duì)中西部區(qū)域?qū)嶋H歷史數(shù)據(jù)精細(xì)和深入的挖掘,先用歷史電量數(shù)據(jù)初步預(yù)測(cè)未來(lái)幾個(gè)月電量,再用與電量相關(guān)性很高的經(jīng)濟(jì)因素修正電量初步預(yù)測(cè)值,新方法實(shí)際預(yù)測(cè)精度得到了有效提高。
算例分析的結(jié)果表明,預(yù)測(cè)MAPE為0.83%,而模型在客觀條件完全不同的嘉興地區(qū)進(jìn)行預(yù)測(cè),MAPE也僅為2.31%,證明模型具有通用性。所提預(yù)測(cè)方法為地區(qū)電量預(yù)測(cè)工作提供了一種可供選擇的新思路,同時(shí),也為供電公司加強(qiáng)電力需求預(yù)測(cè)和供電負(fù)荷管理等工作提供了有益的方法支撐和必要的決策手段。