繆智偉,方 睿
(汕頭大學(xué)數(shù)學(xué)系,廣東 汕頭 515063)
較高電力系統(tǒng)負(fù)荷最大值的預(yù)測準(zhǔn)確率有助于幫助電力部門進(jìn)行電力調(diào)度與電力的規(guī)劃[1-4].當(dāng)電力負(fù)荷最大值預(yù)測偏高時(shí),會(huì)導(dǎo)致調(diào)度過多的電力資源,出現(xiàn)電力不合理分配的情況,造成電力資源的浪費(fèi);當(dāng)電力負(fù)荷最大值預(yù)測偏低時(shí),電網(wǎng)公司不能提供充足的電力資源,嚴(yán)重的話,甚至可能會(huì)出現(xiàn)地區(qū)大面積停電的現(xiàn)象.因此,電力規(guī)劃及調(diào)度部門應(yīng)具備精確預(yù)測電力負(fù)荷最大值的技術(shù),從而制定調(diào)度智能化、分配合理化、節(jié)省電力資源、可持續(xù)發(fā)展的科學(xué)決策和方案.
傳統(tǒng)電負(fù)荷最大值預(yù)測模型是根據(jù)數(shù)學(xué)方程組的方式建立電負(fù)荷預(yù)測模型,其模型訓(xùn)練的速度快,但是缺乏一定模型泛化能力和自主遷移能力[5-8].面對(duì)96 個(gè)時(shí)點(diǎn)電負(fù)荷數(shù)據(jù)時(shí)序性和非線性的特性,難以建立一個(gè)預(yù)測精度高、訓(xùn)練速度快的電負(fù)荷預(yù)測數(shù)學(xué)模型[9-12].為解決該問題,張永偉提出了基于KPCA-SVM 模型的電力負(fù)荷最大值短期預(yù)測方法[13],該方法提高了預(yù)測電力負(fù)荷最大值的精度,但預(yù)測速度還需改進(jìn).此外,趙志強(qiáng)提出了一種基于小波分解和ID3 算法的短期日負(fù)荷最大值預(yù)測方法[14],該方法收斂速度慢,模型訓(xùn)練時(shí)間較長,收斂速度慢等缺陷會(huì)降低或者影響電負(fù)荷預(yù)測模型的精確度.人工神經(jīng)網(wǎng)絡(luò)(ANN)在許多預(yù)測問題上運(yùn)用最為廣泛[7],Beccali[15]構(gòu)建了一種無監(jiān)督與有監(jiān)督相結(jié)合的神經(jīng)網(wǎng)絡(luò)模型,成功預(yù)測了某地區(qū)電力需求.Bashir[16]在電負(fù)荷預(yù)測模型訓(xùn)練參數(shù)的階段,引入鳥群算法來求解最優(yōu)參數(shù),大大優(yōu)化了負(fù)荷預(yù)測的泛化能力和預(yù)測能力.
與神經(jīng)網(wǎng)絡(luò)算法采用經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則不同,支持向量機(jī)(SVM)采用的是結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,彌補(bǔ)了神經(jīng)網(wǎng)絡(luò)的缺陷,依據(jù)最小二乘支持向量機(jī)(LS-SVMR)能夠很好地處理非線性、高維數(shù)以及容易陷入局部極小值等問題. 首先基于支持向量機(jī)(SVM)的理論研究基礎(chǔ),利用模型訓(xùn)練誤差的平方代替松弛變量,取消了不等式約束,用等式約束來替代,從而提出最小二乘支持向量(LS-SVMR)的電力系統(tǒng)最大值負(fù)荷預(yù)測模型,避免求解一個(gè)二次規(guī)劃問題,加快模型的預(yù)測速度,提高模型的預(yù)測精度.
此外,氣象是影響極值電負(fù)荷的主要因素,考慮人體對(duì)于溫度的適應(yīng)具有一定的生理慣性,多日連續(xù)高溫時(shí),即使溫度變化不大,負(fù)荷也會(huì)增長,這就是溫度對(duì)電力最大值負(fù)荷的累積效應(yīng).通過對(duì)預(yù)測日前幾日的最高溫度進(jìn)行加權(quán)后,對(duì)待預(yù)測日的最高溫度進(jìn)行修正,從而體現(xiàn)出多日連續(xù)高溫的留存影響.這就是最大溫度對(duì)最大電力負(fù)荷值的累積效應(yīng).本文提出了氣溫累積效應(yīng)的日最高氣溫修正模型,并利用實(shí)例驗(yàn)證了最高氣溫累積效應(yīng)對(duì)最大電力負(fù)荷的影響,并且驗(yàn)證了修正后的最高溫度可以提高模型的預(yù)測精度.
要提升現(xiàn)在最大值電力負(fù)荷預(yù)測模型的泛化能力以及精確度,就必須要探究影響電力負(fù)荷最大值的因素,對(duì)電力負(fù)荷最大值影響因素主要包含以下方面.
氣候?qū)ω?fù)荷最大值的影響是顯而易見的.影響電負(fù)荷的氣象因素主要是溫度、天氣等.在冬季,當(dāng)氣溫降低到一定程度,人們?nèi)∨秒姷男枨蟛粩嘣黾?,?dǎo)致負(fù)荷的用電量有所提高.在夏季,隨著使用空調(diào)的頻率不斷增加,用電負(fù)荷的壓力也會(huì)增加.
日期類型是影響負(fù)荷的另一個(gè)重要特征. 目前中國城市工業(yè)具有較大的用電需求,工業(yè)的用電量占比比較大,非工作日(法定節(jié)假日、周末)的電力負(fù)荷量與工作日(周一到周五)用電量有明顯的差異,非工作日的用電會(huì)比較少. 本文將日期類型列入影響負(fù)荷預(yù)測結(jié)果的因素之一. 為了避免多重共線性,周一至周六轉(zhuǎn)換為6 個(gè)0,1 的啞變量,將節(jié)假日類型分為三類,分別為:大長假、小長假、短假,并依次用數(shù)值1,2,3量化.
由于電負(fù)荷受到季節(jié)、天氣的影響比較大,所以電負(fù)荷具有明顯的周期性.通過分析不同日最大電負(fù)荷的自相關(guān)性和偏自相關(guān)性,可以明顯的發(fā)現(xiàn)預(yù)測日的電負(fù)荷與延遲一階和延遲七階的最大電負(fù)荷具有較高的相關(guān)性.
本文將原始最大負(fù)荷數(shù)據(jù)、氣象數(shù)據(jù)、工作日和節(jié)假日因素構(gòu)建成中期負(fù)荷預(yù)測特征工程,如表1 所示.
表1 電負(fù)荷預(yù)測模型特征工程
式中:w 為高維空間中的權(quán)重系數(shù)向量;b∈R 為常數(shù).
將回歸問題轉(zhuǎn)換為最小二乘支持向量機(jī)數(shù)學(xué)模型,如下:
式中:ei為回歸函數(shù)值與實(shí)際值的誤差,γ>0 為懲罰系數(shù);用拉格朗日法求解這個(gè)目標(biāo)規(guī)劃問題,將帶有約束目標(biāo)問題轉(zhuǎn)化為無約束目標(biāo)問題,在對(duì)偶高維空間中得到如下數(shù)學(xué)表達(dá)式:
對(duì)式(4)消去w 和ei可得到如下線性方程:
從訓(xùn)練最小二乘支持向量機(jī)過程中存在的問題,發(fā)現(xiàn)參數(shù)γ 與和核函數(shù)σ 可以通過二次判別分析算法在模型訓(xùn)練參數(shù)的階段直接調(diào)用.
為了準(zhǔn)確的衡量模型的精確度,參考國家電網(wǎng)有限公司評(píng)價(jià)電負(fù)荷最大值預(yù)測精度的指標(biāo),采用平均絕對(duì)誤差百分比(MAPE)和決定系數(shù)R2作為模型預(yù)測效果的評(píng)價(jià)指標(biāo):
式中:yi表示第i 個(gè)日的實(shí)際最大負(fù)荷值;表示第i 個(gè)月所采用預(yù)測算法下的最大負(fù)荷值.MAPE 值越小表示預(yù)測值越準(zhǔn)確,所采用的模型效果越好.
式中:yi表示第i 個(gè)月實(shí)際大負(fù)荷值;表示第i 個(gè)月所采用預(yù)測算法下的最大負(fù)荷值;表示測試樣本實(shí)際最大負(fù)荷值的平均值.R2反映實(shí)際值與預(yù)測值關(guān)聯(lián)程度,其值越接近1 表明擬合的優(yōu)度越好.
在負(fù)荷日最大值預(yù)測中,最高溫度和日最大電負(fù)荷的線性相關(guān)性可以通過溫度累積效應(yīng)的修正進(jìn)一步提高.下面介紹如何對(duì)日最高溫度值進(jìn)行合理地修正.
溫度累積效應(yīng)的主要思想是:考慮人體對(duì)于溫度的適應(yīng)能力存在一定的生理慣性,多日連續(xù)高溫時(shí),即使溫度變化不大,最大負(fù)荷也會(huì)持續(xù)地增長.通過對(duì)預(yù)測日前幾日的最高溫度進(jìn)行加權(quán)后,對(duì)待預(yù)測日的最高溫度進(jìn)行修正,從而體現(xiàn)出多日連續(xù)高溫的留存影響.
式中,T′i為考慮電負(fù)荷的溫度累積效應(yīng)后,經(jīng)過模型修正后的日最高溫度值,Ti-j為第i 日前j 天的日最高溫度實(shí)際值,d 為考慮最大的溫度累積效應(yīng)的天數(shù),kj為Ti-j對(duì)應(yīng)的權(quán)重.
有研究表明,當(dāng)d 大于等于3,即高溫持續(xù)天數(shù)達(dá)3 天及以上時(shí),累積效應(yīng)的強(qiáng)度對(duì)天數(shù)不再敏感.所以要考慮溫度累積效應(yīng)進(jìn)行日最大溫度修正,需要求解d 和權(quán)重kj,具體的求解方法如下:
(1)劃分溫度區(qū)間
因?yàn)槿兆罡邷囟群蛯?duì)應(yīng)的日最大負(fù)荷不是線性關(guān)系,故根據(jù)日最高溫度劃分為不同的區(qū)間,分段進(jìn)行線性擬合.根據(jù)統(tǒng)計(jì),選取Tlow=25 ℃,Thigh=37 ℃.
表2 溫度劃分區(qū)間
(2)計(jì)算步驟
算法的核心是對(duì)于每一個(gè)不同的d,將樣本集劃分入按溫度劃分好的n 個(gè)區(qū)間中,形成n 個(gè)方程組.每個(gè)方程組中有數(shù)量不定的等式,方程組一般為超定多元線性方程組.最終對(duì)方程組采用最小二乘法進(jìn)行求解得到權(quán)值kj.計(jì)算流程如圖1 所示.
圖1 溫度累積效應(yīng)計(jì)算流程圖
經(jīng)過算法修正后,日最高溫度與區(qū)域日最大負(fù)荷的皮爾遜相關(guān)性系數(shù)從78.43%提高到了81.29%.
為驗(yàn)證本文所提方法的科學(xué)性和可靠性,本文實(shí)驗(yàn)使用基于廣東省某地區(qū)2018—2022 年每日最大電力負(fù)荷數(shù)據(jù)作為數(shù)據(jù)集,電負(fù)荷單位是kW,構(gòu)建模型結(jié)構(gòu)如表1 所示.最后將實(shí)驗(yàn)結(jié)果與傳統(tǒng)BP、RBF 神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測方法的預(yù)測結(jié)果進(jìn)行對(duì)比分析可知,本文所提模型取得了較好的預(yù)測準(zhǔn)確率.
1)缺失值處理
時(shí)點(diǎn)負(fù)荷數(shù)據(jù)的缺失主要是由于采集器發(fā)生故障或進(jìn)行檢修時(shí)設(shè)備暫停導(dǎo)致的數(shù)據(jù)缺失.面對(duì)缺失的負(fù)荷數(shù)據(jù)我們將根據(jù)歷史近似日的時(shí)點(diǎn)負(fù)荷數(shù)據(jù)采用KNN 最近鄰插補(bǔ),這基于一個(gè)假設(shè),即排除其他外在因素干擾的情況下,地區(qū)負(fù)荷的用電規(guī)律應(yīng)該是一致的.通過找出K 近鄰樣本,并根據(jù)距離確定權(quán)重,求取平均值對(duì)缺失值進(jìn)行插補(bǔ).
2)負(fù)荷數(shù)據(jù)標(biāo)準(zhǔn)化
鑒于神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中需要保證節(jié)點(diǎn)的輸出值在激活函數(shù)的適合范圍內(nèi),而電力負(fù)荷數(shù)據(jù)波動(dòng)性較大,需要對(duì)歷史負(fù)荷數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理.因此,我們在模型預(yù)測輸入的數(shù)據(jù)時(shí)會(huì)對(duì)進(jìn)行均值方差標(biāo)準(zhǔn)化.
其中,均值方差標(biāo)準(zhǔn)化是一種將數(shù)據(jù)轉(zhuǎn)化為標(biāo)準(zhǔn)正態(tài)分布的標(biāo)準(zhǔn)化方法.在回歸模型中,服從正態(tài)分布的自變量和因變量往往對(duì)應(yīng)著較好的回歸預(yù)測效果.均值方差標(biāo)準(zhǔn)化的計(jì)算公式為:
公式中,x 表示單個(gè)數(shù)據(jù)的取值,μ 表示對(duì)應(yīng)列的均值,σ 表示對(duì)應(yīng)列的標(biāo)準(zhǔn)差.
3)天氣狀況數(shù)值化
對(duì)天氣狀況進(jìn)行切分,可以得到每日最好天氣狀況和最壞天氣狀況,例如“晴/小雨”分割后最好為“晴”,最壞為“小雨”.原本只有一個(gè)天氣狀況的則最好最壞天氣相同.對(duì)分割后的所有天氣統(tǒng)計(jì)得到17 個(gè)天氣狀況,進(jìn)行分組數(shù)值化編碼,具體如表3.
表3 分割后的天氣狀況和對(duì)應(yīng)數(shù)值編碼
我們對(duì)分級(jí)后的天氣進(jìn)行打分,天氣越好評(píng)分越高,這是因?yàn)橄募咎鞖庀鄬?duì)較好,且夏季負(fù)荷用量多一些.這樣盡量減小組內(nèi)的差距,而組與組之間則有明顯的差異的做法,可以使數(shù)量較多,次序較為模糊的天氣狀況數(shù)據(jù)變?yōu)橛行?、層次分明的?shù)據(jù).而且每組能體現(xiàn)不同程度的天氣狀況特征.
4)節(jié)假日特征數(shù)值化
考慮不同節(jié)假日對(duì)負(fù)荷的影響,將節(jié)假日類型分為3 類,分別為:大長假、小長假、短假,并依次用數(shù)值1,2,3 量化.不同法定節(jié)假日的歸類以及量化結(jié)果如表4 所示.
表4 節(jié)假日分類與量化
5)訓(xùn)練集和測試集劃分
選用2018 年9 月1 日到2021 年5 月30 日的數(shù)據(jù)作為訓(xùn)練集,選用2021 年5 月31 號(hào)到2021 年8 月31 號(hào)共三個(gè)月的數(shù)據(jù)作為測試集.
應(yīng)用考慮溫度累積效應(yīng)基于改進(jìn)的LS-SVMR 負(fù)荷預(yù)測模型進(jìn)行預(yù)測分析.經(jīng)過樣本數(shù)據(jù)訓(xùn)練得到該地區(qū)3 個(gè)月最大電負(fù)荷實(shí)際值與預(yù)測值的對(duì)比,如圖2 所示.從圖2中可以看出,改進(jìn)LS-SVMR 模型預(yù)測值與實(shí)際值較為接近.
圖2 改進(jìn)LS-SVMR 電負(fù)荷模型預(yù)測結(jié)果
為進(jìn)一步說明本文構(gòu)建模型的有效性,分別采用4 種方法對(duì)該地區(qū)進(jìn)行電力負(fù)荷最大值進(jìn)行預(yù)測,分別是有無考慮溫度累積效應(yīng)的LS-SVMR 模型和BP、RBF 預(yù)測模型,預(yù)測結(jié)果如表5、圖3 所示.
圖3 電負(fù)荷預(yù)測結(jié)果對(duì)比
表5 電負(fù)荷預(yù)測模型比較結(jié)果
首先對(duì)比有無考慮溫度累積效應(yīng)基于改進(jìn)的LS-SVMR 預(yù)測模型測試結(jié)果可以看出,考慮溫度累積效應(yīng)基于改進(jìn)的LS-SVMR 預(yù)測模型的預(yù)測誤差更小,結(jié)果更加精確,表明對(duì)最高溫度進(jìn)行修正,不僅可以提高溫度與最大電負(fù)荷的相關(guān)系數(shù),還可以提高模型的預(yù)測效果.
其次與BP、RBF 神經(jīng)網(wǎng)絡(luò)負(fù)荷預(yù)測結(jié)果對(duì)比,本文基于改進(jìn)的LS-SVMR 預(yù)測模型預(yù)測方法的平均絕對(duì)誤差百分比(MAPE)只有4.73%,且決定系數(shù)值最高,相比于其他2 種電負(fù)荷預(yù)測模型,本文構(gòu)建的預(yù)測模型的精度更高,擬合精度更優(yōu),其結(jié)果證明該預(yù)測方法可以滿足時(shí)序性、非線性的電負(fù)荷預(yù)測的預(yù)測要求,體現(xiàn)了本文所提出的負(fù)荷預(yù)測方法的優(yōu)越性、合理性.
本文發(fā)現(xiàn)最大氣溫對(duì)最大負(fù)荷的影響具有累積效應(yīng),本文首先從分析最大電負(fù)荷與最高氣溫的關(guān)系入手,建立了氣溫累積效應(yīng)的日最高氣溫修正模型,并利用實(shí)例驗(yàn)證了最高氣溫累積效應(yīng)對(duì)最大電力負(fù)荷的影響,在此基礎(chǔ)上,提出一種基于最小二乘支持向量(LS-SVMR)網(wǎng)絡(luò),并采用遺傳算法求解最優(yōu)參數(shù),對(duì)廣東電力系統(tǒng)的歷史最大負(fù)荷進(jìn)行預(yù)測,預(yù)測結(jié)果表明與傳統(tǒng)負(fù)荷預(yù)測方法BP、RBF 神經(jīng)網(wǎng)絡(luò)相比,體現(xiàn)了本文所提出的負(fù)荷預(yù)測方法的優(yōu)越性、合理性.