顏宏文,盛成功
(長(zhǎng)沙理工大學(xué) 計(jì)算機(jī)與通信工程學(xué)院,長(zhǎng)沙 410114)(*通信作者電子郵箱yan_hongwen@126.com)
母線負(fù)荷可以定義為由變電站的主變壓器供給一個(gè)相對(duì)較小的供電區(qū)域的終端負(fù)荷的總和[1],是系統(tǒng)負(fù)荷的細(xì)化。對(duì)母線負(fù)荷的精確預(yù)測(cè)是改善電網(wǎng)安全性、穩(wěn)定性和經(jīng)濟(jì)性,提高用電質(zhì)量的重要保證。母線負(fù)荷不同于系統(tǒng)負(fù)荷,它具有以下特點(diǎn):母線負(fù)荷易受氣象因素變化影響,如氣溫的突然升高和降低,將引起居民用電特別是空調(diào)負(fù)荷的劇烈變化,大面積降雨后會(huì)引起排漬負(fù)荷的突然增加[2];電網(wǎng)系統(tǒng)中母線數(shù)目眾多、量大面廣、負(fù)荷基數(shù)小,波動(dòng)性大,不同母線之間負(fù)荷差異較大,難以人工逐一深入分析。因此,對(duì)母線負(fù)荷進(jìn)行精準(zhǔn)的預(yù)測(cè)具有較高的難度。
國(guó)內(nèi)外眾多學(xué)者對(duì)母線負(fù)荷預(yù)測(cè)進(jìn)行了大量研究。文獻(xiàn)[3]采用的是模糊系統(tǒng)和人工神經(jīng)網(wǎng)絡(luò)的方法;文獻(xiàn)[4]提出了輔助預(yù)測(cè)狀態(tài)估計(jì)和多層感知器神經(jīng)網(wǎng)絡(luò)組成的混合預(yù)測(cè)方法;文獻(xiàn)[5]引入預(yù)測(cè)模型有效度概念,提出基于關(guān)聯(lián)度的組合模型集確定方法和模型有效度灰色預(yù)測(cè)方法;文獻(xiàn)[6]針對(duì)正常日的母線負(fù)荷,提出基于最小二乘支持向量機(jī)和馬爾可夫鏈的預(yù)測(cè)方法;文獻(xiàn)[7]提出小波分解的支持向量機(jī)預(yù)測(cè)母線負(fù)荷的方法;文獻(xiàn)[8]根據(jù)母線負(fù)荷源荷屬性進(jìn)行分類(lèi),將地區(qū)有源網(wǎng)的電源成分和負(fù)荷成分分開(kāi)考慮,改進(jìn)母線負(fù)荷的預(yù)測(cè)方法等。但以上方法籠統(tǒng)地用待測(cè)日之前一段時(shí)間作為相似日,沒(méi)有考慮到影響母線負(fù)荷波動(dòng)的因素而造成的特殊性,如季節(jié)、氣候、星期及節(jié)假日規(guī)律等多重因素對(duì)負(fù)荷變化的影響一直制約著預(yù)測(cè)精度的提高[9]。對(duì)于節(jié)假特殊日來(lái)說(shuō),例如,春節(jié)假期與春節(jié)假期之前雖然日期相鄰,但是負(fù)荷一般會(huì)相差非常大;同理,對(duì)于天氣特殊日來(lái)說(shuō),在季節(jié)交替之時(shí),天氣會(huì)出現(xiàn)驟變的情況,導(dǎo)致相鄰日期的負(fù)荷相差較大。如果使用這些特殊日之前的母線負(fù)荷作為訓(xùn)練樣本,特殊日的負(fù)荷預(yù)測(cè)會(huì)存在較大偏差。
本文提出一種基于層次聚類(lèi)(Hierarchical Clustering, HC)和極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)的母線短期負(fù)荷預(yù)測(cè)方法。該方法先用層次聚類(lèi)法對(duì)歷史負(fù)荷進(jìn)行聚類(lèi),結(jié)合歷史日的氣象信息和日期類(lèi)型建立決策樹(shù),得到分類(lèi)規(guī)則;然后將待測(cè)日屬性根據(jù)分類(lèi)規(guī)則查詢到該日的負(fù)荷分類(lèi)類(lèi)型,用該類(lèi)的歷史母線負(fù)荷數(shù)據(jù)訓(xùn)練極限學(xué)習(xí)機(jī)并對(duì)待測(cè)日母線負(fù)荷進(jìn)行預(yù)測(cè)。該方法充分考慮天氣因素和日期類(lèi)型對(duì)母線負(fù)荷的影響,不僅能提高對(duì)普通日的母線負(fù)荷預(yù)測(cè)精度,而且對(duì)特殊日期的負(fù)荷預(yù)測(cè)也有較好的效果。
為了克服前饋神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)速度較慢的缺點(diǎn),Huang等[10]提出一種名為ELM的新型單隱含層式前饋神經(jīng)網(wǎng)絡(luò)。ELM基于經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化理論,其訓(xùn)練過(guò)程只需要一次迭代,與其他神經(jīng)網(wǎng)絡(luò)相比具有更加優(yōu)越的泛化能力、魯棒性和更快的學(xué)習(xí)速率。目前ELM被廣泛用于分類(lèi)、預(yù)測(cè)和回歸問(wèn)題,因此本文也采用ELM預(yù)測(cè)母線負(fù)荷。ELM的核心是隨機(jī)設(shè)置輸入權(quán)值和偏差,通過(guò)最小化訓(xùn)練誤差來(lái)優(yōu)化輸出層的權(quán)值。
設(shè)有N個(gè)訓(xùn)練樣本{(ξi,τi)|ξi∈Rn,τi∈R,i=1,2,…,N},其中ξi=[ξi1,ξi2,…,ξin]為輸入向量,τi是對(duì)應(yīng)的期望輸出值。含有M個(gè)隱層節(jié)點(diǎn)和激活函數(shù)為f(x)的ELM數(shù)學(xué)模型可以表示為:
(1)
其中:ωi=[ωi1,ωi2,…,ωin]T表示連接第i個(gè)隱層節(jié)點(diǎn)和輸入節(jié)點(diǎn)權(quán)值;βi=[βi1,βi2,…,βin]T表示連接第i個(gè)隱層節(jié)點(diǎn)和輸出節(jié)點(diǎn)的權(quán)值;εi=[εi1,εi2,…,εiM]T表示第i個(gè)隱層節(jié)點(diǎn)的偏差。式(1)可以用矩陣的形式簡(jiǎn)寫(xiě):
Y=Tβ
(2)
其中:
T=
(3)
其中,T為隱層節(jié)點(diǎn)的輸出矩陣。輸出權(quán)值的求解是保證損失函數(shù)(4)取得最小值:
(4)
可由解以下方程組(5)的最小二乘解求得:
(5)
其中T+是矩陣T的Moore-Penrose廣義逆矩陣[11]。
(6)
先將歷史母線日負(fù)荷的96點(diǎn)數(shù)據(jù)作為一個(gè)原子簇,計(jì)算鄰近度矩陣,簇之間的鄰近度采用組平均規(guī)則計(jì)算,相繼合并兩個(gè)最接近的簇,直到只剩下一個(gè)簇[12],或者滿足某個(gè)最終條件。
如果聚類(lèi)數(shù)目太小,差異較大的樣本數(shù)據(jù)就會(huì)劃分到同一類(lèi)中,這樣得到歷史相似日的母線負(fù)荷特征相差較大,從而導(dǎo)致ELM預(yù)測(cè)模型預(yù)測(cè)不準(zhǔn)確;然而如果聚類(lèi)數(shù)目太大,個(gè)別類(lèi)中的樣本數(shù)據(jù)過(guò)少,本屬于同一個(gè)聚類(lèi)的樣本數(shù)據(jù)就會(huì)劃分到不同的聚類(lèi)中,也會(huì)增大ELM預(yù)測(cè)模型的預(yù)測(cè)誤差。因此,母線負(fù)荷預(yù)測(cè)的一個(gè)關(guān)鍵問(wèn)題就是選擇合適的聚類(lèi)數(shù)目,針對(duì)不同的母線負(fù)荷特征,選擇的聚類(lèi)數(shù)目也會(huì)有所差異。
本文研究了湖南省某兩類(lèi)220 kV母線日負(fù)荷數(shù)據(jù),為了預(yù)測(cè)的準(zhǔn)確性,經(jīng)作者實(shí)驗(yàn)選取的聚類(lèi)數(shù)目為20,不僅能保證類(lèi)中有足夠的數(shù)據(jù)樣本數(shù),而且能保證高相似度的數(shù)據(jù)樣本聚為一類(lèi)。
決策樹(shù)是功能強(qiáng)大的分類(lèi)和預(yù)測(cè)算法,它是一種有監(jiān)督的學(xué)習(xí)算法,以樹(shù)狀圖為基礎(chǔ),其輸出結(jié)果為一系列簡(jiǎn)單使用的規(guī)則[13]。決策樹(shù)生成算法中,經(jīng)典的ID3算法用信息增益選擇屬性,存在傾向于選擇取值多的屬性的不足[14],在此基礎(chǔ)上提出的改進(jìn)算法C4.5則采用信息增益比率作為在增長(zhǎng)樹(shù)的每一步中選取最佳屬性特征的度量標(biāo)準(zhǔn)[15]。在樹(shù)構(gòu)造過(guò)程中進(jìn)行剪枝,不僅能夠完成對(duì)連續(xù)屬性的離散化處理,而且能夠?qū)Σ煌暾麛?shù)據(jù)進(jìn)行處理,產(chǎn)生的分類(lèi)規(guī)則易于理解,準(zhǔn)確率更高,故本文采用的決策樹(shù)算法為C4.5算法。
母線日負(fù)荷以及其聚類(lèi)結(jié)果都由每日的天氣情況和日期類(lèi)型直接決定,因此,可以用決策樹(shù)將此關(guān)系以樹(shù)狀圖的方式呈現(xiàn)出來(lái),歷史母線負(fù)荷的聚類(lèi)結(jié)果和影響因素分別作為決策樹(shù)的結(jié)果節(jié)點(diǎn)和決策值。針對(duì)影響母線負(fù)荷的因素,本文選取每日24點(diǎn)實(shí)際天氣信息數(shù)據(jù)的日最高氣溫、日平均氣溫、日平均相對(duì)濕度作為衡量影響母線負(fù)荷的天氣因素;星期類(lèi)型分為星期一至星期日;節(jié)假日類(lèi)型分為國(guó)家法定節(jié)假日、節(jié)假日的后一日和普通日。
傳統(tǒng)的母線負(fù)荷預(yù)測(cè)模型更多使用待測(cè)日前一段時(shí)間的歷史負(fù)荷數(shù)據(jù)訓(xùn)練預(yù)測(cè)模型,但天氣、星期類(lèi)型和節(jié)假類(lèi)型的不同會(huì)導(dǎo)致前一段時(shí)間與待測(cè)日的特征相差很大,導(dǎo)致預(yù)測(cè)精度欠佳。為了充分考慮天氣因素和日期類(lèi)型對(duì)母線負(fù)荷的影響,提高對(duì)普通日的母線負(fù)荷預(yù)測(cè)精度,更好地預(yù)測(cè)特殊日期的母線負(fù)荷,本文采用層次聚類(lèi)法先對(duì)歷史母線負(fù)荷進(jìn)行聚類(lèi),結(jié)合歷史日的氣象信息和日期類(lèi)型建立決策樹(shù),得到分類(lèi)規(guī)則,將待測(cè)日屬性根據(jù)分類(lèi)規(guī)則查詢到該日的負(fù)荷分類(lèi)類(lèi)型,用該類(lèi)的歷史母線負(fù)荷數(shù)據(jù)訓(xùn)練極限學(xué)習(xí)機(jī)并對(duì)待測(cè)日母線負(fù)荷進(jìn)行預(yù)測(cè)。
基于HC和ELM的母線負(fù)荷短期預(yù)測(cè)模型輸入為220 kV母線96點(diǎn)的歷史負(fù)荷數(shù)據(jù)、歷史天氣數(shù)據(jù)和日期類(lèi)型以及待測(cè)日的天氣數(shù)據(jù)和日期類(lèi)型;輸出為預(yù)測(cè)日96點(diǎn)的負(fù)荷值。
基于HC和ELM的母線負(fù)荷短期預(yù)測(cè)算法步驟為:
1)輸入歷史母線日負(fù)荷96點(diǎn)數(shù)據(jù),采用層次聚類(lèi)法對(duì)其進(jìn)行聚類(lèi)。
2)選取以下日屬性作為決策樹(shù)的決策值:
①天氣因素:日最高氣溫、日平均氣溫和日平均相對(duì)濕度;
②日期類(lèi)型:星期類(lèi)型和節(jié)假日類(lèi)型。
3)數(shù)據(jù)數(shù)量化和歸一化。星期類(lèi)型數(shù)量化為D={1,2,3,4,5,6,7},其中1至7依次代表星期一至星期日。將節(jié)假日類(lèi)型數(shù)量化為H={0,1,2},其中0表示該日是國(guó)家法定假日,1表示該日為國(guó)家法定節(jié)假日之后的第一天,2表示其他日期。本文采用線性變換的方法進(jìn)行數(shù)據(jù)歸一化處理,公式如下:
yi=(xi-xmin)/(xmax-xmin)
(7)
其中:xi是樣本數(shù)據(jù)需要轉(zhuǎn)換的數(shù)值,yi是樣本數(shù)據(jù)轉(zhuǎn)換后的數(shù)值,xmax是該樣本數(shù)據(jù)中的最大值,xmin是該樣本數(shù)據(jù)的最小值。
4)歷史母線日負(fù)荷經(jīng)層次聚類(lèi)得到的分類(lèi)結(jié)果作為決策樹(shù)的結(jié)果節(jié)點(diǎn),并建立決策樹(shù)。
5)經(jīng)天氣預(yù)報(bào)得到待預(yù)測(cè)日的日最高氣溫、日平均氣溫和日平均濕度,另外查詢得到其星期類(lèi)型和節(jié)假日類(lèi)型的日屬性,根據(jù)建立的決策樹(shù)的內(nèi)部節(jié)點(diǎn)自頂向下得到分類(lèi)規(guī)則,在葉節(jié)點(diǎn)得到待預(yù)測(cè)日的分類(lèi)。
6)極限學(xué)習(xí)機(jī)參數(shù)設(shè)置。本文極限學(xué)習(xí)機(jī)的輸入層和輸出層節(jié)點(diǎn)數(shù)設(shè)置為1,隱層節(jié)點(diǎn)數(shù)為80。
7)在聚類(lèi)結(jié)果中得到該類(lèi)歷史母線負(fù)荷,用其訓(xùn)練極限學(xué)習(xí)機(jī),輸出最終預(yù)測(cè)值。
以上算法預(yù)測(cè)流程如圖1所示。
圖1 母線負(fù)荷預(yù)測(cè)流程
本文實(shí)驗(yàn)硬件環(huán)境為Intel Core i5 2.53 GHz的CPU,內(nèi)存為2 GB RAM,軟件環(huán)境為Windows 7操作系統(tǒng)、Matlab R2010a和Python 3.4開(kāi)發(fā)環(huán)境,所使用的程序語(yǔ)言為Matlab和Python。本文提出的基于HC和ELM的預(yù)測(cè)算法簡(jiǎn)記為HC-ELM。母線歷史負(fù)荷、日最高氣溫、日平均氣溫、日平均濕度、星期類(lèi)型以及節(jié)假日類(lèi)型使用預(yù)測(cè)日前一年內(nèi)的歷史數(shù)據(jù)。以平均絕對(duì)百分比誤差(Mean Absolute Percentage Error,MAPE)作為誤差評(píng)價(jià)標(biāo)準(zhǔn),其計(jì)算公式為:
(8)
實(shí)驗(yàn)對(duì)象采用湖南省某兩類(lèi)不同的220 kV母線的歷史數(shù)據(jù),兩條母線分別稱(chēng)之為母線1和母線2。對(duì)母線1的2016年2月7日進(jìn)行母線負(fù)荷預(yù)測(cè),該日為春節(jié)的第一天;對(duì)母線2的2015年12月24日進(jìn)行母線負(fù)荷預(yù)測(cè),該日為普通日。分別對(duì)以上兩個(gè)預(yù)測(cè)日前一年365日的歷史負(fù)荷數(shù)據(jù)進(jìn)行層次聚類(lèi),兩條母線的聚類(lèi)結(jié)果分別如表1、2所示。
由表1和表2可知,母線1、2均各自有365個(gè)樣本數(shù)據(jù),分別有94.5%和93.4%的樣本被分在樣本數(shù)大于10的類(lèi)別中,這樣就有足夠的樣本數(shù)據(jù)來(lái)訓(xùn)練預(yù)測(cè)模型。值得注意的是,層次聚類(lèi)能夠篩選出異常的母線負(fù)荷,有的類(lèi)別中樣本很少,比如表1、2中有許多類(lèi)只有1個(gè)樣本,這種異常的原因通常是數(shù)據(jù)采集存在錯(cuò)誤、極端的天氣影響、用戶檢修設(shè)備或者斷路器跳閘等,本文暫不考慮這些異常。
表1 母線1全年負(fù)荷數(shù)據(jù)聚類(lèi)結(jié)果
表2 母線2全年負(fù)荷數(shù)據(jù)聚類(lèi)結(jié)果
根據(jù)母線1和母線2全年負(fù)荷數(shù)據(jù)聚類(lèi)結(jié)果,結(jié)合歷史天氣和日期類(lèi)型數(shù)據(jù)建立決策樹(shù)如圖2、3所示。
圖2 母線1全年負(fù)荷分類(lèi)決策樹(shù)
圖3 母線2全年負(fù)荷分類(lèi)決策樹(shù)
圖2、3中,X[0]~X[4]依次代表日最高氣溫、日平均氣溫、日平均濕度、星期類(lèi)型以及節(jié)假日類(lèi)型。母線1中,預(yù)測(cè)日是2016年2月7日,星期日,春節(jié)的第一天,最高氣溫16.7度,平均氣溫8.4度,平均相對(duì)濕度45.4%,根據(jù)決策樹(shù)查詢分類(lèi)規(guī)則如圖2,該日為第18類(lèi),則該日母線負(fù)荷也屬于第18類(lèi)。母線2中,預(yù)測(cè)日是2015年12月24日,星期五,普通日,最高氣溫8.8度,平均氣溫7.3度,平均相對(duì)濕度83.7%,根據(jù)決策樹(shù)查詢分類(lèi)規(guī)則如圖3,該日為第17類(lèi),則該日母線負(fù)荷也屬于第17類(lèi)。選取母線1全年負(fù)荷數(shù)據(jù)聚類(lèi)結(jié)果中第18類(lèi)的樣本數(shù)據(jù)和母線2全年負(fù)荷數(shù)據(jù)聚類(lèi)結(jié)果中第17類(lèi)的樣本數(shù)據(jù)分別訓(xùn)練ELM預(yù)測(cè)模型并對(duì)兩個(gè)預(yù)測(cè)日的母線負(fù)荷進(jìn)行預(yù)測(cè);傳統(tǒng)ELM預(yù)測(cè)方法則分別選取兩個(gè)預(yù)測(cè)日前30天的負(fù)荷數(shù)據(jù)來(lái)訓(xùn)練ELM預(yù)測(cè)模型并對(duì)兩個(gè)預(yù)測(cè)日的母線負(fù)荷進(jìn)行預(yù)測(cè)。預(yù)測(cè)結(jié)果對(duì)比如圖4和圖5。
圖4 2月7日母線1負(fù)荷預(yù)測(cè)結(jié)果比較
從圖6和圖7中可知,HC-ELM的預(yù)測(cè)誤差小于ELM,經(jīng)計(jì)算可得:母線1中,HC-ELM的MAPE為2.89%,ELM的MAPE為4.33%;母線2中,HC-ELM的MAPE為4.21%,ELM的MAPE為5.73%??梢?jiàn)采用的新方法可以提高預(yù)測(cè)精度。
圖5 12月24日母線2負(fù)荷預(yù)測(cè)結(jié)果比較
圖6 2月7日母線1的MAPE值比較
圖7 12月24日母線2的MAPE值比較
為了進(jìn)一步驗(yàn)證HC-ELM的有效性,對(duì)于母線1,預(yù)測(cè)了從2016年2月8日至2月14日連續(xù)一周的母線負(fù)荷,其中2月8日至13日為春節(jié),14日為工作日,母線負(fù)荷預(yù)測(cè)結(jié)果比較如圖8;對(duì)于母線2,預(yù)測(cè)了從2015年25日至31日連續(xù)一周普通日的母線負(fù)荷,母線負(fù)荷預(yù)測(cè)結(jié)果比較如圖9。母線1、2的MAPE的計(jì)算結(jié)果如表3所示,可以看出,利用HC-ELM計(jì)算母線1和母線的MAPE的平均值比ELM分別降低了1.4個(gè)百分點(diǎn)和0.8個(gè)百分點(diǎn)。
為了提高對(duì)母線短期預(yù)測(cè)的效果,提出一種基于層次聚類(lèi)和極限學(xué)習(xí)機(jī)的母線短期負(fù)荷預(yù)測(cè)算法。本文使用層次聚類(lèi)法選取了與待測(cè)日相似度更高的訓(xùn)練樣本,彌補(bǔ)了傳統(tǒng)預(yù)測(cè)算法選取的相似日與待測(cè)日特征相似度欠佳的不足。根據(jù)實(shí)驗(yàn)分析可知,本文提出的HC-ELM與傳統(tǒng)算法相比,不僅提高了普通日母線負(fù)荷預(yù)測(cè)的效果,特別地,針對(duì)特殊日的母線負(fù)荷預(yù)測(cè)同樣具有更高的預(yù)測(cè)精度。下一步工作要考慮負(fù)荷類(lèi)型對(duì)母線負(fù)荷的影響,以及將該模型應(yīng)用到Hadoop或Spark等大數(shù)據(jù)平臺(tái)上。
圖8 2月8日—2月14日母線1負(fù)荷預(yù)測(cè)結(jié)果比較
圖9 12月25日—12月31日母線2負(fù)荷預(yù)測(cè)結(jié)果比較
%