李 翔,顧 潔
(1.上海市電力公司 浦東供電公司,上海 200122;2.上海交通大學(xué) 電氣工程系,上海 200240)
電力系統(tǒng)負(fù)荷曲線的變化過程是一個非平穩(wěn)的隨機(jī)過程。以不同的時間維度分析,負(fù)荷曲線的變化呈現(xiàn)1天、1周、1月以至1年的變化周期。
日負(fù)荷曲線是表示負(fù)荷需求在1晝夜內(nèi)隨時間變化的特性曲線。日負(fù)荷曲線預(yù)測是根據(jù)電力負(fù)荷、經(jīng)濟(jì)、社會、氣象等歷史數(shù)據(jù),分析電力負(fù)荷歷史數(shù)據(jù)變化規(guī)律,對未來負(fù)荷的影響尋求電力負(fù)荷與各種相關(guān)因素之間的內(nèi)在聯(lián)系,從而對未來某1天的日負(fù)荷曲線進(jìn)行科學(xué)的預(yù)測。隨著電力系統(tǒng)對數(shù)據(jù)挖掘的不斷深入和信息采集功能的不斷提升,大量、豐富的歷史負(fù)荷數(shù)據(jù)為科學(xué)決策提供了依據(jù)[1-3]。
建立日負(fù)荷曲線預(yù)測的聚類模型時,主要考慮歷史數(shù)據(jù)的預(yù)處理、初始聚類中心的設(shè)置、最優(yōu)聚類數(shù)目的確定等問題。
日負(fù)荷曲線的變化具有一定的周期性。例如:同一季節(jié)內(nèi)的日負(fù)荷曲線與當(dāng)日的星期類型有較強(qiáng)的關(guān)聯(lián),不同年份的季節(jié)典型日負(fù)荷曲線具有很高的相似性。因此,考慮對日負(fù)荷曲線的歷史樣本進(jìn)行聚類,進(jìn)而對所形成的各類樣本進(jìn)行變化特征挖掘,所得的結(jié)果能夠比對日負(fù)荷曲線進(jìn)行獨(dú)立分析,更好地反映出本質(zhì)變化規(guī)律。所以,日負(fù)荷曲線預(yù)測的聚類模型,必須建立在充分的歷史數(shù)據(jù)樣本基礎(chǔ)上。
目前,大多數(shù)電力系統(tǒng)都能夠提供包括若干年內(nèi)每一天整點時刻的日類型、負(fù)荷以及溫度、降水量、濕度等氣象因素的歷史數(shù)據(jù)積累,可以據(jù)此進(jìn)行建模分析。其中日類型可以分為工作日和非工作日,作為預(yù)測模型的自變量,進(jìn)行建模時前者用1表示,后者用0表示。而負(fù)荷和氣象因素的絕對數(shù)據(jù)的數(shù)量級從100~103不等,計量單位也不統(tǒng)一,因此必須對數(shù)據(jù)的樣本先進(jìn)行歸一化處理。
氣象因素的歸一化表達(dá)式為:
假設(shè)歷史數(shù)據(jù)中負(fù)荷最大值為Pmax,第h時刻的負(fù)荷為Ph(h=1,2,…,t),以Pmax采用式(2)對負(fù)荷曲線進(jìn)行歸一化處理:
式中:Xh為歸一化后的負(fù)荷曲線第h時刻的值。
K均值聚類算法是一種常用的動態(tài)聚類算法,其實現(xiàn)過程是首先選擇聚類中心,對樣本作初始分類,再根據(jù)聚類準(zhǔn)則,判斷聚類是否合理,不合理就修改聚類,直至合理為止。相對于經(jīng)典的無監(jiān)督聚類算法而言,K均值聚類算法具有簡化計算、加快收斂速度等特點,本文采用此算法對歷史數(shù)據(jù)進(jìn)行分析。
采用誤差平方和函數(shù)作為聚類準(zhǔn)則[4,5]:
式中:wi為類Ri的聚類中心;j為樣本編號;xj為待聚類日的相關(guān)因素構(gòu)成的向量;N為樣本數(shù);c為最初指定的聚類中心個數(shù);dji為第j個樣本是否屬于第i類。
將dji定義為:
K均值算法可得到使誤差平方和準(zhǔn)則取得極小值時的聚類結(jié)果。
K均值聚類算法是一種基于劃分的聚類算法,目的是通過在完備數(shù)據(jù)空間的不完全搜索,使得目標(biāo)函數(shù)取得最大值(或最小值)。由于局部極值點的存在以及啟發(fā)算法的貪心性,該算法對初始聚類中心敏感,從不同的初始聚類中心出發(fā),得到的聚類結(jié)果不一定相同,并不一定保證得到全局最優(yōu)解。因此,怎樣找到一組合適初始中心點,從而獲得一個較好的聚類效果并消除聚類結(jié)果的波動性,對K均值聚類算法具有重要意義。
本文采用文獻(xiàn)[6]介紹的解決方法:
① 算出樣本總體的算術(shù)均值;
②找出所有樣本到算術(shù)均值的最大距離max_d和最小距離 min_d;
③ 將(max_d-min_d)平均分成c等份,這樣將形成c個區(qū)間,c為聚類數(shù)目;
④ 每個樣本到均值的距離,將唯一地落在某個區(qū)間內(nèi),并據(jù)此把樣本分成c類;
⑤ 每一類的算術(shù)均值作為初始聚類中心。
經(jīng)驗證,采用上述方法,可以使初始聚類中心的分布盡可能地體現(xiàn)數(shù)據(jù)的實際分布,獲得較好的聚類效果。
設(shè)置不同的聚類數(shù)目得到的聚類結(jié)果會有所差異,為了得出最優(yōu)的聚類數(shù)目,需要對不同聚類數(shù)目的聚類結(jié)果進(jìn)行評價,評價的內(nèi)容主要是聚類的密集性和鄰近性。
聚類密集性是一種有關(guān)聚類內(nèi)方差的測量,方差越小說明數(shù)據(jù)集的同一性越高。給定一個數(shù)據(jù)集X,其簇內(nèi)方差被定義為:
對聚類輸出結(jié)果c1,c2,…,cc,聚類密集性被定義為:
式中:C為聚類個數(shù);var(ci)為簇ci的方差。
每個聚類內(nèi)的成員應(yīng)盡可能地接近,所以聚類密集性越小越好。但是在極端情況下,當(dāng)每個輸入矢量被分為單獨(dú)的類時,聚類密集性有最小值0。
聚類鄰近性被定義為:
式中:σ為高斯常數(shù),簡化計算時取2σ2=1;xci為聚類ci的中心;d(xci,xcj)為聚類ci中心與cj中心之間的距離。
各聚類應(yīng)有效地分開,且聚類鄰近性反比于聚類間距離,所以聚類鄰近性越小越好。然而,當(dāng)整個輸入矢量被聚為一個類時,聚類鄰近性有最小值0。
為了評價一個聚類系統(tǒng)的綜合質(zhì)量,可將上述聚類密集性與聚類鄰近性組合為一種評價方法,稱作聚類綜合質(zhì)量。它被定義為:
式中:ξ∈[0,1]為平衡聚類密集性與聚類鄰近性的權(quán)值。例如,Ocq(0.5)表示兩種評價有相等的權(quán)值。
顯然,聚類綜合質(zhì)量越大越好。對于不同的給定聚類數(shù)目,分別算出每種聚類結(jié)果的聚類綜合質(zhì)量,該指標(biāo)最大的聚類結(jié)果所對應(yīng)的聚類數(shù)目即為最優(yōu)聚類數(shù)目。
對歷史數(shù)據(jù)的聚類完成后,需要利用聚類的結(jié)果以及待預(yù)測日的相關(guān)參數(shù)預(yù)測出該日的日負(fù)荷曲線。待預(yù)測日的日類型是已知條件,其溫度、降水量、濕度等氣象因素可以通過氣象部門獲得,因此可計算待預(yù)測日的特征向量與各個類的相關(guān)程度,找出相關(guān)程度最大的類,待預(yù)測日的日負(fù)荷曲線即取為該類內(nèi)每一天的日負(fù)荷曲線的平均值。
評價待預(yù)測日特征向量與各個類的相關(guān)程度可以用灰色關(guān)聯(lián)度分析法。
設(shè)參考數(shù)列為X0,被比較數(shù)列為Xi,而且
則關(guān)聯(lián)系數(shù)定義為:
式中:ΔXk=|X0(k)-Xi(k)|為第k個點X0與Xi的絕對誤差為2級最小差為2級最大差;ρ為分辨率,0<ρ<1,一般取0.5。
綜合各點的關(guān)聯(lián)系數(shù)可得出整個Xi與參考曲線X0的等權(quán)關(guān)聯(lián)度為:
日負(fù)荷曲線預(yù)測的聚類模型解算流程如圖1所示。
圖1 日負(fù)荷曲線預(yù)測的聚類模型算法流程圖
以上海電網(wǎng)為研究對象,利用該電網(wǎng)2005年至2008年日負(fù)荷曲線及氣象參數(shù)等歷史數(shù)據(jù),分別預(yù)測了2009年春夏秋冬4個季節(jié)的典型日負(fù)荷曲線,其中典型日的選取是按照當(dāng)?shù)仉娋W(wǎng)長期以來的慣例,即春季、夏季、秋季和冬季的典型日分別選取每年的4月15日、夏季最高負(fù)荷日、10月15日和冬季最高負(fù)荷日,上述典型日如遇上節(jié)假日或周末則相應(yīng)順延。由于篇幅所限,僅給出2009年春季、夏季、秋季和冬季典型日負(fù)荷曲線的聚類模型預(yù)測結(jié)果。
圖2 春季典型日負(fù)荷曲線
圖3 夏季典型日負(fù)荷曲線
圖4 秋季典型日負(fù)荷曲線
圖5 冬季典型日負(fù)荷曲線
預(yù)測結(jié)果表明:
1)大部分點的誤差在3%的允許范圍內(nèi)2009年春季、夏季、秋季和冬季典型日負(fù)荷曲線表明,誤差超過3%的點和待預(yù)測日相鄰幾天的對應(yīng)點相比,差別基本上小于3%,說明這些點的誤差主要是由突變因素造成的。
2)春季和秋季的預(yù)測誤差明顯小于夏季和冬季 這是因為上海地區(qū)春季和秋季的負(fù)荷特征主要為基本負(fù)荷,與氣溫、降水、濕度等氣象因素關(guān)系不大,年間變化較小。而夏季有大量的降溫空調(diào)負(fù)荷,冬季有大量的供暖空調(diào)負(fù)荷,它們均和氣象因素特別是溫度有很大關(guān)系,容易因氣象因素的突變而發(fā)生劇烈變化。
日負(fù)荷趨勢預(yù)測是一項重要工作,也是電力系統(tǒng)安排日調(diào)度計劃,決定開停機(jī)計劃、經(jīng)濟(jì)分配負(fù)荷及安排旋轉(zhuǎn)備用容量的基礎(chǔ),還可為研究電力系統(tǒng)的峰值、抽水蓄能電站的容量以及發(fā)輸電設(shè)備的協(xié)調(diào)運(yùn)行提供基礎(chǔ)數(shù)據(jù)。而日負(fù)荷曲線預(yù)測的精確度和可信度,直接影響著電力系統(tǒng)運(yùn)行的經(jīng)濟(jì)效益。
利用數(shù)據(jù)挖掘理論建立了日負(fù)荷曲線預(yù)測的聚類模型,以上海電網(wǎng)為研究對象,用該模型成功預(yù)測了2009年上海地區(qū)各季度典型日的日負(fù)荷趨勢曲線,并對結(jié)果進(jìn)行了分析。
從結(jié)果分析可以看出,模型較為全面地考慮了對日負(fù)荷曲線有顯著影響的因素,包括日類型及氣溫、降水量、濕度等氣象因素,較為準(zhǔn)確地得出日負(fù)荷曲線預(yù)測結(jié)果,對于電力系統(tǒng)的運(yùn)行及規(guī)劃具有重要的參考價值。
[1]康重慶,夏清,劉梅.電力系統(tǒng)負(fù)荷預(yù)測[M].北京:中國電力出版社,2008.
[2]Park DC,Sahrawi M A,Marks R J,et a1.Electric Load Forecasting Using Artificial Neural network.IEEE Trans on Power Systems,1991,6(2):442-449.
[3]牛東曉,曹樹華,趙磊,張文文[M].北京:中國電力出版社,1988.
[4]程其云.基于數(shù)據(jù)挖掘的電力短期負(fù)荷預(yù)測模型及方法的研究[M].北京.重慶大學(xué),2004.
[5]姜飛,龍子泉,林峰.模糊神經(jīng)網(wǎng)絡(luò)在電力短期負(fù)荷預(yù)測中的應(yīng)用[J].控制理論與應(yīng)用,2003,22(8):23-26.
[6]艾學(xué)勇.地區(qū)電網(wǎng)典型日負(fù)荷曲線預(yù)測方法研究[學(xué)位論文].上海,上海交通大學(xué),2009.