申偉偉 劉牮
摘要:負荷預(yù)測是電力系統(tǒng)分析與運行的基礎(chǔ),對機組組合、經(jīng)濟調(diào)度、安全校核等均具有重要意義。隨著電網(wǎng)規(guī)模不斷增大,數(shù)據(jù)庫時間跨度也隨之變大,對不良數(shù)據(jù)及冗余數(shù)據(jù)的處理造成影響,負荷預(yù)測精度和速度的提高難度顯著增大。針對這一問題,提出基于懶惰學習與聚類算法的組合模型。該模型以懶惰學習(Lazy Learning, LL)算法為基礎(chǔ),通過選擇相似樣本對負荷進行差異性預(yù)測建模。在預(yù)測應(yīng)用中,為縮小樣本庫數(shù)量,減小 LL算法的預(yù)測時間,利用模糊C均值聚類(Fuzzy C-means,F(xiàn)CM)對用電特征進行聚類從而生成局部訓練集,以改進LL算法局部建模。實驗結(jié)果表明, FCM- LL組合算法不僅能高效精確地預(yù)測負荷,而且能實現(xiàn)數(shù)據(jù)庫的實時更新。
關(guān)鍵詞:負荷預(yù)測;模糊C均值聚類;懶惰學習
DOIDOI:10.11907/rjdk.173319
中圖分類號:TP319
文獻標識碼:A 文章編號:1672-7800(2018)008-0165-04
英文摘要Abstract:Load forecasting,which is of great significance to unit set,economic dispatch and safety check,is the basis of power system analysis and operation.With the growing size of the power grid,the time span of the database becomes wider.Due to the limitation of bad data and redundant data,the difficulty in improving the accuracy and speed of load forecasting increases significantly.In order to solve the problem,a combined model based on lazy learning and clustering algorithm is proposed in this paper.This model uses lazy learning (LL) algorithm as the basis to select the similar samples to model the load forecasting.In order to reduce the number of sample banks and the prediction time of LL algorithm,fuzzy C-means (FCM) is used to cluster electricity features to generate local training sets to improve LL algorithm Local modeling.The experimental results show that the FCM-LL combination algorithm proposed in this paper can not only predict the load efficiently and accurately,but also realize the real-time update of the database.
英文關(guān)鍵詞Key Words:electricity demand forecasting; fuzzy C-means clustering; lazy learning
0 引言
短期負荷預(yù)測在電力系統(tǒng)運行中起著關(guān)鍵作用,對區(qū)域經(jīng)濟調(diào)度具有重要意義,負荷預(yù)測精度決定了電力系統(tǒng)優(yōu)化的科學性。
上世紀80年代我國經(jīng)濟高速發(fā)展,導致電力需求飛速上升,負荷預(yù)測開始成為電力公司必須實施的一項工作。隨著科學技術(shù)的迅猛發(fā)展,新的預(yù)測方法源源不斷出現(xiàn)[1],新方法可分成兩大類:①基于數(shù)學統(tǒng)計類的經(jīng)典預(yù)測方法,比如回歸分析法、時間序列法等;②基于計算機算法的新型預(yù)測方法,如人工神經(jīng)網(wǎng)絡(luò)法、支持向量機等[2]。
近年來提出了多種負荷預(yù)測模型,如 BP神經(jīng)網(wǎng)絡(luò)、小波分析和支持向量機等。其中,BP神經(jīng)網(wǎng)絡(luò)具有較強的非線性映射能力和泛化能力,但容易產(chǎn)生過擬合和局部最優(yōu);小波分析具有較強的逼近、容錯能力,但小波基函數(shù)的選擇和參數(shù)初始化沒有一定的依據(jù)準則;支持向量機可剔除大量冗余樣本,魯棒性較好,但對大規(guī)模樣本訓練難以實施,解決多分類問題存在困難;回歸分析法在數(shù)據(jù)少時訓練速度快、誤差率小,但對大量數(shù)據(jù)處理效果差[3]。上述電力負荷預(yù)測算法由于精度和使用范圍限制,無法滿足越來越復(fù)雜的電力系統(tǒng)負荷預(yù)測要求[4]。針對上述不足,本文提出了一種基于模糊C均值聚類(Fuzzy C-means,F(xiàn)CM)與懶惰學習(Lazy Learning,LL)組合模型的預(yù)測方法,先采用FCM算法對原始數(shù)據(jù)進行較小噪聲數(shù)據(jù)預(yù)處理,然后在篩選后的數(shù)據(jù)集中使用LL建立預(yù)測模型。算例表明,本文提出的方法可根據(jù)不同場景下的用電需求有針對性地建立預(yù)測模型,與傳統(tǒng)LL相比,提高了預(yù)測精度、縮短了預(yù)測時間。
1 FCM-LL組合模型預(yù)測原理
傳統(tǒng)的 LL算法每一次局部建模都需要遍歷所有的訓練集特征值,存在不良數(shù)據(jù)及冗余數(shù)據(jù),使得局部建模點的選取偏離待測點,造成預(yù)測失真。因此,本文提出使用FCM算法對訓練集進行分類,縮小數(shù)據(jù)規(guī)模,為LL算法提供篩除噪聲數(shù)據(jù)的訓練集方法。
1.1 FCM原理
由上面兩個條件發(fā)現(xiàn),模糊C均值聚類算法是一個簡單的迭代過程[7]。FCM確定聚類中心ci和隸屬矩陣U步驟如下:①用0、1之間的隨機數(shù)初始化隸屬矩陣U,使其滿足式(1)中的約束條件;②用式(4)計算c個聚類中心ci,i=1,…,c;③根據(jù)式(2)計算價值函數(shù)。如果它小于某個給定閾值,則算法停止;④用式(5)計算新的U矩陣,返回步驟②。
以上算法也可通過先初始化聚類中心再執(zhí)行迭代過程實現(xiàn)。由于不能確保FCM收斂于一個最優(yōu)解,算法性能很大程度上由初始聚類中心決定。因此,需尋求新的快速算法確定初始聚類中心,或者每次用不同的初始聚類中心啟動該算法,多次運行FCM[8]。
1.2 LL原理
LL算法是一種基于“相似輸入產(chǎn)生相似輸出”原則的算法,是一種本質(zhì)為自適應(yīng)模式的靈活建模方法,其對每一個采樣點都從歷史數(shù)據(jù)庫中選擇最匹配的數(shù)據(jù)向量建立估計模型[9],每個模型只對當前的采樣點有效,能夠有效解決普通預(yù)測模型過度擬合問題[10]。
其中,f是未知的非線性映射,Y表示采樣點輸入向量X對應(yīng)的輸出向量,即預(yù)測值,ε(X)是零均值白噪聲,通過獲取采樣點時刻t的實際輸入向量求取當前的負荷。
LL根據(jù)近鄰原則從歷史數(shù)據(jù)庫中選擇與當前采樣點最匹配的建模點,在不知道過程的非線性映射情況下,采用K向量近鄰(K-vector nearest neighbors,K-VNN)方法測量采樣點與歷史數(shù)據(jù)庫中點的距離[11]。選擇K個距離采樣點最近的點{ui,yi}Ki=1作為建模點,建立相應(yīng)的線性模型近似表征系統(tǒng)的非線性特征并預(yù)測輸出。其中{ui,yi}表征一個采樣點,按實際情況劃分為輸入部分ui和輸出部分yi。
要特別注意的是LL方法是多輸入單輸出的,也就是說每次只能預(yù)測一維輸出。如果需要預(yù)測多維輸出則需要建立多個一階線性回歸多項式,分別對每一維輸出進行預(yù)測[13]。
1.3 基于FCM-LL組合模型的負荷預(yù)測
1.3.1 負荷特性分析
本文選用武漢某高校學生宿舍樓2017年4月1日至2017年5月27日的用電數(shù)據(jù)及影響因素進行分析。影響負荷的因素較多,如溫度、天氣條件、節(jié)假日等。
在預(yù)測之前需對負荷特性進行研究,由物理經(jīng)驗得知負荷變化受到溫度或天氣條件的影響,其中溫度指最高溫、最低溫,天氣條件指日照強度、濕度影響等。本文針對的是日負荷預(yù)測,其一日內(nèi)天氣類型并不單一。本文進一步細化兩兩不同氣象間的關(guān)聯(lián)性關(guān)系,量化天氣類型如表1所示,對不同天氣下的負荷進行合理劃分[14]。
影響負荷的另一個因素是節(jié)假日,節(jié)假日期間,人們會選擇休息或外出游玩,學校教學樓用電會減少。除上述影響因素外,還有一些社會因素,如人均消費水平、工業(yè)發(fā)展水平等。但對日負荷來說這些因素變化緩慢,而且長時間范圍內(nèi)的負荷記錄分析顯示,其變化總體呈現(xiàn)穩(wěn)定的增長態(tài)勢,故對日負荷影響因素而言其變化趨勢基本為零,可忽略不計[15]。
1.3.2 FCM-LL預(yù)測模型
傳統(tǒng)的 LL算法每次局部建模都需要遍歷所有的訓練集特征值,且存在不良數(shù)據(jù)及冗余數(shù)據(jù),使得局部建模點的選取偏離待測點,造成預(yù)測失真[16]。因此,本文提出使用FCM算法對訓練集進行分類,縮小數(shù)據(jù)規(guī)模,為LL算法提供篩除噪聲數(shù)據(jù)的訓練集。
構(gòu)建基于FCM-LL負荷預(yù)測模型步驟如下:①將負荷Y及當天對應(yīng)最高溫x1、最低溫x2、天氣特征x3、是否節(jié)假日 x4作為輸入特征值 X建立訓練樣本((x1,x2,x3,x4),Y),輸入向量 Xi為特征值訓練集,輸出向量 Y為待測點負荷;②因為影響負荷的特征值大小單位不一致,所以對實際訓練集和待測點數(shù)據(jù)進行歸一化處理;③通過FCM獲取待測點所在的與其匹配程度最高的局部估計模型訓練集;④在待測點所在類中通過K-VNN選取k=5個近鄰點建立局部學習模型;⑤針對局部模型得到待測日負荷值。
2 短期負荷預(yù)測實例
本文選用武漢某高校實驗樓2017年4月1日至2017年5月27日的用電數(shù)據(jù)及影響因素建立模型,進行預(yù)測、分析。在進行預(yù)測前,需要對模型的輸入數(shù)據(jù)標準化,先求出各變量(指標)的算術(shù)平均值(數(shù)學期望)xi和標準差si,然后進行標準化處理[17] 。
由表2、表3可以看出,現(xiàn)階段使用的FCM-LL算法在預(yù)測精度方面效果更好。對10組數(shù)據(jù)進行了預(yù)測,其中有9組數(shù)據(jù)的預(yù)測結(jié)果顯示,F(xiàn)CM-LL比LL好。特別說明第5組數(shù)據(jù),使用 FCM- LL的誤差較大,這是因為在對數(shù)據(jù)進行模糊 c均值處理后,第5組數(shù)據(jù)尋求近鄰點的集合很小,其近鄰點只能找到兩個,對預(yù)測結(jié)果造成了影響。而使用LL預(yù)測時誤差較小,這是因為第5組數(shù)據(jù)尋求近鄰點的集合沒有受到影響,所找到的近鄰點有的偏大有的偏小,數(shù)據(jù)足夠多,所以抵消了誤差[18]。在相同數(shù)據(jù)規(guī)模下,改進的組合算法耗時低于0.19s,預(yù)測精度指標為2.53%;而傳統(tǒng)算法時間超過0.3s,預(yù)測精度指標為7.8%。改進后的組合算法在保持較高預(yù)測速度的同時達到了更高的預(yù)測精度,預(yù)測結(jié)果可靠性更高。此外,本方法計入天氣因素,相對預(yù)測速度提高了33%,預(yù)測精度也提高了。天氣特征值的加入為近鄰點的選擇提供了有效依據(jù),能夠更加快速地尋找到待測點的近鄰點。
再隨機抽取10組數(shù)據(jù)作為測試集進行預(yù)測,從圖1的預(yù)測曲線可以看出,F(xiàn)CM-LL組合預(yù)測模型的結(jié)果更加吻合實測值曲線,這驗證了本文所使用的組合模型能更快速準確地預(yù)測日負荷,更好地滿足工程需求。
3 結(jié)語
當數(shù)據(jù)量變大時,傳統(tǒng)的懶惰學習在短期負荷預(yù)測方面會存在精度不足、耗時長的缺點,本文對此作出修改,使用聚類與懶惰學習組合預(yù)測模型,有效降低了預(yù)測規(guī)模與噪聲的影響。下一步研究是改進預(yù)測方法,使其內(nèi)部參數(shù)均變?yōu)樽赃m應(yīng),對光伏發(fā)電、風力發(fā)電及并網(wǎng)后的負荷進行預(yù)測,并在電力系統(tǒng)其它問題上應(yīng)用此算法。
參考文獻:
[1] 張云,王渡,莊羽.基于新陳代謝灰色馬爾可夫模型的工業(yè)園區(qū)用電量預(yù)測[J].電力需求側(cè)管理, 2014,16(4):610-611.
[2] 趙騰,王林童,張焰,等.采用互信息與隨機森林算法的用戶用電關(guān)聯(lián)因素辨識及用電量預(yù)測方法[J].中國電機工程學報,2016,36(3):604-614.
[3] 張思遠,何光宇,梅生偉,等.基于相似時間序列檢索的超短期負荷預(yù)測[J].電網(wǎng)技術(shù),2008,32(12):56-59.
[4] 李明干,孫健利,劉沛.基于卡爾曼濾波的電力系統(tǒng)短期負荷預(yù)測[J].電力系統(tǒng)保護與控制,2004,32(4):9-12.
[5] 孟安波,盧海明,李海亮. 縱橫交叉算法優(yōu)化 FCM 在電力客戶分類中的應(yīng)用[J]. 電力系統(tǒng)保護與控制,2015,43(20):150-154.
[6] CAI W,CHEN S,ZHANG D.Fast and robust fuzzy c-means clustering algorithms incorporating local information for image segmentation[J].Pattern Recognition,2007,40(3):825-838.
[7] 孟安波,盧海明,李海亮. 縱橫交叉算法優(yōu)化 FCM 在電力客戶分類中的應(yīng)用[J]. 電力系統(tǒng)保護與控制,2015,43(20):150-154
[8] ZHANG D Q,CHEN S C. A comment on alternative C-means clustering algorithms [J]. Pattern reconition,2004, 37(2):173-174.
[9] 程毛林.數(shù)據(jù)擬合函數(shù)的加權(quán)最小二乘積分法[J].數(shù)學的實踐與認識,2012,42(4):70-76.
[10] 欒媛媛,王忠仁,奚阿丹,等.基于改進BP神經(jīng)網(wǎng)絡(luò)的客戶投訴預(yù)警模型研究[C].中國通信學會學術(shù)年會,2010.
[11] 汪璟玢.一種結(jié)合空間聚類算法的R樹優(yōu)化算法[J].計算機工程與應(yīng)用,2014,50(5):112-115.
[12] BREIMAN L. Random forest[J].Machine Learning, 2001,45(1):532-533.
[13] CHAMBERS D W. Key performance indicators[J].Journal of the American Dental Association, 2013,144(3):242-244.
[14] 周文杰,楊璐,嚴建峰. 大數(shù)據(jù)驅(qū)動的投訴預(yù)測模型[J].計算機科學,2016,6(7):53-59.
[15] 程其云.基于數(shù)據(jù)挖掘的電力短期負荷預(yù)測模型及方法的研究[D].重慶:重慶大學,2014.
[16] 尹玉芬. 地區(qū)電力系統(tǒng)負荷特性分析與需求側(cè)管理研究 [D].廣州:華南理工大學, 2010.
[17] CHERMAN E A,SPOLA R N,VALVERDE-REBAZA J,et al.Lazy multi-label learning algorithms based on mutuality strategies[J].Journal of Intelligent & Robotic Systems,2015,80(1):261-276.
[18] 高亞靜,孫永健,楊文海.基于新型人體舒適度的氣象敏感負荷短期預(yù)測研究[J].中國電機工程學報,2017,37(7):1946-1954.
(責任編輯:杜能鋼)