国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于聚類分析與隨機森林的短期負(fù)荷滾動預(yù)測

2018-06-13 08:40荀港益
智能城市 2018年9期
關(guān)鍵詞:時刻用電聚類

荀港益

華北電力大學(xué),北京 102206

電力系統(tǒng)短期負(fù)荷預(yù)測是電力系統(tǒng)安全、經(jīng)濟運行的基礎(chǔ)和前提,也是電力部門安排調(diào)度計劃、供電計劃的重要依據(jù)[1]。隨著社會經(jīng)濟的持續(xù)發(fā)展和產(chǎn)業(yè)結(jié)構(gòu)的不斷調(diào)整,用戶的用電行為習(xí)慣呈現(xiàn)出多樣化的發(fā)展趨勢[2],針對單個工業(yè)用戶,由于他們在社會經(jīng)濟中的分工、資源配置、服務(wù)對象的不同,其用電行為習(xí)慣存在自己獨有的周期特點,僅以用戶總體特性進行用電預(yù)測已經(jīng)不能滿足負(fù)荷預(yù)測準(zhǔn)確性的要求[3]。

目前短期負(fù)荷預(yù)測方法主要分為經(jīng)典預(yù)測方法、傳統(tǒng)預(yù)測方法與智能預(yù)測方法三類[4]。其中,智能預(yù)測方法中的神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN) 能將傳統(tǒng)的函數(shù)關(guān)系轉(zhuǎn)化為高維的非線性映射,具有很強的自適應(yīng)能力,但由于其從經(jīng)驗風(fēng)險最小推至期望風(fēng)險最小沒有可靠的理論依據(jù),故其泛化能力經(jīng)常不盡人意[5-7];支持向量機 (Support Vector Machine,SVM) 通過將經(jīng)驗風(fēng)險最小化轉(zhuǎn)化成結(jié)構(gòu)風(fēng)險最小化,利用最優(yōu)化方法解決機器學(xué)習(xí)問題中的過擬合與維數(shù)災(zāi)難問題,但其理論復(fù)雜,模型參數(shù)選擇技巧性強,預(yù)測結(jié)果的準(zhǔn)確性很難得到進一步提高,限制了SVM模型的應(yīng)用[8-9];隨機森林 (Random Forest,RF) 在預(yù)測中需要調(diào)節(jié)的參數(shù)少,受離群數(shù)據(jù)干擾小,且隨著數(shù)據(jù)集的增大表現(xiàn)出良好的魯棒性,因此隨機森林更適合電力系統(tǒng)短期負(fù)荷預(yù)測[10-11]。

考慮到預(yù)測方法的輸入特征對模型的預(yù)測精度具有極大的影響,而當(dāng)前的負(fù)荷預(yù)測方法中多利用預(yù)測日的前一天負(fù)荷數(shù)據(jù)建立模型,并不利用當(dāng)日已知的部分負(fù)荷等動態(tài)信息來更新輸入,但根據(jù)近大遠(yuǎn)小的原理[12],預(yù)測日的已知信息對未來預(yù)測結(jié)果影響更大,所以在模型中不斷地加入最新獲得的實時負(fù)荷數(shù)據(jù)信息,對下一時刻進行的預(yù)測具有重要意義。

本文提出一種基于聚類分析與隨機森林的短期負(fù)荷滾動預(yù)測模型:采用K-means聚類算法對用戶用電歷史數(shù)據(jù)進行預(yù)處理,聚類形成用戶的不同用電行為下的樣本集,通過隨機森林[13]訓(xùn)練生成不同行為下的預(yù)測模型,接著計算待測日和聚類后的數(shù)據(jù)集的簇中心的相似度,找到待測日所屬的預(yù)測模型,同時隨著待測日實際負(fù)荷數(shù)據(jù)的采集,不斷滾動更新輸入變量,代入匹配好的隨機森林模型,得到預(yù)測結(jié)果。實例仿真結(jié)果表明本方法相較于常規(guī)方法在預(yù)測精度上具有明顯的提高。

1 用戶用電行為習(xí)慣的聚類分析

1.1 K-means聚類算法

K-means聚類算法[14]是經(jīng)典的聚類算法之一,算法主要原理描述如下:

設(shè)Λ 為已知數(shù)據(jù)集,X中的 Λ 是n個數(shù)據(jù)對象并且每個數(shù)據(jù)對象都是N維的。K-means聚類算法就是要找到含有k個聚類中心的集合:

使得目標(biāo)函數(shù) (1) 最小。

其中表示聚類中心C與數(shù)據(jù)對象X的歐幾里德距離,其定義如下:

直觀看來,式 (1) 在一定程度上刻畫了簇內(nèi)樣本圍繞簇均值向量的緊密程度,J值越小則代表劃分的樣本類與類之間的相異程度越大,基于此可以確定最佳聚類數(shù)。

1.2 用戶用電行為習(xí)慣的多維評價指標(biāo)的選取

根據(jù)用電特性的差異,可將用戶用電行為進行多種類別的劃分,常見的指標(biāo)有:從負(fù)荷特性的角度選取典型日負(fù)荷曲線、用戶平均負(fù)荷率以及最大負(fù)荷率組成聚類特征向量[15];從時間特征量的角度選取季節(jié)用電數(shù)據(jù)、日用電數(shù)據(jù)等組成聚類特征向量[16];從峰谷特性的角度建立包含峰時與谷時用電負(fù)荷等指標(biāo)的時間序列聚類特征向量[17]。本文在綜合現(xiàn)有評價指標(biāo)的基礎(chǔ)上,以天為周期,每隔15min采集一個用電負(fù)荷數(shù)據(jù),建立了一組96維的時間序列作為聚類特征指標(biāo)。

2 隨機森林回歸算法

2.1 隨機森林回歸原理

隨機森林回歸是在分類回歸樹 (CART) 基礎(chǔ)上發(fā)展起來的一種集成學(xué)習(xí)方法,其核心思想是從總體訓(xùn)練樣本集S中利用Bootstrap重抽樣方法隨機抽取多個樣本子訓(xùn)練集,構(gòu)建一組基分類器。每組基分類器使用基尼指數(shù) (GINI index) 進行特征值的選取,最大限度地生成多個回歸樹且無需進行剪枝,最終形成一個多元非線性回歸組合模型,然后對每個基分類器的輸出預(yù)測結(jié)果進行求和平均,作為最終的預(yù)測結(jié)果,隨機森林回歸算法結(jié)構(gòu)如圖1所示。

2.2 隨機森林特征集的組成

由于用電負(fù)荷數(shù)據(jù)與歷史數(shù)據(jù)在兩方面存在相關(guān)性[18]:待測時刻的用電負(fù)荷數(shù)據(jù)與該預(yù)測時刻緊鄰的前個時刻點的負(fù)荷數(shù)據(jù);待測時刻的用電負(fù)荷數(shù)據(jù)與緊鄰的前天的同一時刻點的負(fù)荷數(shù)據(jù)。因此本文輸入隨機森林的特征集包含兩部分?jǐn)?shù)據(jù)特征,即:

式中——預(yù)測的第i個時刻的特征集——距離待測時刻點m天的第n個時刻的用電負(fù)荷數(shù)據(jù)——緊鄰預(yù)測時刻前n個時刻點的負(fù)荷數(shù)據(jù)與預(yù)測時刻緊鄰的前m天的同一時刻點的負(fù)荷數(shù)據(jù)。

3 滾動預(yù)測

本文提出的滾動預(yù)測算法( 設(shè)待預(yù)測時刻點為第共96個時刻點的負(fù)荷數(shù)據(jù)) 具體步驟如下:

(1) 初始化時刻的輸入特征

(2) 代入對應(yīng)的隨機森林模型;

(3) 輸出該時刻下的預(yù)測用電負(fù)荷數(shù)據(jù)

(4) 采集待預(yù)測時刻的實際用電負(fù)荷數(shù)據(jù)

(5) 用實際負(fù)荷數(shù)據(jù)更新輸入:

傳統(tǒng)預(yù)測方法中是直接將待測日前一天的負(fù)荷數(shù)據(jù)輸入,并不涉及實時數(shù)據(jù)的更新) ;

(6) 重復(fù)步驟 (2) ~ (5) ,直至預(yù)測過程結(jié)束。

4 基于聚類分析與隨機森林回歸算法的短期負(fù)荷滾動預(yù)測模型

本文構(gòu)建的短期負(fù)荷預(yù)測模型的流程圖如圖2所示,主要步驟如下:

圖2 基于聚類分析與隨機森林回歸算法的短期負(fù)荷滾動預(yù)測流程

步驟1:采集用戶歷史數(shù)據(jù)樣本集。

步驟2:用戶用電行為類別的劃分。采用K-means聚類算法將用戶一天的各個時刻的用電負(fù)荷數(shù)據(jù)作為時間序列特征指標(biāo)進行聚類,確定最佳聚類數(shù)k,并根據(jù)每個類別劃分對應(yīng)的樣本集。

步驟3:生成k個隨機森林模型。利用不同用電行為下的樣本集,分別訓(xùn)練,生成k個隨機森林模型,對應(yīng)著每類用電行為模式。

步驟4:匹配待測日的用電行為。將待測日的時間序列特征作為輸入,計算與每一類簇中心向量的近似度,選擇與待測日類別相同的隨機森林模型進行預(yù)測。

步驟5:更新輸入變量。采集實時用電負(fù)荷數(shù)據(jù),用滾動預(yù)測中介紹的方法更新下一待測時刻點的輸入變量。

步驟6:滾動預(yù)測。將更新好的特征變量輸入步驟4匹配的隨機森林模型進行滾動預(yù)測。

步驟7:輸出預(yù)測結(jié)果。

5 仿真算例及結(jié)果分析

5.1 數(shù)據(jù)來源及樣本選擇

本文使用的數(shù)據(jù)集由廣州計量自動化系統(tǒng)采集105個工業(yè)用戶近兩年的電量數(shù)據(jù)得到,采樣頻率為15min一個點。本文選取的是105個用戶中的一個電子工業(yè)用戶進行仿真算例,收集其從2015年6月1日~2015年8月29日共90d的負(fù)荷數(shù)據(jù)作為原始訓(xùn)練樣本,每天共有96個樣本點,對2015年9月1日~9月5日的各時刻用電負(fù)荷數(shù)據(jù)進行預(yù)測。

5.2 用戶用電行為習(xí)慣的聚類分析及樣本集的劃分

對于訓(xùn)練數(shù)據(jù)集,以天為周期,建立了一組96維以用電負(fù)荷數(shù)據(jù)為聚類特征指標(biāo)向量的時間序列代入K-means聚類算法,得出的最佳分類結(jié)果如圖3,可以看出該用戶的用電行為習(xí)慣主要為兩類,每一類可以明顯的代表一類用電習(xí)慣,聚類結(jié)果比較理想,并以此對原始數(shù)據(jù)進行樣本集劃分。

圖3 k-means聚類算法對用戶用電行為最佳分類圖

考慮到用戶用電負(fù)荷數(shù)據(jù)與歷史數(shù)據(jù)有較強的相關(guān)性,經(jīng)過參數(shù)調(diào)優(yōu),本文最終選取待預(yù)測時刻點的連續(xù)前7個時刻點以及前8d與待測時刻處于同一時刻的負(fù)荷數(shù)據(jù)作為輸入特征向量進行隨機森林模型訓(xùn)練。

5.3 預(yù)測結(jié)果與分析

本文采用平均絕對百分誤差 (mean absolute percentage error,MAPE) 作為預(yù)測方法的評價指標(biāo):

式中,——實際值,——預(yù)測值,N——每日預(yù)測點的總數(shù)。

圖4 2015年9月2日的用電負(fù)荷預(yù)測結(jié)果

為了說明本文所采用算法 (K-RF) 的優(yōu)越性,另外選取了常規(guī)的支持向量機 (SVM) 算法和隨機森林 (RF) 算法兩種方案與之進行對比。其中,SVM的輸入特征向量與本算法的輸入特征向量一致,常規(guī)隨機森林算法的輸入向量未使用實時數(shù)據(jù)對待測時刻向量進行更新。預(yù)測的時間為2015年9月1日~9月5日的用電負(fù)荷數(shù)據(jù),以2015年9月2日的96個時刻點的預(yù)測結(jié)果為例,預(yù)測詳細(xì)結(jié)果如圖4,可以看出,三種預(yù)測方法中K-RF的預(yù)測曲線與實際負(fù)荷曲線的擬合程度最高。在訓(xùn)練參數(shù)設(shè)定的過程中,隨機森林僅需要對決策樹棵數(shù)進行設(shè)置,相較于支持向量機需要設(shè)置懲罰參數(shù),核參數(shù),中止訓(xùn)練誤差參數(shù)等參數(shù),在參數(shù)設(shè)置方面隨機森林更加方便,結(jié)構(gòu)簡單。

通過計算,分別得出三種預(yù)測模型下的MAPE值:本文提出的K-RF模型預(yù)測結(jié)果為6.81%,SVM模型預(yù)測結(jié)果為10.48%,常規(guī)RF模型預(yù)測結(jié)果為13.13%,其中K-RF模型的預(yù)測精度最高。K-RF與SVM的相對誤差如圖5所示。K-RF與RF的相對誤差如圖6所示。

圖6 K-RF與RF的相對誤差

由圖5比較SVM和K-RF的相對誤差曲線可知,SVM與K-RF預(yù)測相對誤差偏大的時刻點對應(yīng)著圖3中實際負(fù)荷曲線突然出現(xiàn)波動的位置,但K-RF的預(yù)測結(jié)果更接近真實值,可以得出本算法的泛化能力是高于SVM的;由圖6比較RF和K-RF的相對誤差曲線可知,在前期時刻的預(yù)測中二者的差異并不是特別大,但到后期,RF的偏差越來越大,但K-RF依舊有很高的預(yù)測精度,表明實時數(shù)據(jù)的滾動更新對預(yù)測精度的提高具有促進作用。

6 結(jié)論

本文提出的基于聚類分析與隨機森林回歸算法的短期負(fù)荷滾動預(yù)測模型,通過采用k-means聚類算法對原始訓(xùn)練樣本進行用電行為習(xí)慣的分類,選取與待測日同屬一類的訓(xùn)練樣本,能夠有效地降低訓(xùn)練樣本的容量,減少運算負(fù)擔(dān);算法結(jié)合的隨機森林回歸模型,具有泛化誤差小、調(diào)節(jié)參數(shù)少、不會出現(xiàn)過擬合的優(yōu)點,適用于電力系統(tǒng)短期負(fù)荷預(yù)測,通過添加滾動預(yù)測模型,可以在保留原始預(yù)測模型優(yōu)點的基礎(chǔ)上,將實時數(shù)據(jù)進行更新,進一步提升預(yù)測精度。仿真算例結(jié)果表明,在相同條件下,K-RF滾動預(yù)測模型相比于傳統(tǒng)模型結(jié)構(gòu)簡單,能夠明顯地提高預(yù)測精度要求,具有一定的工程實用價值。

[1] 楊波,張海防,李浛永,等.電力系統(tǒng)負(fù)荷預(yù)測技術(shù)的研究[J].電子技術(shù)與軟件工程,2015 (1) :253.

[2] 朱炎平. 基于聚類的用戶用電行為分析研究[D].北京:華北電力大學(xué) (北京) ,2017.

[3] Han Wu. Short-term Electric Load Forecasting based on Data Mining[A]. IEEE.Proceedings of 2016 8th IEEE International Conference on Communication Software and Networks(ICCSN 2016) [C].IEEE,2016(5).

[4] 廖旎煥,胡智宏,馬瑩瑩,等.電力系統(tǒng)短期負(fù)荷預(yù)測方法綜述[J].電力系統(tǒng)保護與控制,2011,39 (1) :147-152.

[5] 姜雲(yún)騰,李萍.基于改進粒子群神經(jīng)網(wǎng)絡(luò)短期負(fù)荷預(yù)測[J].電氣技術(shù),2018,19 (2) :87-91.

[6] Paras Mandal,Tomonobu Senjyu,Naomitsu Urasaki,et al.Electricity Price and Load Short-Term Forecasting Using Artificial Neural Networks[J]. International Journal of Emerging Electric Power Systems,2011,7 (4) .

[7] Xia Hua,Gang Zhang,Jiawei Yang,et al.Theory Study and Application of the BP-ANN Method for Power Grid Short-Term Load Forecasting[J].ZTE Communications,2015,13 (3) :2-5.

[8] 牛東曉,劉達(dá),陳廣娟,等.基于遺傳優(yōu)化的支持向量機小時負(fù)荷滾動預(yù)測[J].電工技術(shù)學(xué)報,2007 (6) :148-153.

[9] 李霄,王昕,鄭益慧,等.基于改進最小二乘支持向量機和預(yù)測誤差校正的短期風(fēng)電負(fù)荷預(yù)測[J].電力系統(tǒng)保護與控制,2015,43 (11) :63-69.

[10] Grzegorz Dudek.Short-Term Load Forecasting Using Random Forests[M].Springer International Publishing:2015-06-15.

[11] 劉劍,曹美燕,高治軍,等.一種基于隨機森林的太陽能輻射預(yù)測模型[J].控制工程,2017,24 (12) :2472-2477.

[12] Ayca Kumluca Topalli,Ismet Erkmen,Ihsan Topalli. Intelligent short-term load forecasting in Turkey[J]. International Journal of Electrical Power and Energy Systems,2006,28 (7) .

[13] 李婉華,陳宏,郭昆,等.基于隨機森林算法的用電負(fù)荷預(yù)測研究[J].計算機工程與應(yīng)用,2016,52 (23) :236-243.

[14] 楊浩,張磊,何潛,等.基于自適應(yīng)模糊C均值算法的電力負(fù)荷分類研究[J].電力系統(tǒng)保護與控制,2010,38 (16) :111-115,122.

[15] 周小明,蘇安龍,楊宏宇.基于K-Means聚類算法的行業(yè)用電行為分析[J].電氣應(yīng)用,2015,34 (S1) :178-182.

[16] 張素香,劉建明,趙丙鎮(zhèn),等.基于云計算的居民用電行為分析模型研究[J].電網(wǎng)技術(shù),2013,37 (6) :1542-1546.

[17] 趙國生,牛貞貞,劉永光,等.基于自適應(yīng)模糊C均值聚類算法的電力負(fù)荷特性分類[J].鄭州大學(xué)學(xué)報 (工學(xué)版) ,2015,36 (6) :56-60.

[18] Hai Liang Hou,Jie Chen,Miao Ping Sun,et al. Daily Load Forecasting Based on RBF-ARX Model[J]. Applied Mechanics and Materials,2014,3411 (623) .

猜你喜歡
時刻用電聚類
冬“傲”時刻
捕獵時刻
安全用電知識多
基于K-means聚類的車-地?zé)o線通信場強研究
對輸配電及用電工程的自動化運行的幾點思考
為生活用電加“保險”
用電安全要注意
基于高斯混合聚類的陣列干涉SAR三維成像
基于Spark平臺的K-means聚類算法改進及并行化實現(xiàn)
基于改進的遺傳算法的模糊聚類算法
武乡县| 双鸭山市| 阆中市| 宣化县| 福海县| 恩施市| 娱乐| 诸城市| 稷山县| 广昌县| 关岭| 肥东县| 钦州市| 合川市| 耒阳市| 长武县| 雷山县| 松潘县| 玛纳斯县| 集贤县| 胶州市| 秭归县| 霍州市| 铁岭县| 屯留县| 金乡县| 稷山县| 弋阳县| 定陶县| 酉阳| 兴国县| 陵水| 怀远县| 衡阳市| 曲阜市| 凯里市| 海原县| 成安县| 南和县| 都匀市| 怀集县|