国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于曲線相似性的負荷分類方法及其應用研究

2014-12-20 06:49:14張靠社何優(yōu)琪劉福潮梁雅芳
電網(wǎng)與清潔能源 2014年7期
關鍵詞:標準差聚類距離

張靠社,何優(yōu)琪,劉福潮,梁雅芳

(1. 西安理工大學 水利水電學院,陜西 西安 710048;2. 甘肅省電力科學研究院,甘肅 蘭州 730050)

伴隨智能電網(wǎng)的不斷發(fā)展,需求側(cè)負荷管理技術在電網(wǎng)被廣泛采用,負荷分類也變?yōu)殡妰r制定、負荷預測、系統(tǒng)規(guī)劃、負荷管理等的重要工作基礎。由此,研究提出更準確有效的負荷分類方法,具有重要的理論意義和實用價值。由于電力系統(tǒng)綜合負荷具有地域分散、類型繁多、結(jié)構(gòu)復雜和非線性等特點,負荷的分類與綜合已成為電力系統(tǒng)的一個難題[1]。現(xiàn)今對大量的用戶負荷時序數(shù)據(jù)進行描述分析和分類控制時,在前期處理時大多數(shù)都利用的是負荷的聚類分析。

通常利用的聚類方法有模糊聚類、C—均值法、系統(tǒng)聚類、K—均值法、K—means聚類、基于人工神經(jīng)網(wǎng)格和基于密度的方法[2-4]等。近年來,逐步深入的進行數(shù)據(jù)挖掘研究,涌現(xiàn)了許多新的聚類分析法[5-6]。文獻[7]采用Ward法,該方法最終聚類數(shù)目的確定需要根據(jù)結(jié)果和經(jīng)驗進行選?。晃墨I[8]采用將最大最小距離作為度量進行聚類。在負荷分類領域中,現(xiàn)今運用最廣泛的方式是自組織映射方法(Self Organizing Mapping,SOM),文獻[9]對SOM算法做了相關研究,應用中SOM方法的主要缺點是分析人員需要在計算前,提前給定分類的具體數(shù)目(K),通常需進行多次試算才能得到滿意的分類結(jié)果,且很難控制負荷分類結(jié)果的精度。

針對這些負荷聚類方法算法復雜、計算量大、要求預先設定聚類初值等缺陷,為了更有效地進行負荷分類,經(jīng)研究發(fā)現(xiàn),一種基于曲線相似性的判定方法被廣泛應用于各領域。文獻[10]提出一種基于類曲率的曲線相似判定方法,并應用于圖像拼接,圖像修補等方向;文獻[11]采用離散Fréchet 距離作為距離的測度進行研究,建立數(shù)學模型用于判定曲線相似性,利用150個隨機的在線手寫簽名進行驗證,結(jié)果匹配率高達90%以上;文獻[12]對中國各個貿(mào)易大類商品中加工貿(mào)易的構(gòu)成曲線進行分析歸納,得到中國加工貿(mào)易主體商品結(jié)構(gòu)的演變過程。

把曲線相似性作為判定依據(jù),應用于大規(guī)模電力負荷分類領域的研究非常少。為此,本文提出一種基于日負荷曲線,將曲線相似精度設定為分類閾值的負荷分類方法。該方法在滿足事先確定的精度要求下,能將日負荷曲線集聚合成滿足要求的類別。并完成某電網(wǎng)實測負荷樣本的分類,證明該方法具有可行性和高效性,可作為系統(tǒng)規(guī)劃、錯峰管理、負荷預測的可靠依據(jù)。

1 分類方法基本理論

以下列出負荷曲線聚類方法的主要定義,含有曲線類相似精度及曲線相似度的明確概念[13]。

將n個連續(xù)觀測的數(shù)據(jù)連成的曲線記為Ci=Ci(xi1,xi2,…,xin)。則可以定義Ci與Cj兩條曲線間的相似度測量如下述。

定義1 曲線Ci(xi1,xi2,…,xin)和Cj(xj1,xj2,…,xjn)之間的距離:

按照上面的定義1,在曲線間相應分量點距離中的最大距離就是兩曲線之間的距離。距離Dij可以表征曲線的形態(tài)相似度,曲線越相似Dij值越小。只有在對應的范圍內(nèi)控制好曲線類中的全部曲線間的相似度,才能保證分類的結(jié)果符合一定的精度。這個“范圍”即是該曲線類的“相似精度”。

定義2 記曲線類M(C1,C2,…,Cm),其中,Ci(xi1,xi2,…,xin)。曲線類M的相似精度為

從式(2)可以看出,如果E(M)為曲線類M的相似精度是已知的,若引入一條不屬于M的新曲線Ci以后變?yōu)樾碌那€類M′,判定E(M′)>E(M)是否成立時,利用表達式(3)計算新曲線類M′的相似精度變得更簡單。

可使用以下3個定義,進一步分析曲線集合分類結(jié)果的質(zhì)量。

首先給出曲線類M的質(zhì)心的定義,從物理學方面來考慮,曲線類的質(zhì)心就是此類曲線中各點的平均值。記M(C1,C2,…,Cm)為曲線,Ci(xi1,xi2,…,xin),1≤i≤m,定義曲線類C的質(zhì)心如下表述。

定義3 曲線類M的質(zhì)心為

如有曲線類M(C1,C2,…,Cm),與曲線Cj(xj1,xj2,…,xjn),其中Cj不屬于M,曲線Cj與曲線類M的距離同曲線Cj的平均離差定義如下表示。

定義4 定義曲線Cj和曲線類M的距離為曲線Cj與質(zhì)心的距離,即

由于分類結(jié)果的優(yōu)劣很大程度上會影響預測建模的精度,即使分類后得出結(jié)果,對曲線類聚集程度進行分析也是十分必要的。若曲線具有較好的分類效果,才可進行該類曲線的建模;如果曲線比較離散,某一類分類效果不佳,為保留原始信息,要求對該類曲線完成二次分類,直至得出滿足要求的結(jié)果。

顯示一組數(shù)據(jù)的離散程度的量化方式中,標準差是最為常用的一種。設曲線類M(C1,C2,…,Cm),其中,Cj(xj1,xj2,…,xjn),1≤j≤m其曲線類M的質(zhì)心為則時刻T(1≤T≤n)該類曲線類的標準差可表示為

SDT體現(xiàn)該組數(shù)據(jù)的變異程度,其值越大變異程度就大,質(zhì)心代表性越差,相反也一樣。將曲線類所有時刻的標準差連起來即得該類的標準差曲線。因各類曲線的數(shù)據(jù)相差較大,因此在使用標準差曲線判定各類曲線的離散度以前,對其數(shù)據(jù)需要進行預處理。

2 負荷分類數(shù)據(jù)預處理

由于負荷數(shù)據(jù)庫極大,且數(shù)據(jù)庫非常容易受到不一致數(shù)據(jù)、噪聲和丟失數(shù)據(jù)的影響。通常數(shù)據(jù)中存在“壞數(shù)據(jù)”或“不良數(shù)據(jù)”,為此利用數(shù)據(jù)前需先完成數(shù)據(jù)預處理,以避免其影響分類結(jié)果。本文利用的是比較濾波法[14],該方法的原理是在T時刻,將負荷進行縱橫向?qū)Ρ?,計算出T-1時刻和T+1時刻的負荷平均值與T時刻的負荷進行比較,且計算出前一天、前兩天的T時刻負荷平均值再次對比。若兩個的偏差超出某一閾值,則選擇橫、縱向比較的平均值。

若進行系統(tǒng)用戶負荷分類時,選取負荷特性指標的不同,很大程度影響到最后的分類結(jié)果。日負荷曲線能體現(xiàn)負荷隨時間變化的特性,用戶負荷的變化趨勢和大小經(jīng)日負荷曲線體現(xiàn)非常直觀,該曲線也可以較全面反映各用戶的負荷特性。在合約交易中典型日負荷曲線更是作為期貨、分配電量、分析互聯(lián)系統(tǒng)錯峰效益和審核調(diào)峰能力的基礎。并且利用各類型用戶的用電日負荷曲線,各級電網(wǎng)變電站和調(diào)度中心能研究用戶結(jié)構(gòu)改變對用電負荷造成的重要影響,從而掌握更全面負荷的變化情況。為此,本文選擇日負荷曲線作為系統(tǒng)負荷分類的依據(jù)。

本文出現(xiàn)的負荷曲線都是用戶日負荷曲線標準化后的結(jié)果,所以完成電力系統(tǒng)用戶的分類工作其本質(zhì)就是進行用戶日負荷曲線的分類。

3 基于曲線相似精度的算法概述

下面介紹的負荷曲線分類方法是將相似精度作為閾值。此算法的基本思路為設一個曲線集合為M。按照具體需求,開始選定一個相似精度,并且把其作為分類時使用的終止閾值,然后選擇M中間曲線距離最大的兩條。將任一條定成聚核開始聚類,若出現(xiàn)此類相似精度達到閾值的情況,則停止聚類,從而聚類出首個曲線類M1。定M2=M-M1,由此曲線集合M2完成相同聚類步驟,在全部曲線均歸到特定類別后,算法停止。此算法的具體步驟如下:

針對給定曲線集M(C1,C2,…,Cm),設W作為曲線聚類的相似精度閾值。1)在曲線集合M中計算兩兩曲線間的距離,挑選出兩兩間距離最大的一條曲線,記為A;2)將A歸到曲線類M1,中,并記M=MM1;3)曲線集合M中,將集合M1同各曲線的距離計算出來,得最小距離相應的曲線B,并記M1′=M1+B;4)按照式(3)計算E(M1′)。如果E(M1′)>W,那么算法轉(zhuǎn)至1)。反之把B歸到曲線類M1中,分別記M1=M1+B;M=M-M1,算法轉(zhuǎn)3);5)若M是空集,那么有算法停止。

根據(jù)所取得的聚類結(jié)果,可以再綜合每一條曲線Cj,j=1,2,…,m,至曲線類質(zhì)心M軓的距離,以及各條曲線Cj,j=1,2,…,m的離差平均值。從整體全面地把握任一曲線的歸類精度和分類效果的分布狀況。

4 應用實例分析

本文從某電網(wǎng)選取370個用戶負荷的時序數(shù)據(jù),同時采用模糊C均值聚類(Fuzzy C-Means,F(xiàn)CM)方法與負荷曲線分類方法對該電網(wǎng)的用戶負荷分別進行分類。首先利用FCM方法對370條日負荷曲線進行分類,在劃分的聚類算法理論基礎之上,F(xiàn)CM方法的思想是保證被歸到同一類的對象間的相似度最大,非同類之間的相似度最小。首先需要確定聚類數(shù)目并建立模糊相似矩陣,才能開始迭代直至目標函數(shù)收斂到最小值,最后顯示聚類結(jié)果。利用距離聚類方法對樣本數(shù)據(jù)進行分類,得最優(yōu)分類數(shù)是十類,分析得到的這十類負荷曲線的簇集程度。計算出每一類各時刻的標準差,繪制各類負荷的標準差曲線如圖1示,由圖1可表明標準差曲線中第一類、第七類與第九類明顯高于其他負荷曲線,顯示這些類曲線簇中的負荷曲線分布較為分散。為此,需進行再次分類的為此三類負荷曲線,以確保對用戶負荷曲線初始信息的準確辨識。

圖1 十類標準差曲線Fig. 1 Ten class standard deviation curves

依照標準差結(jié)果圖,其中有三個曲線類(第一類、第七類與第九類)的聚集不夠理想,分類以后效果較差,且其負荷的均值曲線代表性較差,用此直接進行辨識或預測,導致誤差很大。分類效果較好的是七類,控制標準差都在0.7之下,需對聚集效果不理想的三類中的曲線進行二次分類,以確保每一類的精度。第一類曲線含有38條,第七類曲線包含98條,第九類曲線包含44條,依次對其完成二次分類,總共分為六類,再對二次分類的六類曲線進行簇集度分析,求其六類的標準差及標準差曲線,如圖2所示。

圖2 二次分類后六類標準差曲線Fig. 2 Six standard deviation curves after secondary classification

圖2中表明對第一類、第七類和第九類二次分類,得到較好的分類結(jié)果,明顯改善了各類中的曲線類聚集程度。最終把用戶的370條日負荷曲線分成十三大類,同時將每條曲線的標準差控制在0.07以下,分類效果良好。通過上述分類過程看出,F(xiàn)CM方法是應用較為廣泛聚類方法,能順利完成大規(guī)模曲線的分類,并具有較好的分類效果。但因FCM聚類需要預先指定分類數(shù)目,需要進行聚類的有效性檢驗,所以其具有分類效率和準確性低的缺點。

鑒于此,以下使用本文中基于曲線相似性的負荷分類方法進行該電網(wǎng)的負荷分類。因分類依據(jù)是在日負荷曲線的原始形狀基礎上,且各負荷具有量綱不一致的難題,但預先已對370個用戶負荷的時序數(shù)據(jù)進行標準化處理,再利用新的負荷曲線分類方法進行分類,設定0.5為所選日曲線類相似精度的閾值。該方法把370條不同用戶曲線聚類成十三類,所得到每類的最大值、最小值以及均值曲線,如圖3所示。

圖3 基于曲線相似性分類算法效果圖Fig. 3 Classification algorithm renderings based on the similarity of curves

依照圖3可知,其中每一類的分類效果良好。效果圖顯示,采用新的負荷曲線分類法所得的結(jié)果,同使用模糊C均值聚類法的分類結(jié)果相差并不大,優(yōu)點在于很大程度上減少了分類的工作量,實現(xiàn)了更準確有效進行負荷分類的目標。計算求出各類曲線的標準差,效果圖4中得,若把每一類標準差均控制在0.7以下,分類產(chǎn)生良好效果,且曲線簇集程度較好。

圖4 十三類標準差曲線Fig. 4 Thirteen class standard deviation curve

將上述計算出的每一類負荷曲線的算術均值,當成此類用戶的典型日負荷曲線,其對電網(wǎng)的運行、規(guī)劃和負荷管理都具有重要意義,同時在電力市場條件下,更是作為期貨、合約交易中分配電量,審核調(diào)峰能力及分析互聯(lián)系統(tǒng)錯峰效益的基礎。

5 結(jié)語

本文提出了一種基于曲線相似性的負荷分類方法,依照相似精度的閾值將日負荷曲線集地劃分成若干的曲線類別,其結(jié)果可做為系統(tǒng)規(guī)劃、負荷管理和控制的依據(jù)。通過實例分析,該方法可以高效地得出滿足相似精度要求的分類結(jié)果,能大幅度降低系統(tǒng)負荷管理的難度與復雜度。

[1] 林舜江,李欣然,劉楊華,等. 電力負荷動特性分類方法研究[J]. 電力系統(tǒng)自動化,2005,29(22): 33-38.LIN Shunjiang,LI Xinran,LIU Yanghua,et al. A classification method for aggregated load dynamic characteristics[J]. Automation of Electric Power Systems,2005,29(22): 33-38(in Chinese).

[2] TSEKOURAS G J,KOTOULAS P B,TSIREKIS C D. A pattern recognition methodology for evaluation of load profiles and typical days of large electricity customers[J].Electric Power Systems Research,2008(27): 1494-1510.

[3] BIDOKI S M,MAHMOUDI-KOHAN N. Evaluating different clustering techniques for electricity customer classification[C]. Transmission and Distribution Conference and Exposition,2010 IEEE PES: 1-5.

[4] Teemu rasanen,Dimitrios Voukantsis. Data-based method for creating electricity use load profiles using large amount of customer-specific hourly measured electricity use data[J].Applied Energy,2010(87): 3538-3545.

[5] WANG Wensheng,WANG Jin,WANG Kewen. Application of SOM neural network and C-means method in load classification[J]. Proceedings of the CSU-EPSA,2011,23(4): 36-39.

[6] 周歡,李廣明,張高煜. SOM+K-means兩階段聚類算法及其應用[J]. 計算機應用技術,2010(16): 113-116.ZHOU Huan,LI Guangming,ZHANG Gaoyu. SOM+Kmeans two-phase clustering algorithm and its application[J].Modern Electronics Technique,2010(16): 113-116(in Chinese).

[7] TANG Guangze,WANG Jin,LI Cailing. Study on characteristics classification of power load based on ward method[J]. Journal of Electric Power,2008,12(23): 470-473.

[8] 周涓,熊忠陽,張玉芳,等. 基于最大最小距離法的多中心聚類算法[J]. 計算機用,2006,26(6): 1425-1428.ZHOU Juan,XIONG Zhongyang,ZHANG Yufang,et al.Multiseed clustering algorithm based on max-min distance means[J]. Computer Applications,2006,26(6): 1425-1428(in Chinese).

[9] YU Jian,GUO Ping. Research of clustering algorithm of self-organizing maps neural networks[J]. Modern Computer,2007(255): 7-9.

[10] 于昊,趙乃良,陳小雕. 類曲率在曲線相似性判定中的應用[J]. 中國圖象圖形學報,2012,17(5): 707-714.YU Hao,ZHAO Nailiang,CHEN Xiaodiao.Quasi-curvature and its application in similarity measurement of curves[J].Journal of Image and Graphics,2012,17(5): 707-714(in Chinese).

[11] 朱潔,黃樟燦,彭曉琳. 基于離散Fréchet 距離的判別曲線相似性的算法[J]. 武漢大學學報:理學版,2009,55(2): 227-232.ZHU Jie,HUANG Zhangcan,PENG Xiaolin. Curve similarity judgment based on the discrete fréchet distance[J].Wuhan University Journal,2009,55(2): 227-232(in Chinese).

[12] 葉明. 中國加工貿(mào)易商品演變過程分析—基于曲線聚類方法研究[J]. 世界經(jīng)濟研究,2011(8): 49-54.YE Ming. The evolution of China’s processing trade goods:an analysis based on the curves clustering method[J]. World Economy Study,2011(8): 49-54(in Chinese).

[13] 葉明,王惠文,寇微. 大規(guī)模曲線的自動分類方法及其應用[J]. 系統(tǒng)管理學報,2010,19(2): 640-644.YE Ming. WANG Huiwen,KOU Wei. Automatic classification method of large-scale curves and application[J].Journal of Systems&Management,2010,19(2): 640-644(in Chinese).

[14] 馮曉蒲.基于實際負荷曲線的電力用戶分類技術研究[D].北京: 華北電力大學,2010.

[15] 鞠平,金艷,吳峰,等. 綜合負荷特性的分類綜合方法及其應用[J]. 電力系統(tǒng)自動化,2004,28(1): 64-68.JU Ping,JIN Yan,WU Feng,et al. Studieson classifieation and synthesis of cornposite dynarnie loads[J]. Automation of Eleetrie Power Systems,2004,28(1): 64-68(in Chinese).

[16] 張忠華. 電力系統(tǒng)負荷分類研究[D]. 天津: 天津大學,2007.

[17] 賀仁睦,劉應梅. 基于KOHONEN神經(jīng)網(wǎng)絡的電力系統(tǒng)負荷動特性聚類與綜合[J]. 中國電機工程學報,2003,23(5): 1-5.HE Renmu,LIU Yingmei. The characteristics clustering and synthesis of electric dynamic loads based on KOHONEN neural network[J]. Proceedings of the CSEE,2003,23(5):1-5(in Chinese).

猜你喜歡
標準差聚類距離
用Pro-Kin Line平衡反饋訓練儀對早期帕金森病患者進行治療對其動態(tài)平衡功能的影響
算距離
基于DBSACN聚類算法的XML文檔聚類
電子測試(2017年15期)2017-12-18 07:19:27
每次失敗都會距離成功更近一步
山東青年(2016年3期)2016-02-28 14:25:55
基于改進的遺傳算法的模糊聚類算法
對于平均差與標準差的數(shù)學關系和應用價值比較研究
愛的距離
母子健康(2015年1期)2015-02-28 11:21:33
一種層次初始的聚類個數(shù)自適應的聚類方法研究
距離有多遠
自適應確定K-means算法的聚類數(shù):以遙感圖像聚類為例
如皋市| 高陵县| 利津县| 光山县| 平南县| 利川市| 射阳县| 出国| 汶川县| 中超| 临沂市| 于田县| 平湖市| 黄石市| 留坝县| 闵行区| 余干县| 双牌县| 神农架林区| 西贡区| 满洲里市| 泸州市| 兰坪| 修文县| 淄博市| 沽源县| 遵义县| 胶南市| 霍城县| 鄄城县| 巴楚县| 昆山市| 得荣县| 河东区| 沅江市| 关岭| 菏泽市| 开江县| 贵州省| 博白县| 万载县|