国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

智能電網(wǎng)中高維數(shù)據(jù)聚類方法研究

2016-03-02 08:47于君范文彬杜永軍
關(guān)鍵詞:聚類維度電網(wǎng)

于君 范文彬 杜永軍

摘要:隨著電網(wǎng)智能化程度的逐步深入,智能電網(wǎng)高維數(shù)據(jù)成為了“電網(wǎng)2.0”的重要價(jià)值資源。本文論述了智能電網(wǎng)大數(shù)據(jù)源、大數(shù)據(jù)流體系,討論了傳統(tǒng)電力數(shù)據(jù)聚類方法與特征,分析了智能電網(wǎng)高維數(shù)據(jù)所具有的稀疏性、空空間現(xiàn)象、維度效應(yīng)、Hubness現(xiàn)象和離群點(diǎn)檢測(cè)的特征,對(duì)智能電網(wǎng)高維數(shù)據(jù)從維數(shù)簡(jiǎn)化、索引技術(shù)、結(jié)果表征與評(píng)價(jià)方面論述了高維數(shù)據(jù)聚類分析方法和應(yīng)用實(shí)踐。

關(guān)鍵字:智能電網(wǎng);電網(wǎng)高維數(shù)據(jù);高維數(shù)據(jù)聚類

中圖分類號(hào):TP391,TP274, TM769文獻(xiàn)標(biāo)志碼:A文章編號(hào):2095-2163(2016)01-

Abstract: With the intellectualized development of power grid, SG (Smart Grid) high-dimensional databecomes the valuable resources of “Power Grid 2.0”. The big data resource and big data flow architecture of SG has been discussed. And the methods and characteristics of traditional electric power data clustering have been analyzed. After that, the characteristics of sparsity, empty space phenomenon, Dimensionality, Hubnessphenomenon, outlier detection and similarity measurein SGhigh-dimensional data have also been analyzed. Based on the aboved, the analytical methods and applications have been discussed in detail from several aspects of dimension reduction, indexing technique, result demonstrability and evaluation.

Keywords: smart Grid; SG high-dimensional data;high-dimensional data clustering

0 引言

隨著電力網(wǎng)絡(luò)向著智能化、集約化、清潔化方向的發(fā)展,電力網(wǎng)絡(luò)數(shù)據(jù)的規(guī)模化、高維化和關(guān)聯(lián)化程度日益加深,對(duì)于高維數(shù)據(jù)的數(shù)據(jù)挖掘成為了電力數(shù)據(jù)“工程化”向電力運(yùn)維“價(jià)值化”的關(guān)鍵環(huán)節(jié)[1-2]。通過(guò)電力網(wǎng)絡(luò)高維大數(shù)據(jù)挖掘技術(shù)可以實(shí)現(xiàn)電網(wǎng)規(guī)劃建設(shè)全景可視化、網(wǎng)絡(luò)運(yùn)行實(shí)時(shí)動(dòng)態(tài)監(jiān)控決策、復(fù)雜大電網(wǎng)建模降維與解耦、電網(wǎng)能量傳遞與轉(zhuǎn)化效能分析、網(wǎng)絡(luò)暫態(tài)保護(hù)控制策略分析等方面的價(jià)值應(yīng)用[3]。聚類挖掘分析方法是數(shù)據(jù)挖掘技術(shù)重要手段,其在電力運(yùn)動(dòng)異常檢測(cè)[4]、電力用戶行為分析[5]、電力負(fù)荷曲線聚類[6]、電網(wǎng)覆冰預(yù)警[7]等方面具有重要的理論研究意義和工程實(shí)踐價(jià)值。

1智能電網(wǎng)大數(shù)據(jù)

智能電網(wǎng)依托無(wú)線傳感器網(wǎng)絡(luò)(WSN,Wireless Sensor Network)和物聯(lián)網(wǎng)技術(shù)(IOT,Internet of Things)實(shí)現(xiàn)了信息資源的整合,具體而言,WSN實(shí)現(xiàn)了末端設(shè)備/傳感器完成數(shù)據(jù)采集和轉(zhuǎn)換功能;IOT通過(guò)無(wú)線/有線數(shù)據(jù)傳輸技術(shù)實(shí)現(xiàn)感知數(shù)據(jù)、控制命令等信息資源的傳播;最后基于感知數(shù)據(jù)資源實(shí)現(xiàn)了系統(tǒng)管理、信息挖掘、商業(yè)智能等電網(wǎng)智能全流程。

智能電網(wǎng)技術(shù)與大數(shù)據(jù)分析有著與生俱來(lái)的緊密聯(lián)系,智能電網(wǎng)的全生命周期各環(huán)節(jié)(需求分析、規(guī)劃建設(shè)、優(yōu)化升級(jí)、技術(shù)標(biāo)準(zhǔn)、流程規(guī)范、生產(chǎn)運(yùn)營(yíng)、商業(yè)營(yíng)銷等)均需要持久可靠的數(shù)據(jù)資源提供決策支撐。智能電網(wǎng)大數(shù)據(jù)重點(diǎn)方向及領(lǐng)域涉及社會(huì)化行業(yè)服務(wù)(能源政策分析與制定、新能源開(kāi)發(fā)與推廣等)、個(gè)性化用戶服務(wù)(需求側(cè)相響應(yīng)與管理、客戶服務(wù)能效評(píng)估、混合動(dòng)力汽車設(shè)施建設(shè)與支撐等)、電力企業(yè)運(yùn)營(yíng)(電力系統(tǒng)監(jiān)控與調(diào)度、電力設(shè)備維護(hù)與管理、發(fā)電儲(chǔ)電輸電動(dòng)態(tài)匹配等)[8]。

以電力規(guī)劃設(shè)計(jì)為例,行業(yè)設(shè)計(jì)標(biāo)準(zhǔn)的合理性是通過(guò)反復(fù)的實(shí)驗(yàn)數(shù)據(jù)和工程實(shí)踐共同形成的規(guī)律性參數(shù)總結(jié),同時(shí)需要結(jié)合不同的應(yīng)用環(huán)境(風(fēng)力、土質(zhì)、溫濕度等等)的周期性變化進(jìn)行適用性的修正,甚至是階段性動(dòng)態(tài)修正;在生產(chǎn)運(yùn)營(yíng)環(huán)節(jié)中,智能電網(wǎng)的電能轉(zhuǎn)換、電力輸送、變電配電、電力調(diào)度等各環(huán)節(jié)均需要基于數(shù)據(jù)的精細(xì)化、預(yù)判性的決策,而這種決策方式需要長(zhǎng)期的數(shù)據(jù)積累才能完成合理正確的指揮調(diào)度。

傳輸電網(wǎng)的各個(gè)環(huán)節(jié)均為一個(gè)相對(duì)獨(dú)立的功能單位,因而從主干線輸電網(wǎng)、區(qū)域性配電網(wǎng)、企業(yè)送電網(wǎng)直至家庭用電網(wǎng)均需要全程監(jiān)控,最終形成了由末端用戶“細(xì)胞數(shù)據(jù)”、接入電網(wǎng)“血管數(shù)據(jù)”、傳輸電網(wǎng)“動(dòng)脈數(shù)據(jù)”、電力源頭“心臟數(shù)據(jù)”等一系列連續(xù)且微量的數(shù)據(jù)構(gòu)成智能電網(wǎng)“大數(shù)據(jù)”。電網(wǎng)大數(shù)據(jù)不僅具有大數(shù)據(jù)共性 “3V” 特征,即:海量數(shù)據(jù)(Volume)、多源種類(Variety)、高速流動(dòng)(Velocity),而且具有電力行業(yè)“3E”,即:數(shù)據(jù)即能量(Energy)、數(shù)據(jù)即交互(Exchange)、數(shù)據(jù)即共情(Empathy),以智能電表為例,如果電能計(jì)量單位由“千瓦時(shí)”等級(jí)細(xì)化為“瓦時(shí)”等級(jí),則時(shí)間單位管理粒度就要縮小為約1秒,那么就要將現(xiàn)行的采集頻率由15分鐘調(diào)整至1秒,1萬(wàn)臺(tái)智能電表所獲得計(jì)量信息數(shù)據(jù)則由32.61GB增長(zhǎng)至114.6TB[9]。除此之外,基于電網(wǎng)資源分布與拓?fù)潢P(guān)系的故障管理、基于用戶的用電行為習(xí)慣及地理信息的個(gè)性化營(yíng)銷方案、基于電網(wǎng)設(shè)備特性的智能自修復(fù)控制、基于運(yùn)行數(shù)據(jù)的全網(wǎng)態(tài)勢(shì)評(píng)估等等都將為成為大數(shù)據(jù)的來(lái)源和研究方向。智能電網(wǎng)大數(shù)據(jù)依托電網(wǎng)特性可以實(shí)現(xiàn)低損失、低消耗、無(wú)污染的傳輸,并且在周期性循環(huán)過(guò)程中實(shí)現(xiàn)服務(wù)價(jià)值凝練和升華、商業(yè)價(jià)值的低成本和可持續(xù)。

智能電網(wǎng)的大數(shù)據(jù)來(lái)源涵蓋外部環(huán)境數(shù)據(jù)、企業(yè)運(yùn)營(yíng)運(yùn)行實(shí)時(shí)數(shù)據(jù)以及數(shù)據(jù)管控分析數(shù)據(jù)等多個(gè)層面,通過(guò)科學(xué)合理歸納和經(jīng)驗(yàn)總結(jié)修正,最終將指導(dǎo)末端環(huán)節(jié)的生產(chǎn)實(shí)踐和運(yùn)營(yíng)管理,例如:電網(wǎng)運(yùn)維(網(wǎng)絡(luò)規(guī)劃建設(shè)、設(shè)備運(yùn)轉(zhuǎn)性能指標(biāo)等)、商業(yè)營(yíng)銷(電價(jià)評(píng)估、銷售方案、客戶維系等)、企業(yè)經(jīng)營(yíng)(公司運(yùn)營(yíng)規(guī)劃、內(nèi)部辦公流程等);從生產(chǎn)消費(fèi)角度而言,大數(shù)據(jù)來(lái)源涉及發(fā)電側(cè)、輸變電側(cè)和用電側(cè)。

2 智能電網(wǎng)大數(shù)據(jù)流

由圖1可知,體系結(jié)構(gòu)模型中每一主體層級(jí)的功能實(shí)現(xiàn)闡析可作如下表述:

(1)信息感知層。該層作用是感知、識(shí)別特定目標(biāo)信息并實(shí)現(xiàn)傳感器組網(wǎng)與信息獲取,包括智能傳感器、高清攝像頭、北斗衛(wèi)星導(dǎo)航系統(tǒng)(BDS,Big Dipper Navigation System)、全球定位系統(tǒng)(GPS,Global Positioning System)等設(shè)備,其中的主要技術(shù)包括WSN自組織網(wǎng)絡(luò)技術(shù)、高速電路設(shè)計(jì)技術(shù)、微機(jī)電系統(tǒng)(MEMS,Micro-Electro-Mechanical Systems)、編碼/解碼技術(shù)、抗干擾技術(shù)、傳輸加密技術(shù)、短距離組網(wǎng)傳輸技術(shù)。從信息傳播方式而言,信息感知層位于整個(gè)信息體系的信源,需探測(cè)的電網(wǎng)參數(shù)豐富。

(2)數(shù)據(jù)交互層。該層作用主要是實(shí)現(xiàn)數(shù)據(jù)的交互與傳輸,承載數(shù)據(jù)信息的載體可以是寬帶互聯(lián)網(wǎng)、有線接入網(wǎng)、移動(dòng)通信網(wǎng)絡(luò)等等,例如:2G/3G/4G/5G信息通信技術(shù)、異構(gòu)網(wǎng)絡(luò)融合技術(shù)、信息編碼/鑒權(quán)技術(shù)、自適應(yīng)傳輸技術(shù)、電力線通信等。

(3)信息應(yīng)用層。該層主要是實(shí)現(xiàn)為電網(wǎng)服務(wù)客戶和電力企業(yè)自身決策提供解決方案,其中包括大數(shù)據(jù)存儲(chǔ)技術(shù)、云計(jì)算技術(shù)、物聯(lián)網(wǎng)技術(shù)、分布式存儲(chǔ)技術(shù)、分布式計(jì)算技術(shù)、信息聚合技術(shù)等,同時(shí)融入全球定位系統(tǒng)(GPS,Global Positioning System)、遙感遙測(cè)技術(shù)(RS,Remote Sensing)、地理信息系統(tǒng)(GIS,Geographic Information System)、電網(wǎng)管理/專家決策模型等相對(duì)豐富的應(yīng)用平臺(tái)。

3 傳統(tǒng)聚類方法

對(duì)于單一的電力數(shù)據(jù)而言,可采用的聚類分析方法包括:層次方法、劃分方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。在此,給出各類方法的關(guān)鍵實(shí)用概述。

(1)層次方法(Hierarchical Methods)

層次法是基于目標(biāo)數(shù)據(jù)集合進(jìn)行層次化的分解過(guò)程。根據(jù)目標(biāo)數(shù)據(jù)集合的層次分解過(guò)程可以分為凝聚式層次法(自底而上)和分裂式層次法(自底而上)。其中,凝聚式層次法將目標(biāo)數(shù)據(jù)集中所包含的每個(gè)對(duì)象作為一個(gè)類,再逐步迭代合并相近的對(duì)象或者類,直至合并成為一個(gè)包含所有對(duì)象的類或者達(dá)到所設(shè)置的其他終止條件;而分裂式層次法則是將全部目標(biāo)數(shù)據(jù)集中具體包含的所有對(duì)象視為一個(gè)類,而后迭代分解為更小的類直至每個(gè)對(duì)象成為一個(gè)類或者達(dá)到所設(shè)置的其他終止條件[10]。

層次聚類法的典型算法有ROCK聚類算法、BIRCH聚類算法、CURE聚類算法。

(2)劃分法(Partition Clustering)

劃分法將包含n個(gè)對(duì)象的數(shù)據(jù)集合按照分類規(guī)則劃分為k個(gè)類(k不大于n)。每個(gè)類至少包含一個(gè)對(duì)象,每個(gè)對(duì)象只屬于一個(gè)類。該方法實(shí)現(xiàn)過(guò)程:首先初始化類的個(gè)數(shù)k,劃分方法將隨即創(chuàng)建一個(gè)初始劃分,再通過(guò)迭代優(yōu)化形成更優(yōu)的類劃分結(jié)果,劃分過(guò)程遵循下述準(zhǔn)則,即:相同類分組距離越近越好,不同類分組距離越遠(yuǎn)越好。

劃分聚類法的典型算法有:CLARANS聚類算法、k-Means聚類算法、k-Modes聚類算法、k-Prototypes聚類算法等[11]。

(3)密度法(Density-based Methods)

密度法是以目標(biāo)數(shù)據(jù)的分布密度為基礎(chǔ),規(guī)避了距離聚類方式的球狀聚類局限性,進(jìn)而實(shí)現(xiàn)了任意形態(tài)的聚類形式。該方法實(shí)現(xiàn)過(guò)程:首先設(shè)定密度閾值m和聚類包含數(shù)據(jù)最小個(gè)數(shù)n,當(dāng)某個(gè)區(qū)域的目標(biāo)數(shù)據(jù)分布密度超出閾值則形成聚類,且每個(gè)類中目標(biāo)數(shù)據(jù)個(gè)數(shù)不小于n。

密度聚類法的典型算法有:基于密度分布函數(shù)的DENCLUE聚類算法、基于高密度連接區(qū)域的DBSCAN聚類算法[12]。

(4)網(wǎng)格法(Grid-based Methods)

該方法首先將目標(biāo)數(shù)據(jù)空間劃分為n個(gè)單元的網(wǎng)格結(jié)構(gòu),然后基于網(wǎng)格單元進(jìn)行聚類劃分。

網(wǎng)格聚類法的典型算法有:基于統(tǒng)計(jì)信息的STING聚類算法、基于小波變換的WaveCluster聚類算法、基于網(wǎng)格和密度的OptiGrid聚類算法、基于聚類高維空間的CLIQUE聚類算法等。

(5)模型法(Model-based Methods)

模型法是通過(guò)自行設(shè)定聚類條件模型,尋找目標(biāo)數(shù)據(jù)與設(shè)定聚類條件模型之間的最佳匹配模式,過(guò)程中則假設(shè)目標(biāo)數(shù)據(jù)集合具有一系列的概率分布規(guī)律特征。

模型聚類算法有:COBWeb(統(tǒng)計(jì)學(xué)方法)聚類算法,COBWeb是增量式概念聚類方法,通過(guò)采用分類樹(shù)的形式表征層次聚類。

對(duì)上述傳統(tǒng)典型聚類算法進(jìn)行性能評(píng)價(jià)比較,具體結(jié)果如表1所示[13-14]。

4 電力高維數(shù)據(jù)聚類方法

4.1 電力高維數(shù)據(jù)特征

隨著互聯(lián)網(wǎng)技術(shù)、物聯(lián)網(wǎng)技術(shù)和傳感器網(wǎng)絡(luò)技術(shù)的發(fā)展,電力運(yùn)營(yíng)中的發(fā)電、輸電、配電、用電等全流程電力環(huán)節(jié)均會(huì)產(chǎn)生海量且多維的指標(biāo)數(shù)據(jù),這些數(shù)據(jù)的資源化向價(jià)值化轉(zhuǎn)變成為了電力信息研究的重要課題。1961年由Bellman 提出“維度災(zāi)難”,即:在多變量函數(shù)中數(shù)據(jù)對(duì)象屬性維數(shù)增加,其網(wǎng)格單元數(shù)量將會(huì)以指數(shù)級(jí)速度增長(zhǎng),因而在多維網(wǎng)格中優(yōu)化該函數(shù)是不可能的事情。而高維數(shù)據(jù)聚類分析就是典型的“維度災(zāi)難”問(wèn)題分析。由于高維數(shù)據(jù)特征導(dǎo)致高維數(shù)據(jù)對(duì)傳統(tǒng)聚類分析帶來(lái)了一系列的困難與挑戰(zhàn),分析闡釋如下:

(1)稀疏性(Sparsity)

隨著維度增長(zhǎng)的目標(biāo)數(shù)據(jù)在維度空間中會(huì)遵照其自身的分布特征,但是對(duì)于同步增長(zhǎng)的維度空間而言仍然是稀疏的[15]。

(2)空空間現(xiàn)象(Empty Space Phenomenon)

以正態(tài)分布的目標(biāo)數(shù)據(jù)密度函數(shù)為例,當(dāng)維度值增加為10,分布在中心區(qū)域的數(shù)據(jù)點(diǎn)不到1%[16]。

(3)維度效應(yīng)(Dimensionality)

隨著目標(biāo)數(shù)據(jù)的維度數(shù)量過(guò)多將導(dǎo)致數(shù)據(jù)索引效率下降,當(dāng)目標(biāo)數(shù)據(jù)維度增大,數(shù)據(jù)樣本之間的距離變得等距且稀疏,這就使得傳統(tǒng)的平等使用每個(gè)特征的距離度量將因此而出現(xiàn)失效[17]。對(duì)于高維數(shù)據(jù)聚類分析而言,數(shù)據(jù)自身所蘊(yùn)含大量無(wú)關(guān)屬性,導(dǎo)致此類數(shù)據(jù)噪聲和冗余特征將直接影響聚類分析效果。

(4)Hubness現(xiàn)象(Hubness Phenomenon)

高維數(shù)據(jù)空間Nk(x)分布呈現(xiàn)出明顯右偏態(tài),隨著數(shù)據(jù)維度增大則該分布特征越加明顯,導(dǎo)致少量數(shù)據(jù)點(diǎn)頻繁出現(xiàn)在其他數(shù)據(jù)點(diǎn)的K最近鄰列表中[18]。

(5)離群點(diǎn)檢測(cè)(Outlier Detection)

高維數(shù)據(jù)由于自身的稀疏分布特點(diǎn)導(dǎo)致高維數(shù)據(jù)中的離群點(diǎn)檢測(cè)難度提高,特別是基于深度、偏差、距離或密度的傳統(tǒng)聚類分析在高維數(shù)據(jù)流存在明顯不足。

(6)相似性度量(Similarity Measure)

對(duì)于高維數(shù)據(jù)采用傳統(tǒng)聚類距離度量法用于判別衡量對(duì)象之間相似度,導(dǎo)致搜索近鄰點(diǎn)結(jié)果的有效性和穩(wěn)定性呈現(xiàn)出下降態(tài)勢(shì)。

4.2電力高維數(shù)據(jù)聚類方法

(1)維數(shù)簡(jiǎn)化(Dimension Reduction)

通過(guò)降維處理將高維屬性降至較低維空間,進(jìn)而使用傳統(tǒng)聚類分析方法進(jìn)行數(shù)據(jù)分析。維數(shù)簡(jiǎn)化可以通過(guò)特征變換(FT,F(xiàn)eature Transformation)和特征選擇(FS,F(xiàn)eature Selection)來(lái)展開(kāi)并實(shí)現(xiàn),或者采用非線性維數(shù)簡(jiǎn)化方法(流形學(xué)習(xí)),典型的流形學(xué)習(xí)方法有等距映射、局部線性嵌入以及拉普拉斯特征變換。對(duì)于需考慮數(shù)據(jù)子集屬性差異亦可采用全局維度簡(jiǎn)化(GDR,Global Dimension Reduction)或者局部維度簡(jiǎn)化(LDR,Local Dimension Reduction)不同的維數(shù)簡(jiǎn)化分析手段。

(2)索引技術(shù)(Indexing Technique)

高維數(shù)據(jù)將導(dǎo)致聚類算法的復(fù)雜程度在時(shí)間維度和空間維度上均已表現(xiàn)出指數(shù)級(jí)代價(jià)增長(zhǎng)方式,通過(guò)構(gòu)建快速的高維數(shù)據(jù)索引結(jié)構(gòu)和優(yōu)化高維相似性查詢手段即可實(shí)現(xiàn)高維數(shù)據(jù)信息的快速檢索和交互。高維索引結(jié)構(gòu)包括向量空間索引結(jié)構(gòu)(SAM,Spatial Access Method),例如:R-tree、R*-tree;度量空間索引結(jié)構(gòu)(MAM,Metric Access Method),例如:M-tree、M+-tree等[19]。

(3)結(jié)果表征與評(píng)價(jià)(Result Demonstrability and Evaluation)

通常聚類結(jié)果表征與評(píng)價(jià)內(nèi)容包括:可伸縮性、多數(shù)據(jù)類型數(shù)據(jù)處理能力、發(fā)掘任意形狀簇的能力、輸入?yún)?shù)依賴性、噪聲數(shù)據(jù)分揀能力、數(shù)據(jù)順序敏感度、聚類結(jié)果可詮釋性等等[20]。但是由于高維數(shù)據(jù)具有多維屬性,因此對(duì)于聚類關(guān)系結(jié)果表征與評(píng)價(jià)復(fù)雜度也將有所提升,特別是聚類關(guān)系可視化和聚類邏輯解釋勢(shì)必存在較高的難度,進(jìn)而對(duì)于聚類結(jié)果的有效性和準(zhǔn)確性則將缺乏有效評(píng)估手段。

另外,朱付保等提出了一種基于粗糙集理論的模糊C-means高維數(shù)據(jù)聚類算法,該算法將模糊C-Means算法融入了粗糙集屬性約簡(jiǎn)思想,提取出對(duì)分類影響較大的屬性集而摒棄與分類無(wú)關(guān)的屬性,在聚類過(guò)程中只計(jì)算屬性約簡(jiǎn)結(jié)果集中的屬性,進(jìn)而減少聚類過(guò)程的工作量、提高聚類效率[21];汪仁紅等提出了一種基于投影和密度的高維數(shù)據(jù)流聚類算法(HpDenStream算法),該算法結(jié)合滑動(dòng)窗口技術(shù),采用投影算法對(duì)高維數(shù)據(jù)流進(jìn)行降維處理并運(yùn)用密度聚類算法對(duì)降維后的數(shù)據(jù)進(jìn)行異常數(shù)據(jù)檢測(cè),經(jīng)仿真測(cè)試:HpDenStream算法在存儲(chǔ)空間占用和運(yùn)行效率均要優(yōu)于基于主成分的聚類算法(PCA算法)[22];王倩等提出了云環(huán)境下聚類分解的高維數(shù)據(jù)混合索引方法。該方法采用聚類分解方法對(duì)分割數(shù)據(jù)建立樹(shù)狀索引;以葉節(jié)點(diǎn)為單位,通過(guò)掃描線算法來(lái)獲取節(jié)點(diǎn)內(nèi)部所有對(duì)象的局部最近鄰結(jié)果;最后依據(jù)計(jì)算的結(jié)果得出啟發(fā)式的裁剪距離。在單節(jié)點(diǎn)最近鄰計(jì)算中,第二個(gè)階段獲取外部的最近鄰對(duì)象采用范圍查詢算法。實(shí)驗(yàn)分析表明,在查詢效率上該索引方法高于單純的聚類方法,與M-tree、順序查找、iDisance相比,基于聚類分解的混合索引方法在高維查詢模式下則具有良好的查詢效率和負(fù)載均衡[23]。

5 結(jié)束語(yǔ)

電力網(wǎng)絡(luò)中海量多維數(shù)據(jù)為電網(wǎng)運(yùn)營(yíng)能力的拓展優(yōu)化提供著豐富的數(shù)據(jù)資源,有效挖掘資源價(jià)值是電網(wǎng)運(yùn)營(yíng)的關(guān)鍵環(huán)節(jié)。傳統(tǒng)的數(shù)據(jù)聚類分析手段可以有效實(shí)現(xiàn)對(duì)于單一數(shù)據(jù)的挖掘分析,但是在多維度電網(wǎng)數(shù)據(jù)方面則需要針對(duì)其數(shù)據(jù)特征采用合理的計(jì)算方法。

電力網(wǎng)絡(luò)多維數(shù)據(jù)挖掘(例如:關(guān)聯(lián)分析、主成分分析、動(dòng)態(tài)可視化分析)將有效推動(dòng)規(guī)劃、發(fā)電、輸電、變電、配電、用電等各環(huán)節(jié)的智能化、信息化、科學(xué)化的互動(dòng)管理和精細(xì)運(yùn)維。

參考文獻(xiàn):

[1]李智勇. 電力系統(tǒng)運(yùn)行信息的數(shù)據(jù)挖掘研究[D]. 杭州: 浙江大學(xué), 2009.

[2]張東霞,苗新,劉麗平,等. 智能電網(wǎng)大數(shù)據(jù)技術(shù)發(fā)展研究[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2015, 35(1): 2-12.

[3]李澤文, 鄧拓夫, 曾祥君,等. 智能電網(wǎng)能量流的時(shí)空多尺度大數(shù)據(jù)探討[J]. 電力科學(xué)與技術(shù)學(xué)報(bào), 2015, 30(1): 22-27.

[4]陳利躍, 杭鐘靈, 余亮,等. 基于馬氏距離的雙層聚類電力遠(yuǎn)動(dòng)異常檢測(cè)[J]. 控制工程, 2015,22(2): 360-364.

[5]彭顯剛, 賴家文, 陳奕. 基于聚類分析的客戶用電模式智能識(shí)別方法[J]. 電力系統(tǒng)保護(hù)與控制, 2014, 42(19): 68-73.

[6]張斌, 莊池杰, 胡軍,等. 結(jié)合降維技術(shù)的電力負(fù)荷曲線集成聚類算法[J]. 2015, 35(15): 3741-3749.

[7]羅永勤, 周景, 武國(guó)亮,等. 基于聚類算法的電網(wǎng)覆冰災(zāi)害分級(jí)預(yù)警模型研究[J]. 內(nèi)蒙古電力技術(shù), 2015, 33(1): 13-16.

[8]王秋平, 陳志強(qiáng), 魏浩. 基于數(shù)據(jù)挖掘的電站運(yùn)行參數(shù)目標(biāo)值優(yōu)化[J]. 電力科學(xué)與工程, 2015, 31(7): 19-24.

[9]中國(guó)電機(jī)工程學(xué)會(huì)電力信息化專委會(huì). 中國(guó)電力大數(shù)據(jù)發(fā)展白皮書(shū)[R]. 北京: 中國(guó)電機(jī)工程學(xué)會(huì)電力信息化專委會(huì), 2013.

[10]王芳. 傳統(tǒng)聚類方法的分析及改進(jìn)[D]. 長(zhǎng)沙: 中南大學(xué), 2007.

[11]盧志茂, 馮進(jìn)玫, 范冬梅,等. 面向大數(shù)據(jù)處理的劃分聚類新方法[J]. 系統(tǒng)工程與電子技術(shù), 2014, 36(5): 1010-1115.

[12]沈明明. 聚類算法的研究及應(yīng)用——基于群智能技術(shù)的聚類算法研究[D]. 無(wú)錫: 江南大學(xué), 2011.

[13]Y.P. YAO. 聚類分析中幾種算法的比較[EB/OL].(2011-03-27) [2015-08-08]. http://blog.csdn.net/yaoyepeng/article/details/6281991, 2015-08-08.

[14]Johnho. 聚類算法總結(jié)[EB/OL]. (2013-06-06) [2015-08-08]. http://blog.chinaunix.net/uid-10289334-id-3758310.html, 2015-08-08.

[15]D.L.Donoho. High-Dimensional Data Analysis: The Curses and Blessings of Dimensionality [Z]. Los Angeles: Aide-Memoire of the lecture in AMS conference of the 21st Century, 2000.

[16]M. Verleysen. Learning High-dimensional Data[Z]. Siena: Limitations and Future Trends in Neural Computation, S.Ablameyko et al.(Eds.), 2003: 141-62.

[17]劉建偉. 基于高維數(shù)據(jù)上集成聚類的個(gè)性化推薦算法研究[D]. 廣州: 華南理工大學(xué), 2014.

[18]張巧達(dá), 何振峰. 基于Hub 的高維數(shù)據(jù)初始聚類中心的選擇策略[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2015, 24(4): 171-175.

[19]張井. 高維數(shù)據(jù)子空間聚類算法研究[D]. 天津: 天津大學(xué), 2012.

[20]任亞洲. 高維數(shù)據(jù)上的聚類方法研究[D]. 廣州: 華南理工大學(xué), 2014.

[21]朱付保, 徐顯景, 白慶春等. 基于粗糙集理論的模糊C-means高維數(shù)據(jù)聚類算法[J]. 華中師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2015, 29(4): 511-514.

[22]汪仁紅, 王家偉, 梁宗保. 基于投影和密度的高維數(shù)據(jù)流聚類算法[J]. 重慶交通大學(xué)學(xué)報(bào)(自然科學(xué)版), 2013, 32(4): 725-728.

[23]王倩, 朱變. 云環(huán)境下聚類分解的高維數(shù)據(jù)混合索引方法[J]. 周口師范學(xué)院學(xué)報(bào), 2015, 32(2): 116-119.

猜你喜歡
聚類維度電網(wǎng)
數(shù)字化電網(wǎng)技術(shù)在電網(wǎng)規(guī)劃設(shè)計(jì)中的應(yīng)用
穿越電網(wǎng)
基于知識(shí)維度和認(rèn)知過(guò)程維度的古典名著整本書(shū)閱讀教學(xué)課型探討
基于模糊聚類和支持向量回歸的成績(jī)預(yù)測(cè)
多媒體情境下培養(yǎng)學(xué)生閱讀素養(yǎng)的三個(gè)維度
幼兒教師專業(yè)成長(zhǎng)的三個(gè)維度
基于流形學(xué)習(xí)的自適應(yīng)反饋聚類中心確定方法
基于密度的自適應(yīng)搜索增量聚類法