国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于遺傳聚類的配電變壓器運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)修復(fù)研究

2016-07-05 20:33:03朱江峰單林森黃建楊
科技風(fēng) 2016年18期

朱江峰 單林森 黃建楊

摘 要:為了減少配網(wǎng)設(shè)備運(yùn)行大數(shù)據(jù)在采集以及傳輸?shù)倪^程中容易發(fā)生的丟失或者損壞,保證配網(wǎng)設(shè)備運(yùn)行檢修工作質(zhì)量,提高整個(gè)電網(wǎng)的安全穩(wěn)定性。本文結(jié)合了不完整信息系統(tǒng)原理、近鄰傳播聚類原理以及遺傳優(yōu)化算法原理,提出了一種面向配網(wǎng)設(shè)備運(yùn)行狀態(tài)的遺傳聚類數(shù)據(jù)修復(fù)方法,充分有效的對大規(guī)模、復(fù)雜、不完整的配網(wǎng)設(shè)備運(yùn)行參數(shù)進(jìn)行分析以及修復(fù)。通過對實(shí)際配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)進(jìn)行驗(yàn)證,結(jié)果表明所提出的方法有效的分析和修復(fù)了配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù),具有實(shí)際應(yīng)用價(jià)值。

關(guān)鍵詞:配網(wǎng)設(shè)備;運(yùn)行參數(shù);近鄰傳播聚類;遺傳優(yōu)化;數(shù)據(jù)修復(fù)

隨著當(dāng)代電力科學(xué)的迅速發(fā)展,電力行業(yè)的配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)正以前所未有的速度增長,配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)處于大數(shù)據(jù)時(shí)代。配網(wǎng)信息的大數(shù)據(jù)在采集以及傳輸?shù)倪^程中都容易發(fā)生丟失或者損壞,導(dǎo)致配網(wǎng)設(shè)備運(yùn)行檢修工作質(zhì)量下降,從而影響整個(gè)電網(wǎng)的工作質(zhì)量。因此,針對配電變壓器設(shè)備的不完整運(yùn)行狀態(tài)參數(shù)進(jìn)行模式挖掘與填充修復(fù)的相關(guān)研究,有助于配電大數(shù)據(jù)信息的有效利用,對將強(qiáng)、健康智能電網(wǎng)的建設(shè)有著重要意義[ 1 ]。

傳統(tǒng)數(shù)據(jù)填充方法沒有充分考慮到數(shù)據(jù)對象之間的相關(guān)性,這就會(huì)導(dǎo)致填充的精度嚴(yán)重降低,如基于馬氏距離的缺失值的填充算法、基于貝葉斯網(wǎng)絡(luò)的缺失數(shù)據(jù)填充算法、決策樹算法中屬性缺失值的研究等[ 2-4 ]。上述傳統(tǒng)數(shù)據(jù)填充方法通常簡單的利用已有數(shù)據(jù)對缺失數(shù)據(jù)進(jìn)行填充,并未考慮到數(shù)據(jù)對象的類別特征,使得填充值容易受到噪聲的干擾,導(dǎo)致填充結(jié)果不精確。

本文提出了一種基于遺傳聚類的不完整信息填充方法,通過把數(shù)據(jù)對象劃分為完整數(shù)據(jù)集與不完整數(shù)據(jù)集,先對完整數(shù)據(jù)集進(jìn)行聚類,聚類過程中利用遺傳優(yōu)化原理對聚類參數(shù)進(jìn)行多次迭代優(yōu)化得出聚類中心點(diǎn)。之后計(jì)算不完整數(shù)據(jù)點(diǎn)與每個(gè)聚類中心的相似度,把不完整數(shù)據(jù)點(diǎn)劃分到相似度最大的類中,由于同一類數(shù)據(jù)相關(guān)性強(qiáng),即可利用同一類數(shù)據(jù)中的完整數(shù)據(jù)對不完整數(shù)據(jù)進(jìn)行填充,避免噪聲對填充值的干擾,并有效提高缺失數(shù)據(jù)的填充精度。

1 基于遺傳聚類的不完整數(shù)據(jù)修復(fù)理論

近鄰傳播(Affinity Propagation, AP)聚類算法是一種基于密度分布函數(shù)的方法的無監(jiān)督聚類算法,是由Frey等人于2007年首次提出[ 5 ]。AP算法將所有數(shù)據(jù)樣本均作為潛在聚類中心,自適應(yīng)于數(shù)據(jù)樣本進(jìn)行聚類,無需預(yù)先設(shè)置類別數(shù)量。在程序運(yùn)行中不斷迭代搜索合適的聚類中心,自動(dòng)識別聚類中心的位置以及聚類數(shù)目。其中,吸引度(Responsibility)表示以數(shù)據(jù)點(diǎn)k為數(shù)據(jù)點(diǎn)i聚類中心的適合程度,記做r(i,k)。而歸屬度(Availability)則表示數(shù)據(jù)點(diǎn)i選擇數(shù)據(jù)點(diǎn)k為聚類中心的適合程度,記做a(i,k)。

AP聚類算法通過消息傳播逐步實(shí)現(xiàn)對聚類中心的逼近,并通過如下更新規(guī)則對吸引度矩陣R=[r(i,k)]與歸屬度矩陣A=[a(i,k)]進(jìn)行迭代更新[ 2 ]:

首先,計(jì)算N個(gè)數(shù)據(jù)點(diǎn)的相似度值,建立相似度矩陣S矩陣,同時(shí)設(shè)定偏向參數(shù)。其次,設(shè)置最大迭代次數(shù)maxits值,迭代計(jì)算吸引度矩陣R和歸屬度矩陣A,并根據(jù)r(k,k)+a(k,k)值判斷是否為聚類中心(若(r(k,k)+a(k,k))>0則構(gòu)成一個(gè)聚類中心;反之,則不是聚類中心)。最后,對于數(shù)據(jù)點(diǎn)i,選擇r(i,k)+a(i,k)最大的數(shù)據(jù)點(diǎn)k為其真正聚類中心。值得注意的是,當(dāng)?shù)螖?shù)超過maxits值或多次迭代不發(fā)生改變時(shí)終止迭代。

遺傳優(yōu)化(Genetic Optimization)算法依據(jù)親本初始化解,通過復(fù)制、交叉以及突變等操作產(chǎn)生子代的解,淘汰適應(yīng)度較低的解以增加對最優(yōu)解的逼近效果。本文引入遺傳算法對傳統(tǒng)近鄰AP聚類中阻尼系數(shù)?姿、迭代次數(shù)最大值(maxits值)等聚類參數(shù)進(jìn)行優(yōu)化,用以提高聚類精度。遺傳算法的具體過程包括編碼方式及初始化、適應(yīng)度函數(shù)設(shè)計(jì)、遺傳操作、終止條件以及解碼等五個(gè)環(huán)節(jié)[ 6 ]。在對數(shù)據(jù)進(jìn)行聚類之后,由于同一類中的數(shù)據(jù)相似度高,不同類中的數(shù)據(jù)相似度低,本文利用與缺失屬性的對象在同一個(gè)類當(dāng)中的數(shù)據(jù)對象的相應(yīng)屬性的加權(quán)值作為該屬性的預(yù)測值。這種方法的關(guān)鍵在于確定各數(shù)據(jù)對象的加權(quán)系數(shù),為了能夠客觀準(zhǔn)確的確定加權(quán)系數(shù),本文采用信息論中熵值的概念,通過數(shù)據(jù)對象間的相似度提供的信息來確定加權(quán)系數(shù)。

2 仿真實(shí)例分析

2.1 基于遺傳聚類的不完整數(shù)據(jù)修復(fù)的實(shí)現(xiàn)

為了驗(yàn)證本文所提出的遺傳聚類算法對不完整數(shù)據(jù)的修復(fù)效果,本文使用基于PYTHON語言的仿真測試軟件進(jìn)行仿真測試,選取了國家電網(wǎng)公司某地區(qū)配網(wǎng)設(shè)備的運(yùn)行臺賬數(shù)據(jù)中50個(gè)型號為S9-M-500/10,500kV配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)中的配電變壓器短路阻抗、短路損耗、空載損耗、電壓等級、絕緣介質(zhì)以及額定容量等六類數(shù)據(jù)指標(biāo)形成的指標(biāo)向量作為樣本數(shù)據(jù)。聚類時(shí),根據(jù)遺傳優(yōu)化的結(jié)果,最大迭代次數(shù)maxits取10000次;聚類中心不變的最大迭代次數(shù)convits取50次;阻尼系數(shù)?姿取0.8。經(jīng)過1468次迭代計(jì)算,聚類中心不變次數(shù)達(dá)到了最大值50次,停止迭代,計(jì)算得到樣本聚類3個(gè)。

根據(jù)訓(xùn)練樣本聚類情況,參考樣本數(shù)據(jù),并依據(jù)國際行業(yè)標(biāo)準(zhǔn)《ANSI/IEEE C57.123-2010 變壓器損耗測量指南》以及《ANSI/UL 506-2008 專用變壓器的安全標(biāo)準(zhǔn)》等文件對配電變壓器設(shè)備運(yùn)行狀態(tài)的評定,樣本聚類符合以下描述:

樣本聚類1:以樣本16為聚類中心,包括樣本16、8、12、15、19、21、24、25、27、28、50等,此類樣本設(shè)備服役時(shí)間為3年及3年以下,數(shù)據(jù)反映設(shè)備運(yùn)行狀況良好,穩(wěn)定性較高。

樣本聚類2:以樣本35為聚類中心,包括樣本1、2、3、4、6、7、9、10、13、14、17、20、22、23、26、29、30、31、32、33、34、36、37、38、39、40、41、42、43、44、45、46、48、49等,此類樣本設(shè)備服役時(shí)間為4-8年,數(shù)據(jù)反映設(shè)備運(yùn)行狀況一般,存在著一定的設(shè)備損耗,穩(wěn)定性與新設(shè)備相比,有所降低。

樣本聚類3:以樣本47為聚類中心,包括樣本5、11等,此類樣本設(shè)備服役時(shí)間為9年及9年以上,數(shù)據(jù)反映設(shè)備運(yùn)行狀況較差,設(shè)備損耗比較嚴(yán)重,設(shè)備運(yùn)行穩(wěn)定性較低。

根據(jù)對樣本數(shù)據(jù)的有效聚類,本文選取了5個(gè)含有缺失數(shù)據(jù)的配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)數(shù)據(jù)樣本進(jìn)行修復(fù)填充。修復(fù)結(jié)果與原設(shè)備參數(shù)進(jìn)行對比,修復(fù)樣本1至5的修復(fù)精度分別為:98.73%、95.89%、94.38%、100%以及100%。

2.2 仿真對比實(shí)驗(yàn)結(jié)果分析

為了測試本文提出的算法的性能,將本文提出的算法同基于決策樹的缺失數(shù)據(jù)修復(fù)算法、以及基于馬氏距離的缺失數(shù)據(jù)修復(fù)算法進(jìn)行比較,實(shí)驗(yàn)結(jié)果如圖1所示。

由圖1可知,隨著數(shù)據(jù)缺失率的增長,基于決策樹、基于馬氏距離以及本文提出的基于遺傳聚類三種數(shù)據(jù)修復(fù)算法的修復(fù)精度均有所下降。在以上三種算法中,本文提出的算法有效避免了不同類對象對數(shù)據(jù)填充的影響,因而修復(fù)精度明顯高于另外兩種算法。

除此之外,當(dāng)數(shù)據(jù)缺失率超過15%時(shí),隨著缺失數(shù)據(jù)的增加,基于決策樹的缺失數(shù)據(jù)修復(fù)算法以及基于馬氏距離的缺失數(shù)據(jù)修復(fù)算法的修復(fù)精確度急劇降低,而本文提出的算法則比較穩(wěn)定,充分說明本文提出的算法對待缺失率較高的數(shù)據(jù)集中依然能保持良好的效果。

3 結(jié)論

由于配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)在采集和傳輸過程中容易丟失,導(dǎo)致了大數(shù)據(jù)的不完整性,阻礙了大數(shù)據(jù)的分析精度。本文提出將一種直接針對不完整數(shù)據(jù)進(jìn)行遺傳聚類的方法應(yīng)用于配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)分析上,給出了配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)的相似度度量方式,在此基礎(chǔ)上利用遺傳聚類算法對不完整配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)進(jìn)行聚類。最后,利用數(shù)據(jù)聚類結(jié)果對不完整設(shè)計(jì)數(shù)據(jù)進(jìn)行填充。

實(shí)驗(yàn)結(jié)果表明,本文提出的算法能夠有效地對不完整配電變壓器設(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)進(jìn)行聚類,同時(shí)能夠?qū)Σ煌暾潆娮儔浩髟O(shè)備運(yùn)行狀態(tài)參數(shù)數(shù)據(jù)進(jìn)行有效填充。

參考文獻(xiàn):

[1] 田冰冰,劉念,劉琨等.基于改進(jìn)蟻群算法的變壓器診斷數(shù)據(jù)的約簡[J].電力系統(tǒng)保護(hù)與控制,2011,39(1):96-99,122.

[2] 冷泳林,張清辰,魯富宇等.基于AP聚類的不完整大數(shù)據(jù)填充[J].計(jì)算機(jī)工程與應(yīng)用,2015,(10):123-127,141.

[3] 李宏,阿瑪尼,李平等.基于EM和貝葉斯網(wǎng)絡(luò)的丟失數(shù)據(jù)填充算法[J].計(jì)算機(jī)工程與應(yīng)用,2010,46(5):123-125.

[4] 冷泳林,陳志奎,張清辰等.不完整大數(shù)據(jù)的分布式聚類填充算法[J].計(jì)算機(jī)工程,2015,(5):19-25.

[5] 刁贏龍,盛萬興,劉科研等.大規(guī)模配電網(wǎng)負(fù)荷數(shù)據(jù)在線清洗與修復(fù)方法研究[J].電網(wǎng)技術(shù),2015,(11):3134-3140.

[6] 黃毅成,楊洪耕.改進(jìn)遺傳K均值算法在負(fù)荷特性分類的應(yīng)用[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2014,26(7):70-75.

作者簡介:

朱江峰(1974-),男,漢族,浙江紹興人,國家電網(wǎng)浙江省電力公司紹興供電公司,高級工程師,碩士、研究方向:配電變壓器檢測、數(shù)據(jù)修復(fù);

單林森(1981-),男,漢族,浙江紹興人,國家電網(wǎng)浙江省電力公司紹興供電公司,工程師,學(xué)士,研究方向:配電信息技術(shù)、模式識別;

黃建楊(1982-),男,漢族,浙江諸暨人,國家電網(wǎng)浙江省電力公司諸暨供電公司,工程師,碩士,研究方向:配電變壓器檢測、模式識別;

广西| 东阳市| 叶城县| 皋兰县| 汝南县| 枞阳县| 太谷县| 航空| 郓城县| 安国市| 南乐县| 万荣县| 上高县| 临桂县| 泾川县| 瑞安市| 湛江市| 泌阳县| 兴山县| 东山县| 青冈县| 鸡泽县| 兴宁市| 宜城市| 满洲里市| 通河县| 根河市| 乡城县| 长垣县| 安陆市| 长春市| 都江堰市| 太仆寺旗| 延津县| 松潘县| 大化| 郴州市| 甘孜县| 湘潭县| 临安市| 吉林市|