国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的局部放電識(shí)別分析

2017-09-14 06:48:26安徽華電宿州發(fā)電有限公司
電子世界 2017年17期
關(guān)鍵詞:識(shí)別率決策樹(shù)分類器

安徽華電宿州發(fā)電有限公司 于 凱

基于隨機(jī)森林的局部放電識(shí)別分析

安徽華電宿州發(fā)電有限公司 于 凱

為了提高局部放電的識(shí)別率,針對(duì)單一分類器不能全面學(xué)習(xí)樣本特性的問(wèn)題,提出采用隨機(jī)森林集成分類器對(duì)局部放電類型進(jìn)行識(shí)別分析,識(shí)別結(jié)果表明:基于EEMD-SVD特征,采用隨機(jī)森林分類器取得了較好的識(shí)別效果,這對(duì)局部放電模式識(shí)別與分析具有一定的指導(dǎo)意義。

局部放電;EEMD-SVD;單一分類器;隨機(jī)森林

0 引言

目前對(duì)于局部放電類型分類應(yīng)用比較成熟的是單一分類器[1],該分類器都要經(jīng)過(guò)訓(xùn)練樣本進(jìn)行訓(xùn)練,然后利用測(cè)試樣本對(duì)訓(xùn)練好的結(jié)構(gòu)進(jìn)行識(shí)別分析,然而單一分類器不能全面分析樣本的特性,即使訓(xùn)練樣本足夠大,識(shí)別算法也很難會(huì)達(dá)到局部最優(yōu),從而導(dǎo)致識(shí)別率較低,因此,本文采用Leo Breiman提出的隨機(jī)森林集成分類器對(duì)局部放電類型進(jìn)行識(shí)別分析。隨機(jī)森林分類器是首先利用訓(xùn)練樣本構(gòu)建一系列基分類器,然后對(duì)每個(gè)基分類器的預(yù)測(cè)分類結(jié)果進(jìn)行投票,最后根據(jù)投票結(jié)果進(jìn)行分類,這樣就保證了對(duì)樣本的特性能夠全面分析,不易陷入局部最優(yōu),從而能更好的對(duì)局部放電類型進(jìn)行識(shí)別分析。

1 EEMD-SVD特征

局部放電是一種典型的非線性、非平穩(wěn)信號(hào),其信號(hào)中包含著豐富的放電信息。基于PRPD模式構(gòu)造的統(tǒng)計(jì)、分形和放電圖像灰度等特征,這些特征不是由局部放電信號(hào)直接提取,因而會(huì)丟失部分放電信息,不利于分類器對(duì)其準(zhǔn)確分類。針對(duì)這個(gè)問(wèn)題,本文對(duì)局部放電信號(hào)直接提取EEMD-SVD特征,這樣可以保證所提取的特征信息是最原始,最直接的。

2 隨機(jī)森林分類器識(shí)別分析

隨機(jī)森林是Leo Breiman在2001年提出的一種集成學(xué)習(xí)算法,它利用bootstrap重抽樣法從原始樣本中抽取多個(gè)樣本,并對(duì)bootstrap樣本進(jìn)行決策樹(shù)建模,然后將這些決策樹(shù)組合在一起,通過(guò)投票得出最終分類或預(yù)測(cè)的結(jié)果。

假設(shè)原始訓(xùn)練集中有M個(gè)樣本,樣本屬性特征變量的維數(shù)為K,隨機(jī)特征變量的維數(shù)為F,要形成包含N棵基分類器決策樹(shù)的隨機(jī)森林,其主要內(nèi)容就是形成決策樹(shù)的過(guò)程,具體構(gòu)建過(guò)程如下所示:

(1)利用Bagging抽樣技術(shù)從原始訓(xùn)練集中抽樣產(chǎn)生N個(gè)不同的訓(xùn)練子集,每個(gè)子集中包含的樣本個(gè)數(shù)仍為M。

(2)根據(jù)Forestes-RI方法為每個(gè)基分類器隨機(jī)選取F個(gè)特征變量,其中F滿足,K為全部特征變量的個(gè)數(shù)。

(3)依據(jù)CART算法Gini指標(biāo)最小原則對(duì)每棵決策樹(shù)的節(jié)點(diǎn)進(jìn)行分裂,最終形成一棵棵相互獨(dú)立的決策樹(shù),在節(jié)點(diǎn)分裂過(guò)程中,決策樹(shù)不作剪枝處理。

(4)將上述構(gòu)建出一系列相互獨(dú)立的的決策樹(shù)看作一個(gè)整體,從而形成了隨機(jī)森林。本文中的每種放電類型樣本各100個(gè),總共有300個(gè)原始樣本。對(duì)于EEMD-SVD特征,其樣本屬性特征變量的維數(shù)為13。設(shè)置基分類器的數(shù)目為1000,并且重復(fù)執(zhí)行隨機(jī)森林算法的次數(shù)也置為1000。

泛化誤差是反應(yīng)泛化能力的一個(gè)指標(biāo),泛化誤差越小,則該學(xué)習(xí)性能越好,反之則性能越差。在隨機(jī)森林算法中,Breiman通過(guò)實(shí)驗(yàn)證明,袋外( Out Of Bag OOB)估計(jì)是隨機(jī)森林泛化誤差的一個(gè)無(wú)偏估計(jì),OOB分類誤差越小,說(shuō)明隨機(jī)森林分類能力越強(qiáng),識(shí)別準(zhǔn)確率越高。

圖1反映了基于EEMD-SVD特征,其OOB分類誤差隨決策樹(shù)個(gè)數(shù)增加而變化的情況。

圖1 基于EEMD-SVD特征的OOB分類誤差估計(jì)

由圖1可以看出,基于EEMD-SVD特征,其OOB分類誤差隨著基分類器數(shù)目的增加而顯著減小,并當(dāng)基分類器數(shù)目在20左右時(shí),OOB分類誤差趨于穩(wěn)定,表明基于EEMD-SVD特征與隨機(jī)森林集成分類器的局部放電模式識(shí)別算法學(xué)習(xí)性能較優(yōu),分類能力較強(qiáng),識(shí)別準(zhǔn)確率高。

表1給出了基于隨機(jī)森林分類器的EEMD-SVD時(shí)域特征局部放電識(shí)別準(zhǔn)確率,其每種放電類型的識(shí)別率是相同參數(shù)下1000次執(zhí)行隨機(jī)森林算法取均值而得。

表1 基于時(shí)域特征的局部放電分類準(zhǔn)確率

由表1可以看出,基于EEMD-SVD特征與隨機(jī)森林集成識(shí)別算法,其對(duì)應(yīng)每種放電類型的識(shí)別率均達(dá)到了95%以上,總體平均識(shí)別率為97.32%,取得良好的識(shí)別效果。

3 結(jié)論

本文針對(duì)變壓器局部放電性質(zhì),設(shè)計(jì)制作了三種典型的放電缺陷模型,提取了局部放電信號(hào),并構(gòu)造了EEMD-SVD特征,同時(shí)利用隨機(jī)森林集成分類器進(jìn)行識(shí)別分析,得到的主要結(jié)論:采用隨機(jī)森林集成分類器對(duì)局部放電進(jìn)行識(shí)別分析,由于該分類器能對(duì)樣本進(jìn)行全面分析,因而每種放電類型的識(shí)別率均很高,尤其是基于EEMD-SVD特征,其OOB分類誤差較小,局部放電的平均識(shí)別率很高,達(dá)到了97.32%。

綜上所述,基于EEMD-SVD特征與隨機(jī)森林集成分類器的局部放電模式識(shí)別算法,由于特征量包含的放電信息豐富,分類器能夠全面分析樣本特性,從而使得其局部放電識(shí)別準(zhǔn)確率較高,這對(duì)局部放電的分類識(shí)別分析具有一定的指導(dǎo)意義。

[1]凌衛(wèi)家,張浩,管敏淵.互感器振動(dòng)對(duì)GIS超聲波局部放電檢測(cè)的影響[J].電工電能新技術(shù),2016,35(5):74-79.

猜你喜歡
識(shí)別率決策樹(shù)分類器
基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測(cè)
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
基于真耳分析的助聽(tīng)器配戴者言語(yǔ)可懂度指數(shù)與言語(yǔ)識(shí)別率的關(guān)系
決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
提升高速公路MTC二次抓拍車牌識(shí)別率方案研究
BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
基于決策樹(shù)的出租車乘客出行目的識(shí)別
高速公路機(jī)電日常維護(hù)中車牌識(shí)別率分析系統(tǒng)的應(yīng)用
南投县| 扎鲁特旗| 庆城县| 上虞市| 虞城县| 远安县| 余江县| 赞皇县| 崇左市| 彭阳县| 揭阳市| 同仁县| 芜湖市| 雷州市| 宾阳县| 河源市| 明星| 崇阳县| 德庆县| 黔江区| 涿州市| 沽源县| 武清区| 岚皋县| 班戈县| 富民县| 万州区| 景德镇市| 梅河口市| 新巴尔虎右旗| 青阳县| 元江| 县级市| 宁河县| 淅川县| 当雄县| 汾阳市| 洛宁县| 章丘市| 怀宁县| 莲花县|