国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進(jìn)RF 算法的低壓配電工程信息識(shí)別技術(shù)

2023-10-21 06:10:42劉士李周遠(yuǎn)科施曉敏
電子設(shè)計(jì)工程 2023年20期
關(guān)鍵詞:低壓配電決策樹準(zhǔn)確率

劉士李,周遠(yuǎn)科,施曉敏,高 象

(1.國(guó)網(wǎng)安徽省電力有限公司經(jīng)濟(jì)技術(shù)研究院,安徽合肥 230601;2.國(guó)網(wǎng)安徽省電力有限公司,安徽合肥 230061)

隨著我國(guó)電網(wǎng)建設(shè)工程需求的持續(xù)增長(zhǎng),當(dāng)前電力基礎(chǔ)設(shè)施建設(shè)工程的竣工結(jié)算管理狀況已難以滿足實(shí)際需要。低壓配電網(wǎng)中電力設(shè)備數(shù)量較多,所產(chǎn)生的海量數(shù)據(jù)信息通常需要編制人員不斷重復(fù)開展數(shù)據(jù)統(tǒng)計(jì)、處理與審核工作,進(jìn)而嚴(yán)重縮減了電網(wǎng)主業(yè)員工進(jìn)行低壓配電網(wǎng)故障分析、架構(gòu)規(guī)劃及項(xiàng)目實(shí)施的有效時(shí)間,且在一定程度上影響了低壓配電網(wǎng)建設(shè)及改造工程的最終結(jié)果。此外,低壓配電網(wǎng)自身的復(fù)雜結(jié)構(gòu)使得其建設(shè)工程也較為繁雜,大幅增加了竣工結(jié)算的難度[1-3]。

在當(dāng)前低壓配電網(wǎng)的結(jié)算管理過(guò)程中,施工單位主要承擔(dān)結(jié)算文件編制的工作,而業(yè)主項(xiàng)目部則承擔(dān)結(jié)算審核工作。但從實(shí)際結(jié)算工作來(lái)看,主要存在以下問(wèn)題:1)施工單位缺少高水平配電網(wǎng)技經(jīng)人員,且業(yè)主項(xiàng)目部的相關(guān)人員也較為緊缺,故無(wú)法滿足各區(qū)縣配電網(wǎng)工程編制及審核的需求。因此,容易出現(xiàn)配電網(wǎng)結(jié)算工程量與實(shí)際工程量不遵從、一級(jí)線下表格不統(tǒng)一的現(xiàn)象;2)低壓配電網(wǎng)建設(shè)工程較為復(fù)雜,編制文件涵蓋的內(nèi)容也較多。在工程計(jì)量過(guò)程中會(huì)由于精度不統(tǒng)一而造成一定的偏差,并產(chǎn)生異常數(shù)據(jù)。若未及時(shí)發(fā)現(xiàn)異常會(huì)導(dǎo)致結(jié)算誤差嚴(yán)重,從而不利于低壓配電網(wǎng)工程項(xiàng)目的建設(shè);3)當(dāng)前編制低壓配電網(wǎng)結(jié)算文件所必需的數(shù)據(jù)收集、審核校驗(yàn)、統(tǒng)計(jì)計(jì)算與進(jìn)度管理主要通過(guò)人工手動(dòng)完成,難以適應(yīng)當(dāng)前電網(wǎng)建設(shè)的長(zhǎng)短期發(fā)展規(guī)劃需求。因此,有必要在低壓配電網(wǎng)結(jié)算管理過(guò)程中開展對(duì)工程信息識(shí)別技術(shù)的研究。該文針對(duì)這一問(wèn)題通過(guò)改進(jìn)隨機(jī)森林算法,經(jīng)過(guò)特征提取及特征識(shí)別完成對(duì)工程信息的有效識(shí)別,從而甄別出工程信息中的異常數(shù)據(jù),避免誤差的產(chǎn)生;同時(shí)還改善了傳統(tǒng)人工方式的低效性,提升了低壓配電網(wǎng)建設(shè)的質(zhì)量。

1 電網(wǎng)工程信息特征分析與提取

1.1 低壓配電網(wǎng)工程信息特征分析

低壓配電網(wǎng)的工程信息主要包括項(xiàng)目運(yùn)營(yíng)信息、施工監(jiān)管信息、施工進(jìn)度信息、合同信息、安全監(jiān)管信息、物料設(shè)備信息及預(yù)結(jié)算編制信息等[4-7]。

項(xiàng)目運(yùn)營(yíng)信息是對(duì)低壓配電網(wǎng)建設(shè)項(xiàng)目集中整合管理所獲取的信息,主要包括計(jì)劃編制、項(xiàng)目存儲(chǔ)與項(xiàng)目資金計(jì)劃下發(fā)等內(nèi)容;施工監(jiān)管通常是對(duì)施工前的準(zhǔn)備工作開展統(tǒng)一管理,所涵蓋的信息包含施工期間的日常監(jiān)管記錄、準(zhǔn)備材料和結(jié)束后的竣工驗(yàn)收材料等內(nèi)容;施工進(jìn)度信息主要追蹤工程進(jìn)展,通常包含總工程計(jì)劃起始日期、實(shí)際起始日期、責(zé)任部門、責(zé)任人及分包子工程的相關(guān)信息;合同信息的主要作用是保障甲乙雙方及法人的合法權(quán)益,并協(xié)商達(dá)成書面合同資料,通常包含合同編號(hào)、名稱、類型及總金額等;安全監(jiān)管信息通常涵蓋低壓配電網(wǎng)建設(shè)工程施工期間的安全標(biāo)準(zhǔn)、防護(hù)手段與處理措施,主要包括安全資料臺(tái)賬、安全管理?xiàng)l例、工作票信息等;物料設(shè)備信息主要確保施工期間設(shè)備材料的充足,涵蓋物料設(shè)備的倉(cāng)儲(chǔ)信息、出入庫(kù)信息、物資采購(gòu)計(jì)劃、領(lǐng)料與報(bào)廢信息,其核心是物料定額關(guān)系;預(yù)結(jié)算編制信息通常用于對(duì)工程造價(jià)開展評(píng)估,并概算出低壓配電網(wǎng)建設(shè)工程的基本預(yù)算,主要包括施工預(yù)算信息、工程勞務(wù)結(jié)算信息、施工決算信息與工程毛利潤(rùn)等。

根據(jù)以上分析可以看出,低壓配電網(wǎng)建設(shè)工程信息較為復(fù)雜且數(shù)據(jù)量龐大,僅憑借人工記錄易出現(xiàn)誤差。而所記錄的數(shù)據(jù)由于類目過(guò)多,通常難以進(jìn)行核驗(yàn)。故需提取工程信息的主要特征,并通過(guò)特征分類識(shí)別信息的異常情況。因此,該文引入核主成分分析(Kernel Principal Components Analysis,KPCA)算法進(jìn)行特征提取。

1.2 基于KPCA的電網(wǎng)工程信息特征提取

KPCA 是一種在主成分分析算法基礎(chǔ)上變遷而來(lái)的非線性特征降維方法,主要利用非線性映射函數(shù)對(duì)原始數(shù)據(jù)開展變換并提取主要成分實(shí)現(xiàn)數(shù)據(jù)的充分降維。設(shè)低壓配電網(wǎng)工程信息的數(shù)據(jù)訓(xùn)練集為X={x1,x2,…,xM},?表示非線性映射函數(shù)并滿足,則定義協(xié)方差矩陣為:

對(duì)協(xié)方差矩陣實(shí)行特征分解可得:

其中,V={?(x1),?(x2),···,?(xM)} 表示數(shù)據(jù)的特征向量,且μ>0,則可將式(2)改寫為:

因Vr可視為?(x)的線性組合,因此可得到:

對(duì)r維協(xié)方差矩陣實(shí)行歸一化,使得則映射的投影為:

令G(x)表示非線性的主成分,則可獲得投影向量為:

通過(guò)KPCA能夠有效提取低壓配電網(wǎng)工程信息的特征,將其組成特征向量并用于分類識(shí)別能夠發(fā)現(xiàn)工程信息中的異常數(shù)據(jù)。該文采用隨機(jī)森林作為基礎(chǔ)的分類模型,對(duì)所獲取的工程信息特征向量進(jìn)行分類識(shí)別。

2 低壓配電網(wǎng)工程信息識(shí)別模型

2.1 隨機(jī)森林算法

隨機(jī)森林(Random Forest,RF)算法是在引導(dǎo)聚集算法Bagging(Bootstrap aggregating,Bagging)的基礎(chǔ)上延伸而來(lái)。該算法同時(shí)具備對(duì)所訓(xùn)練樣本實(shí)行有放回的抽選及針對(duì)不同屬性實(shí)行無(wú)放回的抽選兩種功能,從而有效提升了全局搜索性能并獲得較高的分類準(zhǔn)確率。RF 算法所應(yīng)用的弱分類器即為決策樹,每個(gè)決策樹均應(yīng)用Bagging 算法完成訓(xùn)練樣本的采樣工作,同時(shí)還可基于隨機(jī)子空間算法完成屬性的采樣。此外,由于RF 中任一決策樹均獨(dú)立且各不相同,因此對(duì)于訓(xùn)練樣本具有較強(qiáng)的適應(yīng)性[8-11]。

RF 算法流程如圖1 所示,具體流程如下:

圖1 RF算法流程

步驟1:設(shè)定RF 完成訓(xùn)練的初始參數(shù)、訓(xùn)練集的樣本及決策樹的數(shù)量N,隨機(jī)化屬性并設(shè)定數(shù)量為I,確定決策樹在訓(xùn)練過(guò)程中的剪枝閾值;

步驟2:針對(duì)訓(xùn)練集中的樣本進(jìn)行有放回的抽選,直至選出與訓(xùn)練集樣本容量一致的集合并將其作為單個(gè)決策樹訓(xùn)練過(guò)程中的使用樣本;

步驟3:針對(duì)屬性集實(shí)行無(wú)放回的抽選,當(dāng)選夠I個(gè)屬性后,僅留存I個(gè)屬性并將其對(duì)應(yīng)的數(shù)據(jù)劃分為訓(xùn)練所用的樣本;

步驟4:將步驟2-3 所產(chǎn)生的訓(xùn)練樣本輸入至單個(gè)決策樹中進(jìn)行訓(xùn)練;

步驟5:基于剪枝的閾值對(duì)完成訓(xùn)練的決策樹實(shí)行剪枝;

步驟6:若完成訓(xùn)練的決策樹數(shù)目低于N,則回到步驟2 繼續(xù)迭代;反之,則基于投票原則將N個(gè)決策樹進(jìn)行級(jí)聯(lián)以構(gòu)成RF。

RF 算法中基于投票原則將多個(gè)決策樹的分類結(jié)果進(jìn)行歸類,并選擇其中的眾數(shù)輸出為RF 的分類結(jié)果,其數(shù)學(xué)表達(dá)式為:

式中,F(xiàn)RF(x) 表示樣本經(jīng)RF 計(jì)算后的分類結(jié)果,A(·)表示符合式(9)的數(shù)目,=χ表示第n個(gè)決策樹經(jīng)運(yùn)算后的分類結(jié)果為χ。c表示RF 的類目數(shù)量,其中χ隸屬于c中的一類。

2.2 基于精準(zhǔn)加權(quán)的RF投票原則的改進(jìn)

在傳統(tǒng)的RF 投票原則中,各決策樹可自行為自身分類結(jié)果投票。這導(dǎo)致性能存在差異的決策樹具有相同的投票權(quán)重,進(jìn)而對(duì)最終的分類結(jié)果產(chǎn)生不利影響,且若產(chǎn)生票數(shù)相等的情況則難以進(jìn)行抉擇。因此該文為了改進(jìn)RF 算法,采用精準(zhǔn)加權(quán)對(duì)投票過(guò)程進(jìn)行賦權(quán),從而提升RF 算法的分類準(zhǔn)確率。

該文依據(jù)各決策樹的分類性能來(lái)設(shè)置相應(yīng)權(quán)重,該理論的核心在于一部分訓(xùn)練集的樣本仍應(yīng)用于傳統(tǒng)RF,并對(duì)全部決策樹進(jìn)行訓(xùn)練,其余部分則作為分類預(yù)測(cè)的試驗(yàn)樣本。當(dāng)該部分訓(xùn)練完畢后再對(duì)全部決策樹加以測(cè)試,并輸出分類準(zhǔn)確率。整個(gè)流程的數(shù)學(xué)表達(dá)式為:

將ω設(shè)定為相應(yīng)決策樹的權(quán)重,RF 中各決策樹在投票時(shí)需加以賦權(quán),則RF的輸出可由式(10)改寫為:

將RF 的投票過(guò)程進(jìn)行精準(zhǔn)加權(quán)便能避免不平衡,也無(wú)需進(jìn)行平衡性調(diào)整。因此可直接將各決策樹對(duì)于預(yù)測(cè)試驗(yàn)樣本的分類準(zhǔn)確率作為權(quán)重,從而提升運(yùn)算效率。

2.3 粒子群算法優(yōu)化RF參數(shù)

在RF 算法中,其基本參數(shù)的設(shè)置對(duì)于最終的輸出結(jié)果具有較大影響。但RF參數(shù)通常是基于人工經(jīng)驗(yàn)選取,故容易導(dǎo)致最終分類結(jié)果產(chǎn)生誤差。因此為了獲取全局最優(yōu)參數(shù),該文將決策樹的剪枝閾值、決策樹數(shù)量與預(yù)測(cè)的試驗(yàn)樣本選取概率組成目標(biāo)向量。并將其設(shè)定為粒子群(Particle Swarm Optimization,PSO)算法中的單個(gè)粒子,再通過(guò)算法實(shí)現(xiàn)全局尋優(yōu)獲取最優(yōu)粒子,從而得到最適宜的RF參數(shù)[12-13]。

粒子群算法優(yōu)化RF 流程如圖2 所示,具體步驟如下:

圖2 粒子群算法優(yōu)化RF流程

步驟1:初始化RF 參數(shù),隨機(jī)化目標(biāo)向量元素值,并設(shè)定屬性數(shù)目的初始值為log2(L+1)[14-16];

步驟2:基于Bagging算法對(duì)待分類樣本實(shí)行采樣,隨機(jī)產(chǎn)生N個(gè)訓(xùn)練集并選取用于預(yù)測(cè)試的試驗(yàn)樣本;

步驟3:將各訓(xùn)練集的剩余樣本用于生成N個(gè)決策樹,并從屬性集合中篩選M個(gè)屬性作為節(jié)點(diǎn)屬性;

步驟4:當(dāng)節(jié)點(diǎn)樣本個(gè)數(shù)低于剪枝閾值時(shí),則將此節(jié)點(diǎn)作為葉節(jié)點(diǎn)并傳遞回所求屬性的眾數(shù),當(dāng)作該樹的分類結(jié)果,反之則返回步驟1;

步驟5:生成全部決策樹后,開展預(yù)測(cè)試并保存正確率數(shù)據(jù);

步驟6:應(yīng)用式(9)計(jì)算RF 分類結(jié)果;

步驟7:計(jì)算步驟6中的分類結(jié)果以得到準(zhǔn)確率,應(yīng)用粒子群算法實(shí)現(xiàn)RF 參數(shù)尋優(yōu)并確定最優(yōu)參數(shù),從而生成最終的RF 模型。

通過(guò)粒子群改進(jìn)后的RF 對(duì)經(jīng)過(guò)KPCA 所提取的低壓配電網(wǎng)工程信息特征向量進(jìn)行分類,能夠有效識(shí)別異常數(shù)據(jù),從而避免了人工核驗(yàn)的困難。

3 實(shí)驗(yàn)分析

3.1 實(shí)驗(yàn)環(huán)境與數(shù)據(jù)來(lái)源

該文實(shí)驗(yàn)部分主要通過(guò)Matlab 2018B 編程來(lái)實(shí)現(xiàn)改進(jìn)隨機(jī)森林算法,并對(duì)某省2018—2020 年低壓配電網(wǎng)工程信息進(jìn)行了識(shí)別。實(shí)驗(yàn)室的計(jì)算環(huán)境配置如表1 所示。

表1 實(shí)驗(yàn)室的計(jì)算環(huán)境

實(shí)驗(yàn)數(shù)據(jù)中有關(guān)低壓配電網(wǎng)工程信息的內(nèi)容主要包括項(xiàng)目運(yùn)營(yíng)信息、施工監(jiān)管信息、施工進(jìn)度信息、合同信息、安全監(jiān)管信息、物料設(shè)備信息及預(yù)結(jié)算編制信息,如表2 所示。

表2 數(shù)據(jù)集信息

3.2 低壓配電網(wǎng)工程信息識(shí)別結(jié)果

將該文提出的改進(jìn)RF 算法應(yīng)用于低壓配電網(wǎng)工程信息,從而實(shí)現(xiàn)對(duì)異常信息的識(shí)別。并與BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)、SVM(Support Vector Machine)、RBF(Radial Basis Function)神經(jīng)網(wǎng)絡(luò)算法及用PSO 優(yōu)化后的算法進(jìn)行對(duì)比,所得的識(shí)別結(jié)果如表3 所示。

表3 識(shí)別結(jié)果

從表3 中可以看出,相比于其他算法,RF 算法對(duì)于屬性與類別較多的低壓配電網(wǎng)工程信息能夠?qū)崿F(xiàn)更為準(zhǔn)確的識(shí)別,且其訓(xùn)練集和測(cè)試集的識(shí)別準(zhǔn)確率分別達(dá)到90.2%和86.5%。相比于其他算法具有較大的優(yōu)勢(shì),但仍難以滿足實(shí)際工程的需要。當(dāng)采用PSO 優(yōu)化以上分類算法時(shí),各分類算法的分類準(zhǔn)確率均得到顯著提升。其中,PSO-RF 算法訓(xùn)練集與測(cè)試集識(shí)別準(zhǔn)確率分別達(dá)到93.8%和91.0%,能夠滿足實(shí)際工程中的識(shí)別要求。盡管其他算法也在優(yōu)化后得到提升,但仍與PSO-RF 算法存在一定差距。因此,說(shuō)明了該文提出的改進(jìn)RF 算法可有效識(shí)別低壓配電網(wǎng)工程信息,并實(shí)現(xiàn)對(duì)異常信息的發(fā)掘。該算法在一定程度上有效避免了人工核驗(yàn)的繁瑣,有助于推動(dòng)低壓配電網(wǎng)的建設(shè)與改造。

4 結(jié)束語(yǔ)

文中針對(duì)當(dāng)前低壓配電網(wǎng)工程建設(shè)過(guò)程中信息管理面臨的繁雜問(wèn)題,在改進(jìn)隨機(jī)森林算法的基礎(chǔ)上,設(shè)計(jì)了一套低壓配電網(wǎng)工程信息識(shí)別技術(shù)方案。利用KPCA 算法提取了工程信息的特征,并將隨機(jī)森林作為基礎(chǔ)分類模型完成對(duì)特征的識(shí)別。為了有效提升分類識(shí)別準(zhǔn)確率,采用精準(zhǔn)加權(quán)改進(jìn)投票原則,并利用粒子群算法完成隨機(jī)森林的參數(shù)尋優(yōu),從而得到改進(jìn)的隨機(jī)森林模型。所提出的方法相比于其他方法具有較高的識(shí)別準(zhǔn)確率,可精確地完成低壓配電網(wǎng)工程信息的識(shí)別,具有較好的工程實(shí)用價(jià)值。

猜你喜歡
低壓配電決策樹準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
低壓配電網(wǎng)接地方式及與剩余電流保護(hù)的配置探究
電子制作(2019年22期)2020-01-14 03:16:54
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
高速公路車牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
基于決策樹的出租車乘客出行目的識(shí)別
工廠供電系統(tǒng)低壓配電保護(hù)電器的選擇研究
基于肺癌CT的決策樹模型在肺癌診斷中的應(yīng)用
甘德县| 瓮安县| 永和县| 河南省| 江油市| 古丈县| 宜都市| 莱阳市| 濮阳市| 修水县| 白城市| 杨浦区| 四子王旗| 阿克苏市| 诸暨市| 阿尔山市| 曲麻莱县| 扎鲁特旗| 泾阳县| 乌拉特后旗| 双鸭山市| 辽阳县| 宝山区| 通州市| 婺源县| 柘城县| 兴业县| 永川市| 射洪县| 犍为县| 咸宁市| 新沂市| 察哈| 耒阳市| 长治县| 福海县| 荣昌县| 江西省| 行唐县| 津市市| 固原市|