基于加權(quán)決策樹算法的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法

2022-09-02 06:24黃穎祺胡亞榮張建國(guó)

電子設(shè)計(jì)工程 2022年16期

鄧彬，林宏，黃穎祺，胡亞榮，張建國(guó)，孟琦

（1.深圳供電局有限公司，廣東深圳 518000；2.西安交通大學(xué)信息與通信工程學(xué)院，陜西西安 710049；3.興唐通信科技有限公司，北京 100191）

電網(wǎng)規(guī)模的擴(kuò)大[1]和清潔能源的利用[2]使電力數(shù)據(jù)量迅速增加，調(diào)度人員從中獲取決策關(guān)鍵信息變得困難[3]。

現(xiàn)有的調(diào)度指令安全性研究，主要根據(jù)設(shè)備故障概率[4]、負(fù)荷削減[5]、天氣及人員[6]等因素建模并制定風(fēng)險(xiǎn)指標(biāo)[7-9]，但所用指標(biāo)基于經(jīng)驗(yàn)，且結(jié)果未與風(fēng)險(xiǎn)嚴(yán)重程度對(duì)應(yīng)，難以供調(diào)度員參考。電力調(diào)度過(guò)程涉及眾多復(fù)雜特征和規(guī)則，符合機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景，但現(xiàn)有的包括故障辨識(shí)、負(fù)荷預(yù)測(cè)和輔助決策的研究[10-13]還未涉及調(diào)度指令層面。

針對(duì)上述問(wèn)題，文中提出一種基于加權(quán)決策樹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法，利用機(jī)器學(xué)習(xí)技術(shù)找到符合電網(wǎng)運(yùn)行規(guī)律的風(fēng)險(xiǎn)評(píng)估規(guī)則，并解決了樣本不平衡問(wèn)題。

1 調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法

調(diào)度指令是電網(wǎng)調(diào)度操作執(zhí)行的依據(jù)，根據(jù)電網(wǎng)相關(guān)安全規(guī)程和運(yùn)行準(zhǔn)則給出[4]。調(diào)度指令分為單項(xiàng)令、逐項(xiàng)令和綜合令，單項(xiàng)令的操作內(nèi)容一般是針對(duì)某個(gè)具體設(shè)備給出的，而逐項(xiàng)令和綜合令都可視為是由單項(xiàng)令組成的，所以該文只對(duì)單項(xiàng)令進(jìn)行分析。根據(jù)《南方電網(wǎng)運(yùn)行安全風(fēng)險(xiǎn)量化評(píng)估技術(shù)規(guī)范》和電力領(lǐng)域?qū)＜业慕ㄗh，該文將調(diào)度指令的風(fēng)險(xiǎn)分為3 個(gè)等級(jí)：安全、風(fēng)險(xiǎn)和危險(xiǎn)。其定義和系統(tǒng)應(yīng)對(duì)措施如表1 所示。

表1 調(diào)度指令安全風(fēng)險(xiǎn)等級(jí)劃分

電力設(shè)備一般有運(yùn)行、檢修、冷備用和熱備用4種狀態(tài)。當(dāng)設(shè)備處于檢修或冷備用狀態(tài)的時(shí)候，對(duì)設(shè)備的任何操作都無(wú)法影響電網(wǎng)整體狀態(tài)。所以，該文主要考慮處于運(yùn)行或熱備用狀態(tài)的電力設(shè)備調(diào)度指令的風(fēng)險(xiǎn)評(píng)估，如果調(diào)度指令的對(duì)象處于檢修或冷備用狀態(tài)，則對(duì)該調(diào)度指令的風(fēng)險(xiǎn)評(píng)估結(jié)果為“安全”。

調(diào)度操作能夠改變電力設(shè)備的運(yùn)行狀態(tài)，進(jìn)而對(duì)整個(gè)電網(wǎng)產(chǎn)生影響，因此與其相關(guān)聯(lián)的安全影響因素很多。選擇可靠的關(guān)聯(lián)影響因素并構(gòu)建關(guān)聯(lián)影響模型，才能以此找到基于調(diào)度指令的電力系統(tǒng)平穩(wěn)運(yùn)行規(guī)則，從而對(duì)調(diào)度指令進(jìn)行有效的風(fēng)險(xiǎn)評(píng)估。該節(jié)介紹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法利用特征工程構(gòu)建多維度指令畫像，建立調(diào)度指令專家知識(shí)庫(kù)，再以此為基礎(chǔ)使用機(jī)器學(xué)習(xí)方法尋找風(fēng)險(xiǎn)評(píng)估規(guī)則。算法框圖如圖1 所示。

圖1 調(diào)度指令風(fēng)險(xiǎn)評(píng)估算法框圖

1.1 多維指令畫像

利用機(jī)器學(xué)習(xí)技術(shù)對(duì)海量電力數(shù)據(jù)進(jìn)行處理，第一步是特征工程。廣泛采集與調(diào)度指令相關(guān)聯(lián)的海量電力數(shù)據(jù)，對(duì)其進(jìn)行數(shù)據(jù)清洗、特征選擇和進(jìn)一步的預(yù)處理，在多個(gè)維度對(duì)調(diào)度指令進(jìn)行描述和表征，以形成指令畫像。

1）數(shù)據(jù)清洗。對(duì)電力系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)（電氣量測(cè)量、設(shè)備整定值等）和非結(jié)構(gòu)化數(shù)據(jù)（日志、視頻等）分別采用不同方式進(jìn)行處理，并清洗冗余的報(bào)警信號(hào)、事件順序記錄（Sequence of Events，SOE）及無(wú)用信息。

2）特征選擇。一般調(diào)度指令都包含時(shí)間、廠站、操作信息和狀態(tài)4 個(gè)部分，可以從中提取包括廠站名、操作設(shè)備、電壓等級(jí)等信息，從電力能量管理系統(tǒng)中可以獲取設(shè)備運(yùn)行狀態(tài)、保護(hù)設(shè)備狀態(tài)、設(shè)備整定值及安全限值等相關(guān)信息，刪除設(shè)備編號(hào)等不適合作為特征的信息。除此之外，利用PAS 系統(tǒng)對(duì)調(diào)度指令執(zhí)行前的斷面數(shù)據(jù)進(jìn)行潮流計(jì)算，得到調(diào)度指令執(zhí)行后的線路、變壓器、發(fā)電機(jī)、母線的越限和重載信息，從調(diào)度指令的執(zhí)行后果層面構(gòu)建特征來(lái)反映其安全狀態(tài)。綜合以上信息對(duì)調(diào)度指令進(jìn)行多維度畫像，全方位地反映調(diào)度指令的安全風(fēng)險(xiǎn)。

3）標(biāo)準(zhǔn)化處理。選取完特征并提取出相應(yīng)數(shù)據(jù)之后，需對(duì)數(shù)據(jù)做進(jìn)一步處理。首先是缺失值處理，有些信息可能因?yàn)樵O(shè)備故障或通信故障等原因缺失，又或是某些特征本就不適應(yīng)于某些情況，比如變電站沒(méi)有發(fā)電機(jī)這種設(shè)備，該廠站關(guān)于發(fā)電機(jī)的相關(guān)信息就為缺失值，可對(duì)這些缺失值置零處理。機(jī)器學(xué)習(xí)中一般使用數(shù)值數(shù)據(jù)訓(xùn)練模型，所以需要將文本類數(shù)據(jù)單獨(dú)分離并編碼，該文采用獨(dú)熱編碼（One-hot Encoding）對(duì)文本數(shù)據(jù)編碼，將具有m個(gè)可能值的特征編碼為m個(gè)二元特征。這樣做有利于分類器處理屬性數(shù)據(jù)，也起到了擴(kuò)充特征的作用。

1.2 調(diào)度指令專家知識(shí)庫(kù)

按照上述流程對(duì)調(diào)度指令完成多維畫像之后，就將調(diào)度指令與多個(gè)電力安全要素聯(lián)系起來(lái)，在專家及電力調(diào)度人員指導(dǎo)下對(duì)這些數(shù)據(jù)添加標(biāo)簽，可以將其進(jìn)一步與電力系統(tǒng)的安全狀態(tài)關(guān)聯(lián)起來(lái)，構(gòu)建蘊(yùn)含電力系統(tǒng)運(yùn)行規(guī)律的調(diào)度指令專家知識(shí)庫(kù)，并以此為基礎(chǔ)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練，找到調(diào)度指令的風(fēng)險(xiǎn)評(píng)估規(guī)則。

1.3 模型訓(xùn)練

1.3.1 決策樹

決策樹是機(jī)器學(xué)習(xí)分類算法中的一類，它的可解釋性強(qiáng)，易于理解也易于實(shí)現(xiàn)，作為一種非參數(shù)分類方法，不需要擔(dān)心離群點(diǎn)和數(shù)據(jù)是否線性可分的問(wèn)題，適合處理上述文本與數(shù)值數(shù)據(jù)交叉的原始數(shù)據(jù)。

最著名的決策樹算法ID3 算法由J.R.Quinlan 于1986年提出，其核心是在決策樹的各個(gè)節(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn)則進(jìn)行特征選擇。信息增益表示的是已知特征X的信息而使得類別Y的信息不確定性減少的程度，某個(gè)特征的信息增益越大，就表示該特征對(duì)結(jié)果的影響越大，特征A對(duì)數(shù)據(jù)集D的信息增益可表示為：

其中，H(D)表示數(shù)據(jù)集D的經(jīng)驗(yàn)熵，定義為：

其中，|D|為樣本容量，|Ck|為D中類別Ck的樣本個(gè)數(shù)，K為總類別數(shù)。

H(D|A)為給定特征為A的情況下數(shù)據(jù)集D的經(jīng)驗(yàn)條件熵，定義為：

其中，n表示特征A的不同取值數(shù)量，根據(jù)特征A可將數(shù)據(jù)集D劃分為n個(gè)子集Di，|Di|為子集Di的樣本個(gè)數(shù)，Dik為子集Di中屬于類別Ck的樣本集合，|Dik|為其樣本個(gè)數(shù)。

對(duì)于待劃分的數(shù)據(jù)集，計(jì)算每個(gè)特征劃分?jǐn)?shù)據(jù)集的信息增益，信息增益越大說(shuō)明使用該特征劃分得到的子集不確定性越?。兌仍礁撸虼丝偸沁x擇信息增益最大的特征來(lái)劃分當(dāng)前數(shù)據(jù)集。

除了ID3 算法外，還有利用基尼指數(shù)進(jìn)行特征選擇的CART 算法，基尼指數(shù)（又稱基尼不純度）表示一個(gè)隨機(jī)選中的樣本在子集中被分錯(cuò)的可能性。當(dāng)一個(gè)節(jié)點(diǎn)中所有樣本都是一個(gè)類時(shí)，基尼指數(shù)為零。分類問(wèn)題中，假設(shè)有K個(gè)類別，樣本點(diǎn)屬于第k類的概率為pk，則概率分布的基尼指數(shù)定義為：

基于特征A劃分樣本集合D之后的基尼指數(shù)定義如下：

因其表示樣本被分錯(cuò)的概率，所以總是選擇基尼指數(shù)最小的特征來(lái)建立決策樹。

在建立決策樹時(shí)，如果樹的深度過(guò)深，葉子節(jié)點(diǎn)數(shù)量過(guò)大，就會(huì)導(dǎo)致過(guò)擬合問(wèn)題，即該決策樹在訓(xùn)練集上表現(xiàn)很好，但在測(cè)試集上表現(xiàn)很差，為了避免這種問(wèn)題，可以對(duì)決策樹采取先剪枝的方法，提前設(shè)定閾值，當(dāng)信息增益減小到某一閾值的時(shí)候就停止創(chuàng)建分支，并限定樹的最大深度及最大葉子節(jié)點(diǎn)數(shù)量。

在按照前述方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理并建立數(shù)據(jù)集后，就可以利用決策樹算法按照如下步驟進(jìn)行訓(xùn)練，以建立一棵決策樹：

1）從根節(jié)點(diǎn)開始，對(duì)節(jié)點(diǎn)計(jì)算所有可能特征的信息增益，選擇信息增益最大或基尼指數(shù)最小的特征作為結(jié)點(diǎn)的特征，并由該特征的不同取值構(gòu)建子節(jié)點(diǎn)，該文采用二叉樹構(gòu)建方法；

2）對(duì)子節(jié)點(diǎn)遞歸地調(diào)用以上方法，構(gòu)建決策樹；

3）直到所有特征的信息增益減小到某一閾值或基尼指數(shù)大于某一閾值或樹的深度達(dá)到閾值時(shí)為止。

1.3.2 隨機(jī)森林

隨機(jī)森林（Random Forest,RF）是Leo Breiman 在決策樹的基礎(chǔ)上提出的算法[14]，它的基本構(gòu)成單元是決策樹，通過(guò)建立多棵決策樹提高分類準(zhǔn)確性，最后利用投票完成對(duì)新樣本的分類，其算法流程如下：

1）確定決策樹的生成參數(shù)以及樹的數(shù)量n；

2）利用自助法（bootstrap），給每棵決策樹有放回地隨機(jī)選擇N條訓(xùn)練樣本；

3）在每個(gè)節(jié)點(diǎn)處隨機(jī)選擇特征，根據(jù)所選決策樹生成算法比較選擇最佳特征以劃分?jǐn)?shù)據(jù)集并生成子節(jié)點(diǎn)；

4）遞歸生成n棵決策樹，對(duì)于測(cè)試集中的未知數(shù)據(jù)，采用多數(shù)投票法確定分類結(jié)果。

由于隨機(jī)森林引入的隨機(jī)性及決策樹數(shù)量的增加，使其具有很強(qiáng)的抗干擾和抗過(guò)擬合能力，存在分類不平衡的情況時(shí)，可以平衡誤差，提高訓(xùn)練效果。

該文將對(duì)基于ID3 算法和基于CART 算法建立的隨機(jī)森林進(jìn)行比較。

1.4 不平衡樣本處理

在現(xiàn)實(shí)生活中，樣本不平衡的現(xiàn)象十分常見，在電力系統(tǒng)中也很常見，因?yàn)殡娏Π踩苯佑绊憞?guó)計(jì)民生，要盡量避免發(fā)生事故，所以電力歷史數(shù)據(jù)中的負(fù)樣本極少，這是典型的樣本不平衡現(xiàn)象。對(duì)于樣本不平衡的情況，將無(wú)法單純使用準(zhǔn)確率衡量訓(xùn)練效果。比如1 000 條樣本中，正樣本為995 條，負(fù)樣本有5 條，若是正樣本全部分類正確而負(fù)樣本全部分類錯(cuò)誤，則其準(zhǔn)確率將高達(dá)99.5%，但卻沒(méi)有任何意義。

該文根據(jù)表1 的內(nèi)容將樣本分為三類，但是對(duì)于電力系統(tǒng)來(lái)說(shuō)，這三類樣本被模型錯(cuò)分的代價(jià)明顯不同。如果“危險(xiǎn)”的調(diào)度指令被錯(cuò)分為“安全”或“風(fēng)險(xiǎn)”，將可能導(dǎo)致嚴(yán)重的電力事故，所以應(yīng)該最大程度地降低“危險(xiǎn)”樣本的錯(cuò)分概率。

對(duì)于這種情況，該文將采用代價(jià)敏感（Cost-Sensitive）的學(xué)習(xí)方法[15]降低不平衡樣本的影響。代價(jià)敏感方法也就是針對(duì)不同類別的樣本施加錯(cuò)分懲罰（也可叫權(quán)重），使得模型在訓(xùn)練過(guò)程中更傾向于規(guī)模小的類別樣本，提高小樣本分類正確率。對(duì)于決策樹算法來(lái)說(shuō)，其權(quán)重根據(jù)式（6）計(jì)算：

其中，weight 為對(duì)應(yīng)樣本權(quán)重，n_sample 為總樣本數(shù)，n_classed 為類別數(shù)，class_sample 為該類別樣本總數(shù)。

較大的權(quán)重被分配給小樣本，較小的權(quán)重被分配給大樣本。在建立決策樹進(jìn)行節(jié)點(diǎn)的分裂時(shí)，需要計(jì)算特征的信息增益及基尼指數(shù)，此時(shí)將引入樣本權(quán)重，少數(shù)類樣本劃分正確的特征將得到更高的信息增益或更小的基尼指數(shù)，而由于多數(shù)類樣本權(quán)重小，即使被錯(cuò)分對(duì)信息增益或基尼指數(shù)的影響也不大，可以更好地保證少數(shù)類被分類正確，這樣的決策樹被稱為加權(quán)決策樹[16]。

1.5 評(píng)價(jià)指標(biāo)

對(duì)于分類問(wèn)題可以使用如下幾個(gè)指標(biāo)來(lái)評(píng)價(jià)模型的效果：

1）準(zhǔn)確率表示分類正確的樣本數(shù)量占總樣本數(shù)量的比例，如式（7）所示：

其中，F(xiàn)P表示實(shí)際為負(fù)但被預(yù)測(cè)為正的樣本數(shù)量，TN表示實(shí)際為負(fù)被預(yù)測(cè)為負(fù)的樣本的數(shù)量，TP表示實(shí)際為正被預(yù)測(cè)為正的樣本數(shù)量，F(xiàn)N表示實(shí)際為正但被預(yù)測(cè)為負(fù)的樣本的數(shù)量。

2）精確率表示預(yù)測(cè)為正的樣本中實(shí)際也為正的樣本占被預(yù)測(cè)為正的樣本的比例，如式（8）所示：

3）召回率表示實(shí)際為正的樣本中被預(yù)測(cè)為正的樣本所占實(shí)際為正的樣本的比例，如式（9）所示：

4）混淆矩陣是用于表示分類精確度的常用指標(biāo)，由N行N列的矩陣構(gòu)成，其中每列表示所預(yù)測(cè)的類別，每行表示樣本的真實(shí)類別，列數(shù)據(jù)總數(shù)表示預(yù)測(cè)為該類別的樣本數(shù)目，行數(shù)據(jù)總數(shù)表示實(shí)際為該類別的樣本數(shù)目。

綜上，基于加權(quán)決策樹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法流程圖如圖2 所示。

圖2 調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法流程圖

2 實(shí)驗(yàn)與仿真

2.1 數(shù)據(jù)準(zhǔn)備

該實(shí)驗(yàn)的數(shù)據(jù)來(lái)源為南方電網(wǎng)深圳供電局OPEN3000 電力監(jiān)控系統(tǒng)數(shù)據(jù)庫(kù)中的大量電力數(shù)據(jù)。在對(duì)數(shù)據(jù)進(jìn)行初步清理后，按1.1 節(jié)的方法選擇了包括“操作類型”、“電壓等級(jí)”、“設(shè)備類型”、“設(shè)備（線路、變壓器、發(fā)電機(jī)）負(fù)載率”、“設(shè)備越限”等14個(gè)特征來(lái)構(gòu)建數(shù)據(jù)集，并邀請(qǐng)了5 位專家及調(diào)度工作人員根據(jù)當(dāng)?shù)仉娋W(wǎng)的拓?fù)浣Y(jié)構(gòu)及整體安全態(tài)勢(shì)添加風(fēng)險(xiǎn)評(píng)估標(biāo)簽，以符合真實(shí)電網(wǎng)的安全風(fēng)險(xiǎn)狀態(tài)。由于真實(shí)的電網(wǎng)一般都處于正常運(yùn)行狀態(tài)，極少發(fā)生危險(xiǎn)事故，所以數(shù)據(jù)中幾乎沒(méi)有負(fù)樣本，用于訓(xùn)練時(shí)，雖然正確率極高但卻因負(fù)樣本的缺乏而無(wú)法將危險(xiǎn)情況較好地分辨出來(lái)，所以需要在真實(shí)數(shù)據(jù)的基礎(chǔ)上構(gòu)造符合實(shí)際情況的負(fù)樣本。為了模擬真實(shí)情況并測(cè)試不平衡樣本訓(xùn)練效果，最終構(gòu)造的數(shù)據(jù)集中“安全”樣本和“危險(xiǎn)”樣本的占比差距較大，約為14∶1。

2.2 結(jié)果分析

該實(shí)驗(yàn)共構(gòu)造了1 000 條數(shù)據(jù)，將其隨機(jī)劃分為訓(xùn)練集和測(cè)試集，其中80%作為訓(xùn)練集，20%作為測(cè)試集，且訓(xùn)練集與測(cè)試集各類樣本占比基本一致。測(cè)試集里“安全”樣本為159 個(gè)，“風(fēng)險(xiǎn)”樣本為29 個(gè)，“危險(xiǎn)”樣本為12 個(gè)，為不平衡樣本。

分別使用ID3 算法及CART 算法構(gòu)造決策樹。首先利用十折交叉驗(yàn)證和網(wǎng)格搜索對(duì)“max_depth”（樹的最大深度）、“min_samples_split”（分割節(jié)點(diǎn)所需的最小樣本數(shù)）、“min_samples_leaf”（葉子節(jié)點(diǎn)所需的最小樣本數(shù)）、“max_leaf_nodes”（最大葉子節(jié)點(diǎn)數(shù)）4 個(gè)參數(shù)基于訓(xùn)練集準(zhǔn)確率進(jìn)行調(diào)優(yōu)，得到最優(yōu)參數(shù)后用于訓(xùn)練決策樹，并將加權(quán)決策樹（由“W-”表示）與一般決策樹的訓(xùn)練效果進(jìn)行比較。對(duì)于隨機(jī)森林算法來(lái)說(shuō)，還需要對(duì)參數(shù)“n_estimators”（生成樹的數(shù)量）進(jìn)行訓(xùn)練，并將基于一般決策樹和加權(quán)決策樹的隨機(jī)森林進(jìn)行了對(duì)比，訓(xùn)練結(jié)果如表2 和表3所示。

表2 模型準(zhǔn)確率

表3 測(cè)試集其他指標(biāo)

圖3 為使用ID3 算法構(gòu)造的決策樹，使用CART算法構(gòu)造的決策樹限于篇幅不做展示，圖4 為兩個(gè)算法在測(cè)試集上分類結(jié)果的混淆矩陣。

圖3 調(diào)度指令風(fēng)險(xiǎn)評(píng)估決策樹（ID3算法）

圖4 調(diào)度指令風(fēng)險(xiǎn)評(píng)估混淆矩陣

從以上的評(píng)估指標(biāo)可以看出，兩種算法訓(xùn)練出的決策樹在測(cè)試集上表現(xiàn)良好，對(duì)于一般決策樹，基于CART 算法的決策樹性能優(yōu)于基于ID3 算法的決策樹，而隨機(jī)森林算法的性能又優(yōu)于上面兩者，這主要體現(xiàn)在“風(fēng)險(xiǎn)”類別樣本的召回率上，其余指標(biāo)的提升相對(duì)較小，而該指標(biāo)由65.5%（ID3）提升至72.4%（CART），然后繼續(xù)提升至82.8%（ID3-RF），但CART-RF 模型的該指標(biāo)有所下降，這說(shuō)明在隨機(jī)挑選特征生成決策樹的情況下，ID3 算法的魯棒性較好。CART 算法優(yōu)于ID3 算法的原因是，根據(jù)式（1）-（3），其信息增益明顯傾向于取值較多的特征，而CART 算法則沒(méi)有這個(gè)問(wèn)題；隨機(jī)森林算法由于采用了多棵決策樹的集成算法，其精度要大于單棵決策樹，且由于隨機(jī)性的引入，加強(qiáng)了它的抗過(guò)擬合能力和抗噪聲能力。

對(duì)于加權(quán)決策樹，明顯可以看出“危險(xiǎn)”樣本的召回率都為100%，也就是說(shuō)所有的“危險(xiǎn)”樣本都被分類正確。從圖4 所示的調(diào)度指令風(fēng)險(xiǎn)評(píng)估混淆矩陣可以看出，通過(guò)1.4 節(jié)所述的代價(jià)敏感方法，加權(quán)決策樹以將一個(gè)“風(fēng)險(xiǎn)”樣本誤分為“危險(xiǎn)”樣本為代價(jià)，保證了“危險(xiǎn)”樣本全部被正確分類。這也是希望的結(jié)果，因?yàn)橐坏ⅰ拔ｋU(xiǎn)”操作判定為“風(fēng)險(xiǎn)”或“安全”，將可能因誤操作導(dǎo)致嚴(yán)重后果。

3 結(jié)論

該文提出了基于加權(quán)決策樹算法的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法，利用真實(shí)系統(tǒng)中的海量電力數(shù)據(jù)，進(jìn)行數(shù)據(jù)清洗、特征選擇和標(biāo)準(zhǔn)化處理，對(duì)調(diào)度指令進(jìn)行多維指令畫像，并構(gòu)建了調(diào)度指令專家知識(shí)庫(kù)，通過(guò)訓(xùn)練加權(quán)決策樹模型尋找合適的調(diào)度指令風(fēng)險(xiǎn)評(píng)估規(guī)則，實(shí)現(xiàn)了良好的分類評(píng)估準(zhǔn)確率，可以為調(diào)度人員提供高效可靠的輔助決策信息。與文獻(xiàn)[5-9]所使用的方法相比，該文利用機(jī)器學(xué)習(xí)技術(shù)從電力數(shù)據(jù)中自動(dòng)尋找調(diào)度指令風(fēng)險(xiǎn)評(píng)估規(guī)則，省去了場(chǎng)景建模和指標(biāo)建立的過(guò)程，克服了對(duì)海量電力數(shù)據(jù)的特征工程、訓(xùn)練模型的選擇和參數(shù)優(yōu)化等難點(diǎn)，并針對(duì)真實(shí)電力系統(tǒng)中樣本不平衡的情況進(jìn)行了優(yōu)化，降低了高危樣本被錯(cuò)分的概率。

但從實(shí)驗(yàn)結(jié)果來(lái)看，其分類準(zhǔn)確率還有提升的空間，這與數(shù)據(jù)處理和模型選擇都存在一定關(guān)系，而且該文對(duì)于電網(wǎng)拓?fù)浣Y(jié)構(gòu)改變需要重新訓(xùn)練模型這一問(wèn)題尚未解決，后續(xù)研究將通過(guò)優(yōu)化指令畫像方法和使用增量學(xué)習(xí)技術(shù)，以解決上述問(wèn)題。

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡