鄧 彬,林 宏,黃穎祺,胡亞榮,張建國(guó),孟 琦
(1.深圳供電局有限公司,廣東 深圳 518000;2.西安交通大學(xué)信息與通信工程學(xué)院,陜西西安 710049;3.興唐通信科技有限公司,北京 100191)
電網(wǎng)規(guī)模的擴(kuò)大[1]和清潔能源的利用[2]使電力數(shù)據(jù)量迅速增加,調(diào)度人員從中獲取決策關(guān)鍵信息變得困難[3]。
現(xiàn)有的調(diào)度指令安全性研究,主要根據(jù)設(shè)備故障概率[4]、負(fù)荷削減[5]、天氣及人員[6]等因素建模并制定風(fēng)險(xiǎn)指標(biāo)[7-9],但所用指標(biāo)基于經(jīng)驗(yàn),且結(jié)果未與風(fēng)險(xiǎn)嚴(yán)重程度對(duì)應(yīng),難以供調(diào)度員參考。電力調(diào)度過(guò)程涉及眾多復(fù)雜特征和規(guī)則,符合機(jī)器學(xué)習(xí)的應(yīng)用場(chǎng)景,但現(xiàn)有的包括故障辨識(shí)、負(fù)荷預(yù)測(cè)和輔助決策的研究[10-13]還未涉及調(diào)度指令層面。
針對(duì)上述問(wèn)題,文中提出一種基于加權(quán)決策樹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法,利用機(jī)器學(xué)習(xí)技術(shù)找到符合電網(wǎng)運(yùn)行規(guī)律的風(fēng)險(xiǎn)評(píng)估規(guī)則,并解決了樣本不平衡問(wèn)題。
調(diào)度指令是電網(wǎng)調(diào)度操作執(zhí)行的依據(jù),根據(jù)電網(wǎng)相關(guān)安全規(guī)程和運(yùn)行準(zhǔn)則給出[4]。調(diào)度指令分為單項(xiàng)令、逐項(xiàng)令和綜合令,單項(xiàng)令的操作內(nèi)容一般是針對(duì)某個(gè)具體設(shè)備給出的,而逐項(xiàng)令和綜合令都可視為是由單項(xiàng)令組成的,所以該文只對(duì)單項(xiàng)令進(jìn)行分析。根據(jù)《南方電網(wǎng)運(yùn)行安全風(fēng)險(xiǎn)量化評(píng)估技術(shù)規(guī)范》和電力領(lǐng)域?qū)<业慕ㄗh,該文將調(diào)度指令的風(fēng)險(xiǎn)分為3 個(gè)等級(jí):安全、風(fēng)險(xiǎn)和危險(xiǎn)。其定義和系統(tǒng)應(yīng)對(duì)措施如表1 所示。
表1 調(diào)度指令安全風(fēng)險(xiǎn)等級(jí)劃分
電力設(shè)備一般有運(yùn)行、檢修、冷備用和熱備用4種狀態(tài)。當(dāng)設(shè)備處于檢修或冷備用狀態(tài)的時(shí)候,對(duì)設(shè)備的任何操作都無(wú)法影響電網(wǎng)整體狀態(tài)。所以,該文主要考慮處于運(yùn)行或熱備用狀態(tài)的電力設(shè)備調(diào)度指令的風(fēng)險(xiǎn)評(píng)估,如果調(diào)度指令的對(duì)象處于檢修或冷備用狀態(tài),則對(duì)該調(diào)度指令的風(fēng)險(xiǎn)評(píng)估結(jié)果為“安全”。
調(diào)度操作能夠改變電力設(shè)備的運(yùn)行狀態(tài),進(jìn)而對(duì)整個(gè)電網(wǎng)產(chǎn)生影響,因此與其相關(guān)聯(lián)的安全影響因素很多。選擇可靠的關(guān)聯(lián)影響因素并構(gòu)建關(guān)聯(lián)影響模型,才能以此找到基于調(diào)度指令的電力系統(tǒng)平穩(wěn)運(yùn)行規(guī)則,從而對(duì)調(diào)度指令進(jìn)行有效的風(fēng)險(xiǎn)評(píng)估。該節(jié)介紹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法利用特征工程構(gòu)建多維度指令畫像,建立調(diào)度指令專家知識(shí)庫(kù),再以此為基礎(chǔ)使用機(jī)器學(xué)習(xí)方法尋找風(fēng)險(xiǎn)評(píng)估規(guī)則。算法框圖如圖1 所示。
圖1 調(diào)度指令風(fēng)險(xiǎn)評(píng)估算法框圖
利用機(jī)器學(xué)習(xí)技術(shù)對(duì)海量電力數(shù)據(jù)進(jìn)行處理,第一步是特征工程。廣泛采集與調(diào)度指令相關(guān)聯(lián)的海量電力數(shù)據(jù),對(duì)其進(jìn)行數(shù)據(jù)清洗、特征選擇和進(jìn)一步的預(yù)處理,在多個(gè)維度對(duì)調(diào)度指令進(jìn)行描述和表征,以形成指令畫像。
1)數(shù)據(jù)清洗。對(duì)電力系統(tǒng)中的結(jié)構(gòu)化數(shù)據(jù)(電氣量測(cè)量、設(shè)備整定值等)和非結(jié)構(gòu)化數(shù)據(jù)(日志、視頻等)分別采用不同方式進(jìn)行處理,并清洗冗余的報(bào)警信號(hào)、事件順序記錄(Sequence of Events,SOE)及無(wú)用信息。
2)特征選擇。一般調(diào)度指令都包含時(shí)間、廠站、操作信息和狀態(tài)4 個(gè)部分,可以從中提取包括廠站名、操作設(shè)備、電壓等級(jí)等信息,從電力能量管理系統(tǒng)中可以獲取設(shè)備運(yùn)行狀態(tài)、保護(hù)設(shè)備狀態(tài)、設(shè)備整定值及安全限值等相關(guān)信息,刪除設(shè)備編號(hào)等不適合作為特征的信息。除此之外,利用PAS 系統(tǒng)對(duì)調(diào)度指令執(zhí)行前的斷面數(shù)據(jù)進(jìn)行潮流計(jì)算,得到調(diào)度指令執(zhí)行后的線路、變壓器、發(fā)電機(jī)、母線的越限和重載信息,從調(diào)度指令的執(zhí)行后果層面構(gòu)建特征來(lái)反映其安全狀態(tài)。綜合以上信息對(duì)調(diào)度指令進(jìn)行多維度畫像,全方位地反映調(diào)度指令的安全風(fēng)險(xiǎn)。
3)標(biāo)準(zhǔn)化處理。選取完特征并提取出相應(yīng)數(shù)據(jù)之后,需對(duì)數(shù)據(jù)做進(jìn)一步處理。首先是缺失值處理,有些信息可能因?yàn)樵O(shè)備故障或通信故障等原因缺失,又或是某些特征本就不適應(yīng)于某些情況,比如變電站沒(méi)有發(fā)電機(jī)這種設(shè)備,該廠站關(guān)于發(fā)電機(jī)的相關(guān)信息就為缺失值,可對(duì)這些缺失值置零處理。機(jī)器學(xué)習(xí)中一般使用數(shù)值數(shù)據(jù)訓(xùn)練模型,所以需要將文本類數(shù)據(jù)單獨(dú)分離并編碼,該文采用獨(dú)熱編碼(One-hot Encoding)對(duì)文本數(shù)據(jù)編碼,將具有m個(gè)可能值的特征編碼為m個(gè)二元特征。這樣做有利于分類器處理屬性數(shù)據(jù),也起到了擴(kuò)充特征的作用。
按照上述流程對(duì)調(diào)度指令完成多維畫像之后,就將調(diào)度指令與多個(gè)電力安全要素聯(lián)系起來(lái),在專家及電力調(diào)度人員指導(dǎo)下對(duì)這些數(shù)據(jù)添加標(biāo)簽,可以將其進(jìn)一步與電力系統(tǒng)的安全狀態(tài)關(guān)聯(lián)起來(lái),構(gòu)建蘊(yùn)含電力系統(tǒng)運(yùn)行規(guī)律的調(diào)度指令專家知識(shí)庫(kù),并以此為基礎(chǔ)對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行訓(xùn)練,找到調(diào)度指令的風(fēng)險(xiǎn)評(píng)估規(guī)則。
1.3.1 決策樹
決策樹是機(jī)器學(xué)習(xí)分類算法中的一類,它的可解釋性強(qiáng),易于理解也易于實(shí)現(xiàn),作為一種非參數(shù)分類方法,不需要擔(dān)心離群點(diǎn)和數(shù)據(jù)是否線性可分的問(wèn)題,適合處理上述文本與數(shù)值數(shù)據(jù)交叉的原始數(shù)據(jù)。
最著名的決策樹算法ID3 算法由J.R.Quinlan 于1986年提出,其核心是在決策樹的各個(gè)節(jié)點(diǎn)上應(yīng)用信息增益準(zhǔn)則進(jìn)行特征選擇。信息增益表示的是已知特征X的信息而使得類別Y的信息不確定性減少的程度,某個(gè)特征的信息增益越大,就表示該特征對(duì)結(jié)果的影響越大,特征A對(duì)數(shù)據(jù)集D的信息增益可表示為:
其中,H(D)表示數(shù)據(jù)集D的經(jīng)驗(yàn)熵,定義為:
其中,|D|為樣本容量,|Ck|為D中類別Ck的樣本個(gè)數(shù),K為總類別數(shù)。
H(D|A)為給定特征為A的情況下數(shù)據(jù)集D的經(jīng)驗(yàn)條件熵,定義為:
其中,n表示特征A的不同取值數(shù)量,根據(jù)特征A可將數(shù)據(jù)集D劃分為n個(gè)子集Di,|Di|為子集Di的樣本個(gè)數(shù),Dik為子集Di中屬于類別Ck的樣本集合,|Dik|為其樣本個(gè)數(shù)。
對(duì)于待劃分的數(shù)據(jù)集,計(jì)算每個(gè)特征劃分?jǐn)?shù)據(jù)集的信息增益,信息增益越大說(shuō)明使用該特征劃分得到的子集不確定性越?。兌仍礁撸虼丝偸沁x擇信息增益最大的特征來(lái)劃分當(dāng)前數(shù)據(jù)集。
除了ID3 算法外,還有利用基尼指數(shù)進(jìn)行特征選擇的CART 算法,基尼指數(shù)(又稱基尼不純度)表示一個(gè)隨機(jī)選中的樣本在子集中被分錯(cuò)的可能性。當(dāng)一個(gè)節(jié)點(diǎn)中所有樣本都是一個(gè)類時(shí),基尼指數(shù)為零。分類問(wèn)題中,假設(shè)有K個(gè)類別,樣本點(diǎn)屬于第k類的概率為pk,則概率分布的基尼指數(shù)定義為:
基于特征A劃分樣本集合D之后的基尼指數(shù)定義如下:
因其表示樣本被分錯(cuò)的概率,所以總是選擇基尼指數(shù)最小的特征來(lái)建立決策樹。
在建立決策樹時(shí),如果樹的深度過(guò)深,葉子節(jié)點(diǎn)數(shù)量過(guò)大,就會(huì)導(dǎo)致過(guò)擬合問(wèn)題,即該決策樹在訓(xùn)練集上表現(xiàn)很好,但在測(cè)試集上表現(xiàn)很差,為了避免這種問(wèn)題,可以對(duì)決策樹采取先剪枝的方法,提前設(shè)定閾值,當(dāng)信息增益減小到某一閾值的時(shí)候就停止創(chuàng)建分支,并限定樹的最大深度及最大葉子節(jié)點(diǎn)數(shù)量。
在按照前述方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理并建立數(shù)據(jù)集后,就可以利用決策樹算法按照如下步驟進(jìn)行訓(xùn)練,以建立一棵決策樹:
1)從根節(jié)點(diǎn)開始,對(duì)節(jié)點(diǎn)計(jì)算所有可能特征的信息增益,選擇信息增益最大或基尼指數(shù)最小的特征作為結(jié)點(diǎn)的特征,并由該特征的不同取值構(gòu)建子節(jié)點(diǎn),該文采用二叉樹構(gòu)建方法;
2)對(duì)子節(jié)點(diǎn)遞歸地調(diào)用以上方法,構(gòu)建決策樹;
3)直到所有特征的信息增益減小到某一閾值或基尼指數(shù)大于某一閾值或樹的深度達(dá)到閾值時(shí)為止。
1.3.2 隨機(jī)森林
隨機(jī)森林(Random Forest,RF)是Leo Breiman 在決策樹的基礎(chǔ)上提出的算法[14],它的基本構(gòu)成單元是決策樹,通過(guò)建立多棵決策樹提高分類準(zhǔn)確性,最后利用投票完成對(duì)新樣本的分類,其算法流程如下:
1)確定決策樹的生成參數(shù)以及樹的數(shù)量n;
2)利用自助法(bootstrap),給每棵決策樹有放回地隨機(jī)選擇N條訓(xùn)練樣本;
3)在每個(gè)節(jié)點(diǎn)處隨機(jī)選擇特征,根據(jù)所選決策樹生成算法比較選擇最佳特征以劃分?jǐn)?shù)據(jù)集并生成子節(jié)點(diǎn);
4)遞歸生成n棵決策樹,對(duì)于測(cè)試集中的未知數(shù)據(jù),采用多數(shù)投票法確定分類結(jié)果。
由于隨機(jī)森林引入的隨機(jī)性及決策樹數(shù)量的增加,使其具有很強(qiáng)的抗干擾和抗過(guò)擬合能力,存在分類不平衡的情況時(shí),可以平衡誤差,提高訓(xùn)練效果。
該文將對(duì)基于ID3 算法和基于CART 算法建立的隨機(jī)森林進(jìn)行比較。
在現(xiàn)實(shí)生活中,樣本不平衡的現(xiàn)象十分常見,在電力系統(tǒng)中也很常見,因?yàn)殡娏Π踩苯佑绊憞?guó)計(jì)民生,要盡量避免發(fā)生事故,所以電力歷史數(shù)據(jù)中的負(fù)樣本極少,這是典型的樣本不平衡現(xiàn)象。對(duì)于樣本不平衡的情況,將無(wú)法單純使用準(zhǔn)確率衡量訓(xùn)練效果。比如1 000 條樣本中,正樣本為995 條,負(fù)樣本有5 條,若是正樣本全部分類正確而負(fù)樣本全部分類錯(cuò)誤,則其準(zhǔn)確率將高達(dá)99.5%,但卻沒(méi)有任何意義。
該文根據(jù)表1 的內(nèi)容將樣本分為三類,但是對(duì)于電力系統(tǒng)來(lái)說(shuō),這三類樣本被模型錯(cuò)分的代價(jià)明顯不同。如果“危險(xiǎn)”的調(diào)度指令被錯(cuò)分為“安全”或“風(fēng)險(xiǎn)”,將可能導(dǎo)致嚴(yán)重的電力事故,所以應(yīng)該最大程度地降低“危險(xiǎn)”樣本的錯(cuò)分概率。
對(duì)于這種情況,該文將采用代價(jià)敏感(Cost-Sensitive)的學(xué)習(xí)方法[15]降低不平衡樣本的影響。代價(jià)敏感方法也就是針對(duì)不同類別的樣本施加錯(cuò)分懲罰(也可叫權(quán)重),使得模型在訓(xùn)練過(guò)程中更傾向于規(guī)模小的類別樣本,提高小樣本分類正確率。對(duì)于決策樹算法來(lái)說(shuō),其權(quán)重根據(jù)式(6)計(jì)算:
其中,weight 為對(duì)應(yīng)樣本權(quán)重,n_sample 為總樣本數(shù),n_classed 為類別數(shù),class_sample 為該類別樣本總數(shù)。
較大的權(quán)重被分配給小樣本,較小的權(quán)重被分配給大樣本。在建立決策樹進(jìn)行節(jié)點(diǎn)的分裂時(shí),需要計(jì)算特征的信息增益及基尼指數(shù),此時(shí)將引入樣本權(quán)重,少數(shù)類樣本劃分正確的特征將得到更高的信息增益或更小的基尼指數(shù),而由于多數(shù)類樣本權(quán)重小,即使被錯(cuò)分對(duì)信息增益或基尼指數(shù)的影響也不大,可以更好地保證少數(shù)類被分類正確,這樣的決策樹被稱為加權(quán)決策樹[16]。
對(duì)于分類問(wèn)題可以使用如下幾個(gè)指標(biāo)來(lái)評(píng)價(jià)模型的效果:
1)準(zhǔn)確率表示分類正確的樣本數(shù)量占總樣本數(shù)量的比例,如式(7)所示:
其中,F(xiàn)P表示實(shí)際為負(fù)但被預(yù)測(cè)為正的樣本數(shù)量,TN表示實(shí)際為負(fù)被預(yù)測(cè)為負(fù)的樣本的數(shù)量,TP表示實(shí)際為正被預(yù)測(cè)為正的樣本數(shù)量,F(xiàn)N表示實(shí)際為正但被預(yù)測(cè)為負(fù)的樣本的數(shù)量。
2)精確率表示預(yù)測(cè)為正的樣本中實(shí)際也為正的樣本占被預(yù)測(cè)為正的樣本的比例,如式(8)所示:
3)召回率表示實(shí)際為正的樣本中被預(yù)測(cè)為正的樣本所占實(shí)際為正的樣本的比例,如式(9)所示:
4)混淆矩陣是用于表示分類精確度的常用指標(biāo),由N行N列的矩陣構(gòu)成,其中每列表示所預(yù)測(cè)的類別,每行表示樣本的真實(shí)類別,列數(shù)據(jù)總數(shù)表示預(yù)測(cè)為該類別的樣本數(shù)目,行數(shù)據(jù)總數(shù)表示實(shí)際為該類別的樣本數(shù)目。
綜上,基于加權(quán)決策樹的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法流程圖如圖2 所示。
圖2 調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法流程圖
該實(shí)驗(yàn)的數(shù)據(jù)來(lái)源為南方電網(wǎng)深圳供電局OPEN3000 電力監(jiān)控系統(tǒng)數(shù)據(jù)庫(kù)中的大量電力數(shù)據(jù)。在對(duì)數(shù)據(jù)進(jìn)行初步清理后,按1.1 節(jié)的方法選擇了包括“操作類型”、“電壓等級(jí)”、“設(shè)備類型”、“設(shè)備(線路、變壓器、發(fā)電機(jī))負(fù)載率”、“設(shè)備越限”等14個(gè)特征來(lái)構(gòu)建數(shù)據(jù)集,并邀請(qǐng)了5 位專家及調(diào)度工作人員根據(jù)當(dāng)?shù)仉娋W(wǎng)的拓?fù)浣Y(jié)構(gòu)及整體安全態(tài)勢(shì)添加風(fēng)險(xiǎn)評(píng)估標(biāo)簽,以符合真實(shí)電網(wǎng)的安全風(fēng)險(xiǎn)狀態(tài)。由于真實(shí)的電網(wǎng)一般都處于正常運(yùn)行狀態(tài),極少發(fā)生危險(xiǎn)事故,所以數(shù)據(jù)中幾乎沒(méi)有負(fù)樣本,用于訓(xùn)練時(shí),雖然正確率極高但卻因負(fù)樣本的缺乏而無(wú)法將危險(xiǎn)情況較好地分辨出來(lái),所以需要在真實(shí)數(shù)據(jù)的基礎(chǔ)上構(gòu)造符合實(shí)際情況的負(fù)樣本。為了模擬真實(shí)情況并測(cè)試不平衡樣本訓(xùn)練效果,最終構(gòu)造的數(shù)據(jù)集中“安全”樣本和“危險(xiǎn)”樣本的占比差距較大,約為14∶1。
該實(shí)驗(yàn)共構(gòu)造了1 000 條數(shù)據(jù),將其隨機(jī)劃分為訓(xùn)練集和測(cè)試集,其中80%作為訓(xùn)練集,20%作為測(cè)試集,且訓(xùn)練集與測(cè)試集各類樣本占比基本一致。測(cè)試集里“安全”樣本為159 個(gè),“風(fēng)險(xiǎn)”樣本為29 個(gè),“危險(xiǎn)”樣本為12 個(gè),為不平衡樣本。
分別使用ID3 算法及CART 算法構(gòu)造決策樹。首先利用十折交叉驗(yàn)證和網(wǎng)格搜索對(duì)“max_depth”(樹的最大深度)、“min_samples_split”(分割節(jié)點(diǎn)所需的最小樣本數(shù))、“min_samples_leaf”(葉子節(jié)點(diǎn)所需的最小樣本數(shù))、“max_leaf_nodes”(最大葉子節(jié)點(diǎn)數(shù))4 個(gè)參數(shù)基于訓(xùn)練集準(zhǔn)確率進(jìn)行調(diào)優(yōu),得到最優(yōu)參數(shù)后用于訓(xùn)練決策樹,并將加權(quán)決策樹(由“W-”表示)與一般決策樹的訓(xùn)練效果進(jìn)行比較。對(duì)于隨機(jī)森林算法來(lái)說(shuō),還需要對(duì)參數(shù)“n_estimators”(生成樹的數(shù)量)進(jìn)行訓(xùn)練,并將基于一般決策樹和加權(quán)決策樹的隨機(jī)森林進(jìn)行了對(duì)比,訓(xùn)練結(jié)果如表2 和表3所示。
表2 模型準(zhǔn)確率
表3 測(cè)試集其他指標(biāo)
圖3 為使用ID3 算法構(gòu)造的決策樹,使用CART算法構(gòu)造的決策樹限于篇幅不做展示,圖4 為兩個(gè)算法在測(cè)試集上分類結(jié)果的混淆矩陣。
圖3 調(diào)度指令風(fēng)險(xiǎn)評(píng)估決策樹(ID3算法)
圖4 調(diào)度指令風(fēng)險(xiǎn)評(píng)估混淆矩陣
從以上的評(píng)估指標(biāo)可以看出,兩種算法訓(xùn)練出的決策樹在測(cè)試集上表現(xiàn)良好,對(duì)于一般決策樹,基于CART 算法的決策樹性能優(yōu)于基于ID3 算法的決策樹,而隨機(jī)森林算法的性能又優(yōu)于上面兩者,這主要體現(xiàn)在“風(fēng)險(xiǎn)”類別樣本的召回率上,其余指標(biāo)的提升相對(duì)較小,而該指標(biāo)由65.5%(ID3)提升至72.4%(CART),然后繼續(xù)提升至82.8%(ID3-RF),但CART-RF 模型的該指標(biāo)有所下降,這說(shuō)明在隨機(jī)挑選特征生成決策樹的情況下,ID3 算法的魯棒性較好。CART 算法優(yōu)于ID3 算法的原因是,根據(jù)式(1)-(3),其信息增益明顯傾向于取值較多的特征,而CART 算法則沒(méi)有這個(gè)問(wèn)題;隨機(jī)森林算法由于采用了多棵決策樹的集成算法,其精度要大于單棵決策樹,且由于隨機(jī)性的引入,加強(qiáng)了它的抗過(guò)擬合能力和抗噪聲能力。
對(duì)于加權(quán)決策樹,明顯可以看出“危險(xiǎn)”樣本的召回率都為100%,也就是說(shuō)所有的“危險(xiǎn)”樣本都被分類正確。從圖4 所示的調(diào)度指令風(fēng)險(xiǎn)評(píng)估混淆矩陣可以看出,通過(guò)1.4 節(jié)所述的代價(jià)敏感方法,加權(quán)決策樹以將一個(gè)“風(fēng)險(xiǎn)”樣本誤分為“危險(xiǎn)”樣本為代價(jià),保證了“危險(xiǎn)”樣本全部被正確分類。這也是希望的結(jié)果,因?yàn)橐坏ⅰ拔kU(xiǎn)”操作判定為“風(fēng)險(xiǎn)”或“安全”,將可能因誤操作導(dǎo)致嚴(yán)重后果。
該文提出了基于加權(quán)決策樹算法的調(diào)度指令風(fēng)險(xiǎn)評(píng)估方法,利用真實(shí)系統(tǒng)中的海量電力數(shù)據(jù),進(jìn)行數(shù)據(jù)清洗、特征選擇和標(biāo)準(zhǔn)化處理,對(duì)調(diào)度指令進(jìn)行多維指令畫像,并構(gòu)建了調(diào)度指令專家知識(shí)庫(kù),通過(guò)訓(xùn)練加權(quán)決策樹模型尋找合適的調(diào)度指令風(fēng)險(xiǎn)評(píng)估規(guī)則,實(shí)現(xiàn)了良好的分類評(píng)估準(zhǔn)確率,可以為調(diào)度人員提供高效可靠的輔助決策信息。與文獻(xiàn)[5-9]所使用的方法相比,該文利用機(jī)器學(xué)習(xí)技術(shù)從電力數(shù)據(jù)中自動(dòng)尋找調(diào)度指令風(fēng)險(xiǎn)評(píng)估規(guī)則,省去了場(chǎng)景建模和指標(biāo)建立的過(guò)程,克服了對(duì)海量電力數(shù)據(jù)的特征工程、訓(xùn)練模型的選擇和參數(shù)優(yōu)化等難點(diǎn),并針對(duì)真實(shí)電力系統(tǒng)中樣本不平衡的情況進(jìn)行了優(yōu)化,降低了高危樣本被錯(cuò)分的概率。
但從實(shí)驗(yàn)結(jié)果來(lái)看,其分類準(zhǔn)確率還有提升的空間,這與數(shù)據(jù)處理和模型選擇都存在一定關(guān)系,而且該文對(duì)于電網(wǎng)拓?fù)浣Y(jié)構(gòu)改變需要重新訓(xùn)練模型這一問(wèn)題尚未解決,后續(xù)研究將通過(guò)優(yōu)化指令畫像方法和使用增量學(xué)習(xí)技術(shù),以解決上述問(wèn)題。