李志兵 肖健梅 王錫淮
(上海海事大學(xué)電氣自動化系 上海 201306)
隨著現(xiàn)代社會中超大城市及城市群的形成,電網(wǎng)規(guī)模不斷擴(kuò)大,其結(jié)構(gòu)也日趨復(fù)雜,所產(chǎn)生的數(shù)據(jù)也呈現(xiàn)爆炸式增長[1]。在迅速積累的海量數(shù)據(jù)中,如何挖掘出與電力系統(tǒng)穩(wěn)定運行相關(guān)聯(lián)的信息并發(fā)揮其價值,是電力系統(tǒng)數(shù)據(jù)挖掘的關(guān)鍵問題,也是提高電力系統(tǒng)安全穩(wěn)定性的重要途徑。電力系統(tǒng)暫態(tài)穩(wěn)定評估是指在電力系統(tǒng)正常運行時受到某一擾動,模型及時判斷系統(tǒng)是否能繼續(xù)保持穩(wěn)態(tài)。目前,基于相位測量裝置的廣域測量系統(tǒng)[2-3]的出現(xiàn)實現(xiàn)了對電力系統(tǒng)實時檢測并記錄穩(wěn)態(tài)和動態(tài)軌跡信息,為電力系統(tǒng)暫態(tài)穩(wěn)定評估提供了大量系統(tǒng)信息,為研究人員從數(shù)據(jù)挖掘的角度解決這一問題提供了新思路。
按照人工智能方法的發(fā)展,暫態(tài)穩(wěn)定評估研究經(jīng)歷了兩個階段:淺層學(xué)習(xí)模型階段和深度學(xué)習(xí)模型階段。最初的研究者將人工神經(jīng)網(wǎng)絡(luò)作為主要的評估模型,在評估方法進(jìn)一步發(fā)展后,暫態(tài)穩(wěn)定評估模型主要包括決策樹[4-6]、支持向量機(jī)[7-11]、極限學(xué)習(xí)機(jī)[12]等淺層學(xué)習(xí)方法。其中,文獻(xiàn)[4]提出一種基于暫態(tài)穩(wěn)定裕度指標(biāo)的多屬性決策樹方法。文獻(xiàn)[7]提出在安全域概念下基于多支持向量機(jī)綜合的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。文獻(xiàn)[12]則以傳統(tǒng)的基于理論模型的電力系統(tǒng)數(shù)值仿真方法為基礎(chǔ),設(shè)計出基于極限學(xué)習(xí)機(jī)的評估模型。以上幾種機(jī)器學(xué)習(xí)方法均為淺層學(xué)習(xí)模型,雖然它們都能在一定程度上完成對電力系統(tǒng)暫態(tài)的穩(wěn)定評估,但是都存在淺層學(xué)習(xí)模型的共同問題,就是對于大電網(wǎng)的高維數(shù)據(jù)進(jìn)行分類時模型泛化能力差、訓(xùn)練效率低,并且特征提取時需要依靠專家經(jīng)驗,缺乏科學(xué)依據(jù)。
近年來,隨著深度學(xué)習(xí)方法的蓬勃發(fā)展和數(shù)據(jù)處理能力的提升,深度學(xué)習(xí)算法被廣泛應(yīng)用于電力系統(tǒng)暫態(tài)穩(wěn)定評估。目前常用的深度學(xué)習(xí)方法包括卷積神經(jīng)網(wǎng)絡(luò)[13]、深度置信網(wǎng)絡(luò)[14-15]和堆疊自動編碼器[16]等。文獻(xiàn)[14]提出了一種基于集成DBN 的兩階段暫態(tài)穩(wěn)定評估方法。文獻(xiàn)[16]采用一種“預(yù)訓(xùn)練-參數(shù)微調(diào)”兩階段學(xué)習(xí)方法,提出一種基于堆疊自動編碼器的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。相較于淺層學(xué)習(xí)模型,深度學(xué)習(xí)模型通過多層串行的深層架構(gòu)能夠?qū)崿F(xiàn)基于高維數(shù)據(jù)的抽象表達(dá)與分類,泛化能力也優(yōu)于淺層模型。然而,深度學(xué)習(xí)模型的訓(xùn)練需要大量的樣本數(shù)據(jù),樣本數(shù)量過少會導(dǎo)致模型最后的擬合程度不足,評估精度不高,但大量的高維數(shù)據(jù)也可能會出現(xiàn)維數(shù)災(zāi)難。
在電力系統(tǒng)暫態(tài)的過程中,電力系統(tǒng)的物理量(電壓、電流、功率、功角等)具有明顯的時變特征,電力系統(tǒng)生成的原始數(shù)據(jù)是一種時間序列數(shù)據(jù)[17]。常見的機(jī)器學(xué)習(xí)模型沒有挖掘數(shù)據(jù)中蘊含的時間維度信息,導(dǎo)致時序特征淹沒在很多常見特征中,制約了模型評估性能。此外在電力系統(tǒng)中,失穩(wěn)樣本數(shù)量要少于暫態(tài)穩(wěn)定樣本,存在天然的樣本不平衡問題,會使模型在訓(xùn)練過程中具有偏向性,對某一樣本的評估更易判定為穩(wěn)定,在實際電力系統(tǒng)運行過程中,將失穩(wěn)樣本誤判為穩(wěn)定樣本會造成重大損失。
針對以上問題,本文提出一種基于鄰域粗糙集和改進(jìn)雙向長短期記憶網(wǎng)絡(luò)的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。利用鄰域粗糙集對原始數(shù)據(jù)集進(jìn)行屬性約簡,得到原始數(shù)據(jù)的最優(yōu)特征子集,進(jìn)一步優(yōu)化分類模型的評估性能。通過雙向長短期記憶網(wǎng)絡(luò)使分類模型真正實現(xiàn)對暫態(tài)過程時序特征的提取,通過注意力機(jī)制使模型聚焦于與失穩(wěn)樣本相關(guān)的特征,引入焦點損失函數(shù),解決了樣本中兩類樣本數(shù)量不平衡的問題,對失穩(wěn)樣本設(shè)置更多的關(guān)注,減少模型誤分類的情況。最后,在新英格蘭10 機(jī)39 節(jié)點仿真系統(tǒng)中驗證了所提方法的準(zhǔn)確性和有效性。
基于數(shù)據(jù)挖掘的電力系統(tǒng)暫態(tài)評估方法是以數(shù)據(jù)為導(dǎo)向的,構(gòu)建一組與電力系統(tǒng)暫態(tài)過程高度關(guān)聯(lián)的原始特征集對模型的評估性能十分重要。根據(jù)時間的差異,系統(tǒng)特征可分為靜態(tài)特征和動態(tài)特征。靜態(tài)特征是指在故障發(fā)生前系統(tǒng)的一些潮流量,包括母線電壓相角、有功無功功率等。動態(tài)特征是故障持續(xù)過程中和故障后的一些狀態(tài)變量或者由其各自組合的組合指標(biāo),如轉(zhuǎn)子的角速度、加速度和轉(zhuǎn)子動能、發(fā)動機(jī)所受沖擊等。
在對原始特征集進(jìn)行選取時,通常要考慮三個原則:系統(tǒng)性、關(guān)聯(lián)性和實效性,即所選特征滿足以下特點:① 電力系統(tǒng)的規(guī)模大小對原始特征集沒有影響,特征不是某一條母線或電機(jī)的狀態(tài)量;②所選特征量能很好地反映系統(tǒng)的狀態(tài),與暫態(tài)穩(wěn)定狀態(tài)有強(qiáng)關(guān)聯(lián)性;③ 在短時間內(nèi),所選的特征量能良好反映系統(tǒng)的穩(wěn)定性,具有時效性。
根據(jù)以上三個原則和參考文獻(xiàn),本文構(gòu)建了如表1 所示的原始特征集,其中t0、t1、t2分別表示故障發(fā)生前、故障發(fā)生時刻和故障切除時刻。表1 中的特征涵蓋整個系統(tǒng)暫態(tài)過程,充分反映故障對電力系統(tǒng)的沖擊影響,所選特征量大多是系統(tǒng)轉(zhuǎn)子、發(fā)電機(jī)狀態(tài)和系統(tǒng)物理量的組合指標(biāo),構(gòu)建的特征集不受系統(tǒng)規(guī)模影響。其中特征1,2,4,5,13,14,20~22 與系統(tǒng)運行水平相關(guān),反映了故障對系統(tǒng)的功率影響;特征6,7,9~12,16~19 與轉(zhuǎn)子速度和角速度相關(guān),反映了擾動對轉(zhuǎn)子的影響;特征8,15 與轉(zhuǎn)子角度有關(guān),反映系統(tǒng)的同步運行狀態(tài)。從表1 可以看出,構(gòu)建的特征集可以很好地體現(xiàn)整個電力系統(tǒng)暫態(tài)過程,為后續(xù)的深度學(xué)習(xí)分類模型打下良好的基礎(chǔ)。
表1 原始特征集
給定實數(shù)空間中的有限非空集合,對于U上的任意對象,定義其鄰域為信息系統(tǒng) 〈U,C,D,f〉,其中U是全部樣本的有限集合,稱為論域,設(shè)有n個對象,則可表示成U={x1,x2,… ,xn};C為有限個條件屬性,設(shè)有m個條件屬性,表示為C={c1,c2,… ,cm};D為樣本對應(yīng)的標(biāo)簽屬性,也稱為決策屬性;f為信息函數(shù),f:U×C→D,f(xi,cj)∈Dj。
給定實數(shù)空間中的有限非空集合U={x1,x2,x3, …,xn},對于U上的任意對象xi,定義其鄰域為
式中,δ為鄰域的閾值,在數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化以后其數(shù)值介于0 與1 之間;Δ 為距離函數(shù)。
定義信息系統(tǒng) 〈U,C,D,f〉 ,B?A,對于?xi,x j∈U,令
式中,B滿足=s,當(dāng)p取不同值時,
表示的距離含義就不同,本文計算樣本之間的距離時p取2,為歐式距離。
給定決策系統(tǒng) 〈U,C,D,f〉,D將U分成N個等價類,對?B?A,決策D關(guān)于特征子集B的下近似為
基于屬性重要度構(gòu)造一種前向貪心式屬性約簡算法[18-20],該算法以空集為起點,每次計算全部剩余屬性的屬性重要度,從中選擇屬性重要度最大的屬性加入約簡集合,直到剩余屬性的重要度為0,即加入任何新的屬性,系統(tǒng)依賴度函數(shù)的值不再變化為止。相較后向搜索算法,前向搜索算法保證了在有大量冗余特征的樣本中將最重要的屬性最先提取出來,加入約簡集合,既節(jié)省了搜索所需的時間,也能去除大量單一分辨能力弱但整體擁有較好分辨能力的特征[21-22]。屬性約簡具體過程如下所示。
(1) 對于任意的某個條件屬性a,計算它的鄰域關(guān)系Na,定義初始空約簡集合red。
(2) 對每一個不屬于red的條件屬性ai,計算其屬性重要度,并取得最大屬性重要度的特征ak。
(3) 如果特征ak的屬性重要度大于0,則將其放入約簡集合red,轉(zhuǎn)到第(2)步繼續(xù)執(zhí)行,否則輸出屬性約簡集合red。
雙向長短期記憶網(wǎng)絡(luò)由連接著同一個輸入層的前后兩向的長短期記憶網(wǎng)絡(luò)構(gòu)成,如圖1 所示,總輸出為兩層LSTM 的輸出之和。
圖1 雙向長短期記憶網(wǎng)絡(luò)結(jié)構(gòu)
長短期記憶網(wǎng)絡(luò)是一種時間遞歸網(wǎng)絡(luò),為解決循環(huán)神經(jīng)網(wǎng)絡(luò)存在梯度消失的問題而提出,通常用于處理間隔和延遲時間較長的時間序列,模型結(jié)構(gòu)如圖2 所示。長短期記憶網(wǎng)絡(luò)通過幾個不同模塊之間的組合判斷當(dāng)前系統(tǒng)信息是否有用,從而決定信息的保存與遺忘,是解決長序列依賴問題的有效手段。長短期記憶網(wǎng)絡(luò)的結(jié)構(gòu)單元主要包括輸入門、遺忘門、輸出門以及一個自連接的記憶單元狀態(tài)值。
圖2 LSTM 模型網(wǎng)絡(luò)結(jié)構(gòu)
其中,輸入門決定讓多少新信息加入到當(dāng)前狀態(tài),tanh 函數(shù)決定當(dāng)前的候選信息,再與一個通過sigmoid 函數(shù)生成的決策向量it相乘,得到的結(jié)果就確定了候選信息有多少內(nèi)容能加入到單元狀態(tài)Ct中,計算公式為
遺忘門決定上一時刻的單元狀態(tài)Ct-1有多少信息能保留到當(dāng)前時刻的單元狀態(tài)Ct中,上一時刻的隱藏狀態(tài)ht-1與當(dāng)前時刻的輸入xt作為遺忘門的輸入,通過sigmoid 函數(shù),得到?jīng)Q策向量ft,再與上一個時刻的單元狀態(tài)Ct-1相乘,得到遺忘門的結(jié)果,計算公式如下
輸出門決定當(dāng)前細(xì)胞的輸出和輸入到下一個細(xì)胞的隱藏狀態(tài),上一時刻的隱藏狀態(tài)ht-1與當(dāng)前時刻的輸入xt通過sigmoid 函數(shù)得到向量ot,當(dāng)前單元狀態(tài)Ct與tanh 激活函數(shù)生成另一個變量,兩者相乘得到當(dāng)前時刻的隱藏狀態(tài)ht,計算表達(dá)式為
輸入門和遺忘門的結(jié)果都作用于細(xì)胞狀態(tài)Ct,細(xì)胞狀態(tài)Ct由上一時刻的單元狀態(tài)Ct-1與決策向量ft的乘積加上決策向量it與候選信息?tC的乘積組成,即
式中,Wi、Wc、Wf、Wo都是各層之間的權(quán)重矩陣;bi、bc、bf、bo是各結(jié)構(gòu)中對應(yīng)的偏置向量;σ為激活函數(shù)sigmoid。
注意力模型最初被用于機(jī)器翻譯,如今被廣泛用于神經(jīng)網(wǎng)絡(luò)模型中。傳統(tǒng)的編碼器-解碼器框架在處理數(shù)據(jù)時,編碼器必須將所有輸入信息壓縮成一個固定的長度,然后將其傳給解碼器,這可能會導(dǎo)致信息在傳遞過程中丟失。其次,傳統(tǒng)框架無法對結(jié)構(gòu)化輸出任務(wù)中的輸入與輸出序列間對齊進(jìn)行建模。在Seq2Seq 任務(wù)中,我們期望的輸出受輸入序列中的某一部分影響較大,但是解碼器中缺乏在生成輸出時選擇性關(guān)注相關(guān)的輸入機(jī)制。
注意力模型旨在通過允許解碼器訪問整個編碼的輸入序列來解決這些問題,核心思想是在輸入序列上引入注意力權(quán)重,以優(yōu)先考慮存在相關(guān)信息的位置集,生成下一個輸出。網(wǎng)絡(luò)結(jié)構(gòu)中的注意力模塊負(fù)責(zé)自動學(xué)習(xí)注意力權(quán)重,它可以自動捕獲編碼器隱藏狀態(tài)和解碼器隱藏狀態(tài)之間的相關(guān)性,注意力權(quán)重構(gòu)建內(nèi)容向量C,該向量作為輸入傳遞給解碼器,在每個解碼位置j,內(nèi)容向量是編碼器所有隱藏狀態(tài)及相應(yīng)注意力權(quán)重的加權(quán)和。
為解決數(shù)據(jù)樣本中失穩(wěn)樣本和暫態(tài)穩(wěn)定樣本間的不平衡問題,在評估模型中引入焦點損失函數(shù)。焦點損失函數(shù)是在二值交叉熵?fù)p失函數(shù)的基礎(chǔ)上增加一個常數(shù)項α和一個指數(shù)項進(jìn)行改進(jìn)的,如下所示
式中,α是樣本數(shù)量平衡因子,用來調(diào)節(jié)正負(fù)樣本的比重,當(dāng)α越接近1 時,正樣本對損失函數(shù)的貢獻(xiàn)就越大;γ是難易平衡因子,當(dāng)γ越大時,難分樣本對損失函數(shù)的貢獻(xiàn)越大。焦點損失函數(shù)可以同時解決正負(fù)、難易樣本的分割問題,α和γ參數(shù)決定樣本的優(yōu)先級,可根據(jù)實際情況調(diào)整這兩個參數(shù)。
本文設(shè)計出一種基于鄰域粗糙集和改進(jìn)Bi-LSTM 的電力系統(tǒng)暫態(tài)評估模型,流程如圖3 所示。
圖3 暫態(tài)穩(wěn)定評估模型框架
在離線訓(xùn)練階段,首先通過時域仿真模擬系統(tǒng)故障,生成故障樣本庫,讀取各發(fā)電機(jī)節(jié)點仿真數(shù)據(jù)模擬同步相量測量單位(Phasor measurement unit,PMU)測量過程。在文獻(xiàn)[18]中的鄰域閾值范圍[0,0.2]進(jìn)行閾值調(diào)試,在保證約簡結(jié)果良好的條件下,將原始數(shù)據(jù)集中23 維的特征降低特征維度,得到不同粒度下的互異約簡子集,挑選約簡結(jié)果的最重要因素是在降低數(shù)據(jù)維度的前提下約簡子集總的重要度接近1,達(dá)到與原始數(shù)據(jù)集近似的效果。在設(shè)計深度模型時,將約簡后的輸入數(shù)據(jù)集進(jìn)行十折交叉驗證,整個模型主要包括卷積層、Bi-LSTM 層、注意力層和輸出層,采用Adam 優(yōu)化算法對模型學(xué)習(xí)率進(jìn)行自適應(yīng)調(diào)整,使用焦點損失函數(shù)替換普通交叉熵函數(shù)。為了模型獲得更好的泛化能力,使用Dropout 策略,并對權(quán)值矩陣進(jìn)行L2 范數(shù)正則化。
在線暫態(tài)穩(wěn)定評估階段,讀取電網(wǎng)實時同步相量測量單位(PMU)的數(shù)據(jù),對數(shù)據(jù)進(jìn)行歸一化后,將其在鄰域粗糙集約簡得到的特征子空間進(jìn)行再表征,再送入訓(xùn)練好的深度學(xué)習(xí)分類模型中,給出電網(wǎng)暫態(tài)穩(wěn)定狀態(tài)的預(yù)測結(jié)果,為電網(wǎng)調(diào)度人員作進(jìn)一步?jīng)Q策提供幫助。
電力系統(tǒng)暫態(tài)穩(wěn)定評估是一個二分類問題,最終判斷系統(tǒng)在擾動后是否穩(wěn)定,通過受擾動后系統(tǒng)各發(fā)動機(jī)功角的暫態(tài)穩(wěn)定指數(shù)(Transient stability index, TSI),對數(shù)據(jù)進(jìn)行標(biāo)簽,表達(dá)式為
式中,Δδmax為仿真時間內(nèi)任意兩臺發(fā)電機(jī)的最大功角差,當(dāng)Δδmax小于360°,即TSI 大于0,則系統(tǒng)暫態(tài)穩(wěn)定,標(biāo)簽標(biāo)注為1;當(dāng)Δδmax大于360°,即TSI 小于0,則系統(tǒng)暫態(tài)不穩(wěn)定,標(biāo)簽標(biāo)注為0。
對模型進(jìn)行暫態(tài)穩(wěn)定評估時,誤判穩(wěn)定樣本和漏判穩(wěn)定樣本造成損失的嚴(yán)重程度不同。前者將失穩(wěn)樣本誤判為穩(wěn)定,導(dǎo)致電力系統(tǒng)中的故障清除裝置不能及時反應(yīng),給整個電力系統(tǒng)造成嚴(yán)重破壞,而后者是將穩(wěn)定樣本判定為失穩(wěn),使故障清除裝置動作,并不會導(dǎo)致太嚴(yán)重的后果。所以考慮到樣本類別不平衡和錯分代價不同,除了采用常規(guī)模型評估使用的準(zhǔn)確率ACC 之外,還引入漏判率MA、誤判率FA 和G-mean 指標(biāo)。表2為暫態(tài)穩(wěn)定評估混淆矩陣。各項評估指標(biāo)的表達(dá)式如表3 所示。
表2 暫態(tài)穩(wěn)定評估混淆矩陣
表3 模型評估指標(biāo)
其中,ACC 表示模型對穩(wěn)定和失穩(wěn)樣本的分類準(zhǔn)確度,越高分類效果越好,是評估模型性能好壞的首要關(guān)注點;漏判率MA 反映模型正確預(yù)測負(fù)樣本純度的能力,即穩(wěn)定樣本被預(yù)測為失穩(wěn)樣本占總穩(wěn)定樣本的比例,MA 越小,模型性能越好;誤判率FA 反映模型正確預(yù)測正樣本純度的能力,即失穩(wěn)樣本被預(yù)測為穩(wěn)定樣本占總失穩(wěn)樣本的比例,F(xiàn)A越小,模型性能越好;G-mean 綜合考慮了對穩(wěn)定樣本和失穩(wěn)樣本的評估準(zhǔn)確率,G-mean 越大,模型對兩種類別樣本分類的學(xué)習(xí)效果越平衡,模型評估性能越好。
以新西蘭 10 機(jī) 39 節(jié)點為算例在Matlab/Simulink 進(jìn)行時域仿真并根據(jù)表1 的特征集生成原始數(shù)據(jù)集,在仿真時考慮全接線系統(tǒng)和N-1、N-2 故障運行方式,后兩種故障環(huán)境為假設(shè)系統(tǒng)中任意一條或兩條線路、變壓器故障失效。以5%為步長,從80%開始,逐漸增加到125%,共設(shè)置10 個不同負(fù)荷水平,調(diào)整發(fā)電機(jī)的發(fā)力使潮流收斂。在每種運行方式下,故障位置設(shè)在每條輸電線路的始段和末端,故障類型設(shè)置為三相短路,故障發(fā)生時刻為0.1 s,并分別在0.2 s、0.3 s、0.4 s 和0.5 s 清除故障,仿真時長為5 s。本文通過Matlab/Simulink仿真共生成7 000 組樣本,其中穩(wěn)定樣本4 818 個,失穩(wěn)樣本2 182 個,在試驗中采用十折交叉驗證劃分訓(xùn)練集和測試集。
本文模型參數(shù)主要是兩類,包括鄰域粗糙集約簡階段鄰域閾值的設(shè)定和深度學(xué)習(xí)算法中的焦點損失函數(shù)。
5.2.1 鄰域粗糙集參數(shù)
在鄰域約簡階段,根據(jù)文獻(xiàn)[18]設(shè)置鄰域區(qū)間范圍為[0, 0.3],以0.01 步長設(shè)定鄰域閾值進(jìn)行約簡,得到若干組互有差異的鄰域約簡結(jié)果,且保證約簡過后子集的所有屬性重要度之和在0.95 以上。不同粒度級別下的鄰域約簡結(jié)果如表4 所示。
表4 鄰域約簡結(jié)果
將不同粒度級別得到的約簡子集和23 維原始數(shù)據(jù)集作為IM-Bi-LSTM 模型的輸入集,在不改變整個深度模型參數(shù)的條件下,對模型性能進(jìn)行評估和分析。評估結(jié)果如表5 所示。
表5 不同鄰域粒度級別下的模型性能
從表4 可以看出,R1 粒度級別下的約簡子集是最優(yōu)子集,既保證對特征實現(xiàn)降維,又能得到最佳的評估性能。對比未經(jīng)約簡的原始數(shù)據(jù)集,在四項評估指標(biāo)上較其都更為優(yōu)異。可見,鄰域粗糙集摒除原始數(shù)據(jù)集的冗余特征信息,對于提高分類模型的性能有一定的實際意義。在R3 和R4 粒度級別下,模型的評估性能要差于原始數(shù)據(jù)集,這說明不能一味地追求特征集降維,約簡后的子集也不能很好地再表征特征集。
5.2.2 焦點損失函數(shù)參數(shù)
焦點損失函數(shù)中有α、γ兩個參數(shù),其中α為樣本數(shù)量平衡因子,表示失穩(wěn)樣本數(shù)量與總數(shù)據(jù)集數(shù)量的比值,γ為調(diào)試因子指數(shù),表示模型對難易樣本的重視程度。當(dāng)γ取0 時,損失函數(shù)即為帶類別權(quán)重的普通二分類交叉熵?fù)p失函數(shù)。訓(xùn)練過程對比如圖4 所示。
圖4 模型訓(xùn)練損失值對比
從圖4 可以看出,在訓(xùn)練集和測試集上,加入調(diào)試因子的焦點損失值比普通交叉熵?fù)p失值更小,訓(xùn)練過程更加平穩(wěn),說明本文模型采用焦點損失函數(shù)提升了模型性能。當(dāng)γ=2 或者1 時,訓(xùn)練集和測試集的損失值差距較小,而在迭代10 次以后普通交叉熵函數(shù)模型的訓(xùn)練集損失與測試集差距較大,說明焦點損失函數(shù)能防止模型過擬合。文獻(xiàn)[19]中,經(jīng)過大量數(shù)據(jù)集驗證了當(dāng)γ=2 時,模型訓(xùn)練效果最好。經(jīng)本文數(shù)據(jù)驗證,γ=2 時模型性能最佳,以下討論中本文模型均采用γ=2 作為超參數(shù)。
為了驗證模型性能,選擇常規(guī)的機(jī)器學(xué)習(xí)算法進(jìn)行對比分析,包括SVM、KNN、決策樹、卷積神經(jīng)網(wǎng)絡(luò)和雙向長短期記憶網(wǎng)絡(luò),數(shù)據(jù)集為第5.2 節(jié)中約簡得到的R1 粒度級別下的最優(yōu)約簡子集。本文所提IM-Bi-LSTM 模型采用Adam 學(xué)習(xí)算法自適應(yīng)調(diào)整學(xué)習(xí)率,使用L2 范數(shù)進(jìn)行正則化,正則化系數(shù)設(shè)置為0.001,焦點損失函數(shù)的α、γ兩個參數(shù)分別設(shè)置為0.3 和2。SVM 采用高斯核函數(shù),懲罰系數(shù)c設(shè)置為1。K 近鄰算法中近鄰數(shù)K取5,距離度量選擇歐式距離,搜索算法選擇數(shù)據(jù)結(jié)構(gòu)中的二叉樹。決策樹采用CART 決策樹,最大深度設(shè)為10。卷積神經(jīng)網(wǎng)絡(luò)設(shè)置3 層卷積層,訓(xùn)練算法采用梯度下降算法。雙向長短期記憶網(wǎng)絡(luò)的參數(shù)與本文使用的IM-Bi-LSTM 相同。最終,不同模型的暫態(tài)穩(wěn)定評估結(jié)果如表6 所示。
表6 不同模型性能對比
從表6 可以看出,基于IM-Bi-LSTM 的模型在各個評估指標(biāo)上都優(yōu)于其他算法模型,不僅有較高的準(zhǔn)確率,而且算法對失穩(wěn)樣本的重視使得其對失穩(wěn)樣本的誤判明顯低于其他分類算法。以決策樹為例,本文所提模型在總的準(zhǔn)確率上提高了3.74%,而反映模型漏判和誤判指標(biāo)的MA、FA 分別降低了2.1%和4.81%,有效降低了漏判和誤判帶來嚴(yán)重后果的風(fēng)險。普通Bi-LSTM 模型相較于IM-Bi-LSTM模型來說,各項評估結(jié)果都稍低,主要原因還是在訓(xùn)練過程中普通模型不能給予與失穩(wěn)結(jié)果關(guān)聯(lián)的特征更多權(quán)重,而引入注意力機(jī)制提升了模型整體的性能。在所有評估模型中,KNN 的評估效果不佳,在評估失穩(wěn)樣本時造成的誤判最大。另一方面,選擇的淺層模型分類準(zhǔn)確率普遍低于深度學(xué)習(xí)模型,主要原因還是淺層模型自身的學(xué)習(xí)局限性,不能充分利用特征中的重要信息,在面對非線性映射問題時,淺層模型的泛化能力有限。而本文選擇的IM-Bi-LSTM 模型除了對失穩(wěn)樣本增加更多權(quán)重,還能夠?qū)μ卣餍畔⑦M(jìn)行抽象提取,考慮序列的前后因素,挖掘更多隱含在數(shù)據(jù)中的有用信息,提高模型的性能。
本文通過Matlab/Simulink 仿真生成7 000 組樣本,其中失穩(wěn)樣本所占的比例大約在30%,但是實際電力系統(tǒng)運行產(chǎn)生的數(shù)據(jù)中失穩(wěn)樣本的數(shù)量極少。在模型訓(xùn)練的過程中,往往由于樣本間的比例不平衡,導(dǎo)致模型訓(xùn)練不充分,在學(xué)習(xí)過程中更偏向樣本數(shù)量較多的類別,對失穩(wěn)樣本的誤判和漏判就會增加。為了評估在樣本類別不平衡條件下的模型性能,從總樣本中抽離暫態(tài)穩(wěn)定樣本,生成失穩(wěn)樣本占樣本總數(shù)量的50%、40%、30%、20%、10%的樣本子集,并且在不同的模型算法上進(jìn)行性能評估,取準(zhǔn)確率ACC 和G-mean 作為本次評估指標(biāo),評估結(jié)果如圖5 所示。
圖5 模型性能隨失穩(wěn)樣本比例的變化情況
從圖5 可以看出,在穩(wěn)定樣本和失穩(wěn)樣本數(shù)量相當(dāng)時,各個模型的性能都達(dá)到最佳,而隨著失穩(wěn)樣本數(shù)量減少導(dǎo)致的兩類樣本數(shù)量不平衡程度加劇,各類模型的性能也出現(xiàn)不同程度的下降。從準(zhǔn)確率ACC 指標(biāo)上看,KNN 和決策樹模型所受的影響最大,一度降至90%以下,而其他三類模型表現(xiàn)相對穩(wěn)定。從G-mean 指標(biāo)上來看,各類模型都有下降,不過下降幅度相差較大,IM-Bi-LSTM 模型表現(xiàn)最穩(wěn)定且最優(yōu),SVM 和KNN 下降幅度最大,在各類模型中表現(xiàn)最差??偟膩砜?,IM-Bi-LSTM模型所受影響程度最小,即使失穩(wěn)樣本數(shù)量下降到只占總樣本數(shù)量的10%,ACC 和G-mean 指標(biāo)依然有很好的表現(xiàn),主要原因是本文所提模型引入了注意力機(jī)制和焦點損失函數(shù),關(guān)注誤分類樣本進(jìn)行訓(xùn)練,給予失穩(wěn)樣本更多的分類權(quán)重,降低對失穩(wěn)樣本的誤分,使模型在樣本類別數(shù)量不平衡的條件下依然具有較佳的分類性能。
在實際電網(wǎng)中,PMU 測量得到的數(shù)據(jù)往往含有一些噪聲,沒有仿真數(shù)據(jù)穩(wěn)定、標(biāo)準(zhǔn)。為驗證模型的抗噪能力,在干凈的數(shù)據(jù)集中加入標(biāo)準(zhǔn)差為0.01的高斯噪聲,對比模型的評估性能。不同模型的評估結(jié)果如表7 所示。
表7 噪聲條件下的模型評估性能結(jié)果
從表7 可以看出,本文所提算法模型的評估性能相較于其他算法模型更為優(yōu)異,與未加噪聲時的模型性能幾乎沒有變化。Bi-LSTM 算法在加入噪聲后的模型性能與其他機(jī)器學(xué)習(xí)算法相比還是更好,但是CNN 算法模型表現(xiàn)不佳,這是由于Bi-LSTM算法與本文的模型一樣加入了L2 范數(shù)正則化和Dropout 策略,使模型在保證強(qiáng)大的特征提取能力外還有較好的模型泛化能力,不會輕易過擬合和陷入局部最優(yōu)。其他三種機(jī)器學(xué)習(xí)算法相較于未加噪聲前的評估性能都有所下降,模型的泛化能力較弱,表現(xiàn)不盡如人意。
本文從考慮暫態(tài)過程中的樣本不平衡和誤分類導(dǎo)致嚴(yán)重影響的角度出發(fā),提出一種基于鄰域粗糙集和IM-Bi-LSTM 的電力系統(tǒng)暫態(tài)穩(wěn)定評估方法。在新西蘭10 機(jī)39 節(jié)點系統(tǒng)上進(jìn)行仿真研究,并與其他算法進(jìn)行對比分析,得到如下結(jié)論。
(1) 相較于其他機(jī)器學(xué)習(xí)算法與傳統(tǒng)深度學(xué)習(xí)算法,本文所提模型有效利用了數(shù)據(jù)集中的時序信息,并引入注意力機(jī)制提高了對失穩(wěn)樣本的重視,模型評估性能在各項評估指標(biāo)上都優(yōu)于其他算法,更適合用于電力系統(tǒng)的暫態(tài)穩(wěn)定評估。
(2) 使用鄰域粗糙集對原始數(shù)據(jù)集進(jìn)行屬性約簡,不但實現(xiàn)了對數(shù)據(jù)集的降維,而且模型對再表征的約簡子集進(jìn)行學(xué)習(xí)后,有非常好的評估性能。
(3) 實際暫態(tài)穩(wěn)定問題是一個樣本不平衡問題,IM-Bi-LSTM 模型通過焦點損失函數(shù),引入權(quán)重系數(shù)調(diào)整模型訓(xùn)練的傾向性,解決了失穩(wěn)樣本與暫態(tài)穩(wěn)定樣本間的不平衡問題。
本文考慮了暫態(tài)穩(wěn)定評估過程中樣本不平衡問題,未來所提模型與一些樣本增強(qiáng)算法結(jié)合,訓(xùn)練生成一批特征相似的失穩(wěn)樣本,完善本文所提模型。