王 強,劉 煉,陳 浩
(三峽大學(xué)電氣與新能源學(xué)院,宜昌 443002)
隨著現(xiàn)代電網(wǎng)的廣域互聯(lián)和大規(guī)模新能源的接入,電力系統(tǒng)運行面臨的風(fēng)險也在不斷增加,快速、準(zhǔn)確的暫態(tài)穩(wěn)定評估已成為保證系統(tǒng)安全穩(wěn)定運行的重要手段[1]。傳統(tǒng)用于分析電力系統(tǒng)暫態(tài)穩(wěn)定的方法有時域仿真法[2]和直接法[3]。其中:時域仿真法計算速度較慢,難以適應(yīng)在線應(yīng)用的需求;直接法雖然計算速度快,但對于復(fù)雜系統(tǒng),其能量函數(shù)構(gòu)造困難,模型的適應(yīng)性較差。
近年來,廣域測量系統(tǒng)的不斷發(fā)展促進(jìn)了同步相量測量單元PMU(phasor measurement unit)在電網(wǎng)中的廣泛應(yīng)用。PMU能夠快速采集電力系統(tǒng)中各種關(guān)鍵設(shè)備的運行狀態(tài)信息,為在線暫態(tài)穩(wěn)定預(yù)測創(chuàng)造了條件[4-5]。并且,PMU采集的海量數(shù)據(jù)為人工智能方法在電力系統(tǒng)中的應(yīng)用提供了數(shù)據(jù)支撐,掀起了機器學(xué)習(xí)在暫態(tài)穩(wěn)定評估領(lǐng)域的研究熱潮[6-8]。
基于機器學(xué)習(xí)的暫態(tài)穩(wěn)定評估方法不需要建立復(fù)雜的數(shù)學(xué)模型,主要通過在離線階段訓(xùn)練大量的樣本建立特征數(shù)據(jù)與暫態(tài)穩(wěn)定指標(biāo)之間的映射關(guān)系,然后將訓(xùn)練好的模型應(yīng)用于在線暫態(tài)穩(wěn)定預(yù)測。常用于分析電力系統(tǒng)暫態(tài)穩(wěn)定的機器學(xué)習(xí)方法有神經(jīng)網(wǎng)絡(luò)[9-10]、支持向量機SVM(support vector machine)[11-12]、決策樹DT(decision tree)[13-14]和深度學(xué)習(xí)[15-17]等。雖然上述方法已經(jīng)取得了較多的成果,但仍存在著不足之處。其中:DT和SVM由于模型結(jié)構(gòu)簡單,對數(shù)據(jù)的挖掘能力有限,其評估精度仍存在提升的空間;神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)模型屬于“黑箱模型”,模型的結(jié)構(gòu)較為復(fù)雜,導(dǎo)致模型離線更新的成本較高,很難應(yīng)用于實際。
此外,機器學(xué)習(xí)方法在應(yīng)用過程中,通常還會面臨以下問題:一方面,隨著電網(wǎng)規(guī)模的不斷擴(kuò)大,電力系統(tǒng)運行數(shù)據(jù)的維度也在不斷增加,如何篩選初始樣本中的關(guān)鍵運行特征是暫態(tài)穩(wěn)定評估中的一個難題;另一方面,基于機器學(xué)習(xí)的暫態(tài)穩(wěn)定評估方法通常只是評估系統(tǒng)的穩(wěn)定與否,并未給出系統(tǒng)的穩(wěn)定裕度信息,容易造成低暫態(tài)穩(wěn)定裕度情況下由于預(yù)防控制措施采取不及時而導(dǎo)致電力系統(tǒng)出現(xiàn)暫態(tài)失穩(wěn)。
基于上述分析,本文提出了一種基于關(guān)系探索和核-樹聯(lián)合提升KTBoost(combined kernel and tree boosting)的暫態(tài)穩(wěn)定裕度評估方法。首先,通過分析特征與目標(biāo)變量之間的相關(guān)性以及特征之間的冗余性和協(xié)同性,篩選出初始特征集中的關(guān)鍵特征子集。然后,使用關(guān)鍵特征數(shù)據(jù)及其對應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo)訓(xùn)練KTBoost模型,構(gòu)建KTBoost驅(qū)動的暫態(tài)穩(wěn)定裕度評估模型。最后,在新英格蘭10機39節(jié)點系統(tǒng)和1648節(jié)點系統(tǒng)進(jìn)行仿真實驗,驗證了該方法的準(zhǔn)確性和有效性。
暫態(tài)穩(wěn)定裕度TSM(transient stability margin)用于反映電力系統(tǒng)的暫態(tài)穩(wěn)定水平,本文通過引入電力系統(tǒng)故障的極限清除時間CCT(critical clear?ing time)來構(gòu)建每個運行點的暫態(tài)穩(wěn)定裕度指標(biāo)。CCT是指電力系統(tǒng)故障后可以恢復(fù)穩(wěn)定運行所允許的最大故障切除時間,CCT越長,表明系統(tǒng)維持穩(wěn)定運行的能力越強。文獻(xiàn)[18]將CCT作為電力系統(tǒng)的暫態(tài)穩(wěn)定裕度指標(biāo),提出了一種基于Elastic Net的暫態(tài)穩(wěn)定裕度評估方法;文獻(xiàn)[19]使用不同故障位置的CCT與故障清除時間的差值來表征電力系統(tǒng)的穩(wěn)定水平,并采用隨機森林RF(random for?est)實現(xiàn)暫態(tài)穩(wěn)定裕度的回歸預(yù)測?;谏鲜鲅芯?,本文將暫態(tài)穩(wěn)定裕度指標(biāo)構(gòu)建為
式中:TCCT為故障的極限清除時間;TACT為故障的實際清除時間。當(dāng)TSM>0時,表明系統(tǒng)處于穩(wěn)定運行,反之則表明系統(tǒng)失穩(wěn)。TSM越大,則系統(tǒng)的穩(wěn)定性越強。本文采用二分法計算故障的CCT,將能夠保持系統(tǒng)穩(wěn)定運行的最長清除時間作為該故障位置的CCT。在CCT的求解過程中,以任意兩臺發(fā)電機的最大功角差是否超過360°作為系統(tǒng)穩(wěn)定的判斷依據(jù)。
1.2.1 初始輸入特征
1.2.2 關(guān)鍵特征的選擇
由于初始特征中包含了許多冗余重復(fù)的信息,若將其作為機器學(xué)習(xí)模型的輸入,將會極大程度地增加模型的計算負(fù)擔(dān),因此需要進(jìn)行特征降維。最大信息系數(shù)MIC(maximal information coefficient)是一種基于互信息的關(guān)系探索方法,常用于挖掘變量之間的隱含關(guān)系[20]。MIC的基本思想是將兩個變量的關(guān)系離散到一個二維空間并通過散點圖進(jìn)行表示。給定一個數(shù)據(jù)集D={(X,Y)}={(x1,y1),(x2,y2),???,(xn,yn)},其中n為樣本的數(shù)量。首先,將xi和yi構(gòu)成的散點圖進(jìn)行x行y列網(wǎng)格化,再根據(jù)兩個變量在網(wǎng)格中的近似概率密度分布,分別計算這兩個變量的互信息。其中,網(wǎng)格的劃分方式有很多種,求取不同網(wǎng)格劃分下互信息的最大值作為最終的MIC。MIC的計算公式為
式中:a、b為在x軸和y軸方向上劃分格子的個數(shù);I(X;Y)為變量X、Y之間的互信息;B為網(wǎng)格劃分的閾值,通常設(shè)置為n0.6。MIC∈[0,1],MIC越大,表明變量之間的相關(guān)性越強。
雖然MIC能夠篩選出與目標(biāo)變量具有強相關(guān)性的關(guān)鍵特征,但在考慮相關(guān)性的同時,還應(yīng)考慮特征之間的冗余性和協(xié)同性。為此,本文提出了一種基于施密特正交化GSO(Gram-Schmidt orthonor?malization)[21]和信息增益 IG(information gain)[22]的GSO-MIC-IG特征選擇框架。
首先,通過GSO分析變量之間的冗余度。假設(shè)F為包含N個特征的初始特征集,需要選擇的特征子集為S={f1,f2,…,fm},其中,第i次選擇的特征為fi,fi∈F-S,目標(biāo)變量為Y。將fi關(guān)于特征子集S的正交化變量,定義為
式中:‖v‖為正交化向量v的模;GSO(fi,S)為表征變量fi獨立于已選特征子集S之外的信息。通過計算GSO(fi,S)與目標(biāo)變量Y之間的MIC[GSO(fi,S),Y]來衡量待選變量fi與子集S的相關(guān)度。MIC[GSO(fi,S),Y]越大,表明fi所包含獨立于已選子集S的信息越多,對子集S越重要。通過分析特征fi獨立于子集S之外的信息間接考慮了特征之間的冗余度,避免了無關(guān)冗余信息的干擾。
在分析特征之間冗余性的同時,還需對特征之間的協(xié)同作用進(jìn)行分析。對于特征fi、fS以及目標(biāo)變量Y,將這三者的協(xié)同增益定義為
式中:I([fi,fS],Y)為特征fi和fS協(xié)同作用時與Y的互信息,I(fi,Y)和I(fS,Y)分別為fi和fS單獨作用時與Y的互信息。當(dāng)IG(fi,fS,Y)≥0時,表明特征fi和fS之間存在協(xié)同作用;反之,則表明fi和fS對于目標(biāo)變量Y存在冗余。將特征fi和子集S對于Y的協(xié)同度VI(variable interaction)定義[23]為
結(jié)合上述冗余性和協(xié)同性分析過程,文中所提特征選擇框架的整體流程如下所示。
KTBoost[24]是一種結(jié)合核提升和樹提升的新型Boosting算法,其基本思想是通過回歸樹和再生核希爾伯特空間RKHS(reproducing kernel Hilbert space)函數(shù)相結(jié)合,從而獲得學(xué)習(xí)能力更強的強學(xué)習(xí)器。KTBoost在每一次增強迭代中,首先通過牛頓法或梯度下降法來學(xué)習(xí)回歸樹和RKHS函數(shù),然后選擇使經(jīng)驗風(fēng)險最低的基學(xué)習(xí)器加入到集成模型中。KTBoost算法的工作原理如下。
基于關(guān)系探索和KTBoost的暫態(tài)穩(wěn)定裕度評估流程如圖1所示,包括離線訓(xùn)練和在線應(yīng)用2個階段。
圖1 暫態(tài)穩(wěn)定裕度評估流程Fig.1 Process of assessment on transient stability margin
(1)初始數(shù)據(jù)庫。準(zhǔn)備一個可靠且豐富的初始數(shù)據(jù)庫是構(gòu)建準(zhǔn)確映射關(guān)系的前提。文中借助電力系統(tǒng)仿真軟件PSS/E[25]進(jìn)行電力系統(tǒng)預(yù)想事故的時域仿真,得到包含多個樣本的初始數(shù)據(jù)庫,并通過第1.1節(jié)所提方法計算每個樣本對應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo)。
(2)特征選擇。為了降低模型的計算復(fù)雜度,文中通過第1.2小節(jié)提出的方法對初始數(shù)據(jù)進(jìn)行降維,篩選出具有強相關(guān)性、低冗余性和高協(xié)同度的關(guān)鍵特征子集。
(3)模型訓(xùn)練及測試。將特征選擇后的數(shù)據(jù)劃分為訓(xùn)練集和測試集對KTBoost模型進(jìn)行訓(xùn)練及測試,構(gòu)建能夠準(zhǔn)確反映輸入特征數(shù)據(jù)與暫態(tài)穩(wěn)定裕度指標(biāo)之間映射關(guān)系的暫態(tài)穩(wěn)定裕度評估模型。
(4)知識庫的建立。由于檢修和調(diào)整運行方式等原因,電力系統(tǒng)的運行場景會經(jīng)常發(fā)生改變,而初始訓(xùn)練樣本中不可能涵蓋電力系統(tǒng)所有的運行場景,導(dǎo)致離線訓(xùn)練好的模型在應(yīng)用階段的適用性大為降低。為了保證評估模型在應(yīng)用階段的有效性,需要進(jìn)行暫態(tài)穩(wěn)定評估模型的更新。
通常,電力系統(tǒng)的調(diào)度會根據(jù)“日前-日內(nèi)-小時內(nèi)”的負(fù)荷預(yù)測結(jié)果來安排電力系統(tǒng)下一階段的運行方式和啟停計劃,表明電力系統(tǒng)的運行方式和拓?fù)浣Y(jié)構(gòu)是可以提前預(yù)測的。對于這種情況,可以通過在離線階段生成多個未來的運行場景和相應(yīng)的預(yù)想事故集,構(gòu)建針對不同運行場景的暫態(tài)穩(wěn)定裕度評估模型,并將所有的模型集成到一個知識庫中,以備后續(xù)出現(xiàn)緊急事故時的快速調(diào)用。對于在應(yīng)用階段出現(xiàn)的計劃外的停運或故障情況,則需及時仿真生成新的樣本進(jìn)行模型的更新,并將更新后的模型添加到知識庫中。
隨著知識庫的不斷豐富,更多潛在的電力系統(tǒng)運行場景將被覆蓋,未考慮的運行場景將會越來越少,模型的適應(yīng)性及在線應(yīng)用的可靠性將不斷提高。
在應(yīng)用階段,首先對電力系統(tǒng)的運行場景進(jìn)行判斷,然后選擇PMU采集的關(guān)鍵特征數(shù)據(jù)輸入離線訓(xùn)練好的暫態(tài)穩(wěn)定裕度評估模型,實時評估系統(tǒng)的穩(wěn)定情況。當(dāng)電力系統(tǒng)的暫態(tài)穩(wěn)定裕度較高時,說明系統(tǒng)的穩(wěn)定水平較強,則保持對系統(tǒng)的持續(xù)監(jiān)測。當(dāng)系統(tǒng)處于失穩(wěn)或暫態(tài)穩(wěn)定裕度較低時,應(yīng)及時采取預(yù)防控制措施,使電力系統(tǒng)恢復(fù)到較為穩(wěn)定的運行狀況。
文中采用決定系數(shù)(R2)和均方根誤差RMSE(root mean square error)兩個統(tǒng)計指標(biāo)來衡量模型的預(yù)測性能。R2和RMSE的計算公式分別為
式中:n為樣本數(shù)量;yi為xi對應(yīng)的暫態(tài)穩(wěn)定裕度指標(biāo);為預(yù)測值;為yi的平均值。一般來說,R2越接近于1,RMSE越小,表明模型的擬合效果越好。
為驗證所提方法的有效性,本文通過PSS/E軟件對如圖2所示的新英格蘭10機39節(jié)點系統(tǒng)進(jìn)行仿真。所有測試均是在一臺配置Intel Core i5-4200H 2.80 GHz CPU和8 GB RAM的電腦上進(jìn)行。
圖2 新英格蘭10機39節(jié)點系統(tǒng)Fig.2 New England 10-machine 39-bus system
3.1.1 數(shù)據(jù)生成及參數(shù)設(shè)置
在仿真過程中,以5%為步長,模擬總負(fù)荷在[75%,125%]之間增長變化,并根據(jù)負(fù)荷水平相應(yīng)調(diào)整發(fā)電機出力。通過在線路上設(shè)置三相短路故障來模擬電力系統(tǒng)的預(yù)想事故情況,將故障的持續(xù)時間設(shè)置在0.1~0.4 s之間變化,通過切除線路來清除故障?;诓煌某跏歼\行方式進(jìn)行電力系統(tǒng)的時域仿真,采集不同初始運行方式下的電網(wǎng)運行數(shù)據(jù),最終一共生成了4 590個樣本。通過五折交叉驗證法隨機選取初始樣本的80%作為訓(xùn)練集,剩余20%作為測試集。
KTBoost模型參數(shù)的設(shè)置在一定程度上影響了模型的評估性能,通過網(wǎng)格搜索法優(yōu)化模型的參數(shù),最終得到KTBoost的最優(yōu)參數(shù)組合:基回歸器數(shù)量為200,葉子最大深度為4,學(xué)習(xí)率為0.05,核函數(shù)設(shè)置為徑向基核函數(shù)。
3.1.2 特征選擇的影響
KTBoost在不同特征維度下測試的精度及訓(xùn)練時間如圖3所示。結(jié)果表明,隨著特征維度的增加,模型的評估精度逐步上升,最后趨于穩(wěn)定??紤]到基于機器學(xué)習(xí)的暫態(tài)穩(wěn)定評估模型需要經(jīng)常進(jìn)行更新迭代,為了避免計算資源的浪費,最終選擇初始特征的30維作為關(guān)鍵特征子集。
圖3 不同特征維度下的性能測試Fig.3 Performance tests under different feature dimensions
為了體現(xiàn)本文所提特征選擇方法的優(yōu)越性,將其與MIC、最大相關(guān)最小冗余MRMR(maximum rel?evance minimum redundancy)和聯(lián)合互信息JMI(joint mutual information)3種特征選擇方法進(jìn)行對比測試。基于不同的方法分別選擇初始特征的30維作為關(guān)鍵特征子集,測試結(jié)果如表1所示。結(jié)果表明,由于MIC只是挖掘特征與目標(biāo)變量之間的相關(guān)性,并未考慮其他因素的影響,因此模型評估的精度偏低;JMI考慮了多個特征以及目標(biāo)變量之間的相關(guān)性,能夠獲得比MIC更高的評估準(zhǔn)確性;MRMR在特征選擇過程中,并未考慮特征之間的協(xié)同作用,其評估精度低于本文所提的GSOMIC-IG特征選擇框架??傮w來看,基于GSO-MICIG篩選的特征子集,KTBoost模型能夠獲得最優(yōu)的評估結(jié)果。
表1 不同特征選擇方法的對比Tab.1 Comparison among different feature selectionmethods
3.1.3 預(yù)測精度與時間復(fù)雜度
隨著同步相量測量技術(shù)的不斷發(fā)展,PMU對電網(wǎng)運行數(shù)據(jù)的采集頻率已經(jīng)高達(dá)50次/s[5]。即對每個時間步的電力系統(tǒng)暫態(tài)穩(wěn)定裕度的評估,評估模型對PMU數(shù)據(jù)的處理時間必須少于0.02 s。其中,KTBoost模型的性能測試結(jié)果如表2所示,其擬合效果隨迭代次數(shù)變化的曲線如圖4所示。結(jié)果表明,模型對每個樣本的評估時間遠(yuǎn)小于0.02 s,并且隨著迭代次數(shù)的增加,KTBoost模型的擬合效果越好??傮w來看,KTBoost模型能在短時間內(nèi)實現(xiàn)高精度的暫態(tài)穩(wěn)定裕度評估,能夠滿足在線應(yīng)用的需求。
表2 預(yù)測精度和時間復(fù)雜度Tab.2 Prediction accuracy and time complexity
圖4 不同迭代次數(shù)下的RMSEFig.4 RMSE under different numbers of iterations
3.1.4 不同機器學(xué)習(xí)模型的性能對比
為了體現(xiàn)本文所提KTBoost模型的優(yōu)越性,將其與不同的機器學(xué)習(xí)模型進(jìn)行對比測試。主要包括人工神經(jīng)網(wǎng)絡(luò)ANN(artificial neural network)、DT、RF、梯度提升決策樹 GBDT(gradient boosting decision tree)、SVM和卷積神經(jīng)網(wǎng)絡(luò)CNN(convolu?tional neural network)。其中,CNN基于深度學(xué)習(xí)庫TensorFlow搭建,其他機器學(xué)習(xí)模型均基于機器學(xué)習(xí)庫Scikit-learn搭建。在測試過程中,所有模型均使用相同的輸入特征。不同機器學(xué)習(xí)模型的性能測試結(jié)果如表3所示。
表3 不同模型的性能測試Tab.3 Performance tests of different models
結(jié)果表明,ANN、DT和SVM相對與其他方法,總體評估精度處于一個較低的水平。與基于樹提升的GBDT和簡單樹集成的RF相比,KTBoost通過回歸樹與RKHS回歸函數(shù)相結(jié)合,能夠獲得一個更高的評估精度。CNN雖然能夠獲得一個較高的評估準(zhǔn)確性,但CNN在訓(xùn)練時需要調(diào)整大量的網(wǎng)絡(luò)參數(shù),導(dǎo)致模型的計算量較大,模型離線訓(xùn)練的成本較高??傮w來看,KTBoost在保證精度的同時不會消耗大量的訓(xùn)練時間,更加適用于電力系統(tǒng)的在線暫態(tài)穩(wěn)定裕度預(yù)測。
3.1.5 不同訓(xùn)練集規(guī)模的影響
當(dāng)電力系統(tǒng)出現(xiàn)緊急事故時,已經(jīng)訓(xùn)練好的離線模型可能無法給出滿意的評估結(jié)果,因此需要進(jìn)行模型的更新。為了快速建立暫態(tài)穩(wěn)定裕度評估模型,如何確定訓(xùn)練數(shù)據(jù)的規(guī)模使模型能夠達(dá)到滿足要求的評估精度也是一個非常關(guān)鍵的問題。為此,文中分別測試了不同訓(xùn)練集規(guī)模對模型評估精度的影響,結(jié)果如圖5所示。由圖5可知,隨著訓(xùn)練集規(guī)模的逐步遞增,KTBoost模型的評估精度也隨之增加,表明了需要充足的訓(xùn)練樣來保證評估的高準(zhǔn)確性。此外,對于電網(wǎng)運行人員而言,可以根據(jù)暫態(tài)穩(wěn)定評估所需的精度要求來選擇合適的訓(xùn)練樣本規(guī)模,快速建立適用于某個運行場景的暫態(tài)穩(wěn)定裕度評估模型。
圖5 不同訓(xùn)練集規(guī)模下的測試Fig.5 Tests under different sizes of training set
3.1.6 模型的魯棒性測試
PMU在數(shù)據(jù)采集與傳輸?shù)倪^程中,可能會出現(xiàn)以下兩類數(shù)據(jù)異常情況:①由于PMU測量誤差導(dǎo)致部分輸入數(shù)據(jù)存在噪聲;②由于PMU故障導(dǎo)致部分輸入特征缺失。本文針對上述兩種情況分別進(jìn)行了研究。
為了測試噪聲對KTBoost模型評估性能的影響,文中在原始數(shù)據(jù)中考慮了4種不同信噪比SNR(signal to noise ratio)的高斯白噪聲。在不同噪聲條件下,各種機器學(xué)習(xí)模型評估的R2如圖6所示。結(jié)果表明,ANN和DT由于結(jié)構(gòu)簡單,模型的評估精度總體偏低。SVM在低噪聲條件下能夠維持評估的R2在0.97左右,但當(dāng)噪聲增加到20 dB時,模型評估的R2驟減至0.96以下,表明SVM對噪聲的魯棒性較差。RF、GBDT和KTBoost都為集成模型,對噪聲具有一定的魯棒性,因此都能夠維持一個較為穩(wěn)定的評估精度。CNN借助其深層結(jié)構(gòu),對數(shù)據(jù)的挖掘能力較強,雖然CNN對噪聲的魯棒性較強,但其評估精度仍要低于文中所提的KTBoost模型??傮w來看,與其他機器學(xué)習(xí)模型相比,KTBoost在不同噪聲條件下能夠保持一個較高的評估精度,具有更高的實用價值。
圖6 不同模型的抗噪能力測試Fig.6 Anti-noise capability tests of different models
為了測試輸入數(shù)據(jù)存在部分特征缺失情況下KTBoost模型的評估性能,本文在測試集中考慮了4種不同比例的特征缺失情況。在不同條件下,模型評估的精度如表4所示。結(jié)果表明,隨著特征缺失比例的增加,對KTBoost模型的負(fù)面影響也越來越大,雖然模型的評估精度出現(xiàn)一定程度地下降,但仍能夠維持相對穩(wěn)定的預(yù)測結(jié)果。
表4 數(shù)據(jù)缺失的影響Tab.4 Impact of missing data
3.1.7 模型的泛化能力測試
由于電力系統(tǒng)是一個時變的系統(tǒng),在考慮模型評估精度的同時,泛化能力也是衡量模型性能的重要指標(biāo)。本文測試了以下5種場景模型的泛化能力:
場景1:負(fù)荷水平仍保持在[75%,125%],系統(tǒng)拓?fù)浣Y(jié)構(gòu)不變,改變發(fā)電機出力;
場景2:負(fù)荷水平為100%,輸電線路16-17和27-28退出運行;
場景3:負(fù)荷水平為70%,輸電線路23-36、母線36和7號發(fā)電機退出運行;
場景4:負(fù)荷水平為100%,在母線8處新增1臺發(fā)電機、1條母線和1條輸電線路;
場景5:負(fù)荷水平為130%,在母線8和母線16處新增2臺發(fā)電機、2條母線和2條輸電線路。
針對每種運行場景仿真生成450個新樣本,通過將新樣本輸入KTBoost模型測試其評估性能,測試結(jié)果如表5所示。結(jié)果表明,在場景1和場景2中,由于系統(tǒng)的負(fù)荷水平和拓?fù)浣Y(jié)構(gòu)變化較小,KT?Boost模型仍能夠維持評估的R2在0.98以上;在場景3至場景5中,隨著變化的加劇,雖然KTBoost模型的評估精度出現(xiàn)明顯的下降,但仍能夠給出可接受的評估結(jié)果,顯示出KTBoost模型針對未知的電力系統(tǒng)運行場景具有一定的泛化能力。
表5 不同場景下的預(yù)測精度Tab.5 Prediction accuracy under different scenarios
為了進(jìn)一步驗證本文所提方法的有效性,將PSS/E軟件自帶的一個1648節(jié)點系統(tǒng)作為測試系統(tǒng)。該系統(tǒng)包含1 648條母線、313臺發(fā)電機、182個分流器和2 294條輸電線路。采用第3.1.1節(jié)所提方法進(jìn)行仿真,共生成了9 240個樣本。KTBoost模型的參數(shù)使用第3.1.1節(jié)所設(shè)置的參數(shù)。
3.2.1 模型的評估性能檢驗
1648節(jié)點系統(tǒng)的每個仿真樣本包含37 439個初始運行特征,為了降低KTBoost模型的計算負(fù)擔(dān),文中利用第1.2節(jié)所提的GSO-MIC-IG特征選擇框架選取初始特征的1%作為關(guān)鍵特征子集?;诤Y選的關(guān)鍵特征子集,不同機器學(xué)習(xí)模型的性能測試結(jié)果如表6和表7所示。結(jié)果表明,在無噪聲條件下,KTBoost模型能夠獲得比其他模型更高的預(yù)測精度。當(dāng)SNR為20 dB時,除了KTBoost模型外,其他模型的預(yù)測精度均出現(xiàn)顯著下降,體現(xiàn)了KT?Boost優(yōu)異的預(yù)測性能。
表6 不同模型預(yù)測的R2Tab.6 R2predicted by different models
表7 不同模型預(yù)測的RMSETab.7 RMSE predicted by different models
3.2.2 模型的泛化能力測試
為了測試KTBoost模型在大系統(tǒng)中的泛化能力,文中保持負(fù)荷水平在[75%,125%],主要考慮如表8所示的5種電力系統(tǒng)拓?fù)浣Y(jié)構(gòu)變換場景,針對每種場景仿真生成450個新樣本,不同場景的測試結(jié)果如表9所示。結(jié)果表明,在1648節(jié)點系統(tǒng)中,電力系統(tǒng)運行拓?fù)浣Y(jié)構(gòu)的改變不會導(dǎo)致KTBoost模型的評估精度出現(xiàn)大幅度下降,體現(xiàn)了文中所提方法在大系統(tǒng)中的有效性。
表8 電力系統(tǒng)的拓?fù)浣Y(jié)構(gòu)Tab.8 Topology of power system
表9 不同場景下的預(yù)測精度Tab.9 Prediction accuracy under different scenarios
本文提出了一種基于關(guān)系探索和KTBoost的電力系統(tǒng)暫態(tài)穩(wěn)定裕度評估方法。在新英格蘭10機39節(jié)點系統(tǒng)和一個1648節(jié)點系統(tǒng)進(jìn)行了仿真研究,實驗結(jié)果表明:
(1)所提GSO-MIC-IG特征選擇框架能夠有效挖掘特征與目標(biāo)變量之間的相關(guān)性以及特征之間的冗余性和協(xié)同性,能夠有效降低樣本數(shù)據(jù)的維度。與MIC、JMI和MRMR等方法相比,本文所提特征選擇方法能夠篩選出更為關(guān)鍵的特征子集。
(2)與DT、SVM、ANN、RF、GBDT和CNN等模型相比,KTBoost模型能夠在較短的時間給出更為精確的評估結(jié)果,具有更高的實用價值。
(3)針對未知的電力系統(tǒng)運行場景以及輸入數(shù)據(jù)存在噪聲和數(shù)據(jù)缺失的問題,本文所提KTBoost模型仍能夠給出相對穩(wěn)定的評估結(jié)果,具有較強的魯棒性和泛化能力。