改進(jìn)Sammon映射算法在分析暫態(tài)穩(wěn)定評(píng)估輸入特征有效性中的應(yīng)用

2017-01-09 10:00:24張春田芳于之虹李巖松張爽田蓓

電力建設(shè) 2016年12期

張春, 田芳, 于之虹, 李巖松, 張爽, 田蓓

(1.華北電力大學(xué)電氣與電子工程學(xué)院, 北京市 102206；2.中國(guó)電力科學(xué)研究院，北京市 100192；3.國(guó)網(wǎng)寧夏電力公司電力科學(xué)研究院，銀川市 750002)

張春1, 田芳2, 于之虹2, 李巖松1, 張爽3, 田蓓3

基于機(jī)器學(xué)習(xí)技術(shù)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法中，輸入特征提取的是否合理往往決定了最終的分類效果。然而，目前卻缺乏一種工具去評(píng)價(jià)選擇的輸入特征是否具有可分性。鑒于此，引入Sammon映射算法將高維樣本數(shù)據(jù)映射到低維空間中，通過觀察映射點(diǎn)的分布情況判斷提取的特征是否有效，并針對(duì)原算法的不足之處進(jìn)行改進(jìn)。首先利用主成分分析法(principal component analysis, PCA)求出包含原始數(shù)據(jù)信息最多的前兩維主成分向量，代替原算法隨機(jī)取值的方法，作為映射點(diǎn)坐標(biāo)向量的初始值。然后，采用迭代修正法求解最終的映射點(diǎn)坐標(biāo)向量，加快了求解速度。最后，以改進(jìn)Sammon映射算法作為工具，分析IEEE 39節(jié)點(diǎn)系統(tǒng)的仿真數(shù)據(jù)和某地區(qū)實(shí)際在線歷史數(shù)據(jù)提取特征的有效性，證明該算法在指導(dǎo)特征選擇中具有良好的應(yīng)用前景。

暫態(tài)穩(wěn)定; 機(jī)器學(xué)習(xí); Sammon映射; 特征有效性

0 引言

隨著我國(guó)特高壓交直流電網(wǎng)的快速發(fā)展，給基于電力系統(tǒng)仿真方法的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估帶來深刻變化和新的挑戰(zhàn)[1]。近年來大數(shù)據(jù)處理、云計(jì)算等新一代IT技術(shù)在電力行業(yè)的廣泛應(yīng)用，日臻成熟的機(jī)器學(xué)習(xí)技術(shù)為電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估帶來了新的發(fā)展方向[2-3]。在應(yīng)用機(jī)器學(xué)習(xí)技術(shù)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估(transient stability assessment, TSA)方法中，為了減少冗余特征干擾，加快分類模型訓(xùn)練與預(yù)測(cè)的速度，特征提取是必不可少的步驟[4-5]。因此，最終的分類結(jié)果不僅與選擇的分類方法有關(guān)，還與所選取的特征子集有關(guān)，因?yàn)檩斎胩卣鞯谋磉_(dá)能力決定了輸入空間的可分性。如果選取的輸入特征是無(wú)效的，那么無(wú)論采用何種分類器都無(wú)法將穩(wěn)定樣本和失穩(wěn)樣本分開。由于缺乏一個(gè)有效的方法來評(píng)估提取特征的有效性，當(dāng)采用某種方法進(jìn)行分類時(shí),如果分類結(jié)果不理想就無(wú)法判斷問題究竟源于分類方法還是選擇的輸入特征不當(dāng)。

為了解決這個(gè)無(wú)法判斷問題來源的問題，本文引入可以分析數(shù)據(jù)結(jié)構(gòu)特性的Sammon映射算法作為工具分析提取特征的有效性[6]。Sammon映射通過非線性變換可將一個(gè)高維的輸入空間近似地轉(zhuǎn)化為一個(gè)低維(二維)空間，且近似保持其數(shù)據(jù)內(nèi)部的結(jié)構(gòu)關(guān)系不變。因此，能夠在低維空間上直接觀察高維輸入空間的可分性。目前，已有學(xué)者將其作為工具對(duì)電力系統(tǒng)中基于機(jī)器學(xué)習(xí)的分類問題進(jìn)行研究。文獻(xiàn)[7-8]利用Sammon映射分析基于神經(jīng)網(wǎng)絡(luò)的暫態(tài)穩(wěn)定評(píng)估輸入空間可分性。文獻(xiàn)[9]根據(jù)Sammon映射分析暫穩(wěn)評(píng)估穩(wěn)定樣本和失穩(wěn)樣本的邊界問題。文獻(xiàn)[10]利用Sammon映射將高維數(shù)據(jù)映射到低維以快速了解光伏電站功率數(shù)據(jù)的分布。然而，Sammon映射算法對(duì)初始值敏感，選取初值好壞往往會(huì)影響最終的映射結(jié)果。并且，傳統(tǒng)Sammon映射算法采用隨機(jī)數(shù)作為初值，以致映射結(jié)果不穩(wěn)定，需要重復(fù)進(jìn)行多次計(jì)算以選取穩(wěn)定效果[11]。此外采用最速下降法求解低維空間映射點(diǎn)的坐標(biāo)向量時(shí)迭代多、耗時(shí)長(zhǎng)，在實(shí)際工程應(yīng)用中受到很大限制[12]。

針對(duì)上述問題，本文提出一種改進(jìn)Sammon算法。首先利用主成分分析法(principal component analysis, PCA)為Sammon映射提供有效的初始值。在此基礎(chǔ)上，采用迭代修正方法求解映射點(diǎn)在低維空間中的坐標(biāo)向量。最后，將改進(jìn)算法應(yīng)用于IEEE 39節(jié)點(diǎn)系統(tǒng)和實(shí)際某地區(qū)系統(tǒng)特征選取問題分析中。

1 主成分分析法的基本原理

PCA是多元統(tǒng)計(jì)學(xué)中常用的數(shù)據(jù)分析方法，其基本思想是利用原有變量線性組合出幾個(gè)彼此不相關(guān)且盡可能保留原有變量信息的新變量，從而可以讓較少不相關(guān)的新變量代替原有較多的相關(guān)聯(lián)變量進(jìn)行數(shù)據(jù)分析，所組合的新變量即為主成分[13]。根據(jù)統(tǒng)計(jì)學(xué)原理，一個(gè)變量的數(shù)據(jù)信息可以用其方差來表征，方差越大，所包含的信息量越大。

主成分分析是對(duì)多個(gè)樣本的輸入變量形成的數(shù)據(jù)矩陣求取相關(guān)矩陣，根據(jù)相關(guān)矩陣的特征值，獲得累計(jì)方差貢獻(xiàn)率，再根據(jù)相關(guān)矩陣的特征向量，確定主成分。具體步驟如下所示。

設(shè)由N個(gè)運(yùn)行樣本、p個(gè)特征構(gòu)成的電力系統(tǒng)暫態(tài)穩(wěn)定樣本數(shù)據(jù)矩陣為

(1)

(2)

(2)建立標(biāo)準(zhǔn)矩陣X*的相關(guān)矩陣

(3)

并求出其特征值λ1≥λ2≥...≥λp及相應(yīng)的特征向量u1,u2,...,up，X*為X標(biāo)準(zhǔn)化后的標(biāo)準(zhǔn)矩陣。

(3)確定主成分構(gòu)成的矩陣。前m個(gè)主成分對(duì)應(yīng)的特征向量為Up×m=[u1,u2,..,um]，則N個(gè)樣本p個(gè)主成分構(gòu)成的矩陣為

(4)

2 改進(jìn)Sammon映射算法在分析特征有效性中的應(yīng)用

2.1 算法思路分析

當(dāng)采用某一算法提取子特征集后，Sammon映射算法將高維空間的樣本點(diǎn)通過非線性變換映射到低維的二維空間中，然后觀察穩(wěn)定樣本與失穩(wěn)樣本映射點(diǎn)類間邊界區(qū)的重疊情況，進(jìn)而分析所選特征的分類能力。穩(wěn)定樣本與失穩(wěn)樣本映射點(diǎn)重疊情況少說明該輸入空間可分性好，選取特征能代表原始特征集的分類能力。重疊情況多則說明特征子集分類能力差，選取的特征是無(wú)效的，難以通過機(jī)器學(xué)習(xí)的方法對(duì)是否失穩(wěn)進(jìn)行分類。如果分類效果不理想，則需通過改進(jìn)特征提取算法重新選擇新的輸入特征，最終選出有效的特征子集。Sammon映射算法指導(dǎo)分類特征選擇的流程如圖1所示。

圖1 算法流程圖

在傳統(tǒng)Sammon映射算法的映射過程中，2個(gè)重要因素影響著最終映射結(jié)果的穩(wěn)定性和求解速度：低維空間映射點(diǎn)坐標(biāo)向量初始值的選取和目標(biāo)誤差函數(shù)的最小化迭代過程[14]。后續(xù)的改進(jìn)算法是針對(duì)傳統(tǒng)Sammon算法的不足之處加以改進(jìn)。

2.2 基于主成分分析的初值選取

Sammon映射算法對(duì)初始值的設(shè)定很敏感，初始值的設(shè)定會(huì)影響最終映射點(diǎn)的分布結(jié)果，所以當(dāng)穩(wěn)定樣本與失穩(wěn)樣本映射點(diǎn)重疊較多時(shí)也有可能是由于初始值設(shè)置不當(dāng)造成的，并非選取的特征無(wú)效。而傳統(tǒng)Sammon映射算法是利用隨機(jī)取值的隨機(jī)數(shù)作為初始值的，所以有可能選取不當(dāng)?shù)某跏贾?，?dǎo)致對(duì)特征有效性分析的誤判。因此，通常做法是進(jìn)行多次計(jì)算，然后對(duì)比結(jié)果選出穩(wěn)定的映射結(jié)果。這種求解方式的計(jì)算量大，重復(fù)很多不必要的計(jì)算。鑒于此，利用PCA法代替隨機(jī)取值可以提供一個(gè)比較好的初始值[15]。用PCA求出原始樣本中貢獻(xiàn)率最大的兩維主成分作為迭代的初始值，保留了原有矩陣的大部分信息，可以使映射結(jié)果更加穩(wěn)定，減少不必要的計(jì)算。設(shè)低維空間映射點(diǎn)坐標(biāo)向量的初始值為FN×2，則由式(4)得：

FN×2=X*[u1,u2]

(5)

式中u1、u2為相關(guān)矩陣R最大的2個(gè)特征值對(duì)應(yīng)的特征向量。為了對(duì)比所述2種初值設(shè)定方法的映射效果，采用來自加州大學(xué)歐文分校的機(jī)器學(xué)習(xí)數(shù)據(jù)集中的葡萄酒數(shù)據(jù)對(duì)其分別進(jìn)行測(cè)試[16]。

圖2是采用隨機(jī)選取初始值方法中的某一次的映射結(jié)果，圖中各類樣本重疊較多表明數(shù)據(jù)集特征是無(wú)效的，但實(shí)際特征集是有效的，表明這是由于初值不當(dāng)而造成的誤判。圖3是采用PCA方法選取的初值，每次映射結(jié)果分布都一樣，并能正確表示出特征集的分類能力，說明改進(jìn)算法具有更好的穩(wěn)定性。

圖2 采用隨機(jī)取值法的映射結(jié)果

圖3 采用PCA確定初值的映射結(jié)果

2.3 迭代修正過程

Sammon映射將樣本點(diǎn)從高維空間“投影”到低維空間的非線性變換過程中，使低維空間中映射點(diǎn)相互之間的距離與高維空間中樣本之間的距離盡量相同，從而保持各樣本整體結(jié)構(gòu)不變。因此，需要定義一個(gè)誤差E代表從距離角度來講，低維空間和高維空間樣本點(diǎn)分布的相似程度[3]。

設(shè)在維度為p的高維空間中，有N個(gè)向量，p維空間中的數(shù)據(jù)樣本向量Xi(i=1,...,N) 與樣本向量Xj(j=1,...,N)之間的距離(歐式距離)表示為

(6)

(7)

(8)

映射誤差E代表了從距離角度來講高維空間和低維空間的相似程度。映射誤差越小，低維映射空間中數(shù)據(jù)結(jié)構(gòu)關(guān)系與原始高維空間中的數(shù)據(jù)結(jié)構(gòu)關(guān)系的相似程度越高，所以需要尋求N個(gè)能最小化目標(biāo)函數(shù)E的低維空間坐標(biāo)向量。當(dāng)誤差函數(shù)足夠小時(shí)，低維映射點(diǎn)能夠很好地保留原高維空間中的拓?fù)浣Y(jié)構(gòu)。

(9)

式中：Iteration為修正次數(shù)；maxIteration為總修正次數(shù)。迭代修正結(jié)束后通過式(7)、(8)計(jì)算映射誤差E，當(dāng)誤差E小于某一設(shè)定閾值(本文設(shè)定的是10-6)時(shí)，停止迭代，輸出映射點(diǎn)坐標(biāo)。若不滿足映射誤差要求，則增加修正次數(shù)，繼續(xù)迭代修正[17]。

改進(jìn)Sammon算法利用迭代修正的方法調(diào)整低維空間映射點(diǎn)的坐標(biāo)向量至目標(biāo)誤差函數(shù)值到一定范圍內(nèi)，比原最速下降法的求解速度更快。圖4為利用不同數(shù)據(jù)規(guī)模的加州大學(xué)歐文分校的葡萄酒數(shù)據(jù)進(jìn)行測(cè)試，可以看出當(dāng)數(shù)據(jù)規(guī)模越來越大時(shí)，改進(jìn)算法減少的時(shí)間更多。

圖4 映射樣本個(gè)數(shù)與求解低維坐標(biāo)時(shí)間

3 算例分析

3.1 測(cè)試系統(tǒng)與原始特征

3.1.1 IEEE 39節(jié)點(diǎn)系統(tǒng)

第1個(gè)算例采用經(jīng)典的IEEE 39節(jié)點(diǎn)系統(tǒng)作為測(cè)試系統(tǒng)，系統(tǒng)結(jié)構(gòu)如圖5所示，包含10臺(tái)發(fā)電機(jī)、39個(gè)節(jié)點(diǎn)、46條支路、19個(gè)負(fù)荷點(diǎn)。發(fā)電機(jī)模型采用4階模型，負(fù)荷模型為恒阻抗模型[18]。

圖5 IEEE 39節(jié)點(diǎn)系統(tǒng)

在電力系統(tǒng)運(yùn)行過程中，隨機(jī)電網(wǎng)潮流狀態(tài)應(yīng)滿足潮流方程，而該方程為f(A,p,D,u,x)=0。其中A表示網(wǎng)絡(luò)的結(jié)構(gòu)變量；p表示輸電線參數(shù)、變壓器參數(shù)等的網(wǎng)絡(luò)元件參數(shù)；D是不可控變量，例如一般意義上的系統(tǒng)負(fù)荷；u是控制變量，例如發(fā)電機(jī)的有功功率和機(jī)端電壓、電容電抗器投切等；x是依從變量[19]。

上述4種變量確定后，系統(tǒng)的運(yùn)行狀態(tài)隨之確定，這些被確定的量為依從變量。所以通過上述潮流方程發(fā)現(xiàn)，通過波動(dòng)A，p，D，u均可以得到隨即電網(wǎng)潮流方式，而本文中采用在不同負(fù)荷水平下波動(dòng)控制變量中的發(fā)電機(jī)出力變量，來獲取隨機(jī)電網(wǎng)潮流狀態(tài)：

(1)選擇一個(gè)運(yùn)行方式作為潮流基準(zhǔn)，各負(fù)荷水平是以基準(zhǔn)負(fù)荷85%～105%及以5%為步長(zhǎng)得到5組負(fù)荷數(shù)據(jù)；

(2)發(fā)電機(jī)在線的有功出力，其波動(dòng)范圍是85%～115%，隨機(jī)生成該范圍內(nèi)均勻隨機(jī)數(shù)，每種負(fù)荷水平下隨機(jī)生成400種潮流方案，共有2 000種隨機(jī)潮流方式；

(3)每種潮流方案下，在母線3和4之間的線路中間設(shè)三相短路，1 s后切除線路和故障，用PSD-BPA軟件進(jìn)行時(shí)域仿真計(jì)算，在仿真結(jié)束時(shí)，以任意2臺(tái)發(fā)電機(jī)的最大相對(duì)功角差是否大于360°來判定系統(tǒng)是否失穩(wěn)[20-21]。

為客觀評(píng)價(jià)各穩(wěn)態(tài)狀態(tài)變量對(duì)電網(wǎng)安全評(píng)估的貢獻(xiàn)程度，選擇的候選輸入特征幾乎涵蓋了所有的電網(wǎng)穩(wěn)態(tài)狀態(tài)量。該測(cè)試系統(tǒng)共選取263維特征，如表1所示[22-23]。在2 000個(gè)仿真樣本中，穩(wěn)定樣本有1 790個(gè)，失穩(wěn)樣本210個(gè)。

表1 IEEE 39節(jié)點(diǎn)系統(tǒng)原始特征集

Table 1 Original feature set of IEEE 39 bus system

3.1.2 某地區(qū)在線歷史數(shù)據(jù)

第2個(gè)算例的測(cè)試數(shù)據(jù)采用某地區(qū)1個(gè)月的在線歷史數(shù)據(jù)，故障考慮500 kV交流線路后備保護(hù)動(dòng)作，根據(jù)計(jì)算出的極限切除時(shí)間是否超過0.3 s將系統(tǒng)分為穩(wěn)定狀態(tài)與失穩(wěn)狀態(tài)[24]。共選取有效在線數(shù)據(jù)1 979個(gè)，其中穩(wěn)定樣本1 910個(gè)，失穩(wěn)樣本69個(gè)。

至于在線數(shù)據(jù)，由于特征數(shù)過多，并且大多數(shù)特征與穩(wěn)定程度相關(guān)性極小，所以首先利用相關(guān)性分析法，分析選取的輸入特征與極限切除時(shí)間的相關(guān)性，進(jìn)行初步篩選。其中，相關(guān)性分析是指分析2組變量數(shù)據(jù)之間的相關(guān)程度，常用的方法為相關(guān)系數(shù)計(jì)算，又稱Person相關(guān)系數(shù)，計(jì)算公式如下：

(10)

相關(guān)系數(shù)取值在-1到+1之間，大于0時(shí)代表2個(gè)序列正相關(guān)，即A值隨B值的增加而增加，數(shù)值越接近于+1，則相關(guān)程度越強(qiáng)；反之小于0時(shí)代表2個(gè)序列負(fù)相關(guān)，越接近于-1，則相關(guān)程度越強(qiáng)；等于0時(shí)代表2個(gè)序列不相關(guān)。顯而易見，應(yīng)選取相關(guān)系數(shù)絕對(duì)值較大的電氣量作為電網(wǎng)穩(wěn)定特征。本文以0.3為閾值，選取絕對(duì)值大于或等于0.3的電氣特征。利用相關(guān)性分析，進(jìn)行初步篩選后，剩余1 173個(gè)穩(wěn)定特征如表2所示。

表2 某地區(qū)系統(tǒng)原始特征集

Table 2 Original feature set of an area system

3.2 改進(jìn)Sammon映射算法在指導(dǎo)特征選擇中的應(yīng)用

根據(jù)文獻(xiàn)[25]中所提的，利用隨機(jī)森林算法進(jìn)行重要性排序計(jì)算，然后選取重要特征。隨機(jī)森林是組合多棵決策樹進(jìn)行投票分類的集成學(xué)習(xí)算法，在訓(xùn)練分類模型的同時(shí)，也會(huì)計(jì)算各個(gè)特征的重要性得分。文獻(xiàn)[25]根據(jù)隨機(jī)森林計(jì)算出的重要性得分大小將特征排序，保留得分較大的特征，刪除得分較小的特征。然而隨機(jī)森林只能計(jì)算出特征得分大小，區(qū)分是否為重要特征的重要性得分閾值的大小通常是由人工決定。因此，需要根據(jù)本文提出的改進(jìn)Sammon映射算法檢驗(yàn)閾值選擇的是否合理。圖6是IEEE 39節(jié)點(diǎn)系統(tǒng)原始特征集映射到二維空間的樣本點(diǎn)分布圖，圖7是選擇重要性得分排名靠前的45個(gè)的特征作為輸入特征得到的映射結(jié)果，圖8選擇的是前30個(gè)特征。同理，圖9是某地區(qū)實(shí)際系統(tǒng)原始特征集映射后的分布情況，而圖10是選擇重要性得分排名靠前的113個(gè)特征作為輸入特征映射后的結(jié)果，而圖11只是選擇前80個(gè)特征作為輸入特征。

圖6 IEEE 39系統(tǒng)原始特征集的映射結(jié)果

圖7 IEEE 39系統(tǒng)提取前45個(gè)特征后的映射結(jié)果

圖8 IEEE 39系統(tǒng)提取前30個(gè)特征后的映射結(jié)果

圖9 某地區(qū)系統(tǒng)原始特征集的映射結(jié)果

圖10 某地區(qū)系統(tǒng)提取前113個(gè)特征后的映射結(jié)果

圖11 某地區(qū)系統(tǒng)提取前80個(gè)特征后的映射結(jié)果

對(duì)比圖6—8可知，提取重要性得分排名靠前45個(gè)特征子集作為輸入特征后，映射結(jié)果和原始特征的映射結(jié)果基本保持不變，說明該子特征集仍保持原有的數(shù)據(jù)結(jié)構(gòu)特性，選取的閾值是合理的。從只提取得分靠前的30個(gè)特征的映射分布圖中可以看出，穩(wěn)定樣本和失穩(wěn)樣本映射點(diǎn)重疊較多，說明該子特征集不具有可分性，選取特征子集是無(wú)效的，需重新設(shè)定選取特征數(shù)的閾值大小。同理，對(duì)比圖8—10可知，針對(duì)該地區(qū)的在線歷史數(shù)據(jù)集，重要性得分閾值設(shè)定在選取前113個(gè)是合理的，而設(shè)定為80時(shí)，特征子集是無(wú)效的，會(huì)導(dǎo)致后續(xù)的分類效果不理想。

4 結(jié) 論

本文提出了一種基于主成分分析的改進(jìn)Sammon映射算法，用于分析暫態(tài)穩(wěn)定特征提取是否有效的問題，該算法具有以下特點(diǎn)。

(1)改進(jìn)算法比原算法更具穩(wěn)定性與高效性。一方面利用主成分分析法為迭代提供初始值，使映射結(jié)果穩(wěn)定。另一方面，采用迭代修正的方法求解低維空間映射點(diǎn)坐標(biāo)，加快了求解速度。

(2)該算法為分析輸入空間的可分性提供了有力工具，對(duì)暫穩(wěn)特征的選取具有很好的指導(dǎo)作用。同樣，在其他基于機(jī)器學(xué)習(xí)的電力系統(tǒng)問題中也具有良好的應(yīng)用前景。

[1]李亞樓, 張星, 李勇杰,等. 交直流混聯(lián)大電網(wǎng)仿真技術(shù)現(xiàn)狀及面臨挑戰(zhàn)[J]. 電力建設(shè), 2015, 36(12):1-8.

LI Yalou, ZHANG Xing, LI Yongjie, et al. Present situation and challenges of AC/DC hybrid large-scale power grid simulation technology [J]. Electric Power Construction, 2015, 36(12):1-8.

[2]趙春暉, 姜大為, 崔燦,等. 大數(shù)據(jù)時(shí)代下的新型電網(wǎng)規(guī)劃體系[J]. 電力建設(shè), 2014, 35(10):17-20.

ZHAO Chunhui, JIANG Dawei, CUI Can, et al. New power grid planning system in big-data era[J]. Electric Power Construction,2014,35(10):17-20.

[3]張沛, 吳瀟雨, 和敬涵. 大數(shù)據(jù)技術(shù)在主動(dòng)配電網(wǎng)中的應(yīng)用綜述[J]. 電力建設(shè), 2015, 36(1):52-59.

ZHANG Pei, WU Xiaoyu, HE Jinghan. Review on big data technology applied in active distribution network[J]. Electric Power Construction, 2015, 36(1):52-59.

[4]童曉陽(yáng)，葉圣永．?dāng)?shù)據(jù)挖掘在電力系統(tǒng)暫態(tài)估中的應(yīng)用綜述[J]．電網(wǎng)技術(shù)，2009，33(20)：88-93．

TONG Xiaoyang，YE Shengyong．A survey on application of data mining in transient stability assessment of power system[J]．Power System Technology，2009，33(20)：88-93．

[5]王同文，管霖，張堯．人工智能技術(shù)在電網(wǎng)穩(wěn)定評(píng)估中的應(yīng)用綜述[J]．電網(wǎng)技術(shù)，2009，33(12)：60-65．

WANG Tongwen，GUAN Lin，ZHANG Yao．A survey on application of artificial intelligence technology in power system stability assessment[J]．Power System Technology，2009，33(12)：60-65．

[6]SAMMON J W. A nonlinear mapping for data structure analysis[J]. IEEE Transactions on Computers, 1969, C-18(5): 401-409.

[7]顧雪平,張志剛,張文勤. 基于神經(jīng)網(wǎng)絡(luò)的暫態(tài)穩(wěn)定評(píng)估輸入空間可分性[J]. 華北電力大學(xué)學(xué)報(bào),2000,27(2):16-20.

GU Xueping, ZHANG Zhigang , ZHANG Wenqin. Input space separability analysis of artificial neural networks based transient stability assessment[J].Journal of North China Electric Power University,2000,27(2):16-20.

[8]顧雪平,曹紹杰,張文勤. 基于神經(jīng)網(wǎng)絡(luò)暫態(tài)穩(wěn)定評(píng)估方法的一種新思路[J]. 中國(guó)電機(jī)工程學(xué)報(bào),2000,20(4):78-82.

GU Xueping, TSO Shiukit, ZHANG Wenqin. A new framework for transient stability assessment based on neural networks[J]. Proceedings of the CSEE, 2000, 20(4):77-82.

[9]YU Zhihong, ZHOU Xiaoxin, WU Zhongxi. Transient stability boundary visualization for power system[C]// International Conference on Power System Technology. IEEE, 2006.

[10]RADVANSKY M, KUDELKA M, SNASEL V. Identifying power profiles in the photovoltaic power station data by self-organizing maps and dimension reduction by Sammon’s projection[C]//Soft Computing and Pattern Recognition (SoCPaR).IEEE, 2013.

[11]陳敏. 智舌非線性模式識(shí)別方法研究[D].杭州：浙江工商大學(xué),2012.

CHEN Min. The research of nonlinear pattern recognition methods for smartongue[D].Hangzhou: Zhejiang Gongshang University, 2012.

[12]周凌嵐,葉浩歡,柳征,等. 基于改進(jìn)Sammon映射的輻射源個(gè)體特征有效性分析[J].電子信息對(duì)抗技術(shù),2010, 1(25):21-24.

ZHOU Linglan, YE Haohuan, LIU Zheng, et al. Validity analysis of emitter individual features based on an improved Sammon mapping [J].Electronic Warfare Technology, 2010, 1(25):21-24.

[13]崔巍，都秀文，楊海峰．基于主成分分析法的電力需求影響因素分析[J]．電力建設(shè)，2013，34( 8) : 34-39．

CUI Wei, DU Xiuwen, YANG Haifeng. Analysis on influencial factor of power demand based on principal component analysis[J]. Electric Power Construction,2013,34(8) : 34-39．

[14]LERNER B, GUTERMAN H, ALADJ E M, et al. Feature extraction by neural network nonlinear mapping for pattern classification[C]//13th International Conference on Pattern Recognition ( ICPR96). IEEE, 1996:320-324.

[15]KOVCS A, ABONYI J. Visualization of fuzzy clustering results by modified Sammon mapping[C]// IEEE International Conference on Fuzzy Systems. IEEE, 2004, 1(1):365-370.

[16]BACHE K, LICHMAN M. UCI Machine Learning Repository[EB/OL].[2016-06-05]. http//archive.ics.uci.edu/ml/datsets/wine.

[17]Kohonen T. Self-organizing Maps[ M]. 3rd Edition, Kerlin: Springer-Verlag, 2001.

[18]李揚(yáng)，顧雪平．基于改進(jìn)最大相關(guān)最小冗余判據(jù)的暫態(tài)穩(wěn)定評(píng)估特征選擇[J]．中國(guó)電機(jī)工程學(xué)報(bào)，2013，33(34)：179-186．

LI Yang，GU Xueping．Feature selection for transient stability assessment based on improved maximal relevance and minimal redundancy criterion [J]．Proceedings of the CSEE，2013，33(34)：179-186．

[19]張伯明，陳壽孫，嚴(yán)正. 高等電力網(wǎng)絡(luò)分析[M]. 北京：清華大學(xué)出版社，2007.

[20]葉圣永，王曉茹，劉志剛，等．基于支持向量機(jī)的暫態(tài)穩(wěn)定評(píng)估雙階段特征選擇[J]．中國(guó)電機(jī)工程學(xué)報(bào)，2010，30(31)：28-34．

YE Shengyong，WANG Xiaoru，LIU Zhigang，et al． Dual-stage feature selection for transient stability assessment based on support vector machine [J]．Proceedings of the CSEE，2010，30(31)：28-34．

[21]GOMEZ F R，RAJAPAKSE A D，ANNAKKAGE U D，et al. Support vector machine-based algorithm for post-fault transient stability status prediction using synchronized measurements[J]. IEEE Transactions on Power System，2011,26(3):1474-1483.

[22]章小強(qiáng). 智能穩(wěn)定評(píng)估中的關(guān)鍵特征識(shí)別研究[D].廣州：華南理工大學(xué),2010.

ZHANG Xiaoqiang. Studies on kernel feature recognition for intelligent stability assessment [D]．Guangzhou: South China University of Technology，2010.

[23]于之虹，黃彥浩，魯廣明，等．基于時(shí)間序列關(guān)聯(lián)分析的穩(wěn)定運(yùn)行規(guī)則提取方法[J]．中國(guó)電機(jī)工程學(xué)報(bào)，2015，35(3)：519-526．

YU Zhihong，HUANG Yanhao，LU Guangming，et al．A time series associative classification method for the operation rule extracting of transient stability[J]．Proceedings of the CSEE，2015，35(3)：519-526．

[24]國(guó)家電網(wǎng)公司．國(guó)家電網(wǎng)安全穩(wěn)定計(jì)算技術(shù)規(guī)范: Q/GDW 404—2010[S]. 北京：國(guó)家電網(wǎng)公司，2010．

[25]黃彥浩，于之虹，史東宇，等. 基于海量在線歷史數(shù)據(jù)的大電網(wǎng)快速判穩(wěn)策略[J]. 中國(guó)電機(jī)工程學(xué)報(bào)，2016，36(3)：596-603.

HUANG Yanhao，YU Zhihong，SHI Dongyu，et al. Strategy of huge electric power system stability quick judgment based on massive historical online data [J]．Proceedings of the CSEE，2016，36(3)：596-603.

(編輯劉文瑩)

Application of Improved Sammon Mapping Algorithm in Input Features Validity Analysis of Transient Stability Assessment

ZHANG Chun1, TIAN Fang2, YU Zhihong2, LI Yansong1, ZHANG Shuang3, TIAN Bei3

(1. School of Electrical and Electronic Engineering, North China Electric Power University, Beijing 102206, China; 2. China Electric Power Research Institute, Beijing 100192, China; 3. Electric Power Research Institute, State Grid Ningxia Electric Power Company, Yinchuan 750002, China)

In the method of power system transient stability assessment based on machine learning technology, the reasonableness of the input feature extraction decides the final classification result. However, there were no tools to judge whether the selected input features are the separable. Therefore, this paper introduces the Sammon mapping algorithm to map high dimensional sample data to low dimensional space, determines the effectiveness of selected feature through observing the distribution of mapping points, and improves the original algorithm according to its deficiencies. Firstly, we adopted principal component analysis (PCA) method to obtain the first two dimensional principal component vectors containing the most original data information, which worked as the initial value of the mapping point coordinate vector instead of the random selection method in the original algorithm. Then, we used the iterative method to solve the coordinate vector of mapping points to accelerate the solving speed. Finally, we used the improved Sammon mapping algorithm as a tool to analyze the effectiveness of selected features of the numerical simulation data in IEEE39-bus system and the actual online historical data of a certain area. The analysis results show that the improved algorithm has a good application prospect in guiding feature selection.

transient stability; machine learning; Sammon mapping; feature effectiveness

國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃項(xiàng)目(973項(xiàng)目)(2013CB228203);國(guó)家電網(wǎng)公司科技(XT71-15-001)

TM 71

1000-7229(2016)12-0096-08

10.3969/j.issn.1000-7229.2016.12.013

2016-07-07

張春(1991)，男，碩士研究生，主要研究方向?yàn)殡娏ο到y(tǒng)穩(wěn)定與控制；

田芳(1973)，女，博士，教授級(jí)高工，主要研究方向?yàn)殡娏ο到y(tǒng)分析與控制，電力系統(tǒng)數(shù)字仿真等；

于之虹(1975)，女，工學(xué)博士，高級(jí)工程師，主要從事電力系統(tǒng)安全穩(wěn)定評(píng)估與控制、仿真分析技術(shù)等方面的工作；

李巖松(1975)，男，博士，教授，研究方向?yàn)殡娏ο到y(tǒng)分析與控制、光學(xué)傳感技術(shù)等;

張爽(1982)，男，高級(jí)工程師，主要從事電力系統(tǒng)計(jì)算、試驗(yàn)、科研方面的工作；

田蓓(1977)，女，高級(jí)工程師，從事電力系統(tǒng)計(jì)算與分析方面的工作。

Project supported by National Basic Research Program of China (973 Program) (2013CB228203)

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

改進(jìn)Sammon映射算法在分析暫態(tài)穩(wěn)定評(píng)估輸入特征有效性中的應(yīng)用

0 引 言

1 主成分分析法的基本原理

2 改進(jìn)Sammon映射算法在分析特征有效性中的應(yīng)用

3 算例分析

4 結(jié) 論

0 引言