基于支持向量機(jī)的電力系統(tǒng)不良數(shù)據(jù)在線檢測辨識與修正

2013-09-05 06:11:12包永金

四川電力技術(shù) 2013年1期

包永金

(宜賓電業(yè)局，四川宜賓 644000)

0 引言

在能量管理系統(tǒng)(energy management system，EMS)中，電力系統(tǒng)狀態(tài)估計(jì)負(fù)責(zé)處理由SCADA采集到的包含噪聲的冗余數(shù)據(jù)以便為諸如:經(jīng)濟(jì)分配、安全分析等應(yīng)用軟件提供精確的實(shí)時(shí)數(shù)據(jù)。電力系統(tǒng)運(yùn)行人員通過分析這些軟件的結(jié)果來采取決策。如果所使用的實(shí)時(shí)數(shù)據(jù)庫中包含錯誤數(shù)據(jù)，這些應(yīng)用軟件的結(jié)果可能毫無意義，根據(jù)這些結(jié)果采取的決策也很可能對電力系統(tǒng)的安全運(yùn)行產(chǎn)生危險(xiǎn)。故而不良數(shù)據(jù)辨識是狀態(tài)估計(jì)中一項(xiàng)十分重要的任務(wù)。

現(xiàn)行電力系統(tǒng)中有很多狀態(tài)估計(jì)的方法［1］。在正常運(yùn)行(噪聲數(shù)據(jù)主要來自量測不準(zhǔn)確)的條件下，這些方法通常都會獲得很好的結(jié)果。不過當(dāng)出現(xiàn)較大的量測誤差和拓?fù)浣Y(jié)構(gòu)錯誤的時(shí)候，情況可能就不一樣了。不良數(shù)據(jù)辨識的方法正是基于這些問題而提出的。大多數(shù)的方法都是在進(jìn)行狀態(tài)估計(jì)計(jì)算后，利用量測殘差進(jìn)行假設(shè)檢驗(yàn)的統(tǒng)計(jì)理論方法［2-4］。在很多情況下這些方法都表現(xiàn)得很好，不過仍然存在著一些缺點(diǎn):難于辨識多相關(guān)不良數(shù)據(jù)，對于關(guān)鍵量測點(diǎn)的不良數(shù)據(jù)和包含不相關(guān)支路時(shí)的拓?fù)浣Y(jié)構(gòu)錯誤無法辨識。而且這些方法很難同時(shí)處理遙測和遙信不良數(shù)據(jù)。針對以上這些問題，又提出了基于數(shù)據(jù)挖掘的方法。主要有基于神經(jīng)網(wǎng)絡(luò)(ANN)［5-7］、基于模糊理論和聚類分析［8］及基于間歇統(tǒng)計(jì)(GSA)［9］等一些方法。基于神經(jīng)網(wǎng)絡(luò)的方法大多采用典型工況的正確量測數(shù)據(jù)作為訓(xùn)練樣本來構(gòu)造了一個(gè)神經(jīng)元網(wǎng)絡(luò)，用估計(jì)前濾波來辨識各種形式的不良數(shù)據(jù)。但由于神經(jīng)網(wǎng)絡(luò)算法的固有特性，不能從根本上避免訓(xùn)練過飽和及陷入局部最小值的問題，且隨著時(shí)間的推移，訓(xùn)練樣本集應(yīng)該動態(tài)更新，但此類文獻(xiàn)也沒有提出對樣本集更新的動態(tài)處理措施。

支持向量機(jī)(support vector machine，SVM)是數(shù)據(jù)挖掘中一種具有優(yōu)良模式識別性能的新方法。利用SVM回歸和分類算法分別建立起了辨識遙測和遙信不良數(shù)據(jù)的模型:回歸模型采用SVM非線性回歸算法對各種運(yùn)行情況下的正常遙測數(shù)據(jù)進(jìn)行曲線擬合(即訓(xùn)練)，使模型具有對遙測數(shù)據(jù)的一步預(yù)測能力;針對狀態(tài)估計(jì)中拓?fù)浣Y(jié)構(gòu)錯誤的特點(diǎn)(一條支路上的拓?fù)浣Y(jié)構(gòu)錯誤會在該支路周圍的支路潮流和母線注入功率上產(chǎn)生較大的殘差)，應(yīng)用支持向量機(jī)分類算法構(gòu)建起了辨識遙信不良數(shù)據(jù)的分類模型。值得一提的是上述兩種模型都可進(jìn)行在線訓(xùn)練，SVM在線學(xué)習(xí)方法能對每次迭代過程中增加的樣本進(jìn)行學(xué)習(xí)，利用前一次迭代的運(yùn)算結(jié)果，減少計(jì)算復(fù)雜度，實(shí)現(xiàn)在較小時(shí)間代價(jià)下的新樣本學(xué)習(xí)。模型構(gòu)建好后首先運(yùn)用回歸模型對實(shí)際遙測數(shù)據(jù)進(jìn)行預(yù)測，通過比較預(yù)測值與實(shí)測值之間的殘差來一次性辨識量測數(shù)據(jù)中的遙測不良數(shù)據(jù)。一旦檢測出不良數(shù)據(jù)就可將其替換成合理的預(yù)測值以避免出現(xiàn)系統(tǒng)的不可觀測性。遙信不良數(shù)據(jù)辨識時(shí)，先對消除不良數(shù)據(jù)影響后的量測數(shù)據(jù)進(jìn)行狀態(tài)估計(jì)，算出量測殘差，再將量測殘差輸入分類模型，運(yùn)用SVM分類的良好泛化能力辨識出遙信錯誤。通過對IEEE-30節(jié)點(diǎn)模型的仿真結(jié)果表明，所提出的方法對電力系統(tǒng)不良數(shù)據(jù)檢測的效率和準(zhǔn)確性都有較大的提高，說明了方法的有效性。

1 支持向量機(jī)算法介紹

1.1 支持向量機(jī)回歸算法

支持向量機(jī)(SVM)是由 Vapnik［10］最早提出的一種統(tǒng)計(jì)學(xué)習(xí)方法。目前國內(nèi)外所研究的支持向量機(jī)回歸算法主要是多輸入、單輸出，即每次只能對一個(gè)特征量進(jìn)行回歸預(yù)測，對于多輸出支持向量機(jī)的研究并不多［11-12］，且算法的效果也不太理想。鑒于此，采用多個(gè)單輸出支持向量機(jī)來實(shí)現(xiàn)多輸出問題。

將支持向量機(jī)用于解決回歸問題即支持向量回歸(support vector regression，SVR)。SVR用來解決回歸預(yù)測的基本思想是:通過一個(gè)非線性映射φ，將輸入空間中的數(shù)據(jù)映射到高位特征空間G中，并在G空間中進(jìn)行線性回歸。假設(shè)有這樣的訓(xùn)練數(shù)據(jù){(x1，y1)，…，(xl，yl)?x × R}，這里 x 表示輸入樣本空間(如:x=Rd)。SVR通過引入損失函數(shù)來解決回歸問題，采用式(1)來計(jì)算函數(shù)。

對優(yōu)化目標(biāo)取極值

約束條件為

對優(yōu)化目標(biāo)取極值和引入拉格朗日因子ai和，函數(shù)可表示為

高維特征空間中線性問題的內(nèi)積運(yùn)算可以用核函數(shù)來代替，即

常用的核函數(shù)有:徑向基函數(shù)、多項(xiàng)式函數(shù)、Sigmoid函數(shù)、線性函數(shù)等。

目前，SVR的訓(xùn)練方式有兩種:批量訓(xùn)練與在線訓(xùn)練。其問題表述和最優(yōu)化求解的原理相同，不同點(diǎn)在于:在線支持向量機(jī)不斷將新樣本添加到訓(xùn)練集，通過在線調(diào)整模型參數(shù)，實(shí)現(xiàn)預(yù)測模型的不斷變化，而不是批量式的一次訓(xùn)練所有樣本。這樣不但能提高其訓(xùn)練時(shí)間，而且能提高模型的適應(yīng)能力，使系統(tǒng)的運(yùn)行情況發(fā)生變化時(shí)，模型能相應(yīng)地發(fā)生變化。增量式SVR的基本思想如圖1所示。

這里采用增量學(xué)習(xí)的SVR來訓(xùn)練數(shù)據(jù)，具體算法可以查看文獻(xiàn)［13］。

1.2 支持向量機(jī)分類算法

支持向量機(jī)分類(support vector classification，SVC)與SVR算法很相似，具體算法可查看相關(guān)文獻(xiàn)［14］，在此不再贅述。采用在狀態(tài)估計(jì)前后分別進(jìn)行不良數(shù)據(jù)辨識的方式，在狀態(tài)估計(jì)后采用SVC主要對遙信不良數(shù)據(jù)進(jìn)行分類辨識。

圖1 增量式SVR的基本思想

一般來說，當(dāng)系統(tǒng)某一元素(輸電線或母線)發(fā)生拓?fù)溴e誤或量測量突變時(shí)，不良數(shù)據(jù)只會出現(xiàn)在圍繞該元素的量測點(diǎn)上，故而對每一個(gè)系統(tǒng)元素都采用一個(gè)SVC分類器來具體辨識出不良數(shù)據(jù)的類別。當(dāng)出現(xiàn)不良數(shù)據(jù)時(shí)，只會調(diào)用該不良數(shù)據(jù)所對應(yīng)的SVC分類器，以減少計(jì)算量。對任意支路s-r來說，SVC的輸入是該支路潮流和支路兩端母線上注入功率的標(biāo)準(zhǔn)殘差;當(dāng)SVC用于辨識母線結(jié)構(gòu)錯誤時(shí)，其輸入為母線電壓和母線上各支路潮流的標(biāo)準(zhǔn)殘差。

狀態(tài)估計(jì)后的不良數(shù)據(jù)分為支路拓?fù)溴e誤、母線拓?fù)溴e誤以及遙測錯誤。遙測錯誤是由于狀態(tài)估計(jì)前辨識遙測不良數(shù)據(jù)時(shí)的漏判或誤判造成，此外系統(tǒng)中某一元素發(fā)生的拓?fù)溴e誤也可能會在與其相鄰的元素上產(chǎn)生較大的殘差，此類異常數(shù)據(jù)點(diǎn)稱作非不良數(shù)據(jù)點(diǎn)。在訓(xùn)練階段，支路拓?fù)溴e誤所對應(yīng)的SVC輸出選為-1，遙測錯誤的輸出選為1，而非不良數(shù)據(jù)點(diǎn)的輸出選為0。至于母線拓?fù)溴e誤的輸出則要根據(jù)具體母線可能發(fā)生的拓?fù)溴e誤而定，有幾種拓?fù)溴e誤就選幾個(gè)輸出值。

2 基于SVM的不良數(shù)據(jù)檢測與辨識

2.1 檢測與辨識的模型

應(yīng)用支持向量機(jī)來辨識電力系統(tǒng)不良數(shù)據(jù)的模型如圖2所示。下面分別對模型各部分加以說明。

第1步:計(jì)算遙測數(shù)據(jù)的估計(jì)值和平方誤差

由經(jīng)過良好訓(xùn)練的SVR模型可得到原始遙測數(shù)據(jù)的估計(jì)值。初始SVR模型可通過離線訓(xùn)練獲得，訓(xùn)練集可由各種運(yùn)行條件下的歷史正常遙測數(shù)據(jù)或?qū)W(wǎng)絡(luò)進(jìn)行離線仿真獲取。進(jìn)行在線預(yù)測時(shí)，每采到一次遙測數(shù)據(jù)就可由回歸模型獲得該組遙測數(shù)據(jù)的估計(jì)值，然后再將該組遙測數(shù)據(jù)添加到訓(xùn)練數(shù)據(jù)中進(jìn)行SVR增量學(xué)習(xí)。由于SVR增量學(xué)習(xí)不需要從頭進(jìn)行訓(xùn)練，所以訓(xùn)練的時(shí)間很短，滿足在線辨識的需要。獲得估計(jì)值之后，就可由量測值和估計(jì)值計(jì)算平方誤差。

圖2 不良數(shù)據(jù)辨識模型

第2步:辨識和修正遙測不良數(shù)據(jù)

為避免閾值選取主觀性對辨識結(jié)果帶來的影響，這里采用GSA算法來辨識遙測數(shù)據(jù)中的不良數(shù)據(jù)。GSA方法是一種強(qiáng)化聚類效果的數(shù)據(jù)挖掘算法，它可以估計(jì)數(shù)據(jù)集最佳的聚類個(gè)數(shù)。在電力系統(tǒng)不良數(shù)據(jù)辨識中，可以將良好數(shù)據(jù)和不良數(shù)據(jù)所在的聚類準(zhǔn)確地區(qū)分進(jìn)而檢測和辨識不良數(shù)據(jù)［9，13］。據(jù)此將上一步獲得的平方誤差進(jìn)行聚類，如果聚類個(gè)數(shù)大于1，則表明有不良數(shù)據(jù)，接著辨識出不良數(shù)據(jù)并采用估計(jì)值進(jìn)行修正。

第3步:進(jìn)行狀態(tài)估計(jì)

在消除遙測不良數(shù)據(jù)的影響后就可利用狀態(tài)估計(jì)器對系統(tǒng)進(jìn)行狀態(tài)估計(jì)，這里采用加權(quán)最小二乘法狀態(tài)估計(jì)。進(jìn)行狀態(tài)估計(jì)的目的是為了獲取系統(tǒng)最可能的運(yùn)行狀態(tài)和為辨識遙信不良數(shù)據(jù)做準(zhǔn)備。

第4步:計(jì)算標(biāo)準(zhǔn)殘差并判別是否存在不良數(shù)據(jù)

由上一步計(jì)算得到的狀態(tài)估計(jì)值和SCADA量測值就可以計(jì)算出標(biāo)準(zhǔn)殘差，判別是否存在不良數(shù)據(jù)仍然采用GSA算法，判別的原則同辨識遙測不良數(shù)據(jù)時(shí)一樣。如果不存在不良數(shù)據(jù)則狀態(tài)估計(jì)結(jié)束，輸出估計(jì)結(jié)果。依然存在不良數(shù)據(jù)時(shí)，此時(shí)的不良數(shù)據(jù)有兩種情況:一是由于遙信數(shù)據(jù)錯誤產(chǎn)生，此類不良數(shù)據(jù)即遙信不良數(shù)據(jù);此外在辨識遙測不良數(shù)據(jù)時(shí)漏判和相鄰支路的遙信錯誤也會導(dǎo)致本支路殘差過大而出現(xiàn)不良數(shù)據(jù)，此類的不良數(shù)據(jù)稱為量測量突變。這里采用SVM分類算法來辨識上述不良數(shù)據(jù)的類別。

第5步:由SVM分類模型辨識不良數(shù)據(jù)的類別

由于發(fā)生拓?fù)溴e誤時(shí)的殘差特性與發(fā)生遙測不良數(shù)據(jù)時(shí)的殘差特性有很明顯的區(qū)別，所以在獲取訓(xùn)練數(shù)據(jù)集時(shí)不需要模擬系統(tǒng)所有運(yùn)行狀態(tài)。進(jìn)行在線辨識時(shí)，對上一步獲得的每一個(gè)不良數(shù)據(jù)調(diào)用它所對應(yīng)的分類器，由分類器就可獲得該不良數(shù)據(jù)的類型。對于遙測不良數(shù)據(jù)可采用其估計(jì)值進(jìn)行修正或者直接丟棄;對于拓?fù)浣Y(jié)構(gòu)錯誤則更新系統(tǒng)拓?fù)浣Y(jié)構(gòu)。接著轉(zhuǎn)入下一次狀態(tài)估計(jì)，重復(fù)第3步到第5步直到不再出現(xiàn)不良數(shù)據(jù)為止。

2.2 算例分析

通過IEEE-30節(jié)點(diǎn)系統(tǒng)為例來驗(yàn)證方法的可行性。在缺乏真實(shí)量測數(shù)據(jù)的情況下，假設(shè)系統(tǒng)的運(yùn)行情況如下:將原系統(tǒng)中給定的負(fù)荷作為最大負(fù)荷需求，最小負(fù)荷假定為最大負(fù)荷的20%，用一個(gè)負(fù)荷取值區(qū)域模型來模擬母線上的負(fù)荷波動。這樣的一個(gè)例子如圖3所示，圖3中一條母線上的最大和最小負(fù)荷通過一個(gè)6個(gè)時(shí)間段的取值區(qū)域來表示。母線上所有可能的負(fù)荷波動都包含在陰影區(qū)域以內(nèi)。對母線2上所接的發(fā)電機(jī)采用同樣的處理方法，母線1作為平衡節(jié)點(diǎn)，變壓器的變比選取在0.95～1.05之間。

根據(jù)上述運(yùn)行情況，通過仿真計(jì)算獲取了288組運(yùn)行數(shù)據(jù)，其中三分之二用于訓(xùn)練SVM模型，其余用于測試。模型將添加噪聲后的數(shù)據(jù)作為輸入數(shù)據(jù)，將潮流計(jì)算值作為目標(biāo)值來進(jìn)行訓(xùn)練。對于大型系統(tǒng)不良數(shù)據(jù)辨識實(shí)時(shí)性的要求，在訓(xùn)練和測試階段可將量測值分為幾組分別計(jì)算，即每組數(shù)據(jù)都可以有它相應(yīng)的模型。這樣就可將每次采集到的量測數(shù)據(jù)送入其對應(yīng)的分組模型進(jìn)行不良數(shù)據(jù)的辨識。這里采用文獻(xiàn)［7］所述將數(shù)據(jù)按電壓等級分為了兩組。

情況1:遙測不良數(shù)據(jù)

假設(shè)第35組測試數(shù)據(jù)中出現(xiàn)了6個(gè)不良數(shù)據(jù)，分別是 P6-9、P6-10、Q19-20、Q8-28、Q2和 V15。不良數(shù)據(jù)與正常量測值的偏差在±(20-100)標(biāo)準(zhǔn)差之間。此種情況下，GSA算法正確地區(qū)分出了上述不良數(shù)據(jù)。不良數(shù)據(jù)的情況如表1所示。

表1 遙測不良數(shù)據(jù)辨識結(jié)果

情況2:支路遙信變位錯誤

假設(shè)在第72組數(shù)據(jù)的時(shí)刻收到支路4-12錯誤的遙信變位信息。支路4-12開關(guān)實(shí)際為閉合狀態(tài)，但收到的遙信信息為開關(guān)斷開。根據(jù)前面所提方法，在進(jìn)行狀態(tài)估計(jì)后，只有當(dāng)出現(xiàn)不良數(shù)據(jù)時(shí)才會調(diào)用不良數(shù)據(jù)所對應(yīng)的SVM分類模型對不良數(shù)據(jù)進(jìn)行辨識，且每個(gè)系統(tǒng)元素都對應(yīng)著一個(gè)SVM分類模型。由GSA算法得出的一組可疑數(shù)據(jù)如表2所示。從分類結(jié)果可以得出SVM分類模型成功辨識出了支路4-12的遙信變位錯誤。

表2 支路遙信錯誤辨識

值得注意的是當(dāng)辨識出遙信錯誤后就可直接更新系統(tǒng)的拓?fù)浣Y(jié)構(gòu)，無需再進(jìn)行其他的辨識。

情況3:母線分裂型錯誤

假定在90組數(shù)據(jù)的時(shí)刻母線15發(fā)生分裂，但并沒有收到相應(yīng)的遙信信息。分裂前后的情況如圖3所示。

圖3 母線15分裂前后模型

表3列出了可疑數(shù)據(jù)集，在訓(xùn)練階段將此類型拓?fù)溴e誤對應(yīng)的SVC輸出選為2。由分類結(jié)果可知SVM模型成功辨識出了母線15的分裂錯誤。

表3 母線分裂型錯誤辨識

3 結(jié)論

以上提出了一種在電力系統(tǒng)實(shí)時(shí)狀態(tài)估計(jì)中辨識不良數(shù)據(jù)的新方法。與傳統(tǒng)狀態(tài)估計(jì)中的假設(shè)檢驗(yàn)方法相比，該方法可以很好地避免殘差污染和殘差淹沒，且能克服基于神經(jīng)網(wǎng)絡(luò)的方法中神經(jīng)網(wǎng)絡(luò)訓(xùn)練過飽和和容易陷入局部最小值的問題。仿真分析證明了本方法的有效性，將此方法與現(xiàn)行電力系統(tǒng)狀態(tài)估計(jì)結(jié)合可有效實(shí)現(xiàn)不良數(shù)據(jù)的辨識與修正。

［1］ALi Abur，Antonin Gómez Expósito.Power System State Estimation:Theory and Implementation［M］.New York:Marcel Dekker，2004.

［2］L.Mili，Th Van Cutsem and M.Ribbens Pavella.Hypothesis Testing Identification:A New Method for Bad Data Analysis in Power System State Estimation［J］.IEEE Trans.on Power Apparatus and Systems，1984，103(11):3239-3252.

［3］L.Mili，Th.Van Cutsem.Implementation of HTI Method in Power System State Estimation［J］.IEEE Trans.on Power Systems，1988，3(3):887-889.

［4］Salehfar H，Zhao R.A Neural Network Preestimation Filter for Bad Data Detection ad Identification in Power System State Estimation ［J］.Electric Power System Research.1995，34(9):127-134.

［5］J.C.S.Souza，A.M.Leite da Silva，A.P.Alves da Silva.Online Topology Determination and Bad Data Suppression in Power System Operation Using Artificial Neural Networks［J］.IEEE Transactions on Power Systems，1998，13(3):796-803.

［6］S.P.Teeuwsen.Neural Network Based Multi-dimensional Feature Forecasting for Bad Data Detection and Feature Restoration in Power System［C］.IEEE Power Engineering Society General Meeting，2006:18-22.

［7］D.Singh，J.P.Pandey，D.S.Chauhan.Topology Identification，Bad Data Processing，and State Estimation Using Fuzzy Pattern Matching［J］.IEEE Transactions on Power Delivery，2005，20(3).

［8］Huang SJ，Lin JM.Enhancement of Power System Data Debugging Using GSA-based Data Mining Technique.［J］.IEEE Transactions on Power Systems，2002，17(4):1022-1029.

［9］Vapnik V.The Nature of Statistical Learning Theory［M］.New York:Springer，1995:138-145.

［10］F.Pérez-Cruz，G.Camps，E.Soria，J.Pérez，A.R.Figueiras Vidal，and A.Artés-Rodríguez.Multi-dimensional Function Approximation and Regression Estimation［C］.in Proc.ICANN，Madrid，Spain，2002.

［11］M.P.Sánchez-Fernández，M.de Prado-Cumplido，J.Arenas-García，and F.Pérez-Cruz.SVM Multiregression for Nonlinear Channel Estimation in Multiple-input Multiple-output Systems［J］.IEEE Trans.Signal Process，2004，52(8):2298-2307.

［12］Parrella F.Online Support Vector Regression［D］.Master's Thesis，University of Genoa，2007.

［13］Chih-Wei Hsu，Chih-Chung Chang，and Chih-Jen Lin.A Practical Guide to Support Vector Classification.Technical Report，Department of Computer Science and Information Engineering，National Taiwan University，Taipei，2003.http://www.csie.ntu.edu.tw/～ cjlin/libsvm/

［14］吳軍基，楊偉，葛成，等.基于GSA的肘形判別用于電力系統(tǒng)不良數(shù)據(jù)辨識［J］.中國電機(jī)工程學(xué)報(bào)，2006，26(22):23-28.

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡