包永金
(宜賓電業(yè)局,四川 宜賓 644000)
在能量管理系統(tǒng)(energy management system,EMS)中,電力系統(tǒng)狀態(tài)估計(jì)負(fù)責(zé)處理由SCADA采集到的包含噪聲的冗余數(shù)據(jù)以便為諸如:經(jīng)濟(jì)分配、安全分析等應(yīng)用軟件提供精確的實(shí)時(shí)數(shù)據(jù)。電力系統(tǒng)運(yùn)行人員通過分析這些軟件的結(jié)果來采取決策。如果所使用的實(shí)時(shí)數(shù)據(jù)庫中包含錯誤數(shù)據(jù),這些應(yīng)用軟件的結(jié)果可能毫無意義,根據(jù)這些結(jié)果采取的決策也很可能對電力系統(tǒng)的安全運(yùn)行產(chǎn)生危險(xiǎn)。故而不良數(shù)據(jù)辨識是狀態(tài)估計(jì)中一項(xiàng)十分重要的任務(wù)。
現(xiàn)行電力系統(tǒng)中有很多狀態(tài)估計(jì)的方法[1]。在正常運(yùn)行(噪聲數(shù)據(jù)主要來自量測不準(zhǔn)確)的條件下,這些方法通常都會獲得很好的結(jié)果。不過當(dāng)出現(xiàn)較大的量測誤差和拓?fù)浣Y(jié)構(gòu)錯誤的時(shí)候,情況可能就不一樣了。不良數(shù)據(jù)辨識的方法正是基于這些問題而提出的。大多數(shù)的方法都是在進(jìn)行狀態(tài)估計(jì)計(jì)算后,利用量測殘差進(jìn)行假設(shè)檢驗(yàn)的統(tǒng)計(jì)理論方法[2-4]。在很多情況下這些方法都表現(xiàn)得很好,不過仍然存在著一些缺點(diǎn):難于辨識多相關(guān)不良數(shù)據(jù),對于關(guān)鍵量測點(diǎn)的不良數(shù)據(jù)和包含不相關(guān)支路時(shí)的拓?fù)浣Y(jié)構(gòu)錯誤無法辨識。而且這些方法很難同時(shí)處理遙測和遙信不良數(shù)據(jù)。針對以上這些問題,又提出了基于數(shù)據(jù)挖掘的方法。主要有基于神經(jīng)網(wǎng)絡(luò)(ANN)[5-7]、基于模糊理論和聚類分析[8]及基于間歇統(tǒng)計(jì)(GSA)[9]等一些方法。基于神經(jīng)網(wǎng)絡(luò)的方法大多采用典型工況的正確量測數(shù)據(jù)作為訓(xùn)練樣本來構(gòu)造了一個(gè)神經(jīng)元網(wǎng)絡(luò),用估計(jì)前濾波來辨識各種形式的不良數(shù)據(jù)。但由于神經(jīng)網(wǎng)絡(luò)算法的固有特性,不能從根本上避免訓(xùn)練過飽和及陷入局部最小值的問題,且隨著時(shí)間的推移,訓(xùn)練樣本集應(yīng)該動態(tài)更新,但此類文獻(xiàn)也沒有提出對樣本集更新的動態(tài)處理措施。
支持向量機(jī)(support vector machine,SVM)是數(shù)據(jù)挖掘中一種具有優(yōu)良模式識別性能的新方法。利用SVM回歸和分類算法分別建立起了辨識遙測和遙信不良數(shù)據(jù)的模型:回歸模型采用SVM非線性回歸算法對各種運(yùn)行情況下的正常遙測數(shù)據(jù)進(jìn)行曲線擬合(即訓(xùn)練),使模型具有對遙測數(shù)據(jù)的一步預(yù)測能力;針對狀態(tài)估計(jì)中拓?fù)浣Y(jié)構(gòu)錯誤的特點(diǎn)(一條支路上的拓?fù)浣Y(jié)構(gòu)錯誤會在該支路周圍的支路潮流和母線注入功率上產(chǎn)生較大的殘差),應(yīng)用支持向量機(jī)分類算法構(gòu)建起了辨識遙信不良數(shù)據(jù)的分類模型。值得一提的是上述兩種模型都可進(jìn)行在線訓(xùn)練,SVM在線學(xué)習(xí)方法能對每次迭代過程中增加的樣本進(jìn)行學(xué)習(xí),利用前一次迭代的運(yùn)算結(jié)果,減少計(jì)算復(fù)雜度,實(shí)現(xiàn)在較小時(shí)間代價(jià)下的新樣本學(xué)習(xí)。模型構(gòu)建好后首先運(yùn)用回歸模型對實(shí)際遙測數(shù)據(jù)進(jìn)行預(yù)測,通過比較預(yù)測值與實(shí)測值之間的殘差來一次性辨識量測數(shù)據(jù)中的遙測不良數(shù)據(jù)。一旦檢測出不良數(shù)據(jù)就可將其替換成合理的預(yù)測值以避免出現(xiàn)系統(tǒng)的不可觀測性。遙信不良數(shù)據(jù)辨識時(shí),先對消除不良數(shù)據(jù)影響后的量測數(shù)據(jù)進(jìn)行狀態(tài)估計(jì),算出量測殘差,再將量測殘差輸入分類模型,運(yùn)用SVM分類的良好泛化能力辨識出遙信錯誤。通過對IEEE-30節(jié)點(diǎn)模型的仿真結(jié)果表明,所提出的方法對電力系統(tǒng)不良數(shù)據(jù)檢測的效率和準(zhǔn)確性都有較大的提高,說明了方法的有效性。
支持向量機(jī)(SVM)是由 Vapnik[10]最早提出的一種統(tǒng)計(jì)學(xué)習(xí)方法。目前國內(nèi)外所研究的支持向量機(jī)回歸算法主要是多輸入、單輸出,即每次只能對一個(gè)特征量進(jìn)行回歸預(yù)測,對于多輸出支持向量機(jī)的研究并不多[11-12],且算法的效果也不太理想。鑒于此,采用多個(gè)單輸出支持向量機(jī)來實(shí)現(xiàn)多輸出問題。
將支持向量機(jī)用于解決回歸問題即支持向量回歸(support vector regression,SVR)。SVR用來解決回歸預(yù)測的基本思想是:通過一個(gè)非線性映射φ,將輸入空間中的數(shù)據(jù)映射到高位特征空間G中,并在G空間中進(jìn)行線性回歸。假設(shè)有這樣的訓(xùn)練數(shù)據(jù){(x1,y1),…,(xl,yl)?x × R},這里 x 表示輸入樣本空間(如:x=Rd)。SVR通過引入損失函數(shù)來解決回歸問題,采用式(1)來計(jì)算函數(shù)。
對優(yōu)化目標(biāo)取極值
約束條件為
約束條件為
對優(yōu)化目標(biāo)取極值和引入拉格朗日因子ai和,函數(shù)可表示為
高維特征空間中線性問題的內(nèi)積運(yùn)算可以用核函數(shù)來代替,即
常用的核函數(shù)有:徑向基函數(shù)、多項(xiàng)式函數(shù)、Sigmoid函數(shù)、線性函數(shù)等。
目前,SVR的訓(xùn)練方式有兩種:批量訓(xùn)練與在線訓(xùn)練。其問題表述和最優(yōu)化求解的原理相同,不同點(diǎn)在于:在線支持向量機(jī)不斷將新樣本添加到訓(xùn)練集,通過在線調(diào)整模型參數(shù),實(shí)現(xiàn)預(yù)測模型的不斷變化,而不是批量式的一次訓(xùn)練所有樣本。這樣不但能提高其訓(xùn)練時(shí)間,而且能提高模型的適應(yīng)能力,使系統(tǒng)的運(yùn)行情況發(fā)生變化時(shí),模型能相應(yīng)地發(fā)生變化。增量式SVR的基本思想如圖1所示。
這里采用增量學(xué)習(xí)的SVR來訓(xùn)練數(shù)據(jù),具體算法可以查看文獻(xiàn)[13]。
支持向量機(jī)分類(support vector classification,SVC)與SVR算法很相似,具體算法可查看相關(guān)文獻(xiàn)[14],在此不再贅述。采用在狀態(tài)估計(jì)前后分別進(jìn)行不良數(shù)據(jù)辨識的方式,在狀態(tài)估計(jì)后采用SVC主要對遙信不良數(shù)據(jù)進(jìn)行分類辨識。
圖1 增量式SVR的基本思想
一般來說,當(dāng)系統(tǒng)某一元素(輸電線或母線)發(fā)生拓?fù)溴e誤或量測量突變時(shí),不良數(shù)據(jù)只會出現(xiàn)在圍繞該元素的量測點(diǎn)上,故而對每一個(gè)系統(tǒng)元素都采用一個(gè)SVC分類器來具體辨識出不良數(shù)據(jù)的類別。當(dāng)出現(xiàn)不良數(shù)據(jù)時(shí),只會調(diào)用該不良數(shù)據(jù)所對應(yīng)的SVC分類器,以減少計(jì)算量。對任意支路s-r來說,SVC的輸入是該支路潮流和支路兩端母線上注入功率的標(biāo)準(zhǔn)殘差;當(dāng)SVC用于辨識母線結(jié)構(gòu)錯誤時(shí),其輸入為母線電壓和母線上各支路潮流的標(biāo)準(zhǔn)殘差。
狀態(tài)估計(jì)后的不良數(shù)據(jù)分為支路拓?fù)溴e誤、母線拓?fù)溴e誤以及遙測錯誤。遙測錯誤是由于狀態(tài)估計(jì)前辨識遙測不良數(shù)據(jù)時(shí)的漏判或誤判造成,此外系統(tǒng)中某一元素發(fā)生的拓?fù)溴e誤也可能會在與其相鄰的元素上產(chǎn)生較大的殘差,此類異常數(shù)據(jù)點(diǎn)稱作非不良數(shù)據(jù)點(diǎn)。在訓(xùn)練階段,支路拓?fù)溴e誤所對應(yīng)的SVC輸出選為-1,遙測錯誤的輸出選為1,而非不良數(shù)據(jù)點(diǎn)的輸出選為0。至于母線拓?fù)溴e誤的輸出則要根據(jù)具體母線可能發(fā)生的拓?fù)溴e誤而定,有幾種拓?fù)溴e誤就選幾個(gè)輸出值。
應(yīng)用支持向量機(jī)來辨識電力系統(tǒng)不良數(shù)據(jù)的模型如圖2所示。下面分別對模型各部分加以說明。
第1步:計(jì)算遙測數(shù)據(jù)的估計(jì)值和平方誤差
由經(jīng)過良好訓(xùn)練的SVR模型可得到原始遙測數(shù)據(jù)的估計(jì)值。初始SVR模型可通過離線訓(xùn)練獲得,訓(xùn)練集可由各種運(yùn)行條件下的歷史正常遙測數(shù)據(jù)或?qū)W(wǎng)絡(luò)進(jìn)行離線仿真獲取。進(jìn)行在線預(yù)測時(shí),每采到一次遙測數(shù)據(jù)就可由回歸模型獲得該組遙測數(shù)據(jù)的估計(jì)值,然后再將該組遙測數(shù)據(jù)添加到訓(xùn)練數(shù)據(jù)中進(jìn)行SVR增量學(xué)習(xí)。由于SVR增量學(xué)習(xí)不需要從頭進(jìn)行訓(xùn)練,所以訓(xùn)練的時(shí)間很短,滿足在線辨識的需要。獲得估計(jì)值之后,就可由量測值和估計(jì)值計(jì)算平方誤差。
圖2 不良數(shù)據(jù)辨識模型
第2步:辨識和修正遙測不良數(shù)據(jù)
為避免閾值選取主觀性對辨識結(jié)果帶來的影響,這里采用GSA算法來辨識遙測數(shù)據(jù)中的不良數(shù)據(jù)。GSA方法是一種強(qiáng)化聚類效果的數(shù)據(jù)挖掘算法,它可以估計(jì)數(shù)據(jù)集最佳的聚類個(gè)數(shù)。在電力系統(tǒng)不良數(shù)據(jù)辨識中,可以將良好數(shù)據(jù)和不良數(shù)據(jù)所在的聚類準(zhǔn)確地區(qū)分進(jìn)而檢測和辨識不良數(shù)據(jù)[9,13]。據(jù)此將上一步獲得的平方誤差進(jìn)行聚類,如果聚類個(gè)數(shù)大于1,則表明有不良數(shù)據(jù),接著辨識出不良數(shù)據(jù)并采用估計(jì)值進(jìn)行修正。
第3步:進(jìn)行狀態(tài)估計(jì)
在消除遙測不良數(shù)據(jù)的影響后就可利用狀態(tài)估計(jì)器對系統(tǒng)進(jìn)行狀態(tài)估計(jì),這里采用加權(quán)最小二乘法狀態(tài)估計(jì)。進(jìn)行狀態(tài)估計(jì)的目的是為了獲取系統(tǒng)最可能的運(yùn)行狀態(tài)和為辨識遙信不良數(shù)據(jù)做準(zhǔn)備。
第4步:計(jì)算標(biāo)準(zhǔn)殘差并判別是否存在不良數(shù)據(jù)
由上一步計(jì)算得到的狀態(tài)估計(jì)值和SCADA量測值就可以計(jì)算出標(biāo)準(zhǔn)殘差,判別是否存在不良數(shù)據(jù)仍然采用GSA算法,判別的原則同辨識遙測不良數(shù)據(jù)時(shí)一樣。如果不存在不良數(shù)據(jù)則狀態(tài)估計(jì)結(jié)束,輸出估計(jì)結(jié)果。依然存在不良數(shù)據(jù)時(shí),此時(shí)的不良數(shù)據(jù)有兩種情況:一是由于遙信數(shù)據(jù)錯誤產(chǎn)生,此類不良數(shù)據(jù)即遙信不良數(shù)據(jù);此外在辨識遙測不良數(shù)據(jù)時(shí)漏判和相鄰支路的遙信錯誤也會導(dǎo)致本支路殘差過大而出現(xiàn)不良數(shù)據(jù),此類的不良數(shù)據(jù)稱為量測量突變。這里采用SVM分類算法來辨識上述不良數(shù)據(jù)的類別。
第5步:由SVM分類模型辨識不良數(shù)據(jù)的類別
由于發(fā)生拓?fù)溴e誤時(shí)的殘差特性與發(fā)生遙測不良數(shù)據(jù)時(shí)的殘差特性有很明顯的區(qū)別,所以在獲取訓(xùn)練數(shù)據(jù)集時(shí)不需要模擬系統(tǒng)所有運(yùn)行狀態(tài)。進(jìn)行在線辨識時(shí),對上一步獲得的每一個(gè)不良數(shù)據(jù)調(diào)用它所對應(yīng)的分類器,由分類器就可獲得該不良數(shù)據(jù)的類型。對于遙測不良數(shù)據(jù)可采用其估計(jì)值進(jìn)行修正或者直接丟棄;對于拓?fù)浣Y(jié)構(gòu)錯誤則更新系統(tǒng)拓?fù)浣Y(jié)構(gòu)。接著轉(zhuǎn)入下一次狀態(tài)估計(jì),重復(fù)第3步到第5步直到不再出現(xiàn)不良數(shù)據(jù)為止。
通過IEEE-30節(jié)點(diǎn)系統(tǒng)為例來驗(yàn)證方法的可行性。在缺乏真實(shí)量測數(shù)據(jù)的情況下,假設(shè)系統(tǒng)的運(yùn)行情況如下:將原系統(tǒng)中給定的負(fù)荷作為最大負(fù)荷需求,最小負(fù)荷假定為最大負(fù)荷的20%,用一個(gè)負(fù)荷取值區(qū)域模型來模擬母線上的負(fù)荷波動。這樣的一個(gè)例子如圖3所示,圖3中一條母線上的最大和最小負(fù)荷通過一個(gè)6個(gè)時(shí)間段的取值區(qū)域來表示。母線上所有可能的負(fù)荷波動都包含在陰影區(qū)域以內(nèi)。對母線2上所接的發(fā)電機(jī)采用同樣的處理方法,母線1作為平衡節(jié)點(diǎn),變壓器的變比選取在0.95~1.05之間。
根據(jù)上述運(yùn)行情況,通過仿真計(jì)算獲取了288組運(yùn)行數(shù)據(jù),其中三分之二用于訓(xùn)練SVM模型,其余用于測試。模型將添加噪聲后的數(shù)據(jù)作為輸入數(shù)據(jù),將潮流計(jì)算值作為目標(biāo)值來進(jìn)行訓(xùn)練。對于大型系統(tǒng)不良數(shù)據(jù)辨識實(shí)時(shí)性的要求,在訓(xùn)練和測試階段可將量測值分為幾組分別計(jì)算,即每組數(shù)據(jù)都可以有它相應(yīng)的模型。這樣就可將每次采集到的量測數(shù)據(jù)送入其對應(yīng)的分組模型進(jìn)行不良數(shù)據(jù)的辨識。這里采用文獻(xiàn)[7]所述將數(shù)據(jù)按電壓等級分為了兩組。
情況1:遙測不良數(shù)據(jù)
假設(shè)第35組測試數(shù)據(jù)中出現(xiàn)了6個(gè)不良數(shù)據(jù),分別是 P6-9、P6-10、Q19-20、Q8-28、Q2和 V15。不良數(shù)據(jù)與正常量測值的偏差在±(20-100)標(biāo)準(zhǔn)差之間。此種情況下,GSA算法正確地區(qū)分出了上述不良數(shù)據(jù)。不良數(shù)據(jù)的情況如表1所示。
表1 遙測不良數(shù)據(jù)辨識結(jié)果
情況2:支路遙信變位錯誤
假設(shè)在第72組數(shù)據(jù)的時(shí)刻收到支路4-12錯誤的遙信變位信息。支路4-12開關(guān)實(shí)際為閉合狀態(tài),但收到的遙信信息為開關(guān)斷開。根據(jù)前面所提方法,在進(jìn)行狀態(tài)估計(jì)后,只有當(dāng)出現(xiàn)不良數(shù)據(jù)時(shí)才會調(diào)用不良數(shù)據(jù)所對應(yīng)的SVM分類模型對不良數(shù)據(jù)進(jìn)行辨識,且每個(gè)系統(tǒng)元素都對應(yīng)著一個(gè)SVM分類模型。由GSA算法得出的一組可疑數(shù)據(jù)如表2所示。從分類結(jié)果可以得出SVM分類模型成功辨識出了支路4-12的遙信變位錯誤。
表2 支路遙信錯誤辨識
值得注意的是當(dāng)辨識出遙信錯誤后就可直接更新系統(tǒng)的拓?fù)浣Y(jié)構(gòu),無需再進(jìn)行其他的辨識。
情況3:母線分裂型錯誤
假定在90組數(shù)據(jù)的時(shí)刻母線15發(fā)生分裂,但并沒有收到相應(yīng)的遙信信息。分裂前后的情況如圖3所示。
圖3 母線15分裂前后模型
表3列出了可疑數(shù)據(jù)集,在訓(xùn)練階段將此類型拓?fù)溴e誤對應(yīng)的SVC輸出選為2。由分類結(jié)果可知SVM模型成功辨識出了母線15的分裂錯誤。
表3 母線分裂型錯誤辨識
以上提出了一種在電力系統(tǒng)實(shí)時(shí)狀態(tài)估計(jì)中辨識不良數(shù)據(jù)的新方法。與傳統(tǒng)狀態(tài)估計(jì)中的假設(shè)檢驗(yàn)方法相比,該方法可以很好地避免殘差污染和殘差淹沒,且能克服基于神經(jīng)網(wǎng)絡(luò)的方法中神經(jīng)網(wǎng)絡(luò)訓(xùn)練過飽和和容易陷入局部最小值的問題。仿真分析證明了本方法的有效性,將此方法與現(xiàn)行電力系統(tǒng)狀態(tài)估計(jì)結(jié)合可有效實(shí)現(xiàn)不良數(shù)據(jù)的辨識與修正。
[1]ALi Abur,Antonin Gómez Expósito.Power System State Estimation:Theory and Implementation[M].New York:Marcel Dekker,2004.
[2]L.Mili,Th Van Cutsem and M.Ribbens Pavella.Hypothesis Testing Identification:A New Method for Bad Data Analysis in Power System State Estimation[J].IEEE Trans.on Power Apparatus and Systems,1984,103(11):3239-3252.
[3]L.Mili,Th.Van Cutsem.Implementation of HTI Method in Power System State Estimation[J].IEEE Trans.on Power Systems,1988,3(3):887-889.
[4]Salehfar H,Zhao R.A Neural Network Preestimation Filter for Bad Data Detection ad Identification in Power System State Estimation [J].Electric Power System Research.1995,34(9):127-134.
[5]J.C.S.Souza,A.M.Leite da Silva,A.P.Alves da Silva.Online Topology Determination and Bad Data Suppression in Power System Operation Using Artificial Neural Networks[J].IEEE Transactions on Power Systems,1998,13(3):796-803.
[6]S.P.Teeuwsen.Neural Network Based Multi-dimensional Feature Forecasting for Bad Data Detection and Feature Restoration in Power System[C].IEEE Power Engineering Society General Meeting,2006:18-22.
[7]D.Singh,J.P.Pandey,D.S.Chauhan.Topology Identification,Bad Data Processing,and State Estimation Using Fuzzy Pattern Matching[J].IEEE Transactions on Power Delivery,2005,20(3).
[8]Huang SJ,Lin JM.Enhancement of Power System Data Debugging Using GSA-based Data Mining Technique.[J].IEEE Transactions on Power Systems,2002,17(4):1022-1029.
[9]Vapnik V.The Nature of Statistical Learning Theory[M].New York:Springer,1995:138-145.
[10]F.Pérez-Cruz,G.Camps,E.Soria,J.Pérez,A.R.Figueiras Vidal,and A.Artés-Rodríguez.Multi-dimensional Function Approximation and Regression Estimation[C].in Proc.ICANN,Madrid,Spain,2002.
[11]M.P.Sánchez-Fernández,M.de Prado-Cumplido,J.Arenas-García,and F.Pérez-Cruz.SVM Multiregression for Nonlinear Channel Estimation in Multiple-input Multiple-output Systems[J].IEEE Trans.Signal Process,2004,52(8):2298-2307.
[12]Parrella F.Online Support Vector Regression[D].Master's Thesis,University of Genoa,2007.
[13]Chih-Wei Hsu,Chih-Chung Chang,and Chih-Jen Lin.A Practical Guide to Support Vector Classification.Technical Report,Department of Computer Science and Information Engineering,National Taiwan University,Taipei,2003.http://www.csie.ntu.edu.tw/~ cjlin/libsvm/
[14]吳軍基,楊偉,葛成,等.基于GSA的肘形判別用于電力系統(tǒng)不良數(shù)據(jù)辨識[J].中國電機(jī)工程學(xué)報(bào),2006,26(22):23-28.