彭葛樺
(1.國網(wǎng)江西省電力有限公司培訓(xùn)中心,江西 南昌 330006;2.江西電力職業(yè)技術(shù)學(xué)院供用電工程學(xué)院,江西 南昌 330032)
隨著智能電網(wǎng)規(guī)模的擴(kuò)大和輸出負(fù)荷量的提升[1],在運(yùn)行過程中,電網(wǎng)難免會發(fā)生故障,如輸電電線故障、變壓器故障、母線故障等。這些故障發(fā)生后,電力系統(tǒng)中的負(fù)荷分布、線損情況等均會發(fā)生變化[2-3]。這會對用電信息的判斷造成較大影響,使電力系統(tǒng)無法精準(zhǔn)掌握用電需求,導(dǎo)致用電規(guī)劃的合理性降低。因此,電力系統(tǒng)進(jìn)行終端用電規(guī)劃的關(guān)鍵在于有效地采集和管理電網(wǎng)故障下的用電信息[4]。數(shù)據(jù)融合是1種常用的信息處理方法。數(shù)據(jù)融合是將采集的多源信息進(jìn)行聯(lián)合處理[5],以獲取更為全面、完整的信息。由于電力系統(tǒng)結(jié)構(gòu)復(fù)雜,運(yùn)行數(shù)據(jù)具有動態(tài)變化特性,并且電力系統(tǒng)在故障情況下所產(chǎn)生的信息具有一定的隨機(jī)性和變化性[6],導(dǎo)致用電信息的融合效果較差。為實(shí)現(xiàn)信息的智能融合,文獻(xiàn)[7]利用深度反向傳播(back propagation,BP)神經(jīng)網(wǎng)絡(luò)的非線性學(xué)習(xí)能力,實(shí)現(xiàn)信息智能融合。但是在應(yīng)用過程中,如果存在較多動態(tài)數(shù)據(jù),則其融合誤差較大。為實(shí)現(xiàn)多源數(shù)據(jù)的融合、避免發(fā)生數(shù)據(jù)之間的沖突,文獻(xiàn)[8]基于差異信息量,提出相關(guān)多源數(shù)據(jù)融合方法,以實(shí)現(xiàn)多源數(shù)據(jù)的精準(zhǔn)融合。但是該方法在應(yīng)用過程中難以對數(shù)據(jù)中的異常數(shù)據(jù)進(jìn)行處理。
為此,本文基于數(shù)據(jù)驅(qū)動、采用用電信息采集智能融合技術(shù)對電網(wǎng)多源故障展開研究。數(shù)據(jù)驅(qū)動是通過計算或者互聯(lián)網(wǎng)等相關(guān)軟件技術(shù),對海量數(shù)據(jù)進(jìn)行處理,以完成數(shù)據(jù)的整合和提煉。數(shù)據(jù)驅(qū)動在整合過程中以啟發(fā)式規(guī)則為依據(jù),能夠建立數(shù)據(jù)之間的關(guān)聯(lián)。其具有顯著的自動化特點(diǎn)[9]。通過數(shù)據(jù)驅(qū)動對數(shù)據(jù)進(jìn)行處理,能提升原始信息涵蓋的內(nèi)容,并且保證數(shù)據(jù)的融合質(zhì)量。
本文針對電網(wǎng)多源故障用電信息的特點(diǎn)和采集需求,提出基于數(shù)據(jù)驅(qū)動的電網(wǎng)多源故障用電信息采集智能融合技術(shù)。電網(wǎng)多源故障用電信息采集智能融合技術(shù)框架如圖1所示。
圖1 電網(wǎng)多源故障用電信息采集智能融合技術(shù)框架
由圖1可知,電網(wǎng)多源故障用電信息采集智能融合技術(shù)以數(shù)據(jù)驅(qū)動技術(shù)為核心,構(gòu)建多源用電信息融合框架。該框架整體包含在線運(yùn)行機(jī)制和離線運(yùn)行機(jī)制這2個部分。
①在線運(yùn)行機(jī)制。在線運(yùn)行機(jī)制的主要作用是通過相關(guān)智能算法對用電數(shù)據(jù)實(shí)施分類,并完成特征提取。該機(jī)制能夠結(jié)合多源數(shù)據(jù)的特性,較好地完成數(shù)據(jù)處理。
②離線運(yùn)行機(jī)制。離線運(yùn)行機(jī)制對應(yīng)數(shù)據(jù)驅(qū)動引擎的模型操作策略調(diào)整功能。其主要是依據(jù)數(shù)據(jù)驅(qū)動實(shí)現(xiàn)多源數(shù)據(jù)的融合,并且對融合結(jié)果進(jìn)行評價;依據(jù)評價結(jié)果調(diào)整融合策略,以確保最佳的融合效果。
1.2.1 多源用電信息分類
電網(wǎng)中智能終端的用電信息在采集和傳輸過程中,會存在數(shù)據(jù)部分丟失或者損壞的情況[10]。除此之外,終端用戶的用電習(xí)慣等存在一定差異。用電采集過程中,獲取的數(shù)據(jù)有靜態(tài)和動態(tài)這2種,并且數(shù)據(jù)的分布呈現(xiàn)不平衡狀態(tài)。因此,在進(jìn)行多源用電信息融合時,需先通過在線機(jī)制對用電信息進(jìn)行分類處理。本文將先驗(yàn)知識和深度玻爾茲曼機(jī)(deep Boltzmann machine,DBM)相結(jié)合,形成基于先驗(yàn)知識和DBM的采樣模型,并依據(jù)該模型完成多源用電信息分類。多源用電信息分類模型結(jié)構(gòu)如圖2所示。
圖2 多源用電信息分類模型結(jié)構(gòu)
圖2所示的多源用電信息分類模型以從電網(wǎng)側(cè)采集到的原始用電數(shù)據(jù)為基礎(chǔ),在完成對數(shù)據(jù)的初步篩選后,對其中的小樣本數(shù)據(jù)執(zhí)行采樣以及復(fù)制這2種處理。在此基礎(chǔ)上,模型通過DBM網(wǎng)絡(luò)對小樣本數(shù)據(jù)執(zhí)行解耦和編碼處理,從而建立編碼數(shù)據(jù)集。復(fù)制處理主要是通過DBM網(wǎng)絡(luò)對新數(shù)據(jù)進(jìn)行編碼處理后,對該數(shù)據(jù)和原始數(shù)據(jù)進(jìn)行縱向拼接操作,以獲取用電的擴(kuò)充數(shù)據(jù)[11]。本文依據(jù)該數(shù)據(jù)進(jìn)行極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)的訓(xùn)練,以實(shí)現(xiàn)用電數(shù)據(jù)的分類處理。
本文設(shè)原始數(shù)據(jù)為D=[d1,d2,…,d48]∈R1×48、第i個采集點(diǎn)采集的用電數(shù)據(jù)為di、數(shù)據(jù)行向之間的相關(guān)系數(shù)矩陣為R、DBM網(wǎng)絡(luò)的可視層節(jié)點(diǎn)數(shù)量為48。本文對D進(jìn)行篩選處理,在獲取其中的小樣本數(shù)據(jù)后,將獲取的采樣數(shù)據(jù)用Ds表示。D和Ds通過DBM網(wǎng)絡(luò)進(jìn)行訓(xùn)練學(xué)習(xí)后,輸出分別為Dt和Dst。兩者具有相同的維度,并且耦合度較低。采用縱向拼接的方式對兩者進(jìn)行處理,可獲取D的采樣數(shù)據(jù)結(jié)果DST。
(1)
多源用電信息分類詳細(xì)步驟如下。
①在獲取D的訓(xùn)練樣本后對樣本實(shí)施歸一化處理,得到其中的小樣本數(shù)據(jù)。
②將小樣本數(shù)據(jù)輸入DBM網(wǎng)絡(luò),通過該網(wǎng)絡(luò)的學(xué)習(xí)和訓(xùn)練,輸出用于測試的數(shù)據(jù)DS。依據(jù)該數(shù)據(jù)進(jìn)行極限學(xué)習(xí)機(jī)網(wǎng)絡(luò)的訓(xùn)練,可實(shí)現(xiàn)用電數(shù)據(jù)分類,并形成靜態(tài)數(shù)據(jù)集和動態(tài)數(shù)據(jù)集。
1.2.2 多源數(shù)據(jù)特征提取
通過上述步驟完成多源用電信息的分類處理后,本文對靜態(tài)和動態(tài)這2種數(shù)據(jù)集進(jìn)行特征提取。本文通過數(shù)據(jù)驅(qū)動的互信息原理完成特征提取。
互信息用于描述2個隨機(jī)變量之間的相關(guān)性。本文令X、Y分別表示靜態(tài)數(shù)據(jù)集和動態(tài)數(shù)據(jù)集。兩者之間的互信息計算式為:
(2)
式中:p(x,y)為X和Y之間的聯(lián)合概率密度函數(shù);p(x)和p(y)均為邊緣概率密度函數(shù),分別對應(yīng)X和Y。
本文基于互信息提取X和Y的特征量。提取結(jié)果為:
(3)
式中:X0為初始特征量;X′為維度為m的特征量。
依據(jù)式(3)即可獲取最大化的互信息結(jié)果,從而在保證類別不發(fā)生變化的基礎(chǔ)上完成特征選擇。本文為保證互信息的最大化,采用分解的方式對多維互信息進(jìn)行處理,以形成一維互信息。I(X,Y)的計算式為:
(4)
式中:Xi與Yj為X和Y數(shù)據(jù)集的已選特征。
本文在式(2)~式(4)的基礎(chǔ)上,實(shí)現(xiàn)用電信息特征集的快速提取。
初始變量選擇為:
(5)
第二變量選擇為:
(6)
依據(jù)式(5)和式(6)即可完成剩余變量的選擇。每次選擇依據(jù)互信息最大的原則進(jìn)行下一個特征的選擇;在進(jìn)行選擇時,設(shè)定閾值N。當(dāng)循環(huán)次數(shù)達(dá)到該閾值時選擇停止。通過本文技術(shù)獲取的特征集具有特征信息完整、特征的類別不會發(fā)生改變的優(yōu)點(diǎn)。
本文通過1.2節(jié)完成多源用電信息特征集提取后,依據(jù)數(shù)據(jù)驅(qū)動技術(shù),通過離線機(jī)制獲取特征集,從而進(jìn)行用電信息的一致性融合。
用電信息的采集是通過多源采集方式完成的。該方式采集的信息具有明顯的冗余特點(diǎn)[12]。因此,提取的特征集也存在一定的冗余特征。本文為保證較好的用電信息融合效果,對提取的特征集進(jìn)行匯總,使其均位于源節(jié)點(diǎn)內(nèi),并通過卡爾曼濾波算法對特征集中的冗余特征進(jìn)行處理,在此基礎(chǔ)上完成用電數(shù)據(jù)的一致性融合。用電數(shù)據(jù)的融合方法結(jié)構(gòu)如圖3所示。
圖3 用電數(shù)據(jù)的融合方法結(jié)構(gòu)
本文將提取的多源特征集均匯集至源節(jié)點(diǎn),采用卡爾曼濾波方法去除特征集中的冗余信息。以X′類特征集為例,使用卡爾曼濾波對特征集進(jìn)行處理時,在(t+1)時刻的濾波計算式為:
xt+1=Ftxt+Γtwt
(7)
式中:Ft為卡爾曼濾波系數(shù);Γt為Ft的加權(quán)平均值;wt為權(quán)重比例。
(8)
式中:E為最優(yōu)期望函數(shù);γ為所有用電信息特征之和。
(9)
式中:n為特征數(shù)量。
本文采用εq和ξ(z)表示用電數(shù)據(jù)集合中的任意誤差和標(biāo)準(zhǔn)差。
(10)
(11)
依據(jù)εq和ζ(z)的計算結(jié)果即可獲取用電信息特征數(shù)據(jù)的分布規(guī)律,從而可在融合過程中刪除其中異常特征數(shù)據(jù),并進(jìn)行一致性融合。此時,每個源節(jié)點(diǎn)的測量值滿足正態(tài)分布規(guī)律。本文在融合過程中引入融合節(jié)點(diǎn)支持程度理念。如果節(jié)點(diǎn)p對節(jié)點(diǎn)q的支持程度用Ψqp表示,則有:
(12)
式中:ξqp為節(jié)點(diǎn)p和節(jié)點(diǎn)q之間的標(biāo)準(zhǔn)差。
以此確定的融合節(jié)點(diǎn)之間的支持度關(guān)系矩陣ΨN×N為:
(13)
本文依據(jù)融合節(jié)點(diǎn)之間的ΨN×N結(jié)果實(shí)現(xiàn)用電信息的一致性特征描述,從而完成用電信息融合。
為驗(yàn)證基于數(shù)據(jù)驅(qū)動的電網(wǎng)多源故障用電信息采集智能融合技術(shù)的應(yīng)用效果,本文選擇某電力企業(yè)采集的電網(wǎng)側(cè)420個用電終端的數(shù)據(jù)作為試驗(yàn)測試數(shù)據(jù)。該數(shù)據(jù)的采集時間間隔為0.5 h、連續(xù)采集時間為7 d。該數(shù)據(jù)中包含用電終端的動態(tài)和靜態(tài)2種數(shù)據(jù)。
試驗(yàn)參數(shù)設(shè)定如下:DBM網(wǎng)絡(luò)隱含層節(jié)點(diǎn)數(shù)量為30個;分類器的節(jié)點(diǎn)數(shù)量為60個;學(xué)習(xí)率為0.001。
為驗(yàn)證本文技術(shù)對于多源用電信息的分類效果,本文采用戴維森堡丁指數(shù)(Davies-Bouldin index,DBI)作為評價指標(biāo)。該指標(biāo)可以反映數(shù)據(jù)之間的的緊密程度。其取值范圍為[0,1]。數(shù)值越小,表示聚類效果越好。DBI的計算式為:
(14)
在不同的數(shù)據(jù)維度下,本文依據(jù)式(14)計算應(yīng)用本文技術(shù)后的DBI指標(biāo)測試結(jié)果。
通電信息分類性能測試結(jié)果如表1所示。
表1 通電信息分類性能測試結(jié)果
由表1可知:在不同的數(shù)據(jù)維度下,隨著數(shù)據(jù)數(shù)量的逐漸增加,通過本文技術(shù)進(jìn)行用電信息分類后,DBI的測試結(jié)果均在0.017及以下。因此,本文技術(shù)具有較好的用電數(shù)據(jù)分類性能,能夠可靠完成用電數(shù)據(jù)的分類。
為了進(jìn)一步分析本文技術(shù)的數(shù)據(jù)分類效果,測試采用本文技術(shù)對采集的用電信息進(jìn)行分類處理后,獲取數(shù)據(jù)的分類結(jié)果。該結(jié)果通過二維空間進(jìn)行呈現(xiàn)。用電信息分類結(jié)果如圖4所示。
圖4 用電信息分類結(jié)果
由圖4可知:應(yīng)用本文技術(shù)后,能夠在二維空間內(nèi)對動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)進(jìn)行有效分類,并且類別之間的界線顯著,沒有發(fā)生重疊以及錯誤分類情況。因此,本文技術(shù)的用電數(shù)據(jù)分類效果良好。
本文技術(shù)在進(jìn)行用電數(shù)據(jù)融合的過程中,對數(shù)據(jù)進(jìn)行異常數(shù)據(jù)處理。處理效果直接影響數(shù)據(jù)的融合結(jié)果。因此,本文將變異系數(shù)λ作為測試指標(biāo),以衡量經(jīng)本文技術(shù)處理后數(shù)據(jù)的離散程度。λ的計算式為:
(15)
λ的數(shù)值越大,表示數(shù)據(jù)的離散程度越高,說明數(shù)據(jù)特征處理效果越差。其取值范圍在0~1之間。
依據(jù)式(15)計算本文技術(shù)應(yīng)用前后在不同的數(shù)據(jù)殘差率下的λ計算結(jié)果。異常數(shù)據(jù)處理效果測試結(jié)果如表2所示。
表2 異常數(shù)據(jù)處理效果測試結(jié)果
由表2可知:隨著數(shù)據(jù)殘差率的逐漸增加,本文技術(shù)對動態(tài)數(shù)據(jù)和靜態(tài)數(shù)據(jù)進(jìn)行異常處理后,λ的計算結(jié)果均在0.020以下。其中,最大值為0.019。這是由于本文技術(shù)在進(jìn)行異常用電數(shù)據(jù)處理時,依據(jù)用電數(shù)據(jù)集合中的任意誤差和標(biāo)準(zhǔn)差完成數(shù)據(jù)處理。這樣可保證較好的處理效果。
為驗(yàn)證本文技術(shù)的應(yīng)用性,測試采用本文技術(shù)對用電信息進(jìn)行融合處理后,依據(jù)處理后的用電信息對電網(wǎng)正常運(yùn)行和故障運(yùn)行這2種情況下的用電需求進(jìn)行預(yù)測,并獲取其分析結(jié)果。
用戶用電需求預(yù)測結(jié)果如圖5所示。由圖5可知:隨著用電用戶數(shù)量的逐漸增加,在電網(wǎng)正常運(yùn)行和故障運(yùn)行這2種情況下,均可依據(jù)本文的用電信息融合結(jié)果完成用電需求的預(yù)測,并且預(yù)測結(jié)果與實(shí)際需求結(jié)果吻合程度較高。這為電網(wǎng)的能源規(guī)劃提供可靠依據(jù)。
圖5 用戶用電需求預(yù)測結(jié)果
為進(jìn)一步驗(yàn)證本文技術(shù)的應(yīng)用性,測試根據(jù)本文技術(shù)的用電信息融合結(jié)果,對異常用電進(jìn)行識別,從而獲取電網(wǎng)中異常用電的識別結(jié)果。異常用電識別結(jié)果如圖6所示。
由圖6可知:依據(jù)本文技術(shù)融合的用電信息,能夠完成終端用戶用電量的統(tǒng)計,并且獲取統(tǒng)計結(jié)果中的異常用電結(jié)果。凌晨5:00屬于用電低谷時刻,但卻產(chǎn)生較大的用電量。18:00屬于用電高峰時刻,卻出現(xiàn)用電量下降情況。因此可判定這2個時刻屬于異常用電時刻,從而實(shí)現(xiàn)對異常用電的識別。該結(jié)果證明本文技術(shù)具有較好的應(yīng)用性。融合后用電信息能夠?yàn)殡娋W(wǎng)的用電規(guī)劃以及竊電監(jiān)測提供可靠依據(jù)。
電網(wǎng)的用電信息對于電網(wǎng)用電規(guī)劃、竊電監(jiān)測、用電需求預(yù)測等均具有重要意義。用電信息在采集過程中具有顯著的時間序列特征,并且會受到電網(wǎng)運(yùn)行狀態(tài)的影響。因此,本文提出基于數(shù)據(jù)驅(qū)動的電網(wǎng)多源故障用電信息采集智能融合技術(shù)。本文對該技術(shù)的應(yīng)用效果展開相關(guān)測試。測試結(jié)果顯示:本文所研究的融合技術(shù)具有較好的用電信息融合效果,并且在融合過程中能夠有效處理信息中的冗余數(shù)據(jù)和異常數(shù)據(jù);依據(jù)融合后的用電信息可精準(zhǔn)預(yù)測用戶的用電需求以及識別異常用電行為,應(yīng)用性良好。