付浩然
(廣東電網(wǎng)有限責(zé)任公司惠州供電局,廣東 惠州 516211)
竊電等現(xiàn)象在電力行業(yè)中屢禁不止,是比較常見的異常用電行為,在現(xiàn)實生活中電力用戶通過改變智能電表結(jié)構(gòu)、修改智能電表計量線路以及更換智能電表零部件等方式使智能電表無法正常計量實際用電量,以此達(dá)到竊電的目的,這種竊電方式不僅會減少電力企業(yè)收益,還會造成一定的安全隱患,私自修改電路或者改變電表結(jié)構(gòu)非常容易引發(fā)電力事故,并且降低智能電表和電路的使用壽命,會造成嚴(yán)重的經(jīng)濟損失。相關(guān)統(tǒng)計數(shù)據(jù)顯示,2020年全國范圍內(nèi)電力用戶竊電量達(dá)到15 643萬kW·h,造成的經(jīng)濟損失高達(dá)1.32億元人民幣,相比較2019年竊電量增加了近5%,雖然對竊電行為進行了懲罰和警示,但是每年依然會發(fā)生大量的竊電事件。為了及時發(fā)現(xiàn)竊電、欺詐等異常用電行為,降低異常行為造成的經(jīng)濟損失,需要采取有效的手段對電力用戶智能用電異常進行檢測。由于國內(nèi)電力用戶智能用電異常檢測起步比較晚,相關(guān)的技術(shù)還不夠成熟,現(xiàn)有的研究理論也比較少,雖然近幾年電力用戶智能用電異常檢測問題受到廣泛關(guān)注,開展了一系列研究,但是現(xiàn)有的檢測方法存在一定的局限性,在實際應(yīng)用中受數(shù)據(jù)量影響較大,當(dāng)對海量數(shù)據(jù)分析時經(jīng)常出現(xiàn)虛警現(xiàn)象,虛警率較高,為此提出基于無監(jiān)督聚類的電力用戶智能用電異常檢測方法。
電力用戶智能用電數(shù)據(jù)是用電異常檢測分析的基礎(chǔ),因此用電數(shù)據(jù)獲取是用電異常檢測的首要步驟。根據(jù)實際需求,此次以無線傳感器作為智能用電數(shù)據(jù)采集裝置,選擇型號為OIFY-4F4A的無線傳感器,將無線傳感器采用串聯(lián)的方式安裝在電力用戶智能電表總線上,根據(jù)實際情況對無線傳感器掃描周期、掃描頻率等技術(shù)參數(shù)進行設(shè)定,利用讀卡器實時讀取無線傳感器掃描到的電力用戶智能用電數(shù)據(jù),將其上傳到計算機上,以此實現(xiàn)對用電數(shù)據(jù)的獲取[1]。受到某種因素影響,獲取的用電數(shù)據(jù)可能存在缺失和異常問題,對時間序列中出現(xiàn)25%以上為負(fù)值的電力數(shù)據(jù)進行刪除處理。這一部分?jǐn)?shù)據(jù)為異常數(shù)據(jù),對于智能用電異常檢測沒有價值,因此對異常數(shù)據(jù)進行刪除[2]。當(dāng)電力用戶智能電表檢修或者更換時,無線傳感器采集到的電力數(shù)據(jù)還有某時間段缺失,對于缺失量達(dá)到45%的電力數(shù)據(jù)進行刪除,對于缺失量小于45%的電力數(shù)據(jù)采用均值填充法對數(shù)據(jù)進行補齊處理。其用公式表示為
式中:d表示均值填充后的電力數(shù)據(jù);ax表示缺失時間段前端與后端電表數(shù)值;mumday表示缺失段時間長度,利用上述公式將所有用電數(shù)據(jù)中缺失段進行補齊處理,將補齊后的用電數(shù)據(jù)建立用電異常檢測數(shù)據(jù)文件,用于后續(xù)用電異常特征提取和無監(jiān)督聚類分析。
正常情況下電力用戶智能用電數(shù)據(jù)在時間域上會呈現(xiàn)一定的特征,因此選取統(tǒng)計性特征、趨勢特征以及頻域特征坐標(biāo)用電特征指標(biāo),通過對用電數(shù)據(jù)分析提取到該3個特征。統(tǒng)計性特征可以反映出時間序列上用戶總體用電狀況,其中包括用電均值、用電量極差等,計算公式為
式中:mean表示一段時間內(nèi)電力用戶平均用電量;xi表示電力用戶在一段時間內(nèi)第i天的用電量;n表示用電周期天數(shù);range表示一段時間內(nèi)電力用戶用電量極差;xmax表示在一段時間內(nèi)電力用戶用電量最大值;xmin表示在一段時間內(nèi)電力用戶用電量最小值[3]。趨勢特征可以反映出電力用戶用電量時間序列的波動趨勢,其中包括用電量上升趨勢和下降趨勢,用公式表示為
式中:tra表示在一段時間內(nèi)電流用戶用電量上升趨勢;ki表示在一段時間內(nèi)電力用戶用電量的第i個點;u表示原始序列在平均序列之下時間段數(shù)量;trb表示在一段時間內(nèi)電流用戶用電量下降趨勢;mi表示當(dāng)前特征提取段的電力用戶用電量的第i個點;v表示原始序列在平均序列之上時間段數(shù)量[4]。頻域特征可以反映出電力用戶用電時間序列的波動變化狀態(tài),其計算公式為
式中:F表示在一段時間內(nèi)電力用戶用電量幅值極差;Kmax表示電力負(fù)荷序列進行傅里葉變換后的最大值;Kmin表示電力負(fù)荷序列進行傅里葉變換后的最小值[5]。通過以上計算提取到電力用戶智能用電特征,為后續(xù)用電異常檢測提供基礎(chǔ)。
在上述基礎(chǔ)上,采用無監(jiān)督聚類技術(shù)對用電特征進行聚類分析,檢測到用電異常狀態(tài),考慮到提取到的用電特征值比較大,直接對其進行無監(jiān)督聚類分析,會導(dǎo)致聚類難以收斂,因此無監(jiān)督聚類分析前對提取的特征值進行歸一化處理,其用公式表示為
式中:A表示歸一化處理后的電力用戶智能用電特征值;u表示電力用戶智能用電特征編號。完成歸一化處理后,確定無監(jiān)督聚類簇,考慮到此次是對用電異常檢測,用電特征主要分為正常用電和異常用電兩大類,因此此次建立2個聚類中心,將聚類簇取值為2,2個聚類中心分別為正常用電聚類簇和異常用電聚類簇[6]。從電力用電智能用電數(shù)據(jù)庫中選取一分部正常用電數(shù)據(jù),將其列入到正常用電聚類簇中,將待檢測數(shù)據(jù)列入到異常用電聚類簇中,根據(jù)歐式距離計算出2個聚類簇的相似性,其計算公式為
式中:p表示待測樣本到正常用電聚類簇歐式距離,即2個聚類簇相似性;j表示用電特征數(shù)量;Aij表示第i個待測樣本點的第j個用電特征值;Aij*表示正常用電聚類簇的第j個用電特征值[7]。利用上述公式計算出2個聚類簇相似性,在此設(shè)定一個閾值。如果式(6)計算結(jié)果大于閾值,則表示待測樣本點用電特征與正常用電行為非常相似,當(dāng)前電力用戶智能用電正常;如果式(6)計算結(jié)果小于閾值。則表示待測樣本點用電特征與正常用電行為存在較大區(qū)別,當(dāng)前電力用戶智能用電異常,以此檢測出電力用戶智能用電是否異常。
為了驗證本次提出的電力用戶智能用電異常檢測思路的可行性與可靠性,選擇某區(qū)域電力用戶為實驗對象,采用設(shè)計方法與傳統(tǒng)方法,對該區(qū)域電力用戶智能用電異常進行檢測。實驗準(zhǔn)備了8臺無線傳感器,將其安裝在電力用戶智能電表總線上,根據(jù)該區(qū)域電力用戶智能用電實際情況,將無線傳感器的掃描周期設(shè)定為0.26 s,掃描頻率設(shè)定為1.25 Hz,對區(qū)域內(nèi)150個電力用戶智能用電數(shù)據(jù)獲取,共獲取了800 GB電力數(shù)據(jù),按照上述流程對數(shù)據(jù)清洗、異常特征提取、無監(jiān)督聚類分析,檢測到電力用戶智能用電異常情況共1 246個。實驗以電力樣本數(shù)據(jù)量為變量,每完成對100 GB樣本數(shù)據(jù)檢測分析,記錄檢測虛警率,將虛警率作為2種檢測方法精度評價指標(biāo)。虛警率表示檢測結(jié)果中虛假次數(shù)占總預(yù)警次數(shù)的比例,其計算公式為
式中:r表示電力用戶智能用電異常檢測虛警率;e表示檢測結(jié)果中虛假數(shù)量;s表示檢測結(jié)果中正確數(shù)量。利用上述公式計算2種方法虛警率,并使用電子表格對實驗數(shù)據(jù)進行記錄,具體數(shù)據(jù)如表1所示。
表1 2種方法虛警率對比
設(shè)計方法在電力用戶智能用電異常檢測中,虛警率較低,最高虛警率僅為0.24%,最小虛警率為0.03%,平均虛警率為0.11%,可以將虛警率控制在1%以內(nèi),并且虛警率不受樣本數(shù)據(jù)量變化影響,在最大虛警率限值范圍內(nèi)。而傳統(tǒng)方法在電力用戶智能用電異常檢測中虛警率較高,隨著樣本數(shù)據(jù)量的增加,虛警率逐漸增大,最高虛警率可以達(dá)到24.59%,最小虛警率為16.95%,平均虛警率為21.46%,遠(yuǎn)遠(yuǎn)高于設(shè)計方法。在檢測精度方面,設(shè)計方法優(yōu)于傳統(tǒng)方法,檢測結(jié)果基本與實際情況一致,相比較傳統(tǒng)方法更適用于電力用戶智能用電異常檢測。
此次將無監(jiān)督聚類技術(shù)應(yīng)用到電力用戶智能用電異常檢測中,提出了一個新的用電異常檢測思路,實現(xiàn)了對傳統(tǒng)方法的創(chuàng)新和優(yōu)化,有效降低虛警率。此次研究豐富了電力用戶智能用電異常檢測理論,推廣無監(jiān)督聚類技術(shù)在電力用戶智能用電異常檢測中的廣泛應(yīng)用,提高電力用戶智能用電異常檢測精度,具有良好的現(xiàn)實意義。但是由于此次研究時間有限,在研究內(nèi)容方面存在一些不足之處,今后會對該課題展開深層次探究,為電力用戶智能用電異常檢測提供充足的理論支撐。