趙海霞 張光建 張海波
(1、西南交通大學(xué)希望學(xué)院,四川 成都 610400 2、四川建筑職業(yè)技術(shù)學(xué)院,智能計(jì)算研究所,四川 德陽(yáng) 618000)
托馬斯·B·史密斯認(rèn)為,竊電可以定義為:在沒有合同或有效義務(wù)的情況下使用公用事業(yè)公司的電力來改變電力計(jì)量。傳統(tǒng)的反竊電方法包括人工定期檢查、儀器儀表定期檢測(cè)、用戶信息查詢等手段,以發(fā)現(xiàn)竊取用電用戶的信息。這種方法耗時(shí),依賴人力,沒有明確的目標(biāo)同時(shí)存在很大投機(jī)機(jī)會(huì)。目前智能電網(wǎng)的關(guān)鍵技術(shù)是廣泛部署在電網(wǎng)方面的先進(jìn)計(jì)量基礎(chǔ)設(shè)施(AMI),通過采集電壓、電流、功率、電力負(fù)荷數(shù)據(jù),結(jié)合電力終端提取從竊電用戶身上提取的異常數(shù)據(jù),通過偷電識(shí)別模型,確定用戶是否自動(dòng)偷電。
國(guó)內(nèi)外已經(jīng)提出并開發(fā)了幾種檢測(cè)竊電的技術(shù)。目前,對(duì)于現(xiàn)有竊電用戶行為的識(shí)別,研究人員采用不同的方法提取用戶特征,建立識(shí)別模型,得到不同的識(shí)別率。Joker P 等人提出并建立了一個(gè)應(yīng)用程序,該應(yīng)用程序在智能電網(wǎng)采樣數(shù)據(jù)模型中使用用戶行為,檢測(cè)疑似竊電的用戶。Zanetti M 等人描述了一個(gè)使用概率神經(jīng)網(wǎng)絡(luò)(PNN)模型的應(yīng)用程序,根據(jù)模型選擇懷疑客戶,以及其耗電量。概率神經(jīng)網(wǎng)絡(luò)算法對(duì)一類給定的各向同性高斯似然函數(shù)也是如此。Mandala S 等人利用12 個(gè)月的用戶用電量提取的細(xì)節(jié)作為神經(jīng)網(wǎng)絡(luò)的輸入,通過機(jī)器學(xué)習(xí)訓(xùn)練得到期望的輸出精度為70%-80%。他使用的模型是支持向量機(jī)在多次迭代之間的分類,準(zhǔn)確率在76%到92%之間。張良軍在書中介紹了一個(gè)基于LM 神經(jīng)網(wǎng)絡(luò)模型的應(yīng)用,該模型的準(zhǔn)確率為94%,CART 決策樹模型的準(zhǔn)確率為95.3%。劉濤等提出了一個(gè)應(yīng)用,該應(yīng)用利用電能計(jì)量自動(dòng)化系統(tǒng)采集電力、負(fù)荷數(shù)據(jù)、報(bào)警和線損,分析竊電現(xiàn)象現(xiàn)有樣本的電氣檢查增益,基于模糊神經(jīng)網(wǎng)絡(luò)方法的評(píng)估方法,建立自適應(yīng)防盜泄漏診斷模型。樣本數(shù)據(jù)的模擬和分類準(zhǔn)確率為96.16%。
根據(jù)中國(guó)的實(shí)際情況,電力用戶主要集中在企業(yè),尤其是私營(yíng)企業(yè)。銀行、學(xué)校、營(yíng)業(yè)稅等機(jī)構(gòu),其不可能實(shí)施竊電行為。因此采樣數(shù)據(jù)將直接從此類用戶中刪除。電力負(fù)荷中的電能計(jì)量系統(tǒng)不能直接反映用戶的竊電行為,因?yàn)榻K端報(bào)警可能有誤報(bào)和漏報(bào)。
對(duì)于正常的電力用戶來說,用電量不是不穩(wěn)定的,而是穩(wěn)定的。對(duì)于用電用戶來說,在用電臨界時(shí)間點(diǎn)前后,負(fù)荷和終端負(fù)荷數(shù)據(jù)都會(huì)發(fā)生一些變化,用電量會(huì)顯著降低。本次樣本采樣原始數(shù)據(jù)采集包括三個(gè)部分:基本信息和默認(rèn)值,電力營(yíng)銷系統(tǒng)提取處理用戶記錄,來自測(cè)量系統(tǒng)的實(shí)時(shí)負(fù)載數(shù)據(jù)(包括時(shí)間點(diǎn)和測(cè)量點(diǎn)、總有功功率、A/B/C、A/B/C 相電壓、相電流、A/B/C 相功率因數(shù);來自智能電網(wǎng)的報(bào)警數(shù)據(jù)采集終端)。
用戶當(dāng)日用電量計(jì)算公式(1)。
參數(shù)fi計(jì)算如下:
其中,fi對(duì)于總有功功率的前1 天,每15 分鐘的前l(fā)天,為當(dāng)天的用電量總和。
對(duì)于企業(yè)用戶,根據(jù)工作日和節(jié)假日較低的用電量,過濾節(jié)假日用電量。對(duì)于缺失值,使用拉格朗日插值法(2)。
通過電能計(jì)量系統(tǒng)對(duì)電能、負(fù)荷的數(shù)據(jù)特征進(jìn)行轉(zhuǎn)換,并采集數(shù)據(jù)樣本。竊電規(guī)律表征評(píng)價(jià)指標(biāo)體系構(gòu)建了3 個(gè)特征:電力趨勢(shì)下降指標(biāo)特征、電力線損耗特性、線損耗率特性以及與盜竊相關(guān)的終端報(bào)警指示燈報(bào)警號(hào)碼。
3.2.1 電力趨勢(shì)指標(biāo)下降
統(tǒng)計(jì)前一天和后一天的5 天時(shí)間段作為統(tǒng)計(jì)窗口,其中計(jì)算11 天用電量的斜率,計(jì)算公式(3)
如果認(rèn)為秋季的電力趨勢(shì)涉嫌竊電,則在該日前后5 天內(nèi),總共有11 天的電力下降趨勢(shì)指標(biāo)T,方程式(4)。
3.2.2 線損指數(shù)
線損率是衡量電力線損耗的指標(biāo),結(jié)合電路拓?fù)?,?jì)算線損,公式(5)。
計(jì)算當(dāng)日5 天前后的線損率統(tǒng)計(jì)平均值Vi1和Vi2,如果Vi1和Vi2,比增長(zhǎng)率大于1%,則認(rèn)為用戶涉嫌竊電,線損指數(shù)E(i),公式(6)。
3.2.3 報(bào)警指示燈
報(bào)警統(tǒng)計(jì)端子電壓相位、電壓相位總數(shù)、電流反極性報(bào)警作為報(bào)警指示。
根據(jù)上述三類指標(biāo),收集的樣本如表1 所示。
表1 樣本數(shù)據(jù)
序列號(hào)功率下降趨勢(shì)指示燈線損指示燈報(bào)警指示燈被盜。
在實(shí)際應(yīng)用中,不同錯(cuò)誤的代價(jià)往往是不相等的。根據(jù)收集到的樣本,普通客戶的成本可能比竊電客戶的成本高得多。
考慮到解決階級(jí)不平衡問題最常用的方法,其基本思想是改變訓(xùn)練數(shù)據(jù)的分布有助于消除或減少不平衡數(shù)據(jù)。
3.3.1 過采樣
過采樣方法通過添加幾個(gè)樣本來提高少數(shù)類的性能,最簡(jiǎn)單的方法是簡(jiǎn)單地復(fù)制幾個(gè)樣本,缺點(diǎn)是可能會(huì)導(dǎo)致過擬合,沒有向少數(shù)類添加任何新信息。在少數(shù)隨機(jī)高斯噪聲中改進(jìn)的采樣方法創(chuàng)造了新的樣本合成方法。
3.3.2 抽樣不足
在抽樣方法下通過減少大多數(shù)樣本來提高少數(shù)類的性能,最簡(jiǎn)單的方法是去掉一些最隨機(jī)的樣本來減少大多數(shù)類的大小,但一些重要信息在大多數(shù)類中丟失了,不能充分利用現(xiàn)有信息。
3.3.3 成本敏感的方法
3.3.3.1 重建訓(xùn)練集
不改變現(xiàn)有算法,而是根據(jù)樣本不同的誤分類代價(jià)給每個(gè)樣本分配一個(gè)權(quán)重訓(xùn)練集,然后對(duì)原始樣本的權(quán)重進(jìn)行重構(gòu)。
3.3.3.2 引入成本敏感因素,設(shè)計(jì)了成本敏感分類算法
一般來說,它對(duì)小樣本施加了更高的成本,大樣本給出了更小的價(jià)格和期望,以平衡樣本之間的差異數(shù)量。
3.3.4 特征選擇
當(dāng)樣本分布非常不均勻時(shí),分布將不平衡。特別是在文本分類問題中,經(jīng)常出現(xiàn)在特征的類別中,它很可能沒有出現(xiàn)在罕見的類別中。因此,根據(jù)非平衡分類的特點(diǎn),選擇最具差異性的特征有助于提高貴族階層的識(shí)別率。
根據(jù)一個(gè)經(jīng)驗(yàn)樣本,選擇一個(gè)樣本的正負(fù)兩組,分別從中選擇最能體現(xiàn)樣本集特征的方法,然后將特征集作為最終選擇的一個(gè)方面。
在參考文獻(xiàn)[12]中,使用抽樣方法處理不平衡數(shù)據(jù)的類不平衡問題。
3.3.5 模型與仿真
參考文獻(xiàn)1,樣本數(shù)291,使用270 個(gè)樣本作為訓(xùn)練集,剩余樣本作為測(cè)試集,構(gòu)建支持向量機(jī)模型,其中支持向量機(jī)類型設(shè)置為0(c-SVC),內(nèi)核類型設(shè)置為1(多項(xiàng)式核函數(shù))。如圖1 所示繪制ROC。繪制混亂矩陣,如圖2 所示。
圖1 ROC
圖2 混淆矩陣
在智能電網(wǎng)先進(jìn)測(cè)量的基礎(chǔ)上,自動(dòng)采集原始數(shù)據(jù),利用支持向量機(jī)分類裝置對(duì)竊電用戶的行為特征進(jìn)行分析和計(jì)算,實(shí)現(xiàn)竊電識(shí)別,提高識(shí)別精度。模型將進(jìn)一步分析竊電用戶的行為,并提供更多重復(fù)特征。與多個(gè)模型相比,選擇的最優(yōu)模型能夠提高識(shí)別精度。