吳素我,張 焰,蘇 運
(1.上海交通大學 電氣工程系,上海 200240;2.國網(wǎng)上海市電力公司,上海 200437)
中壓配電網(wǎng)擔負著為用戶直接供電的重任。一直以來,人們對各類短路故障進行了較多深入的研究,在故障診斷及故障快速切除等方面取得了豐碩成果并已有效地用于實際電網(wǎng)中。但對于中壓配電網(wǎng)斷線故障診斷,尤其是分支線斷線不接地故障的診斷的研究還較少,缺乏有效的診斷方法。目前關于斷線故障診斷的研究還主要集中在非分支線斷線故障選線及定位方面。
文獻[1]應用小波奇異性檢測功能獲取單相斷線故障引起的正序電流暫態(tài)分量模極大值極性和大小,以此進行故障選線,并結合小波神經(jīng)網(wǎng)絡實現(xiàn)模極大值與故障點位置之間的映射關系,進行故障定位。文獻[2]提出了基于負序電壓幅值的單相斷線判據(jù)以及基于負荷監(jiān)測儀的單相斷線故障區(qū)域判定方法。文獻[3]考慮同桿雙回線可能出現(xiàn)兩回線路參數(shù)不相等的情況,研究了各種斷線故障情況下的線路電壓、電流的序量關系,給出了斷線故障后電氣量的求解方法和結果,可以作為雙回線非全相運行狀態(tài)下故障診斷的判據(jù)。文獻[1-3]提出的診斷方法需要利用故障后電流暫態(tài)量和電壓電流序分量,由于暫態(tài)量成分復雜,很難提取出有效信息,并且目前的配用電信息系統(tǒng)基本不采集這2種類型的數(shù)據(jù),因此實用性不強。文獻[4]采用梯形模糊數(shù)估計配變負荷變化情況,當斷線相電流幅度的減小超過設定值且滿足電壓條件時,計算此單相線路電流,通過分析某節(jié)點電流為零的可能性最大,判斷此節(jié)點與其后節(jié)點之間發(fā)生了斷線故障,該診斷方法需要遍歷配電網(wǎng)拓撲結構,運算量較大、計算時間較長。文獻[5]分析了電力線路斷開時行波產(chǎn)生的機理以及斷線故障初始行波及其傳輸特征,探討了利用行波原理測量斷線故障距離的方法和可行性。文獻[1]和[5]所提方法用于診斷斷線故障的前提是必須有效檢測到斷線故障的發(fā)生,然后才能進行故障選線或故障定位。而中壓配電網(wǎng)饋線上的分支線發(fā)生斷線不接地故障時,饋線電流可能變化很小,不足以讓保護裝置動作發(fā)出告警信號,運行人員難以及時發(fā)現(xiàn)斷線故障,往往是待用戶打電話報修才知道,影響了對用戶供電的可靠性。
隨著電網(wǎng)信息系統(tǒng)建設的不斷深入,許多地區(qū)的供電側和用電側信息采集系統(tǒng)全部接入到綜合數(shù)據(jù)平臺,積累了從配電到用電的大量運行數(shù)據(jù),這些數(shù)據(jù)中可能蘊藏著與斷線故障診斷相關的、未知的、潛在的有價值的信息。如果能從海量數(shù)據(jù)中快速篩選出有用信息并挖掘出它們之間的潛在聯(lián)系,實現(xiàn)對線路故障發(fā)生時間及位置的準確判斷,則可以為電網(wǎng)運行人員快速搶修提供依據(jù),達到有效降低故障損失、提高用戶供電可靠性的目的。數(shù)據(jù)挖掘作為一種處理海量數(shù)據(jù)的方法,能夠挖掘出數(shù)據(jù)中所包含的有用信息,已被應用于多個領域,近年來在配電網(wǎng)故障診斷[6-7]和變壓器故障診斷[8-9]方面也得到了應用。
本文從10 kV配電網(wǎng)實際運行出發(fā),利用配用電信息系統(tǒng)數(shù)據(jù),提出基于數(shù)據(jù)的條件特征和結果特征;通過對關鍵條件特征的選擇和數(shù)據(jù)類型的轉換,達到滿足關聯(lián)規(guī)則算法的模型要求;根據(jù)用戶用電數(shù)據(jù)的特點,采用MSApriori算法對反映線路及設備運行狀態(tài)的條件特征量進行分析,得到10 kV配電網(wǎng)分支線斷線不接地故障診斷規(guī)則集,并對規(guī)則集進行約簡以幫助電網(wǎng)運行人員對故障做出更為準確的診斷。最后通過實際算例,證明本文提出的方法適用于中壓配電網(wǎng)分支線斷線不接地故障的在線診斷。
華東某地區(qū)配電網(wǎng)目前投運的配用電信息系統(tǒng)及其輸出數(shù)據(jù)類型如下。
a.生產(chǎn)管理系統(tǒng)的輸出數(shù)據(jù)類型:一次設備臺賬、電網(wǎng)地理拓撲、電網(wǎng)電氣拓撲、工作票、停復、缺陷等生產(chǎn)業(yè)務,以及日計劃、實時負荷、調(diào)度記錄等數(shù)據(jù)模塊。
b.故障搶修管理系統(tǒng)的輸出數(shù)據(jù)類型:故障區(qū)域、設備類型、故障電壓、電站線路、故障原因、故障設備、搶修耗時、故障類型、故障歸屬、報修內(nèi)容。
c.供電電壓監(jiān)測系統(tǒng)的輸出數(shù)據(jù)類型:電壓幅值,采集目標有B類35 kV和10 kV專線用戶電壓、C類10 kV用戶,其中B類和C類采集點共1000多個,D類用戶不采集,并做出3類電壓統(tǒng)計值。
d.配變負荷監(jiān)測系統(tǒng)的輸出數(shù)據(jù)類型:10 kV配變負荷電壓、電流、有功、無功數(shù)據(jù)。
e.調(diào)度自動化系統(tǒng)的輸出數(shù)據(jù)類型:10 kV饋線有功功率、無功功率、電流等潮流信息以及10 kV開關站、配電站、環(huán)網(wǎng)柜電壓。
f.配電自動化系統(tǒng)的輸出數(shù)據(jù)類型:遙信、遙控、遙測、遙調(diào)。
g.電能質(zhì)量系統(tǒng)的輸出數(shù)據(jù)類型:對暫態(tài)事件進行查詢、顯示,對穩(wěn)態(tài)電能質(zhì)量進行全面監(jiān)測,包括電壓、電流、諧波(25次)、電壓不平衡度、閃變等五大類電能質(zhì)量指標。
h.用戶信息采集系統(tǒng)的輸出數(shù)據(jù)類型:大用戶的日分時凍結電量(峰、平、尖、谷),96點三相有功、電壓、電流;低壓大用戶的日分時凍結電量(峰、平、尖、谷),96點三相有功、電壓、電流;低壓小用戶、大用戶的日分時凍結電量(平、谷)。
i.負荷控制與管理系統(tǒng)的輸出數(shù)據(jù)類型:采集負荷控制與管理系統(tǒng)覆蓋的1000多個用戶的有功功率、電流、電壓。
j.營銷業(yè)務管理系統(tǒng)的輸出數(shù)據(jù)類型:業(yè)擴、電費核算、收費、計量資產(chǎn)、用戶檔案、竊電信息。
k.95596客服系統(tǒng)的輸出數(shù)據(jù)類型:反映停電類型、停電線路、停電時間、頻度等;停送電管理工作類數(shù)據(jù);電網(wǎng)薄弱環(huán)節(jié)的數(shù)據(jù);營業(yè)問題類數(shù)據(jù);反映營業(yè)廳營業(yè)時間的數(shù)據(jù)。
l.可靠性分析系統(tǒng)的輸出數(shù)據(jù)類型:每起停電事件的時戶數(shù)、用戶數(shù)、停電性質(zhì)、停電時間、送電時間、持續(xù)時間、線路名稱、設備原因、技術原因、責任原因、備注、事件類型、區(qū)域。
m.線損系統(tǒng)的輸出數(shù)據(jù)類型:10 kV饋線統(tǒng)計線損、理論線損;公變臺區(qū)統(tǒng)計線損。
配用電信息系統(tǒng)中與斷線故障診斷相關的數(shù)據(jù)類型特征有以下幾類。
a.故障發(fā)生信號和告警信號:來自調(diào)度自動化系統(tǒng),該類信號是判斷故障發(fā)生的標志。
b.配電網(wǎng)潮流數(shù)據(jù):來自供電電壓監(jiān)測系統(tǒng)、配變負荷監(jiān)測系統(tǒng)、調(diào)度自動化系統(tǒng)和配電自動化系統(tǒng),包括10 kV饋線和配變的有功功率、無功功率、電壓、電流數(shù)據(jù)。
c.用戶用電量數(shù)據(jù):來自用戶信息采集系統(tǒng)和負荷控制與管理系統(tǒng),包括中高壓用戶和低壓大用戶96點三相有功功率、電壓、電流數(shù)據(jù)。
d.“四遙”信號:來自配電自動化系統(tǒng),本文以遙測為準,保護動作后,相應的量測量變?yōu)?,則遙信信號正確,若無保護動作信號,視為該信號丟失。
e.重合閘信號:來自配電自動化系統(tǒng)和調(diào)度自動化系統(tǒng),若量測數(shù)據(jù)降低至0后又恢復,則自動重合閘成功,否則自動重合閘失敗。
f.故障描述數(shù)據(jù):來自可靠性分析系統(tǒng)和故障搶修管理系統(tǒng),包括每起停電事件的停電時間、送電時間、持續(xù)時間、線路名稱、事件類型、故障區(qū)域等數(shù)據(jù)。
為提取斷線故障診斷規(guī)則而需構建數(shù)學模型時,首先要確定輸入特征變量,即規(guī)則的條件特征X和結果特征Y。規(guī)則的結果特征Y為斷線故障類型,條件特征X為斷線故障的數(shù)據(jù)項表征。鑒于分支線斷線不接地故障很難被察覺,保護不會動作,因此只考慮量測數(shù)據(jù)。同時鑒于目前配用電信息系統(tǒng)基本不采集暫態(tài)量數(shù)據(jù),這里只考慮穩(wěn)態(tài)量特征。顯然分支線斷線不接地故障會影響用戶的正常用電,因此配電變壓器和用戶的電壓、電流、有功功率和無功功率都會產(chǎn)生很大的變化[10-11],同時變電站內(nèi)10 kV饋線首段的電壓、電流、有功功率和無功功率也會根據(jù)故障位置的遠近發(fā)生相應的變化[2],根據(jù)文獻[12]可知電壓、電流、有功功率和無功功率的變化率也是故障診斷的常用穩(wěn)態(tài)特征。因此從配電網(wǎng)實際運行數(shù)據(jù)出發(fā),綜合已有研究,本文提出的條件特征包括:
其中,U為電壓;I為電流;P和Q分別為有功和無功功率。
基于配用電信息系統(tǒng)及配用電信息系統(tǒng)輸出數(shù)據(jù)類型,本文將數(shù)據(jù)分為3個層級,即10 kV饋線層級、配電變壓器層級和用戶負荷層級,各層級均有如式(1)所述的8類特征,每類特征又都有a、b、c三相(即故障相與非故障相),共有72個條件特征量。為了計算各個候選特征權重,得到準確的關鍵特征選擇結果,需要刪去數(shù)據(jù)質(zhì)量較差的特征量。在目前的配用電信息系統(tǒng)中,有功和無功功率數(shù)據(jù)的有效率較低且10 kV饋線電流一般只采集一相,因此不考慮有功和無功功率及其變化率的相關特征量,并且10 kV饋線層級的電流特征量只包括單相相電流和單相相電流變化率,最后得到32個候選特征量,包括10 kV饋線相電流、10 kV饋線相電流變化率、10 kV饋線a相母線電壓、10 kV饋線a相母線電壓變化率等。
斷線故障的發(fā)生與設備維護水平、運行參數(shù)以及網(wǎng)絡拓撲之間有著復雜的因果關系,這種關系在配用電信息系統(tǒng)大量的數(shù)據(jù)中表現(xiàn)為運行參數(shù)、負荷等數(shù)據(jù)項之間的關聯(lián),因此關聯(lián)規(guī)則挖掘方法非常適合用于處理斷線故障診斷。當采集到的歷史運行數(shù)據(jù)足夠覆蓋可能出現(xiàn)的各種斷線故障事件時,事件的數(shù)據(jù)項表征和故障類型之間常常表現(xiàn)為有一定概率支持的關聯(lián)性,當這種關聯(lián)性在類似的事件出現(xiàn)時,可以被用來判定可能的故障類型。簡而言之,進行關聯(lián)規(guī)則挖掘的目的就是對歷史運行數(shù)據(jù)進行規(guī)則性的總結并利用規(guī)則對故障的快速診斷進行指導。
常規(guī)的關聯(lián)規(guī)則挖掘算法是建立在以下客觀前提假設之上的:條件特征中的各項具有近似的性質(zhì)和作用,即重要性相同或者重要性相近。輸入特征變量的選擇合適與否,很大程度上決定著最終規(guī)則集的準確性,因此,首先要篩選出重要性相似的條件特征[13]。
本文采用的是RELIEF算法[14]進行特征選擇。RELIEF算法是一種基于實例的特征選擇方法,其基本思想是如果某個特征為關鍵特征,那么在同類樣本中,該特征的值應相同;而在異類樣本中,該特征的值應不同。權重取值的基本思想是從訓練集D中隨機選擇一個樣本R,然后從和R同類的樣本中尋找最近鄰樣本H,稱為Near Hit,從和R不同類的樣本中尋找最近鄰樣本M,稱為Near Miss,然后根據(jù)以下規(guī)則更新每個特征的權重:如果R和Near Hit在某個特征上的距離小于R和Near Miss的距離,則說明該特征對區(qū)分同類和不同類的最近鄰是有益的,則增加該特征的權重;反之,如果R和Near Hit在某個特征的距離大于R和Near Miss的距離,說明該特征對區(qū)分同類和不同類的最近鄰起負面作用,則降低該特征的權重。為了將分支線斷線不接地故障和分支線斷線接地故障以及正常的負荷波動分離開,本文將分支線斷線不接地故障取為同類樣本,將分支線斷線接地故障樣本以及正常負荷波動取為異類樣本,并對RELIEF算法的計算公式進行適當改進。
改進后的RELIEF算法執(zhí)行流程如下。
步驟 1 給定樣本集合 E={(xi,yi)}(i=1,2,…,n),其特征集合為 A(x)={a(j)}(j=1,2,…,d)。
步驟2對各特征的值進行歸一化處理,設數(shù)據(jù)集X由m個特征變量、n個樣本組成,將X中的樣本按時間升序進行排列。設uij+1為故障后樣本,uij為故障前樣本,則
步驟3設定各特征的初始權重ωj=0;設對集合(x,y)的采樣次數(shù)為 S。
步驟4隨機從E中選取一個樣本(x,y)。
步驟5找到與樣本(x,y)歐氏距離最近的同類樣本 H(x)和異類樣本 M1(x)、M2(x)。
步驟6按式(2)計算權值:
綜上所述,同類樣本與異類樣本特征統(tǒng)計量差異越明顯,RELIEF算法對該條件特征賦予權值越高,則該條件特征重要性越高。
關聯(lián)規(guī)則算法是針對離散型數(shù)據(jù)的,而條件特征量都是連續(xù)型數(shù)據(jù),因此必須對各特征量進行離散化處理,將離散化后的連續(xù)屬性變換成分類屬性。此外,關聯(lián)規(guī)則算法還要求數(shù)據(jù)是二元屬性形式,因此為了避免每個特征量轉換為二元屬性后出現(xiàn)不必要的屬性聯(lián)系,還需要為每一個分類屬性引入一個二元屬性。
連續(xù)數(shù)值的離散化方法有很多,例如等寬或等頻率法[15]、C4.5 法[16]、熵值法[17]等。由于本文用到的數(shù)據(jù)樣本帶有類別信息,因此采用卡方分裂算法[18]來進行數(shù)據(jù)離散化??ǚ椒至阉惴ㄊ且环N基于卡方分布的監(jiān)督型離散化方法。其采用自上向下的策略,把整個屬性值區(qū)間當做一個離散的屬性值,對數(shù)據(jù)進行升序排列,并依次在數(shù)據(jù)中插入一個斷點,分別計算插入斷點時的卡方值 χ2,然后選擇出現(xiàn)最大卡方值的斷點對該區(qū)間進行劃分,把一個區(qū)間分為2個相鄰區(qū)間,每個區(qū)間對應一個離散的屬性值,該劃分一直進行下去,直到滿足停止條件??ǚ椒至阉惴ǖ年P鍵在于劃分點的選取,因此置信水平的確定十分重要,檢驗的置信水平值太高可能導致過分離散化,而置信水平值太低則可能導致離散化不足,通常置信水平值設在0.01~0.10范圍內(nèi)。選取合適的置信水平值之后,就可以得到條件特征量的離散區(qū)間形如表 1 所示。表中 I1、I2、I3、…、Ua1、Ua2、Ua3、…、Ub1、Ub2、Ub3、… 、Uc1、Uc2、Uc3、… 可 能 相 等 ,也 可 能不等。
表1 條件特征離散區(qū)間Table 1 Discrete intervals of conditional features
然后再對每一個離散區(qū)間引入一個二元屬性。經(jīng)過數(shù)據(jù)布爾離散化處理后將連續(xù)型數(shù)值映射到布爾型數(shù)值上,滿足關聯(lián)規(guī)則挖掘?qū)l件特征數(shù)據(jù)類型的要求后,開始關聯(lián)規(guī)則的挖掘。
利用關聯(lián)規(guī)則可以對數(shù)據(jù)間的關系(相似性、特征性、差異、依賴、趨勢、反常等)進行建模和描述,挖掘數(shù)據(jù)項中有意義的規(guī)律[5]。
關聯(lián)規(guī)則挖掘的對象一般是事務數(shù)據(jù)集。關聯(lián)規(guī)則可定義為:設 T={t1,t2,…,tk,…,tm}為事務數(shù)據(jù)庫,tk為 T 中的第 k 件事務,I={i1,i2,…,ik}是二元屬性的集合,其中的元素稱為項,記D為樣本集合T,對任意k,tk?I;X與Y是I的子集,X∩Y= ,在事務數(shù)據(jù)集中尋找X與Y的關聯(lián)關系,關聯(lián)關系記為X?Y[6]。
關聯(lián)規(guī)則里有2個重要概念:支持度和置信度。支持度表示X和Y這一事件組合在總事務記錄中出現(xiàn)的概率,置信度是指出現(xiàn)了項集X的事務中X和Y這一事件組合出現(xiàn)的概率。
支持度的計算公式為:
置信度的計算公式為:
關聯(lián)規(guī)則挖掘的目的在于挖掘出可信且有意義的規(guī)則。最小支持度Smin和最小置信度Cmin規(guī)定了支持度和置信度的閾值[7],只有達到這2個閾值時才是強關聯(lián)規(guī)則。
Apriori算法[19]是一種最有影響的挖掘布爾關聯(lián)規(guī)則的頻繁項集算法,其核心思想是通過候選集生成和情節(jié)的向下封閉檢測這2個階段來挖掘頻繁項集,然后再由頻繁項集產(chǎn)生強關聯(lián)規(guī)則。挖掘頻繁項集主要分兩步。
a.連接步:首先簡單統(tǒng)計所有含一個元素的項集出現(xiàn)的頻率,并找出那些不小于最小支持度的項集,即一維頻繁項集,然后開始循環(huán)處理根據(jù)第k-1步生成的k-1維最大項集產(chǎn)生k維侯選項集,計算得到侯選項集的項集支持度,將其與最小支持度比較,從而找到k維最大頻繁項集。
b.剪枝步:根據(jù)情節(jié)的向下封閉性,即如果一個項集的子集不是頻繁項集,則該項集肯定也不是頻繁項集來刪除非頻繁項集。
鑒于采集設備和通信通道的有限性,并不是所有電力用戶的數(shù)據(jù)都能被存儲,目前用戶信息采集系統(tǒng)只采集中高壓用戶和低壓大用戶的用電數(shù)據(jù),所以用戶層級的數(shù)據(jù)項集出現(xiàn)的頻率較低,這些不頻繁出現(xiàn)在數(shù)據(jù)集里的項即被稱為稀有項。當最小支持度閾值設置得過高時,就不能挖掘到有關這部分數(shù)據(jù)項集的強關聯(lián)規(guī)則,但當最小支持度閾值設置得太低時,又會出現(xiàn)大量無用的關聯(lián)規(guī)則[13]。因此,利用統(tǒng)一的最小支持度進行整個數(shù)據(jù)集的關聯(lián)規(guī)則挖掘是不合理的。
針對配用電信息系統(tǒng)的實際情況,本文提出采用MSApriori算法來解決該問題。在MSApriori算法中,定義數(shù)據(jù)集合里的每一項都有其獨有的最小支持度,記為MIS(i),項集的最小支持度由其包含的項的最小支持度表示,記為MS(A),規(guī)則的最小支持度由其所包含項集的最小支持度表示[13]。在該定義下,MSApriori算法仍然采用Apriori算法逐級迭代的方式尋找頻繁項集,只不過為了保持Apriori算法的向下封閉性,需要對項集按最小項支持度從小到大進行排序[17]。因此,MSApriori算法可以在配用電信息系統(tǒng)數(shù)據(jù)采集頻率不一致的情況下挖掘到有用的規(guī)則。
此外,為挖掘到配電網(wǎng)運行人員感興趣的規(guī)則,本文只篩選結果特征為含有分支線斷線不接地故障的規(guī)則。
隨著樣本數(shù)據(jù)集的不斷增大,所生成的關聯(lián)規(guī)則數(shù)量也不斷增多,會產(chǎn)生大量無秩序且冗余的規(guī)則,而電網(wǎng)運行人員很難對這些規(guī)則進行分析和應用。如規(guī)則 R1為(a1,a2) b1(Smin=10%,Cmin=80%),規(guī)則 R2為(a1,a2,a3) b1(Smin=10%,Cmin=82%),顯然后一個規(guī)則并沒有比前一個規(guī)則提供更多的有用信息,只是由于隨機波動導致置信度的提高[19],因此規(guī)則R2是冗余規(guī)則。為了有效保留有用規(guī)則,同時便于電網(wǎng)運行人員利用關聯(lián)規(guī)則作出決策,需要對規(guī)則集進一步處理,比如合并相似規(guī)則以及刪除冗余規(guī)則。
本文采用kulc準則來刪除冗余規(guī)則。kulc準則中的kulc系數(shù)被用來對2個置信度做平均處理,即:
其中,confidence(A B)表示規(guī)則A B的置信度;confidence(B A)表示規(guī)則B A的置信度。
當規(guī)則的條件特征增加時,如果kulc系數(shù)沒有增大,則可以認為條件特征和結果特征相關關系沒有增強,該規(guī)則是冗余規(guī)則。在處理后的規(guī)則集中,滿足最小支持度和最小置信度且規(guī)則形式最精簡的規(guī)則可以被認為是代表規(guī)則。隨著規(guī)則條件特征的增加,規(guī)則的置信度得到了有效提高,則認為該規(guī)則是代表規(guī)則的后裔規(guī)則。每條代表規(guī)則和其所有后裔規(guī)則形成代表規(guī)則家族[21],這些代表家族構成完整的診斷規(guī)則集。
代表規(guī)則家族形式如下:
其中,G1為斷線故障類型;m3>m2>m1。
基于配用電數(shù)據(jù)的關聯(lián)規(guī)則挖掘過程如圖1所示。
圖1 關聯(lián)規(guī)則挖掘流程圖Fig.1 Flowchart of association rule mining
基于關聯(lián)規(guī)則挖掘的斷線故障診斷流程如圖2所示。
圖2 基于關聯(lián)規(guī)則挖掘的斷線故障診斷流程Fig.2 Flowchart of open-line fault diagnosis based on association rule mining
來自調(diào)度SCADA系統(tǒng)/EMS和配電網(wǎng)DSCADA系統(tǒng)/DMS的電網(wǎng)運行實時數(shù)據(jù)及歷史數(shù)據(jù)、配電自動化系統(tǒng)的遙信、遙控、遙測和遙調(diào)數(shù)據(jù)、用戶用電信息采集系統(tǒng)的負荷數(shù)據(jù)、配變負荷監(jiān)測系統(tǒng)的桿變和配變數(shù)據(jù)、氣象信息系統(tǒng)數(shù)據(jù)等通過統(tǒng)一接口接入數(shù)據(jù)庫。數(shù)據(jù)經(jīng)過選擇和預處理后存入數(shù)據(jù)倉庫。模型庫和知識庫存關聯(lián)規(guī)則挖掘所得的模型和規(guī)則,它們可以相互共享與調(diào)用。以候選條件特征量為基礎,通過關鍵條件特征量選擇和數(shù)據(jù)布爾離散化來建立關聯(lián)規(guī)則診斷模型,采用合適的關聯(lián)規(guī)則算法從歷史數(shù)據(jù)中提煉得到分支線斷線不接地故障的關聯(lián)規(guī)則集,以此規(guī)則集作為分支線斷線不接地故障診斷的判據(jù)。
根據(jù)采集的歷史數(shù)據(jù),利用離線挖掘出的規(guī)則確定當前情況下的故障類型以及規(guī)則置信度,用于指導運行人員及時發(fā)現(xiàn)故障。圖2在線診斷模塊具體步驟如下。
a.實時讀入10 kV饋線和饋線分支線上所有配電變壓器以及配電變壓器上所連用戶的運行和負荷數(shù)據(jù)。
b.根據(jù)RELIEF算法選出的數(shù)據(jù)關鍵特征處理原始數(shù)據(jù)得到關鍵條件特征。
c.將步驟b結果與歷史數(shù)據(jù)挖掘的關聯(lián)規(guī)則中的條件特征進行匹配。為了縮小步驟a中的實時數(shù)據(jù)量,提高診斷速度,優(yōu)先匹配饋線電流規(guī)則。如果未找到合適的規(guī)則進行匹配且出現(xiàn)了新的分支線斷線不接地故障情況,則視為稀有故障,按照圖1方法新增稀有故障的規(guī)則。需要注意的是,每次挖掘到新的規(guī)則后,需要更新規(guī)則集。
本文利用華東某地區(qū)近兩年的配用電信息系統(tǒng)數(shù)據(jù)進行中壓配電網(wǎng)分支線斷線不接地故障診斷的算例分析。10 kV饋線數(shù)據(jù)來自配電網(wǎng)調(diào)度自動化系統(tǒng)和配電自動化系統(tǒng),10 kV變壓器數(shù)據(jù)來自配變負荷監(jiān)測系統(tǒng),中高壓用戶和低壓大用戶數(shù)據(jù)來自用戶信息采集系統(tǒng)。經(jīng)過篩選后得到近兩年該地區(qū)的320條歷史記錄,以此建立含300條記錄的挖掘庫和含20條記錄的測試庫。鑒于多相斷線故障發(fā)生的情況極少,歷史故障數(shù)據(jù)也較少,因此只考慮單相斷線故障。挖掘庫中包含100條分支線斷線不接地故障記錄、100條分支線斷線接地故障記錄和100條無故障運行記錄。挖掘庫和測試庫兩者結構完全一致,區(qū)別在于挖掘庫包含故障類型信息,用于通過挖掘來獲取規(guī)則,而測試庫不包含故障類型信息,用于檢驗規(guī)則的有效性。
以式(1)最后確定的32個特征量作為數(shù)據(jù)的條件候選特征,考慮到發(fā)生單相斷線故障后,兩非故障相變化幅度相似,因此把兩相合為一相計算。
利用RELIEF算法得到的這些特征的權重如表2所示。
表2 基于RELIEF算法的特征權重Table 2 Feature weights calculated by RELIEF algorithm
根據(jù)表2所示的結果,選取重要性相似即權重相似的條件特征量作為關鍵特征量,其中序號1—7的候選特征權重都在0.1左右,因此選擇這7個候選特征。
取挖掘庫中的一條歷史記錄為例,具體說明物理含義,有名值樣本如表3所示。
不斷地在0.01~0.10之間修改置信水平,以進行交互式挖掘,最終將置信水平值設為0.08。由于非故障相特征量權重基本相同,數(shù)據(jù)變化幅度基本相同,因此只需取一相進行數(shù)據(jù)離散化,最終得到各關鍵特征量的離散化分段區(qū)間如表4所示。
表3 挖掘庫中的某有名值樣本Table 3 An actual sample in mining database
表4 特征量離散化結果Table 4 Results of characteristic variable discretization
在挖掘庫中增加50條不良記錄,用于模擬故障記錄中的信息丟失、信息錯誤和冗余信息,檢驗程序的健壯性。挖掘關聯(lián)規(guī)則的各種算法的輸出結果如表5所示,其中情況1為300條良好故障記錄,情況2、3、4是在情況1的基礎上分別增加50條部分信息丟失故障記錄、50條錯誤信息故障記錄和50條冗余信息故障記錄。根據(jù)各項出現(xiàn)頻率及其他屬性,設定最小項支持度,通過修改閾值進行交互式挖掘,以確定合適的閾值。在該算例中,確定的適合閾值如下:Apriori算法中的最小支持度為6%,最小置信度為75%;在MSApriori算法中設定用戶非故障相電流變化率和用戶故障相電流變化率最小支持度為0.3%,其他條件特征最小支持度為6%,最小置信度為75%。關聯(lián)規(guī)則挖掘結果如表5所示。
從表5可以看出,利用MSApriori算法與kulc準則結合使挖掘結果中的冗余規(guī)則大幅減少,提高了挖掘效率和準確度。挖掘結果中的代表規(guī)則家族部分如下所示。
表5 包含不良數(shù)據(jù)的挖掘結果對比Table 5 Comparison of data mining results,including bad data
(1)代表規(guī)則家族 1。
a.當饋線相電流落在區(qū)間(0,0.800)時,發(fā)生分支線斷線不接地故障的置信度為77.52%。
b.當饋線相電流落在區(qū)間(0,0.800)、用戶故障相電流變化率落在(0.809,192.302)時,發(fā)生分支線斷線不接地故障的置信度為92.59%。
c.當饋線相電流落在區(qū)間(0,0.800)、用戶故障相電流變化率落在區(qū)間(0.809,192.302)、配變故障相電壓落在區(qū)間(0,0.487)時,發(fā)生分支線斷線不接地故障的置信度為100%。
(2)代表規(guī)則家族 2。
a.當配變故障相電流變化率落在區(qū)間(0.980,150.175)時,發(fā)生分支線斷線不接地故障的置信度為83.69%。
b.當配變故障相電流變化率落在區(qū)間(0.980,150.175)、配變非故障相電壓落在區(qū)間(0.434,0.732)時,發(fā)生分支線斷線不接地故障的置信度為87.89%。
c.當配變故障相電流變化率落在區(qū)間(0.980,150.175)、配變非故障相電壓落在區(qū)間(0.434,0.732)、配變非故障相電流變化率落在區(qū)間(0.826,52.473)時,發(fā)生分支線斷線不接地故障的置信度為92.59%。
d.當配變故障相電流變化率落在區(qū)間(0.980,150.175)、配變非故障相電壓落在區(qū)間(0.434,0.732)、配變非故障相電流變化率落在區(qū)間(0.826,52.473)、饋線相電流落在區(qū)間(0,0.800)時,發(fā)生分支線斷線不接地故障的置信度為100%。
利用MSApriori算法產(chǎn)生的診斷規(guī)則對測試庫的故障記錄進行判斷,考慮到測試庫中的數(shù)據(jù)都是目前配用電信息系統(tǒng)能夠采集到的數(shù)據(jù)記錄,因此將測試庫的數(shù)據(jù)看作實時數(shù)據(jù)。在進行關鍵特征量選取時,故障前后變化較為劇烈的條件特征量認為是故障相特征量,變化較為平緩的認為是非故障相特征量。診斷結果如下。
(1)診斷結果 1。
a.配變故障相電流變化率為66.51667,配變非故障相電壓為0.677。
b.關聯(lián)規(guī)則:分支線斷線不接地故障的置信度為87.89%。
c.診斷結果:分支線斷線不接地故障,診斷正確。
(2)診斷結果 2。
a.饋線相電流為0.391842,用戶故障相電流變化率為24.04971。
b.關聯(lián)規(guī)則:分支線斷線不接地故障的置信度為92.59%。
c.診斷結果:分支線斷線故障,診斷正確。
(3)診斷結果 3。
a.配變故障相電流變化率為110.6467,配變非故障相電流變化率為51.07875。
b.關聯(lián)規(guī)則:分支線斷線不接地故障的置信度為7.81%。
c.診斷結果:分支線斷線接地故障,診斷錯誤。
診斷結果4—19省略。
(20)診斷結果 20。
a.配變故障相電流變化率為61.74333,配變非故障相電流變化率為76.01971,配變非故障相電壓為0.44003。
b.關聯(lián)規(guī)則:分支線斷線不接地故障的置信度為87.89%。
c.診斷結果:分支線斷線不接地故障,診斷正確。
由診斷結果3可知,當實時數(shù)據(jù)采集不全時,故障診斷的準確性受到很大影響,因此在線數(shù)據(jù)采集的充分性和準確性尤為重要。
在實時數(shù)據(jù)采集準確的基礎上,在線診斷測試結果表明診斷規(guī)則的匹配率達到90%以上,并且在線診斷過程較為簡單,計算速度很快,如果實時數(shù)據(jù)采集頻率高、數(shù)據(jù)量大,可以采用并行計算的方法提高規(guī)則匹配速度。同時如果需要考慮新的斷線故障類型,可以在線進行斷線故障規(guī)則挖掘,該挖掘庫的規(guī)則挖掘僅用時2.3 s,滿足在線診斷的速度要求。在將挖掘庫的數(shù)據(jù)看作歷史數(shù)據(jù)、測試庫的數(shù)據(jù)看作實時數(shù)據(jù)的條件下,對測試庫的有效診斷表明,本文的方法適用于實時斷線故障診斷,可以為電網(wǎng)運行人員及早發(fā)現(xiàn)斷線故障提供參考。
在發(fā)生斷線不接地故障特別是分支線斷線故障后,由于電流、電壓的變化幅度較小,保護不能及時動作,調(diào)度也不能收到告警信號,因此本文提出了一種利用配用電數(shù)據(jù)之間關聯(lián)關系進行關聯(lián)規(guī)則挖掘的分支線斷線不接地故障診斷方法,將故障后電流、電壓隱藏的變化特征以一種顯性的、相對直接的關聯(lián)規(guī)則集的方式表現(xiàn)出來,以此作為調(diào)度運行人員診斷此類故障的參考依據(jù)。結合關聯(lián)規(guī)則算法和配用電信息系統(tǒng)輸出數(shù)據(jù)的特點,通過以下3個環(huán)節(jié)提高了診斷的準確性:
a.候選條件特征里的弱相關特征在很大程度上影響著最終規(guī)則集的準確與否,利用RELIEF算法篩選出具有相似重要性的特征量;
b.將連續(xù)型特征量進行布爾離散化后再進行關聯(lián)規(guī)則分析,以此得到的規(guī)則能更準確地表述出該故障類型與特征量的值的關系;
c.通過采用MSApriori算法充分考慮了用戶層級條件特征出現(xiàn)頻率低的特點,因此能挖掘到有效的診斷規(guī)則。
仿真結果表明,經(jīng)由上述3個環(huán)節(jié)完善后的斷線故障診斷方法精度高且具有較高的容錯性。
但是也需要注意以下2點。
a.由于斷線故障相較于短路故障發(fā)生的概率較小,導致歷史數(shù)據(jù)有限。如果挖掘庫樣本量越大,能夠診斷的故障模式越多,則挖掘到的關聯(lián)規(guī)則越準確。
b.數(shù)據(jù)挖掘方法是一個不斷反饋的過程,當網(wǎng)絡結構發(fā)生變化時,需要重新積累歷史數(shù)據(jù),挖掘新的規(guī)則,只有獲取足夠多新的挖掘庫樣本時,才可以進行新的分析。
參考文獻:
[1]朱玲玲,張華中,王正剛,等.基于小波神經(jīng)網(wǎng)絡單相斷線故障選線和定位[J].電力系統(tǒng)保護與控制,2011,39(4):12-17.ZHU Lingling,ZHANG Huazhong,WANG Zhenggang,et al.Singlephase open-line fault selection and location based on wavelet neural networks[J].Power System Protection and Control,2011,39(4):12-17.
[2]尤毅,劉東,李亮,等.基于負荷監(jiān)測儀的10kV架空線單相斷線不接地故障區(qū)域判定[J].電力系統(tǒng)保護與控制,2012,40(19):144-149.YOU Yi,LIU Dong,LI Liang,et al.Detection method based on load monitoring for 10 kV overhead line single-phase ungrounded open fault area[J].Power System Protection and Control,2012,40(19):144-149.
[3]屈剛,李長凱.配電網(wǎng)架空線路斷線故障定位[J].電力自動化設備,2005,25(12):35-38.QU Gang,LI Changkai.Faultlocatingofnon-groundingline break in distribution network[J].Electric Power Automation E-quipment,2005,25(12):35-38.
[4]俞恩科,薛永端,李世強,等.斷線故障行波測距分析[J].電氣應用,2015,34(3):121-125.YU Enke,XUE Yongduan,LI Shiqiang,et al.Analysis of fault traveling wave fault location[J].Engineering Design,2015,34(3):121-125.
[5]李博通,李永麗,李洪波,等.同桿雙回線斷線故障復合序網(wǎng)分析法[J].電力系統(tǒng)自動化,2010,34(9):76-80.LI Botong,LI Yongli,LI Hongbo,et al.New method for break-conductor fault analysis on double-circuit transmission lines based on interconnection of sequence networks[J].Automation of Electric Power Systems,2010,34(9):76-80.
[6]李再華,白曉民,周子冠,等.基于特征挖掘的電網(wǎng)故障診斷方法[J]. 中國電機工程學報,2010,30(10):16-22.LI Zaihua,BAI Xiaomin,ZHOU Ziguan,et al.Method of power grid fault diagnosis based on feature mining[J].Proceedings of the CSEE,2010,30(10):16-22.
[7]聶倩雯,高瑋.基于關聯(lián)規(guī)則數(shù)據(jù)挖掘技術的電網(wǎng)故障診斷[J].電力系統(tǒng)保護與控制,2009,37(9):8-14,19.NIE Qianwen,GAO Wei.A power network fault diagnosis method based on data mining association rules[J].Power System Protection and Control,2009,37(9):8-14,19.
[8]鄭元兵,孫才新,李劍,等.變壓器故障特征量可信度的關聯(lián)規(guī)則分析[J].高電壓技術,2012,38(1):82-88.ZHENG Yuanbing,SUN Caixin,LI Jian,et al.Association rule analysis on confidence of features for transformer faults[J].High Voltage Enigneering,2012,38(1):82-88.
[9]謝龍君,李黎,程勇,等.融合集對分析和關聯(lián)規(guī)則的變壓器故障診斷方法[J].中國電機工程學報,2015,35(2):277-286.XIE Longjun,LI Li,CHENG Yong,et al.A fault diagnosis method of power transformers by integrated set pair analysis and association rules[J].Proceedings of the CSEE,2015,35(2):277-286.
[10]馬騰.10 kV配電線路斷線故障檢測與定位研究[D].濟南:山東大學,2013.MA Teng.Line-break fault detection and location of 10 kV distribution line[D].Ji’nan:Shandong University,2013.
[11]沈海濱,陳維江,王頌虞,等.10 kV架空線路雷擊斷線故障的模擬試驗研究[J].電網(wǎng)技術,2011,35(1):117-121.SHEN Haibin,CHEN Weijiang,WANG Songyu,et al.Simulation tests on lightning stroke-caused wire-breakage of 10 kV overhead transmission line[J].Power System Technology,2011,35 (1):117-121.
[12]張沛超,譚嘯風,楊珮鑫.孤島檢測的關鍵特征識別及元學習方法[J].電力系統(tǒng)自動化,2014,38(18):72-78.ZHANG Peichao,TAN Xiaofeng,YANG Peixin.Critical feature identification and meta-learning method for islanding detection[J].Automation of Electric Power Systems,2014,38 (18):72-78.
[13]張小利.多最小支持度關聯(lián)規(guī)則挖掘的研究與應用[D].西安:西北大學,2005.ZHANG Xiaoli.Researches and applications on association rules mining with multiple minimum supports[D].Xi’an:Northwest University,2005.
[14]SUN Y,LI J.Iterative RELIEF for feature weighting[C]∥Proceedingsofthe 23rd InternationalConference on Machine Learning.[S.l.]:ACM,2006:913-920.
[15]梁紅旗.數(shù)值屬性離散化方法研究[J].信息技術,2008,10(5):99-101.LIANG Hongqi.Research on the discretization methods for numerical attributes [J].Information Technology,2008,10(5):99-101.
[16]趙靜嫻,倪春鵬,詹原瑞,等.一種高效的連續(xù)屬性離散化算法[J].系統(tǒng)工程與電子技術,2009,31(1):195-199.ZHAO Jingxian,NI Chunpeng,ZHAN Yuanrui,et al.Efficient discretization algorithm forcontinuousattributes[J].Systems Engineering and Electronics,2009,31(1):195-199.
[17]李建強,劉吉臻,張欒英,等.基于數(shù)據(jù)挖掘的電站運行優(yōu)化應用研究[J]. 中國電機工程學報,2006,26(20):118-123.LI Jianqiang,LIU Jizhen,ZHANG Luanying,et al.Rule mining in power plant operation optimization[J].Proceedings of the CSEE,2006,26(20):118-123.
[18]鄭元兵,孫才新,李劍,等.變壓器故障特征量可信度的關聯(lián)規(guī)則分析[J].高電壓技術,2012,38(1):82-88.ZHENG Yuanbing,SUN Caixin,LI Jian,et al.Association rule analysis on confidence of features for transformer faults[J].High Voltage Engineering,2012,38(1):82-88.
[19]趙洪英,蔡樂才,李先杰.關聯(lián)規(guī)則挖掘的Apriori算法綜述[J].四川理工學院學報(自然科學版),2011,24(1):66-70.ZHAO Hongying,CAI Lecai,LI Xianjie.Overview of association rules apriori mining algorithm[J].Journal of Sichuan University of Science& Engineering(Natural Science Edition),2011,24(1):66-70.
[20]LIU B,HSU W,MA Y.Mining association rules with multiple minimum supports [C]∥Proceedings of the fifth ACM SIGKDD InternationalConference on Knowledge Discovery and Data Mining.[S.l.]:ACM,1999:337-341.
[21]鄒翔,王清毅,肖明軍,等.電力調(diào)度數(shù)據(jù)挖掘后處理方法的研究[J].小型微型計算機系統(tǒng),2003,24(6):1054-1057.ZOU Xiang,WANG Qingyi,XIAO Mingjun,et al.Research on post-processing of data mining for electric power dispatching[J].Mini-micro Systems,2003,24(6):1054-1057.