彭生剛 李吉德
1.平度供電公司 山東 青島 266700;2長(zhǎng)島供電公司 山東 煙臺(tái) 265812
SCADA系統(tǒng)收集了兩類(lèi)量測(cè)數(shù)據(jù),一類(lèi)是遙測(cè)量,如有功、無(wú)功、電壓等;另一類(lèi)就是遙信量,也就是開(kāi)關(guān)的狀態(tài)。根據(jù)開(kāi)關(guān)量的狀態(tài),進(jìn)行網(wǎng)絡(luò)拓?fù)浞治龊?,將結(jié)線方式的實(shí)際情況反映給調(diào)度員。在實(shí)時(shí)情況下,為調(diào)度員提供正確的網(wǎng)絡(luò)結(jié)構(gòu)是十分重要的,而正確的網(wǎng)絡(luò)拓?fù)涫墙⒃谡_的開(kāi)關(guān)遙信的基礎(chǔ)上的,在實(shí)際系統(tǒng)中,遙信抖動(dòng)和誤動(dòng)時(shí)有發(fā)生,主要原因有:一次或二次設(shè)備本身的原因,各種干擾,遠(yuǎn)動(dòng)裝置本身或調(diào)度端采集處理軟件的原因。
現(xiàn)有的軟件很多對(duì)遙信錯(cuò)誤缺少必要的分析,對(duì)于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的分析,更多的是依靠運(yùn)行人員的經(jīng)驗(yàn)來(lái)判斷遙信量的正確與否,這就對(duì)于結(jié)果的正確性帶來(lái)很大的不確定性。所以當(dāng)電網(wǎng)的采集系統(tǒng)中出現(xiàn)開(kāi)關(guān)遙信錯(cuò)誤時(shí),而運(yùn)行人員判斷又有誤時(shí),將影響到狀態(tài)估計(jì)結(jié)果的正確性,可能使得狀態(tài)估計(jì)計(jì)算不能收斂,并進(jìn)一步影響以后的分析(如安全分析,潮流調(diào)度等)。而且自從電力市場(chǎng)在各國(guó)開(kāi)展以后,狀態(tài)估計(jì)作為獨(dú)立系統(tǒng)操作員(ISO)的實(shí)時(shí)監(jiān)控工具越來(lái)越變得重要。因此一個(gè)正確的網(wǎng)絡(luò)拓?fù)浔孀R(shí)對(duì)于電力系統(tǒng)分析運(yùn)行產(chǎn)生重要的影響[1-3]。
本文提出了一種新的基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)拓?fù)浔孀R(shí)方法,利用SCADA系統(tǒng)所保存的大量歷史遙測(cè)及遙信數(shù)據(jù)進(jìn)行關(guān)聯(lián)挖掘,得到各開(kāi)關(guān)狀態(tài)的變化與那些量有關(guān),從而根據(jù)此關(guān)系辨識(shí)出正確的開(kāi)關(guān)狀態(tài)。文章首先對(duì)歷史數(shù)據(jù)進(jìn)行了預(yù)處理,然后用挖掘關(guān)聯(lián)規(guī)則的方法—Apriori算法對(duì)處理的數(shù)據(jù)挖掘計(jì)算,通過(guò)設(shè)置最小信任度閥值,計(jì)算各個(gè)開(kāi)關(guān)動(dòng)作的變化與那些支路潮流的變化及開(kāi)關(guān)變化是強(qiáng)關(guān)聯(lián)的,這樣就得到辨識(shí)開(kāi)關(guān)狀態(tài)的規(guī)則。
SCADA系統(tǒng)中所保存的歷史數(shù)據(jù)只是反映每個(gè)斷面的數(shù)據(jù),不能反映每次開(kāi)關(guān)動(dòng)作所發(fā)生的情況,而文章所要辨識(shí)的是開(kāi)關(guān)狀態(tài)的變化。在開(kāi)關(guān)狀態(tài)沒(méi)有發(fā)生變化,而且負(fù)荷也沒(méi)有發(fā)生很大改變的情況下是不需要辨識(shí)的,因?yàn)槲覀兗俣ㄔ诎l(fā)生變化的前一時(shí)段網(wǎng)絡(luò)的拓?fù)錉顟B(tài)是正確的。
數(shù)據(jù)庫(kù)中所保存的數(shù)據(jù)形式一般如下:
其中1代表開(kāi)關(guān)是合的,0代表是開(kāi)的,Pij,Qij代表線路的有功及無(wú)功。Pi,Qi代表節(jié)點(diǎn)的注入有功無(wú)功。
對(duì)數(shù)據(jù)庫(kù)中開(kāi)關(guān)前后發(fā)生動(dòng)作的數(shù)據(jù)進(jìn)行整理,形成如式(2)的形式。如果第一個(gè)開(kāi)關(guān)發(fā)生動(dòng)作,從合到開(kāi),第二個(gè)開(kāi)關(guān)從開(kāi)到合,則前后兩個(gè)斷面的數(shù)據(jù)如下:從合到開(kāi)以X表示,從開(kāi)到合以Y來(lái)表示,狀態(tài)沒(méi)有變化,則以Z來(lái)表示,則(2)式可轉(zhuǎn)化為(3)式的形式,其中共有m個(gè)開(kāi)關(guān)。
關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的重要研究方向。挖掘關(guān)聯(lián)規(guī)則就是從給定的數(shù)據(jù)集中搜索數(shù)據(jù)項(xiàng)之間所存在的價(jià)值聯(lián)系。
設(shè)I={i1,i2,…,im}為數(shù)據(jù)項(xiàng)集合,本文主要是Xi、Yi、Zi、|ΔPij|等,D為與任務(wù)相關(guān)的數(shù)據(jù)集合,也就是SCADA系統(tǒng)所采集到的遙測(cè)和遙信量經(jīng) (3)式轉(zhuǎn)化后的數(shù)據(jù)集合。因?yàn)樽詈笏璧囊?guī)則是通過(guò)對(duì)潮流變化的大小及周?chē)拈_(kāi)關(guān)狀態(tài)來(lái)判斷此開(kāi)關(guān)的狀態(tài), 所以對(duì)于|ΔPij|、|ΔQij|及|ΔPi|、|ΔQi|設(shè)置一個(gè)閥值,只有大于此閥值的項(xiàng),才作為其中的數(shù)據(jù)項(xiàng)。閥值取多大合適,一是根據(jù)網(wǎng)絡(luò)的結(jié)構(gòu)及負(fù)荷水平,二是根據(jù)實(shí)際運(yùn)行人員的經(jīng)驗(yàn)。一個(gè)有經(jīng)驗(yàn)的運(yùn)行人員通過(guò)分析開(kāi)關(guān)發(fā)生變化前后支路上的潮流變化以及目前的潮流及開(kāi)關(guān)狀態(tài)的關(guān)系,就可以判斷出目前的遙信量正確與否。其中每次開(kāi)關(guān)狀態(tài)發(fā)生變化后所轉(zhuǎn)化的式子 (3)就是一個(gè)數(shù)據(jù)項(xiàng)子集,記為T(mén),即T?I。一個(gè)關(guān)聯(lián)規(guī)則具有如下的形式:A?B,其中A?I,B?I且A∩B=Φ。如果規(guī)則在數(shù)據(jù)集D中成立,它必需滿足最小支持度和最小信任度,只有這樣的關(guān)聯(lián)規(guī)則才是所需要的強(qiáng)規(guī)則。
支持度:在數(shù)據(jù)集D中有一定比例的數(shù)據(jù)項(xiàng)T包含A∪B數(shù)據(jù)項(xiàng)。
信任度:在數(shù)據(jù)集D中有一定比例的數(shù)據(jù)項(xiàng)T滿足“若包含A就包含B條件”。
具體描述如下:
一個(gè)數(shù)據(jù)項(xiàng)的集合稱為項(xiàng)集,一個(gè)包含k個(gè)數(shù)據(jù)項(xiàng)的項(xiàng)集稱為k項(xiàng)集。一個(gè)項(xiàng)集的出現(xiàn)頻度就是整個(gè)交易數(shù)據(jù)集D中包含該項(xiàng)集的交易記錄數(shù)據(jù);這也稱之為該項(xiàng)集的支持度。而若一個(gè)項(xiàng)集的出現(xiàn)頻度大于最小支持度閥值乘以總的數(shù)據(jù)集D的記錄數(shù),那么就稱該項(xiàng)集滿足最小支持度閥值;而滿足最小支持度閥值所對(duì)應(yīng)的記錄數(shù)就稱為最小支持頻度。滿足最小支持閥值的項(xiàng)集就稱為頻繁k-項(xiàng)集。所有頻繁項(xiàng)集的集合就記為L(zhǎng)k。
挖掘關(guān)聯(lián)規(guī)則主要包含以下兩個(gè)步驟:
步驟一:發(fā)現(xiàn)所有頻繁項(xiàng)集,根據(jù)定義,這些項(xiàng)集的頻度至少應(yīng)等于最小支持頻度。
步驟二:根據(jù)所獲得的頻繁項(xiàng)集,產(chǎn)生相應(yīng)的強(qiáng)關(guān)聯(lián)規(guī)則。根據(jù)定義這些規(guī)則必須滿足最小信任度閥值。
Apriori算法是挖掘產(chǎn)生關(guān)聯(lián)規(guī)則所需頻繁項(xiàng)集的基本算法。該算法利用了一個(gè)層次順序搜索的循環(huán)方法來(lái)完成頻繁項(xiàng)集的挖掘工作。這一循環(huán)方法就是利用k-項(xiàng)集來(lái)產(chǎn)生(k+1)-項(xiàng)集。具體做法就是:首先找出頻繁1-項(xiàng)集,記為L(zhǎng)1;然后利用L1來(lái)挖掘L2,即頻繁2-項(xiàng)集;不斷如此循環(huán)下去直到無(wú)法發(fā)現(xiàn)更多的頻繁k-項(xiàng)集為止。每挖掘一層Lk就需要掃描整個(gè)數(shù)據(jù)庫(kù)一遍。
在挖掘過(guò)程,為了提高按層次搜索并產(chǎn)生相應(yīng)頻繁項(xiàng)集的處理效率,算法用到了下列一個(gè)幫助有效縮小頻繁項(xiàng)集的搜索空間的性質(zhì):一個(gè)頻繁項(xiàng)集中任一子集也是頻繁項(xiàng)集。也即若一個(gè)項(xiàng)集I不滿足最小支持度閥值s,那么該項(xiàng)集I就不是頻繁項(xiàng)集,即P(I)<s;若增加一個(gè)項(xiàng)A到項(xiàng)集中,那么所獲得的新項(xiàng)集I∪A在數(shù)據(jù)集合D所出現(xiàn)的次數(shù)也不可能多于原項(xiàng)集I出現(xiàn)的次數(shù),因此I∪A也不可能是頻繁的,即P(I∪A)<s。
從數(shù)據(jù)庫(kù)D中挖掘出所有的頻繁集后,就可以較為容易得到所需的關(guān)聯(lián)規(guī)則。要產(chǎn)生滿足最小支持度和最小信任度的強(qiáng)關(guān)聯(lián)規(guī)則,可以利用公式(6)來(lái)計(jì)算所獲關(guān)聯(lián)規(guī)則的信任度。
其中,Support_count(A∪B)為包含項(xiàng)集A∪B的記錄數(shù)目;Support_count(A)為包含項(xiàng)集A的記錄數(shù)目。
根據(jù)電力網(wǎng)絡(luò)本身的特性,最后網(wǎng)絡(luò)辨識(shí)所需的規(guī)則形式如下:
其中i≠j,(7)式所表示的物理意義:通過(guò)其它相關(guān)開(kāi)關(guān)狀態(tài)的變化、支路潮流及負(fù)荷變化的大小來(lái)判斷開(kāi)關(guān)狀態(tài)的變化。通過(guò)此規(guī)則,根據(jù)和此開(kāi)關(guān)狀態(tài)變化強(qiáng)相關(guān)支路潮流的變化及其它開(kāi)關(guān)的狀態(tài)變化就可以得到所要辨識(shí)開(kāi)關(guān)的狀態(tài)變化,從而可得到正確的開(kāi)關(guān)狀態(tài),因?yàn)槲覀兗俣ㄇ耙粫r(shí)刻的開(kāi)關(guān)狀態(tài)已經(jīng)辨識(shí),是正確的。
最小支持度閥值和最小信任度閥值根據(jù)網(wǎng)絡(luò)自身的特點(diǎn)以及實(shí)際的經(jīng)驗(yàn)來(lái)設(shè)定??赡芤婚_(kāi)始,由于缺少實(shí)際的運(yùn)行經(jīng)驗(yàn),所定的最小支持度閥值和最小信任度閥值或者太大或過(guò)小,從而造成所形成的規(guī)則在辨識(shí)網(wǎng)絡(luò)開(kāi)關(guān)狀態(tài)時(shí)產(chǎn)生一定的誤差。但隨著經(jīng)驗(yàn)的增加,通過(guò)對(duì)最小閥值的不斷調(diào)整,就可以得到能正確判斷網(wǎng)絡(luò)開(kāi)關(guān)狀態(tài)的關(guān)聯(lián)規(guī)則。
1)當(dāng)網(wǎng)絡(luò)的負(fù)荷水平不一樣的時(shí)候,開(kāi)關(guān)狀態(tài)發(fā)生變化時(shí),相關(guān)支路的潮流變化量也是不一樣的,所以在設(shè)定|ΔPij|、|ΔQij|及|ΔPi|、|ΔQi|的閥值時(shí),不同的負(fù)荷水平有不同的閥值。我們按高、中、低三個(gè)負(fù)荷水平來(lái)確定相關(guān)的閥值。
2)通過(guò)對(duì)數(shù)據(jù)庫(kù)中的大量數(shù)據(jù)進(jìn)行挖掘以后,得到所需的關(guān)聯(lián)規(guī)則。然后對(duì)所得的關(guān)聯(lián)規(guī)則根據(jù)負(fù)荷水平分別測(cè)試,以證明所得的規(guī)則是正確可用的。
3)當(dāng)注入為零或接近于零時(shí),判斷不出相關(guān)支路開(kāi)關(guān)狀態(tài)的正確性,因?yàn)楫?dāng)開(kāi)關(guān)發(fā)生變化時(shí),潮流沒(méi)有什么變化,但幸運(yùn)的是零注入時(shí)對(duì)網(wǎng)絡(luò)模型及狀態(tài)估計(jì)的結(jié)果影響不是很大。
4)當(dāng)負(fù)荷突變和拓?fù)溴e(cuò)誤同時(shí)發(fā)生時(shí),造成辨識(shí)的困難。例如當(dāng)電網(wǎng)的拓?fù)浣Y(jié)構(gòu)發(fā)生變化時(shí),很可能導(dǎo)致節(jié)點(diǎn)注入功率的突然變化,切除線路時(shí)連鎖切負(fù)荷,從而導(dǎo)致相關(guān)線路潮流發(fā)生變化,而此時(shí)與相關(guān)線路關(guān)聯(lián)的開(kāi)關(guān)遙信又有誤,造成辨識(shí)的不確定性。但這樣的概率比較低,而且當(dāng)發(fā)生切負(fù)荷的情況,運(yùn)行人員會(huì)特別注意的。
5)由于網(wǎng)絡(luò)的結(jié)構(gòu),線路參數(shù),運(yùn)行方式等隨著時(shí)間會(huì)不斷的變化,這樣造成以前的有些規(guī)則對(duì)于現(xiàn)有的網(wǎng)絡(luò)狀態(tài)可能不一定很適用,從而造成網(wǎng)絡(luò)辨識(shí)的錯(cuò)誤。只有挖掘的關(guān)聯(lián)規(guī)則是反映最新網(wǎng)絡(luò)狀態(tài)的規(guī)則才是所需要的規(guī)則,而最新采集的數(shù)據(jù)能夠反映網(wǎng)絡(luò)情況。所以對(duì)于新采集進(jìn)來(lái)的樣本數(shù)據(jù),要有一個(gè)不斷訓(xùn)練的過(guò)程,以達(dá)到所用的規(guī)則是反映最新的網(wǎng)絡(luò)狀態(tài)的規(guī)則,使得對(duì)網(wǎng)絡(luò)拓?fù)涞谋孀R(shí)達(dá)到較高的正確度,供狀態(tài)估計(jì)等所用。
本文提出了一種新的基于數(shù)據(jù)挖掘技術(shù)的網(wǎng)絡(luò)拓?fù)浔孀R(shí)方法,利用SCADA系統(tǒng)所保存的大量歷史遙測(cè)及遙信數(shù)據(jù)進(jìn)行關(guān)聯(lián)挖掘,得到各開(kāi)關(guān)狀態(tài)的變化與那些量有關(guān),從而根據(jù)此關(guān)系辨識(shí)出正確的開(kāi)關(guān)狀態(tài)。文章首先對(duì)歷史數(shù)據(jù)進(jìn)行了預(yù)處理,然后用Apriori算法對(duì)處理的數(shù)據(jù)挖掘計(jì)算,通過(guò)設(shè)置最小信任度閥值,計(jì)算各個(gè)開(kāi)關(guān)動(dòng)作的變化與那些支路潮流的變化及開(kāi)關(guān)變化是強(qiáng)關(guān)聯(lián)的。隨著經(jīng)驗(yàn)的增加,通過(guò)對(duì)最小閥值的不斷調(diào)整,就可以得到能正確判斷網(wǎng)絡(luò)開(kāi)關(guān)狀態(tài)的關(guān)聯(lián)規(guī)則。利用這些規(guī)則就可以有效的對(duì)網(wǎng)絡(luò)拓?fù)潢P(guān)系進(jìn)行有效的辨識(shí),文章最后利用一個(gè)實(shí)際配網(wǎng)的應(yīng)用范例證明了本文方法的有效性。
[1]Yu E K.State Estimation of Power System [M].Beijing:Hydraulic and Electric Power Press,1985.
[2]Quintama V,Cutsem T V.Real-time Processing of Transformer Tap Positions[J].Canadian Electrical Engineering Journal,1987,12(4): 171-180.
[3]Cutsem T V,Quintana V.Network parameter estimation Using Online Data with Application to Transformer Tap Position Estimation[J].IEE Proceedings,1988,135: 31-40.