王紅斌,陳揚(yáng),高雅,耿大慶
(1. 廣東電網(wǎng)公司 電力科學(xué)研究院,廣東 廣州 510080;2. 快威科技集團(tuán)有限公司,浙江 杭州 310027)
伴隨現(xiàn)代傳感及科學(xué)技術(shù)的發(fā)展,數(shù)據(jù)庫的規(guī)模不斷擴(kuò)大,產(chǎn)生了大量數(shù)據(jù),大量的數(shù)據(jù)往往使人們無法辨別隱藏在其中的能對決策提供支持的信息,傳統(tǒng)的查詢報表工具無法滿足挖掘這些信息的需求,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。數(shù)據(jù)挖掘技術(shù)又稱為知識發(fā)現(xiàn),它能自動地分析數(shù)據(jù)倉庫的海量數(shù)據(jù),做出歸納性的推理,從中挖掘出隱含的模式,并運(yùn)用于預(yù)測,是目前人工智能和數(shù)據(jù)庫領(lǐng)域研究的熱點(diǎn)。一般的流程為通過收集數(shù)據(jù)把數(shù)據(jù)放到數(shù)據(jù)庫或數(shù)據(jù)倉庫中,對數(shù)據(jù)進(jìn)行清理和轉(zhuǎn)換,清除數(shù)據(jù)集中的“噪聲”,開始構(gòu)建模型選擇不同的算法,最終達(dá)到對這些模型預(yù)測的目的,滿足各種需求。如能將這些知識合理運(yùn)用于預(yù)警系統(tǒng),將能突破傳統(tǒng)的預(yù)警系統(tǒng)知識獲取困難的瓶頸,具有重要的理論意義和應(yīng)用價值。
輸電線路設(shè)備的監(jiān)測技術(shù),作為一種智能電網(wǎng)安全的重要實(shí)現(xiàn)手段,對整個輸電線路安全運(yùn)行起著重要的作用。輸電線路在線監(jiān)測的重點(diǎn)在于線路運(yùn)行與周邊環(huán)境的適應(yīng)性上,主要有雷電定位系統(tǒng)、微氣象監(jiān)測系統(tǒng)、輸電線路覆冰在線監(jiān)測(監(jiān)測覆冰重量等)、微風(fēng)振動監(jiān)測(監(jiān)測導(dǎo)線與線夾最后接觸點(diǎn)外一定距離處導(dǎo)線相對于線夾的彎曲振幅和頻率等)、導(dǎo)線舞動監(jiān)測(監(jiān)測振動半波數(shù)、擺動頻率和擺動幅度等)、風(fēng)偏在線監(jiān)測(監(jiān)測絕緣子串導(dǎo)地線出口處或轉(zhuǎn)角塔跳線最低點(diǎn)的風(fēng)偏角和仰角等)、導(dǎo)線溫度監(jiān)測、絕緣子污穢度監(jiān)測及桿塔傾斜監(jiān)測[1]等。如何從在線監(jiān)測的各類設(shè)備產(chǎn)生大量的數(shù)據(jù)中提取挖掘有用的信息提供預(yù)警,避免因故障的發(fā)生或進(jìn)一步擴(kuò)大而導(dǎo)致嚴(yán)重事故的發(fā)生具有重要的經(jīng)濟(jì)意義。
目前基于數(shù)據(jù)挖掘的預(yù)警技術(shù)已廣泛地應(yīng)用于電力、醫(yī)學(xué)、航空、核工業(yè)等領(lǐng)域,同時也取得了較多有意義的成果[2-8]。文獻(xiàn)[9]采用信號檢測的方法,結(jié)合江蘇省藥物自發(fā)報告系統(tǒng)中成藥不良反應(yīng)數(shù)據(jù),探討了數(shù)據(jù)挖掘的預(yù)警方法在雙黃連注射劑不良反應(yīng)監(jiān)測中的表現(xiàn)特點(diǎn)。黃小紅等人根據(jù)高速鐵路牽引供電SCADA系統(tǒng)的特點(diǎn),及當(dāng)前SCADA系統(tǒng)的不足,提出了用數(shù)據(jù)挖掘技術(shù)分析和預(yù)測變電所設(shè)備故障,改善系統(tǒng)的綜合性能[10-15]。胡杰等探討了數(shù)據(jù)挖掘在設(shè)備狀態(tài)監(jiān)測中的應(yīng)用研究,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到水蒸汽發(fā)電機(jī)系統(tǒng)也取得較好的效果。但是目前數(shù)據(jù)挖掘在輸電設(shè)備的監(jiān)測應(yīng)用還比較少,伴隨數(shù)字電力的深入,各個監(jiān)測設(shè)備的監(jiān)測數(shù)據(jù)呈爆炸性增長,常規(guī)方法已經(jīng)捉襟見肘,將數(shù)據(jù)挖掘技術(shù)引入到電力系統(tǒng)分析中勢在必行,所以探討數(shù)據(jù)挖掘的預(yù)警技術(shù)在輸電設(shè)備的應(yīng)用具有很大的發(fā)展?jié)摿Γ哂袑?shí)際意義。
本文旨在討論數(shù)據(jù)挖掘的預(yù)警技術(shù)在輸電設(shè)備檢測中的應(yīng)用,首先通過改進(jìn)的層次聚類算法對輸電設(shè)備監(jiān)測的歷史數(shù)據(jù)挖掘,獲得設(shè)備運(yùn)行狀態(tài)的運(yùn)行庫,對于實(shí)時的在線監(jiān)測數(shù)據(jù)利用回歸方法得到設(shè)備運(yùn)行狀態(tài)的實(shí)時預(yù)測值,然后利用相關(guān)的報警規(guī)則實(shí)現(xiàn)輸電設(shè)備監(jiān)測的預(yù)警,最后給出了基于輸電設(shè)備運(yùn)行狀態(tài)挖掘的預(yù)警系統(tǒng)設(shè)計。
實(shí)現(xiàn)狀態(tài)監(jiān)測通常有3條主要途徑,分別為利用冗余信號、參考通道、多種信號實(shí)現(xiàn)狀態(tài)監(jiān)測[16]。一般輸電設(shè)備通常有多個監(jiān)測點(diǎn),采集到的數(shù)據(jù)為一個含有多個向量的分量,不同的監(jiān)測點(diǎn)監(jiān)測的數(shù)據(jù)存在很大的差異,因此需要對數(shù)據(jù)進(jìn)行歸一化處理,通??刹捎米畲笞钚≈捣椒?、Z-分布方法。
由于輸電設(shè)備監(jiān)測的系統(tǒng)類型較多,會產(chǎn)生大量的歷史數(shù)據(jù),本文采用聚類的方法,聚類結(jié)果中每個類代表著不同的設(shè)備運(yùn)行狀態(tài)歷史數(shù)據(jù)的集合,通過聚類構(gòu)成設(shè)備的總的正常狀態(tài)集。當(dāng)實(shí)時的數(shù)據(jù)進(jìn)來后,首先會定位到相應(yīng)的類,為下面的預(yù)測診斷做準(zhǔn)備。圖1所示為基本的實(shí)現(xiàn)過程。
設(shè)備回歸預(yù)測模塊是實(shí)現(xiàn)設(shè)備狀態(tài)監(jiān)測最為關(guān)鍵的一步,直接關(guān)系到監(jiān)測結(jié)果的準(zhǔn)確性與有效性,為后續(xù)的設(shè)備故障診斷、預(yù)警提供了依據(jù)。
圖1 狀態(tài)監(jiān)測實(shí)現(xiàn)過程Fig.1 Implementation process of the condition monitoring
本文給出的設(shè)備狀態(tài)監(jiān)測實(shí)現(xiàn)算法基于海量歷史數(shù)據(jù)的學(xué)習(xí),得到關(guān)于設(shè)備運(yùn)行狀態(tài)的知識,然后結(jié)合設(shè)備實(shí)時監(jiān)測數(shù)據(jù)進(jìn)行狀態(tài)預(yù)測。利用其預(yù)測結(jié)果和一些根據(jù)實(shí)際需要設(shè)定的預(yù)警規(guī)則實(shí)現(xiàn)狀態(tài)預(yù)警。
算法的實(shí)現(xiàn)分為兩大步驟,一是利用設(shè)備運(yùn)行的歷史數(shù)據(jù)建立起設(shè)備運(yùn)行狀態(tài)模型,這一步通過聚類算法實(shí)現(xiàn);二是利用經(jīng)聚類過程得到的設(shè)備運(yùn)行狀態(tài)模型,結(jié)合設(shè)備運(yùn)行的實(shí)時狀態(tài)數(shù)據(jù)對當(dāng)前運(yùn)行狀態(tài)進(jìn)行回歸預(yù)測。再結(jié)合一些預(yù)警規(guī)則實(shí)現(xiàn)設(shè)備的在線實(shí)時預(yù)警。
傳統(tǒng)的樹聚類算法效率比較低,需要檢查和估算大量的對象或類,并進(jìn)行反復(fù)的迭代,為O(tn2),t是迭代次數(shù),n為數(shù)據(jù)樣本個數(shù),它是一種層次的架構(gòu)方式,通過對數(shù)據(jù)的反復(fù)聚合或分裂,最終形成了層次序列的聚類問題解[17]。由于在監(jiān)測的各種輸電設(shè)備中,通常包括各種類型設(shè)備的海量數(shù)據(jù)樣本量,如果采用傳統(tǒng)的層次聚類方法將耗費(fèi)大量的時間無法滿足實(shí)時性的要求,因此本文采用一種改進(jìn)的層次聚類算法,它能在短時間內(nèi)對海量數(shù)據(jù)實(shí)現(xiàn)聚類,為下一步的回歸預(yù)測做準(zhǔn)備。它將歷史數(shù)據(jù)樣本作為訓(xùn)練數(shù)據(jù)集,依次讀入訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)向量,根據(jù)最大值最小值向量作歸一化處理,確定其所在的類(或?qū)儆诋?dāng)前類,或自成新類),僅當(dāng)所有數(shù)據(jù)向量掃描一遍,聚類過程結(jié)束。這樣就避免了需要把全部數(shù)據(jù)一次性全部讀入內(nèi)存后才聚類的弊端,僅遍歷一次訓(xùn)練集就生成了聚類模型,降低了時間復(fù)雜度,提高了效率。
利用改進(jìn)的聚類算法,海量的歷史數(shù)據(jù)被聚集成一系列類簇。當(dāng)實(shí)時監(jiān)測數(shù)據(jù)經(jīng)過預(yù)處理模塊后,根據(jù)聚類模型,得到預(yù)測的系統(tǒng)狀態(tài)數(shù)據(jù),進(jìn)而根據(jù)預(yù)警規(guī)則預(yù)警。這里采用改進(jìn)的聚類算法進(jìn)行回歸預(yù)測,把每個類的上下線作為相應(yīng)狀態(tài)的邊界值,判斷實(shí)時數(shù)據(jù)是否在邊界值內(nèi)以及差值的大小,從而也避免了對類數(shù)據(jù)逐個處理耗時的弊端,保證了預(yù)警系統(tǒng)的快速響應(yīng)。
這里假定通過聚類,聚類模型已經(jīng)覆蓋了設(shè)備正常運(yùn)行的全部狀態(tài),并且每個類代表了設(shè)備運(yùn)行的一種正常狀態(tài)。當(dāng)正常的實(shí)時數(shù)據(jù)輸入時,根據(jù)改進(jìn)的聚類模型得到的預(yù)測值與自身相差不大,而當(dāng)實(shí)時數(shù)據(jù)向量異常時,預(yù)測值會有較明顯的差距,無法把它合并到任何一個正常的類中,及時給出設(shè)備運(yùn)行狀態(tài)分析,預(yù)警模塊根據(jù)預(yù)先設(shè)定的預(yù)警策略綜合匹配生成預(yù)警消息。
預(yù)警工作可分為訓(xùn)練階段和預(yù)警階段。在訓(xùn)練階段,預(yù)警系統(tǒng)接受輸電設(shè)備監(jiān)測的歷史數(shù)據(jù),從中獲取系統(tǒng)所需的預(yù)警規(guī)則。在預(yù)警階段,系統(tǒng)根據(jù)實(shí)時監(jiān)測的數(shù)據(jù),按照所設(shè)計的預(yù)警策略發(fā)布預(yù)警消息,預(yù)警消息可以采用一步預(yù)警的方法。
圖2描述了基于預(yù)警知識挖掘的輸電線路預(yù)警機(jī)制。預(yù)警系統(tǒng)由輸入/輸出接口、預(yù)處理模塊、預(yù)警信息輸出接口、預(yù)警模塊。其中監(jiān)測的歷史數(shù)據(jù),根據(jù)改進(jìn)的聚類算法生成設(shè)備運(yùn)行狀態(tài)模型,保存在運(yùn)行狀態(tài)庫中。通過挖掘系統(tǒng)原始的歷史數(shù)據(jù)和不斷更新的實(shí)時監(jiān)測數(shù)據(jù)可以自動更新運(yùn)行狀態(tài)庫。對于監(jiān)測數(shù)據(jù),預(yù)警模塊根據(jù)預(yù)警知識運(yùn)行狀態(tài)庫進(jìn)行回歸預(yù)測,結(jié)果進(jìn)入預(yù)警模塊和所設(shè)計的預(yù)警策略決定是否生成預(yù)警消息。該模塊和預(yù)警信息輸出接口一起可以提供實(shí)時控制接口,協(xié)助進(jìn)程所需的消息,聯(lián)動預(yù)警功能。
在實(shí)際的預(yù)警過程中,當(dāng)系統(tǒng)處理一個監(jiān)測數(shù)據(jù)時,總是先通過預(yù)處理模塊將其轉(zhuǎn)變?yōu)橄到y(tǒng)規(guī)定的標(biāo)準(zhǔn)格式,根據(jù)本文所設(shè)計的預(yù)警系統(tǒng)可以實(shí)現(xiàn)輸電設(shè)備的監(jiān)測預(yù)警。
圖2 基于預(yù)警知識挖掘的輸電線路預(yù)警機(jī)制Fig. 2 Early warning mechanism based on warning knowledge discovery of transmission lines
輸電線路在線監(jiān)測系統(tǒng)一體化是未來線路運(yùn)行管理的趨勢,數(shù)據(jù)平臺采用B/S架構(gòu),集成數(shù)據(jù)庫、Web發(fā)布和管理系統(tǒng),在線分析線路運(yùn)行狀態(tài)參數(shù),具有多參數(shù)的預(yù)警等功能。為了實(shí)現(xiàn)一體化設(shè)計與實(shí)現(xiàn),系統(tǒng)軟件方面以獨(dú)立、標(biāo)準(zhǔn)的方式進(jìn)行設(shè)計、開發(fā)。向數(shù)據(jù)采集單元發(fā)送指令的接口,作為總的系統(tǒng)平臺的一部分組件,可采用獨(dú)立的開發(fā)與設(shè)計,不依賴于硬件設(shè)備的設(shè)計。對于主站,任何采集單元設(shè)備都可以發(fā)送到同一主站進(jìn)行數(shù)據(jù)的接收解析,接受同一主站指令,不同的采集設(shè)備可以通過同一主站控制。綜合數(shù)據(jù)平臺與主系統(tǒng)同一風(fēng)格相互集成交互,作為一個單獨(dú)的子模塊運(yùn)行,不需要主系統(tǒng)平臺支持。在系統(tǒng)設(shè)計時采用統(tǒng)一的數(shù)據(jù)接口實(shí)現(xiàn),可以保證數(shù)據(jù)庫的安全,具有標(biāo)準(zhǔn)性和易擴(kuò)展性。
伴隨架空輸電線路的迅速發(fā)展,輸電設(shè)備急劇增加,人力資源也凸顯不足,因此科學(xué)的一體化輸電監(jiān)測方法勢在必行,數(shù)據(jù)挖掘技術(shù)能夠幫助掌握線路的運(yùn)行情況,及時發(fā)現(xiàn)設(shè)備缺陷和隱患。本文是基于數(shù)據(jù)挖掘技術(shù)在輸電設(shè)備監(jiān)測的初步探討。首先通過改進(jìn)的層次聚類算法對輸電設(shè)備監(jiān)測的歷史數(shù)據(jù)挖掘,獲得設(shè)備運(yùn)行狀態(tài)的運(yùn)行庫,對于實(shí)時的在線監(jiān)測數(shù)據(jù)利用回歸方法得到設(shè)備運(yùn)行狀態(tài)的實(shí)時預(yù)測值,然后利用相關(guān)的報警規(guī)則實(shí)現(xiàn)輸電設(shè)備監(jiān)測的預(yù)警,最后給出了基于輸電設(shè)備運(yùn)行狀態(tài)挖掘的預(yù)警系統(tǒng)設(shè)計。
[1] WANG Shaohua,YE Ziqiang,MEI Bingxiao. Application status of online monitoring and live detection technologies of transmission and distribution equipment in electric network[J].High Voltage Apparatus,2011,47(4):84-90.
[2] 潘潔珠,吳共慶,胡學(xué)鋼,等.基于領(lǐng)域知識的預(yù)警規(guī)則發(fā)現(xiàn)研究[J]. 計算機(jī)技術(shù)與發(fā)展,2008,18(7): 66-69.PAN Jiezhu,WU Gongqing,HU Xuegang,et al. Research of mining early warning rules based on domain knowledge[J].Computer Technology and Development,2008,18(7):66-69(in Chinese).
[3] GE Xiaoxia,BI Xiaolong,SI Fengqi,et al. Application of data checking method of principal component analysis in power plant[J]. East China Electric Power,2010,38(5):745-749.
[4] HASHEMIAN H M. On-line testing of calibration of process instrumentation channels in nuclear power plants,NUREG/CR-6343,US Nuclear Regulatory Commission,1995.
[5] ZHANG Xiaochun. Application of on-line detection technologies on transmission and distribution equipment in Yunnan electric network[J]. Yunnan Eleceric Power,2009(9):37-38.
[6] LIU Hongbin,LIU Lianrui,LIU Shaoyu,et al. Application of on-line detection on transmission and distribution equipment in north china grid[J]. North China Electric Power,2009(8): 35-37.
[7] CHEN Yuru,HUNG Mingchuan,YANG Donlin. Using data mining to construct an intelligent web search system[J].International Journal of Computer Processing of Oriental Languages,2003,16(2).
[8] RAKESH AGRAWAL,TOMASZ IMIELINSKI,ARRANSWAMI. Mining association rules between sets of items in large dtabases. In Proc. of the ACM SIGMOD Conference on Management of Data,Pages 207-216,May1993. Washington,D. C.
[9] 陳炯華,魏永越,孫駿,等. 基于數(shù)據(jù)挖掘的預(yù)警方法在雙黃連注射劑不良反應(yīng)監(jiān)測中的應(yīng)用研究[J]. 中國中藥雜志,2010,35(3): 308-312.CHEN Jionghua,WEI Yongyue,SUN Jun,et al. Research on signal detection methods based on data mining in adverse drug reaction of Shuanghuanglian injection[J].China Journal of Chinese Materia Medica,2010,35(3):308-312(in Chinese).
[10] 黃小紅,王倩. 數(shù)據(jù)挖掘技術(shù)在高速鐵路SCADA中的應(yīng)用研究[J]. 工業(yè)控制計算機(jī),2006,19(1): 6-7.HUANG Xiaohong,WANG Qian. Application of data mining to high speed railway SCADA systems[J]. Industrial Control Computer,2006,19(1): 6-7(in Chinese).
[11] 張東利. 決策樹分類方法在水輪機(jī)組故障診斷的應(yīng)用研究[J]. 電網(wǎng)與清潔能源,2013,29(6): 92-94.ZHANG Dongli. Decision tree classification for fault diagnosis of hydro-turbine generating unit[J]. Advances of Power System & Hydroelectric Engineering,2013,29(6):92-94(in Chinese).
[12] 王明疆. 地質(zhì)結(jié)構(gòu)面分組的聚類方法及EXCEL實(shí)現(xiàn)[J].西北水電,2007(4): 83-84,89.WANG Mingjiang. Clustering algorithm of geological structural plane in groups and its realization of EXCEL[J].Northwest Hydropower,2007(4):83-84,89(in Chinese).
[13] 范波. 數(shù)據(jù)挖掘技術(shù)在電力數(shù)據(jù)集成應(yīng)用的研究[J]. 陜西電力,2010,38(9): 55-57.FAN Bo. Application of data mining technology in data integration of power system[J]. Shaanxi Electric Power,2010,38(9): 55-57(in Chinese).
[14] 谷鵬,石國萍. 基于遺傳算法的電力系統(tǒng)綜合負(fù)荷模型的建模與仿真[J]. 節(jié)能,2010,29(9): 4,11-15.GU Peng,SHI Guoping. Power system load modeling and simulation based on improved genetic algorithm[J]. Energy Conservation,2010,29(9): 4,11-15.
[15] 李智勇,曹靜,吳為麟. 決策樹算法在某地區(qū)電網(wǎng)安全評估中的應(yīng)用研究[J]. 能源工程,2009(5): 5-9.LI Zhiyong,CAO Jing,WU Weilin. Application of decision tree algorithm in power grid security assessment of a certain area[J]. Energy Engineering,2009(5): 5-9.
[16] ZHOU Ping,SHEN Wei,SHI Hui. Assessment of sustainable development of cogeneration plant based on AHP and fuzzy comprehensive evaluation[J]. East China Electric Power,2010,38(9): 1421-1424.
[17] 孫吉貴,劉杰,趙連宇. 聚類算法研究[J]. 軟件學(xué)報,2008,19(1): 48-61.SUN Jigui,LIU Jie,ZHAO Lianyu. Clustering algorithms research[J]. Journal of Software,2008,19(1): 48-61.