李鴻奎,程昭龍,周 蕾,王曼琪,胡國(guó)華
(國(guó)網(wǎng)山東省電力公司菏澤供電公司,山東 菏澤274000 )
隨著智能電網(wǎng)建設(shè)規(guī)模的不斷增長(zhǎng)、電網(wǎng)拓?fù)浣Y(jié)構(gòu)和運(yùn)行方式等日趨復(fù)雜,電網(wǎng)公司加大了變電站設(shè)備管控技術(shù)的推廣,智能變電站設(shè)備數(shù)量的快速增長(zhǎng)使得設(shè)備管控的信息數(shù)據(jù)量也在大幅增長(zhǎng)[1-2]。該類數(shù)據(jù)不僅僅包含設(shè)備異常運(yùn)行時(shí)的狀態(tài)信息數(shù)據(jù),同時(shí)還包含設(shè)備穩(wěn)定、濕度以及圖像等數(shù)據(jù),逐漸構(gòu)成智能變電站設(shè)備管控大數(shù)據(jù)[3-4]。
如何對(duì)智能變電站設(shè)備管控大數(shù)據(jù)進(jìn)行高效處理和分析是當(dāng)前重點(diǎn)研究課題。通過對(duì)設(shè)備管控大數(shù)據(jù)的存儲(chǔ)、管理和分析,設(shè)備管控人員能夠在大數(shù)據(jù)中心獲取設(shè)備的歷史和實(shí)時(shí)運(yùn)行狀態(tài),對(duì)變電站設(shè)備的安全穩(wěn)定運(yùn)行提供重要技術(shù)支撐[5-6]。然而,智能變電站設(shè)備管控系統(tǒng)的大量監(jiān)測(cè)節(jié)點(diǎn)向數(shù)據(jù)平臺(tái)傳送所采集到的設(shè)備數(shù)據(jù),形成海量的多源異構(gòu)復(fù)雜數(shù)據(jù)。數(shù)據(jù)中心不僅需要對(duì)海量的數(shù)據(jù)進(jìn)行存儲(chǔ),而且需對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行快速分析和處理,并感知變電站設(shè)備的運(yùn)行狀態(tài)。
目前,智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)所面臨的問題和挑戰(zhàn)主要集中在如下幾個(gè)方面:
a.智能變電站設(shè)備管控?cái)?shù)據(jù)的體量巨大。據(jù)統(tǒng)計(jì),一個(gè)數(shù)字變電站一天內(nèi)所產(chǎn)生的數(shù)據(jù)量高達(dá)3 TB,隨著設(shè)備管控監(jiān)測(cè)系統(tǒng)的擴(kuò)大,數(shù)據(jù)體量還會(huì)增加。
b.多源異構(gòu)數(shù)據(jù)的關(guān)聯(lián)關(guān)系。海量多源異構(gòu)數(shù)據(jù)的關(guān)聯(lián)性分析需要處理巨大的數(shù)據(jù)體量,對(duì)數(shù)據(jù)挖掘的效率是一個(gè)挑戰(zhàn)。
c.數(shù)據(jù)多維度屬性。變電站設(shè)備具有地理位置屬性,而某一設(shè)備數(shù)據(jù)則具有時(shí)間屬性。
d.快速的數(shù)據(jù)處理需求。智能變電站設(shè)備管控要求對(duì)海量數(shù)據(jù)進(jìn)行批量處理,對(duì)數(shù)據(jù)的處理速度提出了挑戰(zhàn)。
針對(duì)上述智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)所面臨的問題和挑戰(zhàn),目前被廣泛應(yīng)用的方法之一是基于云平臺(tái)的數(shù)據(jù)分析技術(shù)[7-10]。其中Hadoop分布式文件系統(tǒng)(Hadoop distributed file system,HDFS)在數(shù)據(jù)處理和分析方面具有獨(dú)特的優(yōu)勢(shì),其具有高吞吐量的數(shù)據(jù)處理能力,目前在計(jì)算機(jī)、互聯(lián)網(wǎng)公司等領(lǐng)域應(yīng)用廣泛[11-14]。但是與互聯(lián)網(wǎng)領(lǐng)域的云服務(wù)技術(shù)相比,智能變電站設(shè)備管控大數(shù)據(jù)分析在數(shù)據(jù)存儲(chǔ)、管理和分析方面都是具有一定的差異性。將Hadoop技術(shù)應(yīng)用于智能變電站設(shè)備管控大數(shù)據(jù)分析是未來的發(fā)展趨勢(shì),也面臨著較大的挑戰(zhàn)。
鑒于此,本文在云服務(wù)平臺(tái)基礎(chǔ)上,分析和設(shè)計(jì)了一種智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)。介紹了變電站設(shè)備運(yùn)行狀態(tài)的大數(shù)據(jù)特征、基本框架以及數(shù)據(jù)集成與預(yù)處理、數(shù)據(jù)存儲(chǔ)與處理、設(shè)備狀態(tài)評(píng)估模型以及數(shù)據(jù)可視化展示等關(guān)鍵技術(shù)。最后通過實(shí)驗(yàn)結(jié)果驗(yàn)證所設(shè)計(jì)的大數(shù)據(jù)分析系統(tǒng)的有效性。
智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)主要通過信息化平臺(tái)來獲取變電站大量設(shè)備的運(yùn)行數(shù)據(jù),采用統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等方法對(duì)設(shè)備的運(yùn)行狀態(tài)數(shù)據(jù)進(jìn)行分析和挖掘,從分析數(shù)據(jù)基本規(guī)律視角來評(píng)估、診斷變電站設(shè)備的狀態(tài),能夠?qū)ψ冸娬驹O(shè)備異常運(yùn)行狀態(tài)進(jìn)行快速檢測(cè)和評(píng)估,全面掌握設(shè)備的健康狀態(tài),為變電站設(shè)備的管控提供輔助決策依據(jù)。變電站設(shè)備管控大數(shù)據(jù)分析是從海量數(shù)據(jù)中來提取客觀規(guī)律,不需要構(gòu)建復(fù)雜的機(jī)理模型,其主要優(yōu)勢(shì)體現(xiàn)在:
a.從數(shù)據(jù)挖掘的視角來揭示設(shè)備之間以及設(shè)備與變電站運(yùn)行之間的內(nèi)在關(guān)聯(lián)關(guān)系,對(duì)設(shè)備早期的故障信息和故障發(fā)展過程進(jìn)行分析,對(duì)不同故障發(fā)生的概率進(jìn)行預(yù)測(cè),從而能夠快速、有效地完成設(shè)備故障預(yù)警和診斷,確保設(shè)備的安全穩(wěn)定運(yùn)行。
b.利用數(shù)據(jù)統(tǒng)計(jì)、關(guān)聯(lián)分析以及數(shù)據(jù)挖掘等方法來獲取不同運(yùn)行狀況、多維度下的設(shè)備運(yùn)行狀態(tài)變化規(guī)律,實(shí)現(xiàn)多層次、多視角以及多維度下的全方位分析,可有效提升設(shè)備狀態(tài)預(yù)警和診斷的準(zhǔn)確性。
c.推動(dòng)新一代信息互聯(lián)與設(shè)備預(yù)警診斷的深度高效融合,能夠快速分析設(shè)備海量數(shù)據(jù),實(shí)現(xiàn)設(shè)備運(yùn)行狀態(tài)的主動(dòng)預(yù)警和智能化診斷,提升變電站設(shè)備管控的效率和智能化水平。
從數(shù)據(jù)來源角度來看,智能變電站設(shè)備管控?cái)?shù)據(jù)可分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)兩大類。其中內(nèi)部數(shù)據(jù)包含功率、電壓和電流等設(shè)備內(nèi)部信息,該類數(shù)據(jù)可由數(shù)據(jù)采集系統(tǒng)、廣域監(jiān)測(cè)系統(tǒng)等獲取。而外部數(shù)據(jù)則由與電網(wǎng)相連接的其他外部網(wǎng)絡(luò)獲取,如物聯(lián)網(wǎng)、互聯(lián)網(wǎng)等。另外,設(shè)備數(shù)據(jù)可分為靜態(tài)數(shù)據(jù)、動(dòng)態(tài)數(shù)據(jù)以及準(zhǔn)動(dòng)態(tài)數(shù)據(jù)。其中靜態(tài)數(shù)據(jù)主要包含設(shè)備臺(tái)賬和技術(shù)參數(shù)等;動(dòng)態(tài)數(shù)據(jù)反映設(shè)備運(yùn)行狀態(tài)隨時(shí)間變化的數(shù)據(jù),包括運(yùn)行數(shù)據(jù)和帶電檢測(cè)數(shù)據(jù)等;而準(zhǔn)動(dòng)態(tài)數(shù)據(jù)則是通常定期或者不定期獲取并更新,包括定期檢修記錄和故障記錄數(shù)據(jù)等。
智能變電站設(shè)備管控?cái)?shù)據(jù)表現(xiàn)了典型的大數(shù)據(jù)特征,主要表現(xiàn)在:
a.較多數(shù)據(jù)來源。數(shù)據(jù)分散在眾多變電站設(shè)備的管理系統(tǒng)、監(jiān)測(cè)系統(tǒng)當(dāng)中,各類型的數(shù)據(jù)相對(duì)獨(dú)立,數(shù)據(jù)接口、格式均存在較大的差異。
b.較大數(shù)據(jù)量。變電站設(shè)備種類多,與設(shè)備密切相關(guān)的狀態(tài)監(jiān)測(cè)、預(yù)警和診斷等管控的數(shù)據(jù)量巨大。
c.多類型數(shù)據(jù)結(jié)構(gòu)。海量數(shù)據(jù)中除了結(jié)構(gòu)化數(shù)據(jù)之外,還包含一些非結(jié)構(gòu)化以及半結(jié)構(gòu)化的設(shè)備運(yùn)行管控?cái)?shù)據(jù)。
智能變電站設(shè)備管控大數(shù)據(jù)分析框架如圖1所示。首先,通過在線監(jiān)測(cè)系統(tǒng)獲取智能變電站設(shè)備的多源異構(gòu)數(shù)據(jù);然后對(duì)設(shè)備異構(gòu)數(shù)據(jù)進(jìn)行數(shù)據(jù)集成、清洗、規(guī)范化和轉(zhuǎn)換等,并利用分布式處理方法實(shí)現(xiàn)大數(shù)據(jù)分布式存儲(chǔ),在此基礎(chǔ)上利用機(jī)器學(xué)習(xí)等數(shù)據(jù)挖掘算法來構(gòu)建大數(shù)據(jù)并行化算法平臺(tái);接著基于算法平臺(tái)對(duì)智能變電站設(shè)備大數(shù)據(jù)的內(nèi)在關(guān)聯(lián)關(guān)系進(jìn)行分析,實(shí)現(xiàn)變電站設(shè)備異常檢測(cè)、狀態(tài)預(yù)警和故障診斷等管控功能;最后利用多維度可視化技術(shù)實(shí)現(xiàn)變電站設(shè)備管控過程的展示,為智能變電站設(shè)備運(yùn)維檢修、電網(wǎng)調(diào)度決策等提供輔助決策支持。
圖1 智能變電站設(shè)備管控大數(shù)據(jù)分析框架
智能變電站設(shè)備管控大數(shù)據(jù)通常需從設(shè)備狀態(tài)監(jiān)控系統(tǒng)和物聯(lián)網(wǎng)系統(tǒng)獲取設(shè)備數(shù)據(jù),依據(jù)數(shù)據(jù)安全、可靠性要求,可采用數(shù)據(jù)中心數(shù)據(jù)庫(kù)共享方式從不同設(shè)備不同業(yè)務(wù)中抽取數(shù)據(jù)。這些獲取的數(shù)據(jù)可能存在數(shù)據(jù)質(zhì)量低、冗余、缺失和不一致等問題,需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,主要的數(shù)據(jù)預(yù)處理方法包括:
a.數(shù)據(jù)清理。對(duì)數(shù)據(jù)庫(kù)中不正確、不完整和不相關(guān)的數(shù)據(jù)進(jìn)行識(shí)別、替換、修改或者刪除。
b.數(shù)據(jù)集成。組合、存儲(chǔ)多源數(shù)據(jù),將類型不一致的數(shù)據(jù)進(jìn)行統(tǒng)一化處理,并對(duì)組合過程中冗余數(shù)據(jù)進(jìn)行清除。
c.數(shù)據(jù)變換。對(duì)數(shù)據(jù)進(jìn)行轉(zhuǎn)換處理,滿足數(shù)據(jù)挖掘的格式需求,包括數(shù)據(jù)規(guī)格化、規(guī)約等。
d.數(shù)據(jù)規(guī)約。采用特征集方法來降低數(shù)據(jù)挖掘過程中的自變量數(shù)量,可用較小規(guī)模的數(shù)據(jù)對(duì)原始數(shù)據(jù)進(jìn)行替代。
2.2.1 數(shù)據(jù)存儲(chǔ)
針對(duì)智能變電站設(shè)備管控大數(shù)據(jù)基本特征,采用基于Hadoop平臺(tái)的云數(shù)據(jù)管理技術(shù)對(duì)數(shù)據(jù)進(jìn)行存儲(chǔ)和處理。首先提出一種基于數(shù)據(jù)相關(guān)性的多副本一致性哈希數(shù)據(jù)存儲(chǔ)算法,該算法具體原理如下:集中處理數(shù)據(jù),在查詢、分析數(shù)據(jù)時(shí),在映射端執(zhí)行主要工作,能夠減少網(wǎng)絡(luò)通信負(fù)載,進(jìn)而提高系統(tǒng)的查詢、分析性能。對(duì)于不同結(jié)構(gòu)、類型的數(shù)據(jù)來說,記錄每一個(gè)傳感器采集數(shù)據(jù)的時(shí)間和位置。Hadoop平臺(tái)可將數(shù)據(jù)存儲(chǔ)為數(shù)據(jù)采集時(shí)間、數(shù)據(jù)采集位置和自定義相關(guān)性等3個(gè)副本,其中采用一致性哈希算法將第1個(gè)副本數(shù)據(jù)的位置進(jìn)行哈希映射,將第2個(gè)副本數(shù)據(jù)的采集時(shí)間進(jìn)行哈希映射,并將第3個(gè)副本依據(jù)自定義相關(guān)系數(shù)進(jìn)行哈希映射,能夠滿足數(shù)據(jù)查詢、分析的具體需求。算法運(yùn)行中需要建立哈希環(huán),其配置基本原理如圖2所示。
圖2 數(shù)據(jù)存儲(chǔ)算法示意
因此,基于數(shù)據(jù)相關(guān)性的多副本一致性哈希數(shù)據(jù)存儲(chǔ)算法的實(shí)現(xiàn)步驟如下:
a.對(duì)系統(tǒng)大數(shù)據(jù)的相關(guān)系數(shù)、冗余副本數(shù)量進(jìn)行監(jiān)測(cè)并配置文件預(yù)定義。
b.對(duì)每個(gè)數(shù)據(jù)節(jié)點(diǎn)的哈希值進(jìn)行計(jì)算,并配置到對(duì)應(yīng)的哈希環(huán)區(qū)間。
c.通過分析數(shù)據(jù)的采集時(shí)間、采集位置和相關(guān)系數(shù),對(duì)數(shù)據(jù)的哈希值進(jìn)行計(jì)算,即對(duì)副本1、副本2和副本3的哈希值分別計(jì)算并映射到對(duì)應(yīng)的哈希環(huán)上。
d.通過分析數(shù)據(jù)的哈希值和數(shù)據(jù)節(jié)點(diǎn)的哈希值來對(duì)數(shù)據(jù)的存儲(chǔ)位置進(jìn)行確定。
e.如果數(shù)據(jù)所存放節(jié)點(diǎn)出現(xiàn)存儲(chǔ)空間不足,則跳過該內(nèi)存不足的節(jié)點(diǎn)而存儲(chǔ)至其他節(jié)點(diǎn)。
2.2.2 數(shù)據(jù)處理
在基于Hadoop平臺(tái)的智能變電站設(shè)備管控中,采用Storm對(duì)采集的數(shù)據(jù)流進(jìn)行處理。首先對(duì)數(shù)據(jù)處理過程的拓?fù)浣Y(jié)構(gòu)進(jìn)行設(shè)計(jì),也即是對(duì)數(shù)據(jù)處理的邏輯關(guān)系進(jìn)行設(shè)計(jì),數(shù)據(jù)處理順序采用獲取數(shù)據(jù)、去噪、特征量計(jì)算以及狀態(tài)評(píng)估。數(shù)據(jù)處理拓?fù)浣Y(jié)構(gòu)如圖3所示,數(shù)據(jù)的起源用Spout表示,能夠支持多種數(shù)據(jù)的來源,且可分別處理不同數(shù)據(jù),例如在設(shè)備狀態(tài)監(jiān)測(cè)中包含電流信息、動(dòng)作信息和其他多類型監(jiān)測(cè)數(shù)據(jù);Blot可表示數(shù)據(jù)的去噪處理和特征量計(jì)算, 不同Blot代表不同的去噪處理方式、特征計(jì)算方式或者狀態(tài)評(píng)估方式。另外,一個(gè)Blot的輸出可以作為另外一個(gè)Blot的輸入。
圖3 數(shù)據(jù)處理拓?fù)浣Y(jié)構(gòu)
在完成智能變電站設(shè)備大數(shù)據(jù)處理工作后,需采用數(shù)據(jù)挖掘算法來構(gòu)建設(shè)備的狀態(tài)評(píng)估模型。在Hadoop集群計(jì)算框架基礎(chǔ)上,文中采用基于分類算法的數(shù)據(jù)挖掘算法來建立智能變電站設(shè)備狀態(tài)評(píng)估模型。分類算法是一種監(jiān)督學(xué)習(xí)算法,文中采用基于決策樹的分類算法來構(gòu)建狀態(tài)評(píng)估模型,首先定義已知數(shù)據(jù)集的類別,依據(jù)所采集數(shù)據(jù)集的數(shù)據(jù)特征來構(gòu)建數(shù)據(jù)分類器,然后利用此分類器對(duì)數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)并輸出離散結(jié)果。
2.3.1 決策樹算法
決策樹的原理結(jié)構(gòu)類似于樹形,主要組成部分包括節(jié)點(diǎn)和分支,其中節(jié)點(diǎn)組成包括內(nèi)部節(jié)點(diǎn)和葉節(jié)點(diǎn)。決策樹算法中葉節(jié)點(diǎn)表示數(shù)據(jù)集元素,內(nèi)部節(jié)點(diǎn)表示元素屬性。決策樹算法本質(zhì)是一種基于布爾算法的決策性函數(shù),所研究對(duì)象屬性決定了輸入的取值,某一屬性決策值則是輸出結(jié)果。決策樹算法的基本結(jié)構(gòu)如圖4所示。
圖4 決策樹模型架構(gòu)
2.3.2 模型評(píng)價(jià)
由于決策樹分類算法屬于一種分類模型,分類算法的性能評(píng)價(jià)采用混淆矩陣。以二分類模型的混淆矩陣為例,采用Kappa系數(shù)對(duì)模型性能進(jìn)行評(píng)價(jià)。二分類模型混淆矩陣采用4類元素表示,其中元素N11和N22表示模型正確分類的樣本數(shù),元素N12和N21表示模型錯(cuò)誤分類的樣本數(shù)。
Kappa系數(shù)是對(duì)模型性能評(píng)價(jià)的一個(gè)指標(biāo),其取值范圍為(-1,1),通常情況下取值都處于0到1之間,該指標(biāo)的值越大則表示分類的精度越高。其中Kappa系數(shù)的計(jì)算方法為
(1)
K為Kappa的系數(shù)取值;r為混淆矩陣的行數(shù);Nij為矩陣第i行第j列的元素值;Ni+為矩陣第i行所有元素值之和;N+i為矩陣第j列所有元素值之和;N為總的樣本數(shù)。
表1給出了Kappa系數(shù)取值范圍和對(duì)應(yīng)模型精度之間的關(guān)聯(lián)關(guān)系。通常而言,當(dāng)分類精度處于“非常好”的情況下,即可認(rèn)為具有非常好的分類性能。
表1 Kappa系數(shù)取值范圍與模型精度關(guān)系
文中采用一種三維平行散點(diǎn)圖以及人機(jī)交互來實(shí)現(xiàn)智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)的數(shù)據(jù)可視化展示。在Hadoop大數(shù)據(jù)計(jì)算平臺(tái)上,采用大數(shù)據(jù)可視化類庫(kù),實(shí)現(xiàn)了智能變電站設(shè)備管控大數(shù)據(jù)的可視化展示,具體步驟如下:
a.讀取變電站設(shè)備多源數(shù)據(jù)庫(kù)提取產(chǎn)生的設(shè)備狀態(tài)信息分布式數(shù)據(jù)集合,生成某一特定設(shè)備狀態(tài)信息的元素表。
b.對(duì)某一特定設(shè)備狀態(tài)信息的元素表的每個(gè)數(shù)據(jù)元素進(jìn)行分解和聚類編號(hào),分別記錄對(duì)應(yīng)的聚類編號(hào)和數(shù)據(jù)點(diǎn)集,并構(gòu)建聚類編號(hào)和數(shù)據(jù)點(diǎn)集的列表。
c.對(duì)聚類編號(hào)列表中的每一個(gè)聚類編號(hào)進(jìn)行著色,并構(gòu)建對(duì)應(yīng)的著色列表。
d.以數(shù)據(jù)點(diǎn)集列表和著色列表作為輸入數(shù)據(jù),構(gòu)建對(duì)應(yīng)的三維平行散點(diǎn)圖。
e.為構(gòu)建的三維平行散點(diǎn)圖添加坐標(biāo)軸,并通過人機(jī)交互實(shí)現(xiàn)數(shù)據(jù)可視化展示。
為了驗(yàn)證本文提出的智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)的實(shí)際效果,在實(shí)驗(yàn)室中搭建了大數(shù)據(jù)分析系統(tǒng)。實(shí)驗(yàn)室平臺(tái)由5臺(tái)服務(wù)器組成,硬件配置如下:CPU型號(hào)為Intel Core i7,內(nèi)存為16 GB,網(wǎng)絡(luò)寬帶為100 MB/s。其中1個(gè)節(jié)點(diǎn)的功能是控制節(jié)點(diǎn),另外4個(gè)節(jié)點(diǎn)的功能是工作節(jié)點(diǎn)。Hadoop采用2.7.3版本。
本次測(cè)試采用的數(shù)據(jù)是智能變電站某繼電保護(hù)設(shè)備的實(shí)時(shí)運(yùn)行數(shù)據(jù),該測(cè)試對(duì)大數(shù)據(jù)分析系統(tǒng)的數(shù)據(jù)處理性能、設(shè)備狀態(tài)評(píng)估結(jié)果有效性分別進(jìn)行了驗(yàn)證。
對(duì)于大數(shù)據(jù)分析而言,數(shù)據(jù)吞吐量表示含義是在特定時(shí)間內(nèi)能夠成功處理數(shù)據(jù)的數(shù)據(jù)量。通過對(duì)數(shù)據(jù)量不斷增加,分析了采用Storm集群控制和單機(jī)控制數(shù)據(jù)集所需要的運(yùn)行時(shí)間,以此來驗(yàn)證本文大數(shù)據(jù)分析系統(tǒng)采用Hadoop的數(shù)據(jù)集群控制的吞吐能力,Storm集群控制與單機(jī)運(yùn)行時(shí)間的對(duì)比結(jié)果如圖5所示。
圖5 Storm集群控制與單機(jī)運(yùn)行時(shí)間對(duì)比
由圖5可知,與單機(jī)運(yùn)行相比較,大數(shù)據(jù)分析系統(tǒng)采用Storm集群控制時(shí),能夠有效縮短數(shù)據(jù)處理時(shí)間,尤其是在數(shù)據(jù)量較大時(shí),集群控制的數(shù)據(jù)處理運(yùn)行時(shí)間優(yōu)勢(shì)更為明顯。
另外,為了驗(yàn)證本文構(gòu)建的智能變電站設(shè)備狀態(tài)評(píng)估模型的有效性,從采集的數(shù)據(jù)集中選取20個(gè)數(shù)據(jù)作為樣本,采用構(gòu)建的決策樹方法來預(yù)測(cè)其狀態(tài)評(píng)分,將預(yù)測(cè)的繼電保護(hù)設(shè)備狀態(tài)評(píng)估結(jié)果與實(shí)際結(jié)果進(jìn)行了對(duì)比,并能夠可視化展示,如圖6所示。
圖6 設(shè)備狀態(tài)評(píng)估結(jié)果對(duì)比
由圖6可以看出,設(shè)備狀態(tài)評(píng)估模型預(yù)測(cè)結(jié)果誤差較小,在智能變電站設(shè)備狀態(tài)評(píng)估應(yīng)用中具有較高的可靠性。從而進(jìn)一步說明了智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng)的可行性和有效性。
智能變電站設(shè)備管控大數(shù)據(jù)具有重大研究?jī)r(jià)值,運(yùn)用大數(shù)據(jù)分析方式能夠快速、有效地完成海量智能變電站設(shè)備數(shù)據(jù)的分析和研究。本文基于Hadoop框架提出了一種智能變電站設(shè)備管控大數(shù)據(jù)分析系統(tǒng),該系統(tǒng)包括數(shù)據(jù)集成與預(yù)處理、數(shù)據(jù)存儲(chǔ)與處理、設(shè)備狀態(tài)評(píng)估模型以及數(shù)據(jù)可視化展示等。實(shí)驗(yàn)結(jié)果表明:本文設(shè)計(jì)的大數(shù)據(jù)分析系統(tǒng)能夠有效提升數(shù)據(jù)處理的實(shí)時(shí)性,同時(shí)能夠精確地評(píng)估智能變電站設(shè)備的運(yùn)行狀態(tài),為智能變電站設(shè)備管控的穩(wěn)定運(yùn)行提供更加有效和實(shí)用性的技術(shù)支撐。