國網吳忠供電公司 蔡 娜
在網絡信息技術高速發(fā)展的背景之下,伴隨著物聯網和社交網絡等各種技術的快速發(fā)展,全世界的數據和信息量得到了前所未有的過程,毫無疑問,那么這種生活在一個信息和數據爆炸的時代。有統(tǒng)計顯示,在最近幾年當中人類所產生的數字信息和數據量幾乎達到了人類歷史上所有數據的九成,在計算機技術當中所采用的GB、TB 等單位已經不能夠滿足現代社會生產領域對數據量的計量需求需求,數據量單位的量級已經上升到了PB、EB,這種數據量的極速擴充證標志的大數據技術的形式和大數據時代的來臨。
我國現階段已建設起了發(fā)達的電力網絡,對于電力企業(yè)來說在電力生產管理與監(jiān)控當中,所需要處理的數據量相較于從前也有極大程度的提升,大數據的發(fā)展是未來必然的一個趨勢,本文將進一步結合大數據技術和數據分析,在電力企業(yè)當中的應用現狀簡要的探討這些技術,對于電力信息和監(jiān)控信息產生的影響,并對這些技術在電力行業(yè)中未來的發(fā)展進行展望。
目前來說學術界對于大數據還沒有一個確切的定義,但是對于大數據的特征,在學術和應用領域基本上達成了共識。通常來說,大數據指的是在一定時間內無法運用傳統(tǒng)數據軟件進行分析處理的大量數據,關于大數據的特征,當前業(yè)界主流且具有代表性的觀點是“4V”特征,也就是Volume、Variety、Velocity、Value,分別代表著數據量、數據種類、傳輸速度和數據價值,所謂大數據也就是數據量大、數據種類多、傳輸速度快、數據價值高這幾樣特征的集合體。從以上幾個特征不難發(fā)現,大數據的應用依賴于數據處理網絡建設高速發(fā)達的網絡才能更好的應用大數據,同時要充分挖掘大數據當中的價值,需要一個更高效的“數據處理器”。而關于數據分析則主要指的是在大數據處理的基礎上數據的實際應用價值進行進一步的挖掘,換句話來說數據處理可以算作是初步的數據分析。對于電力的生產和管理而言,數據分析對整個電力的調配具有重要的意義。
數據分析是大數據技術應用的重要組成部分,因此大數據的關鍵技術也包括數據分析。此外數據的處理管理和展現也同樣是大數據技術應用的關鍵。在數據分析方面,現階段數據分析的主要類型有統(tǒng)計分析、關聯分析、聚類分析和分類分析。
統(tǒng)計分析主要指的就是利用統(tǒng)計學方法對數據進行技術的收集整理和分析,是在數據分析當中一種較為直接的方法,可以比較直觀的發(fā)現數據之間的內在規(guī)律,是將統(tǒng)計所得的數據,利用統(tǒng)計學原理進行篩選并結合統(tǒng)計學的公式來進行計算,將所獲得的結果結合生產中的實際情況進行分析;關聯分析則主要指的是結合實際情況把握不同數據之間的內在聯系,例如早期數據挖掘的典型案例:在超市的顧客當中,購買啤酒的顧客群體里有67%也會同時購買尿布,由此可以推斷出大多數購買啤酒的顧客為有孩子的中青年。利用這條信息就可以對超市內尿布和啤酒兩者的貨架位置進行調整以達到促銷的目的。
聚類分析則主要應用于機器學習領域,在不明確分類標準的前提下,運用數據之間相似或共同的特征將不同的數據進行聯系,自然的將不同的數據分成若干個數據簇,之后以數據的特征為脈絡進行分析;分類分析技術和聚類分析的主要區(qū)別在于分類分析是有明確的分類標準的,分類分析的過程當中發(fā)現并預測新的數據類型。
在數據處理方面,現階段主要運用技術,有分布式計算、內存計算和流處理技術。具體來說是結合云端該實現硬件設備的虛擬化,該降低硬件設備的維護成本和能量的消耗,提高有限的硬件資源利用率,保障數據處理和存儲的穩(wěn)定性避免由于硬件設備的損壞造成不可估量的損失;在數據管理方面,這主要包括關系型與非關系型的數據庫建設,數據融合與數據集成技術等,在數據展現方面主要是數據可視化,歷史流展示技術,空間信息流展示技術,利用圖形學原理借助各類圖形圖表,對數據的分布、特征等級展現,從而快速直觀的獲取部分信息,有利于促進分析工作的開展。
“電力大數據”這個概念是在智能電網建設的背景下大數據技術和電力生產管理的一次有機的融合。與大數據的概念類似,目前業(yè)界對于電力大數據也沒有一個較為明確的概念,但具有一些共識。一般來講,所謂電力檔的數據指的是通過傳感器、智能設備、視頻監(jiān)控設備、音頻通訊設備、移動終端等各種數據采集渠道收集到的結構化、半結構化、非結構化的海量業(yè)務數據集合。電力大數據對于電網建設的整體質量和電力配送以及電網的整體監(jiān)控具有重要的價值。在掌握了這些大數據挖掘大數據信息的基礎上可以對整個社會的用電情況有一個大概了解,為電力企業(yè)后續(xù)的計劃與決策提供參考,同時,這些信息為電力企業(yè)進一步攻克電力工業(yè)和電力供應方面的難關指明了方向。
數據分析在電力企業(yè)當中的應用包括諸多方面,本文會分別從電力信息挖掘和監(jiān)控信息兩個方面進行簡要的闡述。在電力信息的挖掘和運行層面,數據分析主要是建立在整個電力信息系統(tǒng)積累的日志信息數據的基礎上,依照認識信息數據的來源,可將其大致分為兩類:
第一是系統(tǒng)的運行信息,智能化信息系統(tǒng)自身的運作狀態(tài)監(jiān)測因此可以通過運行信息獲取系統(tǒng)正常運行,異常運行和預警等三個種類的信息。通過對這一類信息的分析就可以刻畫出整個電力信息系統(tǒng),在某段時間內的運行狀態(tài)并在此基礎上對系統(tǒng)未來的運行進行預測,從而依據自身的需求,對系統(tǒng)進行及時的維護和調整;第二是系統(tǒng)的訪問日志信息,對于這些信息數據進行分析就可以對系統(tǒng)用戶的行為進行刻畫,包括用戶的訪問喜好以及不同類型用戶對于系統(tǒng)的使用頻次。當中就可以得到關于不同類型用戶對于電力信息系統(tǒng)的依賴程度以及各類用戶對于電力信息系統(tǒng)的應用場景。在對這些信息進行統(tǒng)計和處理的基礎上,進行關聯性分析就可以得出,各類業(yè)務在公司內部的表現狀況從而得出不同客戶對于電力企業(yè)的業(yè)務需求,輔助電力企業(yè)在業(yè)務發(fā)展方向和資源分配方面作出合理決策。
在監(jiān)控信息方面,則主要是輔助對一些監(jiān)測出的異常信息和異動進行及時的處理,在業(yè)務領域的異動信息,主要是指業(yè)務規(guī)則的變化及業(yè)務發(fā)展后期計劃的調整。及時發(fā)現業(yè)務數據當中發(fā)生異常變動,有助于工作人員和管理者及時察覺到業(yè)務領域的指標和規(guī)則的變化,從而對電力企業(yè)內部相關業(yè)務的規(guī)劃做出調整,做到時刻以最好的狀態(tài)面對業(yè)務工作。另外,對監(jiān)測數據的分析也有利于及時發(fā)現數據質量不穩(wěn)定的情況,如果發(fā)現沒有及時接入數據或者收集到的數據不完整,就表明可能是監(jiān)控系統(tǒng)的狀態(tài)出現了問題,讓相關的工作人員進行檢修。
對于電力信息運行來說,電力大數據產生的影響,首先是關于電力企業(yè)的數據中心建設方面,與大數據的數據量龐大,對于硬件設施的要求也相對較高,需要大量的網絡交換機和硬件設備,也就是說電力大數據背景下的數據中心建設。
首先就要有一個充足的機房空間,同時還需要散熱等方面的問題,以保障數據中心的硬件設施能夠長時間的正常運作。與之相對應的,數據中心的維護和使用需要更多的專業(yè)人員,所以對于電力企業(yè)來說,加強關于員工的大數據專業(yè)技能培訓也是十分有必要的,一方面,需要有充足的運維人員,另一方面,需要更多的員工來掌握大數據技術的核心知識體系,從而能夠更好地對大數據進行應用。
其次是對于信息網絡的影響。大數據的一個特點就是傳說速度快,這對于電力企業(yè)的信息網絡建設也有一定要求:信息網絡的傳輸帶寬要高,大數據網絡的一個特點就是持續(xù)的大寬帶通信;由于大數據技術,更多地應用分布式計算的方式來提高整體的運行效率,因此在信息化網絡構建的過程當中,也要體現出分布式的特點,保障據資源的安全性,避免因為一部分網絡出現故障,而導致整個信息網絡無法正常運作;關于網絡的基礎設施也需要進行升級,處于數據安全性考慮網絡交換設備需要有相應的緩存設置,避免重要數據的丟失。由于大數據背景下帶寬的提升,信息網絡基礎設施也需要能夠承受這種大帶寬傳輸,就目前的發(fā)展趨勢而言,建設高性能的光纜傳輸網絡是大勢所趨。
而大數據對于監(jiān)控信息產生的影響,則主要是實際工作層面的,大數據背景下的監(jiān)控信息,同樣具有著信息量大的一個特點,因此對于相關工作人員來說,數據分析技術就顯得尤為關鍵,要能夠從大量的監(jiān)控信息當中及時發(fā)現智能電網當中的異常,科學合理的措施進行處理。另外對于監(jiān)控設備數據采集功能也有一定的要求,監(jiān)控數據數據要具有實時性,準確性。
最后無論是電力信息還是監(jiān)控信息,在大數據時代的背景之下,關于信息資源的安全和網絡安全問題都是重中之重。由于大數據的數據量大,種類繁多,因此在傳輸過程的安全穩(wěn)定就顯得尤為重要,確保重要信息不能丟失、電力信息網絡和電力監(jiān)控網絡的安全防止惡意入侵都是信息資源安全和網絡安全工作的核心內容。目前來說,在這一領域,國內已有了不少的研究,如朱海鵬等基于D-S 證據理論,計算安全事件的偏離度,來確定安全事件權重,構建了建立在證據分類基礎上的復合攻擊檢測防護策略,這種策略和算法能夠針對多類型的網絡攻擊。
就現階段的狀況來說,電力大數據的應用主要是服務于整個電力生產和使用的,通過發(fā)現大量數據之間存在的規(guī)律,把握數據之間的內在聯系,未來業(yè)務服務的發(fā)展走向進行分析和預測。從而進一步提高電力企業(yè)的客戶服務質量,具體來說,通過對電力信息的分析,可以對客戶用電的行為傾向以及具體的用電量作出預測,并以此作為脈絡,將客戶進行初步的分類,通過對公司內部業(yè)務狀況數據的分析預測出未來一段時間內,客戶業(yè)務需求的大體走向,從而進一步優(yōu)化業(yè)務流程,使得客戶感到企業(yè)的服務更加便捷舒心。對于監(jiān)控信息的分析,就可以及時發(fā)現電網在運行的過程當中遇到或產生的技術上或設備上的問題,便于相關工作人員進行及時的維護修理,同時也方便管理者對企業(yè)內部的資源進行調配合調整,優(yōu)化資源分配。總的來說,大數據和數據分析的應用是智能化電網建設的必然要求。
第一是關于數據質量方面的挑戰(zhàn),大數據時代的一大特點就是數據量大的數據價值密度相對較低,電力大數據來自于輸送、變壓、調配、用度等各個環(huán)節(jié),其中難免存在著許多無用、無價值的信息,如何進一步提升大數據的價值密度、高校的挖掘電力大數據當中的有效信息,會議是未來行業(yè)研究電力大數據領域的一個熱點議題。
第二是關于數據集成方面的挑戰(zhàn),由于電力大數據在實際應用的過程當中,大多采用分布式存儲集中化處理的方式,確保信息資源的安全性和處理的穩(wěn)定性,當然是這樣的方式也存在著許多的問題,例如部分數據庫和數據系統(tǒng)的業(yè)務功能和具體的數據內容可能存在重復,這樣就很容易導致硬件資源的占用和浪費。另外,各類采集設備在具體工作時所采用的數據采集方法可能存在差異,這也就使得數據在采集和測量的過程當中存在著各種各樣的誤差,影響數據分析的準確性和實際效率。
第三是關于數據存儲方面的挑戰(zhàn),正如前文所提到的那樣,大數據時代必然會對數據中心的建設產生影響,各種類型的數據對硬件存儲設施包括存儲的算法提出了新的要求。對于視頻和圖片這一類半結構化和非結構化的數據存儲在未來將會成為一個新的研究熱點。如何在數據庫中實現高效的查詢統(tǒng)計,從而更有效率的輔助數據分析,體現出多樣化數據類型的優(yōu)勢,也會成為一個重要的研究課題。
總之,大數據時代的降臨,對于智能電網的建設及電力企業(yè)的信息化進程推進是一個關鍵的機遇,作為電力行業(yè)的從業(yè)者,需要對大數據和數據分析給電力信息和監(jiān)控信息乃至整個電力生產與管理所帶來的影響有明確的認識,了解到大數據時代下,電力行業(yè)未來發(fā)展所需要面臨的挑戰(zhàn),才能以更加積極的心態(tài)獲取相對客觀、科學的認知。讓大數據技術和數據分析在電力行業(yè)當中更好的發(fā)揮作用,發(fā)揮出其作為智能化技術應當具有的價值,讓電力企業(yè)更好的為廣大人民提供高質量的服務。