郭晶 唐冬來
摘? ?要:基于電力物聯(lián)網(wǎng)數(shù)據(jù)特征,采用數(shù)據(jù)自動采集、數(shù)據(jù)質(zhì)量評估和數(shù)據(jù)修復三種技術(shù),提出電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估模型,以信息化支撐電力物聯(lián)網(wǎng)的數(shù)據(jù)精益化管理,從而為智能家居、主動配電網(wǎng)等設備提供精準數(shù)據(jù)支撐的目的。本文首先簡述了電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估模型由數(shù)據(jù)源管理、質(zhì)量規(guī)則庫和數(shù)據(jù)評估管理三部分構(gòu)成,其次,介紹了系統(tǒng)研發(fā)、測試的關鍵點,最后展望系統(tǒng)對智能家居、需求響應等業(yè)務場景的提供的支撐,旨在探討數(shù)據(jù)質(zhì)量評估技術(shù)對電力物聯(lián)網(wǎng)的支撐的關鍵要素。
關鍵詞:電力物聯(lián)網(wǎng)? 數(shù)據(jù)質(zhì)量? 自動評估
中圖分類號:TU47? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1674-098X(2019)05(a)-0003-02
電力物聯(lián)網(wǎng)是物聯(lián)網(wǎng)在智能電網(wǎng)中的應用,通過對電網(wǎng)基礎設施、運維檢修人員以及環(huán)境識別、感知、互聯(lián)、控制等方面的整合,提高電力系統(tǒng)信息化水平,改善電力系統(tǒng)現(xiàn)有基礎設施利用效率,為電網(wǎng)發(fā)、輸、變、配、用電等環(huán)節(jié)提供重要技術(shù)支撐。
電力物聯(lián)網(wǎng)數(shù)據(jù)量十分龐大,數(shù)據(jù)所包含的緯度也比較復雜,這導致了各種系統(tǒng)應用之間的信息孤立現(xiàn)象越來越明顯,在一定程度上導致不能對數(shù)據(jù)進行有效地利用。因此,對電力物聯(lián)網(wǎng)數(shù)據(jù)行集成、評估分析和處理,得到有效的數(shù)據(jù)。電網(wǎng)公司在十年前就針對該問題提出了數(shù)據(jù)清洗的概念,針對從PMS、OMS、營銷等各個業(yè)務系統(tǒng)抽取集成到數(shù)據(jù)中心這一過程,對臟數(shù)據(jù)進行分析、研究及處理,以使經(jīng)過清洗處理后的數(shù)據(jù)能夠在數(shù)據(jù)質(zhì)量方面得到保障。
但根據(jù)當前電力信息化的特征來看,供電公司人員往往輸入的數(shù)據(jù)不完整,存在質(zhì)量問題,即使經(jīng)過數(shù)據(jù)清洗處理,也不達標。隨著運行時間的增加,導致PMS、OMS、營銷等系統(tǒng)數(shù)據(jù)質(zhì)量不斷下降,導致無法有效使用。如果想要得到更加有價值的信息,提高數(shù)據(jù)源的可用性和多樣性業(yè)務系統(tǒng)的數(shù)據(jù)質(zhì)量便成為了非常重要的因素,數(shù)據(jù)質(zhì)量評估環(huán)節(jié)變得不可忽視。
1? 評估模型設計
建立電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估模型的步驟包括:建立數(shù)據(jù)質(zhì)量評估規(guī)則,數(shù)據(jù)抽樣采集,對數(shù)據(jù)的質(zhì)量進行評估三部分。電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估模型如圖1所示。
電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估模型包含的有電力物聯(lián)網(wǎng)數(shù)據(jù)、數(shù)據(jù)抽樣采集、數(shù)據(jù)質(zhì)量評估規(guī)則、質(zhì)量評估、質(zhì)量評估報告和問題分析及處理六部分。
通過對數(shù)據(jù)質(zhì)量評估模型的研究分析,明確了數(shù)據(jù)質(zhì)量評估方法的流程,為數(shù)據(jù)質(zhì)量評估工具的構(gòu)建提供相應的理論依據(jù)。
2? 評估方法與實現(xiàn)
通過多種評估方法和評估算法實現(xiàn)電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量評估,能更好的發(fā)現(xiàn)數(shù)據(jù)中存在的錯誤、紕漏以及相關問題。目前采用了數(shù)據(jù)挖掘算法和評估規(guī)則約束方法兩種。
2.1 數(shù)據(jù)源管理
通過保持數(shù)據(jù)抽樣的樣本原始數(shù)據(jù),以方便用戶查閱,樣本表如表1所示。
2.2 質(zhì)量規(guī)則庫的構(gòu)建
通過準確性、完整性和一致性三個緯度來對數(shù)據(jù)質(zhì)量的特點進行詳細表述。
準確性:準確性可以分為語法準確和語義準確,在這里,我們對數(shù)據(jù)的語法準確性進行討論。客觀事物的值x與客觀事物的真實值之間的近似程度。
完整性:完整性可分為模式完整性、列完整性和總體完整性。
一致性:對關系數(shù)據(jù)庫而言,可以將一致性劃分為關鍵依賴一致性、包含依賴一致性和函數(shù)依賴一致性三種。
2.3 基于表達式樹的數(shù)據(jù)質(zhì)量規(guī)則的描述方法
采用一種稱為質(zhì)量規(guī)則表達式樹的結(jié)構(gòu)來描述所有的數(shù)據(jù)質(zhì)量規(guī)則。
在質(zhì)量規(guī)則表達式樹的結(jié)構(gòu)由函數(shù)和終端兩部分構(gòu)成。終端就如同樹葉,函數(shù)則是將樹葉連接起來的節(jié)點。每一個函數(shù)節(jié)點具有確定數(shù)目的子節(jié)點。
2.4 質(zhì)量規(guī)則庫的構(gòu)建
存儲規(guī)則需出于易存儲、易調(diào)用和易于管理的目的出發(fā),這樣在后期的分析統(tǒng)計才更有效率。本項目采用q-ET的樹型結(jié)構(gòu)特征用xml的方式搭建質(zhì)量規(guī)則庫。
3? 系統(tǒng)實現(xiàn)
本系統(tǒng)設計的數(shù)據(jù)質(zhì)量檢測系統(tǒng)的工作流程主要是數(shù)據(jù)采集、規(guī)則設計、規(guī)則運用以及問題數(shù)據(jù)記錄。系統(tǒng)分數(shù)據(jù)抽樣采集、數(shù)據(jù)質(zhì)量評估、數(shù)據(jù)質(zhì)量評估和問題處理展示界面。
在數(shù)據(jù)抽樣采集頁面,用戶可添加采集點、設定采集點變量以及邏輯定義;在規(guī)則設計頁面,包括規(guī)則數(shù)量添加、規(guī)則變量設定等功能;數(shù)據(jù)質(zhì)量評估顯示了規(guī)則執(zhí)行的選擇;問題處理展示則是對問題數(shù)據(jù)處理結(jié)果的展示。
4? 結(jié)語
本文對電力物聯(lián)網(wǎng)數(shù)據(jù)質(zhì)量的幾個問題進行了研究,但由于電力物聯(lián)網(wǎng)業(yè)務系統(tǒng)多、數(shù)據(jù)量較為龐大,在處理這些數(shù)據(jù)的時候需要綜合考慮多方面的因素才能制定不同的評估規(guī)則,另外一個需要注意的問題,則是如何使不同評估規(guī)則之間不產(chǎn)生沖突,使所有規(guī)則都能相互包含。另外,充分地運用統(tǒng)計工具,結(jié)合數(shù)據(jù)挖掘的理論,有效提高數(shù)據(jù)評估的效率,進一步加強信息化對電力物聯(lián)網(wǎng)的支撐力度。
參考文獻
[1] 韋榮桃,李舒,張艷玲,等.電力物聯(lián)網(wǎng)建設環(huán)境下可充電無線傳感器網(wǎng)絡能效與路由優(yōu)化策略[EB/OL].電測與儀表:1-7[2019-04-09].http://kns.cnki.net/kcms/detail/23.1202.TH.20181207.1730.168.html.
[2] 林靜,林柏.電力物聯(lián)網(wǎng)建設中的關鍵技術(shù)研究[J].通訊世界,2017(24):185-186.
[3] 張莉莉,邵長恒,梁明君.一體化城市大數(shù)據(jù)中心建設[J].電子技術(shù)與軟件工程,2018(23):147-149.
[4] Carinci F, Van Gool K, Mainz J, et al. Towards actionable international comparisons of healthsystem performance: expert revision of the OECD framework and quality indicators[J].International Journal for Quality in Health Care, 2015.
[5] Wu X, Zhu X, Wu G Q, et al. Data mining with big data[J]. Knowledge and Data Engineering,IEEE Transactions on, 2014: 97-107.