許冠軍 高昌盛
摘要:智能水表技術解決了用水數(shù)據(jù)獲取實時性的問題,但新的獲取用水量數(shù)據(jù)技術,在統(tǒng)計準確性上不如傳統(tǒng)方法。為定位智能水表系統(tǒng)的可能錯誤數(shù)據(jù),該文提出了基于歷史數(shù)據(jù)的誤差定位方法,可以有效發(fā)現(xiàn)疑似誤差數(shù)據(jù)。
關鍵詞:校驗;智能水表;歷史數(shù)據(jù)
中圖分類號:G642? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2018)34-0193-03
1 引言
水務公司為便于分析區(qū)域用水情況和布局合理的管網(wǎng)等需求,對居民用水數(shù)據(jù)的實時性和準確性要求越來越高。智能水表技術有效地解決了獲取用水數(shù)據(jù)實時性的問題,但無論是超聲波智能水表還是基于圖像識別的智能抄表系統(tǒng),都存在較大比例的讀數(shù)誤差。誤差數(shù)據(jù)的存在,尤其是明顯的居民用水數(shù)據(jù)錯誤,會引起客戶的投訴,造成客戶和水務公司對系統(tǒng)數(shù)據(jù)的不信任,嚴重影響智能水表系統(tǒng)的進一步推廣。
為提高用水量數(shù)據(jù)的準確性,應在初次統(tǒng)計的數(shù)據(jù)中,盡可能發(fā)現(xiàn)可能的誤差數(shù)據(jù),結合系統(tǒng)重讀、人工篩查和智能預測等方法進行及時糾正。本文提出了基于歷史數(shù)據(jù)的居民用水量數(shù)據(jù)校驗和分析方法,具體實現(xiàn)步驟:(1)結合區(qū)域居民的歷史用水數(shù)據(jù),對居民的用水特點進行分類,形成不同類型的居民用水類型[1-2];(2)結合一年四季的用水差別,利用已分類的用戶類型,擬合出各類型的年度月平均用水變化曲線[3];(3)結合區(qū)域用戶的年度月平均用水曲線,得出月際用水量的變化幅度[4-5]。結合用戶的歷史用水數(shù)據(jù),對當月的系統(tǒng)讀數(shù)的進行合理性識別,并確定疑似誤差數(shù)據(jù)。
2 用水模式分析
本文對某市區(qū)的近萬戶居民連續(xù)兩年用水歷史數(shù)據(jù)進行分析,在用戶類型劃分和用水模式分析中,月平均用水量和用水時間波動性是最受關注的兩個因素。經(jīng)過初步的數(shù)據(jù)分析發(fā)現(xiàn),月平均用水量能較好地區(qū)分用戶的類別,因此,本文先利用月平均用水量劃分用戶類型。
3 數(shù)值實驗
本文的實驗數(shù)據(jù)來自基于圖像識別的自動抄表系統(tǒng),一般情況下該系統(tǒng)的讀數(shù)自動識別正確率能達到95%,發(fā)現(xiàn)剩余5%的錯誤數(shù)據(jù),是本文算法要解決的主要問題。
3.1 實驗分析
實驗中,對非樣本的生產(chǎn)數(shù)據(jù)進行直接驗證,本文算法與傳統(tǒng)的直接基于上月數(shù)據(jù)校驗算法進行比較。實驗結果對正常數(shù)據(jù)誤判率(把正常的數(shù)據(jù)標識成疑似誤差數(shù)據(jù)的比例)、錯誤數(shù)據(jù)識別率(正確識別誤差數(shù)據(jù)的比例)二組結果記錄如表4。
由表4的實驗結果可以發(fā)現(xiàn),和傳統(tǒng)算法相比較,本文算法引入了用水量隨季節(jié)變化的用水模式因素,降低了正常數(shù)據(jù)的誤判率,且提高了錯誤數(shù)據(jù)的識別率。
3.2 算法分析
傳統(tǒng)的直接和上月用水量進行比較的計算方法相對簡單,可以粗略判斷數(shù)據(jù)的合法性,但由于沒有結合用水量隨季節(jié)變化的因素,在季節(jié)交替月份的檢驗效果較差。本文提出的算法,彌補了傳統(tǒng)算法的缺點,但相對計算量較大,具體特點如下:
1)算法依賴于往期數(shù)據(jù)的完整性。若對于不完備的用水數(shù)據(jù)或數(shù)據(jù)質量不高的情形,可以先應用傳統(tǒng)方法進行數(shù)據(jù)積累,當數(shù)據(jù)量積累到1年以上時,便可應用算法。
2)區(qū)分用戶類型的目標是對有相同用水模式的用戶進行分類,本文的用戶分類僅根據(jù)年度月平均用水量,相對比較粗糙,有待進一步改進。但無論何種分類方法,用水模式會隨地域和時間變化而變化,此類算法需要定期更新區(qū)域用戶用水模式數(shù)據(jù)。
3)模型只假設當月用水數(shù)據(jù)只和上月數(shù)據(jù)相關,若能考慮更多月份的用水數(shù)據(jù)和往年同期用水數(shù)據(jù),可能會使模型更加完善。
4 小結
本文設計的用水量校驗算法是抄表系統(tǒng)的一個重要的輔助模塊,在系統(tǒng)實現(xiàn)中,增加了當月待核實數(shù)據(jù)的預測區(qū)間,用于抄表員及時發(fā)現(xiàn)疑似錯誤數(shù)據(jù)。由表4可知,該算法正常數(shù)據(jù)誤判率在7%和11%之間,錯誤數(shù)據(jù)的識別率介于86%和90%之間,取得了相對滿意的校驗效果。進一步優(yōu)化用戶分類方法,形成更為精確的用水模式,將是以后的研究方向。
參考文獻:
[1] 王保義,胡恒,張少敏. 差分隱私保護下面向海量用戶的用電數(shù)據(jù)聚類分析[J]. 電力系統(tǒng)自動化, 2018,42(2):121-127.
[2] 劉春霞,王琰,沈磊,等. 城市典型用戶四季用水模式變化規(guī)律的確定及分析[J]. 供水技術, 2015,9(4):49-52.
[3] 趙太飛,谷偉豪,段延峰. 農(nóng)村居民用水行為的識別方法[J].水資源與水工程學報, 2016,27(4):70-74.
[4] 屈曉淵,張永恒,張鋒,等. 礦區(qū)水環(huán)境數(shù)據(jù)預測模型研究[J]. 電子設計工程, 2016,24(10):45-48.
[5] 陳佳袁,閆杰. 基于ARMA模型的水文數(shù)據(jù)預測[J]. 浙江水利科技,2017(6):27-30.
【通聯(lián)編輯:王力】