雷東海 王林 馮會芳
摘要:隨著信息化時代的來臨,信息技術(shù)促進了各行各業(yè)生產(chǎn)力和生產(chǎn)效率的提升。在水文的管理中,信息化的運用對水資源的管理水平和利用效率的提升提供了重要基礎(chǔ)。但是目前水文信息化建設(shè)中還存在較多難題,如信息化基礎(chǔ)建設(shè)落后,信息體系不完善等,不利于水文數(shù)據(jù)管理的可持續(xù)發(fā)展,因此,水文數(shù)據(jù)對分析系統(tǒng)的設(shè)計對提升水文勘測工作有著重要意義。
關(guān)鍵詞:水文數(shù)據(jù);多維分析系統(tǒng);設(shè)計與實現(xiàn)
引言:在水文勘察工作中運用網(wǎng)絡(luò)、數(shù)據(jù)庫等技術(shù)獲取與分析數(shù)據(jù)信息,可以有效分配資源,優(yōu)化管理模式。通過數(shù)據(jù)多為系統(tǒng)的建設(shè),挖掘蘊藏于水文數(shù)據(jù)中的知識,已成為水文科學(xué)發(fā)展的新熱點。本文主要分析了多為分析系統(tǒng)的設(shè)計方案以及關(guān)鍵技術(shù)的運用,從而使水文勘測工作與信息技術(shù)有效的融合到一起。
1、系統(tǒng)功能
系統(tǒng)各模塊的功能系統(tǒng)主要有數(shù)據(jù)獲取與處理、模型設(shè)計與建立、數(shù)據(jù)分析展現(xiàn)三大部分構(gòu)成:
1.1數(shù)據(jù)獲取與處理功能
主要有水文數(shù)據(jù)獲取和水文數(shù)據(jù)的處理兩個部分。采用水文歷史數(shù)據(jù)作為系統(tǒng)的源數(shù)據(jù)。由于源數(shù)據(jù)的不完整性,其中存在大量的空值、噪聲數(shù)據(jù)和不規(guī)范數(shù)據(jù),因此在進行數(shù)據(jù)挖掘前必須對其進行空值處理、極端數(shù)據(jù)處理等預(yù)處理,為下一階段的數(shù)據(jù)挖掘提供高質(zhì)量的、清潔的數(shù)據(jù)。
1.2模型設(shè)計與建立功能
主要包括數(shù)據(jù)倉庫和數(shù)據(jù)立方體的設(shè)計與建立兩個部分。數(shù)據(jù)倉庫設(shè)計與建立:根據(jù)面向主題、數(shù)據(jù)驅(qū)動和原型法設(shè)計三個原則,設(shè)計并建立相應(yīng)的概念模型、邏輯模型、物理模型,最后完成數(shù)據(jù)倉庫模型的建立。數(shù)據(jù)立方體設(shè)計與建立:根據(jù)數(shù)據(jù)倉庫中的數(shù)據(jù)設(shè)計出維度和度量,以及維度中的層次關(guān)系,從而設(shè)計出相應(yīng)的數(shù)據(jù)立方體,最后通過商業(yè)智能解決方案工具完成數(shù)據(jù)立方體的建立。
1.3數(shù)據(jù)分析展現(xiàn)功能
基于B/S架構(gòu),利用數(shù)據(jù)表,柱狀圖,圓餅圖等方式在Web網(wǎng)頁上展現(xiàn)針對不同主題的數(shù)據(jù)。
2、系統(tǒng)各模塊設(shè)計方案
2.1數(shù)據(jù)獲取與處理
數(shù)據(jù)的獲取:原始數(shù)據(jù)來自于全國基礎(chǔ)水文數(shù)據(jù)庫,數(shù)據(jù)的時間范圍為建站年份到2000年。原始數(shù)據(jù)包含測站信息,降水量信息,水面蒸發(fā)量信息,水溫信息,平均水位信息,平均流量信息,平均含沙量信息和平均輸沙率信息等眾多信息,其中不乏會有一些空值數(shù)據(jù)和錯誤的數(shù)據(jù),所以要對原始數(shù)據(jù)進行處理。數(shù)據(jù)的處理:經(jīng)過檢查,原始數(shù)據(jù)中存在大量的空值、噪聲數(shù)據(jù)和重復(fù)值,因此采用如下方法進行處理:對于重復(fù)值,直接刪除這些重復(fù)的記錄;對于不是大規(guī)模連續(xù)出現(xiàn)的空值,采用求15日均值填充該空值的方法來消除;對于連續(xù)的超過五天但不超過一月的空值,采用求臨近5年同期平均值填充來消除;對于連續(xù)一個月以上的空值,則刪除所有測站同期記錄,剔除該月份或年份的所有記錄。
2.2模型設(shè)計。
2.2.1數(shù)據(jù)倉庫的設(shè)計
選取對水文要素的統(tǒng)計分析作為數(shù)據(jù)倉庫的應(yīng)用主題。下面分別介紹數(shù)據(jù)倉庫中概念模型、邏輯模型和物理模型的設(shè)計。(1)概念模型設(shè)計:水文數(shù)據(jù)倉庫以水文要素為事實,其具體的度量為降水量、水面蒸發(fā)量、平均水位、平均流量、平均含沙量、平均輸沙率、平均水溫?;谒囊氐臅r空間分布特點,設(shè)計了測站維(包含一個“測站”層次)、時間維(包含“年”、“月”、“日”三個層次)、空間維(包含“流域”、“水系”、“測站”三個層次);行政區(qū)劃維(包含“省”、“市”、“縣”三個層次)共四個。(2)邏輯模型設(shè)計:邏輯模型設(shè)計主要是基于上一階段設(shè)計的概念模型,定義數(shù)據(jù)組織的邏輯結(jié)構(gòu),將其轉(zhuǎn)換為邏輯模型。在數(shù)據(jù)倉庫的邏輯模型設(shè)計中,最常用的是星型模型。水文要素的統(tǒng)計分析主題的邏輯模型設(shè)計如下:維度表:測站維表、時間維表、行政區(qū)劃維表、空間維表。事實表:水文要素事實表。度量指標(biāo):降水量(毫米)、水面蒸發(fā)量(毫米)、平均水位(米)、平均流量(m3/s)、平均含沙量(kg/m3)、平均輸沙率(kg/s)、平均水溫(攝氏度)。(3)物理模型的設(shè)計:數(shù)據(jù)倉庫的物理模型設(shè)計是邏輯模型在具體DBMS上的物理實現(xiàn),包括了表的數(shù)據(jù)結(jié)構(gòu)類型定義、索引策略制定、數(shù)據(jù)存儲分配等,其具體內(nèi)容表現(xiàn)為數(shù)據(jù)庫中的物理表。
2.1.2數(shù)據(jù)立方體的設(shè)計
立方體的維表示事實表中的維。立方體的每個單元表示一個事實,它與立方體中不同維度的粒度對應(yīng)。
3、信息服務(wù)平臺建設(shè)
水文綜合信息服務(wù)系統(tǒng)是一個大型復(fù)雜的系統(tǒng),也是省水文綜合業(yè)務(wù)系統(tǒng)的基礎(chǔ)支撐系統(tǒng),不能作為一個獨立的項目單獨建設(shè),為此建立了統(tǒng)一的信息服務(wù)平臺并在此平臺上進行開發(fā),實現(xiàn)多庫共享、應(yīng)用有機集成等要求。
4.分析展現(xiàn)
水文數(shù)據(jù)多維分析系統(tǒng)的數(shù)據(jù)可視化功能和OLAP查詢分析基于Cognos服務(wù)實現(xiàn)。以降水量這一水文要素為例進行分析展現(xiàn)的說明。降水量數(shù)據(jù)可視化:水文數(shù)據(jù)多維分析系統(tǒng)有多種可視化方式,包括表格,柱狀圖,圓餅圖,折線圖等等。例如將空間維和時間維分別拖拽至表格的行和列,然后將降水量和最大降水量兩個度量也拖拽至行中,便可以查看從1985年開始不同流域降水量和最大降水量的情況。降水量OLAP查詢分析:對于對于有層次結(jié)構(gòu)的維度,前臺頁面可提供數(shù)據(jù)鉆取,切片切塊、旋轉(zhuǎn)等功能。
總結(jié):為了全面了解水文信息,分析水文數(shù)據(jù),設(shè)計水文多維分析系統(tǒng)可以實現(xiàn)數(shù)據(jù)倉庫的設(shè)計、建模;數(shù)據(jù)抽取、轉(zhuǎn)換與加載;數(shù)據(jù)存儲與管理;數(shù)據(jù)展現(xiàn),為水利綜合決策提供了決策支持。
參考文獻:
[1]李永強.淺析水庫長期水文預(yù)報系統(tǒng)的多預(yù)報思路[J].珠江水運.2015,(9).68-69.
[2]閆家琿,王一匡.水庫長期水文預(yù)報系統(tǒng)的多預(yù)報思路[J].科技展望.2017,(6).105.
[3占曉安.數(shù)據(jù)挖掘技術(shù)在水庫調(diào)度中的研究與應(yīng)用.2017.