支亞京,卜英竹,陳貞宏,楊恩波
(1.貴州省氣象信息中心,貴州 貴陽 550002;2.貴州省生態(tài)氣象和衛(wèi)星遙感中心,貴州 貴陽 550002; 3.貴州省安順市氣象局,貴州 安順 561000;4.貴州省松桃苗族自治縣氣象局,貴州 松桃 554100)
2014年4月30日,中國氣象局預(yù)報與網(wǎng)絡(luò)司下發(fā)的《預(yù)報司關(guān)于印發(fā)全國地面自動氣象站實時觀測資料質(zhì)量評估辦法通知》中提到,為了加強臺站數(shù)據(jù)處理能力和提高數(shù)據(jù)質(zhì)量,要對自動氣象站觀測數(shù)據(jù)進行質(zhì)量考核。數(shù)據(jù)質(zhì)量統(tǒng)計有助于綜合考核臺站數(shù)據(jù)質(zhì)量,提高全國自動氣象站資料質(zhì)量,促進自動氣象站資料在國家、省級氣象業(yè)務(wù)和服務(wù)中的應(yīng)用。貴州省觀測網(wǎng)絡(luò)處為了加強本省臺站數(shù)據(jù)處理能力和提高數(shù)據(jù)質(zhì)量,對本省自動氣象站數(shù)據(jù)按照中國氣象局觀測司地面觀測數(shù)據(jù)質(zhì)量評估辦法進行考核,其質(zhì)量評估對象包括國家級自動氣象站(不包含無人值守氣象站)和考核區(qū)域站。
氣象資料業(yè)務(wù)系統(tǒng)(Meteorological Data Operational System, MDOS)[1-2]實現(xiàn)了國家、省、臺站三級觀測數(shù)據(jù)收發(fā)、數(shù)據(jù)質(zhì)量控制(以下簡稱,數(shù)據(jù)質(zhì)控)、數(shù)據(jù)處理及應(yīng)用等流程,實現(xiàn)了歷史資料和實時資料業(yè)務(wù)一體化,全面提高各類氣象資料的應(yīng)用。MDOS系統(tǒng)完成的質(zhì)量統(tǒng)計包括國家站(包含無人值守氣象站)和所有區(qū)域自動氣象站(無考核區(qū)域站和非考核區(qū)域站之分)質(zhì)量統(tǒng)計。其統(tǒng)計結(jié)果與國家氣象局和貴州省質(zhì)量考核對象不一致,每次進行觀測數(shù)據(jù)質(zhì)量統(tǒng)計,業(yè)務(wù)人員需要人工將非考核臺站從質(zhì)量統(tǒng)計結(jié)果中剔除,再重新計算考核站觀測數(shù)據(jù)質(zhì)量,增加了業(yè)務(wù)人員的工作量,有時統(tǒng)計結(jié)果不準確。
數(shù)據(jù)質(zhì)量控制碼規(guī)定如表1所示:
表1 數(shù)據(jù)質(zhì)量控制碼規(guī)定Tab.1 Data quality control code specification
評估氣象觀測數(shù)據(jù)質(zhì)量的4個指標分別是:數(shù)據(jù)可用率、數(shù)據(jù)錯誤率、數(shù)據(jù)可疑率和數(shù)據(jù)缺測率,通過統(tǒng)計MDOS數(shù)據(jù)庫中數(shù)據(jù)質(zhì)控碼來反映氣象觀測數(shù)據(jù)質(zhì)量狀況。統(tǒng)計方法如下:
假設(shè)有n(1,2,…,i,…)個臺站進行觀測數(shù)據(jù)質(zhì)量統(tǒng)計,其中,第i個臺站在觀測運行期間數(shù)據(jù)個數(shù)為應(yīng)有數(shù)據(jù)個數(shù)i,對通過質(zhì)量檢查的數(shù)據(jù)個數(shù)i、錯誤數(shù)據(jù)個數(shù)i、可疑數(shù)據(jù)個數(shù)i以及缺測數(shù)據(jù)個數(shù)i進行統(tǒng)計,則該站觀測數(shù)據(jù)質(zhì)量統(tǒng)計結(jié)果為:
(1)
(2)
(3)
(4)
數(shù)據(jù)可用率i、數(shù)據(jù)錯誤率i、數(shù)據(jù)可疑率i和數(shù)據(jù)缺測率i滿足如下關(guān)系式:
數(shù)據(jù)可用率i+數(shù)據(jù)錯誤率i+數(shù)據(jù)可疑率i+數(shù)據(jù)缺測率i=100%
(5)
n個觀測數(shù)據(jù)質(zhì)量統(tǒng)計結(jié)果為:
(6)
(7)
(8)
(9)
系統(tǒng)的設(shè)計流程是:首先,按地市讀入自定義的臺站配置表,根據(jù)臺站號按照各類臺站考核要素,通過讀取本地MDOS oracle數(shù)據(jù)庫臺站信息表中的觀測要素標識碼來判斷該臺站是否觀測此要素,計算該臺站考核要素中總觀測要素個數(shù)。其次,遍歷對應(yīng)臺站逐時次的小時數(shù)據(jù)表,獲取查詢時間段的考核要素質(zhì)控碼。最后,通過遍歷質(zhì)控碼,根據(jù)可用率計算公式得到各臺站和各地市的可用率,輸出到Excel表格中。系統(tǒng)的程序結(jié)構(gòu)邏輯圖如圖1 所示:
圖1 程序結(jié)構(gòu)邏輯圖Fig.1 Logic diagram of program structure
系統(tǒng)設(shè)計的核心基于Windows系統(tǒng)的客戶端-服務(wù)器端(以下簡稱C/S)架構(gòu)體系和MDOS2.1的ORACLE 11g數(shù)據(jù)庫。利用Micorosoft Visual Studio 2010[5]在此數(shù)據(jù)庫的基礎(chǔ)上進行二次開發(fā)。邏輯結(jié)構(gòu)為典型的三層C/S結(jié)構(gòu):表示層、功能層、數(shù)據(jù)層。系統(tǒng)界面即為表示層,負責用戶與應(yīng)用間的交互,業(yè)務(wù)人員可以直接進行操作;功能層是觀測數(shù)據(jù)質(zhì)量統(tǒng)計功能編入程序中;數(shù)據(jù)層即數(shù)據(jù)管理系統(tǒng),負責對ORACLE 11g 數(shù)據(jù)庫的查詢[5]。各模塊在邏輯上獨立,邏輯結(jié)構(gòu)圖如圖2所示:
圖2 系統(tǒng)邏輯結(jié)構(gòu)圖Fig.2 System logic structure diagram
本系統(tǒng)能夠根據(jù)用戶需求,統(tǒng)計任意時間段內(nèi)任意可用率閾值地面觀測數(shù)據(jù)的可用率,系統(tǒng)包括國家級自動氣象站的可用率統(tǒng)計、考核區(qū)域站的可用率統(tǒng)計以及所有區(qū)域站的可用率統(tǒng)計。在界面上選擇好時間、文件存放路徑、可用率閾值之后,需要統(tǒng)計哪類觀測資料數(shù)據(jù)質(zhì)量就點擊相應(yīng)的按鈕,期間可以顯示出當前資料數(shù)據(jù)質(zhì)量統(tǒng)計的運行進度,其統(tǒng)計結(jié)果便于業(yè)務(wù)人員統(tǒng)計了解全省各個地市數(shù)據(jù)質(zhì)量情況。系統(tǒng)的主界面圖如圖3 所示:
圖3 系統(tǒng)界面圖Fig.3 System interface diagram
系統(tǒng)可按地市、臺站分別統(tǒng)計國家地面氣象站、區(qū)域氣象站觀測數(shù)據(jù)可用率,對觀測數(shù)據(jù)可用率低于99%的臺站統(tǒng)一列出,根據(jù)業(yè)務(wù)需要統(tǒng)計有關(guān)站數(shù)。以考核區(qū)域站統(tǒng)計結(jié)果為例,圖4 為考核區(qū)域站可用率統(tǒng)計_按臺站升序排列統(tǒng)計結(jié)果圖、圖5為考核區(qū)域站可用率統(tǒng)計_按地市升序排列統(tǒng)計結(jié)果圖、圖6為全省各地市可用率低于99%的臺站個數(shù)的統(tǒng)計結(jié)果圖。
圖4 考核區(qū)域站可用率統(tǒng)計_按臺站升序排列統(tǒng)計結(jié)果圖Fig.4 The statistical results diagram of data availability order by station ascending
圖5 考核區(qū)域站可用率統(tǒng)計_按地市降序排列統(tǒng)計結(jié)果Fig.5 the statistical results diagram of data availability order by city descending
圖6 全省各地市可用率低于99%的臺站個數(shù)的統(tǒng)計結(jié)果Fig.6 Statistical results of the number of stations with a rate of less than 99% in all cities
貴州省地面觀測數(shù)據(jù)質(zhì)量統(tǒng)計結(jié)果有助于臺站工作人員了解本站的數(shù)據(jù)質(zhì)量狀況,及時發(fā)現(xiàn)儀器運行故障、數(shù)據(jù)傳輸失敗、省級數(shù)據(jù)未入庫等問題,有助于省級管理部門掌握全省自動氣象站的運行情況,提高貴州省自動氣象站資料質(zhì)量,為氣象業(yè)務(wù)、服務(wù)中應(yīng)用提供及時準確的觀測數(shù)據(jù)。作為MDOS的輔助系統(tǒng),存在以下待優(yōu)化方面:一是選取時間不夠靈活,目前統(tǒng)計時間間隔為1 d,后續(xù)需要調(diào)整時間間隔為1 h,使數(shù)據(jù)質(zhì)量統(tǒng)計時段更加靈活;二是基于客戶端-服務(wù)器端(C/S)[6]架構(gòu),不便于擴展系統(tǒng)性能,希望改進成瀏覽器端-服務(wù)器端(B/S)架構(gòu)。