汪 華,黃 笞,金石聲
(貴州省氣象信息中心,貴州 貴陽 550002)
區(qū)域中心站服務(wù)器軟件系統(tǒng)優(yōu)化與維護(hù)
汪 華,黃 笞,金石聲
(貴州省氣象信息中心,貴州 貴陽 550002)
區(qū)域自動氣象站具有分布面積廣、資料數(shù)據(jù)準(zhǔn)確、時空分辨率強(qiáng)、傳輸及時的特點(diǎn),在氣象服務(wù)中發(fā)揮著越來越大的作用。該文總結(jié)了近年來區(qū)域中心站服務(wù)器軟件系統(tǒng)在日常運(yùn)行維護(hù)中遇到的問題,提出切實(shí)有效的優(yōu)化和解決方法。
區(qū)域氣象自動站;數(shù)據(jù)庫;中心站
至2011年1月,貴州已在全省范圍內(nèi)建成由1 656個區(qū)域自動站組成的區(qū)域天氣監(jiān)測網(wǎng),由于區(qū)域自動站具有獲取資料準(zhǔn)確度高、收集密度高、站點(diǎn)密度大的特點(diǎn),為災(zāi)害性天氣系統(tǒng)的監(jiān)測、服務(wù)和預(yù)報提供了有力的基礎(chǔ)數(shù)據(jù)支撐,已經(jīng)成為預(yù)報服務(wù)工作中不可或缺的氣象觀測數(shù)據(jù),該系統(tǒng)的穩(wěn)定運(yùn)行在日常業(yè)務(wù)中也顯得越來越重要。本文具體分析了區(qū)域中心站系統(tǒng)在運(yùn)行維護(hù)過程中遇到的問題和解決辦法。
區(qū)域自動站資料是收集密度達(dá)到分鐘級的實(shí)時數(shù)據(jù),時間精度要求非常高,在運(yùn)行過程中時間精度往往成為數(shù)據(jù)收集的關(guān)鍵。由于系統(tǒng)規(guī)定中心站所在計算機(jī)的時間和各個站點(diǎn)之間的時間誤差≤20s,中心站軟件原有的校時功能設(shè)計不夠合理,校時頻率較低,新建站點(diǎn)由于時間誤差常出現(xiàn)數(shù)據(jù)發(fā)送不正常的問題,新版中心站軟件采取了分別對時和高密度的對時機(jī)制保障了站點(diǎn)時間和中心站之間的同步?;蛘咴谛抡军c(diǎn)建設(shè)完成后,通過中心站軟件系統(tǒng)參數(shù)設(shè)置中的采集器參數(shù)日期時間選項進(jìn)行手工校時,保障時間精度的準(zhǔn)確性。為保障業(yè)務(wù)的高可靠性,一般會考慮中心站備份機(jī),一旦發(fā)生故障需要進(jìn)行業(yè)務(wù)切換的時候必須注意主備計算機(jī)之間的時間差,否則中心站和臺站之間的時間誤差將造成數(shù)據(jù)接收不正常,因此在全網(wǎng)布署NTP時間同步服務(wù)器并對重要業(yè)務(wù)機(jī)定期進(jìn)行時間同步是非常必要的。
區(qū)域自動中心站系統(tǒng)的組成結(jié)構(gòu)一直存在一些根本性問題,如客戶端和中心站調(diào)用檢索的是同一個數(shù)據(jù)庫、用戶權(quán)限沒有細(xì)致的規(guī)劃、數(shù)據(jù)庫存儲過程優(yōu)化不夠、中心站軟件沒有考慮系統(tǒng)的高可用性等問題,并且這些問題在區(qū)域自動站站點(diǎn)數(shù)量不斷增加,數(shù)據(jù)接收量日益增大的情況下顯得日益突出。
在2009年面臨異常天氣過程時常因訪問量變大而造成區(qū)域自動站入庫延遲、客戶端用戶訪問緩慢、無法收集實(shí)時數(shù)據(jù)等等故障,而且隨著該類資料在氣象服務(wù)中發(fā)揮越來越重要的作用,客戶端飛速增加、用戶二次開發(fā)對數(shù)據(jù)庫直接進(jìn)行操作、增加新的存儲過程等,都造成系統(tǒng)負(fù)載逐漸增大。
為解決以上出現(xiàn)的問題,根據(jù)實(shí)際情況重新構(gòu)建了區(qū)域自動站運(yùn)行系統(tǒng),采用了數(shù)據(jù)收集和客戶訪問分離的手段有效的緩解了中心站用機(jī)和數(shù)據(jù)庫運(yùn)行的壓力(現(xiàn)在區(qū)域自動站系統(tǒng)的具體架構(gòu)如圖1所示)。整個省級系統(tǒng)包括中心站接收機(jī)、2臺入庫工作站以及相對應(yīng)的3臺數(shù)據(jù)庫組成。其中主區(qū)域中心站主要負(fù)責(zé)各個區(qū)域站點(diǎn)數(shù)據(jù)的定時收集,另外增設(shè)兩臺入庫工作站通過同步方式建立完全相同的數(shù)據(jù)庫,很好的緩解了客戶端對數(shù)據(jù)庫的訪問壓力,同時也對寶貴的實(shí)時數(shù)據(jù)起到了備份作用,從而使整個系統(tǒng)的運(yùn)轉(zhuǎn)更為高效和可靠。
圖1 新區(qū)域自動站系統(tǒng)架構(gòu)
為解決數(shù)據(jù)備份的問題在數(shù)據(jù)庫建立用戶分級制度,定義不同權(quán)限用戶對數(shù)據(jù)庫的分級訪問,為增加區(qū)域自動站數(shù)據(jù)的可用性,經(jīng)過重新構(gòu)建后的區(qū)域自動中心站系統(tǒng)架構(gòu)較好的解決了數(shù)據(jù)的備份問題,完全相同的數(shù)據(jù)庫相互備份并且可以自由進(jìn)行切換,而且由于中心站軟件訪問數(shù)據(jù)庫是獨(dú)立的,可以較好的保障數(shù)據(jù)的收集和入庫,實(shí)際運(yùn)行中系統(tǒng)故障大大減少。
氣象資料數(shù)據(jù)是不可再生的數(shù)據(jù),而且為了方便用戶的研究和查閱,必須具有時序性,現(xiàn)有數(shù)據(jù)分為小時的文件類型數(shù)據(jù)和存放建站以來分鐘數(shù)據(jù)的數(shù)據(jù)庫兩種方式,一旦發(fā)生服務(wù)器硬件故障、系統(tǒng)錯誤等問題可能就會帶來數(shù)據(jù)的丟失和損壞,這對這么長時間累積來的數(shù)據(jù)是非常危險的,因此,數(shù)據(jù)的備份和數(shù)據(jù)安全成為現(xiàn)在迫切需要解決的問題。2009年5月到2010年3月,800多個區(qū)域自動站的數(shù)據(jù)量約為50G,而現(xiàn)有站點(diǎn)基本翻了一倍,預(yù)計2010年年底數(shù)據(jù)庫的容量將可能超過100G。
數(shù)據(jù)庫日志文件是隨著時間增長而增長的,如果長時間不清理,文件會變得特別大,因此需要定期清空,但是日志文件是恢復(fù)數(shù)據(jù)庫的重要依據(jù),因此設(shè)置自動清理數(shù)據(jù)庫日志的自動作業(yè)可以較好的解決這個問題。
手動清理方法:右鍵單擊需要清理的數(shù)據(jù)庫,選擇“屬性”,在“選項”卡上,把故障還原模型設(shè)定為簡單,確定后關(guān)閉;再右鍵單擊該數(shù)據(jù)庫,“所有任務(wù)”-“收縮數(shù)據(jù)庫”,確認(rèn)后即可清除日志文件,最后記得重新選擇“屬性”,將故障還原模型設(shè)置為完全。
自動清理方法:在企業(yè)管理器中進(jìn)入“sql server代理服務(wù)”-“作業(yè)”,選擇“新建作業(yè)”?!俺R?guī)”選項卡中,填寫作業(yè)名稱,具體描述,注意所有者最好還是用sa或者默認(rèn)的管理帳號。利用sql server代理服務(wù),建立sql腳本執(zhí)行自動作業(yè)。以下為部分sql腳本。
同時必須注意的是需要將數(shù)據(jù)庫的日志增長修改為100~300M,不能選擇10%的增長,因?yàn)楝F(xiàn)有數(shù)據(jù)庫已經(jīng)達(dá)到80G左右,如果每次增長10%,需要開辟10%(8G)的空間,同時如果數(shù)據(jù)還在入庫的話將會引起空間開辟超時,將會造成入庫緩慢的問題。
區(qū)域氣象自動站具有準(zhǔn)確、便捷收集小尺度范圍內(nèi)氣象要素情況的特點(diǎn),并且減少了復(fù)雜地形下人類無法進(jìn)行連續(xù)觀測的盲區(qū),在提高精細(xì)化定點(diǎn)、定時預(yù)報的準(zhǔn)確率等工作中發(fā)揮了重要的作用,通過對該系統(tǒng)架構(gòu)的改變,解決了系統(tǒng)穩(wěn)定性的問題,在2010年的汛期前,站點(diǎn)由800多個增加到1400多個的情況下,系統(tǒng)運(yùn)行穩(wěn)定,為氣象原始數(shù)據(jù)的收集和預(yù)報服務(wù)提供了穩(wěn)定的數(shù)據(jù)基礎(chǔ)。
[1] 李莉,等.影響自動站數(shù)據(jù)傳輸質(zhì)量的幾個主要原因[J].氣象水文海洋儀器,2008(4):41-42.
[2] 蘇禹賓,譚龍.自動氣象站的實(shí)時數(shù)據(jù)傳輸控制策略[J]. 氣象水文海洋儀器,2009(01):55-57.
[3] 林修棟,彭雯,程立渤.區(qū)域自動氣象站的日常維護(hù)與故障排查[J].現(xiàn)代農(nóng)業(yè)科技 ,2009(19):295.
TP311
B
1003-6598(2011)02-0046-02
2010-09-28
汪華(1974-),女,高工,主要從事網(wǎng)絡(luò)管理工作。