姚志平 王洋 陳曦 張健
摘 要:吉林省預(yù)警信息發(fā)布系統(tǒng)承擔(dān)省內(nèi)自然災(zāi)害、事故災(zāi)害、公共衛(wèi)生事件和社會安全事件突發(fā)事件預(yù)警信息的統(tǒng)一采集、分類管理和安全對接工作,充分發(fā)揮公益氣象預(yù)警服務(wù)對現(xiàn)代氣象預(yù)警業(yè)務(wù)和氣象預(yù)警事業(yè)的引領(lǐng)作用。要保障系統(tǒng)穩(wěn)定運行,及時發(fā)布預(yù)警信息,需要建立安全、穩(wěn)定、可靠的運維保障措施,確保吉林省預(yù)警信息發(fā)布系統(tǒng)穩(wěn)定運行。
關(guān)鍵詞:預(yù)警信息;系統(tǒng)運維;保障措施
中圖分類號:TP311.5 文獻標(biāo)識碼:A 文章編號:1671-2064(2020)08-0052-02
1 保障目標(biāo)
吉林省預(yù)警信息發(fā)布系統(tǒng)包括預(yù)警發(fā)布管理子系統(tǒng),應(yīng)用服務(wù)子系統(tǒng),綜合研判與精準(zhǔn)發(fā)布子系統(tǒng),監(jiān)控與反饋評估子系統(tǒng)等四個子系統(tǒng)(以下簡稱“預(yù)警發(fā)布系統(tǒng)”)運行情況的監(jiān)控和管理,及時發(fā)現(xiàn)系統(tǒng)運行中的問題并對系統(tǒng)進行調(diào)優(yōu),提高預(yù)警信息發(fā)布系統(tǒng)運行效率,及時清理一些垃圾日志文件,釋放系統(tǒng)運行存儲空間和內(nèi)存資源,確保足夠的內(nèi)存和CPU資源去承載各類預(yù)警信息發(fā)布任務(wù),及時將預(yù)警信息傳達到應(yīng)急責(zé)任人和社會公眾,提高人民防災(zāi)避險意識,真正實現(xiàn)預(yù)警信息讓人民生命更安全。
2 任務(wù)范圍
省預(yù)警信息發(fā)布系統(tǒng)維護任務(wù)主要包括硬件及系統(tǒng)平臺維護、應(yīng)用軟件維護、數(shù)據(jù)維護等三方面。其中:硬件及系統(tǒng)平臺的維護主要包括終端故障和網(wǎng)絡(luò)故障維護,以及相應(yīng)的硬件配置和系統(tǒng)配置等內(nèi)容;應(yīng)用系統(tǒng)的維護主要包括系統(tǒng)執(zhí)行預(yù)警信息發(fā)布任務(wù)時,所執(zhí)行的任務(wù)指令和業(yè)務(wù)流程,保障應(yīng)用系統(tǒng)各功能模塊運行正常;數(shù)據(jù)的維護主要包括信息目錄的維護,增量數(shù)據(jù)的采集、更新、修正、備份及恢復(fù)等內(nèi)容。預(yù)警發(fā)布系統(tǒng)服務(wù)范圍包括:系統(tǒng)運行相關(guān)操作系統(tǒng)、數(shù)據(jù)庫、業(yè)務(wù)應(yīng)用系統(tǒng)。
2.1 操作系統(tǒng)運維
針對預(yù)警發(fā)布系統(tǒng)運行的服務(wù)器主機Windows操作系統(tǒng)進行定期的漏洞識別和漏洞修復(fù);查看系統(tǒng)進程狀態(tài),CPU利用率、內(nèi)存利用率等方面指標(biāo)是否滿足運行要求。
2.2 數(shù)據(jù)庫運維
預(yù)警發(fā)布系統(tǒng)的數(shù)據(jù)庫運維服務(wù)內(nèi)容主要包括對數(shù)據(jù)庫進行監(jiān)控、優(yōu)化、數(shù)據(jù)備份和故障處理。監(jiān)控的內(nèi)容包含對時長、表空間可用率、緩沖區(qū)命中率、數(shù)據(jù)字典命中率、庫存命中率、可用內(nèi)存和統(tǒng)計時長進行監(jiān)控。數(shù)據(jù)備份通過腳本或設(shè)定任務(wù)計劃進行定期備份。保證業(yè)務(wù)系統(tǒng)的數(shù)據(jù)安全和出現(xiàn)故障時能夠及時準(zhǔn)確的進行數(shù)據(jù)恢復(fù)。
2.3 預(yù)警發(fā)布軟件升級
針對預(yù)警發(fā)布系統(tǒng)的業(yè)務(wù)應(yīng)用系統(tǒng)運維服務(wù)包括:對用戶在應(yīng)用系統(tǒng)使用過程中遇到的操作問題進行7×24h的答疑;應(yīng)用系統(tǒng)的源代碼和中間件的部署、調(diào)試和備份工作;業(yè)務(wù)應(yīng)用系統(tǒng)功能的完善、版本的升級和補丁升級等;對業(yè)務(wù)應(yīng)用系統(tǒng)程序和數(shù)據(jù)進行定時備份,確保預(yù)警信息發(fā)布軟件升級過程中,導(dǎo)致軟件運行故障,以便及時恢復(fù)到軟件升級前狀態(tài),保障軟件系統(tǒng)運行的連貫性。同時,通過對預(yù)警信息發(fā)布軟件功能進行擴展,性能進行升級,適應(yīng)新媒體預(yù)警信息產(chǎn)品的需求,提高預(yù)警信息的覆蓋面。
3 運維方式
對預(yù)警發(fā)布系統(tǒng)相關(guān)的操作系統(tǒng)、數(shù)據(jù)庫、中間件等提供有效巡檢服務(wù),保障預(yù)警發(fā)布系統(tǒng)運行的安全性和穩(wěn)定性,及時發(fā)現(xiàn)和處理故障隱患。
4 保障措施
在運維服務(wù)保障過程中,意外情況很難完全避免,針對預(yù)警發(fā)布系統(tǒng)使用的實際情況,制定了詳細(xì)、嚴(yán)謹(jǐn)、高效的應(yīng)急處理預(yù)案。運維保障人員能夠按照事先制定的預(yù)案流程進行操作,解決突發(fā)故障問題,積累系統(tǒng)運行維護經(jīng)驗,提高運維人員解決問題的效率。
4.1 基本流程
基本流程圖1所示。
4.2 應(yīng)急處理流程
在采用應(yīng)急故障搶修預(yù)案時,運維工程師會以電話及郵件的形式通知其他技術(shù)工程師,設(shè)備廠家技術(shù)工程師進行技術(shù)支持工作,在最短時間內(nèi)解決該故障,同時用備件替換故障設(shè)備,保障系統(tǒng)穩(wěn)定運行。
4.3 預(yù)防措施
預(yù)防措施主要是防范故障風(fēng)險,提前對系統(tǒng)運行情況進行評估,并對評估報告進行分析,提前對系統(tǒng)進行優(yōu)化。通過分類整理常見的故障類型,制定行之有效的預(yù)防措施和處理方法。具體如表1所示。
5 運行維護
吉林省預(yù)警信息發(fā)布系統(tǒng)技術(shù)支持工程師經(jīng)驗豐富,熟悉掌握各級發(fā)布功能模塊間信息交互機制,制定詳細(xì)的工作流程和保障措施,確保預(yù)警信息發(fā)布系統(tǒng)業(yè)務(wù)功能運行穩(wěn)定,具備故障監(jiān)控報警功能。
平臺維護主要包括預(yù)警信息系統(tǒng)專用網(wǎng)絡(luò)、DMZ安全網(wǎng)絡(luò)區(qū)域和Internet網(wǎng)絡(luò)發(fā)布區(qū)。設(shè)計不同網(wǎng)絡(luò)之間的接口協(xié)議,自動監(jiān)測網(wǎng)絡(luò)心跳,確保網(wǎng)絡(luò)通信暢通,為系統(tǒng)運行提供穩(wěn)定可靠的網(wǎng)絡(luò)鏈路,利用規(guī)范的網(wǎng)絡(luò)實時監(jiān)測工具對網(wǎng)絡(luò)通信狀態(tài)進行診斷,對網(wǎng)絡(luò)通信進行優(yōu)化。
應(yīng)用系統(tǒng)的維護主要由應(yīng)用系統(tǒng)設(shè)計人員負(fù)責(zé)升級維護,在軟件系統(tǒng)建設(shè)的質(zhì)保期在維護期內(nèi),無條件對軟件進行升級維護,保障軟件各項功能正常運行穩(wěn)定。同時,加強對軟件操作人員進行培訓(xùn),至少具備解決常見應(yīng)用系統(tǒng)故障的能力。業(yè)務(wù)運行單位要組建維護隊伍開展應(yīng)用系統(tǒng)的改正性和完善性維護;對于新增需求,用戶應(yīng)按照新立項目開展系統(tǒng)的開發(fā)建設(shè)工作。
數(shù)據(jù)的維護將按照各項數(shù)據(jù)采集的責(zé)任主體,由行業(yè)主管部門及相關(guān)人員完成,如需改變數(shù)據(jù)交換平臺的數(shù)據(jù)轉(zhuǎn)化接口,則應(yīng)加強與軟硬件平臺維護方的溝通協(xié)調(diào),但不得輕易改變信息資源的數(shù)據(jù)庫結(jié)構(gòu)。
6 結(jié)語
吉林省預(yù)警信息發(fā)布系統(tǒng)運維保障工作直接關(guān)系到預(yù)警信息的精準(zhǔn)發(fā)布,熟悉整個系統(tǒng)的硬件構(gòu)架和軟件系統(tǒng)的業(yè)務(wù)流程,加強資源共享,建立集約高效的預(yù)警信息發(fā)布體系,形成合力,能更好地服務(wù)于各級突發(fā)事件預(yù)防、應(yīng)急和處置工作,保障預(yù)警信息發(fā)布系統(tǒng)的穩(wěn)定運行。