鄭 凱,李秉哲
(1.山東黃河河務(wù)局信息中心,山東 濟(jì)南 250011;2.濟(jì)南黃河河務(wù)局供水局,山東 濟(jì)南 250032)
隨著信息技術(shù)的不斷完善和廣泛應(yīng)用,加快了山東黃河信息化建設(shè)進(jìn)程,黃河人的工作方式發(fā)生了巨大變化,各項(xiàng)工作對(duì)信息化的依賴程度越來(lái)越強(qiáng),隨之而來(lái)的運(yùn)維管理孤島現(xiàn)象也日益突出,嚴(yán)重影響了治黃業(yè)務(wù)的開(kāi)展,運(yùn)維工作的“一站式”信息化管理平臺(tái)急需建立。
目前,山東黃河信息通信系統(tǒng)網(wǎng)絡(luò)重要機(jī)房包括山東黃河信息中心機(jī)房、省局網(wǎng)管中心機(jī)房和濼口通信站機(jī)房,機(jī)房里各種各樣的IT硬件設(shè)備,不同類(lèi)型的系統(tǒng)需要維護(hù),沒(méi)有統(tǒng)一的管理平臺(tái),現(xiàn)有的管理工具功能太分散,只能對(duì)應(yīng)單點(diǎn)功能,不能實(shí)現(xiàn)信息的共享。
山東黃河目前的運(yùn)維處理方式主要依靠人工運(yùn)維,機(jī)房管理大都采用工作人員定時(shí)巡查的方式,這種方式不能時(shí)時(shí)全面監(jiān)控和掌握機(jī)房及系統(tǒng)情況,由于系統(tǒng)業(yè)務(wù)多,人員數(shù)量、精力有限,缺乏真正的主動(dòng)問(wèn)題管理,以及性能趨勢(shì)預(yù)測(cè)和應(yīng)急準(zhǔn)備,管理效率低下。
雖然部分管理系統(tǒng)設(shè)置了各種管理流程,但許多是通過(guò)執(zhí)行人員人工操作來(lái)完成的,沒(méi)有實(shí)現(xiàn)自動(dòng)化管理過(guò)程。服務(wù)管理流程的不完善和基本執(zhí)行失敗的重復(fù),使員工應(yīng)接不暇,導(dǎo)致了管理效率低下。
傳統(tǒng)的運(yùn)維方式只能解決當(dāng)前故障,沒(méi)有完善的、規(guī)范化的流程控制管理工具,缺少統(tǒng)一、規(guī)范的指導(dǎo)文檔,很難實(shí)現(xiàn)信息系統(tǒng)的統(tǒng)一管理和資源共享。
通過(guò)構(gòu)建綜合運(yùn)維管理平臺(tái)建設(shè),可以實(shí)現(xiàn)現(xiàn)有機(jī)房?jī)?nèi)所有監(jiān)控硬件設(shè)備的集中整合,實(shí)現(xiàn)數(shù)據(jù)的統(tǒng)一獲取和處理,通過(guò)集中式的管理模式對(duì)山東黃河信息化中心的機(jī)房環(huán)境和信息化系統(tǒng)中的存儲(chǔ)設(shè)備、服務(wù)器、網(wǎng)絡(luò)交換機(jī)、OA辦自動(dòng)化系統(tǒng)、數(shù)據(jù)庫(kù)等的運(yùn)行狀態(tài)進(jìn)行統(tǒng)一的監(jiān)控管理,實(shí)現(xiàn)機(jī)房的無(wú)人值守,維護(hù)人員能夠全面掌握信息系統(tǒng)的運(yùn)行狀態(tài),增強(qiáng)運(yùn)維綜合管理能力。
構(gòu)建機(jī)房動(dòng)力環(huán)境監(jiān)測(cè)系統(tǒng),實(shí)現(xiàn)對(duì)溫度、濕度、煙感、水浸等資源的統(tǒng)一監(jiān)控,并結(jié)合基礎(chǔ)資源的監(jiān)控管理,實(shí)現(xiàn)對(duì)機(jī)房的物理環(huán)境與業(yè)務(wù)服務(wù)的一體化管理,并提供告警和報(bào)表功能。
綜合運(yùn)維監(jiān)控系統(tǒng)通過(guò)集中式的管理模式對(duì)機(jī)房環(huán)境和信息化系統(tǒng)中的服務(wù)器、網(wǎng)絡(luò)交換機(jī)、業(yè)務(wù)應(yīng)用系統(tǒng)等設(shè)備的運(yùn)行狀態(tài)進(jìn)行統(tǒng)一的監(jiān)控管理和信息系統(tǒng)資源管理,提供有效評(píng)價(jià)運(yùn)維質(zhì)量的數(shù)據(jù)統(tǒng)計(jì)分析,確保達(dá)到“時(shí)時(shí)監(jiān)控、及時(shí)告警、協(xié)同分析、定期統(tǒng)計(jì)”的目的,增強(qiáng)運(yùn)維綜合管理能力。
1)基礎(chǔ)設(shè)施監(jiān)控平臺(tái)。通過(guò)SNMP等協(xié)議完成對(duì)多個(gè)機(jī)房的傳輸系統(tǒng)、IP層網(wǎng)絡(luò)設(shè)備進(jìn)行監(jiān)控,對(duì)網(wǎng)絡(luò)設(shè)備的基本信息、可用性、性能、配置等指標(biāo)進(jìn)行采集和管理,幫助管理人員及時(shí)發(fā)現(xiàn)故障以及故障隱患。支持配置管理、網(wǎng)絡(luò)拓?fù)涔芾?、IP地址管理等。平臺(tái)主要有網(wǎng)絡(luò)設(shè)備監(jiān)控管理、服務(wù)器監(jiān)控管理、數(shù)據(jù)庫(kù)監(jiān)控管理、中間件監(jiān)控管理、J2EE應(yīng)用服務(wù)器監(jiān)控管理、基礎(chǔ)應(yīng)用平臺(tái)管理、存儲(chǔ)監(jiān)控管理、綜合可視化等功能。
2)應(yīng)用監(jiān)控平臺(tái)。應(yīng)用監(jiān)控平臺(tái)從業(yè)務(wù)視角對(duì)信息化資源進(jìn)行管理,提供一頁(yè)式業(yè)務(wù)運(yùn)行概覽視圖,將信息化健康指數(shù)、業(yè)務(wù)雷達(dá)實(shí)時(shí)掃描、業(yè)務(wù)卡片集中在一個(gè)頁(yè)面內(nèi)進(jìn)行顯示,通過(guò)這個(gè)頁(yè)面可以了解整體業(yè)務(wù)的健康走勢(shì)、業(yè)務(wù)實(shí)時(shí)運(yùn)行狀況、告警信息、健康度、繁忙度和可用性等信息。平臺(tái)主要包括業(yè)務(wù)服務(wù)概覽、業(yè)務(wù)雷達(dá)、業(yè)務(wù)卡片、業(yè)務(wù)服務(wù)一覽、應(yīng)用診斷、指標(biāo)列表、業(yè)務(wù)告警、業(yè)務(wù)應(yīng)用分析、IT健康指數(shù)等功能。
日常維護(hù)管理是通過(guò)監(jiān)控系統(tǒng)的各項(xiàng)設(shè)備,對(duì)流量信息進(jìn)行分析,對(duì)IP資源進(jìn)行管理,自動(dòng)完成對(duì)選定設(shè)備指標(biāo)的巡檢工作,幫助管理員梳理頻繁變化的虛擬化資源,快速判斷用戶網(wǎng)絡(luò)接入的問(wèn)題所在,支持對(duì)windows日志和syslog日志的監(jiān)控管理,可生成面向運(yùn)維分析和服務(wù)管理的統(tǒng)計(jì)分析,協(xié)助領(lǐng)導(dǎo)層的管理決策。平臺(tái)主要包括:告警中心、流量分析、IP地址管理、網(wǎng)絡(luò)配置管理、自動(dòng)巡檢、資源掃描、日志監(jiān)控管理、端到端追蹤、統(tǒng)計(jì)報(bào)表等功能。
綜合運(yùn)維管理平臺(tái)的應(yīng)用,將山東黃河駐濟(jì)信息通信專網(wǎng)內(nèi)的各個(gè)機(jī)房動(dòng)力環(huán)境以及計(jì)算機(jī)網(wǎng)絡(luò)、數(shù)據(jù)庫(kù)、業(yè)務(wù)應(yīng)用等都統(tǒng)一納入到一個(gè)監(jiān)控平臺(tái)中來(lái),對(duì)各種不同來(lái)源的數(shù)據(jù)實(shí)行統(tǒng)一權(quán)限控制;實(shí)現(xiàn)了資源管理系統(tǒng)、業(yè)務(wù)過(guò)程和關(guān)鍵業(yè)務(wù)指標(biāo)的監(jiān)控,能及時(shí)發(fā)現(xiàn)業(yè)務(wù)異常和問(wèn)題,可持續(xù)提升系統(tǒng)能力,切實(shí)提高了工作效率。