周維續(xù),詹全忠
(水利部水利信息中心,北京 100053)
近年來,隨著經(jīng)濟(jì)社會(huì)的不斷進(jìn)步、信息技術(shù)的迅猛發(fā)展和水利事業(yè)的全面推進(jìn),水利信息化逐步深入。特別是 2003 年第一次全國(guó)水利信息化工作會(huì)議以來,全國(guó)水利系統(tǒng)堅(jiān)持以水利信息化帶動(dòng)水利現(xiàn)代化,緊緊圍繞水利中心工作,認(rèn)真組織實(shí)施全國(guó)水利信息化規(guī)劃,初步形成了由基礎(chǔ)設(shè)施、應(yīng)用系統(tǒng)和保障環(huán)境組成的水利信息化綜合體系。水利信息化建設(shè)的快速推進(jìn),有力地支撐了水利勘測(cè)、規(guī)劃、設(shè)計(jì)、科研、建設(shè)、管理、改革等各項(xiàng)工作,特別是在應(yīng)對(duì)頻繁發(fā)生的洪、澇、臺(tái)風(fēng)和干旱等災(zāi)害工作中,發(fā)揮了極其重要的作用,并正在推動(dòng)水利發(fā)展方式發(fā)生深刻轉(zhuǎn)變。然而,隨著水利信息化的發(fā)展,水利信息系統(tǒng)規(guī)模越來越大,對(duì)信息系統(tǒng)運(yùn)行質(zhì)量要求越來越高,任務(wù)越來越重,管理越來越復(fù)雜。如何有效地管理和維護(hù)現(xiàn)有的信息系統(tǒng),保證其高效、穩(wěn)定、安全運(yùn)行,降低運(yùn)營(yíng)成本,提高工作效率及資源利用率,確保其發(fā)揮效益,支撐水利工作,已成為一項(xiàng)十分緊迫而艱巨的任務(wù)[1]。
水利部水利信息中心網(wǎng)絡(luò)中心承擔(dān)水利部信息系統(tǒng)的運(yùn)行保障工作,包括:水利部機(jī)關(guān)終端計(jì)算機(jī)、局域網(wǎng)(政務(wù)外網(wǎng)和內(nèi)網(wǎng))、水利信息網(wǎng)骨干網(wǎng)、主機(jī)及存儲(chǔ)備份系統(tǒng)、數(shù)據(jù)庫(kù)與中間件等應(yīng)用支撐系統(tǒng)、電子政務(wù)系統(tǒng)、防汛抗旱指揮系統(tǒng)、異地會(huì)商視頻會(huì)議系統(tǒng)、水利部網(wǎng)站等運(yùn)行維護(hù)。為了應(yīng)對(duì)不斷發(fā)展的水利部信息系統(tǒng)運(yùn)行保障工作,網(wǎng)絡(luò)中心從 2004 年開展了水利信息系統(tǒng)運(yùn)行保障平臺(tái)研究與應(yīng)用工作,并應(yīng)用研究成果建設(shè)水利部信息系統(tǒng)運(yùn)行保障體系。
隨著運(yùn)行維護(hù)系統(tǒng)的增多、要求的提高,傳統(tǒng)的被動(dòng)式、粗放型維護(hù)方式暴露出很多問題,主要問題如下[2]:
1)維護(hù)工作不規(guī)范。維護(hù)工作存在很多不規(guī)范的地方,如故障處理流程不規(guī)范,存在故障漏報(bào)、處理不及時(shí)的可能;變更存在隨意性大,變更前的風(fēng)險(xiǎn)評(píng)估和應(yīng)對(duì)措施不夠,造成風(fēng)險(xiǎn)難以控制和防范。維護(hù)工作不規(guī)范,工作隨意性大,易引發(fā)人為事故。
2)監(jiān)控不全面。雖然采取了一些監(jiān)控手段,但是不全面,存在很多監(jiān)控盲區(qū),不能全面掌握系統(tǒng)運(yùn)行狀況,系統(tǒng)運(yùn)行面臨極大威脅。
3)自動(dòng)化程度低。運(yùn)行維護(hù)缺乏自動(dòng)化手段,大量時(shí)間花費(fèi)在處理一些簡(jiǎn)單、重復(fù)性勞動(dòng)中,維護(hù)效率低,維護(hù)水平難以提高。
4)技術(shù)能力不足。信息系統(tǒng)的問題復(fù)雜,故障影響范圍大,往往不在故障點(diǎn)顯現(xiàn),需要有全面相互關(guān)聯(lián)的分析處理問題的能力和系統(tǒng)、全面集成化的解決方案。
5)應(yīng)急處置機(jī)制不健全。應(yīng)急處置機(jī)制不完善,突發(fā)事件處置不及時(shí),可能造成較大影響。
6)分析評(píng)估缺失。沒有及時(shí)對(duì)運(yùn)行維護(hù)工作進(jìn)行總結(jié)評(píng)估,運(yùn)行維護(hù)能力難以提高。
網(wǎng)絡(luò)中心在對(duì)水利部信息系統(tǒng)構(gòu)成(包括基礎(chǔ)設(shè)施和業(yè)務(wù)等對(duì)象)充分調(diào)查分析的基礎(chǔ)上,對(duì)現(xiàn)有運(yùn)行保障技術(shù)手段、組織架構(gòu)、工作模式和內(nèi)容等進(jìn)行研究總結(jié),運(yùn)用國(guó)際先進(jìn)的 IT 服務(wù)管理理念,從組織架構(gòu)設(shè)置、規(guī)章制度建立、技術(shù)手段建設(shè)等方面逐步完善水利部信息系統(tǒng)運(yùn)行保障工作。
網(wǎng)絡(luò)中心運(yùn)行維護(hù)的系統(tǒng)種類多、工作內(nèi)容復(fù)雜,因此一個(gè)完善的運(yùn)行組織架構(gòu)和合理運(yùn)作模式是運(yùn)行維護(hù)工作高效開展的前提。網(wǎng)絡(luò)中心根據(jù)承擔(dān)的運(yùn)行維護(hù)工作內(nèi)容,依據(jù)分工協(xié)作、相互配合的原則,將人員劃分為 6 組:維護(hù)服務(wù)組、網(wǎng)絡(luò)與信息安全組、支撐系統(tǒng)組、電子政務(wù)組、防汛業(yè)務(wù)組、網(wǎng)站組。各組有具體的職責(zé)分工,同時(shí)也相互配合,可以充分發(fā)揮各組的技術(shù)優(yōu)勢(shì),提高運(yùn)行維護(hù)水平。
在運(yùn)作模式上,采用一線、二線及原廠商(包括軟件開發(fā)商、第 3 方服務(wù)商等)分級(jí)處理的工作模式,一線負(fù)責(zé)日常事務(wù)的處置,簡(jiǎn)單故障分析、處理,一線不能處置的事件上升至二線處理,二線不能解決的問題將由原廠商或第 3 方服務(wù)商解決。這種工作模式,一方面可以發(fā)揮各自的優(yōu)勢(shì)(一線人員人數(shù)多但是技術(shù)能力稍差,二線人員人數(shù)少但是技術(shù)能力強(qiáng),原廠商人員在各自產(chǎn)品上更深入),提高運(yùn)行維護(hù)效率,同時(shí)將二線人員從重復(fù)、繁雜的日常事務(wù)中解脫出來,更好地研究相關(guān)技術(shù),深入地分析系統(tǒng)運(yùn)行狀況,提升運(yùn)行維護(hù)質(zhì)量和水平。另一方面,可以對(duì)工作中各個(gè)環(huán)節(jié)進(jìn)行精細(xì)管理,明確運(yùn)維工作目標(biāo),降低運(yùn)維時(shí)間,提高用戶的滿意度,有效控制運(yùn)維成本。
為了規(guī)范運(yùn)行維護(hù)工作,網(wǎng)絡(luò)中心對(duì)運(yùn)行維護(hù)工作進(jìn)行全面梳理,逐步建設(shè)和完善運(yùn)行維護(hù)制度。通過幾年的積累,網(wǎng)絡(luò)中心建設(shè)了包括行業(yè)規(guī)范、工作制度、行為規(guī)范、工作流程及應(yīng)急處置預(yù)案等一系列標(biāo)準(zhǔn)規(guī)范,初步形成了運(yùn)行維護(hù)制度體系。編制的《水利信息網(wǎng)運(yùn)行管理辦法》等水利行業(yè)管理規(guī)范主要面向水利行業(yè),規(guī)范水利行業(yè)運(yùn)行維護(hù)工作;編制的《網(wǎng)絡(luò)中心上門服務(wù)規(guī)范》等行為規(guī)范對(duì)運(yùn)行維護(hù)人員的日常行為進(jìn)行管理;編制的《值班制度》等一系列運(yùn)行維護(hù)工作制度,規(guī)范各種運(yùn)行維護(hù)工作,保證運(yùn)行維護(hù)工作的標(biāo)準(zhǔn)化;編制的《網(wǎng)絡(luò)中心事件處理流程》等一系列運(yùn)行維護(hù)工作流程,規(guī)范各類運(yùn)行維護(hù)流程,實(shí)現(xiàn)運(yùn)行維護(hù)工作流程化;編制的《水利部政務(wù)外網(wǎng)應(yīng)急處置預(yù)案》等一系列信息系統(tǒng)專項(xiàng)應(yīng)急處置預(yù)案,規(guī)范各系統(tǒng)可能發(fā)生事件的應(yīng)急處置措施,提高突發(fā)事件應(yīng)急處置措施,降低突發(fā)事件造成的損失。通過制度建設(shè),規(guī)范了運(yùn)行維護(hù)行為,理順了運(yùn)行維護(hù)流程,完善了應(yīng)急處置機(jī)制,實(shí)現(xiàn)運(yùn)行維護(hù)工作的規(guī)范化、制度化和流程化。
完善的管理制度還需要技術(shù)手段來支撐,網(wǎng)絡(luò)中心依托水利信息化項(xiàng)目,逐步完善水利信息系統(tǒng)運(yùn)行保障技術(shù)手段,經(jīng)過幾年的積累,形成了水利信息系統(tǒng)運(yùn)行保障平臺(tái)。水利信息系統(tǒng)運(yùn)行保障平臺(tái),融合了多項(xiàng)運(yùn)行保障技術(shù)手段,集集中監(jiān)控和服務(wù)管理、自動(dòng)化和應(yīng)急處置、安全管理、風(fēng)險(xiǎn)預(yù)警和運(yùn)行評(píng)估等于一體,提供了全面的、細(xì)粒度的系統(tǒng)監(jiān)管能力,以及規(guī)范的運(yùn)行維護(hù)服務(wù)管理能力。對(duì)信息系統(tǒng)運(yùn)行保障工作中涉及的監(jiān)控監(jiān)視、預(yù)測(cè)預(yù)警、維護(hù)操作、應(yīng)急處置及分析評(píng)估等工作進(jìn)行全面的管理,實(shí)現(xiàn)運(yùn)行保障工作的信息化管理。
水利部信息系統(tǒng)運(yùn)行保障體系的建設(shè)在水利部信息系統(tǒng)的運(yùn)行保障中發(fā)揮了重要的作用,通過運(yùn)行保障體系的建設(shè),在運(yùn)行保障的系統(tǒng)及設(shè)備連續(xù)翻番的情況下,運(yùn)行維護(hù)人員不但沒有增加,反而有所減少,用戶滿意度有較大幅度提高,運(yùn)行保障工作得到了部機(jī)關(guān)各司局的充分肯定,很好地支撐了水利信息化的發(fā)展。水利部信息系統(tǒng)運(yùn)行保障體系支撐保障作用主要體現(xiàn)在:
1)集中監(jiān)控管理整合各類監(jiān)控工具采集的數(shù)據(jù),綜合監(jiān)視各系統(tǒng)的運(yùn)行狀況,包括信息系統(tǒng)基礎(chǔ)設(shè)施及應(yīng)用系統(tǒng)狀況,進(jìn)行統(tǒng)一的數(shù)據(jù)分析和顯示,實(shí)現(xiàn)了對(duì)水利信息系統(tǒng)中機(jī)房環(huán)境、網(wǎng)絡(luò)和主機(jī)設(shè)備、數(shù)據(jù)庫(kù)、中間件及業(yè)務(wù)應(yīng)用等統(tǒng)一管理。
2)服務(wù)管理將信息系統(tǒng)運(yùn)行保障工作中人、流程、技術(shù)有機(jī)地結(jié)合起來,實(shí)現(xiàn)運(yùn)行保障人員角色管理、崗位職責(zé)分配、故障處理流程、配置管理流程、變更流程、服務(wù)保障水平、作業(yè)計(jì)劃管理、知識(shí)庫(kù)、人員績(jī)效考核等功能。
3)在信息系統(tǒng)運(yùn)行保障工作中,有很多重復(fù)性工作,這些工作技術(shù)難度低,工作量大,且易出錯(cuò),自動(dòng)化處置系統(tǒng)代替人工重復(fù)性勞動(dòng),減少人為誤操作導(dǎo)致的故障,提高運(yùn)行保障效率。
4)在信息系統(tǒng)運(yùn)行保障過程中,難免會(huì)由于設(shè)備自身故障、人為攻擊或自然災(zāi)害等原因引起各種突發(fā)事件,如果這些事件的處置不及時(shí)有效,將會(huì)對(duì)信息系統(tǒng)造成重大影響,因此建立突發(fā)事件應(yīng)急保障和恢復(fù)工作機(jī)制,提高應(yīng)對(duì)突發(fā)事件的組織指揮和應(yīng)急處置能力,保證應(yīng)急指揮調(diào)度工作迅速、高效、有序進(jìn)行,是保障水利信息系統(tǒng)安全運(yùn)行的一個(gè)重要內(nèi)容。為此,編制了《水利網(wǎng)絡(luò)與信息安全事件應(yīng)急預(yù)案》,并在此基礎(chǔ)上根據(jù)水利部信息系統(tǒng)運(yùn)行保障的實(shí)際工作需要,對(duì)運(yùn)行維護(hù)的網(wǎng)絡(luò)系統(tǒng)、視頻會(huì)議、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)等進(jìn)行全面梳理,針對(duì)每個(gè)系統(tǒng)編制具體可行的突發(fā)事件應(yīng)急響應(yīng)預(yù)案,提高突發(fā)事件的應(yīng)急處置效率。應(yīng)急管理實(shí)現(xiàn)對(duì)各應(yīng)急預(yù)案的電子化管理,并對(duì)部分應(yīng)急處置措施實(shí)現(xiàn)自動(dòng)化處理。
5)水利信息系統(tǒng)運(yùn)行保障平臺(tái)管理眾多設(shè)備、集成眾多監(jiān)控管理工具,各設(shè)備及管理工具都有自身的身份認(rèn)證系統(tǒng),為了實(shí)現(xiàn)集中的管理,需要解決各設(shè)備、系統(tǒng)的統(tǒng)一認(rèn)證及集中授權(quán),以避免因帳號(hào)管理不善引起信息系統(tǒng)的安全問題。安全管理實(shí)現(xiàn)了運(yùn)行保障基礎(chǔ)設(shè)施、運(yùn)行保障管理工具的統(tǒng)一認(rèn)證和集中授權(quán),提高信息系統(tǒng)運(yùn)行保障工作的安全性。
6)風(fēng)險(xiǎn)預(yù)警實(shí)現(xiàn)對(duì)信息系統(tǒng)運(yùn)行過程中可能發(fā)生的故障進(jìn)行預(yù)警,提醒運(yùn)行保障人員進(jìn)行處理,及時(shí)消除故障隱患,以避免發(fā)生較大的信息系統(tǒng)事故,風(fēng)險(xiǎn)預(yù)警主要包括:預(yù)警指標(biāo)的制定、風(fēng)險(xiǎn)監(jiān)控、風(fēng)險(xiǎn)分析、預(yù)警發(fā)布等。
7)運(yùn)行評(píng)估對(duì)信息系統(tǒng)運(yùn)行狀況及運(yùn)行保障工作情況進(jìn)行總結(jié)評(píng)估,以提高信息系統(tǒng)運(yùn)行效率和穩(wěn)定性,提高運(yùn)行保障水平。分析評(píng)估內(nèi)容包括:應(yīng)用系統(tǒng)業(yè)務(wù)效率、性能、績(jī)效考核及故障統(tǒng)計(jì)等分析。
隨著水利信息化的不斷發(fā)展,水利現(xiàn)代化建設(shè)中各業(yè)務(wù)系統(tǒng)應(yīng)用發(fā)揮了顯著的效益,其系統(tǒng)的安全穩(wěn)定運(yùn)行尤為重要。水利部已初步構(gòu)建水利信息系統(tǒng)運(yùn)行保障體系,建設(shè)了水利信息系統(tǒng)運(yùn)行保障平臺(tái),目前流域機(jī)構(gòu)和省級(jí)水利部門正在構(gòu)建,從而逐步建立可靠的信息安全保障體系和高效的系統(tǒng)運(yùn)行維護(hù)體系,全面提高信息系統(tǒng)運(yùn)行保障能力。
[1]陳雷. 明確目標(biāo) 注重實(shí)效 全面提升水利信息化水平[R].北京:水利部,2009.
[2]水利部信息化工作領(lǐng)導(dǎo)小組辦公室 2008 年度中國(guó)水利信息化發(fā)展報(bào)告[M]. 北京:中國(guó)水利水電出版社,2009.
[3]蔡陽. 加快水利信息化重點(diǎn)工程建設(shè),為發(fā)展民生水利提供信息化支撐和保障[R]. 北京:水利部,2008.