蔡 陽,周維續(xù),詹全忠,付 靜
(水利部水利信息中心,100053,北京)
近年,水利信息化迅猛發(fā)展,效益日益顯著,已成為創(chuàng)新和提升水利工作的重要手段,促進(jìn)了傳統(tǒng)水利向現(xiàn)代水利、可持續(xù)發(fā)展水利轉(zhuǎn)變。隨著水利信息化的快速發(fā)展,水利信息系統(tǒng)規(guī)模越來越大,據(jù)初步統(tǒng)計(jì),僅7個(gè)流域機(jī)構(gòu)的信息系統(tǒng)資產(chǎn)就達(dá)10多億元。以水利部機(jī)關(guān)為例,信息系統(tǒng)資產(chǎn)達(dá)5億多元,運(yùn)行的主要應(yīng)用系統(tǒng)128套、網(wǎng)絡(luò)設(shè)備513臺(tái) (套)、 服務(wù)器設(shè)備 206臺(tái)(套)、終端計(jì)算機(jī)3 255臺(tái)。如何有效地管理和維護(hù)現(xiàn)有的信息系統(tǒng),保證其高效、穩(wěn)定、安全運(yùn)行,已成為擺在我們面前的一項(xiàng)十分緊迫而艱巨的任務(wù)。
為有效解決水利信息系統(tǒng)運(yùn)行保障問題,水利部水利信息中心從2004年起,依托水利基本建設(shè)項(xiàng)目以及國(guó)家水利基金項(xiàng)目,組織開展了水利信息系統(tǒng)運(yùn)行保障平臺(tái)研究工作。自2006年起,這項(xiàng)研究成果就在水利部信息系統(tǒng)運(yùn)行保障工作中得到了廣泛應(yīng)用,目前已在部分流域機(jī)構(gòu)和省級(jí)水利部門進(jìn)行推廣應(yīng)用。
水利信息系統(tǒng)的運(yùn)行保障是保障水利網(wǎng)絡(luò)與業(yè)務(wù)系統(tǒng)正常、安全、有效的運(yùn)行,其核心在于提升運(yùn)維能力,保障信息系統(tǒng)穩(wěn)定、高效運(yùn)行。水利信息系統(tǒng)運(yùn)行保障通過運(yùn)行保障措施,實(shí)現(xiàn)對(duì)運(yùn)行保障對(duì)象(信息系統(tǒng)基礎(chǔ)設(shè)施和業(yè)務(wù)應(yīng)用系統(tǒng))的管理和服務(wù),從而實(shí)現(xiàn)支撐保障水利信息系統(tǒng),為水利專業(yè)人員、決策人員及社會(huì)公眾提供服務(wù),它是一套完整的體系。
運(yùn)行保障措施包括:人員隊(duì)伍、運(yùn)行經(jīng)費(fèi)、運(yùn)行保障平臺(tái)、運(yùn)作模式、標(biāo)準(zhǔn)規(guī)范、管理制度。人員隊(duì)伍是指運(yùn)行保障人員(包括技術(shù)人員、管理人員)以及人員培訓(xùn)等;運(yùn)行經(jīng)費(fèi)指運(yùn)行保障工作所需的各種費(fèi)用,包括人員經(jīng)費(fèi)、運(yùn)行材料動(dòng)力消耗費(fèi)用、維護(hù)維修經(jīng)費(fèi)及其他有關(guān)費(fèi)用支出;運(yùn)行保障平臺(tái)是為運(yùn)行保障工作涉及的監(jiān)控監(jiān)視、預(yù)測(cè)預(yù)警、維護(hù)操作、應(yīng)急處置和安全管理等各項(xiàng)工作提供的技術(shù)手段和管理工具;運(yùn)作模式是指運(yùn)行保障工作的組織體系、角色分工、工作流程等;標(biāo)準(zhǔn)規(guī)范主要包括各類運(yùn)行保障標(biāo)準(zhǔn),是行業(yè)性的運(yùn)行保障規(guī)范;規(guī)章制度是運(yùn)行保障工作具體工作制度、守則等。其中:人員隊(duì)伍、運(yùn)行經(jīng)費(fèi)是信息系統(tǒng)運(yùn)行保障工作的前提;運(yùn)行保障平臺(tái)是信息系統(tǒng)運(yùn)行保障工作的技術(shù)支撐;運(yùn)作模式、標(biāo)準(zhǔn)規(guī)范及管理制度是信息系統(tǒng)運(yùn)行保障高效開展的基礎(chǔ)。
基于水利信息系統(tǒng)運(yùn)行保障體系框架,利用自主研發(fā)的業(yè)務(wù)服務(wù)框架 (BSF) 及 業(yè) 務(wù) 信 息 管 理 模 型(BIMM)開發(fā)了水利信息系統(tǒng)運(yùn)行保障平臺(tái)。
水利信息系統(tǒng)運(yùn)行保障平臺(tái)主要包括采集監(jiān)控層、支撐層、應(yīng)用層和門戶層等4個(gè)層次。
采集監(jiān)控層主要是通過各類監(jiān)控采集工具將水利信息系統(tǒng)運(yùn)行所依賴的基礎(chǔ)框架對(duì)象、業(yè)務(wù)對(duì)象的原始性能、告警、配置等數(shù)據(jù)進(jìn)行采集,并通過整合工具匯聚到相應(yīng)的支撐保障庫(kù),供運(yùn)行保障應(yīng)用系統(tǒng)分析使用。
監(jiān)控采集主要包括機(jī)房環(huán)境設(shè)施監(jiān)控、網(wǎng)絡(luò)監(jiān)控、主機(jī)監(jiān)控、數(shù)據(jù)庫(kù)監(jiān)控及業(yè)務(wù)應(yīng)用監(jiān)控等,利用各種通用監(jiān)控采集工具及獨(dú)立開發(fā)的其他監(jiān)控采集工具,通過TCP/IP、SNMP等協(xié)議,根據(jù)運(yùn)行保障監(jiān)控采集策略,實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)拓?fù)?、故障、主機(jī)指標(biāo)、業(yè)務(wù)應(yīng)用、oracle/Sybase/sqlserver等主流數(shù)據(jù)庫(kù)等的常用性能指標(biāo)的采集及控制管理功能。
水利信息系統(tǒng)運(yùn)行保障工作繁雜,保障工具和應(yīng)用系統(tǒng)眾多,數(shù)據(jù)結(jié)構(gòu)復(fù)雜。水利信息系統(tǒng)運(yùn)行保障平臺(tái)將水利信息系統(tǒng)運(yùn)行保障的相關(guān)數(shù)據(jù)進(jìn)行歸納分類,劃分為七大類支撐保障庫(kù),包括運(yùn)行庫(kù)、人員庫(kù)、規(guī)則庫(kù)、策略庫(kù)、預(yù)案庫(kù)、配置庫(kù)和標(biāo)準(zhǔn)庫(kù),支撐保障庫(kù)的建立促進(jìn)了應(yīng)用系統(tǒng)之間信息共享,為運(yùn)行保障應(yīng)用協(xié)同提供了基礎(chǔ)。隨著時(shí)間的推移,經(jīng)驗(yàn)的不斷豐富,支撐保障庫(kù)根據(jù)運(yùn)行保障工作的需要不斷豐富和發(fā)展,從而不斷增強(qiáng)和完善平臺(tái)功能。
(1)集中監(jiān)控管理
集中監(jiān)控管理子系統(tǒng)整合采集監(jiān)控層各監(jiān)控工具采集的數(shù)據(jù),綜合監(jiān)視各系統(tǒng)的運(yùn)行狀況,包括信息系統(tǒng)基礎(chǔ)設(shè)施狀況及應(yīng)用系統(tǒng)狀況,進(jìn)行統(tǒng)一的數(shù)據(jù)分析和顯示,實(shí)現(xiàn)對(duì)水利信息系統(tǒng)中網(wǎng)絡(luò)設(shè)備、主機(jī)設(shè)備、數(shù)據(jù)庫(kù)、中間件等資源的統(tǒng)一管理,完成了拓?fù)涔芾?、故障管理、性能管理、?yīng)用管理等方面的功能。
(2)服務(wù)管理
服務(wù)管理子系統(tǒng)主要完成信息系統(tǒng)運(yùn)行保障工作的管理,將信息系統(tǒng)運(yùn)行保障工作中人、流程、技術(shù)有機(jī)地結(jié)合起來,建立了一套先進(jìn)的、科學(xué)的運(yùn)行維護(hù)綜合服務(wù)臺(tái)。服務(wù)管理根據(jù)水利部信息系統(tǒng)運(yùn)行保障工作的要求,實(shí)現(xiàn)了人員角色管理、崗位職責(zé)分配、故障管理、服務(wù)請(qǐng)求管理、問題管理、配置管理、變更管理、發(fā)布管理、服務(wù)水平管理、作業(yè)計(jì)劃管理、人員績(jī)效考核等功能。
(3)常規(guī)自動(dòng)化管理
在信息系統(tǒng)運(yùn)行保障工作中,有很多重復(fù)性工作,這些工作技術(shù)難度低、工作量大且易出錯(cuò)。平臺(tái)建設(shè)自動(dòng)化處置系統(tǒng),代替人工重復(fù)性勞動(dòng),減少人為誤操作導(dǎo)致的故障,提高運(yùn)行保障效率。目前實(shí)現(xiàn)的自動(dòng)化處理功能包括:自動(dòng)值班及巡檢,運(yùn)行維護(hù)相關(guān)郵件及傳真的自動(dòng)處理,業(yè)務(wù)自動(dòng)處理等。
(4)應(yīng)急管理
在信息系統(tǒng)運(yùn)行保障過程中,難免會(huì)發(fā)生由于設(shè)備自身故障、人為攻擊或自然災(zāi)害等原因引起的各種突發(fā)事件,如果這些事件的處置不及時(shí),往往會(huì)對(duì)信息系統(tǒng)造成重大影響。為此,我們編制了《水利網(wǎng)絡(luò)與信息安全事件應(yīng)急預(yù)案》,并在此基礎(chǔ)上對(duì)網(wǎng)絡(luò)系統(tǒng)、視頻會(huì)議、數(shù)據(jù)庫(kù)、應(yīng)用系統(tǒng)等進(jìn)行全面梳理,針對(duì)每個(gè)系統(tǒng)編制具體可行的突發(fā)事件應(yīng)急響應(yīng)專項(xiàng)預(yù)案,提高突發(fā)事件的應(yīng)急處置效率。應(yīng)急管理實(shí)現(xiàn)對(duì)各應(yīng)急預(yù)案的電子化管理,并對(duì)關(guān)鍵應(yīng)急處置措施 (包括環(huán)境故障應(yīng)急處置、病毒爆發(fā)應(yīng)急處置等)實(shí)現(xiàn)了自動(dòng)化處理。
(5)安全管理
水利信息系統(tǒng)運(yùn)行保障平臺(tái)管理眾多設(shè)備、集成眾多監(jiān)控管理工具,各設(shè)備及管理工具都有自身的身份認(rèn)證系統(tǒng)。為實(shí)現(xiàn)集中管理,需要解決各設(shè)備、系統(tǒng)的統(tǒng)一認(rèn)證及集中授權(quán),以避免因賬號(hào)管理不善引起信息系統(tǒng)的安全問題。該平臺(tái)實(shí)現(xiàn)了運(yùn)行保障基礎(chǔ)設(shè)施、運(yùn)行保障管理工具的統(tǒng)一認(rèn)證和集中授權(quán),提高信息系統(tǒng)運(yùn)行保障工作的安全性。
(6)風(fēng)險(xiǎn)預(yù)警
風(fēng)險(xiǎn)預(yù)警主要實(shí)現(xiàn)對(duì)信息系統(tǒng)運(yùn)行過程中可能發(fā)生的故障進(jìn)行預(yù)警,提醒運(yùn)行保障人員進(jìn)行處理,及時(shí)消除故障隱患,以避免發(fā)生較大的信息系統(tǒng)事故。信息系統(tǒng)運(yùn)行風(fēng)險(xiǎn)預(yù)警主要包括:預(yù)警指標(biāo)的制定、風(fēng)險(xiǎn)監(jiān)控、風(fēng)險(xiǎn)分析、預(yù)警發(fā)布等。
(7)運(yùn)行評(píng)估
運(yùn)行評(píng)估主要是對(duì)信息系統(tǒng)運(yùn)行狀況及運(yùn)行保障工作情況進(jìn)行總結(jié)評(píng)估,以提高信息系統(tǒng)運(yùn)行效率和穩(wěn)定性,提高運(yùn)行保障水平。分析評(píng)估內(nèi)容包括:應(yīng)用系統(tǒng)業(yè)務(wù)效率分析、性能分析、績(jī)效考核及故障統(tǒng)計(jì)分析等。
門戶將運(yùn)行保障平臺(tái)所有的子系統(tǒng)及資源進(jìn)行整合,根據(jù)每個(gè)用戶的角色及使用特點(diǎn),形成個(gè)性化的操作界面,實(shí)現(xiàn)了各運(yùn)行保障應(yīng)用的界面集成及單點(diǎn)登錄。
水利信息系統(tǒng)運(yùn)行保障平臺(tái)的效益主要表現(xiàn)在提高運(yùn)行保障效率、水平和促進(jìn)該平臺(tái)所支持、保障的信息系統(tǒng)效益的發(fā)揮上。據(jù)不完全統(tǒng)計(jì),應(yīng)用水利信息系統(tǒng)運(yùn)行保障平臺(tái)后,系統(tǒng)年平均故障率降低了40%,故障恢復(fù)效率提高數(shù)倍,在運(yùn)行保障的系統(tǒng)及設(shè)備連續(xù)翻番的情況下運(yùn)行維護(hù)人員不但沒有增加,反而有所減少,終端用戶滿意度有較大幅度提高,運(yùn)行保障工作得到了用戶的充分肯定。主要體現(xiàn)在:
(1)規(guī)范了信息系統(tǒng)運(yùn)行保障工作
建立了一整套運(yùn)行保障標(biāo)準(zhǔn)制度、運(yùn)作模式、工作流程,并通過服務(wù)管理系統(tǒng)加以落實(shí),有效地規(guī)范了運(yùn)行保障工作,提高了運(yùn)行保障工作效率。同時(shí),通過規(guī)范管理,對(duì)水利信息系統(tǒng)進(jìn)行精心的維護(hù),大大降低了系統(tǒng)故障。
(2)實(shí)現(xiàn)了信息系統(tǒng)運(yùn)行保障工作自動(dòng)化
通過各種自動(dòng)化手段,實(shí)現(xiàn)運(yùn)行保障工作的自動(dòng)化處理,極大地提高了運(yùn)行保障工作效率,也減少了人為誤操作造成的故障。水利部網(wǎng)站新聞投稿主要通過電子郵件方式,以往采用人工查閱方式,時(shí)效性差且易發(fā)生遺漏,采用自動(dòng)化處理系統(tǒng)后,改由系統(tǒng)自動(dòng)進(jìn)行郵件分揀,根據(jù)預(yù)定的策略將郵件發(fā)送相關(guān)人員處理,并且監(jiān)控處理過程,有效地解決了新聞編發(fā)不及時(shí)、遺漏等問題。
(3)實(shí)現(xiàn)了信息系統(tǒng)的集中監(jiān)控
平臺(tái)對(duì)各類已建的監(jiān)控系統(tǒng)、管理工具進(jìn)行整合,從業(yè)務(wù)應(yīng)用的角度對(duì)信息系統(tǒng)進(jìn)行統(tǒng)一監(jiān)控、集中管理,提升監(jiān)控能力,提高故障和故障隱患發(fā)現(xiàn)的及時(shí)性、準(zhǔn)確性,減少故障的發(fā)生,降低故障造成的影響。
(4)建立了應(yīng)急處置體系
制定了信息系統(tǒng)突發(fā)事件的應(yīng)急處置預(yù)案,并實(shí)現(xiàn)自動(dòng)化管理,實(shí)現(xiàn)了供電、空調(diào)故障以及病毒暴發(fā)等突發(fā)事件的自動(dòng)應(yīng)急處置,提高突發(fā)事件的應(yīng)急處置效率,降低突發(fā)事件造成的損失。比如過去在病毒大規(guī)模暴發(fā)時(shí),對(duì)中毒計(jì)算機(jī)的定位、隔離及病毒清除需要耗費(fèi)大量人力和時(shí)間,在 2000年“沖擊波”病毒暴發(fā)期間,就花費(fèi)了10余人處理了一周的時(shí)間,對(duì)信息系統(tǒng)造成較大影響。該平臺(tái)建成后,根據(jù)信息流量的突然變化,可以自動(dòng)定位中毒計(jì)算機(jī),并自動(dòng)進(jìn)行隔離,再也沒有發(fā)生因?yàn)椴《緦?dǎo)致系統(tǒng)癱瘓的事件。
(5)加強(qiáng)了安全管理
建設(shè)了統(tǒng)一認(rèn)證系統(tǒng),加強(qiáng)了運(yùn)行保障的安全管理,實(shí)現(xiàn)信息系統(tǒng)基礎(chǔ)設(shè)施管理賬號(hào)的統(tǒng)一管理、賬號(hào)口令的定期自動(dòng)更新、管理人員權(quán)限的統(tǒng)一分配、運(yùn)行維護(hù)操作的審計(jì)等,增強(qiáng)了信息系統(tǒng)的運(yùn)行安全。
(6)全面掌握了信息系統(tǒng)資產(chǎn)狀況
建立了全面的配置管理數(shù)據(jù)庫(kù),對(duì)信息系統(tǒng)相關(guān)硬件設(shè)施、軟件環(huán)境、文檔等進(jìn)行全面的管理,并建立相互之間關(guān)聯(lián)關(guān)系,為做好信息系統(tǒng)的運(yùn)行保障奠定基礎(chǔ),也有利于促進(jìn)信息系統(tǒng)資源的共享和合理利用。
(7)實(shí)現(xiàn)了運(yùn)行保障經(jīng)驗(yàn)積累和共享
建設(shè)了支撐庫(kù),運(yùn)行保障工作過程中的各種經(jīng)驗(yàn)都可以積累下來,并進(jìn)行共享,提高了運(yùn)行保障水平和故障處理效率。
通過水利信息系統(tǒng)運(yùn)行保障平臺(tái),水利信息系統(tǒng)運(yùn)行得到了很好的支撐和保障,充分發(fā)揮了作用,取得了顯著效益。
(1)保障了國(guó)家防汛抗旱指揮系統(tǒng)的可靠運(yùn)行
①保障了系統(tǒng)的可靠運(yùn)行。應(yīng)用運(yùn)行保障平臺(tái)以來,國(guó)家防汛抗旱指揮系統(tǒng)從未發(fā)生重大故障,一般故障能及時(shí)有效處置,未造成影響,有力支撐了防汛抗旱工作的開展。
②提升了信息的及時(shí)性、準(zhǔn)確性。平臺(tái)的應(yīng)用使得防汛抗旱信息30分鐘內(nèi)到達(dá)率從2004年的73%提高到2006年的94.8%,錯(cuò)誤率從2.5%降低到0.21%。
③顯著提高了防汛抗旱指揮決策的科學(xué)性。平臺(tái)有力支撐了防汛抗旱應(yīng)用系統(tǒng)的穩(wěn)定、高效運(yùn)行,為防汛抗旱指揮決策提供科學(xué)手段。
(2)保障了異地會(huì)商視頻會(huì)議系統(tǒng)的穩(wěn)定運(yùn)行
自水利信息系統(tǒng)運(yùn)行保障平臺(tái)運(yùn)行以來,異地會(huì)商視頻會(huì)議系統(tǒng)的準(zhǔn)備時(shí)間從一周到現(xiàn)在可以隨時(shí)召開,視頻會(huì)議系統(tǒng)未發(fā)生過事故;在平臺(tái)支撐下,可以快速、穩(wěn)定進(jìn)行多部門、多人員的視頻會(huì)商,提升了防汛抗旱會(huì)商指揮決策的科學(xué)性和及時(shí)性。因其使用便捷、效果良好,越來越多的會(huì)議采用視頻會(huì)議方式召開,據(jù)不完全統(tǒng)計(jì),自2006年以來累計(jì)召開會(huì)議700余次,參加會(huì)議人數(shù)達(dá)25萬人次。
(3)保障了水利部電子政務(wù)系統(tǒng)的運(yùn)行
①保障了系統(tǒng)安全穩(wěn)定運(yùn)行。在運(yùn)行保障平臺(tái)的支撐下,水利電子政務(wù)系統(tǒng)未發(fā)生重大故障(電力等外部環(huán)境導(dǎo)致的停機(jī)除外)和安全事故,系統(tǒng)運(yùn)行安全、穩(wěn)定,有力地支撐了水利工作的開展。
②提高了工作效率,降低了成本。在平臺(tái)支撐下,系統(tǒng)運(yùn)行高效、穩(wěn)定,數(shù)據(jù)安全可靠,2008年水利部全面實(shí)現(xiàn)無紙化辦公,全年利用電子政務(wù)系統(tǒng)辦理各類公文41 016份,處理其他信息79595條。
(4)保障了水利部網(wǎng)站的運(yùn)行
①發(fā)揮了窗口作用。在平臺(tái)支撐下,水利部網(wǎng)站運(yùn)行穩(wěn)定,信息更新及時(shí)、準(zhǔn)確,響應(yīng)快速,吸引了眾多用戶訪問,僅主站每日平均點(diǎn)擊數(shù)達(dá)130萬。特別是在2008年抗震救災(zāi)期間,在第一時(shí)間全面準(zhǔn)確地對(duì)水利抗震救災(zāi)信息進(jìn)行了權(quán)威發(fā)布,搜狐等主要門戶網(wǎng)站引用水利部網(wǎng)站信息。
②有效應(yīng)對(duì)了外部攻擊。自平臺(tái)運(yùn)行以來,水利部網(wǎng)站未發(fā)生安全事故。特別是在2008年北京奧運(yùn)會(huì)期間,通過運(yùn)行保障平臺(tái),及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)了多起黑客攻擊事件,保障了網(wǎng)站安全運(yùn)行。
水利信息系統(tǒng)運(yùn)行保障平臺(tái)是多年水利信息系統(tǒng)運(yùn)行保障研究取得的重大成果,并在近年的實(shí)際工作中得到應(yīng)用,為提高防汛抗旱指揮決策水平和行政效率作出了貢獻(xiàn),下一步將加大平臺(tái)的推廣力度和應(yīng)用范圍。
[1]水利部信息化工作領(lǐng)導(dǎo)小組辦公室.2008年度中國(guó)水利信息化發(fā)展報(bào)告 [M].北京:中國(guó)水利水電出版社,2009.
[2]水利部水利信息中心.全國(guó)水利信息化規(guī)劃[R].2003.
[3]蔡陽.加快水利信息化重點(diǎn)工程建設(shè),為發(fā)展民生水利提供信息化支撐和保障[J].中國(guó)水利,2008(23).