安徽省交通運輸綜合執(zhí)法監(jiān)督局 劉新華
執(zhí)法數(shù)據(jù)是交通運輸領(lǐng)域的重要數(shù)據(jù),快速可靠的數(shù)據(jù)備份是系統(tǒng)穩(wěn)定可靠運行的重要保障。隨著云服務(wù)技術(shù)的飛速發(fā)展和日趨成熟,云災(zāi)備提供了兼顧本地數(shù)據(jù)備份和異地云端備份的功能。本文闡述了交通運輸行政執(zhí)法系統(tǒng)云災(zāi)備服務(wù)的建設(shè)背景和技術(shù)方案研究。
現(xiàn)代信息管理越來越網(wǎng)絡(luò)化,數(shù)據(jù)共享程度越來越高。安徽省部省共建交通運輸行政執(zhí)法綜合管理系統(tǒng)(以下簡稱“部省共建執(zhí)法系統(tǒng)”)隨著業(yè)務(wù)發(fā)展和信息化建設(shè)的推進(jìn),應(yīng)用系統(tǒng)和存儲數(shù)據(jù)不斷增加,各應(yīng)用系統(tǒng)間數(shù)據(jù)共享程度越來越高,系統(tǒng)故障、病毒破壞、自然災(zāi)難等不可測突發(fā)事件造成的應(yīng)用系統(tǒng)服務(wù)中斷及數(shù)據(jù)丟失會給管理造成很大影響。因此建設(shè)一個可以有效應(yīng)對突發(fā)情況、抵御或者化解風(fēng)險的異地災(zāi)備系統(tǒng),以保障系統(tǒng)的高可靠性、可用性是非常必要的。異地災(zāi)備系統(tǒng)的核心就在于將災(zāi)難化解,一是保證行業(yè)數(shù)據(jù)的安全,二是保證業(yè)務(wù)的連續(xù)性。云災(zāi)備兼顧傳統(tǒng)的本地數(shù)據(jù)備份和異地災(zāi)備,具有基礎(chǔ)設(shè)施投入減少,成本節(jié)約,高度機動性和靈活性,快速恢復(fù),安全可靠諸多優(yōu)勢。
部省共建執(zhí)法系統(tǒng)旨在提供全省“一站式”交通運輸行政執(zhí)法綜合服務(wù),建設(shè)任務(wù)概括為:“一中心平臺+多系統(tǒng)+多終端+一支撐+一安全+一云災(zāi)備”。
(1)“一中心平臺”:執(zhí)法數(shù)據(jù)中心及交通行政執(zhí)法數(shù)據(jù)共享平臺建設(shè)。搭建交通運輸行政執(zhí)法數(shù)據(jù)中心,完善數(shù)據(jù)交換共享接口,建立統(tǒng)一的信息發(fā)布和共享交換機制。(2)“多系統(tǒng)”:面向全省交通運輸行政執(zhí)法業(yè)務(wù)應(yīng)用對象,搭建統(tǒng)一執(zhí)法平臺,包含:執(zhí)法協(xié)同辦案系統(tǒng)、執(zhí)法人員管理系統(tǒng)等10個子系統(tǒng),實現(xiàn)省市縣三級的執(zhí)法協(xié)同與處置聯(lián)動管理。(3)“多終端”:根據(jù)一線執(zhí)法業(yè)務(wù)需要,建設(shè)多套執(zhí)法終端系統(tǒng),提升一線執(zhí)法線索證據(jù)信息采集能力,智能感知能力。(4)“一支撐”:依托現(xiàn)有安徽省軟硬件支撐環(huán)境,擴(kuò)充本次工程相關(guān)支撐環(huán)境:包括主機及存儲系統(tǒng)、網(wǎng)絡(luò)系統(tǒng)、應(yīng)用支撐軟件等。(5)“一安全”:安全運維保障建設(shè)。按照安徽省安全等級防護(hù)要求,升級完善已有安全運維軟件環(huán)境:包括安全門戶、安全運營維護(hù)、遠(yuǎn)程監(jiān)控檢測等功能,全面提升加強整體安全防護(hù)能力。(6)“一云災(zāi)備”:提供部省共建執(zhí)法系統(tǒng)異地災(zāi)備專業(yè)服務(wù),對異地災(zāi)備平臺進(jìn)行運維監(jiān)控管理和服務(wù)。云災(zāi)備將實現(xiàn)應(yīng)用系統(tǒng)及重要數(shù)據(jù)異地備份,建立災(zāi)難恢復(fù)機制,保證系統(tǒng)在遭遇人力不可抗拒災(zāi)難期間的對重要數(shù)據(jù)的保護(hù)及恢復(fù),并且隨著后期數(shù)據(jù)量的快速增長,支持備份空間快速擴(kuò)容需求。如表1所示。
表1 云平臺與傳統(tǒng)物理服務(wù)器建設(shè)模式優(yōu)勢對比Tab.1 Comparison of advantages of cloud platform and traditional physical server construction mode
災(zāi)備服務(wù)部署采用“云”部署模式,具體建設(shè)方案如下:
部省共建執(zhí)法系統(tǒng),異地災(zāi)備系統(tǒng)應(yīng)該達(dá)到以下目標(biāo):
(1)建設(shè)異地數(shù)據(jù)中心,為關(guān)鍵業(yè)務(wù)系統(tǒng)及核心數(shù)據(jù)提供數(shù)據(jù)異地備份,實現(xiàn)系統(tǒng)重要數(shù)據(jù)異地存放,當(dāng)本地發(fā)生災(zāi)難后,從災(zāi)備中心能及時恢復(fù)數(shù)據(jù),實現(xiàn)災(zāi)難發(fā)生后災(zāi)備中心對系統(tǒng)數(shù)據(jù)恢復(fù)還原。異地容災(zāi)技術(shù)指標(biāo)達(dá)到:RPO(允許丟失數(shù)據(jù)時間)為24h;機房網(wǎng)絡(luò)正常時,RTO(恢復(fù)時間目標(biāo))為24h;機房網(wǎng)絡(luò)不通時,RTO為48h。(2)提供云災(zāi)備專業(yè)服務(wù),對部省共建執(zhí)法系統(tǒng)異地災(zāi)備平臺進(jìn)行運維監(jiān)控管理和服務(wù),制定災(zāi)備演練方案和流程,定期驗證異地容災(zāi)的可用性,確保災(zāi)備系統(tǒng)穩(wěn)定運行。
災(zāi)備基礎(chǔ)平臺基于云計算技術(shù)建設(shè),通過云平臺上虛擬化生成的云主機構(gòu)建災(zāi)備基礎(chǔ)平臺,至少保留3份全量數(shù)據(jù)備份副本文件,通過安全接入?yún)^(qū)設(shè)備實現(xiàn)對災(zāi)備基礎(chǔ)平臺安全防護(hù)并部署出口、訪問源限制等有效安全保障措施。系統(tǒng)框架如圖1所示。
圖1 系統(tǒng)框架Fig.1 System framework
本項目的云平臺構(gòu)建從接入層、傳輸層、應(yīng)用層、數(shù)據(jù)存儲層及運維層的全方位信息安全保障,通過專線電路接入云平臺,具有以下技術(shù)安全保障:
(1)云平臺邊界防護(hù)。云平臺在其內(nèi)網(wǎng)邊界設(shè)置有專門的邊界防護(hù)區(qū),所有的應(yīng)用訪問請求將通過邊界防護(hù)區(qū)與互聯(lián)網(wǎng)進(jìn)行連接,邊界防護(hù)區(qū)通過專門的邊界防護(hù)手段保證內(nèi)網(wǎng)應(yīng)用系統(tǒng)和業(yè)務(wù)數(shù)據(jù)的安全性。包括:防火墻、DDOS防護(hù)、入侵防御、流量分析。(2)網(wǎng)絡(luò)隔離技術(shù)。每個項目對應(yīng)一個VLAN,每個項目的虛擬機位于該VLAN內(nèi)部,VLAN的隔離性由交換機及各主機上的虛擬化引擎保證。(3)數(shù)據(jù)安全保護(hù)。云平臺對信息進(jìn)行全生命周期的安全管控,包括信息的創(chuàng)建、存儲、應(yīng)用、共享、存檔與銷毀,具體技術(shù)手段包括:數(shù)據(jù)隔離、數(shù)據(jù)加密、剩余信息保護(hù)、數(shù)據(jù)備份等。
容災(zāi)平臺采用“本地前置備份+遠(yuǎn)程云備份”相結(jié)合的整體方案,災(zāi)備技術(shù)方案系統(tǒng)框架如圖2所示。
圖2 災(zāi)備技術(shù)方案系統(tǒng)框架Fig.2 System framework of disaster recovery technical solution
災(zāi)備平臺由云災(zāi)備管理服務(wù)器、策略服務(wù)器、客戶端服務(wù)器及備份空間4部分組成,通過高速、安全的IPRAN專線電路與系統(tǒng)所在機房聯(lián)接。災(zāi)備中心基于云計算平臺,配置與部省共建執(zhí)法系統(tǒng)性能相當(dāng)?shù)脑浦鳈C做為核心系統(tǒng)的備份服務(wù)器,主控服務(wù)器將備份策略下發(fā)到備份服務(wù)器,相應(yīng)備份服務(wù)器負(fù)責(zé)發(fā)出指令通知部省共建執(zhí)法系統(tǒng)所部署客戶端進(jìn)行異地容災(zāi)備份,在出現(xiàn)災(zāi)難性事件的緊急情況下按約定容災(zāi)策略恢復(fù)。具體實現(xiàn)流程為:
(1)在云災(zāi)備中心部署云災(zāi)備管理主機和云災(zāi)備系統(tǒng)控制臺,集中管理云災(zāi)備系統(tǒng)。(2)在本地數(shù)據(jù)中心部署災(zāi)備一體機,數(shù)據(jù)先備份到災(zāi)備一體機上,再災(zāi)備到云災(zāi)備中心。(3)在云災(zāi)備中心部署2臺云災(zāi)備管理主機,與備份存儲空間相連接,用于存取備份數(shù)據(jù),并管理去重計算。(4)在本地生產(chǎn)中心的生產(chǎn)主機上部署相應(yīng)的IDA軟件(備份代理軟件),負(fù)責(zé)讀取生產(chǎn)數(shù)據(jù)傳送到云災(zāi)備管理主機。(5)在云災(zāi)備中心,部署數(shù)據(jù)恢復(fù)測試機,平時可進(jìn)行數(shù)據(jù)恢復(fù)測試,供開發(fā)測試使用及數(shù)據(jù)驗證,發(fā)生災(zāi)難時作為生產(chǎn)機使用,從而保證業(yè)務(wù)的正常運行。
部省共建執(zhí)法系統(tǒng)選用的是運營商的云災(zāi)備服務(wù)。
電信運營商容災(zāi)機房運營由全職技術(shù)骨干組成專業(yè)化維護(hù)團(tuán)隊,提供7×24h一體化監(jiān)控,故障告警及閉環(huán)處理管控,面向用戶實現(xiàn)一個窗口提供機房運營管理服務(wù)。
根據(jù)部省共建執(zhí)法系統(tǒng)容災(zāi)備份服務(wù)項目要求,當(dāng)部省共建執(zhí)法系統(tǒng)出現(xiàn)故障時,災(zāi)備服務(wù)提供商將在接到通知或監(jiān)測到后10min內(nèi)做出響應(yīng),在規(guī)定時間內(nèi)啟動災(zāi)備系統(tǒng)進(jìn)行接管。
容災(zāi)不是簡單的設(shè)備冗余。還應(yīng)著重考慮管理層面的問題。容災(zāi)應(yīng)急預(yù)案根據(jù)系統(tǒng)運行實際,按照GB/T-20988《信息系統(tǒng)災(zāi)難恢復(fù)管理規(guī)范》等我國政府出臺的相關(guān)方針、政策中的要求設(shè)計,滿足系統(tǒng)災(zāi)難恢復(fù)需求,內(nèi)容包括:
(1)災(zāi)難應(yīng)急恢復(fù)組織:包括災(zāi)難應(yīng)急恢復(fù)組織涵蓋范圍、災(zāi)難管理組織結(jié)構(gòu)。災(zāi)難管理組織結(jié)構(gòu)中定義災(zāi)難發(fā)生前、中、后各相關(guān)人員的職責(zé);災(zāi)難恢復(fù)流程書面化各恢復(fù)工作的流程和執(zhí)行步驟。(2)容災(zāi)恢復(fù)場景管理:根據(jù)生產(chǎn)系統(tǒng)發(fā)生災(zāi)難導(dǎo)致現(xiàn)有環(huán)境不能對外提供服務(wù)的情況,梳理細(xì)化與異地災(zāi)備中心容災(zāi)恢復(fù)切換場景,并針對不同容災(zāi)場景制定業(yè)務(wù)切換、恢復(fù)重要操作,實現(xiàn)在接到災(zāi)難宣告后,下達(dá)指令即可快速啟用異地災(zāi)備中心,隨后通過生產(chǎn)中心的恢復(fù),重新啟動生產(chǎn)中心業(yè)務(wù)系統(tǒng),將業(yè)務(wù)從異地災(zāi)備中心切回至生產(chǎn)中心實現(xiàn)正常對外服務(wù)。(3)容災(zāi)恢復(fù)切換流程:根據(jù)設(shè)定的容災(zāi)場景進(jìn)行相應(yīng)的實施操作,保證業(yè)務(wù)系統(tǒng)始終對外提供服務(wù),做到用戶無感知,保障核心業(yè)務(wù)訪問。(4)容災(zāi)演練實施:災(zāi)備演練關(guān)鍵步驟、災(zāi)備演練服務(wù)目標(biāo)、災(zāi)備恢復(fù)及重續(xù)工作流程、災(zāi)備重建及回退工作流程等。
自部省共建執(zhí)法系統(tǒng)上線以來,已備份數(shù)據(jù)近900G,通過建設(shè)部省共建執(zhí)法系統(tǒng)的云災(zāi)備中心,實現(xiàn)應(yīng)用系統(tǒng)重要數(shù)據(jù)備份,保證系統(tǒng)在遭遇人力不可抗拒災(zāi)難期間的對重要數(shù)據(jù)的保護(hù)及對數(shù)據(jù)的恢復(fù),具有穩(wěn)定性、自動化、擴(kuò)展性、快速恢復(fù)、操作簡單、易管理等優(yōu)點。