文/趙明
隨著我國信息技術(shù)及互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展,其應(yīng)用領(lǐng)域已深入到人民生活的各個場景,從工作辦公、餐飲娛樂,到金融理財、民生醫(yī)療等等,應(yīng)用場景無處不在,人民生活已進入線上時代,在享受信息及互聯(lián)網(wǎng)帶來的便捷與高效的同時,信息系統(tǒng)的業(yè)務(wù)連續(xù)性便顯得至關(guān)重要。
十九大對互聯(lián)網(wǎng)安全、信息安全、金融安全都提出了明確的要求,而業(yè)務(wù)連續(xù)性則是其中的重要一環(huán),若服務(wù)中斷,或發(fā)生中斷后長時間無法恢復(fù),那將對人民生活造成重大影響,甚至?xí)斐蓢匈Y產(chǎn)流失、社會事件等嚴重影響。
目前我國對重點信息系統(tǒng)的業(yè)務(wù)連續(xù)性都有明確要求,通過災(zāi)備、雙活等容災(zāi)技術(shù)的應(yīng)用,降低RTO、RPO,使重要信息系統(tǒng)能夠提供穩(wěn)定的服務(wù),在發(fā)生突發(fā)狀況情況能能夠迅速應(yīng)對并恢復(fù),已成為當(dāng)務(wù)之需。而通過數(shù)據(jù)同步技術(shù)實現(xiàn)的災(zāi)備、雙活容災(zāi),則是其有效途徑。
當(dāng)今信息系統(tǒng)對于業(yè)務(wù)連續(xù)性的高標(biāo)準(zhǔn)、高要求,使得在系統(tǒng)進行設(shè)計時,就要把容災(zāi)設(shè)計考慮在內(nèi),從而提高系統(tǒng)災(zāi)難應(yīng)對及恢復(fù)能力,使提供的服務(wù)更加穩(wěn)定可靠,本章節(jié)從災(zāi)備等級上對當(dāng)前主要容災(zāi)技術(shù)進行劃分,并對相關(guān)概念進行描述。
從信息系統(tǒng)的容災(zāi)等級對其進行劃分,粗略可以分為災(zāi)備模式和雙活模式,同時又根據(jù)地域的不同可分為同城和異地兩大類,其中災(zāi)備又可細分為數(shù)據(jù)級災(zāi)備和應(yīng)用級災(zāi)備,雙活又衍生出多活。
表2:容災(zāi)技術(shù)分類及對比
下面我們將對主流容災(zāi)模式進行詳細說明,在此之前我們先要理解容災(zāi)能力指標(biāo),即RTO、RPO的概念。
RTO(Recovery Time Objective)恢復(fù)時間目標(biāo),指在故障或災(zāi)難發(fā)生之后,一臺電腦、系統(tǒng)、網(wǎng)絡(luò)或應(yīng)用停止工作的最高可承受時間。該參數(shù)定義了最大可容忍時限,必須在此時限內(nèi)恢復(fù)數(shù)據(jù)。RTO是反映系統(tǒng)業(yè)務(wù)恢復(fù)的及時性指標(biāo),表示業(yè)務(wù)從中斷到恢復(fù)正常所需的時間,RTO數(shù)值越小,代表容災(zāi)系統(tǒng)的數(shù)據(jù)恢復(fù)能力越強
RPO(Recovery Point Object)恢復(fù)點目標(biāo),指一個過去的時間點,當(dāng)災(zāi)難或緊急事件發(fā)生時,數(shù)據(jù)可以恢復(fù)到的時間點,是業(yè)務(wù)系統(tǒng)所能容忍的數(shù)據(jù)丟失量。RPO指標(biāo)主要反映了業(yè)務(wù)連續(xù)性管理體系下備用數(shù)據(jù)的有效性,即RPO取值越小,表示系統(tǒng)對數(shù)據(jù)完整性的保證能力越強。
RTO和RPO指標(biāo)并不是孤立的,而是從不同角度來反映數(shù)據(jù)中心的容災(zāi)能力
同城:災(zāi)備模式生產(chǎn)端與災(zāi)備端,雙活模式不同服務(wù)器集群位于同一城市,或相距距離小于相關(guān)文件規(guī)定的最大距離。
異地:災(zāi)備模式生產(chǎn)端與災(zāi)備端,雙活模式不同服務(wù)器集群位于不同城市,且相距距離大于相關(guān)文件規(guī)定的最小距離。
數(shù)據(jù)級災(zāi)備:建立數(shù)據(jù)級災(zāi)難備份機制,保證生產(chǎn)端關(guān)鍵或全部數(shù)據(jù)及時復(fù)制至災(zāi)備端,在發(fā)生災(zāi)難時提供可用的恢復(fù)數(shù)據(jù),降低由于災(zāi)難造成的數(shù)據(jù)丟失、損壞所帶來的損失。
表3:數(shù)據(jù)庫同步技術(shù)對比
表4:容災(zāi)技術(shù)方案選型對應(yīng)關(guān)系表
應(yīng)用級災(zāi)備:在數(shù)據(jù)級災(zāi)備基礎(chǔ)上,同時搭建生產(chǎn)業(yè)務(wù)系統(tǒng)的備份環(huán)境,且保證數(shù)據(jù)實時同步,在發(fā)生災(zāi)難時,能夠隨時接管生產(chǎn)系統(tǒng)業(yè)務(wù)。
雙活:生產(chǎn)端和災(zāi)備端同時運行,同時提供服務(wù),可根據(jù)資源配置情況,使資源更充足的一端承擔(dān)更大業(yè)務(wù)壓力。
多活:在雙活基礎(chǔ)上,增加生產(chǎn)節(jié)點,可同時對外提供服務(wù)。
各容災(zāi)模式對于RTO,RPO的要求如表1所示。
數(shù)據(jù)同步技術(shù)是實現(xiàn)災(zāi)備模式容災(zāi)、雙活模式容災(zāi)的根本,本章將對其原理、成熟度、成本等進行描述及對比。數(shù)據(jù)同步技術(shù)可以分為基存儲系統(tǒng)數(shù)據(jù)復(fù)制、基于操作系統(tǒng)層數(shù)據(jù)復(fù)制、基于應(yīng)用程序?qū)訑?shù)據(jù)復(fù)制三大類,下面將從基本原理、平臺要求、復(fù)制性能、資源占用、技術(shù)成熟度、投入成本對其進行對比,并列舉典型軟件產(chǎn)品進。如表2所示。
以上技術(shù)中,基于應(yīng)用程序?qū)拥臄?shù)據(jù)庫復(fù)制技術(shù),由于其成本低、靈活度高、同步性能較高等特點,在市場上應(yīng)用較為廣泛,本節(jié)將對其內(nèi)容進行細化。
數(shù)據(jù)庫復(fù)制技術(shù)按照傳輸內(nèi)容可以分為兩類:
傳輸日志文件類:傳輸整個日志文件到目標(biāo)端進行應(yīng)用。
傳輸變化數(shù)據(jù)類:解析日志后得到變化的數(shù)據(jù),傳輸?shù)侥繕?biāo)端進行應(yīng)用。
日志復(fù)制技術(shù):
傳輸日志,同構(gòu),配置簡單,支持計劃內(nèi)及計劃外停機;備機只讀,帶寬要求高,不記錄日志的操作不進行復(fù)制;需先將源數(shù)據(jù)先通過備份恢復(fù)或者其他方式手工傳輸?shù)侥繕?biāo)端;有數(shù)據(jù)類型限制,主機需啟動歸檔日志模式;通常用作同構(gòu)軟件的同城高可用解決方案。
變化數(shù)據(jù)復(fù)制技術(shù):
以交易為單位傳輸變化數(shù)據(jù),支持異構(gòu)數(shù)據(jù)庫和操作系統(tǒng),帶寬要求低;可多向復(fù)制,主備機雙活;異步復(fù)制,主機需啟動歸檔日志模式;支持數(shù)據(jù)過濾、定制復(fù)制需求,最小可以精確到列;通常用作異構(gòu)數(shù)據(jù)庫異地容災(zāi)解決方案,可滿足數(shù)據(jù)復(fù)制(接管,負載均衡,異地數(shù)據(jù)分發(fā)),滾動升級等需求。如表3所示。
根據(jù)不同容災(zāi)模式,綜合考慮需求、容災(zāi)能力、技術(shù)特點等因素,形成容災(zāi)技術(shù)方案選型對應(yīng)關(guān)系表,并對其帶寬、成本進行分析,描述應(yīng)用場景。
技術(shù)方案的選擇最終取決于用戶需求,包括其對業(yè)務(wù)連續(xù)性的要求,對時間的敏感程度,自身經(jīng)濟及技術(shù)實力以及后期建設(shè)目標(biāo)等眾多因素,讀者可根據(jù)自己特點,在對系統(tǒng)進行容災(zāi)設(shè)計時查閱容災(zāi)技術(shù)方案選型對應(yīng)關(guān)系表進行參考。如表4所示。
目前我國信息系統(tǒng)容災(zāi)建設(shè)水平很不平衡,人們對信息系統(tǒng)的依賴程度不斷提高的同時,系統(tǒng)容災(zāi)建設(shè)必會成為發(fā)展趨勢和方向,兩地三中心模式將逐漸建成,災(zāi)備、雙活模式將成為常態(tài),我國在高科技信息領(lǐng)域已取得長足的進步和一定的成績,會有更多的信息系統(tǒng)建設(shè)者為提高業(yè)務(wù)連續(xù)性及服務(wù)能力獻計出力,逐漸打造出穩(wěn)定、容災(zāi)、高可用的信息系統(tǒng)生態(tài)體系。