李 林 上海鐵路局信息技術(shù)所
鐵路客票預(yù)定與發(fā)售信息系統(tǒng)(以下簡稱客票系統(tǒng))負載著鐵路所有客運營業(yè)站的計算機聯(lián)網(wǎng)售票任務(wù),鑒于鐵路在國民經(jīng)濟客貨運輸中的重要地位,它的穩(wěn)定、高效運行直接關(guān)系到鐵路客運生產(chǎn)收入和社會影響。
目前,客票系統(tǒng)已實現(xiàn)了票庫集中。在某區(qū)域內(nèi)代售點發(fā)售的電子客票均是通過該區(qū)域內(nèi)唯一的后臺中心數(shù)據(jù)庫售出,這就對客票主機、存儲、網(wǎng)絡(luò)等提出了更高的要求??推毕到y(tǒng)在建立之時就通過對主機、存儲配置冗余熱備模塊來規(guī)避單個器件失效的故障,通過雙機集群來規(guī)避單臺服務(wù)器失效的故障,通過操作系統(tǒng)LVM 建立雙存儲間鏡像,同時機房建立冗余UPS 供電、空調(diào)系統(tǒng),這些措施對客票信息系統(tǒng)的安全、穩(wěn)定運行起到了重要作用。
綜上所述,雖然客票系統(tǒng)數(shù)據(jù)中心具備了一定的數(shù)據(jù)保護和保證業(yè)務(wù)連續(xù)性的能力,但是站在更高的層面看,客票系統(tǒng)數(shù)據(jù)中心對于較大范圍的災(zāi)難事件,如中心機房斷電、火災(zāi)、地震、人為破壞等非預(yù)見性因素缺乏有效的技術(shù)防范措施。隨著各地高速鐵路的開通運營,客票系統(tǒng)災(zāi)難的發(fā)生會嚴重影響鐵路客運,并帶來不良的社會影響,因此有必要在安全、穩(wěn)定生產(chǎn)的前提下,建立客票數(shù)據(jù)中心的容災(zāi)備份,盡可能地保證客票系統(tǒng)的連續(xù)性、可靠性。本文就客票系統(tǒng)實現(xiàn)容災(zāi)的幾種數(shù)據(jù)復(fù)制技術(shù)方案小結(jié)如下。
容災(zāi)技術(shù)方案的核心技術(shù)是數(shù)據(jù)復(fù)制技術(shù)。雖然計算機業(yè)界有許多廠商提供各種各樣的產(chǎn)品和技術(shù),但是就其本質(zhì)而言,主流的數(shù)據(jù)容災(zāi)技術(shù)基本可分為四大類,即智能存儲層數(shù)據(jù)復(fù)制、數(shù)據(jù)庫層數(shù)據(jù)復(fù)制、主機層邏輯卷軟件容災(zāi)復(fù)制和存儲網(wǎng)絡(luò)層容災(zāi)復(fù)制(存儲虛擬化技術(shù))。下面就這四種容災(zāi)數(shù)據(jù)復(fù)制技術(shù)的方案設(shè)計進行討論:
智能存儲系統(tǒng)容災(zāi)是基于存儲系統(tǒng)內(nèi)建的固件(firmware)或操作系統(tǒng),通過IP 網(wǎng)絡(luò)或DWDM、光纖通道等傳輸介質(zhì),將數(shù)據(jù)以同步或異步的方式復(fù)制到容災(zāi)端。主要的智能存儲系統(tǒng)容災(zāi)有HP、HDS TrueCopy、IBM PPRC 和EMC SRDF 等。該技術(shù)于上世紀末誕生于智能存儲技術(shù)中,被較多容災(zāi)系統(tǒng)所采用。
基于智能存儲的數(shù)據(jù)復(fù)制由智能存儲系統(tǒng)自身實現(xiàn)數(shù)據(jù)的遠程復(fù)制和同步,即智能存儲系統(tǒng)將對本系統(tǒng)中的存儲器I/O 操作Log 復(fù)制到遠端的存儲系統(tǒng)中并執(zhí)行。該技術(shù)保證了數(shù)據(jù)的一致性,具有高效快速的特點,能較好地保證數(shù)據(jù)的完整性和一致性,數(shù)據(jù)的復(fù)制備份過程不占用主機資源,操作控制比較簡單。但其開放性較差,要求主機、存儲必須同構(gòu)。智能存儲系統(tǒng)的遠程數(shù)據(jù)復(fù)制的示意如圖1 所示。
圖1 智能存儲系統(tǒng)的遠程數(shù)據(jù)復(fù)制的示意
數(shù)據(jù)庫遠程復(fù)制是由數(shù)據(jù)庫系統(tǒng)軟件來實現(xiàn)其遠程復(fù)制和同步。在復(fù)制過程中,使用自動沖突檢測和解決的手段保證數(shù)據(jù)一致性不受破壞。復(fù)制方式可分為實時復(fù)制、定時復(fù)制和存儲轉(zhuǎn)發(fā)復(fù)制。
(1)實時復(fù)制:當(dāng)主中心的數(shù)據(jù)庫內(nèi)容被修改時,容災(zāi)中心的數(shù)據(jù)庫內(nèi)容實時地被修改,此種復(fù)制方式對網(wǎng)絡(luò)可靠性要求高。
(2)定時復(fù)制:當(dāng)主中心的數(shù)據(jù)庫內(nèi)容被修改時,容災(zāi)中心的數(shù)據(jù)庫內(nèi)容會按照時間間隔,周期性地按照主中心的更新情況進行刷新,時間間隔可長(以小時計)可短(以秒計)。
(3)存儲轉(zhuǎn)發(fā)復(fù)制:當(dāng)主中心的數(shù)據(jù)庫內(nèi)容被修改時,主中心的數(shù)據(jù)庫服務(wù)器會先將修改操作Log 存儲于本地,待時機成熟再轉(zhuǎn)發(fā)給容災(zāi)中心。
遠程數(shù)據(jù)庫復(fù)制的實質(zhì)是將主用系統(tǒng)數(shù)據(jù)庫操作Log 實時或者周期性地復(fù)制到備用系統(tǒng)數(shù)據(jù)庫中執(zhí)行,實現(xiàn)二者數(shù)據(jù)的一致性。它對主機的性能有一定影響,會增加對磁盤存儲容量的需求(包括對Log 的存儲),但系統(tǒng)恢復(fù)較簡單,在實時復(fù)制方式時數(shù)據(jù)一致性較好。遠程數(shù)據(jù)庫復(fù)制需配置數(shù)據(jù)庫遠程復(fù)制軟/硬件,對主、備系統(tǒng)的服務(wù)器主機類型、存儲設(shè)備類型可以異構(gòu),對數(shù)據(jù)庫的操作訪問基于開放接口時甚至可以實現(xiàn)異種數(shù)據(jù)庫之間的互為備份復(fù)制。遠程數(shù)據(jù)庫復(fù)制邏輯示意如圖2 所示。
圖2 遠程數(shù)據(jù)庫復(fù)制邏輯示意
該復(fù)制方式采用第三方卷管理軟件實現(xiàn)數(shù)據(jù)復(fù)制。通過在容災(zāi)中心主機和主中心主機上安裝卷管理器軟件,將容災(zāi)中心的磁盤空間和主中心磁盤空間上的分區(qū)或卷虛擬為主機能夠看到的同一分區(qū)或卷,這樣當(dāng)主中心主機發(fā)生I/O 操作時,系統(tǒng)自動將數(shù)據(jù)分別寫入本地的主磁盤陣列和容災(zāi)中心的鏡像磁盤陣列中,從而實現(xiàn)數(shù)據(jù)的復(fù)制。這種寫操作對主機而言的是邏輯上的。當(dāng)主中心發(fā)生災(zāi)難時,容災(zāi)中心可以接管應(yīng)用;當(dāng)主中心系統(tǒng)重建后,數(shù)據(jù)可以從容災(zāi)中心得到恢復(fù)。它的原理和操作系統(tǒng)邏輯卷LVM 鏡像有幾分相似,主機層邏輯卷軟件數(shù)據(jù)復(fù)制原理如圖3 所示。
圖3 主機層邏輯卷軟件數(shù)據(jù)復(fù)制原理
生產(chǎn)系統(tǒng)對“本地數(shù)據(jù)”的任何更新都立刻在“異地數(shù)據(jù)”得到更新?!氨镜財?shù)據(jù)”和“異地數(shù)據(jù)”的更新方式可以選擇順序方式或者并行方式,但一般使用并行方式以增加整體性能。目前較知名的邏輯卷復(fù)制管理軟件包括IBM 的eXtended RemoteCopy (XRC)和HACMP/XD 和LVM、Veritas Volume Replicator(VVR)、SUN 的Data Replicator,這些基于軟件輔助的數(shù)據(jù)復(fù)制工具都可以通過IP 網(wǎng)絡(luò)實現(xiàn)遠程數(shù)據(jù)復(fù)制。
基于智能存儲交換機(SAN-Based)的容災(zāi)方式是將有特殊功能的存儲交換機放置在主機與存儲之間,通過交換機中的功能模塊將主機與生產(chǎn)中心存儲與容災(zāi)中心存儲劃分到一起。當(dāng)主機有I/O寫入時,交換機自動將次I/O 同時寫入到本地和異地的存儲當(dāng)中去,分配I/O的工作完全由專用存儲交換機來完成,因此對主機及存儲的性能影響微小。同時,由于功能使用軟件層面實現(xiàn),可實現(xiàn)精細時間的恢復(fù)策略,并且整個SAN 環(huán)境中使用公共、統(tǒng)一的復(fù)制API,可以實現(xiàn)存儲的異構(gòu)。業(yè)界知名的遠程容災(zāi)方案有飛康CDP、IBM SVC 等。
四種方案的優(yōu)劣比較如表1 所示。
表1 四種方案的優(yōu)劣比較
隨著高速鐵路時代的到來,客票系統(tǒng)在客運組織中的重要性越來越突顯,保證客票系統(tǒng)的安全穩(wěn)定運行,提高其連續(xù)可用性已成為共識,因而,建立客票系統(tǒng)的災(zāi)難備份勢在必行。但災(zāi)難備份是一項技術(shù)復(fù)雜、投資巨大、工程浩大的項目。通過研究當(dāng)前的先進技術(shù),結(jié)合鐵路客票系統(tǒng)的特點,本文分析了各種可行的技術(shù)方案,希望提出對客票系統(tǒng)安全性具有參考意義的觀點。系統(tǒng)容災(zāi)建設(shè)是一個長期過程,它帶來高可靠性保障的同時也需要高額的資金支持,并且對建設(shè)完成后的系統(tǒng)維護也將會提出更高的要求。