劉小斌
(中國石油遼河油田公司勘探開發(fā)研究院,遼寧 盤錦 124010)
隨著時代的發(fā)展,信息化的進(jìn)程也越來越快,企業(yè)的運(yùn)作需要大量的計(jì)算機(jī)系統(tǒng),大量的數(shù)據(jù)隨之產(chǎn)生。數(shù)據(jù)影響著企業(yè)的生存和發(fā)展,是企業(yè)寶貴的無形資產(chǎn)。各行業(yè)對數(shù)據(jù)的依賴日益強(qiáng)烈,如果數(shù)據(jù)一旦因?yàn)閼?yīng)用服務(wù)器受到入侵,數(shù)據(jù)被篡改,或是存儲服務(wù)器因?yàn)閿嚯娀蛘咦匀粸?zāi)害導(dǎo)致系統(tǒng)不正常關(guān)機(jī)或發(fā)生宕機(jī)引起數(shù)據(jù)的丟失,都會給企業(yè)和用戶帶來巨大的損失。如何能保證系統(tǒng)7×24平穩(wěn)可靠的運(yùn)行,使得服務(wù)器存儲的信息能夠有效保存和被利用,并能預(yù)防各種突發(fā)性事件,已成為各行各業(yè)關(guān)注的話題。容災(zāi)技術(shù)逐漸成為人們關(guān)注的焦點(diǎn),如何建立一套高可用的容災(zāi)備份系統(tǒng)是企業(yè)實(shí)現(xiàn)數(shù)據(jù)容災(zāi)的首要問題。
容災(zāi)是一個廣泛的概念,就是在災(zāi)難發(fā)生的時候,保證計(jì)算機(jī)系統(tǒng)的數(shù)據(jù)盡量少丟失,從而保持系統(tǒng)業(yè)務(wù)不間斷地運(yùn)行。它是一個系統(tǒng)工程,需要利用技術(shù)手段、管理方法和相關(guān)資源確保生產(chǎn)數(shù)據(jù)在發(fā)生災(zāi)難后可以恢復(fù)并能繼續(xù)運(yùn)行。從廣義上看,所有提高系統(tǒng)高可信的努力都可稱之為容災(zāi)。從狹義上講,容災(zāi)是通過建立和維護(hù)一個備份存儲系統(tǒng),利用物理上的分離來保證系統(tǒng)和數(shù)據(jù)對災(zāi)難的抵御能力[1]。
一般來說,一個容災(zāi)系統(tǒng)中實(shí)現(xiàn)數(shù)據(jù)容災(zāi)和應(yīng)用容災(zāi)可以采用不同的技術(shù)。所謂數(shù)據(jù)容災(zāi),就是建立一個數(shù)據(jù)備份系統(tǒng),在災(zāi)難發(fā)生后確保原有的數(shù)據(jù)不丟失或者遭到破壞。應(yīng)用容災(zāi)系統(tǒng)建立在數(shù)據(jù)容災(zāi)系統(tǒng)之上,建立一套完整的與生產(chǎn)系統(tǒng)相當(dāng)?shù)膽?yīng)用系統(tǒng),盡可能減少災(zāi)難帶來的損失,讓用戶感覺不到災(zāi)難發(fā)生。
數(shù)據(jù)容災(zāi)不是簡單的數(shù)據(jù)備份或者數(shù)據(jù)復(fù)制,但數(shù)據(jù)備份是容災(zāi)的基礎(chǔ),數(shù)據(jù)復(fù)制是容災(zāi)的一種技術(shù)。數(shù)據(jù)備份的目的是在災(zāi)難發(fā)生時能夠快速地恢復(fù)數(shù)據(jù),并能全面及時地恢復(fù)整個系統(tǒng)。在建立容災(zāi)備份系統(tǒng)時會涉及到多種技術(shù),如數(shù)據(jù)備份技術(shù)、數(shù)據(jù)復(fù)制技術(shù)、遠(yuǎn)程鏡像技術(shù)、快照技術(shù)等。其中數(shù)據(jù)復(fù)制技術(shù)又分為。同步數(shù)據(jù)復(fù)制、異步數(shù)據(jù)復(fù)制。應(yīng)用容災(zāi)包括集群技術(shù)、災(zāi)難檢測技術(shù)、系統(tǒng)遷移技術(shù)和系統(tǒng)恢復(fù)技術(shù)等。
所謂數(shù)據(jù)備份技術(shù),就是讓數(shù)據(jù)能以某種特定的格式加以保留,以便在系統(tǒng)遭受災(zāi)害時能重新加以利用的一個過程。其目的就是為了使數(shù)據(jù)能重新利用,換句話說,數(shù)據(jù)備份的核心是能使數(shù)據(jù)恢復(fù),一個無法恢復(fù)的數(shù)據(jù)備份是毫無意義的,也不能達(dá)到容災(zāi)的要求。數(shù)據(jù)備份有4種策略:完全備份、增量備份、差異備份和即時備份。為了確保備份的數(shù)據(jù)具有完整性,數(shù)據(jù)備份又分為冷備份和熱備份。冷備份又稱為離線備份,當(dāng)執(zhí)行備份操作時,服務(wù)器將不能接受來自用戶和應(yīng)用對數(shù)據(jù)的更新。熱備份也稱在線備份,即同步數(shù)據(jù)備份。它是在用戶和應(yīng)用正在更新數(shù)據(jù)時,系統(tǒng)也可以進(jìn)行備份[2]。
和數(shù)據(jù)備份相比,數(shù)據(jù)復(fù)制技術(shù)則是通過將生產(chǎn)數(shù)據(jù)復(fù)制到另一個存儲備份系統(tǒng)中,這個存儲備份系統(tǒng)可以是本地的,也可以是異地的,從而保證在災(zāi)難發(fā)生時,生產(chǎn)數(shù)據(jù)不丟失或丟失量最少。數(shù)據(jù)復(fù)制可以分成同步數(shù)據(jù)復(fù)制和異步數(shù)據(jù)復(fù)制。同步數(shù)據(jù)復(fù)制就是將本地生產(chǎn)系統(tǒng)的數(shù)據(jù)以同步的方式復(fù)制到備份系統(tǒng)中。由于發(fā)生在生產(chǎn)系統(tǒng)的每一次I/O操作都需要等待遠(yuǎn)程復(fù)制完成才能返回,這種復(fù)制方式雖然可以做到數(shù)據(jù)的零丟失,但是對系統(tǒng)的性能有很大的影響。異步數(shù)據(jù)復(fù)制則是將本地生產(chǎn)系統(tǒng)中的數(shù)據(jù)在后臺異步地復(fù)制到備份系統(tǒng)中。這種復(fù)制方式會有少量的數(shù)據(jù)丟失,但是對生產(chǎn)系統(tǒng)的性能影響較小。
應(yīng)用容災(zāi)是建立在數(shù)據(jù)容災(zāi)的基礎(chǔ)上的,是在備份端建立一套與生產(chǎn)系統(tǒng)完全一致的備份應(yīng)用系統(tǒng),建立這樣一個系統(tǒng)相對復(fù)雜,不僅需要一份可用的數(shù)據(jù)備份,還要有包括網(wǎng)絡(luò)、主機(jī)、應(yīng)用等資源。數(shù)據(jù)容災(zāi)是應(yīng)用容災(zāi)的基礎(chǔ),應(yīng)用容災(zāi)是數(shù)據(jù)容災(zāi)的目標(biāo)。集群系統(tǒng)是一套冗余的高可用性系統(tǒng),運(yùn)行用來檢測集群系統(tǒng)運(yùn)行狀態(tài)的高可靠性軟件。當(dāng)集群中的某臺服務(wù)器發(fā)生故障,該軟件會自動將設(shè)定的服務(wù)轉(zhuǎn)到另一臺服務(wù)器上,當(dāng)這臺服務(wù)器恢復(fù)正常后,軟件還會將原來的服務(wù)分配給改服務(wù)器運(yùn)行,讓使用用戶感覺不到服務(wù)器的切換,認(rèn)為對外提供的服務(wù)始終是由一臺服務(wù)器來完成的。
遼河油田靜態(tài)數(shù)據(jù)庫存放的是遼河油田開發(fā)建設(shè)40多年來積累的靜態(tài)資料,這些資料種類繁多且電子化耗時耗力,十分珍貴。遼河油田靜態(tài)數(shù)據(jù)庫提供瀏覽、查詢等功能,可以通過瀏覽器查詢到各類靜態(tài)資料和科研成果資料。靜態(tài)數(shù)據(jù)也是地質(zhì)研究工作和油藏評價工作的基礎(chǔ),科研人員在使用靜態(tài)資料進(jìn)行科研生產(chǎn)研究也會產(chǎn)生一些珍貴的成果資料,這些資料都存儲在靜態(tài)數(shù)據(jù)庫中。因此,遼河油田靜態(tài)數(shù)據(jù)庫的平穩(wěn)運(yùn)行,關(guān)系到整個油田的井位部署和新老區(qū)調(diào)驅(qū)上產(chǎn)等工作的順利開展,顯得尤為重要。
由于遼河油田靜態(tài)數(shù)據(jù)庫底層數(shù)據(jù)庫是基于Oracle的數(shù)據(jù)庫,因此我們采用了Oracle的RAC數(shù)據(jù)庫系統(tǒng)(Real Application Clusters,實(shí)時應(yīng)用集群)。Oracle RAC能使多臺服務(wù)器同時訪問同一個Oracle數(shù)據(jù)庫,這樣可以避免由于一臺服務(wù)器的宕機(jī)時導(dǎo)致數(shù)據(jù)庫不能訪問,具有高可用性,同時也可以進(jìn)行并行運(yùn)算和負(fù)載均衡,保證前端應(yīng)用系統(tǒng)正常運(yùn)行。Oracle RAC具有很好的可伸縮性,可以根據(jù)需要添加或減少節(jié)點(diǎn)[3]。
圖1 T4的連接圖
Oracle RAC集群實(shí)質(zhì)是讓多個節(jié)點(diǎn)同時訪問同一個Oracle數(shù)據(jù)庫,每個節(jié)點(diǎn)運(yùn)行一個實(shí)例,數(shù)據(jù)庫存儲在共享磁盤上。共享存儲設(shè)備的存儲機(jī)制可以使用裸設(shè)備、Oracle集群文件系統(tǒng)(OCFS)、自動存儲管理(ASM)或網(wǎng)絡(luò)區(qū)域存儲(NAS)、SAN 存儲。我們使用Oracle的Clusterware集群軟件,部署了4臺基于InfiniBand交換機(jī)互聯(lián)的T4服務(wù)器作為Oracle的服務(wù)器來使用(參見圖1)。InfiniBand是集合了業(yè)界的努力而開發(fā)出來的,能夠替代 PCI總線的新標(biāo)準(zhǔn),它是由 Intel、Microsoft、IBM、HP 等 7 家公司牽頭,共同研發(fā)的高速先進(jìn)的I/O標(biāo)準(zhǔn)。InfiniBand交換機(jī)廣泛應(yīng)用于高性能服務(wù)器領(lǐng)域,該互聯(lián)網(wǎng)絡(luò)具有高帶寬,低延時等優(yōu)點(diǎn),是目前全球帶寬最高的高速網(wǎng)絡(luò)互聯(lián)技術(shù)。使用InfiniBand交換機(jī),可以很好地保證4節(jié)點(diǎn)的Oracle RAC集群高可用性。
圖2 存儲連接圖
對于數(shù)據(jù)存儲系統(tǒng),我們采用HDS VSP存儲(參見圖2)它是HDS的一款高性能、高可靠性的高端存儲系統(tǒng),適用于所有的數(shù)據(jù)類型,并能具有3D可擴(kuò)展性。通過在每個節(jié)點(diǎn)上安裝HDS提供的Dynamic Link Manager軟件(多路徑管理軟件),可以識別存儲共享的磁盤。HDLM提供主機(jī)到存儲系統(tǒng)的I/O通道負(fù)載平衡和故障切換功能。HDLM對數(shù)據(jù)通道進(jìn)行實(shí)時監(jiān)控,檢測每個通道的狀態(tài);當(dāng)有任何一個通道發(fā)生故障時自動將I/O切換到其他健康的通道上,保證了業(yè)務(wù)7×24不間斷地運(yùn)行,增強(qiáng)了主機(jī)系統(tǒng)的數(shù)據(jù)可用性。當(dāng)故障通道修復(fù)或替換完畢后,可在線激活,重新開始工作。TrueCopy同步數(shù)據(jù)容災(zāi)解決方案是HDS結(jié)合智能存儲系統(tǒng)的特點(diǎn)推出的數(shù)據(jù)遠(yuǎn)程容災(zāi)解決方案(參見圖3)。它是基于磁盤存儲系統(tǒng)運(yùn)行的軟件包,不依賴任何的主機(jī)操作系統(tǒng)和其他第三方廠商軟件,為用戶提供了最安全、最開放、最經(jīng)濟(jì)、最實(shí)用的容災(zāi)解決方案。TrueCopy采用獨(dú)立于主機(jī)與應(yīng)用的基于邏輯單元級的實(shí)時數(shù)據(jù)備份,可靠地在另一地點(diǎn)對用戶重要數(shù)據(jù)進(jìn)行鏡像并進(jìn)行持續(xù)的在線更新。在災(zāi)難發(fā)生時,TrueCopy會對數(shù)據(jù)實(shí)施無縫保護(hù),免除了一系列煩瑣的手工磁盤恢復(fù)的過程。TrueCopy相比于傳統(tǒng)的手工恢復(fù)步驟,將災(zāi)難恢復(fù)的時間大大減小。
圖3 TrueCopy示意圖
兩臺HDS VSP之間通說光纖線直連,通過在存儲網(wǎng)絡(luò)中布置一臺控制主機(jī)(CCI主機(jī)),控制兩臺存儲之間的同步關(guān)系,CCI主機(jī)只需發(fā)給主存儲一次命令,即可執(zhí)行實(shí)時在線同步。
本文介紹了容災(zāi)系統(tǒng)的關(guān)鍵技術(shù),并結(jié)合生產(chǎn)實(shí)際,搭建了一套適合本業(yè)務(wù)的容災(zāi)備份系統(tǒng)。容災(zāi)備份系統(tǒng)的建立,提供了一套可靠的數(shù)據(jù)運(yùn)行環(huán)境,降低了災(zāi)難發(fā)生時對企業(yè)帶來的損失,提高了系統(tǒng)的可靠性,保證了生產(chǎn)的順利進(jìn)行。
[1] 陳汶濱,呂曼曼,劉義軍.容災(zāi)備份系統(tǒng)研究[J].計(jì)算機(jī)安全,2009(7).
[2] 劉艷.SAN環(huán)境下數(shù)據(jù)備份系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[D].重慶:重慶大學(xué),2008.
[3] 李智賢.ORACLE RAC集群在自動化設(shè)備管理系統(tǒng)中的應(yīng)用[J].儀器儀表標(biāo)準(zhǔn)化與計(jì)量,2010(5).