韓同欣 李楠
摘要:基于虛擬化技術(shù)構(gòu)建的云計(jì)算平臺(tái)成為數(shù)據(jù)中心的主流架構(gòu),針對(duì)虛擬平臺(tái)只是提供了主機(jī)之間的高可用,未實(shí)現(xiàn)虛機(jī)系統(tǒng)層及用戶(hù)數(shù)據(jù)可靠性保護(hù)的情況,給出了一種面向虛擬平臺(tái)的備份恢復(fù)架構(gòu),在虛擬環(huán)境發(fā)生故障時(shí)能夠迅速?gòu)钠脚_(tái)級(jí)、數(shù)據(jù)級(jí)恢復(fù)虛擬平臺(tái)及業(yè)務(wù)虛機(jī)正常運(yùn)行,同時(shí)實(shí)現(xiàn)虛機(jī)內(nèi)文件級(jí)細(xì)粒度備份及恢復(fù),并通過(guò)數(shù)據(jù)去重刪除技術(shù)實(shí)現(xiàn)在有限的備份空間下保存更多備份數(shù)據(jù)。
關(guān)鍵詞:虛擬化;數(shù)據(jù)保護(hù);備份恢復(fù);云計(jì)算;數(shù)據(jù)重刪
中圖分類(lèi)號(hào):TP391 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1009-3044(2015)20-0018-02
虛擬平臺(tái)具有的按需資源分配、動(dòng)態(tài)資源調(diào)整[1]等特點(diǎn)吸引著越來(lái)越多的用戶(hù)將業(yè)務(wù)科研應(yīng)用系統(tǒng)遷移、部署到云平臺(tái)。一旦由于軟硬件原因?qū)е略破脚_(tái)底層文件系統(tǒng)出現(xiàn)錯(cuò)誤,會(huì)影響到之上的多個(gè)虛機(jī)系統(tǒng)。因此,建立面向虛擬環(huán)境的備份恢復(fù)系統(tǒng),在云環(huán)境發(fā)生故障時(shí)能夠迅速?gòu)钠脚_(tái)級(jí)、數(shù)據(jù)級(jí)恢復(fù)云平臺(tái)正常運(yùn)行及業(yè)務(wù)虛機(jī)正常運(yùn)行,成為目前虛擬平臺(tái)亟需解決的問(wèn)題之一。
1 備份恢復(fù)功能設(shè)計(jì)
面向虛擬環(huán)境的備份恢復(fù)系統(tǒng)能夠從異構(gòu)的環(huán)境、異構(gòu)平臺(tái)和異構(gòu)應(yīng)用提供一體化的恢復(fù)和管理模式,從操作系統(tǒng)、虛擬化環(huán)境、應(yīng)用數(shù)據(jù)庫(kù)到文件數(shù)據(jù)提供保護(hù)。需要實(shí)現(xiàn)以下功能點(diǎn):
1)支持對(duì)不同虛擬環(huán)境的備份保護(hù),例如Vmware、vSphere、Xen等??蓪?shí)現(xiàn)虛擬機(jī)整個(gè)虛擬磁盤(pán)文件的整體備份保護(hù),也可以采用安裝客戶(hù)端的方式,對(duì)虛擬機(jī)里面的文件、數(shù)據(jù)進(jìn)行選擇性的備份。
2)可通過(guò)掛載恢復(fù)方式在分鐘級(jí)內(nèi)完成核心業(yè)務(wù)虛擬機(jī)的應(yīng)急恢復(fù);實(shí)現(xiàn)對(duì)核心虛擬服務(wù)器的文件級(jí)細(xì)粒度恢復(fù),可選擇所需要恢復(fù)的文件或目錄,恢復(fù)到指定位置,而無(wú)需恢復(fù)整個(gè)虛擬機(jī),提升恢復(fù)效率。
3)針對(duì)虛擬機(jī)里面Oracle通過(guò)RMAN熱備份的方式保護(hù)數(shù)據(jù)庫(kù)中的重要數(shù)據(jù),同時(shí)在用戶(hù)數(shù)據(jù)丟失的情況下給予原服務(wù)器恢復(fù)或者是指定Oracle數(shù)據(jù)庫(kù)的異機(jī)恢復(fù)選擇。分鐘級(jí)內(nèi)即可將用戶(hù)的Oracle數(shù)據(jù)庫(kù)和應(yīng)用數(shù)據(jù)有效保護(hù)起來(lái)。
4)同時(shí)實(shí)現(xiàn)Lan-Base與Lan-Free備份,最大化利用網(wǎng)絡(luò)資源,在不影響生產(chǎn)運(yùn)行的情況下完成數(shù)據(jù)保護(hù)。
5)通過(guò)全局重復(fù)數(shù)據(jù)刪除技術(shù)實(shí)現(xiàn)在有限的備份空間下,可以保存更多備份數(shù)據(jù),并節(jié)約網(wǎng)絡(luò)帶寬。
2 備份架構(gòu)設(shè)計(jì)
2.1 備份機(jī)制
備份系統(tǒng)包含管理控制臺(tái)系統(tǒng)、介質(zhì)服務(wù)器系統(tǒng)、客戶(hù)端系統(tǒng),由客戶(hù)端發(fā)起備份連接請(qǐng)求,保持和管理控制臺(tái)的通訊,最終將備份數(shù)據(jù)同步到備份介質(zhì)中。備份過(guò)程采用模塊化備份方式,調(diào)用數(shù)據(jù)庫(kù)或虛擬化平臺(tái)的API完成備份,以Vmware為例,可通過(guò)VStorageAPI實(shí)現(xiàn)整體備份恢復(fù)[2],并利用CBT增量備份技術(shù)實(shí)現(xiàn)虛擬機(jī)真正的增量備份,提升備份效率。其他應(yīng)用與此類(lèi)似。
此外,針對(duì)海量數(shù)據(jù)尤其是虛擬機(jī)居多的現(xiàn)狀,可采用重復(fù)數(shù)據(jù)刪除技術(shù)[3],在備份介質(zhì)中只存放非重復(fù)數(shù)據(jù),大量節(jié)約備份空間及網(wǎng)絡(luò)帶寬,降低整體成本及運(yùn)維成本。
2.2備份策略
根據(jù)虛機(jī)承載的應(yīng)用系統(tǒng)業(yè)務(wù)運(yùn)行特點(diǎn),制定不同的備份計(jì)劃,選擇最合適的備份策略,如是否開(kāi)啟重復(fù)數(shù)據(jù)刪除、備份周期、保留周期、選擇普通備份或高級(jí)備份模式、備份目的地等。
對(duì)于不同類(lèi)型的應(yīng)用采用不同分組和不同的備份策略,并將時(shí)間錯(cuò)開(kāi),避免對(duì)網(wǎng)絡(luò)、計(jì)算資源的爭(zhēng)用,最大化提升資源利用率,提升備份效率。備份虛擬機(jī)數(shù)目較大的情況,應(yīng)采用分組方式,將全量和增量備份時(shí)間完全錯(cuò)開(kāi),以在現(xiàn)有網(wǎng)絡(luò)條件下,盡可能提升備份效率。
2.3 系統(tǒng)架構(gòu)
此次設(shè)計(jì)的備份系統(tǒng)獨(dú)立部署,對(duì)接虛擬平臺(tái)。采用一體化備份恢復(fù)架構(gòu),包括軟件、備份存儲(chǔ)介質(zhì),在不改變現(xiàn)有網(wǎng)絡(luò)架構(gòu)的前提下,可將備份恢復(fù)系統(tǒng)直接接入生產(chǎn)環(huán)境,對(duì)虛擬平臺(tái)數(shù)據(jù)進(jìn)行保護(hù)。不使用虛擬平臺(tái)現(xiàn)有的存儲(chǔ),主要優(yōu)點(diǎn)如下:
1)當(dāng)原有存儲(chǔ)發(fā)生故障時(shí),備份數(shù)據(jù)在另外的位置,不會(huì)因?yàn)樵写鎯?chǔ)異常導(dǎo)致生產(chǎn)數(shù)據(jù)與備份數(shù)據(jù)同時(shí)丟失。
2)不使用虛擬機(jī)自帶的快照等機(jī)制,一方面更加便于管理,在統(tǒng)一界面實(shí)現(xiàn)備份與恢復(fù)管理、存儲(chǔ)管理、用戶(hù)管理等;另一方面具備更廣泛的兼容性,可保護(hù)不同的虛擬機(jī)、系統(tǒng)及數(shù)據(jù)庫(kù)、文件等,并具備重復(fù)數(shù)據(jù)刪除等特性。
備份系統(tǒng)架構(gòu)如圖1:
圖1 備份系統(tǒng)與虛擬平臺(tái)的架構(gòu)關(guān)系
架構(gòu)說(shuō)明:
備份恢復(fù)系統(tǒng)采用一體化形態(tài),云計(jì)算架構(gòu),集群式部署,可Scale-Out動(dòng)態(tài)擴(kuò)展。集群內(nèi)包含管理節(jié)點(diǎn)與多個(gè)數(shù)據(jù)備份節(jié)點(diǎn),可以形成統(tǒng)一的備份存儲(chǔ)池,實(shí)現(xiàn)統(tǒng)一管理。
在要保護(hù)的虛擬機(jī)或服務(wù)器上部署備份客戶(hù)端,通過(guò)向?qū)瓿蛇B接配置,同時(shí)可采用模塊化備份方式,實(shí)現(xiàn)無(wú)代理備份,只需在Vcenter等虛擬管理控制臺(tái)上面安裝一個(gè)客戶(hù)端,即可實(shí)現(xiàn)對(duì)所有虛擬機(jī)的一次性備份。針對(duì)虛擬化有NBD方式、NBD-SSL方式、SAN方式[4]。將備份恢復(fù)系統(tǒng)連接到內(nèi)區(qū)的FC-SAN交換機(jī)上,通過(guò)備份恢復(fù)系統(tǒng)實(shí)現(xiàn)對(duì)內(nèi)網(wǎng)區(qū)存儲(chǔ)中的數(shù)據(jù)使用FC網(wǎng)絡(luò)進(jìn)行快速備份。備份恢復(fù)系統(tǒng)通過(guò)內(nèi)網(wǎng)區(qū)的以太網(wǎng)交換機(jī)接入到IP網(wǎng)絡(luò)中,通過(guò)IP網(wǎng)絡(luò)對(duì)備份進(jìn)行管理。對(duì)于DMZ區(qū),在虛擬機(jī)管理平臺(tái)上安裝備份客戶(hù)端,由內(nèi)網(wǎng)區(qū)的備份恢復(fù)系統(tǒng)通過(guò)IP網(wǎng)絡(luò)實(shí)現(xiàn)虛機(jī)數(shù)據(jù)流的備份和恢復(fù)以及備份控制管理。在制定備份策略時(shí)可通過(guò)管理平臺(tái)設(shè)置備份策略選擇對(duì)虛擬機(jī)的獨(dú)立備份或統(tǒng)一備份功能。
2.4 系統(tǒng)可靠性設(shè)計(jì)
備份恢復(fù)系統(tǒng)采用集群架構(gòu),多個(gè)備份節(jié)點(diǎn)并發(fā)備份,可保證部分節(jié)點(diǎn)故障時(shí),不會(huì)影響其他節(jié)點(diǎn)的備份任務(wù)運(yùn)行,同時(shí)備份恢復(fù)系統(tǒng)具備自備份機(jī)制,在備份恢復(fù)系統(tǒng)故障時(shí),可通過(guò)自備份數(shù)據(jù)將索引、任務(wù)信息等導(dǎo)回,快速恢復(fù)備份作業(yè)。備份存儲(chǔ)空間與備份恢復(fù)系統(tǒng)在不同介質(zhì)部署,備份存儲(chǔ)支持Raid0、1、5、6,依據(jù)經(jīng)驗(yàn),一般做Raid5+熱備盤(pán)方式使用,提升備份介質(zhì)的可靠性。備份恢復(fù)系統(tǒng)軟硬件均有告警機(jī)制,確保及時(shí)發(fā)現(xiàn)問(wèn)題與處理。
3 備份恢復(fù)流程
由客戶(hù)端發(fā)起恢復(fù)連接請(qǐng)求,保持和管理控制臺(tái)的通訊,最終將備份數(shù)據(jù)從備份介質(zhì)中恢復(fù)到目標(biāo)服務(wù)器或虛擬化平臺(tái)下。數(shù)據(jù)恢復(fù)調(diào)用各應(yīng)用系統(tǒng)的接口,如VstorageAPI、Oracle rman等,以保證恢復(fù)一致性及有效性,同時(shí)選擇相應(yīng)歷史時(shí)間點(diǎn)的備份集作為恢復(fù)源,將所需恢復(fù)數(shù)據(jù)恢復(fù)到原機(jī)或異機(jī)。
當(dāng)整個(gè)虛擬機(jī)故障時(shí),若緊急恢復(fù)業(yè)務(wù),可通過(guò)“掛載恢復(fù)”方式實(shí)現(xiàn)應(yīng)急接管,恢復(fù)時(shí)間在分鐘級(jí);虛擬機(jī)故障時(shí),可采用“普通恢復(fù)”模式,將虛擬機(jī)整體恢復(fù)到指定的虛機(jī)管理控制臺(tái)下,并可設(shè)置是否自動(dòng)開(kāi)機(jī)、聯(lián)網(wǎng)。當(dāng)只是損壞虛擬機(jī)部分文件或目錄時(shí),可通過(guò)“細(xì)粒度恢復(fù)”方式,選擇需要的文件或目錄,恢復(fù)到原機(jī)或異機(jī)任意路徑下。以上恢復(fù)場(chǎng)景均需選擇想要恢復(fù)的時(shí)間點(diǎn),實(shí)現(xiàn)歷史數(shù)據(jù)找回。
對(duì)于數(shù)據(jù)庫(kù)恢復(fù)場(chǎng)景(以O(shè)racle為例),若Oracle數(shù)據(jù)庫(kù)服務(wù)異?;蛘麕?kù)故障,可通過(guò)恢復(fù)任務(wù),選擇整個(gè)實(shí)例,完成整體恢復(fù),整體恢復(fù)需要停機(jī)恢復(fù),可通過(guò)日志回滾結(jié)合的方式找到更多時(shí)間點(diǎn)的數(shù)據(jù);若因誤操作誤刪除等原因?qū)е虏糠謹(jǐn)?shù)據(jù)文件或控制文件損壞,可選擇“高級(jí)恢復(fù)”模式,將損壞的控制文件結(jié)合有關(guān)聯(lián)的文件,在圖形化界面上自動(dòng)完成恢復(fù),高級(jí)恢復(fù)也需要停機(jī)恢復(fù);若因誤操作誤刪除等原因?qū)е聰?shù)據(jù)庫(kù)單表或部分表丟失,可選擇“單表恢復(fù)”模式,在不停止數(shù)據(jù)庫(kù)服務(wù)的情況下,快速將特定的表找回,恢復(fù)到原數(shù)據(jù)庫(kù)中,此過(guò)程完全采用圖形化界面操作,不需定制腳本,可行性高,恢復(fù)速度快,且不會(huì)造成二次傷害。
4 結(jié)束語(yǔ)
通過(guò)該備份系統(tǒng)使虛擬平臺(tái)中的各業(yè)務(wù)系統(tǒng)得到有效的保護(hù),增強(qiáng)基礎(chǔ)設(shè)施和重要系統(tǒng)災(zāi)難恢復(fù)能力,解決了目前虛擬平臺(tái)對(duì)于災(zāi)難恢復(fù)能力弱的問(wèn)題。為虛擬平臺(tái)中核心業(yè)務(wù)系統(tǒng)虛擬主機(jī)、關(guān)鍵業(yè)務(wù)應(yīng)用構(gòu)建應(yīng)急恢復(fù)機(jī)制,建立可用的備用應(yīng)急系統(tǒng)和數(shù)據(jù),保證業(yè)務(wù)數(shù)據(jù)不丟失和數(shù)據(jù)丟失后數(shù)據(jù)的快速恢復(fù)。以全局去重刪除技術(shù)為基礎(chǔ)設(shè)計(jì)的此架構(gòu),滿(mǎn)足了未來(lái)數(shù)據(jù)增長(zhǎng)的存儲(chǔ)備份需求,解決了不斷擴(kuò)展的備份數(shù)據(jù)量問(wèn)題。
參考文獻(xiàn):
[1] 任昱, 李青榮.基于VMware vSphere虛擬化資源管理平臺(tái)研究[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2012(5).
[2] Designing Backup Solutions for VMware vSphere[EB/OL].https://www.vmware.com/support/developer/vddk/vadp_vsphere_backup12.pdf.
[3] 敖莉, 舒繼武, 李明強(qiáng). 重復(fù)數(shù)據(jù)刪除技術(shù)[J]. 軟件學(xué)報(bào), 2010, 21(5): 916-929.
[4] Sphere Data Protection管理指南[EB/OL].http://www.wmware.corn.