朱潤(rùn)娟,魏能強(qiáng),肖菊香
(航空工業(yè)成飛,四川 成都 610091)
數(shù)據(jù)備份是指為了防止系統(tǒng)故障或人為操作失誤等因素造成生產(chǎn)數(shù)據(jù)的丟失或損壞,影響公司科研生產(chǎn)正常運(yùn)行的事件發(fā)生,而將生產(chǎn)的文件系統(tǒng)或數(shù)據(jù)庫(kù)數(shù)據(jù)從應(yīng)用主機(jī)的硬盤或磁盤陣列備份到專用備份存儲(chǔ)介質(zhì)的過程,是對(duì)備份數(shù)據(jù)進(jìn)行有效管理的一系列工作。
人工備份比較簡(jiǎn)單,一般通過數(shù)據(jù)庫(kù)或者系統(tǒng)自帶的命令來實(shí)現(xiàn),簡(jiǎn)單的幾條腳本語(yǔ)句就能完成相關(guān)數(shù)據(jù)的備份工作,備份數(shù)據(jù)存放于本地,適合規(guī)模較小的生產(chǎn)環(huán)境。但是,當(dāng)備份需求的規(guī)?;蚴菙?shù)據(jù)量達(dá)到一定程度時(shí),對(duì)于數(shù)據(jù)備份的基本管理就有了更進(jìn)一步的要求,部署簡(jiǎn)單的幾個(gè)備份腳本已遠(yuǎn)遠(yuǎn)無法滿足管理的需求,這就需要通過專業(yè)的備份軟件及備份設(shè)備對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的管理。
為了滿足種類繁多、數(shù)據(jù)量大,數(shù)據(jù)保護(hù)要求高的備份需求,企業(yè)通常會(huì)采用集中、統(tǒng)一管理的備份系統(tǒng)對(duì)數(shù)據(jù)進(jìn)行自動(dòng)化備份,即在專用的服務(wù)器和存儲(chǔ)設(shè)備上部署專業(yè)的備份軟件,同時(shí),在需要進(jìn)行數(shù)據(jù)備份的各類平臺(tái)上部署備份客戶端對(duì)數(shù)據(jù)庫(kù)或文件系統(tǒng)進(jìn)行自動(dòng)化備份,由備份系統(tǒng)負(fù)責(zé)調(diào)度備份任務(wù)的執(zhí)行及備份數(shù)據(jù)介質(zhì)的管理等。
兩種備份方式相對(duì)而言,人工備份成本較低,容易實(shí)現(xiàn),但其備份效率較低,數(shù)據(jù)保護(hù)的時(shí)效性較差,無法滿足數(shù)據(jù)量較大且對(duì)數(shù)據(jù)保護(hù)要求較高的場(chǎng)景。而通過備份系統(tǒng)進(jìn)行數(shù)據(jù)備份的方式雖然成本較高,且對(duì)備份人員的技術(shù)水平要求較高,但其系統(tǒng)穩(wěn)定性好、備份效率高、數(shù)據(jù)保護(hù)性好,符合各類場(chǎng)景的數(shù)據(jù)保護(hù)需求,成為目前主流的數(shù)據(jù)備份方式。
數(shù)據(jù)中心包含一個(gè)企業(yè)幾乎所有的信息系統(tǒng),但并不是所有的數(shù)據(jù)都要進(jìn)行備份,要區(qū)分清楚哪些數(shù)據(jù)需要備份。
首先,與科研生產(chǎn)密切相關(guān),數(shù)據(jù)一旦丟失,將影響科研生產(chǎn)正常運(yùn)行的數(shù)據(jù),如操作系統(tǒng)數(shù)據(jù)、數(shù)據(jù)庫(kù)數(shù)據(jù)、文件系統(tǒng)數(shù)據(jù)等。其次,信息系統(tǒng)原始的配置參數(shù)信息,如果信息系統(tǒng)崩潰,關(guān)鍵時(shí)候用來進(jìn)行系統(tǒng)恢復(fù)的數(shù)據(jù),如原始安裝文件、配置參數(shù)等。
此外,備份系統(tǒng)本身的配置信息、調(diào)度信息和介質(zhì)信息,這些數(shù)據(jù)關(guān)系到備份作業(yè)的運(yùn)行狀態(tài),一旦備份系統(tǒng)出現(xiàn)故障,可通過這些數(shù)據(jù)進(jìn)行分析和恢復(fù),如備份系統(tǒng)日志文件等。
一般包括備份頻率和備份時(shí)間窗口,備份頻率是指多長(zhǎng)時(shí)間進(jìn)行一次數(shù)據(jù)備份作業(yè),一般根據(jù)備份內(nèi)容的重要程度,分為日備份、周備份、月備份和年備份,并根據(jù)備份內(nèi)容的類型和數(shù)據(jù)量大小采用不同的備份方式及數(shù)據(jù)保存期限。通常采用幾種備份頻率相結(jié)合的方式進(jìn)行數(shù)據(jù)備份,提高了備份數(shù)據(jù)的有效性和安全性。
備份時(shí)間窗口一般指的是數(shù)據(jù)備份時(shí)間段,配置備份策略時(shí),首先,要考慮什么時(shí)候執(zhí)行備份操作,因?yàn)樵跀?shù)據(jù)備份過程中,會(huì)產(chǎn)生大量的讀寫操作,從而占用部分I/O資源,因此通常會(huì)選擇在非業(yè)務(wù)時(shí)間或者業(yè)務(wù)不繁忙的時(shí)候進(jìn)行數(shù)據(jù)備份,避免對(duì)正常生產(chǎn)業(yè)務(wù)造成影響。
備份角色一般包括備份系統(tǒng)管理人員、應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫(kù)管理人員,其中,應(yīng)用系統(tǒng)管理人員負(fù)責(zé)提出數(shù)據(jù)備份的需求申請(qǐng),包括備份內(nèi)容、備份啟動(dòng)窗口及備份數(shù)據(jù)保留期限等,同時(shí),配合備份系統(tǒng)管理人員分析處理備份異常問題。
數(shù)據(jù)庫(kù)管理人員負(fù)責(zé)提供數(shù)據(jù)庫(kù)備份腳本,通過備份系統(tǒng)調(diào)用實(shí)現(xiàn)數(shù)據(jù)備份,同時(shí)配合備份系統(tǒng)管理人員分析處理數(shù)據(jù)庫(kù)備份異常問題。備份系統(tǒng)管理人員根據(jù)已溝通確認(rèn)的備份需求,結(jié)合實(shí)際備份資源情況,制定備份策略,包括備份啟動(dòng)窗口、備份頻率、備份級(jí)別等,同時(shí),負(fù)責(zé)監(jiān)控備份任務(wù)日常運(yùn)行情況,對(duì)備份異常情況進(jìn)行處理,必要時(shí),需要聯(lián)合應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫(kù)管理人員一起進(jìn)行故障處理。
最后,應(yīng)用系統(tǒng)管理員、數(shù)據(jù)庫(kù)管理員和備份系統(tǒng)管理員需要相互配合制定恢復(fù)方案,對(duì)備份數(shù)據(jù)進(jìn)行恢復(fù)測(cè)試,校驗(yàn)備份數(shù)據(jù)的有效性,包括恢復(fù)對(duì)象、恢復(fù)方式、恢復(fù)時(shí)間點(diǎn)等,由備份系統(tǒng)管理員負(fù)責(zé)執(zhí)行數(shù)據(jù)從備份存儲(chǔ)到應(yīng)用存儲(chǔ)的恢復(fù)操作,由系統(tǒng)管理員或數(shù)據(jù)庫(kù)管理員執(zhí)行備份數(shù)據(jù)到應(yīng)用系統(tǒng)的恢復(fù)操作。
掌握了以上基本信息,接下來應(yīng)該考慮如何進(jìn)行備份操作。數(shù)據(jù)備份的意義在于當(dāng)意外發(fā)生時(shí),如何通過數(shù)據(jù)備份規(guī)避數(shù)據(jù)丟失,保障生產(chǎn)業(yè)務(wù)連續(xù)性。
首先,要明確備份對(duì)象,即需要備份的是數(shù)據(jù)庫(kù)還是文件;其次,需確認(rèn)備份頻率,即多久備份一次,備份級(jí)別是全備還是增量;然后,確定備份時(shí)間窗口,即什么時(shí)候開始備份,大致什么時(shí)候可以完成備份;最后,確定備份數(shù)據(jù)的保留期限,即備份介質(zhì)保存多久后可以回收再利用。
在確認(rèn)了以上幾點(diǎn)后,就可以有針對(duì)性地配置相關(guān)的配置參數(shù)進(jìn)行備份。制定備份策略有以下思路。
(1)當(dāng)生產(chǎn)系統(tǒng)對(duì)數(shù)據(jù)丟失的容忍度較低,即RPO值盡量小時(shí),一般可通過提高備份頻率來實(shí)現(xiàn)。例如,Oracle數(shù)據(jù)庫(kù)的在線備份可以適當(dāng)提高歸檔日志備份頻率。(2)當(dāng)生產(chǎn)系統(tǒng)對(duì)恢復(fù)時(shí)間的容忍度較低,即RTO值盡量短時(shí),一般有兩種解決方案,一是提高恢復(fù)的速度,比如,可通過SAN網(wǎng)絡(luò)傳輸備份速度來提高恢復(fù)速度;二是減少恢復(fù)的數(shù)據(jù)量,比如,可以每次進(jìn)行全備,在恢復(fù)時(shí)可直接恢復(fù)全備即可,而無須再進(jìn)行全備加增量的恢復(fù)步驟,省去了增量數(shù)據(jù)的恢復(fù)時(shí)間。(3)當(dāng)備份數(shù)據(jù)的保留時(shí)間較長(zhǎng)時(shí),需要考慮備份介質(zhì)的壽命,設(shè)置合適的備份保留時(shí)間,在介質(zhì)壽命到期前進(jìn)行介質(zhì)轉(zhuǎn)換儲(chǔ)存。(4)當(dāng)需要備份的時(shí)間窗口盡可能短時(shí),可以選擇在業(yè)務(wù)空閑時(shí)間進(jìn)行備份,同時(shí),可以通過源端去重技術(shù)和全備結(jié)合增量備份的方式減少備份數(shù)據(jù)量,從而縮短備份時(shí)間。
總之,備份策略的制定需要具體情況具體分析,針對(duì)不同的備份需求進(jìn)行綜合考慮,根據(jù)實(shí)際情況來制定最合適的備份策略,再按照備份策略及備份軟件的操作手冊(cè)進(jìn)行相應(yīng)的部署實(shí)施工作。
為了避免備份數(shù)據(jù)在需要時(shí)找不到相應(yīng)的數(shù)據(jù)或者備份數(shù)據(jù)損壞無法恢復(fù),我們需要妥善保存?zhèn)浞輸?shù)據(jù)。備份數(shù)據(jù)存放在備份介質(zhì)上,備份介質(zhì)通常是磁盤和磁帶。備份介質(zhì)應(yīng)進(jìn)行專人管理,建立備份檔案,對(duì)備份介質(zhì)存放與提取進(jìn)行嚴(yán)格管理,實(shí)行審批并登記;選擇適合備份介質(zhì)保存的環(huán)境,包括溫度、濕度和磁場(chǎng)三方面,存放溫度建議控制在5~40℃,濕度控制在20%~80%RH,同時(shí)避免磁場(chǎng)干擾;根據(jù)磁帶使用情況定期進(jìn)行轉(zhuǎn)儲(chǔ),通常磁帶壽命一般為5~10年,讀寫次數(shù)不超過2000次,對(duì)于長(zhǎng)期保存的磁帶,需要定期進(jìn)行轉(zhuǎn)儲(chǔ),防止備份數(shù)據(jù)過期失效。
數(shù)據(jù)備份的最終目的就是在需要數(shù)據(jù)恢復(fù)時(shí),能夠及時(shí)地將數(shù)據(jù)恢復(fù)出來。為了驗(yàn)證備份數(shù)據(jù)的可恢復(fù)性,需要在平時(shí)做好數(shù)據(jù)的恢復(fù)演練,做好測(cè)試驗(yàn)證,確保在關(guān)鍵時(shí)刻體現(xiàn)出備份數(shù)據(jù)的意義和價(jià)值。
備份系統(tǒng)管理員應(yīng)該每天對(duì)備份系統(tǒng)的運(yùn)行狀態(tài)進(jìn)行監(jiān)控,查看備份系統(tǒng)整體運(yùn)行是否正常,備份任務(wù)是否按計(jì)劃成功完成,如發(fā)現(xiàn)異常,則需進(jìn)一步查看相關(guān)的日志信息,及時(shí)處理備份故障,確保備份數(shù)據(jù)的時(shí)有效。
一般按照監(jiān)控對(duì)象的不同分為備份硬件監(jiān)控和備份軟件監(jiān)控。
硬件監(jiān)控:機(jī)房實(shí)地巡查設(shè)備是否有指示燈告警,或者遠(yuǎn)程登錄設(shè)備查看硬件狀態(tài),確認(rèn)硬件正常運(yùn)行。
軟件監(jiān)控:登錄備份軟件查看備份任務(wù)、備份存儲(chǔ)和備份磁帶庫(kù)的運(yùn)行情況,若有備份失敗,通過報(bào)錯(cuò)日志分析原因并及時(shí)處理,必要時(shí),請(qǐng)應(yīng)用系統(tǒng)管理人員和數(shù)據(jù)庫(kù)管理人員共同協(xié)調(diào)解決備份故障。
目前,現(xiàn)有的備份技術(shù)和備份手段越來越成熟,已形成一套完善的數(shù)據(jù)保護(hù)體系。但大多數(shù)軟硬件產(chǎn)品依然采用國(guó)外品牌,未完全實(shí)現(xiàn)國(guó)產(chǎn)自主產(chǎn)權(quán),國(guó)產(chǎn)化備份軟件及備份設(shè)備品牌較少,數(shù)據(jù)備份應(yīng)緊跟軟硬件產(chǎn)品的國(guó)產(chǎn)化替代步伐,在信息技術(shù)國(guó)產(chǎn)化的過程中,及時(shí)做好數(shù)據(jù)保護(hù)工作,為科研生產(chǎn)的正常運(yùn)行保駕護(hù)航。