□馬躍福 王 平 楊 靜
隨著社會(huì)信息化程度的不斷提高,各級(jí)檔案館也將逐步成為海量數(shù)字化檔案信息的存儲(chǔ)中心。建設(shè)安全、可用的數(shù)字化檔案信息存儲(chǔ)體系將成為現(xiàn)代檔案館的一個(gè)極其重要的內(nèi)容。目前數(shù)字化檔案信息存儲(chǔ)體系一般包括存儲(chǔ)、容災(zāi)、備份和歸檔四方面的內(nèi)容。
存儲(chǔ)架構(gòu)分為3種:DAS(直連存儲(chǔ))、NAS(網(wǎng)絡(luò)附加存儲(chǔ))、SAN(網(wǎng)絡(luò)區(qū)域存儲(chǔ))。在檔案系統(tǒng)應(yīng)用中NAS和SAN架構(gòu)最為適合:NAS數(shù)據(jù)結(jié)構(gòu)是基于文件系統(tǒng),因此NAS架構(gòu)應(yīng)用于檔案文件的存放,可以經(jīng)濟(jì)高效地實(shí)現(xiàn)檔案電子化;SAN數(shù)據(jù)結(jié)構(gòu)基于數(shù)據(jù)塊,因此SAN架構(gòu)適用于檔案數(shù)據(jù)庫的構(gòu)建,可以高性能地實(shí)現(xiàn)檔案數(shù)據(jù)的查詢和管理。
考慮完架構(gòu)后,要考慮存儲(chǔ)產(chǎn)品自身的可靠性,如存儲(chǔ)控制器是否冗余、存儲(chǔ)相關(guān)設(shè)備是否冗余、存儲(chǔ)構(gòu)造的合理性、存儲(chǔ)自身的數(shù)據(jù)安全保護(hù)等等。一個(gè)可靠的存儲(chǔ)系統(tǒng)必須至少擁有2個(gè)或以上的高性能控制器,以保證核心控制的可靠性;必須擁有至少N+1設(shè)備冗余(電源、風(fēng)扇、通道卡等);存儲(chǔ)構(gòu)造應(yīng)當(dāng)采用交換或點(diǎn)對(duì)點(diǎn)模式,來確保內(nèi)部的數(shù)據(jù)傳輸性能及容錯(cuò)性;存儲(chǔ)自身的數(shù)據(jù)安全保護(hù)涉及硬盤raid級(jí)別、故障監(jiān)測(cè)、數(shù)據(jù)快照支持和遠(yuǎn)程數(shù)據(jù)復(fù)制支持。
容災(zāi)顧名思義就是為了預(yù)備災(zāi)難發(fā)生時(shí)所做的預(yù)防應(yīng)急措施。在規(guī)劃遠(yuǎn)程容災(zāi)系統(tǒng)方案時(shí),應(yīng)根據(jù)具體要求明確方案所要達(dá)到的目標(biāo)。因?yàn)椴煌臑?zāi)難恢復(fù)目標(biāo),可以使用不同的災(zāi)難恢復(fù)技術(shù)實(shí)現(xiàn)方案,相應(yīng)地,投資規(guī)模和運(yùn)行成本也將會(huì)不同。根據(jù)信息中心的實(shí)際狀況,檔案館選擇容災(zāi)系統(tǒng)方案時(shí)應(yīng)考慮以下幾點(diǎn):
目標(biāo)-1:應(yīng)對(duì)災(zāi)難的種類
有許多計(jì)算機(jī)系統(tǒng)內(nèi)部以及計(jì)算機(jī)所處環(huán)境中的潛在因素可能會(huì)造成數(shù)據(jù)丟失情況的發(fā)生。據(jù)不完全統(tǒng)計(jì),造成數(shù)據(jù)丟失的事件中,軟硬件和網(wǎng)絡(luò)故障占11%左右,斷電和電源故障占50%左右,火災(zāi)地震爆炸和雷電等災(zāi)害占18%左右,人為因素占17%左右,其他因素占4%左右。為應(yīng)對(duì)不同的災(zāi)難,主中心和災(zāi)備中心的選址也會(huì)不一樣。例如為抵御地震災(zāi)害,主中心和災(zāi)備中心應(yīng)選擇在不同的城市,而不宜選擇同城;為抵御長時(shí)間停電故障,主中心和災(zāi)備中心就應(yīng)選在由不同的輸變電網(wǎng)絡(luò)和電廠覆蓋的區(qū)域。
只有明確災(zāi)難恢復(fù)方案所要應(yīng)對(duì)的災(zāi)難的種類,才能科學(xué)地選擇主中心和災(zāi)備中心的地理位置。
目標(biāo)-2:恢復(fù)時(shí)間目標(biāo)(RecoveryTimeObjective)
恢復(fù)時(shí)間目標(biāo)(RecoveryTime Objective-RTO)是災(zāi)難發(fā)生后業(yè)務(wù)能夠容忍的停頓時(shí)間,或者說災(zāi)難發(fā)生后,恢復(fù)業(yè)務(wù)運(yùn)行所需要的時(shí)間。一般來說,恢復(fù)時(shí)間(RTO)越短,那么災(zāi)難恢復(fù)方案的成本就越高,但是造成的業(yè)務(wù)損失就越?。环粗?,恢復(fù)時(shí)間(RTO)越長,災(zāi)難恢復(fù)方案的成本較低,但是造成的業(yè)務(wù)損失就較大。
最佳的恢復(fù)時(shí)間目標(biāo)(RTO)應(yīng)為業(yè)務(wù)影響(損失)曲線和方案成本曲線的交點(diǎn)所對(duì)應(yīng)的時(shí)間。比最佳恢復(fù)時(shí)間更短的目標(biāo)將造成投資浪費(fèi);而比最佳恢復(fù)時(shí)間更長的目標(biāo),災(zāi)難發(fā)生造成的損失會(huì)大于方案投資成本,所以災(zāi)難損失的風(fēng)險(xiǎn)較大。
目標(biāo)-3:恢復(fù)數(shù)據(jù)目標(biāo)(RecoveryPointObjective)
恢復(fù)數(shù)據(jù)目標(biāo)(RecoveryPoint Objective-RPO)是災(zāi)難發(fā)生后業(yè)務(wù)能夠容忍的數(shù)據(jù)丟失量,或者說災(zāi)難發(fā)生造成的數(shù)據(jù)丟失量。一般來說,恢復(fù)數(shù)據(jù)目標(biāo)(RPO)越高(即丟失的數(shù)據(jù)越少),方案的成本越高,但是由于災(zāi)難造成的業(yè)務(wù)損失就越小;反之,恢復(fù)數(shù)據(jù)目標(biāo)(RPO)越低(即丟失的數(shù)據(jù)較多),方案的成本較低,但災(zāi)難造成的業(yè)務(wù)損失也較大。
最佳的恢復(fù)數(shù)據(jù)目標(biāo)(RPO)應(yīng)為業(yè)務(wù)影響(損失)曲線和方案成本曲線的交點(diǎn)所對(duì)應(yīng)的目標(biāo)。比最佳恢復(fù)數(shù)據(jù)目標(biāo)更高的目標(biāo),將造成投資浪費(fèi);而比最佳恢復(fù)數(shù)據(jù)目標(biāo)更低的目標(biāo),災(zāi)難發(fā)生造成的損失會(huì)大于方案投資成本,所以災(zāi)難損失的風(fēng)險(xiǎn)較大。
目標(biāo)-4:確定關(guān)鍵業(yè)務(wù)數(shù)據(jù)(需災(zāi)備保護(hù)的數(shù)據(jù)對(duì)象)
按照數(shù)據(jù)的重要和關(guān)鍵程度,大致將IT系統(tǒng)的所有數(shù)據(jù)分為三大類:
客戶服務(wù)類數(shù)據(jù):指那些支持?jǐn)?shù)據(jù)中心核心產(chǎn)品和服務(wù)所需數(shù)據(jù),該類數(shù)據(jù)的恢復(fù)時(shí)間目標(biāo)(RTO)一般在一小時(shí)內(nèi),而且不允許數(shù)據(jù)丟失。
業(yè)務(wù)支持類數(shù)據(jù):指那些業(yè)務(wù)運(yùn)行所需數(shù)據(jù),該類數(shù)據(jù)的恢復(fù)時(shí)間目標(biāo)(RTO)一般小于24小時(shí)。
可延緩數(shù)據(jù):其他數(shù)據(jù)如辦公室OA等,該類數(shù)據(jù)的恢復(fù)時(shí)間目標(biāo)(RTO)一般小于48小時(shí)。
考慮到上述三類數(shù)據(jù)之間的互相耦合和關(guān)聯(lián),一般來說,客戶服務(wù)相關(guān)的數(shù)據(jù)約占數(shù)據(jù)總量的80%;業(yè)務(wù)支持?jǐn)?shù)據(jù)約占15%;可延緩數(shù)據(jù)約占5%。
綜合以上因素選擇適合的容災(zāi)模式和機(jī)制是非常重要的,可以幫助最大限度避免損失。
備份是保證數(shù)據(jù)安全的最后一道屏障,因?yàn)闊o論是存儲(chǔ)還是容災(zāi),所有數(shù)據(jù)均為在線存放,而備份的數(shù)據(jù)既可以在線存放,也可以通過磁帶等介質(zhì)離線保存,在線保存的數(shù)據(jù)可以快速恢復(fù),離線保存的數(shù)據(jù)可以存放在一個(gè)更為安全的特殊環(huán)境中。一個(gè)大范圍的災(zāi)難造成本地及容災(zāi)系統(tǒng)的數(shù)據(jù)完全不可用時(shí),通過該備份數(shù)據(jù),可以盡可能完整地恢復(fù)至可用數(shù)據(jù),減少損失。若是由于人為操作失誤造成的數(shù)據(jù)丟失,那么磁盤等介質(zhì)在線備份的數(shù)據(jù)可以較快地檢索出之前的正確數(shù)據(jù)。
因此如果在條件允許的情況下,可以考慮磁盤備份和磁帶備份相結(jié)合,從而盡可能地保障數(shù)據(jù)安全?,F(xiàn)今眾多的備份軟件越來越好地支持災(zāi)難備份恢復(fù),能夠通過災(zāi)難恢復(fù)介質(zhì)恢復(fù)至災(zāi)難前的數(shù)據(jù)、系統(tǒng)設(shè)置等,從而更加快速的恢復(fù)業(yè)務(wù)系統(tǒng)。
備份的目的就是為了恢復(fù),保證在出現(xiàn)意外情況時(shí)保證業(yè)務(wù)的連續(xù)進(jìn)展;特別是在線備份,對(duì)速度的要求相對(duì)較高,但對(duì)容量的要求則相對(duì)較小。
歸檔的目的與備份完全不同。檔案館保存著大量的數(shù)據(jù),其中的60%-80%今后可能很少使用到,但這些數(shù)據(jù)必須保留以備查詢。簡言之,歸檔的目的是為了保證數(shù)據(jù)的完整性。在如何最大化使用存儲(chǔ),保證數(shù)據(jù)的訪問方面歸檔和備份有很大區(qū)別。
選擇歸檔系統(tǒng)有四個(gè)原則:
數(shù)據(jù)必須永遠(yuǎn)保留。無論是歸檔還是備份,數(shù)據(jù)的完整性必須得到保證,必須在規(guī)定的時(shí)間內(nèi)保證數(shù)據(jù)的安全存儲(chǔ)。
數(shù)據(jù)易于讀取。雖然大部分?jǐn)?shù)據(jù)重復(fù)讀取的可能性不大,但歸檔系統(tǒng)依舊不是一個(gè)“死”倉庫,必須保證在需要的時(shí)候能方便地讀取數(shù)據(jù),這也是歸檔系統(tǒng)的必備原則之一。
保證法規(guī)遵從。目前國內(nèi)這方面的法規(guī)還在逐步完善過程中,國外如在美國的美國證券交易委員會(huì)SEC(SecuritiesExchangeCommission)法案、薩班斯-奧克斯萊法案(Sarbanes-Oxley)等,對(duì)電子記錄在完整性、保密性和可存取性三個(gè)方面都有明確規(guī)定。摩根公司就曾因?yàn)闆]有在規(guī)定時(shí)間找到全部的電子數(shù)據(jù),被罰款14.5億美金。數(shù)據(jù)歸檔系統(tǒng)也必須完全符合這些要求。
數(shù)據(jù)的可擴(kuò)展性。數(shù)據(jù)是無時(shí)無刻不在擴(kuò)展的,歸檔系統(tǒng)必須保證自身的可擴(kuò)展性,以滿足迅速增長的數(shù)據(jù)量的要求。
目前各級(jí)檔案館都開始投入巨資建設(shè)現(xiàn)代化的數(shù)字化檔案信息存儲(chǔ)體系,包括存儲(chǔ)、容災(zāi)、備份和歸檔等功能的存儲(chǔ)系統(tǒng),但由于不同的廠家產(chǎn)品之間缺乏集成,對(duì)數(shù)據(jù)的完整性和有效性缺乏有效的管理。數(shù)據(jù)管理人員對(duì)所存儲(chǔ)的數(shù)字化檔案信息缺乏整體的了解,往往是知道數(shù)據(jù)在,卻不知道具體位置在哪里。對(duì)數(shù)據(jù)的存儲(chǔ)狀況是否有效也不清楚,不能根據(jù)各個(gè)存儲(chǔ)系統(tǒng)的運(yùn)行狀況及時(shí)提出數(shù)據(jù)遷移的計(jì)劃,往往是即使找到了數(shù)據(jù),也可能發(fā)現(xiàn)數(shù)據(jù)已損壞不可讀了,從備份系統(tǒng)中恢復(fù)數(shù)據(jù)也非常麻煩。為了盡可能地做好數(shù)據(jù)備份,目前大多采用局部集中備份、單獨(dú)備份、手工定期備份等不同的備份模式,導(dǎo)致部分系統(tǒng)的應(yīng)用數(shù)據(jù)備份不充分,備份時(shí)間過長,不能產(chǎn)生備份報(bào)表,無法了解真實(shí)的數(shù)據(jù)保存狀況,也沒有有效的介質(zhì)管理與異地保存。這些問題在不斷增加數(shù)據(jù)保護(hù)風(fēng)險(xiǎn)的同時(shí),也使管理成本居高不下。
數(shù)字化檔案信息的存儲(chǔ)中心的功能應(yīng)該是最大程度地挖掘出它所保管的檔案信息資源的價(jià)值。存儲(chǔ)設(shè)備、服務(wù)器、網(wǎng)絡(luò)為實(shí)現(xiàn)這個(gè)功能提供了工具和基礎(chǔ)架構(gòu),但一個(gè)成功的數(shù)字化檔案信息的存儲(chǔ)中心應(yīng)該體現(xiàn)在在適當(dāng)?shù)臅r(shí)間和適當(dāng)?shù)牡攸c(diǎn)提供適當(dāng)?shù)男畔⒌哪芰ι?。要達(dá)到這個(gè)目的需要實(shí)現(xiàn)存儲(chǔ)、容災(zāi)、備份和歸檔等各個(gè)環(huán)節(jié)的整合,建設(shè)統(tǒng)一的數(shù)字化檔案信息存儲(chǔ)管理平臺(tái)。
統(tǒng)一數(shù)據(jù)管理平臺(tái)把數(shù)據(jù)備份、恢復(fù)、歸檔、復(fù)制、資源管理和搜索這些功能模塊利用同一套源代碼無縫地結(jié)合在一起。這些功能不僅強(qiáng)大,而且從一開始設(shè)計(jì)軟件架構(gòu)時(shí)就確保這些功能模塊能共享相同的服務(wù)功能,從而能通過單一控制臺(tái),迅速、簡單、可靠地執(zhí)行所有的數(shù)據(jù)管理功能,以獨(dú)特的方式幫助客戶消除基礎(chǔ)架構(gòu)成本,并大幅度提高數(shù)據(jù)管理效率。
一個(gè)標(biāo)準(zhǔn)的數(shù)據(jù)管理平臺(tái)可以提升整體表現(xiàn),減少存儲(chǔ)復(fù)雜性并且減少開銷,還可以使所有的數(shù)據(jù)拷貝更具有意義和可獲得性。統(tǒng)一數(shù)據(jù)管理平臺(tái)應(yīng)該采用一個(gè)統(tǒng)一的視圖提供以下的功能:
數(shù)據(jù)備份/恢復(fù)。能對(duì)異構(gòu)環(huán)境下的各種操作系統(tǒng)、文件系統(tǒng)、數(shù)據(jù)庫、郵件系統(tǒng)和應(yīng)用進(jìn)行備份和恢復(fù),備份過程是基于策略的自動(dòng)操作,能提供小顆粒精確恢復(fù)。
快照管理和恢復(fù)。能利用硬件、軟件快照引擎,在存儲(chǔ)設(shè)備上創(chuàng)建具有時(shí)間點(diǎn)的恢復(fù)卷,在短短幾分鐘內(nèi)就能完全恢復(fù)硬軟件,確保業(yè)務(wù)的連續(xù)性。
遠(yuǎn)程連續(xù)數(shù)據(jù)復(fù)制。利用有限帶寬來有效復(fù)制文件和應(yīng)用軟件數(shù)據(jù),并創(chuàng)建恢復(fù)點(diǎn)來確保數(shù)據(jù)的一致性。可利用該功能把中心的數(shù)據(jù)復(fù)制到異地,達(dá)到容災(zāi)的目的;也可把分布在不同地方的數(shù)據(jù)復(fù)制到中心,進(jìn)行集中保護(hù)。
數(shù)據(jù)遷移和歸檔。按照用戶制定的策略把不常用的文件或郵件遷移到二級(jí)存儲(chǔ)中,當(dāng)數(shù)據(jù)遷移走后,原系統(tǒng)中還留有“存根”,當(dāng)用戶訪問“存根”時(shí),數(shù)據(jù)會(huì)自動(dòng)遷回到原處。如果把“存根”刪除,數(shù)據(jù)就自動(dòng)歸檔到二級(jí)存儲(chǔ)中。該功能有效降低了在線存儲(chǔ)的壓力,提高系統(tǒng)性能,并節(jié)約了存儲(chǔ)費(fèi)用。
存儲(chǔ)資源管理。對(duì)在線存儲(chǔ)上的文件、數(shù)據(jù)庫及應(yīng)用的數(shù)據(jù)進(jìn)行跟蹤、分析、發(fā)現(xiàn)、預(yù)測(cè)和報(bào)告,讓IT管理者及時(shí)準(zhǔn)確掌握數(shù)據(jù)存儲(chǔ)的動(dòng)態(tài)情況,為數(shù)據(jù)管理策略制定提供依據(jù)。
服務(wù)管理和報(bào)告。利用該工具軟件,管理者能輕松地跟蹤數(shù)據(jù)管理的所有操作和存儲(chǔ)資源管理,提供相關(guān)報(bào)告,確保規(guī)定的服務(wù)等級(jí)。
雖然可能還不成熟,但是各路廠商的集中數(shù)據(jù)管理平臺(tái)已經(jīng)在起步了。一些備份廠商已經(jīng)通過提供統(tǒng)一代理、統(tǒng)一政策引擎和共同服務(wù)、存儲(chǔ)而發(fā)展出了完全集成的、多功能的產(chǎn)品和很多其他的聯(lián)合點(diǎn)解決方案(pointsolutions,主要是通過集成)。比如 EMC、CommVault,HP和IBM提供集成的備份和歸檔。而這些廠商軟件——BakBone,CA和CommVault可以將備份和復(fù)制合并。而對(duì)于 Asigra、CommVault和Symantec而言,部署連續(xù)的備份抓取特性也是可行的。這些廠商——Asigra、CommVault、EMC、EVault、IBM和Symantec都在它們的備份特性中提供了數(shù)據(jù)重復(fù)刪除特性。
和傳統(tǒng)的存儲(chǔ)管理相比,統(tǒng)一數(shù)據(jù)管理平臺(tái)具有以下的特性和優(yōu)勢(shì):
提供文件系統(tǒng)、應(yīng)用程序和數(shù)據(jù)庫當(dāng)前存儲(chǔ)使用情況的報(bào)告,了解基礎(chǔ)架構(gòu)內(nèi)文件系統(tǒng)、應(yīng)用程序和數(shù)據(jù)庫占用存儲(chǔ)空間情況,無論磁盤類型或其連接方式均可獲取信息,如DAS、NAS和SAN等。
趨勢(shì)分析和未來存儲(chǔ)需求預(yù)測(cè)。全面檢視存儲(chǔ)環(huán)境,做出更好的決策。提供支持性趨勢(shì)分析數(shù)據(jù),優(yōu)化存儲(chǔ)開支,協(xié)助年度預(yù)算預(yù)測(cè)以及消除不必要的開支。
淺度數(shù)據(jù)收集。避免傳統(tǒng)的詳細(xì)統(tǒng)計(jì)數(shù)據(jù)收集,減輕CPU和服務(wù)器存儲(chǔ)相關(guān)的I/O負(fù)載,適用于無需分析型數(shù)據(jù)的查找場(chǎng)景。
深度數(shù)據(jù)收集。能夠執(zhí)行更強(qiáng)大的數(shù)據(jù)收集,滿足深入分析的需要。
應(yīng)用程序相關(guān)的存儲(chǔ)容量視圖。了解映射到應(yīng)用架構(gòu)的存儲(chǔ)使用狀況,如數(shù)據(jù)庫表、消息存儲(chǔ)或NAS共享等。
基于閾值的提示。通過策略管理數(shù)據(jù)存儲(chǔ)能力,以減少人工干預(yù)。通過主動(dòng)提示可能影響生產(chǎn)環(huán)境的事件或故障降低風(fēng)險(xiǎn)。
歸檔ROI報(bào)告。計(jì)算通過歸檔陳舊數(shù)據(jù)可以節(jié)省的成本數(shù)量。
禁用文件報(bào)告。查明垃圾文件、多媒體和非業(yè)務(wù)相關(guān)文件的存儲(chǔ)位置和所有者。
邏輯資源與物理資源的映射。提供磁盤卷所有邏輯存儲(chǔ)實(shí)體,或與邏輯存儲(chǔ)實(shí)體相關(guān)的所有磁盤卷的使用狀態(tài)報(bào)告。
運(yùn)行過程監(jiān)控。提高生產(chǎn)率和數(shù)據(jù)訪問效率,通過多種視圖查看主存儲(chǔ)資源。
操作窗口??啥x針對(duì)數(shù)據(jù)保護(hù)任務(wù)的操作規(guī)則,比如在特定的時(shí)間啟用或禁用特定的操作。這有助于確定數(shù)據(jù)保護(hù)任務(wù)的優(yōu)先級(jí)別,同時(shí)不會(huì)對(duì)SRM數(shù)據(jù)收集工作造成任何潛在影響。