王 偉
(華信咨詢設(shè)計(jì)研究院有限公司,杭州 310014)
傳統(tǒng)存儲面臨性價比低、擴(kuò)展性有限等問題,云存儲[1]具備高擴(kuò)展性、低成本、易管理性等優(yōu)勢正好有效的彌補(bǔ)了傳統(tǒng)存儲的短板。在數(shù)據(jù)量增長很快,或者數(shù)據(jù)總量大的業(yè)務(wù)系統(tǒng)中,常采用云存儲技術(shù)。云存儲可分為分布式塊存儲、分布式文件存儲[2]和分布式對象存儲。本文以某運(yùn)營商網(wǎng)管支撐系統(tǒng)在擴(kuò)容升級過程中系統(tǒng)平臺X86化改造為背景,介紹分布式文件存儲在跨局址數(shù)據(jù)備份和數(shù)據(jù)遷移[3]中的設(shè)計(jì)與應(yīng)用。
網(wǎng)管原有系統(tǒng)集中部署在某市A機(jī)房,為滿足網(wǎng)管業(yè)務(wù)發(fā)展,需將A機(jī)房部分網(wǎng)管支撐系統(tǒng)整體遷移至某市B機(jī)房,A機(jī)房與B機(jī)房之間相距50公里。其中涉及網(wǎng)管支撐系統(tǒng)數(shù)據(jù)庫遷移和系統(tǒng)平臺X86化改造,同時完成A機(jī)房和B機(jī)房業(yè)務(wù)支撐系統(tǒng)數(shù)據(jù)庫備份。本設(shè)計(jì)針對網(wǎng)管支撐系統(tǒng)的數(shù)據(jù)備份需求,采用容量型分布式文件存儲替代傳統(tǒng)磁帶庫或虛擬帶庫,并通過以太網(wǎng)交換機(jī)組建備份網(wǎng)絡(luò),可有效降低系統(tǒng)的建設(shè)成本和系統(tǒng)運(yùn)維難度,并提升數(shù)據(jù)備份效率。
分布式文件存儲系統(tǒng)硬件由X86服務(wù)器和內(nèi)部系統(tǒng)網(wǎng)絡(luò)交換機(jī)組成[4]。內(nèi)部系統(tǒng)網(wǎng)絡(luò)包含前端服務(wù)網(wǎng)絡(luò)和后端數(shù)據(jù)交換網(wǎng)絡(luò),兩者采用獨(dú)立網(wǎng)絡(luò),均具有高可靠、高帶寬、低延遲等特點(diǎn)。前端服務(wù)網(wǎng)絡(luò)支撐千兆和萬兆網(wǎng)絡(luò)接入,支持IEEE 802.3ad 網(wǎng)絡(luò)端口綁定,實(shí)現(xiàn)帶寬聚合與高可靠,支持VLAN和802.1Q。后端數(shù)據(jù)交換網(wǎng)絡(luò),用于存儲節(jié)點(diǎn)間數(shù)據(jù)交換,組網(wǎng)可采用冗余配置的萬兆以太網(wǎng)或In fi niBand交換機(jī)(簡稱IB交換機(jī),多用于高性能場景)。分布式文件存儲提供標(biāo)準(zhǔn)的NFS、CIFS、FTP訪問和POSIX接口,支持IO并發(fā)多隊(duì)列讀寫(前端服務(wù)網(wǎng)絡(luò)單節(jié)點(diǎn)網(wǎng)絡(luò)帶寬2×10GE),并通過12×10GE以太網(wǎng)網(wǎng)絡(luò)和NFS協(xié)議與備份管理服務(wù)器實(shí)現(xiàn)數(shù)據(jù)通信,實(shí)際備份效率可達(dá)到500MB/s,有效提升數(shù)據(jù)備份效率。此外,由于整體采用以太網(wǎng)交換機(jī)組網(wǎng),備份系統(tǒng)運(yùn)維管理難度相當(dāng)降低。
圖1 跨局址數(shù)據(jù)備份網(wǎng)絡(luò)拓?fù)?/p>
A機(jī)房網(wǎng)管支撐系統(tǒng)通過LAN備份方式,采用Veritas NBU備份管理軟件和備份管理服務(wù)器將存儲在傳統(tǒng)磁盤陣列上的Oracle數(shù)據(jù)庫經(jīng)過跨局址傳輸鏈路(8×10GE)備份至B機(jī)房浪潮分布式文件存儲上。B機(jī)房網(wǎng)管支撐系統(tǒng)通過LAN備份方式,采用Veritas NBU備份管理軟件和備份管理服務(wù)器將存儲在分布式塊存儲上的Oracle數(shù)據(jù)庫備份至B機(jī)房浪潮分布式文件存儲上。
隨著運(yùn)營商IT支撐系統(tǒng)X86化改造工作的推進(jìn),傳統(tǒng)Unix服務(wù)器+磁盤陣列的數(shù)據(jù)庫模式逐漸演進(jìn)為X86服務(wù)器+分布式塊存儲的數(shù)據(jù)庫模式。為了減少數(shù)據(jù)遷移對業(yè)務(wù)系統(tǒng)的影響,一般通過數(shù)據(jù)在線遷移方式完成[5]。A機(jī)房和B機(jī)房相距較遠(yuǎn),通過磁盤陣列底層數(shù)據(jù)復(fù)制方式實(shí)現(xiàn)的傳統(tǒng)數(shù)據(jù)在線遷移方案成本和實(shí)施難度相當(dāng)較大。鑒于A機(jī)房Oracle數(shù)據(jù)庫(單個數(shù)據(jù)庫容量約為20TB)已備份存儲在B機(jī)房分布式文件存儲上,可通過B機(jī)房備份管理服務(wù)器采用備份數(shù)據(jù)恢復(fù)方式[3],將A機(jī)房備份在分布式文件存儲上的數(shù)據(jù)庫直接在B機(jī)房作為數(shù)據(jù)庫存儲的分布式塊存儲上進(jìn)行恢復(fù)(B機(jī)房內(nèi)需重構(gòu)A機(jī)房原有網(wǎng)管支撐系統(tǒng)數(shù)據(jù)庫,含數(shù)據(jù)庫服務(wù)器和數(shù)據(jù)庫存儲設(shè)備),進(jìn)而間接實(shí)現(xiàn)A機(jī)房內(nèi)業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫跨機(jī)房遷移。由于數(shù)據(jù)庫服務(wù)器操作系統(tǒng)差異(Unix和Linux)恢復(fù)后的數(shù)據(jù)需要進(jìn)行適當(dāng)?shù)臄?shù)據(jù)庫參數(shù)調(diào)優(yōu)操作[6]。
圖2 備份數(shù)據(jù)恢復(fù)數(shù)據(jù)路由示意
通過分布式文件存儲跨局址數(shù)據(jù)備份間接實(shí)現(xiàn)業(yè)務(wù)系統(tǒng)數(shù)據(jù)遷移,可減少數(shù)據(jù)在線遷移相關(guān)硬件設(shè)備的采購,同時縮短數(shù)據(jù)遷移的時間和實(shí)施難度,有效解決運(yùn)營商業(yè)務(wù)系統(tǒng)升級擴(kuò)容因機(jī)房空間緊張必須實(shí)施業(yè)務(wù)系統(tǒng)整體搬遷的難題。
可以看出,通過分布式文件存儲實(shí)現(xiàn)跨局址數(shù)據(jù)備份和數(shù)據(jù)遷移,可減少系統(tǒng)建設(shè)成本,同時降低項(xiàng)目實(shí)施難度,具有較大的借鑒意義。原有業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫備份和遷移業(yè)務(wù)數(shù)據(jù)庫建設(shè)工作可同時進(jìn)行,但由于數(shù)據(jù)備份和數(shù)據(jù)恢復(fù)均需要消耗一定時間,因此針對數(shù)據(jù)實(shí)時性要求較高的業(yè)務(wù)系統(tǒng)(如在線計(jì)費(fèi)系統(tǒng)),不建議通過分布式文件存儲備份數(shù)據(jù)恢復(fù)方式實(shí)現(xiàn)數(shù)據(jù)遷移。分布式文件存儲作為新型數(shù)據(jù)備份介質(zhì)在信息化系統(tǒng)建設(shè)中完全可替代傳統(tǒng)磁盤庫和虛擬帶庫。
[1] 胡文波,徐造林.分布式存儲方案的設(shè)計(jì)與研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2010(20):65-68.
[2] 啜俊娜.基于Hadoop的分布式文件存儲服務(wù)平臺設(shè)計(jì)與實(shí)現(xiàn)[D].浙江大學(xué),2012.
[3] 蘇艷森.分布式文件存儲平臺文件備份與恢復(fù)系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[D].浙江大學(xué),2008.
[4] 陳正舉.一種分布式文件存儲系統(tǒng)的探索與應(yīng)用[J].中國市場,2017(12):36-39.
[5] 劉海英,馮文秀,杜曉通.管理信息系統(tǒng)升級過程中數(shù)據(jù)遷移的研究及實(shí)現(xiàn)[J].電力自動化設(shè)備,2005(5):37-39.
[6] 杜賓,王明文.跨平臺數(shù)據(jù)遷移的研究和實(shí)現(xiàn)[J].計(jì)算機(jī)與現(xiàn)代化,2001(6):5-10.