王 寧
(海南煙草專賣(mài)局,???570100)
?
煙草行業(yè)同一數(shù)據(jù)中心雙活存儲(chǔ)研究和探索
王 寧
(海南煙草專賣(mài)局,???570100)
摘要:雙活軟件的安裝位置決定其實(shí)現(xiàn)方式。雙活軟件可以安裝在服務(wù)器上,可以安裝在第三方設(shè)備上,可以安裝在存儲(chǔ)上;演變?yōu)榛谥鳈C(jī)卷鏡像方式、基于虛擬化網(wǎng)關(guān)方式、基于存儲(chǔ)雙活套件方式。但隨著存儲(chǔ)技術(shù)的積累、沉淀和發(fā)展,基于存儲(chǔ)雙活套件方式(非虛擬化網(wǎng)關(guān)方式)將引領(lǐng)雙活存儲(chǔ)解決方案。
關(guān)鍵詞:RPO;RTO;雙活架構(gòu);主機(jī)卷鏡像;虛擬化網(wǎng)關(guān);存儲(chǔ)雙活套件
按照國(guó)家局“統(tǒng)一平臺(tái)、統(tǒng)一數(shù)據(jù)庫(kù)、統(tǒng)一網(wǎng)絡(luò)”的總體技術(shù)要求,以及加快行業(yè)信息化建設(shè)中電子商務(wù)、電子政務(wù)和生產(chǎn)經(jīng)營(yíng)決策三大應(yīng)用系統(tǒng)主體框架建設(shè)的統(tǒng)一信息化戰(zhàn)略部署。以實(shí)現(xiàn)MES生產(chǎn)制造執(zhí)行系統(tǒng)、ERP、辦公自動(dòng)化系統(tǒng)(OA)、企業(yè)財(cái)務(wù)管理(EFM)和客戶管理系統(tǒng)(CRM)等集成,資源整合,信息共享。存儲(chǔ)建設(shè)模式以單一業(yè)務(wù)為中心垂直建設(shè)轉(zhuǎn)向以數(shù)據(jù)中心橫向拉通,基于應(yīng)用靈活組織IT資源實(shí)現(xiàn)動(dòng)態(tài)IT架構(gòu),實(shí)現(xiàn)基礎(chǔ)架構(gòu)資源化。
2.1 災(zāi)備建設(shè)遵循標(biāo)準(zhǔn)
根據(jù)業(yè)界權(quán)威機(jī)構(gòu)的統(tǒng)計(jì),在故障分類中,硬件故障占44%,軟件、人為、病毒故障占49%,自然災(zāi)難和社會(huì)災(zāi)難占7%。在這其中,占93%的是軟硬件故障,需要的則是數(shù)據(jù)中心的本地保護(hù)。
2007年7月,全國(guó)信息安全標(biāo)準(zhǔn)化技術(shù)委員會(huì)提出并歸口頒布了《信息系統(tǒng)災(zāi)難恢復(fù)規(guī)范》(GB/ T 20988-2007)國(guó)家標(biāo)準(zhǔn),如表1所示。
表1 RTO/RPO與災(zāi)難恢復(fù)能力等級(jí)關(guān)系(GB/T 20988-2007)
2.2 災(zāi)備建設(shè)衡量要素
在數(shù)據(jù)保護(hù)和災(zāi)備系統(tǒng)建設(shè)中主要有2個(gè)指標(biāo):
(1)RTO(Recovery Time Object,恢復(fù)時(shí)間目標(biāo)):RTO是將信息系統(tǒng)“從災(zāi)難造成的故障或癱瘓狀態(tài)恢復(fù)到可正常運(yùn)行狀態(tài),并將其支持的業(yè)務(wù)功能從災(zāi)難造成的不正常狀態(tài)恢復(fù)到可接受狀態(tài)”所需時(shí)間,其中包括備份數(shù)據(jù)恢復(fù)到可用狀態(tài)所需時(shí)間、數(shù)據(jù)處理系統(tǒng)切換時(shí)間、備用網(wǎng)絡(luò)切換時(shí)間等,該指標(biāo)用以衡量災(zāi)備方案的業(yè)務(wù)恢復(fù)能力。
(2)RPO(Recovery Point Objective,恢復(fù)點(diǎn)目標(biāo)):RPO是指業(yè)務(wù)系統(tǒng)所允許的災(zāi)難過(guò)程中的最大數(shù)據(jù)丟失量。數(shù)據(jù)保護(hù)的根本目的,就是在一定的預(yù)算和技術(shù)基礎(chǔ)上,要求實(shí)現(xiàn)盡量小的RTO,RPO。當(dāng)發(fā)生各種故障時(shí),可以進(jìn)行快速的系統(tǒng)和數(shù)據(jù)恢復(fù),使得系統(tǒng)繼續(xù)發(fā)揮作用,提供數(shù)據(jù)服務(wù)和業(yè)務(wù)服務(wù)能力。
3.1 核心業(yè)務(wù),雙活存儲(chǔ)需求迫在眉睫
數(shù)據(jù)信息是當(dāng)今社會(huì)進(jìn)步、發(fā)展的關(guān)鍵,數(shù)據(jù)安全和業(yè)務(wù)連續(xù)性顯得尤其重要。當(dāng)前,大部分信息中心都采用中心服務(wù)器和單臺(tái)存儲(chǔ)的模式,服務(wù)器具有較高可靠性和可用性,存儲(chǔ)設(shè)備提供數(shù)據(jù)支持,一旦服務(wù)器或存儲(chǔ)出現(xiàn)故障,業(yè)務(wù)就會(huì)被中斷,并可能丟失關(guān)鍵數(shù)據(jù)。
在一些關(guān)鍵應(yīng)用,不允許有業(yè)務(wù)中斷和數(shù)據(jù)丟失。對(duì)于維護(hù)人員,數(shù)據(jù)中心應(yīng)用規(guī)模加大的同時(shí),帶來(lái)了更大的管理難度,如何在故障情況下盡快恢復(fù)使用并保證數(shù)據(jù)的安全,已經(jīng)成為一個(gè)日漸突出的問(wèn)題。
常見(jiàn)應(yīng)用只考慮了服務(wù)器冗余,應(yīng)用集群保護(hù),交換機(jī)冗余,鏈路冗余保護(hù),唯獨(dú)存儲(chǔ)系統(tǒng)存在單點(diǎn)故障。雙活存儲(chǔ)技術(shù)正是解決本地由服務(wù)器或存儲(chǔ)軟硬件故障而引起的問(wèn)題,該技術(shù)較為成熟,具有維護(hù)簡(jiǎn)單、穩(wěn)定可靠等優(yōu)點(diǎn),能充分保障業(yè)務(wù)連續(xù)和數(shù)據(jù)安全。
3.2 雙活存儲(chǔ)架構(gòu)原理剖析
⊙ 數(shù)據(jù)同步,鏡像。RPO=0,數(shù)據(jù)不丟失。
⊙ 自動(dòng)接管,切換。RTO=0,業(yè)務(wù)不中斷。
⊙ 雙活軟件,位置,決定實(shí)現(xiàn)方式。
雙活軟件可以安裝在服務(wù)器上,可以安裝在第三方設(shè)備上,可以安裝在存儲(chǔ)上。位置不同,決定實(shí)現(xiàn)方式不同,例如:基于主機(jī)卷鏡像方式(LVM卷鏡像,Storage Foundation……);基于虛擬化網(wǎng)關(guān)方式(EMC VPLEX,IBM SVC,宏杉MS5500V……);基于存儲(chǔ)雙活套件方式(HDS GAD,NETAPP MetroCluster,宏杉SDAS……)。
由于三種架構(gòu)采用了不同的技術(shù)方案,因此,在方案可靠性、業(yè)務(wù)連續(xù)性以及可擴(kuò)展性方面都存在一定差異。如圖1所示。
圖1 三種雙活存儲(chǔ)架構(gòu)
2010年和2015年是兩個(gè)分水嶺,2010年以前實(shí)現(xiàn)兩臺(tái)存儲(chǔ)雙活,以主機(jī)卷鏡像方式為主,主要在金融、電力和運(yùn)營(yíng)商行業(yè)為主。確切地說(shuō),以VPlex為代表的“虛擬存儲(chǔ)”(Virtual Storage)是EMC 在EMC World 2010大會(huì)上主推的概念,也是虛擬化網(wǎng)關(guān)方式逐漸成為主流雙活存儲(chǔ)解決方案的觸發(fā)點(diǎn)。
但是由于技術(shù)上的限制,傳統(tǒng)的雙活存儲(chǔ)方案無(wú)法由存儲(chǔ)陣列自身直接實(shí)現(xiàn),更多的是通過(guò)在服務(wù)器上增加卷鏡像軟件,或者通過(guò)增加額外的存儲(chǔ)虛擬化引擎實(shí)現(xiàn)。直到2015年基于存儲(chǔ)雙活套件方式(非虛擬化網(wǎng)關(guān)模式)各大廠家陸續(xù)推出新產(chǎn)品高級(jí)特性,例如:EMC VMAX3(SRDF/ METRO),HP(Peer Persistence),DELL(Live Volume),IBM(PowerHA HyperSwap),華為(HyperMetro)等,預(yù)示著2015年開(kāi)始基于存儲(chǔ)雙活套件方式將成為雙活存儲(chǔ)解決方案的主流趨勢(shì)。
3.3 三種雙活存儲(chǔ)架構(gòu)分析
3.3.1 主機(jī)卷鏡像方式
指在操作系統(tǒng)層面通過(guò)邏輯卷管理軟件,對(duì)由兩臺(tái)不同存儲(chǔ)設(shè)備提供的存儲(chǔ)資源進(jìn)行鏡像關(guān)系的創(chuàng)建,實(shí)現(xiàn)數(shù)據(jù)的實(shí)時(shí)同步。以賽門(mén)鐵克Storage Foundation為代表,在前端服務(wù)器安裝軟件代理,通過(guò)跨陣列卷鏡像技術(shù),進(jìn)行陣列雙寫(xiě),無(wú)論是主存儲(chǔ)還是鏡像發(fā)生問(wèn)題,都不會(huì)導(dǎo)致應(yīng)用停頓,從而實(shí)現(xiàn)零停機(jī)時(shí)間、業(yè)務(wù)不中斷。此外,其中存儲(chǔ)設(shè)備一旦發(fā)生災(zāi)難,正常工作的存儲(chǔ)會(huì)記錄從中斷開(kāi)始的所有操作日志,修復(fù)后數(shù)據(jù)從正常存儲(chǔ)增量同步到故障存儲(chǔ),而不需要重新同步所有數(shù)據(jù),對(duì)系統(tǒng)的影響極小。
基于主機(jī)卷鏡像方案優(yōu)勢(shì):
⊙ 提高業(yè)務(wù)連續(xù)性:用戶原有一臺(tái)存儲(chǔ),通過(guò)新增一臺(tái)存儲(chǔ)和卷鏡像方案的實(shí)施,可保證任何一臺(tái)存儲(chǔ)故障,業(yè)務(wù)都不中斷。
⊙ 數(shù)據(jù)遷移或存儲(chǔ)設(shè)備更換:通過(guò)主機(jī)卷鏡像軟件(即邏輯卷管理軟件)將已有存儲(chǔ)上的數(shù)據(jù)遷移到新增存儲(chǔ),卷鏡像同步完成后可拆除原有存儲(chǔ)。
⊙ 實(shí)現(xiàn)異構(gòu)存儲(chǔ)遠(yuǎn)程災(zāi)備:通過(guò)卷鏡像方案實(shí)現(xiàn)原有存儲(chǔ)上數(shù)據(jù)的抽取,為遠(yuǎn)程災(zāi)備打下基礎(chǔ),解決異構(gòu)存儲(chǔ)災(zāi)備難題。
主機(jī)卷鏡像不足之處:
⊙ 維護(hù)復(fù)雜,需要在各個(gè)業(yè)務(wù)系統(tǒng)部署卷鏡像軟件。
⊙ 成本較高,按照服務(wù)器數(shù)量授權(quán),購(gòu)買(mǎi)license。
3.3.2 虛擬化網(wǎng)關(guān)方式
指利用虛擬化技術(shù),統(tǒng)一整合管理FC SAN, IP SAN等多種存儲(chǔ)設(shè)備,形成統(tǒng)一的資源池供上層業(yè)務(wù)使用,屏蔽不同存儲(chǔ)之間的差異。在數(shù)據(jù)中心部署存儲(chǔ)虛擬化引擎,接入現(xiàn)有或新建的存儲(chǔ)系統(tǒng),通過(guò)虛擬化引擎存儲(chǔ)可以做到鏡像關(guān)系(即雙活),從而達(dá)到兩臺(tái)存儲(chǔ)之間雙活。所有存儲(chǔ)通過(guò)虛擬化引擎對(duì)外提供統(tǒng)一的管理接口和訪問(wèn)接口,應(yīng)用系統(tǒng)只需要訪問(wèn)虛擬化存儲(chǔ),可以支持異構(gòu)的存儲(chǔ)系統(tǒng)。該技術(shù)主要由各存儲(chǔ)設(shè)備生產(chǎn)廠家所推薦,如EMC VPLEX,IBM SVC,華為VIS等都提供了相應(yīng)的解決方案。
基于虛擬化網(wǎng)關(guān)方案優(yōu)勢(shì):
⊙ 實(shí)現(xiàn)異構(gòu)雙活,利舊現(xiàn)有存儲(chǔ)設(shè)備。
⊙ 維護(hù)簡(jiǎn)單,各個(gè)業(yè)務(wù)系統(tǒng)無(wú)需一一安裝代理。虛擬化網(wǎng)關(guān)不足之處:
⊙ 通過(guò)存儲(chǔ)虛擬化后的卷鏡像技術(shù)實(shí)現(xiàn)高可用,增加存儲(chǔ)虛擬化的工作量和風(fēng)險(xiǎn)。
⊙ 在主機(jī)和存儲(chǔ)間增加虛擬化層,增加架構(gòu)復(fù)雜度和故障點(diǎn),導(dǎo)致成本增加,性能下降。
⊙ 不能完全提供新的智能存儲(chǔ)功能。
⊙ 與傳統(tǒng)的容災(zāi)技術(shù)不能良好的集成和兼容。
3.3.3 基于存儲(chǔ)實(shí)現(xiàn)雙活
指在存儲(chǔ)系統(tǒng)層面,通過(guò)存儲(chǔ)雙活管理軟件實(shí)現(xiàn)兩臺(tái)存儲(chǔ)的雙活工作,互為冗余。當(dāng)其中一臺(tái)存儲(chǔ)發(fā)生故障時(shí),可由另一臺(tái)存儲(chǔ)實(shí)時(shí)接管業(yè)務(wù),實(shí)現(xiàn)RPO,RTO為0(數(shù)據(jù)不丟失,業(yè)務(wù)不中斷)。該技術(shù)主要由各存儲(chǔ)設(shè)備生產(chǎn)廠家所推薦,如宏杉MS3000/5000/7000產(chǎn)品、HDS VSP/VSP G1000產(chǎn)品都提供了相應(yīng)的解決方案。
宏杉科技的對(duì)稱雙活存儲(chǔ)(SDAS)由兩臺(tái)存儲(chǔ)陣列組成,分別對(duì)應(yīng)存儲(chǔ)引擎A、引擎B。存儲(chǔ)引擎A和B上的卷可配置為雙活鏡像對(duì),中間通過(guò)10Gb/40Gb以太網(wǎng)鏈路進(jìn)行高速數(shù)據(jù)同步,數(shù)據(jù)完全一致。由于采用虛擬卷技術(shù),雙活鏡像對(duì)中的兩個(gè)卷對(duì)外形成一個(gè)虛擬卷。對(duì)服務(wù)器而言,雙活鏡像對(duì)就是可以通過(guò)多條路徑訪問(wèn)的同一個(gè)數(shù)據(jù)卷,服務(wù)器可以同時(shí)對(duì)雙活鏡像對(duì)中兩個(gè)卷進(jìn)行讀寫(xiě)訪問(wèn)。組成雙活鏡像系統(tǒng)的兩臺(tái)存儲(chǔ)互為冗余,當(dāng)其中一臺(tái)存儲(chǔ)陣列發(fā)生故障時(shí),可由另一臺(tái)存儲(chǔ)陣列直接接管業(yè)務(wù)。服務(wù)器訪問(wèn)雙活存儲(chǔ)系統(tǒng)可根據(jù)實(shí)際需要,選用FC,iSCSI方式,服務(wù)器訪問(wèn)存儲(chǔ)的SAN網(wǎng)絡(luò)與數(shù)據(jù)同步的萬(wàn)兆網(wǎng)絡(luò)相互獨(dú)立,互不干擾。
HDS的新雙活模式GAD(Global-Active Device)是由兩臺(tái)高端存儲(chǔ)G1000組成,用戶數(shù)據(jù)可以在兩臺(tái)存儲(chǔ)中實(shí)現(xiàn)時(shí)時(shí)同步復(fù)制,并提供對(duì)外數(shù)據(jù)訪問(wèn)服務(wù),用戶主機(jī)可以訪問(wèn)任意一臺(tái)存儲(chǔ)數(shù)據(jù),如果一臺(tái)存儲(chǔ)設(shè)備出現(xiàn)故障,可以使業(yè)務(wù)不停的訪問(wèn)另一臺(tái)存儲(chǔ)設(shè)備。當(dāng)生產(chǎn)中間出了問(wèn)題,可以自動(dòng)地不停機(jī)的切換到另外一臺(tái)存儲(chǔ)設(shè)備上。如果基于傳統(tǒng)的容災(zāi),被中心存儲(chǔ)的資源是不能被使用的,HDS的雙活方案兩邊存儲(chǔ)都可以使用,所有主機(jī)也都可以使用,這樣就能讓資源得到很好的使用,并實(shí)現(xiàn)設(shè)備自動(dòng)切換,不影響業(yè)務(wù)運(yùn)行。
基于存儲(chǔ)雙活技術(shù)優(yōu)勢(shì):
⊙ 無(wú)須任何第三方軟硬件,基于兩臺(tái)MS存儲(chǔ)陣列就可實(shí)現(xiàn),大幅降低了雙活存儲(chǔ)的建設(shè)成本。
⊙ 無(wú)須人工干預(yù)的自動(dòng)切換,實(shí)施簡(jiǎn)單方便,大大降低了雙活系統(tǒng)的管理復(fù)雜度,提升可維護(hù)性。
⊙ 相對(duì)于傳統(tǒng)災(zāi)備系統(tǒng)的一主一備模式,雙活
存儲(chǔ)系統(tǒng)是雙活模式,有效利用了災(zāi)備系統(tǒng)的資源,大幅提升了投資有效性。
⊙ 可兼容主流應(yīng)用廠商的雙機(jī)、集群系統(tǒng),部署靈活,可與現(xiàn)有IT系統(tǒng)有效融合。
對(duì)于傳統(tǒng)的中端存儲(chǔ)陣列需要依靠存儲(chǔ)虛擬化網(wǎng)關(guān)設(shè)備實(shí)現(xiàn)雙活部署的方案,宏杉的對(duì)稱雙活方案具有的特點(diǎn)和優(yōu)勢(shì)如圖2及表3所示。
表2 雙活存儲(chǔ)解決方案對(duì)比分析
圖2 雙活數(shù)據(jù)中心
表3 兩種雙活技術(shù)對(duì)比
讓我們拭目以待,隨著存儲(chǔ)技術(shù)的積累、沉淀和發(fā)展,基于存儲(chǔ)雙活套件方式(非虛擬化網(wǎng)關(guān)方式)將引領(lǐng)雙活存儲(chǔ)解決方案。
2016年GSMA亞洲移動(dòng)大獎(jiǎng)現(xiàn)已開(kāi)始接受報(bào)名
由GSMA頒發(fā)的亞洲移動(dòng)大獎(jiǎng)(AMO大獎(jiǎng))嘉獎(jiǎng)對(duì)象從來(lái)自亞洲市場(chǎng)的全新移動(dòng)終端及科技到移動(dòng)應(yīng)用及服務(wù),旨在強(qiáng)調(diào)移動(dòng)為亞洲廣泛區(qū)域內(nèi)的用戶、產(chǎn)業(yè)、公司、社團(tuán)及經(jīng)濟(jì)所帶來(lái)的與日俱增的價(jià)值。
此獎(jiǎng)項(xiàng)由全球頂級(jí)的從事撰稿、評(píng)估并研究各類移動(dòng)服務(wù)和產(chǎn)品的獨(dú)立專家進(jìn)行評(píng)選,大獎(jiǎng)分為五個(gè)類別:
? 移動(dòng)應(yīng)用 ? 互聯(lián)生活 ? 移動(dòng)設(shè)備
? 技術(shù)創(chuàng)新 ? 卓越成就
AMO大獎(jiǎng)現(xiàn)已開(kāi)始接受報(bào)名。該獎(jiǎng)項(xiàng)的頒布將在今年6月2016年世界移動(dòng)大會(huì)-上海推向高潮。
詳情瀏覽www.asiamobileawards.cn。
The Research and Exploration about Data Synchronization in Data Center of Tobacco Industry
Wang Ning
(Tobacco Sales Company of Hainan, Haikou, 570100)
Abstract:In order to achieve data redundancy & system sustanble in data center, the first thing we should do is decide on which device we should install the special software which can synchronize the data and remain the system on sustainable. The software can be installed on Server, on another External-Device, or directly on Storage; Correspondly, the technology evolve into three different ways, the first one is through Host LUN Mirroring, the second one is deploying Storage Virtualization Gateway, and the last one is based on Dual Active Storage technology. As the storage technology is becoming more and more effective and mature itself, the dual active storage technology will lead such solution in the future.
Keywords:RPO; RTO; Data Redundancy & System Sustanble; Host Lun Mirroring; Storage Virtualization Gateway; Dual Active Storage
中圖分類號(hào):TP392
文獻(xiàn)標(biāo)識(shí)碼:A 文章編碼:1672-7274(2016)04-0014-04
doi:10.3969/J.ISSN.1672-7274.2016.04.004