吉林省財(cái)政廳 鄭 偉
財(cái)政數(shù)據(jù)中心為典型的多層架構(gòu)IT結(jié)構(gòu),數(shù)據(jù)庫(kù)和主要應(yīng)用服務(wù)器由UNIX小型機(jī)系統(tǒng)承擔(dān)重要業(yè)務(wù),是關(guān)鍵節(jié)點(diǎn),目前工作比較成熟。
大量的其他業(yè)務(wù)服務(wù)器、Web發(fā)布服務(wù)器等由PC服務(wù)器構(gòu)成,這部分服務(wù)器數(shù)量眾多,隨著業(yè)務(wù)量的進(jìn)一步發(fā)展,PC服務(wù)器數(shù)量將越來(lái)越多。
大部分業(yè)務(wù)應(yīng)用的使用CS或者BS結(jié)構(gòu),都需要通過(guò)PC服務(wù)器作為中轉(zhuǎn),甚至很多業(yè)務(wù)本身就安裝在PC服務(wù)器之上,也是財(cái)政業(yè)務(wù)不可缺少的IT設(shè)備。
面對(duì)數(shù)量眾多的PC服務(wù)器設(shè)備和應(yīng)用,如何實(shí)現(xiàn)更好的管理?如何降低單臺(tái)PC服務(wù)器故障帶來(lái)的業(yè)務(wù)停頓?如何減少維護(hù)的工作量?是否可以在現(xiàn)有基礎(chǔ)上,搭建數(shù)據(jù)中心“私有云”,通過(guò)虛擬的基礎(chǔ)架構(gòu)實(shí)現(xiàn)數(shù)據(jù)中心又一次質(zhì)的升級(jí)?
目前財(cái)政的業(yè)務(wù)工作對(duì)于IT系統(tǒng)的依賴已經(jīng)達(dá)到了非常高的程度,日常工作已經(jīng)趨于制度管理模式,下面分析一下虛擬化能為財(cái)政業(yè)務(wù)帶來(lái)的工作方便之處:
一是資源利用充分,目前PC服務(wù)器數(shù)量眾多,從應(yīng)用系統(tǒng)的歸屬者角度和應(yīng)用系統(tǒng)彼此間的兼容角度考慮,一般是一臺(tái)PC服務(wù)器承擔(dān)一個(gè)windows系統(tǒng),其上部署一個(gè)應(yīng)用,因?yàn)閼?yīng)用本身占用CPU等資源很低,這樣就造成了大量CPU、內(nèi)存、電源的浪費(fèi)。如果通過(guò)虛擬化進(jìn)行服務(wù)器整合,就可以在一臺(tái)PC服務(wù)器上安裝多個(gè)windows或者linux系統(tǒng),每個(gè)系統(tǒng)之上承擔(dān)一個(gè)應(yīng)用,這樣就可以實(shí)現(xiàn)一臺(tái)PC服務(wù)器承載多個(gè)應(yīng)用,充分利用了CPU和內(nèi)存等資源。同一臺(tái)PC服務(wù)器上的多個(gè)windows系統(tǒng),其中一個(gè)重新啟動(dòng)或者感染病毒,并不會(huì)對(duì)其他系統(tǒng)造成任何影響。
二是高可用角度,PC服務(wù)器可以通過(guò)雙機(jī)集群來(lái)進(jìn)行高可用,但因?yàn)镻C服務(wù)器數(shù)量眾多,不可能所有都進(jìn)行集群,因此一旦一臺(tái)PC服務(wù)器壞掉,就會(huì)影響其上的應(yīng)用。通過(guò)虛擬化技術(shù),可以實(shí)現(xiàn)多臺(tái)PC服務(wù)器并行承擔(dān)多個(gè)windows系統(tǒng)或者linux系統(tǒng)的應(yīng)用,一旦一臺(tái)PC服務(wù)器壞掉,其上的所有操作系統(tǒng)會(huì)切換到其他PC服務(wù)器之上,這樣帶來(lái)了更大的高可用性。
三是管理方便,PC服務(wù)器數(shù)量眾多,傳統(tǒng)的方式是通過(guò)KVM等進(jìn)行管理,其間切換、重啟、連接光驅(qū)等工作經(jīng)常需要進(jìn)入機(jī)房,尤其是給某臺(tái)服務(wù)器擴(kuò)展內(nèi)存、增加CPU等不可避免的需要停機(jī)。通過(guò)虛擬化技術(shù),操作系統(tǒng)并不依賴于任何硬件,對(duì)于每臺(tái)應(yīng)用服務(wù)器的硬件狀態(tài)、軟件狀態(tài)都可以在線監(jiān)控,對(duì)于任何服務(wù)器硬件擴(kuò)容,都可以將其上的應(yīng)用系統(tǒng)不停機(jī)的遷移到其他服務(wù)器硬件上,這些動(dòng)作對(duì)于最終用戶都是沒(méi)有任何影響的。
四是安裝使用方便,以往安裝PC服務(wù)器,基本都是通過(guò)Ghost原有系統(tǒng),然后再安裝數(shù)據(jù)庫(kù)、或者應(yīng)用程序、殺毒軟件等。通過(guò)虛擬化技術(shù),可以將任何操作系統(tǒng)進(jìn)行復(fù)制,對(duì)于常用系統(tǒng)的安裝就是復(fù)制就可以,大大簡(jiǎn)化了操作系統(tǒng)的安裝環(huán)節(jié),甚至可以完整的復(fù)制一臺(tái)現(xiàn)有的系統(tǒng)出來(lái)使用,操作靈活簡(jiǎn)單。
對(duì)于一些測(cè)試開(kāi)發(fā)部門,之前需要服務(wù)器可能需要立項(xiàng)購(gòu)買,一是時(shí)間長(zhǎng),二是成本高,通過(guò)虛擬化技術(shù),可以在測(cè)試需求提出來(lái)后,立即從硬件資源池中劃分CPU、內(nèi)存、硬盤、網(wǎng)絡(luò)設(shè)備等,給測(cè)試部門使用,用完之后回收,簡(jiǎn)單方便、成本低廉。
五是備份方便,以往對(duì)于PC服務(wù)器的備份,多是在數(shù)據(jù)層面,一旦服務(wù)器損壞,只能先安裝系統(tǒng),再恢復(fù)數(shù)據(jù)。通過(guò)虛擬化技術(shù),可以直接對(duì)整臺(tái)服務(wù)器進(jìn)行備份,一旦需要恢復(fù),可以即時(shí)恢復(fù)整臺(tái)服務(wù)器,備份恢復(fù)工作簡(jiǎn)單方便。
同時(shí)虛擬化技術(shù)預(yù)留了容災(zāi)接口,可以將所有PC服務(wù)器原封不動(dòng)的容災(zāi)到異地容災(zāi)中心,這樣小型機(jī)和PC服務(wù)器就整體打包容災(zāi)到異地,實(shí)現(xiàn)應(yīng)用級(jí)的“雙活數(shù)據(jù)中心”容災(zāi)。
通過(guò)整合硬件和提高服務(wù)器利用率降低成本。PC服務(wù)器數(shù)量眾多,使用時(shí)間長(zhǎng)短不齊,帶來(lái)一系列的管理問(wèn)題、耗電問(wèn)題等,同時(shí)PC服務(wù)器面臨著大量的資源利用不足,硬件閑置,一旦能通過(guò)一臺(tái)硬件支持多臺(tái)服務(wù)器,提高硬件資源使用率,降低服務(wù)器管理的數(shù)量,可以明顯的降低成本和工作量。
2.2.1 大幅減少停機(jī)時(shí)間
2.2.1.1 減少計(jì)劃內(nèi)停機(jī)
計(jì)劃內(nèi)停機(jī)包括硬件維護(hù)、服務(wù)器遷移和固件更新,通常占數(shù)據(jù)中心停機(jī)時(shí)間的80%以上。虛擬化解決方案允許將工作負(fù)載動(dòng)態(tài)移動(dòng)到其他物理服務(wù)器上,因此無(wú)需停機(jī)或中斷服務(wù)就能進(jìn)行服務(wù)器維護(hù)??呻S時(shí)執(zhí)行維護(hù),而無(wú)需中斷用戶和服務(wù),并且消除了日常維護(hù)操作所需的計(jì)劃內(nèi)停機(jī)。
2.2.1.2 防止計(jì)劃外停機(jī)
虛擬化解決方案采用對(duì)虛擬機(jī)中運(yùn)行的操作系統(tǒng)和應(yīng)用程序透明的方式,將重要的容錯(cuò)功能內(nèi)置于數(shù)據(jù)中心基礎(chǔ)架構(gòu)中。
2.2.1.3 確保從停機(jī)中快速恢復(fù)
虛擬機(jī)獨(dú)立于硬件并且可以共享物理資源,因此無(wú)需相同的專用備用硬件即可部署故障切換,并且消除了維護(hù)相同配置所導(dǎo)致的附加復(fù)雜性。在服務(wù)器發(fā)生故障時(shí),高可用High Availability(HA)可確保虛擬機(jī)快速、自動(dòng)重啟。HA可在其他生產(chǎn)服務(wù)器上自動(dòng)并智能地重啟受影響的虛擬機(jī)??赏ㄟ^(guò)將虛擬機(jī)和其他虛擬機(jī)組成群集或?qū)⑽锢頇C(jī)與其他物理機(jī)組成群集,在虛擬環(huán)境中充分利用第三方群集軟件。使用虛擬機(jī)組成群集具有下列好處:不會(huì)產(chǎn)生使用相同服務(wù)器時(shí)產(chǎn)生的成本,避免了物理硬件更改時(shí)重建群集帶來(lái)的復(fù)雜性,排除了與測(cè)試物理系統(tǒng)群集相關(guān)的困難。
2.2.2 虛擬化備份提高數(shù)據(jù)和程序保護(hù)
2.2.2.1 快速、輕松恢復(fù)數(shù)據(jù)
利用現(xiàn)有工具和數(shù)據(jù)恢復(fù)方法保護(hù)虛擬機(jī)上運(yùn)行的應(yīng)用程序和系統(tǒng)數(shù)據(jù)。使用將整個(gè)虛擬機(jī)捕捉為一個(gè)文件集的第三方備份產(chǎn)品來(lái)進(jìn)行完整映像備份,確保在虛擬化環(huán)境中有效部署數(shù)據(jù)恢復(fù)計(jì)劃。
2.2.2.2 簡(jiǎn)化全面的數(shù)據(jù)保護(hù)
利用基于磁盤的備份和恢復(fù)解決方案Data Recovery,實(shí)現(xiàn)快速、簡(jiǎn)單和全面的虛擬機(jī)數(shù)據(jù)保護(hù)。Data Recovery是第一道數(shù)據(jù)保護(hù)防線。虛擬化將完整的系統(tǒng)(系統(tǒng)配置、應(yīng)用程序安裝和數(shù)據(jù))封裝到幾個(gè)文件中。無(wú)需傳統(tǒng)解決方案的復(fù)雜性即可實(shí)現(xiàn)對(duì)系統(tǒng)、應(yīng)用程序和數(shù)據(jù)的全面保護(hù)。利用一組工具和過(guò)程就能保護(hù)系統(tǒng)、應(yīng)用程序和數(shù)據(jù)。
2.2.2.3 支持可靠的無(wú)中斷備份
?降低備份過(guò)程中虛擬機(jī)服務(wù)器上的負(fù)載;
?通過(guò)使用運(yùn)行在代理服務(wù)器上的單個(gè)代理,而不是在所有虛擬機(jī)上都運(yùn)行代理,來(lái)改進(jìn)IT資源的可管理性;
?通過(guò)利用光纖通道磁帶設(shè)備進(jìn)行虛擬機(jī)備份,消除局域網(wǎng)上的備份流量。
2.2.3 為PC服務(wù)器提供容災(zāi)可能
2.2.3.1 恢復(fù)文件即恢復(fù)整臺(tái)PC服務(wù)器
傳統(tǒng)災(zāi)難恢復(fù)計(jì)劃需要許多手動(dòng)、復(fù)雜的步驟來(lái)分配恢復(fù)資源、執(zhí)行裸機(jī)恢復(fù)、執(zhí)行數(shù)據(jù)恢復(fù),并驗(yàn)證系統(tǒng)是否為使用做好了準(zhǔn)備。
一般來(lái)講容災(zāi)方案很少考慮PC服務(wù)器,原因無(wú)非是PC服務(wù)器數(shù)量眾多、實(shí)現(xiàn)技術(shù)手段困難、重要性不如小型機(jī)高等等,但配置了虛擬化,PC服務(wù)器的容災(zāi)變的相對(duì)簡(jiǎn)單。
PC服務(wù)器的硬件配置、固件、操作系統(tǒng)安裝以及應(yīng)用程序安裝都作為數(shù)據(jù)存儲(chǔ)在磁盤上的少量文件中。使用備份或復(fù)制軟件保護(hù)這些文件即保護(hù)了整個(gè)系統(tǒng)。之后,這些文件無(wú)需更改即可恢復(fù)到任何硬件上,因?yàn)樘摂M機(jī)是獨(dú)立于硬件的。
2.2.3.2 確??煽康幕謴?fù)
傳統(tǒng)的恢復(fù)計(jì)劃通常難以測(cè)試和保持更新,并且依賴于準(zhǔn)確執(zhí)行復(fù)雜的手動(dòng)過(guò)程。在虛擬化環(huán)境中,測(cè)試變得十分簡(jiǎn)單,因?yàn)榭梢岳矛F(xiàn)有資源進(jìn)行無(wú)中斷測(cè)試。硬件獨(dú)立性通過(guò)消除由硬件差異導(dǎo)致的故障,簡(jiǎn)化了維護(hù)恢復(fù)站點(diǎn)的復(fù)雜性。
2.2.3.3 降低災(zāi)難恢復(fù)成本
在過(guò)去那些可靠的災(zāi)難恢復(fù)解決方案總是要求設(shè)置重復(fù)的完整生產(chǎn)基礎(chǔ)架構(gòu),從而會(huì)產(chǎn)生相應(yīng)的成本。利用虛擬化解決方案,可提供快速而可靠的恢復(fù),并且不需要配備完全相同的硬件。由于獨(dú)立于硬件,可以將現(xiàn)有服務(wù)器重新規(guī)劃用于災(zāi)難恢復(fù),而不需要為快速恢復(fù)購(gòu)買重復(fù)的服務(wù)器。服務(wù)器整合還可以幫助大幅降低用于生產(chǎn)和災(zāi)難恢復(fù)的服務(wù)器基礎(chǔ)架構(gòu)的成本。
2.2.3.4 自動(dòng)執(zhí)行災(zāi)難恢復(fù)
無(wú)需執(zhí)行許多很難或不可能自動(dòng)執(zhí)行而且容易出現(xiàn)人為錯(cuò)誤的手動(dòng)步驟。通過(guò)將物理服務(wù)器轉(zhuǎn)換為數(shù)據(jù),并將恢復(fù)過(guò)程轉(zhuǎn)換為軟件,虛擬化打開(kāi)了通向?yàn)?zāi)難恢復(fù)自動(dòng)化的大門。利用專用的虛擬化容災(zāi)解決方案可自動(dòng)執(zhí)行災(zāi)難恢復(fù)過(guò)程,并且能夠確保經(jīng)濟(jì)高效而且快速地執(zhí)行災(zāi)難恢復(fù)計(jì)劃??奢p松測(cè)試災(zāi)難恢復(fù)計(jì)劃,從而確保整個(gè)IT基礎(chǔ)架構(gòu)具有最高級(jí)別的可靠性和可用性。