何軍 何元清
摘要:信息化建設(shè)任務(wù)長期以來被全球各國、各行業(yè)所關(guān)注,尤其是在計(jì)算機(jī)網(wǎng)絡(luò)化愈加完善的當(dāng)今。隨著企業(yè)業(yè)務(wù)量和服務(wù)器數(shù)量的不斷增加,管理效率和硬件成本問題日益突出。服務(wù)器虛擬化能很好地解決這一問題,通過將服務(wù)器進(jìn)行虛擬化可以減少硬件開支,從而節(jié)約成本、提高效率。本文首先對虛擬化技術(shù)下的數(shù)據(jù)中心進(jìn)行了概述,其次對虛擬化技術(shù)及其分類進(jìn)行了探討,最后利用VMware vSphere進(jìn)行了服務(wù)器虛擬化的實(shí)際部署研究,并通過行業(yè)數(shù)據(jù)進(jìn)行了應(yīng)用案例分析。
關(guān)鍵詞:虛擬化;VMware vSphere;服務(wù)器部署;數(shù)據(jù)分析
中圖分類號:TP311 ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2019)14-0014-03
1引言
社會大眾的日常工作與生活都在信息技術(shù)的更新?lián)Q代,蓬勃發(fā)展下逐漸信息化、數(shù)字化。同時,信息化也作為各行業(yè)追逐和競爭的關(guān)鍵點(diǎn),成為新時期下企業(yè)能否長遠(yuǎn)發(fā)展的重要項(xiàng)。然而長期以來,各企業(yè)的信息化建設(shè)一直缺乏系統(tǒng)性規(guī)劃,往往是按照業(yè)務(wù)需求,分散購置相應(yīng)設(shè)備,按需建設(shè)系統(tǒng)服務(wù)器。從而造成網(wǎng)絡(luò)設(shè)備系統(tǒng)之間的巨大差異,在應(yīng)用集成階段更是暴露了大量問題。
首先,企業(yè)、單位的各部門根據(jù)本部門的實(shí)際需求開發(fā)、使用相關(guān)信息管理系統(tǒng),用以儲存本部門數(shù)據(jù),但由于各部門之間大都按自身所需創(chuàng)建,并沒有各部門統(tǒng)一的數(shù)據(jù)庫,導(dǎo)致了大量數(shù)據(jù)的冗余。而且各部門之間的數(shù)據(jù)庫設(shè)計(jì)標(biāo)準(zhǔn)和數(shù)據(jù)端口沒有對應(yīng)和統(tǒng)一,各部門間的數(shù)據(jù)共用和交換難以實(shí)現(xiàn),各信息管理系統(tǒng)之間形成了“信息孤島”[1]。
其次由于供應(yīng)商更換、軟硬件升級更新等原因,各部門所使用的信息管理系統(tǒng)難以保持一致性,進(jìn)一步惡化各系統(tǒng)之間的獨(dú)立性,不能為企業(yè)、單位的協(xié)同工作和可持續(xù)發(fā)展提供充足的數(shù)據(jù)支持和可靠的技術(shù)保障,對人力、物力和財(cái)力上造成不必要的浪費(fèi)。
最后對于傳統(tǒng)的孤島式數(shù)據(jù)中心,主要呈現(xiàn)出的弊端有:機(jī)房建設(shè)與運(yùn)營成本高;各類資源分配不合理;軟硬件兼容性差;管理復(fù)雜且成本高;系統(tǒng)擴(kuò)展性差;安全管理無效;災(zāi)難應(yīng)急實(shí)行困難且低效等。
虛擬化,即利用虛擬化技術(shù),將一臺物理計(jì)算機(jī)虛擬成為多臺邏輯計(jì)算機(jī),不同的操作系統(tǒng)可在同一物理系統(tǒng)的不同邏輯計(jì)算機(jī)上運(yùn)行,同時各應(yīng)用能互不影響在各自獨(dú)立的單位運(yùn)行,從而大幅增加計(jì)算機(jī)的工作效率[1]。面對數(shù)據(jù)中心這些問題時,虛擬化技術(shù)減少軟硬件開支,降低人力成本的特性,起到了很好的作用。
2 數(shù)據(jù)中心
數(shù)據(jù)中心是用于容納計(jì)算機(jī)系統(tǒng)和相關(guān)組件,如電信設(shè)備和存儲設(shè)備等設(shè)施的專用建筑、建筑群或?qū)S每臻g。
由于信息中心的計(jì)算機(jī)業(yè)務(wù)相關(guān)操作對于連續(xù)性有較高要求,因此信息中心中通常包含一般性服務(wù)器機(jī)房的基礎(chǔ)設(shè)施,電源(常規(guī)電源、UPS不間斷電源等),數(shù)據(jù)通信連接,環(huán)境控制(溫度調(diào)節(jié)系統(tǒng),防火警報(bào)系統(tǒng)),其他安全設(shè)備和各設(shè)備系統(tǒng)的冗余備份。
一個完備的數(shù)據(jù)中心其內(nèi)包含了各種復(fù)雜的系統(tǒng),各系統(tǒng)間相互配合為數(shù)據(jù)中心的工作服務(wù)。一個國家級的大型數(shù)據(jù)中心已經(jīng)達(dá)到工業(yè)規(guī)模運(yùn)營,其能耗與量級幾乎能匹配一個小城鎮(zhèn)。世界數(shù)據(jù)中心(World Data Center)是國際科學(xué)聯(lián)合會下設(shè)的科學(xué)數(shù)據(jù)組織,有40多個學(xué)科數(shù)據(jù)中心,我國的世界數(shù)據(jù)中心有九個分中心,分別包含了海洋、地址、天文、氣象等方向[2]。
2.1 數(shù)據(jù)中心的發(fā)展
在70年代前后,計(jì)算機(jī)系統(tǒng)的占地面積和體積都很大,計(jì)算機(jī)需要放置在特定的空間內(nèi);整個系統(tǒng)的操作和維護(hù)過程煩瑣復(fù)雜,需要特定人員進(jìn)行專業(yè)操作。這便是初期的數(shù)據(jù)中心。
80年代時期,計(jì)算機(jī)軟硬件都迅速發(fā)展,計(jì)算機(jī)被大量使用,但是對于計(jì)算機(jī)系統(tǒng)的維護(hù)幾乎沒有,系統(tǒng)內(nèi)的數(shù)據(jù)經(jīng)常發(fā)生丟失,因而資源管理開始被重視。尤其是在C/S模式出現(xiàn)后,服務(wù)端與客戶端分離,服務(wù)器被單獨(dú)統(tǒng)一集中在指定的空間中,數(shù)據(jù)中心的概念也隨之提出。
90年代后,隨著個人電腦和互聯(lián)網(wǎng)的普及,數(shù)據(jù)中心也迅速發(fā)展,大量的企業(yè)、單位開始建立允許用戶通過互聯(lián)網(wǎng)24小時不間斷訪問的網(wǎng)站,這一服務(wù)要求服務(wù)器所提供的資源訪問快速且穩(wěn)定,互聯(lián)網(wǎng)數(shù)據(jù)中心應(yīng)運(yùn)而生。
如今,數(shù)據(jù)中心建設(shè)早已有了行業(yè)標(biāo)準(zhǔn),規(guī)范的方案,相應(yīng)的設(shè)計(jì)標(biāo)準(zhǔn)。提倡綠色環(huán)保、節(jié)能高效、基礎(chǔ)設(shè)施共享、安全保密概念的面向服務(wù)的數(shù)據(jù)中心受到各行業(yè)廣泛關(guān)注,集中計(jì)算、分布式云計(jì)算、SOA、虛擬化等新興技術(shù)與數(shù)據(jù)中心密切結(jié)合[3]。
2.2 傳統(tǒng)數(shù)據(jù)中心的弊端
數(shù)據(jù)中心的建立能幫助分散的服務(wù)器形成系統(tǒng)性的資源管理和網(wǎng)絡(luò)服務(wù)。但是傳統(tǒng)的數(shù)據(jù)中心缺少低耗能、高使用設(shè)計(jì),在長期使用后,存在大量缺陷,主要表現(xiàn)在以下五個方面:
1)故障無保障。由于不同應(yīng)用系統(tǒng)對服務(wù)器系統(tǒng)配置要求不同,大部分的數(shù)據(jù)中心為了確保其上的應(yīng)用穩(wěn)定,各應(yīng)用都部署在獨(dú)立的服務(wù)器上,在這種情況下,服務(wù)器一旦出故障,將導(dǎo)致整個應(yīng)用服務(wù)失效。
2)硬件煩繁冗笨拙。服務(wù)器數(shù)目由于業(yè)務(wù)量上漲而增加,提高了設(shè)備成本,服務(wù)器型號、性能的不同,使得維護(hù)困難,統(tǒng)一管理和故障排查都難以實(shí)現(xiàn),并且服務(wù)器之間還易發(fā)不兼容問題。隨著設(shè)備的不斷增多,配套設(shè)施也增加,導(dǎo)致機(jī)房空間的消耗增大,對能源消耗增加,同時維護(hù)成本也增加。
3)資源輪空浪費(fèi)。由于每個服務(wù)器對應(yīng)的業(yè)務(wù)不同,其資源使用時段和效率都不同。大部分的服務(wù)器無法充分發(fā)揮其硬件性能,各服務(wù)器之間的資源不能靈活調(diào)配,缺乏對突發(fā)數(shù)據(jù)流的處理,數(shù)據(jù)中心內(nèi)各服務(wù)器資源不能夠充分的利用。
4)系統(tǒng)升級復(fù)雜。在面對服務(wù)器軟硬件更換、軟硬件故障、升級,服務(wù)器系統(tǒng)更換、更新和業(yè)務(wù)軟件的數(shù)據(jù)更新、恢復(fù)等工作,常常會花費(fèi)較長時間,致使服務(wù)暫停。
5)數(shù)據(jù)量隱患。隨著服務(wù)器所提供服務(wù)時間的增加,系統(tǒng)內(nèi)的數(shù)據(jù)量逐漸增多,這將導(dǎo)致系統(tǒng)的備份十分困難,無論是熱備份還是定期備份的工作量都是龐大的。同時系統(tǒng)業(yè)務(wù)的恢復(fù)時長也隨之增加,使安全性降低。
2.3 虛擬化技術(shù)下的數(shù)據(jù)中心
在大數(shù)據(jù)的大時代下,用戶對資源實(shí)際情況不關(guān)心也沒必要關(guān)心,用戶只希望資源能夠隨時被訪問和使用,服務(wù)器的計(jì)算能力、數(shù)據(jù)的存儲位置、網(wǎng)絡(luò)的擁堵狀況對于用戶都是透明的。針對這些使用特性,虛擬化技術(shù)對于當(dāng)前數(shù)據(jù)中心的改造十分貼切。
數(shù)據(jù)中心的資源使用率符合2/8定律,根據(jù)這一特性,利用虛擬化技術(shù),將各種資源進(jìn)行整合,減少對設(shè)備、空間、電力、溫度的需求,實(shí)現(xiàn)高效的數(shù)據(jù)中心建設(shè),高可擴(kuò)展性應(yīng)對快速增長的服務(wù)載荷需求。
在保證應(yīng)用服務(wù)正常運(yùn)行的同時,降低硬件成本,不同服務(wù)系統(tǒng)之間隔離,數(shù)據(jù)的安全性和系統(tǒng)的穩(wěn)定性同時兼顧。減少服務(wù)器的部署時長,到達(dá)對業(yè)務(wù)需求的及時應(yīng)對。提高管理效率,節(jié)省大量的能源支出,使數(shù)據(jù)中心建設(shè)更貼近綠色環(huán)保的概念。同時虛擬化后,簡化了數(shù)據(jù)中心的網(wǎng)絡(luò)架構(gòu),便于網(wǎng)絡(luò)架設(shè)和管理[4]。
3虛擬化技術(shù)
虛擬化技術(shù)將現(xiàn)有的軟硬件資源整合并利用,所謂虛擬化實(shí)則是對所擁有資源的分配管理,即虛擬技術(shù)的本質(zhì)就是對資源管理的技術(shù)。通過加入一個虛擬化層,將底層的物理資源抽象成虛擬的形式,并向上層提接口,使其提供相同或類似功能,所以應(yīng)用程序得以在虛擬環(huán)境下完成工作。
3.1 虛擬化技術(shù)的發(fā)展
60年代初期,虛擬化由美國等國最先探索。1959年克里斯托弗《大型高速計(jì)算機(jī)中的時間共享》一文發(fā)表,虛擬化的這一理論被首次提出[5]。
80年代中期,大型主機(jī)上的虛擬化最早由IBM提出并使用,通過VMM虛擬監(jiān)控器將物理硬件資源實(shí)現(xiàn)虛擬,很大程度上解決了大型機(jī)價格成本高,但使用率低的問題,資源能盡可能地被利用。
新世紀(jì)前后,VMware公司對外發(fā)行了基于x86計(jì)算機(jī)的虛擬化產(chǎn)品,實(shí)現(xiàn)了x86平臺虛擬化的突破。隨著x86計(jì)算機(jī)各項(xiàng)硬件的大幅提升,其各方面性能也都有極大的攀升,直到今天,x86計(jì)算器上的虛擬化技術(shù)快速發(fā)展。PC機(jī)虛擬化建設(shè)開始向控制成本、面向服務(wù)、策略實(shí)施、自動化控制、節(jié)能綠色方向發(fā)展[5]。
3.2 虛擬化技術(shù)的分類
從虛擬化架構(gòu)作依據(jù)有寄居架構(gòu)(Hosted Architecture)和裸金屬架構(gòu) (Bare Metal Architecture)。前者借由現(xiàn)有的平臺來進(jìn)行虛擬化操作;后者則將虛擬系統(tǒng)安裝在底層硬件上。
從數(shù)據(jù)中心建設(shè)方面,虛擬化是對數(shù)據(jù)中心的系統(tǒng)、存儲、網(wǎng)絡(luò)、應(yīng)用程序進(jìn)行整合,已達(dá)到對建設(shè)成本、使用效率等因素的控制,因此可分為系統(tǒng)虛擬化、基礎(chǔ)虛擬化、軟件虛擬化[6]。
3.3 虛擬化產(chǎn)品比較
現(xiàn)今市場上的虛擬化產(chǎn)品很多,但市場的主要份額由VMware的vSphere系列,微軟的Hyper系列和Citrix的Xen系列三家占有。表1對以上三種產(chǎn)品的部分參數(shù)比較。
4 VMware vSphere
VMware vSphere是現(xiàn)今市場上最為成熟的虛擬化產(chǎn)品,也是市場占比最高的,vSphere針對服務(wù)器、存儲器和網(wǎng)絡(luò)等當(dāng)面進(jìn)行虛擬操作,為用戶提供簡單、直接、高效的虛擬化服務(wù)[6]。
由圖1可知,傳統(tǒng)的X86架構(gòu)的計(jì)算機(jī)由底層物理設(shè)備、其次X86架構(gòu)、中間操作系統(tǒng)、最上層應(yīng)用軟件四部分組成。而在vSphere的虛擬化架構(gòu)中將傳統(tǒng)的操作系統(tǒng)替換為虛擬管理內(nèi)核和監(jiān)視系統(tǒng),而在其上開辟虛擬的物理設(shè)備,在虛擬物理設(shè)備上建立若干傳統(tǒng)的X86計(jì)算機(jī)架構(gòu)[7]。
vSphere中有許多管理和控制系統(tǒng),底層核心是VMware ESXi,包括VMware Kernel虛擬化管理內(nèi)核和VMM虛擬監(jiān)視系統(tǒng)兩部分,其相當(dāng)于傳統(tǒng)架構(gòu)中的X86架構(gòu),為上層提供基礎(chǔ)物理的虛擬化。vSphere上層應(yīng)用層面向用戶提供了VMware vCenter Server虛擬化平臺管理中心控制系統(tǒng),以便于用戶對虛擬機(jī)管理控制;用戶有兩種客戶端VMware vSphere Client和vSphere Web Client可供選擇;同時還提供vSphere API/SDK,便于用戶二次開發(fā);vCLI是對腳本進(jìn)行編輯的IDE開發(fā)工具;CIM硬件管理系統(tǒng)是針對硬件的管理軟件[5]。
5應(yīng)用實(shí)例
本例中使用飛行學(xué)院SR20教練機(jī)的SD卡訓(xùn)練數(shù)據(jù)作為數(shù)據(jù)集。其數(shù)據(jù)由GARMIN1000綜合航空電子設(shè)備機(jī)載數(shù)據(jù)系統(tǒng)收集,在飛行員上機(jī)后的一系列操作都將被G1000感應(yīng)器采集,飛行關(guān)鍵信息和發(fā)動機(jī)數(shù)據(jù)存儲在系統(tǒng)自帶的飛行數(shù)據(jù)記錄卡(SD卡)中,如飛行坐標(biāo)、空速、航向、燃油及流量等等69個類別。根據(jù)設(shè)計(jì),在G1000系統(tǒng)啟動后,數(shù)據(jù)信息將每秒一次刷新,在SD卡中以.csv格式存放。
數(shù)據(jù)表中的69項(xiàng)數(shù)據(jù)可以分為:飛行環(huán)境數(shù)據(jù)、飛行狀態(tài)數(shù)據(jù)、發(fā)動機(jī)數(shù)據(jù)和未定義數(shù)據(jù)。其中未定義數(shù)據(jù)均為記錄為空或暫無定義的數(shù)據(jù)。而剩余項(xiàng)中存在對于數(shù)據(jù)分析無用的數(shù)據(jù),如日期時間、環(huán)境因素等。最終確定了11項(xiàng)數(shù)據(jù)作為分析數(shù)據(jù)分析參考。
基礎(chǔ)數(shù)據(jù)中有相當(dāng)一部分?jǐn)?shù)據(jù)為空白或間斷性缺失,存在不利于數(shù)據(jù)分析的情況,所以先對數(shù)據(jù)進(jìn)行清洗。清洗過程包括對于無效數(shù)據(jù)文件(文件過小、關(guān)鍵數(shù)據(jù)連續(xù)空白)刪去,部分內(nèi)容(初始、著陸階段關(guān)鍵數(shù)據(jù)空白、不連續(xù)數(shù)據(jù))刪除。
實(shí)驗(yàn)所選取的測量項(xiàng)有:連續(xù)地面等待超時、粗猛操縱油門、俯仰姿態(tài)超限、坡度超限、俯仰操縱粗猛、近地俯仰坡度超限、近地過載超限(重著陸)、低燃油量、空速超限、未完成試車前暖機(jī)。
實(shí)驗(yàn)共使用到hadoop集群中的節(jié)點(diǎn),一個Master節(jié)點(diǎn),兩個節(jié)點(diǎn)作為Worker節(jié)點(diǎn)。具體分配如下表。
在數(shù)據(jù)處理操作中,使用Hadoop套件中的Sqoop和Zeppelin工具。
Sqoop是Hadoop與關(guān)系數(shù)據(jù)庫(本例使用的是MySQL數(shù)據(jù)庫)相互傳輸數(shù)據(jù)的工具套件。本例中的數(shù)據(jù)存放在工作簿中,將其導(dǎo)入MySQL數(shù)據(jù)庫中,通過Sqoop將關(guān)系型數(shù)據(jù)中的數(shù)據(jù)導(dǎo)入到Hadoop的分布式文件系統(tǒng)(HDFS)中,也可以將分布式文件系統(tǒng)(HDFS)中的數(shù)據(jù)導(dǎo)出到關(guān)系型數(shù)據(jù)庫中,做進(jìn)一步處理[7]。
Zeppelin 是Hadoop中對倉庫中數(shù)據(jù)進(jìn)行快速分析并實(shí)現(xiàn)可視化的工具套件。使用解釋器( Interpreter)操作不同的數(shù)據(jù)處理引擎,快速實(shí)現(xiàn)數(shù)統(tǒng)計(jì)及可視化統(tǒng)計(jì)結(jié)果[7]。通過Zeppelin對數(shù)據(jù)分析并可視化,詳見圖2。
上圖可知,在分析數(shù)據(jù)中,出現(xiàn)粗猛操縱油門:709次,俯仰操縱粗猛:96次,俯仰姿態(tài)超限:60次,近地過載超限:91次,連續(xù)地面等待超時:78次,深失速:37次,未完成試車前暖機(jī):11次,坡度超限:6次,低燃油量:0次,空速超限:4次,近地俯仰坡度超限:0次。
6結(jié)論
在面對企業(yè)業(yè)務(wù)量和服務(wù)器數(shù)量的不斷增加,管理效率和硬件成本問題日益突出等情況下,通過服務(wù)器虛擬化技術(shù),能很好地解決這一問題,通過將服務(wù)器進(jìn)行虛擬化可以減少硬件開支,節(jié)約成本、提高效率。虛擬化技術(shù)對傳統(tǒng)數(shù)據(jù)中心進(jìn)行了結(jié)構(gòu)優(yōu)化于資源整合,將數(shù)據(jù)中心的處理能力和效率提高。在利用VMware vSphere等成熟的虛擬化產(chǎn)品對服務(wù)器進(jìn)行虛擬化也是十分便捷和高效。
參考文獻(xiàn):
[1] 張杰,李文輝. VMware 虛擬化服務(wù)器的構(gòu)建方法與展望[J].信息通信, 2015(3):60-63.
[2] 張超. Web2.0 增值業(yè)務(wù)安全運(yùn)營支撐系統(tǒng)的研究[J].信息安全與通信保密,2013(11): 51-52.
[3] 蔣祝平.網(wǎng)絡(luò)計(jì)費(fèi)策略研究[J].中興通信技術(shù),2013,(4): 49-55.
[4] 錢磊. 基于Vmware虛擬化技術(shù)服務(wù)器虛擬化的設(shè)計(jì)與實(shí)現(xiàn)[D].北京:北京郵電大學(xué),2014.
[5] 譚文輝. 利用VMware實(shí)現(xiàn)數(shù)據(jù)中心服務(wù)器虛擬化[J].計(jì)算機(jī)工程與應(yīng)用,2015(29):115-118.
[6] 馮海欣. 虛擬化在高校數(shù)據(jù)中心建設(shè)中應(yīng)用[D]. 大連:大連海事大學(xué),2013:2-13.
[7] 鄧杰.Hadoop大數(shù)據(jù)挖掘進(jìn)階[M].北京:機(jī)械工業(yè)出版社,2018:61-8.
【通聯(lián)編輯:梁書】