陳國(guó)華 李曉林 嚴(yán)峻 廖劍雄 仇紅燕
[摘 要]本文主要探討了虛擬化技術(shù)在塔里木油田的實(shí)際應(yīng)用,通過(guò)闡述油田虛擬化平臺(tái)建設(shè)過(guò)程中系統(tǒng)架構(gòu)、網(wǎng)絡(luò)架構(gòu)、容災(zāi)保護(hù)的設(shè)計(jì)方法,以及在安全管理、運(yùn)維監(jiān)控、預(yù)警分析等方面采取的舉措,分析了虛擬化平臺(tái)在提高資源利用率、管理效率、系統(tǒng)安全性、業(yè)務(wù)連續(xù)性和節(jié)能增效等方面取得的成效。
[關(guān)鍵詞]服務(wù)器虛擬化;NBU備份;SRM容災(zāi)
doi:10.3969/j.issn.1673 - 0194.2018.20.020
[中圖分類號(hào)]TE4;TP391.9 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1673-0194(2018)20-00-02
0? ? ?引 言
隨著油田信息化的快速發(fā)展和集團(tuán)公司統(tǒng)建系統(tǒng)的推廣應(yīng)用,大量的應(yīng)用系統(tǒng)上線部署,服務(wù)器、存儲(chǔ)、網(wǎng)絡(luò)等設(shè)備越來(lái)越多,架構(gòu)越來(lái)越復(fù)雜,機(jī)房配電、制冷等配套設(shè)施負(fù)荷不堪重負(fù),運(yùn)維難度加劇。如何提高設(shè)備資源的使用率,降低能耗,減少軟硬件故障對(duì)業(yè)務(wù)連續(xù)性和數(shù)據(jù)安全性的影響,簡(jiǎn)化架構(gòu)設(shè)計(jì),降低運(yùn)維管理難度,減少應(yīng)用部署遷移的工作量和時(shí)間周期,縮減機(jī)房設(shè)施及運(yùn)維投入等成為了企業(yè)的迫切需求。虛擬化技術(shù)的推廣應(yīng)用有效解決了上述問(wèn)題,通過(guò)對(duì)油田IT環(huán)境進(jìn)行資源整合利用,與油田自主開(kāi)發(fā)監(jiān)控系統(tǒng)、運(yùn)維系統(tǒng)有效結(jié)合,建成了具有油田特色的虛擬化平臺(tái)架構(gòu)。
1? ? ?虛擬化平臺(tái)的應(yīng)用概況
塔里木油田服務(wù)器虛擬化平臺(tái)自投建至今,歷經(jīng)兩次擴(kuò)建和平臺(tái)的拓展融合,已建成以30臺(tái)PC服務(wù)器、3套存儲(chǔ)及配套網(wǎng)絡(luò)設(shè)備為基礎(chǔ),以虛擬化平臺(tái)為核心,融合備份管理平臺(tái)、容災(zāi)平臺(tái)、運(yùn)維監(jiān)控平臺(tái)的具有油田特色的虛擬化平臺(tái)架構(gòu)。目前,油田自建的應(yīng)用系統(tǒng)95%以上是在虛擬化平臺(tái)運(yùn)行,實(shí)現(xiàn)了服務(wù)器虛擬化在油田的全面應(yīng)用。
2? ? ?虛擬化平臺(tái)的建設(shè)思路
隨著X86系統(tǒng)的虛擬化技術(shù)不斷成熟,越來(lái)越多的企業(yè)用戶開(kāi)始接受并大規(guī)模使用服務(wù)器虛擬化技術(shù)。為了提高服務(wù)器資源利用率、延長(zhǎng)陳舊應(yīng)用的生命周期、減少設(shè)備投入資金、降低機(jī)房能耗,油田決定引進(jìn)虛擬化技術(shù),本著標(biāo)準(zhǔn)化、高可用、高性能、開(kāi)放接口、易擴(kuò)展和綠色節(jié)能的建設(shè)理念,對(duì)油田的虛擬化應(yīng)用技術(shù)進(jìn)行了選型,并對(duì)架構(gòu)進(jìn)行了整體設(shè)計(jì),分階段實(shí)施。
油田虛擬化應(yīng)用歷經(jīng)了3個(gè)階段。①初步應(yīng)用。通過(guò)VMware軟件對(duì)現(xiàn)有的服務(wù)器、應(yīng)用進(jìn)行優(yōu)化整合,完成搭建油田中心機(jī)房服務(wù)器虛擬化環(huán)境。②擴(kuò)展建設(shè)。隨著虛擬化技術(shù)應(yīng)用得到各級(jí)用戶的認(rèn)可和新應(yīng)用不斷上線,前期投入的資源已不能滿足業(yè)務(wù)增長(zhǎng)需求,亟需對(duì)平臺(tái)進(jìn)行升級(jí)擴(kuò)容和站點(diǎn)容災(zāi)。擴(kuò)容建設(shè)采用雙站點(diǎn)并行思路,滿足將應(yīng)用按等級(jí)、用途、功能進(jìn)行分類管理的需求。③架構(gòu)優(yōu)化、系統(tǒng)融合。該階段新建站點(diǎn)一個(gè),并對(duì)站點(diǎn)的功能用途進(jìn)行優(yōu)化調(diào)整,同時(shí)融合了SRM容災(zāi)備份系統(tǒng)、統(tǒng)一監(jiān)控系統(tǒng)和NBU備份系統(tǒng),實(shí)現(xiàn)了站點(diǎn)級(jí)的容災(zāi)保護(hù)機(jī)制,建立了集性能分析、數(shù)據(jù)分析、預(yù)警、告警追蹤和問(wèn)題督辦于一身的統(tǒng)一運(yùn)維監(jiān)控體系。
3? ? ?虛擬化技術(shù)路線
3.1? ?虛擬化系統(tǒng)架構(gòu)
經(jīng)過(guò)對(duì)國(guó)內(nèi)外企業(yè)虛擬化案例的分析和研究,結(jié)合油田實(shí)際IT環(huán)境,設(shè)計(jì)了符合油田需求的虛擬化架構(gòu)。服務(wù)器、存儲(chǔ)、IP網(wǎng)絡(luò)和SAN網(wǎng)絡(luò)均使用冗余配置。管理層通過(guò)融合NBU備份、vCops監(jiān)控、SRM容災(zāi)等系統(tǒng),建立了具有塔里木油田特點(diǎn)的虛擬化管理平臺(tái),如圖1所示。在應(yīng)用層面,通過(guò)對(duì)業(yè)務(wù)應(yīng)用系統(tǒng)的功能、資源、性能等進(jìn)行需求分析,劃分并分配到不同站點(diǎn)的資源池中,以保障資源得到合理利用。在物理層面,以30臺(tái)PC服務(wù)器、3套存儲(chǔ)以及相關(guān)配套的網(wǎng)絡(luò)設(shè)備構(gòu)建了3個(gè)不同功能的站點(diǎn)為業(yè)務(wù)系統(tǒng)提供資源保障,其中,A站點(diǎn)用于開(kāi)發(fā)和測(cè)試環(huán)境,B站點(diǎn)、C站點(diǎn)用于生產(chǎn)環(huán)境,并在B站點(diǎn)、C站點(diǎn)間建立了站點(diǎn)級(jí)別SRM容災(zāi)機(jī)制。
3.2? ?虛擬化容災(zāi)及數(shù)據(jù)保護(hù)
隨著油田信息化的不斷深入,油田運(yùn)營(yíng)對(duì)信息系統(tǒng)的依賴程度越來(lái)越高,如何保障業(yè)務(wù)系統(tǒng)運(yùn)行的持續(xù)性、高可用性,數(shù)據(jù)的安全性、有效性,容災(zāi)恢復(fù)的時(shí)效性、完整性,成為數(shù)據(jù)中心設(shè)計(jì)、建設(shè)和運(yùn)行時(shí)需要重點(diǎn)考慮的因素。在虛擬化技術(shù)實(shí)踐過(guò)程中,在業(yè)務(wù)層面,油田運(yùn)用“vMotion在線遷移”“HA高可用”“DRS資源動(dòng)態(tài)均衡”等技術(shù)手段保障應(yīng)用高可用,利用SRM技術(shù)實(shí)現(xiàn)站點(diǎn)級(jí)的容災(zāi)保護(hù)。
3.3? ?網(wǎng)絡(luò)架構(gòu)設(shè)計(jì)
為保障網(wǎng)絡(luò)的安全性、穩(wěn)定性和高可用性,在網(wǎng)絡(luò)設(shè)計(jì)規(guī)劃部署時(shí),建立了4套功能不同的網(wǎng)絡(luò)用于管理、業(yè)務(wù)、容災(zāi)和心跳專用數(shù)據(jù)通道,部署分布式虛擬交換機(jī),端口組啟用“基于IP哈希路由”負(fù)載均衡,確保網(wǎng)絡(luò)端口負(fù)載均衡和鏈路冗余需要。NBU備份采用Lan-Free模式,由傳統(tǒng)的LAN網(wǎng)絡(luò)備份方式轉(zhuǎn)變?yōu)镾AN網(wǎng)絡(luò)數(shù)據(jù)傳輸,備份速度大幅提高且不會(huì)對(duì)LAN網(wǎng)絡(luò)帶寬造成爭(zhēng)用。各業(yè)務(wù)網(wǎng)絡(luò)物理隔離保障了網(wǎng)絡(luò)的穩(wěn)定性,解決了網(wǎng)絡(luò)帶寬爭(zhēng)用的問(wèn)題,增強(qiáng)了虛擬化環(huán)境網(wǎng)絡(luò)的可用性和穩(wěn)定性,對(duì)業(yè)務(wù)系統(tǒng)的正常運(yùn)行提供了平穩(wěn)、安全的網(wǎng)絡(luò)基礎(chǔ)環(huán)境,提升了各業(yè)務(wù)系統(tǒng)的用戶體驗(yàn)。
3.4? ?系統(tǒng)安全技術(shù)措施
為了應(yīng)對(duì)虛擬環(huán)境安全風(fēng)險(xiǎn),除啟用虛擬化平臺(tái)系統(tǒng)自帶的安全防控措施以及系統(tǒng)層面常規(guī)措施的基礎(chǔ)上,在虛擬化環(huán)境安全防控上采取了下列措施加以保障。①訪問(wèn)控制。通過(guò)部署堡壘機(jī)對(duì)虛擬機(jī)、主機(jī)系統(tǒng)、管理系統(tǒng)等的訪問(wèn)加以控制,授權(quán)訪問(wèn)才能使用。②定制化部署。建立的十余套系統(tǒng)模板均完成了各項(xiàng)安全配置,堵塞了系統(tǒng)漏洞,提高了各業(yè)務(wù)系統(tǒng)的安全性和高可用性。③安全準(zhǔn)入。在虛擬機(jī)上線前,部署安全準(zhǔn)入客戶端,對(duì)系統(tǒng)、配置、安全基線等檢測(cè),符合要求后方可開(kāi)通網(wǎng)絡(luò)接入權(quán)限。④補(bǔ)丁防護(hù)。定期推送操作系統(tǒng)、殺毒軟件、防火墻補(bǔ)丁至客戶端,及時(shí)修復(fù)操作系統(tǒng)存在的安全漏洞。
3.5? ?基于大數(shù)據(jù)分析主動(dòng)預(yù)警
在虛擬化技術(shù)應(yīng)用的過(guò)程中,要結(jié)合油田引進(jìn)大數(shù)據(jù)分析系統(tǒng)(Splunk)對(duì)關(guān)鍵業(yè)務(wù)系統(tǒng)日志信息進(jìn)行自動(dòng)收集、整理和分析,及時(shí)發(fā)現(xiàn)存在的反?,F(xiàn)象,減少故障檢修、系統(tǒng)停機(jī)、事件調(diào)查的時(shí)間,不斷提升IT服務(wù)水平和風(fēng)險(xiǎn)管理能力。
3.6? ?統(tǒng)一運(yùn)維監(jiān)控
為了解決資源及運(yùn)維人員配置存在的浪費(fèi)現(xiàn)象,有必要通過(guò)開(kāi)發(fā)數(shù)據(jù)接口抽取vCops虛擬化監(jiān)控系統(tǒng)、Vantage監(jiān)控系統(tǒng)等運(yùn)行及報(bào)警信息,集成到中心機(jī)房統(tǒng)一監(jiān)控平臺(tái),實(shí)時(shí)在監(jiān)控中心大屏上進(jìn)行展示,并通過(guò)短信平臺(tái)將告警信息實(shí)時(shí)發(fā)送到運(yùn)維管理人員手機(jī)上。同時(shí),機(jī)房值班管理人員要進(jìn)行24小時(shí)不間斷監(jiān)控,并對(duì)問(wèn)題進(jìn)行跟蹤督辦,保證平臺(tái)安全穩(wěn)定運(yùn)行。
4? ? ?虛擬化平臺(tái)的應(yīng)用成效
服務(wù)器虛擬化在油田中的推廣應(yīng)用整合了應(yīng)用系統(tǒng)平臺(tái),優(yōu)化了油田服務(wù)器資源配給,為油田中小機(jī)房整合奠定了提供了資源和技術(shù)保障,有利于順利完成機(jī)房整合工作。在應(yīng)用過(guò)程中,通過(guò)系統(tǒng)架構(gòu)優(yōu)化、平臺(tái)系統(tǒng)融合等探索取得以下成效。
4.1? ?節(jié)約了管理和維護(hù)成本
虛擬化平臺(tái)實(shí)現(xiàn)了虛擬化平臺(tái)系統(tǒng)高可用性,為應(yīng)用系統(tǒng)營(yíng)造了良好的服務(wù)器應(yīng)用環(huán)境,消除了單點(diǎn)故障隱患,減少了宕機(jī)事件,達(dá)到了站點(diǎn)級(jí)容災(zāi)保護(hù),保障了應(yīng)用服務(wù)的連續(xù)性。虛擬化平臺(tái)通過(guò)采用DRS、VCops、VMotion、DVSwitch和HA等虛擬化技術(shù),實(shí)現(xiàn)了軟硬件資源的集中監(jiān)控、統(tǒng)一管理、自動(dòng)均衡、自動(dòng)遷移、快速恢復(fù)和動(dòng)態(tài)擴(kuò)展,減少了業(yè)務(wù)系統(tǒng)停機(jī)時(shí)間,提高了工作效率,節(jié)約了管理和維護(hù)成本。
4.2? ?提高了服務(wù)器資源的利用率
虛擬化平臺(tái)應(yīng)用P2V技術(shù)在機(jī)房整合過(guò)程中完成了應(yīng)用由物理環(huán)境向虛擬環(huán)境的遷移,延長(zhǎng)了遺留應(yīng)用的生命周期,同時(shí)大幅提升了服務(wù)器資源的利用率,硬件利用率由虛擬化整合前的不到10%提升到了60%以上。
4.3? ?保障了油田信息系統(tǒng)和數(shù)據(jù)的安全
虛擬化平臺(tái)內(nèi)置了安全基線配置、網(wǎng)絡(luò)準(zhǔn)入防控、強(qiáng)制安全客戶端部署等基礎(chǔ)安全,定制模板統(tǒng)一部署、業(yè)務(wù)專網(wǎng)物理隔離部署,結(jié)合授權(quán)訪問(wèn)操作、行為審計(jì)等措施保障了系統(tǒng)安全,在2017年“5.12”勒索病毒全面爆發(fā)時(shí),平臺(tái)運(yùn)行平穩(wěn),保障了油田信息系統(tǒng)和數(shù)據(jù)的安全。
4.4? ?帶來(lái)了顯著的經(jīng)濟(jì)效益
虛擬化技術(shù)應(yīng)用給油田帶來(lái)了顯著的經(jīng)濟(jì)效益。第一,虛擬化平臺(tái)使用30臺(tái)物理服務(wù)器承載虛擬機(jī)400余臺(tái),較傳統(tǒng)模式單臺(tái)物理服務(wù)器平均部署2個(gè)應(yīng)用核算,至少節(jié)約服務(wù)器170臺(tái),按物理服務(wù)器15萬(wàn)元/臺(tái)測(cè)算,僅服務(wù)器直接節(jié)約資金投入2 550萬(wàn)元。同時(shí),物理服務(wù)器減少,機(jī)房能耗也得到了有效控制,以每臺(tái)服務(wù)器平均650萬(wàn)元計(jì)算,年節(jié)約電費(fèi)和空調(diào)制冷費(fèi)用近120萬(wàn)元,經(jīng)濟(jì)效益顯著。
5? ? ?結(jié) 語(yǔ)
塔里木油田在實(shí)施服務(wù)器虛擬化過(guò)程中,通過(guò)選用合理可靠的技術(shù)和系統(tǒng)架構(gòu),滿足了當(dāng)前油田信息化的發(fā)展需要,減少了維護(hù)服務(wù)器的時(shí)間與成本,降低了運(yùn)維難度,提高了工作效率。在推廣服務(wù)器虛擬化技術(shù)的過(guò)程中,針對(duì)系統(tǒng)的高可用、業(yè)務(wù)的持續(xù)性、數(shù)據(jù)的安全等需求,通過(guò)優(yōu)化網(wǎng)絡(luò)架構(gòu)、構(gòu)建數(shù)據(jù)互備系統(tǒng)、融合統(tǒng)一運(yùn)維監(jiān)控平臺(tái)等舉措,對(duì)資源進(jìn)行優(yōu)化動(dòng)態(tài)配置,實(shí)現(xiàn)了資源效益最大化。