張艷 趙野軍
摘要:隨著高校信息化程度的不斷提高,業(yè)務(wù)系統(tǒng)對IT基礎(chǔ)設(shè)施的依賴程度越來越高,業(yè)務(wù)系統(tǒng)的連續(xù)性和災(zāi)難保護的重要性也越來越突出,建設(shè)新數(shù)據(jù)中心機房的服務(wù)器融合云平臺建設(shè),是保證業(yè)務(wù)系統(tǒng)快速部署、動態(tài)分配、最大化利用硬件資源,保障服務(wù)器應(yīng)用的水平不斷提高。新數(shù)據(jù)中心機房的服務(wù)融合平臺建設(shè)將對高??蒲薪虒W(xué)、綜合服務(wù)、業(yè)務(wù)管理、信息共享等多項職能方面起到很大支撐作用。
關(guān)鍵詞:云平臺;數(shù)據(jù)中心;服務(wù)融合;虛擬存儲;信息管理
中圖分類號:TP393 文獻標識碼:A 文章編號:1009-3044(2018)21-0021-04
Abstract:With the constant improvement of the degree of university informatization, business system of the reliance of the IT infrastructure is higher and higher, the continuity of the business system and the importance of disaster protection is becoming more and more outstanding, the construction of new data center computer room server fusion cloud platform construction, is to ensure that the business system rapid deployment, dynamic allocation, to maximize the utilization of hardware resources, improving continuously the security server applications. The construction of the service integration platform of the new data center computer room will greatly support the functions of scientific research and teaching, comprehensive service, business management and information sharing.
Key words:Cloud platform; Data center; Service integration; Virtual storage; Information management
1 引言
隨著云計算和虛擬化技術(shù)向構(gòu)建新一代數(shù)據(jù)中心方向發(fā)展,關(guān)鍵以云計算為基礎(chǔ),實現(xiàn)管理以及業(yè)務(wù)的集中,對數(shù)據(jù)中心資源進行動態(tài)調(diào)整和分配,重點滿足企業(yè)關(guān)鍵應(yīng)用向X86系統(tǒng)遷移對于資源高性能、高可靠、安全性和高可適應(yīng)性上的要求,同時提高基礎(chǔ)架構(gòu)的自動化管理水平,確保滿足基礎(chǔ)設(shè)施快速適應(yīng)業(yè)務(wù)的商業(yè)敏捷訴求,同時進一步減少企業(yè)的IT整體投入。
隨著信息技術(shù)的普及和全球信息化趨勢的加強,作為信息系統(tǒng)的物理載體和核心資源,數(shù)據(jù)中心的作用愈發(fā)重要。通過校園云數(shù)據(jù)中心可以對校園信息化建設(shè)的硬件資源進行統(tǒng)一靈活管理,提供統(tǒng)一的系統(tǒng)平臺建設(shè)、管理和運維,統(tǒng)一部署安全防護設(shè)施、備份策略等等.云數(shù)據(jù)中心的虛擬化環(huán)境還提供了資源動態(tài)調(diào)度、高可用性保證及故障檢測等能力,有效地保證了信息化系統(tǒng)的穩(wěn)定性、可擴展性和高可用性.在設(shè)計、使用合理的條件下,任何單機的硬件級、OS級故障基本都不會對應(yīng)用業(yè)務(wù)系統(tǒng)造成致命性破壞。而數(shù)據(jù)中心機房作為數(shù)據(jù)中心運行的平臺,提供著數(shù)據(jù)中心運行所需要的場所和環(huán)境保障。本文以北京服裝學(xué)院為例來淺談高校數(shù)據(jù)中心機房服務(wù)平臺的建設(shè)。
2 現(xiàn)狀
2.1業(yè)務(wù)應(yīng)用方面
信息建設(shè)堅持高起點規(guī)劃、高標準建設(shè)、高效能管理的原則。隨著其業(yè)務(wù)和信息化建設(shè)的快速發(fā)展。目前現(xiàn)有的虛擬化平臺的計算資源能力已經(jīng)很有限,學(xué)院的業(yè)務(wù)應(yīng)用系統(tǒng)新上的較多,各個業(yè)務(wù)系統(tǒng)也面臨著需要更好的計算性能的提升,目前云平臺服務(wù)器的已使用的虛擬機數(shù)量已達70%以上(已超過了虛擬機所允許的正常限額60%),無法滿足學(xué)校對服務(wù)器的數(shù)量需求。
2.2原系統(tǒng)情況
目前的云平臺為Vmware虛機系統(tǒng),共由11臺華為2288、2285H和HP,屬于較低檔次的低配置服務(wù)器。軟件VMWAWRE 5.5.0,軟硬件均使用多年,已到更新?lián)Q代期限。
網(wǎng)絡(luò)及安全根據(jù)放置在數(shù)據(jù)唯一出入的萬兆光纖的WAFI和防火墻做網(wǎng)絡(luò)流量縱向監(jiān)控,采用VLAN隔離不同應(yīng)用的安全級別經(jīng)防火墻進行服務(wù)器間橫向訪問控制。
學(xué)院云平臺承載學(xué)院各個業(yè)務(wù)應(yīng)用系統(tǒng)的長期的運行和學(xué)校的各種新的系統(tǒng)應(yīng)用的日益增加,現(xiàn)有的云平臺系統(tǒng)硬件已超負荷運行,作為支撐全校各個應(yīng)用系統(tǒng)的核心軟硬件設(shè)施,現(xiàn)有云平臺已無法滿足學(xué)院的未來新上業(yè)務(wù)系統(tǒng)和已有業(yè)務(wù)系統(tǒng)的升級擴容的需求,亟需對自動化系統(tǒng)軟硬件設(shè)備進行更新建設(shè)。
隨著學(xué)校對數(shù)據(jù)中心機房的需求日益增大,云平臺系統(tǒng)的承載能力必將面臨新的挑戰(zhàn)。數(shù)據(jù)中心要求更穩(wěn)健安全可靠的系統(tǒng)云平臺、更高處理能力的硬件條件,以滿足數(shù)據(jù)中心的日常業(yè)務(wù)應(yīng)用需求。
3 項目必要性
學(xué)院在2008年開始利用Vmware虛機系統(tǒng)搭建云平臺,最初的服務(wù)器數(shù)量僅為6臺;2015年增加了8臺服務(wù)器以滿足學(xué)院高速業(yè)務(wù)發(fā)展的需求,在保證穩(wěn)定性和可用性的性的要求下目前的云平臺資源及性能已經(jīng)發(fā)揮到能夠提供資源的極致。為此,通過分析學(xué)院業(yè)務(wù)增長趨勢,2018年計劃采購10臺服務(wù)器用以滿足日益增長的虛擬機資源需求保障學(xué)院數(shù)據(jù)中心運作暢通。
學(xué)院的虛擬化系統(tǒng)承載學(xué)院的各個業(yè)務(wù)應(yīng)用,隨著學(xué)院的業(yè)務(wù)系統(tǒng)的不斷完善,信息化建設(shè)不斷推進,新增的業(yè)務(wù)系統(tǒng)將越來越多,智慧課堂、網(wǎng)絡(luò)教學(xué)、綜合校情分析等智慧校園體系將逐步在校內(nèi)搭建,應(yīng)用管理平臺、服務(wù)門戶平臺與教學(xué)平臺也將隨著學(xué)院發(fā)展不斷完善,同時隨時數(shù)據(jù)量的不斷增加老舊的業(yè)務(wù)系統(tǒng)也需要增強計算能力來滿足日益增長的數(shù)據(jù)量,因此對目前云平臺的計算能力造成了極大的壓力,現(xiàn)網(wǎng)的云平臺的承載能力已經(jīng)無法滿足學(xué)院業(yè)務(wù)系統(tǒng)的新增及老舊業(yè)務(wù)的擴容。
目前使用的數(shù)據(jù)中心云平臺管理系統(tǒng)VMWAWRE 5.5.0,隨著數(shù)據(jù)中心業(yè)務(wù)量的增加,運行效率低下,該系統(tǒng)已無法滿足現(xiàn)有需求,嚴重影響到了數(shù)據(jù)中心的業(yè)務(wù)運轉(zhuǎn)。
作為硬件系統(tǒng)物理節(jié)點的2288服務(wù)器自投入使用以來,已經(jīng)不間斷運行了很多年,其配置了2個E5-2620處理器、128G內(nèi)存、4塊300G硬盤,硬件性能已經(jīng)跟不上學(xué)校數(shù)據(jù)中心業(yè)務(wù)的發(fā)展。且隨著應(yīng)用的增多、補丁的升級、程序緩沖的堆積、以及服務(wù)器365天不間斷的運行,服務(wù)器硬件損耗老化加快,處理性能不斷降低,現(xiàn)有的老舊服務(wù)器在訪問高峰期會出現(xiàn)業(yè)務(wù)系統(tǒng)訪問速度急劇下降、訪問不穩(wěn)定、死機掉線等現(xiàn)象,需要更換性能更強大的服務(wù)器。
隨著云計算和虛擬化技術(shù)向構(gòu)建新一代數(shù)據(jù)中心方向發(fā)展,關(guān)鍵以云計算為基礎(chǔ),實現(xiàn)管理以及業(yè)務(wù)的集中,對數(shù)據(jù)中心資源進行動態(tài)調(diào)整和分配,重點滿足關(guān)鍵應(yīng)用向X86系統(tǒng)遷移對于資源高性能、高可靠、安全性和高可適應(yīng)性上的要求,同時提高基礎(chǔ)架構(gòu)的自動化管理水平,確保滿足基礎(chǔ)設(shè)施快速適應(yīng)業(yè)務(wù)的商業(yè)敏捷訴求,同時進一步減少企業(yè)的IT整體投入。
總之,根據(jù)每年對服務(wù)器的發(fā)展和需求趨勢,預(yù)計每年至少平均需求量約5臺。其中包括每年有因過期無法使用需要報廢淘汰更新2~3臺每年還會有信息系統(tǒng)應(yīng)用的新的系統(tǒng)或升級需要2~3臺新的服務(wù)器。其二,由于缺乏對投資新機房的建設(shè),僅完成了機房的基礎(chǔ)環(huán)境。目前機房內(nèi)只有利舊的服務(wù)器,最早的都是10年前服務(wù)器使用年限,存在著故障率高、更換備件難找且費用高;第三、許多新上的業(yè)務(wù)系統(tǒng)需要利用云平臺來更好地分配和使用計算機資源,以獲得節(jié)能高效。
4 需求分析
4.1業(yè)務(wù)需求
北京服裝學(xué)院現(xiàn)有數(shù)據(jù)中心機房,管理著各種全局性應(yīng)用。由于近幾年信息化要求不斷提高以及信息化建設(shè)投入不斷增加,北京服裝學(xué)院對各種信息化系統(tǒng)的依賴不斷加強,各項工作的緊迫性和連續(xù)性較高,因此任何情況下,北京服裝學(xué)院數(shù)據(jù)中心的運行都必須保持暢通、不間斷。
服務(wù)器硬件故障造成的業(yè)務(wù)系統(tǒng)停運時間過長。維修或購買設(shè)備都需要時間,在短時間很難恢復(fù)業(yè)務(wù)系統(tǒng)的正常運行。對于一些實時的數(shù)據(jù)庫業(yè)務(wù),特別是涉及全校的對外服務(wù)的業(yè)務(wù)會造成比較大的影響。所以,數(shù)據(jù)中心更需要一個安全,可靠的云平臺環(huán)境
4.2功能需求
傳統(tǒng)的信息化管理方式使服務(wù)器資源沒有得到充分利用,性價比較低。一方面是一臺或幾臺物理服務(wù)器只運行一個業(yè)務(wù)系統(tǒng),而大部分業(yè)務(wù)系統(tǒng)的訪問量比較少,勢必造成服務(wù)器資源閑置或浪費。另一方面新的信息化建設(shè)需求,又需要購買新的服務(wù)器,造成資源的浪費和系統(tǒng)部署周期的增長。機房內(nèi)大部分服務(wù)器已出質(zhì)保期,部分服務(wù)器服役超過五年,需進行更換。
如上圖,仍有多臺2008年的舊服務(wù)器在用,需要更新。
4.3數(shù)據(jù)需求
由上圖中看到,有些物理機的虛機使用率最高的已經(jīng)100%(24/24), 注即(虛機CPU/物理機實際CPU核數(shù))之比。急需新增云平臺的虛擬容量。為了保證提升故障恢復(fù)速度,降低業(yè)務(wù)中斷時間、保障業(yè)務(wù)的連續(xù)性,需要預(yù)留HA資源,當前系統(tǒng)總體容量已經(jīng)超過了虛機的適宜使用比例60%。
4.4性能需求
1)數(shù)據(jù)中心機房的融合平臺服務(wù)器
4路4U機架式服務(wù)器,配置Intel Xeon E7-4820處理器;
內(nèi)存擴展能力:≥48個插槽,支持1.5倍高大尺寸內(nèi)存;
內(nèi)置硬盤類型:≥8塊熱插拔2.5英寸SAS/SATA/SSD硬盤;
配置獨立硬件Raid卡,支持RAID0,1,1E,10等。
2)數(shù)據(jù)中心機房的融合平臺虛擬化軟件
實現(xiàn)對虛擬化環(huán)境和物理環(huán)境的集中管理;
實現(xiàn)對操作系統(tǒng)、中間件、數(shù)據(jù)庫、計算、存儲及網(wǎng)絡(luò)設(shè)備的綜合監(jiān)控管理;
實現(xiàn)對虛擬化環(huán)境的資源部署管理;
需要實現(xiàn)如下流程和功能:服務(wù)臺、事件管理(服務(wù)請求管理)、問題管理、配置管理、變更管理(發(fā)布管理)、服務(wù)級別管理;
需要建立報表系統(tǒng),實現(xiàn)對服務(wù)管理平臺中各種信息的分析和呈現(xiàn);
在融合平臺基礎(chǔ)上建設(shè)智慧課堂、網(wǎng)絡(luò)教學(xué)、綜合校情分析構(gòu)建智慧校園體系。
5 建設(shè)目標
5.1業(yè)務(wù)目標
通過此次數(shù)據(jù)中心機房的服務(wù)融合平臺的建設(shè)及硬件設(shè)備采購,滿足數(shù)據(jù)中心建設(shè)的迫切需求,在一定程度上數(shù)據(jù)中心的業(yè)務(wù)能力水平,提高數(shù)據(jù)中心運維管理效率,爭取實現(xiàn)數(shù)據(jù)中心融合一體化管理。
5.2技術(shù)目標
高效:性能業(yè)界領(lǐng)先,大容量大集群資源池,自動化管理,彈性伸縮等;
安全:端到端安全加固,多種災(zāi)備方案,虛擬化防病毒,TPM可信計算等;
融合:云和非云資源統(tǒng)一管理,多數(shù)據(jù)中心管理,支持私有云、公有云和混合云的一站式解決方案等;
開放:Openstack開放架構(gòu),廣泛的軟硬件兼容性認證和產(chǎn)業(yè)鏈合作,提供標準開放API和eSDK擴展。
6 建設(shè)方案
6.1建設(shè)原則
1) 穩(wěn)定性和可靠性原則
系統(tǒng)設(shè)備硬件均采用高可靠性的工控級產(chǎn)品,在運行環(huán)境溫濕度范圍、抗電磁干擾、噪聲震動、空氣含塵量等方面具有高于被監(jiān)控網(wǎng)絡(luò)的良好適應(yīng)性。
2)安全性原則
安全體系是一個復(fù)雜的系統(tǒng)工程,涉及人、技術(shù)、操作等要素,單靠技術(shù)或單靠管理都不可能實現(xiàn)。因此,必須將各種安全技術(shù)與運行管理機制、人員思想教育與技術(shù)培訓(xùn)、安全規(guī)章制度建設(shè)相結(jié)合。
3)實用性和先進性原則
結(jié)合數(shù)據(jù)中心新實際環(huán)境,最大限度利用現(xiàn)有設(shè)備,保證實用性和適用性的同時,采用主流新的技術(shù),并有一定的創(chuàng)新性和先進性。
6.2設(shè)計依據(jù)
安全監(jiān)控項目遵循或參照:
國家標準:
國家標準《計算站場地技術(shù)要求》(GB2887-89)
國家標準《計算站場地安全技術(shù)》(GB9361-88)
國家標準《低壓配電設(shè)計規(guī)范》(GB50054-95)
國家標準《供配電系統(tǒng)設(shè)計規(guī)范》(GB50052-95)
國家標準《電氣裝置安裝工程接地裝置施工及驗收規(guī)范》(GB50169-92)
國家標準《電氣裝置安裝工程電氣設(shè)備交接試驗標準》GB 50150-91
國家標準《現(xiàn)場設(shè)備、工業(yè)管道焊接工程施工及驗收規(guī)范》GB 50236-98
6.3總體建設(shè)任務(wù)與分期建設(shè)內(nèi)容
1)數(shù)據(jù)中心云平臺自動化系統(tǒng)建設(shè)
提升數(shù)據(jù)處理性能,提高系統(tǒng)資源的利用率,實現(xiàn)跨平臺恢復(fù)數(shù)據(jù)庫,方便日常維護管理。
2)自動化系統(tǒng)服務(wù)器
對數(shù)據(jù)庫系統(tǒng)目前在運行的服務(wù)器硬件進行更換。新的服務(wù)器配置兼顧數(shù)據(jù)中心現(xiàn)有和未來升級需求,對數(shù)據(jù)庫版本和操作系統(tǒng)版本具有良好的兼容性。
3)自動化運維監(jiān)控系統(tǒng)
有效監(jiān)控物理服務(wù)器,虛擬服務(wù)器的健康狀態(tài)及負載信息,自動化報警。
以上所有項目本期完成。
7 總體框架
7.1硬件框架
7.2系統(tǒng)平臺框架
8 設(shè)備選型原則及關(guān)鍵技術(shù)指標
8.1 數(shù)據(jù)中心云平臺自動化系統(tǒng)硬件
穩(wěn)定可靠:支持53項RAS特性,包括內(nèi)存鏡像、內(nèi)存?zhèn)溆?、鏈路自動恢?fù)等特性,支持故障預(yù)告警等功能;
性能卓越:E7 v4系列處理器最高支持24個計算核心,整體性能大幅提升;
擴展靈活:最高支持23個2.5英寸本地硬盤,適用于大數(shù)據(jù)分析等應(yīng)用場景;
綠色節(jié)能:支持DEMT動態(tài)節(jié)能、功率封頂、高壓直流供電等節(jié)能技術(shù)。
8.2數(shù)據(jù)中心云平臺自動化系統(tǒng)平臺
具有合理的內(nèi)存調(diào)度機制,能夠?qū)崿F(xiàn)內(nèi)存的過量使用(如共享頁面技術(shù)等),保障內(nèi)存資源的充分利用。
可以在不停機的狀態(tài)下,手工或自動地實現(xiàn)虛擬機在集群之內(nèi)的不同物理機之間遷移(遷移并發(fā)量6臺及以上),保障業(yè)務(wù)連續(xù)性。
由一個存儲池遷移至另一個存儲池,在不同存儲底層遷移。在線手工或自動地實現(xiàn)虛擬機存儲磁盤在集群之內(nèi)不同存儲資源上的遷移,保障業(yè)務(wù)連續(xù)性以及可靠性。
實現(xiàn)虛擬機的網(wǎng)絡(luò)調(diào)度,支持標準式以及分布式交換,同一物理機上虛擬機之間的網(wǎng)絡(luò)隔離(支持VLAN)。
實現(xiàn)虛擬機存儲的超分,虛擬機僅占用已使用的磁盤空間,而虛擬機看到的為完整邏輯空間。
支持虛擬機快照功能,能對虛擬機進行快速備份,在操作系統(tǒng)維護、應(yīng)用以及數(shù)據(jù)庫升級變更操作前,執(zhí)行快照,提高系統(tǒng)可靠性。
統(tǒng)一管理集群、主機和虛擬機,并能監(jiān)控主機、虛擬機的狀態(tài)、性能等。
9 總結(jié)
本次數(shù)據(jù)中心機房的融合平臺服務(wù)器選用 4 路服務(wù)器采用 Xeon E7處理器,配置 512G 內(nèi)存 6*300G SAS 硬盤以滿足日益增加的業(yè)務(wù)需求。數(shù)據(jù)中心機房的融合平臺虛擬化軟件實現(xiàn)對虛擬化環(huán)境和物理環(huán)境的集中管理,對操作系統(tǒng)、中間件、數(shù)據(jù)庫、計算、存儲及網(wǎng)絡(luò)設(shè)備的綜合監(jiān)控管理,實現(xiàn)對服務(wù)管理平臺中各種信息的分析和呈現(xiàn)。利用虛擬化技術(shù)可將多種應(yīng)用進行整合,"按需規(guī)劃"數(shù)據(jù)中心的虛擬化環(huán)境,不僅可以提高服務(wù)器的使用效率,降低運行成本,而且可以簡化服務(wù)器管理模式,提高數(shù)據(jù)中心的管理與服務(wù)保障水平。
參考文獻:
[1] 周俐軍,林澤東.基于VMware的高校數(shù)據(jù)中心虛擬化管理探究[J].中國管理信息化,2009,12 (16) :65-66.
[2] 李先毅,高山,劉柱,等.高校信息化運維體系中的校園網(wǎng)云數(shù)據(jù)中心建設(shè)[J].華東師范大學(xué)學(xué)報:自然科學(xué)版,2015(s1):262-265.
【通聯(lián)編輯:王力】