劉曉魁
摘要:當數(shù)據(jù)中心云平臺架構(gòu)面臨老化升級時,需要考慮資源利舊、兼容性、成本、效率等諸多因素,對整體架構(gòu)重新進行設(shè)計。這里以甲骨文信息處理教育部重點實驗室的數(shù)據(jù)中心為例,對已有的微軟的SystemCenter架構(gòu)問題和需求進行梳理,并與現(xiàn)有主流的VMware vSphere架構(gòu)、微軟Azure Stack架構(gòu)以及超融合架構(gòu)之間的兼容性、可拓展性、可行性等進行分析,對云平臺架構(gòu)的升級和多云架構(gòu)管理提供一些參考。
關(guān)鍵詞:數(shù)據(jù)中心;云平臺;架構(gòu);升級
中圖分類號:TP311? ? 文獻標識碼:A
文章編號:1009-3044(2021)30-0004-03
開放科學(資源服務(wù))標識碼(OSID):
Analysis of Data Center Cloud Platform Architecture Upgrade
LIU Xiao-kui
(Oracle Bone Inscriptions Information Processing Lab, Anyang Normal University, Anyang 455000, China)
Abstract: When the data center cloud platform architecture is facing aging and upgrading, we need to consider many factors such as resource utilization, compatibility, cost, efficiency and so on, and redesign the overall architecture. Taking the data center of the Key Laboratory of Oracle information processing Ministry of education as an example, this paper analyzes the existing Microsoft system center architecture and the existing mainstream VMware vSphere architecture, Microsoft azure stack architecture and hyper fusion architecture, hoping to provide some reference for the architecture design and upgrading of the old cloud platform.
Key words: Data center; cloud platform; architecture; upgrade
隨著信息化建設(shè)的不斷發(fā)展,數(shù)據(jù)中心總體架構(gòu)正朝著資源設(shè)備整合、管理維護簡化的趨勢發(fā)展。特別是日趨成熟的虛擬化技術(shù),可以更高效地挖掘硬件資源,大大降低運維和建設(shè)成本。服務(wù)器虛擬化提高了物理服務(wù)器資源的利用率;網(wǎng)絡(luò)和存儲的虛擬化,使得災難恢復更加簡化、應(yīng)用部署更加便捷、負載均衡更加靈活;操作系統(tǒng)和基礎(chǔ)硬件的分離,有效解決了諸多兼容性問題。隨著云技術(shù)的日趨成熟,私有云中的超融合架構(gòu)也應(yīng)運而生。這里以甲骨文信息處理教育部重點實驗室數(shù)據(jù)中心為例,在涉及整個云平臺架構(gòu)升級時,重新進行架構(gòu)梳理和設(shè)計。
1現(xiàn)有架構(gòu)梳理
所在甲骨文信息處理教育部重點實驗室數(shù)據(jù)中心承載著是冷門絕學性質(zhì)的甲骨文資源大數(shù)據(jù)平臺--“殷契文淵”,為全世界甲骨文與甲骨學研習者提供便利,傳承與弘揚著中華民族優(yōu)秀古典文化遺產(chǎn)。該平臺目前已經(jīng)收錄專業(yè)甲骨文著錄84種,收錄專業(yè)文獻32117篇,收錄數(shù)字甲骨圖150302片,并且,數(shù)據(jù)還在不斷增長,功能也在不斷拓展。未來線上三維甲骨也在計劃建設(shè)中。海量的圖像數(shù)據(jù)存儲、傳輸和處理對系統(tǒng)性能和網(wǎng)絡(luò)速度都有比較高的要求。目前有服務(wù)器31臺,磁盤陣列4臺,存儲容量約80T,交換機7臺。甲骨文數(shù)據(jù)中心現(xiàn)有云架構(gòu)如下:
現(xiàn)有31臺物理服務(wù)器,配置如下:
其中兩臺相對舊配置的物理機用于安裝主輔域控制器,同時用一臺虛擬機做輔域控制器,用以提升基礎(chǔ)架構(gòu)的高可用性、穩(wěn)定性。另外四臺舊配置服務(wù)器組建一個物理服務(wù)器故障轉(zhuǎn)移群集,供學生課程設(shè)計互動體驗云平臺使用。性能較為優(yōu)越的服務(wù)器,通過萬兆網(wǎng)卡直連存儲,承載了主要業(yè)務(wù)系統(tǒng),分為3個物理服務(wù)器故障轉(zhuǎn)移群集:管理服務(wù)器群集、甲骨文科研成果發(fā)布服務(wù)器群集、教師教研服務(wù)器群集。
共有四個群集如下表:
在網(wǎng)絡(luò)設(shè)計方面,由于存在物理服務(wù)器網(wǎng)絡(luò)、虛擬服務(wù)器網(wǎng)絡(luò)、存儲網(wǎng)絡(luò)、群集網(wǎng)絡(luò)等,錯綜復雜,網(wǎng)絡(luò)虛擬化中使用Windows Server 2012 R2中的NIC Teaming功能來實現(xiàn)多網(wǎng)絡(luò)融合,在提升訪問速度和網(wǎng)絡(luò)的災備能力的同時,實現(xiàn)虛擬機網(wǎng)絡(luò)之間的隔離。這種架構(gòu)從性能上看完全能滿足目前和將來一段時間的需求。甲骨文云平臺網(wǎng)絡(luò)架構(gòu)圖如下:
私有云管理平臺方面,在2014年時,微軟公有云、私有云或者混合云的Azure 和 Azure Stack架構(gòu)還沒有出現(xiàn),是采用第三方的微創(chuàng)云管理平臺,它構(gòu)建在System Center之上,雖然也可以向用戶提供虛擬機申請、擴容、退租等操作,同時可以對整個虛擬化環(huán)境進行管理、監(jiān)控、備份,在可用性、安全性、管理靈活性也有一定的體現(xiàn),在當時還是新技術(shù)應(yīng)用,但是隨著時間推移,故障率開始提升,各種問題也凸顯出來。這里主要從軟件和硬件兩個方面進行分析:
2面臨需要解決的問題
數(shù)據(jù)中心是在2014年進行整體改造升級的,當時云架構(gòu)初露頭角,隨著信息化的高速發(fā)展特別是云技術(shù)的日趨成熟,出現(xiàn)許多新的技術(shù)手法和手段,隨著時間推移,暴露出越來越多需要解決的問題,這里分為軟件和硬件兩個方面。
1)軟件方面問題:
原有部署的基于System Center2014版本的虛擬化環(huán)境集成化程度較低。諸多服務(wù)也都是基于System Center組件和SQL Server數(shù)據(jù)庫之上,這些服務(wù)部署在不同的管理服務(wù)器群集中的虛擬機上,并且服務(wù)之間相互依賴,導致穩(wěn)定性上存在一些隱患。而System Center是使用一系列的組件來實現(xiàn)各種虛擬化功能的管理得,比如基于面向Windows桌面的配置軟硬件資產(chǎn)管理的批量部署工具:System Center Configuration Manager(SCCM);用于監(jiān)控各種服務(wù)和應(yīng)用的System Center Operations Manager(SCOM)組件;用于數(shù)據(jù)中心虛擬化管理的System Center Configuration Manager(SCVMM)組件;用于計劃任務(wù)生成的System Center Orchestrator(SCO)組件;提供數(shù)據(jù)保護和數(shù)據(jù)還原的System Center Data Protection Manager (SCDPM)組件等。一般狀態(tài)下穩(wěn)定性尚可,但是遇到需要異?;謴蜁r,會遇到各種服務(wù)之間相互調(diào)度和協(xié)調(diào)的問題。甚至于服務(wù)器的開關(guān)機都需要按照順序進行,并且開機時需要對諸多虛擬機設(shè)置合理的延遲方案。如果遇到突然斷電,或者非正常關(guān)機,往往會影響到云架構(gòu)中各個服務(wù)間正常通信。另外,原有第三方的云管理對System Center的依賴很大,相應(yīng)的它的可用性也存在很大的風險。隨著服務(wù)器硬件的逐步老化,軟硬件故障率提高,問題更加突出地暴露出來。比如:故障轉(zhuǎn)移群集中物理服務(wù)器丟失或者虛擬機脫域等問題出現(xiàn)頻率增加??偟膩碚f,就是舊的云架構(gòu)集成化程度相對不高,結(jié)構(gòu)和運維復雜,第三方云管理平臺在異常情況下的自我恢復能力差等。
2)硬件方面問題:
物理服務(wù)器全部過保,需要考慮升級換代和平穩(wěn)過渡的問題。續(xù)保成本很高,而如果全部一次性更換,代價也很高,需要在硬件升級中,找到利舊和保障應(yīng)用穩(wěn)定之間的平衡。
原有萬兆冗余網(wǎng)絡(luò)架構(gòu)從性能和穩(wěn)定性上都能滿足目前和未來幾年的需求??梢詫⑿碌脑萍軜?gòu)直接使用或者融合到原有網(wǎng)絡(luò)架構(gòu)中。這種使用新云架構(gòu)實現(xiàn)舊的虛擬化層面管理目前主流的云管理平臺都是可以實現(xiàn)的,但是將舊的物理服務(wù)器直接應(yīng)用在新的云架構(gòu)中往往都涉及服務(wù)器授權(quán)的問題。
3云平臺架構(gòu)預升級方案分析
要解決上面問題,必須從底層架構(gòu)層面對數(shù)據(jù)中心云平臺進行設(shè)計。經(jīng)過多方調(diào)研和考察學習,這里給出如下三種云平臺架構(gòu)預升級方案,并分析各自的優(yōu)勢和面臨問題:
第一種:升級微軟Azure Stack架構(gòu)
微軟System Center 2016版本、2018版本和目前最新的2019版本陸續(xù)發(fā)布。并且,微軟云平臺已經(jīng)出臺Azure 和 Azure Stack架構(gòu),支持公有云、私有云或者混合云。
該平臺在私有云和公有云轉(zhuǎn)換或者拓展方面比較靈活;另外云架構(gòu)底層虛擬化原理有一定的連貫性,在運維和管理習慣上更加容易上手;私有云系統(tǒng)架構(gòu)中對Windows系統(tǒng)十分友善,系統(tǒng)激活非常便捷,可以輕松解決Windows系統(tǒng)版權(quán)問題。
但是,這種Azure架構(gòu)獨立封裝性強,在理服務(wù)器利舊方面不具備優(yōu)勢;也不能向下兼容直接將原有的基于SystemCenter架構(gòu)的2014版本管理起來;目前國內(nèi)高校用戶罕見,經(jīng)驗的積累和交流是個問題。
第二種:升級為主流的VMware云架構(gòu)
VMware架構(gòu)市場占有率很高,技術(shù)相對比較成熟,對原有的物理設(shè)備有著更好的兼容性和可拓展性,可以實現(xiàn)快速部署軟件定義的數(shù)據(jù)中心,執(zhí)行效率很高。在高校中有著廣泛的使用案例,同行之間相互學習和借鑒經(jīng)驗的機會很多。
缺點就是跟原有微軟基于System Center的虛擬機不能直接兼容,虛擬機遷移需要使用Vmware Converter工具轉(zhuǎn)換。如果保留原有微軟基于SystemCenter架構(gòu),需要同時運維管理兩套私有云架構(gòu)。另外完全不同的云架構(gòu),結(jié)構(gòu)差異比較大,比如原微軟云架構(gòu)中的域管理功能,無法直接使用VMware架構(gòu)中的某個功能模塊代替,如果強行遷移到VMware架構(gòu)下,只是兩種云架構(gòu)機械的嵌套,效益不高,意義不大。只能完全放棄原有云架構(gòu),將業(yè)務(wù)逐步完全遷移出來,然后再考慮舊物理設(shè)備的利用。這個過程應(yīng)該會花費更多的時間成本。
第三種:升級為超融合私有云架構(gòu)
超融合架構(gòu)技術(shù),可以通過對網(wǎng)絡(luò)、存儲、安全等基礎(chǔ)資源的全面池化和整合,實現(xiàn)基礎(chǔ)資源的按需分配及彈性擴展,甚至是自動化部署。可以大大簡化日常的管理和維護工作,提高效能與管理水平,實現(xiàn)安全可靠、高效節(jié)能、靈活多樣的集約化建設(shè)和虛擬化管理。彌補傳統(tǒng)架構(gòu)的投入成本高、業(yè)務(wù)上線慢、運維工作量大、擴展復雜等缺點。諸多互聯(lián)網(wǎng)廠商都在介入超融合領(lǐng)域,其中出現(xiàn)不少功能和設(shè)計上的亮點,比如“IT資源的可視化管理”“可通過瀏覽器、移動終端靈活訪問的B/S瘦客戶端云管理系統(tǒng)”等。
綜合上面三種云架構(gòu)升級方案,在云平臺架構(gòu)軟件方面,前兩種微軟Azure Stack和VMware云架構(gòu)都不能實現(xiàn)對舊的虛擬化平臺的直接管理,第三種超融合私有云架構(gòu)通常都能支持VMware、Hyper-v、KVM等市場上主流的多種虛擬化平臺,可以實現(xiàn)對原有虛擬化平臺的管理。在物理設(shè)備利舊方面,后兩種的服務(wù)器硬件可拓展性更好一些,可以將舊的云架構(gòu)中的物理服務(wù)器重新部署后利用到新的云架構(gòu)中,雖然一般都需要在新的架構(gòu)中購買物理服務(wù)器授權(quán),但是考慮到原有服務(wù)器性能尚可,利舊的價值明顯。從自身業(yè)務(wù)拓展需求出發(fā),綜合建設(shè)成本、運行效率和運維管理的角度進行考量,該數(shù)據(jù)中心的云架構(gòu)升級傾向于第三種云架構(gòu)升級方案。這種私有云超融合架構(gòu),可以直接管理原有的虛擬化平臺,提升舊設(shè)備利用率,通過分步遷移數(shù)據(jù)中心核心業(yè)務(wù)和其他業(yè)務(wù),可以實現(xiàn)數(shù)據(jù)中心整體架構(gòu)的平穩(wěn)過渡升級。
4結(jié)束語
數(shù)據(jù)中心的架構(gòu)設(shè)計舊架構(gòu)升級的時候,要立足自身原有資源,以需求和問題為導向,面對現(xiàn)有諸多云平臺新架構(gòu),考慮兼容性、可拓展性、可行性等因素,實現(xiàn)數(shù)據(jù)中心的整體架構(gòu)升級和重組。當然,還要根據(jù)具體的標準化物理環(huán)境包括UPS電源、精密空調(diào)系統(tǒng)、消防系統(tǒng);系統(tǒng)運維包括網(wǎng)絡(luò)運維與監(jiān)控、動力和溫濕度監(jiān)控、人臉或指紋識別等門禁準入系統(tǒng);以及網(wǎng)絡(luò)鏈路負載、應(yīng)用和數(shù)據(jù)庫服務(wù)器負載、數(shù)據(jù)存儲和災備、網(wǎng)絡(luò)安全等方面進行查漏補缺,讓整個云架構(gòu)更加完善起來。整體的云平臺架構(gòu)分析在數(shù)據(jù)中心的建設(shè)和升級改造中有著十分重要的決策意義,希望能夠通過這次分析對其他數(shù)據(jù)中心云整體架構(gòu)的升級有一定的參考價值。
參考文獻:
[1] 施慶.基于VMware vSphere的高校數(shù)據(jù)中心虛擬化建設(shè)研究[D].上海:復旦大學,2012.
[2] VMware [EB/OL]. http://www.vmware.com/cn/virtualization/
[3] 鐘原.基于云計算數(shù)據(jù)中心網(wǎng)絡(luò)設(shè)計[J].微型電腦應(yīng)用,2019,35(3):59-61.
[4] 沈立強.虛擬化技術(shù)推動數(shù)據(jù)中心革命[J].中國教育網(wǎng)絡(luò),2009(12):32-34.
[5] 余侃.云計算時代的數(shù)據(jù)中心建設(shè)與發(fā)展[J].信息通信,2011,24(6):100-102.
[6] 冼學輝,熊偉.基于超融合技術(shù)的高校數(shù)據(jù)中心設(shè)計與實現(xiàn)[J].中國教育信息化,2020(15):80-82.
[7] 常潘.數(shù)字化校園數(shù)據(jù)中心建設(shè)的研究[J].中山大學學報(自然科學版),2009,48(S1):232-234.
【通聯(lián)編輯:梁書】