黃家凱, 趙逸君, 樊旭東, 吳恩政
(湖北省地質(zhì)調(diào)查院,湖北 武漢 430034)
從部署和應(yīng)用模式來看,地質(zhì)大數(shù)據(jù)云計算基礎(chǔ)設(shè)施可采用公有云、私有云和混合云這3種主要的建設(shè)模式。不同的模式對一次性投入成本、運行維護(hù)成本產(chǎn)生根本性的影響。設(shè)計地質(zhì)大數(shù)據(jù)云計算基礎(chǔ)設(shè)施方案,首先必須根據(jù)數(shù)據(jù)安全性需求、可擴(kuò)展性、便捷性及投入規(guī)模合理選擇建設(shè)模式。
公有云主要由第三方云計算服務(wù)商(如阿里云、騰訊云、華為云、AWS、azure等)提供,湖北省“楚天云”可視為政務(wù)數(shù)字化領(lǐng)域內(nèi)的公有云。公有云按照云主機(jī)的性能、存儲容量、網(wǎng)絡(luò)接入能力、安全資源需求按需使用并付費,多數(shù)公有云服務(wù)商還能提供網(wǎng)站備案、安全防護(hù)等增值服務(wù)。成熟的公有云企業(yè)基本屬于IT領(lǐng)域的頭部企業(yè),在其強(qiáng)大技術(shù)實力的支持下,公有云具有安全、便捷、共享、可擴(kuò)展等諸多優(yōu)點。與此同時,公有云用戶也要考慮數(shù)據(jù)產(chǎn)權(quán)、數(shù)據(jù)敏感性,以及極端情況下的數(shù)據(jù)安全性和一致性問題,一旦發(fā)生災(zāi)難性故障,數(shù)據(jù)丟失后極難恢復(fù)。
私有云是由用戶基于開源虛擬化及云管理技術(shù)(如KVM、Xen、Openstack等)或采購商業(yè)云計算軟件(如VMware、Nutanix、深信服云平臺等),通過整合服務(wù)器、存儲和網(wǎng)絡(luò)資源后搭建的一種云計算基礎(chǔ)設(shè)施。私有云作為一種完全自主可控的云計算基礎(chǔ)設(shè)施,兼具安全性、可擴(kuò)展性、維護(hù)便捷性等特點,其缺點是建設(shè)期一次性投入成本較大,運行維護(hù)需要投入較大的人力成本,但當(dāng)企業(yè)內(nèi)部有較多上云應(yīng)用時可有效降低單位成本。
混合云融合了公有云和私有云,是近年來云計算的主要模式和發(fā)展方向。私有云主要是面向企業(yè)用戶,出于安全考慮,企業(yè)更愿意將數(shù)據(jù)存放在私有云中,但同時又希望可以獲得公有云的計算資源,在這種情況下混合云被越來越多地采用,它將公有云和私有云進(jìn)行混合和匹配,以獲得最佳的效果[3]。雖然混合云具有很多優(yōu)點,但因為其云計算的落地位置及架構(gòu)各異,通常也會帶來數(shù)據(jù)安全、法律法規(guī)和信息安全管理等風(fēng)險。
在分析公有云、私有云及混合云技術(shù)特點的基礎(chǔ)上,對地質(zhì)大數(shù)據(jù)云計算基礎(chǔ)設(shè)施建設(shè)的數(shù)據(jù)所有權(quán)可控性、可擴(kuò)展性、安全性、便捷性、經(jīng)濟(jì)性作綜合分析,如表1所示。
表1 地質(zhì)大數(shù)據(jù)云計算基礎(chǔ)設(shè)施建設(shè)模式綜合分析表Table 1 Comprehensive analysis table of geological big data cloud computing infrastructure construction mode selection
2)私有云承載的應(yīng)用越多,其經(jīng)濟(jì)性越好,若上云應(yīng)用較少,經(jīng)濟(jì)性可能不及公有云。
地質(zhì)大數(shù)據(jù)平臺屬于數(shù)據(jù)密集型信息系統(tǒng),其主要數(shù)據(jù)(如地質(zhì)圖件、地質(zhì)資料等)具有較高的潛在價值,同時部分?jǐn)?shù)據(jù)具有一定的敏感性,因此數(shù)據(jù)所有權(quán)可控性需要優(yōu)先考慮。此外,地質(zhì)大數(shù)據(jù)平臺上云后需長期運行維護(hù),其費用支出也是重要的考量因素。公有云按量計費,上云應(yīng)用越多,支出總額越高;私有云則是一次性投入,后期使用中上云應(yīng)用越多,每個應(yīng)用攤薄后的單價越低。
在后續(xù)可維護(hù)性上,電機(jī)廠運行維護(hù)人員對于機(jī)組的電動機(jī)和發(fā)電機(jī)均非常了解。我廠現(xiàn)有機(jī)組電源的電動機(jī)/發(fā)電機(jī)均為本廠產(chǎn)品,備件獲得很容易,檢修人員對裝備也熟悉,相對維護(hù)比較方便。而靜態(tài)變頻電源采用的核心部件為變頻器,對于電機(jī)制造工廠技術(shù)人員來說相對比較陌生,維護(hù)技術(shù)難度較大。實際運行狀況證明一套有著良好的維修保養(yǎng)的機(jī)組電源,使用壽命高達(dá)40~50年,而變頻電源即使有著良好的運行維護(hù),其壽命一般不超過20年。
綜上所述,當(dāng)前地質(zhì)大數(shù)據(jù)平臺云計算基礎(chǔ)設(shè)施應(yīng)優(yōu)先考慮私有云的模式?;旌显谱鳛橐环N公有云與私有云的中間模式,在今后平臺應(yīng)用范圍擴(kuò)展得非常廣、用戶數(shù)量及應(yīng)用并發(fā)量非常高的情形下,可作為并發(fā)密集型應(yīng)用的部署首選。
開展地質(zhì)大數(shù)據(jù)平臺私有云基礎(chǔ)設(shè)施建設(shè),應(yīng)重點關(guān)注4項技術(shù)指標(biāo)[4-5]。
(1) 可擴(kuò)展性。集成電路的發(fā)展遵循“摩爾定律”:集成電路芯片上所集成電路的數(shù)目,每隔18個月就翻一番,而價格下降一半。為了有效降低一次性投入成本,避免投入的資源閑置浪費,私有云基礎(chǔ)設(shè)施必須具有良好的擴(kuò)展性,從而支持當(dāng)期建成符合核心集群,后期可根據(jù)需要橫向擴(kuò)展。
(2) 通用性。私有云應(yīng)該滿足軟件和硬件解耦的原則,硬件需要支持基于復(fù)雜指令集的通用×86服務(wù)器,也需要能支持ARM架構(gòu)的服務(wù)器。
(3) 安全性。私有云基礎(chǔ)設(shè)施應(yīng)具有冗余容錯機(jī)制,包括網(wǎng)絡(luò)、數(shù)據(jù)和應(yīng)用的高可用性(HA)保障,以及支持云內(nèi)的網(wǎng)絡(luò)信息安全防護(hù)。
(4) 便捷性。私有云面向大批信息化建設(shè)的用戶,需要有良好的后臺管理維護(hù)功能和前端租戶功能。
早期的私有云采取分離式架構(gòu),即計算、存儲能力通過不同的設(shè)備或服務(wù)器集群來提供。按照技術(shù)架構(gòu)的不同,它又分為開源和閉源兩類。
(1) 開源分離式架構(gòu)私有云。OpenStack是當(dāng)下最為流行的開源云計算管理平臺,具備較強(qiáng)的定制化能力,因此通過OpenStack對接KVM、VMware vSphere、XenServer等計算虛擬化平臺以及Ceph等開源分布式存儲平臺,在過去一段時間曾是個性化需求較多的大中型企業(yè)客戶構(gòu)建私有云的一種流行方式[6]。由于OpenStack的復(fù)雜性問題,近些年在產(chǎn)品化、標(biāo)準(zhǔn)化、商用化等方面開始面臨大量痛點,因此開源云廠商基于OpenStack進(jìn)行閉源深度自主研發(fā),從而提高產(chǎn)品的標(biāo)準(zhǔn)化程度,實現(xiàn)產(chǎn)品無縫升級已經(jīng)成為大勢所趨。
(2) 閉源分離式架構(gòu)私有云。VMware等成熟廠商在商用虛擬化技術(shù)方面一直占據(jù)主導(dǎo)地位,其閉源分離式架構(gòu)私有云主體由VMware vSphere對接SAN商用存儲設(shè)備構(gòu)建而成,而云管的部分可以選擇VMware vRealize Automation或獨立的云管理軟件(CMP),前者僅支持VMware自身產(chǎn)品,后者更加開放。閉源私有云的優(yōu)勢在于其長期實踐經(jīng)驗和產(chǎn)品迭代帶來的高度穩(wěn)定性,但由于其核心技術(shù)往往由國外虛擬化廠商、商用存儲設(shè)備廠商所控制,會使得企業(yè)面臨自主可控性差、廠商綁定等因素的困擾。此外,商用存儲擴(kuò)展性不足也成為困擾企業(yè)的一大痛點。
總體來看,無論是開源技術(shù)還是閉源技術(shù),計算、存儲分離部署模式由于采用了單獨的存儲集群,在面向具備龐大數(shù)據(jù)中心資源的超大規(guī)??蛻魰r存在三點優(yōu)勢:①能夠?qū)崿F(xiàn)存儲性能的大規(guī)模獨立擴(kuò)展,保證以往計算和存儲分離的IT管理模式的可延續(xù)性;②充分兼容異構(gòu)化的計算資源,支持裸機(jī)等非虛擬化的計算平臺;③提供完全獨立的存儲空間,不至于因為計算工作負(fù)載的提升而使得存儲性能出現(xiàn)瓶頸。但是,分離式私有云架構(gòu)同樣存在兩點劣勢:①需要采用單獨的存儲集群,對數(shù)據(jù)中心規(guī)模一般的中等規(guī)模企業(yè)來說性價比偏低,如果采用商用存儲設(shè)備,成本就更加高昂;②計算、存儲、網(wǎng)絡(luò)拓?fù)漭^為復(fù)雜,對部分缺乏運維能力的企業(yè)和分支機(jī)構(gòu)造成大量運維管理難題。
超融合基礎(chǔ)架構(gòu)(Hyper-Converged Infrastructure,簡稱HCI)是一種以軟件為中心的體系結(jié)構(gòu),它通過虛擬化技術(shù),將計算、網(wǎng)絡(luò)、存儲和應(yīng)用高度融合到一套標(biāo)準(zhǔn)設(shè)備單元中,實現(xiàn)模塊化的無縫橫向/縱向擴(kuò)展(Scale-out/Scale-up),形成統(tǒng)一的云化資源池,并通過統(tǒng)一管理平臺實現(xiàn)可視化集中運維管理[7]。相比于分離式架構(gòu)的私有云,超融合架構(gòu)的私有云真正實現(xiàn)了完全的軟件定義、虛擬化和分布式,目前如深信服私有云已支持×86架構(gòu)與ARM架構(gòu)的“雙棧云”。當(dāng)用戶追求私有云的易于管理、高性價比等特性時,計算、存儲融合部署的超融合架構(gòu)成為最合適選擇,目前這種方案已經(jīng)開始在中型乃至大型企業(yè)中出現(xiàn)。
與分離式架構(gòu)私有云類似,超融合架構(gòu)私有云同樣存在開源、商用兩類生態(tài)。
(1) 開源超融合架構(gòu)私有云?;贠penStack、KVM、Ceph等開源產(chǎn)品整合的超融合方案,優(yōu)勢是可以快速從社區(qū)獲得最新的功能,但同時存在著諸多問題,比如OpenStack架構(gòu)復(fù)雜,大量模塊在超融合中并不需要,商用程度差,且計算資源要求高;基于開源的Ceph模塊代碼復(fù)雜,服務(wù)商對產(chǎn)品核心問題無法有效支持,且計算資源消耗較高,I/O密集型場景性能也表現(xiàn)欠佳;一般無法有效支持VMware等商用虛擬化平臺。
(2) 閉源超融合架構(gòu)私有云。該種模式最典型的廠商案例是VMware的vSphere+vSAN+vCenter超融合架構(gòu)配合vRealize Automation,以及國內(nèi)超融合廠商深信服、SmartX等云計算企業(yè)的超融合架構(gòu)產(chǎn)品。這些超融合架構(gòu)可對接典型的商用多云管理平臺,實現(xiàn)計算存儲的資源池化、分布式化、軟件定義化和自服務(wù)化。超融合架構(gòu)除了包括自有的虛擬機(jī)服務(wù)和分布式塊存儲,還可兼容其他廠商的虛擬機(jī)服務(wù)。
相比于分離式架構(gòu)私有云,超融合架構(gòu)私有云有兩點明顯的優(yōu)勢:①易于管理,超融合技術(shù)可幫助私有云非常簡單地完成基礎(chǔ)架構(gòu)的虛擬化,包括計算、存儲、網(wǎng)絡(luò)的虛擬化,無須為不同的設(shè)備考慮虛擬化的方案,降低了方案的復(fù)雜性;支持集成VMware vSphere和KVM等主流虛擬化軟件,用戶端幾乎沒有學(xué)習(xí)成本;②高性價比,超融合技術(shù)實現(xiàn)了完全的軟件定義架構(gòu),支持普通商用服務(wù)器硬件以及使用以太網(wǎng)進(jìn)行傳輸,避免使用價格高昂的專用硬件,有效降低了私有云中的硬件采購成本;超融合技術(shù)的特性是每個服務(wù)器節(jié)點都能同時提供計算與存儲能力,架構(gòu)精簡,資源占用更低。
通過對兩種主要私有云的架構(gòu)分析可知,基于超融合的私有云架構(gòu)較好地滿足了可擴(kuò)展性、通用性的要求。同時,在超融合廠家長期研發(fā)積累和專業(yè)的技術(shù)支持下,閉源超融合私有云的解決方案能滿足安全性和便捷性的要求,是構(gòu)建局地質(zhì)大數(shù)據(jù)平臺穩(wěn)定數(shù)字底座的首選。
按照集約型建設(shè)的原則,湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)平臺云基礎(chǔ)設(shè)施面向全局提供服務(wù),需承載大數(shù)據(jù)平臺及局屬單位各類應(yīng)用系統(tǒng)近100臺云主機(jī),因此采用私有云的經(jīng)濟(jì)性已超過其他的類型。2018—2020年,湖北省地質(zhì)調(diào)查院依托地質(zhì)大數(shù)據(jù)平臺建設(shè)項目,對業(yè)務(wù)資源的使用情況進(jìn)行了采集與分析,結(jié)合業(yè)務(wù)增長趨勢和冗余要求,確定了CPU、內(nèi)存、磁盤、網(wǎng)絡(luò)等組件的要求[5]。在充分利用已有機(jī)房環(huán)境、網(wǎng)絡(luò)接入設(shè)施及安全防護(hù)設(shè)施的基礎(chǔ)上,采購了相關(guān)計算節(jié)點、網(wǎng)絡(luò)交換機(jī)和超融合軟件,建成了湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)私有云。
硬件主要包括:華為×86服務(wù)器云計算節(jié)點(含存儲盤)、華為數(shù)據(jù)中心交換機(jī)。支撐私有云所需的機(jī)房環(huán)境、網(wǎng)絡(luò)接入帶寬、IP資源、網(wǎng)絡(luò)設(shè)施、安全防護(hù)設(shè)備,統(tǒng)籌利用湖北省地調(diào)院現(xiàn)有設(shè)備資源。
已搭建完成的湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)私有云的軟硬件設(shè)備情況見表2。該地質(zhì)大數(shù)據(jù)私有云部署的超融合軟件包括:云管理平臺(26CPU)、超融合服務(wù)器虛擬化授權(quán)(26CPU)、超融合網(wǎng)絡(luò)虛擬化授權(quán)(26CPU)、超融合存儲虛擬化授權(quán)(26CPU)。
湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)私有云基礎(chǔ)設(shè)施的拓?fù)浣Y(jié)構(gòu)如圖1所示?!?6服務(wù)器節(jié)點、各網(wǎng)絡(luò)平面交換機(jī)以堆疊的方式部署。業(yè)務(wù)網(wǎng)、管理網(wǎng)通過鏈路聚合提高帶寬,保障高可用性,向上連接到核心交換機(jī);存儲網(wǎng)采用光纖鏈路聚合,保障I/O性能和讀寫速度,同時保障高可用性。
表2 湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)私有云軟硬件設(shè)備一覽表Table 2 List of private cloud software and hardware equipment for geological big data of Hubei Geological Bureau
在×86服務(wù)器節(jié)點上逐一安裝超融合虛擬化管理平臺,該平臺是私有云基礎(chǔ)架構(gòu)的底層支撐環(huán)境,用于創(chuàng)建和運行虛擬機(jī),其本身是一個基于Linux內(nèi)核的操作系統(tǒng)。之后通過該管理平臺,設(shè)置各節(jié)點的網(wǎng)絡(luò)參數(shù),組建超融合集群,配置存儲資源池并初始化后,即可上線提供私有云服務(wù)。
圖1 湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)私有云基礎(chǔ)設(shè)施拓?fù)浣Y(jié)構(gòu)示意圖Fig.1 Topological structure diagram of geological big data private cloud infrastructure of Hubei Geological Bureau
2018年7月中旬,湖北省地質(zhì)局地質(zhì)大數(shù)據(jù)平臺私有云基礎(chǔ)設(shè)施部署完成并上線運行?;诔诤霞夹g(shù),地質(zhì)大數(shù)據(jù)私有云形成了1.29 THz CPU(1070核心)、4.94 TB內(nèi)存、108.84 TB存儲(二副本卷)的資源池,向地質(zhì)大數(shù)據(jù)平臺業(yè)務(wù)應(yīng)用提供了穩(wěn)定可靠的計算存儲資源服務(wù)。目前該私有云承載了82個云主機(jī),CPU計算核心占用率約56%、性能使用率約20%,內(nèi)存占用率約28%,存儲使用率約26%,運行近2年半未發(fā)生資源服務(wù)故障,較好地保障了地質(zhì)大數(shù)據(jù)平臺的IT資源需求。
基于超融合技術(shù)的私有云具有高度的可擴(kuò)展性和通用性,同時可以有效保障網(wǎng)絡(luò)、數(shù)據(jù)和業(yè)務(wù)應(yīng)用的安全性,通過定制開發(fā)或者采用商用產(chǎn)品能實現(xiàn)良好的兼容性和用戶便利性,是開展地質(zhì)大數(shù)據(jù)建設(shè)工作的首選。應(yīng)用過程中,可根據(jù)當(dāng)期建設(shè)規(guī)模需求構(gòu)建一個較小的核心集群,今后根據(jù)業(yè)務(wù)規(guī)模的增長采用“堆疊”的方式橫向擴(kuò)充交換機(jī)等網(wǎng)絡(luò)部件、計算節(jié)點等服務(wù)器部件,實現(xiàn)私有云基礎(chǔ)設(shè)施的擴(kuò)容。與此同時,可充分發(fā)揮超融合“軟件定義”的特性,結(jié)合需要在云內(nèi)部署防火墻、負(fù)載均衡、持續(xù)數(shù)據(jù)保護(hù)等安全防護(hù)組件,為地質(zhì)大數(shù)據(jù)網(wǎng)絡(luò)信息安全保駕護(hù)航。