郭濤
10月25日,每半年一屆的OpenStack峰會(OpenStack Summit)即將在西班牙的巴塞羅那揭幕,中國移動參加了峰會的重頭戲之一“超級用戶大獎”的競逐。看看以往那些超級用戶——CERN(歐洲核子研究組織)、AT&T、NTT DOCOMO(日本最大的移動通信運(yùn)營商)等,正是它們所起到的帶頭和示范作用,才讓OpenStack快速走向了企業(yè)級應(yīng)用市場。
無論中國移動能否在本屆OpenStack峰會上最終贏得超級用戶大獎,它都是中國的驕傲——中國移動在全球范圍內(nèi)首次構(gòu)建了超過1000個(gè)節(jié)點(diǎn)的OpenStack單集群,并因此成了OpenStack千節(jié)點(diǎn)工作組的牽頭人?;贠penStack架構(gòu),中國移動在云計(jì)算的道路上進(jìn)行了諸多有益的探索,以及具有獨(dú)創(chuàng)性的開發(fā)和應(yīng)用,積累了豐富的經(jīng)驗(yàn)。
OpenStack不僅要做大,更要做強(qiáng)。中國移動的實(shí)踐已經(jīng)證明,中國企業(yè)有能力構(gòu)建超大規(guī)模的OpenStack集群。接下來,擺在所有中國OpenStack廠商和用戶面前的一個(gè)挑戰(zhàn)就是,如何將OpenStack應(yīng)用引向縱深,將應(yīng)用OpenStack的成功經(jīng)驗(yàn)在全球范圍內(nèi)進(jìn)行分享,并引領(lǐng)OpenStack未來的發(fā)展。
OpenStack是云計(jì)算
最好的支撐
中國移動在云計(jì)算方面的探索起步很早,2007年就開始了針對云計(jì)算的研究工作。2009年,中國移動正式開始構(gòu)建自己的IaaS平臺,考慮到傳統(tǒng)的IT架構(gòu)并不能滿足應(yīng)用的需求,所以決定采用開放的平臺和軟件。不過,由于當(dāng)時(shí)OpenStack還不太成熟,所以中國移動在幾個(gè)備選的開源軟件中最終選擇了OpenNebula。
中國移動第一次就這樣與OpenStack擦肩而過了。從2013年開始,OpenStack步入快速成長階段。2015年的OpenStack項(xiàng)目研究報(bào)告顯示,累計(jì)有4.1萬余人為OpenStack貢獻(xiàn)了2000多萬行代碼,180個(gè)國家的近600個(gè)公司支持OpenStack項(xiàng)目,OpenStack是全球發(fā)展最快的開源社區(qū)之一。正是看到OpenStack整個(gè)產(chǎn)業(yè)環(huán)境趨于成熟,完全可以支持商業(yè)化的運(yùn)營,中國移動再次將關(guān)注的目光投向OpenStack。
經(jīng)過謹(jǐn)慎的評估和測試,中國移動逐漸將云計(jì)算的重心向OpenStack傾斜,并于2014年和2015年分別發(fā)布了基于OpenStack的“大云”3.0和“大云”4.0兩個(gè)版本。據(jù)中國移動(蘇州)軟件技術(shù)有限公司副總經(jīng)理孫少陵介紹,中國移動基于OpenStack kilo版本的“大云”4.0已經(jīng)實(shí)現(xiàn)了大規(guī)模應(yīng)用,總計(jì)部署規(guī)模超過4000個(gè)節(jié)點(diǎn)。
“OpenStack是開放架構(gòu),具有平臺無關(guān)性、分布式、標(biāo)準(zhǔn)化、易用性和可持續(xù)交付等優(yōu)點(diǎn),所以我們才選擇了它?!睂O少陵表示,中國移動基于OpenStack建立了完整的產(chǎn)品線,即基于OpenStack構(gòu)建了管理域和業(yè)務(wù)域共計(jì)12個(gè)主要產(chǎn)品、三大類操作系統(tǒng),形成了完整的IaaS、PaaS和SaaS產(chǎn)品體系和解決方案。
在云計(jì)算方面,中國移動并不是一時(shí)心血來潮,而是有備而來,甚至將自己的未來交到了云計(jì)算手上。2013年12月24日,中國移動決定在蘇州成立研發(fā)中心,注冊資金6億元,計(jì)劃招聘4500人,主要開發(fā)與云計(jì)算、大數(shù)據(jù)和IT支撐系統(tǒng)相關(guān)的產(chǎn)品。蘇州研發(fā)中心將成為中國移動內(nèi)部產(chǎn)品開發(fā)的重要力量和支撐。
蘇州研發(fā)中心的職責(zé)主要有三方面:第一,為集團(tuán)內(nèi)部提供一些核心的軟件產(chǎn)品;第二,打造IT整體解決方案,為集團(tuán)業(yè)務(wù)的運(yùn)營提供強(qiáng)有力的IT支持;第三,不斷提升自身在產(chǎn)品開發(fā)和運(yùn)營方面的能力,為集團(tuán)實(shí)現(xiàn)向IT服務(wù)商轉(zhuǎn)型奠定基礎(chǔ)。孫少陵進(jìn)一步解釋說:“AT&T正欲轉(zhuǎn)型為一家軟件公司。我們成立蘇州研發(fā)中心也有類似的愿景,以便更快速地交付更多的產(chǎn)品和解決方案,從而改變中國移動的基因,從一個(gè)傳統(tǒng)的管道服務(wù)商向數(shù)字化服務(wù)商轉(zhuǎn)變,不斷增強(qiáng)自身的IT能力?!?/p>
一座現(xiàn)代化的占地500畝的研發(fā)中心已經(jīng)在蘇州拔地而起。中國移動的這個(gè)研發(fā)基地現(xiàn)有700多人,其中研發(fā)人員占85%,專門從事OpenStack研發(fā)的有200多人。有了在研發(fā)上的如此大的投入,中國移動距成為國內(nèi)一流、世界領(lǐng)先的IT服務(wù)商又近了一步。
越過OpenStack那道坎
在云計(jì)算平臺全面轉(zhuǎn)向OpenStack后,中國移動的私有云和公有云建設(shè)突飛猛進(jìn)。
按中國移動的既定計(jì)劃,2016年底即將完成共計(jì)6000個(gè)節(jié)點(diǎn)的公有云建設(shè),其中廣州和北京的兩個(gè)集群已經(jīng)上線運(yùn)行。另外,到2017年5月,中國移動還將建成兩個(gè)新的數(shù)據(jù)中心,即呼和浩特和哈爾濱兩個(gè)數(shù)據(jù)中心,各有3000個(gè)節(jié)點(diǎn),以支持私有云的運(yùn)行。無論是公有云還是私有云,都是基于OpenStack構(gòu)建的。
目前,中國移動最近上線的OpenStack單群位于北京的云數(shù)據(jù)中心,共有1000個(gè)物理節(jié)點(diǎn),主要包括650個(gè)計(jì)算節(jié)點(diǎn)、20個(gè)控制節(jié)點(diǎn)、20個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)和250個(gè)存儲節(jié)點(diǎn)。
中國移動基于OpenStack構(gòu)建的私有云承載著中國移動內(nèi)部所有的業(yè)務(wù),同時(shí)支持物理機(jī)和虛擬機(jī),未來還要支撐NFV,其業(yè)務(wù)不僅規(guī)模大,而且復(fù)雜度非常高,堪稱全球范圍內(nèi)最大的OpenStack商用案例。中國移動對整個(gè)平臺的可靠性、安全性、靈活調(diào)控能力和彈性伸縮能力提出了極其嚴(yán)苛的要求。中國移動與英特爾合作,解決了系統(tǒng)面臨的高并發(fā)、吞吐量瓶頸等問題。
“在全球范圍內(nèi)能夠進(jìn)行數(shù)千個(gè)節(jié)點(diǎn)的OpenStack測試和應(yīng)用,目前只有中國移動擁有這樣的能力?!睂O少陵介紹說,“我們與英特爾一起在廣州和北京的兩個(gè)數(shù)據(jù)中心機(jī)房進(jìn)行了測試,在部署數(shù)個(gè)千節(jié)點(diǎn)的過程中,雙方的工程師共同設(shè)計(jì)和完善測試方案,分析系統(tǒng)存在的問題,進(jìn)行系統(tǒng)調(diào)優(yōu),不斷提升吞吐率。”
上千個(gè)節(jié)點(diǎn)的OpenStack集群是一個(gè)門檻,以前在全球范圍內(nèi)還沒有其他用戶進(jìn)行過如此大規(guī)模的測試和應(yīng)用。這說明中國移動具備了企業(yè)級OpenStack的部署和應(yīng)用能力。
OpenStack到底能夠支撐多大的規(guī)模,以前業(yè)內(nèi)并沒有一個(gè)標(biāo)準(zhǔn)。通常情況下,在200個(gè)節(jié)點(diǎn)以下,OpenStack不會有明顯的性能瓶頸,但是隨著節(jié)點(diǎn)數(shù)量不斷增加,千奇百怪的問題就會暴露出來。眾所周知“木桶”原理,為了保證OpenStack大規(guī)模集群的平穩(wěn)運(yùn)行,英特爾的主要工作是將系統(tǒng)結(jié)構(gòu)中存在的短板提高,從硬件平臺的角度對OpenStack進(jìn)行優(yōu)化,使之達(dá)到最佳的性能。英特爾和中國移動合作,努力使OpenStack集群在超過4500個(gè)節(jié)點(diǎn)時(shí)仍然可用。
為了提升OpenStack大規(guī)模集群的性能,中國移動與英特爾從多個(gè)層面對集群進(jìn)行了優(yōu)化。中國移動準(zhǔn)備將這些系統(tǒng)調(diào)優(yōu)的經(jīng)驗(yàn)在OpenStack巴塞羅那峰會上進(jìn)行分享。
對于未來在云計(jì)算方面的探索,中國移動早就有了全盤規(guī)劃,那就是實(shí)現(xiàn)“四化”:實(shí)現(xiàn)統(tǒng)一化的管理,讓分散在全國各地的異構(gòu)的數(shù)據(jù)中心資源進(jìn)行充分的資源共享,這樣云平臺才能真正發(fā)揮其作用;在云數(shù)據(jù)中心規(guī)模不斷擴(kuò)張的情況下,人工管理不太現(xiàn)實(shí),因此必須實(shí)現(xiàn)管理的自動化或者說智能化,在減少人工介入的情況下,仍然能夠?qū)崿F(xiàn)高效的管理,以及故障后的及時(shí)恢復(fù);實(shí)現(xiàn)各種功能模塊的服務(wù)化,通過平臺化和開放API,讓更多的人可以在平臺上進(jìn)行應(yīng)用開發(fā);實(shí)現(xiàn)層次化,對平臺進(jìn)行分層解耦,各司其職。
OpenStack在企業(yè)級應(yīng)用中不斷走向成熟
從其他開源平臺轉(zhuǎn)向以O(shè)penStack為核心,中國移動的這種轉(zhuǎn)型不僅需要魄力,更需要能力。中國移動本身具有大規(guī)模云計(jì)算應(yīng)用的需求,同時(shí)具備強(qiáng)大的研發(fā)能力,還有像英特爾這樣的合作伙伴作為助力,因此才能在OpenStack的應(yīng)用方面走在全球前列。
中國在OpenStack方面的進(jìn)展比國外快。一方面,中國的企業(yè)更強(qiáng)調(diào)自主創(chuàng)新;另一方面,中國有各種類型的客戶、各種不同的OpenStack需求和應(yīng)用場景,這將有力地推動OpenStack生態(tài)和技術(shù)的創(chuàng)新,促進(jìn)OpenStack在企業(yè)級應(yīng)用中不斷走向成熟。
毫無疑問,中國移動在OpenStack方面的創(chuàng)新具有引領(lǐng)作用。孫少陵表示:“我們在公有云、私有云等不同的應(yīng)用環(huán)境中對OpenStack的能力進(jìn)行了測試和驗(yàn)證,找出在各種應(yīng)用場景中存在的問題,不斷試錯(cuò),并將問題和解決方案反饋給社區(qū),這樣才能真正推動OpenStack走向成熟。”
中國移動的經(jīng)驗(yàn)雖然是個(gè)性化的,但是對于其他用戶來說仍有很多值得借鑒的地方。在基于OpenStack的軟硬件結(jié)合的SDN實(shí)施上,中國移動是首創(chuàng)。在應(yīng)用過程中,中國移動發(fā)現(xiàn)某些接口不開放會影響SDN的應(yīng)用。中國移動的做法是將這些接口進(jìn)一步標(biāo)準(zhǔn)化,并反饋給社區(qū)。另外,中國移動也會主動發(fā)起一些項(xiàng)目,不斷積累OpenStack的實(shí)踐經(jīng)驗(yàn)。比如,中國移動發(fā)現(xiàn)OpenStack在管理上還有欠缺,必須通過更多的實(shí)踐加以改進(jìn)。
云計(jì)算的生態(tài)環(huán)境越來越復(fù)雜。OpenStack要想更好地支持云計(jì)算就必須與容器、大數(shù)據(jù)等新興的技術(shù)和應(yīng)用對接。英特爾也十分強(qiáng)調(diào)生態(tài)的重要性,發(fā)布了Cloud for All計(jì)劃,在生態(tài)系統(tǒng)方面進(jìn)行廣泛投資與合作,不斷優(yōu)化SDI(軟件定義的架構(gòu))解決方案,以便充分發(fā)揮英特爾平臺的能力,通過開放的行業(yè)標(biāo)準(zhǔn)積極推動社區(qū)發(fā)展。
OpenStack市場出現(xiàn)了新的拐點(diǎn),中國能否抓住此契機(jī),在OpenStack領(lǐng)域?qū)崿F(xiàn)引領(lǐng)和主導(dǎo)呢?我們拭目以待。