為響應(yīng)中國(guó)聯(lián)通集團(tuán)公司網(wǎng)絡(luò)線運(yùn)營(yíng)組織體系改革精神,推進(jìn)資源統(tǒng)籌布局共享,實(shí)現(xiàn)云資源統(tǒng)一規(guī)劃布局、統(tǒng)一投資建設(shè)、統(tǒng)一資源調(diào)動(dòng)和統(tǒng)一維護(hù),針對(duì)江蘇聯(lián)通IT 云、CT 云、業(yè)務(wù)云,尤其是行業(yè)云如地(市)政務(wù)云、私有云,當(dāng)前缺乏統(tǒng)一運(yùn)營(yíng)管理手段、云技術(shù)架構(gòu)分散、集中維護(hù)管理難度大、IT 專業(yè)人員缺失的現(xiàn)狀,本文探討了一種多云環(huán)境下的集約化運(yùn)營(yíng)平臺(tái)的功能建設(shè)方案,希望能解決痛點(diǎn)問(wèn)題,滿足業(yè)務(wù)需求,面向政企云客戶提供電信級(jí)的保障手段,有效推動(dòng)全省云運(yùn)營(yíng)集約化體系的改革落地,提升客戶感知和服務(wù)質(zhì)量。
江蘇聯(lián)通目前建設(shè)有IT云、CT云、各類業(yè)務(wù)云,包括行業(yè)云、私有云等多種云資源池,這些云資源池的維護(hù)統(tǒng)一由省市兩級(jí)云資源池維護(hù)團(tuán)隊(duì)負(fù)責(zé),業(yè)務(wù)運(yùn)營(yíng)由產(chǎn)互公司負(fù)責(zé)。全省共有DC 數(shù)據(jù)中心15 個(gè),云資源池23 個(gè),資源池類型包括Xen、OpenStack+KVM、裸金屬等,云廠商有中興、華為、愛(ài)立信、沃云、華三、阿里、騰訊等,硬件設(shè)備廠商繁雜。上云的業(yè)務(wù)系統(tǒng)有410 個(gè),物理設(shè)備1 457 臺(tái),云主機(jī)2 776 臺(tái)。DC 組網(wǎng)方式有傳統(tǒng)三層架構(gòu)、硬件SDN 和軟件SDN 架構(gòu)。各云資源池均有獨(dú)立的操作平臺(tái),有的云平臺(tái)運(yùn)營(yíng)面和運(yùn)維面無(wú)法分離,存在審計(jì)風(fēng)險(xiǎn)。
目前多云資源池的運(yùn)營(yíng)主要存在以下問(wèn)題。
a)資源交付效率低下:主要以線下方式為主,通過(guò)電話、郵件、紙質(zhì)單據(jù)等完成資源審批,周期長(zhǎng)。
b)網(wǎng)絡(luò)資源管理混亂:不同資源池的網(wǎng)絡(luò)架構(gòu)不一致,VLAN/VXLAN/IP等用戶配置只能用Excel管理。
c)自助服務(wù)能力不足:云資源通過(guò)4A 堡壘機(jī)登錄較多,但系統(tǒng)級(jí)故障處理仍依賴運(yùn)維團(tuán)隊(duì)。
d)資源效率無(wú)法評(píng)估:硬件資產(chǎn)、虛擬化資產(chǎn)的使用情況無(wú)法得到有效評(píng)估。
e)運(yùn)維工作量大且故障無(wú)法快速感知:硬件設(shè)備數(shù)量龐大,類型眾多,多種虛擬化技術(shù)與云平臺(tái)分開(kāi)使用,維護(hù)人員需要在各種管理工具之間來(lái)回切換。傳統(tǒng)的網(wǎng)管監(jiān)控系統(tǒng)無(wú)法覆蓋云資源池內(nèi)的虛擬資源,無(wú)法及時(shí)感知云自身的運(yùn)行狀態(tài)。
云網(wǎng)業(yè)務(wù)應(yīng)以高質(zhì)量發(fā)展為目標(biāo),通過(guò)數(shù)字化轉(zhuǎn)型,提升業(yè)務(wù)的運(yùn)營(yíng)管理水平。集約化的多云管控平臺(tái)的建設(shè)需求應(yīng)運(yùn)而生。該平臺(tái)應(yīng)具備以下基本功能。
a)縮短資源交付時(shí)間:將本系統(tǒng)與企業(yè)OA 或CBSS 流程結(jié)合,實(shí)現(xiàn)線上流程和資源發(fā)放全自動(dòng),顯著提升資源交付效率,資源全流程開(kāi)通平均時(shí)長(zhǎng)由之前的數(shù)天縮短到小時(shí)或分鐘級(jí)。
b)異構(gòu)網(wǎng)絡(luò)自動(dòng)開(kāi)通:將云內(nèi)多種網(wǎng)絡(luò)架構(gòu)有機(jī)整合,通過(guò)統(tǒng)一的運(yùn)維平面消除底層技術(shù)差異、簡(jiǎn)化配置步驟,網(wǎng)絡(luò)開(kāi)通方式由原來(lái)的手動(dòng)和專業(yè)人員操作轉(zhuǎn)變?yōu)闃I(yè)務(wù)部門(mén)自助按需開(kāi)通,并且開(kāi)放自助配置能力。
c)資源管理統(tǒng)一視圖:將整體納管本地行業(yè)云、私有云等多個(gè)異構(gòu)云網(wǎng)資源池,提供全局資源評(píng)估和調(diào)度機(jī)制,有效平衡和提高云資源使用效率,方便從業(yè)務(wù)運(yùn)營(yíng)視角客觀評(píng)價(jià)當(dāng)前網(wǎng)絡(luò)資源使用效能和收益情況。
d)簡(jiǎn)化運(yùn)維工作:通過(guò)建立數(shù)據(jù)中心資產(chǎn)臺(tái)賬,增強(qiáng)設(shè)備帶外管理、補(bǔ)全云內(nèi)監(jiān)控機(jī)制,建立應(yīng)用和設(shè)備的端到端拓?fù)?;通過(guò)自動(dòng)化工具和智能算法進(jìn)行異常檢測(cè)和容量預(yù)測(cè),以此簡(jiǎn)化運(yùn)維工作,降低故障風(fēng)險(xiǎn)。
針對(duì)不同業(yè)務(wù)場(chǎng)景對(duì)多云集約化運(yùn)營(yíng)平臺(tái)的要求,站在不同使用者的視角,集約化平臺(tái)應(yīng)同時(shí)具備資源管理、運(yùn)營(yíng)、自服務(wù)和運(yùn)維管理能力,滿足以下用戶場(chǎng)景需求。
a)外部客戶可感知多樣化的云產(chǎn)品和云服務(wù),自助訂購(gòu)使用云網(wǎng)資源,及時(shí)掌握資源使用量和成本;內(nèi)部用戶通過(guò)合規(guī)流程獲得云能力,自主維護(hù)云網(wǎng)資源,通過(guò)運(yùn)維工單得到快速支撐。
b)外部系統(tǒng)調(diào)用API 進(jìn)行數(shù)據(jù)集約共享、能力注冊(cè)和開(kāi)放,具備第三方快速適配和接入能力,可集成和擴(kuò)展系統(tǒng)規(guī)模。
c)運(yùn)營(yíng)決策者可設(shè)計(jì)云產(chǎn)品和云網(wǎng)融合套餐,快速發(fā)布上線,靈活配置計(jì)費(fèi)規(guī)則,感知云能力容量變化并做好預(yù)測(cè)、規(guī)劃。
d)運(yùn)維管理員整合云平臺(tái),統(tǒng)一視圖,監(jiān)控云資源運(yùn)行狀況,并根據(jù)負(fù)載進(jìn)行調(diào)度,及時(shí)發(fā)現(xiàn)和處理故障。
多云集約化運(yùn)營(yíng)平臺(tái)通過(guò)屏蔽云之間的差異、抽象功能、統(tǒng)一概念,以標(biāo)準(zhǔn)化視圖來(lái)簡(jiǎn)化全省業(yè)務(wù)云/產(chǎn)業(yè)云的業(yè)務(wù)運(yùn)營(yíng)、網(wǎng)絡(luò)運(yùn)維工作。平臺(tái)主要功能模塊包括資源管理、運(yùn)營(yíng)管理、自服務(wù)、運(yùn)維管理和南北向API總線。異構(gòu)云環(huán)境的統(tǒng)一視圖主要是通過(guò)南向API 實(shí)現(xiàn)各云的對(duì)接納管。北向API 用于對(duì)接第三方應(yīng)用或集團(tuán)平臺(tái),提供平臺(tái)能力輸出(見(jiàn)圖1)。
運(yùn)營(yíng)管理模塊主要實(shí)現(xiàn)產(chǎn)品配置和上線、客戶和租戶管理、訂單管理和流程設(shè)計(jì)、計(jì)量計(jì)費(fèi)、運(yùn)營(yíng)統(tǒng)計(jì)和分析。運(yùn)維能力模塊主要實(shí)現(xiàn)云資產(chǎn)管理、拓?fù)浒l(fā)現(xiàn)和可視化、自動(dòng)化作業(yè)、異常檢測(cè)、故障定位、故障預(yù)測(cè)。自助能力模塊主要實(shí)現(xiàn)自服務(wù)、云資源自助開(kāi)通/變更/注銷、資源管理控制、訂單/賬單/清單管理。資管能力模塊主要實(shí)現(xiàn)異構(gòu)云平臺(tái)統(tǒng)一視圖、全生命周期管理、資源調(diào)度和編排、容量監(jiān)控和預(yù)測(cè)、資源適配擴(kuò)展API。
如圖2 所示,各地的行業(yè)云、私有云可以通過(guò)DCI或城域網(wǎng)進(jìn)行互聯(lián),在省中心部署多云集約化運(yùn)營(yíng)平臺(tái),各級(jí)用戶分權(quán)分域在統(tǒng)一的平臺(tái)上進(jìn)行操作。
圖1 集約化平臺(tái)架構(gòu)設(shè)計(jì)圖
平臺(tái)應(yīng)具有以下5 種常用角色和標(biāo)準(zhǔn)工作流程,同時(shí)支持根據(jù)客戶需求進(jìn)行定制。常用角色分為系統(tǒng)管理員、運(yùn)維管理員、運(yùn)營(yíng)管理員、租戶管理員和普通用戶。系統(tǒng)管理員負(fù)責(zé)維護(hù)人員組織架構(gòu)和用戶權(quán)限、設(shè)置系統(tǒng)基本參數(shù)。運(yùn)維管理員負(fù)責(zé)云資源生命周期管理、性能監(jiān)控、操作維護(hù)、資產(chǎn)管理、自動(dòng)化運(yùn)維、告警監(jiān)控、報(bào)表管理、云資源工單處理。運(yùn)營(yíng)管理員負(fù)責(zé)維護(hù)租戶及成員、發(fā)布服務(wù)、管理訂單賬單和訂單審批。普通用戶負(fù)責(zé)資源申請(qǐng)、監(jiān)控、操作和查看申請(qǐng)單和流程。租戶管理員負(fù)責(zé)管理普通用戶所有功能、維護(hù)租戶內(nèi)項(xiàng)目和成員、審批租戶內(nèi)訂單、查看租戶賬單。
圖3 為5 種用戶角色之間的標(biāo)準(zhǔn)工作流程圖,體現(xiàn)了各角色的不同功能職責(zé)和工作流程。
集約化平臺(tái)不僅支持云資源的全自動(dòng)開(kāi)通,同時(shí)也支持下發(fā)物理/虛擬網(wǎng)元參數(shù),完成租戶VPC、出口網(wǎng)關(guān)和防火墻的全鏈路自動(dòng)配置,實(shí)現(xiàn)從“開(kāi)資源”到“開(kāi)業(yè)務(wù)”的轉(zhuǎn)變,一體化交付應(yīng)用系統(tǒng)所需的計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)資源和服務(wù)。
云網(wǎng)融合借助于資源管理模塊,通過(guò)資源適配總線完成各類設(shè)備的納管(見(jiàn)圖4),在此基礎(chǔ)上實(shí)現(xiàn)云資源和網(wǎng)絡(luò)資源的一站式開(kāi)通。
服務(wù)目錄是運(yùn)營(yíng)管理中的重要功能。服務(wù)目錄可以將云能力封裝成標(biāo)準(zhǔn)服務(wù)發(fā)布上線,自定義服務(wù)費(fèi)率和生命周期策略,自定義服務(wù)模型,滿足各類云業(yè)務(wù)場(chǎng)景,如圖5所示。
a)支持合規(guī)化發(fā)放。服務(wù)目錄可配置多場(chǎng)景不同流程,確保資源使用合規(guī),支持根據(jù)IT 規(guī)范定制開(kāi)發(fā)流程。
b)自動(dòng)化配置。在資源交付之前可根據(jù)企業(yè)內(nèi)控和基線要求,對(duì)資源進(jìn)行初始配置、安全加固。
c)標(biāo)準(zhǔn)化封裝。服務(wù)目錄將公有云標(biāo)準(zhǔn)服務(wù)和私有/第三方非標(biāo)準(zhǔn)服務(wù),采用統(tǒng)一標(biāo)準(zhǔn)封裝對(duì)齊,統(tǒng)一面向業(yè)務(wù)部門(mén)提供能力。
圖5 服務(wù)目錄運(yùn)行結(jié)構(gòu)
集約化運(yùn)營(yíng)平臺(tái)應(yīng)為企業(yè)租戶提供多種異構(gòu)云的統(tǒng)一管理界面,一站式滿足企業(yè)上云、用云、管云需求,為企業(yè)上云消除最后一公里障礙。由于現(xiàn)網(wǎng)的復(fù)雜性和多樣性,可以分階段規(guī)劃實(shí)施多云環(huán)境下集約化運(yùn)營(yíng)平臺(tái)方案。初期主要指云網(wǎng)協(xié)同,以各類云專線為代表,為企業(yè)提供云網(wǎng)套餐,幫助企業(yè)實(shí)現(xiàn)安全可靠的上云和組網(wǎng)。中后期運(yùn)營(yíng)商以云網(wǎng)融合為目標(biāo),實(shí)現(xiàn)關(guān)鍵能力垂直和水平擴(kuò)展。垂直維度向上與企業(yè)應(yīng)用深度融合,實(shí)現(xiàn)“云+網(wǎng)+X”,向下實(shí)現(xiàn)企業(yè)組網(wǎng)及IT 集成服務(wù)延伸,以云服務(wù)方式提供ICT 服務(wù)。水平維度向云網(wǎng)融合體驗(yàn)和產(chǎn)品創(chuàng)新方面持續(xù)擴(kuò)展,優(yōu)化用戶體驗(yàn),做強(qiáng)云計(jì)算產(chǎn)品。