劉 作,陳 楊,黎 聰
(中國—東盟信息港股份有限公司,廣西 南寧 530200)
隨著向4G、5G核心網(wǎng)的演進,核心網(wǎng)網(wǎng)元功能在分組交換領(lǐng)域深度迭代。在模擬通信時代,信令與媒體不可分割。隨著對信令輕量化的需求,控制與承載分離成為2G、3G時代核心網(wǎng)架構(gòu)的標志。但是,隨著網(wǎng)絡(luò)能力的提升和分組交換技術(shù)的深度發(fā)展,在當下的4G、5G時代,隨路信令再次回歸核心網(wǎng)架構(gòu)。隨著控制與承載分分合合幾十年,如今的輕量化部署與靈活應(yīng)用,對核心網(wǎng)功能網(wǎng)元的NFV化產(chǎn)生了硬性需求。
網(wǎng)關(guān)即完成兩個異構(gòu)網(wǎng)絡(luò)之間信息(包括媒體信息和用于控制的信令信息)相互轉(zhuǎn)換的設(shè)備。國際互聯(lián)網(wǎng)工程任務(wù)組(The Internet Engineering Task Force,簡稱IETF)在RFC2719提出了網(wǎng)關(guān)的總體模型,將網(wǎng)關(guān)的特征分為3個功能實體——媒體網(wǎng)關(guān)(MG)功能、媒體網(wǎng)關(guān)控制(MGC)功能和信令網(wǎng)關(guān)(SG)功能。
5G網(wǎng)絡(luò)切片基于NFV和SDN技術(shù),為了打破傳統(tǒng)核心網(wǎng)運行模式單一的狀況,采用各種運行業(yè)務(wù)綜合發(fā)展的模式,根據(jù)不同業(yè)務(wù)的優(yōu)先等級,能夠?qū)崿F(xiàn)端到端的業(yè)務(wù)編排;基于NFV化的媒體網(wǎng)關(guān),可以實現(xiàn)對用戶業(yè)務(wù)進行切片定制化,針對不同業(yè)務(wù)實現(xiàn)端到端業(yè)務(wù)編排能力,符合5G核心網(wǎng)的發(fā)展方向。
ETSI網(wǎng)絡(luò)功能虛擬化行業(yè)規(guī)范工作組(NFV ISG)在GS NFV 002(Architectural Framework)中定義NFV基礎(chǔ)體系架構(gòu)[1],整體架構(gòu)由3部分組成。
網(wǎng)絡(luò)功能虛擬化設(shè)施(NFV Infrastructure,NFVI)基于傳統(tǒng)硬件的計算、存儲、網(wǎng)絡(luò)3大硬件模塊,將其組成節(jié)點和網(wǎng)絡(luò)鏈路通過hypervisor管理程序,將物理資源能力抽象為VNF應(yīng)用調(diào)用,提供應(yīng)用部署支撐環(huán)境。
虛擬網(wǎng)絡(luò)功能(Virtualized Network Functions,VNFs)是已定義好外部接口和功能行為的功能模塊。一個VNF就是某網(wǎng)絡(luò)功能部署在虛擬資源如VM中的一個實例。實際上,單個VNF可以劃分多個內(nèi)部元件,部署在多個虛擬機中。每個虛擬機承載VNF的一個元件,打包作為方案向外提供定制化服務(wù)。
網(wǎng)絡(luò)功能虛擬化的管理與編排(NFV Management and Orchestration,NFV MANO),主要用于編排管理VNF組件、配置及基礎(chǔ)設(shè)施,并管理VNF的生命周期,主要聚焦于NFV架構(gòu)中所需的所有虛擬化相關(guān)的管理任務(wù)[2]。
媒體網(wǎng)關(guān)VNF應(yīng)用基于為用戶提供定制化切片服務(wù),將媒體網(wǎng)關(guān)整體功能進行劃分,由多個子VNF共同構(gòu)成基于VNF的微服務(wù)集群。
(1)MG_Core:輸出媒體轉(zhuǎn)碼、放音及錄音合成等核心媒體操控功能。
(2)Signaling Control:提供信令支撐功能,包括信令轉(zhuǎn)換、sdp媒體協(xié)商以及到核心網(wǎng)元偶聯(lián)的建立與維護。
(3)SCP(Service Control Point):核心業(yè)務(wù)邏輯控制與編排單元,基于面向服務(wù)架構(gòu)設(shè)計,對其他子VNF網(wǎng)元提供業(yè)務(wù)邏輯控制,以及根據(jù)不同客戶需求提供定制化業(yè)務(wù)邏輯編排。
(4)DBS:提供數(shù)據(jù)庫和存儲支撐。
(5)ACP(Access Control Point):對接用戶,為用戶提供的切片入口用于滿足定制化需求請求及響應(yīng)。
本文的分析流程劃分為3個部分:NFV平臺搭建與核心網(wǎng)對接、VNF應(yīng)用部署、問題分析與改進總結(jié)。
媒體網(wǎng)關(guān)VNF應(yīng)用指標,包括媒體協(xié)商轉(zhuǎn)碼,計算、網(wǎng)絡(luò)、存儲硬件指標,流媒體錄音生成,業(yè)務(wù)服務(wù)連續(xù)性;(2)核心網(wǎng)對接指標參數(shù),包括M3UA偶聯(lián)、CIC使用率和流媒體帶寬占用率。
NFV環(huán)境搭建整體架構(gòu)劃分。本文所述應(yīng)用場景是一種基于語音通話的電信增值業(yè)務(wù)平臺,提供語音通話接續(xù)、錄音、彩鈴等定制化功能。為形成對比及方便測試,整體劃分為超融合NFV集群和基于物理機的VMWare資源池。參考論文《基于NFV的媒體網(wǎng)關(guān)軟化技術(shù)應(yīng)用測試研究》的測試結(jié)論,軟化媒體網(wǎng)關(guān)組件CPU線程個數(shù)與響應(yīng)網(wǎng)卡IRQ的線程個數(shù)最佳配置比為1:8的情況下,分配2個線程用于響應(yīng)網(wǎng)卡中斷,使網(wǎng)卡SI%穩(wěn)定在25%以下[3]。此外,與核心網(wǎng)T局、H/L局通過sigtran協(xié)議互配OPC、DPC、GT碼,互聯(lián)互通。
基于VNF應(yīng)用能力輸出的靈活性和定制化需求,單粒度應(yīng)用部署采取兩種應(yīng)用標準。單粒度MG_Core支撐500媒體話路并發(fā)能力,各VNF應(yīng)用均按錄音轉(zhuǎn)碼要求配置。
本文旨在研究基于NFV部署的VNF應(yīng)用,在承載電信級核心網(wǎng)媒體業(yè)務(wù)時的系統(tǒng)穩(wěn)定性,包括從Hypervisor抽象底層設(shè)施的能力輸出效果、底層變更對應(yīng)用的影響以及VNF應(yīng)用性能指標。
3.3.1 錄音合成延遲問題
基于系統(tǒng)周期性抽檢錄音合成監(jiān)控機制,發(fā)現(xiàn)系統(tǒng)在業(yè)務(wù)高峰期存在錄音合成延遲問題。抽檢規(guī)模為500個隨機樣本,以失敗案例為分子進行統(tǒng)計,嚴重時刻能達到60%的延遲,通過對物理層資源的觀測顯示,部署MG_Core的子VNF應(yīng)用會存在個別線程CPUIdle跳0,而集中在CPUWait等待資源釋放,持續(xù)時間0~9 s,此時CPU利用率超過60%。基于錄音合成優(yōu)先級低于媒體轉(zhuǎn)碼、接續(xù)等優(yōu)先級。此外,由于Hypervisor抽象物理資源所消耗的計算資源占比大概為30%,在系統(tǒng)媒體話路并發(fā)增高時,會出現(xiàn)底層計算資源搶占問題。
3.3.2 業(yè)務(wù)偶發(fā)閃斷問題
在系統(tǒng)上線使用過程中,觀測業(yè)務(wù)穩(wěn)定性發(fā)現(xiàn)存在偶發(fā)閃斷現(xiàn)象。閃斷發(fā)生時表現(xiàn)為系統(tǒng)呼叫量從2 400媒體話路并發(fā)瞬間降至0,振鈴量由于存量呼叫的關(guān)系由2 300話路并發(fā)降至280,接通量由1 250降至150,部署的MG_Core的CPU空閑率從60%釋放至95%,網(wǎng)絡(luò)流入流量監(jiān)控顯示流入的流量從600 kb/s降至30 kb/s,網(wǎng)絡(luò)流出流量從12 Mb/s降至0。IOPS讀寫由于媒體業(yè)務(wù)中斷原因?qū)懭胱兙彛瑥?00 r/s降至90 r/s,CIC使用率從1 200降至160。
通過排查發(fā)現(xiàn),最早時刻發(fā)生中斷告警的為到核心網(wǎng)H/L局的sigtran偶聯(lián)中斷,每次中斷時間0~5 min。由于偶聯(lián)是支撐信令交互的傳輸通道,在偶聯(lián)發(fā)生中斷后無法對話路進行路由,導致發(fā)生業(yè)務(wù)中斷和底層物理資源的釋放。經(jīng)研究排查,在sigtran偶聯(lián)閃斷時,Signaling Ctrl應(yīng)用模塊所在的物理機存在突發(fā)重啟導致的冷遷移,導致5 min內(nèi)的業(yè)務(wù)中斷。
3.4.1 錄音合成延遲問題解決
經(jīng)3.3.2節(jié)對MG_Core子VNF應(yīng)用的分析,它的承載業(yè)務(wù)擴容基線CPU利用率在60%。當高于60%時,系統(tǒng)會出現(xiàn)資源搶占問題導致的錄音合成延遲。由于其他子VNF應(yīng)用模塊資源與MG_Core子VNF應(yīng)用存在資源利用差值,在其他模塊資源未飽和之前,可以動態(tài)擴容MG_Core子VNF應(yīng)用,降低整體資源利用率,解決資源搶占問題。此外,由于錄音合成基于ffmpeg組件,為防止單個線程被強占導致錄音合成掛死現(xiàn)象,通過配置ffmpeg錄音合成采用多進程綁定可避免該問題的發(fā)生。綜上,在部署MG_Core子VNF應(yīng)用時,可調(diào)整ffmpeg配置綁定多線程工作,同時對虛擬機資源進行監(jiān)控基線添加,當CPU利用率超過60%時,即可考慮動態(tài)擴容子VNF應(yīng)用方案。
3.4.2 閃斷問題解決
雖然閃斷是基于物理層故障暴露出來的問題,但經(jīng)分析可以從VNF應(yīng)用部署角度盡力避免該問題,即采用分布式部署與負載均衡策略,將VNF應(yīng)用部署在不同物理機上,采用偶數(shù)部署機制形成彼此互為熱備。當某個底層物理資源宕機遷移期間,部署在其他底層物理機所制成的虛擬機上的VNF應(yīng)用即可起到熱備份作用。通過該解決方案策略部署VNF子應(yīng)用后,系統(tǒng)業(yè)務(wù)閃斷問題修復,經(jīng)數(shù)日觀測無閃斷發(fā)生。綜上,在部署VNF子應(yīng)用時,將子應(yīng)用針對底層物理機資源采取分布式部署與負載均衡策略,可極大提高對底層物理資源障礙的容錯性,提高業(yè)務(wù)系統(tǒng)穩(wěn)定性。
5G網(wǎng)絡(luò)是萬物互聯(lián)的時代。NFV作為5G網(wǎng)絡(luò)切片的關(guān)鍵技術(shù),是電信核心網(wǎng)的發(fā)展趨勢。本文以NFV為基礎(chǔ)環(huán)境,對媒體網(wǎng)關(guān)進行以VNF應(yīng)用部署為目的的功能分解與部署,制定了核心網(wǎng)電信業(yè)務(wù)承載穩(wěn)定性分析流程和技術(shù)指標,以系統(tǒng)承載業(yè)務(wù)所暴露出來的問題為基礎(chǔ),分析得到了能夠提高系統(tǒng)穩(wěn)定性的VNF應(yīng)用部署方案和MG_Core擴容基線數(shù)值,為基于VNF的媒體網(wǎng)關(guān)承載電信級業(yè)務(wù)應(yīng)用部署提供了參考。