雷多萍 鄧勇 彭莉
【摘? 要】通過對(duì)虛擬化IMS網(wǎng)絡(luò)可靠性需求分析,從滿足電信級(jí)可靠性要求的角度出發(fā),在vIMS網(wǎng)元級(jí)可靠性和網(wǎng)絡(luò)級(jí)可靠性兩個(gè)層面,對(duì)虛擬化IMS網(wǎng)絡(luò)可靠性解決方案進(jìn)行探討:在網(wǎng)元級(jí)層面,從網(wǎng)元架構(gòu)設(shè)計(jì)、故障檢測(cè)和恢復(fù)手段等三個(gè)方面層層遞進(jìn)給出解決方案;在網(wǎng)絡(luò)級(jí)層面,著眼網(wǎng)絡(luò)全局,結(jié)合不同網(wǎng)元在網(wǎng)絡(luò)中的角色、資源平衡等因素給出相應(yīng)的解決方案。
【關(guān)鍵詞】NFV架構(gòu);vIMS;虛擬化;可靠性
doi:10.3969/j.issn.1006-1010.2020.03.011? ? ? ? 中圖分類號(hào):TN915.07
文獻(xiàn)標(biāo)志碼:A? ? ? ? 文章編號(hào):1006-1010(2020)03-0056-06
引用格式:雷多萍,鄧勇,彭莉. 虛擬化IMS網(wǎng)絡(luò)可靠性解決方案探討[J]. 移動(dòng)通信, 2020,44(3): 56-61.
The Discussion on Reliability Solution of Virtual IMS
LEI Duoping1, DENG Yong2, PENG Li1
(1. China Telecom Intelligent Network and Terminal Research Institute, Guangzhou 510630, China;
2. China Telecom Corporation Limited, Beijing 100033, China)
[Abstract]?Through analyzing the reliability requirements of virtual IMS networks, this paper discusses the solutions of vIMS network reliability at both network-element and network levels in view of meeting the reliability requirements of telecom level. At the network-element level, the solution is given in a progressive way with network-element architecture design, fault detection and recovery methods. At the network level, the solution is given by considering the overall network and combining the roles of different network elements and their resource balance in the network.
[Key words]NFV architecture; vIMS; virtualization; reliability
0? ?引言
NFV具有網(wǎng)絡(luò)部署高效彈性、通用硬件資源共享、業(yè)務(wù)快速上線等優(yōu)勢(shì),已成為未來通信網(wǎng)絡(luò)演進(jìn)的主要趨勢(shì)。不同于傳統(tǒng)的專用設(shè)備,NFV采用通用的IT硬件設(shè)備部署網(wǎng)元,因此其可靠性機(jī)制與傳統(tǒng)的物理設(shè)備有一定的差異。如何提高和保證NFV網(wǎng)絡(luò)的可靠性是虛擬化網(wǎng)絡(luò)設(shè)備能否大規(guī)模商用的關(guān)鍵因素。
業(yè)界在NFV可靠性方面做了大量研究,比如網(wǎng)元架構(gòu)設(shè)計(jì)中提供高可用HA(High Availability)和容錯(cuò)FT(Fault Tolerance)兩種方案,在網(wǎng)元故障自動(dòng)恢復(fù)方面也提供了進(jìn)程重啟、虛機(jī)重啟和虛機(jī)重建等手段。但這些方案主要是針對(duì)單個(gè)虛擬化網(wǎng)元的通用手段,并沒有結(jié)合網(wǎng)元的實(shí)際業(yè)務(wù)需求和網(wǎng)絡(luò)整體架構(gòu)的可靠性提供面向具體業(yè)務(wù)特性、端到端的解決方案。本文根據(jù)語音業(yè)務(wù)對(duì)網(wǎng)絡(luò)可靠性的要求和語音網(wǎng)絡(luò)虛擬化架構(gòu)的特點(diǎn),深入探討影響設(shè)備和網(wǎng)絡(luò)可靠性的因素,結(jié)合業(yè)界研究成果,從IMS網(wǎng)元可靠性架構(gòu)設(shè)計(jì)、故障檢測(cè)和自動(dòng)恢復(fù)等方面提出解決方案,并站在全網(wǎng)視角提出網(wǎng)絡(luò)級(jí)的可靠性解決方案。
1? ?vIMS/網(wǎng)絡(luò)設(shè)備虛擬化架構(gòu)
圖1是建立在ETSI NFV(Network Functions Virtualiza-tion)定義的架構(gòu)之上,vIMS實(shí)例化后的網(wǎng)絡(luò)架構(gòu)圖,整個(gè)NFV架構(gòu)由三部分構(gòu)成:基礎(chǔ)設(shè)施NFVI(NFV Infrastructure)、網(wǎng)絡(luò)功能VNF(Virtual Network Function)和NFV 管理和編排MANO(NFV Management and Orchestration)。
虛擬化基礎(chǔ)設(shè)施層包括通用硬件、虛擬化軟件(Hypervisor)和操作系統(tǒng)(OS)。通用硬件是云資源池里的計(jì)算、存儲(chǔ)、交換機(jī)和路由器等實(shí)體資源。虛擬化軟件包括Hypervisor在內(nèi)的一些中間件,是通用硬件和操作系統(tǒng)之間的交互通道。虛擬化軟件向上提供標(biāo)準(zhǔn)化接口,向下屏蔽底層不同硬件的差異,提供硬件和上層應(yīng)用軟件交互通道。虛擬化軟件技術(shù)實(shí)現(xiàn)了軟硬件之間的隔離,使得上層應(yīng)用軟件不再感知硬件的差異,實(shí)現(xiàn)傳統(tǒng)設(shè)備的軟硬解耦,使得多種業(yè)務(wù)軟件可以運(yùn)行在統(tǒng)一的虛擬化基礎(chǔ)設(shè)施之上。
網(wǎng)絡(luò)功能是搭載在基礎(chǔ)設(shè)施層之上的各個(gè)虛擬機(jī)的應(yīng)用軟件,完成各種業(yè)務(wù)邏輯。對(duì)于vIMS來說,主要是vCSCF、vMMTEL、vENUM/DNS、vHSS等網(wǎng)元軟件,提供包括語音、視頻和短信等服務(wù)。
協(xié)同編排由OSS/BSS和MANO組成。OSS/BSS提供開銷戶、計(jì)費(fèi)等運(yùn)營支撐。MANO由NFVO、VNFM和VIM組成,負(fù)責(zé)網(wǎng)絡(luò)功能VNF生命周期管理,包括VNF軟件鏡像管理、實(shí)例創(chuàng)建、啟用、停止、升級(jí)、擴(kuò)縮容、網(wǎng)元管理策略以及對(duì)NFVI層資源管理、調(diào)度、運(yùn)行監(jiān)控等。
從NFV本質(zhì)來看,vIMS實(shí)際就是一張IT化、云化的語音網(wǎng)絡(luò)。從傳統(tǒng)ATCA專用硬件到通用X86服務(wù)器,硬件翻天覆地的變化極大影響了語音網(wǎng)絡(luò)可靠性要求。
2? ?vIMS可靠性需求分析和影響因素
語音網(wǎng)絡(luò)的可靠性強(qiáng)弱采用系統(tǒng)可用性指標(biāo)來對(duì)標(biāo)。系統(tǒng)可用性是指語音網(wǎng)絡(luò)一年內(nèi)正常服務(wù)的時(shí)間。目前運(yùn)營商可用性指標(biāo)大多要求一年內(nèi)業(yè)務(wù)正常服務(wù)時(shí)間為99.999%。即一年內(nèi)語音業(yè)務(wù)出現(xiàn)故障時(shí)間不能超過5.256分鐘。為保障業(yè)務(wù)的延續(xù)性,運(yùn)營商在網(wǎng)絡(luò)重構(gòu)時(shí),這個(gè)嚴(yán)苛的可用性指標(biāo)被繼承下來,并作為vIMS能否成為語音網(wǎng)絡(luò)重構(gòu)技術(shù)的關(guān)鍵指標(biāo)之一。
從傳統(tǒng)專用硬件構(gòu)成的IMS網(wǎng)絡(luò)來看,軟硬件是一種緊耦合的關(guān)系,軟硬件之間溝通渠道由單廠家完成,協(xié)議是私有協(xié)議,不存在對(duì)協(xié)議理解溝通上的差異,不同硬件服務(wù)于不同功能軟件。這種架構(gòu)軟硬件之間接口單一,轉(zhuǎn)發(fā)效率高,設(shè)備可靠性也高。
從NFV功能架構(gòu)可知,vIMS實(shí)例化首先由協(xié)同編排MANO根據(jù)NFV鏡像和模板要求,組合NFVI層虛擬計(jì)算、存儲(chǔ)、網(wǎng)絡(luò)等資源構(gòu)成一個(gè)個(gè)符合NFV規(guī)格的虛擬機(jī),并在這些虛擬機(jī)上加載相應(yīng)的IMS功能軟件,生成vIMS各種功能網(wǎng)元的過程。從單個(gè)虛機(jī)角度剖析,vIMS網(wǎng)元首先建立在虛機(jī)之上,而虛機(jī)又是由通用硬件、Host OS、Hypervisor、Guest OS、網(wǎng)絡(luò)等顆粒組成,所有接口都開放和標(biāo)準(zhǔn)化,不唯一地為某種軟件所使用,是一種松耦合關(guān)系。適用性廣也就犧牲了包括轉(zhuǎn)發(fā)效率在內(nèi)的能力,設(shè)備可靠性也受到一定影響。除此之外,任何一個(gè)顆粒發(fā)生故障,都可能造成虛機(jī)故障,影響上層應(yīng)用軟件運(yùn)行,最終影響語音業(yè)務(wù)可用性,而虛擬化vIMS比傳統(tǒng)IMS顆粒度更細(xì),顆粒更多。
綜上分析,影響虛擬化IMS網(wǎng)元可靠性有以下因素:
NFVI層面:計(jì)算資源、存儲(chǔ)資源等物理機(jī)層面故障直接影響虛擬機(jī)正常運(yùn)行,網(wǎng)絡(luò)故障則影響虛機(jī)或網(wǎng)元之間信息交換。
虛擬機(jī)層面:包括Host OS、Hypervisor、Guest OS在內(nèi)相關(guān)軟件和進(jìn)程故障。
NFV層面:vIMS網(wǎng)元模塊故障發(fā)現(xiàn)(檢測(cè)效率)、個(gè)別進(jìn)程運(yùn)行故障、吊死。
3? ?vIMS可靠性部署方案
系統(tǒng)可用性指標(biāo)考核的是業(yè)務(wù)正常服務(wù)時(shí)間,不是設(shè)備故障時(shí)間。局部設(shè)備故障,只要不影響業(yè)務(wù)正常服務(wù),就不影響整個(gè)網(wǎng)絡(luò)可靠性。所以提高網(wǎng)絡(luò)可靠性可以從網(wǎng)絡(luò)和網(wǎng)元健壯性著手,最終提升整個(gè)語音系統(tǒng)的可靠性。
從網(wǎng)絡(luò)組成可知,網(wǎng)絡(luò)可靠性分為兩個(gè)層面:網(wǎng)元級(jí)和網(wǎng)絡(luò)級(jí)。網(wǎng)元級(jí)可靠性指單個(gè)網(wǎng)元的可用性,包括網(wǎng)元內(nèi)各個(gè)模塊軟硬件和軟硬件之間交互網(wǎng)絡(luò)的可用性。網(wǎng)絡(luò)級(jí)可靠性指為提供某種功能所需要的所有網(wǎng)元可用性的合集。網(wǎng)元和網(wǎng)絡(luò)之間的可靠性可能會(huì)相互影響,單網(wǎng)元故障造成的雪崩可能會(huì)導(dǎo)致整個(gè)網(wǎng)絡(luò)癱瘓,網(wǎng)元級(jí)安全是可靠性部署的重點(diǎn),做好充分可靠性保護(hù)方案是降低單個(gè)模塊軟硬件故障、網(wǎng)絡(luò)故障和由此產(chǎn)引發(fā)網(wǎng)元可靠性降低的重要舉措,甚至可以實(shí)現(xiàn)單點(diǎn)故障不影響整個(gè)網(wǎng)絡(luò)功能的可用性,從而提高網(wǎng)絡(luò)的健壯和安全。
3.1? ?vIMS網(wǎng)元級(jí)可靠性解決方案
作為網(wǎng)絡(luò)可靠性部署重點(diǎn)的網(wǎng)級(jí)元可靠性保護(hù)分三個(gè)層面,首先是在網(wǎng)元設(shè)計(jì)時(shí)充分考慮安全,其次是網(wǎng)元出現(xiàn)故障時(shí)要及時(shí)發(fā)現(xiàn)和隔離,最后應(yīng)有措施自我修復(fù)。
(1)網(wǎng)元可靠性架構(gòu)設(shè)計(jì)
vIMS的VNF由不同功能模塊VNFC(Virtual Network
Function Component)組成,VNFC之間互相協(xié)助共同完成協(xié)議分發(fā)處理、業(yè)務(wù)控制管理、數(shù)據(jù)存儲(chǔ)管理、媒體報(bào)文處理、告警和維護(hù)管理、營帳和業(yè)務(wù)發(fā)放幾大功能。
如圖2所示,從實(shí)現(xiàn)VNF功能的角度看,僅需要把每種VNFC部署一套即可實(shí)現(xiàn)VNF所有能力,考慮到設(shè)備使用一段時(shí)間后大概率會(huì)出現(xiàn)各種問題,如果每種VNFC只配置一套,單點(diǎn)VNFC故障必然影響VNF能力供給,所以在平衡資源利用率和網(wǎng)絡(luò)可靠性時(shí),不同功能VNFC有不同的設(shè)計(jì)。對(duì)于協(xié)議分發(fā)處理、告警和維護(hù)管理、營帳和業(yè)務(wù)發(fā)放這類業(yè)務(wù)負(fù)荷不是非常繁忙的VNFC通常使用1+1主備方式,在主用故障時(shí),備用及時(shí)接管業(yè)務(wù)。業(yè)務(wù)控制管理、數(shù)據(jù)存儲(chǔ)管理、媒體報(bào)文處理這類和業(yè)務(wù)處理密切相關(guān),工作負(fù)荷大的模塊采用負(fù)荷分擔(dān)方式,在某一VNFC故障時(shí),其他同種VNFC共同分擔(dān)故障VNFC的工作。網(wǎng)元內(nèi)部網(wǎng)絡(luò)設(shè)計(jì)則需要保證在某一VNFC故障時(shí)不影響VNF相關(guān)功能,這就要求有消息交互關(guān)系的VNFC之間通過兩兩互聯(lián)保證其他VNFC即刻接管其工作。
VNFC除了在設(shè)計(jì)過程中需要考慮可靠性外,VNFC在部署時(shí)資源選取也是一個(gè)重要環(huán)節(jié),即VNFC的NUMA親和性和反親和性部署。反親和性部署指vIMS同一網(wǎng)元同種VNFC(有主備關(guān)系或者有負(fù)荷分擔(dān)關(guān)系的功能模塊),實(shí)例化時(shí)必須部署在不同物理機(jī),以防物理機(jī)發(fā)生故障,所有同種VNFC都故障,所有功能相同的模塊一起宕機(jī),業(yè)務(wù)根本沒有倒換到備用或負(fù)荷分擔(dān)模塊的機(jī)會(huì)。NUMA親和性指在分配虛機(jī)資源時(shí),vCPU、內(nèi)存和PCI插槽等采用vCPU對(duì)應(yīng)物理CPU所帶的內(nèi)存和PCI插槽。如圖3所示,NUMA親和性避免了采用不同內(nèi)存和PCI插槽需要經(jīng)過QPI總線轉(zhuǎn)接。顯而易見,NUMA親和性不但提高數(shù)據(jù)轉(zhuǎn)發(fā)效率,數(shù)據(jù)轉(zhuǎn)發(fā)點(diǎn)減少也是提高數(shù)據(jù)轉(zhuǎn)發(fā)可靠性的舉措。圖3虛機(jī)B采用的是另一物理CPU所帶的內(nèi)存和PCI插槽資源,造成數(shù)據(jù)轉(zhuǎn)發(fā)點(diǎn)增多,可靠性降低。
(2)網(wǎng)元內(nèi)部故障檢測(cè)
提升網(wǎng)絡(luò)的可靠性離不開對(duì)網(wǎng)絡(luò)健壯性檢測(cè),vIMS應(yīng)具備自動(dòng)檢測(cè)本身業(yè)務(wù)應(yīng)用進(jìn)程是否正常能力。同一設(shè)備內(nèi)部故障檢測(cè)有幾種方式:
同種有負(fù)荷分擔(dān)關(guān)系的VNFC設(shè)置心跳,定期向控制VNFC匯報(bào)健康狀況。
1+1主備方式的VNFC通過內(nèi)部網(wǎng)絡(luò)互發(fā)心跳,備用VNFC發(fā)現(xiàn)主用心跳異常時(shí),即刻向控制VNFC發(fā)出警告,由控制VNFC決定下一步動(dòng)作。
VNF和Hypervisor之間也應(yīng)有心跳機(jī)制,互相檢測(cè)對(duì)方健康狀態(tài),根據(jù)健康狀態(tài)采取不同恢復(fù)措施。當(dāng)虛機(jī)啟用了HA和“故障本地重啟”后,會(huì)定期向Hypervisor發(fā)送心跳信息,上報(bào)運(yùn)行狀態(tài)。當(dāng)檢測(cè)到虛機(jī)沒有按照設(shè)定時(shí)間發(fā)送心跳時(shí),Hypervisor就判斷虛機(jī)運(yùn)行異常,并根據(jù)故障情況直接進(jìn)行重啟虛機(jī)或者上報(bào)虛擬化基礎(chǔ)設(shè)施管理系統(tǒng)VIM,VIM進(jìn)一步上報(bào)到NFVO,由上層設(shè)定的策略決定當(dāng)前故障采用何種措施。
Hypervisor和硬件資源之間也存在互相檢查機(jī)制,當(dāng)Hypervisor檢查到硬件故障,或者硬件監(jiān)測(cè)到Hypervisor故障時(shí),通知VIM,由VIM通知NFVO決策。
(3)故障自動(dòng)恢復(fù)手段
業(yè)內(nèi)虛擬化可靠性有兩種解決方案:高可用HA和容錯(cuò)FT。vIMS網(wǎng)元的VNFC主要通過設(shè)計(jì)1+1主備、負(fù)荷分擔(dān)等方式實(shí)現(xiàn)HA。FT的解決方案是雙機(jī)熱備。備用VNFC和主用VNFC同步接收數(shù)據(jù)、處理數(shù)據(jù),但是不輸出數(shù)據(jù),實(shí)時(shí)同步主用VNFC數(shù)據(jù)(包括靜態(tài)數(shù)據(jù)和動(dòng)態(tài)數(shù)據(jù)),在主用VNFC發(fā)生故障時(shí)備份設(shè)備可以立刻接管業(yè)務(wù),不丟失任何數(shù)據(jù),不影響業(yè)務(wù)運(yùn)行。但在實(shí)際應(yīng)用中,F(xiàn)T模式對(duì)主備VNFC實(shí)時(shí)同步要求較高,容易造成數(shù)據(jù)不一致,在vIMS網(wǎng)元內(nèi)部應(yīng)用不多。vIMS網(wǎng)元結(jié)合業(yè)務(wù)實(shí)現(xiàn)和HA方案對(duì)故障不同層級(jí)作了層層遞進(jìn)的保護(hù)性措施,在故障被檢測(cè)到時(shí)首先啟動(dòng)故障倒換,把受影響的業(yè)務(wù)倒換到備用或者負(fù)荷分擔(dān)VNFC之后,系統(tǒng)根據(jù)故障程度逐步升級(jí)恢復(fù)手段,從進(jìn)程重啟、虛機(jī)重啟、到I層重建到最后網(wǎng)元級(jí)重建。I層重建按照發(fā)起者不同分為VIM主導(dǎo)發(fā)起和VNFM發(fā)起。
進(jìn)程重啟:VNF某進(jìn)程故障或吊死,操作系統(tǒng)自動(dòng)重啟該進(jìn)程。這個(gè)過程1、2秒內(nèi)可完成,不影響業(yè)務(wù)。
虛機(jī)重啟:重啟和虛機(jī)是否支持HA無關(guān),但虛機(jī)的“故障本地重啟策略”參數(shù)需要開啟。當(dāng)虛機(jī)出現(xiàn)操作系統(tǒng)類故障時(shí),故障將被I層檢測(cè)出來,I層啟動(dòng)虛擬機(jī)的重啟功能,虛機(jī)重啟后恢復(fù),業(yè)務(wù)也同步接管恢復(fù)。這個(gè)過程相當(dāng)于電腦的重啟,對(duì)業(yè)務(wù)基本無影響。例如某個(gè)虛機(jī)操作系統(tǒng)崩潰,I層檢測(cè)到虛機(jī)故障后通知VIM,VIM通知VNFM,VNFM通知VNF進(jìn)行業(yè)務(wù)倒換,同時(shí)I層重啟該虛機(jī),嘗試恢復(fù)故障。
如果虛機(jī)重啟不能恢復(fù),并且虛機(jī)HA開關(guān)打開。VIM檢測(cè)到虛機(jī)不能恢復(fù)時(shí),將故障虛機(jī)下電并通知I層重建虛機(jī)。I層將通過故障虛機(jī)共享存儲(chǔ)中的操作系統(tǒng)、數(shù)據(jù)等在其他物理機(jī)上生成新虛機(jī),這個(gè)過程也稱為I層重建。新虛機(jī)構(gòu)建成功后,原虛機(jī)上所有業(yè)務(wù)也將被遷移到這個(gè)新建的虛機(jī)上。例如虛機(jī)所在的物理機(jī)故障、Hypervisor關(guān)鍵進(jìn)程故障,無法通過重啟虛機(jī)恢復(fù),I層在其他物理機(jī)使用共享存儲(chǔ)上的操作系統(tǒng)和數(shù)據(jù)自動(dòng)復(fù)活。
如果虛機(jī)重啟不能恢復(fù),并且虛機(jī)HA沒有打開。VIM便不能主導(dǎo)虛機(jī)自動(dòng)復(fù)活。這個(gè)過程中VNF一直監(jiān)測(cè)虛機(jī)恢復(fù)狀況,定時(shí)器終了時(shí)間仍未能恢復(fù)時(shí),VNF主動(dòng)向VNFM發(fā)起重建申請(qǐng)(虛機(jī)自愈告警),VNFM收到重建申請(qǐng)后,上報(bào)VIM,VIM確認(rèn)原虛機(jī)確實(shí)處于故障態(tài),把故障虛機(jī)下電后,進(jìn)行虛機(jī)I層重建。這里需要說明VNF監(jiān)測(cè)間不能太短,太短可能會(huì)造成VIM發(fā)起的重建和VNFM發(fā)起的重建沖突,即要避免造成VNFM發(fā)起重建時(shí),VIM發(fā)起的重建已經(jīng)在進(jìn)行當(dāng)中。所以虛機(jī)HA不開啟情況下,恢復(fù)時(shí)間要比打開要長,所以建議vIMS網(wǎng)絡(luò)HA開關(guān)打開。
如果I層重建所必須的,存放在共享存儲(chǔ)中的操作系統(tǒng)、數(shù)據(jù)、VNF配置已經(jīng)損壞,I層就無法采用故障虛機(jī)數(shù)據(jù)直接生成替代虛機(jī)。系統(tǒng)則通過存放在NFVO上的鏡像文件、模板重建虛機(jī)。這個(gè)過程也稱為網(wǎng)元級(jí)重建。虛機(jī)重建成功后,將替代故障虛機(jī)恢復(fù)服務(wù)。
3.2? vIMS網(wǎng)絡(luò)級(jí)可靠性解決方案
vIMS語音網(wǎng)絡(luò)由多種設(shè)備組成,從功能的角度分為核心控制設(shè)備和媒體轉(zhuǎn)發(fā)設(shè)備,核心控制設(shè)備由vCSCF、vMMTEL、vMRFC、vENUM/DNS、vDRA、vHSS等,媒體轉(zhuǎn)發(fā)設(shè)備有vBAC、vMRFP。從平衡資源利用率和可靠性需求考慮,設(shè)備職能不同,部署時(shí)對(duì)資源傾斜度也有所差別。
vCSCF、vMMTEL、vMRFC這類核心控制設(shè)備采用組POOL方案,某一設(shè)備故障,其余N-1接管故障設(shè)備的工作。
vENUM DNS網(wǎng)元包含多個(gè)區(qū)域所有靜態(tài)查詢用戶數(shù)據(jù),采用1主+2備方案,即在核心網(wǎng)絡(luò)節(jié)點(diǎn)城市異局址機(jī)房設(shè)置1主+1備2套vENUM/DNS,同時(shí)在另一核心網(wǎng)絡(luò)節(jié)點(diǎn)城市設(shè)置1套vENUM/DNS設(shè)備作為備份,主用設(shè)備對(duì)2套備用設(shè)備實(shí)時(shí)自動(dòng)同步數(shù)據(jù),以防地震、水災(zāi)等自然災(zāi)害影響所轄區(qū)域用戶使用業(yè)務(wù)。
vDRA主要用于轉(zhuǎn)發(fā)vIMS網(wǎng)Diameter信令,其作用類似PSTN網(wǎng)絡(luò)中信令轉(zhuǎn)接點(diǎn)STP。參考STP可靠性部署方案,根據(jù)vDRA所處位置的不同,部署L-vDRA和H-vDRA。 L-vDRA之間、H-vDRA之間采用1+1負(fù)荷分擔(dān)方式, L-vDRA和H-vDRA之間采用雙平面異構(gòu)組網(wǎng)方式。
vHSS采用1+1互助方案,vHSS的兩套設(shè)備都處于主用狀態(tài),但是對(duì)于用戶A,vHSS1是主用,vHSS2是備用,而用戶B則反過來。這種方法既盡量提高設(shè)備使用率,又保障安全可靠。
vBAC、vMRFP也采用組POOL負(fù)荷分擔(dān)方案,其中一套設(shè)備故障,由其他N-1套接管業(yè)務(wù)。
4? ?結(jié)束語
綜上,通過分析語音網(wǎng)絡(luò)對(duì)可靠性需求以及對(duì)NFV架構(gòu)、vIMS整體架構(gòu)和單網(wǎng)元設(shè)備各層面詳細(xì)分析影響vIMS可靠性的因素(包括計(jì)算、存儲(chǔ)等物理資源層面;Host OS、Hypervisor、Guest OS軟件層面以及網(wǎng)元故障檢測(cè)效率等方法論層面),建議在vIMS實(shí)際部署中,從網(wǎng)元級(jí)和網(wǎng)絡(luò)級(jí)兩方面加以考慮。
網(wǎng)元級(jí)可靠性從三個(gè)層面保障:網(wǎng)元架構(gòu)設(shè)計(jì)中保證VNFC反親和性部署、虛機(jī)采用NUMA親和性部署,VNFC根據(jù)業(yè)務(wù)量繁忙程度采用雙機(jī)主備或者負(fù)荷分擔(dān)。為保證故障檢測(cè)實(shí)時(shí)性,有主備關(guān)系或負(fù)荷分擔(dān)關(guān)系的VNFC之間須設(shè)置心跳,VNF和Hypervisor之間、Hypervisor和硬件資源之間心跳也必須打開。在保證故障恢復(fù)手段方面要求虛機(jī)HA和 “故障本地重啟策略”開關(guān)必須開啟,定期檢查共享存儲(chǔ)和存放的操作系統(tǒng)、配置文件是否完好,以免因?yàn)楣蚕泶鎯?chǔ)或者其中的數(shù)據(jù)和軟件損壞造成I層重建不成功。
在vIMS整體組網(wǎng)設(shè)計(jì)則組合采用網(wǎng)絡(luò)級(jí)可靠性組網(wǎng),不同功能的網(wǎng)元分別采用不同方案。核心控制設(shè)備、媒體轉(zhuǎn)發(fā)設(shè)備采用組POOL方式、包含多個(gè)區(qū)域所有靜態(tài)用戶數(shù)據(jù)設(shè)備采用1主+2備方案,本區(qū)域用戶數(shù)據(jù)設(shè)備采用1+1互助方案,Diameter信令轉(zhuǎn)發(fā)設(shè)備采用雙平面異構(gòu)組網(wǎng)。
通過網(wǎng)元級(jí)、網(wǎng)絡(luò)級(jí)可靠性組網(wǎng)方案最終從網(wǎng)元、網(wǎng)絡(luò)的角度全方位保障vIMS業(yè)務(wù)安全、穩(wěn)定運(yùn)行。
參考文獻(xiàn):
[1]? ? ? 張靖. 網(wǎng)構(gòu)軟件可靠性技術(shù)研究[M]. 成都: 西南交通大學(xué)出版社, 2017.
[2]? ? ? 曾聲奎. 可靠性設(shè)計(jì)分析基礎(chǔ)[M]. 北京: 北京航空航天大學(xué)出版社, 2015.
[3]? ? ?李素游,壽國礎(chǔ). 網(wǎng)絡(luò)功能虛擬化NFV架構(gòu)、開發(fā)、測(cè)試及應(yīng)用[M]. 北京: 人民郵電出版社, 2017.
[4]? ? ? 顧炯炯. 云計(jì)算架構(gòu)技術(shù)與實(shí)踐[M]. 北京: 清華大學(xué)出版社, 2016.
[5]? ? ?唐青昊,毛大鵬. 云虛擬化安全攻防實(shí)踐[M]. 北京: 電子工業(yè)出版社, 2018.
[6]? ? ?唐宏,秦潤峰,范均倫. 開源云OpenStack技術(shù)指南[M]. 北京: 科學(xué)出版社, 2017.
[7]? ? ? 戴夫· 沙克爾福. 虛擬化安全解決方案[M]. 北京: 機(jī)械工業(yè)出版社, 2015.
[8]? ? ? 凱文· 杰克遜,科迪· 邦奇.? OpenStack云計(jì)算實(shí)戰(zhàn)手冊(cè) [M]. 北京: 人民郵電出版社, 2018.
[9]? ? ?何坤源. Linux KVM虛擬化架構(gòu)實(shí)戰(zhàn)指南[M]. 北京: 人民郵電出版社, 2015.
[10]? ?謝朝陽. 云計(jì)算:規(guī)劃、實(shí)施、運(yùn)維[M]. 北京: 電子工業(yè)出版社, 2015.
作者簡介
雷多萍(orcid.org/0000-0001-5597-605X):高級(jí)工程師,學(xué)士,現(xiàn)任職于中國電信股份有限公司智能網(wǎng)絡(luò)與終端研究院,從事網(wǎng)絡(luò)技術(shù)研究和支撐工作。
鄧勇:學(xué)士,現(xiàn)任職于中國電信集團(tuán)公司網(wǎng)絡(luò)運(yùn)行維護(hù)事業(yè)部,從事核心網(wǎng)維護(hù)管理工作。
彭莉:現(xiàn)任職于中國電信股份有限公司智能網(wǎng)絡(luò)與終端研究院,從事電信網(wǎng)技術(shù)和網(wǎng)絡(luò)發(fā)展戰(zhàn)略研究工作。