劉淑祎
(中國移動通信集團(tuán)河北有限公司,河北 石家莊 050020)
5G 網(wǎng)絡(luò)不僅可以更好、更快地滿足普通大眾用戶的上網(wǎng)和語音業(yè)務(wù)需求,使更多的人享受到移動網(wǎng)絡(luò)的便捷性,而且提供了一種面向工業(yè)生產(chǎn)、企業(yè)信息化改造等不同種類應(yīng)用的高質(zhì)量無線接入網(wǎng)絡(luò)。眾所周知,5G 網(wǎng)絡(luò)可以提供增強(qiáng)移動帶寬、高可靠低時延及大規(guī)模機(jī)器通信三類業(yè)務(wù),其中增強(qiáng)移動帶寬主要面向的是普通大眾用戶,而另外兩種則更多地面向企業(yè)生產(chǎn)和物聯(lián)網(wǎng)等各種行業(yè)應(yīng)用[1-3]。
在5G 網(wǎng)絡(luò)時代,將有數(shù)以億計(jì)的設(shè)備通過5G網(wǎng)絡(luò)應(yīng)用實(shí)現(xiàn)互聯(lián)互通,如面向鋼鐵生產(chǎn)的5G 無人天車應(yīng)用,面向港口業(yè)務(wù)的5G 自動裝船機(jī)應(yīng)用及面向工業(yè)園區(qū)的5G 智能倉儲應(yīng)用等。由于不同企業(yè)生產(chǎn)應(yīng)用的特征不同,對5G 網(wǎng)絡(luò)可靠性的要求也不盡相同,而無線網(wǎng)絡(luò)需要滿足不同行業(yè)應(yīng)用的業(yè)務(wù)等級協(xié)定(Service Level Agreement,SLA)要求[4]。SLA 是一種由服務(wù)提供商與用戶協(xié)商后的約定,明確了服務(wù)商提供具體服務(wù)的能力、可靠性、可用性、性能及響應(yīng)速度或其他屬性。SLA 在5G面向商業(yè)(to Business,ToB)的業(yè)務(wù)中具體指網(wǎng)絡(luò)運(yùn)營商對垂直行業(yè)提供無線網(wǎng)絡(luò)的規(guī)格能力[5]。
對于任何一種5G ToB 行業(yè)應(yīng)用而言,其不僅涉及無線側(cè),也涉及傳輸、核心網(wǎng)及終端等多個環(huán)節(jié),其網(wǎng)絡(luò)組成也是一種端到端的組網(wǎng)設(shè)計(jì)。本文主要針對基于5G 的ToB 行業(yè)應(yīng)用高可用性網(wǎng)絡(luò)方案進(jìn)行研究。本文首先介紹了SLA 中,與可用度及高可用性相關(guān)的技術(shù);其次在此基礎(chǔ)上給出了幾種不同的高可用性技術(shù)性能提升方案;最后結(jié)合相關(guān)案例進(jìn)行了說明,以期支撐面向5G ToB 的行業(yè)應(yīng)用拓展和業(yè)務(wù)交流,進(jìn)一步發(fā)揮5G 網(wǎng)絡(luò)價值。
目前,5G 無論是在技術(shù)、標(biāo)準(zhǔn)、產(chǎn)業(yè)生態(tài)還是網(wǎng)絡(luò)部署等方面都取得了階段性的成果,5G 行業(yè)場景逐漸成為業(yè)界關(guān)注的焦點(diǎn)。描述行業(yè)應(yīng)用的基本性能有時延、吞吐量、可用性和彈性等不同的SLA 指標(biāo),因此5G 要在行業(yè)應(yīng)用中發(fā)揮自身價值,滿足SLA 要求是基礎(chǔ)。不同5G 行業(yè)應(yīng)用如上行大帶寬、低時延高可靠性及高精度定位等,對SLA 要求的差異很大,SLA 指標(biāo)要能夠匹配不同行業(yè)的差異化要求[6-8]。SLA 明確了通信網(wǎng)絡(luò)要高可靠性地滿足設(shè)備性能和無線性能的要求,如果不滿足,則可能造成生產(chǎn)業(yè)務(wù)中斷,甚至導(dǎo)致生產(chǎn)事故發(fā)生。下面重點(diǎn)介紹SLA 中與可用性相關(guān)的指標(biāo)。
可用度指的是對可用性的概率度量。可用度A與MTTR,MTBF之間的關(guān)系為:
式中:MTBF為平均故障間隔時間(Mean Time Between Failures),是可修復(fù)產(chǎn)品可靠性的一個基本度量,即在規(guī)定狀態(tài)下的特定測量區(qū)間內(nèi),產(chǎn)品的所有部件能夠在指定范圍內(nèi)完成工作的壽命單位均值;MTTR為平均故障恢復(fù)時間(Mean Time to Repair),是產(chǎn)品維修性的一種基本參數(shù),其度量方法為,在規(guī)定的條件下和規(guī)定的時間內(nèi),產(chǎn)品在任一規(guī)定的維修級別上,修復(fù)性維修總時間與在該級別上被修復(fù)產(chǎn)品的故障總數(shù)之比[9-11]。
按照馬爾可夫模型計(jì)算,通信設(shè)備商只需要分析和提供無線網(wǎng)絡(luò)系統(tǒng)的可用度。網(wǎng)絡(luò)可用度A網(wǎng)絡(luò)等于核心網(wǎng)(Core Network,CN)、傳輸網(wǎng)絡(luò)(Transmission Network,TN)及無線接入網(wǎng)(Radio Access Network,RAN)的可用度Acn,Atn和Aran的乘積,即:
要計(jì)算網(wǎng)元可用度指標(biāo),需要先計(jì)算單板故障率,而單板故障率又是該單板上所有器件故障率的累加,包括元器件故障率、單板故障率、網(wǎng)元可用度及MTTR參數(shù)。
1.3.1 元器件故障率
元器件故障率φSSi的計(jì)算公式為:
式中:φGi為第i個器件的一般穩(wěn)態(tài)故障率;πQi為第i個器件的質(zhì)量因子;πSi為第i個器件的應(yīng)力因子;πTi為第i個器件在一般工作溫度下穩(wěn)態(tài)的穩(wěn)定因子。
1.3.2 單板故障率
單板故障率是指該單板上所有器件故障率的累計(jì),其計(jì)算方法為,其中,n為單板上不同器件類型的種類數(shù),Ni為第i個器件類型的數(shù)量,πE為單元環(huán)境因子。
1.3.3 網(wǎng)元可用度計(jì)算
網(wǎng)元可用度中,串聯(lián)結(jié)構(gòu)的故障率是各單元故障率的累加,冗余系統(tǒng)采用可修產(chǎn)品的馬爾可夫模型計(jì)算。MTBF為故障率的倒數(shù),可用度A與上文計(jì)算方法一致。
1.3.4 MTTR 參數(shù)確定
根據(jù)MIL-HDBK-472《美軍標(biāo) 維修性預(yù)計(jì)手冊》的基本原則以及工程經(jīng)驗(yàn)和現(xiàn)場數(shù)據(jù),確定各單元及設(shè)備的平均修復(fù)時間MTTR為1 h(不包括路途時間)。如果包括路途時間,MTTR通常為3 h。在具體實(shí)施中,各產(chǎn)品的MTTR取值可能會有所不同[12-13]。
在當(dāng)前的5G ToB 行業(yè)應(yīng)用中,結(jié)合具體業(yè)務(wù)需求引入了CN、TN、RAN 及無線端側(cè)相關(guān)設(shè)備。CN、TN 通常采用全冗余備份,RAN、客戶終端設(shè)備(Customer-Premises Equipment,CPE)一般為非冗余。在特別強(qiáng)調(diào)高可用的場景,RAN 和CPE 終端也會采用冗余方式進(jìn)行部署。通常無線端側(cè)設(shè)備故障影響范圍小,一般不會構(gòu)成事故,可以不計(jì)入網(wǎng)絡(luò)可用度,此時計(jì)算公式為:網(wǎng)絡(luò)可用度=CN 可用度×TN 可用度×RAN 可用度[14-15]。
根據(jù)以上介紹的方法論,可以得到5G 核心網(wǎng)的系統(tǒng)可靠性模型如圖1 所示。表1 所示為可靠性指標(biāo)估計(jì)結(jié)果。
圖1 核心網(wǎng)系統(tǒng)可靠性模型
表1 核心網(wǎng)可靠性指標(biāo)估計(jì)結(jié)果
在5G ToB 網(wǎng)絡(luò)中,基帶單元(Baseband Unit,BBU)接入TN 網(wǎng)絡(luò)主要采用TN 節(jié)點(diǎn)雙主控單節(jié)點(diǎn)組網(wǎng)模式。考慮ToB 業(yè)務(wù)的高SLA 要求,同時對雙節(jié)點(diǎn)組網(wǎng)進(jìn)行分析,所有節(jié)點(diǎn)電源/風(fēng)扇都進(jìn)行冗余配置(如果存在板卡冗余的時候)??煽啃阅P桶ㄒ韵? 種模型:
(1)BBU 單Eth 端口接入TN 節(jié)點(diǎn),TN 設(shè)備雙主控、環(huán)網(wǎng)/雙歸組網(wǎng);
(2)BBU 雙Eth 端口雙歸TN 節(jié)點(diǎn),每個節(jié)點(diǎn)雙主控配置,與匯聚側(cè)網(wǎng)關(guān)(Aggregation Site Gateway,ASG)環(huán)網(wǎng)/雙歸組網(wǎng);
(3)BBU 四Eth 端口雙歸TN 節(jié)點(diǎn),每個節(jié)點(diǎn)雙主控配置,與ASG 環(huán)網(wǎng)/雙歸組網(wǎng)。
表2 所示為3 種可靠性模型硬件配置方式。
表2 承載網(wǎng)可靠性模型配置
3 種不同模式下,傳輸網(wǎng)TN 節(jié)點(diǎn)可用度指標(biāo)分別在MTTR=1 h 和MTTR=3 h 情況下的結(jié)果如表3 所示。
職業(yè)培訓(xùn)模塊包括報關(guān)員培訓(xùn)、普通話培訓(xùn)、單證員培訓(xùn)等。這一模塊根據(jù)職業(yè)需求注重學(xué)生職業(yè)資格證書的獲取,針對性很強(qiáng)。
表3 不同TN 模式下可靠性指標(biāo)
在ToB 行業(yè)應(yīng)用中,5G 網(wǎng)絡(luò)RAN 側(cè)的可用度由于企業(yè)對Downtime 計(jì)算規(guī)則的不同,因此體現(xiàn)出較大的差異性。本文主要針對ToB 公網(wǎng)模式進(jìn)行闡述,其中MTTR按照1 h 計(jì)算。在實(shí)際5G ToB 公網(wǎng)配置中,較多地采用了表4 中的配置1 和配置2,配置3 相對較少。配置1 中各單板均為無冗余配置;配置2 中BBU 電源板采用了冗余配置;配置3 中BBU 電源板、BBU 主控板采用了冗余配置。
表4 5G ToB 無線側(cè)網(wǎng)絡(luò)可用度配置
表5 所示為配置1、配置2 和配置3 情況下分別對應(yīng)RRU/AAU 時的可用度指標(biāo)。
表5 5G RAN 側(cè)網(wǎng)絡(luò)可靠性指標(biāo)
在不考慮時延等其他條件的情況下,模組、CPE 或手機(jī)終端可用度指標(biāo)一般在99.95%以上,功能基本可用。AR 路由器可分為單卡和多卡,兩者在可用度設(shè)計(jì)上是一致的,可靠性為99.999 25%,MTBF為267 180 h,30.50 y,Downtime 為3.93 min/y。端側(cè)組網(wǎng)有表6 所示的4 種配置。
表6 端側(cè)組網(wǎng)可用度評估
在實(shí)際的5G ToB 園區(qū)組網(wǎng)中,通常使用公網(wǎng)的核心網(wǎng)CN,同時在園區(qū)也會部署本地CN(主要是指用戶面UPF 下沉),兩者按照串聯(lián)模型處理(在后續(xù)演化中,也有可能變成并聯(lián)模型)。此時,網(wǎng)絡(luò)可用度為CN 可用度、CN 本地可用度、TN 可用度、RAN 可用度的乘積。其中CN、本地CN、TN采用全冗余組網(wǎng),RAN 按照不同配置場景可用度由高到低選取不同配置組合。這里MTTR取1 h。在主要考慮硬件故障原因時,對應(yīng)的網(wǎng)絡(luò)可用度見表7。
表7 網(wǎng)絡(luò)可用度評估結(jié)果
無線網(wǎng)絡(luò)可用度主要用于描述網(wǎng)絡(luò)故障中斷的影響,相比丟包中斷來說,一般中斷時間比較長(分鐘級到小時級),但中斷頻次會比較低。鋼鐵、軌道、港口等行業(yè)還對升級中斷、MTTR故障維修時間、故障倒換時間等指標(biāo)提出了明確的要求。
為了提高業(yè)務(wù)可用性,在終端組網(wǎng)方面,有AR 路由器與5G 射頻單元、AR 路由器與5G CPE終端和AR 路由器與5G 板卡3 種不同的連接方式。這3 種連接方式可靠性無差別,可以根據(jù)可得性靈活選取。有兩種工作模擬,AR 雙發(fā)選收可以實(shí)現(xiàn)0 ms 業(yè)務(wù)倒換和0 丟包;1+1 備份可以實(shí)現(xiàn)100 ms的鏈路倒換功能。
在無線側(cè)組網(wǎng)方面,可以通過AB 網(wǎng)異頻雙活的方式提高可靠性。當(dāng)小區(qū)出現(xiàn)故障、異常等問題時,通過小區(qū)重選駐留到正常的小區(qū),倒換時間依賴終端,一般在10 s 左右。也可以通過主備倒換實(shí)現(xiàn),其中主控板、基帶板倒換一般耗時6 min,射頻模塊主備倒換一般耗時1 min。圖2 所示為主備倒換功能,其中射頻匯聚單元(radio HUB,rHUB)主要用于站點(diǎn)射頻信號的匯聚。
圖2 無線側(cè)主備倒換
在核心網(wǎng)組網(wǎng)方面,可以通過核心網(wǎng)相關(guān)功能冗余備份提升網(wǎng)絡(luò)可用性,如圖3 所示。
圖3 核心網(wǎng)側(cè)可靠性組網(wǎng)方案
針對穩(wěn)定低時延ToB 應(yīng)用場景,可以采用核心網(wǎng)用戶面下沉本地/企業(yè)園區(qū)內(nèi)部+AR 雙發(fā)選收技術(shù),整體方案如圖4 所示。其中無線空口可以通過5QI 預(yù)調(diào)度、時延參數(shù)優(yōu)化等方式降低時延;核心網(wǎng)可以通過用戶面UPF 下沉園區(qū)實(shí)現(xiàn)時延大幅降低;端側(cè)可以通過AR 雙發(fā)選收功能實(shí)現(xiàn)時延降低和可靠性提升。
圖4 穩(wěn)定低時延可靠性組網(wǎng)方案
其中,AR 雙發(fā)選收的技術(shù)原理為,發(fā)送端通過配置鏈路組,并按優(yōu)先級指定備份鏈路,將報文復(fù)制到其他鏈路發(fā)送出去,即使某條鏈路丟包或突發(fā)大時延,其他鏈路復(fù)制的報文仍然可以發(fā)送到對端,降低網(wǎng)絡(luò)時延和丟包率,提高可靠性。
圖5 所示為采用AB 雙網(wǎng)高可用性組網(wǎng)的案例,其中在無線側(cè),在同一業(yè)務(wù)覆蓋區(qū),部署AB 兩張網(wǎng)絡(luò),雙網(wǎng)采用相互隔離、互不干擾的頻率,實(shí)現(xiàn)雙頻冗余覆蓋。當(dāng)一個頻段設(shè)備故障時,業(yè)務(wù)可通過另一頻段保持業(yè)務(wù)的連續(xù)性。BBU 主控板和基帶板采用單配模式,存在兩種場景:
圖5 AB 雙網(wǎng)高可用數(shù)據(jù)面組網(wǎng)
(1)硬件pRRU 故障,小區(qū)正常。當(dāng)終端所在區(qū)域信號惡化時,通過異頻小區(qū)切換流程,保證業(yè)務(wù)連續(xù)性,倒換時間為異頻切換時間。
(2)小區(qū)級故障,小區(qū)異常。通過小區(qū)重選,選擇駐留到正常的小區(qū),倒換時間依賴終端,~10 s。
在承載側(cè),根據(jù)園區(qū)規(guī)模大小,基站側(cè)網(wǎng)關(guān)(Cell Site Gateway,CSG)與ASG 可合一或者分立,雙機(jī)熱備,路由倒換,~50 ms。
在核心網(wǎng)側(cè),當(dāng)前雙機(jī)為冷備方案,用戶切換業(yè)務(wù)中斷15~45 s。
隨著5G 網(wǎng)絡(luò)的逐步成熟,其在垂直行業(yè)的應(yīng)用領(lǐng)域也在逐步擴(kuò)展。針對不同的行業(yè)應(yīng)用場景,結(jié)合網(wǎng)絡(luò)設(shè)備能力、應(yīng)用環(huán)境及綜合造價等方面,選擇合理的業(yè)務(wù)可用性標(biāo)準(zhǔn)SLA,是實(shí)現(xiàn)5G ToB網(wǎng)絡(luò)價值的必要基礎(chǔ)。本文介紹了不同SLA 業(yè)務(wù)可用度指標(biāo)的定義,總結(jié)歸納了基于5G 的SLA 網(wǎng)絡(luò)可用性模型,并根據(jù)不同的業(yè)務(wù)SLA 級別選擇組網(wǎng)方案和技術(shù),提供了具備競爭力的解決方案。由于5G ToB 業(yè)務(wù)仍在不斷發(fā)展,后續(xù)仍需加強(qiáng)在企業(yè)端到端組網(wǎng)可靠性和切片等方面的研究,實(shí)現(xiàn)5G 網(wǎng)絡(luò)價值的最大化。