劉天雪 郝雙洋 楊姣等
摘要:圍繞數(shù)字化運(yùn)營建設(shè)要求,基于VoLTE端到端關(guān)聯(lián)分析系統(tǒng)多維度對IMS域網(wǎng)絡(luò)關(guān)鍵性能指標(biāo)中的相關(guān)失敗次數(shù)做波動(dòng)分析,實(shí)現(xiàn)網(wǎng)絡(luò)KPI波動(dòng)告警和劣化指標(biāo)異常原因定界定位,對網(wǎng)絡(luò)異常做出智能預(yù)警,在問題暴露前優(yōu)化網(wǎng)絡(luò),以免對業(yè)務(wù)造成影響。通過數(shù)智化手段多維度分析定位移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根固,實(shí)現(xiàn)網(wǎng)絡(luò)隱患故障的早預(yù)警、早發(fā)現(xiàn)、早處理,提升運(yùn)營效率和網(wǎng)絡(luò)質(zhì)量。
關(guān)鍵詞:數(shù)字化運(yùn)營;語音質(zhì)差根因;運(yùn)營效率
中圖法分類號:TN929 文獻(xiàn)標(biāo)識碼:A
1 引言
隨著移動(dòng)通信網(wǎng)的不斷發(fā)展,基于IMS 網(wǎng)絡(luò)的移動(dòng)網(wǎng)絡(luò)語音方案已成為主流,但是VoLTE 語音呼叫流程復(fù)雜,一次呼叫經(jīng)過多個(gè)域,眾多網(wǎng)元、核心網(wǎng)側(cè)信令交互達(dá)100 多次,在發(fā)生定位故障及處理用戶投訴時(shí),為了對每一個(gè)異常故障及呼叫做到準(zhǔn)確歸因,需要有經(jīng)驗(yàn)的工程師花費(fèi)近1 小時(shí)或更長時(shí)間進(jìn)行根因判斷定位,這不僅耗時(shí)耗力,而且效率低下。
傳統(tǒng)運(yùn)維模式不僅低效,還消耗了大量的人力資源。傳統(tǒng)運(yùn)維一直處于被動(dòng)運(yùn)維的狀態(tài),因此若要由被動(dòng)變主動(dòng),提高維護(hù)效率是關(guān)鍵。本文從提升核心網(wǎng)網(wǎng)絡(luò)質(zhì)量和人員維護(hù)效率角度,構(gòu)建移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位模型,通過監(jiān)控移動(dòng)核心網(wǎng)網(wǎng)元關(guān)鍵指標(biāo)閾值準(zhǔn)確發(fā)現(xiàn)質(zhì)差指標(biāo),利用多接口關(guān)聯(lián)的端到端平臺,自動(dòng)完成質(zhì)差指標(biāo)的分析和定界,并將定界結(jié)果輸出給相關(guān)專業(yè)人員進(jìn)行優(yōu)化,做到準(zhǔn)確、及時(shí)、主動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)隱患故障問題,以達(dá)到提升網(wǎng)絡(luò)質(zhì)量和維護(hù)效率的目的。
2 移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位模型概述
2.1 整體描述
移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位模型分為數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)分析與生產(chǎn)派單系統(tǒng)互通等模塊。
數(shù)據(jù)采集,結(jié)合維護(hù)一線在數(shù)字化轉(zhuǎn)型過程的使用需求,依托VoLTE 端到端關(guān)聯(lián)分析平臺數(shù)據(jù),將三域XDR 話單和MR 話單進(jìn)行數(shù)據(jù)統(tǒng)一采集,具體采集5GC 域(8 個(gè)) N1/ N2,N7,N8,N10,N11,N12,N14,N26 等接口XDR 話單;EPC 域(1 個(gè)) S1?MME 接口XDR 話單;IMS 域(11 個(gè)) Gm,Mw,ISC,Mg,Mi/ Mj,Mx,Rx,Gx,Cx,Sh,SGi 媒體等接口XDR 話單,以及4G/5G MR 話單。其實(shí)現(xiàn)了各域數(shù)據(jù)的統(tǒng)一采集,為后續(xù)的數(shù)據(jù)分析提供有效、實(shí)時(shí)、準(zhǔn)確的數(shù)據(jù)源。
數(shù)據(jù)處理,在深入理解移動(dòng)網(wǎng)語音業(yè)務(wù)及信令特征的基礎(chǔ)上,將一次業(yè)務(wù)所涵蓋的5GC,IMS,EPC 三域各單接口話單以及MR 話單,根據(jù)時(shí)間、號碼、會(huì)話ID 等信息,合成一條多接口關(guān)聯(lián)的端到端話單。數(shù)據(jù)的統(tǒng)一整合、統(tǒng)一處理,實(shí)現(xiàn)了數(shù)字化能力的一點(diǎn)處理。
數(shù)據(jù)分析,是監(jiān)控5 分鐘粒度的關(guān)鍵指標(biāo)。其利用策略梯度算法,學(xué)習(xí)預(yù)測動(dòng)態(tài)閾值,精準(zhǔn)發(fā)現(xiàn)質(zhì)差指標(biāo),結(jié)合多域端到端關(guān)聯(lián)數(shù)據(jù),進(jìn)一步對指標(biāo)進(jìn)行大數(shù)據(jù)智能分析。按照不同維度、不同時(shí)間粒度聚類分析,利用決策樹算法,根據(jù)不同原因的劣化權(quán)重和劣化偏離度,自動(dòng)匹配專家知識庫,定位質(zhì)差故障節(jié)點(diǎn)和故障原因,輸出質(zhì)差根因,從而實(shí)現(xiàn)網(wǎng)絡(luò)隱患故障的早預(yù)警、早發(fā)現(xiàn)、早處理,提升運(yùn)營效率和網(wǎng)絡(luò)質(zhì)量。
與生產(chǎn)派單系統(tǒng)互通,實(shí)現(xiàn)帶有根因定位的異常KPI 波動(dòng)告警,通過一級NFO 派發(fā)到專業(yè)人員,并對返單內(nèi)容進(jìn)行分析處理。
2.2 主要功能描述
(1)數(shù)據(jù)采集。
采集5GC 域,EPC 域,IMS 域以及MR 話單,并對其進(jìn)行校驗(yàn),自動(dòng)修正異常數(shù)據(jù),按照分鐘級粒度將數(shù)據(jù)匯聚到文件,并對文件內(nèi)的記錄按照時(shí)間進(jìn)行排序存儲(chǔ)。
(2)多接口話單呈現(xiàn)。
對采集到的數(shù)據(jù),進(jìn)行全業(yè)務(wù)流程的端到端關(guān)聯(lián),形成多接口的VoLTE/ EPS 及FB/ VoNR 業(yè)務(wù)話單,同時(shí)關(guān)聯(lián)跨域端到端全流程的業(yè)務(wù)結(jié)果、首拆網(wǎng)元、錯(cuò)誤碼、定界原因等業(yè)務(wù)質(zhì)量字段。
(3)移動(dòng)網(wǎng)語音業(yè)務(wù)關(guān)鍵指標(biāo)呈現(xiàn)。
通過報(bào)表和圖形化方式,呈現(xiàn)移動(dòng)網(wǎng)語音業(yè)務(wù)關(guān)鍵指標(biāo),包括VoLTE 初始注冊成功、VoLTE 網(wǎng)絡(luò)接通率(剔除用戶原因) 、VoLTE TO VoLTE 接續(xù)時(shí)延、EPSFB 成功率、尋呼成功率等。
(4)質(zhì)差根因分析。
通過監(jiān)控5 分鐘粒度的關(guān)鍵指標(biāo),利用策略梯度算法,學(xué)習(xí)預(yù)測動(dòng)態(tài)閾值,精準(zhǔn)發(fā)現(xiàn)質(zhì)差指標(biāo),結(jié)合多域端到端關(guān)聯(lián)數(shù)據(jù),進(jìn)一步對性能指標(biāo)進(jìn)行大數(shù)據(jù)智能分析,按照不同維度、不同時(shí)間粒度聚類分析,利用決策樹算法,根據(jù)不同原因的劣化權(quán)重和劣化偏離度,自動(dòng)匹配專家知識庫,定位質(zhì)差故障節(jié)點(diǎn)和故障原因,數(shù)智化輸出質(zhì)差根因[1~2] 。
質(zhì)差根因分析模型的主要功能如下。
① KPI 指標(biāo)異常檢測。通過監(jiān)控5 分鐘粒度的IMS 域關(guān)鍵性能指標(biāo),利用策略梯度算法,學(xué)習(xí)預(yù)測動(dòng)態(tài)閾值,精準(zhǔn)發(fā)現(xiàn)質(zhì)差指標(biāo)。通過劣化指標(biāo)可以及時(shí)發(fā)現(xiàn)網(wǎng)絡(luò)存在的風(fēng)險(xiǎn)、隱患等,以便運(yùn)營人員及時(shí)采取相應(yīng)的解決和優(yōu)化措施,降低網(wǎng)絡(luò)故障率,提高運(yùn)營效率。
② 網(wǎng)元級聚類分析。按5 分鐘、15 分鐘、1 小時(shí)、1 天等多時(shí)間粒度,以關(guān)鍵KPI 為入口,自動(dòng)實(shí)現(xiàn)網(wǎng)元維度異常原因的逐層鉆取分析,精準(zhǔn)定位故障網(wǎng)元。
并以圖形化界面簡單清晰地呈現(xiàn)SIP 首拆占比、定界域占比、定界結(jié)果占比。
③ 用戶級聚類分析。以用戶業(yè)務(wù)記錄為入口,實(shí)現(xiàn)用戶任意時(shí)間粒度失敗業(yè)務(wù)的SIP 首拆消息、定界域、定界網(wǎng)元報(bào)表的高效呈現(xiàn)。
④ 小區(qū)級聚類分析。按5 分鐘、15 分鐘、1 小時(shí)、1 天等多時(shí)間粒度,以關(guān)鍵KPI 為入口,智能實(shí)現(xiàn)小區(qū)維度異常原因的逐層鉆取分析,精準(zhǔn)定位質(zhì)差小區(qū),并以圖形化界面直觀呈現(xiàn)SIP 首拆占比、定界域占比、定界結(jié)果占比[3~6] 。
(5)專家?guī)炷P汀?/p>
針對不同網(wǎng)絡(luò)指標(biāo),通過地市維度、網(wǎng)元維度、小區(qū)維度、終端維度進(jìn)行聚類分析,得出劣化的錯(cuò)誤碼、警告代碼、警告正文等信息,若能匹配上專家?guī)欤瑒t直接輸出專家?guī)斓亩ń缃Y(jié)果、定界原因和處理建議,轉(zhuǎn)專業(yè)人員直接優(yōu)化處理;若不能匹配上專家?guī)?,則轉(zhuǎn)專家分析,對分析結(jié)果進(jìn)行現(xiàn)網(wǎng)驗(yàn)證,固化該質(zhì)差場景的信令特征,并將其增加到專家根因庫。
專家?guī)鞂⒃蛎鞔_或經(jīng)過回單驗(yàn)證過的根因和處理方法進(jìn)行逐一匯總,并通過智能算法對回單結(jié)果進(jìn)行分析處理,不斷優(yōu)化、更新、完善專家?guī)臁?/p>
移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位系統(tǒng)根據(jù)不同的語音質(zhì)差場景建立對應(yīng)的專家?guī)炷P?,如VoLT?初始注冊異常根因庫、VoLTE 網(wǎng)絡(luò)接通異常根因庫和EPSFB網(wǎng)絡(luò)接通率根因庫模型等。
(6)解決方案智能匹配。
針對劣化指標(biāo),關(guān)聯(lián)根因庫對其進(jìn)行定界定位,基于根因定位結(jié)果,智能生成相應(yīng)的解決方案。
(7)工單系統(tǒng)對接及交互。
和工單系統(tǒng)同步工單編號、工單主題、派單日期、工單狀態(tài)、質(zhì)差根因、解決方案。系統(tǒng)根據(jù)派單規(guī)則和根因定位情況,將KPI 指標(biāo)異常的告警派發(fā)到相關(guān)單位或相關(guān)人員進(jìn)行處理,攜帶信息主要包括網(wǎng)絡(luò)類型、網(wǎng)元名稱、KPI 名稱、時(shí)間、異常情況、波動(dòng)子項(xiàng)信息、根因定位、建議處理步驟等。接單人對KPI 異常波動(dòng)告警工單進(jìn)行處理,直至告警恢復(fù)。告警恢復(fù)后,總結(jié)處理步驟,并按照固定格式回單。
(8)專家?guī)旄隆?/p>
專家?guī)旄虏扇≈悄埽粒?算法進(jìn)行自動(dòng)學(xué)習(xí)更新,系統(tǒng)支持根據(jù)回單結(jié)果對專家?guī)熘械母蚨ㄎ贿M(jìn)行更新,包括對指標(biāo)檢測閾值進(jìn)行調(diào)整優(yōu)化,以不斷提升系統(tǒng)告警有效性和根因定位準(zhǔn)確性。
系統(tǒng)根據(jù)關(guān)鍵字段對回單內(nèi)容進(jìn)行機(jī)器學(xué)習(xí)建模,自動(dòng)分析學(xué)習(xí)回單內(nèi)容,輸出關(guān)鍵詞匯,得到具體原因和處理步驟,并更新專家?guī)?。系統(tǒng)支持根據(jù)每次的回單內(nèi)容及分詞結(jié)果評估情況進(jìn)行自我優(yōu)化。若KPI 屬于正常波動(dòng),則回單提出算法更新和告警閾值參數(shù)設(shè)置調(diào)整建議。
(9)功能視圖呈現(xiàn)。
功能視圖界面簡單、高效、準(zhǔn)確地呈現(xiàn)質(zhì)差指標(biāo)、指標(biāo)趨勢、質(zhì)差告警、派單情況、根因分析和專家?guī)斓裙δ苣K。每個(gè)功能模塊動(dòng)態(tài)呈現(xiàn),并可一鍵聯(lián)動(dòng),實(shí)現(xiàn)一點(diǎn)監(jiān)控、一點(diǎn)接入、一點(diǎn)處置,以便運(yùn)營人員快速直觀地掌握移動(dòng)網(wǎng)核心網(wǎng)質(zhì)差指標(biāo)和業(yè)務(wù)指標(biāo)運(yùn)行情況,實(shí)時(shí)監(jiān)控質(zhì)差告警和工單處理情況,及時(shí)發(fā)現(xiàn)并解決網(wǎng)絡(luò)隱患和故障,提升網(wǎng)絡(luò)安全性、可靠性。
3 結(jié)束語
圍繞數(shù)字化運(yùn)營要求,依托VoLTE 端到端關(guān)聯(lián)分析系統(tǒng),通過關(guān)鍵指標(biāo)閾值準(zhǔn)確發(fā)現(xiàn)質(zhì)差指標(biāo),利用多接口關(guān)聯(lián)的端到端系統(tǒng),智能完成核心網(wǎng)質(zhì)差指標(biāo)的分析和定界,并將定界結(jié)果輸出給相關(guān)專業(yè)人員進(jìn)行優(yōu)化,做到準(zhǔn)確、及時(shí)、主動(dòng)發(fā)現(xiàn)網(wǎng)絡(luò)隱患或故障,以達(dá)到提升網(wǎng)絡(luò)質(zhì)量和維護(hù)效率的目的,進(jìn)而為數(shù)字化運(yùn)營賦能,為一線維護(hù)人員減負(fù)。
本系統(tǒng)已在集約化vIMS 網(wǎng)絡(luò)實(shí)施,解決了運(yùn)維工作中長期的痛點(diǎn)難點(diǎn),具體如下。(1)提高了維護(hù)效率,減少了維護(hù)人員80%的維護(hù)量、維護(hù)效率提升90%以上;(2)降低了網(wǎng)絡(luò)故障率及客戶投訴率,較項(xiàng)目實(shí)施前減少了50%的故障及投訴量;(3)通過監(jiān)測移動(dòng)核心網(wǎng)關(guān)鍵性能指標(biāo),先于告警和投訴發(fā)現(xiàn)隱患和故障,快速精準(zhǔn)定界故障網(wǎng)元和故障原因,從而在規(guī)模故障爆發(fā)前解除隱患,減小影響范圍,縮短影響時(shí)長,提升了運(yùn)營效率和網(wǎng)絡(luò)質(zhì)量。
移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位模型經(jīng)過不斷優(yōu)化已具備模塊通用性,易移植、易推廣。隨著VoNR 的試商用,該模型已快速移植到VoNR 質(zhì)差根因定位中,實(shí)現(xiàn)隱患或故障的快速發(fā)現(xiàn)、快速定位、快速解決,從而縮短故障處理時(shí)長,降低故障發(fā)生率和用戶投訴率。
移動(dòng)網(wǎng)絡(luò)語音質(zhì)差根因定位模型基于VoLTE 端到端關(guān)聯(lián)分析系統(tǒng)(包含EPC,5GC 域,無線域全量數(shù)據(jù))具備數(shù)據(jù)業(yè)務(wù)的端到端能力,可滿足4G/5G 用戶數(shù)據(jù)業(yè)務(wù)質(zhì)差根因定位的數(shù)字化運(yùn)營需要,賦能5G智能化運(yùn)維。
參考文獻(xiàn):
[1] 唐建榮.提升VoLTE 客戶感知的優(yōu)化分析方法淺析[J].通訊世界,2017(7):87.
[2] 魏宗靜.VOLTE 語音質(zhì)量優(yōu)化方法研究[J].科技經(jīng)濟(jì)導(dǎo)刊,2016(5):33.
[3] 劉毅,肖濤,郭寶,等.提升VoLTE 用戶感知的保障策略研究[J].移動(dòng)通信.2017(18):6?10.
[4] 唐建榮,文志成,亓新峰.VoLTE 關(guān)鍵性能指標(biāo)分析[J].信息通信技術(shù),2015(4):56?59.
[5] 孫平強(qiáng).VoLTE 業(yè)務(wù)的性能分析及優(yōu)化研究[D].北京:北京郵電大學(xué),2015.
[6] 聶飛翔.基于客戶感知的3G 與4G 一體化網(wǎng)絡(luò)的規(guī)劃與優(yōu)化[D].南京:南京郵電大學(xué),2016.
作者簡介:劉天雪(1979—),本科,高級工程師,研究方向:移動(dòng)核心網(wǎng)重構(gòu)。