楊聚毅,王 林,安明偉,李柚宏,王 琴,王 斌(中國(guó)聯(lián)通四川分公司,四川成都 )
四川聯(lián)通于2019年6月1日開始VoLTE業(yè)務(wù)試商用。由于業(yè)務(wù)流程長(zhǎng),涉及網(wǎng)元、接口多,信令交互復(fù)雜,跨多廠家等原因,在VoLTE業(yè)務(wù)商用以后,出現(xiàn)感知問題定位難、處理時(shí)間長(zhǎng)等運(yùn)維難題。
針對(duì)VoLTE業(yè)務(wù)商用帶來的巨大挑戰(zhàn),參考其他運(yùn)營(yíng)商VoLTE網(wǎng)絡(luò)運(yùn)營(yíng)中遇到的問題以及省網(wǎng)優(yōu)中心和省網(wǎng)管中心對(duì)VoLTE端到端分析手段的迫切需求,借鑒行業(yè)成功的部署經(jīng)驗(yàn),在四川聯(lián)通現(xiàn)有三層架構(gòu)(采集層、共享層、應(yīng)用層)的基礎(chǔ)上,制定了基于大數(shù)據(jù)的VoLTE端到端系統(tǒng)解決方案,在應(yīng)用層部署了VoLTE端到端分析系統(tǒng)。目前該系統(tǒng)已正式投入使用,針對(duì)注冊(cè)、接通、切換等環(huán)節(jié)進(jìn)行了業(yè)務(wù)質(zhì)量的探索,總結(jié)出多種問題分析方法,包括一串、二跟、三判斷的“123”IMS注冊(cè)問題定位法,“刪繁就簡(jiǎn),找源頭,看特征”的接通問題分析方法,“235”eSRVCC切換分析法,有效提升了VoLTE網(wǎng)絡(luò)運(yùn)營(yíng)效率。
端到端分析系統(tǒng)整體遵循了四川聯(lián)通現(xiàn)網(wǎng)的三層架構(gòu)(采集層、共享層、應(yīng)用層),系統(tǒng)采用松耦合方式,共用現(xiàn)網(wǎng)采集層和共享層,并補(bǔ)充采集了vIMS相關(guān)數(shù)據(jù),對(duì)PM/告警/MR/EPC XDR/VoLTE XDR多種數(shù)據(jù)源關(guān)聯(lián)合成,實(shí)現(xiàn)真正的端到端感知分析。系統(tǒng)架構(gòu)如圖1所示。
圖1 端到端分析系統(tǒng)架構(gòu)
VoLTE端到端業(yè)務(wù)分析系統(tǒng)的需實(shí)現(xiàn)如下功能。
a)支持探測(cè)VoLTE業(yè)務(wù)量、質(zhì)量的發(fā)展及變化趨勢(shì),對(duì)于發(fā)現(xiàn)的質(zhì)差現(xiàn)象進(jìn)行端到端問題定界,定位問題到EPC、CS、IMS、無線、終端等環(huán)節(jié)。
b)有效監(jiān)控業(yè)務(wù)指標(biāo),通過端到端信令關(guān)聯(lián)分析,支撐專項(xiàng)優(yōu)化工作,進(jìn)行快速問題定界,保障端到端業(yè)務(wù)質(zhì)量。
根據(jù)目前信令采集能力和關(guān)聯(lián)能力,保證關(guān)鍵指標(biāo)監(jiān)控、用戶記錄查詢、信令回溯以及相關(guān)分析功能。結(jié)合VoLTE網(wǎng)絡(luò)部署和運(yùn)營(yíng)的實(shí)際需求,目前系統(tǒng)可實(shí)現(xiàn)六大功能。
a)VoLTE業(yè)務(wù)全景透視。
b)VoLTE用戶體驗(yàn)。
c)撥測(cè)用戶保障。
d)VIP用戶保障。
e)VoLTE業(yè)務(wù)CSFB分析。
f)CSFB指標(biāo)監(jiān)控。
在LTE網(wǎng)絡(luò)基礎(chǔ)上,新增vIMS網(wǎng)絡(luò),形成VoLTE端到端網(wǎng)絡(luò)架構(gòu)。
根據(jù)VoLTE業(yè)務(wù)流程,借鑒業(yè)界成熟的“八元六階”定界方法,進(jìn)行端到端定界?!鞍嗽A”定界方法如圖2所示。
當(dāng)關(guān)鍵KQI指標(biāo)發(fā)生劣化時(shí),端到端分析系統(tǒng)對(duì)問題進(jìn)行專業(yè)定界,對(duì)于成功率類指標(biāo),首先核心網(wǎng)(EPC/CS/IMS)分域映射至關(guān)聯(lián)KPI,然后通過時(shí)域分析、關(guān)聯(lián)分析、聚類分析粗定界到用戶、終端、無線、傳輸、EPC、IMS、CS和數(shù)通8個(gè)維度的問題。
對(duì)于時(shí)延類指標(biāo),首先將業(yè)務(wù)流程拆分為多個(gè)過程,然后逐段定界。
對(duì)于語音質(zhì)量指標(biāo),引入編解碼類型、編解碼速率、抖動(dòng)、丟包、時(shí)延5個(gè)關(guān)鍵因素進(jìn)行評(píng)估,再通過關(guān)聯(lián)分析、聚類分析、根因分析,定界到各維度。
通過將異常信令攜帶原因值與接口、網(wǎng)元進(jìn)行關(guān)聯(lián),運(yùn)用聚類算法,深度發(fā)掘各類問題的典型特征和失敗原因,并對(duì)問題進(jìn)行反推驗(yàn)證,以點(diǎn)帶面,形成問題“指紋特征”庫(kù)。搭建基于“問題指紋庫(kù)”的端到端定界體系,基于定界的定位方法,對(duì)各類問題進(jìn)行“靶向治療”。
圖2 “八元六階”定界方法
基于端到端平臺(tái)的應(yīng)用,形成了注冊(cè)、接通、切換一整套問題定界定位方法,達(dá)到快速發(fā)現(xiàn)解決網(wǎng)絡(luò)問題的目的。問題定界定位方法如圖3所示。
圖3 問題定界定位方法
通過投訴處理、分公司上報(bào)、終端測(cè)試、端到端分析以及測(cè)試分析進(jìn)行問題分析匯總,形成問題“指紋庫(kù)”,利用本地化開發(fā),形成智能分析系統(tǒng),快速高效支撐一線人員進(jìn)行網(wǎng)絡(luò)質(zhì)量提升、問題定位分析及處理,有力保障客戶感知。
3.4.1 指紋庫(kù)建立流程
指紋庫(kù)建立流程如圖4所示。
3.4.2 基于多數(shù)據(jù)源和指紋庫(kù)的智能分析系統(tǒng)
圖4 指紋庫(kù)建立流程
基于多數(shù)據(jù)源和指紋庫(kù)的智能分析系統(tǒng)如圖5所示。
圖5 基于多數(shù)據(jù)源和指紋庫(kù)的智能分析系統(tǒng)
通過“關(guān)聯(lián)多接口、著眼全流程、聚焦關(guān)鍵點(diǎn)”的手段,形成一串、二跟、三判斷的“123”IMS注冊(cè)問題定位法,同時(shí)可發(fā)現(xiàn)因4G弱覆蓋造成3G、4G頻繁重選注冊(cè)的問題。
a)一串(條件關(guān)聯(lián))。通過S1-U口采集到的IM?SI注冊(cè)開始、返回Cause的時(shí)間點(diǎn)為基準(zhǔn)。
b)二跟(時(shí)間追蹤)。追蹤注冊(cè)周期(20 s)段內(nèi)對(duì)應(yīng)IMSI注冊(cè)過程中S1-u口和Gx接口采集的交互信息,提取關(guān)鍵信息字段。
c)三判斷(分布判斷)。1:注冊(cè)超時(shí)20s,收到CCR消息攜帶信息rat_type;2:rat_type=1001或=1000;3:request_type=3(CCR信息消息標(biāo)識(shí))。
具體流程如圖6所示。
通過“刪繁就簡(jiǎn),找源頭,看特征”,進(jìn)行接通問題分析。刪繁就簡(jiǎn)確定關(guān)鍵接口,信令回溯找源頭,歸類匯聚形成規(guī)則庫(kù),智能化定界,形成接通率問題準(zhǔn)確定界。
4.2.1 刪繁就簡(jiǎn)
接通問題全流程包含主被叫,涉及S1口、Mw、Rx、Gx、Cx、S6a、ISC等多個(gè)關(guān)鍵接口,還要考慮VoLTE到CS域的呼叫和漫游用戶等多種場(chǎng)景,復(fù)雜度高。將所有接口,所有網(wǎng)絡(luò)的信令進(jìn)行關(guān)聯(lián)分析實(shí)現(xiàn)成本高,而且由于關(guān)聯(lián)度低也不能實(shí)現(xiàn)所有問題的定界。因此取Mw口作為接通問題分析的主要接口,根據(jù)需要再關(guān)聯(lián)其他接口。
4.2.2 找源頭
圖6 具體流程
通過信令回溯找到首條異常信令,根據(jù)異常信令中攜帶的原因值判斷導(dǎo)致未接通的根本源頭。
4.2.3 看特征
對(duì)于同類型未接通事件進(jìn)行總結(jié)、聚類、歸納形成同一場(chǎng)景的特征碼,根據(jù)特征碼定義counter。特征碼組合使用的字段包含主被叫方向區(qū)分、是否有CAN?CEL、SIP錯(cuò)誤碼、SIP錯(cuò)誤碼原因、CANCEL原因值、183原因值共6個(gè)緯度。同樣特征碼的未接通,定界到同一原因,不同場(chǎng)景的未接通對(duì)應(yīng)的特征碼不同。不同場(chǎng)景的特征碼匯總形成規(guī)則庫(kù)。
4.2.4 智能定界
根據(jù)規(guī)則庫(kù)將符合不同特征碼的未接通事件定位到用戶、終端、無線、IMS和CS域這5個(gè)方面,通過智能化平臺(tái)將工單流轉(zhuǎn)至相關(guān)專業(yè)進(jìn)行處理。
在大量案例分析的基礎(chǔ)上,制定出接通問題定界規(guī)則庫(kù),按照特征碼設(shè)計(jì)counter,每個(gè)counter對(duì)應(yīng)一類接通失敗事件和相應(yīng)界定規(guī)則。
在進(jìn)行接通問題分析時(shí),首先區(qū)分未接通事件是主叫還是被叫,然后按照主叫有/無CANCEL未接通判定流程和被叫有/無CANCEL判定流程,對(duì)未接通事件進(jìn)行界定和歸類;基于規(guī)則庫(kù)的未接通分析步驟可以很方便地實(shí)現(xiàn)智能化。
聚焦eSRVCC切換成功率提升,采用“235”eS?RVCC切換分析法,針對(duì)切換準(zhǔn)備和切換執(zhí)行階段,從信令分析定位、參數(shù)精細(xì)優(yōu)化、互操作協(xié)同提升3個(gè)維度開展優(yōu)化工作,在信令指紋庫(kù)快速定位、場(chǎng)景化參數(shù)設(shè)置、4G-3G鄰區(qū)精確配置、弱覆蓋全面發(fā)現(xiàn)、3G-4G協(xié)同優(yōu)化5個(gè)方面聚焦落地,目前eSRVCC切換問題定界率達(dá)到85%以上,促進(jìn)了eSRVCC切換成功率快速改善提升。
通過VoLTE端到端系統(tǒng)信令回溯功能,對(duì)eS?RVCC切換失敗的單Case進(jìn)行集中化分析,結(jié)合各接口信令點(diǎn)的代碼含義,總結(jié)出問題點(diǎn)的典型特征和失敗原因,進(jìn)而通過以點(diǎn)帶面的方式,對(duì)問題進(jìn)行反推驗(yàn)證,從而形成問題原因的“指紋識(shí)別”庫(kù)。
具體從信令分析定位、參數(shù)精細(xì)優(yōu)化、互操作協(xié)同提升3個(gè)維度進(jìn)行優(yōu)化,提升eSRVCC切換成功率。
面對(duì)多網(wǎng)元信令交互復(fù)雜,VoLTE用戶行為多,新網(wǎng)絡(luò)優(yōu)化經(jīng)驗(yàn)少等諸多困難,eSRVCC“235”方法論能夠快速定位、快速解決問題,節(jié)約人力和物力投入,具有較高的經(jīng)濟(jì)價(jià)值。
VoLTE高清語音是基于LTE網(wǎng)絡(luò)的重要語音解決方案,必將經(jīng)歷一個(gè)長(zhǎng)期的發(fā)展和完善的過程,穩(wěn)定性與可靠性也將逐步地改善與提高。在VoLTE業(yè)務(wù)發(fā)展過程中,制定完整的端到端分析方法,部署端到端的分析系統(tǒng),將有助于支撐VoLTE業(yè)務(wù)發(fā)展,有利保障用戶感知。