吳威
摘要:文章針對(duì)傳統(tǒng)家庭寬帶網(wǎng)絡(luò)運(yùn)維過程中存在的自動(dòng)化程度低、重復(fù)工作占比高、功能割裂等問題,提出如何采取家庭寬帶全過程問題主動(dòng)感知、自檢查自治閉環(huán)體系,并融入IT化自執(zhí)行手段,打造一站式質(zhì)量自運(yùn)維能力,實(shí)現(xiàn)對(duì)家寬問題的自識(shí)別、自定位、自處理、自執(zhí)行,從被動(dòng)等待客戶投訴的被動(dòng)運(yùn)維轉(zhuǎn)變?yōu)橹鲃?dòng)識(shí)別、發(fā)現(xiàn)、解決問題的主動(dòng)運(yùn)維,大幅增強(qiáng)家寬網(wǎng)絡(luò)異常識(shí)別和分析能力,為家寬網(wǎng)絡(luò)質(zhì)量精細(xì)化智能運(yùn)維提供參考。
關(guān)鍵詞:家庭寬帶;網(wǎng)絡(luò)質(zhì)量;主動(dòng)感知;智能運(yùn)維
doi:10.3969/J.ISSN.1672-7274.2024.04.020
中圖分類號(hào):TN 919.8? ? ? ? ? 文獻(xiàn)標(biāo)志碼:B? ? ? ? ? ? 文章編碼:1672-7274(2024)04-00-04
Research and Practice on Intelligent Operation and Maintenance of Home Broadband Quality Based on Problem Proactive Perception
WU Wei
(China Mobile Communications Group Guangdong Co., Ltd., Guangzhou 510000, China)
Abstract: This article addresses the problems of low automation, high proportion of repetitive work, and functional fragmentation in the operation and maintenance process of traditional home broadband networks. It proposes how to adopt an active perception and self inspection autonomous closed-loop system for the entire process of home broadband problems, and integrate IT based self execution methods to create a one-stop quality self operation and maintenance capability, achieving self identification, self positioning, self processing, and self execution of home broadband problems, Transforming from passive operation and maintenance waiting for customer complaints to active operation and maintenance identifying, discovering, and solving problems, significantly enhancing the ability to identify and analyze anomalies in the home wide network, and providing reference for the refined and intelligent operation and maintenance of home wide network quality.
Keywords: home broadband; network quality; active perception; intelligent operation and maintenance
隨著千兆寬帶、高清/4K視頻、云游戲等新業(yè)務(wù)應(yīng)用越來越普及,家庭寬帶裝機(jī)量大幅提升[1],家庭寬帶網(wǎng)絡(luò)的運(yùn)維及管理面臨越來越大的挑戰(zhàn)和壓力,傳統(tǒng)的家庭寬帶網(wǎng)絡(luò)運(yùn)維主要依托專家經(jīng)驗(yàn)進(jìn)行人工操作[2],在提升網(wǎng)絡(luò)質(zhì)量保證用戶感知體驗(yàn)及網(wǎng)絡(luò)精細(xì)化運(yùn)維方面存在以下痛點(diǎn)。
(1)用戶感知體驗(yàn)管理主要基于投訴驅(qū)動(dòng),網(wǎng)絡(luò)問題主要由用戶發(fā)現(xiàn),運(yùn)維管理被動(dòng)地依賴用戶投訴及網(wǎng)管告警,缺乏提前預(yù)判網(wǎng)絡(luò)瓶頸和潛在問題的手段。
(2)家寬網(wǎng)絡(luò)有海量的網(wǎng)絡(luò)數(shù)據(jù),傳統(tǒng)的運(yùn)維方式未能充分挖掘數(shù)據(jù)價(jià)值,缺乏提前預(yù)測(cè)網(wǎng)絡(luò)異常或隱患問題的能力,并且發(fā)現(xiàn)的問題未能及時(shí)提供根本原因分析結(jié)果,無法先于用戶發(fā)現(xiàn)并解決問題。
(3)在日常的運(yùn)維工作中,低效、重復(fù)性的操作占比高,主要依賴運(yùn)維人員經(jīng)驗(yàn)積累和對(duì)工作的熟悉程度,缺少自動(dòng)化的處理能力,運(yùn)維效率較低。同時(shí)運(yùn)維人員主要工作置身于各類運(yùn)維流程中,無暇聚焦更為關(guān)鍵的管理、流程和規(guī)則設(shè)計(jì)等工作,人員高階價(jià)值未能有效體現(xiàn)。
(4)家寬流程長、專業(yè)多、用戶終端雜、網(wǎng)元數(shù)量多、業(yè)務(wù)涉及面廣,跨部門跨專業(yè)且各個(gè)數(shù)據(jù)的側(cè)重點(diǎn)有所不同,系統(tǒng)或功能模塊互相割裂,未能形成全流程的運(yùn)維聚合,缺乏整體運(yùn)維整合手段。
1? ?家寬全過程問題的主動(dòng)感知體系
針對(duì)以上問題,可從底層CMNET網(wǎng)(IDC、CDN、Cache)、城域網(wǎng)(NRAS、SR、BNG)、接入網(wǎng)(ONU、分光器、OLT、SW)和用戶側(cè)(家庭網(wǎng)關(guān)、機(jī)頂盒、電腦)等全域多數(shù)據(jù)進(jìn)行關(guān)聯(lián)融合,構(gòu)建全過程問題的主動(dòng)感知體系,從過往的被動(dòng)管理轉(zhuǎn)變?yōu)橹鲃?dòng)識(shí)別、發(fā)現(xiàn)、解決問題的主動(dòng)運(yùn)維。同時(shí)上層融入IT化自執(zhí)行手段,進(jìn)行全流程聚合輸出,提供自動(dòng)化手段,全程無需人工干預(yù),形成一站式質(zhì)量自運(yùn)維能力,如圖1所示。
1.1 家寬全過程問題主動(dòng)感知識(shí)別技術(shù)
從家庭側(cè)網(wǎng)絡(luò)、接入側(cè)網(wǎng)絡(luò)、城域網(wǎng)側(cè)到業(yè)務(wù)云端共計(jì)構(gòu)建了31個(gè)問題感知識(shí)別規(guī)則,其中家庭側(cè)問題感知包含了網(wǎng)關(guān)/機(jī)頂盒性能、Wi-Fi干擾、弱信號(hào)、速率協(xié)商、質(zhì)差路由器、STB性能及負(fù)荷、端口速率協(xié)商等9項(xiàng)問題感知能力,接入網(wǎng)問題感知包含了OLT/PON端口鏈路質(zhì)差、分光不均、光功異常、掉線、小區(qū)聚合、告警分類聚類等8項(xiàng)問題感知能力,城域網(wǎng)問題識(shí)別包含了網(wǎng)元負(fù)荷、端口利用率、誤碼、質(zhì)差用戶網(wǎng)元聚合、端口鏈路負(fù)載、告警分類聚類等8項(xiàng)問題感知能力,業(yè)務(wù)端問題識(shí)別包含了網(wǎng)外流量、質(zhì)差頻道/CDN地址、質(zhì)差出口、高投出口、業(yè)務(wù)感知、網(wǎng)速不穩(wěn)定等6項(xiàng)問題感知能力,這31個(gè)問題感知識(shí)別規(guī)則涵蓋用戶端到端全流程感知問題主動(dòng)識(shí)別,可大幅增強(qiáng)網(wǎng)絡(luò)異常識(shí)別和分析能力。同時(shí)依托上述問題感知識(shí)別技術(shù),建立如圖2所示的質(zhì)差性能管理流程,對(duì)質(zhì)差問題進(jìn)行二次聚合分析后通過工單派發(fā)輸出至一線處理修復(fù)[3],并對(duì)處理情況進(jìn)行最終的效果驗(yàn)證,實(shí)現(xiàn)了從感知評(píng)估—問題識(shí)別發(fā)現(xiàn)—處理閉環(huán)的全過程管理。
1.2 速率問題自定位技術(shù)
針對(duì)家庭側(cè)影響速率高發(fā)問題,建立速率問題自發(fā)現(xiàn)自定位能力?;诩覍捰脩羲俾嗜^程節(jié)點(diǎn),依托多數(shù)據(jù)深度關(guān)聯(lián)分析,核查遍歷所有影響環(huán)節(jié)(見圖3),識(shí)別存在的問題并定位原因,直接輸出問題結(jié)論,為一線運(yùn)維提供精準(zhǔn)處理指引,具體核查規(guī)則如下。
(1)檢查用戶AAA速率:通過與BOSS系統(tǒng)開通速率數(shù)據(jù)進(jìn)行比對(duì),檢查下發(fā)的速率是否與簽約速率一致,如不一致則可判定為數(shù)據(jù)配置錯(cuò)誤。
(2)檢查用戶GPON通道速率:通過與BOSS系統(tǒng)開通速率數(shù)據(jù)進(jìn)行比對(duì),檢查GPON通道速率是否與簽約速率一致,如不一致則可判定為用戶GPON通道數(shù)據(jù)錯(cuò)誤。
(3)檢查IHGU下連端口速率:運(yùn)用軟探針采集的端口速率及光貓?jiān)O(shè)備信息數(shù)據(jù),分步驟判斷核查:一是核查光貓LAN1口支撐最大速率,如為百兆口,則判定光貓無千兆口;二是核查LAN1口是否在用,如無在用,則判定為錯(cuò)接光貓百兆口;三是核查下掛路由器WAN口支撐速率,通過爬蟲技術(shù)爬取路由器產(chǎn)品信息進(jìn)行WAN口速率核查,如路由器支持速率低,則判定為WAN口速率不支持。
通過全過程節(jié)點(diǎn)遍歷,對(duì)識(shí)別出根因問題,制定輸出對(duì)應(yīng)處理指引,具體如表1如示。
1.3 質(zhì)差終端性能問題自處理技術(shù)
從過往投訴、滿意度分析發(fā)現(xiàn),終端(光貓、機(jī)頂盒等)長期運(yùn)行(超過14天)不重啟,可能導(dǎo)致運(yùn)行內(nèi)存、CPU占用高等問題,進(jìn)而引起用戶使用異常。針對(duì)此問題,通過構(gòu)建質(zhì)差終端性能問題自發(fā)現(xiàn)遠(yuǎn)程自處理技術(shù)進(jìn)行解決,具體業(yè)務(wù)流程見圖4。該技術(shù)方案基于軟探針每天采集終端質(zhì)量信息[4],通過采集到的運(yùn)行時(shí)長、CPU和內(nèi)存等信息進(jìn)行綜合計(jì)算,標(biāo)記質(zhì)差終端,輸出目標(biāo)清單,在遠(yuǎn)程進(jìn)行批量重啟操作,并對(duì)重啟后的終端進(jìn)行最終的質(zhì)量后評(píng)估,本技術(shù)提供遠(yuǎn)程低成本主動(dòng)發(fā)現(xiàn)、優(yōu)化手段,有效提升用戶寬帶業(yè)務(wù)質(zhì)量。
1.4 自執(zhí)行實(shí)現(xiàn)技術(shù)
基于以上對(duì)問題的自識(shí)別、自定位、自處理機(jī)制,在上層通過IT手段融入自執(zhí)行技術(shù),借助Chrome內(nèi)核,基于Chrome Headless模式,通過爬蟲進(jìn)行自動(dòng)化動(dòng)作命令控制,實(shí)現(xiàn)全流程運(yùn)維內(nèi)容的整合并自動(dòng)化輸出。實(shí)現(xiàn)技術(shù)內(nèi)容如下。
(1)定制:根據(jù)問題感知數(shù)據(jù)及實(shí)際運(yùn)維需求,可靈活的定制運(yùn)維內(nèi)容。
(2)實(shí)現(xiàn):借助Chrome內(nèi)核,基于Chrome Headless模式,通過爬蟲進(jìn)行自動(dòng)化動(dòng)作命令控制,實(shí)現(xiàn)元素交互,控制Chrome自動(dòng)加載。其主要技術(shù)特點(diǎn)為:在不打開瀏覽器GUI的情況,通過Chrome內(nèi)核支持的性能,在Chrome Headless模式下完成運(yùn)維內(nèi)容渲染輸出,同時(shí)借助Chrome Headless運(yùn)行Web自動(dòng)化,編寫爬蟲進(jìn)行自動(dòng)化動(dòng)作命令控制,加快執(zhí)行時(shí)間[5]。
(3)執(zhí)行:通過爬蟲發(fā)起請(qǐng)求至chrome后臺(tái)加載頁面,完成渲染,再通過爬蟲模擬實(shí)現(xiàn)運(yùn)維內(nèi)容自動(dòng)導(dǎo)出。其主要技術(shù)特點(diǎn)為:基于Selenium庫,與頁面元素進(jìn)行交互,爬蟲發(fā)起請(qǐng)求至chrome后臺(tái)加載頁面,完成渲染,再通過爬蟲模擬實(shí)現(xiàn)運(yùn)維內(nèi)容自動(dòng)輸出,最終實(shí)現(xiàn)自執(zhí)行。
(4)輸出:調(diào)用API郵件接口實(shí)現(xiàn)分析內(nèi)容自動(dòng)發(fā)送至對(duì)應(yīng)業(yè)務(wù)處理部門。
2? ?實(shí)踐應(yīng)用成效
(1)實(shí)現(xiàn)從投訴驅(qū)動(dòng)的被動(dòng)維護(hù)到可預(yù)測(cè)性的主動(dòng)維護(hù)。建立了全過程問題主動(dòng)感知—自檢查自智閉環(huán)體系,從被動(dòng)等待客戶投訴的被動(dòng)運(yùn)維轉(zhuǎn)變?yōu)橹鲃?dòng)識(shí)別、發(fā)現(xiàn)、解決問題的主動(dòng)運(yùn)維,大幅增強(qiáng)網(wǎng)絡(luò)異常識(shí)別和分析能力。
(2)實(shí)現(xiàn)從人工操作到系統(tǒng)自動(dòng)執(zhí)行。通過建立家寬網(wǎng)絡(luò)質(zhì)量運(yùn)維自動(dòng)執(zhí)行能力,實(shí)現(xiàn)質(zhì)量分析自智閉環(huán)及作業(yè)的自動(dòng)化,替代了傳統(tǒng)工作任務(wù)中低效、重復(fù)性的人工操作部分,運(yùn)維人員由過去“在流程中”(In the Loop)轉(zhuǎn)變成“在流程之上”(On the Loop),釋放運(yùn)維專家精力,使其聚焦于更為關(guān)鍵的管理、流程和規(guī)則等更高價(jià)值的設(shè)計(jì)工作上。
(3)根據(jù)實(shí)際生產(chǎn)或業(yè)務(wù)發(fā)展需要可靈活配置調(diào)整,直觀可視化規(guī)范化輸出,直接賦能一線生產(chǎn)。一是運(yùn)維內(nèi)容模板化、任務(wù)化、自動(dòng)化,運(yùn)維內(nèi)容能以規(guī)范化方式自動(dòng)輸出,避免人為方式固有的不嚴(yán)密性帶來分析上的疏漏;二是高度貼合生產(chǎn),根據(jù)業(yè)務(wù)區(qū)域日常分析作業(yè)、數(shù)據(jù)報(bào)表、報(bào)告等進(jìn)行整合固化開發(fā),減輕日常繁重的人工例行工作;三是成果輸出報(bào)告實(shí)現(xiàn)內(nèi)容數(shù)據(jù)及問題的直觀呈現(xiàn),運(yùn)維人員無需二次分析,只需具備基礎(chǔ)的專業(yè)知識(shí)即可執(zhí)行問題的處理,高效解決問題。
(4)各類指標(biāo)均有明顯提升,如表2所示?;趩栴}主動(dòng)感知能力,精準(zhǔn)定位質(zhì)差并整治問題隱患,整體質(zhì)差用戶畫像評(píng)分提升2.57%,實(shí)際上網(wǎng)使用感知(以自動(dòng)重啟后TCP平均時(shí)延為例)提升22.92%,質(zhì)差網(wǎng)元下帶投訴下降53%。
3? ?結(jié)束語
基于問題主動(dòng)感知的家寬質(zhì)量智能運(yùn)維體系,涵蓋了用戶運(yùn)營數(shù)據(jù)分析、投訴及熱點(diǎn)分析、網(wǎng)元告警分析、容量鏈路負(fù)荷分析、電視質(zhì)量分析、質(zhì)差用戶派單修復(fù)跟蹤等能力,強(qiáng)化了自智網(wǎng)絡(luò)在家寬網(wǎng)絡(luò)質(zhì)量運(yùn)維和客戶滿意度提升中的應(yīng)用,豐富了家寬網(wǎng)絡(luò)智能運(yùn)維場(chǎng)景,有效地提升了家寬運(yùn)維智能化水平,實(shí)現(xiàn)了“IT換人”降本增效的目的,為家寬網(wǎng)絡(luò)質(zhì)量精細(xì)化智能運(yùn)維提供了較好的實(shí)踐參考?!?/p>
參考文獻(xiàn)
[1] 吳博,李連源,李建坤,等.家寬室內(nèi)網(wǎng)絡(luò)質(zhì)量問題研究[J].通信世界,2023(6):39-41.
[2] 常鐵一.家寬網(wǎng)絡(luò)運(yùn)維和優(yōu)化手段探討[J].通訊世界,2020,27(7):53-54.
[3] 王鋮岑,何均均,王江舟.基于AI畫像的家寬用戶多維健康體系研究[J].江蘇通信,2022,38(3):87-91.
[4] 笑杰,梁童,方波,等.基于用戶感知的家寬端到端質(zhì)量分析方案研究[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2023,36(4):35-39.
[5] 楊健,陳偉.基于Python的三種網(wǎng)絡(luò)爬蟲技術(shù)研究[J].軟件工程,2023,26(2):24-27,19.