[文錦朝 劉琳]
隨著通信技術(shù)的不斷進(jìn)步,人們對上網(wǎng)的體驗要求越來越高,而突發(fā)網(wǎng)絡(luò)異常波動對用戶的上網(wǎng)體驗尤為明顯,因此運營商第一時間發(fā)現(xiàn)、解決網(wǎng)絡(luò)問題維持網(wǎng)絡(luò)的穩(wěn)定性[1~2]成為網(wǎng)絡(luò)維護(hù)和網(wǎng)絡(luò)優(yōu)化的關(guān)鍵。而網(wǎng)絡(luò)穩(wěn)定性主要體現(xiàn)在基站是否正常運營,即是否存在故障、網(wǎng)絡(luò)性能是否穩(wěn)定等方面。目前對于網(wǎng)絡(luò)故障方面,已有維護(hù)專員監(jiān)控故障告警并派單進(jìn)行維護(hù);但部分站點/小區(qū)業(yè)務(wù)量(本文主要通過流量開展分析)會出現(xiàn)陡降的現(xiàn)象,并且部分無法通過硬件故障發(fā)現(xiàn),現(xiàn)有廣東大數(shù)據(jù)平臺中已有流量陡降的監(jiān)控[3~4],但目前局限于天級別流量陡降小區(qū)派單,故時效性受到限制。對于小時級實時性能的流量陡降監(jiān)控依然欠缺,因此本文通過對小區(qū)流量下降對比方法(滑動平均二階對比法)、流量下降幅度、流量下降時間段(小時粒度)、流量徒降門限、監(jiān)控時間范圍多個緯度進(jìn)行流量陡降預(yù)警模型研究,提高流量陡降異常小區(qū)的監(jiān)控與處理效率,解決舊模型準(zhǔn)確性一般實時性差的問題,更好的維持網(wǎng)絡(luò)穩(wěn)定性。從而及時發(fā)現(xiàn)流量異常小區(qū),并派單解決,提升用戶感知。
總體思路:為解決舊預(yù)警模型[5~7]發(fā)現(xiàn)問題實時性差和準(zhǔn)確性低的問題,本流量陡降預(yù)警模型采用基于滑動平均二階對比法,以每3 個小時為一個滑塊作為基礎(chǔ)對比單位,一是通過每小時監(jiān)控當(dāng)前滑塊day(n)與前一個滑塊day(n-1)時間進(jìn)行流量環(huán)比,提高輸出數(shù)據(jù)的實時性;二是當(dāng)前滑塊day(n)與上一周同時間段滑塊week(n)進(jìn)行流量同比,保證輸出數(shù)據(jù)的準(zhǔn)確性。研究思路框架如圖1 所示。
圖1 研究思路框架圖
2.1.1 新模型的優(yōu)點
舊模型中,直接使用小區(qū)天粒度流量進(jìn)行環(huán)比降幅大于80%時,第三天才能輸出流量陡降預(yù)警小區(qū),輸出時效性差,并且當(dāng)流量連續(xù)幾天下降80%以下時,將會出現(xiàn)真實陡降小區(qū)無法觸發(fā)預(yù)警的問題,準(zhǔn)確性一般。
新模型采用3 小時作為滑塊區(qū)間,將滑塊區(qū)間內(nèi)的流量數(shù)據(jù)[8~9]求平均處理以達(dá)到平滑削峰的目的,做到隱性故障發(fā)生3 個小時后就可以被監(jiān)控發(fā)現(xiàn)并預(yù)警,解決了舊模型實時性差的問題,也避免了因單個小時流量偶發(fā)突變造成的準(zhǔn)確率下降的問題。兩種模型的對比如表1 所示。
表1 新舊模型優(yōu)缺點比較
2.2.1 滑動平均二階對比法原理
滑動平均二階對比法是融合了滑動平均法[10~12]、環(huán)比法和同比法的綜合算法。
(1)滑動平均法:移動平均的各元素的權(quán)重都相等。
滑動平均公式:
公式1 中:
day(n)為當(dāng)前滑塊平均值;
n 為移動平均的時期個數(shù);
At-1 為前期實際值;
At-2,At-3 和At-m 分別表示前兩期、前三期直至前m 期的實際值。
(2)環(huán)比法:表示連續(xù)2 個統(tǒng)計周期(比如連續(xù)兩月)內(nèi)的量的變化比,如環(huán)比=(本期流量-上期流量)/上期流量。
(3)同比法:表示2 個不同的大周期內(nèi)相同事間段的2 個統(tǒng)計周期的變化比,如同比=(本期流量-上周同期流量)/上周同期流量×100%。
2.2.2 流量陡降預(yù)警模型研究
流量陡降預(yù)警模型基本原理是使用滑動平均二階對比法,針對小時級粒度的流量數(shù)據(jù)進(jìn)行分析統(tǒng)計,并通過關(guān)聯(lián)廣東某地市的流量數(shù)據(jù),確認(rèn)模型中滑塊時長m(3 小時)、小時級數(shù)據(jù)取數(shù)時間段time(8:00~23:00)、環(huán)比陡降幅度門限a1(80%)和同比陡降幅度門限a2(80%),以保證流量陡降預(yù)警模型的實時性和準(zhǔn)確性,提高維護(hù)處理的效率,從而提升客戶感知。
(1)滑塊時長m 主要控制模型靈敏度,嘗試用1、2、3、4、5 小時作為輸出模型后,發(fā)現(xiàn)m=1 時,模型過于靈敏,容易出現(xiàn)誤判問題;5 小時模型靈敏度降低,實時性也得不到保障。
(2)時間段time 主要控制模型的準(zhǔn)確性,因為其他時間段受上班、凌晨參數(shù)修改等方面會導(dǎo)致流量的劇烈波動;
(3)流量陡降幅度門限a1 和a2 用于提高用戶感知的敏感度,有利于重點處理TOP 小區(qū)[13]。
滑動平均二級對比法滑塊示意圖如表2 所示。
表2 滑動平均二階對比法示意圖
day(n):代表當(dāng)天第n 時、n-1 時、n-2 時...的滑塊平均值,
day(n-1):代表day(n)前1 個小時的滑塊平均值
week(n):代表上周每天第n 時、n-1 時、n-2 時...的滑塊平均值,取前一周同時間段的每小時的流量,可以有效穩(wěn)定參照對象,使得模型更加準(zhǔn)確,解決了舊模型中連續(xù)流量下降導(dǎo)致無法監(jiān)控到流量陡降小區(qū)的問題。
2.2.3 監(jiān)控小區(qū)集的確定
統(tǒng)計廣東某地市一周各小區(qū)日均流量,對流量分段統(tǒng)計小區(qū)的數(shù)量。日均流量低于20 GB 的小區(qū)有44 704 個(占全網(wǎng)46.5%),高于20 GB 小區(qū)占比為53.50%。在日常分析中,日均流量20 GB 以上的小區(qū),用戶感知相對敏感,如果出現(xiàn)流量陡降的情況,用戶投訴的幾率大幅上升。
小結(jié):為了減輕模型的運算量,模型確定監(jiān)控小區(qū)集確定為日均流量>20 GB 的小區(qū)。
2.2.4 滑塊時間長度的確定
通過數(shù)據(jù)分析,當(dāng)m=1 小時的流量波動較大,尖峰較多,模型不夠平滑,容易出現(xiàn)流量小區(qū)陡降的誤判。當(dāng)m=3 小時,曲線平滑,達(dá)到平滑削峰的目的。因此m=3 時,靈敏度(實時性)能有一定的保證,并且準(zhǔn)確度也較舊模型大。m=1 或m=3 時,流浪波動對比如圖2 所示。(注:橫坐標(biāo)單位為時,縱坐標(biāo)單位為GB)
圖2 小時級流量滑塊對比圖
2.2.5 流量陡降門限的確定
本文通過兩種方法確定流量陡降幅度門限。一是通過對現(xiàn)網(wǎng)廣東某地市A 網(wǎng)格小區(qū)的XDR 投訴數(shù)據(jù)與用戶常駐小區(qū)的流量陡降幅度進(jìn)行關(guān)聯(lián)分析,確定對用戶影響最大的流量陡降幅度的門限a1 和a2;二是通過專家判斷法,對陡降50%、60%、70%、80%等門限共抽樣3 500 個小區(qū),根據(jù)2.2.4 方法輸出波形圖進(jìn)行準(zhǔn)確行判斷。
(1)方法1:散點圖關(guān)聯(lián)法
流量陡降幅度環(huán)比門限a1:由圖3 可知,環(huán)比a1 小區(qū)流量陡降幅度達(dá)到80%時,小區(qū)投訴量快速增長,嚴(yán)重影響用戶感知,因此可確定流量陡降降幅環(huán)比門限a1 值為80%。
圖3 流量陡降幅度與小區(qū)投訴量散點圖(環(huán)比門限a1)
流量陡降幅度同比門限a2:由圖4 可知,同比a2 小區(qū)流量陡降幅度達(dá)到80%時,小區(qū)投訴量快速增長,嚴(yán)重影響用戶感知,因此可確定流量陡降幅度同比門限a2值為80%。
圖4 流量陡降幅度與小區(qū)投訴量散點圖(同比門限a2)
(2)方法2:專家判斷法
針對采用同比環(huán)比降幅大于60%以上的觸發(fā)點(3 500 個)進(jìn)行人工抽查核查。從抽查的樣本305 個中存在流量陡降的有235 個。根據(jù)同比環(huán)比的分段對核驗準(zhǔn)確率進(jìn)行分析:當(dāng)降幅區(qū)間為同比降幅80%以上,環(huán)比降幅80%以上時,專家判斷準(zhǔn)確率達(dá)到80%以上。專家判斷法統(tǒng)計結(jié)果如表3 所示。
表3 專家判斷法統(tǒng)計結(jié)果
3 小時滑塊流量降量值確定:在專家判斷法環(huán)節(jié)的人工抽樣工作中發(fā)現(xiàn)存在同比環(huán)比降幅均大于80%但流量降量小于1 GB 的小區(qū),因該類小區(qū)已經(jīng)觸發(fā)現(xiàn)網(wǎng)低流量小區(qū)工單的派發(fā),此種情況會導(dǎo)致重復(fù)派單,故流量陡降門限增加一個條件,即同比和環(huán)比3 小時平均流量降量大于1 GB 以上。
2.2.6 監(jiān)控時間范圍的確定
從7 天的小時級總流量分布看,流量高峰出現(xiàn)在晚上21 點為12 萬 GB,流量低谷在凌晨5 點1.56 萬 GB,分布如圖5 所示。
圖5 小時級流量分布圖
按照2.2.3 結(jié)論,統(tǒng)計滑塊流量陡降降幅大于80%的小區(qū),主要集中在區(qū)間0:00~7:00,時間段(分布圖如圖6所示)。主要原因有3 個:用戶晚間休息、網(wǎng)絡(luò)正常維護(hù)、載波節(jié)點功能開啟斷電退服,并且該時間段流量波動較大,數(shù)據(jù)準(zhǔn)確性低,對用戶影響小,故0:00~7:00 不納入流量陡降預(yù)警模型,只考慮8:00~23:00 的時間區(qū)間范圍。
圖6 同比環(huán)比流量降幅時間分布圖
2.2.7 模型參數(shù)小結(jié)
根據(jù)數(shù)據(jù)的分析,流量陡降預(yù)警模型相關(guān)參數(shù)制定如下:
(1)監(jiān)控小區(qū)集:日均流量大于20 GB 的小區(qū)
(2)滑塊時間長度m=3 小時
(3)陡降門限a1=80%和a2=80%,同比和環(huán)比3 小時平均流量降量大于1G 以上
(4)監(jiān)控時間范圍:8:00~23:00
如圖7 該小區(qū)(460-00-176276-11)在在當(dāng)天的16:00、17:00、18:00 觸發(fā)了流量陡降預(yù)警共3 次。
圖7 流量陡降預(yù)警模型輸出案例
以16:00 為例,滿足綠色虛線框中day_cell_GB 的平均流量對比上周同時段均值流量(week_Avg_GB)降幅大于80%且降量大于1 GB;綠色虛線框中day_cell_GB的平均流量對比橙色虛線框中的day_cell_GB 的平均流量降幅大于80%且降量大于1 GB 且上周的日均流量大于20 GB,故觸發(fā)了預(yù)警。由于滑塊判別的延續(xù)性,如后續(xù)流量未能恢復(fù)正常,會持續(xù)觸發(fā)3 次告警后才不再觸發(fā)。
說明:
(1)橫坐標(biāo)是0~24 點,縱坐標(biāo)是流量(GB)。
(2)粉色實線是查詢小區(qū)查詢?nèi)掌诘牡?4 小時流量分布。
(3)藍(lán)色實線是查詢小區(qū)上一周5 個工作日的每小時平均流量分布。
(4)2 條藍(lán)色虛線 分別是查詢小區(qū)上一周5 個工作的每個小時最大值和最小值流量分布。
本文創(chuàng)新性采用滑動平均二階對比法的綜合算法,結(jié)合現(xiàn)有生產(chǎn)的數(shù)據(jù)分析,搭建流量陡降預(yù)警模型。模型綜合考慮了用戶滿意度、現(xiàn)有優(yōu)化人員的生產(chǎn)力等主客觀因素,制定模型的具體參數(shù)門限值,并通過計算機(jī)語言編程實現(xiàn)流量陡降預(yù)警小區(qū)清單的輸出和派單優(yōu)化,響應(yīng)了集團(tuán)降本增效的工作指引。本模型可運用于現(xiàn)有的4G 和5G網(wǎng)絡(luò)當(dāng)中,具有廣泛的實用性,由于目前5G 話務(wù)較少,數(shù)據(jù)量無法滿足模型驗證,因此本文主要通過研究4G 話務(wù)分布對模型中參數(shù)進(jìn)行確定,隨著5G 網(wǎng)絡(luò)的不斷建設(shè)和話務(wù)的不斷吸收,可通過本文的滑動平均二階對比法,輸出5G 的流量陡降預(yù)警模型,及時發(fā)現(xiàn)隱形故障,提升5G 網(wǎng)絡(luò)質(zhì)量,從而提供用戶滿意度。