文英, 何長(zhǎng)梟, 居天春
(中國(guó)移動(dòng)通信集團(tuán)廣西有限公司, 南寧 530022)
隨著手機(jī)上網(wǎng)用戶的增多,移動(dòng)數(shù)據(jù)流量業(yè)務(wù)及話單增長(zhǎng)迅猛。關(guān)于套餐使用量的提醒不及時(shí)等相關(guān)問題及投訴呈上漲趨勢(shì)。本文首先分析了目前流量閥值提醒短信下發(fā)的主要流程及存在的話單生成或采集不及時(shí)、離線話單占比高導(dǎo)致提醒時(shí)延偏大等相關(guān)問題,接著從監(jiān)控、系統(tǒng)處理等方面提出了一些優(yōu)化措施。優(yōu)化后數(shù)據(jù)表明,在線計(jì)費(fèi)系統(tǒng)處理性能和在線計(jì)費(fèi)話單占比得到了提升,較好地縮短了流量閥值提醒短信下發(fā)時(shí)延。
某通信運(yùn)營(yíng)商全流程提醒服務(wù)規(guī)范中套餐內(nèi)數(shù)據(jù)流量定量提醒定義:對(duì)客戶套餐內(nèi)數(shù)據(jù)流量業(yè)務(wù),每賬期至少進(jìn)行兩次用量提醒,即當(dāng)實(shí)際使用量接近和到達(dá)套餐使用限量時(shí)進(jìn)行提醒。此類提醒是由用戶使用話單中使用量觸發(fā),一般是通過短信下發(fā)提醒信息給客戶,又稱為流量閥值提醒或流量余量提醒。
相關(guān)提醒時(shí)延定義:提醒發(fā)布時(shí)延指提醒觸發(fā)具備條件至提醒發(fā)布并向客戶成功展示所需時(shí)間,包括計(jì)費(fèi)生成時(shí)延、提醒生成時(shí)延、提醒下發(fā)時(shí)延。其中,計(jì)費(fèi)生成時(shí)延:指客戶相應(yīng)通信消費(fèi)行為產(chǎn)生對(duì)應(yīng)計(jì)費(fèi)信息并傳送至支撐系統(tǒng)的時(shí)間間隔;提醒生成時(shí)延:支撐系統(tǒng)收到客戶計(jì)費(fèi)信息,在生成提醒內(nèi)容后發(fā)布至下發(fā)平臺(tái)(如短信中心)的時(shí)間間隔;提醒下發(fā)時(shí)延:提醒下發(fā)平臺(tái)(如短信中心)收到提醒內(nèi)容并成功向客戶展示的時(shí)間間隔。
各類提醒發(fā)布時(shí)延和相關(guān)指標(biāo)參考值如表1所示。
從表1可知,在線、離線情況下,閥值提醒短信的最大提醒生成時(shí)延參考值分別是5 min和10 min,全流程的發(fā)布最大時(shí)延分別是10 min和45 min。
根據(jù)上述定義,計(jì)費(fèi)生成時(shí)延相當(dāng)于是從話單結(jié)束至支撐系統(tǒng)收到客戶計(jì)費(fèi)信息的時(shí)間間隔;提醒生成時(shí)延是從支撐系統(tǒng)收到客戶計(jì)費(fèi)信息的時(shí)間開始計(jì)算。支撐系統(tǒng)收到客戶計(jì)費(fèi)信息的時(shí)間,準(zhǔn)確來說是采集話單或采集在線消息的時(shí)間,但目前計(jì)費(fèi)系統(tǒng)中僅有話單文件的采集時(shí)間,對(duì)應(yīng)話單量龐大,僅能通過手工統(tǒng)計(jì)單個(gè)及少量話單對(duì)應(yīng)的采集時(shí)間,無法批量統(tǒng)計(jì)多個(gè)流量話單對(duì)應(yīng)的采集時(shí)間?;诖饲闆r,目前提醒生成時(shí)延有如下兩種統(tǒng)計(jì)口徑。
表1 提醒時(shí)延參考值和指標(biāo)參考值
統(tǒng)計(jì)口徑1:考慮到一般情況下采集到批價(jià)處理耗時(shí)較短,而系統(tǒng)可提供批價(jià)時(shí)間,故從系統(tǒng)批價(jià)時(shí)間即生成閥值告警開始計(jì)算。
統(tǒng)計(jì)口徑2:是從話單結(jié)束時(shí)間開始計(jì)算,但離線情況下從話單結(jié)束至支撐系統(tǒng)實(shí)際采集和處理仍有一定耗時(shí)。
目前,移動(dòng)數(shù)據(jù)流量業(yè)務(wù)閥值提醒短信下發(fā)的流程,涉及設(shè)備側(cè)、BOSS側(cè)計(jì)費(fèi)、賬管、短信廳等系統(tǒng),包括話單生成、話單處理、閥值告警生成及處理、提醒短信生成及發(fā)送等多個(gè)環(huán)節(jié),整理如圖1所示。
(1)生成離線話單或根據(jù)在線會(huì)話消息生成在線話單:客戶開始使用移動(dòng)數(shù)據(jù)流量業(yè)務(wù)、產(chǎn)生上網(wǎng)行為時(shí),若是離線方式會(huì)在GGSN等設(shè)備側(cè)生成離線話單;若是在線方式,由在線計(jì)費(fèi)系統(tǒng)根據(jù)會(huì)話消息生成在線話單。設(shè)備側(cè)數(shù)據(jù)流量話單按照每2 M流量(上下行流量之和)或每30 min(滿足任一條件)進(jìn)行切割。
(2)生成閥值告警: BOSS系統(tǒng)計(jì)費(fèi)程序會(huì)對(duì)話單進(jìn)行批價(jià)處理,讀取用戶資料MDB(Memory Data Base,簡(jiǎn)稱MDB)及免費(fèi)資源MDB,根據(jù)使用量及產(chǎn)品閥值(如剩余10 M、0 M等),判斷是否觸發(fā)閥值告警,滿足則觸發(fā)閥值告警,從免費(fèi)資源MDB中導(dǎo)出告警記錄至賬務(wù)數(shù)據(jù)庫(kù)流量提醒表中。
(3)處理閥值告警生成提醒短信:BOSS系統(tǒng)賬管程序會(huì)實(shí)時(shí)掃描賬務(wù)數(shù)據(jù)庫(kù)流量提醒表,多線程并發(fā)處理相應(yīng)記錄,根據(jù)提醒模板、提醒規(guī)則、提醒內(nèi)容等拼接生成提醒短信,處理后寫歷史表。
(4)提醒短信提交至短信中心:BOSS系統(tǒng)短廳程序?qū)崟r(shí)掃描短信發(fā)表中提醒短信并提交網(wǎng)絡(luò)側(cè)短信中心,處理后寫短信發(fā)送歷史表。
(5)短信中心下發(fā)客戶:網(wǎng)絡(luò)側(cè)短信中心將BOSS提交的短信發(fā)送給用戶,成功發(fā)送則生成相應(yīng)短信話單。
綜上,閥值提醒短信的下發(fā)涉及到話單生成、話單處理、閥值告警生成及處理、提醒短信生成及發(fā)送等4個(gè)主要環(huán)節(jié),各環(huán)節(jié)的時(shí)延長(zhǎng)短會(huì)影響到客戶對(duì)流量提醒短信是否及時(shí)的感知。
基于此流程,結(jié)合日常維護(hù)和投訴處理相關(guān)情況,總結(jié)出目前系統(tǒng)中主要存在如下兩個(gè)問題,這些問題也是導(dǎo)致提醒不及時(shí)相關(guān)投訴居高不下的重要原因之一。
圖1 移動(dòng)數(shù)據(jù)流量業(yè)務(wù)閥值提醒短信下發(fā)流程
(1)離線情況下因網(wǎng)絡(luò)斷連、網(wǎng)元異常、賬號(hào)密碼過期等情況造成話單采集不及時(shí),影響到話單后續(xù)處理,導(dǎo)致閥值提醒不及時(shí)。
例如,2014年5月出現(xiàn)臨時(shí)網(wǎng)絡(luò)故障,設(shè)備側(cè)與BOSS側(cè)網(wǎng)絡(luò)斷聯(lián),導(dǎo)致BOSS側(cè)無法采集到設(shè)備側(cè)生成的話單,網(wǎng)絡(luò)恢復(fù)正常后才將積壓在設(shè)備側(cè)話單采集過來并進(jìn)行后續(xù)處理,延遲最長(zhǎng)達(dá)30余分鐘。
從BOSS側(cè)較難主動(dòng)發(fā)現(xiàn)網(wǎng)元異常情況,而網(wǎng)絡(luò)連通性問題,易受設(shè)備側(cè)、BOSS側(cè)雙方影響,且存在較多不可控因素,如施工導(dǎo)致傳輸斷、網(wǎng)絡(luò)設(shè)備老化等,可優(yōu)化空間較小?;诖?,可以考慮從監(jiān)控網(wǎng)絡(luò)連通性、業(yè)務(wù)對(duì)應(yīng)話單文件生成等情況來發(fā)現(xiàn)異常。
(2)離線話單占比高,導(dǎo)致整體提醒時(shí)延偏長(zhǎng)。
以某市公司2014年5月一天全量非漫游移動(dòng)數(shù)據(jù)流量話單為例,話單總數(shù)為2261萬條,在線話單數(shù)為1 399萬條,在線話單數(shù)占比61.87%,即離線話單占比超38%,占比較高?;诮y(tǒng)計(jì)口徑2時(shí),在線情況下提醒短信平均時(shí)延已低于0.5 min,離線對(duì)應(yīng)的提醒短信平均時(shí)延超過9 min。由此可見,離線話單占比較高,是導(dǎo)致整體(不區(qū)分在線、離線)提醒生成時(shí)延偏大的主要原因,需要提高在線話單占比。
針對(duì)問題1,從BOSS側(cè)主動(dòng)監(jiān)控角度出發(fā),新增話單采集點(diǎn)連通性監(jiān)控、話單超時(shí)未生成及生成延遲的監(jiān)控,可降低網(wǎng)絡(luò)異常、網(wǎng)元異常等情況對(duì)話單采集的影響。
BOSS側(cè)計(jì)費(fèi)主機(jī)是一般是通過FTP登錄采集點(diǎn)進(jìn)行移動(dòng)數(shù)據(jù)流量話單采集的。梳理采集進(jìn)程中的采集配置,新增監(jiān)控腳本,根據(jù)采集點(diǎn)IP、采集賬號(hào)、密碼、話單文件源路徑等關(guān)鍵字段模擬計(jì)費(fèi)主機(jī)FTP登錄,根據(jù)能否登錄、登錄后相應(yīng)路徑話單文件數(shù)量等情況來判斷到對(duì)應(yīng)采集點(diǎn)的網(wǎng)絡(luò)連通性,對(duì)異常情況進(jìn)行告警,核查確認(rèn)后通知設(shè)備側(cè)進(jìn)行相應(yīng)核查。
離線情況下的移動(dòng)數(shù)據(jù)流量話單記錄是每達(dá)到2M流量(上下行流量之和)或每30 min(滿足任一條件)時(shí),即生成一條話單記錄。根據(jù)這一生成規(guī)則,查看現(xiàn)網(wǎng)話單生成情況,白天業(yè)務(wù)量較大,正常情況下話單文件生成頻率是5~16個(gè)/ min;在夜間閑時(shí),正常情況下話單文件生成頻率是個(gè)1~3個(gè)/ min??紤]BOSS側(cè)采集處理延時(shí),共計(jì)設(shè)置18個(gè)移動(dòng)數(shù)據(jù)流量話單采集進(jìn)程的超時(shí)閥值為35 min,即正常情況下超過35 min未生成話單時(shí)進(jìn)行告警。同時(shí)在解碼環(huán)節(jié),增加對(duì)話單延遲的相關(guān)監(jiān)控,如延遲超過24 h則進(jìn)行告警。出現(xiàn)上述告警時(shí),可能是設(shè)備側(cè)網(wǎng)絡(luò)異常、話單生成異常等導(dǎo)致,需進(jìn)一步核查處理,確定后通知設(shè)備側(cè)進(jìn)行相應(yīng)核查。
針對(duì)問題2,通過分析在線用戶產(chǎn)生的異常離線話單,發(fā)現(xiàn)大量用戶在BOSS側(cè)和HLR側(cè)在線計(jì)費(fèi)屬性存在不一致情況,導(dǎo)致在線用戶產(chǎn)生的在線話單走離線話單處理,導(dǎo)致提醒生成時(shí)延偏大。例如,前期遷入在線計(jì)費(fèi)系統(tǒng)的1500萬用戶中,BOSS側(cè)與HLR側(cè)在線計(jì)費(fèi)屬性一致數(shù)據(jù)約為1 100萬,BOSS側(cè)有、HLR側(cè)無在線計(jì)費(fèi)屬性的用戶約400萬,BOSS側(cè)無、HLR側(cè)有在線計(jì)費(fèi)屬性的用戶約14萬,差異的主要原因?yàn)閺腂OSS側(cè)批量遷入時(shí)部分資料發(fā)HLR失敗導(dǎo)致。
為確保BOSS側(cè)和HLR側(cè)用戶在線計(jì)費(fèi)屬性一致,分步重新將各地市用戶遷入在線計(jì)費(fèi)系統(tǒng),先從用戶量相對(duì)少的地市開始,每天遷入約20萬用戶,遷入后觀察在線計(jì)費(fèi)話單情況,無異常后再繼續(xù)進(jìn)行遷入。截至2014年10月,共計(jì)完成978萬用戶的遷入,占全區(qū)用戶的36%。
同時(shí),統(tǒng)計(jì)分析BOSS側(cè)內(nèi)部數(shù)據(jù)一致性情況,比對(duì)營(yíng)業(yè)側(cè)和賬管側(cè)在線計(jì)費(fèi)屬性相關(guān)表,修復(fù)相關(guān)差異數(shù)據(jù),并進(jìn)行用戶資料MDB初始化,確保MDB中數(shù)據(jù)與數(shù)據(jù)庫(kù)中數(shù)據(jù)一致,逐步建立BOSS側(cè)和HLR側(cè)在線計(jì)費(fèi)用戶一致性比對(duì)機(jī)制。
此外,核查在線轉(zhuǎn)離線的異常話單時(shí),發(fā)現(xiàn)存在INBOSS系統(tǒng)處理性能不足導(dǎo)致系統(tǒng)反算超時(shí)切離線的情況。針對(duì)此情況,對(duì)在線計(jì)費(fèi)系統(tǒng)進(jìn)行擴(kuò)容,增加2臺(tái)主機(jī)后,共計(jì)在4臺(tái)主機(jī)上部署在線計(jì)費(fèi)應(yīng)用程序,并增加DCC代理與INBOSS的進(jìn)程個(gè)數(shù),調(diào)整系統(tǒng)待應(yīng)答時(shí)間。同時(shí),針對(duì)4G流量話單,因4G網(wǎng)絡(luò)下速率較快,參照集團(tuán)相關(guān)參數(shù)建議值,調(diào)整了在線計(jì)費(fèi)流量片配額值,以減少不斷反算申請(qǐng)流量片的系統(tǒng)處理開銷以及話單量。通過上述一系列優(yōu)化工作,來提升在線計(jì)費(fèi)系統(tǒng)處理能力,減少在線轉(zhuǎn)離線的異常情況。
優(yōu)化措施1涉及的相關(guān)監(jiān)控部署,已于2014年6月底已全部完成。截至10月,設(shè)備及平臺(tái)側(cè)賬號(hào)過期故障出現(xiàn)2次,話單生成異常(包括超時(shí)無文件生成、生成話單延遲)故障出現(xiàn)3次、設(shè)備斷連故障出現(xiàn)1次,共計(jì)出現(xiàn)6次。而通過采集點(diǎn)連通性、話單超時(shí)未生成情況的異常告警,均主動(dòng)發(fā)現(xiàn)了上述6次故障,即做到100%主動(dòng)發(fā)現(xiàn)此類設(shè)備及平臺(tái)側(cè)異常的故障,并及時(shí)通知設(shè)備、平臺(tái)側(cè)進(jìn)行處理避免升級(jí)至更大故障,極大地降低了故障的相關(guān)影響,保障了話單采集及時(shí)性。優(yōu)化后,10月隨機(jī)抽樣數(shù)據(jù)顯示,在線話單占比由優(yōu)化前的61.87%提升至81.71%,即降低了離線話單占比。
實(shí)施優(yōu)化措施2之前,以全區(qū)客戶5月不同時(shí)間段的閥值流量提醒短信數(shù)據(jù)做統(tǒng)計(jì)分析,各環(huán)節(jié)時(shí)延情況如表2和表3所示。
備注:因各環(huán)節(jié)無唯一標(biāo)識(shí),BOSS側(cè)只能根據(jù)下發(fā)端口、客戶號(hào)碼對(duì)應(yīng)短信下發(fā)時(shí)間、接收時(shí)間等來估算客戶接收提醒短信的情況,不能完全準(zhǔn)確對(duì)應(yīng),故環(huán)節(jié)D為隨機(jī)抽樣數(shù)據(jù),總樣本數(shù)為200余萬條。
表2中,在線流量提醒閥值告警占比37.41%。不區(qū)分在線、離線時(shí),基于統(tǒng)計(jì)口徑1、2的提醒生成時(shí)延分別是0.11 min和7.23 min,全流程提醒發(fā)布時(shí)延為7.47 min;96.35%的提醒短信下發(fā)時(shí)延(環(huán)節(jié)D)均小于提醒服務(wù)規(guī)范要求的4 min,平均時(shí)延為0.24 min。雖然各環(huán)節(jié)均滿足提醒服務(wù)規(guī)范要求的最大參考時(shí)延,但從客戶角度來看,提醒不夠及時(shí),影響客戶感知。表3中,在線閥值提醒5 min及時(shí)率為99.5%,提醒較及時(shí);離線閥值提醒5 min及時(shí)率和10 min及時(shí)率分別為40.8%和52.62%。不區(qū)分在線、離線時(shí),整體閥值提醒的5 min及時(shí)率和10 min及時(shí)率僅為62.76%和70.16% ,時(shí)延較大。
表2 隨機(jī)抽樣數(shù)據(jù)-5月(優(yōu)化前)閥值流量提醒時(shí)延
表3 隨機(jī)抽樣數(shù)據(jù)-5月(優(yōu)化前)、10月(優(yōu)化后)閥值流量提醒時(shí)延分布
表4 隨機(jī)抽樣數(shù)據(jù)-10月(優(yōu)化后)閥值流量提醒時(shí)延
優(yōu)化后,以全區(qū)客戶10月不同時(shí)間段的閥值流量提醒短信數(shù)據(jù)做統(tǒng)計(jì)分析,各環(huán)節(jié)時(shí)延情況如表3和表4所示。
表4中,優(yōu)化后在線流量提醒閥值告警占比79.13%,較優(yōu)化前提升41.72 PP。不區(qū)分在線、離線時(shí),基于統(tǒng)計(jì)口徑1、2的提醒生成時(shí)延分別是0.1 min和3.46 min,全流程提醒發(fā)布時(shí)延為3.68 min,提醒較及時(shí),較優(yōu)化前縮短近一半。表3中,優(yōu)化后在線閥值提醒5 min及時(shí)率為99.97%,較優(yōu)化前提升0.47 PP;離線閥值提醒5 min及時(shí)率和10 min及時(shí)率分別為66.47%和75.41%,較優(yōu)化前分別提升25.67 PP和22.79 PP。不區(qū)分在線、離線時(shí),整體閥值提醒的5 min及時(shí)率和10 min及時(shí)率分別為87.63%和91.50% ,較優(yōu)化前分別提升24.87 PP和21.34 PP。
在目前流量閥值提醒短信下發(fā)流程中,話單生成和采集的及時(shí)性極大地影響著后續(xù)閥值提醒短信下發(fā)的及時(shí)性。在線計(jì)費(fèi)系統(tǒng)基于在線實(shí)時(shí)計(jì)費(fèi)消息生成話單,可以較好地縮短話單生成時(shí)延,有利于及時(shí)下發(fā)閥值提醒短信,降低欠費(fèi)風(fēng)險(xiǎn),從而提升客戶使用感知和客戶滿意度。隨著流量業(yè)務(wù)向在線計(jì)費(fèi)系統(tǒng)的逐步遷移,對(duì)在線計(jì)費(fèi)系統(tǒng)的穩(wěn)健性和健壯性提出了更高要求。此外,在引導(dǎo)客戶了解閥值提醒短信服務(wù)、理解提醒短信存在合理時(shí)延的同時(shí),可以考慮提供多種渠道的提醒服務(wù)來提升客戶感知,如實(shí)現(xiàn)頁面提醒、客戶端提醒等。