陳 鋒,連 慧,李張錚,洪林夢(mèng)涵,張雪平(中國聯(lián)通福州分公司,福建福州 350001)
中國經(jīng)濟(jì)正處于新基建時(shí)代,移動(dòng)通信日益改變大眾工作生活方式,當(dāng)前層出不窮的虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、超高清視頻等超大帶寬移動(dòng)互聯(lián)網(wǎng)應(yīng)用對(duì)移動(dòng)寬帶網(wǎng)速提出越來越高的要求[1],5G 網(wǎng)絡(luò)應(yīng)運(yùn)而生。在目前5G 網(wǎng)絡(luò)大規(guī)模部署背景下,要拉動(dòng)5G 業(yè)務(wù)收入增長,運(yùn)營商面臨著兩大首要問題:哪部分存量3G/4G 用戶是潛在5G 用戶和這些潛在5G 用戶的常駐區(qū)域的網(wǎng)絡(luò)質(zhì)量。發(fā)展最可能成為5G 用戶的傳統(tǒng)用戶和保障最容易出問題的覆蓋地點(diǎn),是5G網(wǎng)絡(luò)端網(wǎng)協(xié)同優(yōu)化的重中之重。傳統(tǒng)營銷方式精準(zhǔn)度低,無法快速實(shí)現(xiàn)5G 用戶規(guī)?;?;5G 用戶位置信息準(zhǔn)確度不高,無法針對(duì)性進(jìn)行5G 網(wǎng)絡(luò)部署,目前用戶終端上報(bào)的MR信息中,支持A-GPS 功能終端占比低,大多數(shù)MRO 數(shù)據(jù)的用戶位置信息缺失;傳統(tǒng)網(wǎng)絡(luò)感知分析手段有限,無法實(shí)現(xiàn)用戶級(jí)評(píng)估;5G 站點(diǎn)規(guī)劃工作量大、人員水平有限的問題導(dǎo)致站址規(guī)劃效果不佳。如何在提升5G 用戶營銷成功率的同時(shí)保障5G 用戶級(jí)網(wǎng)絡(luò)感知,提升5G站點(diǎn)規(guī)劃效能,是運(yùn)營商亟待解決的問題。
基于傳統(tǒng)方式的5G 網(wǎng)絡(luò)運(yùn)營無法對(duì)哪些用戶是5G 用戶、這些用戶使用的網(wǎng)絡(luò)位置在哪、該位置的用戶網(wǎng)絡(luò)感知如何等進(jìn)行系統(tǒng)性分析,導(dǎo)致5G網(wǎng)絡(luò)運(yùn)營耗時(shí)耗力。主要表現(xiàn)在如下4個(gè)方面。
a)移動(dòng)網(wǎng)絡(luò)傳統(tǒng)用戶營銷方法存在諸多短板,比如營銷策略模糊、目標(biāo)用戶存在盲目性、營銷成效與人員水平相關(guān)等,嚴(yán)重影響5G 用戶營銷效率,同時(shí)也造成5G 網(wǎng)絡(luò)用戶保障的盲點(diǎn)。因此需要建立用戶特征模型,實(shí)現(xiàn)潛在5G用戶精準(zhǔn)挖掘。
b)用戶級(jí)網(wǎng)絡(luò)感知保障面臨復(fù)雜多變的無線環(huán)境,不同的地點(diǎn)存在不同的網(wǎng)絡(luò)質(zhì)量,要對(duì)用戶進(jìn)行精細(xì)化保障就必須知道MR 發(fā)生的真實(shí)位置,這樣才能保證用戶的網(wǎng)絡(luò)質(zhì)量問題可在地理空間上進(jìn)行回溯,但是目前支持A-GPS 功能終端占比低,大多數(shù)MRO 數(shù)據(jù)的用戶位置信息缺失。需要建立AI 位置預(yù)測(cè)模型,預(yù)測(cè)無經(jīng)緯度的5G用戶位置信息。
c)傳統(tǒng)站點(diǎn)規(guī)劃主要通過路測(cè)或者用戶投訴發(fā)現(xiàn)無線網(wǎng)絡(luò)覆蓋問題,目前主流分析方法為人工分析、排查收集到的質(zhì)差數(shù)據(jù),判斷弱覆蓋類型、弱覆蓋原因并預(yù)估解決方案,分析人員的主觀判斷在這個(gè)過程中起主要作用,容易出現(xiàn)誤判且消耗大量人力;另外采用仿真手段,通過設(shè)定基站類型和網(wǎng)絡(luò)參數(shù)輸入選址仿真軟件,輸出基站建設(shè)位置,此方案成本較高且與實(shí)際網(wǎng)絡(luò)環(huán)境存在偏差。需要在5G 用戶弱覆蓋位置信息進(jìn)行聚類,有效指導(dǎo)5G規(guī)劃。
d)傳統(tǒng)網(wǎng)絡(luò)感知保障僅限于小區(qū)級(jí)的KPI/KQI指標(biāo),無法對(duì)用戶級(jí)無線環(huán)境質(zhì)量進(jìn)行保障,這就導(dǎo)致無線網(wǎng)絡(luò)多數(shù)覆蓋面上指標(biāo)好,少數(shù)點(diǎn)上無線質(zhì)量差的表里不一現(xiàn)象,無法發(fā)現(xiàn)實(shí)際存在的問題點(diǎn),即精細(xì)化用戶級(jí)感知保障缺失,給運(yùn)營商網(wǎng)絡(luò)口碑造成巨大壓力。需要實(shí)現(xiàn)MR 數(shù)據(jù)與SEQ 數(shù)據(jù)的關(guān)聯(lián),同時(shí)依靠地理可視化工具,直觀呈現(xiàn)用戶級(jí)網(wǎng)絡(luò)感知,提升網(wǎng)絡(luò)優(yōu)化效率。
本項(xiàng)目圍繞Who、Where 和How,即5G 用戶是誰、5G用戶在哪、5G用戶網(wǎng)絡(luò)感知如何這3個(gè)核心問題來開展研究,包含5G 用戶畫像、5G 用戶位置預(yù)測(cè)、5G 智能規(guī)劃和5G網(wǎng)絡(luò)感知保障四大核心模塊。
a)5G 用戶畫像:要識(shí)別5G 用戶是誰主要解決如何找到5G 用戶的問題,傳統(tǒng)運(yùn)營商在制定5G 用戶營銷策略時(shí)往往是一刀切,沒有考慮用戶個(gè)體差異性,5G用戶發(fā)展效率低效果差,本項(xiàng)目針對(duì)這一短板利用機(jī)器學(xué)習(xí)分類算法,建立用戶特征模型,實(shí)現(xiàn)潛在5G用戶精準(zhǔn)挖掘,提升營銷效率節(jié)省成本。
b)MR 用戶位置預(yù)測(cè):要知道5G 用戶在哪主要是獲取用戶位置信息,目前5G 用戶主要是NSA 用戶,用戶同時(shí)附著于4G 和5G 網(wǎng)絡(luò)上,可以利用4G MR 獲取用戶位置信息,但僅有A-GPS 終端能實(shí)現(xiàn)位置信息獲取。目前A-GPS 終端占比低,導(dǎo)致用戶位置信息獲取不完整。針對(duì)這個(gè)問題項(xiàng)目采用MRO 多維數(shù)據(jù)進(jìn)行AI建模,預(yù)測(cè)無經(jīng)緯度的5G用戶位置。
c)5G 網(wǎng)絡(luò)感知保障:在知道用戶是誰用戶在哪后,就需要了解這些5G 用戶的網(wǎng)絡(luò)體驗(yàn)如何,傳統(tǒng)的優(yōu)化手段通過SEQ 與MR 平臺(tái)進(jìn)行分析,但2 個(gè)平臺(tái)缺乏關(guān)聯(lián)性,比如對(duì)于單用戶速率慢問題,根據(jù)SEQ無法了解到當(dāng)時(shí)用戶位置的無線環(huán)境情況,根因定位困難,針對(duì)該問題,本項(xiàng)目組開發(fā)工具自動(dòng)關(guān)聯(lián)SEQ與MR用戶數(shù)據(jù),實(shí)現(xiàn)5G用戶級(jí)感知監(jiān)控。
d)5G 智能規(guī)劃:基于5G 用戶的位置信息和感知就可以在5G建網(wǎng)初期進(jìn)行更精準(zhǔn)的站址規(guī)劃與部署,但傳統(tǒng)規(guī)劃方法更多采用人工審核,找出規(guī)劃站點(diǎn)過程中面臨工作量大、人員水平參差不齊的問題,導(dǎo)致站址規(guī)劃效果不佳,項(xiàng)目利用機(jī)器學(xué)習(xí)算法對(duì)5G用戶覆蓋差的位置進(jìn)行智能聚類,輸出5G網(wǎng)絡(luò)覆蓋亟待加強(qiáng)的區(qū)域,指導(dǎo)5G規(guī)劃。
本項(xiàng)目主要?jiǎng)?chuàng)新點(diǎn)如下。
a)5G 用戶畫像:使用出賬數(shù)據(jù)、上網(wǎng)行為、感知指標(biāo)等維度數(shù)據(jù)對(duì)多種機(jī)器學(xué)習(xí)算法進(jìn)行評(píng)估,選擇最優(yōu)的GBDT 算法進(jìn)行潛在5G 用戶建模,輸出潛在5G用戶清單。
b)5G 用戶位置預(yù)測(cè):結(jié)合MR 數(shù)據(jù)的電平、質(zhì)量、網(wǎng)絡(luò)工參的小區(qū)經(jīng)緯度、方位角、覆蓋類型等多維度數(shù)據(jù)對(duì)多種機(jī)器學(xué)習(xí)算法進(jìn)行模型選擇,最后通過隨機(jī)森林算法學(xué)習(xí)帶經(jīng)緯度標(biāo)簽的用戶級(jí)MR 特征數(shù)據(jù),同時(shí)針對(duì)全網(wǎng)統(tǒng)一建模存在的定位誤差不均衡問題,建立差異化潛在5G 用戶位置預(yù)測(cè)模型,輸出潛在5G用戶經(jīng)緯度數(shù)據(jù)。
c)5G 智能規(guī)劃:分不同場(chǎng)景基于DBSCAN 聚類分析對(duì)潛在5G 用戶位置進(jìn)行聚類發(fā)現(xiàn)無線環(huán)境差的地點(diǎn),指導(dǎo)5G智能規(guī)劃。
d)5G 網(wǎng)絡(luò)感知保障:融合時(shí)空維度無線網(wǎng)絡(luò)質(zhì)量數(shù)據(jù)和用戶經(jīng)緯度信息,可視化呈現(xiàn)監(jiān)控5G用戶網(wǎng)絡(luò)感知,提升5G網(wǎng)絡(luò)口碑。
圖1給出了基于大數(shù)據(jù)+AI的5G網(wǎng)絡(luò)運(yùn)營與保障項(xiàng)目框架。
圖1 基于大數(shù)據(jù)+AI的5G網(wǎng)絡(luò)運(yùn)營與保障項(xiàng)目框架
對(duì)每個(gè)上述核心功能模塊,本項(xiàng)目嚴(yán)格按照機(jī)器學(xué)習(xí)建模的標(biāo)準(zhǔn)流程,從數(shù)據(jù)源獲取、數(shù)據(jù)集拆分、數(shù)據(jù)預(yù)處理、特征工程、模型選擇和超參數(shù)調(diào)優(yōu)等步驟進(jìn)行模型開發(fā)[2],最終實(shí)現(xiàn)基于大數(shù)據(jù)+AI 的5G 網(wǎng)絡(luò)運(yùn)營與保障。
3.2.1 基于AI算法的5G用戶智能預(yù)測(cè)
本項(xiàng)目通過梯度提升GBDT 機(jī)器學(xué)習(xí)算法學(xué)習(xí)5G 用戶正負(fù)樣本歷史上的B 域出賬數(shù)據(jù)和O 域網(wǎng)絡(luò)數(shù)據(jù),建立5G 用戶分類預(yù)測(cè)模型,預(yù)測(cè)出傳統(tǒng)移動(dòng)網(wǎng)絡(luò)用戶是否是潛在5G用戶。該模型可在5G用戶營銷支撐、5G網(wǎng)絡(luò)感知保障等網(wǎng)優(yōu)日常工作中起到積極作用。
a)數(shù)據(jù)準(zhǔn)備。收集5G 用戶和非5G 用戶在歷史3G/4G 網(wǎng)絡(luò)上的字段數(shù)據(jù)作為樣本,這些原始字段包含B 域的用戶基礎(chǔ)信息和用戶消費(fèi)信息、O 域的用戶上網(wǎng)行為和用戶網(wǎng)絡(luò)感知KQI指標(biāo)(見表1)。
表1 5G用戶正負(fù)樣本原始字段
b)數(shù)據(jù)預(yù)處理。主要是對(duì)原始數(shù)據(jù)的缺失值或異常字符進(jìn)行校正替換,高維度類別特征進(jìn)行降維處理,類別特征不平衡字段進(jìn)行重新歸并。
c)特征工程。對(duì)樣本數(shù)據(jù)分別采用特征構(gòu)造、特征抽取和特征選擇進(jìn)行處理,舉例如下:
(a)特征構(gòu)造。通過設(shè)置標(biāo)桿時(shí)間將原始字段的“入網(wǎng)時(shí)間”轉(zhuǎn)換成在網(wǎng)月數(shù)。
(b)特征抽取。使用PCA 算法對(duì)KQI 數(shù)據(jù)進(jìn)行降維,使用降維后的PCA 分量與標(biāo)簽做相關(guān)性分析,保留最相關(guān)的分量作為最終特征進(jìn)行模型訓(xùn)練。
(c)特征選擇。采用相關(guān)系數(shù)法進(jìn)行特征篩選,為了避免部分特征間的相關(guān)性過高,導(dǎo)致多重共線性,影響模型效果,刪除相關(guān)性高的特征。
d)模型選擇與優(yōu)化。使用多種機(jī)器學(xué)習(xí)模型進(jìn)行交叉驗(yàn)證打分,選擇分?jǐn)?shù)最高的GBDT 模型進(jìn)行建模訓(xùn)練(見圖2)。
圖2 基于交叉驗(yàn)證的分類模型選擇
選定模型后利用隨機(jī)搜索算法來調(diào)整GBDT 算法的超參數(shù),最終搜索得到最佳超參數(shù)組合。在測(cè)試集上進(jìn)行評(píng)估,分類正確率acurracy 為0.858,召回率為0.732。對(duì)比二分類隨機(jī)判別50%的正確性,本模型有較好的預(yù)測(cè)性能。
3.2.2 基于MR的AI智能用戶位置定位算法
受限于終端不具備A-GPS 功能,目前MRO 攜帶位置信息的MR 數(shù)據(jù)占比較低,如何利用AI 手段學(xué)習(xí)已有的帶位置信息的MR 數(shù)據(jù)來預(yù)測(cè)不帶位置信息的MR 樣本成為網(wǎng)絡(luò)優(yōu)化智能化的重要方向。本項(xiàng)目使用自主采集解析的MRO 多維用戶MR 數(shù)據(jù),嘗試多種AI 算法對(duì)MR 樣本進(jìn)行訓(xùn)練,最終確定使用隨機(jī)森林算法分地域差異化建模,取得了較好的預(yù)測(cè)效果[3]。
a)數(shù)據(jù)準(zhǔn)備:利用前面自主開發(fā)的MRO 采集解析工具對(duì)當(dāng)日1 h的福州聯(lián)通全網(wǎng)MRO 數(shù)據(jù)進(jìn)行采集解析,得到11個(gè)維度的MR數(shù)據(jù),結(jié)合小區(qū)工參中經(jīng)緯度、區(qū)縣、方位角和覆蓋類型,共生成16個(gè)維度的訓(xùn)練集數(shù)據(jù)(見表2),同樣采集次日同時(shí)段的全網(wǎng)MRO 數(shù)據(jù)作為測(cè)試集數(shù)據(jù)。
表2 16個(gè)維度的MR訓(xùn)練數(shù)據(jù)
b)數(shù)據(jù)預(yù)處理。基數(shù)(cardinality)指的是類別特征所有可能的不同值的數(shù)量,在高基數(shù)的類別特征面前,直接使用Label Encoding 和One-Hot Encoding 的數(shù)據(jù)預(yù)處理的方法往往得不到令人滿意的結(jié)果。本項(xiàng)目的MR.LteScCgi、MR.LteScPci 和MR.LteNcPci 3 個(gè)類別特征可以發(fā)現(xiàn)存在高基數(shù)問題,因此對(duì)所述的高基數(shù)特征采用特征Hash 編碼的方式映射到低維空間,使用API為:sklearn.feature_extraction.FeatureHasher。
c)模型選擇:分別使用基于多目標(biāo)回歸的線性回歸、XGBoost、GBDT、Ridge 和隨機(jī)森林算法進(jìn)行5 折交叉驗(yàn)證模型選擇(見圖3),發(fā)現(xiàn)隨機(jī)森林算法得分最高(見圖4),因此使用隨機(jī)森林算法進(jìn)行建模。
圖3 交叉驗(yàn)證模型選擇代碼
圖4 交叉驗(yàn)證模型選擇得分
d)測(cè)試集測(cè)試結(jié)果分析:預(yù)測(cè)結(jié)果分區(qū)縣來看,存在非常明顯的地域差異,其中福州城區(qū)臺(tái)江、鼓樓、倉山和晉安好于全網(wǎng)平均水平,臺(tái)江最好,誤差僅140 m;偏遠(yuǎn)區(qū)縣閩清和永泰誤差最大,誤差達(dá)到1 km以上(見圖5)。不同區(qū)域的基站和人群的分布不一,全網(wǎng)建立一個(gè)通用的且符合預(yù)期精度的模型不具備實(shí)踐性和可操作性。
圖5 基于全網(wǎng)統(tǒng)一模型的平均預(yù)測(cè)距離誤差
e)算法優(yōu)化:鑒于上述缺陷,調(diào)優(yōu)的主要思路是選取一個(gè)大小合適的區(qū)域進(jìn)行建模和訓(xùn)練,將算法選型和模型參數(shù)優(yōu)化好之后,再在其他區(qū)域進(jìn)行推廣建模,建立差異化的位置定位算法模型。本項(xiàng)目對(duì)福州聯(lián)通13 個(gè)區(qū)(縣)MR 分別進(jìn)行差異化建模,取次日五城區(qū)同時(shí)段MR 數(shù)據(jù)作為測(cè)試集進(jìn)行測(cè)試,福州五城區(qū)的差異化建模測(cè)試效果如表3 所示,與統(tǒng)一建模相比,預(yù)測(cè)精度有較大提升。
3.2.3 基于DBSCAN算法的5G智能規(guī)劃
對(duì)于龐大復(fù)雜的5G無線網(wǎng)絡(luò),網(wǎng)絡(luò)覆蓋問題層出不窮,現(xiàn)有無線覆蓋分析的局限性日趨明顯,如何盡可能減少人工路測(cè)成本和分析成本、提高分析判斷準(zhǔn)確性成為重中之重[4]。本項(xiàng)目提出的基于DBSCAN 算法的5G 智能規(guī)劃在用戶MR 位置可以預(yù)測(cè)的基礎(chǔ)上,利用密度聚類算法定位問題,高效挖掘MR 弱覆蓋區(qū)域。對(duì)福州聯(lián)通某區(qū)域用戶MR 采樣點(diǎn)進(jìn)行篩選,定義服務(wù)小區(qū)RSRP 小于-110 dBm 的采樣點(diǎn)為弱覆蓋點(diǎn),共篩選出弱覆蓋采樣點(diǎn)3 500個(gè)[5]。
對(duì)這些弱覆蓋點(diǎn)開展第一輪粗粒度的參數(shù)搜索,先設(shè)定DBSCAN 參數(shù)最少樣本個(gè)數(shù)以10為步長,從10變化到100,半徑始終200 m,經(jīng)過DBSCAN 聚類得到的10 種弱覆蓋簇(見圖6)。從計(jì)算結(jié)果可以發(fā)現(xiàn),最少樣本個(gè)數(shù)為30 時(shí),輪廓系數(shù)值最高0.368 5。第2 輪開展細(xì)粒度的參數(shù)搜索,設(shè)置最小樣本個(gè)數(shù)以30為中心,步長為1,從25 變化到34,半徑始終200 m,使用聚類算法分析當(dāng)最少樣本個(gè)數(shù)為25 時(shí)輪廓系數(shù)最高為0.388 7。此時(shí)聚類數(shù)量為26 個(gè),即該區(qū)域發(fā)現(xiàn)26 個(gè)弱覆蓋場(chǎng)景,需要規(guī)劃建設(shè)。
圖6 福州聯(lián)通某區(qū)域弱覆蓋DBSCAN聚類結(jié)果
3.2.4 基于用戶級(jí)MR的5G網(wǎng)絡(luò)感知保障
傳統(tǒng)網(wǎng)優(yōu)平臺(tái)僅有天級(jí)小區(qū)MR 指標(biāo),無法針對(duì)用戶投訴信息進(jìn)行回溯。本項(xiàng)目將用戶SEQ 數(shù)據(jù)與MR 信息進(jìn)行關(guān)聯(lián),利用基站ID、用戶S1AP ID 和問題發(fā)生時(shí)間回溯用戶當(dāng)時(shí)特定地點(diǎn)的無線網(wǎng)絡(luò)環(huán)境,分析解決用戶網(wǎng)絡(luò)感知問題[6]。此外,在用戶級(jí)感知保障的基礎(chǔ)上擴(kuò)展實(shí)現(xiàn)區(qū)域級(jí)保障,將用戶級(jí)MR 匯總到相應(yīng)區(qū)域,渲染出全區(qū)的MR 感知分布圖,應(yīng)用于區(qū)域級(jí)網(wǎng)絡(luò)優(yōu)化。
本項(xiàng)目的落地實(shí)施為某市聯(lián)通5G 市場(chǎng)營銷和網(wǎng)絡(luò)運(yùn)營帶來了巨大效益。在5G用戶畫像應(yīng)用方面,某市聯(lián)通2020年9月實(shí)際新增5G終端用戶11 311戶,其中存量用戶5 276戶,5 276戶中預(yù)測(cè)出的用戶有2 981戶,命中率56.5%。2020 年11 月份的5G 用戶預(yù)測(cè)已向市場(chǎng)部門完成第2 次用戶推送,累計(jì)推送用戶4.9萬。在5G 智能優(yōu)化方面,基于精細(xì)化MR 的5G 用戶感知獲取模塊落地后,用戶級(jí)保障共分析4G/5G 用戶321 人,其中發(fā)現(xiàn)問題63 個(gè),解決42 個(gè),閉環(huán)率67%;區(qū)域級(jí)保障共發(fā)現(xiàn)172 個(gè)問題,解決117 個(gè),閉環(huán)率68%。問題平均解決時(shí)間由原來3 天/人降低到當(dāng)前0.5 天/人,極大提升了問題解決效率。通過基于DBSCAN 聚類分析網(wǎng)絡(luò)質(zhì)量模塊,發(fā)現(xiàn)4G/5G 現(xiàn)網(wǎng)MR 弱覆蓋地點(diǎn)97 處,對(duì)于這些問題借助5G 站點(diǎn)開通過程中的5G 網(wǎng)絡(luò)優(yōu)化來解決,同時(shí)解決4G 底層網(wǎng)覆蓋問題;第1期已解決42個(gè)問題點(diǎn),第2期計(jì)劃完成剩余45個(gè)問題點(diǎn)。
推進(jìn)全面數(shù)字化轉(zhuǎn)型是貫徹國家新基建發(fā)展戰(zhàn)略的具體行動(dòng),站在數(shù)字化轉(zhuǎn)型的新關(guān)口,福州聯(lián)通充分利用運(yùn)營商大數(shù)據(jù)優(yōu)勢(shì),結(jié)合現(xiàn)有的AI 應(yīng)用能力,針對(duì)5G 用戶是誰、5G 用戶在哪、5G 用戶網(wǎng)絡(luò)感知如何這3個(gè)核心問題來開展基于大數(shù)據(jù)+AI的5G網(wǎng)絡(luò)運(yùn)營與保障研究,取得了一系列創(chuàng)新成果,對(duì)加快福州地區(qū)5G 新基建發(fā)展、加快5G 應(yīng)用、引領(lǐng)科技創(chuàng)新、助推產(chǎn)業(yè)升級(jí)意義重大。