王西點(diǎn),王磊,龍泉,薛陽
(中國(guó)移動(dòng)通信集團(tuán)設(shè)計(jì)院有限公司,北京 100080)
AI(Artificial Intelligence,人工智能),首次提出于1956年的Dartmouth學(xué)會(huì)。會(huì)議中,麥卡賽、明斯基、羅切斯特和香農(nóng)等共同探討機(jī)器模擬人類智慧,開創(chuàng)人工智能學(xué)科。
此后,人工智能技術(shù)螺旋式發(fā)展,多次成為計(jì)算機(jī)科學(xué)的熱點(diǎn)領(lǐng)域,并產(chǎn)生了眾多流派,如以推理和知識(shí)為核心的符號(hào)主義,以仿生學(xué)為基礎(chǔ)的連接主義,以數(shù)據(jù)為核心的機(jī)器學(xué)習(xí)科學(xué)等等。21世紀(jì)初,隨著大數(shù)據(jù)技術(shù)的出現(xiàn),現(xiàn)有的數(shù)據(jù)分析能力得到了大幅提升,社會(huì)生產(chǎn)生活中積累的豐富數(shù)據(jù)資源,進(jìn)一步促進(jìn)了人工智能技術(shù)的突破。人工智能熱潮再次來臨。時(shí)至今日,人工智能已在多個(gè)領(lǐng)域取得巨大成功。
作為通信網(wǎng)絡(luò)優(yōu)化及運(yùn)維從業(yè)者,尤其在當(dāng)前通信網(wǎng)絡(luò)運(yùn)營(yíng)維護(hù)工作越來越復(fù)雜的形勢(shì)下,面臨著許多問題和挑戰(zhàn)。故我們不禁要問:人工智能是什么?在網(wǎng)絡(luò)優(yōu)化運(yùn)維工作中,能否借助人工智能算法來提升網(wǎng)絡(luò)優(yōu)化、運(yùn)維效率和質(zhì)量?如何利用人工智能開展有效應(yīng)用?
人工智能是研究、開發(fā)用于模擬、延伸和擴(kuò)展人的智能的理論、方法、技術(shù)及應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué)。作為一門交叉學(xué)科,哲學(xué)與認(rèn)知科學(xué)、數(shù)學(xué)、計(jì)算機(jī)科學(xué)、生物學(xué)、心理學(xué)、信息論等均為人工智能的研究范疇。
從算法的角度看,體系如圖1所示。
人工智能技術(shù)范圍廣泛,所有智能化算法都屬于人工智能,包括我們常用的最優(yōu)化搜索算法類。
機(jī)器學(xué)習(xí)作為人工智能的重要分支,在很多領(lǐng)域表現(xiàn)出色。機(jī)器學(xué)習(xí)指的是計(jì)算機(jī)程序可以在給定某種類別的任務(wù) T 和性能度量 P 下學(xué)習(xí)經(jīng)驗(yàn) E ,如果其在任務(wù) T 中的性能恰好可以用 P 度量,則隨著經(jīng)驗(yàn) E而提高。這類算法涉及概率論、統(tǒng)計(jì)學(xué)、逼近論、凸分析、計(jì)算復(fù)雜性理論等多門學(xué)科。
圖1 人工智能技術(shù)分類
經(jīng)典機(jī)器學(xué)習(xí)算法包括羅杰斯特回歸、決策樹、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、k-means聚類、貝葉斯網(wǎng)絡(luò)等。這些機(jī)器學(xué)習(xí)方法擅長(zhǎng)處理數(shù)據(jù)量較小的結(jié)構(gòu)化數(shù)據(jù),已在工程中得到一定應(yīng)用。但隨著數(shù)據(jù)體量及種類的增加,大部分經(jīng)典機(jī)器性能隨數(shù)據(jù)量增長(zhǎng)而提升的能力有限,對(duì)非結(jié)構(gòu)化數(shù)據(jù)(如文字、語音、圖像、視頻等)分析困難,難以應(yīng)對(duì)大數(shù)據(jù)時(shí)代的需求。
神經(jīng)網(wǎng)絡(luò)在大數(shù)據(jù)時(shí)代脫穎而出。神經(jīng)網(wǎng)絡(luò)來源于腦科學(xué),其工作原理接近人類的學(xué)習(xí)過程,并被證明單個(gè)神經(jīng)元能執(zhí)行邏輯功能。1989年,Hornik等人甚至證明:只需一個(gè)包含足夠多神經(jīng)元的隱層,多層前饋網(wǎng)絡(luò)就能以任意精度逼近任意復(fù)雜度的連續(xù)函數(shù),故開創(chuàng)了神經(jīng)網(wǎng)絡(luò)研究的時(shí)代。神經(jīng)網(wǎng)絡(luò)采用BP (Back Propagation)梯度下降算法實(shí)現(xiàn)模型學(xué)習(xí),從結(jié)構(gòu)上看,具備天然的嵌套概念層次,為深度學(xué)習(xí)的產(chǎn)生奠定基礎(chǔ)。相比其他算法,多層神經(jīng)網(wǎng)絡(luò)能隨數(shù)據(jù)量提升獲得更多性能提升,因此被認(rèn)為是一種有前途的人工智能算法。但神經(jīng)網(wǎng)絡(luò)的隱層較多時(shí),會(huì)出現(xiàn)梯度彌散,無法有效的反向傳播,故早期的神經(jīng)網(wǎng)絡(luò)通常采用1~3個(gè)隱層。
2006年,Hinton等人首次提出深度學(xué)習(xí)概念,并基于無監(jiān)督逐層預(yù)訓(xùn)練+BP算法精調(diào)來實(shí)現(xiàn)對(duì)深度網(wǎng)絡(luò)的訓(xùn)練[1,2],掀起了深度學(xué)習(xí)熱。深度學(xué)習(xí),是一種特殊的機(jī)器學(xué)習(xí)。使用嵌套的概念層次來表示并實(shí)現(xiàn)巨大的功能和靈活性,其中每個(gè)概念都定義為與簡(jiǎn)單概念相關(guān)聯(lián),而更為抽象的表示則以較不抽象的方式來計(jì)算。深度學(xué)習(xí)以神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)為基礎(chǔ),多隱層結(jié)構(gòu)能帶來學(xué)習(xí)器容量增加,激活函數(shù)的嵌套提升了表達(dá)能力,并產(chǎn)生了一系列避免梯度彌散的技術(shù)。
近10年,人工智能在語音、圖像、醫(yī)療、機(jī)器人等領(lǐng)域的突破性應(yīng)用幾乎均利用了深度學(xué)習(xí)算法。截至今日,人類可以說初步實(shí)現(xiàn)了狹義人工智能。
人工智能算法眾多,至少300項(xiàng)以上,神經(jīng)網(wǎng)絡(luò)類型也已達(dá)40種。作者僅對(duì)典型算法類別進(jìn)行梳理,并討論其在網(wǎng)絡(luò)優(yōu)化、運(yùn)維中的可能應(yīng)用方向。
首先,借助人工智能/機(jī)器學(xué)習(xí)技術(shù),可以應(yīng)用在對(duì)網(wǎng)絡(luò)覆蓋、干擾、容量等關(guān)鍵質(zhì)量指標(biāo)的建模和預(yù)測(cè);也能夠應(yīng)用在網(wǎng)絡(luò)運(yùn)維經(jīng)驗(yàn)、案例、處理工單等的深度挖掘、學(xué)習(xí)、決策;還可以實(shí)現(xiàn)對(duì)高維度網(wǎng)絡(luò)結(jié)構(gòu)、特征的降維分析、場(chǎng)景特征畫像和標(biāo)簽化建模;此外,還可以實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)隱性故障/告警/投訴類問題的異常特征分析、原因檢測(cè)和智能問題定位等方面,詳細(xì)梳理如表1所示。
在了解人工智能算法基礎(chǔ)上,根據(jù)網(wǎng)絡(luò)優(yōu)化、運(yùn)維的目標(biāo),基于網(wǎng)絡(luò)優(yōu)化、運(yùn)維流程或機(jī)制,選擇相應(yīng)的輸入數(shù)據(jù),及輸出目標(biāo)。最終設(shè)計(jì)相應(yīng)的工具實(shí)現(xiàn)流程。
表1 人工智能技術(shù)在網(wǎng)絡(luò)優(yōu)化運(yùn)維中的應(yīng)用場(chǎng)景
同時(shí),在利用人工智能技術(shù)時(shí),遵循相應(yīng)的流程。如數(shù)據(jù)預(yù)處理(含數(shù)據(jù)清洗)、特征選取或特征學(xué)習(xí)、數(shù)據(jù)集劃分、模型訓(xùn)練,及輸出測(cè)試,并根據(jù)測(cè)試結(jié)果調(diào)整相應(yīng)的算法超參數(shù)。
以下給出幾個(gè)系統(tǒng)的設(shè)計(jì)思路。
無線網(wǎng)絡(luò)覆蓋優(yōu)化是提升無線網(wǎng)絡(luò)質(zhì)量的重要工作內(nèi)容,現(xiàn)有覆蓋優(yōu)化主流技術(shù)以仿真優(yōu)化、人工經(jīng)驗(yàn)優(yōu)化為主。此外,仿真優(yōu)化很大程度上依賴傳播模型的準(zhǔn)確性,沒有充分考慮用戶及業(yè)務(wù)量分布場(chǎng)景。本系統(tǒng)提出利用深度學(xué)習(xí)來進(jìn)行覆蓋優(yōu)化,設(shè)計(jì)思路分為以下幾個(gè)步驟:
3.1.1 覆蓋TopN小區(qū)問題分析
利用MRO(Measurement Report of Original Type,測(cè)量報(bào)告原始數(shù)據(jù))數(shù)據(jù)中小區(qū)的覆蓋關(guān)系、地形地理位置數(shù)據(jù)、站型結(jié)構(gòu)數(shù)據(jù)、用戶分布情況等,構(gòu)建覆蓋評(píng)估矩陣。并通過預(yù)置規(guī)則判斷,輸出小區(qū)軟、硬參數(shù)定性調(diào)整建議或問題(包括接入電平/功率/A2門限/下傾角/方向角優(yōu)化建議,及工參準(zhǔn)確性問題),輸出TopN小區(qū)分析和定性優(yōu)化建議。
3.1.2 利用深度神經(jīng)網(wǎng)絡(luò)構(gòu)建本區(qū)域的覆蓋模型
使用小區(qū)網(wǎng)絡(luò)結(jié)構(gòu)、參數(shù)配置、地形地貌、業(yè)務(wù)類型、覆蓋指標(biāo)、干擾指標(biāo)等特征屬性,并將這些樣本按照業(yè)務(wù)邏輯進(jìn)行向量化,預(yù)處理后用于網(wǎng)絡(luò)覆蓋的精細(xì)畫像,后對(duì)本區(qū)域覆蓋模型進(jìn)行訓(xùn)練。
3.1.3 覆蓋指標(biāo)定量預(yù)測(cè)
動(dòng)態(tài)輸入功率、方向角、傾角調(diào)整方案,實(shí)現(xiàn)對(duì)弱覆蓋、過覆蓋等指標(biāo)量化預(yù)測(cè)。
本系統(tǒng)亦可根據(jù)預(yù)測(cè)結(jié)果,實(shí)現(xiàn)全流程自動(dòng)輸出推薦方案。深度學(xué)習(xí)模型設(shè)計(jì)如圖2所示。
提高參數(shù)管理和分析的智能化水平,可以提升網(wǎng)絡(luò)優(yōu)化工作效率,降低網(wǎng)絡(luò)運(yùn)維成本。LTE(Long Term Evolution)網(wǎng)絡(luò)中,各設(shè)備商無線參數(shù)總和已超過8000個(gè),僅依靠人工經(jīng)驗(yàn)很難進(jìn)行精細(xì)配置。本系統(tǒng)設(shè)計(jì)目標(biāo)為智能化的學(xué)習(xí)現(xiàn)網(wǎng)已有參數(shù)配置經(jīng)驗(yàn),快速?gòu)?fù)制和推廣參數(shù)優(yōu)化經(jīng)驗(yàn)。系統(tǒng)設(shè)計(jì)思路如下。
3.2.1 LTE小區(qū)特征建模
選取并量化特征屬性進(jìn)行無線場(chǎng)景的精細(xì)分類,包括:站型結(jié)構(gòu)、 業(yè)務(wù)量、用戶分布、用戶移動(dòng)性、鄰區(qū)結(jié)構(gòu)、地形地貌、互操作配置策略等特征。
圖2 基于深度學(xué)習(xí)的覆蓋優(yōu)化系統(tǒng)模型設(shè)計(jì)
3.2.2 基于聚類算法的小區(qū)特征分簇分類
基于無監(jiān)督機(jī)器學(xué)習(xí)聚類算法進(jìn)行小區(qū)特征分簇分類:如基于可變權(quán)重的K-Means算法,肘部法則獲取聚類結(jié)果;BIRCH算法,可識(shí)別噪音點(diǎn),但調(diào)參過程復(fù)雜,對(duì)高維數(shù)據(jù)的聚類能力較弱;DBSCAN算法計(jì)算速度快,能發(fā)現(xiàn)任意形狀的聚類,但難以反應(yīng)密度,等等[3],該類算法能夠讓計(jì)算機(jī)程序自動(dòng)完成小區(qū)特征的定量分簇分類。小區(qū)無線特征的聚類運(yùn)算過程可視化,如圖3所示。
3.2.3 參數(shù)配置與網(wǎng)絡(luò)質(zhì)量相關(guān)性分析
各場(chǎng)景特征聚類劃分結(jié)果后的簇內(nèi)小區(qū),進(jìn)行網(wǎng)絡(luò)質(zhì)量評(píng)價(jià),挖掘現(xiàn)網(wǎng)各個(gè)場(chǎng)景下的局部參數(shù)最優(yōu)配置,并固化簇內(nèi)局部參數(shù)配置經(jīng)驗(yàn),用于后續(xù)按照協(xié)同過濾算法進(jìn)行參數(shù)經(jīng)驗(yàn)值的自動(dòng)化推薦。
3.2.4 基于協(xié)同過濾算法的小區(qū)特征匹配與LTE參數(shù)智能化推薦
利用典型的鄰域算法KNN,通過計(jì)算樣本個(gè)體間的距離或者相似度尋找與每個(gè)輸入樣本個(gè)體最相近的K個(gè)個(gè)體(即找到特征最相似LTE無線小區(qū)的過程),算法的時(shí)間復(fù)雜度跟樣本的個(gè)數(shù)直接相關(guān),需要與每個(gè)個(gè)體完成一次兩兩比較的過程。最終找到參數(shù)最優(yōu)經(jīng)驗(yàn)庫中的特征最相似LTE無線小區(qū),從而實(shí)現(xiàn)參數(shù)取值的自動(dòng)推薦輸出[4]。
圖3 小區(qū)無線特征的聚類運(yùn)算過程
在廣西欽州地區(qū)進(jìn)行現(xiàn)網(wǎng)驗(yàn)證,省內(nèi)選擇67個(gè)欽州高掉線TOP小區(qū),使用場(chǎng)景參數(shù)自動(dòng)推薦工具輸出參數(shù)修改建議,累計(jì)修改254項(xiàng)參數(shù),調(diào)整后無線接通率從99.45%提升至99.65%,無線掉線率從0.5%下降至0.37%,切換成功率從98.85%提升到了98.91%,可以看到,該系統(tǒng)基本接近人工優(yōu)化的效果,同時(shí)降低人力成本,可長(zhǎng)期穩(wěn)定地進(jìn)行網(wǎng)絡(luò)優(yōu)化工作。
對(duì)于網(wǎng)絡(luò)性能告警、設(shè)備軟、硬件告警、投訴類問題等,傳統(tǒng)的網(wǎng)絡(luò)監(jiān)控和運(yùn)維方法大多基于事后處理模式,即“觸發(fā)告警→工單派發(fā)”模式,但各類性能告警一旦生成,代表網(wǎng)絡(luò)問題已經(jīng)發(fā)生,只能被動(dòng)處理。
借助人工智能算法,如果能預(yù)先預(yù)測(cè)網(wǎng)絡(luò)出問題概率,減少網(wǎng)絡(luò)故障實(shí)際發(fā)生概率,則能將運(yùn)維模式從事后處理推向事前預(yù)防,大大減少投訴發(fā)生,提升客戶感知。系統(tǒng)設(shè)計(jì)思路如下。
3.3.1 網(wǎng)絡(luò)正常運(yùn)行下的特征數(shù)據(jù)提取
在網(wǎng)絡(luò)正常運(yùn)行狀態(tài)下,提取所有和網(wǎng)絡(luò)運(yùn)行特征相關(guān)的數(shù)據(jù),如:性能、參數(shù)、告警狀態(tài)、業(yè)務(wù)量等。并將這些特征按照業(yè)務(wù)邏輯進(jìn)行向量化。
3.3.2 特征學(xué)習(xí)或降維
由于原始特征多達(dá)幾百項(xiàng),包括很多冗余特征,計(jì)算量巨大,且影響后續(xù)異常樣本分布的識(shí)別,故通過自編碼器等算法降維。
3.3.3 異常數(shù)據(jù)篩選
根據(jù)正常樣本點(diǎn)學(xué)習(xí)到分布密度,輸出待檢測(cè)數(shù)據(jù)的密度異常概率,如圖4所示[5,6]。
至此,即可實(shí)現(xiàn)告警/投訴預(yù)診斷,并進(jìn)行故障排查。更近一步,如果選用有監(jiān)督學(xué)習(xí),即異常樣本中含有故障類型標(biāo)簽,則可以根據(jù)上述流程直接輸出故障類型。
圖4 異常網(wǎng)絡(luò)質(zhì)量特征的智能檢測(cè)
探索利用現(xiàn)網(wǎng)已積累的閉環(huán)工單處理數(shù)據(jù),進(jìn)行挖掘分析并建立數(shù)學(xué)模型,利用有監(jiān)督機(jī)器學(xué)習(xí)算法,分析網(wǎng)絡(luò)特征與工單處理方案、工單反饋結(jié)果之間的映射關(guān)系等,通過大量數(shù)據(jù)訓(xùn)練模型,實(shí)現(xiàn)網(wǎng)絡(luò)問題智能分類和工單智能派發(fā)。
系統(tǒng)設(shè)計(jì)流程包括:
(1) 記錄工單實(shí)施方案和指標(biāo)前后對(duì)比效果,對(duì)網(wǎng)絡(luò)問題特征、工程師的業(yè)務(wù)處理能力聯(lián)合畫像。
(2) 基于復(fù)雜特征畫像,對(duì)有效的工單進(jìn)行機(jī)器模型學(xué)習(xí),利用模型預(yù)測(cè),實(shí)現(xiàn)網(wǎng)絡(luò)問題智能分類和工單智能派發(fā)。
(3) 不斷反饋/修正特征畫像,強(qiáng)化機(jī)器學(xué)習(xí)能力。同時(shí),不斷積累形成網(wǎng)絡(luò)問題特征庫、網(wǎng)絡(luò)分析經(jīng)驗(yàn)庫、以及人員能力庫。
針對(duì)集中維護(hù)中的隱患預(yù)測(cè)、動(dòng)態(tài)巡檢等需求進(jìn)行機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘處理。通過同步用戶權(quán)限省端數(shù)據(jù),集中優(yōu)化平臺(tái)數(shù)據(jù),動(dòng)環(huán)監(jiān)控?cái)?shù)據(jù),從多維度對(duì)站點(diǎn)運(yùn)維指標(biāo)進(jìn)行特征畫像,實(shí)現(xiàn)細(xì)粒度可視化的管理站點(diǎn)。利用人工智能技術(shù),對(duì)重要告警進(jìn)行實(shí)時(shí)預(yù)測(cè)?;谡军c(diǎn)畫像與隱患預(yù)測(cè),定位重點(diǎn)監(jiān)控小區(qū),制定動(dòng)態(tài)巡檢計(jì)劃。通過關(guān)聯(lián)工單系統(tǒng),基于歷史工單數(shù)據(jù),自動(dòng)輸出診斷方案,提高工單派發(fā)的準(zhǔn)確性。最終實(shí)現(xiàn)運(yùn)維智能化。
利用數(shù)據(jù)挖掘技術(shù),實(shí)現(xiàn)問題早發(fā)現(xiàn),由被動(dòng)的處理問題改為積極的預(yù)防問題,從而提高整體資源的利用率和維護(hù)效率。系統(tǒng)流程分別如下。
(1) 基于站點(diǎn)性能數(shù)據(jù)、告警信息、工參資源、設(shè)備情況等多個(gè)維度,對(duì)站點(diǎn)進(jìn)行統(tǒng)計(jì)畫像,實(shí)現(xiàn)運(yùn)維側(cè)的健康度評(píng)級(jí)等。
(2) 利用大數(shù)據(jù)和深度循環(huán)神經(jīng)網(wǎng)絡(luò),對(duì)已有的歷史性能、工參、及動(dòng)環(huán)類數(shù)據(jù)和歷史告警數(shù)據(jù)進(jìn)行建模,從而實(shí)現(xiàn)重要告警的提前預(yù)測(cè),并形成隱患專家診斷系統(tǒng),通過對(duì)歷史檢修方案的學(xué)習(xí),實(shí)現(xiàn)自動(dòng)輸出告警巡檢方案如圖5所示。
(3) 以隱患管理和站點(diǎn)畫像為基礎(chǔ),定位隱患小區(qū),制定動(dòng)態(tài)巡檢計(jì)劃,優(yōu)化資源調(diào)度,并執(zhí)行巡檢任務(wù)。
(4) 將工單數(shù)據(jù)進(jìn)行對(duì)接整合,并對(duì)工單進(jìn)行數(shù)據(jù)挖掘歸并,剔除不必要的工單,合并相似的工單。
圖5 基于循環(huán)神經(jīng)網(wǎng)絡(luò)的重要告警預(yù)測(cè)
當(dāng)前,人工智能的巨大進(jìn)步已在各個(gè)領(lǐng)域發(fā)揮了巨大作用,機(jī)器在完成特定任務(wù)方面的表現(xiàn)甚至超過了人類。未來,人工智能技術(shù)將深刻改變?nèi)祟惿a(chǎn)生活方式和思維模式,實(shí)現(xiàn)社會(huì)生產(chǎn)力的整體躍升。研究人工智能在網(wǎng)絡(luò)優(yōu)化運(yùn)維中的應(yīng)用,必將極大提升網(wǎng)絡(luò)智能優(yōu)化及運(yùn)維的水平,助力網(wǎng)絡(luò)運(yùn)營(yíng)降本增效。
[1] G. E. Hinton and R. R. Salakhutdinov.Reducing the Dimensionality of Data with Neural Networks[J]. Science, 2006.
[2] Yoshua Bengio.Learning Deep Architectures for AI[J]. Foundations and Trends in Machine Learning,2009
[3] 周志華. 機(jī)器學(xué)習(xí)[M]. 北京:清華大學(xué)出版社, 2016.
[4] Francesco Ricci等著. 推薦系統(tǒng):技術(shù)、評(píng)估及高效算法[M]. 北京:機(jī)械工業(yè)出版社, 2015.
[5] Han J W, Micheline K著. 數(shù)據(jù)挖掘概念與技術(shù)[M]. 北京:機(jī)械工業(yè)出版社, 2010.
[6] Witten, I. H., Frank, E著. 數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)[M].北京: 機(jī)械工業(yè)出版社, 2006.