杜永生 蔣新建 巫江濤
摘要:通過分析一種較為系統(tǒng)的思維模型,提出了在網(wǎng)絡(luò)智能中“以智賦動”的觀點(diǎn)。通過網(wǎng)元及用戶智能識別、網(wǎng)絡(luò)資源智能調(diào)度、網(wǎng)絡(luò)智能保障、網(wǎng)絡(luò)業(yè)務(wù)智能編排4個主要智能能力,分別賦予網(wǎng)絡(luò)自動化用戶通信環(huán)境適應(yīng)能力、自動化網(wǎng)絡(luò)資源優(yōu)化能力、自動化故障修復(fù)能力、自動化業(yè)務(wù)適應(yīng)能力。介紹了當(dāng)前系統(tǒng)節(jié)能、智能無線資源管理(RRM)、邊緣智能、智能網(wǎng)規(guī)網(wǎng)優(yōu)、智能運(yùn)維保障、網(wǎng)絡(luò)安全6個應(yīng)用級子方案。最后提出了MAPE-K、智能服務(wù)側(cè)掛、模型驅(qū)動、三層共享等頂層設(shè)計思路,作為后續(xù)網(wǎng)絡(luò)智能化架構(gòu)設(shè)計的參照。
關(guān)鍵詞:網(wǎng)絡(luò)智能;思維模型;智能RRM
Abstract: Based on the systematic thinking model, “artificial intelligence endows network automation” is put forward. Through the intelligent identification of network elements and users, intelligent scheduling of network resources, intelligent guarantee of network resources and intelligent arrangement of network business, the network automation users are endowed with communication environment adaptability, automation network resource optimization capability, automatic fault repair capability, and automation business adaptability. Then six sub-schemes of system are proposed, including energy saving, intelligent radio resource management (RRM), edge intelligence, intelligent network regulation network excellence, intelligent operation and maintenance guarantee, and network security. Finally, the MAPE-K, intelligent service side-hanging, model-driven, three-tier sharing and other top-level design ideas are proposed as the reference for the following intelligent network architecture design.
Key words: network intelligence; thinking model; intelligent RRM
1 網(wǎng)絡(luò)智能的業(yè)界解決思路
1.1 利用人工智能(AI)解決網(wǎng)絡(luò)
相關(guān)問題
如何利用AI解決網(wǎng)絡(luò)相關(guān)問題,目前業(yè)界有2種做法:
一種是自上而下,即以技術(shù)驅(qū)動應(yīng)用。盡量利用成熟的AI技術(shù)解決網(wǎng)絡(luò)中的問題。如果能保證最終效果,甚至不惜重新定義網(wǎng)絡(luò)中的業(yè)務(wù)問題來適配AI技術(shù)。例如某國的運(yùn)營商通過無人機(jī)來尋找弱覆蓋區(qū)域[1],如果這個做法在城市中能普及,將大幅顛覆原有的網(wǎng)優(yōu)業(yè)務(wù)流程。
另外一種是自下而上,即業(yè)務(wù)驅(qū)動技術(shù)。先對現(xiàn)有網(wǎng)絡(luò)生產(chǎn)、管理、運(yùn)營流程的問題進(jìn)行梳理,從這些問題出發(fā)估計可能使用哪些AI技術(shù),然后研究相應(yīng)的AI技術(shù)來解決當(dāng)前流程中的問題。例如某國運(yùn)營商提出從自組織網(wǎng)絡(luò)(SON)或網(wǎng)絡(luò)優(yōu)化流程出發(fā),通過將AI技術(shù)應(yīng)用到SON中,提高現(xiàn)有算法的性能和自適應(yīng)能力,以及面對不同小區(qū)/用戶的個性化適應(yīng)能力。這種做法有針對性,但是算法如何設(shè)計、訓(xùn)練、應(yīng)用,須要自行研究,而這個研究工作恰恰是整個網(wǎng)絡(luò)智能化中最難的一環(huán)。
1.2 AI技術(shù)在IT領(lǐng)域的進(jìn)展
谷歌于2016年提出基于機(jī)器學(xué)習(xí)的Zero Touch Network[2]的概念,通過機(jī)器學(xué)習(xí)讓網(wǎng)絡(luò)層自適應(yīng)運(yùn)營業(yè)務(wù)的變化,達(dá)到自動擴(kuò)容、自動編排新業(yè)務(wù)。在Garter 2017年的關(guān)于智能運(yùn)維(AIOps)[3]的報告中,則把網(wǎng)絡(luò)智能運(yùn)維的關(guān)注點(diǎn)集中于智能檢測、預(yù)測、根因分析3個維度。Cisco提出的意圖網(wǎng)絡(luò)[4],就是通過語義理解技術(shù)將用戶的意圖轉(zhuǎn)換為網(wǎng)絡(luò)資源的自動部署和自動保障需求。
網(wǎng)絡(luò)智能涉及問題的思考方向,從抽象的層次來看,分為3點(diǎn):
(1)貫通整合。從空間角度來看,這是一個整體能力的體現(xiàn),即利用人工智能善于獲取各層數(shù)據(jù)并關(guān)聯(lián)的能力以及較成熟的語義理解技術(shù),整合貫通網(wǎng)絡(luò)業(yè)務(wù)涉及到的各層次及各層次端到端的網(wǎng)元器件。例如Zero Touch、意圖網(wǎng)絡(luò)涉及到的都是端到端網(wǎng)絡(luò)資源的整合。
(2)自適應(yīng)和模糊邏輯。從空間維度上看,這些都是網(wǎng)絡(luò)中每一個層次或個體的智能化體現(xiàn)。利用人工智能技術(shù)擅長的模式識別能力,對現(xiàn)有網(wǎng)絡(luò)進(jìn)行畫像,并進(jìn)行自適應(yīng)調(diào)整,達(dá)到網(wǎng)絡(luò)資源使用最優(yōu)化;利用人工智能的數(shù)據(jù)關(guān)聯(lián)能力替代邏輯,解決人力思考的時間成本,AIOps就屬于這種范疇;利用數(shù)據(jù)監(jiān)測控制耗能成本低的特點(diǎn),針對網(wǎng)絡(luò)中的最小個體(例如單個用戶)進(jìn)行監(jiān)測控制并進(jìn)行個性化的自適應(yīng)調(diào)整,提升用戶感知。
(3)預(yù)測。從時間維度上看,利用人工智能自優(yōu)化學(xué)習(xí)和善于從歷史數(shù)據(jù)預(yù)測未來的能力,在問題出現(xiàn)之前進(jìn)行針對性部署,能夠避免在問題造成既有損失后再設(shè)法彌補(bǔ)的情況。例如AIOps利用預(yù)測進(jìn)行預(yù)維,理論上可以把故障降低為零;SON領(lǐng)域的預(yù)測優(yōu)化場景,可以避免損失出現(xiàn)。
2 網(wǎng)絡(luò)智能化的問題分析
在通信領(lǐng)域,為了識別人工智能技術(shù)帶來的價值,減少相關(guān)風(fēng)險,我們嘗試提出一種較為系統(tǒng)的思維模型,希望能對人工智能在無線通信領(lǐng)域帶來的問題進(jìn)行較為系統(tǒng)的分析,并對各種問題的關(guān)鍵特性、價值、難易程度進(jìn)行簡要說明。
這個系統(tǒng)的思維模型如圖1所示,我們從AI能力簡易分類、網(wǎng)絡(luò)傳統(tǒng)管理層次模型、網(wǎng)絡(luò)類型3個維度對目前網(wǎng)絡(luò)智能問題進(jìn)行思考。網(wǎng)絡(luò)類型按照數(shù)據(jù)流動的方向進(jìn)行分類排列;網(wǎng)絡(luò)分層參照電信管理網(wǎng)(TMN)分層模型,并針對網(wǎng)絡(luò)智能化應(yīng)用做了一些調(diào)整,將用戶和網(wǎng)元合并為一個層次納入進(jìn)來;網(wǎng)絡(luò)層是指管理網(wǎng)絡(luò)資源優(yōu)化、均衡、調(diào)度業(yè)務(wù)的層次,管理層則是指保障網(wǎng)絡(luò)正常運(yùn)行的層次,業(yè)務(wù)層是面向運(yùn)營商最終用戶的服務(wù)的層次。AI能力分為識別、分析、預(yù)測、決策。識別是指從海量數(shù)據(jù)中學(xué)習(xí)和匹配復(fù)雜模式;分析是指從高維數(shù)據(jù)中尋找相關(guān)和因果關(guān)系;預(yù)測是指在時空維度學(xué)習(xí)數(shù)據(jù)分布規(guī)律預(yù)測未來事件;決策是指在高度復(fù)雜場景下多目標(biāo)優(yōu)化聯(lián)合求解。從這3個維度出發(fā),我們可以思考在某一種網(wǎng)絡(luò)的某一個運(yùn)作流程,能利用AI的什么能力來解決什么問題,通過這樣的模型進(jìn)行全方位、有條理的思考。下面我們將按照網(wǎng)絡(luò)分層模型對各個層次逐一進(jìn)行分析。
(1)網(wǎng)元/用戶層次。
如圖1所示,在這個層面出現(xiàn)了一個三角形區(qū)域。該區(qū)域由無線接入網(wǎng)絡(luò)類型、網(wǎng)元和面向復(fù)雜的信道模型和可移動的用戶模型、AI識別能力構(gòu)成。
·選擇無線接入網(wǎng)絡(luò)類型是因為其數(shù)量大,并是目前4G和未來5G主要的接入方式,本身涉及到當(dāng)前通信網(wǎng)絡(luò)的核心競爭力。
·該領(lǐng)域主要利用AI技術(shù)中的識別技術(shù),通過對無線通信物理層和空口的各種場景進(jìn)行識別,提高各種空口算法性能和準(zhǔn)確率。該領(lǐng)域還能對于用戶使用模型和個人通信環(huán)境的識別、網(wǎng)絡(luò)通過自適應(yīng)識別結(jié)果來大幅提高用戶感受。例如利用AI對信道的學(xué)習(xí)識別自動適配各種參數(shù)的鏈路自適應(yīng)技術(shù),并通過射頻指紋來識別用戶的通信環(huán)境。
·該領(lǐng)域主要的困難是數(shù)據(jù)采集和AI應(yīng)用理論比較欠缺。從數(shù)據(jù)的角度看,網(wǎng)元的空口信道和用戶的使用模型、數(shù)據(jù)收集和建模非常困難,且屬于無線通信特有,是通信設(shè)備商的核心競爭力所在,無法從相鄰領(lǐng)域借鑒。另外,業(yè)界公開的論文質(zhì)量一般,我們必需腳踏實地地自行研究。
盡管非常困難,但由于提升網(wǎng)元性能和用戶感受是通信設(shè)備商的核心競爭力所在,因此我們須要作為長期項目跟蹤研究。
(2)網(wǎng)絡(luò)層面。
該層面涉及的范圍是圖1中的一條線,由決策技術(shù)、所有網(wǎng)絡(luò)類型構(gòu)成。資源優(yōu)化本來就是所有網(wǎng)絡(luò)的主要設(shè)計目標(biāo),涉及的主要AI技術(shù)是模糊決策技術(shù),即并非一定需要找到邏輯明確的原因,只要能幫助改善網(wǎng)絡(luò)資源利用效果的決策動作即可。
·網(wǎng)絡(luò)層面進(jìn)行資源優(yōu)化設(shè)計的范圍比較廣泛,即應(yīng)用比較廣泛,例如大規(guī)模多輸入多輸出(MIMO)自適應(yīng)調(diào)整、小區(qū)負(fù)荷均衡、流量均衡等。
·網(wǎng)絡(luò)層面引入AI在近期實現(xiàn)的可能性非常大。從數(shù)據(jù)的角度看,網(wǎng)絡(luò)測量的數(shù)據(jù)本身就已經(jīng)在搜集,存儲非常規(guī)范;從技術(shù)的角度看,網(wǎng)絡(luò)資源優(yōu)化的相關(guān)學(xué)術(shù)論文較多,質(zhì)量較高;從可借鑒的角度看,信息技術(shù)(IT)和通信技術(shù)(CT)問題域非常類似。另外,由于人工智能上線,導(dǎo)致算力提升,即使利用傳統(tǒng)方法也可能解決部分問題。
·由于存在規(guī)模效應(yīng),網(wǎng)絡(luò)層面優(yōu)化的絕對效果往往非常驚人,例如采用了大規(guī)模MIMO智能自適應(yīng)的網(wǎng)絡(luò),初步實驗中吞吐率上升10%,資源利用率上升20%,對于規(guī)模網(wǎng)絡(luò)來說每一個百分點(diǎn)帶來的絕對值效益非常驚人。
網(wǎng)絡(luò)層優(yōu)化相關(guān)技術(shù)較為成熟,且存在規(guī)模效應(yīng),絕對價值對運(yùn)營商來說吸引力非常大;因此,應(yīng)該屬于新興產(chǎn)業(yè)中所謂“低垂的果實”,是短期內(nèi)需要重點(diǎn)突破和投入的方向。
(3)管理層。
如圖1所示,這個層面涉及的范圍一個四邊形區(qū)域,由所有AI技術(shù)、所有網(wǎng)絡(luò)類型構(gòu)成。該區(qū)域的管理流程和基礎(chǔ)數(shù)據(jù)類型和IT網(wǎng)絡(luò)類似,所以基本可以借鑒AIOps的方法論。
·管理層優(yōu)化主要是解決運(yùn)維方內(nèi)部人力和網(wǎng)絡(luò)質(zhì)量問題。根據(jù)Garter的AIOps的方法論,關(guān)鍵問題的方向是異常檢測、根因定位、模式識別和預(yù)測。關(guān)鍵性能指標(biāo)(KPI)異常檢測和故障定界都是較為成熟的例子。
·管理層的流程和基礎(chǔ)數(shù)據(jù)類型基本和IT網(wǎng)絡(luò)類似,且數(shù)據(jù)存儲比較規(guī)范。從技術(shù)上看,此領(lǐng)域受眾較網(wǎng)絡(luò)層更為廣泛,相關(guān)的論文數(shù)量多,IT業(yè)界智能化技術(shù)領(lǐng)先的公司也在進(jìn)行研究,所以容易出現(xiàn)成果。
·管理層優(yōu)化的規(guī)模效應(yīng)沒有網(wǎng)絡(luò)層資源調(diào)度明顯,但因該領(lǐng)域向上連接業(yè)務(wù)層,向下連接資源層,根據(jù)IT領(lǐng)域的發(fā)展情況,是最有可能實現(xiàn)端到端場景的層次。
智能化技術(shù)領(lǐng)先的公司正在進(jìn)行該領(lǐng)域的相關(guān)研究,成果比較多,技術(shù)、機(jī)制較為成熟,也容易出現(xiàn)新的觀點(diǎn)和業(yè)務(wù)思路,且能提高運(yùn)營商的運(yùn)維效率,所以應(yīng)是短期內(nèi)業(yè)界主要保持研究跟進(jìn)的方向。
(4)業(yè)務(wù)層。
如圖1所示,這個層面是五角星的一個點(diǎn)。之所以是一個點(diǎn),因為這個層次是3個維度整合的頂點(diǎn)即核心網(wǎng)、業(yè)務(wù)層、AI決策能力的整合。網(wǎng)絡(luò)類型層面則是由接入網(wǎng)到核心網(wǎng),最終構(gòu)成一條完整的業(yè)務(wù)鏈條;識別、分析、預(yù)測和決策4種AI能力盡管能各自發(fā)展、獨(dú)立應(yīng)用,但大致上存在一個層層遞進(jìn)的關(guān)系,AI決策依賴識別、分析,而業(yè)務(wù)依賴管理層的網(wǎng)絡(luò)質(zhì)量保障和網(wǎng)絡(luò)層的網(wǎng)絡(luò)資源優(yōu)化。
·目前該領(lǐng)域主要的需求是在不同網(wǎng)絡(luò)類型的端到端、網(wǎng)絡(luò)分層層面、用戶業(yè)務(wù)到網(wǎng)絡(luò)資源端到端;在AI層面,則是完全的自動化訴求,目前標(biāo)準(zhǔn)提案中的意圖網(wǎng)絡(luò)則體現(xiàn)該訴求,將用戶意圖翻譯為端到端網(wǎng)絡(luò)資源需求,然后自動激活、保障、優(yōu)化,全過程能夠通過AI自主決策。
·這種意圖網(wǎng)絡(luò)的概念來源于Cisco,在IT云網(wǎng)絡(luò)中實施,CT具備一定的借鑒性,但CT虛實結(jié)合的網(wǎng)絡(luò)和IT基本完全的虛擬化和云化網(wǎng)絡(luò)存在一定的區(qū)別。從數(shù)據(jù)的角度看,不僅僅是單個領(lǐng)域的數(shù)據(jù)存儲、收集問題,而是多個領(lǐng)域的數(shù)據(jù)搜集、存儲以及規(guī)范性問題;從技術(shù)上看,需要在基礎(chǔ)數(shù)據(jù)建模和網(wǎng)絡(luò)各領(lǐng)域元器件可驅(qū)動的行為建模達(dá)到一定的深度、廣度和較高的規(guī)范性之后,業(yè)務(wù)層AI化需求才能變得鮮活起來。