李碩朋,齊思宇,林紹福,3,劉希亮,3,陳華敏
(1.北京工業(yè)大學(xué)信息學(xué)部,北京 100124;2.北京未來網(wǎng)絡(luò)科技高精尖創(chuàng)新中心,北京 100124;3.北京智慧城市研究院,北京 100124)
人工智能作為近年來科學(xué)研究的前沿領(lǐng)域,引發(fā)了社會全行業(yè)的重點關(guān)注,逐漸成為社會經(jīng)濟發(fā)展的新引擎.人工智能已經(jīng)在社會各領(lǐng)域中得到廣泛的實踐與應(yīng)用[1],其中主要包括:自然語言處理、計算機視覺、智能機器人、數(shù)據(jù)挖掘、認知與推理等.
隨著智能手機、智能汽車和智能家居等智能設(shè)備的快速增長,當(dāng)今網(wǎng)絡(luò)數(shù)據(jù)流量呈指數(shù)式增長.同時,邊緣計算、虛擬化和網(wǎng)絡(luò)切片等技術(shù)的應(yīng)用,使得網(wǎng)絡(luò)服務(wù)變得更加多樣化,提升了用戶體驗,也催生出了更加復(fù)雜的網(wǎng)絡(luò)環(huán)境.如何高效管理大量智能設(shè)備,并優(yōu)化大規(guī)模復(fù)雜網(wǎng)絡(luò)環(huán)境的資源分配,成為未來網(wǎng)絡(luò)發(fā)展的一個重要問題.
未來網(wǎng)絡(luò)需要全面擁抱人工智能.人工智能作為未來網(wǎng)絡(luò)的大腦,用于網(wǎng)絡(luò)的優(yōu)化與決策.同時,網(wǎng)絡(luò)節(jié)點算力的增強為網(wǎng)絡(luò)帶來了骨骼與肌肉,使得智能網(wǎng)絡(luò)的計算成為可能.算法與算力的協(xié)同發(fā)展將使未來網(wǎng)絡(luò)進入全新的智能化時代.
通信網(wǎng)絡(luò)的基本結(jié)構(gòu)是圖.圖數(shù)據(jù)是一種典型的非歐式空間數(shù)據(jù),具有復(fù)雜的相關(guān)性和對象間依賴性.傳統(tǒng)圖論的方法難以適應(yīng)未來網(wǎng)絡(luò)中復(fù)雜的圖形問題.因此,尋找解決復(fù)雜圖數(shù)據(jù)的算法,用以指導(dǎo)通信網(wǎng)絡(luò)的資源分配、管理調(diào)度,成為未來網(wǎng)絡(luò)中的重要科學(xué)問題.
圖神經(jīng)網(wǎng)絡(luò)作為近年來人工智能領(lǐng)域的新興技術(shù),為處理復(fù)雜圖結(jié)構(gòu)數(shù)據(jù)開辟了新空間.借助深度學(xué)習(xí)、強化學(xué)習(xí)等人工智能技術(shù),圖神經(jīng)網(wǎng)絡(luò)能夠快速挖掘圖結(jié)構(gòu)中的拓撲信息和復(fù)雜特征,已經(jīng)解決了計算機視覺、推薦系統(tǒng)、知識圖譜等領(lǐng)域的許多重大問題.因此,圖神經(jīng)網(wǎng)絡(luò)與未來網(wǎng)絡(luò)的結(jié)合,是解決網(wǎng)絡(luò)優(yōu)化問題、增強網(wǎng)絡(luò)可靠性、提升網(wǎng)絡(luò)資源利用率的重要途徑.
本文綜述了圖神經(jīng)網(wǎng)絡(luò)及其在通信網(wǎng)絡(luò)領(lǐng)域的應(yīng)用.表1給出了本文重復(fù)使用的術(shù)語簡寫形式及其含義.本文首先介紹了圖神經(jīng)網(wǎng)絡(luò)的基本模型以及幾種重要的圖神經(jīng)網(wǎng)絡(luò);其次介紹了圖神經(jīng)網(wǎng)絡(luò)在通信網(wǎng)絡(luò)各領(lǐng)域中的具體應(yīng)用方法;在結(jié)論部分探討了當(dāng)前的研究現(xiàn)狀并給出了未來的研究方向.
表1 術(shù)語簡寫及含義Table 1 Abbreviations and meanings of terms
圖神經(jīng)網(wǎng)絡(luò)的概念由Gori等[2]于2005年最早提出,Scarselli等[3]對此模型進行了更詳細的闡述.Gori等提出的圖神經(jīng)網(wǎng)絡(luò)借鑒了神經(jīng)網(wǎng)絡(luò)領(lǐng)域的研究成果,能夠直接處理圖結(jié)構(gòu)數(shù)據(jù),其核心是局部轉(zhuǎn)移函數(shù)和局部輸出函數(shù).局部轉(zhuǎn)移函數(shù)生成節(jié)點的狀態(tài)向量,該向量包含節(jié)點的鄰域信息.轉(zhuǎn)移函數(shù)在所有節(jié)點間共享,并根據(jù)輸入的鄰域更新節(jié)點的狀態(tài)向量h,其表達式為
(1)
ov=g(hv,xv)
(2)
局部轉(zhuǎn)移函數(shù)和局部輸出函數(shù)應(yīng)用于所有節(jié)點的堆疊形式構(gòu)成了GNN結(jié)構(gòu).模型通過迭代最終將達到穩(wěn)定狀態(tài).
早期的圖神經(jīng)網(wǎng)絡(luò)存在很大的局限性,其效率較低,計算成本較大,同時節(jié)點特征難以影響多次更新后的狀態(tài).近年來,為了更高效地處理圖結(jié)構(gòu)數(shù)據(jù),陸續(xù)有新型圖神經(jīng)網(wǎng)絡(luò)及應(yīng)用研究被提出.
GCN將卷積運算引入圖結(jié)構(gòu),是目前最主要的圖神經(jīng)網(wǎng)絡(luò)之一,根據(jù)特征提取方式的不同,可劃分為基于譜域的圖卷積網(wǎng)絡(luò)和基于空間域的圖卷積網(wǎng)絡(luò).
基于譜域的圖卷積網(wǎng)絡(luò)源自于圖信號處理,引入濾波器對圖卷積進行定義,可將其理解為通過濾波器去除噪聲從而得到輸入信號的分類結(jié)果[4].Bruna等[5]基于譜圖理論首次提出了定義譜域圖卷積網(wǎng)絡(luò)的卷積層函數(shù).2016年,Kipf等[6]首次提出了GCN的概念,此處的GCN為基于譜域的圖卷積網(wǎng)絡(luò).Kipf等將譜域圖卷積定義為信號與濾波器函數(shù)的乘積,其表達式為
gθ*x=UgθUTx
(3)
式中:gθ為濾波器函數(shù);x為圖在節(jié)點上的信號;U為圖歸一化拉普拉斯矩陣的特征向量.gθ可以被理解為圖拉普拉斯矩陣的特征值函數(shù),即gθ(Λ),Λ為圖拉普拉斯矩陣的特征值組成的對角矩陣,θ為函數(shù)參數(shù).為降低計算復(fù)雜度,可以對gθ(Λ)進行近似處理,其表達式為
(4)
(5)
(6)
式中:Tk為k階切比雪夫多項式;θ′為切比雪夫系數(shù)向量;L為圖拉普拉斯矩陣;λmax為L的最大特征值;IN為單位矩陣;D為對角度矩陣;A為鄰接矩陣.當(dāng)限制k=1時,卷積層可簡化為
(7)
令
(8)
(9)
則圖卷積網(wǎng)絡(luò)的卷積層公式為
(10)
式中:σ(·)為非線性激活函數(shù);W(l)為第l層圖卷積網(wǎng)絡(luò)的權(quán)重矩陣.
GCN的概念被提出后,陸續(xù)有新形式的基于譜域的圖卷積網(wǎng)絡(luò)模型被提出,如AGCN[7]、CayleyNet[8]、AGC[9]等.但基于譜域的圖卷積網(wǎng)絡(luò)無法處理有向圖且擴展性較差,而基于空間域的GCN更加靈活與通用.
基于空間域的圖卷積網(wǎng)絡(luò)根據(jù)節(jié)點的空間關(guān)系定義圖卷積.NN4G[10]是最早提出的基于空間域的圖卷積網(wǎng)絡(luò),其通過對節(jié)點鄰域特征信息的直接累加實現(xiàn)圖卷積.Gilmer等[11]提出的MPNN可看作基于空間域的圖卷積網(wǎng)絡(luò)的通用框架.MPNN將空間域卷積分解為信息傳遞和狀態(tài)更新2個過程,其將節(jié)點v的特征作為隱藏狀態(tài)的初始態(tài),即
(11)
式中xv為節(jié)點v的特征.MPNN的隱藏狀態(tài)更新公式為
(12)
式中:l為層索引;Ul(·)為更新函數(shù);Ml(·)為信息傳遞函數(shù).得到圖中所有節(jié)點的隱藏表示后,可通過readout函數(shù)生成整個圖的表示.
(13)
式中R(·)為readout函數(shù).通過定義不同形式的更新函數(shù)、信息傳遞函數(shù)和readout函數(shù),MPNN可以表示多種基于空間域的圖卷積網(wǎng)絡(luò).典型的基于空間域的圖卷積網(wǎng)絡(luò)還包括PATCHY-SAN[12]、GraphSage[13]和DCNN[14]等.
基于譜域的圖卷積網(wǎng)絡(luò)方法與基于空間域的圖卷積網(wǎng)絡(luò)方法的總結(jié)與對比如表2所示,表中時間復(fù)雜度為各方法進行圖卷積計算的時間復(fù)雜度,n為節(jié)點數(shù),m為邊數(shù).
表2 圖卷積網(wǎng)絡(luò)方法的比較與總結(jié)Table 2 Comparison and summary of graph convolutional networks methods
GAT在圖卷積網(wǎng)絡(luò)的基礎(chǔ)上引入了注意力機制,使模型能夠?qū)W⒂诤彤?dāng)前任務(wù)最相關(guān)的信息,從而改進模型性能.基于譜域的GCN中,濾波器函數(shù)依賴于拉普拉斯矩陣,而拉普拉斯矩陣來源于圖結(jié)構(gòu),這使得在特定圖上訓(xùn)練的模型無法直接應(yīng)用于其他圖結(jié)構(gòu).為解決這一問題,Velikovi等[15]提出了一種新型的圖神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),即GAT.
GAT學(xué)習(xí)圖中每個節(jié)點的鄰域特征的平均值,根據(jù)鄰域的重要性進行稀釋加權(quán).圖注意力層是GAT實現(xiàn)注意力機制的關(guān)鍵結(jié)構(gòu).圖注意力層以圖中節(jié)點的特征為輸入,輸出另一組可能具有不同基數(shù)的更高層次的節(jié)點特征.圖注意力層通過注意力機制a得到的注意力系數(shù)實現(xiàn)輸入與輸出的轉(zhuǎn)換,注意力系數(shù)表示節(jié)點j對于節(jié)點i的重要性,其表達式為
eij=a(Wxi,Wxj)
(14)
式中:W為應(yīng)用于所有節(jié)點的權(quán)重矩陣,代表輸入特征與輸出特征間的關(guān)系;xi和xj分別為節(jié)點i和節(jié)點j的特征.模型通過只計算節(jié)點與其鄰居節(jié)點的注意力系數(shù)將注意力機制引入圖結(jié)構(gòu),而不需考慮圖的結(jié)構(gòu)信息.為簡化運算和便于比較,對注意力系數(shù)進行正則化處理,并將其用于生成輸出特征
(15)
式中:σ(·)為非線性激活函數(shù);αij為正則化后的注意力系數(shù).GAT中還引入了與Transformer架構(gòu)[16]類似的多頭注意力機制,能夠針對相鄰節(jié)點對進行并行計算,穩(wěn)定學(xué)習(xí)過程.
GAT方法的復(fù)雜度較低且只關(guān)注相鄰節(jié)點,無須整張圖的信息,其應(yīng)用于新的圖結(jié)構(gòu)時不需重復(fù)訓(xùn)練模型.針對復(fù)雜的圖結(jié)構(gòu),有研究提出了新型的圖注意力網(wǎng)絡(luò),如異構(gòu)圖注意力網(wǎng)絡(luò)[17]和動態(tài)圖注意力網(wǎng)絡(luò)[18],這些模型能夠在更加復(fù)雜、信息量更大的網(wǎng)絡(luò)中取得更好的效果.
GAE是一種無監(jiān)督的學(xué)習(xí)框架,能夠?qū)D結(jié)構(gòu)轉(zhuǎn)化為低維向量,并利用編碼信息重建圖結(jié)構(gòu),常用于圖嵌入(graph embedding,GE)和圖結(jié)構(gòu)生成.
圖嵌入是一種圖表示學(xué)習(xí) (graph representation learning,GRL)方法,其目的是在保留節(jié)點信息的同時將圖結(jié)構(gòu)數(shù)據(jù)映射為低維稠密向量.圖嵌入使圖結(jié)構(gòu)數(shù)據(jù)能夠被更高效地應(yīng)用于傳統(tǒng)機器學(xué)習(xí)算法,從而在推薦、分類等任務(wù)中取得更好的結(jié)果,典型方法包括基于隨機游走的圖嵌入,如DeepWalk[19]和Node2Vec[20],以及基于矩陣分解的圖嵌入,如奇異值分解(singular value decomposition,SVD)、局部線性嵌入(locally linear embedding,LLE)和非負矩陣分解(nonnegative matrix factorization,NMF).相比基于隨機游走和基于矩陣分解的圖嵌入,圖自編碼器能夠應(yīng)用于高度非線性的圖結(jié)構(gòu),保留圖的非線性結(jié)構(gòu)與復(fù)雜特征.
2014年,Tian等[21]首次將自動編碼器(autoencoder)應(yīng)用于圖數(shù)據(jù),該模型將圖的鄰接矩陣或其變體作為原始節(jié)點特征,通過堆疊稀疏自編碼器(sparse autoencoder,SAE)生成了圖的非線性嵌入,即低維節(jié)點表示.SDNE[22]是一種同樣采用堆疊自動編碼器結(jié)構(gòu)的重要的圖自編碼器模型,其分別通過節(jié)點間的一階相似性和二階相似性保持圖的局部網(wǎng)絡(luò)結(jié)構(gòu)和全局網(wǎng)絡(luò)結(jié)構(gòu),利用多層非線性函數(shù)生成圖嵌入向量.SDNE的隱藏層表達式為
(16)
(17)
式中xv為節(jié)點v的特征;W(l)為第l層權(quán)重矩陣;b(l)為第l層偏差.得到最后的隱藏層輸出后,可通過反轉(zhuǎn)編碼器的計算過程獲得輸出表示x′.SDNE包含2個損失函數(shù),其中第一損失函數(shù)采用拉普拉斯特征映射的思想,用以保留一階相似性,其表達式為
(18)
式中:si,j表示圖中節(jié)點的連接關(guān)系,當(dāng)且僅當(dāng)節(jié)點i與節(jié)點j相連時,si,j>0.第二損失函數(shù)用以保持二階相似性,并引入懲罰向量對非零元素的重構(gòu)誤差施加相比零元素更大的懲罰,其表達式為
(19)
Lmix=L2nd+αL1st+νLreg
(20)
式中Lreg為正則化L2范數(shù),用于防止過擬合.
另一類圖自編碼器利用變分自編碼器(variational autoencoders,VAE)[23]實現(xiàn)圖嵌入,變分自編碼器是一種重要的生成模型,能夠提高模型的泛化能力.VGAE[24]首先將變分自編碼器應(yīng)用于圖結(jié)構(gòu),其推理模型,即編碼器,利用了一個2層的GCN[6]結(jié)構(gòu),其表達式為
(21)
(22)
式中:μ為編碼器的均值矩陣;log(σ)為方差矩陣;X為特征矩陣;A為鄰接矩陣;zi為隨機潛在變量.VGAE的生成函數(shù),即解碼器,由隱藏變量的內(nèi)積得出,其表達式為
(23)
除VGAE外,使用變分自動編碼器的圖自編碼器還包括RGVAE[25]、DVNE[26]、ARVGA[27]等.
除圖卷積網(wǎng)絡(luò)和圖注意力網(wǎng)絡(luò)外,常用的圖神經(jīng)網(wǎng)絡(luò)還包括門控圖神經(jīng)網(wǎng)絡(luò)(gated graph neural networks,GGNN)和時空圖神經(jīng)網(wǎng)絡(luò)(spatial-temporal graph neural networks,STGNN)等.
門控圖神經(jīng)網(wǎng)絡(luò)是對傳統(tǒng)圖神經(jīng)網(wǎng)絡(luò)架構(gòu)的改進,通過將門控循環(huán)單元(gated recurrent unit,GRU)引入圖神經(jīng)網(wǎng)絡(luò),提高了模型在信息長期傳播時的性能.Li等[28]提出的門控圖序列神經(jīng)網(wǎng)絡(luò)將門控循環(huán)單元引入到信息傳播過程,將迭代循環(huán)控制在固定的步數(shù),不再需要進行參數(shù)約束以保證收斂.除該模型外,門控圖神經(jīng)網(wǎng)絡(luò)模型還包括GAAN[29]等.
時空圖(spatio-temporal graph)[30]是一種刻畫實體間在空間與時間維度上交互的圖結(jié)構(gòu),其擁有節(jié)點、時空邊(spatio-temporal edge)和時間邊(temporal edge)3個基本要素,高維特征空間中的特征矩陣會隨時間而變化.時空圖神經(jīng)網(wǎng)絡(luò)能夠?qū)W習(xí)時空圖中的隱藏模式,同時獲取圖結(jié)構(gòu)中時間域和空間域的特征信息.時空圖神經(jīng)網(wǎng)絡(luò)可以被分為基于循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)的方法和基于卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)的方法.基于RNN的STGNN通過圖卷積捕獲時空相關(guān)性,如文獻[31-32].基于CNN的STGNN相比基于RNN的方法,以非遞歸的方式處理時空圖,能夠進行并行計算且可以避免梯度爆炸或梯度消失問題,如CGCN[33].
上述圖神經(jīng)網(wǎng)絡(luò)方法具有處理復(fù)雜通信網(wǎng)絡(luò)問題的能力,已經(jīng)被應(yīng)用到網(wǎng)絡(luò)功能虛擬化、無線網(wǎng)絡(luò)資源分配、網(wǎng)絡(luò)建模與性能分析等方面.已有研究成果的應(yīng)用領(lǐng)域與實現(xiàn)方法如表3所示.
表3 圖神經(jīng)網(wǎng)絡(luò)在通信網(wǎng)絡(luò)領(lǐng)域應(yīng)用總結(jié)Table 3 Summary of GNN in communication networks
軟件定義網(wǎng)絡(luò)(software defined network,SDN)和網(wǎng)絡(luò)功能虛擬化(network functions virtualization,NFV)是近年來通信網(wǎng)絡(luò)領(lǐng)域的研究熱點,SDN將網(wǎng)絡(luò)的控制平面與轉(zhuǎn)發(fā)平面分離,通過中央控制器,獲得整個網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和資源信息.NFV借助虛擬化技術(shù)將網(wǎng)絡(luò)功能從傳統(tǒng)硬件設(shè)備中剝離出來,提升了網(wǎng)絡(luò)配置的靈活性.
GNN可以用于解決SDN和NFV中需要探索圖結(jié)構(gòu)的問題,例如動態(tài)資源分配、服務(wù)功能鏈(service function chain,SFC)建立和虛擬網(wǎng)絡(luò)映射(virtual network embedding,VNE).
2.1.1 SFC動態(tài)資源分配
圖神經(jīng)網(wǎng)絡(luò)于2017年首次用于NFV動態(tài)資源分配.Mujumbi等[34]提出一種用于SFC流量預(yù)測的監(jiān)督學(xué)習(xí)方法.該方法利用GNN將輸入的歷史流量映射為輸出的預(yù)測流量,并據(jù)此調(diào)節(jié)資源分配.此模型的圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練2個函數(shù):點的轉(zhuǎn)移函數(shù)和輸出函數(shù).節(jié)點n的轉(zhuǎn)移函數(shù)輸入n的特征、所有鄰接邊特征、所有相鄰節(jié)點特征及狀態(tài),輸出節(jié)點n的狀態(tài).輸出函數(shù)根據(jù)點的狀態(tài)和特征計算節(jié)點輸出.
Jaliodia等[35]使用與文獻[34]同樣的圖神經(jīng)網(wǎng)絡(luò),但采用異步深度強化學(xué)習(xí)(deep reinforcement learning,DRL)模型解決SFC資源需求預(yù)測問題.此類問題的本質(zhì)是傳統(tǒng)的基于機器學(xué)習(xí)的回歸模型.
Liu等[36]利用GNN預(yù)測NFV資源需求,從而獲得請求即將到來的預(yù)先信息,并提高基于深度強化學(xué)習(xí)的SFC重構(gòu)算法的有效性.
網(wǎng)絡(luò)流量遷移也是動態(tài)資源配置的一個重要分支問題.Sun等[37-38]提出一種利用GNN和深度強化學(xué)習(xí)實現(xiàn)NFV網(wǎng)絡(luò)流量遷移的方法,該方法將輸入的網(wǎng)絡(luò)拓撲結(jié)構(gòu)映射為輸出的遷移后網(wǎng)絡(luò)拓撲結(jié)構(gòu),用于實現(xiàn)網(wǎng)絡(luò)流量的擴增、縮減和負載均衡.
SFC動態(tài)資源分配問題的本質(zhì)是拓撲結(jié)構(gòu)的變換,優(yōu)化目標為端到端總延遲,且不存在復(fù)雜限制條件,易于利用GNN求解.
2.1.2 服務(wù)功能鏈建立
不同于SFC動態(tài)資源分配,SFC建立問題需要根據(jù)輸入的網(wǎng)絡(luò)請求,通過算法按次序求得輸出的網(wǎng)絡(luò)拓撲結(jié)構(gòu).SFC建立問題包含虛擬網(wǎng)絡(luò)功能(virtual network function,VNF)的放置和鏈接的建立.解決該問題通常需要借助自然語言處理中的序列模型.
Heo等[39]提出了一種針對該問題的圖神經(jīng)網(wǎng)絡(luò)序列模型.該模型由編碼器和解碼器組成,編碼器用于表示網(wǎng)絡(luò)的拓撲結(jié)構(gòu),解碼器用于計算相鄰節(jié)點的概率和執(zhí)行VNF的概率.在編碼器中,拓撲結(jié)構(gòu)由標記矩陣和鄰接矩陣表示.標記矩陣用于標記節(jié)點可接收的VNF類型,鄰接矩陣用于表示延遲.編碼器使用GGNN將拓撲結(jié)構(gòu)進行編碼,解碼器每次選擇一個節(jié)點直到完成整個路徑選擇.解碼器的狀態(tài)編碼包含完整VNF請求、下一個需執(zhí)行的VNF和當(dāng)前所在物理節(jié)點.解碼器輸出選擇下一個節(jié)點的概率以及是否要在此節(jié)點上執(zhí)行VNF.
Kim等[40-41]利用GNN學(xué)習(xí)代表物理網(wǎng)絡(luò)的圖結(jié)構(gòu)中節(jié)點的狀態(tài)嵌入,再通過附加輸出層對節(jié)點上的VNF類型和最優(yōu)VNF實例數(shù)進行預(yù)測,能夠得到更具體的VNF管理策略,該模型同時適用于物理網(wǎng)絡(luò)動態(tài)變化的場景.
Sun等[42]提出了與文獻[39-41]相似的強化學(xué)習(xí)模型用于解決VNF放置問題,區(qū)別在于使用GNN抽取節(jié)點和鏈接資源.
上述SFC建立方法關(guān)注于VNF放置問題.此類方法借助于GNN可用于圖節(jié)點分類的特性,但并未涉及鏈接建立,因此具有一定的局限性.
2.1.3 虛擬網(wǎng)絡(luò)映射
虛擬網(wǎng)絡(luò)映射問題類似SFC建立問題,但網(wǎng)絡(luò)請求、資源限制條件更為復(fù)雜.VNE問題分為節(jié)點映射和鏈接映射.已有的GNN解決VNE問題的方法主要集中在節(jié)點映射方面.
Habibi等[43]提出一種利用GAE輔助VNE物理節(jié)點分類的方法.該模型的輸入是鄰接矩陣和資源特征矩陣,通過圖神經(jīng)網(wǎng)絡(luò)訓(xùn)練出可以重建網(wǎng)絡(luò)拓撲結(jié)構(gòu)的監(jiān)督學(xué)習(xí)模型.
Yan等[44]提出利用GCN結(jié)合深度強化學(xué)習(xí)完成節(jié)點分類任務(wù).該方法采用actor-critic強化學(xué)習(xí),其中GCN用于抽取物理節(jié)點特征,從物理節(jié)點抽取出的特征與虛擬網(wǎng)絡(luò)請求通過前饋神經(jīng)網(wǎng)絡(luò)(feed forward neural networks,FF)融合,最終得到映射節(jié)點的概率分布.
事實上,針對大規(guī)模復(fù)雜網(wǎng)絡(luò)的SFC建立和VNE問題,考慮到節(jié)點和鏈接資源以及優(yōu)化目標的復(fù)雜性,圖神經(jīng)網(wǎng)絡(luò)是提取拓撲信息的有力工具,具有提供更快速、更優(yōu)化的解的潛力.
隨著5G、物聯(lián)網(wǎng)、邊緣計算等技術(shù)的快速發(fā)展與應(yīng)用,無線網(wǎng)絡(luò)的資源分配問題變得越來越重要.無線接入網(wǎng)可以抽象為圖拓撲結(jié)構(gòu),其中用戶和基站為點,無線信道為鏈接.用戶、基站、無線信道需要通力協(xié)作,通過資源的有效配置,在不同應(yīng)用場景下實現(xiàn)多樣化的優(yōu)化目標,提升網(wǎng)絡(luò)資源的利用率.
2.2.1 功率控制
無線功率控制問題是如何確定各發(fā)送端的發(fā)射功率,使網(wǎng)絡(luò)達到整體最優(yōu)的信噪比的問題.其基本模型是一個帶有限制條件的優(yōu)化問題,優(yōu)化目標是信號與干擾加噪聲比的加權(quán)和,限制條件是基站或設(shè)備的發(fā)射功率.
Shen等[45]提出將多用戶無線信道用一個完全圖來表示,并利用GNN解決功率控制問題.該完全圖的節(jié)點是一個收發(fā)對,節(jié)點特征包含直接信道狀態(tài)和權(quán)重;圖的鏈接是干擾信道,鏈接特征為干擾信道狀態(tài).該方法通過GCN訓(xùn)練轉(zhuǎn)移函數(shù)和輸出函數(shù),用于輸出每個發(fā)射器最優(yōu)化的發(fā)射功率.
考慮到實際問題中基站和用戶的情況,Guo等[47]提出一種解決異構(gòu)網(wǎng)絡(luò)功率控制問題的方法.該模型的節(jié)點包含基站和用戶2種異構(gòu)節(jié)點,異構(gòu)節(jié)點采用不同的轉(zhuǎn)移函數(shù),并用參數(shù)共享得到輸出結(jié)果.
無線功率控制問題并不是一個直觀的圖結(jié)構(gòu)問題,因此需要通過建模將問題轉(zhuǎn)化為圖結(jié)構(gòu),隨后利用GNN模型求解.
2.2.2 其他資源分配問題
無線功率控制問題的GNN模型可以被擴展,用以解決其他無線資源分配問題,例如波束成形[46]、設(shè)備間通信[48]、信道選擇[49-50]、拓撲控制[51]等.
Lee等[48]提出一種基于圖嵌入解決設(shè)備間通信無線連接調(diào)度問題的方法.該問題的圖抽象模型與文獻[45]相同,區(qū)別在于優(yōu)化問題的變量是二元的,即收發(fā)對是否開啟.該方法采用Structure2Vec圖嵌入模型將圖結(jié)構(gòu)轉(zhuǎn)化為低維向量,并通過FF解決二元分類問題從而得到輸出結(jié)果.
考慮到信道狀態(tài)難以獲得的情況,Zhao等[49]提出利用強化學(xué)習(xí)結(jié)合GCN解決認知無線電中信道選擇和功率控制問題.智能體觀測網(wǎng)絡(luò)狀態(tài),通過GCN生成動作,執(zhí)行動作后根據(jù)網(wǎng)絡(luò)的反饋學(xué)習(xí)優(yōu)化GCN參數(shù).
Nakashima等[50]利用基于深度強化學(xué)習(xí)的GCN提取具有拓撲信息的信道向量的特征,進而生成信道部署策略.該方法能夠在密集部署的無線局域網(wǎng)中進行信道分配,從而提高系統(tǒng)吞吐量.
Yan等[51]提出了一種基于GCN的節(jié)能拓撲控制算法,利用GCN模仿最大生成樹算法,進行鏈路預(yù)測,并根據(jù)概率圖向拓撲中引入新的邊,優(yōu)化了5G和B5G環(huán)境下無線自組織物聯(lián)網(wǎng)生命周期.
Eisen等[52]提出一種解決無線資源分配的統(tǒng)一模型:隨機邊圖神經(jīng)網(wǎng)絡(luò)(random edge graph neural networks,REGNN).REGNN和已有方法相比具有可擴展性和可轉(zhuǎn)化性,可以用于解決功率控制、帶有用戶請求的多接入以及隨機接入無線控制系統(tǒng)等問題.
GNN解決無線資源分配問題的基本原理是抽取并學(xué)習(xí)節(jié)點特征、鏈接特征和拓撲結(jié)構(gòu),在每個節(jié)點上輸出一個最優(yōu)化數(shù)值.
網(wǎng)絡(luò)建模與性能分析是實現(xiàn)高效通信網(wǎng)絡(luò)的一個基礎(chǔ)問題.如上文所述,GNN可以用于有線、無線等網(wǎng)絡(luò)的資源優(yōu)化,網(wǎng)絡(luò)中的各種資源通過優(yōu)化策略被分配到設(shè)備上,因此急需一個高效的網(wǎng)絡(luò)模型用以評價資源分配的好壞.
2.3.1 網(wǎng)絡(luò)性能指標分析
網(wǎng)絡(luò)性能指標分析需要根據(jù)現(xiàn)有網(wǎng)絡(luò)的拓撲結(jié)構(gòu)和資源狀態(tài),通過算法計算出評價當(dāng)前網(wǎng)絡(luò)的一個指標.該指標可以是簡單的端到端延遲,也可以是針對特定情況的復(fù)雜指標.
Rusek等[53]提出RouteNet,利用GNN精確評估網(wǎng)絡(luò)路徑的端到端延遲與丟包.RoutNet將網(wǎng)絡(luò)拓撲結(jié)構(gòu)、流量矩陣和端到端路徑作為輸入,根據(jù)網(wǎng)絡(luò)狀態(tài)輸出性能評價指標(延遲、抖動、丟包等).RouteNet內(nèi)部包含一個多層的信息傳遞神經(jīng)網(wǎng)絡(luò),采用RNN作為轉(zhuǎn)移函數(shù),將鏈接和路徑信息壓縮到隱藏狀態(tài)向量,最終通過輸出函數(shù)得到路徑的評價指標值.RouteNet被用于以下2種示例問題:1)基于網(wǎng)絡(luò)延遲丟包的路由優(yōu)化;2)有預(yù)算限制的網(wǎng)絡(luò)拓撲升級.
針對數(shù)據(jù)中心網(wǎng)絡(luò),Li等[54]提出一種利用GNN推斷網(wǎng)絡(luò)流完成時間的方法.每一個網(wǎng)絡(luò)流作為GNN的輸入,由5個特征組成:原地址、目標地址、網(wǎng)絡(luò)流大小、起始時間、服務(wù)類型.該方法采用基于GNN的監(jiān)督學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)由編碼器、核心、解碼器構(gòu)成.編碼器將節(jié)點和連接特征編碼;核心執(zhí)行多層信息傳遞;解碼器輸出完成時間特征.
網(wǎng)絡(luò)演算是一種基于非線性代數(shù)的確定性排隊理論,目前已廣泛應(yīng)用于網(wǎng)絡(luò)建模與性能分析,特別是為計算延遲和積壓等端到端性能參數(shù)的確界提供了有效工具.Geyer等[55-56]提出利用GNN構(gòu)建網(wǎng)絡(luò)演算模型,用于推斷網(wǎng)絡(luò)延遲、輔助判定多協(xié)議標簽交換(multi-protocol label switching,MPLS)配置合理性.
2.3.2 路由選擇與評價
路由選擇是通信網(wǎng)絡(luò)領(lǐng)域古老且核心的優(yōu)化問題.人工智能算法已經(jīng)被用于網(wǎng)絡(luò)的路由選擇.在光傳輸網(wǎng)絡(luò)中,Almasan等[57]采用基于Q學(xué)習(xí)的DRL推斷端到端路徑.為提升算法效果,GNN代替?zhèn)鹘y(tǒng)神經(jīng)網(wǎng)絡(luò),被用于計算Q學(xué)習(xí)中的Q值.
在多徑路由中,Zhu等[58]利用RouteNet模型,根據(jù)給定的網(wǎng)絡(luò)拓撲和多徑路由,預(yù)測多徑傳輸控制協(xié)議(transmission control protocol,TCP)吞吐量,并以此指導(dǎo)TCP路徑選擇.
值得注意的是,為了減小動作數(shù)據(jù)集空間,以上路由選擇方法[57-58],均將備選路徑限定在K條最短路徑范圍內(nèi),因此限制了方法的應(yīng)用場景與拓展性.事實上,隨著通信網(wǎng)絡(luò)復(fù)雜性的增加,對最優(yōu)路由策略的要求也不斷提高,GNN的拓撲信息感知能力允許算法根據(jù)流量分布動態(tài)地調(diào)整路由策略.
Geyer等[59]提出利用GNN學(xué)習(xí)分布式路由算法.該方法將路由器接口抽象為拓撲結(jié)構(gòu)中的點,并使用GNN訓(xùn)練出隱藏節(jié)點信息,使得每一個節(jié)點都有對于圖拓撲結(jié)構(gòu)的本地表示.該方法是少有的面向分布式的GNN應(yīng)用.
1)現(xiàn)有通信網(wǎng)絡(luò)領(lǐng)域應(yīng)用主要采用GN、GCN、MPNN模型,鮮有使用GAE模型,沒有使用GAT模型.現(xiàn)有應(yīng)用多數(shù)將FF、RNN、CNN等作為聚合函數(shù),傳遞節(jié)點與拓撲信息并輸出預(yù)測值,應(yīng)用范圍有限.GN、GCN、MPNN由于其自身局限性,難以解決復(fù)雜的通信網(wǎng)絡(luò)問題.
2)學(xué)習(xí)方法主要分為監(jiān)督學(xué)習(xí)和強化學(xué)習(xí).監(jiān)督學(xué)習(xí)多用于流量/資源/指標預(yù)測,節(jié)點分類等問題;強化學(xué)習(xí)多用于路徑選擇、拓撲變換/映射等問題.
3)現(xiàn)有應(yīng)用目標主要集中在節(jié)點的任務(wù).輸出特征多為節(jié)點的特征或網(wǎng)絡(luò)的整體指標,很少用于鏈接任務(wù).
4)現(xiàn)有應(yīng)用幾乎都基于集中式學(xué)習(xí),需要得到所有節(jié)點的信息,才能進行學(xué)習(xí).
通過以上結(jié)論可知,圖神經(jīng)網(wǎng)絡(luò)在通信網(wǎng)絡(luò)領(lǐng)域應(yīng)用仍處在初級階段.因此,得出如下值得探索的未來研究方向:
1)充分利用GAE、GAT模型的優(yōu)勢,挖掘其解決網(wǎng)絡(luò)問題的能力.例如,GAT模型具有易于處理動態(tài)圖和有向圖的特性,可用于解決復(fù)雜網(wǎng)絡(luò)拓撲結(jié)構(gòu)問題.
2)通信網(wǎng)絡(luò)中的眾多資源優(yōu)化問題通常很難獲得精確的標簽,因此強化學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)結(jié)合作為未來的重要應(yīng)用方向,具有廣闊前景.
3)在通信網(wǎng)絡(luò)中存在大量鏈接預(yù)測、拓撲生成等鏈接任務(wù),需要開發(fā)合適的算法模型解決此類問題.
4)在邊緣計算等場景中,分布式機器學(xué)習(xí)與圖神經(jīng)網(wǎng)絡(luò)結(jié)合是值得探索的研究方向.