楊洋 王俊峰
準(zhǔn)確識(shí)別出網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)是復(fù)雜網(wǎng)絡(luò)研究的重要內(nèi)容之一.現(xiàn)存的關(guān)鍵節(jié)點(diǎn)識(shí)別方法多數(shù)是基于網(wǎng)絡(luò)結(jié)構(gòu)提出的中心性度量方法,識(shí)別準(zhǔn)確率低且適用范圍具有局限性.因此本文提出了基于圖卷積網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)識(shí)別方法,不僅考慮了節(jié)點(diǎn)屬性,還考慮了網(wǎng)絡(luò)結(jié)構(gòu)和鄰居節(jié)點(diǎn)結(jié)構(gòu).首先,根據(jù)網(wǎng)絡(luò)圖例數(shù)據(jù)提取多維度特征并構(gòu)建特征向量;其次,將節(jié)點(diǎn)特征向量輸入到GCN層學(xué)習(xí);最后,通過(guò)回歸損失函數(shù)計(jì)算出最小損失,識(shí)別出關(guān)鍵節(jié)點(diǎn).本文選取傳播動(dòng)力學(xué)中的SIR模擬實(shí)驗(yàn)和牽制控制實(shí)驗(yàn)作為評(píng)價(jià)方式,在不同類(lèi)型的真實(shí)網(wǎng)絡(luò)上進(jìn)行驗(yàn)證.結(jié)果表明本文提出的方法在適用范圍和準(zhǔn)確率方面較其他方法更具優(yōu)勢(shì).
關(guān)鍵節(jié)點(diǎn); 復(fù)雜網(wǎng)絡(luò); 圖卷積網(wǎng)絡(luò)
TP301.6A2023.032002
收稿日期: 2022-06-28
基金項(xiàng)目: 基礎(chǔ)加強(qiáng)計(jì)劃重點(diǎn)項(xiàng)目(2019-JCJQ-ZD-113); 國(guó)家自然科學(xué)基金(U2133208); 四川省青年科技創(chuàng)新研究團(tuán)隊(duì)(2022JDTD0014)
作者簡(jiǎn)介: 楊洋(1998-), 河南平頂山人, 碩士研究生, 研究方向?yàn)榫W(wǎng)絡(luò)空間安全. E-mail: 305004556@qq.com
通訊作者: 王俊峰. E-mail: wangjf@scu.edu.cn
Research on key node identification of complex network based on GCN
YANG Yang, WANG Jun-Feng
(College of Computer Science, Sichuan University, Chengdu 610065, China)
Accurately identifying the key nodes in the network is one of the important research topics in complex networks. Most of the existing key node identification methods are based on the centrality measurement method by the network structure, which has low identification accuracy and limited scope of application. A key node identification method, based on Graph Convolutional Network (GCN), is proposed in this paper, which considers not only the node attributes, but also the network structure and neighbor node structure. Multidimensional features are extracted first from the network legend data to construct feature vectors and then the node feature vector is input to the GCN layer for learning. Finally, the minimum loss is calculated with the regression loss function, and the key nodes are identified. In this paper, SIR (Susceptible Infected Removed) is choosed as the evaluation method in the propagation dynamics simulation experiment and Pinning Control experiment, the proposed method is verified on different types of real networks, the results show that the GCN-based method proposed in this paper outperforms other methods in terms of scope of application and accuracy.
Key node; Complex network; Graph convolutional network
1 引 言
在網(wǎng)絡(luò)理論的研究中,生物網(wǎng)絡(luò)、電力網(wǎng)絡(luò)以及通訊網(wǎng)絡(luò)等都被證實(shí)為復(fù)雜網(wǎng)絡(luò)[1].關(guān)鍵節(jié)點(diǎn)[2]是能高度影響復(fù)雜網(wǎng)絡(luò)功能的少數(shù)特殊節(jié)點(diǎn).定位關(guān)鍵節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)信息傳遞、網(wǎng)絡(luò)同步、網(wǎng)絡(luò)控制起著至關(guān)重要的作用[3].例如:社交網(wǎng)絡(luò)中權(quán)威賬號(hào)對(duì)輿論的引導(dǎo)作用明顯;社會(huì)網(wǎng)絡(luò)中控制流行病的爆發(fā)點(diǎn)能抑制傳染病大規(guī)模傳播;交通網(wǎng)絡(luò)中挖掘關(guān)鍵樞紐能夠?yàn)橐?guī)劃航線(xiàn)做出理論支撐[4].此外,研究復(fù)雜網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)在案件偵察、輿情控制等方面也有廣闊前景[5].
目前存在的關(guān)鍵節(jié)點(diǎn)識(shí)別方法是基于網(wǎng)絡(luò)物理結(jié)構(gòu)的中心性度量方法[6-8],他們從網(wǎng)絡(luò)的局部屬性、全局屬性、位置屬性以及不同的隨機(jī)游走策略4個(gè)方面度量節(jié)點(diǎn)的關(guān)鍵程度[9].相關(guān)方法有:度中心性(Degree Centrality)算法、介數(shù)中心性(Betweenness Cen-trality)算法、K-Shell算法、PageRank算法等[10].由于這些方法通常從單一角度尋找反映節(jié)點(diǎn)關(guān)鍵程度的因素,考慮得并不全面,且忽略了不同網(wǎng)絡(luò)的結(jié)構(gòu)差異性,導(dǎo)致識(shí)別準(zhǔn)確率較低.
相關(guān)研究[9]表明,節(jié)點(diǎn)的關(guān)鍵性與多種因素有關(guān),例如:網(wǎng)絡(luò)的結(jié)構(gòu)、節(jié)點(diǎn)的特征以及鄰居節(jié)點(diǎn)間的結(jié)構(gòu).因此,對(duì)網(wǎng)絡(luò)中多類(lèi)信息進(jìn)行融合分析能更準(zhǔn)確地反映網(wǎng)絡(luò)的真實(shí)情況,識(shí)別出關(guān)鍵節(jié)點(diǎn).圖卷積網(wǎng)絡(luò)(Graph Convolutional Network, GCN)[11]是一種深度學(xué)習(xí)模型,由于它能夠處理圖形結(jié)構(gòu)數(shù)據(jù),且能研究網(wǎng)絡(luò)拓?fù)渲械墓?jié)點(diǎn)和連邊信息,因此已經(jīng)成為處理復(fù)雜網(wǎng)絡(luò)相關(guān)任務(wù)的有效方法之一[12].對(duì)于關(guān)鍵節(jié)點(diǎn)識(shí)別任務(wù), GCN能夠迭代地聚集網(wǎng)絡(luò)中節(jié)點(diǎn)及鄰居節(jié)點(diǎn)間的結(jié)構(gòu)信息,綜合分析影響節(jié)點(diǎn)關(guān)鍵性的多種因素.
基于此,本文提出了基于GCN的關(guān)鍵節(jié)點(diǎn)識(shí)別方法.該方法從節(jié)點(diǎn)自身屬性、復(fù)雜網(wǎng)絡(luò)結(jié)構(gòu)與鄰居節(jié)點(diǎn)間的結(jié)構(gòu)等三方面提取了7個(gè)具有代表性的特征,結(jié)合節(jié)點(diǎn)的二度子圖進(jìn)行分析.這些特征綜合了網(wǎng)絡(luò)局部屬性、全局屬性、位置屬性以及隨機(jī)游走屬性,適用于不同類(lèi)型的復(fù)雜網(wǎng)絡(luò)[13-18].此外,本方法還增加了節(jié)點(diǎn)的圈比[13]、橋接性[16]、節(jié)點(diǎn)嵌入[17]3個(gè)更具判別能力的特征,相較于單一特征工程方法[18],特征維度更加廣泛.本文在8個(gè)真實(shí)的復(fù)雜網(wǎng)絡(luò)上對(duì)此方法進(jìn)行驗(yàn)證,使用傳播動(dòng)力學(xué)中的SIR模擬實(shí)驗(yàn)和牽制控制實(shí)驗(yàn)作為評(píng)價(jià)方式[13].在SIR模擬實(shí)驗(yàn)中平均感染率為其他方法的1.3倍;在牽制控制實(shí)驗(yàn)中牽制效率P的性能在36次實(shí)驗(yàn)中有34次排名第一,2次排名第二.實(shí)驗(yàn)結(jié)果表明,本文提出的方法在準(zhǔn)確性和適用范圍方面較其他方法更具有優(yōu)勢(shì).
2 相關(guān)工作
基于中心性的關(guān)鍵節(jié)點(diǎn)識(shí)別方法[19]主要從復(fù)雜網(wǎng)絡(luò)的局部屬性、全局屬性、位置屬性以及隨機(jī)游走四個(gè)方面進(jìn)行研究.
(1) 局部屬性. 基于網(wǎng)絡(luò)局部屬性的關(guān)鍵節(jié)點(diǎn)識(shí)別方法主要考慮了節(jié)點(diǎn)自身的屬性及其鄰居的相關(guān)信息,這些指標(biāo)的計(jì)算復(fù)雜度較低,在結(jié)構(gòu)復(fù)雜的大規(guī)模網(wǎng)絡(luò)中使用廣泛.度中心性算法[20]是網(wǎng)絡(luò)中刻畫(huà)節(jié)點(diǎn)關(guān)鍵程度最簡(jiǎn)單的指標(biāo),它通過(guò)節(jié)點(diǎn)度(與其相連的鄰居節(jié)點(diǎn)數(shù)量)的大小來(lái)判斷該節(jié)點(diǎn)的重要程度.在網(wǎng)絡(luò)傳播過(guò)程中,大度節(jié)點(diǎn)可以最大限度地傳染它的鄰居,也會(huì)以較大概率被鄰居所傳染.度中心性算法只計(jì)算了節(jié)點(diǎn)的鄰居數(shù)目,卻沒(méi)有考慮鄰居節(jié)點(diǎn)的屬性.局部中心性算法(Local Centrality)[20]考慮了節(jié)點(diǎn)鄰居的屬性與間接鄰居的屬性,但不適用于有向網(wǎng)絡(luò).半局部算法(Cluster Rank)[21]是針對(duì)有向網(wǎng)絡(luò)的關(guān)鍵節(jié)點(diǎn)識(shí)別算法,該算法考慮了節(jié)點(diǎn)鄰居的屬性與聚類(lèi)系數(shù)在網(wǎng)絡(luò)傳播中的影響.半局部算法的準(zhǔn)確性?xún)?yōu)于局部中心性算法與度中心性算法.
(2) 全局屬性. 基于網(wǎng)絡(luò)全局屬性的關(guān)鍵節(jié)點(diǎn)識(shí)別算法考慮的是節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)中的屬性.較為常用的算法有介數(shù)中心性算法(Betweenness Centrality)[21]和接近中心性算法(Closeness Centrality)[21].在介數(shù)中心性算法中,判斷節(jié)點(diǎn)的關(guān)鍵性指標(biāo)是該節(jié)點(diǎn)在網(wǎng)絡(luò)中進(jìn)行信息傳播時(shí)的負(fù)載量.具體的判別方法是計(jì)算出任意兩個(gè)節(jié)點(diǎn)之間的最短路徑,若一個(gè)節(jié)點(diǎn)包含的最短路徑數(shù)越多,則該節(jié)點(diǎn)的關(guān)鍵程度越大.接近中心性算法表達(dá)節(jié)點(diǎn)到達(dá)網(wǎng)絡(luò)其他節(jié)點(diǎn)的快慢程度.基于網(wǎng)絡(luò)全局屬性的關(guān)鍵節(jié)點(diǎn)挖掘算法準(zhǔn)確性較高,但計(jì)算復(fù)雜度也很高.
(3) 位置屬性. 基于網(wǎng)絡(luò)位置屬性的關(guān)鍵節(jié)點(diǎn)識(shí)別算法是根據(jù)節(jié)點(diǎn)在網(wǎng)絡(luò)中所處的位置來(lái)度量該節(jié)點(diǎn)的關(guān)鍵程度.若一個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中處于核心位置,則認(rèn)為其影響力較大.反之,則認(rèn)為該節(jié)點(diǎn)的影響力有限.K-殼分解算法( K-Shell)[22]是最經(jīng)典的基于網(wǎng)絡(luò)位置屬性的關(guān)鍵節(jié)點(diǎn)挖掘算法. K-殼分解算法的實(shí)現(xiàn)方式是逐層去除小于等于度為K的節(jié)點(diǎn),將節(jié)點(diǎn)歸為不同的層次,處于網(wǎng)絡(luò)內(nèi)層的節(jié)點(diǎn)最為關(guān)鍵.基于網(wǎng)絡(luò)位置屬性的挖掘算法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)有一定的要求.例如K-殼分解算法對(duì)星型網(wǎng)絡(luò)和BA無(wú)標(biāo)度網(wǎng)絡(luò)不適用,并且難以確定各個(gè)指標(biāo)的最佳權(quán)重因子.
(4) 隨機(jī)游走. 基于隨機(jī)游走的關(guān)鍵節(jié)點(diǎn)識(shí)別算法是一種動(dòng)態(tài)識(shí)別關(guān)鍵節(jié)點(diǎn)的過(guò)程,主要應(yīng)用領(lǐng)域是搜索引擎用來(lái)分析網(wǎng)頁(yè)間質(zhì)量的排序.該算法具體的實(shí)現(xiàn)方式是研究網(wǎng)頁(yè)之間的關(guān)聯(lián)指向,若一個(gè)網(wǎng)頁(yè)被多個(gè)高質(zhì)量網(wǎng)頁(yè)所指,則證明其本身質(zhì)量較高.常見(jiàn)的方法有HITS算法(Hypertext-Induced Topic Search)、谷歌搜索引擎使用的PageRank算法以及Leader Rank算法等[23].
除了以上方法外,還有一些方法從其他角度出發(fā),基于網(wǎng)絡(luò)的連通程度、網(wǎng)絡(luò)中邊的屬性等方面對(duì)節(jié)點(diǎn)的關(guān)鍵程度進(jìn)行判斷.這些方法都是從單一角度對(duì)節(jié)點(diǎn)進(jìn)行度量,存在著表征不全、準(zhǔn)確率低等問(wèn)題.節(jié)點(diǎn)的關(guān)鍵性不僅由網(wǎng)絡(luò)結(jié)構(gòu)決定,還與節(jié)點(diǎn)自身特性以及鄰居節(jié)點(diǎn)的信息有關(guān).
3 基于GCN的關(guān)鍵節(jié)點(diǎn)識(shí)別技術(shù)
3.1 關(guān)鍵節(jié)點(diǎn)識(shí)別架構(gòu)
基于GCN的關(guān)鍵節(jié)點(diǎn)識(shí)別方法流程如圖1所示.
該方法主要分為4個(gè)步驟:數(shù)據(jù)處理、特征提取、生成關(guān)鍵節(jié)點(diǎn)識(shí)別模型、網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)預(yù)測(cè).首先,在數(shù)據(jù)處理過(guò)程中我們將一些網(wǎng)絡(luò)數(shù)據(jù)中含有的極少量孤立的節(jié)點(diǎn)進(jìn)行移除操作,使得本方法所使用的輸入圖例均為連通圖;其次,進(jìn)行特征提取.在網(wǎng)絡(luò)中提取每個(gè)節(jié)點(diǎn)的二度子圖,構(gòu)建子圖網(wǎng)絡(luò),提取子圖網(wǎng)絡(luò)的特征(詳見(jiàn)第3.2節(jié)),并為每個(gè)節(jié)點(diǎn)構(gòu)建7個(gè)特征組成的特征向量(詳見(jiàn)第3.3節(jié)).將每個(gè)節(jié)點(diǎn)的子圖網(wǎng)絡(luò)特征和特征向量作為模型的原始輸入.為了避免實(shí)驗(yàn)過(guò)度擬合,在將特征送入模型進(jìn)行學(xué)習(xí)前,對(duì)提取的特征進(jìn)行歸一化處理;接著,構(gòu)建關(guān)鍵節(jié)點(diǎn)識(shí)別模型.根據(jù)提取到每個(gè)節(jié)點(diǎn)的特征輸入到GCN層進(jìn)行學(xué)習(xí),同時(shí)為了更好地利用節(jié)點(diǎn)自身屬性,該層增加了跳躍連接.然后通過(guò)三個(gè)全連接層對(duì)關(guān)鍵節(jié)點(diǎn)預(yù)測(cè)任務(wù)學(xué)習(xí);最后,輸入圖例數(shù)據(jù),通過(guò)回歸損失函數(shù)MSE計(jì)算出最小損失,該模型的輸出值是預(yù)測(cè)網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的關(guān)鍵性得分情況.
3.2 構(gòu)建子圖網(wǎng)絡(luò)
本文的研究對(duì)象是無(wú)權(quán)無(wú)向網(wǎng)絡(luò)G,每個(gè)G由點(diǎn)集V={v1,v2,…,vn}和邊集E={e1,e2,…,en}構(gòu)成.在本文中N代表網(wǎng)絡(luò)中存在節(jié)點(diǎn)的數(shù)量,E代表網(wǎng)絡(luò)中存在邊的數(shù)量.網(wǎng)絡(luò)G的鄰接矩陣為A=aijN×N,定義為
aij=1, 節(jié)點(diǎn)i和節(jié)點(diǎn)j存在連邊0, 節(jié)點(diǎn)i和節(jié)點(diǎn)j不存在連邊(1)
在GCN模型中,節(jié)點(diǎn)的特征與其鄰居網(wǎng)絡(luò)關(guān)聯(lián)較大,節(jié)點(diǎn)的鄰居網(wǎng)絡(luò)對(duì)該點(diǎn)關(guān)鍵性起著至關(guān)重要的作用.每一層GCN的輸入是鄰接矩陣和節(jié)點(diǎn)的特征.根據(jù)三度影響力原則[24],本文選取距離目標(biāo)節(jié)點(diǎn)不超過(guò)3的鄰居節(jié)點(diǎn)構(gòu)建該點(diǎn)的二度子圖網(wǎng)絡(luò),計(jì)算出子圖網(wǎng)絡(luò)的對(duì)稱(chēng)歸一化拉普拉斯矩陣 (Symmetric Normalized Laplacian),其中節(jié)點(diǎn)的搜索方式為廣度優(yōu)先搜索(BFS).
3.3 特征提取
根據(jù)現(xiàn)存關(guān)鍵節(jié)點(diǎn)識(shí)別方法的諸多不足,我們對(duì)此模型的特征有了以下三方面的考慮:(1) 對(duì)目前使用廣泛的基于網(wǎng)絡(luò)的局部屬性、全局屬性、位置屬性等方法進(jìn)行綜合;(2) 增加了節(jié)點(diǎn)的圈比、橋接值、節(jié)點(diǎn)嵌入等三個(gè)更具判別能力的點(diǎn)的特征屬性,用于彌補(bǔ)和完善其它方法存在的缺陷;(3)根據(jù)GCN的特點(diǎn),抽取圖例中節(jié)點(diǎn)的子圖構(gòu)建特征.
本文方法使用的7個(gè)特征具體如特征(1)~(7),這些特征對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、節(jié)點(diǎn)信息以及鄰居節(jié)點(diǎn)的信息進(jìn)行匯總,從不同的角度深入剖析復(fù)雜網(wǎng)絡(luò).其中,特征(1)~(3)彌補(bǔ)和完善了現(xiàn)存方法的缺陷,特征(4)~(7)對(duì)使用廣泛的基于網(wǎng)絡(luò)結(jié)構(gòu)的方法進(jìn)行綜合.
(1) 節(jié)點(diǎn)的圈比(Node Cycle Ratio).節(jié)點(diǎn)的圈比指一個(gè)節(jié)點(diǎn)參與到其他節(jié)點(diǎn)的最短圈(包含這個(gè)節(jié)點(diǎn)的長(zhǎng)度最小的圈)的程度.定義Si表示與節(jié)點(diǎn)i相關(guān)聯(lián)的最短循環(huán)的集合,S=∪i∈VSi是G中所有最短圈的集合.定義圈數(shù)矩陣C=cijN×N刻畫(huà)G的圈結(jié)構(gòu),N是節(jié)點(diǎn)數(shù).如果i≠j,則cij是通過(guò)節(jié)點(diǎn)i和j的圈數(shù).如果i=j,Cij是S中包含節(jié)點(diǎn)i的圈數(shù).圈比ri估計(jì)了節(jié)點(diǎn)i參與S中其他節(jié)點(diǎn)的最短圈的重要性.
ri=0, cii=0∑j,cij>0cijcjj, cii>0(2)
在此定義中,僅考慮與每個(gè)節(jié)點(diǎn)相關(guān)的最短圈.在節(jié)點(diǎn)的圈比中節(jié)點(diǎn)是否重要取決于它對(duì)鄰居節(jié)點(diǎn)的參與程度,圈上的鄰居節(jié)點(diǎn)越多,節(jié)點(diǎn)本身的圈數(shù)越多,則該節(jié)點(diǎn)越重要.將節(jié)點(diǎn)的圈比作為特征對(duì)網(wǎng)絡(luò)局部屬性的缺陷做出了完善和補(bǔ)充.
(2) 節(jié)點(diǎn)的橋接值.復(fù)雜網(wǎng)絡(luò)具有社團(tuán)結(jié)構(gòu),符合社會(huì)學(xué)的“弱連接的強(qiáng)度”理論:1)弱連接(Weak Tie)各個(gè)社團(tuán)之間聯(lián)系稀疏;2)強(qiáng)連接(Strong Ties)社團(tuán)內(nèi)部節(jié)點(diǎn)聯(lián)系緊密,使用社區(qū)發(fā)現(xiàn)法能將網(wǎng)絡(luò)分為不同的社團(tuán).
本文采用Louvain社區(qū)發(fā)現(xiàn)算法對(duì)網(wǎng)絡(luò)進(jìn)行劃分,模塊度(Modularity)為衡量社團(tuán)劃分質(zhì)量的標(biāo)準(zhǔn).令C代表網(wǎng)絡(luò)社團(tuán),Ci與Cj表示節(jié)點(diǎn)i與節(jié)點(diǎn)j在網(wǎng)絡(luò)中的分屬社團(tuán).若節(jié)點(diǎn)i與節(jié)點(diǎn)j同屬一個(gè)社團(tuán),則δ的值為1,反之δ的值為0.令ev w為社團(tuán)v和w之間的連邊占整個(gè)網(wǎng)絡(luò)中邊的比例,則有以下公式:
ev w=12M∑ijaijδCi,vδCj,w(3)
av=12M∑idiδCi,v(4)
其中,αv是一邊與社團(tuán)v中節(jié)點(diǎn)相連的邊在整個(gè)網(wǎng)絡(luò)中的比例,di表示點(diǎn)i的度數(shù).
模塊度Q的表示公式是
Q=12M∑ij(aij-didj2M)∑vδCi,vδCj,v,
簡(jiǎn)化后表示為
Q=∑ev v-a2v(5)
橋接值VC描述節(jié)點(diǎn)連接的社團(tuán)種類(lèi),即該節(jié)點(diǎn)的鄰居節(jié)點(diǎn)所屬的社團(tuán)情況.VCi定義為與節(jié)點(diǎn)i直接相連的社團(tuán)數(shù)量(包括自己所在的社團(tuán)).
例如,在圖2網(wǎng)絡(luò)中,可以將網(wǎng)絡(luò)分為4個(gè)社團(tuán)G1、G2、G3、G4.
其中,G1=v1,v2,v3,v4,v5,v6;G2=v11,v12,v13,v14;G3=v7,v8,v9,v10;G4=v15,v16,v17,v18,v19,v20,v21.節(jié)點(diǎn)1的橋接值為VC(1)=2,節(jié)點(diǎn)2的橋接值為VC(2)=1,節(jié)點(diǎn)11的橋接值為VC(11)=4.
節(jié)點(diǎn)橋接值越大,證明該節(jié)點(diǎn)參與社團(tuán)越多,能夠獲得的信息種類(lèi)越多.將節(jié)點(diǎn)的橋接值作為特征彌補(bǔ)了節(jié)點(diǎn)位置屬性存在的缺陷.
(3) 節(jié)點(diǎn)嵌入.圖的表示學(xué)習(xí)的特點(diǎn)是自動(dòng)學(xué)習(xí)網(wǎng)絡(luò)的特征,能夠針對(duì)不同任務(wù)學(xué)習(xí)得到適合任務(wù)的嵌入表示.節(jié)點(diǎn)嵌入的學(xué)習(xí)方式為無(wú)監(jiān)督學(xué)習(xí).本文使用node2vec[25]進(jìn)行編譯用以保留網(wǎng)絡(luò)的結(jié)構(gòu)信息,將節(jié)點(diǎn)映射到嵌入空間,為節(jié)點(diǎn)做One-hot[26]編碼,然后用One-hot編碼乘以嵌入矩陣,得到每個(gè)節(jié)點(diǎn)的節(jié)點(diǎn)嵌入向量(Node Embedding Vector).
(4) 度中心性.節(jié)點(diǎn)的度是網(wǎng)絡(luò)局部屬性中使用最廣泛的一種方法,節(jié)點(diǎn)i的度ki為與該節(jié)點(diǎn)直接相連的鄰居節(jié)點(diǎn)的數(shù)量.
ki=∑Nj=1aij=∑Nj=1aji(6)
節(jié)點(diǎn)的度屬性因計(jì)算方便快捷、時(shí)間復(fù)雜度低等優(yōu)點(diǎn)使之成為基于網(wǎng)絡(luò)局部屬性中最具有代表性的關(guān)鍵節(jié)點(diǎn)識(shí)別算法.它的適用范圍很廣,特別是在網(wǎng)絡(luò)中邊稠密、網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜的情況下,可以快速計(jì)算出網(wǎng)絡(luò)中的大度節(jié)點(diǎn).除此之外,在研究網(wǎng)絡(luò)脆弱性問(wèn)題中,保護(hù)網(wǎng)絡(luò)中的大度節(jié)點(diǎn)對(duì)維護(hù)網(wǎng)絡(luò)魯棒性起著至關(guān)重要的作用.
(5) 介數(shù)中心性.節(jié)點(diǎn)的介數(shù)中心性是該節(jié)點(diǎn)在網(wǎng)絡(luò)中進(jìn)行信息傳播時(shí)的負(fù)載量.計(jì)算出G中任意兩個(gè)節(jié)點(diǎn)間的最短路徑,若一個(gè)節(jié)點(diǎn)被最短路徑包含的次數(shù)越多,則該節(jié)點(diǎn)i的負(fù)載量越大,該節(jié)點(diǎn)越重要.節(jié)點(diǎn)vi的介數(shù)定義為
BCi=∑i≠s,i≠t,s≠tgis tgs t(7)
其中,gs t代表點(diǎn)s到點(diǎn)t最短路徑的數(shù)目;gis t代表點(diǎn)s到點(diǎn)t的最短路徑里經(jīng)過(guò)點(diǎn)i的數(shù)量.介數(shù)中心性考慮到了網(wǎng)絡(luò)的整體結(jié)構(gòu)屬性,因其表示信息在網(wǎng)絡(luò)中傳播時(shí)的忙碌程度的特性,在研究網(wǎng)絡(luò)通信問(wèn)題中使用廣泛.在網(wǎng)絡(luò)中移除介數(shù)大的點(diǎn)可對(duì)信息傳播造成巨大影響,介數(shù)中心性的時(shí)間復(fù)雜度較高,是基于網(wǎng)絡(luò)全局屬性中經(jīng)典的關(guān)鍵節(jié)點(diǎn)識(shí)別算法.
(6) K-shell分解法.節(jié)點(diǎn)的K-shell值是對(duì)節(jié)點(diǎn)所處網(wǎng)絡(luò)位置的評(píng)分.節(jié)點(diǎn)所處于的位置越貼近網(wǎng)絡(luò)的內(nèi)部,則該節(jié)點(diǎn)的影響力越大.相反,若節(jié)點(diǎn)處于網(wǎng)絡(luò)的邊界位置,則節(jié)點(diǎn)關(guān)鍵程度較小.實(shí)現(xiàn)方法是將網(wǎng)絡(luò)中處于最邊緣的節(jié)點(diǎn)逐層刪去,留下的處于網(wǎng)絡(luò)核心位置的節(jié)點(diǎn)作為關(guān)鍵節(jié)點(diǎn).具體的過(guò)程如圖4所示.
K-shell分解法時(shí)間復(fù)雜度低,適用于大型網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)的識(shí)別,是基于網(wǎng)絡(luò)位置屬性中常用的關(guān)鍵節(jié)點(diǎn)識(shí)別算法.
(7) 緊密中心性.節(jié)點(diǎn)的緊密中心性是用來(lái)描述節(jié)點(diǎn)到達(dá)其他節(jié)點(diǎn)的速度快慢,體現(xiàn)了節(jié)點(diǎn)在網(wǎng)絡(luò)中的緊密性,表達(dá)節(jié)點(diǎn)i到達(dá)網(wǎng)絡(luò)中其他節(jié)點(diǎn)的速度快慢.緊密中心性的計(jì)算公式如下.
CC(i)=n-1∑j≠idij(8)
di=1n-1∑j≠idij(9)
式中,dij是節(jié)點(diǎn)i和節(jié)點(diǎn)j之間的距離.可以看出,節(jié)點(diǎn)的緊密中心性越大,該節(jié)點(diǎn)距離其他節(jié)點(diǎn)越近,則該點(diǎn)處于網(wǎng)絡(luò)的中心位置.在信息傳播中,接近中心性可以很好地衡量信息的流動(dòng)性.節(jié)點(diǎn)處于網(wǎng)絡(luò)中心位置具有更好的傳播能力,它的時(shí)間復(fù)雜度較高,是基于網(wǎng)絡(luò)全局屬性中常用的關(guān)鍵節(jié)點(diǎn)識(shí)別算法.
3.4 基于GCN的關(guān)鍵節(jié)點(diǎn)識(shí)別模型
GCN是針對(duì)圖的特征提取器,其操作對(duì)象是圖數(shù)據(jù),能夠?qū)D的空間特征進(jìn)行提取.利用這些特征可以實(shí)現(xiàn)圖分類(lèi)、鏈路預(yù)測(cè)以及圖嵌入表示等功能.GCN可以分為兩類(lèi):(1) 基于空間的GCN方法,它將圖卷積核定義為來(lái)自鄰居網(wǎng)絡(luò)的特征信息,迭代地對(duì)鄰居信息進(jìn)行聚合,同時(shí)考慮了節(jié)點(diǎn)特征和子圖特征;(2) 基于頻譜的GCN方法,它主要涉及信號(hào)處理范圍,通過(guò)引入濾波器來(lái)定義卷積核.
本文選取的是第一類(lèi)基于空間的GCN方法.本文建立的復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)識(shí)別模型的GCN層定義如下.
Hi+1=σAHiWi+bi(10)
其中,A是二度子圖網(wǎng)絡(luò)的對(duì)稱(chēng)歸一化拉普拉斯算子(Laplace Operator);Hi表示第i個(gè)GCN層的節(jié)點(diǎn);Wi和bi分別是可訓(xùn)練的權(quán)重和偏差參數(shù);σ是非線(xiàn)性激活函數(shù).我們將其設(shè)置為指數(shù)線(xiàn)性單元(Exponential Linear Unit,ELU)函數(shù)[27].H0是輸入層中鄰居節(jié)點(diǎn)的特征向量.此外,為了更好地利用節(jié)點(diǎn)功能,我們?cè)贕CN層添加了Skip Connection[28].同時(shí),為了避免過(guò)度擬合,應(yīng)用了基于退化學(xué)習(xí)率的Dropout技術(shù).
本方法中節(jié)點(diǎn)的特征提取過(guò)程如圖5所示.首先,根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)提取出節(jié)點(diǎn)i的二度子圖;然后根據(jù)上文,分別提取出描述網(wǎng)絡(luò)與節(jié)點(diǎn)相關(guān)信息的7個(gè)特征;最后,與子圖特征一起拼接成特征向量,作為模型的輸入.
為了加速實(shí)驗(yàn)擬合過(guò)程,本文使用最大最小標(biāo)準(zhǔn)化(Min-Max Normalization)方法對(duì)特征進(jìn)行歸一化處理,使每個(gè)特征值映射到[0,1]之間.
GCN層后是三個(gè)全連接層,起到分類(lèi)作用.通過(guò)特征學(xué)習(xí)將網(wǎng)絡(luò)中的節(jié)點(diǎn)進(jìn)行統(tǒng)一評(píng)分,得分高的節(jié)點(diǎn)關(guān)鍵程度高,被分為關(guān)鍵節(jié)點(diǎn).第一個(gè)全連接層后使用基于退化學(xué)習(xí)率的Dropout技術(shù)擬合數(shù)據(jù)集.為了避免出現(xiàn)過(guò)度擬合的現(xiàn)象,第二和第三個(gè)全連接層后使用了指數(shù)化線(xiàn)性單元ELU非飽和激活函數(shù),用以縮短訓(xùn)練時(shí)間并提高準(zhǔn)確度.模型的輸出值是網(wǎng)絡(luò)中每個(gè)節(jié)點(diǎn)的關(guān)鍵程度得分情況,本文選取得分前0.1N的節(jié)點(diǎn)為網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn).
4 實(shí)驗(yàn)評(píng)估
4.1 實(shí)驗(yàn)數(shù)據(jù)
本文所用的實(shí)驗(yàn)數(shù)據(jù)均為公開(kāi)數(shù)據(jù)集.這些數(shù)據(jù)是來(lái)自不同領(lǐng)域的真實(shí)網(wǎng)絡(luò),網(wǎng)絡(luò)規(guī)模與網(wǎng)絡(luò)類(lèi)型多樣化[27].包括: (1) Zebra是一個(gè)動(dòng)物網(wǎng)絡(luò);(2) Email是西班牙羅維拉維爾吉利大學(xué)的電子郵件通信網(wǎng)絡(luò);(3) C.elegans是秀麗隱桿線(xiàn)蟲(chóng)的神經(jīng)網(wǎng)絡(luò);(4) NS-GC是從事NS42的科學(xué)家合作網(wǎng)絡(luò);(5) Erdos是一個(gè)科學(xué)合作網(wǎng)絡(luò),其中節(jié)點(diǎn)和鏈接代表個(gè)人和科學(xué)合作;(6) BA網(wǎng)絡(luò)是無(wú)標(biāo)度網(wǎng)絡(luò);(7) Air traffic control是美國(guó)航空運(yùn)輸網(wǎng)絡(luò);(8) Friendship是一個(gè)包含網(wǎng)站Hamsterster的用戶(hù)之間友誼的網(wǎng)絡(luò).所有網(wǎng)絡(luò)的詳細(xì)參數(shù)如表1所示.
表1中,N表示的是網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)目;E表示的是網(wǎng)絡(luò)的連邊數(shù)目;〈k〉表示網(wǎng)絡(luò)的平均度〈k〉=1N∑Niki; 〈L〉表示平均路徑長(zhǎng)度;〈c〉表示網(wǎng)絡(luò)的平均聚類(lèi)系數(shù).
〈c〉=1n∑ni=12IiΓiΓi-1′ (11)
其中,Ii表示節(jié)點(diǎn)i的直接鄰居之間的邊數(shù).
本文采用流行病傳播模型與牽制控制兩種評(píng)估方式對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià).對(duì)比的五種算法有:節(jié)點(diǎn)度(D)、介數(shù)中心性算法(BC)、接近中心性算法(CC)、H-度中心性算法(H-index)和K-殼分解算法(K-shell).
4.2 流行病傳播實(shí)驗(yàn)
評(píng)價(jià)關(guān)鍵節(jié)點(diǎn)識(shí)別方法的準(zhǔn)確性時(shí),采用較為廣泛的方法是基于傳播動(dòng)力學(xué)中的SIR傳播實(shí)驗(yàn).在SIR仿真實(shí)驗(yàn)中,網(wǎng)絡(luò)中的節(jié)點(diǎn)具有三個(gè)狀態(tài),分別是易染態(tài)S(能夠被處于感染態(tài)的鄰節(jié)點(diǎn)感染)、感染態(tài)I(感染態(tài)的節(jié)點(diǎn)在固定時(shí)間后會(huì)變?yōu)槊庖邞B(tài))以及免疫態(tài)R(免疫態(tài)的節(jié)點(diǎn)穩(wěn)定,不會(huì)被其他狀態(tài)感染).其中處于易染態(tài)S的節(jié)點(diǎn)會(huì)在每個(gè)時(shí)間步長(zhǎng)t內(nèi)以概率β被處于感染態(tài)I的節(jié)點(diǎn)所感染,也變?yōu)楦腥緫B(tài)I.隨后,處于感染態(tài)I的節(jié)點(diǎn)會(huì)以固定速率γ變?yōu)槊庖邞B(tài)R.SIR模型從傳播速度與傳播范圍兩方面對(duì)節(jié)點(diǎn)關(guān)鍵程度進(jìn)行考察.本文選擇排序索引中的前0.1N個(gè)節(jié)點(diǎn)作為初始感染源,時(shí)間步長(zhǎng)為t,對(duì)其他節(jié)點(diǎn)進(jìn)行感染.按某一時(shí)間步t的累計(jì)感染節(jié)點(diǎn)數(shù)量作為最終的傳播范圍,通過(guò)比較t時(shí)刻累計(jì)感染節(jié)點(diǎn)數(shù)量來(lái)衡量初始感染源的重要程度.被感染的節(jié)點(diǎn)越多,表明選取的初始感染源節(jié)點(diǎn)的傳播能力越強(qiáng),關(guān)鍵程度越大.
本文選取擴(kuò)散閾值β = βc和γ=1對(duì)每個(gè)網(wǎng)絡(luò)進(jìn)行SIR實(shí)驗(yàn),感染源為每種關(guān)鍵節(jié)點(diǎn)識(shí)別方法排序索引的前0.1N個(gè)節(jié)點(diǎn).
βc=〈k〉〈k2〉-〈k〉(12)
其中,〈k〉是網(wǎng)絡(luò)的平均度數(shù);〈k2〉是平均平方度數(shù).
圖6是在時(shí)間步長(zhǎng)t=1,t=2,…,t=10、擴(kuò)散閾值β=βc、 γ=1的情況下,五類(lèi)關(guān)鍵節(jié)點(diǎn)識(shí)別方法與本方法感染的關(guān)鍵節(jié)點(diǎn)數(shù)量.橫坐標(biāo)為時(shí)間步長(zhǎng)t,縱坐標(biāo)為感染的節(jié)點(diǎn)數(shù)量,由于實(shí)驗(yàn)存在隨機(jī)性,以下為500次獨(dú)立運(yùn)行SIR模型的結(jié)果.
由圖6可以看出,在8個(gè)網(wǎng)絡(luò)中,將本文方法求得的節(jié)點(diǎn)作為感染源在SIR模型中的感染規(guī)模均大于其他5種關(guān)鍵節(jié)點(diǎn)識(shí)別方法.特別是在Friendship網(wǎng)絡(luò)中,在擴(kuò)散閾值β取0.08的條件下,使用本方法時(shí)每個(gè)時(shí)間步長(zhǎng)t時(shí)的感染規(guī)模都遠(yuǎn)遠(yuǎn)高于其他五種方法.在t=10時(shí)網(wǎng)絡(luò)趨于穩(wěn)定狀態(tài),使用本文方法網(wǎng)絡(luò)的平均感染規(guī)模為727.95,另外五種對(duì)比方法中最大平均感染規(guī)模為470.48.在NS-GC網(wǎng)絡(luò)和C.elegans網(wǎng)絡(luò)以及Air traffic-control網(wǎng)絡(luò)中,本文方法在每一個(gè)時(shí)間步長(zhǎng)t時(shí)的感染規(guī)模都高于其他方法;在Email網(wǎng)絡(luò)中,雖然前5個(gè)時(shí)間步長(zhǎng)內(nèi)本文方法略低于K-shell方法,但是當(dāng)SIR仿真模型在網(wǎng)絡(luò)中感染的節(jié)點(diǎn)最終達(dá)到平衡時(shí),本文方法的感染規(guī)模為323.03,K-Shell方法的平均感染規(guī)模為312.42,低于本文中的方法.
圖7是進(jìn)行SIR仿真實(shí)驗(yàn)中部分網(wǎng)絡(luò)在每個(gè)時(shí)間步長(zhǎng)t時(shí)網(wǎng)絡(luò)的感染詳情.橫坐標(biāo)為時(shí)間步長(zhǎng)t,縱坐標(biāo)為幾類(lèi)關(guān)鍵節(jié)點(diǎn)識(shí)別方法,顏色越深代表感染節(jié)點(diǎn)數(shù)越多,識(shí)別出的關(guān)鍵節(jié)點(diǎn)越準(zhǔn)確.
由圖7可以看出,在SIR模型中本文方法的感染速率與感染規(guī)模均明顯優(yōu)于其他方法.綜上所述,在傳播動(dòng)力學(xué)SIR模型中,本文方法識(shí)別出的關(guān)鍵節(jié)點(diǎn)在傳播速度與傳播范圍兩個(gè)方面均高于其他方法.使用本文提出的基于GCN的關(guān)鍵節(jié)點(diǎn)識(shí)別方法比傳統(tǒng)方法更具有優(yōu)勢(shì).
4.3 牽制控制實(shí)驗(yàn)
現(xiàn)實(shí)中網(wǎng)絡(luò)規(guī)模龐大且結(jié)構(gòu)復(fù)雜,因此想要實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)的完全控制需要耗費(fèi)大量成本.在現(xiàn)實(shí)場(chǎng)景中,為了節(jié)約控制網(wǎng)絡(luò)過(guò)程中使用的資源成本,通常會(huì)對(duì)網(wǎng)絡(luò)中的少量節(jié)點(diǎn)施加控制使目標(biāo)網(wǎng)絡(luò)在有限時(shí)間達(dá)到相應(yīng)狀態(tài),這個(gè)過(guò)程被稱(chēng)為網(wǎng)絡(luò)的牽制控制.在牽制控制實(shí)驗(yàn)中,根據(jù)節(jié)點(diǎn)索引逐個(gè)固定節(jié)點(diǎn),并量化網(wǎng)絡(luò)的可同步性.通過(guò)測(cè)量在同步過(guò)程中控制節(jié)點(diǎn)所產(chǎn)生的影響來(lái)評(píng)估節(jié)點(diǎn)的關(guān)鍵程度.
復(fù)雜網(wǎng)絡(luò)G由N個(gè)節(jié)點(diǎn)構(gòu)成,它們之間相互作用的動(dòng)力學(xué)公式為
x˙i=fxi+σ∑Nj=1lijΓxj+Uixi,…,xN(13)
其中,向量xi∈Rn是節(jié)點(diǎn)i的狀態(tài);函數(shù)f(·)描述節(jié)點(diǎn)的自動(dòng)力學(xué);正常數(shù)σ表示耦合強(qiáng)度;內(nèi)耦合矩陣Γ:Rn→Rn是半正定的;Ui(xi,…,xN)是施加在節(jié)點(diǎn)i上的控制器.網(wǎng)絡(luò)G的拉普拉斯矩陣的定義如下:L=lijN×N,如果(i,j)∈E,則lij=-1;如果(i,j)E and i≠j,則lij=0;如果i=j,則lii=-∑j≠1lij.
假設(shè)網(wǎng)絡(luò)在時(shí)間為t時(shí)的目標(biāo)狀態(tài)s(t)滿(mǎn)足:s˙(t)=f(s(t)),s(0)=s0,牽制控制實(shí)驗(yàn)的目的就是通過(guò)控制網(wǎng)絡(luò)中的部分節(jié)點(diǎn)使網(wǎng)絡(luò)狀態(tài)趨近于目標(biāo)狀態(tài)s(t).此時(shí)網(wǎng)絡(luò)的真實(shí)狀態(tài)與目標(biāo)狀態(tài)中存在的誤差為:ei=xi(t)-s(t).
若對(duì)網(wǎng)絡(luò)中前l(fā)個(gè)節(jié)點(diǎn)施加控制,控制器Ui(xi,…,xN)的定義如下式.
Ui=-diΓei,di=hieTiΓei,1≤i≤lUi=0,l+1≤i≤N(14)
其中,hi是一個(gè)任意的正常數(shù).
在這里,提出了一個(gè)度量P,名為牽制效率,以表征受牽制控制的索引的性能.
P=1Qmax∑QmaxQ=11μ1L-Q(15)
其中,Qmax表示固定節(jié)點(diǎn)的最大數(shù)量;L-Q是主子矩陣,通過(guò)從原始拉普拉斯矩陣L中刪除對(duì)應(yīng)于Q個(gè)固定節(jié)點(diǎn)的Q個(gè)行和列而獲得;μ1L-Q是L-Q的最小非零特征值.
P隨著固定節(jié)點(diǎn)數(shù)量的增加而衰減.P值越小,衰減越快.更快的衰減對(duì)應(yīng)于更好的性能.本文將Qmax設(shè)置為每種關(guān)鍵節(jié)點(diǎn)識(shí)別方法排序索引的前0.05N~0.1N個(gè)節(jié)點(diǎn).
表2和表3是數(shù)據(jù)集中的5個(gè)網(wǎng)絡(luò)在Qmax設(shè)置為0.05N和0.1N兩種情況下,不同方法下的牽制效率P.其中加粗?jǐn)?shù)據(jù)為表現(xiàn)最佳的牽制效率.
由表2和表3可知,選取前0.05N個(gè)節(jié)點(diǎn)與前0.1N個(gè)節(jié)點(diǎn)的實(shí)驗(yàn)結(jié)果相似,本文方法總體占據(jù)優(yōu)勢(shì).從牽制效率P的性能考慮,在36組實(shí)驗(yàn)中本方法有34次表現(xiàn)為最佳的牽制效率.剩余2次實(shí)驗(yàn)為Email網(wǎng)絡(luò)的實(shí)驗(yàn),本方法的性能略低于K-Shell方法,排名第二.但是與BC、D、H-index、CC等四類(lèi)方法的結(jié)果相比明顯具備更快的衰減率和更高的性能.綜上所述,本方法識(shí)別出的節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)控制產(chǎn)生的影響更大,節(jié)點(diǎn)關(guān)鍵程度更高.
5 結(jié) 論
復(fù)雜網(wǎng)絡(luò)中關(guān)鍵節(jié)點(diǎn)識(shí)別研究取得了一定進(jìn)展,但仍存在著方法適用范圍局限、識(shí)別準(zhǔn)確率低等缺陷.本研究根據(jù)上述缺陷提出了基于GCN的復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)識(shí)別方法,優(yōu)勢(shì)如下:(1) 考慮全面.使用深度學(xué)習(xí)的方法對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、節(jié)點(diǎn)屬性、鄰居節(jié)點(diǎn)間結(jié)構(gòu)進(jìn)行融合分析. (2) 算法適用范圍廣.在不同類(lèi)型的真實(shí)網(wǎng)絡(luò)中實(shí)驗(yàn)結(jié)果良好.(3) 識(shí)別準(zhǔn)確率高. SIR實(shí)驗(yàn)證明本方法確定的關(guān)鍵節(jié)點(diǎn)在復(fù)雜網(wǎng)絡(luò)中的傳播速度與傳播范圍兩方面均優(yōu)于其它方法;牽制控制實(shí)驗(yàn)證明本方法確定的關(guān)鍵節(jié)點(diǎn)對(duì)網(wǎng)絡(luò)控制產(chǎn)生的影響更大.綜上所述,本研究提出的方法與其他方法相比更具優(yōu)勢(shì).
參考文獻(xiàn):
[1] Ju Y, Zhang S, Ding N, et al. Complex network clustering by a multi-objective evolutionary algorithm based on decomposition and membrane structure [J]. Sci Rep: UK, 2016, 6: 1.
[2] 韓忠明, 吳楊, 譚旭升, 等. 面向結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)排序[J]. 物理學(xué)報(bào), 2015, 64: 058902.
[3] Malliaros F D, Rossi M E G, Vazirgiannis M. Locating influential nodes in complex networks [J].Sci Rep: UK, 2016, 6: 19307.
[4] De Domenico M, Solé-Ribalta A, Omodei E, et al. Ranking in interconnected multilayer networks reveals versatile nodes [J]. Nat Commun, 2015, 6: 1.
[5] 任曉龍, 呂琳媛. 網(wǎng)絡(luò)重要節(jié)點(diǎn)排序方法綜述[J]. 科學(xué)通報(bào), 2014, 59: 1175.
[6] 韓忠明, 陳炎, 李夢(mèng)琪, 等. 一種有效的基于三角結(jié)構(gòu)的復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)影響力度量模型[J]. 物理學(xué)報(bào), 2016, 65: 168901.
[7] Bellingeri M, Bevacqua D, Scotognella F, et al. A comparative analysis of link removal strategies in real complex weighted networks[J]. Sci Rep: Uk, 2020, 10: 1.
[8] Zhu C, Wang X, Zhu L. A novel method of evaluating key nodes in complex networks [J]. Chaos Soliton Fract, 2017, 96: 43.
[9] 朱軍芳, 陳端兵, 周濤, 等. 網(wǎng)絡(luò)科學(xué)中相對(duì)重要節(jié)點(diǎn)挖掘方法綜述[J]. 電子科技大學(xué)學(xué)報(bào), 2019, 48: 595.
[10] Lü L, Chen D, Ren X L, et al. Vital nodes identification in complex networks[J]. Phys Rep, 2016, 650: 1.
[11] Chiang W L, Liu X, Si S, et al. Cluster-gcn: An efficient algorithm for training deep and large graph convolutional networks[C]//Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining. Alaska:ACM, 2019: 257-266.
[12] Fan T, Lü L, Shi D, et al. Characterizing cycle structure in complex networks[J]. Commun Phys: UK, 2021, 4: 1.
[13] 趙之瀅, 于海, 朱志良, 等. 基于網(wǎng)絡(luò)社團(tuán)結(jié)構(gòu)的節(jié)點(diǎn)傳播影響力分析[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, 37: 753.
[14] 梁世嬌, 柴爭(zhēng)義. 基于多目標(biāo)自適應(yīng)Memetic算法的復(fù)雜網(wǎng)絡(luò)社區(qū)檢測(cè)[J]. 江蘇大學(xué)學(xué)報(bào): 自然科學(xué)版, 2020, 41: 262.
[15] 張淼,梁延研,黃相杰.基于集成學(xué)習(xí)的復(fù)雜網(wǎng)絡(luò)鏈路預(yù)測(cè)及其形成機(jī)制分析[J].重慶郵電大學(xué)學(xué)報(bào): 自然科學(xué)版, 2020, 32: 759.
[16] Cavallari S, Zheng V W, Cai H, et al. Learning community embedding with community detection and node embedding on graphs[C]// Proceedings of the 2017 ACM on Conference on Information and Knowledge Management. Singapore. [S.l.]: ACM, 2017: 377.
[17] 潘侃, 尹春林, 王磊, 等. 基于特征工程的重要節(jié)點(diǎn)挖掘方法[J]. 電子科技大學(xué)學(xué)報(bào), 2021, 50: 930.
[18] Zhong L, Gao C, Zhang Z, et al. Identifying influential nodes in complex networks: A multiple attributes fusion method[C]// Proceedings of the Inte-rnational conference on active media technology. Warsaw, Polan: Springer, 2014: 11.
[19] Kang W, Tang G, Sun Y, et al. Identifying influential nodes in complex network based on weighted semi-local centrality[C]// Proceedings of the 2016 2nd IEEE International Conference on Computer and Communications (ICCC). Chengdu: IEEE, 2016: 2467.
[20] Samadi N, Bouyer A. Identifying influential spreaders based on edge ratio and neighborhood diversity measures in complex networks[J]. Comb Probab Comput, 2019, 101: 1147.
[21] Vernize G, Guedes A L P, Albini L C P. Malicious nodes identification for complex network based on local views [J]. Comput J, 2015, 58: 2476.
[22] 喻依, 甘若迅, 樊鎖海, 等. 基于 PageRank 算法和 HITS 算法的期刊評(píng)價(jià)研究[J]. 計(jì)算機(jī)科學(xué), 2014(Z6): 110.
[23] 王名揚(yáng), 賈沖沖, 楊東輝. 基于三度影響力的社交好友推薦機(jī)制[J]. 計(jì)算機(jī)應(yīng)用, 2015, 35: 1984.
[24] Ribeiro L F R, Saverese P H P, Figueiredo D R. struc2vec: learning node representations from structural identity[C]//Proceedings of the 23rd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2017: 385.
[25] Buckman J, Roy A, Raffel C, et al. Thermometer encoding: One hot way to resist adversarial examples [C]//International Conference on Learning Representations. Vancouver: ICLR, 2018.
[26] Clevert D A, Unterthiner T, Hochreiter S. Fast and accurate deep network learning by expon-ential linear units (elus)[ EB/OL].(2015-11-23)[2022-08-22].https://doi.org/10.48550/arXiv.1511.07289.
[27] Bae W, Yoo J, Chul Y J. Beyond deep residual learning for image restoration: Persistent homology-guided manifold simplification [C]// Proceedings of the IEEE Conference on Computer Vision and Pattern recognition Workshops. Honolulu: CVPRW, 2017.
[28] Rossi R, Ahmed N. The network data repository with interactive graph analytics and visualization[C]//Twenty-ninth AAAIConferen-ce on Artificial Intelligence.Austin: AAAI Press, 2014: 753.
引用本文格式:
中 文: 楊洋, 王俊峰. 基于GCN的復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)識(shí)別研究[J]. 四川大學(xué)學(xué)報(bào): 自然科學(xué)版, 2023, 60: 032002.
英 文:? Yang Y, Wang J F. Research on key node identification of complex network based on GCN [J]. J Sichuan Univ: Nat Sci Ed, 2023, 60: 032002.