楊曉暉 王衛(wèi)賓
摘 要:針對基于圖神經(jīng)網(wǎng)絡(luò)的謠言檢測方法在聚合鄰居節(jié)點信息生成謠言表示過程中存在的噪聲干擾問題,充分利用社交媒體源帖包含的豐富語義和結(jié)構(gòu)信息對謠言檢測的重要影響,提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測模型,該模型根據(jù)信息傳播過程建模謠言的傳播圖和擴散圖,基于門控圖神經(jīng)網(wǎng)絡(luò)聚合鄰居信息生成節(jié)點表示,利用門控機制去除鄰居節(jié)點噪聲,同時引入根節(jié)點語義增強方法提升表征節(jié)點的能力。此外,利用注意力機制融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息學(xué)習(xí)更加全面的謠言表示用于謠言檢測任務(wù)。在公開數(shù)據(jù)集上的實驗結(jié)果證明,提出的模型在謠言檢測性能和早期檢測能力方面均優(yōu)于基線方法。
關(guān)鍵詞:社交媒體;謠言檢測;圖神經(jīng)網(wǎng)絡(luò);注意力機制
中圖分類號: TP391? 文獻(xiàn)標(biāo)識碼: A? DOI:10.3969/j.issn.1007-791X.2023.01.008
0 引言
隨著移動互聯(lián)網(wǎng)的迅猛發(fā)展,社交媒體已成為人們獲取和傳播信息的主要途徑。然而,由于媒體缺乏對信息有效的監(jiān)控手段,謠言能夠迅速滋生并廣泛傳播,對網(wǎng)絡(luò)秩序和社會穩(wěn)定產(chǎn)生了不利影響[1]。例如,2022年俄羅斯與烏克蘭爆發(fā)沖突以來,社交媒體上不斷出現(xiàn)未經(jīng)證實或故意偽造的消息,對人們準(zhǔn)確了解沖突局勢產(chǎn)生了嚴(yán)重干擾,甚至造成社會恐慌。由于社交媒體用戶數(shù)量極大,謠言在社交媒體上迅速傳播,已經(jīng)開始從各個方面影響人們的日常生活。因此,開展謠言檢測任務(wù)對維護網(wǎng)絡(luò)安全和保障社會穩(wěn)定發(fā)展具有重大的現(xiàn)實意義[2]。
早期謠言檢測方法主要采用人工提取特征,利用傳統(tǒng)的機器學(xué)習(xí)分類方法識別謠言信息。此類方法依賴繁重的特征工程工作,難以獲得復(fù)雜、抽象的特征表示,造成方法的魯棒性較差。由于社交媒體信息經(jīng)過評論或轉(zhuǎn)發(fā)過程形成具有豐富的傳播結(jié)構(gòu)信息,目前的方法通過構(gòu)建傳播序列或傳播樹,利用深度學(xué)習(xí)獲得傳播結(jié)構(gòu)特征進(jìn)行
謠言檢測,在一定程度上提高了表征謠言的能力。但這些方法仍只考慮了謠言信息傳播的序列特征,不能充分體現(xiàn)出其內(nèi)部結(jié)構(gòu)信息,因此存在一些限制。最近的一些研究使用圖神經(jīng)網(wǎng)絡(luò)來解決謠言檢測問題,由于圖神經(jīng)網(wǎng)絡(luò)對圖結(jié)構(gòu)數(shù)據(jù)強大的表示能力,取得了良好的識別效果。盡管如此,現(xiàn)有的基于圖神經(jīng)網(wǎng)絡(luò)的謠言檢測方法在聚合鄰居信息學(xué)習(xí)節(jié)點表示時忽略了噪聲問題的干擾,限制了謠言檢測的性能。此外,社交媒體中的源帖包含豐富的語義和結(jié)構(gòu)信息,在信息傳播過程中將會產(chǎn)生廣泛的影響力,對謠言檢測具有重要作用。
針對現(xiàn)有謠言檢測方法存在的不足,本文提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測模型。首先建模社交媒體中的帖子雙向傳播結(jié)構(gòu),利用門控機制去除鄰居節(jié)點噪聲并聚合得到目標(biāo)節(jié)點的表示;接著引入根節(jié)點語義增強方法獲得可靠的表征節(jié)點的能力。同時,融合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息以獲得全面的謠言表示,提升謠言檢測的性能。
1 相關(guān)工作
隨著謠言檢測研究的深入,目前提出的謠言檢測方法可概括為基于機器學(xué)習(xí)的謠言檢測方法與基于深度學(xué)習(xí)的謠言檢測方法。
1.1 基于機器學(xué)習(xí)的謠言檢測方法
基于機器學(xué)習(xí)的謠言檢測方法,利用人工構(gòu)造和提取顯著特征進(jìn)行謠言檢測。CASTILLO等人[3]通過對熱門話題相關(guān)的帖子進(jìn)行分析,人工提取用戶信息、文本內(nèi)容以及引用的外部源等特征對帖子進(jìn)行可信度評估,利用決策樹模型完成謠言的識別任務(wù)。YANG等人[4]通過提取微博內(nèi)容、用戶、主題、傳播統(tǒng)計、位置和客戶端等特征,采用支持向量機(Support Vector Machine, SVM)分類器對微博信息進(jìn)行謠言檢測。GUO等人[5]深入分析了基于謠言用戶賬戶的特征,提出用戶可信度,可靠性和名譽等隱含特征,通過實驗證明了該特征的有效性。這些方法只是考慮單一信息的特征分析,忽略了信息傳播過程之間的差異,而基于事件級特征可以根據(jù)其傳播結(jié)構(gòu)反映出謠言信息的特點。GUPTA等人[6]提取用戶、消息、事件之間的層次關(guān)系特征,提出基于事件圖優(yōu)化的方法進(jìn)行可信度分析識別謠言事件。WU等人[7]基于隨機游走圖核和RBF核結(jié)合的方法,提出了一種基于混合核SVM模型進(jìn)行謠言檢測。MA等人[8]利用傳播結(jié)構(gòu)建立樹核模型,通過計算傳播樹子樹結(jié)構(gòu)相似度來識別謠言的傳播特性,以提升謠言的檢測性能。徐建民等人[9]提取微博用戶的影響力、情感信息特征嵌入到傳播樹的節(jié)點中,提升了基于傳播樹核的謠言檢測方法性能。然而,基于機器學(xué)習(xí)的謠言檢測方法需要一定的專家知識,依靠人工選擇特征,缺乏高階的特征表示,造成檢測模型的魯棒性較差,無法應(yīng)對復(fù)雜多變的現(xiàn)實環(huán)境。
1.2 基于深度學(xué)習(xí)的謠言檢測方法
深度學(xué)習(xí)飛速發(fā)展,其強大的特征學(xué)習(xí)能力和對數(shù)據(jù)良好的代表性,在多個領(lǐng)域中都取得不錯的效果。研究者開始探索在謠言檢測問題中使用深度學(xué)習(xí)的方法。MA等人[10]對謠言事件中的文本數(shù)據(jù)進(jìn)行時間序列排序,利用循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN)學(xué)習(xí)謠言信息的序列特征。CHEN等人[11]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)來提取分散在輸入序列中的關(guān)鍵特征,有助于模型有效地識別謠言,尤其是在早期階段的謠言檢測中。MA等人[12]對謠言的消息傳播結(jié)構(gòu)建模為樹結(jié)構(gòu),利用遞歸神經(jīng)網(wǎng)絡(luò)捕獲節(jié)點的隱藏表示。然而,這些方法只考慮了謠言傳播過程中的序列特征,不能反應(yīng)出傳播的內(nèi)部結(jié)構(gòu)信息。圖神經(jīng)網(wǎng)絡(luò)(Graph Neural Network, GNN)由于其強大的表示能力[13-14],為謠言檢測任務(wù)提出了新的解決思路。BIAN等人[15]提出了一種用于謠言檢測的Bi-GCN模型,通過雙向圖卷積網(wǎng)絡(luò)學(xué)習(xí)消息轉(zhuǎn)發(fā)的結(jié)構(gòu)特征,取得了良好的效果。胡斗等人[16]建模社交媒體帖子之間多種交互關(guān)系,并提出一種多關(guān)系傳播結(jié)構(gòu)的檢測方法,捕捉更多傳播結(jié)構(gòu)特征以提升謠言檢測性能。盡管如此,圖神經(jīng)網(wǎng)絡(luò)在聚合鄰居節(jié)點信息時可能會產(chǎn)生噪聲,無法獲得充分的節(jié)點表示。
基于此,本文探究謠言自頂向下的信息傳播結(jié)構(gòu)和自底向上的信息擴散結(jié)構(gòu),提出基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測方法,將節(jié)點特征表示和聚合后的鄰居特征表示利用門控機制進(jìn)行特征選擇,減少鄰居的噪聲影響。此外,考慮到社交媒體中的源帖包含最原始的語義信息,同時也包含著重要的局部結(jié)構(gòu)信息,提出根節(jié)點語義增強方法獲得可靠的節(jié)點表示,融合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息實現(xiàn)謠言檢測任務(wù)。
2 問題定義
形式化地,定義C={c1,c2,…,cm}表示謠言數(shù)據(jù)集,其中,ci是第i個事件,m表示數(shù)據(jù)集中事件對應(yīng)的總數(shù)量。對于每個社交媒體事件ci記為ci={ri,wi1,wi2,…,wini-1,Gi},其中ri表示事件ci的源帖,wij表示第j個轉(zhuǎn)發(fā)或評論關(guān)系的帖子,ni表示事件ci包含的帖子數(shù)量,Gi表示事件ci的傳播結(jié)構(gòu)。本文將Gi定義為傳播圖Gi=(Vi,Ei),其中,節(jié)點集合表示為Vi={ri,wi1,wi2,…,wini-1},ri表示圖Gi根節(jié)點,Ei={eist|s,t=0,…,ni-1}表示轉(zhuǎn)發(fā)或評論的邊集合。如圖1(a)所示,如果wi1是ri的一個轉(zhuǎn)發(fā)帖子,那么存在一條有向邊e01。定義鄰接矩陣Ai∈{0,1}ni×ni表示圖中的傳播關(guān)系,其中元素表示為
aist=1? eist∈Ei0其他。(1)
對于事件ci,Xi=[xi0,xi1,…,xini-1]T為事件的特征矩陣,其中xi0表示源帖的特征向量,其他每個特征xij表示wij的特征向量。此外,對于社交媒體謠言檢測任務(wù),每個事件ci都包含著一個真實標(biāo)簽yi∈Y,其中Y表示事件的類別標(biāo)簽集合。謠言檢測問題的分類器可以用由輸入空間C到輸出空間Y之間的映射f來表示,記作
f:C→Y。(2)
3 模型框架
本文提出一種基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測模型(Rumor detection model based on gated graph neural network, GGNN-RD),如圖2所示。模型主要包括構(gòu)建傳播和擴散圖、節(jié)點表示、謠言表示、謠言分類器4部分內(nèi)容。
3.1 構(gòu)建傳播和擴散圖
基于轉(zhuǎn)發(fā)和評論關(guān)系,為每個事件構(gòu)建傳播結(jié)構(gòu)G=(V,E)。定義A∈Rn×n和X分別為事件的鄰接矩陣和初始特征矩陣,A僅包含從上方節(jié)點到下方節(jié)點的邊。本文引入Dropedge方法[17]以減小模型的過擬合問題,在訓(xùn)練的每個階段,通過式(3)隨機地從輸入圖中刪除邊生成變形數(shù)據(jù),這種方法增加了輸入數(shù)據(jù)的隨機性和多樣性。假設(shè)A中邊的數(shù)據(jù)量是Ne,丟棄比例為p,丟棄掉一定比例的邊后得到新的鄰接矩陣
A′=A-Adrop。(3)
基于A′和X,本文同時構(gòu)建自頂向下信息傳播方向上的傳播圖GTD和自底向上信息擴散方向上的擴散圖GBU,如圖1所示。將圖GTD的鄰接矩陣表示為ATD=A′,圖GBU的鄰接矩陣表示為ABU=A′T。另外,圖GTD和圖GBU采用相同的初始特征矩陣X。
其中,基于機器學(xué)習(xí)的謠言檢測方法使用scikit-learn庫實現(xiàn),BU-RvNN、TD-RvNN使用Theano框架實現(xiàn),GRU-RNN、Bi-GCN和本文提出的模型都采用PyTorch框架實現(xiàn)。為了進(jìn)行公平比較,數(shù)據(jù)集采用5折交叉驗證的方法以獲得穩(wěn)健的實驗結(jié)果。謠言檢測任務(wù)看作分類問題,評估方法采用基于分類的評價指標(biāo)進(jìn)行評測。對于Twitter數(shù)據(jù)集,評估4個分類的整體準(zhǔn)確率(Accuracy,Acc)和各類別的F1值(F1)來驗證本文模型的謠言檢測性能。對于Weibo數(shù)據(jù)集,通過實驗得到分類的Acc和各類別的精確率(Precision,Pre),召回率(Recall,Rec),F(xiàn)1值來驗證本文模型的謠言檢測性能。本文參考基線方法的相關(guān)參數(shù)設(shè)置[15],對本文所提模型的參數(shù)使用Adam[21]優(yōu)化算法進(jìn)行更新優(yōu)化,每個節(jié)點的隱藏特征向量的維度為64,DropEdge的丟棄率設(shè)為0.2,模型訓(xùn)練迭代次數(shù)設(shè)為200。
4.2 實驗結(jié)果分析
首先,對本文提出的GGNN-RD模型與基線方法在謠言檢測任務(wù)中的性能進(jìn)行了一系列實驗。實驗結(jié)果顯示在表2~4中。
由表2~4的實驗結(jié)果觀察可知,在Twitter15和Twitter16數(shù)據(jù)集,GGNN-RD相比最優(yōu)的基線方法在準(zhǔn)確率評估指標(biāo)上提升了至少1.1個百分點,F(xiàn)1值提升了至少0.6個百分點;在Weibo數(shù)據(jù)集,GGNN-RD相比于最優(yōu)的基線方法在準(zhǔn)確率評估指標(biāo)上提升了至少1.3個百分點,F(xiàn)1值提升了至少1.2個百分點。因此,對比基線方法,本文提出的GGNN-RD在3個數(shù)據(jù)上均取得最優(yōu)的謠言檢測性能。
具體實驗結(jié)果分析如下:
1) 由實驗結(jié)果觀察得到,基于機器學(xué)習(xí)的謠言檢測方法(DTC、SVM-RBF)在所有評價指標(biāo)上都低于利用深度學(xué)習(xí)模型的謠言檢測方法。原因是機器學(xué)習(xí)通過人工提取特征,缺乏對謠言檢測的高階特征表示能力,模型的魯棒性較差。而深度學(xué)習(xí)方法具有較強的特征學(xué)習(xí)能力,可以捕捉到謠言信息重要的高階特征表示,對謠言信息的檢測性能更優(yōu)。這也說明了開展基于深度學(xué)習(xí)的謠言檢測技術(shù)研究具有一定的必要性和重要性。
2) 與GRU-RNN方法相比,基于傳播結(jié)構(gòu)的謠言檢測方法具有較好的性能。這是因為GRU-RNN僅考慮了謠言傳播隨時間變化的序列特征,忽略了謠言信息的傳播結(jié)構(gòu)特征,從而導(dǎo)致謠言檢測性能的下降。實驗證明,傳播過程含有大量重要的結(jié)構(gòu)信息,基于傳播結(jié)構(gòu)的檢測方法能夠挖掘豐富的傳播結(jié)構(gòu)特征,并對謠言進(jìn)行有效的識別。
3) 本文提出的GGNN-RD模型的實驗結(jié)果要優(yōu)于BU-RvNN、TD-RvNN和Bi-GCN模型,BU-RvNN和TD-RvNN分別只考慮了單向信息傳播結(jié)構(gòu),無法獲得全面的結(jié)構(gòu)特征。Bi-GCN雖然使用了雙向的GCN對于傳播圖結(jié)構(gòu)進(jìn)行了建模,但是忽略了聚合鄰居節(jié)點信息時可能會產(chǎn)生噪聲,無法獲得較好的節(jié)點表示,針對這一點本文模型通過門控循環(huán)單元過濾聚合鄰居信息而產(chǎn)生的噪聲問題。此外,本文模型利用了源貼豐富的語義和結(jié)構(gòu)信息,提出根節(jié)點增強方法,并融合了局部結(jié)構(gòu)和全局結(jié)構(gòu)信息特征從而學(xué)習(xí)更加全面的謠言特征表示。
4.3 消融實驗
以往采用平均池化[22]的謠言表示方法無法取得突出的檢測性能,為了證明本文所提出的融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息的謠言表示方法有效性,通過設(shè)計消融實驗,對本文提出的謠言表示策略和下面3種方法相比較:
1) GGNN-RD-L指在謠言表示時僅考慮局部結(jié)構(gòu)信息的特征表示;
2) GGNN-RD-AVG指在謠言表示時考慮具有平均池化的全局結(jié)構(gòu)信息的特征表示;
3) GGNN-RD-ATT指在在謠言表示時只考慮具有注意力機制的全局結(jié)構(gòu)信息的特征表示。
通過在3個數(shù)據(jù)集采用4種不同謠言表示方法的消融實驗獲得最終的實驗結(jié)果,如圖3所示。
從圖3中可以看出,融合局部結(jié)構(gòu)和全局結(jié)構(gòu)信息的謠言表示方法GGNN-RD在所有數(shù)據(jù)集上都取得了最佳實驗結(jié)果,它明確驗證了將局部結(jié)構(gòu)信息與全局結(jié)構(gòu)信息結(jié)合起來的重要性。其中,GGNN-RD-L的性能最低,說明僅包含源貼信息的局部結(jié)構(gòu)特征無法得到充分的謠言表示,隨著時間的不斷推移,社交媒體中的信息會形成豐富的傳播結(jié)構(gòu)。GGNN-RD-ATT在所有數(shù)據(jù)集上的結(jié)果都優(yōu)于采取平均池化的GGNN-RD-AVG方法,這說明采用平均池化的謠言表示可能包含一些嘈雜的信息,而基于注意力機制能夠更好地捕獲重要信息,這再次說明了融合局部結(jié)構(gòu)和全局結(jié)構(gòu)對于謠言檢測任務(wù)的必要性。
4.4 早期謠言檢測
早期謠言檢測是評估一個謠言檢測模型的重要指標(biāo),實現(xiàn)在社交媒體謠言傳播的早期發(fā)現(xiàn)謠言,及時對謠言信息進(jìn)行干預(yù),挽回一定損失[23]。本文設(shè)計了早期謠言檢測實驗,來評估各方法的早期謠言檢測效果。具體實現(xiàn),通過設(shè)置了一系列檢測截止期限來評估本文提出的模型和基線方法的準(zhǔn)確性,在每個截止時間點只選擇從源貼發(fā)布時間到檢測截止時間之間的帖子進(jìn)行實驗,對源帖發(fā)布后36 h內(nèi)多個檢測截止時間分別實驗得出早期謠言檢測的實驗結(jié)果,如圖4、圖5所示。
從實驗結(jié)果中可以發(fā)現(xiàn),在圖4、圖5中源帖發(fā)布的最初期,本文所給出的模型在兩個不同的數(shù)據(jù)集上分別取得82.6%和81.3%的結(jié)果,與基線方法相比具有更優(yōu)的檢測性能,說明本文的模型具有良好的早期謠言檢測水平。隨著時間不斷增長,不同謠言檢測方法的性能表現(xiàn)均有一定提升,說明謠言檢測方法通過社交媒體中的信息傳播過程中學(xué)習(xí)得到的結(jié)構(gòu)特征越來越豐富。同時,本文提出的模型在早期謠言檢測性能要明顯優(yōu)于基于傳播序列和傳播樹的檢測方法,表明其具有更好的捕獲真實環(huán)境中謠言的傳播模式的能力。在多個檢測截止時間節(jié)點的性能都優(yōu)于Bi-GCN模型,從而體現(xiàn)了模型具有良好的謠言表示能力,再次說明了利用門控機制去除噪聲,融合局部結(jié)構(gòu)與全局結(jié)構(gòu)信息的謠言表示方法的有效性。
5 結(jié)論
本文對基于傳播結(jié)構(gòu)的謠言檢測問題進(jìn)行了研究,并提出基于門控圖神經(jīng)網(wǎng)絡(luò)的謠言檢測模型GGNN-RD。通過建模社交媒體中信息的傳播過程為圖結(jié)構(gòu),利用門控圖神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)傳播結(jié)構(gòu)特征。此外,為了挖掘源帖豐富的語義和結(jié)構(gòu)信息,結(jié)合謠言的局部結(jié)構(gòu)和全局結(jié)構(gòu)信息以學(xué)習(xí)更全面的謠言表示。實驗結(jié)果表明,本文模型較之前的基線方法有較大的性能提升,并且具有更好的早期檢測能力。由于社交媒體中包含豐富的對象及其社會交互關(guān)系,今后研究工作將考慮利用異質(zhì)信息網(wǎng)絡(luò)建模來解決謠言檢測問題。
參考文獻(xiàn)
[1] 陳慧敏,金思辰.新冠疫情相關(guān)社交媒體謠言傳播量化分析[J].計算機研究與發(fā)展,2021,58(7):1366-1384.
CHEN H M, JIN S C. Quantitative analysis on the communication of COVID-19 related social media rumors[J]. Journal of Computer Research and Development, 2021, 58(7):1366-1384.
[2] 高玉君,梁剛, 蔣方婷,等. 社會網(wǎng)絡(luò)謠言檢測綜述[J]. 電子學(xué)報, 2020,48(7):1421-1435.
GAO Y J, LIANG G, JIANG F T,et al. Social network rumor detection: a survey[J]. Acta Electronica Sinica, 2020,48(7):1421-1435.
[3] CASTILLO C, MENDOZA M, POBLETE B. Information credibility on twitter[C]//Proceedings of the 20th International Conference on World Wide Web,New York, USA,2011:675-684.
[4] YANG F, LIU Y, YU X H. Automatic detection of rumor on Sina Weibo[C]//Proceedings of the ACM SIGKDD Workshop on Mining Data Semantics,New York, USA,2012:1-7.
[5] GUO H, CAO J, ZHANG Y, et al. Rumor detection with hierarchical social attention network[C]//Proceedings of the 27th ACM International Conference on Information and Knowledge Management,Torino, Italy, 2018:943-951.
[6] GUPTA M,ZHAO P,HAN J. Evaluating event credibility on twitter[C]//Proceedings of the 2012 SIAM International Conference on Data Mining,San Francisco, USA, 2012:153-164.
[7] WU K, YANG S, ZHU K Q. False rumors detection on Sina Weibo by propagation structures[C]//Proceedings of the IEEE 31th International Conference on Data Engineering,Seoul, Korea, 2015:651-662.
[8] MA J, GAO W, WONG K F. Detect rumors in microblog posts using propagation structure via kernel learning[C]//Proceedings of the 55th Association for Computational Linguistics, Stroudsburg, USA,2017:708-717.
[9] 徐建民,孫朋,吳樹芳. 傳播路徑樹核學(xué)習(xí)的微博謠言檢測方法[J]. 計算機科學(xué),2022,49(6): 342-349.
XU J M, SUN P, WU S F. Microblog rumor detection method based on propagation path tree kernel learning[J]. Computer Science,2022,49(6): 342-349.
[10] MA J, GAO W, MITRA P, et al.Detecting rumors from microblogs with recurrent neural networks[C]//Proceedings of the 25th International Joint Conference on Artificial Intelligence,Palo Alto, USA, 2016:3818-3824.
[11] CHEN Y X, SUI J, HU L, et al. Attention-residual network with CNN for rumor detection[C]//Proceedings of the 28th ACM International Conference on Information and Knowledge Management, New York,USA,2019:1121-1130.
[12] MA J, GAO W, WONG K, et al. Rumor detection on twitter with tree-structured recursive neural networks[C]//Proceedings of the 56th Annual Meeting of the Association for Computational Linguistics,Melbourne, Australia,2018:1980-1989.
[13] WU Z, PAN S, CHEN F, et al. A comprehensive survey on graph neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems, 2021, 32(1):4-24.
[14] 石川,王睿嘉,王嘯.異質(zhì)信息網(wǎng)絡(luò)分析與應(yīng)用綜述[J].軟件學(xué)報,2022,33(2):598-621.
SHI C, WANG R J, WANG X.Survey on heterogeneous information networks analysis and applications[J].Journal of Software,2022,33(2):598-621.
[15] BIAN T, XIAO X, XU T, et al. Rumor detection on social media with bi-directional graph convolutional networks[C]//Proceedings of the AAAI Conference on Artificial Intelligence, Palo Alto, USA, 2020:549-556.
[16] 胡斗, 衛(wèi)玲蔚,周薇.一種基于多關(guān)系傳播樹的謠言檢測方法[J].計算機研究與發(fā)展,2021,58(7):1395-1411.
HU D, WEI L W, ZHOU W, et al. A rumor detection approach based on muti-relational propagation tree[J].Journal of Computer Research and Development, 2021,58(7):1395-1411.
[17] RONG Y, HUANG W B, XU T Y. Dropedge:towards deep graph convolutional networks on node classification[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA, 2020:1862.
[18] NIKOLENTZOS G, TIXIER A, VAZIRGIANNIS M. Message passing attention networks for document understanding[C]//Proceedings of the AAAI Conference on Artificial Intelligence, New York, USA,2020:8544-8551.
[19] HUANG Q, ZHOU C, WU J, et al. Deep spatial-temporal structure learning for rumor detection on twitter[J]. Neural Computing and Applications, 2020,41(3):219-230.
[20] LUONG M T, PHAM H, MANNING C D. Effective approaches to attention-based neural machine translation[C]//Proceedings of the 2015 Conference on Empirical Methods in Natural Language Processing, Lisbon, Portugal, 2015:1412-1423.
[21] KINGMA D, BA J. Adam: a method for stochastic optimization[C]//Proceedings of the 3rd International Conference on Learning Representations,San Diego, USA, 2015:1-13.
[22] RAO D N, MIAO X, JIANG Z H, et.al. STANKER: stacking network based on level-grained attention-masked BERT for rumor detection on social media[C]//Proceedings of the 2021 Conference on Empirical Methods in Natural Language Processing, Punta Cana, Dominican,2021: 3347-3363.
[23] LU Y J, LI C T. GCAN:graph-aware co-attention networks for explainable fake news detection on social media[C]//Proceedings of the 58th Annual Meeting of the Association for Computational Linguistics,2020:505-514.
Rumor detection model based on gated graph neural network
YANG Xiaohui, WANG Weibin
(School of Cyber Security and Computer, Hebei University, Baoding, Hebei 071003, China)
Abstract:Aiming at the noise interference problem of the rumor detection method based on graph neural network in the process of aggregating neighbor node information to generate rumor representation, a rumor detection model based on gated graph neural network is proposed. It also makes full use of the important impact of rich semantic and structural information contained in social media source posts on rumor detection. In the model, propagation graphs and diffusion graphs based on the propagation process of rumors is constructed, and a node representation is generated by aggregating neighbor information through a gated graph neural network.Gate mechanism is used to remove noise from neighbor nodes. At the same time, a root node semantic enhancement method is introduced to improve the ability to represent nodes. In addition, the attention mechanism is used to fuse local structure and global structure information to learn a more comprehensive rumor representation for the task of rumor detection. Experimental results on public datasets show that the proposed model has better rumor detection performance and early detection ability than baseline methods.
Keywords: social media; rumor detection; graph neural network; attention mechanism