国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

面向社交網(wǎng)絡(luò)重要信息傳播的重疊節(jié)點(diǎn)挖掘模型研究

2024-01-15 14:14:04魏會廷陳永光
關(guān)鍵詞:標(biāo)簽社交節(jié)點(diǎn)

魏會廷,陳永光

1. 許昌學(xué)院 實(shí)驗(yàn)室與設(shè)備管理中心,河南 許昌 461000;2. 周口師范學(xué)院 教育科學(xué)學(xué)院,河南 周口 466001

隨著互聯(lián)網(wǎng)和智能手機(jī)的普及,社交網(wǎng)絡(luò)已經(jīng)成為現(xiàn)代社會中人們?nèi)粘I詈凸ぷ鞯闹匾M成部分.而社交網(wǎng)絡(luò)中信息傳播迅速,影響力巨大,關(guān)鍵節(jié)點(diǎn)在信息傳播過程中發(fā)揮著重要作用.對于社交網(wǎng)絡(luò)中重要信息傳播的研究,挖掘重疊節(jié)點(diǎn)具有重要的理論和實(shí)際價(jià)值.特別是在信息傳播和輿情監(jiān)控等領(lǐng)域,重疊節(jié)點(diǎn)的挖掘可以幫助人們更好地理解信息是如何在社交網(wǎng)絡(luò)中擴(kuò)散,以及如何更有效地監(jiān)控和管理這些傳播過程.

社交網(wǎng)絡(luò)信息傳播是指信息在社交網(wǎng)絡(luò)中的擴(kuò)散過程[1].隨著社交網(wǎng)絡(luò)的普及和快速發(fā)展,信息傳播研究逐漸成為學(xué)術(shù)界和產(chǎn)業(yè)界關(guān)注的焦點(diǎn).在這一領(lǐng)域的研究中,基本理論和傳播模型是兩個(gè)主要方向[2].基本理論主要關(guān)注信息傳播規(guī)律、影響因素和機(jī)制[3],如網(wǎng)絡(luò)結(jié)構(gòu)、節(jié)點(diǎn)屬性、信息內(nèi)容等對信息傳播過程的影響[4].網(wǎng)絡(luò)結(jié)構(gòu)分析主要關(guān)注社交網(wǎng)絡(luò)中信息傳播的特點(diǎn),如小世界現(xiàn)象和冪律分布等[5]; 節(jié)點(diǎn)屬性研究則關(guān)注個(gè)體在信息傳播中的角色,包括意見領(lǐng)袖、橋接節(jié)點(diǎn)等; 信息內(nèi)容研究主要關(guān)注信息本身的特性,如話題、情感和傳播力等,以及這些特性如何影響信息在社交網(wǎng)絡(luò)中的傳播[6].

傳播模型則主要用于描述和預(yù)測信息傳播過程[7].國內(nèi)外的學(xué)者提出了很多模型,而其中最著名的是獨(dú)立級聯(lián)模型(ICM)[8]和線性閾值模型(LTM)[9].在獨(dú)立級聯(lián)模型中每個(gè)節(jié)點(diǎn)有一定的概率被其鄰居影響,從而采納某種行為或觀點(diǎn).這個(gè)概率通常根據(jù)節(jié)點(diǎn)間的關(guān)系強(qiáng)度來確定[10].線性閾值模型則認(rèn)為節(jié)點(diǎn)在鄰居中所占的影響力達(dá)到一定閾值時(shí),才會采納新的行為或觀點(diǎn)[11].此外,還有其他的傳播模型,例如信息擴(kuò)散模型(IDM),為國內(nèi)外學(xué)者提供了多種信息傳播過程的建模方法[12].盡管學(xué)者們在社交網(wǎng)絡(luò)信息傳播研究中取得了顯著成果,但這一領(lǐng)域的研究仍然面臨諸多挑戰(zhàn).社交網(wǎng)絡(luò)中信息傳播往往受多方面因素的影響,如時(shí)效性、跨平臺傳播和社交媒體上的算法推薦等.這些因素使信息傳播的規(guī)律和模式變得更加復(fù)雜,給信息傳播研究和預(yù)測帶來了困難.

由于重疊節(jié)點(diǎn)在社交網(wǎng)絡(luò)中起到關(guān)鍵作用,尤其在信息傳播過程中具有特殊意義[13],在過去的研究中盡管學(xué)者們提出了許多方法來挖掘這些重疊節(jié)點(diǎn)(包括基于社區(qū)劃分的方法[14]、基于網(wǎng)絡(luò)結(jié)構(gòu)的方法[15]、基于隨機(jī)游走的方法[16]及基于機(jī)器學(xué)習(xí)的方法)[17],但是由于節(jié)點(diǎn)的動(dòng)態(tài)性、社區(qū)結(jié)構(gòu)的復(fù)雜性及信息傳播的多樣性,仍然對社交網(wǎng)絡(luò)中挖掘重疊節(jié)點(diǎn)造成了困難和挑戰(zhàn).在動(dòng)態(tài)社交網(wǎng)絡(luò)中,節(jié)點(diǎn)和邊的變化頻繁,傳統(tǒng)的社區(qū)檢測方法往往難以應(yīng)對這種變化[18].此外,社交網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)通常具有重疊性,即一個(gè)節(jié)點(diǎn)可能屬于多個(gè)社區(qū),這種狀態(tài)給社區(qū)檢測帶來了額外的復(fù)雜性[19].

為了解決目前研究的不足,本文提出一種面向社交網(wǎng)絡(luò)重要信息傳播的重疊節(jié)點(diǎn)挖掘模型(SNONMM),該模型綜合了標(biāo)簽傳播算法(LPA)和擴(kuò)散激活原理,旨在克服現(xiàn)有方法的局限性.標(biāo)簽傳播算法通過在網(wǎng)絡(luò)中傳播節(jié)點(diǎn)標(biāo)簽來發(fā)現(xiàn)社區(qū)結(jié)構(gòu); 而擴(kuò)散激活原理則模擬了信息在網(wǎng)絡(luò)中的傳播過程.兩者相結(jié)合使SONMM模型能夠有效地挖掘社交網(wǎng)絡(luò)中的重疊節(jié)點(diǎn).

1 社交網(wǎng)絡(luò)重要信息傳播的重疊節(jié)點(diǎn)挖掘模型(SNONMM)

1.1 動(dòng)態(tài)網(wǎng)絡(luò)和擴(kuò)散激活過程

動(dòng)態(tài)網(wǎng)絡(luò)通常由一個(gè)網(wǎng)絡(luò)G(V,E)表示,其中V是頂點(diǎn)的集合,而E是邊的集合.本文定義動(dòng)態(tài)網(wǎng)絡(luò)SG為一組順序網(wǎng)絡(luò)SG={G1,G2,…,Gt},其中每個(gè)網(wǎng)絡(luò)對應(yīng)一次迭代.例如,G1對應(yīng)第一次迭代,t表示從1開始的迭代編號.由于本文方法和其他可用方法都是為動(dòng)態(tài)重疊社區(qū)檢測提供的,因此本文模型考慮了這類社區(qū).重疊動(dòng)態(tài)社區(qū)檢測是指在SG中找到密集連接的重疊子網(wǎng)絡(luò)任務(wù).

擴(kuò)散激活過程是一種搜索方法,通過在網(wǎng)絡(luò)中隨機(jī)選擇一個(gè)或多個(gè)節(jié)點(diǎn)作為源節(jié)點(diǎn)開始.每個(gè)節(jié)點(diǎn)都對應(yīng)一個(gè)初始化激活值,源節(jié)點(diǎn)的激活值為1,其他節(jié)點(diǎn)的激活值為0.每個(gè)節(jié)點(diǎn)的激活值表示該節(jié)點(diǎn)傳播信息所需的激活量.每個(gè)源節(jié)點(diǎn)通過廣度優(yōu)先搜索方法將其激活值發(fā)送給其他節(jié)點(diǎn).如式(1)所示,接收節(jié)點(diǎn)根據(jù)以下3個(gè)參數(shù)更新它們的激活值: ① 源節(jié)點(diǎn)的激活值; ② 源節(jié)點(diǎn)與目標(biāo)節(jié)點(diǎn)之間的鏈接權(quán)重; ③ 衰減因子.

(1)

衰減因子是表示網(wǎng)絡(luò)邊緣擴(kuò)散強(qiáng)度減小的參數(shù).當(dāng)從多條路徑到達(dá)一個(gè)節(jié)點(diǎn)時(shí),該過程停止.每個(gè)源節(jié)點(diǎn)創(chuàng)建一個(gè)由其可訪問節(jié)點(diǎn)組成的樹.總的來講,節(jié)點(diǎn)j的激活值是基于節(jié)點(diǎn)i的激活值計(jì)算獲得,其中i是源節(jié)點(diǎn),j是目標(biāo)節(jié)點(diǎn).A[i]和A[j]分別是節(jié)點(diǎn)i和j的激活值.D是衰減因子,W[i,j]表示節(jié)點(diǎn)i和j之間的鏈接權(quán)重.

1.2 SNONMM原理描述

SNONMM主要由4個(gè)部分組成.第1部分是初始化,其中每個(gè)節(jié)點(diǎn)都被標(biāo)記為一對標(biāo)簽名稱,激活值.本文首先將標(biāo)簽名稱設(shè)為節(jié)點(diǎn)編號,激活值設(shè)置為1.標(biāo)簽名稱用于區(qū)分節(jié)點(diǎn),而激活值表示節(jié)點(diǎn)的狀態(tài)或活躍程度.第2部分是網(wǎng)絡(luò)權(quán)重分配,應(yīng)用了名為社交行為信息擴(kuò)散模型(SBIDM)的權(quán)重算法.這種算法為每個(gè)節(jié)點(diǎn)分配一個(gè)分?jǐn)?shù),并從得分最高的鄰居即最佳鄰居處獲取基于信息.SBIDM算法的基本原理是通過節(jié)點(diǎn)社交行為來分配權(quán)重,從而使信息傳播更加高效.在確定最佳鄰居后,通過增加節(jié)點(diǎn)與其最佳鄰居之間的邊來提升該節(jié)點(diǎn)的狀態(tài)值:

(2)

式(2)中:

(3)

這種權(quán)重算法旨在實(shí)現(xiàn)目標(biāo)邊的權(quán)重越大,則信息流量越大.本文在具有7個(gè)頂點(diǎn)的網(wǎng)絡(luò)中進(jìn)行了應(yīng)用,其中圖1和圖2顯示了SNONMM在具有7個(gè)頂點(diǎn)的網(wǎng)絡(luò)中第1部分和第2部分的結(jié)果.

圖1 SNONMM第1部分結(jié)果

圖2 SNONMM第2部分結(jié)果

第3部分為所有節(jié)點(diǎn)考慮預(yù)定義權(quán)重的自循環(huán)(圖3),應(yīng)用了擴(kuò)散激活過程,其中所有新節(jié)點(diǎn)而非少數(shù)節(jié)點(diǎn)被選擇為源節(jié)點(diǎn).每個(gè)源節(jié)點(diǎn)首先將其標(biāo)簽激活值發(fā)送給自身,然后將其發(fā)送給通過廣度優(yōu)先搜索訪問的其他節(jié)點(diǎn),直到達(dá)到目標(biāo)狀態(tài)(激活值低于閾值).每個(gè)目標(biāo)節(jié)點(diǎn)根據(jù)3個(gè)參數(shù)更新接收標(biāo)簽的激活值.第1個(gè)參數(shù)是源節(jié)點(diǎn)的激活值,第2個(gè)參數(shù)是源節(jié)點(diǎn)和目標(biāo)節(jié)點(diǎn)之間的邊的權(quán)重,第3個(gè)參數(shù)是衰減因子.當(dāng)過程完成時(shí),激活值較低的標(biāo)簽將從節(jié)點(diǎn)中移除.

第4部分首先將更改的節(jié)點(diǎn)按隨機(jī)順序排列,然后從該順序中選擇一個(gè)節(jié)點(diǎn)作為接收節(jié)點(diǎn),提取其鄰居并將其視為發(fā)送節(jié)點(diǎn),每個(gè)發(fā)送節(jié)點(diǎn)選擇激活值大于其他標(biāo)簽的一個(gè)標(biāo)簽.發(fā)送節(jié)點(diǎn)將其選定的標(biāo)簽發(fā)送給接收節(jié)點(diǎn),接收節(jié)點(diǎn)根據(jù)發(fā)送節(jié)點(diǎn)和接收節(jié)點(diǎn)之間的邊的權(quán)重計(jì)算發(fā)送標(biāo)簽的新激活值.接收節(jié)點(diǎn)對相同標(biāo)簽的激活值求和,然后接受激活值之和大于其他標(biāo)簽的標(biāo)簽.如果接收標(biāo)簽的激活值大于1,算法將其設(shè)置為1,作為激活值范圍的結(jié)果.第4部分重復(fù)進(jìn)行5~20次,刪除激活值較低的標(biāo)簽.具有近似激活值標(biāo)簽的節(jié)點(diǎn)形成社區(qū).圖4顯示了SNONMM在網(wǎng)絡(luò)中第4部分的結(jié)果,表明節(jié)點(diǎn)(a,e,f,g)和(a,b,c,d)在同一個(gè)社區(qū)中.

圖3 SNONMM第3部分結(jié)果

圖4 SNONMM第4部分結(jié)果

1.3 模型的算法實(shí)現(xiàn)

算法首先為所有新節(jié)點(diǎn)分配最大激活值,然后開始邊權(quán)重處理過程.算法1首先將所有邊的權(quán)重初始化為1,然后隨機(jī)選擇一個(gè)節(jié)點(diǎn)并計(jì)算其鄰居的分?jǐn)?shù).在鄰居中,分?jǐn)?shù)大于其他節(jié)點(diǎn)的節(jié)點(diǎn)被選為最佳鄰居.本文將節(jié)點(diǎn)與其最佳鄰居之間的權(quán)重加上該節(jié)點(diǎn)的狀態(tài)值.函數(shù)Normalize(G(V,E))調(diào)整邊的權(quán)重,使每條邊的權(quán)重不超過1.

算法1SBIDMEdgeWeighting(Gts)

Input:G=(V,E)

Output: WG: weighted graph

Method:

1.for eache_minE

2.setw(e_m)=1

3.end for each

4.fori: =1 to n do

5.Choose nodevrandomly

6.Calculate score for neighbors ofv

7.best_neighbor=select_best_neighbor(neighbor_scores)

8.if best_neighbor exists then

9.Update edge weight betweenvand best_neighbor based on Eq. (3)

10.Update activation values ofvand best_neighbor based on Eq. (2)

11.end if

12.end for

13.for each nodevinVdo

14.for each neighboruofvdo

15. Normalize edge weight betweenvandu

16.end for each

17.end for

18.WG=G(V,E)

算法2中函數(shù)Spreading Activation(G(t))計(jì)算節(jié)點(diǎn)的激活值.首先為每個(gè)節(jié)點(diǎn)創(chuàng)建一個(gè)名為UnFiredNodeSet的空集,然后根據(jù)廣度優(yōu)先搜索進(jìn)行更新.從這個(gè)集合中提取節(jié)點(diǎn),并計(jì)算它們的激活值,直到激活值低于閾值或者UnFiredNodeSet為空.

算法2Spreading Activation (G(t),new nodes)

Input:G(V,E)

Output:G(V+,E)

Method:

1.for each nodevinVdo

2.Create empty set UnfiredNodeSet

3.Addvto UnFiredNodeSet

4.Neighbors=v.ObtainNbs()

5.Add Neighbors to UnFiredNodeSet

6.while UnFiredNodeSet is not empty do

7.Extract nv from UnFiredNodeSet

8.Compute nv.label.activation_value

9.If nv.label.activation_value

10.continue

11.end if

12.Neighbors=nv.ObtainNbs()

13.Add Neighbors to UnFiredNodeSet

14.end while

15.end for

算法3開始標(biāo)簽傳播.首先通過ShuffleOrder函數(shù)將更改的節(jié)點(diǎn)按隨機(jī)順序排列,并從這個(gè)順序中選擇一個(gè)節(jié)點(diǎn)作為接收節(jié)點(diǎn),通過函數(shù)ObtainNbsO提取接收節(jié)點(diǎn)的鄰居作為發(fā)送節(jié)點(diǎn).GetLabelsO函數(shù)選擇每個(gè)發(fā)送節(jié)點(diǎn)中激活值最大的一個(gè)標(biāo)簽,創(chuàng)建發(fā)送標(biāo)簽的候選標(biāo)簽集.然后,接收節(jié)點(diǎn)接受候選標(biāo)簽集中激活值之和最大的一個(gè)標(biāo)簽.最后,刪除激活值較低的標(biāo)簽,并根據(jù)標(biāo)簽激活值的相似性提取社區(qū).

算法3SNONMM算法

Input:SG={L_1=〈V_1,E_1〉,L_2=〈V_2,E_2〉,…,L_n=〈V_n,E_n〉},T

Output: set of communities ofSG

Method:

1.Initialize communities

2.for ts=1:Tdo // ts stands for timestamp

3.for each nodevinSGdo

4.Node(v).label=v

5.Node(v).label.activation_value=1

6.end for

7.InitializeG(ts)

8.end for

9.Initialize deltaV

10.ΔV={v|v∈V(ts)}.3

11.for ts=1:Tdo

// Part 2: Edge Weighting

12.WERW-KpathEdgeWeighting (G(ts)) or SBIDMEdgeWeighting (G(ts))

// end Part 2

// Part 3: Spreading Activation

13.Spreading Activation (G(ts))

// end Part 3

// Part 4: label propagation

14.ChangedNodes={u,v|(u,v)∈E(ts)}

15.V_old={v|v∈G(ts)∩v?G(ts+1)}

16.ChangedNodes=ChangedNodes-V_old

17.for it=1: IT do // it means iteration

18.ChangedNodes.ShuffleOrder()

19.for i=1: ChangedNodes.count do

20.Receiver=ChangedNodes(i)

21.Senders=ChangedNodes(i).ObtainNbs()

22.CandidateLabels=Senders.GetLabels()

23.Receiver.update(CandidateLabels.TheMostActivationValueLabel)

24.end for

25.end for

26.Remove Nodes(i) labels with activation value

27.Update communities

28.UpdateSG

// end Part 4

29.end for

1.4 復(fù)雜度分析

本文方法分為4個(gè)部分.第1部分中初始化標(biāo)簽需要O(n),其中n是節(jié)點(diǎn)數(shù)量.第2部分中應(yīng)用了權(quán)重算法.在最壞的情況下這一部分需要O(m),其中m是邊的數(shù)量.第3部分中由于本文方法對網(wǎng)絡(luò)每個(gè)節(jié)點(diǎn)使用廣度優(yōu)先搜索,因此總共需要O(n×m).第4部分包括發(fā)送和接收標(biāo)簽,需要O(n).從上述事實(shí)可以得出,本文方法在每次迭代中需要O(n×m).由于迭代次數(shù)是一個(gè)常數(shù)T,所以所有社區(qū)檢測的總復(fù)雜度為O(n×m).

2 實(shí)驗(yàn)與評估

本文選擇2個(gè)引文網(wǎng)絡(luò)和1個(gè)合成網(wǎng)絡(luò)對SNONMM進(jìn)行評估.在引文網(wǎng)絡(luò)中只能添加節(jié)點(diǎn),因此與前一次迭代相比節(jié)點(diǎn)數(shù)量有所增加.在本文中,有向邊被視為無向邊.

2.1 數(shù)據(jù)集介紹

Arxiv HEP-PH是一個(gè)引文網(wǎng)絡(luò),涵蓋了1993年1月至2003年4月期間發(fā)表的論文,包含34,546個(gè)節(jié)點(diǎn)和421,578條邊,其中節(jié)點(diǎn)是論文,邊是論文之間的引用.因此,從節(jié)點(diǎn)i到節(jié)點(diǎn)j的邊被視為論文i和j之間的引用.該數(shù)據(jù)集將1個(gè)月的論文和交流視為1次迭代.

Arxiv HEP-TH是一個(gè)覆蓋高能物理理論出版物的引文網(wǎng)絡(luò),論文被視為節(jié)點(diǎn),論文之間的引用被視為邊,該網(wǎng)絡(luò)包含27,770個(gè)節(jié)點(diǎn)和352,807條邊.數(shù)據(jù)集涵蓋了1993年1月至2003年4月期間的論文,且將兩個(gè)月的論文和交流視為1次迭代.引文數(shù)據(jù)集的基本信息如表1所示.

表1 引文數(shù)據(jù)集基本信息

除2個(gè)真實(shí)引文網(wǎng)絡(luò)外,本文還將SNONMM與其他可用方法的性能在一個(gè)人工合成網(wǎng)絡(luò)中進(jìn)行評估,生成這些網(wǎng)絡(luò)的核心參數(shù)如表2所示.其中,S表示迭代次數(shù),n表示節(jié)點(diǎn)數(shù)量,avgd和maxd分別表示節(jié)點(diǎn)的平均度和最大度,符號minc和maxc分別表示社區(qū)的最大和最小規(guī)模,符號On和Onc分別表示重疊節(jié)點(diǎn)的數(shù)量和每個(gè)重疊節(jié)點(diǎn)所屬的社區(qū)數(shù)量,μ是設(shè)定為0.3的混合參數(shù).

表2 人工合成網(wǎng)絡(luò)的參數(shù)設(shè)置

2.2 評價(jià)指標(biāo)

本文中由于真實(shí)網(wǎng)絡(luò)缺乏已知的基準(zhǔn)社區(qū),因此采用模塊度衡量和標(biāo)準(zhǔn)互信息方法來評估檢測模型的準(zhǔn)確性.

2.2.1 模塊度衡量

盡管原始模塊度主要處理非重疊社區(qū),但在本文中社區(qū)成員可以相互重疊.因此,如式(4)所示,本文采用了一種拓展模塊度方法,以便衡量具有重疊結(jié)構(gòu)的社區(qū).

(4)

式(4)中:

(5)

式(4)、式(5)中,符號ki和kj分別表示頂點(diǎn)i和j的度.符號m表示邊的數(shù)量,Ai,j是鄰接矩陣.符號βiC和βjC分別表示節(jié)點(diǎn)i和j屬于社區(qū)c的強(qiáng)度.符號kiC和kjC分別表示節(jié)點(diǎn)i和j到社區(qū)c的鏈接總權(quán)重.

2.2.2 標(biāo)準(zhǔn)互信息(NMI)

由于在人工合成網(wǎng)絡(luò)中已知社區(qū)結(jié)構(gòu),因此使用標(biāo)準(zhǔn)互信息(Normalized Mutual Information,NMI)[20]作為評估社區(qū)檢測的指標(biāo).NMI值的范圍在0~1之間,當(dāng)算法劃分的社區(qū)結(jié)構(gòu)更準(zhǔn)確時(shí),NMI值較大; 若不太準(zhǔn)確,則NMI值較?。?/p>

2.3 實(shí)驗(yàn)結(jié)果

本文選擇了動(dòng)態(tài)的Speaker-Listener標(biāo)簽傳播算法(SLPAD)[21]和基于動(dòng)態(tài)網(wǎng)絡(luò)標(biāo)簽傳播的進(jìn)化聚類算法(DLPAE)[22]來與SNONMM在真實(shí)網(wǎng)絡(luò)和人工合成網(wǎng)絡(luò)中的結(jié)果進(jìn)行對比,分別顯示在圖5和圖6中.選擇SLPAD和DLPAE方法是因?yàn)樗鼈兌寄茉趧?dòng)態(tài)社交網(wǎng)絡(luò)中檢測到重疊社區(qū).

圖5 不同算法在Arxiv HEP-PH和Arxiv HEP-TH網(wǎng)絡(luò)上獲得的模塊度值

圖6 各種算法在人工合成網(wǎng)絡(luò)中的NMI值

圖5A繪制了Arxiv HEP-PH數(shù)據(jù)集上本文方法與其他可用方法在模塊度方面的比較結(jié)果.從圖5A的數(shù)據(jù)中可以明顯看出所有方法(包括本文的SNONMM和其他可用方法)呈現(xiàn)出遞減趨勢.這是因?yàn)樗蟹椒ㄔ诘?次迭代中考慮了整個(gè)網(wǎng)絡(luò),而在迭代2及以后的迭代中與前一次迭代相比,考慮了發(fā)生變化的邊和節(jié)點(diǎn).由于迭代2及以后的迭代中考慮了變化的邊和節(jié)點(diǎn),因此模塊度的減少不可避免.此外,SNONMM在早期迭代中的模塊度減少量大于SLPAD和DLPAE.然而,在中間和最后的迭代中,本文方法模塊度的減少量小于其他可用方法.從以上事實(shí)可以得出,SNONMM在節(jié)點(diǎn)和邊變化方面的性能優(yōu)于其他可用方法.圖5B繪制了Arxiv HEP-TH數(shù)據(jù)集上SNONMM方法與SLPAD[20]和DLPAE[21]方法在模塊度方面的比較.Arxiv HEP-TH數(shù)據(jù)集中迭代數(shù)量是Arxiv HEP-PH數(shù)據(jù)集的一半,而數(shù)據(jù)集中的節(jié)點(diǎn)數(shù)量大致相同,由于在此數(shù)據(jù)集中節(jié)點(diǎn)僅被添加而沒有被刪除,新節(jié)點(diǎn)的數(shù)量遠(yuǎn)低于Arxiv HEP-PH數(shù)據(jù)集.在早期迭代中SLPAD和DLPAE方法表現(xiàn)出增長趨勢,而在后期迭代中它們的準(zhǔn)確性顯著降低.除了早期迭代外,SNONMM在大部分迭代中都實(shí)現(xiàn)了更高的模塊度.圖6顯示了3種方法在人工合成網(wǎng)絡(luò)中得出的結(jié)果,可以看出SNONMM在人工合成網(wǎng)絡(luò)中的NMI值同樣大于SLPAD[20]和DLPAE[21]方法,即SNONMM在社區(qū)劃分時(shí)得到的結(jié)果相較于其他兩種方法具有更高的準(zhǔn)確度.

基于上述結(jié)果,SNONMM方法在上述3個(gè)數(shù)據(jù)集中取得了比其他兩種方法更好的性能.

3 結(jié)論和展望

本文針對社交網(wǎng)絡(luò)中重要信息傳播的重疊節(jié)點(diǎn)挖掘問題進(jìn)行了深入研究,并提出一種面向社交網(wǎng)絡(luò)重要信息傳播的重疊節(jié)點(diǎn)挖掘模型(SNONMM).該模型結(jié)合標(biāo)簽傳播算法(LPA)和擴(kuò)散激活原理,能夠在動(dòng)態(tài)社交網(wǎng)絡(luò)中提高社區(qū)檢測的準(zhǔn)確性,使新節(jié)點(diǎn)在社交網(wǎng)絡(luò)中向其他節(jié)點(diǎn)傳播標(biāo)簽的機(jī)會大于舊節(jié)點(diǎn),且每個(gè)標(biāo)簽都有一個(gè)表示其傳播強(qiáng)度的激活值.通過對2個(gè)真實(shí)網(wǎng)絡(luò)和1個(gè)人工合成網(wǎng)絡(luò)的實(shí)驗(yàn)評估,本文發(fā)現(xiàn)SNONMM方法在檢測社區(qū)準(zhǔn)確性方面優(yōu)于其他可用方法,表明SNONMM在解決動(dòng)態(tài)社交網(wǎng)絡(luò)中重疊節(jié)點(diǎn)挖掘問題方面具有潛在優(yōu)勢.然而,動(dòng)態(tài)網(wǎng)絡(luò)中的社區(qū)檢測仍然具有挑戰(zhàn)性,尤其是在動(dòng)態(tài)社區(qū)發(fā)現(xiàn)方面,盡管本文SNONMM在一定程度上解決了這個(gè)問題,但未來的研究仍需進(jìn)一步探討和優(yōu)化這些方法,以提高其在更廣泛應(yīng)用場景中的性能.在未來的研究中,可以考慮對網(wǎng)絡(luò)結(jié)構(gòu)和社交媒體上的內(nèi)容進(jìn)行融合,以提高社區(qū)檢測的準(zhǔn)確性和效率,并結(jié)合多層次和多維度數(shù)據(jù),更好地捕捉和描述動(dòng)態(tài)社交網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)變化,同時(shí)可以開發(fā)更多針對動(dòng)態(tài)網(wǎng)絡(luò)的社區(qū)檢測算法,并對它們進(jìn)行跨學(xué)科綜合研究,以提高算法的通用性和適應(yīng)性.

猜你喜歡
標(biāo)簽社交節(jié)點(diǎn)
社交之城
英語世界(2023年6期)2023-06-30 06:28:28
CM節(jié)點(diǎn)控制在船舶上的應(yīng)用
社交牛人癥該怎么治
意林彩版(2022年2期)2022-05-03 10:25:08
Analysis of the characteristics of electronic equipment usage distance for common users
基于AutoCAD的門窗節(jié)點(diǎn)圖快速構(gòu)建
社交距離
你回避社交,真不是因?yàn)閮?nèi)向
文苑(2018年17期)2018-11-09 01:29:28
無懼標(biāo)簽 Alfa Romeo Giulia 200HP
車迷(2018年11期)2018-08-30 03:20:32
不害怕撕掉標(biāo)簽的人,都活出了真正的漂亮
海峽姐妹(2018年3期)2018-05-09 08:21:02
標(biāo)簽化傷害了誰
南皮县| 辽阳市| 黄冈市| 蕉岭县| 即墨市| 绥滨县| 黔南| 阳江市| 新宾| 淮安市| 安丘市| 泾源县| 繁昌县| 商丘市| 马尔康县| 股票| 贵德县| 高阳县| 民乐县| 房山区| 手游| 大竹县| 来安县| 杂多县| 胶州市| 阿拉尔市| 武冈市| 镇宁| 连城县| 保定市| 上饶市| 哈巴河县| 横峰县| 城市| 无棣县| 河源市| 内江市| 沙坪坝区| 永善县| 富顺县| 湘潭市|