王曉萌, 方濱興, 張宏莉, 王 星
(哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院, 哈爾濱 150001)
在線社交網(wǎng)絡(luò)與生俱來的自由性和開放性,使其逐漸成為當(dāng)代社會(huì)信息傳播的重要集散地,社交網(wǎng)絡(luò)中的信息活躍性達(dá)到了前所未有的程度。隨著國內(nèi)外大量在線社交網(wǎng)絡(luò)服務(wù)的涌現(xiàn)以及用戶的參與,針對社交網(wǎng)絡(luò)信息傳播分析的相關(guān)研究引起了國內(nèi)外學(xué)者的高度關(guān)注。研究社交網(wǎng)絡(luò)中的信息傳播規(guī)律,建立傳播模型,即能從信息傳播的角度對網(wǎng)絡(luò)結(jié)構(gòu)、屬性以及突發(fā)事件遵循的規(guī)律有進(jìn)一步的認(rèn)識。
信息傳播模型是信息傳播研究內(nèi)容的核心,主要任務(wù)是分析信息傳播過程中的影響因素,理解、模擬并驗(yàn)證擴(kuò)散過程。信息傳播與疾病、文化和行為的傳播是人類社會(huì)中常見的現(xiàn)象,很多研究者多借鑒病毒傳播模型[1-2]來研究在線社交絡(luò)中的謠言傳播[3-4]。傳統(tǒng)的傳染病傳播模型中的狀態(tài)表征存在不足,個(gè)體只有感染、易感和免疫三種狀態(tài),許多擴(kuò)展模型并沒有充分考慮信息傳播的內(nèi)在機(jī)理與用戶的影響力,傳播模擬實(shí)驗(yàn)結(jié)論也沒有給出拓?fù)浣Y(jié)構(gòu)對傳播機(jī)理影響的合理解釋。信息傳播具有記憶效應(yīng)(memory effect)[5],記憶效應(yīng)是指人對于同類信息接觸所具有的記憶上的累積特性,即同一類信息的多次冗余接觸會(huì)改變?nèi)藗儗ζ涑跏伎捶?,這種累積特性會(huì)對社交網(wǎng)絡(luò)中用戶的轉(zhuǎn)發(fā)行為產(chǎn)生影響。部分在線社交網(wǎng)絡(luò)上的實(shí)證研究[6]已經(jīng)驗(yàn)證的記憶效應(yīng)在社交網(wǎng)絡(luò)信息傳播過程中存在且具有規(guī)律性。
以往的傳播模型大都沒有考慮記憶效應(yīng)這種行為對傳播的影響或考慮不全面。本文中,將同時(shí)考慮傳播過程中的記憶效應(yīng)的興趣累積與時(shí)效衰減兩方面,還將兼顧社交網(wǎng)絡(luò)中用戶影響力,對在線社交網(wǎng)絡(luò)中的信息傳播行為進(jìn)行詳細(xì)的理論建模與數(shù)值仿真,有助于深入理解社交網(wǎng)絡(luò)中的傳播行為,為輿情研究提供理論基礎(chǔ)。
社交網(wǎng)絡(luò)中記憶效應(yīng)的研究最早來自于Centola的郵件推薦實(shí)驗(yàn)[5],Centola將1 528名的注冊用戶以匿名的方式分配到度相同的規(guī)則網(wǎng)絡(luò)(最近鄰耦合)與隨機(jī)網(wǎng)絡(luò)[7]中,每個(gè)用戶通過郵件的方式對鄰居用戶重復(fù)推薦一個(gè)健康社區(qū)網(wǎng)站,當(dāng)個(gè)體接收到多次郵件推薦后,則更有可能接收該郵件的推薦內(nèi)容并進(jìn)行轉(zhuǎn)發(fā)。而在此之前,傳統(tǒng)結(jié)論一般認(rèn)為具有短平均路徑的隨機(jī)網(wǎng)絡(luò)更有利于信息的傳播,但在線社交網(wǎng)絡(luò)存在記憶效應(yīng),與此同時(shí)還發(fā)現(xiàn)相比于平均路徑較短的隨機(jī)網(wǎng)絡(luò),具有高聚集系數(shù)的規(guī)則網(wǎng)絡(luò)更有利于行為的傳播與擴(kuò)散。
隨后,Romero等人[6]對大量Twitter數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分類,發(fā)現(xiàn)不同類型話題傳播過程中記憶效應(yīng)的的巔峰概率與接受信息次數(shù)的關(guān)聯(lián)關(guān)系。文獻(xiàn)[8]對海量新浪微博數(shù)據(jù)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)不同類型的微博在轉(zhuǎn)發(fā)過程中所表征出來的記憶效應(yīng)曲線存在差異,冗余的信息刺激可能會(huì)降低微博的轉(zhuǎn)發(fā)概率。Myers等人[9]認(rèn)為社交網(wǎng)絡(luò)用戶影響力可以近似擬合為一個(gè)與信息累積接受次數(shù)相關(guān)的曝光曲線(exposure curve)。文獻(xiàn)[10]建立了一個(gè)興趣積累的記憶效應(yīng)傳播模型,并討論該模型在小世界網(wǎng)絡(luò)上的傳播能力,但該模型只考慮了記憶效應(yīng)帶來的概率累積一種情況。
相對于之前的研究,本文將整合上述研究者的工作,探究符合記憶效應(yīng)規(guī)律的信息傳播特征,借鑒傳染病模型,重新劃分社交網(wǎng)絡(luò)上節(jié)點(diǎn)的狀態(tài)集,給出傳播動(dòng)力學(xué)方程并在模擬網(wǎng)絡(luò)與真實(shí)網(wǎng)絡(luò)上進(jìn)行驗(yàn)證分析。
在線社交網(wǎng)絡(luò)中,用戶發(fā)布或分享的信息會(huì)傳遞給該用戶的好友,其好友會(huì)依據(jù)興趣程度、是否可信、新鮮程度以及傳播源的影響力等因素以一定概率對信息進(jìn)行轉(zhuǎn)發(fā)擴(kuò)散。然而信息多次累積會(huì)產(chǎn)生記憶效應(yīng),對用戶的轉(zhuǎn)發(fā)行為產(chǎn)生影響,研究中給出了2個(gè)過程的表征含義可分述如下。
(1)興趣累積。在社交網(wǎng)絡(luò)中,愛好、謠言以及一些信息真實(shí)性辨識度不高的信息在傳播過程中一般表現(xiàn)出興趣累積的記憶效應(yīng),即接收到同類信息刺激越多,用戶越易產(chǎn)生轉(zhuǎn)發(fā)行為。如圖1中所示“事件一”[8]的傳播概率隨著被推薦次數(shù)的累積而增加,近似呈現(xiàn)指數(shù)式遞增。
(2)時(shí)效衰減。即時(shí)性強(qiáng)的突發(fā)新聞,社交網(wǎng)絡(luò)用戶越少接觸,則轉(zhuǎn)發(fā)的意愿越強(qiáng)烈。若社交網(wǎng)絡(luò)用戶在某一時(shí)刻收到多次轉(zhuǎn)發(fā),則用戶的興趣度就會(huì)隨時(shí)間衰減,不易再產(chǎn)生轉(zhuǎn)發(fā)意圖。如圖1中即時(shí)性很強(qiáng)的新聞“事件二”[8],轉(zhuǎn)發(fā)該條微博的用戶一般初次收到就轉(zhuǎn)發(fā),隨接觸次數(shù)增多轉(zhuǎn)發(fā)概率便逐步遞減。
本節(jié)將首先提出一種涵蓋以上兩種記憶效應(yīng)表征的統(tǒng)一模型,兼具興趣累加與時(shí)效衰減兩種特點(diǎn)。該模型中,信息要經(jīng)過興趣累積過程,傳播概率在多次接觸后會(huì)達(dá)到峰值,而當(dāng)經(jīng)歷了時(shí)效衰減過程,傳播概率逐漸降低,概率函數(shù)性質(zhì)符合圖1中曝光度曲線。在此基礎(chǔ)上將在線社交網(wǎng)絡(luò)節(jié)點(diǎn)劃分為4種狀態(tài),其狀態(tài)間的轉(zhuǎn)移概率以及傳播過程如圖2所示。本節(jié)中涉及到的縮寫和符號的含義見表1。
圖1 新浪微博中信息傳播的記憶效應(yīng)
圖2 狀態(tài)轉(zhuǎn)移示意圖
表1 相關(guān)符號含義
Tab. 1 Related symbol meaning
符號(縮寫)含義G社交網(wǎng)絡(luò)拓?fù)銿整體拓?fù)潼c(diǎn)集E整體拓?fù)溥吋疨(x)收到信息第x次后轉(zhuǎn)發(fā)的概率α累積效應(yīng)峰值β傳播轉(zhuǎn)發(fā)過程中所能達(dá)到的巔峰概率ri節(jié)點(diǎn)i由傳播態(tài)轉(zhuǎn)為疲勞態(tài)的概率Ci節(jié)點(diǎn)i的個(gè)體影響力強(qiáng)度deg(i)節(jié)點(diǎn)i的度R終態(tài)時(shí)網(wǎng)絡(luò)中疲勞態(tài)的數(shù)量b影響力差異系數(shù)
社交網(wǎng)絡(luò)形式化描述為G=(V,E),其中G代表社交網(wǎng)絡(luò),V是點(diǎn)的集合,表示社交網(wǎng)絡(luò)上的用戶,E為邊的集合(無向邊),表示用戶間的好友關(guān)系。借鑒SIR模型的思想,將社交網(wǎng)絡(luò)中節(jié)點(diǎn)的類型拓展為4種狀態(tài),每一時(shí)間步,每一個(gè)體處于如下4種狀態(tài)之一:
(1)未知態(tài)U(Unknown)。不知道消息的人群,類似于SIR模型中的易感人群。
(2)積蓄態(tài)C(Cumulative)。用戶聽到了這個(gè)信息,但是由于不確定信息的準(zhǔn)確性或者已經(jīng)變得不感興趣而不愿意傳播。
(3)傳播態(tài)I(Infected)。個(gè)體確認(rèn)了該消息并將該信息擴(kuò)散給其鄰居。
(4)疲勞態(tài)R(Resistant)。個(gè)體傳播了信息后失去繼續(xù)傳播該類話題興趣的人群,相當(dāng)于SIR模型中的免疫態(tài)。
(1)傳播概率。假設(shè)積蓄態(tài)節(jié)點(diǎn)轉(zhuǎn)變?yōu)閭鞑B(tài)節(jié)點(diǎn)的概率服從如圖1所示的曝光度曲線,曲線方程定義如下:
(1)
其中,x為截止到t時(shí)刻,個(gè)體累計(jì)接收到的信息次數(shù),反映了信息傳播的記憶性特征;P(x)為用戶第x次接收到其鄰居轉(zhuǎn)發(fā)的信息后選擇轉(zhuǎn)發(fā)的概率;β∈(0,1]為該類型信息最流行時(shí)的傳播概率峰值,稱之為巔峰概率;α∈N*為P(x)=β時(shí)的轉(zhuǎn)發(fā)次數(shù),稱α為累積效應(yīng)峰值。
當(dāng)累積峰值α=1時(shí),所對應(yīng)的信息類型為具有時(shí)效衰減性質(zhì)的即時(shí)新聞,接觸次數(shù)越多用戶越易失去轉(zhuǎn)發(fā)興趣,傳播概率方程退化為式(2):
P(x)=βx·exp(1-x),
(2)
(2)恢復(fù)概率。社交網(wǎng)絡(luò)信息傳播過程中的另一個(gè)重要因素就是用戶影響力,影響力大的用戶發(fā)布的信息往往具有較長的持續(xù)時(shí)效。影響力越大,用戶對其鄰居施加的持續(xù)影響力越大,相對應(yīng)模型中傳播態(tài)變?yōu)槠趹B(tài)的時(shí)間就越長,其函數(shù)關(guān)系如式(3)所示:
ri=exp(-b·Ci),
(3)
其中,ri為節(jié)點(diǎn)i由傳播態(tài)變?yōu)槠趹B(tài)的轉(zhuǎn)移概率,b∈[0,)為影響力差異系數(shù),用于刻畫不同用戶節(jié)點(diǎn)間影響力差異程度。當(dāng)b=0時(shí),用戶間影響力不存在差異,ri=exp(0)=1,傳播態(tài)節(jié)點(diǎn)只對鄰居節(jié)點(diǎn)轉(zhuǎn)發(fā)一次信息便失效,每條邊只使用一次,類似于信息快速更新的微博網(wǎng)絡(luò)。Ci為節(jié)點(diǎn)i的影響力強(qiáng)度,這里研究采用直接反映社交網(wǎng)絡(luò)用戶人際關(guān)系的點(diǎn)度中心度(degree centrality)來表示節(jié)點(diǎn)直接影響力;deg(i)為節(jié)點(diǎn)i的度,則節(jié)點(diǎn)i的影響力強(qiáng)度如式(4)所示:
Ci=deg(i),
(4)
將式(3)帶入式(2)得:
ri=exp(-b·deg(i)).
(5)
模型中,假定傳播過程開始前網(wǎng)絡(luò)上所有節(jié)點(diǎn)均處于未知狀態(tài)。當(dāng)社交網(wǎng)絡(luò)上的用戶發(fā)布或轉(zhuǎn)發(fā)信息的同時(shí),會(huì)擴(kuò)散給其所有的好友,即隨機(jī)選取一個(gè)種子節(jié)點(diǎn),這個(gè)種子節(jié)點(diǎn)在每次給其所有的鄰居發(fā)送信息后都以ri的概率置為疲勞態(tài)。在每個(gè)時(shí)間步內(nèi),如果一個(gè)節(jié)點(diǎn)(未知態(tài)或積蓄態(tài))收到信息,都將立刻變?yōu)榉e蓄態(tài),并以概率P(x)變?yōu)閭鞑B(tài),這里x是指個(gè)體已經(jīng)接收到信息的次數(shù)。當(dāng)x≤α?xí)r,P(x)的值隨信息接收次數(shù)x的增加而單調(diào)遞增,并在x=α?xí)r達(dá)到最大。當(dāng)x>α?xí)r,P(x)的值隨信息接收次數(shù)x的增加而單調(diào)下降。因此,轉(zhuǎn)發(fā)概率的大小不僅依賴接收信息的次數(shù),也取決于信息本身的特性。如果一個(gè)節(jié)點(diǎn)在某個(gè)時(shí)間步內(nèi)轉(zhuǎn)變?yōu)閭鞑B(tài),就將在下一個(gè)時(shí)間步把信息發(fā)送給其所有的鄰居,同時(shí)以概率ri變?yōu)槠趹B(tài)。如果一個(gè)處在積蓄態(tài)的節(jié)點(diǎn),在當(dāng)前的時(shí)間步?jīng)]有接收到任何信號,無論已經(jīng)接受到信息的次數(shù)x為多大,都將不會(huì)發(fā)生任何狀態(tài)上的改變。詳細(xì)步驟如下。
輸入: 網(wǎng)絡(luò)拓?fù)銰=(V,E)、巔峰概率β、累積峰值α
輸出: 終態(tài)的疲勞態(tài)節(jié)點(diǎn)集R
Step1將所有N個(gè)節(jié)點(diǎn)初始化為未知態(tài)。
Step2從N個(gè)未知態(tài)節(jié)點(diǎn)中隨機(jī)選取一個(gè)節(jié)點(diǎn)置為傳播態(tài)。
Step3所有傳播態(tài)節(jié)點(diǎn)向其所有鄰居轉(zhuǎn)發(fā)消息,這些鄰居節(jié)點(diǎn)中處于未知態(tài)的節(jié)點(diǎn)變?yōu)榉e蓄態(tài),曝光度x=1;積蓄態(tài)個(gè)體曝光度x=x+1。
Step4檢查所有積蓄態(tài)節(jié)點(diǎn),若隨機(jī)數(shù)random[0,1]
Step5檢查所有傳播態(tài)節(jié)點(diǎn),若隨機(jī)數(shù)random[0,1] Step6循環(huán)Step 3~Step 5,直至網(wǎng)絡(luò)中不存在傳播態(tài)節(jié)點(diǎn)。 在線社交網(wǎng)絡(luò)中存在許多高聚集性的社區(qū),朋友圈等。社區(qū)內(nèi)部緊密相連,類似規(guī)則網(wǎng)絡(luò)。而不同的社區(qū)間又通過一些共享用戶隨機(jī)地鏈接在一起。這使得在線社交網(wǎng)絡(luò)兼具高聚集系數(shù)與短平均路徑。已有模型如BA模型[11]、WS模型[12]及一些拓展模型,這些模型雖然宏觀上表述了在線社交網(wǎng)絡(luò)的小世界現(xiàn)象與無標(biāo)度特性,但都不能完全表征在線社交網(wǎng)絡(luò)的拓?fù)涮卣鳌entola的電子郵件實(shí)驗(yàn)從宏觀的角度說明了相比于具有較短平均路徑的隨機(jī)網(wǎng)絡(luò),高聚集系數(shù)的規(guī)則網(wǎng)絡(luò)更有利于行為在人際社會(huì)中的傳播。為了驗(yàn)證這一結(jié)論,研究將首先在規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)兩種均勻網(wǎng)絡(luò)拓?fù)渖向?yàn)證本文模型的傳播演變過程。 此外,本文選取國內(nèi)較流行的大學(xué)生社交網(wǎng)絡(luò)人人網(wǎng)的用戶數(shù)據(jù)作為非均勻網(wǎng)絡(luò)數(shù)據(jù),該網(wǎng)絡(luò)上的節(jié)點(diǎn)為注冊用戶,用戶間的好友關(guān)系表示為邊。研究建立了一個(gè)基于網(wǎng)頁解析方式的爬蟲程序,首先選取多個(gè)同一所學(xué)校的用戶作為種子節(jié)點(diǎn),遞歸地爬取每個(gè)種子用戶的好友關(guān)系,及其好友的好友關(guān)系。然后將爬取得到的多個(gè)好友網(wǎng)絡(luò)進(jìn)行拼接與去重,并且對不屬于種子節(jié)點(diǎn)注冊學(xué)校的其它節(jié)點(diǎn)以及邊的關(guān)系進(jìn)行刪除,最終得到一個(gè)包含8 102個(gè)節(jié)點(diǎn)、45 776條邊的的最大聯(lián)通子圖。各網(wǎng)絡(luò)的拓?fù)鋮?shù)見表2。 表2 各網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù) 分別選取節(jié)點(diǎn)數(shù)N=8 000,平均度k=11的規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò),影響力差異系數(shù)b=0.2,迭代次數(shù)T=500。圖3中列出了隨著巔峰概率β取不同值時(shí),規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)上疲勞態(tài)節(jié)點(diǎn)的比例隨累積峰值α變化的情況,對每組數(shù)據(jù)的結(jié)果都是進(jìn)行500次獨(dú)立重復(fù)模擬求均值得到的。當(dāng)累積峰值α=1時(shí),對應(yīng)具有時(shí)效衰減類型記憶效應(yīng)的即時(shí)新聞,由圖3(a)~(c)可以看出,當(dāng)α=1,β取0.1,0.2,0.3時(shí),隨機(jī)網(wǎng)絡(luò)的R值均略大于規(guī)則網(wǎng)絡(luò),這是由于規(guī)則網(wǎng)絡(luò)的聚集性強(qiáng),時(shí)效衰減的效果更容易積累,阻礙了傳播。同時(shí),研究還可以觀察到,隨著峰值概率β的上升,規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)的擴(kuò)散規(guī)模均呈現(xiàn)增加趨勢。當(dāng)β=0.8時(shí),圖3(d)中規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)的傳播規(guī)模都幾乎覆蓋了全部節(jié)點(diǎn)。由此可以認(rèn)為,當(dāng)峰值概率的值上升到一定程度時(shí),聚集系數(shù)與平均路徑長度這兩個(gè)網(wǎng)絡(luò)拓?fù)涮卣饕巡荒茏笥倚畔⒌膫鞑ィ畔⒍紝U(kuò)散至全部網(wǎng)絡(luò)。 疲勞態(tài)節(jié)點(diǎn)密度差值比例與α的變化關(guān)系如圖4所示。由圖4可見,當(dāng)β=0.1,N=8 000,累積效應(yīng)峰值α>1時(shí),規(guī)則網(wǎng)絡(luò)的傳播范圍Rrandom均大于隨機(jī)網(wǎng)絡(luò)的傳播范圍Rregular。聯(lián)合圖3(a)進(jìn)一步分析可發(fā)現(xiàn),1<α<5時(shí),Rregular-Rrandom呈明顯遞增趨勢,規(guī)則的傳播優(yōu)勢更加明顯;當(dāng)5≤α≤10時(shí),Rregular-Rrandom呈現(xiàn)波動(dòng)性變化;當(dāng)α>10后,Rregular-Rrandom幾乎維持不變。 此外,可以從圖3中發(fā)現(xiàn),總是存在臨界值αc,使得當(dāng)1≤α<αc時(shí),Rrandom>Rregular;α>αc時(shí),則Rrandom≤Rregular。保持節(jié)點(diǎn)數(shù)量N=8 000不變,臨界值αc相對于巔峰概率β變化規(guī)律如圖5所示。 圖3 疲勞態(tài)節(jié)點(diǎn)最終密度隨累積峰值α變化的關(guān)系 圖4 疲勞態(tài)節(jié)點(diǎn)密度差值比例與α的變化關(guān)系 Fig. 4 The relationship between the ratio of the difference in fatigue state node density andα 圖5 臨界值αc隨巔峰概率β的變化關(guān)系 Fig. 5 The relationship between the critical valueαcand the peak probabilityβ 由圖5可以看出αc隨著β先增大后減小,當(dāng)β=0.3時(shí),maxαc=5。這說明當(dāng)記憶效應(yīng)呈現(xiàn)出興趣累積特征時(shí),若這種特征不明顯,隨機(jī)網(wǎng)絡(luò)也有可能比規(guī)則網(wǎng)絡(luò)更適合傳播,而Centola的規(guī)則網(wǎng)絡(luò)優(yōu)于隨機(jī)網(wǎng)絡(luò)的結(jié)論在這種場景下并不適用。 除了傳播過程中的巔峰概率α與累積效應(yīng)峰值β外,另一個(gè)重要的影響因素是網(wǎng)絡(luò)的規(guī)模N。研究中保持巔峰概率β=0.1,網(wǎng)絡(luò)平均度k=11不變,在100~8 000間不同網(wǎng)絡(luò)規(guī)模N上分別對α=1,α=10,α=20這三種取值進(jìn)行實(shí)驗(yàn)?zāi)M。如圖6所示。研究分析發(fā)現(xiàn)當(dāng)N≤500時(shí),隨機(jī)網(wǎng)絡(luò)總是優(yōu)于規(guī)則網(wǎng)絡(luò)。這是由于規(guī)模小的網(wǎng)絡(luò),節(jié)點(diǎn)彼此間收到信息次數(shù)差異不明顯。而在網(wǎng)絡(luò)規(guī)模N>500后,α=10與α=20對應(yīng)的曲線總體上都呈現(xiàn)上升趨勢。這是因?yàn)榫W(wǎng)絡(luò)規(guī)模N上升,隨機(jī)網(wǎng)絡(luò)的聚集系數(shù) 在線社交網(wǎng)絡(luò)的度分布是不均勻的,分別選取人人網(wǎng)數(shù)據(jù)集中度最大的節(jié)點(diǎn)kmax=221與度最小的節(jié)點(diǎn)kmin=1為初始傳播節(jié)點(diǎn)。當(dāng)α=1,N=8 102時(shí),在線社交網(wǎng)絡(luò)中處于疲勞態(tài)R的節(jié)點(diǎn)占總數(shù)量N的比值隨時(shí)間變化情況用R(t)/N表示,如圖7所示??梢园l(fā)現(xiàn),網(wǎng)絡(luò)規(guī)模均為N=8 102時(shí),在線社交網(wǎng)絡(luò)上的信息傳播速度要快于隨機(jī)網(wǎng)絡(luò)與規(guī)則網(wǎng)絡(luò),這是由于社交網(wǎng)絡(luò)中存在一些度較大的節(jié)點(diǎn),使信息得以快速擴(kuò)散。還可以發(fā)現(xiàn),初始節(jié)點(diǎn)的選擇對信息傳播的規(guī)模存在影響,度較大則達(dá)到的最終傳播規(guī)模更大,但這種規(guī)模并沒有超越隨機(jī)網(wǎng)絡(luò),而是介于隨機(jī)網(wǎng)絡(luò)與規(guī)則網(wǎng)絡(luò)之間,這說明在聚集系數(shù)低的隨機(jī)網(wǎng)絡(luò)上記憶效應(yīng)更不容易累積。 圖6 疲勞態(tài)節(jié)點(diǎn)數(shù)量差值比例與網(wǎng)絡(luò)規(guī)模的關(guān)系 Fig. 6 Relationship between the ratio of the difference of fatigue state nodes number and the network scale 圖7 初始節(jié)點(diǎn)度最大與度最小情況下的傳播情況 Fig. 7 Propagation of the maximum degree and the minimum degree of initial node 本文首先討論了在線社交網(wǎng)絡(luò)上信息傳播的記憶效應(yīng),及其不同表征過程。然后針對社交網(wǎng)絡(luò)上傳播行為的記憶效應(yīng)與個(gè)體影響力對傳統(tǒng)傳染病模型進(jìn)行改進(jìn),并在此基礎(chǔ)上設(shè)計(jì)提出了基于記憶效應(yīng)的在線社交網(wǎng)絡(luò)傳播模型。再由模擬網(wǎng)絡(luò)與人人網(wǎng)數(shù)據(jù)集合搭建的實(shí)驗(yàn)網(wǎng)絡(luò)中對信息傳播進(jìn)行仿真,實(shí)驗(yàn)結(jié)果表明,該模型能夠表征在線社交網(wǎng)絡(luò)的傳播特性,并且信息在不同結(jié)構(gòu)網(wǎng)絡(luò)上的傳播效果存在差異,對此可表述如下。 (1)具有時(shí)效衰減特征的信息在隨機(jī)網(wǎng)絡(luò)上進(jìn)行傳播更廣,拓展了Centola的實(shí)驗(yàn)結(jié)論。 (2)謠言、愛好等具有興趣累加類型記憶效應(yīng)的信息更容易在規(guī)模較大規(guī)則網(wǎng)絡(luò)上傳播,如學(xué)校的在線社區(qū),且這種趨勢會(huì)隨著網(wǎng)絡(luò)規(guī)模與累積峰值的增大而更加顯著。 本文研發(fā)提出的模型針對的是單一信息的獨(dú)立傳播,而真實(shí)社交網(wǎng)絡(luò)中信息是多種類且并行傳播的,會(huì)產(chǎn)生互相影響,從而與獨(dú)立信息的傳播規(guī)律不同。研究多信息傳播的規(guī)律并建立驗(yàn)證模型將是今后的研究方向。3 仿真實(shí)驗(yàn)
3.1 數(shù)據(jù)集
3.2 仿真結(jié)果
4 結(jié)束語