鄭 蕾, 李生紅
(上海交通大學(xué) 電子信息與電氣工程學(xué)院,上海 200240)
微博,是一種基于用戶關(guān)系的信息分享,傳播以及獲取的平臺(tái),用戶通過(guò) WEB,WAP以及各種客戶端組件便能隨時(shí)隨地地實(shí)現(xiàn)信息的更新和即時(shí)分享。與BBS和博客不同的是,微博用戶可以不受時(shí)間空間的限制,持續(xù)不斷地對(duì)某條信息作出評(píng)論和轉(zhuǎn)發(fā),使得該信息可能在極短時(shí)間內(nèi)以“核裂變”的方式被成百上千的用戶轉(zhuǎn)發(fā),從而演化成引起輿論關(guān)注的社會(huì)新聞事件,例如,直播玉樹(shù)大地震,“我爸是李剛”,唐俊“學(xué)歷門(mén)”事件等。在微博網(wǎng)絡(luò)上,信息的傳播速度,廣度和效率都得到了極大提高,但這無(wú)疑也為一些帶有敏感字眼的失實(shí)消息(如“無(wú)償獻(xiàn)血被紅十字以一袋 200元賣(mài)給醫(yī)院”)在微博上的傳播創(chuàng)造了更有利的條件。因此,研究信息(輿論)在微博網(wǎng)絡(luò)上的傳播及其傳播的性質(zhì) 、規(guī)律等,進(jìn)而研究如何控制 、引導(dǎo)輿論,具有非常重要的理論價(jià)值和現(xiàn)實(shí)意義。
現(xiàn)有的文獻(xiàn)大多從單一的角度來(lái)研究人際網(wǎng)絡(luò)上的信息傳播,如,信息傳播所在網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)[1-3],個(gè)體相互作用規(guī)則[4-7]。但實(shí)際中信息(輿論)的傳播與形成是一個(gè)典型的復(fù)雜系統(tǒng)的演化過(guò)程,需要將個(gè)體的相互作用和網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行綜合考慮才能更準(zhǔn)確地描述信息在網(wǎng)絡(luò)中的傳播。文中在基于信息在微博網(wǎng)絡(luò)上的傳播規(guī)則,并結(jié)合微博網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)對(duì)傳播行為的影響,初步建立了微博網(wǎng)絡(luò)中信息傳播的隨機(jī)演化仿真模型。
在微博網(wǎng)絡(luò)中,入度越大,說(shuō)明關(guān)注的用戶越多,信息來(lái)源越豐富,而出度越大,說(shuō)明關(guān)注自己的人越多,影響力越大。早在20世紀(jì)40年代,拉扎斯菲爾德等人在《人民的選擇》中提出了“意見(jiàn)領(lǐng)袖”的概念,所謂意見(jiàn)領(lǐng)袖,維基百科是這樣描述的,在人際傳播網(wǎng)中經(jīng)常為他人提供信息,同時(shí)對(duì)他人施加影響的“活躍分子”,他們?cè)诖蟊妭鞑バЧ男纬蛇^(guò)程中起著重要的中介或過(guò)濾的作用。通常而言,大部分微博用戶的粉絲一般是幾十至幾百的數(shù)量級(jí),而少數(shù)用戶的粉絲超過(guò)上千乃至上萬(wàn),稱(chēng)其為明星用戶(意見(jiàn)領(lǐng)袖)。文中基于提出的信息傳播模型,探討了明星用戶和小級(jí)別用戶在微博網(wǎng)絡(luò)信息擴(kuò)散中扮演的角色,通過(guò)仿真實(shí)驗(yàn),得到了一些有趣的發(fā)現(xiàn)。
微博的每個(gè)用戶通常都擁有一定數(shù)量的“粉絲”(跟隨者),其發(fā)布的信息會(huì)以廣播的形式通知每個(gè)“粉絲”,從而受到關(guān)注甚至轉(zhuǎn)發(fā)。以新浪微博為例,它具有4大功能模塊:發(fā)布功能,轉(zhuǎn)發(fā)功能,關(guān)注功能及評(píng)論功能。發(fā)布功能,用戶可以隨時(shí)隨地發(fā)布消息;轉(zhuǎn)發(fā)功能,用戶可以把自己喜歡的消息一鍵轉(zhuǎn)發(fā)到自己的微博,在轉(zhuǎn)發(fā)過(guò)程中原帖內(nèi)容不會(huì)被篡改,且轉(zhuǎn)發(fā)記錄會(huì)以“//@用戶名”的方式保留轉(zhuǎn)發(fā)路徑;關(guān)注功能,用戶u可以對(duì)自己喜歡的用戶v進(jìn)行關(guān)注,成為用戶v的“粉絲”,這一行為不需要得到受關(guān)注用戶的同意,之后用戶 v更新的所有消息便會(huì)同步出現(xiàn)在用戶u的微博首頁(yè)上;評(píng)論功能,用戶可以對(duì)任何一條微博進(jìn)行評(píng)論。由此,消息I在微博網(wǎng)絡(luò)上的傳播過(guò)程可以簡(jiǎn)述如下:
1)用戶u發(fā)布消息I,消息的形式可能是一句話,一張照片等。
2)u的粉絲可通過(guò)個(gè)人首頁(yè)上系統(tǒng)的新鮮消息提醒和主動(dòng)訪問(wèn)u的微博頁(yè)面這兩種途徑來(lái)獲知消息 I。
3)對(duì)消息I感興趣的粉絲v可能會(huì)對(duì)該消息進(jìn)行評(píng)論,收藏和轉(zhuǎn)發(fā),從而將信息I進(jìn)行再次傳播。
4)如此重復(fù)過(guò)程2)和3)。
將微博網(wǎng)絡(luò)中的信息傳播機(jī)制和網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)相結(jié)合,提出一種基于微博網(wǎng)絡(luò)的信息傳播模型IDM (α, β) , 其中α∈[0,1]表示消息的敏感度,其值是由消息的來(lái)源,內(nèi)容及表現(xiàn)形式?jīng)Q定的;β∈{-1,0,1}是模型的另一個(gè)參數(shù),用來(lái)決定選擇轉(zhuǎn)發(fā)信息的節(jié)點(diǎn)的方式。在這個(gè)模型中,網(wǎng)絡(luò)中的節(jié)點(diǎn)只可能處于3種狀態(tài),一是未激活狀態(tài),即不知道消息I,記為S0,二是被消息I激活但選擇不作為狀態(tài),記為S1,三是被消息I激活后對(duì)消息進(jìn)行轉(zhuǎn)發(fā)的狀態(tài),記為S2。時(shí)間步序列是一個(gè)離散的等間隔(如,5 min)時(shí)間序列。模型定義如下:
1)初始時(shí)刻,將網(wǎng)絡(luò)中所有節(jié)點(diǎn)的狀態(tài)初始化為S0。在時(shí)間步T=0,隨機(jī)選擇一個(gè)節(jié)點(diǎn)v作為發(fā)布消息I的源節(jié)點(diǎn)。節(jié)點(diǎn)v的出度是dout_v。
2)在時(shí)間步T=T+1,關(guān)注節(jié)點(diǎn)v的dout_v個(gè)節(jié)點(diǎn)被激活,其中轉(zhuǎn)發(fā)消息 I的節(jié)點(diǎn)數(shù)量為M( M≤dout_v),M計(jì)算如下:設(shè)PT是時(shí)間步 T內(nèi)選擇轉(zhuǎn)發(fā)的節(jié)點(diǎn)的集合,即PT={uj}, 其中uj的狀態(tài)為S2。
3)對(duì)關(guān)注節(jié)點(diǎn) v且不屬于集合PT-1的n( n≤dout_v)個(gè)節(jié)點(diǎn)的出度進(jìn)行排序,按照從小到大的順序記為Q={u_(1),u(2),…,u( dout_v )}。若β=1,順序選擇序列Q中前M個(gè)節(jié)點(diǎn),將它們狀態(tài)設(shè)為S2,放入集合PT+1;若β=-1,順序選擇序列Q最后M個(gè)節(jié)點(diǎn),將它們狀態(tài)設(shè)為S2,放入集合PT+1; 若β=0,從序列Q中隨機(jī)選出M個(gè)節(jié)點(diǎn),將它們狀態(tài)設(shè)為S2,放入集合PT+1。將節(jié)點(diǎn)v從集合PT中刪去。
4)對(duì)每一個(gè)節(jié)點(diǎn)v∈PT遞歸執(zhí)行2)和3),直到集合PT為空。
由式(1)可知,微博網(wǎng)絡(luò)中節(jié)點(diǎn)v對(duì)消息傳播的貢獻(xiàn)是與它的出度及消息的敏感度成正比的,這與現(xiàn)實(shí)情況中用戶的粉絲越多,其發(fā)布(轉(zhuǎn)發(fā))的消息被進(jìn)一步轉(zhuǎn)發(fā)的可能性就越大及消息的敏感度越高,吸引力越大,其轉(zhuǎn)發(fā)率越大是吻合的。在該模型中,利用參數(shù)β來(lái)選擇節(jié)點(diǎn)v的“粉絲”節(jié)點(diǎn)中會(huì)進(jìn)一步轉(zhuǎn)發(fā)消息I的節(jié)點(diǎn),當(dāng)β=-1時(shí),選擇出度小的節(jié)點(diǎn)對(duì)信息進(jìn)行轉(zhuǎn)發(fā),當(dāng)β=1時(shí),選擇出度大的節(jié)點(diǎn)對(duì)信息進(jìn)行轉(zhuǎn)發(fā),當(dāng)β=0時(shí),隨機(jī)選擇出轉(zhuǎn)發(fā)節(jié)點(diǎn)。
現(xiàn)利用自動(dòng)搜索程序,獲得了新浪微博網(wǎng)絡(luò)的一個(gè)子網(wǎng)絡(luò),該網(wǎng)絡(luò)是個(gè)有向圖,記為G=(V, E),其中節(jié)點(diǎn)v∈V表示一個(gè)微博ID,有向邊(u, v)∈E表示用戶v是用戶u的粉絲, 信息從u流向v。所獲取的子圖的節(jié)點(diǎn)數(shù)N=62 668,平均入度din_mean=248.12, 平均出度dout_mean=329.49。 累積出度的分布如圖1所示,p表示出度值。
圖2顯示的是信息敏感度取不同值時(shí),采取不同的轉(zhuǎn)發(fā)節(jié)點(diǎn)選擇策略,信息在網(wǎng)絡(luò)上的擴(kuò)散面積和擴(kuò)散耗時(shí)的比較,圖2中空心點(diǎn),倒三角,叉分別代表β取1,0,-1時(shí)信息在網(wǎng)絡(luò)中的擴(kuò)散比例,每一條曲線是通過(guò)對(duì)每對(duì)參數(shù) 50次仿真結(jié)果的統(tǒng)計(jì)平均得到的。從圖2可以看出當(dāng)信息敏感度較小時(shí),明星用戶在信息傳播過(guò)程中扮演著意見(jiàn)領(lǐng)袖的角色,對(duì)輿論的傳播起著絕對(duì)的推動(dòng)作用;但當(dāng)信息敏感度大于某一臨界值后,明星用戶對(duì)提高信息傳播速度、擴(kuò)大信息傳播面積的作用逐漸減??;當(dāng)信息敏感度趨于1時(shí),明星用戶在信息傳播中的優(yōu)勢(shì)趨于0。
圖1 累積出度分布
圖2 信息擴(kuò)散密度隨時(shí)間的演化
微博網(wǎng)絡(luò)是復(fù)雜網(wǎng)絡(luò)在實(shí)際人際網(wǎng)絡(luò)的一個(gè)實(shí)例,文中初步構(gòu)建了一個(gè)基于微博網(wǎng)絡(luò)的信息傳播模型,該模型準(zhǔn)確描述了微博網(wǎng)絡(luò)中信息傳播的基本特點(diǎn),以及輿論演化過(guò)程中每次節(jié)點(diǎn)的選取、節(jié)點(diǎn)策略的轉(zhuǎn)移。通過(guò)在新浪微博的拓?fù)渥泳W(wǎng)上進(jìn)行仿真,得到如下結(jié)論:明星用戶在信息擴(kuò)散的過(guò)程中起著著意見(jiàn)領(lǐng)袖的作用,但當(dāng)信息敏感度大于某一臨界值后,明星用戶對(duì)提高信息傳播速度、擴(kuò)大信息傳播面積的作用逐漸減小,當(dāng)信息敏感度趨于1時(shí),明星用戶在信息傳播中的優(yōu)勢(shì)趨于0。由于輿論傳播過(guò)程中存在著許多會(huì)影響傳播過(guò)程的不確定因素,因此該模型還有很大的改善空間,例如,信息敏感度的劃分需要更多的實(shí)證研究來(lái)支持。相信隨著這方面研究的深入,復(fù)雜網(wǎng)絡(luò)中的信息傳播機(jī)制會(huì)越來(lái)越得到重視,進(jìn)而更好的提升網(wǎng)絡(luò)空間的文明度和保障人們對(duì)網(wǎng)絡(luò)安全的需求。
[1] JAEWON Y, LESKOVEC J. Modeling Information Diffusion in Implicit Networks[C]//IEEE.2010 IEEE 10thInternational Conference on Data Mining.Berlin,Germany: IEEE,2010:599-608.
[2] GOLDENBERG J, LIBAI B, MOLDOVAN S, et al. The NPV of Bad News[J].International Journal of Research in Marketing,2007,24(03):186-200.
[3] LAHIRI M, CEBRIN M. The Genetic Algorithm as a General Diffusion Model for Social Networks[C]//The 24th AAAI Conference on Artificial Intelligence.Atlanta,Georigia,USA:[s.n.],2010:76-81.
[4] SAITO K, KIMURA M, OHARA K, et al. Learning Continuous Time Information Diffusion Model for Social Behavioral Data Analysis[J]. Advances in Machine Learning, Springer,2009(5828): 322-337.
[5] 惠彥濤,吳靜. 互補(bǔ)結(jié)構(gòu)網(wǎng)絡(luò)建模與統(tǒng)計(jì)特性分析[J].通信技術(shù),2011,44(05): 94-96.
[6] HADDADI H, BENEVENUTO F, GUMMADI K P. Measuring User Influence in Twitter: The Million Follower Fallacy[C]// Proceedings of International AAAI Conference on Weblogs and Social. Washington,DC:ICWSM,2010:97-105.
[7] BHARATHI S, DAVID K, MAYHAR S. Competitive Influence Maximization in Social Networks Internet and Network Economics[J]. Springer, 2007(2315):306-311.