簡國明,李冬梅,李少勇,周碧江
(韶關(guān)學院數(shù)學與統(tǒng)計學院,廣東韶關(guān)512005)
?
微博用戶及消息的影響力研究與建模
簡國明,李冬梅,李少勇,周碧江
(韶關(guān)學院數(shù)學與統(tǒng)計學院,廣東韶關(guān)512005)
摘要:考慮某微博群體中的微博用戶及微博消息影響力問題,以微博用戶為頂點,建立了用戶關(guān)注關(guān)系的頂點賦權(quán)有向圖模型;通過討論用戶的粉絲數(shù)、入鄰點集的關(guān)注強度、發(fā)布或轉(zhuǎn)發(fā)消息數(shù)等因素,定義了大V的各影響因子,并利用層次分析法中確定權(quán)向量的辦法,得到了微博用戶影響力模型;討論了微博消息被轉(zhuǎn)的用戶總影響力、消息被發(fā)布或轉(zhuǎn)發(fā)用戶數(shù)和消息被瀏覽次數(shù)等影響因素,通過消息影響力權(quán)重向量的確定,得到了微博消息影響力模型;對南京師范大學2014年數(shù)學建模競賽題的實例數(shù)據(jù)進行了驗證與求解,得到了微博用戶影響力最大的十個大V及最具影響力的前十則消息。
關(guān)鍵詞:微博;影響因子;權(quán)重;用戶影響力;消息影響力
微博,作為一個新的傳播交流平臺,以其簡單快捷的操作方式、隨時隨地發(fā)布信息的互動形式,在各類網(wǎng)絡社交服務中獨樹一幟,在新聞傳播、信息交流、用戶行為分析等領(lǐng)域都具有廣闊的應用前景??紤]某微博有N個(如N=10 000)用戶群體,已知每個用戶關(guān)注其他用戶的關(guān)注數(shù)據(jù);同時已知每個用戶發(fā)布或轉(zhuǎn)發(fā)的具體消息數(shù)據(jù),消息總數(shù)為M個(如M=500)[1-3]。
在微博群體中,有些用戶受到的關(guān)注度很高,被稱為大V,這些大V發(fā)的微博受到的關(guān)注和轉(zhuǎn)發(fā)遠高于一般的微博,因此,大V的影響力很大。試對大V用戶定義合適的影響因子,并且找出用戶影響力最大的10個大V;某些微博消息,被大量的用戶關(guān)注和轉(zhuǎn)發(fā),因而具有很大的影響,試找出前10個最具有影響力的消息。
對于有N個用戶的微博群體,以每個微博用戶作為頂點,若微博用戶A關(guān)注微博用戶B,則A到B連一條有向邊,得到一個有向圖D(V,E),其中V是頂點集,E是有向邊集。此有向圖D(V,E)是微博用戶群體的關(guān)注(關(guān)系)有向圖。頂點A的出度d+(A)就是對應用戶A的關(guān)注數(shù),而頂點B的入度d-(B)就是對應用戶B的被關(guān)注數(shù)[4]。將每個微博用戶發(fā)布或轉(zhuǎn)發(fā)消息數(shù)視為頂點的權(quán),從而得到頂點賦權(quán)有向圖,如圖1所示。
圖1 頂點賦權(quán)有向圖D(V,E)
假設:s(i)為用戶i發(fā)布或轉(zhuǎn)發(fā)消息數(shù);Q(i)為用戶i的粉絲集合(即頂點的入鄰點集)。由于微博用戶i的影響力與該用戶的粉絲數(shù)、入鄰點集的關(guān)注強度、發(fā)布或轉(zhuǎn)發(fā)消息數(shù)有關(guān),則定義如下微博用戶i的各影響因子(也是大V的影響因子)。
這里各影響因子均采取與該量的各用戶之和進行比較,也就相當于各影響因子進行總量歸一化,P1(i)≤1,P2(i)≤1,P3(i)≤1。
現(xiàn)定義微博用戶i的影響力模型為
其中λ1≥0,λ2≥0,λ3≥0,λ1+λ2+λ3=1。權(quán)重因子λ1,λ2,λ3可采用層次分析法中確定權(quán)向量的辦法進行。通過將用戶的粉絲數(shù)、入鄰點集的關(guān)注強度、發(fā)布或轉(zhuǎn)發(fā)消息數(shù)等三個因素兩兩比較,得到如下成對比較矩陣A[5]
運用Matlab編程[6],求A的最大特征根及對應的特征向量,經(jīng)計算此處成對比較矩陣A具有一致性,得到三個影響因素對用戶i的影響力權(quán)重向量值為
在微博群體中某些消息被大量的用戶關(guān)注和轉(zhuǎn)發(fā),因而具有很大的影響,即消息被轉(zhuǎn)發(fā)或關(guān)注越多,其影響力就越大,消息的影響力與轉(zhuǎn)發(fā)數(shù)和消息被瀏覽的次數(shù)相關(guān)。其次,發(fā)布或者轉(zhuǎn)發(fā)消息的用戶的自身影響力也對消息的影響力存在一定的影響。微博消息的影響力與微博消息被轉(zhuǎn)的用戶總影響力、消息被發(fā)布或轉(zhuǎn)發(fā)用戶數(shù)和消息被瀏覽次數(shù)等有關(guān)。
其中η1≥0,η2≥0,η3≥0,η1+η2+η3=1。這里采用層次分析法中確定權(quán)向量的辦法進行,通過將微博消息被轉(zhuǎn)的用戶總影響力、消息被發(fā)布或轉(zhuǎn)發(fā)用戶數(shù)和消息被瀏覽次數(shù)等三個因素兩兩比較,得到如下成對比較矩陣B
運用編程Matlab,求B的最大特征根及對應的特征向量,經(jīng)計算此處成對比較矩陣B具有一致性,得到三個影響因素對微博消息i的影響力權(quán)重向量值為
5.1數(shù)據(jù)處理
本文采用南京師范大學2014年數(shù)學建模競賽題的相關(guān)數(shù)據(jù),數(shù)據(jù)文件data1.xls包含了10 000個用戶的相互關(guān)注數(shù)據(jù),每一行為該行號對應的用戶對其他用戶的關(guān)注信息;數(shù)據(jù)文件data2.xls為500條消息數(shù)據(jù),每一行為用戶發(fā)布或轉(zhuǎn)發(fā)的消息編號。
5.2求解結(jié)果
在各個用戶間短時間內(nèi)沒有添加新的關(guān)注和取消舊的關(guān)注以及用戶間不存在虛假粉絲(指花錢就可以買到“關(guān)注”,有名無實的微博粉絲,它們通常是由系統(tǒng)自動產(chǎn)生的惡意注冊用戶)的情況下,分別利用多因素加權(quán)算法對收集到的各微博用戶進行影響力計算,最終得到微博用戶的影響力排名結(jié)果,如表1所示。
表1 影響力排名前十的用戶
在不考慮多次轉(zhuǎn)發(fā)情況以及一個用戶發(fā)布或轉(zhuǎn)發(fā)微博消息,其粉絲一定能看到的情況下,通過對收集到各微博消息進行處理,根據(jù)上述的公式,求解得到各消息的影響力,影響力排名前十的消息編號如表2所示。
表2 影響力排名前十的消息編號
由于本文所研究的問題涉及數(shù)據(jù)很大,數(shù)量級上有較大差異,因此在數(shù)據(jù)預處理方面,都先將數(shù)據(jù)進行了總量歸一化、最大值歸一化,從而盡可能減少數(shù)量級差異大對結(jié)果產(chǎn)生的影響,使數(shù)據(jù)更具可信性;本文定義了影響因子,在公眾人物建立公眾形象以及如何提升個人影響力方面起了一定的作用,對社會的穩(wěn)定發(fā)展也起了一定的作用;針對微博用戶影響力、消息影響力等問題,考慮了用戶的粉絲數(shù)、微博發(fā)布或轉(zhuǎn)發(fā)數(shù)以及用戶關(guān)注數(shù)等,并在建立模型時采用了層次分析法中成對比較陣方法確定權(quán)向量。本研究在信息傳播、電子商務、網(wǎng)絡營銷、網(wǎng)絡代購等領(lǐng)域有一定的應用價值和借鑒作用。
參考文獻:
[1]朱文俊,張寧,聶雨薇.基于圖論的微博消息傳播對微博影響力的研究[J].現(xiàn)代商業(yè),2015(17)∶267-269.
[2]原福永,馮靜,符茜茜.微博用戶的影響力指數(shù)模型[J].情報分析與研究,2012,220(6)∶60-64.
[3]王琛,陳庶樵.一種改進的微博用戶影響力評價算法[J].信息工程大學學報,2013,14(3)∶380-384.
[4]徐俊明.圖論及其應用[M].合肥∶中國科學技術(shù)大學出版社,1998.
[5]韓中庚.數(shù)學建模及其應用[M].北京∶高等教育出版社,2005.
[6]薛山. MATLAB基礎(chǔ)教程[M].北京∶清華大學出版社,2011.
【責任編輯:王桂珍foshanwgzh@163.com】
Impact study and modeling of micro-blog users and messages
JIAN Guo-ming,LI Dong-mei,LI Shao-yong,ZHOU Bi-jiang
(School of Mathematics and Information Science,Shaoguan University,Shaoguan 512005,China)
Abstract∶Considering the influence of micro-blog users and micro-blogging news of a micro-blogging group,with micro-blogging users as the vertex,the vertex weighted directed graph model of the relationship between user concerns is established;Through the discussion of the user number of fans,the neighbor set of attention intensity,published or forwarded message factors,the impact factor V is defined,then using the AHP method to determine weight vector method,the influence of micro blogging users model is obtained;the total influence of users of Twitter to be turned,news to be released or forwarding of the number of users and the news was browsing the number of influencing factors are discussed;By determining the weight vectors,the news influence of micro-blogging model is obtained;In addition,the instance data of Nanjing Normal University in 2014 of math modeling contest was verified and solved,and ten big V micro-blogging influential users and the top ten most influential news were obtained.
Key words∶micro-blog;impact factor;the weight;user influence;news influence
中圖分類號:G206
文獻標志碼:A
文章編號:1008-0171(2016)03-0001-04
收稿日期:2016-03-11
基金項目:廣東大學生科技創(chuàng)新培育專項資金(pdjh2015b0477);廣東省本科高校教學質(zhì)量與教學改革工程項目(〔2014〕97號)
作者簡介:簡國明(1958-),男,江西南昌人,韶關(guān)學院教授。