国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

興趣、習(xí)慣、交互三重驅(qū)動的微博用戶動力學(xué)模型

2015-04-18 09:43:54趙金樓成俊會劉家國
關(guān)鍵詞:冪指數(shù)冪律間隔

趙金樓,成俊會,2,劉家國

(1.哈爾濱工程大學(xué) 經(jīng)濟管理學(xué)院,黑龍江 哈爾濱 150001; 2.海南大學(xué) 經(jīng)濟與管理學(xué)院,海南 ???570228)

興趣、習(xí)慣、交互三重驅(qū)動的微博用戶動力學(xué)模型

趙金樓1,成俊會1,2,劉家國1

(1.哈爾濱工程大學(xué) 經(jīng)濟管理學(xué)院,黑龍江 哈爾濱 150001; 2.海南大學(xué) 經(jīng)濟與管理學(xué)院,海南 ???570228)

針對微博用戶行為問題,采集Sina微博實證數(shù)據(jù)分析了不同情境下的微博用戶行為特征。分析結(jié)果表明:微博用戶的發(fā)布行為存在周期性和陣發(fā)性,用戶發(fā)布微博的時間間隔服從冪律分布,且冪指數(shù)與用戶活躍性呈正相關(guān)關(guān)系,同時用戶之間的交互能夠進一步激發(fā)用戶的發(fā)布行為。在此基礎(chǔ)上,構(gòu)建了興趣、習(xí)慣、交互三重驅(qū)動模式下的用戶行為動力學(xué)模型,通過數(shù)學(xué)推導(dǎo)可知,該模型能夠獲得冪指數(shù)為參數(shù)可調(diào)的冪律分布,且模型仿真結(jié)果與實證數(shù)據(jù)分析結(jié)果相吻合。

時間間隔分布;興趣;習(xí)慣;交互;行為動力學(xué);微博;動力學(xué)模型

人類行為動力學(xué)一直是社會學(xué)研究中的重要內(nèi)容。以往的研究中常常將人類行為泛化為一種泊松過程,這種假設(shè)的必然推論是人類相鄰行為的時間間隔是比較均勻的,較大的時間間隔所占比重很小。然而隨著大規(guī)模數(shù)據(jù)采集技術(shù)的不斷發(fā)展,大量實證數(shù)據(jù)顯示人類相鄰行為的時間間隔特征呈現(xiàn)出非泊松現(xiàn)象,其中涵蓋了電子郵件的發(fā)送和回復(fù)時間[1-3]、手機通話和短信息接收回復(fù)[4-6]、在線電影的點播[7]、網(wǎng)頁搜索和網(wǎng)頁訪問[8-9]、社交網(wǎng)絡(luò)(博客、微博等)的使用[10-12]等各方面數(shù)據(jù)。這些實證數(shù)據(jù)的出現(xiàn),揭示了人類行為的非泊松特性,并具有短期內(nèi)頻繁發(fā)生、長期靜默的規(guī)律性,研究者們將這種人類行為模式所產(chǎn)生的時間間隔用冪律分布刻畫,且伴有衰減緩慢的胖尾特征。

為了解讀人類行為的這種非泊松現(xiàn)象,Barabási[1]提出了一種具有優(yōu)先選擇機制的排隊論觀點。他認為,高優(yōu)先權(quán)的任務(wù)被優(yōu)先選擇。文獻[13]則認為人們在處理排隊中的任務(wù)時,會按照已形成的處理習(xí)慣執(zhí)行。排隊論和隨機過程的引入很好的解釋了任務(wù)型行為,然而卻并不適用網(wǎng)頁瀏覽、游戲、社交網(wǎng)絡(luò)使用等非任務(wù)驅(qū)動行為。因此另有學(xué)者從用戶興趣和記憶等視角去解釋人類行為。文獻[14-15]指出人類行為存在周期性的根源在于興趣的改變,并據(jù)此構(gòu)建了興趣遞減的行為動力學(xué)模型。文獻[16]則在文獻[14]的基礎(chǔ)上,研究了興趣和社會認同雙驅(qū)動模式下的微博客用戶行為。文獻[17]則認為人類記憶對行為具有重要影響,并按照記憶中的活動速率對將來的活動進行增速或減速。文獻[18-19]則對190多篇不同領(lǐng)域的人類行為時間和空間的特征統(tǒng)計和建模文獻進行了綜述。

事實上,自2006年“twitter”誕生以來,其方便快捷的個性化信息傳播方式就引發(fā)了一場新的互聯(lián)網(wǎng)革命。目前,微博已成為人們生活中必不可少的社交工具和信息交流平臺,這就意味著多數(shù)微博用戶已形成了相對穩(wěn)定的行為習(xí)慣。而現(xiàn)有的模型往往忽略了用戶習(xí)慣對行為的影響。作為現(xiàn)有研究的補充和延伸,本文在統(tǒng)計分析微博用戶行為特征的基礎(chǔ)上構(gòu)建了興趣、習(xí)慣、交互三重驅(qū)動下的微博動力學(xué)模型,試圖更恰當(dāng)?shù)慕忉屛⒉┯脩粜袨榈姆遣此商匦浴?/p>

1 實證數(shù)據(jù)分析

研究數(shù)據(jù)來源于新浪微博。新浪微博擁有超過5億的注冊用戶,月活躍用戶數(shù)高達1.29億。本文采集了1 843個用戶從2010年1月到2013年11月的微博信息,共計964 728條。其數(shù)據(jù)格式如表1。

表1 數(shù)據(jù)格式

對所收集的數(shù)據(jù)按照工作日和非工作日進行分類,統(tǒng)計各類別中每個時間段內(nèi)的微博數(shù)量得到圖1。

圖1 微博用戶行為的周期性特征Fig. 1 Periodic characteristics of users’ behavior in microblog

由圖1可知,微博用戶行為存在周期性和陣發(fā)性,并以24 h為一周期。從凌晨到6點鐘,微博發(fā)布數(shù)驟減,表明該段時間內(nèi)發(fā)布微博的用戶數(shù)較少;從早晨7點鐘開始,微博數(shù)量逐漸攀升,中午12點左右達到最大值;之后出現(xiàn)小幅度的下滑之后,晚上22點鐘達到另一個高峰期。這也證實了微博用戶的行為時間基本為碎片時間,如上班前(7點)、午休時(12點)、入睡前(晚10點)等。

對所獲得數(shù)據(jù)按照用戶ID進行統(tǒng)計,將用戶 ID相同的數(shù)據(jù)項歸為一類,去除內(nèi)容不完整和微博 ID相同的數(shù)據(jù),然后求出各個用戶 ID的平均日發(fā)文量。將用戶按照日發(fā)文量進行分組,日發(fā)文量在20以上的為組1,日發(fā)文量在11~20之間的為組2,日發(fā)文量在6~10之間的為組3,日發(fā)文量在0~5之間的為組4。具體分析結(jié)果如表2所示。

表2 分組及冪指數(shù)取值情況

由表2知,群體冪律分布的冪指數(shù)正相關(guān)于日平均發(fā)文量,即日平均發(fā)文量越高,則群體行為時間間隔分布的冪指數(shù)越大,這表明微博發(fā)布與文獻[7]的電影點播具有類似的行為特征。因為日平均發(fā)文量可以看作是用戶活躍性的反映性指標(biāo),所以可以認為,日平均發(fā)文量越大,則用戶活躍性越高。而用戶的活躍性則受到興趣、習(xí)慣、交互、職業(yè)性質(zhì)等多方面的影響。由于研究對象的特殊性,所以本文中的交互是指用戶發(fā)布的微博獲得評論或轉(zhuǎn)發(fā)。

(a) 組1

(b) 組2

(c) 組3

(d)組4圖2 各組用戶時間間隔分布Fig. 2 The interval distribution of individual group

由圖2可知,較高活躍性的用戶群體的時間間隔分布下降速度較快;而較低活躍性群體的時間間隔分布下降較緩。因轉(zhuǎn)發(fā)微博也作為用戶發(fā)布的微博呈現(xiàn)在用戶界面上,所以文中微博用戶行為不嚴(yán)格區(qū)分原創(chuàng)和轉(zhuǎn)發(fā)行為。同時可以看出,較小的時間間隔在用戶發(fā)布行為中占有絕對的分量,這與文獻[12]的分析結(jié)果是一致的,即長時間的靜默和短時間內(nèi)的爆發(fā)。且較長的時間間隔所占比例較小,這是由人類動力學(xué)的普遍規(guī)律所決定的。一方面,人們的活動周期性使得較長的行為時間間隔存在;另一方面,發(fā)布微博對于用戶而言不是必須要做的任務(wù),其主要是由用戶興趣和習(xí)慣等因素決定,在沒有形成固定的發(fā)布習(xí)慣時,用戶主要受興趣和交互的支配,而發(fā)布行為的興趣是復(fù)雜多變的。

將數(shù)據(jù)按照有交互和無交互分成兩組,統(tǒng)計整理出兩組的時間間隔分布如圖3所示??梢钥闯?,有交互的情況下,相鄰行為時間間隔分布服從冪指數(shù)為1.53的冪律分布;而無交互的情況下,微博用戶相鄰行為時間間隔則服從冪指數(shù)為1.35的冪律分布。這說明在交互的情況下用戶相鄰行為的時間間隔較小的占有較大比重,也就是說同一時間段內(nèi),相比較無交互的情況下,用戶行為發(fā)生的更為頻繁。該圖表明用戶之間的交互行為,在一定程度上能夠刺激用戶更積極的發(fā)布微博。

(a) 有交互

(b)無交互圖3 有無交互情況下微博用戶行為時間間隔分布Fig. 3 The interval distribution with and without interactions

2 興趣、習(xí)慣、交互三重驅(qū)動下的用戶行為建模

以上分析結(jié)果表明,用戶的活躍程度決定了微博用戶的信息發(fā)布行為模式。為了便于研究,假定用戶的活躍性僅受到興趣、習(xí)慣和交互的影響,其他因素暫且忽略。影響用戶活躍性的習(xí)慣因素包括兩個方面,一方面是習(xí)慣的穩(wěn)定性;另一方面是習(xí)慣的強度,即每日習(xí)慣行為發(fā)生的次數(shù)。本文假設(shè)用戶形成習(xí)慣后不會改變。

首先考慮興趣的驅(qū)動,初期興趣濃厚,隨著時間的增加,興趣逐漸遞減,直到時間足夠長時(超過一個周期時)興趣又變?yōu)?,采用興趣遞減函數(shù)形式為1/(1+α(t-t'))(同文獻[14]等),其中α表示興趣的衰減速度,t-t'表示時間間隔,下文中以τ表示;其次用戶習(xí)慣的形成對行為具有驅(qū)動作用,可以認為用戶習(xí)慣的形成能夠緩解興趣的衰減,使用參數(shù)β表示形成習(xí)慣的穩(wěn)定性,β的取值范圍為[0,1],使用參數(shù)η表示習(xí)慣強度,且η≥0,則興趣、習(xí)慣雙驅(qū)動下的模型為1/(1+α(t-t')/(1+ηβ));最后考慮交互的驅(qū)動影響,由上文可知交互能夠進一步激發(fā)用戶的發(fā)布行為,因此可以認為用戶之間的交互也能夠抑制興趣的衰減,使用參數(shù)φ表示用戶交互的程度,取值范圍為φ≥0,其中φ=0表示無用戶交互,不考慮習(xí)慣時,則興趣和交互的驅(qū)動函數(shù)為1/(1+α(t-t')/(1+φ)),而在興趣、習(xí)慣、交互三重驅(qū)動模式下,還要考慮習(xí)慣和交互的關(guān)系,本文認為當(dāng)形成的習(xí)慣較穩(wěn)定時,習(xí)慣的影響較大,而形成的習(xí)慣較隨機時,則認為交互帶來的影響更大,使用λ表示用戶習(xí)慣的影響權(quán)重,γ為用戶交互的影響權(quán)重,且λ+γ=1,則三重驅(qū)動下模型為1/(1+ατ/(1+ληβ+γφ)),其中λ與β的取值關(guān)系為

根據(jù)以上假設(shè),提出引入習(xí)慣和交互雙重抑制的興趣驅(qū)動模型,模型描述如下:

1)時間離散,單位步長為1min,用戶發(fā)布微博的概率以用戶興趣來表示。

2)興趣的改變具有周期性,t=0時興趣最大,值為1。在一個周期內(nèi),用戶發(fā)布行為的興趣隨著時間的增加呈衰減趨勢,當(dāng)時間間隔超過一個周期時,用戶興趣上升為1。

假設(shè)t時刻行為發(fā)生,則下個行為發(fā)生在t+τ時刻的概率為:

(1)

式(1)又可以變換成如下形式:

(2)

由伽馬函數(shù)的性質(zhì)可將式(2)變換為下式:

(3)

(4)

由式(4)可知

由以上推導(dǎo)結(jié)果可知,興趣、習(xí)慣、交互三重驅(qū)動模式下的微博用戶動力學(xué)模型能夠產(chǎn)生的相鄰行為時間間隔服從冪指數(shù)為參數(shù)可調(diào)的((1+ληβ+γφ)/α+1)的冪律分布。

對上述提出的微博用戶行為動力學(xué)模型進行數(shù)值模擬,模擬時間步為100 000,為了驗證實證數(shù)據(jù)的有效性,固定興趣衰減速度為3;用戶習(xí)慣穩(wěn)定性β分別取0.1和0.6,用戶習(xí)慣強度η分別取0和5;用戶交互φ取1;λ則分別取0.1和0.5的情況下進行仿真。在數(shù)值模擬中,取P(t)的初始值為1,在仿真的過程中根據(jù)P(t)的取值判斷行為是否發(fā)生,若行為發(fā)生則將該時刻的P(t)賦值為1,否則發(fā)生行為的概率取值為P(t)=(1+ληβ+γφ)/(1+ληβ+γφ+α(t-t′)),其中t′為上次行為發(fā)生的時間。

(a) β=0.1,η=0,λ=0.1,γ=0.9

(b) β=0.6,η=5,λ=0.5,γ=0.5圖4 模型數(shù)值仿真結(jié)果Fig. 4 Simulation results of the model

圖4中,(a)為β=0.1、η=0,λ=0.1,γ=0.9模型所產(chǎn)生的相鄰行為時間間隔分布圖,該參數(shù)取值下所產(chǎn)生的冪律分布冪指數(shù)為1.59,與數(shù)學(xué)推導(dǎo)所得冪律1.63比較吻合,且η=0意味著不考慮用戶習(xí)慣行為,即模型弱化為興趣、交互雙驅(qū)動動力學(xué)模型;(b)為β=0.6,η=5,λ=0.5,γ=0.5時模型所產(chǎn)生的相鄰行為時間間隔分布圖,冪律分布指數(shù)為2.06,與推導(dǎo)所得冪指數(shù)2.0較一致,該參數(shù)取值下表示用戶形成較穩(wěn)定的行為習(xí)慣,且習(xí)慣強度較大,該取值意味著習(xí)慣成為興趣衰減的主要抑制因素,同時,用戶之間的交互對用戶行為的驅(qū)動影響變?nèi)酰荒芎鲆曈脩艚换サ拇嬖?,因為用戶交互行為變得很頻繁時,人們往往能夠打破習(xí)慣的束縛,進一步刺激用戶變得更為活躍。這與實證數(shù)據(jù)的分析結(jié)果是一致的。

3 結(jié)束語

本文通過統(tǒng)計分析微博用戶每日發(fā)文的時間和數(shù)量特征,驗證了微博用戶的發(fā)布行為具有周期性和陣發(fā)性。同時分析了不同日平均發(fā)文量群體用戶的微博發(fā)布時間間隔特征和有無交互行為的時間間隔分布特征,分析結(jié)果表明,不同活躍程度的用戶群體的發(fā)布時間間隔都近似服從冪律分布,且冪指數(shù)與活躍程度之間具有正相關(guān)關(guān)系;另外交互能夠在一定程度上激發(fā)用戶的發(fā)布行為。在實證數(shù)據(jù)分析結(jié)果的基礎(chǔ)上,探討了用戶興趣、習(xí)慣和交互之間的關(guān)系,并提出一種基于用戶興趣、習(xí)慣和交互的行為動力學(xué)模型。通過數(shù)學(xué)推導(dǎo)可以看出,該模型能夠生成冪指數(shù)為((1+ληβ+γφ)/α+1)的冪律分布。且模型的仿真結(jié)果與實證數(shù)據(jù)分析結(jié)果較為一致。

人類行為是高度復(fù)雜的,本模型對用戶行為的驅(qū)動力作了較多簡化,因此該模型尚存在一定的不足。未來,可進一步挖掘隱藏在行為背后的更為本質(zhì)的驅(qū)動因素或發(fā)布動機,本模型的提出有助于進一步的分析和探討。

[2]ECKMANN J P, MOSES E, SERGI D. Entropy of dialogues creates coherent structures in e-mail traffic[J]. Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(40): 14333-14337.

[3]JOHANSEN A. Probing human response times[J]. Physical A: Statistical Mechanics and its Applications, 2004, 338(1/2): 286-291.

[4]HONG Wei, HAN Xiaopu, ZHOU Tao, et al. Heavy-tailed statistics in short-message communication[J].Chinese Physics Letters, 2009, 26(2): 028902.

[5]ZHAO Zhidan, XIA Hu, SHANG Mingsheng, et al. Empirical analysis on the human dynamics of a large-scale short message communication system[J]. Chinese Physics Letters, 2011, 28(6): 068901.

[6]CANDIA J, GONZLEZ M C, WANG Pu, et al. Uncovering individual and collective human dynamics from mobile phone records[J]. Journal Physics A: Mathematical and Theoretical Email, 2008, 41(22): 224015.

[7]ZHOU Tao, KIET H A T, KIM B J, et al. Role of activity in human dynamics[J]. Europhysics Letters, 2008, 82(2): 28002.

[8]GON?ALVES B, RAMASCO J J. Human dynamics revealed through web analytics[J]. Physical Review E, 2008, 78(2): 026123.

[9]RADICCHI F. Human activity in the web[J]. Physical Review E, 2009, 80(2): 026118.

[10]WANG Peng, LEI Ting, YEUNG C H, et al. Heterogeneous human dynamics in intra-and inter-day time scales[J]. Europhysics Letters, 2011, 94(1): 18005.

[11]GUO Jinli, FAN Chao, GUO Z H. Weblog patterns and human dynamics with decreasing interest[J]. The European Physical Journal B, 2011, 81(3): 341-344.

[12]BAO Yuanyuan, XIN Zhanhong. Human activity pattern on microblogging interaction[C]// Proceedings of the 2011 International Conference on Information Management, Innovation Management and Industrial Engineering (ICIII). Shenzhen, 2011: 303-306.

[13]焦玉, 劉衍珩, 王健, 等. 基于習(xí)慣的人類動力學(xué)建模[J]. 科學(xué)通報, 2010, 55(11): 1070-1076. JIAO Yu, LIU Yanhang, WANG Jian, et al. Model for human dynamics based on habit[J]. Chinese Science Bulletin, 2010, 55(24): 2744-2749.

[14]SHANG Mingsheng, CHEN Guanxiong, DAI Shuangxing, et al. Interest-driven model for human dynamics[J]. Chinese Physics Letters, 2010, 27(4): 48701-48703.

[15]HAN Xiaopu, ZHOU Tao, WANG Binghong. Modeling human dynamics with adaptive interest[J]. New Journal of Physics, 2008, 10: 073010.

[16]YAN Qiang, YI Lanli, WU Lianren. Human dynamic model co-driven by interest and social identity in the microblog community[J]. Physica A: Statistical Mechanics and its Applications, 2012, 391(4): 1540-1545.

[17]VAZQUEZ A. Impact of memory on human dynamics[J]. Physica A: Statistical Mechanics and its Applications, 2007, 373: 747-752.

[18]韓筱璞, 汪秉宏, 周濤. 人類行為動力學(xué)研究[J]. 復(fù)雜系統(tǒng)與復(fù)雜性科學(xué), 2010, 7(2/3): 132-144. HAN Xiaopu, WANG Binghong, ZHOU Tao. Researches of human dynamics[J]. Complex Systems and Complexity Science, 2010, 7(2/3): 132-144.

[19]周濤, 韓筱璞, 閆小勇, 等. 人類行為時空特性的統(tǒng)計力學(xué)[J]. 電子科技大學(xué)學(xué)報, 2013, 42(4): 482-540. ZHOU Tao, HAN Xiaopu, YAN Xiaoyong, et al. Statistical mechanics on temporal and spatial activities of human[J]. Journal of University of Electronic Science and Technology of China, 2013, 42(4): 482-540.

Microblog users' dynamic model driven by interest, habit, and interaction

ZHAO Jinlou1, CHENG Junhui1,2, LIU Jiaguo1

(1. School of Economics and Management, Harbin Engineering University, Harbin 150001, China; 2. School of Economics and Management, Hainan University, Haikou 570228, China)

Aiming at the behavior of microblog users, Sina empirical data were collected to analyze microblog userbehavior characteristics in different circumstances. The results show that the user blog release behavior has periodic and outburst characteristics, the time interval of users releasing microblogs obeys a power-law distribution, and the relation between power exponent and user activity shows positive correlation. In the time between blog entries, the interaction among users can stimulate users to be more active microbloggers. On this basis,we construct a dynamic model driven by interest, habit, and interaction. Mathematical derivation shows that the model is able to obtain a power-law distribution with an adjustable power exponent. The simulation results of the dynamic model are consistent with the analysis results of empirical data.

time interval distribution; interest; habit; interaction; human behavior dynamics;microblog; dynamic model

2014-06-12.

時間:2015-07-15.

國家自然科學(xué)基金資助項目(71271062);中央高?;究蒲袠I(yè)務(wù)費資助項目(HEUCFD1507).

趙金樓(1957-), 男, 教授,博士生導(dǎo)師; 成俊會(1989-), 女,講師,博士.

成俊會, E-mail:chengjunhui1989@163.com.

10.3969/jheu.201406021

C931

A

1006-7043(2015)09-1292-05

網(wǎng)絡(luò)出版地址:http://www.cnki.net/kcms/detail/23.1390.U.20150715.1728.009.html

猜你喜歡
冪指數(shù)冪律間隔
源于學(xué)生試題疑問的數(shù)學(xué)建模例談
部分相干冪指數(shù)相位渦旋光束的傳輸特性研究*
間隔問題
間隔之謎
基于逼近理想點冪指數(shù)評估的防空導(dǎo)彈型譜分析與研究
一類度互質(zhì)的無標(biāo)度網(wǎng)絡(luò)研究
考試周刊(2016年99期)2016-12-26 10:54:30
四川地區(qū)降水冪律指數(shù)研究
冪律流底泥的質(zhì)量輸移和流場
對抗冪律
上樓梯的學(xué)問
阳曲县| 嘉祥县| 六枝特区| 家居| 韶山市| 尚义县| 宾阳县| 景谷| 延寿县| 沅陵县| 九龙城区| 洪洞县| 云梦县| 江津市| 达州市| 独山县| 沁阳市| 福安市| 南通市| 乐安县| 湖口县| 安溪县| 桓仁| 资阳市| 潢川县| 南涧| 镇平县| 西乌| 鹤壁市| 民和| 登封市| 铁岭市| 凤庆县| 朝阳县| 岳池县| 丰台区| 呼伦贝尔市| 罗甸县| 洱源县| 象州县| 潍坊市|