李滄海,許益貼,羅春海,胡海波
(華東理工大學管理科學與工程系,上海 200237)
微博信息擴散的空間分析
李滄海,許益貼,羅春海,胡海波
(華東理工大學管理科學與工程系,上海 200237)
為揭示信息擴散的空間特征,利用新浪微博數(shù)據(jù),研究了中國地級市間的微博信息擴散,并利用重力模型,研究了影響城際信息擴散的因素。研究表明,少數(shù)一二線城市呈現(xiàn)信息寡占型,主導微博內(nèi)容的輸出和擴散。對城際信息交互模型的分析發(fā)現(xiàn),用戶數(shù)在很大程度上影響了城際信息擴散,城市總GDP也可預測城際信息交互,空間距離則不再發(fā)揮作用,微博中的信息擴散打破了物理距離的限制。該研究揭示了線上社交網(wǎng)絡(luò)與線下物理空間的映射關(guān)系以及社交媒體中信息的城際擴散特征,可為空間位置相關(guān)的信息發(fā)布和網(wǎng)絡(luò)輿情監(jiān)控提供借鑒。
社交網(wǎng)絡(luò);城際網(wǎng)絡(luò);信息擴散;重力模型
Facebook、Twitter、新浪微博、騰訊微信等社交工具已逐漸走入大眾生活,它們所連接的社交網(wǎng)絡(luò)也已覆蓋全球。無論何時何地,線下的用戶均可利用這些社交工具,發(fā)布關(guān)于自身的信息,尋找感興趣的內(nèi)容或賬號,關(guān)注其他用戶,并對其他用戶發(fā)布的信息進行點贊、評論或轉(zhuǎn)發(fā)。這些社交媒體以一定社會關(guān)系或共同興趣為紐帶,為在線網(wǎng)民提供溝通和交互服務(wù),它們深刻地改變了人類社會的組織結(jié)構(gòu)和活動模式[1-2]。
社會性連接和社交網(wǎng)絡(luò)的發(fā)展,使得人類社會的聯(lián)系和交互行為從物理空間延伸到虛擬網(wǎng)絡(luò)空間,由此帶來了全新的社會組織結(jié)構(gòu)關(guān)系。在線社交網(wǎng)絡(luò)使得網(wǎng)絡(luò)中的個體可以與其他大量陌生個體建立聯(lián)系,網(wǎng)絡(luò)中的強關(guān)系有助于網(wǎng)絡(luò)群體(社團)消費和共享同質(zhì)信息,弱關(guān)系則有助于網(wǎng)絡(luò)群體傳遞新信息,促成信息流動,強弱社會關(guān)系共同促進信息擴散[3]。社交網(wǎng)絡(luò)的普及使得一些熱門話題和具有爆炸性屬性的話題傳播極快,形成了所謂的超級傳播事件[4]。在此過程中,網(wǎng)絡(luò)中的意見領(lǐng)袖在虛擬社區(qū)、網(wǎng)絡(luò)群體以及信息傳播中發(fā)揮著巨大作用,能夠快速擴散、放大輿論[5-6]。在線社交網(wǎng)絡(luò)的研究已獲得來自多個領(lǐng)域和學科的學者們的關(guān)注,形成了多學科交叉的一系列熱點研究方向,如社交網(wǎng)絡(luò)結(jié)構(gòu)及演化、網(wǎng)絡(luò)建模以及網(wǎng)絡(luò)上的信息擴散等[1,7-9]。過去近十年學術(shù)界對社交網(wǎng)絡(luò)的研究多集中于對其拓撲結(jié)構(gòu)和基于傳染病模型的信息擴散動力學特征的分析[1,4],近年來,社交網(wǎng)絡(luò)研究開始考慮用戶的地理位置,致力于線上虛擬空間和線下傳統(tǒng)物理空間的映射[10-15]。
盡管互聯(lián)網(wǎng)使人與人之間的交流跨越了空間的限制,使整個世界變得更加扁平,但近來大量的實證研究表明,對于在線社交網(wǎng)絡(luò),空間距離在好友關(guān)系的形成中仍擔當重要角色。個人的好友圈在地理位置上具有相似性,兩位用戶之間的距離越近,他們之間形成好友關(guān)系的可能性也就越大[10-15]。在基于位置的在線社交網(wǎng)絡(luò),如Gowalla[10],BrightKite[10-11]和FourSquare[10-11],以及一般性社交網(wǎng)絡(luò),如iWiW[12],Microsoft Messenger[13],LiveJournal[11],Twitter[11,14]和Facebook[15]中均發(fā)現(xiàn)了空間距離所起的作用??臻g距離也會影響社交網(wǎng)絡(luò)中的城際交流強度,對比利時移動電話通信網(wǎng)絡(luò)的研究發(fā)現(xiàn),跨城市的通話時長跟城市間距離的平方成反比[16],而對中國移動電話通信網(wǎng)絡(luò)的研究發(fā)現(xiàn)[17],跨城市的通話時長(通話次數(shù))則跟城市間距離的0.4(0.5)次方成反比。
在基于空間位置的信息擴散研究中,目前大多數(shù)工作關(guān)注社交媒體中關(guān)注關(guān)系或好友關(guān)系跟空間距離之間的關(guān)系[10-15,18],較少關(guān)注基于轉(zhuǎn)發(fā)關(guān)系的空間信息擴散與交互。本文從實證角度出發(fā),基于新浪微博中用戶的轉(zhuǎn)發(fā)關(guān)系,以城市為尺度,聚合個體用戶的轉(zhuǎn)發(fā)關(guān)系,構(gòu)建城際信息流網(wǎng)絡(luò),建立城市空間交互模型,探討空間距離對城際信息擴散的影響。本研究可揭示線上網(wǎng)絡(luò)空間與線下現(xiàn)實空間的映射關(guān)系以及社交網(wǎng)絡(luò)中信息流的地理空間傳播,并可為預測網(wǎng)絡(luò)熱點事件的時空演化趨勢及時空影響范圍提供理論依據(jù)。
本研究利用新浪微博提供的API接口(http://open.weibo.com/),從2014年10月15日開始到10月20日共收集了21 992位用戶的信息和這些用戶發(fā)布的2 076 564條微博的信息,之后收集了這些用戶在2014年10月15日至2015年2月1日期間發(fā)表的9 534 792條微博,最后收集這些用戶的轉(zhuǎn)發(fā)關(guān)系,排除國外用戶(用戶基本信息中地理信息注冊地在國外的用戶)、僵尸用戶(有微博賬號但無發(fā)微博記錄的用戶)、陌生人(轉(zhuǎn)發(fā)了某賬號微博但未關(guān)注該賬號的用戶)的轉(zhuǎn)發(fā),共得到11 508位有效樣本用戶,以及他們之間的389 956條有效轉(zhuǎn)發(fā)關(guān)系(信息流)。將個體用戶聚合到326個地級市,研究城際信息流網(wǎng)絡(luò)。
在基于地理位置的城際信息流網(wǎng)絡(luò)G=(V,E)中,節(jié)點V為城市,連邊E為城市用戶間的轉(zhuǎn)發(fā)關(guān)系,信息流網(wǎng)絡(luò)是一個可映射到地理空間上的有向加權(quán)網(wǎng)絡(luò)。用wij表示從城市i到j(luò)的城際信息通量,即城市j中用戶轉(zhuǎn)發(fā)城市i中用戶微博的數(shù)量,對于i,它表示從i到j(luò)的出向城際信息通量,對于j,它表示從i到j(luò)的入向城際信息通量。城市i、j間的總城際信息通量為w(i,j)=wij+wji。城際信息通量刻畫了城市之間的信息交互強度。
圖1給出了中國城際信息流網(wǎng)絡(luò),節(jié)點包括了中國最重要的39個城市(下文簡稱39城市),即中國大陸直轄市、省會城市、計劃單列市及香港、澳門、臺北。節(jié)點顏色越深,則該城市進出其他城市的總信息通量越大,有向邊的寬度正比于城際信息通量。可見北京、廣州、上海3個城市間信息通量非常顯著,它們之間信息交流多于其他城市,京滬間最為明顯,這與三城市的政治、經(jīng)濟和文化地位有關(guān)。由北京發(fā)出的信息流尤為顯著,表明北京對外的影響力非常強。
城際信息通量最大的前20位中,只有第12位由廣州到北京、第16名由上海到北京,其余均由北京發(fā)出,表明北京在信息擴散上占據(jù)了極大的主動性和壟斷地位。城際信息通量最大者是由北京到上海,兩座城市一為政治中心一為經(jīng)濟中心,線下的密切往來也映射到了微博空間中。
所有城市對中單向(出向或入向)城際信息通量的異質(zhì)系數(shù)為0.884 6,總城際信息通量的異質(zhì)系數(shù)為0.869 7。國家統(tǒng)計局數(shù)據(jù)顯示,2016年中國居民收入的Gini系數(shù)為0.465,可見,中國信息領(lǐng)域的“貧富差距”遠遠超過了經(jīng)濟領(lǐng)域的。國際上通常把H=0.4作為貧富差距的警戒線,就微博而言,大的H值意味著少數(shù)幾個城市主導了信息的生產(chǎn)與擴散,絕大多數(shù)城市在信息生產(chǎn)、傳輸方面規(guī)模很小,這是一種新形式的“數(shù)字鴻溝”,這個鴻溝跟城市人口數(shù)、經(jīng)濟發(fā)展水平、互聯(lián)網(wǎng)接入率、人口結(jié)構(gòu)等密切相關(guān)。信息通量的補累積概率分布如圖2所示,二者均未能通過閾值p=0.1的Kolmogorov-Smirnov測試,因而并不滿足冪律分布,實際上利用極大似然估計,對于對數(shù)似然函數(shù),對數(shù)正態(tài)分布的最大值均大于冪律分布的(對于單向信息通量,最大值-22 779>-23 075,對于總信息通量,則-21 243>-22 431),說明對于二者,對數(shù)正態(tài)分布的擬合優(yōu)度均略好于冪律分布。
圖1 中國39城市城際微博信息流網(wǎng)絡(luò)Fig.1 Intercity microblog information flow network among 39 cities in China
圖2 城際單向和總信息通量補累積概率分布Fig.2 Complementary cumulative probability distributions for directed and undirected intercity information fluxes
地理上中國南北方的分界線是秦嶺——淮河一線,但西部某些城市的南北方歸屬意見并不統(tǒng)一,本文中對于西北五省,陜西和甘肅的大部(秦嶺以北),以及寧夏、青海和新疆歸為北方,對于西南五省市,四川、云南、貴州和重慶歸為南方,西藏歸為北方。城市入向信息通量排名前三者為上海、北京、廣州,緊臨其后的是南京、西安、深圳3個中心城市,它們的入向信息通量相近。北方城市中,西安、鄭州、天津占據(jù)前十的第5、9、10名,西安是西北五省中心,鄭州是北方交通樞紐,天津緊鄰北京,均是國家重要城市。城市出向信息通量排名前三者是北京、廣州、上海,它們具有重要的對外影響力。在前5名的城市中,廣州、香港、深圳是屬于珠三角城市群落的3個特大城市。臺北在出向信息通量中排名第8,對外信息輸出能力也很強。北京、上海、廣州無論是出向還是入向,在兩個排名中都占據(jù)了前3,這3座城市線上的影響力和活力與它們線下“國家中心城市”身份相符。
我們發(fā)現(xiàn),排名前10的城市集中了近34.4%的入向信息通量,以及高達88.47%的出向信息通量,排名前20位的城市占據(jù)了總信息通量的71.23%。Sin的異質(zhì)系數(shù)為0.727 4,Sout的異質(zhì)系數(shù)為0.950 8,Stotal的異質(zhì)系數(shù)為0.842 3,表明在微博中城市擴散信息的能力和活躍度存在巨大的地區(qū)差異。少數(shù)一線城市和活躍的二線城市擁有極大的網(wǎng)絡(luò)話語權(quán)和傳播力,以其政治、經(jīng)濟及文化匯聚了大量的網(wǎng)絡(luò)意見領(lǐng)袖,例如微博中的“大V”還有官方微博機構(gòu),擁有基數(shù)龐大的粉絲群體,博取了大量的關(guān)注度,具有極強的社會號召力和信息擴散能力。
圖4給出了城市出入向和總信息通量補累積概率分布圖,它們均屬于長尾分布,通量值跨越了4到5個數(shù)量級。不同城市的信息傳播能力和活躍度存在顯著差異,城際社交關(guān)系存在“富人俱樂部”現(xiàn)象,少數(shù)城市占據(jù)了極高的關(guān)注度和信息話語權(quán),對外影響力很大,同時也得到了大量的關(guān)注,它們既是豐富信息的誕生地和傳播者,也是熱點事件傳播、輿論引導的“推手”。
圖3 城市出入向信息通量相關(guān)性。實線為線性擬合線,兩側(cè)的灰色區(qū)域給出了0.95置信區(qū)間Fig.3 The correlation between inflowing and outflowinginformation fluxes of cities
圖4 城市出入向和總信息通量補累積概率分布Fig.4 Complementary cumulative probability distributions for inflowing, outflowing and total information fluxes of cities
香港、拉薩、臺北的人均總信息通量排名前3,而總信息通量最高的北京位于第7,說明前者城市的用戶平均活躍度和影響力較高。此外,寧波、大連、青島等計劃單列市的人均總信息通量高于其所在省的省會城市,這幾個城市在社交媒體中的重要性與它們線下的迅速發(fā)展密切相關(guān)。
消息轉(zhuǎn)發(fā)是微博中信息擴散的關(guān)鍵機制,是社交網(wǎng)絡(luò)中一種簡單卻又強大的散布信息方式。在微博中,有些城市被轉(zhuǎn)發(fā)的消息要比它們轉(zhuǎn)發(fā)的消息多得多,有些城市則恰恰相反;同樣有些城市的粉絲比它們關(guān)注的用戶多,有些城市則恰恰相反。用Sout/Sin表示某城市用戶被其他城市用戶轉(zhuǎn)發(fā)消息的數(shù)量與轉(zhuǎn)發(fā)其他城市用戶消息的數(shù)量的比值,即被轉(zhuǎn)發(fā)數(shù)/轉(zhuǎn)發(fā)數(shù),用Fout/Fin表示某城市用戶關(guān)注其他城市用戶的數(shù)量與被其他城市用戶關(guān)注的數(shù)量的比值,即關(guān)注數(shù)/被關(guān)注數(shù),據(jù)此可將城市分為4類:當Sout/Sin>1且Fout/Fin<1時,該城市為有影響力的城市,當Sout/Sin>1且Fout/Fin>1時,該城市為隱藏的有影響力的城市,當Sout/Sin<1且Fout/Fin<1時,該城市為轉(zhuǎn)發(fā)者,當Sout/Sin<1且Fout/Fin>1時,該城市為草根城市[20]。
城市的類別對于信息的傳播和擴散有很大影響,一般地,有影響力的城市會觸發(fā)最大的信息級聯(lián),即影響范圍和程度最大,之后轉(zhuǎn)發(fā)者會追隨這些級聯(lián)。根據(jù)擁有的相對被關(guān)注數(shù),有影響力的城市和轉(zhuǎn)發(fā)者在網(wǎng)絡(luò)中具有中心地位,草根城市即使具有數(shù)量上的優(yōu)勢,也往往很難發(fā)起長鏈反應(yīng)。研究發(fā)現(xiàn),在39城市中,北京、廣州、香港、澳門、臺北為有影響力的城市,它們均在國際上有重要影響力,廈門、銀川、拉薩、貴陽為轉(zhuǎn)發(fā)者,海口為隱藏的有影響力的城市,其余包括深圳、上海、天津、南京等為草根城市。這說明有些城市雖然在經(jīng)濟、文化上發(fā)達,但就信息擴散而言并非處于主導地位,其他因素也會影響其在信息流通中的角色。
我們利用重力模型來研究用戶數(shù)和地理距離對城際信息擴散的影響[21],該模型借鑒牛頓引力定律,已廣泛用于預測人口遷移[21,23]、城際電話呼叫[16]和國際貿(mào)易[24]等。用wij表示城際信息通量,Pi和Pj分別表示城市i和j的用戶數(shù),α和β分別表示一個城市的出向和入向信息通量指數(shù),dij表示城市i和j間的地理距離,γ表示距離阻礙因子??紤]到城市的人均GDP或總GDP可以衡量該城市的發(fā)展水平,可能影響城際信息擴散,因此用Gi和Gj分別表示城市i和j的GDP(采用2015年的數(shù)據(jù)),將其融入重力模型中。
表1 39城市間單向城際信息通量回歸結(jié)果(GDP取人均)Tab.1 The regression results for the directed intercity information fluxes among 39 cities(G represents GDP per capita)
表2 39城市間單向城際信息通量回歸結(jié)果(GDP取總量)Tab.2 The regression results for the directed intercity information fluxes among 39 cities(G represents total GDP)
表3 39城市間雙向城際信息通量回歸結(jié)果(GDP取人均)Tab.3 The regression results for the undirected intercity information fluxes among 39 cities(G represents GDP per capita)
表4 39城市間雙向城際信息通量回歸結(jié)果(GDP取總量)Tab.4 The regression results for the undirected intercity information fluxes among 39 cities(G represents total GDP)
表5 所有城市間單向城際信息通量回歸結(jié)果(GDP取人均)Tab.5 The regression results for the directed intercity information fluxes among all cities(G represents GDP per capita)
表6 所有城市間單向城際信息通量回歸結(jié)果(GDP取總量)Tab.6 The regression results for the directed intercity information fluxes among all cities(G represents total GDP)
表7 所有城市間雙向城際信息通量回歸結(jié)果(GDP取人均)Tab.7 The regression results for the undirected intercity information fluxes among all cities(G represents GDP per capita)
表8 所有城市間雙向城際信息通量回歸結(jié)果(GDP取總量)Tab.8 The regression results for the undirected intercity information fluxes among all cities(G represents total GDP)
根據(jù)表1-8,我們發(fā)現(xiàn),對于39城市,GDP取人均時模型4)最佳,GDP取總量時,模型3)最佳。對于所有城市,GDP取人均時模型2)最佳,GDP取總量時,模型4)最佳。更一般的,對于預測39城市間單向或雙向城際信息通量,考慮人均GDP的模型4)最佳,而對于預測所有城市間單向或雙向城際信息通量,則考慮總GDP的模型4)最佳。在相同條件下,39城市的擬合優(yōu)度均大于所有城市的,造成這種現(xiàn)象的可能原因一是數(shù)據(jù)采樣偏差,二是有本文未考慮的其他因素影響了信息擴散。既然39城市間的信息流網(wǎng)絡(luò)構(gòu)成了社交媒體中信息擴散的主干網(wǎng)絡(luò),從而表明重力模型可以在很大程度上刻畫中國城際信息流的主要特征。對于單向城際信息通量,研究發(fā)現(xiàn)出向指數(shù)α均大于入向指數(shù)β,這意味著一個城市若用戶數(shù)增加,那么該城市微博被轉(zhuǎn)發(fā)的數(shù)量其增加的幅度要大于該城市轉(zhuǎn)發(fā)量的,隨著城市用戶數(shù)的增加其輸出或擴散信息的能力將顯著增強。
對于39城市和所有城市兩種情況,對于單向和雙向兩種情景,圖5給出了調(diào)整R2最大情況下城際信息通量w(i,j)與模型預測值w′(i,j)之間的關(guān)系。圖5c、d數(shù)據(jù)較多,大量數(shù)據(jù)點重疊,因此采用六邊形分箱方法可視化數(shù)據(jù),顏色越淺數(shù)據(jù)越集中??梢婋p向比單向有更高的預測精度,39城市相對所有城市也有更高的預測精度,這體現(xiàn)在它們的調(diào)整R2上。
注:實線為對角線y=p。圖5 城際信息通量與模型預測值間的關(guān)系Fig.5 The relation between information fluxes and the predicted values
圖6 不同因素對城際信息通量的解釋能力Fig.6 The ability of different factors to explain information fluxes
相對于人均GDP,總GDP可以得到更好的擬合優(yōu)度,既然用戶數(shù)對城際信息通量影響最大,故城市總GDP與用戶數(shù)間可能存在相關(guān)性。為驗證此猜想,圖7給出了用戶數(shù)與GDP的關(guān)系圖。二者近似滿足標度關(guān)系,對于人均GDP,gdp∝p0.220 8(p<0.001,調(diào)整R2=0.276 6),對于總GDP,GDP∝p0.625 3(p<0.001,調(diào)整R2=0.657 8)。ln(GDP)與ln(P)間存在一定程度的線性關(guān)系,這解釋了為什么總GDP也有較好的預測效果。
圖7 城市用戶數(shù)與其人均GDP(a)和總GDP(b)的關(guān)系Fig.7 The relation between cities’ user numbers and their GDP ((a) for GDP per capita and (b) for total GDP)
除了利用2015年的GDP數(shù)據(jù)進行分析,我們還用2015年第一季度的GDP數(shù)據(jù)(有46個城市數(shù)據(jù)由于未公布或難以獲取缺失,對于這些城市其季度GDP用全年總GDP或人均GDP的1/4代替),對模型進行了研究,發(fā)現(xiàn)跟全年數(shù)據(jù)相比,定量上有微小的差異,定性上除了對于所有城市,GDP取人均時模型2)(單向)或模型4)(雙向)最佳外,其他沒有變化。
本研究以新浪微博中有關(guān)注關(guān)系的用戶之間的轉(zhuǎn)發(fā)關(guān)系為基礎(chǔ),構(gòu)建了基于地理位置的中國城際信息流網(wǎng)絡(luò),研究了城際信息擴散特征,之后利用重力模型刻畫了城際信息交互,研究了影響城際信息擴散的因素。研究發(fā)現(xiàn),信息擴散在地理空間分布上呈現(xiàn)空間分異現(xiàn)象,信息流從北京及東南沿海流向西北內(nèi)陸,信息擴散存在巨大的區(qū)域差異,這種差異遠遠超越了線下的經(jīng)濟差異,不同城市在信息擴散中扮演了不同角色。對重力模型的分析發(fā)現(xiàn),該模型可以很好地刻畫中國最重要的39城市間的城際信息擴散,城市用戶數(shù)在預測城際信息擴散上作用最大,總GDP也具有較好的預測效果,空間距離對社交媒體上的信息擴散無顯著作用。微博這類社交媒體可以通過關(guān)注關(guān)系把我們連接在一起,與地理距離在關(guān)注關(guān)系形成中的作用不同,信息擴散克服了地理限制。
目前對信息擴散的研究多側(cè)重于微觀個體層面,本文邁出了宏觀層面研究的第一步。更細致的工作是進一步考慮更多的經(jīng)濟地理及人口統(tǒng)計學數(shù)據(jù),如人口密度、城際人口遷移等,這些信息有望以更高的精度刻畫城際信息流動。中國有幾大城市群落,如珠三角、長三角、京津冀體系等,而不同城市群落的核心城市之間又存在顯著的信息交互,構(gòu)成了信息流網(wǎng)絡(luò)的主干,因此可以進一步對比研究不同城市群落中的信息擴散模式及信息流網(wǎng)絡(luò)中的層次結(jié)構(gòu)。不同城市傳播不同類型信息的能力也可能存在差異,有必要研究基于信息屬性的城際信息擴散,這對于輿情監(jiān)控尤為重要。這些研究需要更多的外部輔助數(shù)據(jù)和微博信息,將成為我們下一步工作的重點。
[1]胡海波, 王科, 徐玲, 等. 基于復雜網(wǎng)絡(luò)理論的在線社會網(wǎng)絡(luò)分析[J]. 復雜系統(tǒng)與復雜性科學, 2008, 5(2): 1-14.
Hu Haibo, Wang Ke, Xu Ling, et al. Analysis of online social networks based on complex network theory[J]. Complex Systems and Complexity Science, 2008, 5(2): 1-14.
[2]Hu H, Wang X. Disassortative mixing in online social networks[J]. EPL, 2009, 86: 18003.
[3]Lai G, Wong O. The tie effect on information dissemination: the spread of a commercial rumor in Hong Kong[J]. Social Networks, 2002, 24(1):49-75.
[4]Liu Y, Wang B, Wu B, et al.Characterizing super-spreading in microblog: an epidemic-based information propagation model[J]. Physica A, 2016, 463:202-218.
[5]Aral S,Walker D. Identifying influential and susceptible members of social networks[J]. Nature, 2010, 466(7307):761-764.
[6]Dubois E, Gaffney D. The multiple facets of influence: identifying political influentials and opinion leaders on Twitter[J]. Am Behav Sci, 2014,58(10): 1260-1277.
[7]Goel S, Anderson A, Hofman J, et al. The structural virality of online diffusion[J]. Manage Sci, 2016, 62(1): 180-196.
[8]劉紅麗, 黃雅麗, 羅春海, 等. 基于用戶行為的微博網(wǎng)絡(luò)信息擴散模型[J]. 物理學報, 2016, 65(15): 158901.
Liu Hongli, Huang Yali, Luo Chunhai, et al. Modeling information diffusion on microblog networks based on users’ behaviors[J]. Acta Phys Sin, 2016,65(15): 158901.
[9]許小可, 胡海波,張倫,等. 社交網(wǎng)絡(luò)上的計算傳播學[M]. 北京: 高等教育出版社, 2015.
[10] Scellato S, Noulas A, Lambiotte R, et al. Socio-spatial properties of online location-based social networks[C]// Proceedings of the Fifth International AAAI Conference on Weblogs and Social Media. Palo Alto, CA: The AAAI Press, 2011: 329-336.
[11] Scellato S, Mascolo C, Musolesi M, et al. Distance matters: geo-social metrics for online social networks[C]// Proceedings of the 3rd Conference on Online Social Networks. Berkeley, CA, 2010.
[12] Lengyel B, Varga A, Ságvári B, et al. Geographies of an online social network[J]. PLoS One, 2015, 10(9): e0137248.
[13] Leskovec J, Horvitz E. Planetary-scale views on a large instant-messaging network[C]// Proceedings of the 17th International Conference on World Wide Web. New York: ACM Press, 2008: 915-924.
[14] Takhteyev Y, Gruzd A, Wellman B. Geography of Twitter networks[J]. Social Networks, 2012, 34: 73-81.
[15] Levy M, Goldenberg J. The gravitational law of social interaction[J]. Physica A, 2014, 393: 418-426.
[16] KringsG, Calabrese F, Ratti C, et al. Urban gravity: a model for inter-city telecommunication flows[J]. J Stat Mech, 2009, (7): L07003.
[17] Kang C, Zhang Y, Ma X, et al. Inferring properties and revealing geographical impacts of intercity mobile communication network of China using a subnet data set[J].Int J Geogr Inf Sci, 2013, 27(3): 431-448.
[18] 衛(wèi)健炯,胡海波.在線社會網(wǎng)絡(luò)的形成機制——基于跨學科的視角[J].復雜系統(tǒng)與復雜性科學,2015,12(4):14-24.
Wei Jianjiong, Hu Haibo.The underlyingmechanismsdrivingtheformationofonlinesocialnetworks-Interdisciplinaryperspective[J]. Complex Systems and Complexity Science,2015, 12(4): 14-24.
[19] Hu H, Wang X. Unified index to quantifying heterogeneity of complex networks[J]. Physica A, 2008, 387: 3769-3780.
[20] González-BailónS, Borge-HolthoeferJ, Moreno Y. Broadcasters and hidden influentials in online protest diffusion[J]. Am Behav Sci, 2013, 57(7): 943-965.
[21] ZipfGK. The P1P2/D hypothesis: on the intercity movement of persons[J]. Am Sociol Rev, 1946, 11: 677-686.
[22] Simini F, González M C, Maritan A, et al. A universal model for mobility and migration patterns[J]. Nature, 2012, 484: 96-100.
[23] Liu Y, Sui Z, Kang C, et al. Uncovering patterns of inter-urban trip and spatial interaction from social media check-in data[J]. PLoS One, 2014, 9(1): e86026.
[24] van Bergeijk P A G, Brakman S. The gravity model in international trade: advances and applications[J]. Steven Brakman, 2010,19(5):979-981.
SpatialAnalysisofMicroblogInformationDiffusion
LI Canghai, XU Yitie, LUO Chunhai, HU Haibo
(Department of Management Science and Engineering, East China University of Science andTechnology, Shanghai 200237, China)
To reveal the spatial characteristics of information diffusion, this paper studies the microblog information diffusion among China’s prefecture-level cities utilizing Sina microblog data, and studies the factors influencing the intercity information diffusion using gravity model. We find that a few first and second-tier cities show information monopoly and dominate the output and diffusion of microblog content. The analysis on intercity information interaction models shows that the number of users affects the intercity information diffusion to a large extent, the total GDP of cities can also predict intercity information interaction, and space distance no longer plays a part. The information diffusion in microblog breaks the limit of spatial distance. This study reveals the mapping between online social networks and offline physical space, and the intercity diffusion characteristics of information in social media, which can provide reference for spatial location-related information distribution and online public opinion monitoring.
social network; intercity network; information diffusion; gravity model
1672-3813(2017)03-0075-10;
10.13306/j.1672-3813.2017.03.007
N94
A
2017-03-21;
2017-06-02
國家自然科學基金(61473119);中央高?;究蒲袠I(yè)務(wù)費專項資金(WN1524301)
李滄海(1993-),女,甘肅武威人,碩士研究生,主要研究方向為社會化媒體。
胡海波(1980-),男,山東萊西人,博士,副教授,主要研究方向為社交網(wǎng)絡(luò)與社會化媒體,E-mail:hbhu@ecust.edu.cn。
(責任編輯耿金花)