崔金棟,鄭 鵲,孫 碩
微博信息傳播模型及其演化研究綜述
崔金棟,鄭 鵲,孫 碩
文章針對微博信息建模過程中影響因素眾多、過程復雜現(xiàn)狀,梳理模型構(gòu)建的依據(jù)及其演化脈絡(luò)。文章對現(xiàn)有微博信息模型進行功能解析和演化分析,從節(jié)點自身屬性、鏈接關(guān)系到整體拓撲結(jié)構(gòu)演化的視角,解析微博信息傳播模型中的社會網(wǎng)絡(luò)特征;從傳播模式、傳播影響因素和傳播規(guī)律演化的角度,闡釋微博信息傳播模型的復雜網(wǎng)絡(luò)特性;從傳播預測和傳播控制的視角,揭示微博信息傳播模型的雙重網(wǎng)絡(luò)特質(zhì)。文章提出微博信息傳播模型的演化方向,即微博信息傳播中節(jié)點、節(jié)點鏈接與信息內(nèi)容的融合,復雜網(wǎng)絡(luò)與多重網(wǎng)絡(luò)的融合,微博信息傳播與大數(shù)據(jù)的融合。
微博信息傳播 網(wǎng)絡(luò)結(jié)構(gòu) 傳播規(guī)律 傳播預測
移動互聯(lián)網(wǎng)已經(jīng)成為信息傳播的主要途徑,微博作為一個可以自由發(fā)表觀點和態(tài)度的平臺,具有信息傳播多樣化、信息交互便捷化等特性,同時意味著其信息的傳播具有不可控的屬性。因此,有效監(jiān)管信息的真實性、準確性和時效性,控制不良信息擴散范圍,對規(guī)范網(wǎng)絡(luò)環(huán)境,促進微博平臺健康發(fā)展具有重要意義。
國外對微博信息傳播的研究大都建立在對Twitter研究的基礎(chǔ)上,在微博網(wǎng)絡(luò)結(jié)構(gòu)、傳播機制和傳播模型等方面取得了一定的成果。國內(nèi)對微博信息傳播的研究起步較晚,大多數(shù)是基于目前國內(nèi)最先進、最活躍、用戶數(shù)量最高的新浪微博,對其信息傳播特征、影響因素[1-2]、傳播模式[3]、傳播預測模型和影響力等展開研究[4-5]。然而,學者們普遍從自身的研究角度出發(fā),采用的信息傳播模型側(cè)重點各有不同,研究結(jié)論多樣化。因此,筆者以微博信息傳播功能為視角,在解析微博信息傳播模型演化規(guī)律基礎(chǔ)上,提出未來微博信息傳播的技術(shù)發(fā)展趨勢。
微博作為在線社交平臺,每一個用戶可以視為一個節(jié)點,各個節(jié)點相互關(guān)聯(lián)構(gòu)成整個微博網(wǎng)絡(luò)。為了更加科學且合理地解析微博網(wǎng)絡(luò)結(jié)構(gòu)及其節(jié)點屬性,研究者普遍將復雜網(wǎng)絡(luò)理論、多重網(wǎng)絡(luò)理論和社會網(wǎng)絡(luò)分析法作為基礎(chǔ)支撐理論。
復雜網(wǎng)絡(luò)是復雜性理論的分支,具有結(jié)構(gòu)復雜、節(jié)點多樣、網(wǎng)絡(luò)結(jié)構(gòu)多變等特征,是抽象于復雜系統(tǒng)的框架性表示形式[6],主要特征包括:(1)由多個節(jié)點或子系統(tǒng)組成;(2)易受外界環(huán)境影響,并與外界不斷進行物質(zhì)、能量和信息交換;(3)在特定情況下,網(wǎng)絡(luò)內(nèi)的節(jié)點之間存在某種鏈接關(guān)系,并且互相作用,從而給彼此帶來影響;(4)節(jié)點間的相互作用和整個系統(tǒng)存在某種復雜的非線性關(guān)系。在理論研究方面,復雜網(wǎng)絡(luò)主要運用圖論和統(tǒng)計物理作為理論支撐,深入探討網(wǎng)絡(luò)拓撲結(jié)構(gòu)及其特性[7]。20世紀末小世界網(wǎng)絡(luò)和無標度網(wǎng)絡(luò)被發(fā)現(xiàn),并通過實例論證真實世界網(wǎng)絡(luò)同時擁有小世界網(wǎng)絡(luò)屬性和無標度網(wǎng)絡(luò)屬性,并非以往認知中的規(guī)則網(wǎng)絡(luò)或隨機網(wǎng)絡(luò),因此科學家將擁有這兩種屬性的網(wǎng)絡(luò)統(tǒng)稱為復雜網(wǎng)絡(luò)[7]。隨著對復雜網(wǎng)絡(luò)認知的深入,研究快速發(fā)展。目前相關(guān)理論研究趨于完善,主要將其運用到其它學科領(lǐng)域。
隨著對微博網(wǎng)絡(luò)研究的深入,學者們發(fā)現(xiàn)微博網(wǎng)絡(luò)不僅僅是一個單層次復雜網(wǎng)絡(luò),因此提出多重網(wǎng)絡(luò)(Multiplex Network)概念,即在一個網(wǎng)絡(luò)結(jié)構(gòu)中具有多層網(wǎng)絡(luò),每層網(wǎng)絡(luò)的參與節(jié)點相同[8-12],但不同節(jié)點之間的鏈接屬性存在一定的差異。多重網(wǎng)絡(luò)可以看作是一種多個平行網(wǎng)絡(luò)層動態(tài)相互耦合的網(wǎng)絡(luò),各子網(wǎng)絡(luò)層間具有一定的關(guān)聯(lián)性。多重網(wǎng)絡(luò)亦稱為多層次網(wǎng)絡(luò)、相互依賴網(wǎng)絡(luò)、多關(guān)系網(wǎng)絡(luò)[13-14]。多重網(wǎng)絡(luò)作為特殊的相互作用的網(wǎng)絡(luò),它的結(jié)構(gòu)和動態(tài)演化過程受到越來越多的關(guān)注,研究者從多角度在多個學科領(lǐng)域?qū)ζ湔归_研究[15-16]。通過研究多重網(wǎng)絡(luò)的內(nèi)部屬性,節(jié)點之間的鏈接關(guān)系等,可實現(xiàn)對子網(wǎng)絡(luò)之間相互影響和動態(tài)關(guān)系的挖掘;亦可運用多重網(wǎng)絡(luò)對微博網(wǎng)絡(luò)進行仿真,探索微博網(wǎng)絡(luò)結(jié)構(gòu)的內(nèi)部屬性和傳播規(guī)律。
從實踐角度看,社會網(wǎng)絡(luò)分析(SocialNetwork Analysis)是一種解析社會網(wǎng)絡(luò)結(jié)構(gòu)及其屬性的技術(shù)方法;從理論視角來說,亦可以視作一種結(jié)構(gòu)分析思想[17]。社會網(wǎng)絡(luò)分析法將整個網(wǎng)絡(luò)看作由若干個節(jié)點構(gòu)成,每個節(jié)點之間有一定的鏈接關(guān)系,網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)的鏈接關(guān)系決定了信息的傳播路徑及其特征[18]。社會網(wǎng)絡(luò)分析法通常用于分析不同社會單位(個人、群體)乃至整個社會網(wǎng)絡(luò)結(jié)構(gòu)內(nèi)的個體和整體的屬性以及節(jié)點的鏈接關(guān)系特征[18],其中個體屬性主要涵蓋點度中心性、中間中心性和接近中心性[19]。點度中心性指在網(wǎng)絡(luò)結(jié)構(gòu)中某個節(jié)點與其他節(jié)點的關(guān)聯(lián)程度,直接關(guān)聯(lián)的數(shù)量決定該節(jié)點成為中心節(jié)點的概率[20];中間中心性指通過衡量節(jié)點之間占有信息和資源的程度,從而實現(xiàn)評估網(wǎng)絡(luò)中心性的目的;而接近中心性則主要用來比較分析節(jié)點之間的差異性,節(jié)點差異值表示了節(jié)點接近網(wǎng)絡(luò)核心的距離。常見的社會網(wǎng)絡(luò)分析軟件有Ucinet、Pajek、Netminer等。
這三個基礎(chǔ)理論是開展微博傳播研究的基石,也是微博信息建模的出發(fā)點。筆者以上述理論為主線對微博傳播模型及其演化進行闡述,總結(jié)現(xiàn)有成果的不足以及技術(shù)發(fā)展趨勢。
微博信息傳播的主體主要由傳播者、信息、接收者構(gòu)成。在微博信息傳播的研究過程中通常將傳播者和接收者(即用戶)看作節(jié)點,用戶的相互關(guān)注視作節(jié)點關(guān)聯(lián)形成的邊,把整個微博網(wǎng)絡(luò)抽象成一種有向網(wǎng)絡(luò)圖。因此,節(jié)點自身屬性、節(jié)點鏈接關(guān)系和網(wǎng)絡(luò)拓撲結(jié)構(gòu)的演化是挖掘傳播過程中關(guān)鍵節(jié)點的重要因素。
節(jié)點自身屬性是識別微博網(wǎng)絡(luò)關(guān)鍵節(jié)點的重要因素,分析節(jié)點自身屬性,計算節(jié)點權(quán)重值,從而識別關(guān)鍵節(jié)點是學界普遍采用的方法。權(quán)重值越大,作為關(guān)鍵節(jié)點的概率就越大。早期模型中,節(jié)點權(quán)重值計算方法主要通過對不同節(jié)點自身屬性進行對比,將用戶微博貢獻值、社會影響力等作為指標,進行權(quán)重值計算。這類方法最大的不足在于準確度低、時間復雜度高。隨后研究者發(fā)現(xiàn)節(jié)點傳播影響力對識別關(guān)鍵節(jié)點具有重要作用,因此,將信息擴散廣度、速度和深度作為評價用戶傳播影響力的指標,分別賦予權(quán)重系數(shù),構(gòu)建基于WSD-Rank算法的傳播影響力模型。與傳統(tǒng)PageRank算法對比,這種算法對節(jié)點傳播影響力的表達更加直接,提高了適用性[21]。隨著拓撲結(jié)構(gòu)研究的融入,學者基于拓撲結(jié)構(gòu)將緊密中心度和介數(shù)中心度作為評價指標衡量節(jié)點傳播影響力,但這種方法僅從節(jié)點自身屬性出發(fā),忽略了節(jié)點鏈接關(guān)系帶來的影響,缺少整體性,準確度低[22]。因此,后續(xù)模型將近似計算節(jié)點和邊的中介中心性作為識別關(guān)鍵節(jié)點的評價指標,基于Brandes算法,執(zhí)行Betweenness算法,最終求出每個節(jié)點的唯一中介性值。這種方法不僅提高了計算效率,而且提升了識別準確度[23]。
構(gòu)建信息傳播模型也是研究節(jié)點自身屬性的常用方法之一。研究者在獨立級聯(lián)模型(IC)和線性閾值模型兩個經(jīng)典模型的基礎(chǔ)上,提出遞減級聯(lián)、DRUC等演化模型。遞減級聯(lián)模型認為,在傳播過程中,隨著時間的推進,節(jié)點之間的傳播概率會逐漸下降。DRUC(Decaying Reinforced User-Centric)模型是在線性閾值模型的基礎(chǔ)上,結(jié)合信息內(nèi)容和用戶輪廓,綜合考慮用戶興趣度、接收者傳播意愿和被感染的鄰居節(jié)點三個因素的反作用。但是,獨立級聯(lián)模型和線性閾值模型及其演化模型的最大缺陷在于:模型構(gòu)建的前提是假設(shè)任意兩個節(jié)點之間的信息傳播時間是相同的,整個傳播過程是離散的、同步的。然而在實際的傳播過程中,任意兩個節(jié)點之間的傳播時間是有差異的,整個傳播過程是連續(xù)的、不同步的。因此,通過引入傳播延遲時間,提出AsIC(Asynchronous IC Model)非同步模型(如圖 1),即在對傳播主體特征(影響力、權(quán)威度和活躍度)、傳播客體特征(傳播意愿)和傳播的信息特征(情感屬性、是否包含URL鏈接、是否包含標簽)進行討論分析后,構(gòu)建基于AsIC模型的細粒度社會網(wǎng)絡(luò)信息傳播模型[24]。實證表明該模型提升了信息傳播過程中的預測準確率。
圖1 IC模型和AsIC模型
節(jié)點鏈接關(guān)系表示兩個節(jié)點之間相互作用所產(chǎn)生的對彼此的影響。不同節(jié)點的鏈接關(guān)系不同,對微博信息傳播的影響和作用也不同?,F(xiàn)有的節(jié)點鏈接關(guān)系算法大多從PageRank算法演化而來,比較成功的演化算法有TwitterRank算法、SpreadRank算法。TwitterRank算法通過融入話題影響力、關(guān)注關(guān)系網(wǎng)絡(luò)、用戶發(fā)布微博數(shù)量和用戶興趣相似度等影響因子,提高識別話題的敏感度;SpreadRank算法將轉(zhuǎn)發(fā)時間間隔作為影響因子,并考慮不同用戶在傳播過程中的級別,提升影響力計算的準確度[25-26]。
節(jié)點鏈接關(guān)系最直接的表現(xiàn)就是節(jié)點之間的關(guān)注度,因此可運用程度中心法衡量節(jié)點的直接關(guān)注度。直接關(guān)注度越高,成為關(guān)鍵節(jié)點的概率就越大。但是,這種方法只考慮節(jié)點的局部環(huán)境,忽視其他間接關(guān)聯(lián)節(jié)點的影響作用?;诖?,有學者提出了接近中心法,將節(jié)點與其他節(jié)點的最短路徑和作為衡量指標,最短路徑和越短,接近中心度就越高,成為關(guān)鍵節(jié)點的概率越大。雖然與程度中心法相比,接近中心法的準確度和整體性都有所提升,但這種算法的約束性和計算復雜度很高,必須在所有節(jié)點完全相連的網(wǎng)絡(luò)中才能夠執(zhí)行。為解決該問題,在同質(zhì)節(jié)點的所有子網(wǎng)絡(luò)中引入超級節(jié)點,這些超級節(jié)點令整個網(wǎng)絡(luò)內(nèi)的所有節(jié)點完全相連,然后運用接近中心法計算節(jié)點最短路徑和。這種方法不僅突破了原算法的約束性,而且提高了適用性,可以分別從全網(wǎng)絡(luò)、同質(zhì)子網(wǎng)絡(luò)、異質(zhì)子網(wǎng)絡(luò)進行測量,算法更加全面合理[27],見圖2。
圖2 基于節(jié)點鏈接關(guān)系的判定方法及其演化
網(wǎng)絡(luò)作為微博信息傳播的載體,它的屬性對微博信息傳播的影響大。因此,分析網(wǎng)絡(luò)拓撲結(jié)構(gòu)屬性,或通過構(gòu)建網(wǎng)絡(luò)拓撲結(jié)構(gòu)找出信息傳播規(guī)律是重要的研究方向。通過分析微博社會網(wǎng)絡(luò)中心性,發(fā)現(xiàn)當信息敏感度超越某個臨界點,關(guān)鍵節(jié)點影響力將會隨著敏感度的提升而減弱[28],因此,精準、及時識別關(guān)鍵節(jié)點對控制事件的傳播擴散具有重要作用。以突發(fā)性事件的傳播作為研究對象,分析事件發(fā)展的時間階段特性,采用鄰接矩陣的方式表示節(jié)點和邊,構(gòu)建信息傳播網(wǎng)絡(luò)拓撲結(jié)構(gòu),為找出控制事件惡性發(fā)展的關(guān)鍵時間和節(jié)點提供有效手段[29]。雖然這種方法能有效識別關(guān)鍵節(jié)點,但不具有通用性。因此,構(gòu)建兩個雙向“關(guān)注”網(wǎng)絡(luò),通過分析網(wǎng)絡(luò)的中心性指標(節(jié)點度、緊密度、介數(shù)、K-核),證實節(jié)點中心性指標的差異給信息傳播的深度和廣度帶來的影響有所不同,而緊密度和K-核指標的應用提高了尋找網(wǎng)絡(luò)核心節(jié)點的準確度[30]。隨著研究及學科之間交互作用的深化,借鑒社會物理學思想,以微博信息傳播網(wǎng)絡(luò)特征向量為出發(fā)點,將傳播過程中的影響因素以及傳播模式類比作動力學變量,從而建立微觀動力學方程:
公式1中Xi(t)表示t時刻用戶獲取信息繼續(xù)傳播的概率;v0表示信息價值;e-λix(t-t)表示信息關(guān)注程度;其余部分表示時效性以及參與信息傳播的用戶比例。此模型說明信息價值與信息關(guān)注度、被傳播的概率成正向相關(guān)關(guān)系。信息關(guān)注度越高,用戶繼續(xù)傳播的可能性也就越大[31]。
復雜網(wǎng)絡(luò)的信息傳播動力(即網(wǎng)絡(luò)內(nèi)信息的傳播形態(tài))機制研究一直是微博網(wǎng)絡(luò)研究的熱點問題。區(qū)別于人人網(wǎng)等熟人關(guān)系網(wǎng)絡(luò),微博的公開性令其成為一種由信息推動的弱關(guān)系網(wǎng)絡(luò)。弱關(guān)系型網(wǎng)絡(luò)最明顯的特征就是用戶之間的關(guān)系可以是單向的。單向關(guān)聯(lián)關(guān)系的優(yōu)勢在于令網(wǎng)絡(luò)內(nèi)的節(jié)點互聯(lián)性更優(yōu)、網(wǎng)絡(luò)結(jié)構(gòu)更加緊密。微博網(wǎng)絡(luò)存在較多單向關(guān)聯(lián)關(guān)系,促使其信息傳播路徑更長,傳播速度更快,具有很明顯的小世界網(wǎng)絡(luò)特質(zhì),符合六度分隔理論[32]。在此基礎(chǔ)上,研究者對信息轉(zhuǎn)發(fā)的傳播動力模式進行研究,將其分為三種傳播模式(見圖3):(1)單關(guān)鍵點型,傳播速度快,傳播節(jié)點大多數(shù)是強勢節(jié)點;(2)鏈式型,傳播范圍小,影響力?。?3)多關(guān)鍵點型,在傳播過程中需要大量的強勢節(jié)點和關(guān)聯(lián)中介節(jié)點,傳播范圍廣,影響力較大。這種分類方式略為粗糙,在詳細分析新浪微博若干個熱點信息的傳播動力模式后,發(fā)現(xiàn)其主要傳播動力模式有七類:波紋型、蒲公英型、菌落型、煙花型、蜂巢型、雙子星型、隨機引爆型,其中比較普遍的是波紋型和蒲公英型。
圖3 信息轉(zhuǎn)發(fā)傳播模式
時間、用戶行為特征、發(fā)布的信息都有可能引起微博信息傳播網(wǎng)絡(luò)結(jié)構(gòu)的演化,從而給信息傳播帶來影響。因此,筆者從網(wǎng)絡(luò)結(jié)構(gòu)整體屬性、局部屬性以及演化時間規(guī)律三方面分析影響網(wǎng)絡(luò)結(jié)構(gòu)演化的主要因素。
小世界、無標度特性通常被用來形容復雜網(wǎng)絡(luò)的整體宏觀結(jié)構(gòu)。正是因為這些特性,微博網(wǎng)絡(luò)在演化進程中,存在擇優(yōu)連接的現(xiàn)象,即節(jié)點粉絲數(shù)量越多,被新節(jié)點關(guān)注的概率就越大[33]。因此,將節(jié)點被新節(jié)點連接的概率P(ki)表示為:
其中,ki是節(jié)點i的度值。除了這種擇優(yōu)連接現(xiàn)象,微博平臺會通過相關(guān)規(guī)則實行推薦機制,包括推薦好友、推薦微博信息等隨機因素,所以網(wǎng)絡(luò)內(nèi)還擁有大量的隨機連接。將擇優(yōu)和隨機模式融入無標度網(wǎng)絡(luò)模型,則節(jié)點被新節(jié)點連接的概率表示為:
其中αi為吸引力因子;ρ為可調(diào)參數(shù),取決于擇優(yōu)和隨機的權(quán)重,當ρ較小時擇優(yōu)權(quán)重占優(yōu),反之隨機占優(yōu)。從公式3可以看出,節(jié)點被新節(jié)點連接的概率取決于網(wǎng)絡(luò)的隨機性、節(jié)點的度和吸引力。節(jié)點度值大、吸引力高,被連接可能性就非常大;節(jié)點度值小,吸引力高,被連接的可能性會較高。這類節(jié)點通常指新注冊的社會名人,或是受一些事件影響突然成為焦點的普通用戶;節(jié)點度值大、吸引力低,被連接的概率小,如名人退出微博平臺,不再發(fā)表信息,其吸引力隨之會迅速減弱;節(jié)點度值小、吸引力低,則被連接的概率更低,這類節(jié)點普遍是粉絲數(shù)量較少的普通用戶。
(1)共同鄰居節(jié)點的影響。對真實網(wǎng)絡(luò)進行實證分析,結(jié)果表明陌生節(jié)點是否能建立聯(lián)系,與它們的共同鄰居節(jié)點有很大關(guān)系[34]。共同鄰居節(jié)點越多,建立直接聯(lián)系的可能性就越大。在微博網(wǎng)絡(luò)中,可以將兩個互相關(guān)注節(jié)點看作是一個子網(wǎng)絡(luò),則微博信息傳播過程是由若干個子網(wǎng)絡(luò)所構(gòu)成的網(wǎng)絡(luò)結(jié)構(gòu),子網(wǎng)絡(luò)數(shù)量越多,共同鄰居節(jié)點越多,延長信息傳播路徑、擴大信息傳播廣度的幾率就越高。
(2)共同屬性的影響。在微博網(wǎng)絡(luò)內(nèi),具有共同屬性(相同興趣、職業(yè)等)的節(jié)點往往會形成一個小集體網(wǎng)絡(luò)。很顯然,小集體網(wǎng)絡(luò)內(nèi)原本陌生的兩個節(jié)點變成互相關(guān)注鏈接關(guān)系的概率將會大大增加。共同屬性的存在驅(qū)動著小集體網(wǎng)絡(luò)的構(gòu)建,提高了節(jié)點之間的直接聯(lián)系概率,進而促進微博信息的傳播。
(3)鍍金效應。鍍金效應是指在微博網(wǎng)絡(luò)中借助其他用戶力量來提高自身影響力的行為。具體做法就是將增加粉絲數(shù)量作為共同目的進行用戶之間的互相推薦,或是通過與名人互動,吸引名人的關(guān)注、評論和轉(zhuǎn)發(fā),從而獲得關(guān)注量,提升自身影響力。鍍金效應的前提在于用戶活躍度以及發(fā)布的信息價值。信息價值高,鍍金效應發(fā)生的概率就較大,擴大信息傳播范圍的概率就越大。
網(wǎng)絡(luò)結(jié)構(gòu)的演化不是一種穩(wěn)定的結(jié)構(gòu)變動。用戶的活躍時間分布情況、突發(fā)事件的發(fā)生等不確定性因素都會對信息源節(jié)點的網(wǎng)絡(luò)結(jié)構(gòu)帶來一定的影響。經(jīng)統(tǒng)計分析,用戶活躍度日高峰期處于 11:00-12:00、17:00-18:00、22:00-23:00三個時間段,周高峰期則在周五、周六、周日三天。由此可見,活躍度高峰期幾乎處在用戶的休息時段內(nèi)。通過對微博網(wǎng)絡(luò)的演化情況進行監(jiān)測,發(fā)現(xiàn)在高峰期演化較快,低谷期則比較平穩(wěn)。突發(fā)性事件作為影響網(wǎng)絡(luò)結(jié)構(gòu)演化的一種不確定因素,一般會經(jīng)歷三個時期:醞釀期、飛漲期、消退期。從以往的調(diào)查數(shù)據(jù)可以看出,事件發(fā)生后較短時間內(nèi),信息轉(zhuǎn)發(fā)量和信息相關(guān)節(jié)點的關(guān)注度會暴增,從而令整個網(wǎng)絡(luò)結(jié)構(gòu)發(fā)生顯著變化。
微博信息傳播模型多數(shù)是基于SIR模型所構(gòu)建的。根據(jù)動力學方法構(gòu)建的SIR模型,早期主要用于病毒傳播及其發(fā)展規(guī)律的定量研究;后期則用于研究信息傳播,并逐漸成為應用最廣泛的模型之一。SIR模型將S定義為易感染節(jié)點,I定義為傳染節(jié)點,R定義為免疫節(jié)點,每個節(jié)點都有可能變?yōu)檫@三種類型之一。但是,SIR模型的最大不足在于,它的假設(shè)前提是網(wǎng)絡(luò)內(nèi)用戶總數(shù)量不變,易感染節(jié)點變?yōu)閭魅竟?jié)點和傳染節(jié)點變?yōu)槊庖吖?jié)點概率值都是固定的;并且只考慮隨時間的變化節(jié)點之間內(nèi)在因素的影響,忽略了外部環(huán)境影響因素,因此出現(xiàn)了SIR模型的演化模型。
(1)融入新影響因素的SIR模型。SIR模型是一種單向傳染機制,但是真正的傳染方式是雙向的、不固定的。因此,將遺忘機制(可能將感染節(jié)點和免疫節(jié)點變成易感染節(jié)點)和遏制機制(可能將感染節(jié)點轉(zhuǎn)變成免疫節(jié)點)作為影響信息傳播的重要因素融入SIR模型(見圖4),依據(jù)此模型所構(gòu)建的微分動力學方程如公式4所示。
通過計算節(jié)點密度變化趨勢及傳播速率,發(fā)現(xiàn)遺忘機制和遏制機制對信息傳播具有顯著的影響作用[35]。由于網(wǎng)絡(luò)社會因素同樣會給傳播路徑帶來影響,所以將社會加強因素融入,提出CSR(在線社交網(wǎng)絡(luò)謠言傳播)模型,但CSR模型的針對性較強,不具有通用性。因此,通過更新傳播規(guī)則,運用動力學方程,融入個人接受閾值,提出一種基于移動社交網(wǎng)絡(luò)的謠言傳播模型[36],該模型驗證了信息在均勻網(wǎng)絡(luò)結(jié)構(gòu)中的傳播速率更快。但是,上述研究都將拓撲結(jié)構(gòu)置于規(guī)則網(wǎng)絡(luò)中,與實際的網(wǎng)絡(luò)結(jié)構(gòu)有一定的差異,研究結(jié)果缺少實用性。因此,有學者加入用戶相對影響力因子來構(gòu)建RWSIR模型,通過引入節(jié)點轉(zhuǎn)化概率系數(shù)λ,并在隨機網(wǎng)絡(luò)、小世界網(wǎng)絡(luò)、無標度網(wǎng)絡(luò)中進行仿真分析,研究結(jié)果顯示RWSIR模型與實際的微博信息傳播過程更加貼合[37]。
(2)SIR模型節(jié)點形態(tài)的演化。通過改進節(jié)點形態(tài)而構(gòu)建的SIR演化模型有SEIR、SIRS和SEIRS等。這些模型依據(jù)不同研究方向和目的,通過融入潛在節(jié)點E或是改變節(jié)點感染流程進而改良SIR模型。另外,為了研究信息傳播周期、傳播速度、傳播深度與節(jié)點狀態(tài)的關(guān)系,研究者將傳播節(jié)點分為S態(tài)(易感染用戶)、Ia態(tài)(感染用戶,且與傳播者觀點一致)、Id態(tài)(感染用戶,與傳播者觀點不一致)和R態(tài)(免疫用戶),依據(jù)經(jīng)典SIR微分方程推導原理,計算節(jié)點感染概率、信息忽略概率和感染用戶衰減度。實證結(jié)果表明,信息傳播過程中的初始節(jié)點感染率越高,傳播速度越快;信息忽略概率越高,被感染用戶越少;已感染用戶衰減速率越快,傳播周期越短,傳播范圍越小[38]。亦有為研究信息傳播有效率和節(jié)點規(guī)模大小的影響程度,將節(jié)點分為S態(tài)(未收到信息)、I態(tài)(收到信息,確定會繼續(xù)傳播),IR態(tài)(收到信息,不確定是否會繼續(xù)傳播)和R態(tài)(收到信息,確定不會繼續(xù)傳播)四種形態(tài),從網(wǎng)絡(luò)結(jié)構(gòu)特征、信息屬性和用戶主觀差異性進行分析,通過模型仿真,認為這兩種因素對信息傳播的速度和深度產(chǎn)生的影響可以忽略不計[39]。SIR演化模型在挖掘微博信息傳播模式和傳播規(guī)律的研究中取得了突破性的進展。
微博網(wǎng)絡(luò)可以看作是由線上網(wǎng)絡(luò)和線下網(wǎng)絡(luò)構(gòu)成的一種多重網(wǎng)絡(luò),線上網(wǎng)絡(luò)由微博平臺內(nèi)的節(jié)點用戶構(gòu)成,線下網(wǎng)絡(luò)由現(xiàn)實世界的微博用戶構(gòu)成。因此,基于多重網(wǎng)絡(luò)對線上網(wǎng)絡(luò)開展傳播預測研究,為線下網(wǎng)絡(luò)制定信息傳播控制策略提供依據(jù);對線下網(wǎng)絡(luò)進行微博信息傳播控制研究,為網(wǎng)絡(luò)環(huán)境安全提供保障。
圖4 SIR經(jīng)典模型及其演化
早期的線上網(wǎng)絡(luò)微博信息傳播預測模型主要對用戶的轉(zhuǎn)發(fā)行為、信息的傳播路徑進行預測分析,將用戶名、直接鏈接節(jié)點數(shù)量、信息內(nèi)容等特征作為預測指標。若預測指標過少,預測精度難以保證;當預測指標數(shù)量滿足條件時,雖提高了精確度,但由于特征向量過多,量化處理非常復雜,難以達到預測目的。因此,一種信息傳播路徑級聯(lián)概率模型出現(xiàn)了。通過運用貝葉斯網(wǎng)絡(luò)、樸素葉貝斯和邏輯回歸三種經(jīng)典算法,分析影響用戶轉(zhuǎn)發(fā)行為的相關(guān)因素,從而實現(xiàn)用戶轉(zhuǎn)發(fā)行為和傳播路徑的預測,實驗證明該模型預測精度比較理想[40]。隨著研究的深入,最初運用的判定樹、貝葉斯、樸素葉貝斯、邏輯回歸等經(jīng)典算法已經(jīng)不能滿足微博信息傳播預測研究的需要。基于此,學者提出了一種改良的決策樹算法——隨機森林微博轉(zhuǎn)發(fā)預測算法,其構(gòu)建過程如圖5所示。通過提取重要特征,加入用戶間微網(wǎng)絡(luò)關(guān)系和用戶權(quán)重等系數(shù),預測用戶的轉(zhuǎn)發(fā)行為,實驗證明隨機森林微博轉(zhuǎn)發(fā)預測算法性能高于其他經(jīng)典算法,并取得較高的預測精度[41]。
圖5 隨機森林微博轉(zhuǎn)發(fā)預測算法的構(gòu)建過程
由于微博網(wǎng)絡(luò)的特殊性,一旦不良信息形成爆發(fā)式傳播,將對微博平臺、網(wǎng)絡(luò)環(huán)境帶來諸多不利影響。微博信息傳播研究的最終目的就是為了控制微博信息傳播的流向和流速,因此,對控制策略的制定和實施方式進行研究具有重要意義。微博信息控制策略模式分為個體式、分割式、誘導式以及改變式四類[42]。最初的微博信息傳播控制研究提出一種隨機控制策略,其缺點在于如果想要達到控制的目的,需要選取的控制節(jié)點數(shù)量過于龐大。為了解決這一問題,學者提出了一種目標控制策略,然而微博網(wǎng)絡(luò)的巨大規(guī)模令目標控制同樣難以實現(xiàn)。因此熟人控制策略應運而生,熟人控制策略將隨機控制策略和目標控制策略相融合,首先運用隨機策略選取部分節(jié)點,然后找到與其相關(guān)聯(lián)的鄰居節(jié)點,最后對部分鄰居節(jié)點采取目標控制策略。仿真分析驗證了這種方法不僅容易實現(xiàn),而且實施效果非常理想[43]。博弈論是一種研究特定條件下,個體如何選取令自己收益最大化的策略的理論。借鑒博弈論思想,分析信息傳播策略演化,計算遇到突發(fā)事件時采取不同策略分別可能獲取的收益,可為控制微博信息的惡意傳播,制定適合事件良性發(fā)展和演化的最優(yōu)策略提供依據(jù)。仿真分析結(jié)果顯示,參與傳播用戶多、爆發(fā)時間長并且規(guī)模較大的群體事件更加適合透明公開處理;參與傳播用戶少、爆發(fā)時間短并且在未變?yōu)闊狳c事件前可適當對信息進行屏蔽處理[44]。
從微博信息傳播模型及其演化看出,研究側(cè)重點主要集中在微博傳播節(jié)點屬性和傳播路徑屬性,卻忽略了關(guān)鍵主體——信息。在微博傳播過程中,信息可以劃分為多種類型,不同類型信息的傳播路徑、影響力等都會存在較大的差異。不僅節(jié)點之間存在鏈接關(guān)系,節(jié)點與信息內(nèi)容同樣有一定的聯(lián)系,節(jié)點用戶的心理行為、關(guān)注信息的類別、發(fā)布信息的類型等都關(guān)聯(lián)著不同的信息屬性。由于微博網(wǎng)絡(luò)可看作由多個子網(wǎng)絡(luò)構(gòu)成,所以信息屬性與子網(wǎng)絡(luò)的匹配度、信息在傳播過程中的演化等問題同樣是微博傳播研究的重要方向。劃分微博信息類別,構(gòu)建指標體系來評估信息差異性以及其在傳播過程中帶來的影響,不僅可促進信息傳播特征以及傳播機制的挖掘深度,而且可為制定信息調(diào)控監(jiān)管策略、規(guī)范微博網(wǎng)絡(luò)環(huán)境提供更可靠的依據(jù)。
現(xiàn)實微博網(wǎng)絡(luò)的復雜性,線上線下的多重關(guān)系,子網(wǎng)絡(luò)結(jié)構(gòu)鏈接關(guān)系的差異性,用戶的個性化特征、信息的多種類別都給微博網(wǎng)絡(luò)的屬性增添了復雜性。運用單一的網(wǎng)絡(luò)結(jié)構(gòu)研究微博信息傳播顯然不夠貼合實際,研究成果現(xiàn)實適用性并不強。因此,運用大數(shù)據(jù)解析微博網(wǎng)絡(luò)的基本特征,并引入復雜網(wǎng)絡(luò)與多重網(wǎng)絡(luò)的理念,令整個微博網(wǎng)絡(luò)既具有小世界和無標度等復雜網(wǎng)絡(luò)的特性,同時又兼具多重網(wǎng)絡(luò)的線上線下網(wǎng)絡(luò)結(jié)構(gòu)特性。從微博網(wǎng)絡(luò)的整體性來看,將微博傳播規(guī)律研究與預測控制研究相融合,不僅令所構(gòu)建的網(wǎng)絡(luò)結(jié)構(gòu)模型更貼合實際,而且可通過網(wǎng)絡(luò)結(jié)構(gòu)的整體性研究,進一步提升信息傳播的路徑及其演化規(guī)律的準確度。從微博子網(wǎng)絡(luò)角度來看,將線上網(wǎng)絡(luò)與復雜網(wǎng)絡(luò)融合,對網(wǎng)絡(luò)結(jié)構(gòu)自身特性及其復雜性進行研究,有利于拓展微博信息傳播研究深度,進一步提升預測精度,使成果應用更具實踐價值;將線下網(wǎng)絡(luò)與復雜網(wǎng)絡(luò)融合,優(yōu)化控制策略方案,提高控制策略實施點的精準度,可為微博信息監(jiān)管調(diào)控提供更可靠的依據(jù)。
隨著大數(shù)據(jù)技術(shù)的飛速崛起,將大數(shù)據(jù)技術(shù)與微博信息傳播管理相融合,不僅為研究微博信息傳播提供了新的研究工具,而且為傳播監(jiān)管提供重要的技術(shù)支持(見圖6)。在理論研究方面,運用大數(shù)據(jù)技術(shù),分析歸納總結(jié)微博信息傳播主要影響因素、關(guān)鍵路徑等,為理論研究提供準確度更高的實踐依據(jù)。在實踐應用方面,運用大數(shù)據(jù)技術(shù),解析整個微博網(wǎng)絡(luò)結(jié)構(gòu)所有因子的屬性,從中找到每一類因子的共通特性,以此為基礎(chǔ)識別用戶性質(zhì),嚴加監(jiān)管“水軍”類型用戶,甚至可將其設(shè)置為黑名單用戶。同時,利用大數(shù)據(jù)識別信息性質(zhì),辨別虛假消息并進行相應的封閉處理。最后,可利用大數(shù)據(jù)預測信息傳播路徑以及用戶轉(zhuǎn)發(fā)行為,實現(xiàn)對輿論信息爆炸性傳播的有效控制。
圖6 基于大數(shù)據(jù)的微博信息傳播
[1]崔金棟,于圓美,王新媛,等.信息管理技術(shù)視角下微博研究綜述與趨勢分析[J].圖書館論壇,2015(4):92-99.
[2]袁毅.微博客信息傳播結(jié)構(gòu)、路徑及其影響因素分析[J].圖書情報工作,2011(12):26-30.
[3]劉繼,李磊.基于微博用戶轉(zhuǎn)發(fā)行為的輿情信息傳播模式分析[J].情報雜志,2013(7):74-77,63.
[4]馬捷,孫夢瑤,尹爽,等.微博信息生態(tài)鏈構(gòu)成要素與形成機理[J].圖書情報工作,2012(18):73-77.
[5]張海濤,宋拓,張連峰,等.基于信息內(nèi)容與信息屬性的微博熱點信息生態(tài)化的實現(xiàn)研究[J].圖書情報工作,2014(15):123-127.
[6]方錦清,畢橋.統(tǒng)計物理與網(wǎng)絡(luò)科學面臨的若干挑戰(zhàn)與思考[J].復雜系統(tǒng)與復雜性科學,2010(4):29-38.
[7] 劉建香.復雜網(wǎng)絡(luò)及其在國內(nèi)研究進展的綜述[J].系統(tǒng)科學學報,2009(4):31-37.
[8]Peter J M,Thomas R,Kevin M,et al.Community structure in time-dependent,multiscale,and multiplex networks[J].Science,2010,328:876-878.
[9]Kyu-MinL,CharlesD.Brummitt,K.I.Goh.Threshold cascades with responseheterogeneity in multiplex networks[J].Physical Review E Statistical Nonlinear&SoftMatterPhysics,2014,90 (6):062816.
[10]Gomez-Gardenes J, Rrinares I, Arenas A, et al.Evolution of cooperation in multiplex networks[J].ScientificReports,2012,2:620.
[11]GiuliaM,DanielR,PietroP,et al.Weightedmultiplex networks[J].PlosOne,2014,9 (6):e97857.
[12]Nicosia V,Bianconi G,Latora V,et al.Growing multiplex networks[J].PhyscialReview Letters,2013,111(5):058701.
[13]BoccalettiS,BianconiG,CriadoR,et al.The structure and dynamicsofmultilayer networks[J].PhysicsReports,2014,544 (1):1-122.
[14]Mostafa S,Rajesh S,Moreno M,et al.Spreading processesin multilayer networks[J].IEEE Transactionson Network Science and Engineering, 2015, 2 (2) :65-83.
[15]Federico B,Vincenzo N,Vito L.Structural measures for multiplex networks[J].Physical Review E Statistical Nonlinear&Soft Matter Physics, 2014, 89 (3) :032804.
[16]Azimi-Tafreshi N,Gomez-Gardenes J,Dorogovtsev S N.K-core percolation on multiplex networks[J]Physical Review E Statistical Nonlinear&Soft Matter Physics,2014,90 (3):032816.
[17]H X WU,M JXIN.Aquick emergencyresponsemodel for micro-blog public opinion crisis oriented to mobile Internetservices:Design and implementation[J].Advances in Intelligent and Soft Computing,2012,7(6):1-7.
[18]周秀云,婁策群.信息生態(tài)群落演替的概念、過程與特征[J].情報理論與實踐,2011(6):12-14.
[19]吳少華,崔鑫,胡勇.基于SNA的網(wǎng)絡(luò)輿情演變分析方法[J].四川大學學報(工程科學版),2015(1):138-142.
[20]Rafa D,Jan S,Wojciech F.The application of social networkanalysisalgorithmsin asystem supportingmoney laundering detection[J].Information Sciences, 2015,295:18-32.
[21]蔣侃,唐竹發(fā),隋浩.基于微博信息擴散質(zhì)量的網(wǎng)絡(luò)輿情關(guān)鍵節(jié)點識別[J].情報科學,2016(7):64-69.
[22]鐘杰,陳興蜀,王文賢,等.面向微博話題傳播的重要節(jié)點測量研究[J].計算機應用研究,2016(8):2290-2293.
[23]鄧小龍,李欲曉.面向應急管理的大圖重要節(jié)點中介度高效近似計算方法[J].系統(tǒng)工程理論與實踐,2015(10):2531-2543.
[24]周東浩,韓文報,王勇軍.基于節(jié)點和信息特征的社會網(wǎng)絡(luò)信息傳播模型[J].計算機研究與發(fā)展,2015(1):156-166.
[25]Z Y DING,Y JIA,B ZHOU,et al.Measuring the spreadabilityofusersin microblogs[J].JournalofZhejiang UniversitySCIENCEC ,2013,14(9):701-710.
[26]袁毅,楊成明.微博客用戶交流的機制、結(jié)構(gòu)及特征研究[J].圖書館論壇,2010(6):82-86.
[27]武澎,王恒山,李煜.突發(fā)事件信息傳播超網(wǎng)絡(luò)中樞紐節(jié)點的判定研究[J].管理評論,2013(6):104-111.
[28]鄭蕾,李生紅.基于微博網(wǎng)絡(luò)的信息傳播模型[J].通信技術(shù),2012(2):39-41.
[29]莊亞明,余海林.群體性突發(fā)事件信息傳播網(wǎng)絡(luò)特性研究——以搶蠟燭事件為例[J].情報雜志,2013(7):37-42.
[30]苑衛(wèi)國,劉云,程軍軍,等.微博雙向“關(guān)注”網(wǎng)絡(luò)節(jié)點中心性及傳播影響力的分析[J].物理學報,2013(3):502-511.
[31]賀筱媛,胡曉峰.網(wǎng)絡(luò)信息傳播動力學建模研究[J].系統(tǒng)仿真學報,2010(11):2511-2514,2518.
[32]易成岐,鮑媛媛,薛一波,等.新浪微博的大規(guī)模信息傳播規(guī)律研究[J].計算機科學與探索,2013(6):551-561.
[33]KimB J,TrusinaA,MinnhagenP,et al.Selforganized scalefreenetworksfrommergingandregeneration[J].The European Physical Journal B Condensed Matter and ComplexSystem,2005,43(3):369-372.
[34]G.Kossinets,D.J.Watts.Empirical analysis of an evolvingsocialnetwork[J].Science,2006,311(5757):88-90.
[35]王超,劉騁遠,胡元萍,等.社交網(wǎng)絡(luò)中信息傳播的穩(wěn)定性研究[J].物理學報,2014(18):87-93.
[36]王輝,韓江洪,鄧林,等.基于移動社交網(wǎng)絡(luò)的謠言傳播動力學研究[J].物理學報,2013(11):106-117.
[37]王金龍,劉方愛,朱振方.一種基于用戶相對權(quán)重的在線社交網(wǎng)絡(luò)信息傳播模型[J].物理學報,2015(5):71-81.
[38]黃宏程,蔣艾玲,胡敏.基于社交網(wǎng)絡(luò)的信息傳播模型分析[J].計算機應用研究,2016(9):2738-2742.
[39]田占偉,王亮,劉臣.基于復雜網(wǎng)絡(luò)的微博信息傳播機理分析與模型構(gòu)建[J]情報科學,2015(9):15-21.
[40]曹玖新,吳江林,石偉,等.新浪微博網(wǎng)信息傳播分析與預測[J].計算機學報,2014(4):779-790.
[41]羅知林,陳挺,蔡皖東.一個基于隨機森林的微博轉(zhuǎn)發(fā)預測算法[J].計算機科學,2014(4):62-64,74.
[42]Thomas W V.Network interventions[J].Science,2012,337 (6090):49-53.
[43]顧亦然,夏玲玲.在線社交網(wǎng)絡(luò)中謠言的傳播與抑制[J].物理學報,2012(23):544-550.
[44]肖人彬,張耀峰.網(wǎng)絡(luò)群體事件信息傳播的演化博弈分析[J].復雜系統(tǒng)與復雜性科學,2012(1):1-7.
A Review of the Study on Microblogging Information Dissemination Model and Its Evolution
CUI Jin-dong,ZHENG Que,SUN Shuo
A review of the basis on which microblogging information dissemination model is constructed and the evolutionary process of the model is instrumental for the microblogging information transmission,since the impact related to the process is various and complex.In this paper,analysis is performed on the functions and evolution patterns of the existing microblogging information dissemination model,attempting to interpret that it is of the traits of a social network in terms of the own properties of the nodes,the link relation and the overall topology evolution;of the characteristics of a complex network in terms of the dissemination patterns,influencing factors and evolutionary laws of the model;of the qualities of a dual network in terms of information transmission prediction and control.After analyzing the functions and technical trends of the model,the authors point out the evolution direction of microblogging information dissemination model,that is,the fusion of nodes,node links and information content,the integration of complex networks and multiple networks,and the application of big data technology.
microblogging information dissemination; network structure; dissemination law; dissemination prediction
格式 崔金棟,鄭鵲,孫碩.微博信息傳播模型及其演化研究綜述[J].圖書館論壇,2018(1):68-77.
*本文系國家社科基金規(guī)劃項目“基于信息生態(tài)的微博信息管理機理研究”(項目編號:16BTQ068)研究成果。
崔金棟,博士,東北電力大學經(jīng)濟管理學院副教授;鄭鵲,孫碩,東北電力大學經(jīng)濟管理學院研究生。
2017-04-09
何燕)