侯學(xué)慧,馮玉花
(新疆警察學(xué)院 信息安全工程系,烏魯木齊 830001)
網(wǎng)絡(luò)謠言是人們?yōu)榱藢?shí)現(xiàn)某一目的或者引起社會(huì)關(guān)注,通過網(wǎng)絡(luò)介質(zhì)(社交平臺(tái)、網(wǎng)絡(luò)論壇、微博等)散播未經(jīng)證實(shí)的公眾難辨真?zhèn)蔚拈e話、傳聞或輿論[1]。網(wǎng)絡(luò)謠言的廣泛傳播會(huì)擾亂社會(huì)秩序,甚至影響社會(huì)穩(wěn)定。因此,研究者有必要發(fā)現(xiàn)社交網(wǎng)絡(luò)中網(wǎng)絡(luò)謠言的傳播規(guī)律,建立符合實(shí)際情況的網(wǎng)絡(luò)謠言傳播模型,了解網(wǎng)絡(luò)謠言傳播的動(dòng)力學(xué)過程[2-3],并發(fā)現(xiàn)其傳播過程的影響因素,提供有效的網(wǎng)絡(luò)謠言傳播預(yù)測(cè)模型、算法及決策依據(jù),以便更好地引導(dǎo)和控制網(wǎng)絡(luò)謠言的傳播走勢(shì),有效控制網(wǎng)絡(luò)輿情的發(fā)酵[4-5]。
根據(jù)網(wǎng)絡(luò)謠言傳播的特征,研究者發(fā)現(xiàn)它與傳染病模型非常相似[6]。本文首先按照網(wǎng)絡(luò)謠言的傳播規(guī)律建立模型,逐步深入研究;然后對(duì)網(wǎng)絡(luò)謠言的案例數(shù)據(jù)進(jìn)行挖掘和分析,將時(shí)間軸按照每天(或每小時(shí))為單位劃分,繪出相應(yīng)的真實(shí)數(shù)據(jù)散點(diǎn)圖,建立改進(jìn)的傳染病SIR模型;再通過Matlab軟件進(jìn)行非線性參數(shù)擬合,得到與網(wǎng)絡(luò)謠言傳播的動(dòng)態(tài)演化最貼近的連續(xù)曲線的分段函數(shù),并得到預(yù)測(cè)的函數(shù)表達(dá)式,分析其演化特征;最后利用最小二乘法,計(jì)算決定系數(shù)R2,分析擬合模型的預(yù)測(cè)值與真實(shí)值之間的相關(guān)性,對(duì)網(wǎng)絡(luò)謠言傳播預(yù)測(cè)模型進(jìn)行評(píng)估。
假設(shè)在網(wǎng)絡(luò)謠言的傳播過程中,網(wǎng)絡(luò)中的活躍網(wǎng)民總數(shù)為N(N是個(gè)變量,取決于某一時(shí)刻網(wǎng)絡(luò)中的活躍網(wǎng)民總數(shù))。本文將活躍網(wǎng)民群體分為兩類人群:一類是相信謠言的傳播者I類,另一類是不信謠言的易感染者S類。設(shè)在t時(shí)刻,網(wǎng)絡(luò)中信謠傳播者I類人群占總數(shù)N的比例為I(t),不信謠的S類易感染人群占總數(shù)N的比例為S(t),則有:I(t)+S(t)=1。根據(jù)現(xiàn)實(shí)的網(wǎng)絡(luò)謠言傳播情況,當(dāng)網(wǎng)絡(luò)中的謠言傳播者達(dá)到最高值時(shí),在謠言傳播群體中會(huì)產(chǎn)生淡忘者R類人群,即由于一些正面的辟謠措施等,使得謠言傳播者不再相信謠言,從而不再傳播謠言,從I類轉(zhuǎn)化為S類。網(wǎng)絡(luò)中群體分布示意圖如圖1所示。
圖1 網(wǎng)絡(luò)中信謠與不信謠群體分布(SIR模型)Fig.1 Distribution of Groups Who Believe in Rumors and Groups Who Don't Believe in Rumors in the Network(SIR Model)
假設(shè)在單位時(shí)間內(nèi),每個(gè)謠言傳播者接觸易感者S群體可有效傳播的人數(shù)為λ。μ為淡忘率(0<μ<1),即單位時(shí)間內(nèi)謠言淡忘者占信謠群體的比例。在改進(jìn)的SIR模型中,淡忘者R類來自I類,R1類淡忘者進(jìn)入S類不信謠人群,有效的傳播則來自I1類傳播者,其占比為1-μ。則在t到t+Δt時(shí)刻內(nèi),網(wǎng)絡(luò)謠言傳播者的人數(shù)增加量為
I(t+Δt)×N-I(t)×N=(1-μ)×I(t)×
λ×N×S(t)×Δt-μ×I(t)×N×Δt。
(1)
由式(1)可得
(1-μ)×I(t)×λ×(1-I(t))-μ×I(t) 。
(2)
假設(shè)在t=t0時(shí),網(wǎng)絡(luò)中的謠言傳播者人數(shù)占比為I(t0)=I0,解微分方程式
(3)
根據(jù)伯努利微分方程的通解公式,解得
(4)
其中,n=λ×(1-μ);m=λ-λ×μ-μ。
由I(t0)=I0可以求解出C0,網(wǎng)絡(luò)中t時(shí)刻謠言傳播者的函數(shù)表達(dá)式為
(5)
式(5)表明,網(wǎng)絡(luò)謠言傳播者I(t)×N的函數(shù)模型為L(zhǎng)ogistic模型,圖像呈現(xiàn)S曲線型。
若網(wǎng)絡(luò)謠言按自然規(guī)律傳播,在無其他因素干擾的情況下,謠言傳播將在很短時(shí)間內(nèi)到達(dá)最高值,可假設(shè)在這段時(shí)間內(nèi)網(wǎng)絡(luò)中并沒有淡忘者,或者R在I中的比例μ非常小,謠言傳播隨時(shí)間的變化呈現(xiàn)上升趨勢(shì);當(dāng)網(wǎng)絡(luò)中的淡忘者逐漸增多,R在I中的比例μ逐漸增大,謠言傳播隨時(shí)間的變化呈現(xiàn)下降趨勢(shì)??紤]到傳播率λ與淡忘率μ之間的關(guān)系,我們將網(wǎng)絡(luò)謠言傳播模型視為這兩種情況的分段函數(shù),在謠言傳播過程中,無論是上升階段還是下降階段,均遵循改進(jìn)的SIR模型。
1)網(wǎng)絡(luò)謠言傳播量上升階段(m>0)
情形1:μ=0,m>0,m=λ。
當(dāng)謠言開始散布時(shí),網(wǎng)絡(luò)中群體分布如圖2所示。
圖2 網(wǎng)絡(luò)中信謠與不信謠群體分布(SI模型初始時(shí))Fig.2 Distribution of Groups Who Believe in Rumors and Groups Who Don't Believe in Rumors in the Network (Initial Stage of SI Model)
當(dāng)網(wǎng)絡(luò)中不存在淡忘者或者淡忘者數(shù)量很小時(shí),則μ趨近于0;根據(jù)謠言傳播量表達(dá)式 (5),假設(shè)μ=0,得到謠言傳播量上升期的函數(shù)表達(dá)式為
(6)
因此,網(wǎng)絡(luò)中t時(shí)刻謠言傳播量隨時(shí)間變化的函數(shù)為
(7)
式(7)表明,網(wǎng)絡(luò)謠言傳播量表達(dá)式完全符合傳染病SI模型[6]。在謠言傳播初期,網(wǎng)絡(luò)中不存在淡忘者,謠言的傳播速度非??欤词钩霈F(xiàn)淡忘者,人數(shù)也非常小,這種情況就是μ趨近于0時(shí)的極限情況。根據(jù)與真實(shí)數(shù)據(jù)的擬合結(jié)果顯示,網(wǎng)絡(luò)謠言傳播上升期的函數(shù)圖像非常符合傳染病SI模型。
根據(jù)Logistics非線性回歸方程的圖像特征,我們可以預(yù)測(cè)出謠言傳播量的最大值,以及達(dá)到最大值的時(shí)間周期,為建立正確的網(wǎng)絡(luò)謠言傳播預(yù)警應(yīng)對(duì)機(jī)制,提供有效的數(shù)據(jù)保障和支持。
情形2:μ>0,m>0,m=λ-λ×μ-μ。
在實(shí)際問題中,相關(guān)部門可采取有效手段抑制謠言傳播,如可以通過控制傳播率λ與淡忘率μ,降低謠言傳播量的最大值,以及縮短達(dá)到最大值的時(shí)間。
2)網(wǎng)絡(luò)謠言傳播量下降階段(m<0)
情形3:μ>0,m<0,m=λ-λ×μ-μ。
情形3適用于網(wǎng)絡(luò)謠言傳播量處于下降和消減階段,即在謠言傳播過程中,謠言發(fā)酵達(dá)到最大值后,由于淡忘者的不斷增加,導(dǎo)致網(wǎng)絡(luò)謠言傳播量下降,直至消亡。
根據(jù)本文分析得出的Logistics函數(shù)表達(dá)式(5),可以對(duì)網(wǎng)絡(luò)謠言真實(shí)案例的傳播數(shù)據(jù)做非線性參數(shù)擬合,從而得到網(wǎng)絡(luò)謠言傳播量隨時(shí)間變化的預(yù)測(cè)值。網(wǎng)絡(luò)謠言傳播的整個(gè)過程,可以看作是改進(jìn)的SIR模型中情形1和情形3交替變換的分段函數(shù),謠言傳播量不斷上升的過程遵循情形1或情形2。拐點(diǎn)又稱反曲點(diǎn),指改變曲線向上或向下方向的點(diǎn),即連續(xù)曲線的凹弧與凸弧的分界點(diǎn)。傳播量在拐點(diǎn)后下降、消減直至消亡的過程遵循情形3,這也解釋了謠言的形成、高潮、消減和消亡的4個(gè)階段。謠言的傳播是不斷波動(dòng)的,主要由事件發(fā)展過程中的民眾主觀態(tài)度、政府機(jī)關(guān)的有效干預(yù)和監(jiān)管以及案件轉(zhuǎn)折等眾多因素決定,因此這是一個(gè)分段函數(shù),要根據(jù)具體變化情況,調(diào)整相應(yīng)的影響參數(shù)λ和μ等,而不能用某一確定的單一函數(shù)表達(dá)式來做擬合。
在網(wǎng)絡(luò)謠言傳播中,將活躍網(wǎng)民N劃分為信謠群體I和不信謠群體S。在不信謠群體S中,不是所有人都是易感人群,而是存在免疫人群R2類[7],即由于知識(shí)結(jié)構(gòu)、個(gè)人素質(zhì)及工作環(huán)境等原因,使部分網(wǎng)民已明確知曉網(wǎng)絡(luò)謠言的虛假性,從而選擇不信謠,因此網(wǎng)絡(luò)中群體分布示意圖如圖3所示。
圖3 網(wǎng)絡(luò)中信謠與不信謠群體分布(SR2IR1模型)Fig.3 Distribution of Groups Who Believe in Rumors and Groups Who Don't Believe in Rumors in the Network (SR2IR1 Model)
假設(shè)β(0<β<1)為單位時(shí)間內(nèi)謠言免疫者占不信謠群體的比例。R2的組成包括兩部分:一是初始狀態(tài)時(shí)S內(nèi)的免疫人群,二是I類信謠者中淡忘人群R1的加入,使得免疫人群不斷增加,直至達(dá)到網(wǎng)民總數(shù),即網(wǎng)絡(luò)謠言的消亡狀態(tài)。
在改進(jìn)的SR2IR1模型中,仍有I(t)+S(t)=1。免疫者R類來自S類和I類的轉(zhuǎn)化,R1淡忘者進(jìn)入S類不信謠人群,有效的傳播則來自I1傳播者,其占比為1-μ,可感染的范圍是S2類易感人群,其占比為1-β。在t到t+Δt時(shí)刻內(nèi),網(wǎng)絡(luò)謠言傳播者的人數(shù)增加量為
I(t+Δt)×N-I(t)×N=(1-μ)×I(t)×λ×
N×(1-β)×S(t)×Δt-μ×I(t)×N×Δt。
(8)
假設(shè)在t=t0時(shí),網(wǎng)絡(luò)中的謠言傳播者占比為I(t0)=I0,解微分方程式
λ×(1-μ)×(1-β)×I2。
(9)
根據(jù)伯努利微分方程的通解公式,解得網(wǎng)絡(luò)謠言傳播量隨時(shí)間t變化的函數(shù)表達(dá)式為
(10)
網(wǎng)絡(luò)中不信謠S類人群隨時(shí)間變化的函數(shù)表達(dá)式為
(11)
除了參數(shù)發(fā)生改變之外,表達(dá)式的形式保持不變,與模型一中的式 (5)一致。根據(jù)參數(shù)的大小關(guān)系,網(wǎng)絡(luò)謠言在上升階段遵循SI模型(情形1),在下降階段,遵循改進(jìn)的SIR模型(情形3)。
2.1.1案件背景
某地曾發(fā)生的“搶購食鹽”網(wǎng)絡(luò)謠言,在部分門戶網(wǎng)站和搜索引擎上傳播,其中,騰訊微博的轉(zhuǎn)載量如圖4所示。
圖4 “搶購食鹽”網(wǎng)絡(luò)謠言的騰訊微博轉(zhuǎn)載量Fig.4 The Number of Reposts about the Case of Rush-to-buy-salt Network Rumors on Tencent Weibo
2.1.2數(shù)值模擬及結(jié)果分析
本文使用Matlab軟件對(duì)建立的數(shù)學(xué)模型進(jìn)行仿真實(shí)驗(yàn),根據(jù)網(wǎng)絡(luò)謠言真實(shí)案例的傳播量數(shù)據(jù),進(jìn)行非線性參數(shù)擬合,得到與網(wǎng)絡(luò)謠言傳播的動(dòng)態(tài)演化最貼近的連續(xù)曲線的分段函數(shù),建立合理的數(shù)學(xué)模型,分析其演化特征。
網(wǎng)絡(luò)謠言傳播在上升階段遵循SI模型,到達(dá)拐點(diǎn)后,下降階段遵循改進(jìn)的SIR模型。利用Matlab軟件,根據(jù)真實(shí)數(shù)據(jù)非線性回歸擬合得到Logistic模型函數(shù)表達(dá)式,即從謠言傳播開始的第1~22 d,設(shè)網(wǎng)絡(luò)中t時(shí)刻謠言傳播者的人數(shù)為y(t),則非線性參數(shù)擬合方程為
(12)
網(wǎng)絡(luò)謠言傳播上升階段遵循SI函數(shù)模型,函數(shù)表達(dá)式如式(7)所示,由圖4的初始數(shù)據(jù),計(jì)算初始量C0,用非線性參數(shù)擬合網(wǎng)絡(luò)謠言傳播量上升階段的預(yù)測(cè)函數(shù)表達(dá)式為
(13)
由此得到,y預(yù)測(cè)最大值=165 074,y真實(shí)最大值=127 924。
網(wǎng)絡(luò)謠言傳播下降階段遵循改進(jìn)的SIR函數(shù)模型,函數(shù)表達(dá)式如式(5)所示,由圖4當(dāng)中的第5~22 d的數(shù)據(jù),計(jì)算初始量C0,用非線性參數(shù)擬合網(wǎng)絡(luò)謠言傳播量下降階段的預(yù)測(cè)函數(shù)表達(dá)式為
(14)
由此得到,y預(yù)測(cè)最大值=151 490,y真實(shí)最大值=127 924。
綜上所述,在網(wǎng)絡(luò)謠言從形成、擴(kuò)散,逐步到達(dá)高峰直至消減的傳播過程(1≤t≤22)中,謠言傳播量I(t)×N隨時(shí)間變化的擬合預(yù)測(cè)函數(shù)圖像如圖5所示。
圖5 “搶購食鹽”網(wǎng)絡(luò)謠言傳播的擬合函數(shù)示意圖Fig.5 Fitting Function Image of Transmission of Rush-to-buy-salt Network Rumors
對(duì)模型進(jìn)行非線性函數(shù)擬合后,須評(píng)價(jià)回歸模型的擬合優(yōu)度。根據(jù)決定系數(shù)的計(jì)算公式,利用Matlab軟件進(jìn)行求解,得到實(shí)際值與預(yù)測(cè)值之間的差異為
(15)
因?yàn)镾(t)×N=N-I(t)×N,由此我們也可以得到網(wǎng)絡(luò)中不信謠人群隨時(shí)間變化的預(yù)測(cè)函數(shù)圖像,如圖6所示。Smin=21 589,說明在不信謠S類群體中,存在免疫群體R的人數(shù)至少是21 589人。
圖6 “搶購食鹽”網(wǎng)絡(luò)傳播中不信謠人群的擬合函數(shù)示意圖Fig.6 Fitting Function Diagram of People Who Do not Believe in the Rumors in the Transmission of Rush-to-buy-salt Network Rumors
2.2.1案件背景
某知名演員在經(jīng)濟(jì)合約糾紛案中,其個(gè)人銀行賬戶流水未經(jīng)本人授權(quán)被提供給第三方,個(gè)人信息被侵犯,該事件引發(fā)輿論關(guān)注。在大數(shù)據(jù)環(huán)境下,通過輿情監(jiān)測(cè)平臺(tái)得到一周之內(nèi)各新聞網(wǎng)站和大型媒體對(duì)該輿情的傳播情況,如圖7所示。
圖7 輿情傳播量隨時(shí)間變化圖Fig.7 Image of Transmission of Network Public Opinion over Time
2.2.2數(shù)值模擬及結(jié)果分析
由于分析方法類似,本文只模擬了兩次輿情高峰及下降過程,即在0~55時(shí),設(shè)網(wǎng)絡(luò)中t時(shí)刻輿情傳播者的人數(shù)為y(t),非線性擬合方程為
(16)
對(duì)于第一波遞增,根據(jù)SI函數(shù)模型,計(jì)算得到擬合預(yù)測(cè)函數(shù)為
(17)
由此得到,y預(yù)測(cè)最大值=15 354,y真實(shí)最大值=13 800。
對(duì)于第一波遞減,根據(jù)SIR函數(shù)模型,計(jì)算得到擬合預(yù)測(cè)函數(shù)為
(18)
網(wǎng)絡(luò)輿情傳播的預(yù)測(cè)值是分段函數(shù),輿情從形成、擴(kuò)散、第一次到達(dá)高峰直至消減(0≤t≤30)的函數(shù)圖像包括兩部分,分別如圖8和圖9所示。
圖8 第一波輿情上升圖像(基于SI模型)Fig.8 The First Stage of Public Opinion Rising (Based on SI Model)
圖9 第一波輿情下降圖像(基于SIR模型)Fig.9 The First Stage of Public Opinion Declining (Based on SIR Model)
對(duì)于第二波遞增,根據(jù)SI函數(shù)模型,計(jì)算得到擬合預(yù)測(cè)函數(shù)為
(19)
由此得到,y預(yù)測(cè)最大值=25 712,y真實(shí)最大值=16 479。
對(duì)于第二波遞減,根據(jù)SIR函數(shù)模型,計(jì)算得到擬合預(yù)測(cè)函數(shù)為
(20)
網(wǎng)絡(luò)輿情傳播從第二次擴(kuò)散到達(dá)高峰值,直至消減(30≤t≤54)的函數(shù)圖像同樣包括兩部分,分別如圖10和圖11所示。
圖10 第二波輿情上升圖像(基于SI模型)Fig.10 The Second Stage of Public Opinion Rising (Based on SI Model)
圖11 第二波輿情下降圖像(基于SIR模型)Fig.11 The Second Stage of Public Opinion Declining (Based on SIR Model)
通過分析0~54時(shí)刻輿情傳播隨時(shí)間的變化情況,可以預(yù)測(cè)輿情每一次上升可能到達(dá)的最高值,并預(yù)測(cè)輿情傳播周期,為控制和引導(dǎo)網(wǎng)絡(luò)輿情提供數(shù)據(jù)支持。輿情傳播從形成、擴(kuò)散,到達(dá)高峰直至消減(0≤t≤54)的函數(shù)圖像,如圖12所示。
圖12 輿情傳播過程隨時(shí)間擬合的函數(shù)圖像Fig.12 Fitting Function Image of Public Opinion Transmission over Time
對(duì)模型進(jìn)行非線性函數(shù)擬合后,須評(píng)價(jià)回歸模型的擬合優(yōu)度。經(jīng)計(jì)算得出,此分段函數(shù)的殘差R2=0.936 9,說明用此模型擬合效果較好。
網(wǎng)絡(luò)謠言傳播是遵循規(guī)律性變化的。網(wǎng)絡(luò)謠言傳播在上升階段時(shí),由于在很短時(shí)間內(nèi)就能達(dá)到高峰值,假設(shè)信謠I類群體中不產(chǎn)生R類淡忘群體,那么謠言傳播遵循傳染病SI模型,該模型的圖像呈現(xiàn)S型曲線特征。我們從每一次謠言上升開始的前幾個(gè)小時(shí)就能分析出可能達(dá)到的高峰值和發(fā)酵周期,從而可及時(shí)采取有效措施,控制和引導(dǎo)謠言走勢(shì)。由于網(wǎng)絡(luò)中民眾的主觀態(tài)度、政府采取的有效手段、客觀事件的影響力等隨謠言傳播的時(shí)間而發(fā)生變化,所以整個(gè)謠言傳播過程是分段函數(shù)。謠言傳播在下降階段時(shí),在謠言傳播I群體中產(chǎn)生了淡忘者,遵循改進(jìn)的SIR模型,我們利用Matlab軟件對(duì)真實(shí)數(shù)據(jù)做非線性參數(shù)擬合,得到該模型的圖像呈下降趨勢(shì),直至謠言消亡。以此可得到謠言傳播量隨時(shí)間變化的預(yù)測(cè)函數(shù),為建立網(wǎng)絡(luò)謠言傳播預(yù)警和導(dǎo)控機(jī)制提供了數(shù)據(jù)預(yù)測(cè)和量化支持。