錢 穎 倪君 范明林
(1.上海大學(xué)管理學(xué)院,上海 200444;2.上海大學(xué)社會學(xué)院,上海 200444)
?
基于微博的突發(fā)事件針對性信息分享行為分析
錢 穎1倪君1范明林2
(1.上海大學(xué)管理學(xué)院,上海 200444;2.上海大學(xué)社會學(xué)院,上海 200444)
文章研究了2012年臺風(fēng)“海葵”這一突發(fā)事件的大量微博中@這一針對性分享行為與哪些內(nèi)容有關(guān)。通過對518條關(guān)于??⒉┻M(jìn)行內(nèi)容分析,借助關(guān)聯(lián)分析的apriori算法得到與@相關(guān)的內(nèi)容。本文的創(chuàng)新點(diǎn)在于通過研究針對性信息分享行為,以了解在突發(fā)事件中用戶與朋友分享的信息,從而揭示了用戶的信息需求,發(fā)現(xiàn)在“??边@一突發(fā)事件中用戶針對性分享的內(nèi)容主要是突發(fā)事件的基本信息,包括基本情況、地點(diǎn)以及時(shí)間,同時(shí)還會使用多種表達(dá)方式,包括表情符號、圖片、詳細(xì)信息的短鏈接等。這對提高應(yīng)對突發(fā)事件信息發(fā)布的有效性有借鑒作用。
微博;內(nèi)容分析;關(guān)聯(lián)分析法;突發(fā)事件;信息行為
“突發(fā)事件”指突然發(fā)生,造成或可能造成嚴(yán)重的危害,并需要采取相應(yīng)的應(yīng)急措施來應(yīng)對的自然災(zāi)害事件、事故災(zāi)難事件、公共衛(wèi)生事件及社會安全事件[1]。突發(fā)事件具有瞬時(shí)性、偶然性、危機(jī)性[2]。突發(fā)事件中,由于主流媒體報(bào)道的不及時(shí)、不全面性,不能滿足用戶的信息需求。而微博以其實(shí)時(shí)性、便捷性、互動性等特點(diǎn),使得大量信息能夠在短時(shí)間內(nèi)得到擴(kuò)散和傳播[3],彌補(bǔ)了傳統(tǒng)媒體的不足,成為了突發(fā)事件信息傳播的主要渠道。例如在“7·23 甬溫動車事件”中,大量用戶對事件進(jìn)行了多角度深層次的報(bào)道,促進(jìn)了信息的公開,為救援提供了很大的幫助[4]。但微博中信息傳播也存在著問題,比如“黃玉斌招待費(fèi)事件”中,由于有關(guān)人員未能及時(shí)澄清而導(dǎo)致網(wǎng)絡(luò)謠言不斷[5],產(chǎn)生了嚴(yán)重的負(fù)面影響,這些都是因?yàn)橛脩舻男畔⑿枨鬀]有得到滿足,因此,研究突發(fā)事件相關(guān)微博內(nèi)容,了解受眾的信息需求具有重要的價(jià)值。
國內(nèi)外對微博文本內(nèi)容進(jìn)行分析的研究有很多,主要包括3個(gè)方面:話題檢測、情感分析和信息分析。這三方面研究的對象都是微博文本,研究方法都需要首先從微博文本中提取關(guān)鍵詞。針對話題檢測,學(xué)者們基于提取的關(guān)鍵詞使用了數(shù)據(jù)挖掘的方法進(jìn)行研究,包括聚類、關(guān)聯(lián)分析等。唐曉波和王洪艷[6]、鄭斐然[7]都使用了聚類方法來識別話題。王熙[8]則借助可信關(guān)聯(lián)規(guī)則來挖掘用戶關(guān)注的話題,并將最后得到的關(guān)鍵詞的極大團(tuán)作為頻率最高的話題。情感分析主要是對內(nèi)容的情感極性進(jìn)行分類,主要分為正面、中性及負(fù)面情緒[9],通?;谔崛〉年P(guān)鍵詞采用SVM分類器[10]、素貝葉斯分類器(NB)[11]來進(jìn)行分析。信息分析主要通過對高頻關(guān)鍵詞分類,用關(guān)聯(lián)分析等方法來分析微博中包含的主要信息之間的關(guān)系。姬浩、蘇兵、呂美[12]總結(jié)出高校群體性突發(fā)事件中信息的關(guān)鍵分類為發(fā)生時(shí)間、地點(diǎn)、誘發(fā)因素、處置有效性及事件影響,并使用關(guān)聯(lián)分析對這些分類進(jìn)行研究,發(fā)現(xiàn)決定事件影響大小的因素主要為誘發(fā)因素、應(yīng)急處置的有效性等,其研究結(jié)果能夠?yàn)橥话l(fā)事件的預(yù)警和預(yù)測提供指導(dǎo);龐穎[13]對虛擬社區(qū)中用戶對商品的評論信息進(jìn)行了分析,得到評論主要為產(chǎn)品的性能類信息,這些性能主要包括電池、像素、CPU頻率等,通過對這些關(guān)鍵信息進(jìn)行關(guān)聯(lián)分析,有效挖掘出了企業(yè)需求的信息。Chew、Eysenbach[14]在“2009H1N1事件”研究中,選取了2009年3月到12月中每月某天的600條微博文本,使用手工編碼并結(jié)合統(tǒng)計(jì)的方法總結(jié)出主要內(nèi)容包括資源鏈接、個(gè)人經(jīng)歷、個(gè)人觀點(diǎn),并對不同時(shí)刻,各類微博的數(shù)量進(jìn)行統(tǒng)計(jì),并結(jié)合實(shí)際背景分析了峰值產(chǎn)生的原因,如個(gè)人經(jīng)歷的兩個(gè)峰值的出現(xiàn)是因?yàn)槭澜缧l(wèi)生組織宣布6級流感的盛行及H1N1疫苗到達(dá)美國;Terpstra et al.[15]對“Pukkelpop 2011”這一危機(jī)事件的微博內(nèi)容進(jìn)行了分析,提取出了整個(gè)事件中關(guān)鍵的信息,總結(jié)出極端的天氣情況、破壞、傷亡、救援等方面的信息是廣泛分享的信息,據(jù)此了解了事件中人們所需要的關(guān)鍵信息。
借鑒以上研究,分析了2012年臺風(fēng)“海葵”登陸上海時(shí)的相關(guān)微博。不僅總結(jié)出哪些信息被廣泛地分享,并且應(yīng)用共現(xiàn)分析,研究了@與哪些信息相關(guān)度高。@是針對性的信息分享行為,被@的用戶會收到提醒。微博上信息量大,沒有提醒時(shí)可能會忽視信息,因此包含@的微博相對有效。大多數(shù)包含@的微博是分享給親朋好友的,使得信息能夠通過較為密切的人際關(guān)系實(shí)現(xiàn)快速傳播,信任度更高,故研究突發(fā)事件中@與哪些內(nèi)容有關(guān)可以了解人們在突發(fā)事件中@的主要信息,可供有關(guān)信息發(fā)布部門和個(gè)人借鑒。
1.1 數(shù)據(jù)獲取
本文選取的是上海大學(xué)學(xué)生在2012年8月1~28日期間發(fā)表或者轉(zhuǎn)發(fā)的有關(guān)“??边@一突發(fā)事件的微博。通過爬蟲軟件從新浪微博進(jìn)行數(shù)據(jù)采集,共收集1 127條微博,刪除了重復(fù)的微博,即轉(zhuǎn)發(fā)時(shí)沒有進(jìn)行評論的微博,最后得到518條有效微博。表1給出了2條微博實(shí)例。
表1 關(guān)于“??钡奈⒉?其中2條數(shù)據(jù))
1.2 文本處理
采集到的微博數(shù)據(jù)→分詞(武漢大學(xué)Rost分詞軟件)→確定分類→統(tǒng)計(jì)分類出現(xiàn)的頻數(shù)
圖1 數(shù)據(jù)處理過程
筆者對獲取的微博文本進(jìn)行分詞處理,關(guān)注那些頻率較高的詞語,并將其他出現(xiàn)頻率較低而語義相同的詞語與之合并,繼而統(tǒng)計(jì)出了較高頻的關(guān)鍵詞(頻次大于50),即為28項(xiàng)二級分類,見表2。結(jié)合王炎龍[16]、Terpstra et al.[15]對突發(fā)災(zāi)害中微博內(nèi)容的幾項(xiàng)概括以及本文的微博文本對統(tǒng)計(jì)出的高頻詞進(jìn)行分類,進(jìn)一步概括出11項(xiàng)一級分類:基本情況、災(zāi)難影響、有關(guān)人員、受災(zāi)地點(diǎn)、發(fā)生時(shí)間、政府組織、救援行為、呼吁提醒,以及微博虛擬平臺所特有表情符號、圖片、短鏈接和@行為,見表2。
表2 詞語分類
表2(續(xù))
圖2中統(tǒng)計(jì)了一級分類所涉及關(guān)鍵詞在微博中出現(xiàn)的頻次,以受災(zāi)地點(diǎn)為例,所有微博中有363條微博中包含與受災(zāi)地點(diǎn)有關(guān)的詞??梢钥吹健昂?敝谢厩闆r(91.31%)、受災(zāi)地點(diǎn)(70.08%)、發(fā)生時(shí)間(57.53%)出現(xiàn)的頻率是最高的。表情圖片鏈接(55.98%)、@(43.05%)出現(xiàn)的頻率較高,前者頻率高是因?yàn)槲⒉┯脩魳酚谠谕话l(fā)事件中傳播詳細(xì)的事件信息并表達(dá)自己的情緒;后者表明事件中微博用戶會傾向于將重要的信息傳遞給周圍人,因?yàn)闉?zāi)害與用戶的生活息息相關(guān),需要與朋友分享這些信息,避免由于不知情而帶來不便甚至意外,但@出現(xiàn)的頻率不到50%,說明還是有很多人在發(fā)布信息的時(shí)候沒有@行為,所以需要研究究竟是哪些信息促使用戶針對性的分享信息。還有一些頻率相對較小的關(guān)鍵信息:有關(guān)人員(39.19%)、災(zāi)難影響(38.99%)、受災(zāi)之物(36.49%)、救援行為(32.05%)、政府組織(30.16%)、呼吁提醒(29.34%),說明微博用戶還會關(guān)心物品損壞及人員傷亡情況、政府企業(yè)等的救災(zāi)行為、官方提醒信息。綜上所述,“??笔录腥藗冴P(guān)注的焦點(diǎn)是??l(fā)展的基本情況和發(fā)生的地點(diǎn)。時(shí)間也是一個(gè)相對重要的信息,可以使用戶知道出現(xiàn)某些災(zāi)情的準(zhǔn)確時(shí)間,以做好適當(dāng)?shù)膽?yīng)對措施。
圖2 一級類別中每個(gè)類對應(yīng)的微博數(shù)
1.3 分享內(nèi)容共現(xiàn)分析
本文的目的是了解人們在突發(fā)事件中,會使用社會化媒體針對性的分享哪些信息,所以主要研究@這一行為會與哪些關(guān)鍵詞存在較強(qiáng)的關(guān)聯(lián)關(guān)系,以發(fā)現(xiàn)隱藏在大量數(shù)據(jù)信息中、不易被人察覺的關(guān)聯(lián)事件[17]。應(yīng)用Clementine軟件進(jìn)行數(shù)據(jù)處理?;?.2的結(jié)果,筆者首先進(jìn)行了共現(xiàn)分析,統(tǒng)計(jì)了哪些關(guān)鍵詞會與@較為頻繁的同時(shí)出現(xiàn)。
1.3.1 一級分類與針對性分享的共現(xiàn)分析
表3是@與一級分類的共現(xiàn)分析,可以發(fā)現(xiàn)“基本情況+@”、“受災(zāi)地點(diǎn)+@”這兩組的概率最高,都超過了33%,說明微博用戶更傾向于針對性的分享“??钡幕厩闆r,其次也關(guān)注災(zāi)難發(fā)生的地點(diǎn),因?yàn)檫@些是與突發(fā)事件直接相關(guān),是大眾迫切需要的,能夠滿足基本需求,避免造成恐慌?!鞍l(fā)生時(shí)間+@”組合的概率為25.43%,可見人們也會針對性地分享時(shí)間信息,以了解事件的階段性進(jìn)展,但它與前面相比概率小一些,這是因?yàn)槲⒉┯脩敉ǔJ窃谑录l(fā)生當(dāng)下發(fā)布信息的,所以很多用戶不會再特意注明時(shí)間。“表情圖片鏈接+@”組合的概率為23.51%,表明用戶針對性分享信息時(shí)圖片、短鏈、表情等出現(xiàn)較頻繁?!笆転?zāi)之物+@”、“有關(guān)人員+@”、“災(zāi)難影響+@”、“救援行為+@”、“政府組織+@”這些組合的概率依次減小,都低于20%,說明這些信息得到了關(guān)注,但關(guān)注度不夠。而“呼吁提醒+@”的概率更是低于10%,可見用戶很少將這些官方的提醒信息@給有密切關(guān)系的人,而是通過自己的方式表達(dá)關(guān)心。
表3 一個(gè)關(guān)鍵詞與@同時(shí)出現(xiàn)(一級分類)
表4中分別列出了兩個(gè)關(guān)鍵詞與@共現(xiàn)的情況。兩個(gè)關(guān)鍵詞與@共現(xiàn)的結(jié)果中,“基本情況”、“受災(zāi)地點(diǎn)”、“發(fā)生時(shí)間”中的任意兩者與@共現(xiàn)的概率都達(dá)到了22%,說明這三者與@的關(guān)系都很緊密。其中,“基本情況+受災(zāi)地點(diǎn)+@”這一組合的概率最大,為30.83%,與另兩種情況相差較大,說明人們最樂于針對性地分享的是某地的基本情況信息,這將會使得用戶了解到發(fā)生災(zāi)難的某地的風(fēng)力、雨量以及嚴(yán)重情況等。與期望的結(jié)果不同,結(jié)果中時(shí)間相對而言是次要的,是因?yàn)槲⒉┌l(fā)布具有實(shí)時(shí)性,不必特意注明時(shí)間信息?!氨砬閳D片鏈接+基本情況+@”這一組合的概率為21.39%,說明人們與指定的人分享的圖片鏈接內(nèi)容主要與基本情況有關(guān)。
表4 兩個(gè)關(guān)鍵詞與@同時(shí)出現(xiàn)(一級分類)
1.3.2 二級分類與針對性分享的共現(xiàn)分析
進(jìn)一步研究@與二級分類的共現(xiàn)分析。選取了一級分類下與@關(guān)聯(lián)度高的“基本情況”、“受災(zāi)地點(diǎn)”、“發(fā)生時(shí)間”、“表情圖片鏈接”為對象,同時(shí)關(guān)注“有關(guān)人員”這一分類,因?yàn)樗说湫腿宋锱c受災(zāi)群眾兩個(gè)截然不同的對象,可進(jìn)一步研究用戶的關(guān)注傾向。結(jié)果如表5所示。
表5 一個(gè)關(guān)鍵詞與@同時(shí)出現(xiàn)(二級分類)
“基本情況”中,“風(fēng)+@”這一組合的概率為35.65%,顯著大于“雨+@”,說明用戶與指定的人分享時(shí)更關(guān)注風(fēng)而不是雨,這是因?yàn)榕_風(fēng)中風(fēng)力造成的影響會危險(xiǎn)人身安全。“加強(qiáng)嚴(yán)重+@”的概率為18%,遠(yuǎn)大于“雨+@”,說明當(dāng)出現(xiàn)嚴(yán)重情況時(shí),用戶將會@這類信息。
“受災(zāi)地點(diǎn)”中,“上海+@”這一組合的概率為27.55%,顯著大于“浙江+@”的概率,因?yàn)楣P者選取的微博是上海地區(qū)的,必然更加關(guān)注上海的情況。
“發(fā)生時(shí)間”中,“日+@”以及“時(shí)+@” 這兩個(gè)組合的概率分別為19.84%、12.33%,相差較大,說明用戶每天都在關(guān)注臺風(fēng)的情況,因?yàn)槭鼙娦枰皶r(shí)地了解這些信息,來應(yīng)對各種災(zāi)難,但當(dāng)事件更新頻率過高時(shí)(精確到時(shí)、分甚至秒),則不能時(shí)刻都關(guān)注到。
“表情圖片鏈接”中,“表情符號+@”的概率最高,表明圖片、短鏈、表情這三者中更關(guān)注的是表情符號,即用戶會通過表情符號來表達(dá)自己在突發(fā)事件中的情緒并@給朋友,相對而言圖片及鏈接這些包含事件詳細(xì)內(nèi)容的信息關(guān)注度較低。
“有關(guān)人員”的二級分類中,“受災(zāi)群眾+@”的概率與“典型人物+@”的概率相差較大,說明雖然人們在突發(fā)事件中需要正能量,但面對更需要幫助的群眾時(shí),仍然更樂于@緊迫的信息。
文章研究了在“??边@一突發(fā)事件的大量微博中@這一針對性分享行為與哪些內(nèi)容有關(guān)。有@行為的微博體現(xiàn)了一種基于強(qiáng)關(guān)系傳播,傳播的雙方在現(xiàn)實(shí)中存在較為密切的聯(lián)系,可能是朋友、家人、同事等,傳播者希望特定的人了解到這些信息,而接受者也更容易接收并繼續(xù)轉(zhuǎn)發(fā)這類信息,這類研究具有較大的實(shí)用價(jià)值。
通過分析,筆者發(fā)現(xiàn)在“海葵”這一突發(fā)事件中人們針對性分享的信息主要是與事件本身密切相關(guān)的情況信息,包括基本的情況(風(fēng)力、雨量、加強(qiáng)、減弱、路徑等)、受災(zāi)的地點(diǎn)、發(fā)生的時(shí)間。但比起前兩者,微博用戶對時(shí)間的關(guān)注度較少,原本時(shí)間在突發(fā)事件中是極其重要的信息,但由于微博中發(fā)布信息具有實(shí)時(shí)性,因此很多用戶在微博中省略了關(guān)注時(shí)間的習(xí)慣,而將精力放在別的內(nèi)容上。除了這三者,微博用戶@的內(nèi)容還包括表情圖片短鏈,說明在微博中除了文字,用戶習(xí)慣于通過多種方式表達(dá)情緒和內(nèi)容,在突發(fā)事件中更是如此。
針對更細(xì)致的內(nèi)容,用戶更傾向于分享的是風(fēng)力信息,因?yàn)榕_風(fēng)中風(fēng)力造成的影響會危及人身安全。用戶會及時(shí)@每天的信息,但當(dāng)事件更新頻率過高時(shí),精確到時(shí)、分、秒時(shí),則不能時(shí)刻都關(guān)注到。除文字外的多種表達(dá)方式中,用戶傾向于通過表情符號表達(dá)事件中的情緒并@給朋友。另外,雖然在突發(fā)事件中人們需要正能量,但面對需要幫助的群眾,還是愿意把更多的精力放在緊迫的事情上。
有關(guān)部門可借鑒這些分析結(jié)果發(fā)布與上面的內(nèi)容相關(guān)的信息來引起用戶的@行為,從而更好地滿足用戶的信息需求。本研究尚存在不足之處,后續(xù)研究可以在更大范圍內(nèi)搜集與“??笔录嚓P(guān)的微博,以發(fā)現(xiàn)受災(zāi)地點(diǎn)信息與@之間更有意義更實(shí)用的關(guān)系。
[1]據(jù)2007年8月30日第十屆全國人民代表大會常務(wù)委員會第二十九次會議通過的《中華人民共和國突發(fā)事件應(yīng)對法》.
[2]朱力.突發(fā)事件的概念、要素與類型[J].南京社會科學(xué),2007,(11):81-88.
[3]陳紅玉.由突發(fā)事件看微博的傳播機(jī)制[J].傳媒觀察,2010,(8):45-46.[4]楊鳳嬌,王劍.突發(fā)事件中政務(wù)微博傳播功效的實(shí)證研究——以“北京發(fā)布”在7·21暴雨中的應(yīng)對為例[J].青年記者,2013,(23):17-18.
[5]孫婷婷.論微博時(shí)代我國體育管理部門對體育突發(fā)事件的應(yīng)對——以黃玉斌微博事件為例[J].體育與科學(xué),2012,33(2):37-39.
[6]唐曉波,王洪艷.基于潛在語義分析的微博主題挖掘模型研究[J].圖書情報(bào)工作,2012,56(24):114-119.
[7]鄭斐然,苗奪謙,張志飛,等.一種中文微博新聞話題檢測的方法[J].計(jì)算機(jī)科學(xué),2012,39(1):138-141.
[8]王熙.基于用戶關(guān)系分析和微博內(nèi)容挖掘的信息推薦系統(tǒng)研究[D].北京郵電大學(xué),2013.
[9]劉曉娟,尤斌,張愛蕓.基于微博數(shù)據(jù)的應(yīng)用研究綜述[J].情報(bào)雜志,2013,32(9):39-45.
[10]王政霄,黃征.一種中文微博觀點(diǎn)抽取技術(shù)[J].信息安全與通信保密,2013,(1):49-53.
[11]張珊,于留寶,胡長軍.基于表情圖片與情感詞的中文微博情感分析[J].計(jì)算機(jī)科學(xué),2012,39(11A):146-148.
[12]姬浩,蘇兵,呂美.基于FP-growth算法的高校群體性突發(fā)事件關(guān)聯(lián)規(guī)則分析[J].中國安全科學(xué)學(xué)報(bào),2012,22(12):144-151.
[13]龐穎.基于共詞分析虛擬社區(qū)中有效需求信息獲取研究[D].重慶大學(xué),2012.
[14]Chew.C,Eysenbach.G..Pandemics in the Age of Twitter:Content Analysis of Tweets during the 2009 H1N1 Outbreak[J].PLoS ONE,2010,5(11):e14118.
[15]Terpstra T,Vries A D,Stronkman R.Towards a real time Twitter analysis during crises for operational crisis management[C].Proceedings of the 6th International ISCRAM Conference,Vancouver,Canada,April 2012.
[16]王炎龍.重大災(zāi)害性事件的微博直播——基于4·20蘆山地震搜狐微直播分析[J].新聞界,2013,(22):51-55.
[17]何超,張玉峰.基于語義關(guān)聯(lián)分析的商務(wù)情報(bào)分析算法研究[J].情報(bào)雜志,2013,32(4):134-137.
(本文責(zé)任編輯:馬 卓)
Analysis of the @ Behavior in the Emergency Based on the Microblog
Qian Ying1Ni Junyu1Fan Minglin2
(1.School of Management,Shanghai University,Shanghai 200444,China;2.School of Society,Shanghai University,Shanghai 200444,China)
This paper studied what the @ behavior was relevant to among large number of micro-blogs about“sea anemones”.In the Sina microblog,it collected 518 posts related to this emergency in August,2012,and then this study did content analysis.In the analysis,apriori algorithm of the correlation analysis was used to obtain rules between key information and @ behavior.The innovation point of this paper was to analyze the sharing behavior @,which had important significance to understand what was the major information users would share with specified people in the emergency.This paper found that the most important information was the basic situation,the disaster sites,the time and three kinds of expression way(images of faces,pictures and short links),which would be helpful to respond to release of information in emergencies.
Micro-blog;content analysis;correlation analysis;emergency;information behavior
2014-12-15
國家自然科學(xué)基金項(xiàng)目“新媒介輿情與群體恐慌心理的動態(tài)關(guān)系研究”(項(xiàng)目編號:71103118);教育部人文社會科學(xué)重大攻關(guān)項(xiàng)目“推進(jìn)以保障和改善民生為重點(diǎn)的社會體制改革研究”(項(xiàng)目編號:13JZD025)。
錢 穎(1976-),女,講師,博士,研究方向:信息資源管理、網(wǎng)絡(luò)輿情傳播。
10.3969/j.issn.1008-0821.2015.04.002
G203
A
1008-0821(2015)04-0008-04