国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于微博輿情數(shù)據(jù)的震后有感范圍提取研究

2017-06-15 17:20曹彥波吳艷梅許瑞杰張方浩
地震研究 2017年2期

曹彥波++吳艷梅++許瑞杰++張方浩

摘要:提出了基于微博輿情信息的震后有感范圍快速判定技術(shù)框架,構(gòu)建了微博輿情數(shù)據(jù)的獲取方法和技術(shù)流程。根據(jù)中國(guó)地震烈度表和地震現(xiàn)場(chǎng)工作調(diào)查規(guī)范,將微博特征詞與地震災(zāi)情速判指標(biāo)進(jìn)行關(guān)聯(lián)匹配,建立微博災(zāi)情信息分類(lèi)指標(biāo)體系,通過(guò)自然鄰點(diǎn)空間插值方法將離散分布的微博災(zāi)情點(diǎn)轉(zhuǎn)化為連續(xù)分布的災(zāi)情面,形成震后災(zāi)區(qū)有感范圍的時(shí)空變化特征分布圖,輔助災(zāi)情快速判定。以2014年景谷66級(jí)地震為例,進(jìn)行探索和實(shí)踐。結(jié)果表明:在震后1~2 h內(nèi),微博用戶活躍度高,信息量大且豐富,對(duì)信息充分挖掘有助于對(duì)災(zāi)情的宏觀把握,對(duì)救災(zāi)決策部署有一定的參考意義,彌補(bǔ)了傳統(tǒng)獲取技術(shù)時(shí)效性差、數(shù)據(jù)量少、覆蓋面小等問(wèn)題。

關(guān)鍵詞:微博輿情數(shù)據(jù);災(zāi)情判定;有感范圍提取

中圖分類(lèi)號(hào):P315941文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1000-0666(2017)02-0303-08

0引言

地震發(fā)生后,災(zāi)情信息的快速獲取、處理、分析和研判是各級(jí)黨委政府、各級(jí)抗震救災(zāi)指揮部成員單位部署抗震救災(zāi)工作,派遣救援力量、調(diào)配救災(zāi)物資的關(guān)鍵環(huán)節(jié),尤其是震后2 h的黑箱期內(nèi),如何快速判定災(zāi)區(qū)影響范圍災(zāi)情時(shí)空分布、震害規(guī)模、強(qiáng)度等是地震應(yīng)急災(zāi)情快速獲取及服務(wù)的關(guān)鍵(聶高眾等,2012)。目前,在震后有感范圍確定方面,主要有以下幾個(gè)途徑:一是通過(guò)“三網(wǎng)一員”、政府、地震部門(mén)應(yīng)急人員電話、傳真,網(wǎng)站災(zāi)情填報(bào)等方式獲取災(zāi)情,繪制有感范圍圖;二是根據(jù)烈度衰減模型快速計(jì)算生成地震影響場(chǎng)來(lái)預(yù)估災(zāi)區(qū)范圍和強(qiáng)度(汪素云等,2000;王景來(lái),宋志峰,2001;張方浩等,2016a);三是基于智能手持采集終端(PDA、12322、IOS/Andrio手機(jī)端APP等)獲取地震信息,生成有感范圍分布圖(鄭黎輝等,2012;陳維鋒,2014;章熙海等,2014);四是通過(guò)網(wǎng)絡(luò)爬蟲(chóng)在網(wǎng)站上獲取災(zāi)情信息,通過(guò)地址匹配、空間定位解析后插值生成有感范圍分布圖(帥向華等,2009,2013;胡素平,帥向華,2012;楊天青等,2016)。在實(shí)際地震應(yīng)急中,上述幾種途徑在信息獲取的時(shí)效性、獲取效率、信息量、空間范圍上存在一定的局限性,短時(shí)間內(nèi)都難以全面客觀地反應(yīng)災(zāi)區(qū)有感范圍的強(qiáng)度和分布,“互聯(lián)網(wǎng)+”時(shí)代的來(lái)臨為我們?cè)谡鸷鬄?zāi)情快速獲取方面提供了一種新的解決思路。

根據(jù)中國(guó)互聯(lián)網(wǎng)絡(luò)信息中心(CNNIC)發(fā)布的《第38次中國(guó)互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計(jì)報(bào)告》顯示,截至2016年6月,中國(guó)網(wǎng)民規(guī)模達(dá)710億,互聯(lián)網(wǎng)普及率為488%,手機(jī)網(wǎng)民規(guī)模達(dá)656億,微博客用戶242億。從統(tǒng)計(jì)數(shù)字可以看出,隨著移動(dòng)互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,數(shù)量眾多的個(gè)人成為信息傳播的重要載體。相對(duì)于手機(jī)信令、浮動(dòng)車(chē)、微信等數(shù)據(jù),以新浪微博為代表的新興社交平臺(tái)具有實(shí)時(shí)性、互動(dòng)性、強(qiáng)擴(kuò)散、空間分布廣泛性等特點(diǎn),微博數(shù)據(jù)可以在互聯(lián)網(wǎng)上被免費(fèi)、公開(kāi)地獲?。莸?,2011;劉經(jīng)南等,2014;仇培元等,2016)。尤其是在破壞性地震發(fā)生后數(shù)小時(shí)內(nèi),大量與地震相關(guān)的信息發(fā)布并廣泛傳播,匯集形成海量數(shù)據(jù),包括用戶賬號(hào)、發(fā)布時(shí)間、經(jīng)緯度坐標(biāo)、博文、圖片、微視頻、關(guān)注熱點(diǎn)等,這些數(shù)據(jù)中包含有地震災(zāi)情信息,如震感、人員傷亡、房屋破壞、生命線工程破壞、地震地質(zhì)災(zāi)害等(王松等,2014;何宗宜等,2015;徐敬海等,2015)。通過(guò)對(duì)這些微博“大數(shù)據(jù)”進(jìn)行充分挖掘、分析、表達(dá)和應(yīng)用,能客觀地反映災(zāi)情時(shí)空演變規(guī)律,輔助地震災(zāi)情快速研判,服務(wù)政府應(yīng)急救援決策。[HJ]

本文根據(jù)微博輿情數(shù)據(jù)特點(diǎn)和傳播特性,研究如何利用微博輿情數(shù)據(jù)分時(shí)段提取地震有感范圍,并以2014年景谷66級(jí)地震為例進(jìn)行應(yīng)用檢驗(yàn)。

1研究技術(shù)框架

當(dāng)破壞性地震發(fā)生后,首先根據(jù)地震三要素信息,通過(guò)微博API調(diào)用、關(guān)鍵字檢索、網(wǎng)絡(luò)爬蟲(chóng)、專(zhuān)業(yè)地理抓取等技術(shù)手段,實(shí)時(shí)獲取微博用戶發(fā)布的信息,信息主要來(lái)源于新浪、騰訊、網(wǎng)易、人民網(wǎng)等主流網(wǎng)站微博用戶,對(duì)這些信息進(jìn)行存儲(chǔ)管理,形成結(jié)構(gòu)化的數(shù)據(jù)庫(kù)。其次,對(duì)微博數(shù)據(jù)進(jìn)行解析、去重,提取有效信息,包括微博發(fā)布時(shí)間、博文內(nèi)容、圖片、空間經(jīng)緯度坐標(biāo)等,并對(duì)核心博文內(nèi)容進(jìn)行中文分詞、清洗等挖掘處理,提取與地震災(zāi)情相關(guān)的特征詞,根據(jù)相關(guān)標(biāo)準(zhǔn)和規(guī)則對(duì)微博數(shù)據(jù)與地震烈度判定的描述性信息進(jìn)行關(guān)聯(lián)匹配,建立微博地震災(zāi)情信息分類(lèi)表。最后,以微博災(zāi)情節(jié)點(diǎn)為基礎(chǔ)進(jìn)行空間插值,將離散分布的災(zāi)情點(diǎn)轉(zhuǎn)化為連續(xù)分布的災(zāi)情有感范圍圖,描述災(zāi)情時(shí)空演變規(guī)律,輔助災(zāi)情研判。具體研究技術(shù)框架如圖1所示。

2微博數(shù)據(jù)獲取

微博數(shù)據(jù)獲取方式有網(wǎng)絡(luò)爬蟲(chóng)技術(shù)和調(diào)用微博官方API接口兩種途徑,基于網(wǎng)絡(luò)爬蟲(chóng)技術(shù)獲取信息的基本流程是通過(guò)設(shè)定入口URL地址,按照一定的爬行策略將網(wǎng)頁(yè)內(nèi)容保存,并提取網(wǎng)頁(yè)中有效地址作為下一次爬行的入口URL地址,直到爬行完畢。由于地震災(zāi)情信息抽取和空間定位要求,該方式信息獲取效率不高,空間地理位置還需通過(guò)地名規(guī)則、地址匹配技術(shù)進(jìn)行解析獲取,另外,多次訪問(wèn)有賬號(hào)屏蔽風(fēng)險(xiǎn)(廉捷等,2011)。因此,本文以當(dāng)前用戶基數(shù)較大的新浪微博為例,注冊(cè)認(rèn)證后獲取調(diào)用新浪微博的API權(quán)限,通過(guò)調(diào)用相關(guān)API,解析服務(wù)器返回的JSON數(shù)據(jù)文檔獲取微博信息,該方式微博信息獲取時(shí)效性高,數(shù)據(jù)格式清晰,便于數(shù)據(jù)的存儲(chǔ)和解析。微博數(shù)據(jù)獲取技術(shù)流程如圖2所示。

[BT(12]3微博數(shù)據(jù)分析表達(dá)

31微博數(shù)據(jù)分析處理[BT)]

面對(duì)海量的微博信息“大數(shù)據(jù)”,為提高數(shù)據(jù)挖掘效率和準(zhǔn)確率,需對(duì)原始數(shù)據(jù)進(jìn)行解析、去重,提取微博的發(fā)布時(shí)間、內(nèi)容、圖片、經(jīng)緯度坐標(biāo)等有效信息,并對(duì)核心博文內(nèi)容進(jìn)行中文分詞、清洗等挖掘處理,濾掉一些頻繁出現(xiàn)而意義又不大的詞,比如“的”“就”“是”“和”等語(yǔ)氣助詞、副詞、介詞和連詞,提取與地震災(zāi)情相關(guān)的特征詞、熱詞,對(duì)微博災(zāi)情信息進(jìn)行分類(lèi)和編碼,具體流程如圖3所示。

對(duì)微博信息進(jìn)行數(shù)據(jù)挖掘完成后,建立微博與地震災(zāi)情信息分類(lèi)映射是微博災(zāi)情可視化表達(dá)的關(guān)鍵環(huán)節(jié)。通過(guò)對(duì)2014年云南地區(qū)70余次地震新浪微博博文內(nèi)容進(jìn)行解析,提取主體特征詞,從結(jié)果分析看,震后與地震相關(guān)的內(nèi)容,主體集中于人的反應(yīng)、器物反應(yīng)方面,約占統(tǒng)計(jì)的70%以上,房屋破壞、人員傷亡、生命線工程破壞的信息以及地震地質(zhì)破壞方面的較少。依據(jù)《中國(guó)地震烈度表》《地震現(xiàn)場(chǎng)工作第3部分——調(diào)查規(guī)范》等相關(guān)標(biāo)準(zhǔn),將微博信息與地震災(zāi)情描述性信息進(jìn)行關(guān)聯(lián)匹配,建立了微博災(zāi)情分類(lèi)表(表1)(曹彥波等,2010;張方浩等,2016b)。

32微博數(shù)據(jù)可視化表達(dá)

微博數(shù)據(jù)的空間可視化表達(dá)是實(shí)現(xiàn)分析災(zāi)情時(shí)空演變規(guī)律的基礎(chǔ),震后獲取到的微博災(zāi)情數(shù)據(jù)往往是在地理上分布不規(guī)則的離散數(shù)據(jù),為了能夠更直觀地了解地震災(zāi)情時(shí)空分布特征,需以這些微博數(shù)據(jù)點(diǎn)為基礎(chǔ)進(jìn)行空間插值。常用的空間插值算法有反距離加權(quán)插值法(Inverse Distance to a Power)、克里金插值法(Kriging)、最小曲率插值法(Minimum Curvature)、樣條函數(shù)插值法、Shepard插值法和自然鄰點(diǎn)插值方法(Natural Neighbor Interpolation)等(高洋,張健,2005)。本文將采用自然鄰點(diǎn)插值方法來(lái)處理高度離散化分布的不規(guī)則微博災(zāi)情節(jié)點(diǎn),通過(guò)插值擬合來(lái)描述災(zāi)情空間尺度上的變化特征。

由于震區(qū)絕大部分微博用戶群體是一般公眾,個(gè)人震感不一,對(duì)災(zāi)情的描述也有差別,為方便對(duì)微博災(zāi)情節(jié)點(diǎn)進(jìn)行空間插值,使擬合出來(lái)的有感范圍更接近實(shí)際,基于中國(guó)地震局工程力學(xué)研究所提出的“等震線長(zhǎng)短軸半徑與烈度對(duì)應(yīng)經(jīng)驗(yàn)關(guān)系”,計(jì)算微博災(zāi)情位置距震中的距離,根據(jù)距離震中遠(yuǎn)近對(duì)微博數(shù)據(jù)進(jìn)行分級(jí)賦值,共分7級(jí):1代表有感區(qū),對(duì)應(yīng)烈度表的Ⅳ度區(qū);2代表輕微區(qū),對(duì)應(yīng)Ⅴ度區(qū);3代表輕度區(qū),對(duì)應(yīng)Ⅵ度區(qū);4代表中度區(qū),對(duì)應(yīng)Ⅶ度區(qū);5代表重災(zāi)區(qū),對(duì)應(yīng)Ⅷ度區(qū);6代表極重災(zāi)區(qū),對(duì)應(yīng)Ⅸ度區(qū);7代表巨災(zāi)區(qū),對(duì)應(yīng)Ⅹ度及以上(表2)。

4微博數(shù)據(jù)應(yīng)用實(shí)踐

[KG(0.2mm]2014年10月7日21時(shí)49分39秒,云南省普洱市景谷傣族彝族自治縣發(fā)生66級(jí)地震,震中位于(234°N,1005°E),震源深度50 km。這是進(jìn)入新世紀(jì)以來(lái)云南省發(fā)生的震級(jí)最大的一次地震,影響范圍廣,引起較多的微博用戶關(guān)注。筆者通過(guò)調(diào)用新浪API,以本次地震震中位置為中心,150 km為搜索半徑,數(shù)據(jù)采集時(shí)段為震后24 h。共獲取到1 231條微博信息,經(jīng)過(guò)清洗篩選后剩余281條與本次地震相關(guān)的災(zāi)情信息,包括人的反應(yīng)信息178條,器物反應(yīng)信息56條,房屋破壞信息15條,其他信息26條。發(fā)布這些信息的微博用戶地理位置上主要分布在普洱市、臨滄市、西雙版納州3個(gè)州(市)的16個(gè)縣(區(qū)),震中附近區(qū)域震感強(qiáng)烈,微博活躍用戶群體主要集中在永平鎮(zhèn)、距離震中較近的景谷縣城威遠(yuǎn)鎮(zhèn)以及人口密集的普洱市主城區(qū)(圖4)。[KG)]

從災(zāi)情數(shù)據(jù)分類(lèi)結(jié)果來(lái)看,在震后24 h內(nèi),災(zāi)情描述信息以人的反應(yīng)和器物反應(yīng)為主,占總信息條數(shù)的83%,而房屋破壞、地震地質(zhì)、生命線破壞等情況描述較少,不到20%,主要因?yàn)槲⒉┯脩羧后w以一般公眾為主,博文的內(nèi)容主體集中在微博用戶自身所處環(huán)境的感覺(jué)、表情、心情和身邊器物反應(yīng)的描述,對(duì)于其他如房屋破壞、地震地質(zhì),生命線破壞等比較專(zhuān)業(yè)的災(zāi)情描述不是很多(圖5)。

從震后24 h內(nèi)的微博災(zāi)情數(shù)據(jù)分時(shí)段統(tǒng)計(jì)結(jié)果看,大量的信息集中在震后2 h,共發(fā)布145條,占總條數(shù)的50%左右,第一條微博信息發(fā)布于2014年10月7日21時(shí)56分32秒,也就是震后3 min,發(fā)布的內(nèi)容為“就在1分鐘前,地震了,好恐怖[淚],這個(gè)美麗的地方又地震了”,地理位置是(101043 5°N,230588 8°E),距離本次震中64 km(圖6)。對(duì)獲取到的數(shù)據(jù)進(jìn)行分析挖掘,提取特征詞庫(kù),擬合形成了震后10 h災(zāi)情演變時(shí)空特征分布圖(表3,圖7)。

來(lái)自Ⅵ度區(qū)以外的臨翔區(qū)和思茅區(qū),景谷縣城附近震感強(qiáng)烈,周邊的景東、墨江、景洪、勐海、孟連、滄源有感,根據(jù)該圖,可幫助決策部門(mén)在較短時(shí)間內(nèi)把握宏觀災(zāi)情的空間分布和重點(diǎn)救助區(qū)域的初步判斷。震后1~4 h,隨著救援力量、救災(zāi)物資的投人,災(zāi)區(qū)社會(huì)秩序逐步恢復(fù),災(zāi)民得到救助和轉(zhuǎn)移安置,通信恢復(fù)正常,微博粉絲活躍度逐漸增加,信息發(fā)布量增多,有感范圍增大,但震感較強(qiáng)烈的區(qū)域還是在震中附近。震后8 h,隨著救援行動(dòng)的進(jìn)一步深入,震中永平鎮(zhèn)附近也發(fā)布有10多條相關(guān)的微博災(zāi)情信息,災(zāi)情進(jìn)一步明朗,空間分布上主要集中在永平鎮(zhèn)和威遠(yuǎn)鎮(zhèn)一帶,強(qiáng)有感區(qū)邊界也較清晰明顯。震后10 h,微博災(zāi)情有感范圍基本與實(shí)際地震烈度范圍一致。

5結(jié)語(yǔ)

“互聯(lián)網(wǎng)+”時(shí)代背景下,微博等新興社交平臺(tái)產(chǎn)生的“大數(shù)據(jù)”信息豐富、多變、復(fù)雜,充分挖掘利用這些數(shù)據(jù),對(duì)震后有感范圍提取,災(zāi)情快速判定提供了新的研究方法和技術(shù)實(shí)現(xiàn)途徑。本文提出了基于微博輿情數(shù)據(jù)的震后有感范圍快速判定的技術(shù)框架,詳細(xì)論述了微博輿情數(shù)據(jù)的獲取方法和技術(shù)流程,根據(jù)《中國(guó)地震烈度表》和《地震現(xiàn)場(chǎng)工作第3部分——調(diào)查規(guī)范》等規(guī)范,將微博主體特征詞與地震烈度判定的描述性信息進(jìn)行關(guān)聯(lián)匹配,建立了微博地震災(zāi)情信息分類(lèi)表,采用自然鄰點(diǎn)方法將微博災(zāi)情節(jié)點(diǎn)通過(guò)插值擬合來(lái)描述地震有感范圍時(shí)空變化特征。最后以景谷66級(jí)地震為例獲取了震后微博災(zāi)情數(shù)據(jù),對(duì)災(zāi)情數(shù)據(jù)進(jìn)行了分析處理,生成有感范圍時(shí)空演變圖,對(duì)于決策部門(mén)震后快速把握災(zāi)情提供了一種可行和有效的途徑。但在實(shí)際地震應(yīng)用中,應(yīng)將微博擬合結(jié)果與衰減模型烈度、儀器烈度、震源機(jī)制、破裂過(guò)程等信息進(jìn)行對(duì)比分析和綜合判定,提供更科學(xué)、合理的決策建議。

參考文獻(xiàn):

曹彥波,李永強(qiáng),胡秀玉2010地震現(xiàn)場(chǎng)災(zāi)情信息編碼體系研究[J].地震研究,33(3):344-348

陳維鋒,郭紅梅,張翼,等2014四川省地震災(zāi)情快速上報(bào)接收處理系統(tǒng)[J].災(zāi)害學(xué),29(2):116-122

仇培元,陸鋒,張恒才,等2016蘊(yùn)含地理事件微博客消息的自動(dòng)識(shí)別方法[J].地球信息科學(xué)學(xué)報(bào),18(7):886-893

高洋,張健2005基于自然鄰點(diǎn)插值的數(shù)據(jù)處理方法[J].中國(guó)科學(xué)院研究生院學(xué)報(bào),22(3):346-351

何宗宜,苗靜,彭將,等2015結(jié)合微博數(shù)據(jù)挖掘的時(shí)空特征分析[J].測(cè)繪通報(bào),(10):60-64

胡素平,帥向華2012網(wǎng)絡(luò)地震災(zāi)情信息智能處理模型與地震烈度判定方法研究[J].震災(zāi)防御技術(shù),7(4):420-430

廉捷,周欣,曹偉,等2011新浪微博數(shù)據(jù)挖掘方案[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,51(10):1300-1305

劉經(jīng)南,方媛,郭遲,等2014位置大數(shù)據(jù)的分析處理研究進(jìn)展[J].武漢大學(xué)學(xué)報(bào):信息科學(xué)版,39(4):379-385

聶高眾,安基文,鄧硯2012地震應(yīng)急災(zāi)情服務(wù)進(jìn)展[J].地震地質(zhì),34(4):783-789

帥向華,侯建盛,劉欽2009基于地震現(xiàn)場(chǎng)離散點(diǎn)災(zāi)情報(bào)告的災(zāi)害空間分析模擬研究[J].地震地質(zhì),31(2):321-333

帥向華,胡素平,鄭向向2013地震災(zāi)情網(wǎng)絡(luò)媒體獲取與處理模型研究[J].自然災(zāi)害學(xué)報(bào),(3):178-184

汪素云,俞言祥,高阿甲,等2000中國(guó)分區(qū)地震動(dòng)衰減關(guān)系的確定[J].中國(guó)地震,16(2):99-106

王景來(lái),宋志峰2001地震災(zāi)害快速評(píng)估模型[J].地震研究,24(2):162-167

王松,吳亞?wèn)|,李秋生,等2014基于時(shí)空分析的微博演化可視化[J].西南科技大學(xué)學(xué)報(bào),29(3):68-75

徐敬海,褚俊秀,聶高眾,等2015基于位置微博的地震災(zāi)情提取[J].自然災(zāi)害學(xué)報(bào),24(5):12-18

楊天青,席楠,張翼,等2016基于離散災(zāi)情信息的地震烈度分布快速判定方法研究[J].地震,36(2):48-59

張方浩,和仕芳,呂佳麗,等2016b基于互聯(lián)網(wǎng)的地震災(zāi)情信息分類(lèi)編碼與初步應(yīng)用研究[J].地震研究,39(4):664-671

張方浩,蔣飛蕊,李永強(qiáng),等2016a云南地區(qū)地震烈度評(píng)估模型研究[J].中國(guó)地震,32(3):572-583

章熙海,宋法奇,胡曉榮,等2014基于PDA的地震災(zāi)情信息流動(dòng)采集系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].地震,34(2):131-137

鄭黎輝,黃聲明,林巖釗,等2012基于智能手機(jī)的地震災(zāi)情快速上報(bào)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].國(guó)際地震動(dòng)態(tài),(6):164-164

牟定县| 梅河口市| 油尖旺区| 五寨县| 宕昌县| 隆昌县| 垫江县| 德清县| 永仁县| 彭水| 松溪县| 邵武市| SHOW| 玉山县| 九龙城区| 抚顺市| 樟树市| 黄石市| 大余县| 赤水市| 嘉义市| 合水县| 安新县| 沽源县| 宜兰市| 太白县| 赫章县| 德保县| 林州市| 公安县| 桦川县| 罗城| 彭泽县| 金沙县| 四子王旗| 南召县| 盐津县| 全南县| 高淳县| 西峡县| 资阳市|