趙亮 俞海洋 李嬌 魏軍
摘 要:該文通過對(duì)傳統(tǒng)氣象災(zāi)害上報(bào)收集方法進(jìn)行總結(jié)分析,發(fā)現(xiàn)傳統(tǒng)方法收集到的氣象災(zāi)害信息數(shù)據(jù)來源渠道多,數(shù)據(jù)存儲(chǔ)格式、標(biāo)準(zhǔn)不一致,數(shù)據(jù)應(yīng)用不規(guī)范,更新不及時(shí),難以滿足實(shí)時(shí)氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警服務(wù)需求。因此,該文針對(duì)上述問題,提出一種基于網(wǎng)絡(luò)輿情監(jiān)測(cè)技術(shù)的氣象災(zāi)害信息收集方法,該方法可進(jìn)一步提高氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警與評(píng)估的時(shí)效性和準(zhǔn)確性。
關(guān)鍵詞:互聯(lián)網(wǎng)時(shí)代 氣象災(zāi)害 信息收集與處理
中圖分類號(hào):TP399 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-3791(2017)07(a)-0004-02
我國(guó)是氣象災(zāi)害多發(fā)國(guó)家,每年汛期又是氣象災(zāi)害的多發(fā)期,遭遇的氣象災(zāi)害主要有暴雨、冰雹、大風(fēng)、高溫、臺(tái)風(fēng)、雷電等。在全球氣候持續(xù)變暖的大背景下,各類極端天氣氣候事件更加頻繁,氣象災(zāi)害造成的損失和影響不斷加重,因此,做好氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警與評(píng)估工作對(duì)于最大限度減少災(zāi)害造成的損失、保障經(jīng)濟(jì)社會(huì)發(fā)展和人民安全福祉具有至關(guān)重要的意義。
目前,氣象部門氣象災(zāi)害數(shù)據(jù)主要來自災(zāi)情直報(bào)、災(zāi)情普查、暴雨洪澇災(zāi)害風(fēng)險(xiǎn)普查、民政部災(zāi)情、公路交通專業(yè)氣象災(zāi)害風(fēng)險(xiǎn)普查等。由于氣象觀測(cè)站點(diǎn)建設(shè)相對(duì)稀疏和人力資源的限制,無法全面、及時(shí)地上報(bào)災(zāi)情信息,從而造成氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警與評(píng)估的實(shí)時(shí)性差、準(zhǔn)確性低。
隨著互聯(lián)網(wǎng)的不斷壯大,網(wǎng)絡(luò)已經(jīng)成為各類資源數(shù)據(jù)的重要來源。但是,網(wǎng)絡(luò)數(shù)據(jù)的龐大也曾讓人們望而卻步。隨著網(wǎng)絡(luò)技術(shù)的不斷提高,現(xiàn)如今利用網(wǎng)絡(luò)輿情監(jiān)測(cè)、云計(jì)算和大數(shù)據(jù)等技術(shù),可實(shí)現(xiàn)全天24 h不間斷監(jiān)測(cè)網(wǎng)絡(luò)信息,并快速發(fā)現(xiàn)網(wǎng)絡(luò)中的氣象災(zāi)情信息,大大提高災(zāi)情獲取的時(shí)效性,拓展了災(zāi)情收集渠道,及時(shí)獲取第一手資料。可進(jìn)一步提高氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警與評(píng)估的實(shí)時(shí)性和準(zhǔn)確性。
1 基于網(wǎng)絡(luò)輿情監(jiān)測(cè)技術(shù)的氣象災(zāi)害信息收集方法
1.1 網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)
隨著互聯(lián)網(wǎng)的快速發(fā)展,網(wǎng)絡(luò)媒體作為一種新的信息傳播形式,已深入人們的日常生活。網(wǎng)友言論活躍已達(dá)到前所未有的程度,不論是國(guó)內(nèi)還是國(guó)際重大事件,都能馬上形成網(wǎng)上輿論,通過這種網(wǎng)絡(luò)來表達(dá)觀點(diǎn)、傳播思想,進(jìn)而產(chǎn)生巨大的輿論壓力,達(dá)到任何部門、機(jī)構(gòu)都無法忽視的地步。可以說,互聯(lián)網(wǎng)已成為思想文化信息的集散地和社會(huì)輿論的放大器。
“網(wǎng)絡(luò)輿情監(jiān)測(cè)系統(tǒng)”是針對(duì)在一定的社會(huì)空間內(nèi),圍繞中介性社會(huì)事件的發(fā)生、發(fā)展和變化,民眾對(duì)社會(huì)管理者產(chǎn)生和持有的社會(huì)政治態(tài)度于網(wǎng)絡(luò)上表達(dá)出來意愿集合而進(jìn)行的計(jì)算機(jī)監(jiān)測(cè)的系統(tǒng)統(tǒng)稱。
輿情監(jiān)測(cè)的主要功能包括以下幾點(diǎn):
(1)熱點(diǎn)識(shí)別能力??梢愿鶕?jù)新聞出處權(quán)威度、評(píng)論數(shù)量、發(fā)言時(shí)間密集程度等參數(shù),識(shí)別出給定時(shí)間段內(nèi)的熱門話題。
(2)傾向性分析與統(tǒng)計(jì)。對(duì)信息的闡述的觀點(diǎn)、主旨進(jìn)行傾向性分析。以提供參考分析依據(jù)。分析的依據(jù)可根據(jù)信息的轉(zhuǎn)載量、評(píng)論的回言信息時(shí)間密集度。來判別信息的發(fā)展傾向。
(3)主題跟蹤。主題跟蹤主要是指針對(duì)熱點(diǎn)話題進(jìn)行信息跟蹤,并對(duì)其進(jìn)行傾向性與趁勢(shì)分析。跟蹤的具體內(nèi)容包括:信息來源、轉(zhuǎn)載量、轉(zhuǎn)載地址、地域分布、信息發(fā)布者等相關(guān)信息元素。其建立在傾向性與趁勢(shì)分析的基礎(chǔ)上。
(4)信息自動(dòng)摘要功能。能夠根據(jù)文檔內(nèi)容自動(dòng)抽取文檔摘要信息,這些摘要能夠準(zhǔn)確代表文章內(nèi)容主題和中心思想。用戶無需查看全部文章內(nèi)容,通過該智能摘要即可快速了解文章大意與核心內(nèi)容,提高用戶信息利用效率。而且該智能摘要可以根據(jù)用戶需求調(diào)整不同長(zhǎng)度,滿足不同的需求。主要包括文本信息摘要與網(wǎng)頁(yè)信息摘要兩個(gè)方面。
(5)趨勢(shì)分析。通過圖表展示監(jiān)控詞匯和時(shí)間的分布關(guān)系以及趨勢(shì)分析,包括地域信息分布。以提供階段性的分析。如:信息傳播的區(qū)域分布,轉(zhuǎn)載量與轉(zhuǎn)載網(wǎng)站類型等。
(6)突發(fā)事件分析。突發(fā)事件不外乎有以下幾種:自然災(zāi)害、社會(huì)災(zāi)難、戰(zhàn)爭(zhēng)、動(dòng)亂和偶發(fā)事件等。互聯(lián)網(wǎng)信息監(jiān)控分析系統(tǒng)主要是針對(duì)互聯(lián)網(wǎng)信息進(jìn)行突發(fā)事件監(jiān)聽與分析。對(duì)熱點(diǎn)信息的傾向分析與趁勢(shì)分析,以監(jiān)聽信息的突發(fā)性。
(7)報(bào)警系統(tǒng)。報(bào)警系統(tǒng)主要是針對(duì)輿情分析引擎系統(tǒng)的熱點(diǎn)信息與突發(fā)事件進(jìn)行監(jiān)聽分析,然后根據(jù)信息的語(yǔ)料庫(kù)與報(bào)警監(jiān)控信息庫(kù)進(jìn)行分析。以確保信息的輿論健康發(fā)展。
(8)統(tǒng)計(jì)報(bào)告。根據(jù)輿情分析引擎處理后的結(jié)果庫(kù)生成報(bào)告,用戶可通過瀏覽器瀏覽,提供信息檢索功能,根據(jù)指定條件對(duì)熱點(diǎn)話題、傾向性進(jìn)行查詢,并瀏覽信息的具體內(nèi)容,提供決策支持。
(9)預(yù)警。輿情預(yù)警是一種時(shí)效性要求很高、重要程度要求很高的精準(zhǔn)網(wǎng)絡(luò)輿情監(jiān)測(cè)功能。一個(gè)是滿足用戶對(duì)一些已經(jīng)發(fā)生的重要網(wǎng)絡(luò)事件的實(shí)時(shí)監(jiān)測(cè),及時(shí)跟蹤事件的發(fā)展態(tài)勢(shì);另一個(gè)是滿足用戶相關(guān)行為信息的監(jiān)測(cè)和預(yù)警。預(yù)警方式分為三種:在線彈框預(yù)警、手機(jī)短信預(yù)警和郵箱預(yù)警。監(jiān)測(cè)預(yù)警包括監(jiān)測(cè)和預(yù)警兩個(gè)過程,當(dāng)系統(tǒng)監(jiān)測(cè)到輿情信息后將及時(shí)發(fā)出預(yù)警,讓相關(guān)人員第一時(shí)間掌握輿情狀況。
1.2 互聯(lián)網(wǎng)中氣象災(zāi)害信息的提取
利用輿情監(jiān)測(cè)技術(shù),設(shè)置各類氣象災(zāi)害關(guān)鍵詞,即可完成互聯(lián)網(wǎng)中災(zāi)害信息的提取。該方法應(yīng)具有以下幾個(gè)特征
(1)多載體全網(wǎng)監(jiān)測(cè)??杀O(jiān)測(cè)搜索引擎、新聞門戶、論壇、博客、留言板、微博、微信、QQ群、電子報(bào)、SNS載體、各單位主頁(yè)。提供通用采集配置,支持大部分新聞、論壇的采集,并可配置指定URL,指定微博、微信賬戶的監(jiān)測(cè)。
(2)全天候不間斷監(jiān)測(cè)??啥〞r(shí)監(jiān)測(cè),也可24 h全天候監(jiān)測(cè),不放過每一條網(wǎng)絡(luò)災(zāi)情信息,第一時(shí)間發(fā)現(xiàn)網(wǎng)絡(luò)氣象災(zāi)情。
(3)信息智能提取技術(shù)。智能提取網(wǎng)頁(yè)中有效的災(zāi)情信息,如:發(fā)生時(shí)間、地點(diǎn)、影響等。并對(duì)具有關(guān)聯(lián)性的多個(gè)網(wǎng)頁(yè)內(nèi)容進(jìn)行自動(dòng)合并、自動(dòng)提取等。
(4)結(jié)構(gòu)化采集技術(shù)。對(duì)非結(jié)構(gòu)化的網(wǎng)頁(yè)數(shù)據(jù)采集時(shí)進(jìn)行結(jié)構(gòu)化的信息抽取和數(shù)據(jù)存儲(chǔ),滿足多維度的信息挖掘和統(tǒng)計(jì)需要,形成結(jié)構(gòu)化的災(zāi)情信息記錄。
(5)關(guān)鍵詞管理功能??稍O(shè)置與氣象災(zāi)害相關(guān)的關(guān)鍵詞,如暴雨、大風(fēng)、暴雪等,根據(jù)設(shè)定的關(guān)鍵詞進(jìn)行監(jiān)控。也可以實(shí)現(xiàn)自動(dòng)提取關(guān)鍵詞功能,根據(jù)搜索到的有效信息,自動(dòng)關(guān)聯(lián)其他關(guān)鍵詞,進(jìn)一步豐富氣象災(zāi)害關(guān)鍵詞。
(6)災(zāi)情傳播途徑跟蹤。智能分析網(wǎng)絡(luò)輿情傳播途徑,并通過反向解析技術(shù)解析出URL所對(duì)應(yīng)的網(wǎng)站名稱。使整個(gè)監(jiān)管平臺(tái)能夠有效的實(shí)現(xiàn)“發(fā)現(xiàn)傳播源頭、追蹤傳播內(nèi)容、監(jiān)控傳播主體”,可通過該項(xiàng)功能查找氣象災(zāi)害主要傳播媒體。
2 網(wǎng)絡(luò)氣象災(zāi)害信息共享平臺(tái)
為了便于網(wǎng)絡(luò)氣象災(zāi)害信息的應(yīng)用,網(wǎng)絡(luò)氣象災(zāi)害數(shù)據(jù)庫(kù)設(shè)計(jì)的合理性則十分重要。該文中的設(shè)計(jì)原則有以下幾種。
(1)基本字段設(shè)置。為了充分利用原有氣象災(zāi)情數(shù)據(jù)庫(kù)(如災(zāi)情直報(bào)數(shù)據(jù)庫(kù)),該文參照《全國(guó)氣象災(zāi)情收集上報(bào)技術(shù)規(guī)范》設(shè)置數(shù)據(jù)庫(kù)字段,其數(shù)據(jù)庫(kù)字段屬性與其保持基本一致。
(2)災(zāi)情信息分類。根據(jù)災(zāi)害發(fā)生地點(diǎn),本文將災(zāi)情信息分為兩種:面狀災(zāi)情和點(diǎn)狀災(zāi)情。所謂面狀災(zāi)情,指的是災(zāi)害發(fā)生地點(diǎn)具體到某個(gè)市或者縣,范圍比較粗略;而點(diǎn)狀災(zāi)情,指的是災(zāi)害發(fā)生地點(diǎn)具體到某個(gè)村鎮(zhèn)或者某條街道,范圍比較精確。
(3)地理信息。根據(jù)災(zāi)害發(fā)生地點(diǎn),為每條災(zāi)情信息添加相應(yīng)的經(jīng)緯度信息。
(4)氣象要素信息。根據(jù)不同的災(zāi)害種類,為每條災(zāi)情信息匹配其相對(duì)應(yīng)的氣象要素。這樣便于后期氣象災(zāi)情數(shù)據(jù)的高效利用。
將網(wǎng)絡(luò)中搜集的災(zāi)情信息按照上述原則進(jìn)行入庫(kù),形成災(zāi)情信息共享,供氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警與評(píng)估業(yè)務(wù)平臺(tái)實(shí)時(shí)訪問。
3 關(guān)鍵技術(shù)
3.1 氣象災(zāi)情關(guān)鍵詞設(shè)置
利用網(wǎng)絡(luò)進(jìn)行搜索,得到的結(jié)果準(zhǔn)確與否,很大程度上與所設(shè)置的關(guān)鍵詞相關(guān)。設(shè)置的關(guān)鍵詞過多,得到的信息越準(zhǔn)確,但是也有可能丟失過多有用信息;設(shè)置的關(guān)鍵詞過少,得到的冗余信息太多,又加大了篩選工作的難道。如何得到合適的關(guān)鍵詞,成為了該文中的關(guān)鍵技術(shù)。
該文主要是采用人機(jī)互動(dòng)的方式完善關(guān)鍵詞管理功能,前期對(duì)人工搜索的災(zāi)害相關(guān)信息,進(jìn)行整理分析,統(tǒng)計(jì)描述災(zāi)情使用詞匯的頻率。將頻率較高的詞匯設(shè)置為初始關(guān)鍵詞;后期系統(tǒng)根據(jù)初始關(guān)鍵詞,查找到相關(guān)信息,自動(dòng)統(tǒng)計(jì)高頻詞匯,進(jìn)行添加,實(shí)現(xiàn)關(guān)鍵詞的逐步完善。
3.2 氣象要素匹配技術(shù)
根據(jù)發(fā)生時(shí)間為每條災(zāi)情信息匹配其相關(guān)的氣象信息。通過自動(dòng)調(diào)取氣象資料庫(kù),包括A文件、Z文件、加密自動(dòng)站資料、雷達(dá)資料和氣象衛(wèi)星云圖等,通過插值、雷達(dá)反演等方法獲取災(zāi)情發(fā)生地距離最近、時(shí)間最接近的氣象資料,采用自動(dòng)和人工相結(jié)合的方法給每條災(zāi)情記錄信息添加產(chǎn)生氣象災(zāi)情的氣象要素實(shí)況的特征值。
3.3 氣象災(zāi)情數(shù)據(jù)篩選
(1)通過氣象要素實(shí)況資料的匹配剔除錯(cuò)誤、標(biāo)記可疑災(zāi)情信息記錄。將氣象要素的實(shí)況資料與逐條災(zāi)情資料信息對(duì)比分析,對(duì)實(shí)況資料與災(zāi)情影響明顯不符的應(yīng)刪除,有疑問的,標(biāo)記為可疑記錄。
(2)從民政、統(tǒng)計(jì)、水利、農(nóng)業(yè)、交通運(yùn)輸?shù)扔嘘P(guān)部門、氣象災(zāi)害大典、報(bào)紙和媒體等獲取災(zāi)情及影響數(shù)據(jù)再次實(shí)現(xiàn)對(duì)氣象災(zāi)情資料的篩選,確保災(zāi)情資料的合法可靠。
4 結(jié)語(yǔ)
氣象災(zāi)害災(zāi)情的快速收集和共享對(duì)于開展災(zāi)害性天氣的監(jiān)測(cè)、預(yù)報(bào)和服務(wù)工作至關(guān)重要?;诰W(wǎng)絡(luò)輿情監(jiān)測(cè)技術(shù)的氣象災(zāi)害信息收集方法可以有效解決現(xiàn)有災(zāi)情收集方法上報(bào)不及時(shí),覆蓋范圍密度低等缺點(diǎn)??蓪?shí)現(xiàn)災(zāi)情的快速共享,有效提高氣象災(zāi)害風(fēng)險(xiǎn)預(yù)警的時(shí)效性和評(píng)估的準(zhǔn)確性,加強(qiáng)氣象預(yù)報(bào)服務(wù)和災(zāi)害災(zāi)情分析能力,對(duì)于各級(jí)部門開展災(zāi)害災(zāi)情應(yīng)用亦有較強(qiáng)的指導(dǎo)意義。
參考文獻(xiàn)
[1] 帥向華,胡素平,劉欽,等.地震災(zāi)情網(wǎng)絡(luò)媒體獲取與處理模型[J].自然災(zāi)害學(xué)報(bào),2013,22(3):178-184.
[2] 中國(guó)氣象局關(guān)于印發(fā)《氣象災(zāi)害風(fēng)險(xiǎn)管理業(yè)務(wù)建設(shè)(2015—2016年)實(shí)施方案》的通知[氣發(fā)〔2015〕46號(hào)][Z].2015.
[3] 程鵬.氣象災(zāi)情收集與影響評(píng)估工作中存在的若干問題[J].湖北氣象,2005(4):39-40.
[4] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計(jì)算機(jī)學(xué)報(bào),2013,36(6):1125-1138.
[5] 王清川.近58年廊坊市氣象災(zāi)情普查分析及問題與建議[J].防災(zāi)科技學(xué)院學(xué)報(bào),2009,11(4):36-43.
[6] 杜鵑,汪明,史培軍.基于歷史事件的暴雨洪澇災(zāi)害損失概率風(fēng)險(xiǎn)評(píng)估——以湖南省為例[J].應(yīng)用基礎(chǔ)與工程科學(xué)學(xué)報(bào),2014,22(5):916-927.
[7] 蔡立輝,楊欣翥.大數(shù)據(jù)在社會(huì)輿情監(jiān)測(cè)與決策制定中的應(yīng)用研究[J].行政論壇,2015(2):1-10.
[8] 黃崇福.用智聯(lián)網(wǎng)緩解風(fēng)險(xiǎn)分析中的4個(gè)問題[J].自然災(zāi)害學(xué)報(bào),2014,23(2):1-7.
[9] 章國(guó)才.氣象災(zāi)害風(fēng)險(xiǎn)評(píng)估與區(qū)劃方法[M].氣象出版社,2010.