張麗連
(天津財(cái)經(jīng)大學(xué)理工學(xué)院 天津 300222)
?
實(shí)時(shí)追蹤森林火災(zāi)受災(zāi)范圍的自動(dòng)估算方法的介紹與評(píng)價(jià)
張麗連
(天津財(cái)經(jīng)大學(xué)理工學(xué)院 天津 300222)
本文介紹了一項(xiàng)由Xu Zhong,Matt Duckham等人(2016)提出的基于緊急電話報(bào)警服務(wù)數(shù)據(jù)的眾包信息數(shù)據(jù)使用聚類算法進(jìn)行實(shí)時(shí)追蹤森林火災(zāi)受災(zāi)范圍的自動(dòng)估算方法,并對(duì)其創(chuàng)新性以及實(shí)際應(yīng)用價(jià)值進(jìn)行了評(píng)價(jià)。
火災(zāi);聚類算法;實(shí)時(shí)追蹤
用于計(jì)算自然災(zāi)害例如森林火災(zāi)或者洪水泛濫的有關(guān)空間范圍的實(shí)時(shí)信息可以協(xié)助救災(zāi)者快速有效地組織救災(zāi)活動(dòng),以及幫助群眾了解災(zāi)情。然而官方信息資源往往受到阻礙,并且是滯后的,而由使用者創(chuàng)造信息的社會(huì)媒體信息又往往缺乏必要的結(jié)構(gòu)和真實(shí)性用以進(jìn)行可靠的自動(dòng)處理。在緊急災(zāi)難中,眾包信息數(shù)據(jù)通常比官方信息產(chǎn)生得更迅速,因此在實(shí)時(shí)估計(jì)中利用這些信息更具有優(yōu)勢(shì)。但是這些眾包信息又因?yàn)樽钚?shù)據(jù)結(jié)構(gòu)的限制和數(shù)據(jù)噪聲的影響使得與目標(biāo)事件并不直接相關(guān),因此在使用這些信息前應(yīng)該先對(duì)其進(jìn)行過(guò)濾、真實(shí)性驗(yàn)證以及質(zhì)量控制。利用眾包信息數(shù)據(jù)進(jìn)行實(shí)時(shí)估計(jì)的好處是明顯的。在確保較為滿意的精度下,使用眾包數(shù)據(jù)可以做到實(shí)時(shí)估計(jì)比傳統(tǒng)估計(jì)更靈活,且成本更低。
本文介紹的實(shí)時(shí)追蹤森林火災(zāi)受災(zāi)范圍的自動(dòng)估算模型由Xu Zhong,Matt Duckham等人(2016)提出,文章發(fā)表在自然雜志子刊科學(xué)報(bào)告上。該文章提出了一種基于緊急電話報(bào)警服務(wù)數(shù)據(jù)的公眾可用的眾包數(shù)據(jù)進(jìn)行實(shí)時(shí)追蹤森林火災(zāi)受災(zāi)范圍的自動(dòng)計(jì)算估計(jì)技術(shù)。作者先介紹了實(shí)時(shí)估計(jì)森林火災(zāi)的背景,再對(duì)傳統(tǒng)官方信息以及眾包信息在森林火災(zāi)范圍估計(jì)中的優(yōu)劣進(jìn)行了比較。然后利用2009年澳大利亞維多利亞黑色周六森林火災(zāi)的數(shù)據(jù)來(lái)展示這個(gè)模型在比較令人滿意的精度上自動(dòng)實(shí)時(shí)辨別和追蹤森林火災(zāi)邊長(zhǎng)可能線。通過(guò)結(jié)合其他官方人口統(tǒng)計(jì)學(xué)和環(huán)境信息,例如人口密度和風(fēng)場(chǎng)動(dòng)態(tài)變化的數(shù)據(jù)來(lái)提高該模型估計(jì)的精確度。并對(duì)部分參數(shù)進(jìn)行直覺(jué)上的調(diào)整。模型建立后,再把2014年墨西哥米克勒姆森林火災(zāi)數(shù)據(jù)代入模型中進(jìn)行交叉驗(yàn)證,驗(yàn)證了模型具有良好的精確性。
以下對(duì)模型進(jìn)行介紹。
(1)數(shù)據(jù):Xu Zhong等選取了2009年澳大利亞維多利亞黑色周六森林火災(zāi)報(bào)警數(shù)據(jù)進(jìn)行模型的擬合和估計(jì)。該數(shù)據(jù)集主要包括三個(gè)方面:報(bào)警時(shí)間、所處位置、報(bào)告事故類型。報(bào)警數(shù)據(jù)可能受以下兩個(gè)因素的影響:不同地點(diǎn)的呼叫電話可能是來(lái)自同一場(chǎng)火災(zāi)前線;而相近點(diǎn)的報(bào)警電話可能是不同的火災(zāi)前線,即使在重大火災(zāi)中緊急呼叫電話也可能是其他事件的。因此需要利用已存在的空間聚類和結(jié)構(gòu)構(gòu)建技術(shù)對(duì)呼叫電話根據(jù)主題,時(shí)間,地點(diǎn)進(jìn)行聚類篩選。
(2)模型主要參數(shù):檢測(cè)到的火災(zāi)最小面積(At);火災(zāi)最長(zhǎng)的移動(dòng)多邊形的周長(zhǎng)范圍(x);處理中的報(bào)警電話所在區(qū)域的“窗口”大小;受限于空間(Es)和時(shí)間(Et)用于ST-DBSCAN聚類算法的最小街區(qū)電話報(bào)警數(shù)(minPts)。
(3)模型構(gòu)建的四個(gè)步驟:1)對(duì)事故信息進(jìn)行過(guò)濾;2)使用ST-DBSCAN算法進(jìn)行空間聚類;3)重塑火災(zāi)周長(zhǎng)形狀;4)基于地面信息對(duì)估計(jì)量的甄別。
(4)估計(jì)精確度的判斷標(biāo)準(zhǔn):召回率、精確率以及F1分?jǐn)?shù)。
Xu Zhong等按照以上的步驟建立了實(shí)時(shí)估計(jì)模型,并利用人口密度和風(fēng)場(chǎng)動(dòng)態(tài)變化的數(shù)據(jù),對(duì)部分參數(shù)進(jìn)行調(diào)整。最后他們把模型應(yīng)用在實(shí)時(shí)估計(jì)2014年米克勒姆森林火災(zāi)周長(zhǎng)范圍,模型的預(yù)測(cè)表現(xiàn)出了高召回率低精確率。由于在火災(zāi)范圍實(shí)時(shí)估計(jì)中高召回率更具有價(jià)值,因此該模型的應(yīng)用具有很大的現(xiàn)實(shí)意義。
該方法的創(chuàng)新性主要體現(xiàn)在兩個(gè)方面。
第一,相比過(guò)去的檢測(cè)技術(shù),該項(xiàng)技術(shù)可以做到實(shí)時(shí)檢測(cè),并且成本較低。過(guò)去計(jì)算火災(zāi)范圍只能依靠實(shí)體硬件技術(shù)檢測(cè),例如地面檢測(cè)儀、高空衛(wèi)星檢測(cè)或者空中紅外線檢測(cè)等,但是這些檢測(cè)都無(wú)法做到實(shí)時(shí)監(jiān)測(cè)和預(yù)測(cè),且存在明顯的滯后性。這大大降低了監(jiān)測(cè)的價(jià)值,因?yàn)槿绻梢詫?shí)現(xiàn)火宅周長(zhǎng)實(shí)時(shí)估計(jì)就能夠挽救大量的生命和財(cái)產(chǎn)并從而把火宅造成的損失降到最低。同時(shí)使用這些硬件設(shè)備進(jìn)行監(jiān)測(cè)的成本往往是高昂的,有很多地方都沒(méi)能使用上這些硬件設(shè)備進(jìn)行森林火宅檢測(cè),而文章中介紹的利用報(bào)警電話數(shù)據(jù)以及結(jié)合其他一些低成本并且可實(shí)時(shí)獲取的輔助信息對(duì)森林火災(zāi)周長(zhǎng)進(jìn)行實(shí)時(shí)估計(jì),充分地利用和挖掘眾包信息數(shù)據(jù)的價(jià)值。
第二,文章結(jié)合過(guò)去已經(jīng)研究深徹的ST-DBSCAN聚類算法以及χ-shapes形狀重塑算法還有新設(shè)計(jì)的算法形成新模型對(duì)森林火宅進(jìn)行實(shí)時(shí)估計(jì)。算法的設(shè)計(jì)基本上是現(xiàn)成的,但是在實(shí)際操作設(shè)計(jì)上,Xu Zhong等充分發(fā)揮了其對(duì)火宅周長(zhǎng)計(jì)算的經(jīng)驗(yàn)從而對(duì)計(jì)算的具體情況的準(zhǔn)確把握大大提高整個(gè)計(jì)算的精確度。
文中介紹的這種方法背后的思維方法促使人對(duì)數(shù)據(jù)挖掘產(chǎn)生了一種新的理解。隨著信息時(shí)代的不斷滲透,生活處處是數(shù)據(jù),我們無(wú)時(shí)無(wú)刻不在產(chǎn)生出數(shù)據(jù)。過(guò)去有大量的數(shù)據(jù)我們并不知道如何去使用和發(fā)揮其價(jià)值,但如今我們?cè)絹?lái)越意識(shí)到應(yīng)該學(xué)會(huì)如何從這些看似沒(méi)有很大用途的數(shù)據(jù)中挖掘出“黃金”。就如同當(dāng)年沉寂在農(nóng)場(chǎng)站里的90多年的繁雜數(shù)據(jù)一樣,經(jīng)過(guò)偉大的統(tǒng)計(jì)學(xué)家費(fèi)歇爾的重新設(shè)計(jì)和利用重現(xiàn)其應(yīng)有的價(jià)值一般。
同時(shí),筆者認(rèn)為該方法如果能夠應(yīng)用到我國(guó)的火災(zāi)或者洪水泛濫的災(zāi)情預(yù)測(cè)中,將可以大大地降低人民群眾的生命財(cái)產(chǎn)損失。但是在應(yīng)用這項(xiàng)技術(shù)之前,應(yīng)該注意到我國(guó)目前的報(bào)警電話數(shù)據(jù)的數(shù)據(jù)結(jié)構(gòu)還需要進(jìn)一步改善,即需要登記者在錄入報(bào)警信息時(shí)按照一定的格式錄入,讓報(bào)警者提供與預(yù)測(cè)最相關(guān)的數(shù)據(jù)。這就有賴于相關(guān)部門對(duì)報(bào)警電話信息錄入方法的改進(jìn),同時(shí)加強(qiáng)對(duì)災(zāi)情預(yù)測(cè)技術(shù)的進(jìn)一步的研究。
[1]Xu Zhong,Matt Duckham,Derek Chong,* & Kevin Tolhurst.Real-time estimation of wildfire perimeters from curated crowdsourcing.Nature:Scientific Reports 6,Article number:24206(2016)
張麗連(1990-),女,漢族,廣東茂名人,碩士,天津財(cái)經(jīng)大學(xué)理工學(xué)院,統(tǒng)計(jì)學(xué)。