杜秋洋 楊傳杰 張國(guó)琛 武英達(dá) 石 寬
(1.中國(guó)消防救援學(xué)院,北京 102202;2.森林草原火災(zāi)風(fēng)險(xiǎn)防控應(yīng)急管理部重點(diǎn)實(shí)驗(yàn)室,北京 102202)
森林作為一種重要的自然資源,在維護(hù)生態(tài)平衡、保持水土流失等方面具有重要意義,一旦發(fā)生森林火災(zāi)危害巨大[1]。據(jù)統(tǒng)計(jì),僅2010—2020年我國(guó)發(fā)生的森林火災(zāi)就有39 040起,特別是2019—2020年連續(xù)兩年發(fā)生撲火人員重大傷亡,給我國(guó)森林資源和人民生命財(cái)產(chǎn)安全造成嚴(yán)重?fù)p失,因此森林火災(zāi)的有效精準(zhǔn)預(yù)測(cè)已成為目前亟待解決的科學(xué)問(wèn)題。云南省森林資源豐富,具有自然保護(hù)區(qū)、森林公園、濕地公園等11類自然保護(hù)地362處,占云南國(guó)土面積的14.32%[2],這些區(qū)域一旦發(fā)生森林火災(zāi),后果將不堪設(shè)想。
近年來(lái),國(guó)內(nèi)外已有許多專家學(xué)者通過(guò)Logistic回歸模型研究森林火災(zāi)發(fā)生的規(guī)律,并取得了一定成果。蘇漳文等[3]利用福建省9個(gè)驅(qū)動(dòng)因子(日最高地表氣溫、平均風(fēng)速、日照時(shí)長(zhǎng)等)建立該地區(qū)Logistic回歸模型,該模型的預(yù)測(cè)森林火災(zāi)發(fā)生準(zhǔn)確率達(dá)到72.3%,具有較好的預(yù)測(cè)效果,進(jìn)一步驗(yàn)證LR模型在預(yù)測(cè)森林火災(zāi)發(fā)生概率的可行性。宋雨[4]以黑龍江省為研究對(duì)象,利用Logistic回歸模型對(duì)氣象因子(風(fēng)速、溫度、降水量等)和非氣象因子(距離公路距離、人均GDP、人口密度等)進(jìn)行分析驗(yàn)證,研究結(jié)果表明:在黑龍江省森林火災(zāi)預(yù)測(cè)當(dāng)中,氣象驅(qū)動(dòng)因子對(duì)該省林火發(fā)生概率影響更加顯著。閆平等[5]利用Logistic回歸模型綜合了地形、氣象、植被、人為基礎(chǔ)設(shè)施等因子,建立大興安嶺林區(qū)的多驅(qū)動(dòng)因子森林火災(zāi)發(fā)生預(yù)測(cè)模型。張翔[6]分析了影響四川省涼山州森林火災(zāi)發(fā)生的驅(qū)動(dòng)因子,并建立四川涼山州森林火災(zāi)發(fā)生的預(yù)測(cè)模型。Mohammadi等[7]結(jié)合伊朗庫(kù)爾德斯坦省的火點(diǎn)數(shù)據(jù),利用Logistic回歸模型研究得出火災(zāi)發(fā)生概率與該地土地坡度、場(chǎng)地高程和與農(nóng)田距離呈負(fù)相關(guān),但與年降水量呈正相關(guān)。
Logistic回歸模型在森林火災(zāi)發(fā)生預(yù)測(cè)方面已被國(guó)內(nèi)外專家廣泛運(yùn)用,其在預(yù)測(cè)森林火災(zāi)發(fā)生概率中具有較好效果。如能在我國(guó)重點(diǎn)林區(qū)建立適用模型,將有利于采取有效措施降低火災(zāi)風(fēng)險(xiǎn),減少撲火成本。本文基于云南省歷史火點(diǎn)數(shù)據(jù),結(jié)合氣象、地形、植被等驅(qū)動(dòng)因子驗(yàn)證Logistic回歸模型在該地區(qū)森林火災(zāi)監(jiān)測(cè)的適用性,并建立森林火災(zāi)發(fā)生預(yù)測(cè)模型,以期為加強(qiáng)森林火災(zāi)預(yù)防和管理提供參考。
云南省位于21°8′~29°15′N和97°31′~106°11′E之間,平均海拔2 000 m,年溫差小、日溫差大,干濕季節(jié)分明,原始林和自然保護(hù)區(qū)眾多,野生動(dòng)植物資源豐富。2021年全省森林覆蓋率已達(dá)65%。主要樹種有高山松(Pinus densata Mast.)、長(zhǎng)苞冷杉(Abies georgei Orr)、云南油杉(Keteleeria evelyniana Mast.)、云南松(Pinus yunnanensis)等。云南省火險(xiǎn)Ⅰ級(jí)的縣102個(gè),是我國(guó)森林火災(zāi)高發(fā)多發(fā)省份之一[8]。
2.1.1 火點(diǎn)數(shù)據(jù) 云南省歷史森林火點(diǎn)數(shù)據(jù)來(lái)源于國(guó)家林業(yè)和草原科學(xué)數(shù)據(jù)中心數(shù)據(jù)共享服務(wù)平臺(tái)(http://www.forestdata.cn)提供的云南省1999—2019年的火點(diǎn)數(shù)據(jù)(見圖1)。其中,1999—2009年共1 792起森林火災(zāi)作為訓(xùn)練集,隨機(jī)抽取2009—2019年中200 場(chǎng)火災(zāi)作為驗(yàn)證集,用于構(gòu)建預(yù)測(cè)模型和模型檢驗(yàn)。因Logistic回歸模型要求訓(xùn)練集數(shù)據(jù)符合二項(xiàng)分布,因此本研究利用ArcGIS 10.7軟件隨機(jī)建立1 712個(gè)隨機(jī)點(diǎn)(非火點(diǎn)),并將火點(diǎn)賦值為1,非火點(diǎn)賦值為0。
圖1 1999—2009年森林火災(zāi)火點(diǎn)分布Fig.1 Distribution of fire points of forest fires from 1999 to 2009
2.1.2 氣象數(shù)據(jù) 氣象數(shù)據(jù)來(lái)源于中國(guó)氣象數(shù)據(jù)網(wǎng)(http://www.cma.gov.cn)提供的月平均相對(duì)濕度(%)、最小相對(duì)濕度(%)、日平均降水量(mm)、月平均水氣壓(hPa)、月平均最高氣溫(℃)、月平均氣壓(hPa)、月日照百分率(%)、最低氣溫(℃)、月平均最低氣溫(℃)、月平均氣溫(℃)、日照時(shí)數(shù)(h)、最大日降水量(mm)、日降水量≥0.1 mm日數(shù)(d)、極大風(fēng)速(m/s)、極大風(fēng)速的風(fēng)向、最高氣壓(hPa)、最高氣溫(℃)、最低氣壓(hPa)、最大風(fēng)速(m/s)、最大風(fēng)速的風(fēng)向共20個(gè)氣象驅(qū)動(dòng)因子。利用ArcGIS 10.7軟件以各氣象站坐標(biāo)為中心點(diǎn)建立緩沖區(qū),計(jì)算距離最近的火點(diǎn)和隨機(jī)點(diǎn),并提取相應(yīng)的氣象數(shù)據(jù)[9]。
2.1.3 地形數(shù)據(jù) 云南省的海拔、坡向和坡度數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云(http://www.gscloud.cn)提供的30 m高分辨率數(shù)字高程模型(DEM)。利用ArcGIS 10.7軟件“值提取至點(diǎn)”功能,從DEM中提取火點(diǎn)和隨機(jī)點(diǎn)對(duì)應(yīng)的數(shù)據(jù)。
2.1.4 植被數(shù)據(jù) 如圖2,植被數(shù)據(jù)來(lái)源于地理空間數(shù)據(jù)云(http://www.gscloud.cn)提供的空間精度為500 m的歸一化指數(shù)值(NDVI)數(shù)據(jù),NDVI為植被在某一區(qū)域內(nèi)森林植被垂直投影面積的占比。利用“值提取至點(diǎn)”功能,提取火點(diǎn)對(duì)應(yīng)的NDVI值。
圖2 云南省NDVI值Fig.2 NDVI value in Yunnan province
2.2.1 模型構(gòu)建 Logistic回歸模型[10]屬于廣義線性回歸模型之一,是國(guó)內(nèi)外最常用的林火預(yù)測(cè)模型,國(guó)內(nèi)應(yīng)用主要集中在四川、福建、大小興安嶺等地區(qū),通常將該模型與遙感技術(shù)相結(jié)合應(yīng)用于森林火災(zāi)預(yù)測(cè)當(dāng)中。該模型假設(shè)森林火災(zāi)發(fā)生的概率為P,P=1或P=0表示有森林火災(zāi)發(fā)生或沒有森林火災(zāi)發(fā)生,則P的公式為:
式中:e為自然對(duì)數(shù)的底;Z是對(duì)于x1,x2,x3,……xn的線性函數(shù);a0,a1,a2,a3,……an是解釋變量的回歸系數(shù)。對(duì)發(fā)生森林火災(zāi)的概率大小P進(jìn)行Logit變換,則得:
式中:a0,a1,a2,a3,……an可用極大似然估計(jì)法。
2.2.2 驅(qū)動(dòng)因子選擇 1)多重共線性檢驗(yàn)。利用ArcGIS 10.7軟件中的線性回歸功能,根據(jù)方差膨脹因子(VIF)的大小,判斷驅(qū)動(dòng)因子之間是否存在顯著的共線性關(guān)系,可逐步剔除共線性關(guān)系顯著的因子。通常以VIF=10為衡量標(biāo)準(zhǔn)[11],當(dāng)VIF介于0和10之間時(shí),表示驅(qū)動(dòng)因子之前不存在或存在較弱的共線性關(guān)系;反之,若VIF大于10時(shí),說(shuō)明驅(qū)動(dòng)因子之間存在顯著的共線性關(guān)系,需要對(duì)此類因子進(jìn)一步篩選。2)逐步回歸。利用逐步回歸功能對(duì)已剔除存在共線性關(guān)系驅(qū)動(dòng)因子的樣本進(jìn)行逐步檢驗(yàn),分析驅(qū)動(dòng)因子對(duì)發(fā)生森林火災(zāi)的影響顯著水平,確定最終構(gòu)建模型的變量。
2.2.3 模型檢驗(yàn) 本研究模型擬合度檢驗(yàn)采用ROC曲線模型檢驗(yàn)方法[12]。ROC曲線將預(yù)測(cè)結(jié)果劃分為若干個(gè)閾值,通過(guò)AUC的值(ROC曲線下的面積)來(lái)確定模型的擬合程度[13]。當(dāng)AUC介于0.7和1之間時(shí),才認(rèn)為模型具備預(yù)測(cè)火災(zāi)發(fā)生概率的功能,AUC越接近1,模型的擬合效果越好[14-15]。利用曲線坐標(biāo)中的敏感度和特異性值計(jì)算約登指數(shù)(敏感度+特異性)來(lái)確定云南省火險(xiǎn)區(qū)域劃分的最佳閾值,并用最佳劃分閾值和系統(tǒng)默認(rèn)值0.5作為火險(xiǎn)區(qū)域劃分標(biāo)準(zhǔn),將云南省劃分為低火險(xiǎn)區(qū)、中火險(xiǎn)區(qū)和高火險(xiǎn)區(qū)三級(jí)。根據(jù)驗(yàn)證集火點(diǎn)落入中高火險(xiǎn)區(qū)域的概率判斷構(gòu)建模型擬合效果。
根據(jù)多重共線性和逐步回歸的檢驗(yàn)結(jié)果顯示,極大風(fēng)速、月平均氣壓、月平均相對(duì)濕度、月平均最高氣溫、日照時(shí)數(shù)、海拔高度、NDVI共7個(gè)驅(qū)動(dòng)因子的VIF值<10,不存在共線性關(guān)系,如表1所示。以7個(gè)因子為自變量,是否發(fā)生森林火災(zāi)為因變量,采用輸入法,置信水平為95%,進(jìn)行Logistic回歸分析,各變量的p值均小于0.05,通過(guò)Wald檢驗(yàn),如表2所示。
表1 多重共線性檢驗(yàn)結(jié)果Tab.1 Multicollinearity test results
表2 模型擬合參數(shù)結(jié)果Tab.2 Model fit parameter results
通過(guò)模型擬合參數(shù)結(jié)果可看出月平均氣壓、月平均相對(duì)濕度、月平均最高氣溫和日照時(shí)數(shù)對(duì)云南省森林火災(zāi)發(fā)生的影響較為顯著,且極大風(fēng)速、月平均氣壓、日照時(shí)數(shù)與森林火災(zāi)發(fā)生的概率呈正相關(guān),月平均相對(duì)濕度、月平均最高氣溫、NDVI呈負(fù)相關(guān)。由于海拔高度的系數(shù)<0.001,相對(duì)于其他變量影響較小,故在構(gòu)建模型時(shí)可排除此變量。
將估計(jì)系數(shù)代入LR回歸模型的公式可得:
式中:x1表述為極大風(fēng)速;x2表示為月平均氣壓;x3表示為月平均相對(duì)濕度;x4表示為月平均最高氣溫;x5表示為日照時(shí)數(shù);x6表示為NDVI。通過(guò)計(jì)算得到的模型對(duì)驗(yàn)證集中賦值為“1”的火點(diǎn)預(yù)測(cè)準(zhǔn)確率為85.0%,對(duì)賦值為“0”的隨機(jī)點(diǎn)預(yù)測(cè)準(zhǔn)確率為79.4%,總體預(yù)測(cè)準(zhǔn)確率為82.3%。
利用ROC曲線模型檢驗(yàn)方法對(duì)云南省森林火災(zāi)發(fā)生預(yù)測(cè)模型的擬合優(yōu)度進(jìn)行檢驗(yàn)。如圖3,檢驗(yàn)結(jié)果得到AUC值為0.894,說(shuō)明模型具有良好的預(yù)測(cè)效果。根據(jù)ROC曲線的敏感度和特異性可通過(guò)計(jì)算(敏感度+特異性)得出該模型劃分最佳閾值為0.645。
圖3 ROC檢驗(yàn)結(jié)果Fig.3 ROC test results
陳岱[9]將0.5和模型劃分的最佳閾值0.645作為云南省火險(xiǎn)區(qū)域劃分的標(biāo)準(zhǔn)。其中小于0.5 的為低火險(xiǎn)地區(qū);介于0.5和0.645之間的為中火險(xiǎn)地區(qū);大于0.645的為高火險(xiǎn)地區(qū),火災(zāi)風(fēng)險(xiǎn)等級(jí)劃分如圖4、5所示。中高火險(xiǎn)地區(qū)主要集中在大理州、麗江市、昭通市、曲靖市、楚雄州、昆明市等云南省中部和北部地區(qū)。
圖4 森林火災(zāi)發(fā)生概率Fig.4 Probability of forest fire occurrence
圖5 火險(xiǎn)等級(jí)區(qū)域劃分Fig.5 Classification of fire risk grade areas
本文利用Logistic回歸方法,基于云南省歷史森林火點(diǎn)數(shù)據(jù),結(jié)合氣象、地形和植被等數(shù)據(jù),對(duì)影響森林火災(zāi)發(fā)生的主要驅(qū)動(dòng)因子進(jìn)行分析,構(gòu)建森林火災(zāi)發(fā)生預(yù)測(cè)模型,并對(duì)火災(zāi)風(fēng)險(xiǎn)進(jìn)行區(qū)域劃分[16-19],結(jié)論如下:
1)研究結(jié)果顯示:月平均氣壓、月平均相對(duì)濕度、月平均最高氣溫、日照時(shí)數(shù)、極大風(fēng)速、海拔高度和NDVI等7個(gè)驅(qū)動(dòng)因子,對(duì)云南省森林火災(zāi)的發(fā)生具有顯著影響,與蘇漳文等研究福建林火發(fā)生的主要驅(qū)動(dòng)因子相似。因研究結(jié)果海拔Logistic回歸分析的系數(shù)<0.001,在構(gòu)建模型時(shí)予以排除,原因是海拔與溫度的負(fù)相關(guān)對(duì)森林火災(zāi)的影響,和海拔與風(fēng)速的正相關(guān)對(duì)森林火災(zāi)的影響相互抵消。
2)構(gòu)建的預(yù)測(cè)模型預(yù)測(cè)準(zhǔn)確率高達(dá)82.3%,AUC=0.894(p<0.000 1),模型具有良好擬合效果,在該地具有一定適用性。
3)高火險(xiǎn)地區(qū)主要集中在大理州、麗江市、昭通市、曲靖市、楚雄州、昆明市等地,該區(qū)域海拔較低,可燃物載量大,易發(fā)生森林火災(zāi),應(yīng)進(jìn)一步加強(qiáng)護(hù)林防火的宣傳教育、建立健全野外用火管控制度、加強(qiáng)重點(diǎn)火險(xiǎn)區(qū)基礎(chǔ)設(shè)施建設(shè)等森林火災(zāi)預(yù)防工作。