徐艷杰
(內(nèi)蒙古森林消防總隊(duì)興安盟支隊(duì),內(nèi)蒙古 興安盟 137400)
森林火災(zāi)是一種隨機(jī)性強(qiáng)、破壞性大的自然災(zāi)害,對(duì)林業(yè)發(fā)展和生態(tài)環(huán)境保護(hù)影響惡劣,同時(shí)造成了較為嚴(yán)重的生命和財(cái)產(chǎn)損失[1]。我國(guó)是森林火災(zāi)發(fā)生頻次高、受災(zāi)面積廣的國(guó)家之一,2007—2017年我國(guó)森林火災(zāi)平均成災(zāi)面積達(dá)26467hm2,各省市均經(jīng)歷了不同程度的森林火災(zāi)。由于全球氣候不斷變暖,加之火災(zāi)還受到地形和人為等眾多因素的干擾和影響,林火發(fā)生概率逐漸提高[2]。因此,構(gòu)建準(zhǔn)確的森林火災(zāi)成災(zāi)面積預(yù)測(cè)模型,可以為林火預(yù)防工作提供指導(dǎo),從而減少相應(yīng)損失。
目前針對(duì)森林火災(zāi)面積預(yù)測(cè)方面,一些學(xué)者開(kāi)展了相關(guān)研究。沈姣姣等[3]采用聚類分析對(duì)陜西省森林火災(zāi)成災(zāi)面積、次數(shù)等特征進(jìn)行分析,考慮溫度、濕度等氣候因素,建立了森林火災(zāi)面積預(yù)測(cè)模型,模型正確率超過(guò)70%。汪文野等[4]從時(shí)間和空間尺度進(jìn)行了氣候條件分析,建立了深度學(xué)習(xí)算法-森林火災(zāi)面積預(yù)測(cè)模型,研究表明預(yù)測(cè)模型的數(shù)據(jù)泛化能力提升,預(yù)測(cè)精度較高。徐海龍等[5]根據(jù)主成分分析消除了所選取10個(gè)氣象因子之間的共線性關(guān)系,利用多元回歸構(gòu)建了森林火災(zāi)成災(zāi)面積預(yù)測(cè)模型,結(jié)果表明模型的相關(guān)系數(shù)為0.66,預(yù)測(cè)結(jié)果較為符合實(shí)際情況。黃家榮等[6]建立了3層神經(jīng)網(wǎng)絡(luò)森林火災(zāi)面積預(yù)測(cè)模型,引入變結(jié)構(gòu)法確定了預(yù)測(cè)模型的主要參數(shù),預(yù)測(cè)結(jié)果與實(shí)際受災(zāi)面積吻合度較好,為森林火災(zāi)預(yù)防提供了一種較為可靠的方法。
針對(duì)森林火災(zāi)發(fā)生具有隨機(jī)性和不確定性等特點(diǎn),且受到諸多因素的影響,森林火災(zāi)成災(zāi)面積時(shí)間序列往往具有較大的波動(dòng)性,屬于非平穩(wěn)時(shí)間序列[7]。因此,本文將集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD和長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM相結(jié)合,提出了基于EEMD-LSTM的森林火災(zāi)成災(zāi)面積預(yù)測(cè)模型,根據(jù)集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD將樣本數(shù)據(jù)分解,采用長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM對(duì)分解后的各分量進(jìn)行預(yù)測(cè)并將各分量預(yù)測(cè)結(jié)果疊加重構(gòu)?;?992—2017年我國(guó)森林火災(zāi)成災(zāi)面積對(duì)上述所建預(yù)測(cè)模型應(yīng)用驗(yàn)證,并與BP和LSTM神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)結(jié)果進(jìn)行比較,所建EEMD-LSTM預(yù)測(cè)模型的平均絕對(duì)誤差MAE和均方根誤差RMSE最小,驗(yàn)證了該模型在森林火災(zāi)成災(zāi)面積預(yù)測(cè)方面具有更高的預(yù)測(cè)精度。
集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD(Ensemble Empirical Mode Decomposition,EEMD)是一種新型自適應(yīng)信號(hào)處理方法,廣泛應(yīng)用于從噪聲非線性和非平穩(wěn)過(guò)程中產(chǎn)生的數(shù)據(jù)提取信號(hào)。集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD將樣本數(shù)據(jù)分解成多個(gè)本征模函數(shù)IMF(Intrinsic Mode Function)和趨勢(shì)項(xiàng)RES(Trend Items),實(shí)現(xiàn)非平穩(wěn)數(shù)據(jù)序列的平穩(wěn)化處理,具體過(guò)程如下。
生成幅值為k的白噪聲序列n(t),設(shè)置EMD分解運(yùn)算的總次數(shù)M和初始迭代次數(shù)m=1。
進(jìn)行第m次EMD運(yùn)算,分解流程如下。
①將生成的白噪聲序列nm(t)加入森林成災(zāi)面積時(shí)間序列x(t),得到新的森林成災(zāi)面積時(shí)間序列xm(t):
xm(t)=x(t)+k×nm(t)
(1)
②循環(huán)變量初始化:
i=1,j=1,x1(t)=x(t),y1(t)=xi(t)。
③對(duì)森林成災(zāi)面積時(shí)間序列yj(t)的局部極大值點(diǎn)進(jìn)行統(tǒng)計(jì),根據(jù)3次樣條插值擬合形成上包絡(luò)線lj(t);同理,對(duì)局部極小值點(diǎn)進(jìn)行統(tǒng)計(jì)擬合形成下包絡(luò)線nj(t),求出2條線的均值pj(t):
(2)
④計(jì)算森林成災(zāi)面積時(shí)間序列yj(t)與pj(t)的差值hj(t):
hj(t)=yj(t)-pj(t)
(3)
⑤根據(jù)EMD分解的要求對(duì)hj(t)進(jìn)行判斷,滿足條件則得到分解量Ci(t),不滿足則重復(fù)上述③和④,Ci(t):
Ci(t)=hj(t)
(4)
⑥計(jì)算剩余分解量ri(t):
ri(t)=xi(t)-Ci(t)
(5)
⑦循環(huán)i和j進(jìn)行計(jì)算,得到n個(gè)IMF分量和1個(gè)剩余分量:
Ci,m(t)=hj,m(t),i=1,2,…,n
(6)
rn,m(t)=rn-1,m(t)-Cn,m(t)
(7)
⑧如果m 長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)是一類機(jī)器學(xué)習(xí)智能算法,廣泛應(yīng)用于信號(hào)建模、時(shí)間序列預(yù)測(cè)等研究,能夠有效解決循環(huán)神經(jīng)網(wǎng)絡(luò)RNN所帶來(lái)的一系列梯度問(wèn)題影響。長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM主要由3種門狀態(tài)組成,具體內(nèi)容見(jiàn)圖1。 長(zhǎng)短期記憶網(wǎng)絡(luò)LSTM具體計(jì)算公式: ft=σ(ωf[qt-1,xt]+bf) (8) it=σ(ωi[qt-1,xt]+bf) (9) s′t=tanh(ωc[qt-1,xt]+bc) (10) st=ftst-1+its′t (11) ot=σ(ωo[qt-1,xt]+bo) (12) qt=ot×tanh(st) (13) 式中,ft表示遺忘門的輸出;it表示輸入門的輸出;s′t表示前一時(shí)刻細(xì)胞狀態(tài);st表示當(dāng)前時(shí)刻細(xì)胞狀態(tài);ot表示輸出門的輸出;qt表示t時(shí)刻單元輸出;xt表示t時(shí)刻的輸入;σ表示sigmoid函數(shù);ωf、ωi、ωc、ωo分別表示對(duì)應(yīng)門或細(xì)胞狀態(tài)的權(quán)重值;bf、bi、bc、bo分別表示對(duì)應(yīng)門或細(xì)胞狀態(tài)的偏移值。 將1992—2017年共計(jì)26個(gè)年份的全國(guó)森林火災(zāi)成災(zāi)面積作為本文預(yù)測(cè)模型的輸入樣本,資料選自《中國(guó)林業(yè)統(tǒng)計(jì)年鑒》,具體見(jiàn)表1。 表1 1992—2017年全國(guó)森林火災(zāi)成災(zāi)面積數(shù)據(jù) 將1992—2009年的樣本數(shù)據(jù)作為訓(xùn)練集,2010—2017年的樣本數(shù)據(jù)作為測(cè)試集。采用集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD對(duì)全國(guó)森林火災(zāi)成災(zāi)面積數(shù)據(jù)時(shí)間序列有效分解,將分解后的各分量分別代入LSTM模型進(jìn)行預(yù)測(cè),將所有分量預(yù)測(cè)的數(shù)據(jù)進(jìn)行組合重構(gòu),得到EEMD-LSTM模型的預(yù)測(cè)結(jié)果。為驗(yàn)證所建EEMD-LSTM模型的預(yù)測(cè)性能和可靠性,分別采用BP和LSTM神經(jīng)網(wǎng)絡(luò)模型對(duì)森林火災(zāi)成災(zāi)面積時(shí)間序列進(jìn)行預(yù)測(cè)。3種模型預(yù)測(cè)結(jié)果的相對(duì)誤差如圖2所示。 圖2 3種模型預(yù)測(cè)結(jié)果的相對(duì)誤差對(duì)比 從圖2可以看出,EEMD-LSTM模型預(yù)測(cè)結(jié)果的相對(duì)誤差較為穩(wěn)定,最大相對(duì)誤差出現(xiàn)在2012年,其值為12.19%,2010年、2011年、2016年、2017年4個(gè)年份預(yù)測(cè)結(jié)果的相對(duì)誤差小于10%。另外2個(gè)模型預(yù)測(cè)結(jié)果相對(duì)誤差的波動(dòng)變化較為明顯,尤其是從2014—2015年,LSTM模型預(yù)測(cè)結(jié)果的相對(duì)誤差從最大值23.82%變化為不到15%。整體而言,EEMD-LSTM模型的相對(duì)誤差明顯小于BP和LSTM模型的相對(duì)誤差,除2014年外,LSTM模型各年份的相對(duì)誤差均小于BP模型的相對(duì)誤差。 采用常見(jiàn)的評(píng)價(jià)指標(biāo)平均絕對(duì)誤差MAE和均方根誤差RMSE,3個(gè)模型的具體計(jì)算結(jié)果見(jiàn)表2。 表2 3種模型預(yù)測(cè)精度對(duì)比 由表2可知,EEMD-LSTM模型預(yù)測(cè)結(jié)果的平均絕對(duì)誤差MAE和均方根誤差RMSE分別為2021hm2和2415hm2,根據(jù)2個(gè)預(yù)測(cè)結(jié)果評(píng)價(jià)指標(biāo)可知,模型預(yù)測(cè)精度排序:EEMD-LSTM>LSTM神經(jīng)網(wǎng)絡(luò)>BP神經(jīng)網(wǎng)絡(luò)。從平均絕對(duì)誤差MAE考慮,相較于LSTM神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò),EEMD-LSTM模型的預(yù)測(cè)性能分別提高了33.7%和41.8%。從均方根誤差RMSE考慮,相較于LSTM神經(jīng)網(wǎng)絡(luò)和BP神經(jīng)網(wǎng)絡(luò),EEMD-LSTM模型的預(yù)測(cè)性能分別提高了28.8%和39.1%。由此可知,EEMD-LSTM模型的預(yù)測(cè)結(jié)果準(zhǔn)確性明顯高于另外2種模型,原因在于集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD將非平穩(wěn)的森林成災(zāi)面積時(shí)間序列轉(zhuǎn)化為多個(gè)不同變化規(guī)律的分量,各分量預(yù)測(cè)值重構(gòu)后的預(yù)測(cè)結(jié)果較為準(zhǔn)確,有效降低了預(yù)測(cè)的誤差,從而保障了預(yù)測(cè)精度。 考慮到集合經(jīng)驗(yàn)?zāi)B(tài)分解EEMD能夠?qū)⒎瞧椒€(wěn)時(shí)間序列分解成具有不同變化規(guī)律的分量,基于先分解后重構(gòu)的思想,將該方法與LSTM神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立了EEMD-LSTM森林成災(zāi)面積預(yù)測(cè)模型,基于1992—2017年全國(guó)森林火災(zāi)成災(zāi)面積數(shù)據(jù),將所建模型與單一BP和LSTM神經(jīng)網(wǎng)絡(luò)模型進(jìn)行比較驗(yàn)證。研究結(jié)果表明,EEMD-LSTM模型預(yù)測(cè)結(jié)果的相對(duì)誤差較為穩(wěn)定且明顯小于BP和LSTM神經(jīng)網(wǎng)絡(luò)模型的相對(duì)誤差。EEMD-LSTM森林成災(zāi)面積預(yù)測(cè)模型平均絕對(duì)誤差MAE的預(yù)測(cè)性能分別提高了33.7%和41.8%,均方根誤差RMSE的預(yù)測(cè)性能分別提高了28.8%和39.1%。相較于另外2個(gè)模型,EEMD-LSTM模型能夠更為準(zhǔn)確地預(yù)測(cè)森林成災(zāi)面積,為森林火災(zāi)預(yù)測(cè)提供了一種新的方法。2.2 LSTM算法
3 實(shí)例應(yīng)用
4 結(jié)論