唐 旺, 馬尚昌,陳 銳
(1.成都信息工程大學 電子工程學院(大氣探測學院), 成都 610225; 2.四川省甘孜藏族自治州氣象局, 四川 康定 626000)
川西北地區(qū)屬于青藏高原的一部分,僅阿壩州境內就已形成多達200多萬畝(13.33多萬hm2)的干旱河谷地帶,兩岸山坡上幾乎寸草不生,在雨季暴雨頻發(fā),極易誘發(fā)泥石流,堵塞河道,沖毀公路,危及城鎮(zhèn)[1]。丹巴縣位于甘孜藏族州境內,該地區(qū)每逢雨季地質災害頻發(fā),泥石流是丹巴縣境內主要的地質災害之一。泥石流的發(fā)生與水有著密切關系,按照水源類型可將泥石流分為暴雨型泥石流、潰決型泥石流、冰雪融水型泥石流、泉水型泥石流等4類。從調查的結果可知, 廣泛分布于丹巴縣境內的254條泥石流全部屬于暴雨型泥石流,沒有潰決型、 冰雪融水型和泉水型泥石流。 每年汛期,受強降水天氣過程的影響, 并在匯流作用下,在溝谷會發(fā)生不同程度的泥石流。 尤其是2008年以來, 受 “5·12” 汶川和 “4·20” 雅安地震的影響, 溝谷內有大量松散物源堆積,每年汛期內均有數(shù)條溝谷爆發(fā)泥石流。汛期泥石流災害的集中發(fā)生詮釋了泥石流與降雨量之間的不可分割的關系。
雖然各種自然因素都有可能引發(fā)泥石流,但降水是泥石流形成的直接觸發(fā)因素[2]。 費曉燕等[3]基于降雨信息資料對四川省滑坡災害的前期雨量進行了統(tǒng)計分析, 并采用邏輯回歸分析建立模型,該模型的整體準確率為78.36%; 滑坡災害的當日降雨量、前一日降雨量和前兩日降雨量對災害的影響權重分別為0.587、0.220、0.189,氣象預警模型的地質背景概率和綜合雨量概率的權重參數(shù)分別為0.349、0.606。江錦紅等[4]從河道安全泄洪流量出發(fā),提出了最小臨界值和臨界雨力的新概念和計算方法,并在此基礎上構建了暴雨臨界曲線作為山洪災害預警標準。高華喜等[5]利用深圳市降雨與滑坡歷史資料, 對區(qū)域性滑坡與降雨量進行相關性分析并得出結論:一次性降雨量達到或超過某一數(shù)值時區(qū)域性滑坡就可能出現(xiàn),大暴雨或特大暴雨具有直接觸發(fā)滑坡的作用,另外暴雨后滑坡發(fā)生可能出現(xiàn)滯后,滯后時間一般不超過4日。付世軍等[6]基于南充市2011—2016年181條強降雨型滑坡記錄,與213個自動區(qū)域站的小時雨量數(shù)據(jù)進行對比,分析了滑坡成因,確定了分縣域引發(fā)滑坡的平均降雨強度與時間窗口的關系閾值,并提出了南充市強降雨誘發(fā)滑坡地質災害風險預警技術流程框架和關鍵性閾值參考值。Aleotti等[7]以意大利西北部Piedmont Region 為例, 通過研究降水事件與泥石流發(fā)生之間的統(tǒng)計關系, 確定了該區(qū)導致泥石流發(fā)生的降水閾值。 于國強等[8]詳細論述了舟曲“8·8”泥石流成災特征和發(fā)展趨勢,采用水文學分析方法,計算不同降雨頻率下的洪水特征值與降雨特征值,劃分地質災害不同預警級別,提出預警判據(jù),計算不同預警級別下的降雨特征閾值,建立前期含水量在一般和干旱兩種條件下,不同預警級別的降雨歷時與降雨強函數(shù)關系曲線,并闡明觸發(fā)不同等級地質災害的臨界降雨特征。 溫智熊等[9]通過對大量滑坡、 崩塌發(fā)生時的日降雨量、 3 日累計降雨量統(tǒng)計分析, 發(fā)現(xiàn)廣西龍勝縣的滑坡及崩塌發(fā)生的總數(shù)與降雨量值的大小呈折線正相關, 即降雨量值增加, 滑坡、 崩塌的數(shù)量呈臺階狀增加。 Tang等[10]利用線性回歸和BP神經(jīng)網(wǎng)絡對成都市地面溫度進行預測, 發(fā)現(xiàn)神經(jīng)網(wǎng)絡的準確率高于線性回歸。 疏杏勝等[11]利用ANN、 ELM以及SVM模型對桓仁水庫流域未來1~3 d降雨進行多模式集成預報, 基于SVM和ELM的多模式集成預報模型預報效果均優(yōu)于單一模式, 基于ANN的集成預報模型在輸入因子選擇合適的情況下, 其預報效果也優(yōu)于單一模式, 3種模型中SVM模型對降雨預報精度改善最為明顯, 說明基于機器學習模型的多模式降雨集成預報方法可行且能夠提高短期預報降雨精度。 目前對于降雨閾值的研究主要分為兩類, 一類是根據(jù)歷史上誘發(fā)滑坡的降雨數(shù)據(jù)建立經(jīng)驗性降雨閾值, 另一類是通過試驗方法或數(shù)值方法研究降雨對邊坡穩(wěn)定性的影響規(guī)律[12]。
國內外泥石流預報模型都是在長期野外監(jiān)測和數(shù)據(jù)分析的基礎上建立的, 所在的實驗區(qū)得到了較為理想的使用[13],包括泥石流、山體滑坡、洪澇災害等;對于地質災害的預警預報大多使用統(tǒng)計的方式,即統(tǒng)計歷史上的發(fā)生泥石流的大小與當日降雨量的數(shù)據(jù),經(jīng)過分類后給出閾值;而對于氣象數(shù)據(jù)預測的研究,采用了各種神經(jīng)網(wǎng)絡在各研究區(qū)域都取得了良好的結果。但利用閾值和天氣預報的協(xié)同預警,沒有考慮時間、成本和復雜度的因素,因為降雨型泥石流的發(fā)生與前一段時間的降雨量都存在一定關系,而天氣預報的復雜度極高且成本同樣高昂,在川西北地區(qū)高原大部分地區(qū)并未設置精密的天氣預報設備和裝置。針對降雨型泥石流的預警,除了地質條件的影響,應該重點關注降雨量的預測,將地質災害的預警和氣象預報相結合。因此,本研究結合統(tǒng)計方法與LSTM方法,采用四川省甘孜藏族州丹巴縣的氣象數(shù)據(jù),探尋一種針對川西北地區(qū)強降雨誘發(fā)泥石流預警的方法。
氣象數(shù)據(jù)來自于丹巴縣氣象監(jiān)測站,主要為2010—2019年24 h降雨量、平均氣溫、平均相對濕度、平均風速數(shù)據(jù),用于降雨量的預測。由于2008年汶川大地震對川西北的地質地貌產(chǎn)生了重大的影響,在很多地區(qū)形成了泥石流易發(fā)的溝壑、斷裂等,在2010年之前同樣發(fā)生了多起重大泥石流災害。為了使閾值的劃分更加科學準確,擴大樣本總數(shù)以提升數(shù)據(jù)統(tǒng)計的可靠性,本研究統(tǒng)計了近20年發(fā)生的特大、大、中、小型泥石流數(shù)據(jù),共計254條,其中特大型泥石流為6次,大型泥石流為21次,中型泥石流為102次,小型泥石流為125次。
根據(jù)近20年泥石流災害的統(tǒng)計數(shù)據(jù)分析,災害活動頻繁的月份在5—8月,其中6—8月占比達到91%,其原因在于每年6—8月正逢丹巴縣的主汛期(圖1),其中6、7月發(fā)生頻率最高,總占比達到82%。丹巴縣泥石流主要發(fā)生在兩個時間段,分別為下午至傍晚和夜晚至次日凌晨(圖2),且在凌晨發(fā)生的可能性更大。
由于數(shù)據(jù)量較大, 本文僅選取部分數(shù)據(jù)分析展示(表1)。 對泥石流災害發(fā)生前后時段的降水量分析可知, 當降雨達到一定程度時, 將會引發(fā)泥石流災害。 進一步地, 丹巴縣泥石流的發(fā)生與1 h、 3 h、6 h、12 h、24 h、3 d、10 d的降水量有一定關系,其中與10 d的前期降雨量關系密切。小時降水量中,3 h降水所占權重較大。表2為1999年以來危害較嚴重的泥石流災害發(fā)生時的前期降雨量和短時降雨量數(shù)據(jù)以及受災情況(其中部分數(shù)據(jù)無詳細發(fā)生時間, 可能與災害統(tǒng)計人員的統(tǒng)計方式和習慣有關)。 經(jīng)過分析, 當前期累積降水量(前10 d)達到50 mm以上時, 發(fā)生泥石流災害的概率為55%; 累積降水量(前10 d)達到30 mm時發(fā)生泥石流災害的概率為36%; 累積降水量(持續(xù)10 d)達到20 mm以上時, 發(fā)生泥石流的概率僅為9%。 小時降水量的多少與泥石流的發(fā)生有一定關系, 但無必然關系, 災害的形成必須配合前期降水量來分析。 當12 h降水量達25~40 mm時, 泥石流發(fā)生的概率為45%; 24 h降水量達25~40 mm時, 泥石流發(fā)生的概率為9%。 經(jīng)過對泥石流發(fā)生時前一段時間的降雨量統(tǒng)計分析,可以劃分出預警的閾值,并通過不斷檢驗和修正,得到高準確率的預警閾值。
圖1 丹巴縣泥石流發(fā)生的月份分布
圖2 丹巴縣泥石流發(fā)生的時段概率分布
1.3.1 長短時記憶神經(jīng)網(wǎng)絡[14]長短時記憶神經(jīng)網(wǎng)絡(long short-term memory, LSTM)相較于傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(recurrent neural network,RNN)多了三道門,即“遺忘門”(forget gate)、“ 輸入門”(input gate)和“輸出門”(output gate), 可用以下流程和公式表示。
(1)遺忘門:t-1時刻的輸入ht-1和xt經(jīng)過一個線性變換+ReLU激活以后, 輸出ft, 再與ct-1進行相乘得到一個中間結果。
ft=ReLU(Wf·[ht-1,xt]+bf)·ct-1。
(1)
lt=ReLU(Wi·[ht-1,xt]+bi);
(2)
(3)
(4)
(3)輸出門:t-1時刻的輸入ht-1和xt經(jīng)過另外一個線性變換+ReLU激活以后, 輸出ot;ot與ct相乘得到輸出ht。
ot=ReLU(Wo·[ht-1,xt]+bo);
(5)
ht=ot·ct。
(6)
1.3.2 數(shù)據(jù)歸一化 使用數(shù)據(jù)歸一化能夠將數(shù)據(jù)轉換為0~1的數(shù)字, 在梯度下降時它可以收斂得更快。在本研究中, 使用最小-最大歸一化方法來處理數(shù)據(jù)。歸一化函數(shù)可描述為
表1 丹巴縣部分地區(qū)泥石流發(fā)生與降水量的分布情況
表2 丹巴縣部分地區(qū)泥石流災害與前期累計和短時降水量
資料來源: 四川省丹巴縣氣象監(jiān)測站。
(7)
其中:Xscale是歸一化后的數(shù)據(jù);X代表樣本值;Xmin為樣本中的最小值;Xmax為樣本中的最大值。
1.3.3 精度評價 本實驗采用均方誤差(MSE)和平均絕對誤差(MAE)作為模型預測的評價標準
(8)
(9)
根據(jù)近20年(1999—2019年)丹巴縣泥石流災害發(fā)生情況的統(tǒng)計分析, 得出了大致的閾值范圍。 表3為泥石流預警等級與24 h降水量及前期累計降水量的閾值情況, 根據(jù)歷史數(shù)據(jù)大致劃分為5個等級, 隨降雨量的增加而增加。 表4為對于泥石流發(fā)生時間的預警情況, 夜間發(fā)生泥石流的可能性最大, 如果有大的降雨發(fā)生, 那么需要在夜間之前發(fā)布預警消息。
表3 丹巴縣泥石流發(fā)生的降水閾值
表4 丹巴縣泥石流發(fā)生的時間閾值
由于數(shù)據(jù)量過大,本文隨機抽取災害樣本中的一些災害數(shù)據(jù)進行驗證,結果見表5。通過丹巴縣的部分泥石流數(shù)據(jù)作閾值檢驗,災害發(fā)生的等級預報符合所作閾值范圍,閾值預警準確率較高,整體準確率超過90%。由于丹巴縣地理位置特殊,等級達到二級時就需要作相應預報。但在實際生活生產(chǎn)中,若所有等級為二時都作預報,那么空報的可能性較高,漏報可能性較低。但隨著數(shù)據(jù)的不斷收集增加,閾值也將會在今后的泥石流災害預報中進行檢驗和訂正。
本研究將主要針對5—8月的降雨進行預測分析, 實驗數(shù)據(jù)分為兩個子集——訓練集和測試集。 LSTM作為循環(huán)神經(jīng)網(wǎng)絡的一種,若訓練數(shù)據(jù)時間周期太長, 也會遺忘先前學到的數(shù)據(jù)規(guī)律, 因此對于模型訓練的數(shù)據(jù)集時間跨度不宜太長, 但數(shù)據(jù)太少模型也不能訓練出好的結果, 因此, 本實驗決定采用近10年的數(shù)據(jù)進行模型的訓練。訓練數(shù)據(jù)集為2010—2017年記錄的共4 700個數(shù)據(jù), 占總數(shù)據(jù)記錄的80%。測試數(shù)據(jù)集為2018—2019年的1 180條數(shù)據(jù)記錄, 占總數(shù)據(jù)的20%。表6為模型對丹巴縣5—8月的降雨量預測誤差結果, 分別是平均絕對誤差(MAE)和均方誤差(MSE), 誤差結果均低于1.5 mm, 說明了模型是切實可行的。圖3、表6為丹巴縣2019年5—8月日累計降雨量預測情況, 整體預測效果良好, 預測結果和實際數(shù)值非常接近, 但其中5月中下旬和8月上旬, 預測結果出現(xiàn)了較大的偏差, 可能的原因是高原氣候的多變導致降雨量出現(xiàn)波動, 致使模型沒有完全學習到數(shù)據(jù)的變化規(guī)律。
確定了泥石流發(fā)生時的降雨閾值和時間閾值后, 再結合24 h累計降雨量的預測, 可對未來的泥石流發(fā)生情況進行及時的預警預報, 提前發(fā)布預警信息。預警方法如下:
(1)將前3日的24 h累計降雨量數(shù)據(jù)輸入模型, 通過計算可以得到未來幾日的24 h累計降雨預測值。
(2)將降雨預測結果與閾值進行比對, 并考慮降雨發(fā)生的時間, 可以得出預警等級的大小及泥石流發(fā)生可能性。
表5 丹巴縣部分泥石流數(shù)據(jù)的閾值檢驗
表6 丹巴縣5—8月降雨預測結果誤差
圖3 丹巴縣2019年5—8月降雨預測結果
采用LSTM方法預測短時降雨量,并統(tǒng)計了近10年泥石流數(shù)據(jù),大致劃定了預警閾值區(qū)間,對四川省丹巴縣氣象站2010—2019年日累計降雨量進行分析計算,結論如下:
(1)通過統(tǒng)計近10年所發(fā)生的泥石流災害情況,采用統(tǒng)計分類的方法劃定了預警閾值,劃分為降雨閾值和時間閾值,并給出預警等級和發(fā)生可能性大小,閾值預警準確率超過90%。
(2)整體模型降雨量預測誤差均低于1.5 mm,5—8月各月預測效果良好,但5月下旬和8月上旬的預測出現(xiàn)較大誤差,可能是在汛期的開始和結尾時期,高原氣候不穩(wěn)定而出現(xiàn)降雨波動,致使模型沒有完全學習到數(shù)據(jù)的變化規(guī)律。
(3)結合本研究的降雨閾值結果和降雨預測方法,降低了傳統(tǒng)氣象預警的復雜度,實現(xiàn)氣象預警一體化,即“預警=閾值+預測”,能對提前發(fā)布預警信息提供較強的指導意義。