韓 俊,王保云,徐繁樹,劉坤香
(1.云南南師范大學(xué)信息學(xué)院,昆明 650500;2.云南南師范大學(xué)數(shù)學(xué)學(xué)院,昆明 650500;3.云南省高校復(fù)雜系統(tǒng)建模及應(yīng)用重點實驗室,昆明 650500)
泥石流災(zāi)害是一種主要由強降雨引發(fā)的自然災(zāi)害,泥石流災(zāi)害給周圍的城鎮(zhèn)和村莊帶來嚴(yán)重的財產(chǎn)和生命損失。云南是全國泥石流發(fā)生最高頻的省份之一,對泥石流災(zāi)害的預(yù)防是一項重要的研究工作。泥石流的預(yù)測尚沒有精確的方法,高速等簡述了目前泥石流常用的預(yù)測方法。翟淑花等基于遺傳規(guī)劃對包括降雨量、流域面積、松散物質(zhì)比率及溝床平均坡度等因子建立模型對泥石流發(fā)生進(jìn)行預(yù)測。
隨著數(shù)據(jù)量的增加,使用機器學(xué)習(xí)以及深度學(xué)習(xí)的方法對泥石流數(shù)據(jù)進(jìn)行預(yù)測取得了良好的效果。唐旺等基于LSTM模型對西北地區(qū)的降雨量與泥石流進(jìn)行訓(xùn)練,通過降雨量對泥石流預(yù)測取得良好的預(yù)測效果。孫顯辰基于深度遷移學(xué)習(xí)的方法對云南怒江流域的泥石流溝谷數(shù)字高程模型(DEM)圖按發(fā)生次數(shù)進(jìn)行分類預(yù)測,取得了良好的分類效果。趙巖等詳細(xì)構(gòu)建了引發(fā)泥石流相關(guān)因子的數(shù)據(jù)庫,并使用深度學(xué)習(xí)的方法來識別泥石流堆積扇,使用線性回歸的方式對泥石流發(fā)生進(jìn)行預(yù)測。
目前,使用泥石流溝谷圖像的深度學(xué)習(xí)大多是對泥石流堆積扇的識別,本文采用深度學(xué)習(xí)中的小樣本學(xué)習(xí)方法,對泥石流溝谷圖像正負(fù)樣本進(jìn)行訓(xùn)練,從溝谷形態(tài)特征上實現(xiàn)對泥石流發(fā)生與否的概率預(yù)測。
文中的數(shù)據(jù)來源依據(jù)主要是云南怒江流域相關(guān)監(jiān)測站的記錄及網(wǎng)絡(luò)新聞報告。對記錄發(fā)生的數(shù)據(jù),按記載信息結(jié)合地圖,確定到具體發(fā)生的村和溝谷,此溝谷作為確定發(fā)生的溝谷之一。通過查找,共找到50條確定發(fā)生的泥石流溝谷。同樣地,查找50條沒有任何發(fā)生泥石流記錄且人員密集居住的溝谷作為負(fù)樣本。
目前常用的遙感影像主要有數(shù)字高程模型(DEM)和遙感兩類數(shù)據(jù),文中采用谷歌高清遙感地圖,如圖1所示,對某一條樣本溝谷,采用正俯視、左斜下俯視、右斜下俯視,溝口仰視、上下翻轉(zhuǎn)俯視進(jìn)行截圖。除了正俯視,其他幾種截圖都作為對此溝谷的數(shù)據(jù)增強。隨機選擇正負(fù)樣本中各10份正俯視圖作為測試集,其余80份數(shù)據(jù)的正俯視及數(shù)據(jù)增強作為正負(fù)樣本的訓(xùn)練集。
圖1 緯度:26.643457,經(jīng)度:98.905072的高清遙感溝谷圖
因為數(shù)據(jù)量少,將截取的圖像摳出完整溝谷。同時,為保障數(shù)據(jù)的大小比例,將同一位置的圖,按照ArcGIS中DEM比例尺,縮放到同一比例下,然后對短邊進(jìn)行填充操作使之成為寬高相同的圖形。訓(xùn)練的時候只進(jìn)行縮放,不再進(jìn)行隨機裁剪和旋轉(zhuǎn)等操作。
小樣本學(xué)習(xí)是指在樣本量很少或者標(biāo)注樣本很少的情況下實現(xiàn)對樣本的正確分類和識別。不同學(xué)者對小樣本方法的分類不同??傮w而言,小樣本學(xué)習(xí)方法有:微調(diào)方法、度量學(xué)習(xí)方法和元學(xué)習(xí)的方法等等。
原型網(wǎng)絡(luò)(prototypical networks)由Snell J等人于2017年發(fā)表在NIPS上,是小樣本學(xué)習(xí)度量方法中的經(jīng)典模型。其思想主要如圖2所示。
圖2 原型網(wǎng)絡(luò)
支持集通過特征提取器提取特征,C、C、C分別為各類支持集特征向量的均值,x^為查詢向量,將x^提取特征后與C、C、C做歐氏距離,距離越小,x^屬于這一類的概率越大,最終完成分類。
實驗只分正負(fù)樣本,即N-way為2,K-shot為5,使用Conv-4和ResNet-12作為骨干架構(gòu)來提取圖像特征。準(zhǔn)確率有微小波動,因此選取5次實驗的均值作為實驗結(jié)果。重要的超參數(shù)有學(xué)習(xí)率lr:0.01、dropout率:0.3、epoch:450。重新從正負(fù)樣本中,再次隨機選擇正負(fù)樣本中各10份正俯視圖作為測試集進(jìn)行第二輪實驗。結(jié)果如表1所示。
表1 2-way 5-shot下原型網(wǎng)絡(luò)對泥石流遙感圖像的預(yù)測結(jié)果
通過以上實驗,可以發(fā)現(xiàn),對泥石流溝谷遙感圖像特征的提取ResNet12優(yōu)于Conv_4,取Resnet12兩次的平均結(jié)果,正確率為65.60%。這意味著,對于同流域的其他溝谷圖像,此模型有65%的可信度認(rèn)為某一溝谷圖像具有發(fā)生或者是未發(fā)生的泥石流溝谷的特征,如果預(yù)測為發(fā)生泥石流溝谷圖像的類,那么此溝谷可能有發(fā)生泥石流的潛在可能,當(dāng)雨季來臨時,溝谷附近的人應(yīng)該提前做好防范措施。
趙巖等目前對泥石流形成因子總結(jié)較為全面,其中地貌條件是泥石流發(fā)生最基本的條件。本文中截取的溝谷高清遙感圖保留了溝谷長度、流域面積、溝谷形態(tài)等地貌條件因子,還包括植被覆蓋、土地利用等物質(zhì)條件因子。借助神經(jīng)網(wǎng)絡(luò)對正負(fù)樣本的這些特征進(jìn)行學(xué)習(xí)和預(yù)測,是一個極好的方法,但也存在一些問題,首先,此樣本遙感圖樣本量極少且包含的信息有限,如高程差等信息缺失;其次,由于目前泥石流發(fā)生的背景、形成機理等認(rèn)識不深,單一靠一個方面的條件來判斷,能提高的精度有限。降雨量是一個重要的誘發(fā)因素,將誘發(fā)因素、物質(zhì)條件和地貌條件綜合考慮的多模態(tài)深度學(xué)習(xí)可能會取得更好的預(yù)測效果。最后,小樣本深度學(xué)習(xí)自身的發(fā)展還不夠完善,好的建模才能繼續(xù)提高預(yù)測精度。