韓俊,王保云
(1.云南師范大學(xué)信息學(xué)院,云南 昆明 650500;2.云南師范大學(xué)數(shù)學(xué)學(xué)院,云南 昆明 650500;3.云南省高校復(fù)雜系統(tǒng)建模及應(yīng)用重點(diǎn)實(shí)驗(yàn)室,云南 昆明 650500)
泥石流是一種自然地質(zhì)災(zāi)害,發(fā)生時(shí)對(duì)當(dāng)?shù)鼐用竦娜松砗拓?cái)產(chǎn)安全造成重大的危害。我國(guó)泥石流研究防治工作始于20 世紀(jì)60 年代,早期的泥石流研究依靠實(shí)地考察,結(jié)合實(shí)地?cái)?shù)據(jù)分析得出防治方法。唐邦興等[1-2]通過(guò)對(duì)我國(guó)山地泥石流的考察研究,繪制了我國(guó)早期1∶600 萬(wàn)泥石流災(zāi)害分布與危險(xiǎn)區(qū)劃圖。陳寧生等[3-5]、崔鵬等[6-8]對(duì)四川、云南、新疆、西藏等特定地區(qū)泥石流的考察,提出了有效的泥石流判別方法和防治策略。隨著遙感技術(shù)的發(fā)展,從數(shù)字高程模型(DEM)和遙感數(shù)據(jù)中獲取與泥石流相關(guān)的地形地貌類因子和物源類因子彌補(bǔ)了實(shí)地考察的不便,通過(guò)提取溝谷的地貌因子、物源和降雨等因子,使用動(dòng)力學(xué)模型FLO-2D、Debris2D、MatDEM 等模擬特定溝谷的泥石流動(dòng)力學(xué)過(guò)程,能夠較準(zhǔn)確的研究該溝谷或此類溝谷泥石流形成機(jī)理并提出預(yù)警和防治方法。
為了能夠大面積地研究和評(píng)估,將研究區(qū)域通過(guò)匯水面積或其他閾值劃分為小流域單元,統(tǒng)計(jì)各單元的泥石流相關(guān)因子,通過(guò)模型學(xué)習(xí)泥石流流域因子蘊(yùn)含的特征來(lái)完成其他流域的分類預(yù)測(cè)。李益敏等[9]提取云南怒江州小流域單元的流域距斷裂帶距離、巖性、流域水系密度等11 個(gè)因子,建立模型預(yù)測(cè)得到泥石流易發(fā)性分區(qū),并繪制了怒江小流域易發(fā)性分布圖。孫濱等[10]選取高程、坡度和坡向等9 個(gè)影響因子,建立東川地區(qū)的小流域評(píng)價(jià)模型進(jìn)行泥石流易發(fā)性評(píng)價(jià)。趙巖[11]詳細(xì)構(gòu)建了地貌、物源和激發(fā)三類泥石流因子的數(shù)據(jù)庫(kù),選取流域10 min 降雨量、植被覆蓋、6 h 均降雨量等8 個(gè)因子,使用線性回歸的方式來(lái)對(duì)泥石流發(fā)生頻率進(jìn)行預(yù)測(cè)。統(tǒng)計(jì)學(xué)的方法能夠在區(qū)域尺度上進(jìn)行預(yù)測(cè),但劃分流域的方法不一,并且專家學(xué)者收集的影響因子和建模方法不同,導(dǎo)致預(yù)警評(píng)價(jià)結(jié)果不一,很難量化其評(píng)價(jià)預(yù)測(cè)的準(zhǔn)確性。為了規(guī)避這些“主觀”選擇因子的過(guò)程,將卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取圖像特征的方法用于地質(zhì)災(zāi)害影像的研究成為了新熱點(diǎn)。劉坤香等[12]提取怒江州泥石流溝谷的DEM 圖像,使用改進(jìn)的殘差網(wǎng)絡(luò)學(xué)習(xí)圖像特征,并用其他溝谷的分類預(yù)測(cè)。楊小兵等[13]基于深度學(xué)習(xí)方法對(duì)泥石流堆積扇的多光譜遙感影像進(jìn)行訓(xùn)練和識(shí)別,以此找尋更多的泥石流隱患點(diǎn)。神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)需要大量的樣本數(shù)據(jù),而區(qū)域尺度上的災(zāi)害數(shù)據(jù)屬于小樣本問(wèn)題,小樣本學(xué)習(xí)的提出用于解決樣本量少的學(xué)習(xí)情況。茹穎[14]在遙感影像較少的數(shù)據(jù)集上,使用小樣本學(xué)習(xí)對(duì)遙感圖像分類得到了比傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)更好的效果。張萌月[15]在遙感影像識(shí)別目標(biāo)較少的情況下,使用小樣本學(xué)習(xí)方法相對(duì)傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò)有絕對(duì)優(yōu)勢(shì)。
本文以溝谷為評(píng)價(jià)單元,提取怒江州遙感影像建立泥石流溝谷數(shù)據(jù)集,使用基于原型網(wǎng)絡(luò)(Prototypes Net)[16]的小樣本學(xué)習(xí)方法對(duì)發(fā)生泥石流的溝谷影像特征進(jìn)行學(xué)習(xí),并將模型用于其余大量溝谷的泥石流易發(fā)性評(píng)價(jià),借助ArcGIS 軟件將每條溝谷易發(fā)性結(jié)果和易發(fā)性分區(qū)進(jìn)行可視化。
云南省怒江傈僳族自治州是全國(guó)發(fā)生泥石流最嚴(yán)重的州(市)之一,怒江州地處云南省西北部橫斷山脈縱向嶺谷區(qū),轄瀘水市、福貢縣、貢山縣和蘭坪縣,總面積14 584.95 km2。州內(nèi)高黎貢山、怒山山脈、云嶺山脈近南北向延伸,瀾滄江(湄公河)、怒江(薩爾溫江)、獨(dú)龍江(伊洛瓦底江)等深切峽谷平行南下,河谷谷坡坡度一般35°~45°、部分達(dá)60°~70°。按云南省各年減災(zāi)年鑒及網(wǎng)絡(luò)中的不完全統(tǒng)計(jì),截至2022 年,有相關(guān)文字記載的泥石流災(zāi)害中,福貢縣至少發(fā)生69 起泥石流災(zāi)害事件、貢山縣至少67 起、蘭坪縣至少24 起、瀘水市至少42 起。1950—2021 年,福貢縣各年平均降水量達(dá)到3 460 mm、貢山縣1 632 mm、蘭坪縣1 550 mm、瀘水市2 596 mm[17]。較高的降水量、高山峽谷的特殊地形及其他因素導(dǎo)致了怒江州泥石流災(zāi)害的頻發(fā)。怒江州的地理位置和地形分布情況如圖1 所示。
圖1 怒江州地理位置和地形分布情況Fig.1 Geographical location and topographical distribution of Nujiang Prefecture
泥石流遙感數(shù)據(jù)集的建立主要使用谷歌地圖(Google Earth)遙感影像,地圖的高程數(shù)據(jù)由SRTM 提供,空間分辨率30 m,遙感影像則由Landsat,Quick-Bird,Spot 等遙感衛(wèi)星提供。Google Earth 擁有高精度的時(shí)間和空間分辨率,城市區(qū)域空間分辨率可達(dá)1m,農(nóng)村地區(qū)可達(dá)2.5~5 m,邊遠(yuǎn)山區(qū)可達(dá)15 m[18]。數(shù)據(jù)的提取和處理如圖2 所示,利用數(shù)字高程模型(DEM)獲取每條溝谷的掩膜信息,按照掩膜批量提取Google Earth 遙感圖像,為了保留溝谷的大小特征,將提取的遙感圖像按照DEM 比例進(jìn)行重采樣,并按照最大DEM溝谷圖像的尺寸進(jìn)行填充處理。
圖2 Google Earth 遙感數(shù)據(jù)的提取與處理Fig.2 Extraction and processing of Google Earth remote sensing data
所使用的Google Earth 遙感和DEM 數(shù)據(jù)的信息如表1 所示。
表1 Google Earth 遙感和DEM 數(shù)據(jù)信息Table 1 Information on Google Earth remote sensing and DEM data
泥石流遙感數(shù)據(jù)集包含正樣本、負(fù)樣本和待評(píng)價(jià)溝谷,正樣本的確定是從《云南減災(zāi)年鑒》[19]、相關(guān)文獻(xiàn)和網(wǎng)絡(luò)報(bào)道中獲得發(fā)生泥石流山谷和村莊的精確地點(diǎn),依據(jù)坐標(biāo)在Google Earth 中與發(fā)生泥石流后最近的時(shí)間分辨率進(jìn)行溝谷圖像提取。負(fù)樣本溝谷的確定依據(jù)為:在歷史記錄中不能檢索到發(fā)生泥石流信息,影像中沒(méi)有明顯的沖積痕跡和堆積扇的形成且周圍村莊密集。最終收集到泥石流溝谷50 條作為正樣本,未發(fā)生泥石流溝谷42 條作為負(fù)樣本,待評(píng)價(jià)溝谷樣本600 條。
基于原型網(wǎng)絡(luò)的溝谷泥石流易發(fā)性評(píng)價(jià)流程如圖3 所示,流程包括數(shù)據(jù)收集、溝谷提取、流域劃分、數(shù)據(jù)集劃分、數(shù)據(jù)集預(yù)分類、模型訓(xùn)練和預(yù)測(cè)、易發(fā)性評(píng)價(jià)和易發(fā)性分區(qū)圖,詳細(xì)流程如下。
圖3 基于原型網(wǎng)絡(luò)的溝谷泥石流易發(fā)性評(píng)價(jià)流程Fig.3 Chartflow of susceptibility assessment of debris flow based on prototype networks
首先收集研究區(qū)域的DEM、Google Earth 遙感影像和歷史泥石流數(shù)據(jù),按上一節(jié)中的數(shù)據(jù)提取流程,以溝谷流域?yàn)樵u(píng)價(jià)單元,提取得到Google Earth 溝谷泥石流遙感影像數(shù)據(jù)集和溝谷流域分區(qū)。其次,考慮形態(tài)各異的溝谷潛在危險(xiǎn)性存在特征差異,直接將溝谷分為正負(fù)樣本兩類訓(xùn)練,在忽略特征差異的同時(shí)網(wǎng)絡(luò)模型也不穩(wěn)定,按照影響泥石流的重要因子流域面積[20],將正負(fù)樣本按流域面積大小各預(yù)分為小、中、大3 類,0、1、2 屬于正樣本,3、4、5 屬于負(fù)樣本,如圖3 中數(shù)據(jù)集預(yù)分類標(biāo)簽所示。以元學(xué)習(xí)的形式組織正負(fù)樣本數(shù)據(jù)并輸入到原型網(wǎng)絡(luò)模型中進(jìn)行訓(xùn)練,將待評(píng)價(jià)溝谷樣本輸入到已訓(xùn)練的模型中,與6 個(gè)溝谷分類進(jìn)行相似度量,計(jì)算每個(gè)評(píng)價(jià)樣本的泥石流易發(fā)性指數(shù)。最后將易發(fā)性指數(shù)分區(qū),得到溝谷的泥石流易發(fā)性評(píng)價(jià)等級(jí),在流域單元?jiǎng)澐种锌梢暬u(píng)價(jià)結(jié)果,得到易發(fā)性評(píng)價(jià)分區(qū)圖。
從流程圖中可以看出,與基于泥石流因子進(jìn)行評(píng)價(jià)的流程相比,基于原型網(wǎng)絡(luò)的溝谷泥石流易發(fā)性評(píng)價(jià)方法直接使用溝谷影像來(lái)學(xué)習(xí)泥石流溝谷的特征,減少了從小流域計(jì)算眾多泥石流因子和泥石流因子篩選的繁瑣過(guò)程,避免了選擇不同因子帶來(lái)的評(píng)價(jià)差異問(wèn)題。原型網(wǎng)絡(luò)在保證性能的前提下,能夠快速高效的進(jìn)行泥石流易發(fā)性的評(píng)價(jià)。
原型網(wǎng)絡(luò)是小樣本學(xué)習(xí)中經(jīng)典的元學(xué)習(xí)和度量學(xué)習(xí)方法[21],網(wǎng)絡(luò)模型如圖4 所示。原型網(wǎng)絡(luò)以元學(xué)習(xí)的方式組織泥石流數(shù)據(jù)集進(jìn)行訓(xùn)練,通過(guò)特征提取器(feature extractor)提取支持集(support set)每一類溝谷的特征,計(jì)算每類溝谷特征均值作為該類的原型中心(Ck),將查詢集(query set)中待測(cè)溝谷的特征(Q)與原型中心進(jìn)行距離度量來(lái)完成待測(cè)溝谷的分類和預(yù)測(cè)。同時(shí),按照度量距離計(jì)算待測(cè)溝谷從屬類別的概率,并計(jì)算待測(cè)溝谷的泥石流易發(fā)性指數(shù),從而得到待測(cè)樣本的泥石流易發(fā)性評(píng)價(jià)等級(jí)。
圖4 原型網(wǎng)絡(luò)及分類模型Fig.4 Prototype network classification model
2.2.1 基于元學(xué)習(xí)方法的原型中心計(jì)算
元學(xué)習(xí)分為元訓(xùn)練和元測(cè)試。元訓(xùn)練將有限的訓(xùn)練樣本分為不同的子任務(wù)進(jìn)行訓(xùn)練,在小樣本學(xué)習(xí)中稱為C-wayK-shot 問(wèn)題。具體為:在N類訓(xùn)練樣本中,每類有少量樣本,學(xué)習(xí)時(shí)每個(gè)子任務(wù)選取C類(C≤N),每類中選取K個(gè)樣本,共C×K個(gè)樣本組成支持集(support set),即子任務(wù)的訓(xùn)練集。每類選取K個(gè)樣本后,從每類剩余樣本中各選取Q個(gè)樣本(K+Q小于等于類內(nèi)樣本總數(shù)),共C×Q個(gè)樣本作為查詢集(query set),即子任務(wù)的測(cè)試集。不斷從總類N中抽取C-wayKshot 組成支持集進(jìn)行訓(xùn)練,充分地利用了訓(xùn)練樣本數(shù)據(jù),使得模型在新任務(wù)時(shí)表現(xiàn)得更好。元測(cè)試則使用相同的方法來(lái)測(cè)試模型性能。
在訓(xùn)練和測(cè)試泥石流數(shù)據(jù)時(shí),原型網(wǎng)絡(luò)將VGG[22]、GoogleNet[23]、ResNet[24]等不帶分類器的卷積網(wǎng)絡(luò)作為特征提取器,計(jì)算支持集中每一類溝谷的原型中心作為該類溝谷的代表,原型中心計(jì)算如式(1)所示:
式中:Ck——每一類溝谷的原型中心;
Sk——訓(xùn)練批次中每一類溝谷的樣本數(shù);
(xi,yi)——某一樣本和對(duì)應(yīng)的標(biāo)簽;
f?——特征提取器;
2.2.2 樣本類別概率計(jì)算
如果將普通的神經(jīng)網(wǎng)絡(luò)分類器訓(xùn)練在小樣本學(xué)習(xí)的任務(wù)中,幾乎都是過(guò)擬合?;诜菂?shù)度量的方法(例如:最近鄰、k最近鄰、K-means、距離度量等)不需要優(yōu)化參數(shù),可以在元學(xué)習(xí)框架下構(gòu)建端到端的小樣本分類器。原型網(wǎng)絡(luò)使用余弦或歐氏距離的距離度量方式作為分類器,通過(guò)距離度量溝谷樣本的特征與每類原型中心的距離大小來(lái)完成分類,并通過(guò)式(2)計(jì)算溝谷樣本屬于某一類溝谷的概率:
式中:p?——某一樣本屬于真實(shí)類別k的概率;
?——提取器的參數(shù)。
d——距離度量函數(shù);
Q——樣本通過(guò)f?提取的特征;
k′——同一批訓(xùn)練的每一類別。
在訓(xùn)練優(yōu)化階段,通過(guò)將式(3)中的目標(biāo)函數(shù)J(?)反向傳播和隨機(jī)梯度下降來(lái)對(duì)網(wǎng)絡(luò)模型參數(shù) ?進(jìn)行優(yōu)化。
2.2.3 溝谷泥石流易發(fā)性等級(jí)評(píng)價(jià)
在進(jìn)行溝谷的泥石流易發(fā)性評(píng)價(jià)時(shí),通過(guò)計(jì)算溝谷的泥石流易發(fā)性指數(shù)來(lái)判定溝谷易發(fā)性等級(jí)。易發(fā)性指數(shù)通過(guò)所屬類別概率來(lái)計(jì)算,文中原型網(wǎng)絡(luò)使用歐氏距離來(lái)度量評(píng)價(jià)樣本特征向量與類原型特征向量之間的相似程度,歐式距離越小,相似程度越大,使用式(2)計(jì)算所屬類別的概率也就越大。
評(píng)價(jià)溝谷所屬正樣本中0、1、2 類其中一類溝谷的概率越高,說(shuō)明樣本泥石流易發(fā)性越高。使用式(4)將所屬概率轉(zhuǎn)化為易發(fā)性指數(shù)。具體方法為:將正樣本每類所屬概率之和與負(fù)樣本每類所屬概率之和作差,差值大于等于0,表示評(píng)價(jià)樣本與正樣本相似程度更大,取正樣本中的最大值作為易發(fā)性指數(shù),值越大易發(fā)性越大。反之,差值小于0,取負(fù)樣本中最大值的相反數(shù)為易發(fā)性指數(shù),值越小易發(fā)性越小。將溝谷的易發(fā)性指數(shù)按大小進(jìn)行分區(qū),即可得到溝谷的易發(fā)性等級(jí)。
式中:Ii——驗(yàn)證樣本i的易發(fā)性指數(shù);
m、k——正樣本、負(fù)樣本的類別數(shù),文中m=k=3。
本實(shí)驗(yàn)實(shí)現(xiàn)的硬件為CPU:Intel Xeon E5-2 650 v3、內(nèi)存:128GB、GPU:NVIDIA GeForce RTX 3 090。軟件為Ubuntu18.06、Pytorch1.9.0、python3.8、CUDA11.1。實(shí)驗(yàn)時(shí)設(shè)置訓(xùn)練輸入為6-way 10-shot,即每輪選6 類,每類選10 張訓(xùn)練,測(cè)試時(shí)輸入6-way 4shot 1query,即每輪測(cè)試選取6 類,每類4 張計(jì)算原型,1 張作為測(cè)試。選取9 個(gè)網(wǎng)絡(luò)模型結(jié)構(gòu),包括VGG、GoogleNet、ShuffleNetV2[25]、MobileNetV2[26]、Conv4[27]、ResNet12[27]、ResNet18[24]、DenseNet[28]、Rir[29]作為原型網(wǎng)絡(luò)的特征提取器,分類結(jié)果如表2 所示。
表2 多個(gè)特征提取器的分類性能Table 2 Classification performance of multiple feature extractors
表2 中,2 分類為只考慮正負(fù)樣本的分類正確率,可以看出,提取溝谷特征時(shí),Conv4 在原型網(wǎng)絡(luò)中的6 分類和2 分類正確率優(yōu)于其他模型。將正負(fù)樣本溝谷輸入此模型進(jìn)行測(cè)試,得到6 分類結(jié)果的混淆矩陣和正負(fù)2 分類的混淆矩陣如表3 和表4 所示。
表3 6 分類測(cè)試混淆矩陣Table 3 Confusion matrix of six-classification
表4 正負(fù)2 分類測(cè)試混淆矩陣Table 4 Confusion matrix for positive and negative binaryclassification test
使用分類指標(biāo)對(duì)分類結(jié)果進(jìn)行衡量,計(jì)算6 分類的卡帕系數(shù)(Kappa)和2 分類的準(zhǔn)確率(Accuracy)、精確率(Precision)、召回率(Recall)、F1 Score,得到表5 指標(biāo)表。
表5 2 分類和6 分類指標(biāo)表Table 5 Binary-classification and six-classification indicator table
表2—4 表明,Conv4 表現(xiàn)出了良好的分類性能,作為模型的特征提取器能夠帶來(lái)更好的泥石流易發(fā)評(píng)價(jià)結(jié)果。
保持同樣的模型參數(shù),將600 張怒江州待評(píng)價(jià)溝谷及正負(fù)樣本輸入網(wǎng)絡(luò),計(jì)算每一個(gè)溝谷樣本屬于6 類溝谷的概率,按式(4)計(jì)算每個(gè)樣本的易發(fā)性指數(shù)Ii。使用自然斷點(diǎn)法,按照易發(fā)性指數(shù)將易發(fā)區(qū)分為5 個(gè)等級(jí):低易發(fā)區(qū)[-1,-0.760 7]、較低易發(fā)區(qū)(-0.760 7,0]、易發(fā)區(qū)(0,0.603 6]、較高易發(fā)區(qū)(0.603 6,0.828 8]、高易發(fā)區(qū)(0.828 8,1]。最后,在ArcGIS 中使用DEM 進(jìn)行易發(fā)性分區(qū)可視化,得到如圖5 所示分區(qū)圖。
圖5 怒江州泥石流易發(fā)性分區(qū)圖Fig.5 Susceptibility zoning map of debris flow in Nujiang Prefecture
從圖5 中可以看出,預(yù)測(cè)為高易發(fā)的溝谷主要分布在貢山縣、福貢縣、瀘水市中,蘭坪縣較少。易發(fā)性溝谷分區(qū)中,低易發(fā)區(qū)249 條、較低易發(fā)區(qū)96 條、易發(fā)區(qū)100 條、較高易發(fā)區(qū)124 條、高易發(fā)區(qū)123 條。使用ArcGIS 計(jì)算溝谷的高程差、主溝長(zhǎng)度、溝谷投影面積和坡降比。計(jì)算時(shí),高程差為ArcGIS 中使用溝谷的最高海拔減去溝口海拔得出,主溝長(zhǎng)度為ArcGIS 中使用流量計(jì)算出最長(zhǎng)的河流長(zhǎng)度,溝谷面積為使用CGCS-2000 投影坐標(biāo)得到的柵格面積,坡降比即溝床比降,為高程差與主溝長(zhǎng)的比值,反映溝谷的整體陡度。按照易發(fā)性分區(qū)將高程差、主溝長(zhǎng)度、溝谷面積和坡降比分布可視化,如圖6 所示,作為對(duì)比,正樣本分布如圖6 中虛線空心箱線圖所示。
圖6 怒江州泥石流易發(fā)性分區(qū)中溝谷高程差、溝長(zhǎng)、面積、坡降比的分布情況Fig.6 Distribution of the valley elevation difference,valley length,area,and slope ratio in the debris flow susceptibility zone in Nujiang prefecture
從分布情況中可知,在預(yù)測(cè)的溝谷中,低易發(fā)區(qū)、較低易發(fā)區(qū)、易發(fā)區(qū)、較高易發(fā)區(qū)在高程差、溝長(zhǎng)、面積的分布上呈現(xiàn)下降趨勢(shì),坡降比呈上升趨勢(shì)。易發(fā)區(qū)和較高易發(fā)區(qū)分布在高程差小、溝長(zhǎng)短、面積小和坡降大的溝谷中。高易發(fā)區(qū)溝谷分布則較廣,面積、高程差、溝長(zhǎng)和坡降比從小到大都有高易發(fā)溝谷,這和正樣本溝谷的分布有著相似的特點(diǎn)。
李益敏[9]使用泥石流因子評(píng)價(jià)方法,以5 km2的匯水面積為閾值,將怒江州劃分為1 414 個(gè)小流域單元,選取流域單元的距斷裂帶距離、巖性、Melton 指數(shù)[30]、流域延伸率、流域高差率、河流彎曲系數(shù)、流域水系密度、平均植被覆蓋度、年均降水量、距道路距離、距居民點(diǎn)距離共 11 個(gè)評(píng)價(jià)因子,采用確定性系數(shù)模型 CF和多因子疊加權(quán)重確定法,對(duì)怒江州小流域單元進(jìn)行泥石流易發(fā)性評(píng)價(jià)分區(qū)。與本文易發(fā)性分區(qū)對(duì)比,存在著相同點(diǎn):預(yù)測(cè)為高易發(fā)及較高易發(fā)的溝谷(其文中為小流域)都集中在瀾滄江以西,蘭坪縣較少,這與泥石流歷史分布都較為符合。預(yù)測(cè)為高易發(fā)及較高易發(fā)溝谷(流域)數(shù)分別占全部溝谷(流域)的35.69%和34.72%,非常相近。
在《云南省減災(zāi)年鑒》中檢索到4 條發(fā)生了人員傷亡或多次發(fā)生泥石流的溝谷,地理位置如圖7 中標(biāo)簽A、B、C、D 處所示,編號(hào)A 為貢山縣普拉底鄉(xiāng)東月谷,于2010 年8 月18 日凌晨1 時(shí)30 分暴發(fā)特大山洪泥石流災(zāi)害,造成11 212 人受災(zāi),死亡96 人,失蹤53 人,重傷9 人,輕傷30 人,轉(zhuǎn)移安置災(zāi)民3 282 人,直接經(jīng)濟(jì)損失1.4 億元。編號(hào)B 為貢山縣普拉底鄉(xiāng)咪谷河,于2010年7 月26 日凌晨發(fā)生泥石流災(zāi)害,造成3 人死亡、8 人失蹤、11 人受輕傷,直接經(jīng)濟(jì)損失200 萬(wàn)元。編號(hào)C 為貢山縣獨(dú)龍江鄉(xiāng)巴坡村溝谷,于2010 年4 月4 日12 時(shí)發(fā)生泥石流災(zāi)害,造成1 人失蹤,公路與通訊中斷,巴坡村2014 年2 月20 日、2017 年8 月12 日都有發(fā)生泥石流的記錄。編號(hào)D 為蘭坪縣金頂鎮(zhèn)七聯(lián)村練登大溝,于2010 年9 月19 日發(fā)生泥石流,對(duì)下游基礎(chǔ)設(shè)施造成破壞,直接經(jīng)濟(jì)損失360 萬(wàn)元,又于2019 年8 月7 日發(fā)生泥石流。4 條溝谷的遙感圖像和溝口泥石流堆積情況如圖7 中所示。
4 條泥石流溝谷的所屬概率和易發(fā)性指數(shù)如表6所示。
表6 4 條泥石流溝谷原型網(wǎng)絡(luò)計(jì)算的所屬概率和易發(fā)性指數(shù)Table 6 Probability and susceptibility index of four debris flow valleys with prototype networks
在預(yù)測(cè)中東月谷、咪谷河和練登大溝與1 類泥石流溝谷相似度最高,巴坡村與0 類泥石流溝谷相似度最高,東月谷、咪谷河和巴坡村三條溝谷的易發(fā)性指數(shù)都屬于高易發(fā)性區(qū)間,這說(shuō)明三條溝谷具有非常高的泥石流易發(fā)性。練登大溝易發(fā)性指數(shù)在易發(fā)區(qū)間,具有較高的泥石流易發(fā)性。
基于因子統(tǒng)計(jì)分析是較為成熟的分析方法,文中收集了溝谷相關(guān)的高程差、主溝長(zhǎng)度、溝谷面積、溝谷周長(zhǎng)、溝谷平均坡度、坡降比、Melton 指數(shù)、切割密度和圓狀率共9 個(gè)地形因子。其中,Melton 指數(shù)[30]由Melton M A提出,其值為流域高程差與面積平方根的比值,反映了集水區(qū)的動(dòng)力學(xué)及其對(duì)泥石流的敏感性。切割密度為主溝長(zhǎng)度與流域面積的比值,反映集水區(qū)內(nèi)巖石的抗風(fēng)化能力和地貌發(fā)育情況[31]。圓狀率由溝谷周長(zhǎng)與主溝長(zhǎng)度比值所得,影響匯流時(shí)間。對(duì)9 個(gè)因子使用隨機(jī)森林的分類方法進(jìn)行訓(xùn)練,模型正負(fù)樣本分類準(zhǔn)確率為61.11%,對(duì)4 條溝谷進(jìn)行預(yù)測(cè),預(yù)測(cè)結(jié)果如表7所示。
表7 4 條泥石流溝谷因子分析方法計(jì)算的所屬概率和易發(fā)性指數(shù)Table 7 Probability and susceptibility index of four debris flow valleys with factor analysis methods
可以看出,雖然使用因子分析和原型網(wǎng)絡(luò)對(duì)4 條溝的預(yù)測(cè)類別不同,但除了巴坡村預(yù)測(cè)錯(cuò)誤,其他3 條溝仍被預(yù)測(cè)為正樣本。同樣的,與李益敏[9]基于因子分析的易發(fā)性分區(qū)相比,4 條溝谷在其評(píng)測(cè)中的易發(fā)性結(jié)果為:東月各為低易發(fā)、咪谷河為高易發(fā)、巴坡村為低易發(fā)、練登大溝為極低易發(fā)。對(duì)于四條已經(jīng)發(fā)生泥石流的溝谷來(lái)說(shuō),特別是東月各溝谷發(fā)生特大泥石流災(zāi)害的特點(diǎn),4 條溝谷在本文原型網(wǎng)絡(luò)評(píng)價(jià)中為高易發(fā)和較高易發(fā),這與歷史情況更為接近。
泥石流的發(fā)生是地貌條件、物質(zhì)條件和激發(fā)條件共同作用的結(jié)果[11],選取若干小流域易發(fā)性評(píng)價(jià)實(shí)驗(yàn)[32-34]中認(rèn)為重要的地貌條件和物質(zhì)條件因子,對(duì)上面4 條泥石流溝谷進(jìn)行分析,分析如表8 所示[35-36]。
表8 4 條泥石流溝谷的地貌條件和物質(zhì)條件因子分析Table 8 Factors analysis of geomorphological and material conditions of four debris flow valleys
在地形地貌和物質(zhì)條件對(duì)泥石流形成的影響中,流域面積大匯水量多,主溝長(zhǎng)、坡度大、高程差大、坡降比大、Melton 指數(shù)大都會(huì)為泥石流的沖積提供動(dòng)能。巖性對(duì)泥石流發(fā)生的影響中,片巖、混合巖、砂巖都容易風(fēng)化產(chǎn)生松散物質(zhì),花崗巖、板巖、千枚巖、石灰?guī)r、其他碳酸鹽巖雖然比片巖、混合巖更硬,但是對(duì)泥石流也有較高的敏感性[37-40]。灌林和草地的含沙量比林地多,水滲透能力也比林地強(qiáng),能夠提供更多的松散物質(zhì)和更強(qiáng)的雨水侵蝕能力[41-42]。淋溶土和松軟薄層土也提供了松散物質(zhì)[43]。東月谷、咪谷河、練登大溝3 條溝谷中,疏林地、草地、松軟薄土和淋溶土、砂巖和片巖等為泥石流提供了大量松散物質(zhì),練登大溝半個(gè)坡面為人工礦區(qū),對(duì)植被破壞大,大量裸露的松散泥土,容易被雨水沖刷和搬運(yùn)。其次,3 條溝谷都有較長(zhǎng)的主溝長(zhǎng)度、較大的匯水面積、高程差、平均坡度和Melton 指數(shù),匯集大量雨水且促成強(qiáng)大的沖積能量,從圖7 中的堆積扇可以看出,沖積泥沙量巨大,阻斷河流形成堰塞湖、毀壞公路和農(nóng)田、摧毀房屋,造成巨大的經(jīng)濟(jì)損失。以人員傷亡和經(jīng)濟(jì)損失最大的東月谷為例,暴發(fā)泥石流時(shí)沖出體積約為 60×104m3[44],破壞力極強(qiáng)。巴坡村雖然溝長(zhǎng)和面積較小,但同樣有足夠的松散物質(zhì),并且坡度極大,降雨量達(dá)到一定程度,極容易形成小型泥石流或者滑坡,每當(dāng)松散物質(zhì)得到補(bǔ)充,只要一定的雨水條件激發(fā),就會(huì)周期性的發(fā)生泥石流。
文中考慮到形態(tài)各異的溝谷潛在的特征差異及模型的穩(wěn)定性,按面積大小對(duì)泥石流溝谷進(jìn)行預(yù)分類,再進(jìn)行原型網(wǎng)絡(luò)的訓(xùn)練,可能存在更為合理的預(yù)分類,讓神經(jīng)網(wǎng)絡(luò)能更好地區(qū)分溝谷潛在的圖像特征從而使得評(píng)價(jià)更為準(zhǔn)確。其次,能夠提取到溝谷圖像的還有高分衛(wèi)星遙感和數(shù)字高程模型,這2 種圖像對(duì)泥石流特征是否有著更好的表征能力,或者使用它們的組合能夠帶來(lái)更好的評(píng)測(cè)效果,是今后研究工作的一個(gè)重點(diǎn)。最后,以溝谷為單元進(jìn)行評(píng)價(jià),從歷史信息中能夠確定發(fā)生泥石流的溝谷數(shù)量極其有限,特別是極小部分多次發(fā)生泥石流的高頻溝谷,網(wǎng)絡(luò)并沒(méi)有學(xué)習(xí)到這種高頻特征。
李益敏等[9]使用因子評(píng)價(jià)的方法中,評(píng)價(jià)為高易發(fā)性的流域在貢山縣、福貢縣和瀘水市中,但主要集中在貢山縣,而本文中貢山縣稍多,同時(shí)在貢山縣、福貢縣和瀘水市中的分布比其更加“均勻”,更加符合歷史泥石流災(zāi)害的分布規(guī)律。但是,評(píng)價(jià)的準(zhǔn)確度需要從后續(xù)泥石流災(zāi)害事件中得到驗(yàn)證。而且,小樣本深度學(xué)習(xí)的方法依賴于數(shù)據(jù)和模型,在后期的工作中,繼續(xù)收集更多的泥石流溝谷圖像,并不斷改進(jìn)模型,提高模型的精度,以此來(lái)減少模型性能帶來(lái)的誤差,提高預(yù)測(cè)精度。
基于原型網(wǎng)絡(luò)的小樣本學(xué)習(xí)方法對(duì)怒江州所有溝谷的泥石流易發(fā)性進(jìn)行評(píng)價(jià),經(jīng)過(guò)實(shí)驗(yàn),得出了以下結(jié)論:
(1)基于原型網(wǎng)絡(luò)的小樣本學(xué)習(xí)模型在泥石流正負(fù)樣本的分類上精度為67.39%,模型具有良好的評(píng)價(jià)能力。
(2)通過(guò)模型預(yù)測(cè),將溝谷泥石流易發(fā)性分為低易發(fā)區(qū)、較低易發(fā)區(qū)、易發(fā)區(qū)、較高易發(fā)區(qū)和高易發(fā)區(qū)5 個(gè)等級(jí),高易發(fā)和較高易發(fā)溝谷主要分布在貢山縣、福貢縣、瀘水市中,蘭坪縣較少,這與歷史泥石流發(fā)生點(diǎn)的空間分布較為吻合。
(3)選取4 條發(fā)生泥石流的溝谷,使用原型網(wǎng)絡(luò)對(duì)其易發(fā)性進(jìn)行評(píng)價(jià),同時(shí)選取高程差、面積、溝長(zhǎng)等9 個(gè)地形因子使用隨機(jī)森林的分類方法進(jìn)行評(píng)價(jià),最后再與基于小流域的評(píng)價(jià)方法進(jìn)行對(duì)比分析,只有原型網(wǎng)絡(luò)全部評(píng)價(jià)正確,這說(shuō)明,原型網(wǎng)絡(luò)小樣本學(xué)習(xí)的方法有良好的評(píng)價(jià)性能。
(4)對(duì)這4 條典型溝谷的地貌條件和物源條件因子進(jìn)行分析,4 條溝谷都有著泥石流發(fā)生的地形地貌和物源條件,使用Google Earth 遙感圖像學(xué)習(xí)泥石流特征并進(jìn)行泥石流易發(fā)性預(yù)測(cè)的方法,消除了選取因子不統(tǒng)一的問(wèn)題,是泥石流易發(fā)性評(píng)價(jià)的一種新的方法,為泥石流易發(fā)性研究帶來(lái)新的思路。
中國(guó)地質(zhì)災(zāi)害與防治學(xué)報(bào)2023年5期