楊 光 徐佩華 曹 琛 張 文 蘭志廣 陳俊淇 董秀軍
( ①吉林大學建設工程學院 長春 130026)
( ②成都理工大學 成都 610059)
滑坡敏感性評價是以地質環(huán)境條件為基礎,參考滑坡現(xiàn)狀靜態(tài)因素預測滑坡在一定區(qū)域內發(fā)生的可能性大小( 倪化勇等,2015) 。近年來,3S 技術快速發(fā)展,許多研究人員將其應用于滑坡敏感性制圖( Bai et al.,2009) 。地質災害敏感性評價主要可以分為定性和定量方法兩類,定性方法是以專家的知識和經(jīng)驗為基礎來判斷各個因子的權重,然后將各個因子疊加,就得到了敏感性分區(qū)圖; 近10 年來,定量分析方法逐漸成為地質災害評價的主要方向。定量方法是使用一種或多種數(shù)學方法來分析地質災害的數(shù)據(jù)與選取的評價因子是否具有相關性,然后疊加各因子得到敏感性分區(qū)圖。常用的分析方法有層次分析法( 許沖等,2009) 、模糊綜合評判法( 王哲等,2012) 、邏輯回歸法( 陳燕平,2010) 等。其中層次分析法和模糊綜合評判法是啟發(fā)式方法,邏輯回歸方法屬于統(tǒng)計方法,統(tǒng)計方法具有較高精度并且能夠客觀評價因子的權重,因此確定性系數(shù)法( 許沖等,2010; 劉麗娜等,2014; 馮杭建等,2017) 、信息量法( 許英姿等,2016; 寇麗娜等,2017) 等統(tǒng)計方法已經(jīng)廣泛應用于地質災害評價。除了統(tǒng)計方法,大量機器學習算法如支持向量機( Chen et al.,2016) 、多層感知器模型( 王志恒等,2015) 、決策樹模型( Tsangaratos et al.,2016) 等也被廣泛使用。但是單一的評價模型會存在一定的缺點,例如確定性系數(shù)法沒有考慮每個評價因素對地質災害敏感性的影響差異,而層次分析過程不能考慮每個因素內不同特征變量對其的影響,邏輯回歸法和多層感知器法無法解決各個影響因子的量化問題,即多源數(shù)據(jù)類型的合并問題,難以客觀、定量準確地進行區(qū)域地質災害評價?;诖?,近些年組合方法得以廣泛的應用并取得良好效果,像信息量法與Logistic 回歸法組合( 樊芷吟等,2018; 張曉東等,2018) 、支持向量機和人工神經(jīng)網(wǎng)絡組合方法( 夏輝等,2018) 。
確定性系數(shù)方法計算嚴密,可以解決多源數(shù)據(jù)類型的合并問題,也能夠很好地解決影響因子內部不同特征區(qū)間對地質災害敏感性的影響; 層次分析法可以很好地考慮每個因素的復雜性以及不同因素對地質災害敏感性的影響差異; 邏輯回歸模型屬于統(tǒng)計方法,計算簡單,物理意義明確,可以用簡單的線性回歸來描述自然現(xiàn)象之間復雜的非線性關系;多層感知器是數(shù)據(jù)挖掘方法,具有突出的非線性映射能力更適合用于滑坡預測預報。將確定性系數(shù)分別與層次分析法、邏輯回歸模型、多層感知器模型結合進行滑坡敏感性評價,結合各個模型的優(yōu)點,能夠較好地解決使用單一模型在地質災害敏感性分析中的不足,使評價結果更為直觀合理。
為了對研究區(qū)的土地利用規(guī)劃及防災減災預警工作提供一定的參考,本文結合122 個災害點,對四川茂縣疊溪鎮(zhèn)到石大關鄉(xiāng)區(qū)域的地質災害敏感性進行評價。在茂縣的孕災環(huán)境基礎上,選取了坡度、剖面曲率、起伏度、坡向、距河流距離、高程、地層、距斷層距離、土地類型、植被覆蓋度10 個影響災害發(fā)生的評價因子,并選用確定性系數(shù)( Certainty Factor,CF) 法分別與層次分析( Analytic Hierarchy Process)法、邏輯回歸( Logistics Regression,LR) 法、多層感知器( Multiple Layer Perceptron,MLP) 法相結合等3種方法對區(qū)域進行敏感性區(qū)劃,比較3 種模型的敏感性分區(qū)效果。
研究區(qū)為疊溪鎮(zhèn)到石大關鄉(xiāng)區(qū)域,位于四川省茂縣東北部,地理范圍在103°32' ~103°51'E,31°48'~32°12' N 之間( 圖1a) ,面積為1120 km2。研究區(qū)地處青藏高原向川西平原過渡地帶,北側有岷山、南側有龍門山、西側有邛崍山等山脈。研究區(qū)為中山地帶,地貌以高山峽谷為主,地勢由西北向東南傾斜,高程最低為1581 m,最高為4711 m,相對高差3130 m( 圖1b) 。研究區(qū)屬高原性季風氣候,垂直氣候和地區(qū)氣候明顯,海拔超過2400 m 的地區(qū)氣溫低,海拔低于2400 m 的地區(qū)氣候溫和,年均氣溫11.0 ℃,夏季和秋季降雨較多,春季和冬季降雨較少,年降水量486.3 mm; 研究區(qū)內河流屬岷江水系,支流發(fā)育,迂回曲折,縱貫全境,境內流長約5 km。區(qū)內出露的地層主要有三疊系、二疊系、泥盆系、志留系,巖性主要為早三疊系灰綠色變質凝灰質砂巖、粉砂巖與絹云板巖,中夾薄層灰?guī)r,為軟硬互層; 中三疊系變砂巖、板巖,夾灰?guī)r,為軟質巖體;晚三疊系深灰色薄-厚層變質長石石英砂巖、含礫砂巖,與炭質板巖互層,為軟質巖體; 二疊系碳酸鹽巖夾硅質巖,為硬質巖體; 泥盆系灰黑色變質泥、砂、炭硅質巖,夾碳酸鹽巖,為軟質巖體; 志留系綠色絹云板巖,夾砂質灰?guī)r、石英砂巖,為軟質巖體。研究區(qū)的斷裂和褶皺較為發(fā)育,區(qū)內主要斷裂構造為岷江斷裂和松坪溝斷裂( 圖1c) 。這些斷裂和褶皺造成區(qū)內巖體破碎,產(chǎn)狀倒轉等特點,大部分屬馬爾康地質分區(qū)。
確定性系數(shù)法是一種概率函數(shù)方法,用于分析影響事件發(fā)生的各種因素的敏感性?;炯僭O條件為:滑坡災害的易發(fā)程度可依據(jù)以前發(fā)生的滑坡與確定為環(huán)境因素的數(shù)據(jù)集之間的統(tǒng)計關系來確定。Shortliffe( 1975) 提出確定性系數(shù)模型,并經(jīng)過Heckerman( 2013) 修正。確定性模型可以組合不同類型的數(shù)據(jù),它可以有效地解決數(shù)據(jù)輸入的異質性和不確定性,數(shù)據(jù)處理和評估過程相對簡單,準確性高。因此,它被廣泛用于滑坡敏感性評估。模型假設將來發(fā)生地質災害的條件與以前相比是不變的,
計算公式為:
式中,CF為地質災害的確定性系數(shù); Pa 為影響因子數(shù)據(jù)a 中地質災害個數(shù)與數(shù)據(jù)a 面積之比; Ps 為研究區(qū)災害總個數(shù)與研究區(qū)總面積之比。由式( 1) 可知,CF區(qū)間為[- 1,1],CF越接近1,說明地質災害發(fā)生的確定性越大,對應區(qū)域極有可能是災害易發(fā)區(qū); CF越接近-1,說明地質災害發(fā)生的確定性越小,對應區(qū)域是災害易發(fā)區(qū)的可能性很小。
層次分析法是一種定性與定量相結合的系統(tǒng)化決策方法,由美國學者Saaty( 1980) 在20 世紀70 年代提出。它的基本原理是根據(jù)問題的實質,將決策問題的有關元素分解成指標等層次,按照指標之間的相互關系進行組合,形成一種定性與定量關系相結合的多層次遞階結構。層次分析法可根據(jù)以下幾個基本步驟來進行: ( 1) 首先應該建立起遞階層次結構模型,通過分析問題所選取的指標及指標之間的相互關系確立; ( 2) 從層次結構的第2 層開始,采用1~9 標度方法,根據(jù)薩蒂方法,比較每個因素,構造判斷矩陣; ( 3) 根據(jù)層次分析法的基本原理,應該滿足判斷矩陣A:
式中,ω 為對應于矩陣A 的最大特征值λmax的特征向量,并引入一致性指標CI 來測量判斷矩陣的偏離,檢驗一致性。
引入平均隨機一致性指標RI,其值如表1 所示。隨機一致性之比CR 為:
如果CR<0.1,則判斷矩陣滿足一致性檢驗,因子權重設定指標較合理。
表1 隨機一致性指標(RI)Table 1 Random consistency indicator( RI)
CF-AHP 組合模型是利用AHP 計算所選取指標因子的重要性程度,并且采用CF 法計算不同因子的CF 值,并此為基礎,將指標因子的CF 加權求和,得到要評價的區(qū)域的敏感性指數(shù),以此為依據(jù)進行研究區(qū)敏感性評價。
邏輯回歸模型是研究二分類因變量常用的多元統(tǒng)計分析方法,其中因變量y 只取兩個值,在地質災害分析中,y 通常會取值0 和1( 0 代表地質災害不存在,1 代表地質災害存在) 。模型用來描述二元因變量和一系列的自變量( X1,X2,…,Xn) 之間的關系。自變量數(shù)據(jù)類型沒有具體要求,邏輯回歸模型具有容易計算,物理意義明確等優(yōu)點,可以用簡單的線性回歸來描述自然現(xiàn)象之間復雜的非線性關系,也可以用來預測事件發(fā)生的概率。邏輯回歸估計的優(yōu)勢比也可以用來檢驗自變量與因變量之間的相關性強度。該方法在滑坡敏感性分析中得到了廣泛的應用。函數(shù)如下式:
式中,P 為滑坡可能發(fā)生概率,在[0,1]區(qū)間,β1為通過計算得到的回歸系數(shù)。
CF-LR 組合模型是將由確定性系數(shù)模型計算出的各個指標等級的CF 值作為邏輯回歸模型中的指標值,不同滑坡點處和非滑坡點處提取CF 值,建立回歸方程以估計邏輯回歸系數(shù),以此為依據(jù)進行研究區(qū)敏感性評價。
Rumehart 等提出了多層感知器模型( Multiple Layer Perceptron,MLP) ,它可以解決單層感知器模型存在的非線性可分數(shù)據(jù)的多類別分解問題,多層感知器是一種按照單向誤差傳播的多層前饋網(wǎng)絡模型,相對于一般的線性統(tǒng)計方法,多層感知器突出的非線性映射能力更適合用于滑坡預測預報,因此,多層感知器模型在滑坡敏感性分析中得到廣泛的應用,是最基本的網(wǎng)絡模型之一。
MLP 模型由3 部分組成,分別為感受層( S) 、聯(lián)想層( A) 和響應層( R) 。3 部分都是由同類的神經(jīng)元構成的,特征向量通過感受層輸入,聯(lián)想層屬于模型中的隱含層,而響應層為網(wǎng)絡的輸出層。模型示意圖如圖2。
圖2 MLP 模型示意圖Fig. 2 MLP model diagram
CF-MLP 模型通過影響因子的CF 值來確定滑坡的關鍵影響因子,每個影響因子的CF 值都位于相同的數(shù)據(jù)區(qū)間。此數(shù)據(jù)具有同樣的量綱,解決數(shù)據(jù)類型的合并問題。CF-MLP 模型將CF 值通過輸入層輸入,結合CF 函數(shù)和MLP 模型,構建出CFMLP 模型,很好地提高了模型的精度。
本文選取244 個樣本點,其中滑坡點和非滑坡點分別為122 個,從244 個樣本點中隨機選擇70%的數(shù)據(jù)作為訓練樣本來建模,再結合本文選取的10個評價因子,采用CF-AHP、CF-LR 和CF-MLP 3 種模型評價研究區(qū)的滑坡敏感性并分區(qū),利用剩余的30%樣本點,采用精度檢驗,結合滑坡實際發(fā)育情況討論并比較3 種模型。
有許多影響滑坡發(fā)生的因素,指標的選取主要基于前人對滑坡災害的研究( Park et al.,2012) ,Park et al. ( 2012) 對2005~2012 年發(fā)表的220 余篇文獻進行總結,統(tǒng)計出一些常用影響因子,結果如圖3。根據(jù)研究區(qū)的地質災害調查資料,并結合上述統(tǒng)計結果,經(jīng)過分析選擇坡度、剖面曲率、起伏度、坡向、距河流距離、高程、地層、距斷層距離、土地類型、植被覆蓋度10 個因子作為研究區(qū)的評價因子( 圖4) ,每個因子的分級指標見表2,指標數(shù)據(jù)精度見表3。
表2 各評價因子分類級別確定性系數(shù)計算結果表Table 2 Results for different classes of influence factors of CF model
圖3 滑坡影響因子文獻統(tǒng)計( Park et al.,2012)Fig. 3 Landslide impact factor literature statistics( Park et al.,2012)
圖4 研究區(qū)滑坡敏感性評價因子Fig. 4 Conditioning factors for landslide hazard assessment of the study area
高程是滑坡發(fā)生的重要影響因素,對坡體應力值大小起著重要影響,坡高越大,應力值也越大,影響滑坡的勢能。研究區(qū)地處高山峽谷地區(qū),高程對降雨、植被分布特征及土地利用范圍都會產(chǎn)生重要的影響,因此有必要對高程因素進行考慮; 滑坡通常都會發(fā)生在一定的斜坡上,在一定坡角范圍內,由于坡角的增大,邊坡的破壞概率增加,因此坡度對滑坡發(fā)生起著重要的作用; 坡向不同會影響滑坡環(huán)境的植被覆蓋率、降雨量的大小,也會對巖石風化節(jié)理發(fā)育程度造成影響; 剖面曲率描述了斜坡形狀的形態(tài)特征,反映了地表侵蝕和地表徑流的形成,例如凸型坡非常容易在坡腳處發(fā)生應力集中導致失穩(wěn),安全性十分不好; 地形起伏度可以反映坡面的變化,可以揭示整個區(qū)域的地形變化規(guī)律; 通常來講,起伏度越大,地形內的地勢變動也就會越大,研究區(qū)處于高山峽谷地區(qū),地勢變化比較明顯,因此對起伏度進行考慮。植被覆蓋情況是區(qū)域地質災害發(fā)育的重要影響因素,植被可以對滑坡的穩(wěn)定性起到積極的作用,滑坡多發(fā)生在無植被或低植被覆蓋的區(qū)域,NDVI 是反映植被覆蓋度的常用指標,NDVI 值越大,植被覆蓋越好。地層巖性對滑坡的發(fā)生有明顯的影響,例如出現(xiàn)強度較差、結構破碎等情況的地層就十分容易發(fā)生滑坡( 尚敏等,2018) ; 邊坡的類型、硬度、結構特征等對邊坡的物理力學性能、變形性和破壞模式有很大的影響; 河流兩岸的坡度通常由河流侵蝕,在正常情況下,與河流的距離越近,侵蝕越強烈,滑坡的發(fā)生概率越高( 譚春,2013) ; 斷層距離是滑坡發(fā)生的重要影響因素,構造帶發(fā)育的地方容易發(fā)生滑坡,因為斷裂帶巖石相對破碎,節(jié)理斷裂發(fā)育,巖石強度明顯降低,使該地區(qū)邊坡不穩(wěn)定,更易發(fā)生滑坡。
表3 影響因子信息數(shù)據(jù)Table 3 Impact factor information data
4.1.1 CF-AHP 模型
根據(jù)前人的研究( Pourghasemi et al.,2017) ,利用層次法將指標進行對比,將每個指標賦值1~9,賦值越小,則對應的權重就越大,構建判斷矩陣獲取各指標權重,如表4 所示。CF-AHP 模型因子權重由大到小依次為地層、斷層距、坡度、河流距、土地類型、高程、坡向、剖面曲率、NDVI、起伏度。
4.1.2 CF-LR 組合模型
將122 個樣本點10 個因子的CF 值作為數(shù)據(jù)源,在SPSS 軟件中進行二項邏輯回歸分析,其中每個評價因子的CF 值都是獨立的自變量,將滑坡是否會發(fā)生作為因變量,回歸分析結果( 表4) ,從左到右依次為變量系數(shù)值( B) 、B 的絕對值和重要性排序。
選用回歸系數(shù)的絕對值作為分析因子重要性程度的指標,該因子對滑坡發(fā)生的影響隨著絕對值的增大而增加。各因子回歸系數(shù)B 的絕對值如表5所示??梢钥闯?,CF-LR 模型計算出的因子權重由大到小依次為高程、距斷層距離、地層、土地類型、坡度、剖面曲率、NDVI、坡向、地形起伏度、距河流距離。
表4 層次分析法判斷矩陣與各因子權重值Table 4 Analytic hierarchy process judgment matrix and each factor weight value
表5 邏輯回歸分析結果Table 5 Results of logistic regression analysis
將以上10 個因子數(shù)值代入到邏輯回歸計算模型,得到研究區(qū)邏輯回歸式( 6) :
式中,P 為發(fā)生滑坡的概率; x1- x10分別為NDVI、河流距、斷層距、坡度、坡向、剖面曲率、土地類型、地形起伏度、地層巖性、高程的CF 值。
4.1.3 CF-MLP 組合模型
基于影響因子的確定性系數(shù)和滑坡數(shù)據(jù),構建多層感知器網(wǎng)絡,其模型示意如圖2 所示。基于MLP 網(wǎng)絡訓練得到各個影響因子的重要性系數(shù)( 表6) ??梢钥闯觯珻F-MLP 模型計算出的因子權重由大到小依次為高程、地層、坡向、坡度、起伏度、距河流距離、剖面曲率、土地類型、NDVI 和距斷層距離。
表6 影響因子重要性系數(shù)表Table 6 Impact factor importance coefficient table
通過上述3 種方法并結合ArcGIS 工具箱疊加計算出3 種模型的敏感性程度值,可以根據(jù)ArcGIS軟件的自然斷點法進行分級,自然斷點法是統(tǒng)計學中常用的分級方法,能夠保持類別的一致性,是一種比較客觀的分類方法,在地質災害分級中得到廣泛應用( 譚春,2013) 。將研究區(qū)的敏感性分為4 級:高敏感性、中敏感性、低敏感性、極低敏感性。結果如圖5。
CF 模型中,高、中、低和極低敏感區(qū)面積分別為144.29 km2、230.47 km2、340.08 km2和386.93 km2,分別占研究區(qū)總面積的13.0、20.9%、30.9%和35.2%; CF-LR 模型,高敏感區(qū)、中敏感區(qū)、低敏感區(qū)和極低敏感區(qū)面積分別為 124.95 km2、278.74 km2、248.17 km2和449.90 km2,分別占研究區(qū)總面積的11.3%、25.1%、22.5%和41.1%; CFMLP 模型,高敏感區(qū)、中敏感區(qū)、低敏感區(qū)和極低敏感 區(qū) 面 積 分 別 為 152.46 km2、191.99 km2、303.28 km2和454.04 km2,分別占研究區(qū)總面積的13.8%%、17.3%、30.0 和38.9%。高敏感區(qū)主要集中在石大關鄉(xiāng)附近區(qū)域,沿著石大關鄉(xiāng)到疊溪鎮(zhèn)的岷江兩岸也分布少部分滑坡高敏感區(qū)。
圖5 研究區(qū)滑坡敏感性分區(qū)圖Fig. 5 Landslide sensitivity map of the study area
圖6 3 種模型ROC 曲線圖Fig. 6 ROC curves for three models
ROC 曲線是目前應用于地質災害敏感區(qū)域評價精度驗證比較常用的方法( Hamid et al.,2012) 。ROC 曲線非常簡單直觀,對所選用的方法和敏感性的關系能夠很好的反映,試驗的準確性非常好。AUC 表示ROC 曲線下的面積,其數(shù)值一般小于1,越接近1,說明模型模擬效果越好。
應用SPSS 軟件,將3 種模型進行ROC 曲線的繪制,并求取AUC 值( 圖6) 可知,3 個AUC 的值分別為0.850、0.884、0.867。其中CF-LR 模型AUC值為0.884,準確性最高,分區(qū)可靠。因此本區(qū)域選用CF-LR 組合模型。
( 1) 地層:從表2 中可以看出,泥盆系和志留系CF 值為正值,這兩個地層有利于滑坡的發(fā)生。這些地層的巖性為灰黑色變質泥、砂、碳硅質巖,夾碳酸鹽巖和綠色絹云板巖,夾砂質灰?guī)r、石英砂巖,都為軟質巖體。巖體受水流沖刷作用影響很大,導致強度降低,巖體中常見彎曲和撕裂變形現(xiàn)象,因此,這些因素為滑坡變形提供了有利條件; 對于坡向,根據(jù)CF 值可以看出,研究區(qū)北、東北、東、東南和西向CF 值為正值,其中東南向CF 值最大,說明東南向最有利于滑坡的發(fā)生。邊坡的坡向往往影響巖體的邊坡結構,巖石反向邊坡更容易發(fā)生彎曲,傾斜層質邊坡比陡坡更容易發(fā)生滑坡; 對于土地類型和NDVI,根據(jù)CF 值,當土地類型為耕地和NDVI 區(qū)間為0.2~0.3 時最有利于滑坡的發(fā)生,當?shù)貐^(qū)植被茂盛時,由于植被根系的作用,會加強邊坡穩(wěn)定性,沒有植被的地區(qū)更容易引發(fā)滑坡; 斷層距方面,滑坡主要發(fā)生在離斷層0~3200 m 區(qū)間,在斷裂帶中,巖石相對破碎,節(jié)理斷裂發(fā)育,因此更容易發(fā)生滑坡( Hong et al.,2015) 。
( 2) 圖5 中敏感性高的地區(qū)大部分集中在主要水系周圍、泥盆系和志留系的軟質巖體、以及植被相對缺乏的地帶,斜坡遭受水的沖刷,軟化和動水壓力將導致斜坡上的巖土強度下降,山谷兩側陡峭且起伏較大的斜坡,在地形的影響下容易發(fā)生滑坡。
( 1) 基于GIS 平臺分析取得的敏感性評價結果,將研究區(qū)分成高、中、低和極低敏感區(qū)4 類。CF模型、CF-LR 組合模型和CF-MLP 組合模型中高敏感區(qū)分別占研究區(qū)總面積的12.2%、11.3% 和13.8%?;赂呙舾袇^(qū)大部分集中在石大關鄉(xiāng)附近區(qū)域,沿著石大關鄉(xiāng)到疊溪鎮(zhèn)的岷江兩岸也分布少部分滑坡高敏感區(qū),石大關鄉(xiāng)應做好防災工作。
(2) 研究區(qū)滑坡災害敏感性評價結果表明高敏感區(qū)主要集中在主要水系周圍與斷層集中區(qū)域,其主要控制作用的因子是斷層、高程、水系。
(3) 利用ROC 曲線,得到CF 模型、CF-LR 組合模型和CF-MLP 組合模型的AUC 值分別為0.848、0.884 和0.867。說明CF-LR 的組合模型在該研究區(qū)的滑坡敏感性評價中效果最好。采用CF-LR 組合模型所得出的敏感性分區(qū)圖與研究區(qū)實際情況比較一致,可以為地質災害風險評價提供參考。