屈新星, 李道安, 何云玲, 余 嵐, 閆文波
(云南大學 地球科學學院, 昆明 650201)
滑坡是巖土體沿滑坡面迅速發(fā)生位移的一種過程,在巖土體變形中規(guī)模大、數(shù)量多、危害嚴重、性質(zhì)比較復雜[1]?;乱装l(fā)性,即滑坡基于當?shù)丨h(huán)境條件在一個地區(qū)發(fā)生滑坡的概率;易發(fā)性不考慮滑坡發(fā)生的時間或頻率,也不考慮預期滑坡發(fā)生的破壞程度[2]。構建科學的預測模型,即依據(jù)滑坡災害潛在區(qū)域內(nèi)各種環(huán)境要素的空間分布,預測滑坡的易發(fā)程度,可為滑坡防災減災提供科學的參考依據(jù)[3]。
目前國內(nèi)應用最為廣泛的滑坡易發(fā)性評價方法主要有兩類[4]:一類是定性分析方法,主要依靠主觀經(jīng)驗打分確定因子權重;一類是定量分析方法,通過數(shù)理統(tǒng)計建立模型。定量分析方法中的信息量模型是通過計算各個影響因素對地質(zhì)災害發(fā)生破壞所提供的信息量貢獻值,作為定量分區(qū)的指標,以信息量的大小來表示各個影響因素與地質(zhì)災害的密切程度,災害發(fā)生的概率隨信息量值的增大而變大[5-6];這種方法逐漸成為區(qū)域地質(zhì)災害預測評估的常用方法之一[7]。
國外學者主要是通過概率、二元統(tǒng)計模型、模糊邏輯、AHP(Analytic Hierarchy Process)模型、熵指數(shù)模型等進行滑坡易發(fā)性研究。如:Mokarram等[8]使用了ROC(Receiver Operating Characteristic Curve)和AUC(Area Under Curve)方法對fuzzy logic(模糊邏輯)和AHP模型產(chǎn)生的滑坡易發(fā)性進行驗證,最終fuzzy logic模型(89.7%)在研究區(qū)域(伊朗)的表現(xiàn)優(yōu)于AHP(81.1%)模型。Akgun等[9-10]利用Logistic回歸方法建立了磁化率模型對土耳其西部滑坡易發(fā)性進行評估;并通過似然—頻率比和加權線性組合模型評估土耳其東北部滑坡易發(fā)性。Pradhan等[11-12]采用了人工神經(jīng)網(wǎng)絡法、GIS和頻率比模型、多元回歸模型和模糊邏輯法對馬來西亞多地進行了滑坡易發(fā)性評估。Lee等[13]對韓國龍仁山體滑坡采用了概率和邏輯回歸模型進行研究。Pourghasemi等[14]利用GIS中的熵指數(shù)和條件概率模型進行滑坡易發(fā)性評估,并在結果中表示熵指數(shù)(AUC=86.08%)表現(xiàn)略好于條件概率(AUC=82.75%)模型。
maxEnt(maximum Entropy)模型是一個基于最大熵原理的概率模型,即在滿足已知約束的條件下,利用目標的存在分布點和環(huán)境變量,推算目標的生態(tài)需求[15];其表現(xiàn)出較好的分辨變量相互作用能力及抽樣偏差處理能力,操作運行簡單快捷,對樣本量要求較低(>5),建立了一個反映多個影響因子對目標綜合影響的評價指標,即存在概率[16]。maxEnt模型和上述以往滑坡易發(fā)性研究中常用的信息量模型、熵指數(shù)模型、概率模型在理論上有一致的共同性,但是基于maxEnt模型對滑坡易發(fā)性的研究鮮有報道。因此,本研究以攀枝花市為研究區(qū)域,基于maxEnt模型原理,結合ArcGIS空間分析模塊對其滑坡易發(fā)性進行定量預測和分析研究,以期為攀枝花市土地利用規(guī)劃和滑坡防災減災工作提供科學參考。
攀枝花市地處四川省西南部,地理位置為26°05′—27°21′N,101°08′—102°15′E;是川西南和滇西北區(qū)域的中心城市和交通樞紐,也是全國著名的重要礦區(qū);市轄東區(qū)、西區(qū)和仁和區(qū)、米易縣和鹽邊縣,總面積7 440 km2。全市屬南亞熱帶季風氣候,年降雨量800~1 100 mm,夏季受高溫高濕的西南季風影響,92%以上雨量集中于6—10月的雨季;日最低氣溫為4~8℃,日最高氣溫為19~23℃[17]。攀枝花市屬侵蝕、剝蝕中山丘陵、山原峽谷地貌,地形陡峻,強烈的地質(zhì)構造活動使巖體破碎;加之特殊的干熱河谷及旱、雨季分明的氣候環(huán)境,使巖體物理、化學風化劇烈,由此形成崩塌堆積物和松散的坡積、殘積層穩(wěn)定性差,易形成滑坡[18-19];其滑坡數(shù)量相對較多,而且發(fā)生的頻率和成災概率都很大[20],給該區(qū)的工農(nóng)業(yè)生產(chǎn)、交通運輸和人民生命財產(chǎn)造成了很大的危害。
按照前文滑坡易發(fā)性的定義,結合滑坡發(fā)生主要受河流沖刷、地下水活動、雨水浸泡、地震等自然要素,以及人工切坡等人類活動要素的影響。經(jīng)過篩選比對,最終確定高程、坡度、坡向、土地利用類型、歸一化植被指數(shù)(Normalized Difference Vegetation Index,NDVI)和人口密度6項因子作為攀枝花市滑坡易發(fā)性的評價指標。
滑坡點數(shù)據(jù)來源于2016年、2017年的全國礦山環(huán)境遙感監(jiān)測,是中國地質(zhì)調(diào)查局航空物探遙感中心項目下發(fā)的土地利用多源遙感數(shù)據(jù),分辨率最低為5 m×5 m、最高為1 m×1 m。圖1中的滑坡分布點是前期項目組通過室內(nèi)的遙感影像解譯,再經(jīng)過野外逐一實地調(diào)查驗證后得到的37個點。高程、坡度、坡向來自于美國國防部國家測繪局公布的SRTM-DEM數(shù)據(jù)。NDVI數(shù)據(jù)來自于美國國家航空航天局NASA(National Aeronautics and Space Admini-stration)的Terra遙感衛(wèi)星的MOD13Q1數(shù)據(jù)產(chǎn)品。同時通過中國科學院資源環(huán)境科學數(shù)據(jù)中心獲取土地利用類型遙感監(jiān)測數(shù)據(jù)和人口分布數(shù)據(jù)。
將所獲取的全部數(shù)據(jù)先進行地理坐標系統(tǒng)和像元大小(30 m×30 m)的統(tǒng)一;然后通過ArcGIS的3D分析模塊進行高程、坡度、坡向提取,通過ENVI 5.1軟件對NDVI進行MVC(maximum Value Composite)最大值合成平均值[21]。最后將高程、坡度、坡向、土地利用類型、人口密度和NDVI這6個影響因子數(shù)據(jù)轉(zhuǎn)化成maxEnt 3.4.1軟件所要求的ASCII格式文件,將滑坡點的地理位置轉(zhuǎn)成.csv格式文件。
圖1 攀枝花市的地理位置及主要滑坡點分布
將滑坡地理位置和各環(huán)境特征變量數(shù)據(jù)導入maxEnt 3.4.1中,隨機選取65%,70%,75%,80%,85%,90%的滑坡點數(shù)據(jù)作為訓練數(shù)據(jù)集用于建立模型,將剩余的滑坡點用于模型驗證。為了避免偶然誤差,在模型運行中選擇logistic為輸出形式,表示某個滑坡在整個模擬區(qū)域(攀枝花市)每個柵格上的存在概率(P),取值范圍為0~1,勾選隨機種子,其他參數(shù)不變,在預試驗中運行10次,目的是使模擬得到的AUC值較為穩(wěn)定(±0.001),AUC為模型自帶的受試者工作特征曲線ROC下的面積,不同的值代表模型準確度級別。通過運行模型將環(huán)境因子中貢獻率為0的因子剔除后,再重新輸入模型運行10次直至沒有貢獻率為0的影響因子出現(xiàn)。在正式試驗中將篩選后的影響因子再運行10次以得到一個穩(wěn)定的預測數(shù)值。
在建立模型和運行過程中,均采用交叉驗證的方式進行模型驗證。首先,通過模型Jackknife中的AUC評價指標對模型模擬的滑坡潛在分布點預測效果,這種AUC值的驗證是以樣本點的形式對模型進行驗證。其次,通過Kappa值從整體上檢驗模擬的準確度,即通過模型模擬完成后的研究區(qū)滑坡易發(fā)性預測圖與已發(fā)生的滑坡現(xiàn)狀點圖進行Kappa一致性檢驗。AUC值和Kappa值的評估標準見表1[22]。
表1 AUC值和Kappa值及其與模型準確性的關系
本文采用AUC標準差來判斷模型模擬值是否穩(wěn)定,在利用maxEnt處理數(shù)據(jù)過程中,每個測試百分比數(shù)據(jù)的運行處理都有很多次重復,計算出的多個AUC值的方差計算公式為:
(1)
圖2為應用maxEnt模型進行攀枝花市滑坡點潛在地理分布模擬的特征曲線,可以看出,訓練集AUC值為0.960,驗證集AUC值為0.966,適用等級均達到優(yōu)秀,表明maxEnt模型能夠準確地對滑坡點的地理分布與環(huán)境影響因子的關系進行模擬。
圖2 攀枝花市滑坡地理分布模擬結果的ROC曲線
為了研究maxEnt模型在運行中選取不同現(xiàn)狀分布點做樣本隨機訓練比率對maxEnt模型預測擬合準確度的影響,按照上文描述步驟將不同比率的AUC值采用GraphPad Prism軟件進行均方差處理得到圖3。可以發(fā)現(xiàn)AUC值雖然在隨機訓練比例80%達到最大值,但是AUC的方差值顯示當模型隨機訓練比例75%的時候方差是最小的,表明這個時候的AUC值最穩(wěn)定,模型模擬所得到的數(shù)據(jù)最精確。因此,下文的研究結果均基于隨機選取75%訓練數(shù)據(jù)比例作為模型運行的基礎。
將模型模擬結果導入到ArcGIS 10.2中,轉(zhuǎn)換成浮點型柵格數(shù)據(jù)。根據(jù)統(tǒng)計學上小概率事件不可能發(fā)生的原理,當p<0.1時,認為該柵格內(nèi)滑坡災害不可能發(fā)生;當p≥0.1時,認為該柵格內(nèi)滑坡災害可能在此柵格發(fā)生;將滑坡概率0.1~1依次按照自然斷點法進行劃分0~0.100,0.100~0.156,0.156~0.321,0.321~0.556,0.556~0.980共5段,對應易發(fā)性中極低易發(fā)生、低易發(fā)生、中易發(fā)生、高易發(fā)生和極高易發(fā)生5個等級,空間分布格局見圖4。
圖3 不同訓練比例的AUC值及AUC方差
圖4 攀枝花市滑坡易發(fā)性等級空間分布
Kappa值為整體上檢驗模擬的準確度,將模型模擬完成后的研究區(qū)滑坡易發(fā)性預測圖4中滑坡點的潛在地理空間分布,與已發(fā)生的滑坡現(xiàn)狀點圖進行Kappa一致性檢驗,結果顯示Kappa系數(shù)為0.86,基于maxEnt模型的模型結果顯示與實際滑坡災害點在空間上的分布十分吻合。從整個市域范圍來看,攀枝花市滑坡極低易發(fā)生、低易發(fā)生和中易發(fā)生的面積分別為6 381.96,311.36,380.00 km2,分別占研究區(qū)總面積的87.18%,4.25%,5.19%,高易發(fā)生和極易發(fā)生分別占總面積的2.57%,0.80%;其中高易發(fā)生和極易發(fā)生區(qū)域主要分布在人口比較密集的東區(qū)和西區(qū),部分沿著金沙江、雅礱江、巴關河、安寧河和攀枝花市主要道路兩邊而發(fā)育。此研究結果和攀枝花市人民政府在網(wǎng)上公布的部分結論和王喜娜等[20]的研究結果一致。
表2為滑坡的各影響因子的百分貢獻率和置換重要性,其中百分貢獻率是maxEnt模型在訓練過程中給出的各影響因子對滑坡地理分布的貢獻程度;置換重要性是將訓練樣點的影響因子隨機替換后進行模擬得到的maxEnt模型模擬結果的AUC值減少程度,減少值越大表明模型高度依賴于該變量。由表2可知,NDVI的貢獻百分比和置換重要性都占絕對優(yōu)勢。
表2 不同環(huán)境影響因子的貢獻百分比和置換重要性 %
為進一步分析滑坡地理分布的各個環(huán)境特征變量影響的閾值,根據(jù)maxEnt模型模擬結果得到的攀枝花市滑坡存在概率與各影響因子的關系(圖5),可以得到不同的滑坡易發(fā)性等級對應的各影響因子的閾值(表3)。從圖5,表3可知,攀枝花市滑坡易發(fā)性在高程約1 700 m以下隨著高程增加滑坡發(fā)生概率增大,而在高程1 700 m以上則表現(xiàn)為隨著高程增加滑坡發(fā)生概率減小的變化趨勢。隨著坡度增大滑坡越易發(fā)生,坡度大于12.5°表現(xiàn)為滑坡高易發(fā)生和極高易發(fā)生區(qū)。坡向和人口密度兩個因子均表現(xiàn)為隨著環(huán)境變量的增大,滑坡存在概率先增加后減少的變化趨勢;其中人口密度在110人/m2及其以上,滑坡災害等級為高易發(fā)生,主要原因為人口密度越大,周邊環(huán)境越受人類活動的影響。陽坡比陰坡更易發(fā)生滑坡,其可能原因為陽坡接受的陽光和降水相對較為充沛,巖體更易風化,形成的松散堆積物比陰坡多。滑坡易發(fā)性隨著NDVI值的增大而減小,NDVI小于0.5表現(xiàn)為滑坡高易發(fā)生區(qū);NDVI主要反映植被覆蓋狀態(tài),其值越大表明植被覆蓋度越好,表明植被覆蓋度越好,滑坡越不易發(fā)生。不同的土地利用類型對滑坡存在概率的影響表現(xiàn)不同,旱地、疏林地、其他林地、其他建設用地的易發(fā)性等級為高易發(fā)區(qū),其余為中易發(fā)區(qū)域。
注:縱坐標存在概率取值范圍為0~1,地類代碼同表3。
表3 攀枝花市滑坡地理分布不同易發(fā)等級的影響因子閾值
maxEnt模型本質(zhì)上是生物氣候包絡模型(Bioclimatic Envelope Models,BEMs)的一種,BEMs利用具有地理參考的環(huán)境變量和物種分布信息之間的相關性推斷物種的生態(tài)需求,模擬物種的地理分布,目前已被廣泛應用于解決保護生物學、生物地理學、生態(tài)學和分類學中的問題。本研究嘗試通過maxEnt模型建立環(huán)境影響因子與滑坡易發(fā)性的關系模型,模擬攀枝花市滑坡地理分布對影響因子的響應,同樣取得了較好的模擬效果,這種研究擴展了BEMs的應用范圍。
maxEnt模型的一個優(yōu)勢是可以對環(huán)境變量的重要性進行評價。NDVI和坡度貢獻率最高,表明植被覆蓋和坡度是決定攀枝花市滑坡易發(fā)性分布格局最重要的因素。坡向和高程的貢獻率最低,表明攀枝花市滑坡對坡向和高程的波動并不敏感。當然,滑坡的發(fā)生還受地震、降雨等因素的影響。在大量前期已有的文獻使用maxEnt模型時,均采用默認參數(shù)[23],在默認參數(shù)里隨機種子不參與模型的構建,這樣會導致在不同的隨機測試比例,運行10次的情況下,每次運行后結果都會一致,故在構建maxEent模型時應盡量避免選擇所有均為默認參數(shù)。最后,因數(shù)據(jù)獲取原因,只能解譯并實地驗證現(xiàn)狀37個滑坡點,雖已滿足maxEnt模型樣本量的最低需求,但在未來的研究可進一步獲取更多的樣本點以更精確地模擬滑坡易發(fā)點。
在研究中發(fā)現(xiàn)攀枝花市的滑坡沿河谷集中分布;市內(nèi)的金沙江、安寧河河谷兩岸滑坡集中分布,形成滑坡分布密集帶。除地層構造原因之外還發(fā)育著第四紀形成的沖、洪積層組成的各級階地,松散的沖、洪積層力學強度低,穩(wěn)定性差,易形成滑坡。另外,滑坡與人類工程活動關系密切,易形成滑坡分布密集帶。其余零星散落的滑坡主要是因一些自然原因,如攀枝花市為特殊的干熱河谷及旱、雨分明的氣候環(huán)境,且雨季大多暴雨;老滑坡蠕動的影響;巖體中的破碎帶或組合結構面等原因。
(1) maxEnt模型在研究區(qū)滑坡易發(fā)性方面適用性等級為優(yōu)秀(AUC=0.96),Kappa系數(shù)為0.86,以37個滑坡點為樣本數(shù)據(jù),隨機選取75%(28個)用于訓練模型,其余25%(9個)用于驗證模型,得到的AUC值最穩(wěn)定且精度最高,模型預測可信度最高。
(2) 高易發(fā)生和極易發(fā)生區(qū)分別占研究區(qū)總面積的2.57%,0.80%,主要分布在人口比較密集的東部和西部地區(qū),部分沿著金沙江、雅礱江、巴關河、安寧河和攀枝花市主要道路兩側(cè)而發(fā)育。
(3) 滑坡易發(fā)性的影響因素中,植被覆蓋和坡度是決定研究區(qū)滑坡易發(fā)性空間分布格局最重要的地理環(huán)境因子;NDVI小于0.5,坡度大于12.5°的地區(qū)表現(xiàn)為滑坡高易發(fā)生區(qū)和極高易發(fā)生區(qū)。