閆舉生 譚建民
(武漢地質(zhì)調(diào)查中心,湖北 武漢 430205)
滑坡危險(xiǎn)性分析是滑坡災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià)和管理的基礎(chǔ)工作,而易發(fā)性評(píng)價(jià)(Susceptibility Assessment)是滑坡危險(xiǎn)性分析的基礎(chǔ),是研究某一特定范圍內(nèi)的所有斜坡體與基礎(chǔ)地質(zhì)環(huán)境條件之間的相關(guān)性,并分析研究區(qū)域滑坡在相對(duì)穩(wěn)定的孕災(zāi)環(huán)境下發(fā)生可能性的大小、在何處可能發(fā)生等問(wèn)題,是對(duì)滑坡在區(qū)域空間尺度發(fā)生的可能性大小進(jìn)行定量估算的過(guò)程。目前,隨著大數(shù)據(jù)和GIS技術(shù)的飛速發(fā)展和進(jìn)步,基于GIS平臺(tái)的滑坡區(qū)域易發(fā)性評(píng)價(jià)應(yīng)用越來(lái)越多,其中的空間預(yù)測(cè)模型也不斷豐富,主要有:邏輯回歸模型[1]、人工神經(jīng)網(wǎng)絡(luò)[2]、支持向量機(jī)[3]、證據(jù)權(quán)[4]、層次分析法[5]等。在以前易發(fā)性的工作中,多是基于簡(jiǎn)單的統(tǒng)計(jì)模型進(jìn)行易發(fā)性評(píng)價(jià)。因此,本文選取了傳統(tǒng)的邏輯回歸模型(Logistic Regression)和人工智能算法的人工神經(jīng)網(wǎng)絡(luò)模型(Artificial Neural Network),并綜合考慮多類(lèi)滑坡易發(fā)性指標(biāo),通過(guò)相關(guān)性分析剔除相關(guān)性較高的因子,最后得到研究區(qū)的滑坡災(zāi)害易發(fā)性區(qū)劃圖,并利用ROC曲線(xiàn)對(duì)兩個(gè)模型的成功率進(jìn)行了評(píng)價(jià)。
B-P神經(jīng)網(wǎng)絡(luò)模型是人工神經(jīng)網(wǎng)絡(luò)模型中廣泛應(yīng)用的模型之一。假設(shè)神經(jīng)網(wǎng)絡(luò)中輸入xi,i=1,2,…,n(滑坡易發(fā)性分析中的指標(biāo)因子),ωi表示其對(duì)應(yīng)的權(quán)重(每個(gè)指標(biāo)因子的權(quán)重),表示每個(gè)輸入神經(jīng)元與輸出神經(jīng)元的連接強(qiáng)度。取其特征函數(shù)為雙曲正切函數(shù),如式(1),式(2):
(1)
(2)
式中:S——激活函數(shù),表示神經(jīng)元的輸入總和;
θ——神經(jīng)元的閾值;
y——神經(jīng)元的輸出。
邏輯回歸模型(Logistic Regression Model,LR)是滑坡易發(fā)性評(píng)價(jià)應(yīng)用最廣泛地一種數(shù)學(xué)方法。如果某一事件或現(xiàn)象,其發(fā)生的可能性或概率設(shè)為P,取值范圍為0~1,那么事件不發(fā)生的概率則為1-P。當(dāng)P的取值越接近于0或者1時(shí),P值的變化就很難捕捉,因此需要對(duì)P值進(jìn)行變換[6]。一般取P/(1-P)的自然對(duì)數(shù),即用ln(P/(1-P))對(duì)P的變化進(jìn)行量度。將P進(jìn)行Logit變換,記為L(zhǎng)ogitP,此時(shí)LogitP變化范圍就為(-∞,+∞)。若有:
LogitP=Z
(3)
(4)
其中,Z=β0+β1I1j+β2I2j+L+βnInj+ε,則代入式(4)中得:
(5)
其中,Z為事件的效用函數(shù),表達(dá)為自變量I1j,I2j,L,Inj(j為各個(gè)自變量的狀態(tài)分級(jí)序列)的線(xiàn)性組合,βn為變量Inj的估計(jì)參數(shù)。模型中βn是邏輯回歸系數(shù),ε是常數(shù)。那么:
(6)
其中,如果β是正數(shù),則eβ>1,該指標(biāo)因子與滑坡發(fā)生呈正相關(guān)關(guān)系,如果β是負(fù)數(shù),則eβ在0~1之間。
遠(yuǎn)安縣位于湖北省鄂西山區(qū),屬宜昌市轄區(qū)。地勢(shì)西高東低,范圍為東徑110°13′~111°55′,北緯30°52′~31°22′。全區(qū)縣域總面積1 752 km2,東鄰荊門(mén)市,西、西南和宜昌市夷陵區(qū)接壤,北鄰南漳、???。遠(yuǎn)安縣屬長(zhǎng)江中游亞熱帶濕潤(rùn)季風(fēng)氣候,具有氣候宜人、四季分明的特點(diǎn)??h區(qū)大的地質(zhì)構(gòu)造自西向東分別為黃陵背斜、石橋坪向斜、遠(yuǎn)安地塹和當(dāng)陽(yáng)向斜。境內(nèi)地層自前震旦系至第四系(除第三系外)均有出露,地層分布自西向東由老漸新。
遠(yuǎn)安縣地處鄂西山區(qū),在地形地貌、地層巖性、地質(zhì)構(gòu)造、水文氣象等自然環(huán)境和采礦、修路等人類(lèi)活動(dòng)作用下,縣內(nèi)滑坡、崩塌等地質(zhì)災(zāi)害廣泛發(fā)育,嚴(yán)重威脅著人類(lèi)生命財(cái)產(chǎn)安全。其中,滑坡是遠(yuǎn)安縣最主要的地質(zhì)災(zāi)害,全縣有滑坡177處,占災(zāi)害點(diǎn)總數(shù)的62.11%。
單元網(wǎng)格的劃分是否恰當(dāng),對(duì)地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)結(jié)果的可靠性影響較大,也影響著評(píng)價(jià)過(guò)程中各因素獲取的難易程度。小比例尺如1∶5萬(wàn)以下,一般采用柵格單元進(jìn)行滑坡易發(fā)性評(píng)價(jià)。結(jié)合遠(yuǎn)安縣地形地貌,以及該縣有5%的滑坡規(guī)模小于0.01×104m3,本文采用10 m×10 m分辨率的柵格作為滑坡易發(fā)性評(píng)價(jià)的基本單元,統(tǒng)計(jì)得該縣共計(jì)有17 462 719個(gè)柵格單元。
滑坡受斜坡地質(zhì)條件與環(huán)境因素共同影響,因此,本文基于收集到的資料選取了9個(gè)指標(biāo)因子:高程、坡度、坡向、地層巖性、斜坡結(jié)構(gòu)、斷層距離、水系距離、地形濕度指數(shù)、公路距離(如圖1所示)。
影響滑坡形成的各個(gè)指標(biāo)因子之間存在一定的相關(guān)性,因此,必須對(duì)因子進(jìn)行處理,以減少因子之間的疊加影響。本文利用SPSS軟件對(duì)各致災(zāi)因子進(jìn)行了相關(guān)性分析(如表1所示),相關(guān)性系數(shù)大于0.5,表明因子間相關(guān)性較強(qiáng)。高程與水系為0.54,兩者相關(guān)性較高,為確定該剔除某個(gè)因子,通過(guò)其他因子間的相關(guān)性確定除坡度和高程的相關(guān)性系數(shù)為0.31外,其他因子間的相關(guān)性系數(shù)均小于0.3,確定在該研究區(qū),若相關(guān)性系數(shù)大于0.3,則排除共同相關(guān)的因子。故在滑坡易發(fā)性評(píng)價(jià)的指標(biāo)中去除高程,選擇剩下的8類(lèi)指標(biāo)因子。
表1 指標(biāo)因子相關(guān)性分析表
利用SPSS Modeler軟件內(nèi)置的人工神經(jīng)網(wǎng)絡(luò)模塊,將提取的數(shù)據(jù)導(dǎo)入軟件,神經(jīng)網(wǎng)絡(luò)模型設(shè)置為多層傳感器,終止規(guī)則為是否能進(jìn)一步降低誤差。運(yùn)行軟件得到兩層神經(jīng)網(wǎng)絡(luò)模型,隱藏層有12個(gè)神經(jīng)元。
將模型計(jì)算得到的每個(gè)柵格的滑坡易發(fā)性指數(shù)值導(dǎo)入ArcGIS,然后利用自然斷點(diǎn)分級(jí)法,進(jìn)行滑坡易發(fā)性的劃分,將研究區(qū)分為5個(gè)等級(jí),從而得到基于人工神經(jīng)網(wǎng)絡(luò)的滑坡易發(fā)性區(qū)劃圖(見(jiàn)圖2a))。
利用ArcGIS柵格轉(zhuǎn)點(diǎn)工具,提取出各個(gè)指標(biāo)因子每個(gè)柵格值,得到17 462 719×9的數(shù)據(jù)矩陣,其中包含57 311個(gè)滑坡點(diǎn),加上隨機(jī)提取的等量非滑坡點(diǎn),得到114 622×9的數(shù)據(jù)矩陣作為樣本數(shù)據(jù)。將數(shù)據(jù){Y,X1j,…,X8j}導(dǎo)入SPSS Modeler數(shù)據(jù)處理軟件得到邏輯回歸方程為:
Y=-0.04X1j+0.024X2j+0.057X3j-0.121X4j+
0.345X5j-0.489X6j-0.40X7j-0.583X8j+1.324
(7)
其中,Y為滑坡易發(fā)性指數(shù);X1j,…,X8j均為自變量,即各致災(zāi)指標(biāo)因子。
將該回歸方程代入總數(shù)據(jù)矩陣中計(jì)算得到每個(gè)柵格點(diǎn)的易發(fā)性指數(shù),進(jìn)行歸一化處理。利用自然斷點(diǎn)分級(jí)法,將易發(fā)性指數(shù)分為5個(gè)等級(jí),從而得到基于邏輯回歸的滑坡易發(fā)性分布圖(見(jiàn)圖2b))。
根據(jù)基于人工神經(jīng)網(wǎng)絡(luò)模型和邏輯回歸的滑坡易發(fā)性評(píng)價(jià)區(qū)劃圖,可以得到,雖然兩個(gè)模型的結(jié)果存在一定的差異,但區(qū)劃結(jié)果的基本趨勢(shì)相同。研究區(qū)極高易發(fā)區(qū)和高易發(fā)區(qū)主要分布在東部軟硬相間的碎屑巖地區(qū),極低易發(fā)區(qū)主要為中部地勢(shì)平坦的區(qū)域,滑坡發(fā)生的可能性較小。西部地勢(shì)相對(duì)復(fù)雜,在水系、構(gòu)造發(fā)育,地層巖性為軟硬相間的碎屑巖類(lèi)的區(qū)域分布有極高和高易發(fā)區(qū),而在相對(duì)平坦,水系、構(gòu)造相對(duì)不發(fā)育,出露其他巖性的地區(qū),則主要為極低、低和中易發(fā)區(qū)。
為了評(píng)價(jià)兩個(gè)模型在滑坡易發(fā)性評(píng)價(jià)中的精度,本文采用了ROC曲線(xiàn)對(duì)評(píng)價(jià)結(jié)果進(jìn)行成功率分析,在滑坡易發(fā)性評(píng)價(jià)中ROC曲線(xiàn)即易發(fā)區(qū)面積百分比累加與實(shí)際滑坡面積百分比累加形成的曲線(xiàn)[7](如圖3所示)。其中,AUC值為曲線(xiàn)下的面積,代表了成功率的大小。AUC值越接近于1,代表該模型的預(yù)測(cè)成功率越高,預(yù)測(cè)效果越好。根據(jù)圖3可以得到,ANN模型和LR模型的AUC值分別為0.864和0.809,說(shuō)明人工神經(jīng)網(wǎng)絡(luò)模型在該研究區(qū)具有更好的預(yù)測(cè)能力。
本文在通過(guò)實(shí)地調(diào)查收集到大量數(shù)據(jù)的基礎(chǔ)下,利用人工神經(jīng)模型和邏輯回歸模型對(duì)湖北遠(yuǎn)安縣進(jìn)行了滑坡易發(fā)性評(píng)價(jià),得到了以下主要結(jié)論:
1)研究區(qū)因子間相關(guān)性系數(shù)大于0.3的因子,應(yīng)排除共同相關(guān)性較高的因子。
2)根據(jù)易發(fā)性區(qū)劃圖得到,極高和高易發(fā)區(qū)主要分布在研究區(qū)東部軟硬相間的碎屑巖地區(qū);研究區(qū)中部地勢(shì)相對(duì)較為平坦,主要為極低和低易發(fā)區(qū);研究區(qū)西部地質(zhì)環(huán)境復(fù)雜,從極低到極高易發(fā)區(qū)均有分布,但極高和高易發(fā)區(qū)主要分布在地層巖性為軟硬相間的碎屑巖類(lèi),以及近水系和斷層的區(qū)域。結(jié)果與歷史滑坡災(zāi)害點(diǎn)分布相對(duì)一致。
3)利用ROC曲線(xiàn),得到人工神經(jīng)網(wǎng)絡(luò)和邏輯回歸模型的AUC值分別為0.864和0.809,說(shuō)明人工神經(jīng)網(wǎng)絡(luò)模型在該研究區(qū)的預(yù)測(cè)能力更好。相對(duì)于較為原始的邏輯回歸型的機(jī)器學(xué)習(xí)模型,更為現(xiàn)代化的神經(jīng)網(wǎng)絡(luò)型的人工智能模型具有更好的預(yù)測(cè)能力。