劉璐瑤,高惠瑛**,李 照
(1.中國海洋大學(xué)工程學(xué)院,山東 青島 266100;2.中國海洋大學(xué)城市與工程管理信息化山東高校重點(diǎn)實(shí)驗(yàn)室,山東 青島 266100)
中國地質(zhì)環(huán)境脆弱、地理?xiàng)l件復(fù)雜,是地質(zhì)災(zāi)害多發(fā)的國家之一?;聻?zāi)害作為主要的地質(zhì)災(zāi)害之一,具有分布范圍廣、發(fā)生頻率高、災(zāi)害損失嚴(yán)重等特點(diǎn)。浙江省永嘉縣具有獨(dú)特的地形地貌條件、水文地質(zhì)環(huán)境以及地理位置,在降雨因素的誘發(fā)下,極易發(fā)生滑坡災(zāi)害,僅在2019年8月10日利奇馬臺風(fēng)期間,發(fā)生的山體滑坡就造成了27人死亡,5人失聯(lián)的嚴(yán)重人員傷亡。故在研究該地區(qū)孕災(zāi)環(huán)境的基礎(chǔ)上,開展滑坡易發(fā)性評價對當(dāng)?shù)胤罏?zāi)減災(zāi)、土地利用規(guī)劃具有十分重要的參考價值[1]。
近年來,隨著地理信息系統(tǒng)的發(fā)展,區(qū)域地質(zhì)災(zāi)害評價模型日漸完善,從過去的直接地形地貌地質(zhì)制圖、基于專家經(jīng)驗(yàn)定性分析發(fā)展到現(xiàn)在的統(tǒng)計模型及機(jī)器學(xué)習(xí)的定量分析[2]。目前,常用的滑坡易發(fā)性評價模型主要有:層次分析法、信息量模型、Logistic回歸模型、證據(jù)權(quán)模型、確定性系數(shù)模型、決策樹、隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等[3-4]。國外學(xué)者,Guillard C等[5]對葡萄牙盧爾斯市進(jìn)行了滑坡災(zāi)害易發(fā)性評估研究,基于GIS數(shù)據(jù)庫,以柵格單元為基礎(chǔ),采用基于統(tǒng)計分析的信息量法對特定的地形單元進(jìn)行了滑坡易發(fā)性評估。Zhang K等[6]將機(jī)器學(xué)習(xí)與遙感和GIS技術(shù)結(jié)合,基于地形、地質(zhì)、水文、土地覆蓋與環(huán)境觸發(fā)因素,采用隨機(jī)森林模型對三峽地區(qū)進(jìn)行滑坡災(zāi)害易發(fā)性制圖,并與決策樹模型的評價結(jié)果進(jìn)行比較,結(jié)果表明,隨機(jī)森林具有更高的精確度,其評價結(jié)果與實(shí)際情況更加吻合。Bahareh 等[7]采用坡度、坡向、高程、曲率、地形濕度指數(shù)、距河流的距離、距斷層的距離、土地利用、巖性等因子,利用支持向量機(jī)、邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)方法對伊朗馬贊達(dá)蘭省薩里縣多丹格河流域的滑坡易發(fā)性進(jìn)行了分析,分析表明,邏輯回歸模型對多丹格河流域的滑坡易發(fā)性分析的精度比支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)的精度高。國內(nèi)學(xué)者,沈玲玲等[8]用Shannon熵對信息量模型進(jìn)行改進(jìn),并與模糊邏輯模型進(jìn)行比較,對甘肅岷縣地震滑坡進(jìn)行了易發(fā)性研究評價。武雪玲等[9]通過融合多源數(shù)據(jù)以選取孕災(zāi)環(huán)境與誘發(fā)因子為評價指標(biāo),采用PSO-SVM模型,定性預(yù)測滑坡易發(fā)性,并通過對網(wǎng)格單元與對象單元的易發(fā)性預(yù)測精度進(jìn)行分類精度比較,得到與野外調(diào)查一致的預(yù)測結(jié)果。
確定性系數(shù)模型原理簡單、操作性強(qiáng)、易于實(shí)現(xiàn),能夠進(jìn)行一級評價因子各分類級別對滑坡災(zāi)害的影響大小的評價,故可進(jìn)行影響因素的內(nèi)部比較[2-3];Logistic回歸模型能夠根據(jù)不同因子與災(zāi)害點(diǎn)之間的關(guān)系,確定各因子的權(quán)重。二者的耦合模型解決指標(biāo)因子權(quán)重確定及不同因子分類級別的權(quán)重計算問題,以實(shí)現(xiàn)各評價單元滑坡易發(fā)性概率的計算[10]。故本文采用確定性系數(shù)與Logistic回歸耦合模型,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地質(zhì)巖性與NDVI八個評價因子開展永嘉縣滑坡災(zāi)害易發(fā)性評價,制作其易發(fā)性區(qū)劃圖,為當(dāng)?shù)胤罏?zāi)減災(zāi)工作提供參考。
永嘉縣位于浙江省東南部,地理坐標(biāo)為東經(jīng)120°19′34″—120°59′19″,北緯28°01′08″—28°36′54″,總面積為2 674.3 km2(見圖1)。該地區(qū)屬亞熱帶季風(fēng)氣候,四季分明,雨量充沛,雨熱同步,年均氣溫19.6 ℃,多年平均降雨量為1 743.9 mm。其中,楠溪江是貫穿全縣的水系,流域總面積達(dá)2 489.97 km2??h域內(nèi)地勢南低北高,分布有中山、低山、丘陵及河谷平原四種地貌。境內(nèi)NE向、NW向斷裂最為發(fā)育,如NE向溫州—鎮(zhèn)海大斷裂、永嘉—黃巖大斷裂,NW向淳安—溫州斷裂[11]。區(qū)內(nèi)巖脈發(fā)育,斷裂分布,巖石破碎;出露的地層以早白堊世和晚侏羅世的火山巖、火山沉積巖為主;第四紀(jì)的沖積物、洪積物主要分布在河流兩岸及溝谷地帶;局部出露小范圍的早二疊世變質(zhì)巖——芝溪頭雜巖。同時,該區(qū)位于亞熱帶常綠闊葉林區(qū),分布多為次生林及人工幼林,森林覆蓋率約為77.27%[11]。
圖1 研究區(qū)概況圖Fig.1 Overview of the study area
永嘉縣主要發(fā)育有滑坡、崩塌、泥石流及斜坡等地質(zhì)災(zāi)害。從地域上看,整個研究區(qū)均分布有地質(zhì)災(zāi)害,且分布密度自北向南逐漸增大[11];從地形上看,主要分布在海拔較低、坡度較緩的縣域南部地區(qū);從水文地質(zhì)環(huán)境上看,歷史災(zāi)害點(diǎn)主要分布在河流沿岸的斷層密集區(qū)。由此可見,頻繁的人類工程活動、軟弱的地質(zhì)巖組及河流切坡均可能導(dǎo)致滑坡災(zāi)害發(fā)生,造成嚴(yán)重的災(zāi)情事故,威脅人民生命與財產(chǎn)安全[12]。
本次研究的基礎(chǔ)數(shù)據(jù)主要來源于遙感、規(guī)劃與統(tǒng)計三個方面[13],其中滑坡歷史災(zāi)害點(diǎn)的數(shù)據(jù)來源于中國科學(xué)院資源環(huán)境科學(xué)數(shù)據(jù)中心,共包含203個災(zāi)害點(diǎn)數(shù)據(jù)?;乱装l(fā)性評價指標(biāo)因子的基礎(chǔ)數(shù)據(jù)有永嘉縣DEM(Digital Elevation Model,數(shù)字高程模型,簡稱DEM)數(shù)據(jù)、地質(zhì)數(shù)據(jù)、水文交通和歸一化植被指數(shù)(Normalized Difference Vegetation Index,簡稱NDVI)數(shù)據(jù)4類,主要來源見表1。
表1 數(shù)據(jù)來源Table 1 Sources of data
指標(biāo)因子的選取需與滑坡災(zāi)害的發(fā)生有密切關(guān)系[14],故對浙江永嘉縣的滑坡災(zāi)害發(fā)育特征及時空分布規(guī)律進(jìn)行分析,選擇合適的孕災(zāi)環(huán)境因子作為滑坡易發(fā)性評價的指標(biāo)因子。
通過研究發(fā)現(xiàn):不同的高程范圍內(nèi),植被覆蓋率、降雨量及人類工程活動強(qiáng)度均具有明顯差異性,直接或間接地影響著滑坡災(zāi)害的發(fā)生[14-15];坡度的大小則影響著地表松散巖土體發(fā)生位移形成滑坡災(zāi)害的可能性,影響著坡體應(yīng)力分布、地表徑流及地下水補(bǔ)給、排泄等情況[2,12];不同的坡向,植被類型、覆蓋率、降雨量、蒸發(fā)量的大小的不同,影響著斜坡體的穩(wěn)定性[12,14-15]。河流對斜坡坡腳的沖刷、掏蝕,改變了坡體的形態(tài)結(jié)構(gòu),使得邊坡的臨空面增大,為滑坡的發(fā)生提供了誘發(fā)條件[12,14-15];道路交通是研究區(qū)內(nèi)最具代表性的人類工程活動,道路的修建通過切坡、開挖邊坡實(shí)現(xiàn),這改變了坡體的應(yīng)力狀態(tài),使得邊坡臨空面積增大,加劇了滑坡發(fā)生可能[16]。斷層導(dǎo)致了巖體破碎,致使邊坡自穩(wěn)性下降,形成了有利于滑坡災(zāi)害形成和發(fā)育的構(gòu)造條件;出露的地層為滑坡的發(fā)生提供了物質(zhì)基礎(chǔ)[17],不同性質(zhì)的巖石堅硬程度不同、抗剪能力不同,對于滑坡失穩(wěn)變形的影響不同,對滑坡的影響程度也不同[2,15]。與此同時,越來越多的學(xué)者把歸一化植被指數(shù)(NDVI)看作用來描述土地覆蓋類型特征影響滑坡災(zāi)害發(fā)生的一個指標(biāo)因子[2],不同的植被覆蓋率下,人類活動密集程度、地表蒸發(fā)量、植被根莖根固程度有所不同,對滑坡災(zāi)害的影響程度不同[16]。
根據(jù)以上分析,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地層巖性、NDVI八個評價因子構(gòu)成本次滑坡易發(fā)性評價的指標(biāo)體系。為進(jìn)一步研究各評價因子對滑坡發(fā)生的影響,在前人的研究基礎(chǔ)上,根據(jù)滑坡發(fā)生的特點(diǎn)和分布規(guī)律[1],且結(jié)合研究尺度和研究區(qū)的實(shí)際情況[2],對各因子進(jìn)行分級處理(見圖2)。
圖2 評價因子分級圖Fig.2 Classification maps of assessment factors
本文對浙江省永嘉縣開展滑坡易發(fā)性評價,基于上節(jié)對各評價因子的分類級別處理,首先采用確定性系數(shù)模型計算出各評價因子各分類級別的權(quán)重值,即CF值。然后各因子分類級別的CF值作為自變量,將是否發(fā)生滑坡災(zāi)害(“1”代表滑坡災(zāi)害發(fā)生,“0”表示滑坡災(zāi)害未發(fā)生)作為因變量[18],導(dǎo)入SPSS 25.0軟件中進(jìn)行二元Logistic回歸分析,以得到各評價因子的回歸系數(shù)即因子之間的權(quán)重?;贕IS平臺計算得到各評價單元的滑坡發(fā)生概率,最終運(yùn)用自然間斷點(diǎn)法實(shí)現(xiàn)研究區(qū)滑坡災(zāi)害易發(fā)性區(qū)劃[1,18]。本文選取的基本柵格單元大小為30 m×30 m,對各評價因子?xùn)鸥駡D層進(jìn)行重采樣[19],與之匹配進(jìn)行分析。
(1)評價因子各分類級別CF值計算
通過對各個評價因子進(jìn)行分類級別處理,與203個歷史滑坡災(zāi)害點(diǎn)進(jìn)行疊加處理,分析滑坡災(zāi)害點(diǎn)在各評價因子不同分類級別中的分布情況,根據(jù)下式:
(1)
計算出評價因子各分類級別的CF值,即權(quán)重值。該權(quán)重可實(shí)現(xiàn)評價因子內(nèi)部各分類級別之間的重要性比較,也可實(shí)現(xiàn)不同評價因子各分類級別之間的比較[2,10]。評價因子各分類級別的CF值見表2。
表2 各評價因子分類級別的CF值Table 2 Values of CF for different classes of assessment factors
(2)評價因子權(quán)重值的計算
本文采用的評價單元為30 m×30 m的柵格單元,通過GIS的重采樣功能[15],共計得到2 976 478個獨(dú)立的評價單元。隨機(jī)選取203個非災(zāi)害點(diǎn),與同等數(shù)量的歷史災(zāi)害點(diǎn)構(gòu)成永嘉縣滑坡災(zāi)害易發(fā)性評價的統(tǒng)計樣本。其中,406個樣本點(diǎn)8個評價因子的CF值為自變量,滑坡發(fā)生與否為因變量(“1”代表滑坡災(zāi)害發(fā)生,“0”代表滑坡災(zāi)害未發(fā)生)[18]。運(yùn)用GIS的多值提取至點(diǎn)功能,依次提取各樣本點(diǎn)的CF值,并將提取的樣本值導(dǎo)入至SPSS 25.0中進(jìn)行二元Logistic回歸分析,結(jié)果見表3。
表3 Logistic回歸分析結(jié)果Table 3 Results of logistic regression analysis
在滑坡災(zāi)害易發(fā)性評價過程中,回歸系數(shù)B代表各指標(biāo)因子的權(quán)重[2,18],每個變量在方程的重要性可以通過比較sig值(顯著性)的大小來判斷,當(dāng)sig<0.05時,變量具有統(tǒng)計意義[20]?;貧w結(jié)果顯示,高程、坡度、坡向等8個評價因子的sig均小于0.05,說明8個指標(biāo)因子的回歸系數(shù)在誤差允許的范圍內(nèi)是準(zhǔn)確的,耦合模型得到的各因子權(quán)重由大到小分別是:距斷層距離、坡度、高程、坡向、NDVI、地層巖組、距河流距離和距道路距離。
(3)各因子獨(dú)立性檢驗(yàn)
變量之間存在高度相關(guān)性會使模型估計失真或難以估計準(zhǔn)確[10],故為使所選的評價因子更加合理,需要對各因子進(jìn)行獨(dú)立性檢驗(yàn),剔除相關(guān)性較大的評價因子[2]。各評價因子的相關(guān)系數(shù)矩陣見表4。
表4 評價因子相關(guān)系數(shù)矩陣Table 4 Correlation matrix of assessment factors
由表4可知,各評價因子之間的相關(guān)系數(shù)均小于0.3,根據(jù)胡燕等對相關(guān)性大小的劃分標(biāo)準(zhǔn)[21],相關(guān)性系數(shù)小于0.3時,所選因子之間的相關(guān)性較小,故8個評價因子均可進(jìn)入模型。
(4)易發(fā)性評價計算與區(qū)劃
根據(jù)計算所得的各因子回歸系數(shù),結(jié)合Logistic回歸公式,可得下式:
(2)
式中:P為滑坡災(zāi)害發(fā)生的概率值,x1~x8為各評價因子的CF值。根據(jù)式(2),利用GIS的柵格計算功能[1,4],得到每個評價單元的滑坡發(fā)生概率P,采用自然間斷點(diǎn)分級法[1,18],將研究區(qū)易發(fā)性劃分為極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)、極低易發(fā)區(qū)5類,見圖3。
圖3 研究區(qū)滑坡易發(fā)性分區(qū)圖Fig.3 Landslide susceptibility map of study area
根據(jù)確定性系數(shù)模型與Logistic回歸模型的計算過程及研究區(qū)易發(fā)性分區(qū)圖,可以得出:
(1)從各評價因子的回歸系數(shù)及各分類級別的CF值,可以看出:滑坡災(zāi)害主要發(fā)生在高程0~100 m,坡度5°~10°,距河流和道路距離400 m內(nèi)的區(qū)域,該區(qū)域地勢平緩、人類工程活動密切,受河流沖刷、掏蝕及道路開挖、開鑿的影響,使得斜坡的臨界面大大增加,滑坡災(zāi)害易發(fā)性明顯提高。同時,斷層的密集分布與軟弱的芝溪頭雜巖、高塢組等為滑坡災(zāi)害的發(fā)生提供了豐富的物質(zhì)來源與充足的物質(zhì)基礎(chǔ)。
(2)從永嘉縣的易發(fā)性分區(qū)圖,可以看出:極高易發(fā)區(qū)與極高易發(fā)區(qū)主要分布在永嘉縣的南部地區(qū),并沿河流和道路向北分布,約占縣域面積的28%;極低易發(fā)區(qū)和低易發(fā)區(qū)主要分布在縣域地北部區(qū)域,該區(qū)域海拔高、坡度陡,人類工程活動稀少,約占研究區(qū)總面積的55%。
本文采用歷史滑坡點(diǎn)落在各等級易發(fā)區(qū)的比例對易發(fā)性分區(qū)的合理性進(jìn)行檢驗(yàn)[2,12],采用受試者工作特征曲線(Receiver Operating Characteristic Curve,ROC)對模型評價精度進(jìn)行檢驗(yàn)[2-3,12]。
將歷史滑坡點(diǎn)與易發(fā)性分區(qū)結(jié)果進(jìn)行疊加分析[2-3],得到分析結(jié)果,見表5。檢驗(yàn)結(jié)果顯示,有74.88%的歷史滑坡點(diǎn)落在極高易發(fā)區(qū)和高易發(fā)區(qū)的范圍內(nèi),而二者的柵格數(shù)量占總柵格數(shù)量的28.03%;分別有4.93%和5.42%的歷史滑坡點(diǎn)落在占研究區(qū)總柵格數(shù)量32.41%和22.59%的極低易發(fā)區(qū)和低易發(fā)區(qū)內(nèi);且隨著易發(fā)性由低到高,柵格比逐漸減小,滑坡比與頻率比均逐步增加,這均符合實(shí)際情況,由此說明易發(fā)性區(qū)劃結(jié)果是合理的[2]。若用歷史滑坡點(diǎn)落在較高易發(fā)區(qū)域內(nèi)的比例表征精度[12],則本研究的預(yù)測精度達(dá)74.88%。
表5 耦合模型易發(fā)性分區(qū)結(jié)果Table 5 Susceptibility zoning results of coupling model
再進(jìn)一步采用ROC曲線對耦合模型的評價精度進(jìn)行檢驗(yàn)。以滑坡災(zāi)害單元被正確預(yù)測的比例(真陽性率,也稱敏感度)為縱坐標(biāo),以未發(fā)生滑坡單元被正確預(yù)測的比例(假陽性率,也稱1-特異性)為橫坐標(biāo)繪制曲線[2-3],ROC曲線越靠近左上角,曲線下的面積(Area Under the Curve,AUC)越大,模型的準(zhǔn)確率越高[1,3]。耦合模型的ROC曲線如圖4所示,AUC值為0.814,說明確定性系數(shù)與Logistic回歸耦合模型能夠較為準(zhǔn)確客觀地對浙江省永嘉縣滑坡易發(fā)性進(jìn)行評價。
圖4 耦合模型的ROC曲線Fig.4 ROC curve of coupling model
(1)本文采用了確定性系數(shù)和Logistic回歸耦合模型對浙江省永嘉縣開展了滑坡易發(fā)性評價。確定性系數(shù)模型通過計算評價因子各分類級別的CF值,客觀地揭示了評價因子各分類級別與滑坡災(zāi)害發(fā)育的關(guān)系,避免了人為主觀的不合理賦值情況;Logistic回歸模型通過計算各評價因子間的權(quán)重,客觀地揭示了不同評價因子對滑坡作用的影響程度差異。二者的耦合模型實(shí)現(xiàn)了各因子權(quán)重和各因子分類級別權(quán)重的客觀計算,避免了主觀因素對權(quán)重評估的干擾。
(2)基于前人研究成果,從地形地貌、地質(zhì)構(gòu)造、水文交通、其他因子等方面,選取高程、坡度、坡向、距水系距離、距道路距離、距斷層距離、地層巖組及NDVI 8個評價因子,采用了確定性系數(shù)與Logistic回歸耦合模型,對永嘉縣開展滑坡易發(fā)性區(qū)劃研究。其中,距斷層距離、坡度、高程、坡向、NDVI這5個因子對研究區(qū)滑坡易發(fā)性影響相對較大。
(3)根據(jù)耦合模型下滑坡易發(fā)性區(qū)劃結(jié)果,將研究區(qū)劃分為極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)和極低易發(fā)區(qū)。并將滑坡點(diǎn)與分區(qū)圖疊加分析,發(fā)現(xiàn)分區(qū)圖與研究區(qū)實(shí)際情況較為一致。其中極高易發(fā)區(qū)和高易發(fā)區(qū)主要分布在縣域南部,并沿河流、道路、斷層相對發(fā)育;極低易發(fā)區(qū)和低易發(fā)區(qū)主要分布在研究區(qū)北部海拔高、坡度陡峭的區(qū)域。
(4)通過采用歷史滑坡點(diǎn)落在各易發(fā)性分區(qū)的比例與ROC曲線分別對分區(qū)結(jié)果合理性和耦合模型評價精度進(jìn)行了檢驗(yàn)。有74.88%的滑坡點(diǎn)落在極高易發(fā)區(qū)和高易發(fā)區(qū)范圍內(nèi),且ROC曲線的AUC值達(dá)到為0.814,說明分區(qū)結(jié)果合理,模型評價精度較高。由此可知,確定性系數(shù)和Logistic回歸耦合模型能夠客觀準(zhǔn)確地實(shí)現(xiàn)永嘉縣滑坡災(zāi)害易發(fā)性評價,且能在滑坡易發(fā)性及其風(fēng)險評價工作中起到一定的作用。