王衛(wèi)東,劉攀,龔陸
?
基于支持向量機(jī)模型的四川省滑坡災(zāi)害易發(fā)性區(qū)劃
王衛(wèi)東,劉攀,龔陸
(中南大學(xué)土木工程學(xué)院,湖南 長沙 410004)
以四川省為研究區(qū),結(jié)合野外調(diào)查情況和主成分分析法,選擇與構(gòu)造線距離、高程、與河流距離、地貌類型、巖性、年均降雨量和坡度等7個滑坡致災(zāi)因子,并基于頻率比模型構(gòu)建滑坡致災(zāi)因子評價體系,引入支持向量機(jī)模型編制研究區(qū)滑坡易發(fā)性區(qū)劃圖。研究結(jié)果表明:四川省被劃分為低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)和極高易發(fā)區(qū)4個區(qū)域,各區(qū)面積占研究區(qū)比例分別為41.77%,31.19%,17.20%和10.84%,高易發(fā)區(qū)和極高易發(fā)區(qū)主要位于四川省的南部和中東部,且發(fā)生滑坡數(shù)量占總數(shù)的79.14%。研究成果不僅為基礎(chǔ)設(shè)施建設(shè)、防災(zāi)減災(zāi)工作提供科學(xué)依據(jù),還為其他地區(qū)滑坡易發(fā)性評價提供參考。
滑坡;易發(fā)性區(qū)劃;支持向量機(jī);主成分分析;頻率比模型
我國地域面積遼闊,地形條件、地貌類型多種多樣,山區(qū)面積(包括丘陵和高原)幾乎占了國土面積的70%,孕育大量地質(zhì)災(zāi)害。根據(jù)中國統(tǒng)計年鑒,2013~2017年共發(fā)生地質(zhì)災(zāi)害53 184起,其中滑坡的數(shù)量占了總數(shù)70%以上,可見滑坡是我國發(fā)生頻率最高的地質(zhì)災(zāi)害,給人民群眾的生命財產(chǎn)帶來嚴(yán)重威脅,科學(xué)準(zhǔn)確的開展滑坡易發(fā)性評價,對災(zāi)害預(yù)警、風(fēng)險管理都具有重要意義[1]。國內(nèi)外關(guān)于滑坡易發(fā)性區(qū)劃已經(jīng)有較長的研究歷史。研究方法大致可分為定性和定量方法,定性方法主要依靠專家主觀經(jīng)驗來對滑坡進(jìn)行定性描述,例如:層次分析法(Biplab等[2]),模糊數(shù)學(xué)法(Giovanni等[3])等,定量的方法主要采用統(tǒng)計學(xué)或者神經(jīng)網(wǎng)絡(luò)等把滑坡災(zāi)害轉(zhuǎn)換成定量計算,例如:邏輯回歸法(YANG 等[4?5]),BP神經(jīng)網(wǎng)絡(luò)(Aditian等[6?7]),支持向量機(jī)(HUANG[8])等。除了研究方法以外,滑坡致災(zāi)因子的選擇也非常重要,與易發(fā)性區(qū)劃結(jié)果直接相關(guān)。滑坡的影響因素互相依存、互相影響,目前對于滑坡致災(zāi)因子的選擇和分級主要依靠文獻(xiàn)調(diào)研和經(jīng)驗總結(jié)。本文以四川省為研究對象,在研究參考文獻(xiàn)[9?10]的基礎(chǔ)上并結(jié)合四川省實際情況,初選10個滑坡致災(zāi)因子,并基于主成分分析法(PCA)予以篩選,引入頻率比模型構(gòu)建四川省滑坡致災(zāi)因子體系,并利用支持向量機(jī)模型,編制四川省滑坡災(zāi)害易發(fā)性區(qū)劃圖。
四川省位于我國西南部,東經(jīng)97°21′~108°31′,北緯26°03′~34°19′之間,轄區(qū)面積48.6萬km2,東西向長1 075 km,南北向長921 km。四川省位于青藏高原與長江中下游之間的過渡地帶,全省地形地貌復(fù)雜,地層發(fā)育完全,地質(zhì)構(gòu)造作用強(qiáng)烈,山地廣布,地勢西高東低,高差相差懸殊,故東西部氣候有著明顯差異。降水量也由東南向西北逐漸減少,其中降水最多的四川盆地年均降水量達(dá)到745~1 732.4 mm,省內(nèi)水資源豐富,河流眾多,下切作用強(qiáng)烈,同時境內(nèi)工程活動數(shù)量多、規(guī)模大。復(fù)雜自然條件導(dǎo)致四川省成為我國地質(zhì)災(zāi)害發(fā)生最為嚴(yán)重的省份之一,本文統(tǒng)計了中國科學(xué)院成都山地所提供的歷史滑坡災(zāi)點數(shù)據(jù)(圖1)。
圖1 歷史滑坡災(zāi)點
影響滑坡的因素較多,按其對滑坡的影響方式可以分為內(nèi)在因素和外在因素,內(nèi)在因素包括地形地貌、高程、坡度、坡向等從本質(zhì)上孕育滑坡的因子,外在因素包括人類工程活動、強(qiáng)降雨等外界誘發(fā)滑坡的條件。本文初步選取了高程、與構(gòu)造線距離、與河流距離、地貌類型、巖性、年均降雨量、坡度、坡向、與鐵路距離、與公路距離等10個致災(zāi)因子。
采用主成分分析法[11](PCA)對上述致災(zāi)因子進(jìn)行篩選。PCA的主要思想是用較少的變量去解釋原數(shù)據(jù)中大部分變量,尋找原始數(shù)據(jù)中相互獨立或者不相關(guān)變量,從而得到對滑坡災(zāi)害貢獻(xiàn)較大的致災(zāi)因子。經(jīng)過主成分分析,得到研究區(qū)域的高程、與構(gòu)造線距離、與河流距離、地貌類型、巖性、年均降雨量和坡度等7個主要致災(zāi)因子(表1),這7個致災(zāi)因子累計貢獻(xiàn)率之和達(dá)到了86.397%。各致災(zāi)因子的二級因子分級如圖2~8所示。
表1 致災(zāi)因子主成分分析表
7個致災(zāi)因子中有定性指標(biāo),也有定量指標(biāo),且量綱也不一致,為了方便對致災(zāi)因子計算以及清晰的反映其二級因子對滑坡易發(fā)性的影響程度,本文以頻率比模型[12]統(tǒng)一致災(zāi)因子量綱,得到表2。
式中:Fij是各二級因子區(qū)域內(nèi)的歷史滑坡集中度;Nij是第i個因子第j個二級因子區(qū)域內(nèi)歷史滑坡個數(shù);N是研究區(qū)歷史滑坡總個數(shù);Sij是第i個因子第j個二級因子區(qū)域面積;S是研究區(qū)總面積。
圖3 高程
圖4 與河流距離
圖5 地貌類型
圖6 巖性
圖7 年平均降雨
圖8 坡度
表2 致災(zāi)因子各二級因子指標(biāo)值表
地貌類型臺地608 707.422.172 40.365 1 大起伏山地721248 540.570.913 00.153 4 中起伏山地42386 615.851.542 70.259 3 小起伏山地286109 018.810.818 60.137 6 平原4931 211.70.503 70.084 6 巖性易滑巖組37298 231.921.196 40.319 3 較易滑巖組217123 406.10.566 70.151 3 偶滑巖組797174 036.11.448 20.386 5 穩(wěn)定巖組15391 091.710.535 20.142 9 年均降雨量/mm<400353 368.540.031 50.008 6 400~800185175 337.870.346 30.094 0 800~1 2001112127 992.472.739 10.743 6 >1 200235130 182.870.566 70.153 8 坡度/(°)<27735 954.690.661 20.179 5 2~12349132 935.760.818 60.222 2 12~24578152 418.861.196 40.324 8 >24535165 502.681.007 50.273 5
支持向量機(jī)(SVM)是Vapnik等[13]于1995年提出的一種新的機(jī)器學(xué)習(xí)方法,其主要思想是通過一個非線性映射,把非線性可分的數(shù)據(jù)映射到高維特征空間,并在此特征空間尋找最優(yōu)分類超平面,將2類數(shù)據(jù)點高效分類。
運用SVM模型對四川省進(jìn)行易發(fā)性區(qū)劃研究主要步驟如下:本文采用1 000 m×1 000 m網(wǎng)格將研究區(qū)分為512 623個單元,每個單元都有7個致災(zāi)因子二級因子和是否發(fā)生滑坡(1代表滑坡,0代表非滑坡)的屬性,并單獨作為一個樣本。總樣本集被分成2部分,隨機(jī)選取80%的單元作為訓(xùn)練樣本集,20%作為驗證樣本集。有研究表明不同核函數(shù)的類型對于SVM模型的性能影響不大[14],更重要的是核函數(shù)中的參數(shù)和懲罰因子。故本文選用徑向基核函數(shù)作為該模型的核函數(shù),并利用交叉驗證[15]得到SVM模型的參數(shù)值和,=12,=0.8。用訓(xùn)練好的模型計算研究區(qū)內(nèi)所有單元,并結(jié)合所得結(jié)果和自然裂點法將研究區(qū)易發(fā)性等級將分為低、中、高、極高4個等級,得到研究區(qū)的滑坡易發(fā)性區(qū)劃圖,如圖9。并疊加歷史滑坡災(zāi)點圖,進(jìn)而得到各個分區(qū)內(nèi)滑坡個數(shù)和面積,見表3。
圖9 易發(fā)性區(qū)劃圖
表3 研究區(qū)結(jié)果分析
研究結(jié)果表明,高易發(fā)區(qū)和極高易發(fā)區(qū)主要分布在四川省的南部和中東部,從各等級易發(fā)區(qū)內(nèi)歷史滑坡的比例來看,低易發(fā)區(qū)面積占全省面積41.77%,僅7.67%的歷史滑坡災(zāi)點處于該區(qū)域;雖然高易發(fā)區(qū)和極高易發(fā)區(qū)域只占全省面積28.04%,但79.14%的歷史滑坡災(zāi)點位于該區(qū)域。隨著易發(fā)區(qū)等級由低到高,面積百分比減少,歷史滑坡災(zāi)點數(shù)增加,完全符合地質(zhì)災(zāi)害易發(fā)性區(qū)劃圖的特性[16]。同時,評價結(jié)果與歷史滑坡災(zāi)害點的分布情況基本吻合,可以認(rèn)定該區(qū)劃結(jié)果準(zhǔn)確可靠。
1) 結(jié)合四川省的實際情況綜合選取10個致災(zāi)因子,并應(yīng)用主成分分析法篩選出高程、與構(gòu)造線距離、與河流距離、地貌類型、巖性、年均降雨量、坡度等7個致災(zāi)因子構(gòu)建四川省滑坡致災(zāi)因子評價體系。
2) 基于支持向量機(jī)模型,編制四川省滑坡災(zāi)害易發(fā)性區(qū)劃圖,滑坡災(zāi)害低易發(fā)區(qū)、中易發(fā)區(qū)、高易發(fā)區(qū)、極高易發(fā)區(qū)占全省總面積分別為7.67%,13.19%,29.70%和49.44%?;聻?zāi)害易發(fā)性較高的地區(qū)主要分布在四川省南部和中東部。
3) 滑坡災(zāi)害高易發(fā)性等級以上的區(qū)域占研究區(qū)域總面積28.04%,而該區(qū)域內(nèi)歷史滑坡災(zāi)點數(shù)占研究區(qū)歷史滑坡總數(shù)的79.14%。表明滑坡易發(fā)性評價結(jié)果與歷史滑坡分布吻合程度高,本文編制的滑坡易發(fā)性區(qū)劃圖有較高的準(zhǔn)確性和可靠性。
[1] 陳香, 王瑞. 福建省滑坡災(zāi)害風(fēng)險管理決策系統(tǒng)構(gòu)建[J]. 災(zāi)害學(xué), 2016, 31(2): 47?52. CHEN Xiang, WANG Rui. Construction of landslide disaster risk management decision system in Fujian province[J]. Disaster science, 2016, 31(2): 47?52.
[2] Mandal B, Mandal S. Analytical hierarchy process (AHP) based landslide susceptibility mapping of Lish river basin of eastern Darjeeling Himalaya[J]. Advances in Space Research, 2018, 62(11): 3114?3132.
[3] Giovanni L, Rocco P, Francis C. Landslide susceptibility mapping using a fuzzy approach[J]. Procedia Engineering, 2016, 161: 380?387.
[4] Luigi L, Martin M P. Presenting logistic regression-based landslide susceptibility results[J]. Engineering Geology, 2018, 244: 14?24.
[5] YANG Jintao, SONG Chao, YANG Yang. New method for landslide susceptibility mapping supported by spatial logistic regression and GeoDetector: A case study of Duwen Highway Basin, Sichuan Province[J]. Geomorphology, 2019, 324: 62?71.
[6] Aditian A, Kubota T, Shinohara Y. Comparison of GIS-based landslide susceptibility models using frequency ratio, logistic regression, and artificial neural network in a tertiary region of Ambon, Indonesia[J]. Geomorphology, 2018, 318: 101?111.
[7] Binh T P, Ataollah S, Dieu T B. A hybrid machine learning ensemble approach based on a Radial Basis Function neural network and Rotation Forest for landslide susceptibility modeling: A case study in the Himalayan area, India[J]. International Journal of Sediment Research, 2018, 33(2): 157?170.
[8] HUANG Yu, ZHAO Lu. Review on landslide susceptibility mapping using support vector machines[J]. Catena, 2018, 165: 520?529.
[9] 王衛(wèi)東, 陳燕平, 鐘晟. 應(yīng)用CF和Logistic回歸模型編制滑坡危險性區(qū)劃圖[J]. 中南大學(xué)學(xué)報(自然科學(xué)版), 2009(4): 1127?1132. WANG Weidong, CHEN Yanping, ZHONG Sheng. Landslide susceptibility mapped with CF and Logistic regression model[J]. Journal of Central South University (Science and Technology), 2009(4): 1127?1132.
[10] 黃發(fā)明, 殷坤龍, 蔣水華. 基于聚類分析和支持向量機(jī)的滑坡易發(fā)性評價[J]. 巖土力學(xué)與工程學(xué)報, 2018, 37(1): 156?167. HUANG Faming, YIN Kunlong, JIANG Shuihua. Landslide susceptibility evaluation based on cluster analysis and support vector machine[J]. Chinese Journal of Rock Mechanics and Engineering, 2018, 37(1): 156? 167.
[11] 雷鵬, 蔣廷耀.基于PCA和SVM算法的滑坡穩(wěn)定性分析研究[J]. 科技視界, 2015, 14(6): 92?97. LEI Peng, JIANG Tingyao. Analysis of landslide stability based on PCA and SVM algorithms[J]. Science & Technology, Vision, 2015, 14(6): 92?97.
[12] 齊信, 黃波林, 劉廣寧, 等. 基于GIS技術(shù)和頻率比模型的三峽地區(qū)秭歸向斜盆地滑坡敏感性評價[J]. 地質(zhì)力學(xué)學(xué)報, 2017, 23(1): 97?104. QI Xin, HUANG Bolin, LIU Guangning, et al. Sensitivity evaluation of landslides in the Zigui inclined basin in the Three gorges area based on gis technology and frequency ratio model[J]. Journal of Geomechanics, 2017, 23(1): 97?104.
[13] 陳冰梅, 樊曉平, 周志明, 等. 支持向量機(jī)原理及展望[J]. 制造業(yè)自動化, 2010, 32(12): 136?138. CHEN Bingmei, FAN Xiaoping, ZHOU Zhiming, et al. The principle and prospect of support vector machine[J]. Manufacturing Automation, 2010, 32(12): 136?138.
[14] 傅文杰. GIS支持下基于支持向量機(jī)的滑坡危險性評價[J]. 地理科學(xué), 2008, 28(6): 838?841. FU Wenjie. Landslide susceptibility evaluation based on support vector machine with GIS support[J]. Scientia Geographica Sinica, 2008, 28(6): 838?841.
[15] Edson D, Jacques W. Empirical comparison of cross- validation and internal metrics for tuning SVM hyperparameters[J]. Pattern Recognition Letters, 2017, 88: 6?11.
[16] Eslami M, Shadfar S, Mohammadi-Torkashvand A. Assessment of density area and LNRF models in landslide hazard zonation (Case study: Alamout watershed, Qazvin Province, Iran)[J]. Acta Ecologica Sinica, 2018, 19: 1?8.
(編輯 涂鵬)
Landslide susceptibility mapping of sichuan province based on support vector machine
WANG Weidong, LIU Pan, GONG Lu
(School of Civil Engineering, Central South University, Changsha 410004, China)
Taking Sichuan Province as the research area, combining the field investigation and principal component analysis (PCA) method, distance from the construction line, elevation, distance from the river, landform types, lithology, annual average rainfall and slope are selected as landslide causal factors with the frequency ratio model, and support vector machine (SVM) is used to created landslide susceptibility zoning map of research area. The results show that the research area could be classified into four categories, i.e., low susceptibility zone, moderate susceptibility zone, high susceptibility zone, and extremely high susceptibility zone, taking an area proportion of 41.77%, 31.19%, 17.20%, 10.84%, respectively. The number of landslides in high-susceptibility areas and extremely high-susceptibility areas accounted for 79.14% of the total, mainly in the southern and central eastern parts of Sichuan Province. The research results not only provide a scientific basis for infrastructure construction, disaster prevention, and mitigation work but also provide a reference for landslide susceptibility evaluation in other regions.
landslide; susceptibility zoning; support vector machine; principal component analysis; frequency ratio model
10.19713/j.cnki.43?1423/u.2019.05.011
[P694]
A
1672 ? 7029(2019)05 ? 1194 ? 07
2018?06?09
國家自然科學(xué)基金資助項目(51478483)
王衛(wèi)東(1971?),男,江西上饒人,教授,博士,從事道路與鐵道工程研究;E?mail:147745@163.com