劉飛,秦勝伍,喬雙雙,竇強(qiáng),扈秀宇
吉林大學(xué)建設(shè)工程學(xué)院,長(zhǎng)春130026
斜坡地質(zhì)災(zāi)害[1]是指在降雨、人工爆破、坡腳開(kāi)挖和地下開(kāi)采等外界因素下,受到重力的影響,坡體物質(zhì)沿坡體向下滑動(dòng),并造成人員傷亡、財(cái)產(chǎn)損失等地質(zhì)災(zāi)害。永吉縣是吉林省吉林市的一個(gè)市轄縣,其東部地貌以山區(qū)為主,地勢(shì)起伏較大,雨季降雨量大,加之人類工程活動(dòng),存在大量的斜坡類地質(zhì)災(zāi)害隱患。為減少斜坡地質(zhì)災(zāi)害的危害性,對(duì)研究區(qū)的斜坡地質(zhì)災(zāi)害進(jìn)行了易發(fā)性分析,從而為永吉縣斜坡地質(zhì)災(zāi)害的預(yù)測(cè)和治理提供了依據(jù)。
目前,對(duì)于地質(zhì)災(zāi)害易發(fā)性的制圖方法,已經(jīng)從開(kāi)始的定性分析發(fā)展到定性--定量分析,再到定量分析。定量分析的評(píng)價(jià)結(jié)果客觀,不受人為主觀干擾,主要包括傳統(tǒng)的統(tǒng)計(jì)分析法和新興的機(jī)器學(xué)習(xí)法。統(tǒng)計(jì)分析法包括:頻率比[2]、信息量[3]和確定系數(shù)[4]等。斜坡地質(zhì)災(zāi)害作為一種非線性系統(tǒng),一般的線性統(tǒng)計(jì)方法難以準(zhǔn)確的進(jìn)行模擬。而機(jī)器學(xué)習(xí)法能夠較好地處理非線性問(wèn)題。常用的機(jī)器學(xué)習(xí)法主要有:人工神經(jīng)網(wǎng)絡(luò)[5]、支持向量機(jī)[6]和邏輯回歸[7]等。這些方法都有著各自的優(yōu)缺點(diǎn):支持向量機(jī)模型的數(shù)學(xué)函數(shù)比較復(fù)雜,不能較好地解決多分類問(wèn)題;邏輯回歸模型在建模過(guò)程中的主觀干擾比較大;而神經(jīng)網(wǎng)絡(luò)模型具有強(qiáng)大的學(xué)習(xí)能力,可以較好地處理區(qū)域內(nèi)災(zāi)害易發(fā)性與影響因子的非線性關(guān)系。D. P.Kanungo等人研究表明,相比其他方法,神經(jīng)網(wǎng)絡(luò)模型對(duì)于評(píng)價(jià)因子權(quán)重的計(jì)算更為準(zhǔn)確[8]。因此筆者選取神經(jīng)網(wǎng)絡(luò)模型對(duì)永吉縣區(qū)域的斜坡地質(zhì)災(zāi)害進(jìn)行易發(fā)性評(píng)價(jià),同時(shí)為更直觀地體現(xiàn)神經(jīng)網(wǎng)絡(luò)模型的評(píng)價(jià)效果,構(gòu)建頻率比、支持向量機(jī)模型和神經(jīng)網(wǎng)絡(luò)模型進(jìn)行對(duì)比驗(yàn)證。
永吉縣位于吉林省吉林市,地理坐標(biāo)分別為:125°47′43″~126°39′40″E,43°18′36″~43°53′12″N,面積為2 625 km2。區(qū)內(nèi)春夏秋冬四季明顯,冬季、夏季溫度差別較大,年平均降水量677.4 mm。東南部是山區(qū),西北部是臺(tái)地,地勢(shì)從南到北、從東到西逐漸降低,最高海拔1 387 m,最低點(diǎn)的高程為182 m。區(qū)內(nèi)北東向、北西向斷層發(fā)育,巖體主要有第四系土體、堅(jiān)硬的塊狀巖和層狀巖組、較軟和較堅(jiān)硬的碎屑巖巖組[9]。由于較差的地質(zhì)環(huán)境質(zhì)量,研究區(qū)分布大量的斜坡地質(zhì)災(zāi)害,對(duì)農(nóng)田、人員、道路和房屋等造成極大的威脅。
經(jīng)調(diào)查,研究區(qū)共發(fā)現(xiàn)了131處斜坡類地質(zhì)災(zāi)害點(diǎn),包括111個(gè)不穩(wěn)定斜坡和20個(gè)崩塌,主要分布于永吉縣中部低山區(qū)域、東南部中山和河谷區(qū)域,災(zāi)害點(diǎn)分布情況見(jiàn)圖1,本文按照70%:30%的比例將災(zāi)害點(diǎn)隨機(jī)分為2組,訓(xùn)練點(diǎn)92個(gè),驗(yàn)證點(diǎn)39個(gè),用于模型的建立和驗(yàn)證。
根據(jù)研究區(qū)實(shí)際情況以及對(duì)影響斜坡地質(zhì)災(zāi)害發(fā)生的地形因素、環(huán)境因素以及地質(zhì)因素進(jìn)行分析最終選?。焊叱獭⑵露?、坡向、剖面曲率、平面曲率、距斷層距離、巖性、距河流距離、年均降雨量、地形濕度指數(shù)(TWI)和植被覆蓋指數(shù)(NDVI)等11個(gè)影響因子,利用ArcGIS軟件進(jìn)行重分類(圖2),因子分級(jí)情況見(jiàn)表1。分類方法主要是常用的自然間斷法。自然間斷法是對(duì)分類間隔加以識(shí)別,對(duì)相似值進(jìn)行最恰當(dāng)?shù)胤纸M,并使各個(gè)類之間的差異最大化。
數(shù)字高程模型(DEM)反映了地表高低情況,斜坡地質(zhì)災(zāi)害的發(fā)生與高程值密切相關(guān)。本文選用的DEM柵格單元大小為8 m×8 m,高程值分布在181~1 387 m之間,基于ArcGIS軟件利用自然間斷法將高程值劃分為:181~248 m、248~328 m、328~413 m、413~512 m、512~649 m、649~848 m、848~1 387 m等7個(gè)等級(jí),根據(jù)分區(qū)結(jié)果,高程在181~413 m范圍最有利于斜坡災(zāi)害的發(fā)生。
圖2 評(píng)價(jià)因子圖Fig.2 Diagrams of evaluation factors
表1 斜坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià)表
Table 1 Table of slope geological hazards susceptibility evaluation
評(píng)價(jià)因子分類子類所占比例 /%災(zāi)害點(diǎn)所占比例 /%神經(jīng)網(wǎng)絡(luò)頻率比支持向量機(jī)高程/m181~24828.0%22.8%0.073 4 0.815 6 0.106 0 248~32826.8%53.3%0.179 1 1.990 4 0.258 7 328~41323.2%18.5%0.071 8 0.797 9 0.103 7 413~51212.3%3.3%0.023 8 0.264 2 0.034 3 512~6496.5%0.0%0.000 0 0.000 0 0.000 0 649~8482.4%0.0%0.000 0 0.000 0 0.000 0 848~1 3870.9%2.2%0.221 8 2.464 0 0.320 3 距斷層距離/m<1001.7%0.0%0.000 0 0.000 0 0.000 0 100~2001.8%0.0%0.000 0 0.000 00.000 0 200~4003.8%7.6%0.341 9 2.011 3 0.020 1 400~8008.0%10.9%0.230 9 1.358 3 0.013 6 800~1 60015.5%13.0%0.142 8 0.839 9 0.008 4 >1 60069.2%68.5%0.1682 0.989 2 0.009 9 巖性堅(jiān)硬的層狀巖2.0%1.1%0.026 9 0.537 1 0.016 1 堅(jiān)硬的塊狀巖28.6%23.9%0.041 8 0.835 2 0.025 1 較堅(jiān)硬的碎屑巖11.0%2.2%0.009 9 0.198 0 0.005 9 較軟碎屑巖21.1%5.4%0.012 9 0.257 1 0.007 7 土體37.2%67.4%0.090 5 1.810 2 0.054 3 坡度0°~3.48°43.9%8.7%0.027 7 0.197 9 0.017 8 3.48°~8.02°20.2%26.1%0.180 8 1.291 1 0.116 2 8.02°~12.86°16.8%38.0%0.316 8 2.262 8 0.203 7 12.86°~18.46°13.3%20.7%0.218 0 1.557 4 0.140 2 18.46°~38.90°5.8%6.5%0.158 1 1.129 6 0.101 7 >38.90°0.0%0.0%0.000 0 0.000 0 0.000 0 坡向Flat10.1%1.1%0.009 6 0.107 1 0.017 1 N10.0%4.3%0.039 0 0.432 8 0.069 2 NE11.7%6.5%0.050 1 0.556 8 0.089 1 E10.1%14.1%0.125 6 1.395 9 0.223 3 SE9.7%28.3%0.262 3 2.914 3 0.466 3 S10.2%17.4%0.153 5 1.7051 0.272 8 SW13.0%19.6%0.135 3 1.503 1 0.240 5 W13.1%6.5%0.044 6 0.496 1 0.079 4 NW11.9%2.2%0.016 4 0.182 5 0.029 2 距河流距離/m<10013.7%35.9%0.131 1 2.621 0 0.078 6 100~20012.0%18.5%0.077 3 1.545 3 0.046 4 200~40019.6%20.7%0.052 6 1.051 3 0.031 5 400~80027.2%12.0%0.022 0 0.440 3 0.013 2 800~1 60023.1%10.9%0.023 6 0.471 4 0.014 1 >1 6004.5%2.2%0.024 2 0.483 4 0.014 5 年均降雨量/mm60050.8%40.2%0.039 5 0.790 9 0.039 5 70049.2%59.8%0.060 8 1.216 3 0.060 8
續(xù)表1
評(píng)價(jià)因子分類子類所占比例 /%災(zāi)害點(diǎn)所占比例 /%神經(jīng)網(wǎng)絡(luò)頻率比支持向量機(jī)剖面曲率-6.8~0.0125.5%19.6%0.023 00.766 60.015 3-0.01~0.0142.7%29.3%0.020 60.686 60.013 70.01~9.231.7%51.1%0.048 31.609 80.032 2平面曲率-5.6~0.0127.4%32.6%0.035 81.191 70.083 4-0.01~0.0144.8%28.3%0.018 90.631 30.044 20.01~5.527.9%39.1%0.042 11.404 20.098 3TWI<8.5119.8%22.8%0.046 11.152 80.046 18.51~10.5329.1%33.7%0.046 31.158 70.046 310.53~12.5526.7%32.6%0.048 81.221 00.048 812.55~16.0913.4%2.2%0.006 50.161 80.006 516.09~27.201.9%0.0%0.000 00.000 00.000 0>27.209.1%8.7%0.038 20.954 70.038 2NDVI-0.990~0.0951.2%0.0%0.000 00.000 00.000 0-0.095~0.1378.3%16.3%0.313 11.956 90.489 20.137~0.3428.8%27.2%0.495 93.099 30.774 80.342~0.49711.6%30.4%0.419 12.619 60.654 90.497~0.61325.5%17.4%0.10930.683 00.170 70.613~1.00044.6%8.7%0.031 20.194 80.048 7
坡度和坡向是利用ArcGIS軟件中的提取工具,從基礎(chǔ)數(shù)據(jù)DEM中獲得。坡度的大小影響著斜坡的穩(wěn)定性[10]。永吉縣坡度分布在0°~38.90°之間,按照自然間斷法共分為6個(gè)等級(jí),分別為0°~3.48°、3.48°~8.02°、8.02°~12.86°、12.86°~18.46°、18.46°~38.90°,斜坡災(zāi)害在0°~18.46°分布最多;斜坡坡向由于受到的光照不同,所以土的力學(xué)特性差異較大[11]。按照45°一個(gè)等級(jí),將坡向分為平面、北、東北、東、東南、西、西南、西和西北9個(gè)等級(jí),西南、南和東南方向的斜坡地質(zhì)災(zāi)害發(fā)育較多。
剖面曲率和平面曲率反映著地面的凹凸情況,影響著斜坡地質(zhì)災(zāi)害的發(fā)育。按照自然間斷法:剖面曲率分為-6.8~0.01、-0.01~0.01、0.01~9.2,平面曲率分為-5.6~0.01、-0.01~0.01、0.01~5.5,其中正值代表地形向上凸,負(fù)值代表地形向下凹;災(zāi)害點(diǎn)分布在凸起的地形中。
斷層的發(fā)育影響著巖體的質(zhì)量,從而影響斜坡災(zāi)害的發(fā)育,利用ArcGIS軟件對(duì)斷層進(jìn)行緩沖區(qū)劃分,分為<200 m、200~400 m、400~800 m、800~1 600 m、>1 600 m等5個(gè)等級(jí),結(jié)果顯示,斷層附近100~400 m的斜坡地質(zhì)災(zāi)害更為發(fā)育。
巖性是斜坡地質(zhì)災(zāi)害發(fā)育的基礎(chǔ),在不同的巖性地區(qū),災(zāi)害發(fā)育情況差別明顯。永吉縣的巖性按照硬度和結(jié)構(gòu)特性進(jìn)行劃分,主要為堅(jiān)硬的層狀巖、堅(jiān)硬的塊狀巖、較堅(jiān)硬的碎屑巖、較軟碎屑巖和第四系土體5類,根據(jù)災(zāi)害點(diǎn)的分布情況,第四系土體中斜坡地質(zhì)災(zāi)害發(fā)育最多。
河流也是導(dǎo)致斜坡地質(zhì)災(zāi)害產(chǎn)生的重要因素,距河流越近的地區(qū)越容易受到河流的沖蝕以及軟化,利用ArcGIS軟件對(duì)河流進(jìn)行緩沖區(qū)劃分,分為<100 m、100~200 m、200~400 m、400~800 m、800~1 600 m、>1 600 m共6個(gè)等級(jí);距河流400 m之內(nèi)的斜坡受到的影響最大、分布最多。
降雨不僅會(huì)沖蝕坡體表面,還會(huì)浸透到巖體內(nèi)部,造成巖體軟化,促使斜坡地質(zhì)災(zāi)害形成。永吉縣年均降雨量分別是600 mm和700 m,其中700 mm降雨量的區(qū)域斜坡地質(zhì)災(zāi)害發(fā)育較多。
地形濕度指數(shù)TWI是以DEM為基礎(chǔ)數(shù)據(jù),利用GIS軟件的水分分析模塊獲得,表示土壤水分情況。將獲取的TWI分為<8.509、8.509~10.530、10.530~12.550、12.550~16.086、16.086~27.199、>27.199共6個(gè)等級(jí),斜坡地質(zhì)災(zāi)害主要分布于0~16.086之間。
植被覆蓋指數(shù)NDVI主要體現(xiàn)了研究區(qū)域內(nèi)的植被覆蓋情況,其公式為:
NDVI=(NIR-R)/(NIR+R)
(1)
式中:NIR和R表示近紅外波段和紅光波段的反射值;本文通過(guò)地理空間數(shù)據(jù)云獲得近紅外波段和紅光波段的反射值,利用GIS軟件根據(jù)上述公式進(jìn)行柵格計(jì)算,得到植被覆蓋度,結(jié)果按自然間斷法分為:-0.99~0.095、-0.095~0.137、0.137~0.342、0.342~0.497、0.497~0.613、0.63~1共6個(gè)等級(jí),其中斜坡地質(zhì)災(zāi)害在0.497~1之間發(fā)育最多(表2)。
表2 評(píng)價(jià)因子的數(shù)據(jù)來(lái)源
神經(jīng)網(wǎng)絡(luò)是由一系列小型處理節(jié)點(diǎn)組成的網(wǎng)絡(luò)系統(tǒng),現(xiàn)已廣泛用于易發(fā)性測(cè)繪,可以用來(lái)處理非線性問(wèn)題。三層BP神經(jīng)網(wǎng)絡(luò)模型近年來(lái)被應(yīng)用于各個(gè)方面。
設(shè)輸入層A=(A1,A2,A3…Ai…AI),隱藏層B=(B1,B2,B3…Bj…BJ),輸出層C=(C1,C2,C3…Ck…CK)和期望輸出層為:D=(D1,D2,D3…Dk…DK),神經(jīng)元Bj和Ck的關(guān)系方程如下:
(2)
(3)
式中:j=(1,2,3…J),k=(1,2,3…K);wij和aj分別為輸入層和隱藏層之間的權(quán)重和閾值;wjk和bk分別為隱藏層和輸出層之間的權(quán)重和閾值;f1,f2是激活函數(shù)[12];
BP模型的輸出誤差公式為:
(4)
模型通過(guò)選取合適的激活函數(shù),不斷調(diào)整閾值和權(quán)重,使得MSE的值最小。
頻率比是一種傳統(tǒng)的概率統(tǒng)計(jì)方法,其定義是對(duì)于給定屬性災(zāi)害發(fā)生的可能性與不發(fā)生的可能性之比。其比值與影響因子的重要程度相關(guān),比值>1表示重要,反之說(shuō)明較低。計(jì)算公式為:
(5)
式中:A1代表該影響因子的特定級(jí)別內(nèi)出現(xiàn)的災(zāi)害點(diǎn)的網(wǎng)格數(shù)目;A2代表研究區(qū)所有災(zāi)害點(diǎn)的網(wǎng)格數(shù)目;B1代表該因子特定級(jí)別的總網(wǎng)格數(shù)目;B2代表研究區(qū)網(wǎng)格的總數(shù)目。
支持向量機(jī)(SVM)是通過(guò)尋找一個(gè)超平面將數(shù)據(jù)進(jìn)行分割的二分類模型,目的是為了把問(wèn)題轉(zhuǎn)化為一個(gè)凸二次規(guī)劃問(wèn)題。其原理是將原始空間里的訓(xùn)練數(shù)據(jù)根據(jù)確定的函數(shù)映射到更高空間,從而使得樣本在這個(gè)空間中線性可分[13]。選取RBF核函數(shù),利用線性回歸函數(shù)f(x)=ax+b,對(duì)數(shù)據(jù)點(diǎn)(Xi,Yi)進(jìn)行擬合,其中i=1,2,3…n;設(shè)擬合的精度為c,則有:
Yi-f1(Xi)≤c+ξi
(6)
f1(Xi)-Yi≤c+ξi′
(7)
式中:i=1,2,3…n,ξi,ξi′為松弛因子且≥0,沒(méi)有誤差時(shí)取0。目標(biāo)函數(shù)變?yōu)椋?/p>
(8)
式中:C是懲罰參數(shù),且C>0。對(duì)公式(6)、(7)和(8)進(jìn)行求解,變?yōu)橥苟我?guī)劃問(wèn)題,使用拉格朗日函數(shù):
(9)
式中:α,α′,γ,γ′為拉格朗日乘數(shù),ai′≥0,γi′≥0,i=1,2,3…n。求函數(shù)L對(duì)a,b,ξi,ξi′的最小化以及對(duì)α,α′,γ,γ′的最大化,帶入式(9),得到對(duì)偶形式和它的最大化函數(shù)。最后求得:
(10)
神經(jīng)網(wǎng)絡(luò)(ANN)模型通過(guò)SPSS軟件構(gòu)建,將11個(gè)影響因子作為輸入層,進(jìn)行神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練,再利用GIS軟件得到斜坡地質(zhì)災(zāi)害易發(fā)性分區(qū)圖(圖4)。根據(jù)自然間斷法將結(jié)果分為:極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)、極低易發(fā)區(qū),面積分別為9.2%、18.1%、23.5%、30.7%、18.6%,各分區(qū)對(duì)應(yīng)的災(zāi)害點(diǎn)分別為61個(gè)、24個(gè)、6 個(gè)、0個(gè)、1個(gè),位于高易發(fā)區(qū)的災(zāi)害點(diǎn)個(gè)數(shù)占總災(zāi)害點(diǎn)個(gè)數(shù)的92.4%,結(jié)果合理。
神經(jīng)網(wǎng)絡(luò)模型構(gòu)建的易發(fā)性分區(qū)情況為:高和極高易發(fā)區(qū)主要分布于永吉縣東南部的北大湖鎮(zhèn)、西陽(yáng)鎮(zhèn)、雙河鎮(zhèn)一帶的中低山區(qū)以及永吉縣中部的口前鎮(zhèn)、金家鄉(xiāng)、黃榆鄉(xiāng)一帶的丘陵地區(qū),該區(qū)由于村民建房、修路削坡等形成了大量不穩(wěn)定斜坡,區(qū)內(nèi)出露巖層主要為花崗巖,巖體中的原生節(jié)理和構(gòu)造裂隙發(fā)育,風(fēng)化程度高,第四紀(jì)土層覆蓋較多,降雨充沛,容易形成斜坡類災(zāi)害;而中易發(fā)區(qū)主要分布于永吉經(jīng)濟(jì)開(kāi)發(fā)區(qū)洋草溝村、乃子街村,北大湖鎮(zhèn)小山村、南溝村、朝陽(yáng)村,一拉溪鎮(zhèn)碾子溝村、松花村、索屯村,口前鎮(zhèn)繁榮村、達(dá)屯村、春登村,岔路河鎮(zhèn)岔路河村和馬家村等,分布區(qū)域廣泛,巖性主要由較軟碎屑巖和花崗巖構(gòu)成,節(jié)理較發(fā)育,人類工程較頻繁,在降雨作用下較易形成斜坡災(zāi)害;低和極低易發(fā)區(qū)主要分布于北部的岔路河鎮(zhèn)、一拉溪鎮(zhèn)、萬(wàn)昌鎮(zhèn)一帶的臺(tái)地區(qū)域,以及中部的西陽(yáng)鎮(zhèn)、黃榆鄉(xiāng)、金家鄉(xiāng)區(qū)域,該區(qū)地勢(shì)較為平緩,地貌以臺(tái)地和河谷為主,人類活動(dòng)弱,植被覆蓋較好,不易形成斜坡類地質(zhì)災(zāi)害。
利用神經(jīng)網(wǎng)絡(luò)計(jì)算得到因子的重要性見(jiàn)圖3。結(jié)果顯示高程、坡向、NDVI、TWI是影響斜坡災(zāi)害發(fā)育最重要的3個(gè)因子,占據(jù)全部因子重要性的54.00%;其次巖性、距斷層距離、距河流距離也對(duì)斜坡災(zāi)害的發(fā)育影響較大;而剖面曲率、平面曲率、降雨和坡度對(duì)斜坡災(zāi)害的發(fā)育影響較小,重要性僅占18.82%。
圖3 ANN計(jì)算因子重要性圖Fig.3 ANN calculates factors importance graph
頻率比模型按照公式(4)先計(jì)算11個(gè)評(píng)價(jià)因子圖層的權(quán)重,再通過(guò)Arcgis軟件進(jìn)行疊加,得到易發(fā)性圖(圖5),將結(jié)果分為極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)和極低易發(fā)區(qū)5類,對(duì)應(yīng)分區(qū)面積分別為8.0%、20.4%、29.0%、28.0%、14.6%;對(duì)應(yīng)的災(zāi)害點(diǎn)個(gè)數(shù)分別為69個(gè)、15個(gè)、7個(gè)、0個(gè)、1個(gè)。
支持向量機(jī)模型通過(guò)SPSS軟件構(gòu)建,核函數(shù)選用徑向基函數(shù),系數(shù)選取0.1,懲罰系數(shù)選取1。利用自然間斷法對(duì)得到的斜坡災(zāi)害易發(fā)性圖進(jìn)行分類(圖6),分成5種類型:極高易發(fā)區(qū)、高易發(fā)區(qū)、中易發(fā)區(qū)、低易發(fā)區(qū)和極低易發(fā)區(qū);相對(duì)應(yīng)的面積分別為9.6%、18.0%、22.2%、29.6%、20.6%,分區(qū)情況見(jiàn)圖6;對(duì)應(yīng)分布的災(zāi)害點(diǎn)個(gè)數(shù)分別是55個(gè)、28個(gè)、7個(gè)、1個(gè)、1個(gè)(表3)。
表3 模型分區(qū)面積占比情況
圖4 神經(jīng)網(wǎng)絡(luò)模型評(píng)價(jià)結(jié)果圖Fig.4 Neural network model evaluation results
圖5 頻率比模型評(píng)價(jià)結(jié)果圖Fig.5 Frequency ratio model evaluation results
圖6 支持向量機(jī)模型評(píng)價(jià)結(jié)果圖Fig.6 Support vector machine model evaluation results
驗(yàn)證是易發(fā)性制圖中必不可少的組成部分,直接決定了制圖的質(zhì)量。為評(píng)估選用模型的精度,使用受試者工作特征曲線(ROC曲線)來(lái)進(jìn)行驗(yàn)證。受試者工作特征曲線是將特異性和敏感度分別作為橫、縱坐標(biāo)繪制得到的曲線[14]。曲線下的面積大小說(shuō)明了模型的好壞,面積值與1越接近則說(shuō)明模型的判別效果越好。
筆者將斜坡地質(zhì)災(zāi)害點(diǎn)按70%∶30%的比例進(jìn)行了劃分[15],分別作為訓(xùn)練點(diǎn)和驗(yàn)證點(diǎn),基于SPSS軟件建立了成功率和預(yù)測(cè)率曲線(圖7、8)。成功率法采用訓(xùn)練點(diǎn)作為模型建立的數(shù)據(jù),不適合評(píng)價(jià)模型的預(yù)測(cè)能力,然而可以確定易發(fā)性圖對(duì)現(xiàn)有區(qū)域的分級(jí)情況,而預(yù)測(cè)率曲線可以表示模型的預(yù)測(cè)能力(表4)。
表4 模型準(zhǔn)確率及預(yù)測(cè)率表
根據(jù)表中數(shù)據(jù),可以看出在訓(xùn)練效果和預(yù)測(cè)能力這兩方面,神經(jīng)網(wǎng)絡(luò)表現(xiàn)最好,支持向量機(jī)模型次之,頻率比模型最差;成功率和預(yù)測(cè)率之間的差值可以表示模型的穩(wěn)定程度,神經(jīng)網(wǎng)絡(luò)、頻率比模型、支持向量機(jī)的成功率與預(yù)測(cè)率差值分別是0.040、0.050、0.046,在穩(wěn)定性方面同樣是神經(jīng)網(wǎng)絡(luò)最好;從以上3方面可以看出,神經(jīng)網(wǎng)絡(luò)模型的性能最優(yōu),最適合永吉縣的斜坡地質(zhì)災(zāi)害易發(fā)性評(píng)價(jià),且機(jī)器學(xué)習(xí)模型優(yōu)于傳統(tǒng)的概率統(tǒng)計(jì)模型。
圖7 成功率ROC曲線Fig.7 ROC curvesof success rate
圖8 預(yù)測(cè)率ROC曲線Fig.8 ROC curvesof prediction rate
(1)神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建使用SPSS Modeler軟件即可實(shí)現(xiàn),相比于傳統(tǒng)的頻率比模型,實(shí)現(xiàn)方式簡(jiǎn)便,運(yùn)行結(jié)果精度更高。
(2)將神經(jīng)網(wǎng)絡(luò)模型評(píng)價(jià)結(jié)果分為極低、低、中、高和極高易發(fā)區(qū),面積分別為18.6%、30.7%、23.5%、18.1%、9.2%,災(zāi)害點(diǎn)占比為:1.10%、0%、6.5%、26.1%、66.3%,斜坡地質(zhì)災(zāi)害分布情況符合易發(fā)性等級(jí)。
(3)通過(guò)ROC曲線對(duì)3種模型評(píng)價(jià)結(jié)果的精度進(jìn)行檢驗(yàn),結(jié)果顯示神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練效果、預(yù)測(cè)能力和穩(wěn)定性均最高,評(píng)價(jià)效果最好,最適用于永吉縣區(qū)域的斜坡災(zāi)害易發(fā)性評(píng)價(jià)。
(4)由神經(jīng)網(wǎng)絡(luò)模型構(gòu)建的斜坡災(zāi)害易發(fā)區(qū)分布情況為:高和極高易發(fā)區(qū)主要分布于永吉縣東南部的北大湖鎮(zhèn)、西陽(yáng)鎮(zhèn)、雙河鎮(zhèn)一帶的中低山區(qū)以及永吉縣中部的口前鎮(zhèn)、金家鄉(xiāng)、黃榆鄉(xiāng)一帶的丘陵地區(qū);中易發(fā)區(qū)主要分布于永吉縣永吉經(jīng)濟(jì)開(kāi)發(fā)區(qū)、洋草溝村、乃子街村,北大湖鎮(zhèn)小山村、南溝村、朝陽(yáng)村,一拉溪鎮(zhèn)碾子溝村,松花村、索屯村,口前鎮(zhèn)繁榮村、達(dá)屯村、春登村,岔路河鎮(zhèn)岔路河村和馬家村等;而低和極低易發(fā)區(qū)主要分布于北部的岔路河鎮(zhèn)、一拉溪鎮(zhèn)、萬(wàn)昌鎮(zhèn)一帶的臺(tái)地區(qū)以及中部的西陽(yáng)鎮(zhèn)、黃榆鄉(xiāng)和金家鄉(xiāng)區(qū)域。