国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于信息量模型和Logistic回歸模型的地質(zhì)災(zāi)害易發(fā)性評價
——以十堰市鄖陽區(qū)為例

2022-01-06 11:27:08費雯麗杜翌超
資源環(huán)境與工程 2021年6期
關(guān)鍵詞:鄖陽十堰市信息量

金 朝, 費雯麗, 丁 衛(wèi), 陳 曦, 杜翌超

(1.湖北省地質(zhì)調(diào)查院,湖北 武漢 430034; 2.湖北省地質(zhì)局 第八地質(zhì)大隊,湖北 襄陽 441000)

目前,國內(nèi)外學(xué)者常用的地質(zhì)災(zāi)害易發(fā)性評價模型主要有模糊邏輯、層次分析法、證據(jù)權(quán)法、信息量法、確定性系數(shù)法、人工神經(jīng)網(wǎng)絡(luò)、支持向量機、Logistic回歸等多種數(shù)理統(tǒng)計方法[1-8]。近年來,多數(shù)學(xué)者使用不同的評價模型疊加分析地質(zhì)災(zāi)害的易發(fā)性,Poiraud[9]采用指標法、證據(jù)權(quán)法、回歸模型、決策樹、獨立條件單元5種方法建立滑坡易發(fā)性分區(qū),并對比分析各個評價結(jié)果;金亞兵等[10]通過層次分析法+神經(jīng)網(wǎng)絡(luò)模型對區(qū)域地災(zāi)進行評價;張曉東[11]通過信息量法+邏輯回歸模型和確定性系數(shù)法+邏輯回歸模型對寧夏鹽池縣地災(zāi)易發(fā)性進行了評價并對比分析其結(jié)果。多數(shù)學(xué)者認為多種方法組合評價效果優(yōu)于單一方法評價。

本文以湖北省十堰市鄖陽區(qū)為例,利用信息量模型和邏輯回歸模型,分別建立信息量模型和信息量法+邏輯回歸模型進行地質(zhì)災(zāi)害易發(fā)性評價,并對比分析評價結(jié)果,以期為同類型的地災(zāi)易發(fā)性評價提供思路,為地質(zhì)災(zāi)害風(fēng)險評估和管理提供依據(jù)。

1 研究區(qū)概況及易發(fā)性評價因子選取

1.1 研究區(qū)概況

鄖陽區(qū)位于湖北省西北部、漢江上游,北緯32°25′~33°16′、東經(jīng)110°07′~111°16′,國土面積3 863 km2,地勢由南、北邊界向中部的漢江谷地傾斜,谷地兩側(cè)有狹窄而斷續(xù)的盆地與丘陵相間分布。區(qū)內(nèi)除中生界志留系、二疊系—侏羅系地層缺失外,元古界—新生界地層皆有分布。

據(jù)野外資料,全區(qū)地質(zhì)災(zāi)害點分布大致可分為三個帶:①丹江口庫區(qū)及黃龍灘庫區(qū)滑坡帶;②重要交通干線滑坡、崩塌帶;③兩鄖斷裂與公路斷裂之間滑坡帶。鄖陽區(qū)地質(zhì)災(zāi)害主要分布于構(gòu)造剝蝕低山地形區(qū),碳酸鹽巖類和變質(zhì)巖類占比較高,以不穩(wěn)定斜坡、滑坡和崩塌為主。依據(jù)十堰市鄖陽區(qū)地質(zhì)災(zāi)害風(fēng)險調(diào)查評價項目資料,十堰市鄖陽區(qū)內(nèi)共有地質(zhì)災(zāi)害隱患點868個(圖1)。

1.2 易發(fā)性影響因子選取

根據(jù)調(diào)查資料的統(tǒng)計分析,結(jié)合對典型災(zāi)害點的詳細勘察研究,初步確定鄖陽區(qū)地質(zhì)災(zāi)害的主要影響因素包括:工程地質(zhì)巖組、高程、地質(zhì)構(gòu)造、地形地貌、地災(zāi)點距道路的距離等。結(jié)合鄖陽區(qū)自然地理特征和前人對其他地區(qū)地災(zāi)易發(fā)性的研究因子選擇[11-16],在充分考慮研究區(qū)尺度大小、范圍、精度以及資料的可獲性等等因素的前提下,最終選取工程地質(zhì)巖組、高程、斷裂、坡度、地災(zāi)點距道路的距離、地災(zāi)點距水系的距離和植被覆蓋度7個影響因子作為研究區(qū)地質(zhì)災(zāi)害易發(fā)性區(qū)劃的評價指標。

圖1 研究區(qū)高程及地質(zhì)災(zāi)害隱患點分布圖Fig.1 Distribution map of elevation and geological disaster points in study area

本文采用的7個易發(fā)性影響因子原始數(shù)據(jù)來源于湖北省地質(zhì)局以及1∶1萬縣級二調(diào)數(shù)據(jù),具體信息如表1所示。由于地質(zhì)災(zāi)害易發(fā)性影響因子多基于DEM數(shù)據(jù)和Landsat8數(shù)據(jù),因此采用網(wǎng)格單元作為地質(zhì)災(zāi)害風(fēng)險評價的評價單元。為便于計算,研究區(qū)的柵格大小取30 m×30 m,共劃分為4 224 841個柵格單元。

表1 影響因子數(shù)據(jù)源Table 1 Data source of influence factor

2 模型方法及易發(fā)性評價流程

2.1 信息量模型

信息量模型的理論基礎(chǔ)是信息論,采用地質(zhì)災(zāi)害發(fā)生過程中熵的減少來表征地質(zhì)災(zāi)害事件產(chǎn)生的可能性。地質(zhì)災(zāi)害現(xiàn)象(Y)受多種因素xi的影響,在各種不同的地質(zhì)環(huán)境中,對于地質(zhì)災(zāi)害而言,各種因素所起作用的大小、性質(zhì)是不相同的,總會存在一種“最佳因素組合”對地質(zhì)災(zāi)害發(fā)生“貢獻率”最大。其模型的建立過程如下:

首先,計算單因素(指標)xi提供給地質(zhì)災(zāi)害發(fā)生(A)的信息量I(xi,A):

(1)

式中:P(xi/A)為地質(zhì)災(zāi)害發(fā)生條件下xi出現(xiàn)的概率;P(xi)為研究區(qū)指標xi出現(xiàn)的概率。

式(1)是理論模型,在具體運算時往往用樣本頻率計算,即:

(2)

式中:S為預(yù)測區(qū)總單元數(shù);N為預(yù)測區(qū)已知發(fā)生地災(zāi)的單元數(shù);Si為含有xi的單元個數(shù);Ni為含有指標xi且已知發(fā)生地災(zāi)的單元個數(shù)。

然后,計算某一單元在P種因素組合情況下提供的信息量,即:

(3)

式中:xi代表評價單元內(nèi)所取的因子等級;I(xi/A)為因子xi對地質(zhì)災(zāi)害所貢獻的信息量;S為研究區(qū)面積;Si為研究區(qū)內(nèi)含有因子xi的面積;N為研究區(qū)內(nèi)地質(zhì)災(zāi)害總數(shù);Ni為發(fā)生地質(zhì)災(zāi)害區(qū)域中含有因子xi的數(shù)量;I為評價單元中的綜合信息量。由于該模型理論簡單、客觀性高且實用性強,在地質(zhì)災(zāi)害易發(fā)性評價中能取得較好效果,尤其在中小比例尺區(qū)域應(yīng)用十分廣泛[7-12]。

2.2 Logistic回歸模型

建立Logistic回歸模型,主要有兩個目的:首先是利用建立的模型挖掘隱含在數(shù)據(jù)內(nèi)部的信息,解釋自變量與因變量之間的依存關(guān)系;其次是利用模型預(yù)測未知情況下發(fā)生或者不發(fā)生某種事件的概率。在地質(zhì)災(zāi)害易發(fā)性評價中,因變量為是否發(fā)生地質(zhì)災(zāi)害,自變量為各個影響因子。

在已經(jīng)獲得研究區(qū)信息量值的基礎(chǔ)上,提取出所有自變量因子樣本數(shù)據(jù)點,應(yīng)用Logistic回歸分析原理與方法,構(gòu)建研究區(qū)地災(zāi)易發(fā)性分區(qū)預(yù)測模型,并對模型作回歸診斷分析與評價[11,13-14]。

本文以十堰市鄖陽區(qū)地災(zāi)點數(shù)據(jù)作為因變量,地災(zāi)點距斷層距離、NDVI、坡度等7個影響因子作為自變量,在信息量法的基礎(chǔ)上將Logistic回歸分析應(yīng)用到研究區(qū)地災(zāi)易發(fā)性評價中。

其函數(shù)如下式:

式中:P為地災(zāi)點的概率,取值范圍(0,1);βn為邏輯回歸系數(shù);Z為地災(zāi)預(yù)測線性函數(shù),基于權(quán)重的所有變量之和。

2.3 地災(zāi)易發(fā)性評價流程

本文依據(jù)868個地災(zāi)樣本點來建模,結(jié)合評價因子分別采用信息量模型以及信息量法+Logistic回歸模型分析評價十堰市鄖陽區(qū)的地質(zhì)災(zāi)害易發(fā)性;取80%樣品點和等量的隨機非地災(zāi)點樣本作為研究區(qū)的地質(zhì)災(zāi)害精度檢驗樣本,導(dǎo)入SPSS軟件中進行精度檢驗(ROC),工作流程見圖2。

圖2 研究區(qū)易發(fā)性評價流程圖Fig.2 Flow chart of susceptibility evaluation in study area

3 評價因子分級及信息量值的計算

在十堰市鄖陽區(qū)地質(zhì)災(zāi)害風(fēng)險調(diào)查資料的基礎(chǔ)上,充分研究區(qū)內(nèi)地質(zhì)災(zāi)害的孕災(zāi)環(huán)境,經(jīng)過分析選擇坡度、工程巖組、距道路的距離、植被指數(shù)等7個影響因子(易發(fā)性評價通常不考慮人類工程活動、降雨等誘發(fā)因素)作為研究區(qū)地質(zhì)災(zāi)害易發(fā)性評價因子(圖3),每個因子的分級指標見表2。從表3中統(tǒng)計得出的地災(zāi)點個數(shù)在各個因子分級中的數(shù)量分布可以看出,地災(zāi)點分布規(guī)律接近野外實際情況,分布較合理,無明顯的分布不均,本次對于評價因子的分級標準整體符合野外實際地災(zāi)點分布規(guī)律。

根據(jù)868個地災(zāi)樣本點和坡度、工程巖組、植被指數(shù)等7個評價因子分類級別中的分布特征,利用前述I值計算公式,計算各分類級別在各因子中的信息量值,各分類級別的I值見表3。

表2 十堰市鄖陽區(qū)地質(zhì)災(zāi)害易發(fā)性評價因子指標分級表Table 2 Index classification table of geological disaster susceptibilityevaluation factors in Yunyang District, Shiyan City

圖3 研究區(qū)地質(zhì)災(zāi)害易發(fā)性評價因子Fig.3 Influence factors of susceptibility of geological disasters in study area

表3 各評價因子分類級別信息量模型計算結(jié)果表Table 3 Calculation result table of information quantity model level of evaluation factors

4 信息量法+Logistic回歸模型

4.1 評價因子共線性診斷

本文在計算信息量值的基礎(chǔ)上,隨機選取災(zāi)害點總樣本的80%作為訓(xùn)練樣本,提取每個樣本的各個因子等級值,在SPSS軟件中進行多重共線性診斷,統(tǒng)計其方差膨脹因子(VIF)。對所選7個評價因子進行共線性診斷,其VIF計算結(jié)果顯示VIF值在1~1.3。其VIF<5,說明無明顯偏高因子,表明變量之間不存在共線性,相互之間無交互作用(表4)。

利用相關(guān)分析再次對7個評價因子之間的獨立性進行檢驗,以保證變量之間的獨立性,各評價因子之間的相關(guān)系數(shù)矩陣見表5,結(jié)果顯示各評價因子之間的相關(guān)系數(shù)均<0.4,表明評價因子之間的相關(guān)性較小,7個評價因子均可以進入模型。

表4 各評價因子VIF計算結(jié)果表Table 4 Calculation results for each evaluation factor VIF

表5 評價因子之間的相關(guān)系數(shù)矩陣Table 5 Correlation coefficient matrix between evaluation factors

4.2 評價因子權(quán)重值的計算

將868個樣本點7個評價因子的I值輸入SPSS軟件中進行二項邏輯回歸分析,各評價因子分類級別的I值作為自變量,是否發(fā)生地質(zhì)災(zāi)害作為因變量(1代表地質(zhì)災(zāi)害樣本點,0代表非地質(zhì)災(zāi)害樣本點)。邏輯回歸分析結(jié)果中B代表各因子權(quán)重的大小,每個變量在方程中的統(tǒng)計學(xué)意義要通過比較Sig.值來判斷,當(dāng)Sig.值<0.05時才有統(tǒng)計意義。邏輯回歸分析結(jié)果顯示模型計算出的工程巖組因子的Sig.值為0.107,無法通過顯著性檢驗,無統(tǒng)計意義。將該因子剔除,剩余6個因子重新利用二項邏輯回歸模型計算,結(jié)果顯示6個因子顯著性均<0.05(表6)。因此,其回歸系數(shù)在誤差允許范圍內(nèi)是準確的,該模型的評價因子權(quán)重值即為表6中的各因子回歸系數(shù)(B)值。

信息量法+Logistic回歸模型計算出的權(quán)重因子按照大小降序排列依次為:植被指數(shù)、道路、斷層、水系、坡度、高程??梢娭脖恢笖?shù)對模型貢獻變化最大,計算出所有回歸因子均>0,說明這些因子在模型中同時起到正向作用。

表6 邏輯回歸分析結(jié)果Table 6 Results of logistic regression analysis

5 評價結(jié)果檢驗和分析

在ArcGIS軟件中,依據(jù)得到的各評價因子I值和回歸系數(shù)值(B值),采用自然間斷法分級將研究區(qū)分成4個區(qū),最終形成研究區(qū)易發(fā)性分區(qū)(圖4)。

兩種模型得出的極高易發(fā)區(qū)和高易發(fā)區(qū)主要分布在青曲鎮(zhèn)—城關(guān)鎮(zhèn)—青山鎮(zhèn)地帶以及重要交通干線,分區(qū)結(jié)果與實際地質(zhì)災(zāi)害隱患點分布規(guī)律基本吻合。結(jié)合災(zāi)害點分布及所占比例分析2種模型得到的面積占比可知(表7),信息量模型低易發(fā)分區(qū)和中易發(fā)分區(qū)面積占比為6.9%,而信息量法+Logistic回歸模型低易發(fā)分區(qū)和中易發(fā)分區(qū)面積占比為14.63%;同時信息量法+Logistic回歸模型中植被指數(shù)權(quán)重因子占比最大,與實際影響地災(zāi)點分布的權(quán)重因子客觀規(guī)律略有差異。結(jié)合項目組野外調(diào)查資料,隨機選取兩種模型存在差異的地災(zāi)點進行驗證,分析其歷史受災(zāi)情況,以及工程巖組特征、高程等多個因子的分布規(guī)律,綜合分析認為信息量模型得出的災(zāi)害點分布規(guī)律更加符合野外實際情況。

表7 兩種模型地質(zhì)災(zāi)害易發(fā)性分區(qū)對比分析表Table 7 Comparative analysis table of two models of geological hazard-prone areas

圖4 研究區(qū)地質(zhì)災(zāi)害易發(fā)性分區(qū)對比圖Fig.4 Comparative map of susceptibility zoning in study areaA.信息量模型;B.信息量法+Logistic回歸模型。

ROC曲線即受試者工作特征曲線,是地質(zhì)災(zāi)害易發(fā)區(qū)域評價精度驗證的常用方法[15-16]。AUC(Area Under Curve)表示ROC曲線下的面積,是度量分類模型好壞的一個標準,其值介于0~1間,越接近1,則模型模擬值和樣本值越接近;AUC評價指標值越大,則代表模型分類結(jié)果的準確性越高,即模型精度越高。

檢驗結(jié)果顯示,信息量模型和信息量法+Logistic回歸模型的AUC值分別為0.759和0.764(圖5、表8),漸近顯著性b均<0.05;信息量法+Logistic回歸模型比信息量模型AUC值略高,AUC值差異不明顯,說明兩種模型的評價結(jié)果差異不大。由于信息量法+Logistic回歸模型在計算過程中剔除了工程巖組評價因子,實際野外地質(zhì)災(zāi)害隱患點分布特征與工程巖組密切相關(guān),結(jié)合兩種模型的面積分布及地災(zāi)點分布規(guī)律,選擇更接近于實際災(zāi)害隱患點信息量模型作為十堰市鄖陽區(qū)地災(zāi)易發(fā)性評價模型。

圖5 ROC曲線Fig.5 ROC curve圖中紅線為信息量模型ROC曲線,藍線為信息量法+Logistic回歸模型ROC曲線。

表8 AUC檢驗結(jié)果Table 8 Test results of AUC

部分學(xué)者認為多種方法組合評價效果優(yōu)于單一方法評價[17-18],但是本文認為地災(zāi)易發(fā)性評價模型方法的選擇需要結(jié)合項目實際情況,綜合工程地質(zhì)、地形、地災(zāi)點的分布特征等多種因素,不能簡單依據(jù)統(tǒng)計學(xué)擬合參數(shù)來選擇數(shù)學(xué)模型方法,從而得出最優(yōu)的數(shù)學(xué)模型評價地質(zhì)災(zāi)害的易發(fā)性。

在地質(zhì)災(zāi)害評價中數(shù)學(xué)模型的選擇不一定兩種方法模型疊加使用較一種模型效果好,需要結(jié)合項目實際情況來選擇合適的數(shù)學(xué)模型。

6 結(jié)論

選取坡度、高程、距道路的距離、距斷層的距離、距水系的距離、植被指數(shù)、工程巖組等7個影響因子作為十堰市鄖陽區(qū)地質(zhì)災(zāi)害易發(fā)性評價因子,利用信息量模型以及信息量法+Logistic回歸模型對該區(qū)地質(zhì)災(zāi)害易發(fā)性進行評價,同時與單獨使用的信息量模型評價結(jié)果進行對比分析,研究結(jié)果如下:

(1) 基于信息量模型對研究區(qū)進行地質(zhì)災(zāi)害易發(fā)性評價的結(jié)果表明,極高易發(fā)區(qū)和高易發(fā)區(qū)主要分布在青曲鎮(zhèn)—城關(guān)鎮(zhèn)—青山鎮(zhèn)地帶,與實際的地質(zhì)災(zāi)害隱患點分布一致,低易發(fā)區(qū)和極低易發(fā)區(qū)中,地質(zhì)災(zāi)害隱患點占比只有6.9%,模型預(yù)測效果較信息量法+Logistic回歸模型好。

(2) 利用ROC曲線精度檢驗結(jié)果顯示,信息量模型和信息量法+Logistic回歸模型的AUC值分別為0.759和0.764,評價結(jié)果對比兩者差別不大,兩者均能較為客觀準確地評價鄖陽區(qū)地質(zhì)災(zāi)害易發(fā)性,但是由于工程巖組評價因子在信息量法+Logistic回歸模型中Sig.值無法通過顯著性檢驗,考慮到實際地災(zāi)隱患點分布與工程巖組有一定的相關(guān)性,故選用信息量模型作為十堰市鄖陽區(qū)地質(zhì)災(zāi)害易發(fā)性評價的結(jié)果。

(3) 在地質(zhì)災(zāi)害評價中數(shù)學(xué)模型的選擇不一定兩種方法模型疊加使用較一種模型效果好,需要結(jié)合項目實際情況來選擇合適的評價模型。

猜你喜歡
鄖陽十堰市信息量
湖北省十堰市東風(fēng)61小學(xué)五(5)中隊
《寶藏》通聯(lián)站展示之窗 湖北省 十堰市
寶藏(2021年10期)2021-11-22 06:00:22
傾情水利作貢獻 深耕水保為民生
——記鄖陽區(qū)水土保持局局長鄭全新
基于信息理論的交通信息量度量
水源漢江 石聚鄖陽——2017中國·鄖陽南水北調(diào)奇石邀請展
寶藏(2017年6期)2017-07-20 10:01:06
2017中國·鄖陽南水北調(diào)奇石邀請展
寶藏(2017年4期)2017-05-17 03:34:04
如何增加地方電視臺時政新聞的信息量
新聞傳播(2016年11期)2016-07-10 12:04:01
十堰市鄖陽區(qū)中小學(xué)踐行“五和”精神
喜迎五十華誕 譜寫發(fā)展新篇 蓬勃發(fā)展中的十堰市太和醫(yī)院
基于多尺度互信息量的數(shù)字視頻幀篡改檢測
計算機工程(2015年4期)2015-07-05 08:29:20
五河县| 丹东市| 大足县| 大埔区| 鹤庆县| 思南县| 东乡族自治县| 阿荣旗| 苗栗县| 泾阳县| 衡东县| 辉县市| 通河县| 夏河县| 浦东新区| 桑日县| 嘉祥县| 大丰市| 阳西县| 呈贡县| 应用必备| 象山县| 上栗县| 达州市| 昌都县| 沐川县| 满城县| 高邑县| 天祝| 彩票| 武功县| 富宁县| 乡城县| 永丰县| 宁陕县| 富锦市| 邛崃市| 平陆县| 西峡县| 宾川县| 达尔|