国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于邏輯回歸模型的汶川地震災區(qū)崩塌滑坡易發(fā)性評估

2021-04-15 06:14楊偉華楊志強趙建林梁詠琪
湖北農業(yè)科學 2021年6期
關鍵詞:易發(fā)回歸系數(shù)汶川

楊偉華,楊志強,趙建林,梁詠琪

(長安大學地質工程與測繪學院,西安710054)

崩塌、滑坡災害是常見的地質災害,隨著中國社會經(jīng)濟的發(fā)展、建設規(guī)模的擴大,特別是近年來洪澇、地震自然災害的頻繁發(fā)生和各種交通以及水利等工程的大規(guī)模建設,促使崩塌、滑坡災害高發(fā)期的形成,崩塌、滑坡災害造成的損失也愈來愈大[1]。因此,崩滑災害的風險預警顯得尤為重要。易發(fā)性(Susceptibility)評估是崩滑災害預警常見的研究方法。

易發(fā)性的研究方法較多,在早期主要采用統(tǒng)計分析方法。然而,隨著地理信息系統(tǒng)和人工智能技術的發(fā)展,各種機器學習方法開始應用于相關研究,如信息量模型[2]、支持向量機法[3]、確定性系數(shù)法[4]、層次分析法[5]、證據(jù)權法[6]、頻率比模型[7]、邏輯回歸模型[8]等。隨著機器學習方法越來越多,一些研究將不同分析方法運用到同一區(qū)域崩滑易發(fā)性評價中,以比較不同方法的精度。國外學者中有Kalan?tar等[9]基于支持向量機、人工神經(jīng)網(wǎng)絡和邏輯回歸模型對伊朗Dodangeh流域的滑坡易發(fā)性進行評價,并對比每種方法的準確性;Reis等[10]采用頻率比模型、邏輯回歸模型和模糊邏輯模型對伊朗Zab盆地滑坡易發(fā)性進行研究;國內程霄[11]基于邏輯回歸模型和信息量模型對汶川映秀地區(qū)的崩滑易發(fā)性進行評估,并對比兩種方法的結果;馮凡[12]應用信息量模型、證據(jù)權模型和邏輯回歸模型對黃河中游流域的石樓-吉縣段的崩滑易發(fā)性進行評價和分區(qū);王瀟[13]利用確定性系數(shù)法、信息量模型和邏輯回歸模型對汶川災區(qū)的崩滑易發(fā)性進行評估;Xu等[14]應用層次分析、證據(jù)權、二元統(tǒng)計、邏輯回歸、人工神經(jīng)網(wǎng)絡和支持向量機模型對汶川地震災區(qū)進行滑坡災害易發(fā)性分區(qū)研究,并對各個結果進行了對比分析。通過上述對不同評價模型的對比研究,表明邏輯回歸(Logistic regression)模型具有計算簡單、物理意義明確和準確度高等優(yōu)點,因而在崩滑易發(fā)性評估中取得了較廣泛的應用。不僅如此,在大尺度區(qū)域范圍進行崩滑易發(fā)性評價時,邏輯回歸模型具有顯著的優(yōu)越性[15]。Broeckx等[15]應用邏輯回歸模型預測了整個非洲區(qū)域的崩滑易發(fā)性并得到了較好的結果;Greco等[16]使用邏輯回歸模型對意大利Calabria地區(qū)的滑坡易發(fā)性進行預測;Mandal等[17]采用邏輯回歸模型對喜馬拉雅山大吉嶺地區(qū)崩滑易發(fā)性進行評估并取得良好的效果。

汶川地震災區(qū)由于地質地貌條件復雜,震后崩塌滑坡災害頻發(fā),因此對該區(qū)域的崩滑災害易發(fā)性進行綜合評估具有重要的研究意義[18]。很多專家學者對汶川災區(qū)崩滑易發(fā)性開展了研究[19,20],但大部分研究都集中在小區(qū)域范圍內[21,22],缺少對整個汶川地震災區(qū)大尺度范圍的研究。本研究基于汶川地震災區(qū)的崩塌滑坡災害監(jiān)測數(shù)據(jù)庫,選取地質、地貌、土地利用、降雨量等崩滑災害誘發(fā)因子,利用邏輯回歸(LR)模型對整個汶川震區(qū)進行崩滑易發(fā)性評估,以探討LR模型在該區(qū)域的適用性,深入探索該區(qū)域崩滑災害與影響因子的關系,研究成果也將為汶川災區(qū)的防災減災工作提供數(shù)據(jù)支持。

1 研究區(qū)概況

5·12汶川地震是2008年5月12日14時28分04秒發(fā)生的8.0級地震,震中位于四川省汶川縣的映秀鎮(zhèn)與漩口鎮(zhèn)交界處,波及范圍包括震中50 km范圍內的縣城和200 km范圍內的大中城市,中國除黑龍江、吉林、新疆外均有不同程度的震感,其中,以川陜甘三省震情最為嚴重。本研究主要基于中國四川省、陜西省、甘肅省3個震情嚴重的省份,根據(jù)胡偉華等[23]按照烈度區(qū)劃分的汶川地震受災等級,選取極重災區(qū)、嚴重災區(qū)和較重災區(qū)中的22個縣作為具體研究區(qū)域。22個縣的地理區(qū)位以及地震影響程度如圖1所示,該區(qū)域位于地貌第一階梯向第二階梯的過渡帶上,南北大斷裂帶的鮮水河斷裂(龍門山斷裂)-安寧河斷裂-小江斷裂-紅河斷裂縱貫其間,巨大的地形起伏,復雜的地質構造,加上受西南季風影響形成的獨特氣候,導致該區(qū)域的崩塌、滑坡災害頻發(fā)[24]。

圖1 研究區(qū)域

2 方法與數(shù)據(jù)

2.1 邏輯回歸模型介紹

邏輯回歸模型是二項分類因變量常用的統(tǒng)計分析模型,它描述的是因變量崩滑是否發(fā)生(0代表不發(fā)生,1代表發(fā)生)和多個致災因子( )x1,x2,x3,…,xn之間的關系。該模型中自變量可以是連續(xù)的也可以是離散的,不需要滿足正態(tài)的頻率分布。邏輯回歸函數(shù)表達式為:

式中,P為崩滑發(fā)生概率,范圍為[0,1];α為邏輯回歸計算出的一個常數(shù)項;βi為邏輯回歸計算而得出的回歸系數(shù);i為評價因子種類數(shù)目。

2.2 汶川地震災區(qū)的崩塌滑坡分布

崩滑數(shù)據(jù)編錄是研究區(qū)域內崩塌滑坡分布的重要依據(jù)。本研究采用的崩塌滑坡數(shù)據(jù)是通過查找文獻資料以及當?shù)叵嚓P部門建立的崩滑數(shù)據(jù)集所得,該數(shù)據(jù)集主要記錄了發(fā)生在該區(qū)域的地質災害,包括總共6 007條滑坡、崩塌數(shù)據(jù),其中,滑坡點1 172個,崩塌點4 835個,崩滑災害在該區(qū)域的分布如圖2所示。在研究區(qū)范圍內,崩滑災害多發(fā)生在極重災區(qū),崩滑點占歷史樣本的65.6%,崩滑點尤其密集,甚至在幾近重合的位置不斷發(fā)生;嚴重災區(qū)崩滑點數(shù)據(jù)占歷史樣本的22.4%;較重災區(qū)崩滑點數(shù)據(jù)占歷史樣本的12%;總體來說呈現(xiàn)極重災區(qū)、嚴重災區(qū)、較重災區(qū)崩滑密度不斷減小的趨勢。

圖2 汶川災區(qū)崩滑分布

2.3 崩滑影響因子的選擇

崩滑災害易發(fā)性評價準確性依賴于相關評價因子的選擇,目前不同的地區(qū)針對崩滑災害影響因子的選取存在差異,但主要包括地質條件、地貌情況、氣候因子以及其他相關因子,如土地利用等人類活動因子[25]?;谇叭搜芯炕A以及研究區(qū)域相關數(shù)據(jù)可獲得性,本研究選取高程、坡度、坡向、巖性、距斷層距離、降雨量、土地利用類型共7個因子作為崩滑災害影響因子。

研究區(qū)的地貌因子(高程、坡度和坡向)通過DEM數(shù)據(jù)提取。DEM數(shù)據(jù)為來源于地理空間數(shù)據(jù)云平臺(http://www.gscloud.cn/search),空間分辨率為30 m。其中,高程因子以400 m為間隔分為12級;坡度以10°為間隔分為9級,坡向按方向分為9級。本研究選取2個地質條件因子即巖性和斷層活動影響,地質條件及巖性數(shù)據(jù)主要來源于中國地質科學院地質數(shù)據(jù)共享網(wǎng)站(http://www.geoscience.cn)1∶250萬的斷層分布矢量圖和巖性矢量圖。研究區(qū)主要涵蓋九大巖性,分別標記為巖性0、11、12、13、14、15、16、17、21,巖性數(shù)字所代表的具體巖土類型見表1。基于斷層矢量圖,對區(qū)域不同斷層影響進行歐氏距離評價,并以1 000 m為間隔,將斷層影響距離分為18級。本研究利用該區(qū)域1995—2015年20年平均降雨量代表該區(qū)域的氣候條件,降雨量數(shù)據(jù)來源于中國科學院資源環(huán)境科學數(shù)據(jù)中心(http://www.resdc.cn/data.aspx?DATAID=229),空間分辨率為1 000 m。土地利用類型數(shù)據(jù)來源于全球變化科學研究數(shù)據(jù)出版系統(tǒng)(http://geodoi.ac.cn/We?bCn/doi.aspx?Id=177),本研究集中2010年的土地利用數(shù)據(jù),按照土地利用類型不同,可分為耕地、林地、草地、水域、建設用地、未利用土地、其他用地共7類,空間分辨率為100 m。所有數(shù)據(jù)轉換為30 m×30 m柵格數(shù)據(jù)(圖3)。

表1 巖性類型及其代表的詳細巖性說明

2.4 基于邏輯回歸模型的易發(fā)性評價流程

首先,將研究區(qū)6 007個崩滑點作為崩滑樣本點(圖2)。隨機選取2/3的崩滑點即4 005個崩滑點作為訓練樣本,余下1/3的崩滑點即2 002個崩滑點作為驗證樣本。對所有崩滑點建立1 km的緩沖區(qū),在緩沖區(qū)外隨機生成6 007個非崩滑點,隨機選取2/3的非崩滑點即4 005個非崩滑點作為訓練樣本,余下1/3的非崩滑點即2 002個非崩滑點作為驗證樣本。至此,4 005個崩滑點和4 005個非崩滑點共8 010個點作為訓練樣本集。2 002個崩滑點和2 002個非崩滑點共4 004個點作為驗證樣本集?;谏鲜鼋⒌挠柧殬颖咎崛∠嚓P崩滑影響因子,利用邏輯回歸模型對該區(qū)域崩滑易發(fā)性進行評價,并用歷史崩滑點分布情況和ROC(Receiver operating characteristic curve)曲線[26]來對評估結果精度進行交叉驗證。本研究空間分析主要基于ArcGIS平臺,邏輯回歸及相關統(tǒng)計分析基于SPSS平臺。

圖3 研究區(qū)崩滑易發(fā)性評價因子分級

3 結果與分析

3.1 汶川震區(qū)崩滑災害影響因子分析

利用SPSS軟件的二元邏輯回歸模塊,采用向前最大似然法對建立的8 010個訓練樣本點進行邏輯回歸分析,得到每個崩滑影響因子各個分級的回歸系數(shù),該系數(shù)越大,則表明該分級在這個崩滑影響因子中危險性越高[27]。各影響因子的分級回歸系數(shù)以及各分級分類面積與崩滑點密度如圖4所示。設每個影響因子的第一個分級的回歸系數(shù)為0,同因子其他不同分級的回歸系數(shù)值與其進行對比,若值為正,則表明該分級的崩滑易發(fā)性比第一個分級大;若值為負,則表明該分級的崩滑易發(fā)性比第一個分級小。整個回歸分析結果的常數(shù)α為-25.76。

基于崩滑條目對各個影響因子進行分析,各因子對崩滑形成的影響情況(圖4)如下。

1)高程。68%的崩滑點分布在1 000~2 600 m,這個區(qū)間段的崩滑點密度和回歸系數(shù)也相對最高,說明這個區(qū)間段崩滑易發(fā)性較大(圖4a)。

2)坡度。75%的崩滑點分布在20°至50°的坡度范圍內,很大一部分原因是因為這個坡度區(qū)間段的面積較大,崩滑點密度基本上隨著坡度升高而增大,回歸系數(shù)完全隨著坡度升高而增大,說明崩滑易發(fā)性是隨著坡度升高而增大(圖4b)。

3)坡向。39%的崩滑點分布在東向和東南向,這2個方向崩滑點密度和回歸系數(shù)相對最高,表明東向和東南向風險較大(圖4c)。

4)距斷層距離。53%的崩滑點分布在距斷層2 500 m的范圍內,崩滑點密度和回歸系數(shù)也相對較大,表明距斷層距離越小,崩滑易發(fā)性越高(圖4d)。

5)巖性。巖性0、17、21由于面積較小,參考性不足,巖性11、12、13、14、15、16崩滑點密度逐漸增大,回歸系數(shù)也基本上逐漸增大,說明崩滑易發(fā)性逐漸上升(圖4e)。

6)降雨量。77%的崩滑點集中在900~1 100 mm,崩滑點密度和回歸系數(shù)也相對較高,表明該區(qū)間段易發(fā)性較高(圖4f)。

7)土地利用類型。98%的崩滑點集中在耕地、林地和草地,其中,62%的崩滑點集中在林地,其崩滑點密度最大,回歸系數(shù)也最大,說明林地崩滑易發(fā)性最高(圖4g)。

3.2 崩滑易發(fā)性評估結果

通過對各影響因子分級回歸系數(shù)的求取,將其代入邏輯回歸模型中進而預測整個研究區(qū)域的崩滑易發(fā)性概率,并生成崩滑災害易發(fā)性概率,如圖5所示,該概率圖反映了研究區(qū)域的崩滑易發(fā)性程度,概率值越大,則崩滑易發(fā)性越高。

每隔0.2為1個級別,根據(jù)崩滑易發(fā)性概率將研究區(qū)分為極低風險區(qū)(0~0.2)、低風險區(qū)(0.2~0.4)、中風險區(qū)(0.4~0.6)、高風險區(qū)(0.6~0.8)和極高風險區(qū)(0.8~1.0),如圖6所示。高風險區(qū)和極高風險區(qū)的崩滑點密度極高,這2個區(qū)域也基本集中在汶川地震極重災區(qū),如北川縣、汶川縣、茂縣、綿竹市、青川縣、平武縣。

3.3 模型精度評價與檢驗

圖5 崩滑易發(fā)性概率

圖6 崩滑易發(fā)性分區(qū)

為了對估算的汶川震區(qū)崩滑災害易發(fā)性評價結果進行檢驗,本研究采取ROC曲線值以及歷史崩滑點在不同崩滑易發(fā)性分區(qū)中的分布情況來進行交叉驗證。受試者工作特征曲線(ROC曲線)是檢驗崩滑易發(fā)性評價模型精度的常用方法,以未發(fā)生崩塌滑坡的單元被正確預測的比例(假陽性率)為橫坐標,以發(fā)生崩塌滑坡的單元被正確預測的比例(真陽性率)為縱坐標繪制曲線。其評估準則為:當AUC(ROC曲線下與坐標軸圍成的面積)<0.5時,預測結果相反;當AUC=0.5時,模型預測結果隨機;AUC為(0.5,0.7]時,模型預測結果準確度較低;AUC為(0.7,0.9]時,模型預測結果準確度較高;當AUC>0.9時,模型預測結果準確度極高[28]。

在本次研究中,將訓練樣本和驗證樣本的數(shù)據(jù)分別導入SPSS進行分析,得到訓練樣本的AUC為0.84,驗證樣本的AUC為0.79,如圖7所示,表明本研究邏輯回歸模型的預測準確率較高。

對每個易發(fā)性分區(qū)的面積與其中發(fā)生的崩滑點數(shù)量與密度的統(tǒng)計結果見圖8和表2。由圖8和表2可知,在低風險區(qū)和極低風險區(qū),崩滑發(fā)育的數(shù)量極少,而隨著風險性的提高,崩滑發(fā)育迅速增多,尤其在高風險區(qū)和極高風險區(qū),崩滑點數(shù)量和密度急劇上升。說明歷史崩滑點分布情況與崩滑易發(fā)性分區(qū)圖擬合程度較好,本研究崩滑易發(fā)性分區(qū)圖精確度較高。

圖8 不同易發(fā)性分級崩滑點分布情況

表2 崩滑易發(fā)性分區(qū)統(tǒng)計

4 小結

以汶川地震災區(qū)為研究區(qū)域,本研究選擇了地質(巖性、斷層)、地貌(高程、坡度、坡向)、氣候(降雨)、土地利用類型共7個崩滑影響因子?;谶壿嫽貧w模型得到每個因子各個分級的回歸系數(shù),進行圖層疊加分析,得到整個研究區(qū)域的崩滑易發(fā)性分區(qū)圖。結果表明,歷史崩滑點分布狀況與崩滑易發(fā)性分區(qū)圖擬合程度較好,易發(fā)性分區(qū)圖準確度較高,汶川縣、茂縣、北川縣、綿竹市、青川縣、平武縣為崩滑易發(fā)性較高的區(qū)域,與劃分的區(qū)縣危險性等級一致。通過ROC曲線對模型精度進行驗證,表明模型的成功率為84%,預測率為79%,研究成果準確率較高。由于預測結果準確度較好,本研究成果可為汶川地震災區(qū)崩滑災害的防災減災工作提供有價值的參考。

猜你喜歡
易發(fā)回歸系數(shù)汶川
機用鎳鈦銼在乳磨牙根管治療中的應用
貴州省地質災害易發(fā)分區(qū)圖
云上遠眺新汶川
夏季羊易發(fā)疾病及防治方法
冬季雞腸炎易發(fā) 科學防治有方法
多元線性回歸的估值漂移及其判定方法
多元線性模型中回歸系數(shù)矩陣的可估函數(shù)和協(xié)方差陣的同時Bayes估計及優(yōu)良性
健康中國的汶川實踐
On Commuting Graph of Group Ring ZnS3?
我在汶川掛職的日子