王團輝,王 超,2,李岳峰,徐健琿,王琦瑋
(1.昆明理工大學 國土資源工程學院,云南 昆明650093;2.自然資源部高原山地地質(zhì)災害預報預警與生態(tài)保護修復重點實驗室,云南 昆明650093)
近年來,隨著社會經(jīng)濟的不斷發(fā)展,巖土體工程數(shù)量快速增加,其中邊坡安全問題受到了越來越多的關注。邊坡失穩(wěn)可能會對人民生命財產(chǎn)安全造成重大影響[1-3],自然資源部2022年發(fā)布的2021年全國地質(zhì)災害災情統(tǒng)計數(shù)據(jù)顯示,我國發(fā)生的滑坡事故數(shù)量為2 335起,占地質(zhì)災害總起數(shù)的48.93%,居于首位[4]。據(jù)2023年2月24日央視新聞報道,內(nèi)蒙古自治區(qū)阿拉善盟阿拉善左旗新井煤業(yè)有限公司礦區(qū)發(fā)生山體滑坡,造成6人死亡,47人失聯(lián)[5-6]。因此,邊坡失穩(wěn)防治是巖土工程的重要研究課題之一[7-8]。為了降低邊坡失穩(wěn)帶來的危害,開展邊坡穩(wěn)定性預測研究十分必要[9]。
目前,邊坡穩(wěn)定性預測通常分為定量和定性兩類方法。定性分析方法主要有地質(zhì)分析法、工程地質(zhì)類比法等[10-11],該類方法綜合考慮了影響邊坡的多種因素,但主觀性較強。定量分析方法包括確定性分析和不確定性分析,確定性分析主要采用極限平衡法和數(shù)值分析法[12-13]。邊坡工程是一個復雜的非線性系統(tǒng)[14],其穩(wěn)定性受多種不確定性因素的影響。不確定性方法在處理非線性問題上具有較好的預測效果,隨著人工智能算法的興起,不確定性分析已成為目前常用的分析方法,如模糊層次綜合評判法[15]、灰色關聯(lián)度分析[16]、支持向量機(SVM)[17]、BP神經(jīng)網(wǎng)絡[18]、K近鄰(KNN)[19]、隨機森林(RF)[20]等。鑒于邊坡巖土體的結(jié)構(gòu)、巖土體構(gòu)成及物理力學性質(zhì)的不確定性和非線性特點[9],國內(nèi)外學者多從降維的角度出發(fā)進行邊坡穩(wěn)定性研究,如:姚怡等[21]通過主成分分析(PCA)進行降維,消除指標之間的相關性,建立了徑向核函數(shù)(ERBF)優(yōu)化的SVM模型;EANG等[22]采用層次聚類分析(HCA)和主成分分析(PCA)對邊坡穩(wěn)定性進行了預測;IVANOV等[23]通過主成分分析對土質(zhì)邊坡穩(wěn)定性的影響因素進行了特征提取;SANTOS 等[24]采用主成分分析、判別分析和置信度對露天礦邊坡穩(wěn)定性進行了評估;高峰等[25]利用PCA降低了數(shù)據(jù)的冗余性,建立了基于粒子群優(yōu)化算法的極限學習機模型;馮澤杰[26]利用Z-Score主成分分析及代數(shù)迭代算法(ART)提高了邊坡穩(wěn)定性的預測精度;陳建宏等[27]建立了PCA和BP神經(jīng)網(wǎng)絡的預測模型,對邊坡穩(wěn)定性進行了預測;高文華等[28]利用PCA優(yōu)化了BP神經(jīng)網(wǎng)絡的運行效率;宋鑫華等[29]建立了PCA-Logistic模型,其能夠有效處理樣本數(shù)據(jù),提升模型的準確性。
以上研究都是基于PCA降維來消除指標之間的相關性,鮮有學者運用升維思想即用高維空間的線性運算來代替原始空間的非線性運算[30]。基于此,本文利用核主成分分析(KPCA)方法,通過維數(shù)提升來挖掘高維空間中特征之間的關聯(lián),使處理后的數(shù)據(jù)更易于分類,建立基于KPCA-KNN算法的邊坡穩(wěn)定性預測模型,旨在提高模型的分類性能和效率。
KPCA是一種基于核方法的非線性主成分分析方法,其核心原理見圖1。核方法是一種基于核函數(shù)的學習算法,善于處理非線性問題,其核心思想是:將原始數(shù)據(jù)映射到更高維的空間進行線性運算,以減少計算量、提高運算效率。由于核主成分分析方法應用較廣,在此不再贅述,詳細計算步驟見文獻[31]。
圖1 KPCA核心原理[30]
K近鄰算法是一種常見的機器學習算法,能夠高效處理分類和回歸問題,其核心思想是:在確定各個樣本之間距離的前提下,通過樣本間的距離來界定該樣本與特征空間內(nèi)K個樣本的親疏關系,根據(jù)最相鄰的K個樣本的類別來判定該樣本的所屬類別[32],其核心原理見圖2。
圖2 K近鄰算法核心原理[33]
若有n個訓練對象,利用K近鄰算法對待分類樣本xnew進行分類。首先找到K個距離xnew最近的訓練樣本點,根據(jù)K組樣本的類別投票確定xnew所屬類別。距離可用歐氏距離計算:
(1)
式中,xi為已知類別樣本。
在實際工程中,影響邊坡穩(wěn)定性的因素眾多,主要包括地層、巖性、地質(zhì)構(gòu)造、地應力、巖體結(jié)構(gòu)、水的作用、邊坡的幾何形狀和表面形態(tài)等[34]。其中邊坡高度、邊坡角是基本的邊坡幾何參數(shù);影響邊坡穩(wěn)定性的巖土體物理力學指標主要是容重、黏聚力、內(nèi)摩擦角和孔隙壓力比等。一般而言,巖土體的容重、黏聚力、內(nèi)摩擦角越大,邊坡越穩(wěn)定;反之,則邊坡越容易失穩(wěn)[35]。在水的作用方面,可以用孔隙壓力比來表征注液量變化和降雨過程[36]。借鑒前人的研究成果,選取容重(γ)、黏聚力(c)、內(nèi)摩擦角(φ)、邊坡角(φf)、邊坡高度(H)、孔隙壓力比(ru)等6個指標作為輸入指標,邊坡狀態(tài)作為輸出指標。模型構(gòu)建流程見圖3。本文在文獻[37]所收集的邊坡實例中選取55組樣本建立數(shù)據(jù)庫,部分數(shù)據(jù)見表1。
表1 樣本原始數(shù)據(jù)
圖3 模型構(gòu)建流程
為了消除指標量綱對預測模型的影響,本文選取統(tǒng)一極差處理法對樣本的原始數(shù)據(jù)進行處理[38],計算式為
(2)
將預處理后的樣本數(shù)據(jù)進行KPCA處理,處理后的指標由K1-K6代替,得到的數(shù)據(jù)見表2。
表2 KPCA數(shù)據(jù)處理結(jié)果
K值作為KNN算法的超參數(shù)之一,直接影響模型的性能。K值過小,訓練誤差減小,但會出現(xiàn)過擬合現(xiàn)象;K值過大,泛化能力提高,但誤差增大,易出現(xiàn)欠擬合。本文結(jié)合文獻[19]中的K值尋優(yōu)方法,最后取最優(yōu)K值為5。
分別將KPCA處理前和處理后的數(shù)據(jù)劃分為訓練集(40個樣本)和測試集(15個樣本),將數(shù)據(jù)導入KNN模型并進行5倍交叉驗證(交叉驗證原理見圖4)。
對測試集中的樣本進行預測,結(jié)果見表3。由表3可知,本文模型的預測結(jié)果與實際等級完全吻合,而傳統(tǒng)KNN模型、BP神經(jīng)網(wǎng)絡模型、SVM模型均出現(xiàn)了錯判。
表3 測試集樣本預測結(jié)果
各模型的準確率-召回率見圖5。由圖5可知,經(jīng)過KPCA處理的KNN模型準確率和召回率均為100%,未經(jīng)過KPCA處理的KNN模型則為70.6%,BP神經(jīng)網(wǎng)絡和SVM的準確率和召回率也不及本文模型。
圖5 準確率-召回率
各模型的F1-訓練時間見圖6。由圖6可知,指標F1-score(同時考慮精確率和召回率,在0~1范圍內(nèi),越靠近1表示效果越好)在本文模型預測中達到峰值1,且本文模型的訓練時間為0.044 s,均短于其他3種模型。
圖6 F1-訓練時間
綜上,經(jīng)過KPCA方法處理的數(shù)據(jù)可以提高KNN算法的準確率并縮短訓練時間,是對原模型的進一步優(yōu)化。
選取6組國內(nèi)外邊坡實例進行穩(wěn)定性預測[37],同時將預測結(jié)果與傳統(tǒng)KNN、BP神經(jīng)網(wǎng)絡、SVM的預測結(jié)果進行對比,結(jié)果見表4。由表4可知,本文模型預測結(jié)果與實際邊坡情況完全相符,其余3種對比模型均出現(xiàn)了錯判(KNN錯判2個,BP和SVM各錯判1個)。由此可見,經(jīng)過KPCA處理的KNN預測模型效果最好,進一步驗證了本文模型的準確性和合理性。
表4 預測結(jié)果對比
a.本文以55組邊坡實例樣本為研究對象,選取容重、黏聚力、內(nèi)摩擦角、邊坡角、邊坡高度、孔隙壓力比作為邊坡穩(wěn)定性預測指標,并采用統(tǒng)一極差處理法對樣本指標的原始數(shù)據(jù)進行處理,消除了指標量綱的影響。
b.運用核主成分分析將樣本指標數(shù)據(jù)映射到高維空間進行線性運算,經(jīng)過訓練構(gòu)建了KPCA-KNN邊坡穩(wěn)定性預測模型,模型測試集準確率和召回率均為100%,F1-score達到峰值1且訓練時間短。
c.6組工程實例預測結(jié)果與邊坡實際狀態(tài)完全相符,且優(yōu)于傳統(tǒng)的KNN、BP神經(jīng)網(wǎng)絡、SVM模型,表明本文建立的KPCA-KNN模型是一種有效的邊坡穩(wěn)定性預測方法。在后續(xù)的工程應用中,可根據(jù)工程需要,基于MATLAB平臺建立數(shù)據(jù)采集、數(shù)據(jù)預處理、質(zhì)量控制和分析預測等一體化邊坡穩(wěn)定性實時監(jiān)測系統(tǒng),以實現(xiàn)邊坡穩(wěn)定性監(jiān)測預警的智能化和可視化。