劉永紅 屈希峰
隧道巖爆一旦發(fā)生,破壞力較大,可能傷及人員和設(shè)備。傳統(tǒng)隧道巖爆分級:一是通過工程類比、經(jīng)驗判據(jù);二是利用數(shù)值分析,主要有剪切抗壓強(qiáng)度比法、應(yīng)力比法、臨界深度法等。文章旨在研究國內(nèi)外22個項目104組巖爆分級數(shù)據(jù),通過機(jī)器學(xué)習(xí)LGBM分類算法預(yù)測隧道巖爆分級。該分析方法可用在其他室內(nèi)試驗或監(jiān)測檢測領(lǐng)域,為工程決策提供依據(jù)。
隧道; 巖爆分級; 機(jī)器學(xué)習(xí); LGBM算法
U456.3+3B
[定稿日期]2021-06-22
[作者簡介]劉永紅(1979~),男,碩士,高級工程師,從事巖土工程設(shè)計與施工工作。
隧道巖爆是隧道掌子面或洞壁在高地應(yīng)力條件下出現(xiàn)巖塊爆裂、剝落、彈(拋)射、氣浪、發(fā)聲甚至產(chǎn)生震動的現(xiàn)象,它是由于原先巖體在三向應(yīng)力狀態(tài)所積蓄的應(yīng)變能在開挖暴露形成臨空面后,使圍巖失穩(wěn),突然瞬間轉(zhuǎn)換為沖擊動能的地質(zhì)災(zāi)害,破壞力較大,可能傷及人員和設(shè)備[1]。
2009年11月28日四川涼山州冕寧錦屏水電站發(fā)生巖爆坍塌事故,造成多人死亡,數(shù)億元人民幣的經(jīng)濟(jì)損失[2];2014年3月9日,云南貢山縣獨(dú)龍江公路隧道內(nèi)發(fā)生因巖爆造成的巖石結(jié)構(gòu)坍塌風(fēng)險事故,3名施工管理人員不幸被墜落的巖石砸中遇難[3];2015年5月31日,巴基斯坦NJ水電站引水隧洞發(fā)生巖爆,造成TBM嚴(yán)重?fù)p壞、3人死亡17人受傷[2].隨著埋深的增加和應(yīng)力水平的增高,地下工程巖爆呈頻發(fā)趨勢[3]。
傳統(tǒng)隧道巖爆分級:一種方法是通過經(jīng)驗判據(jù)、工程類比;二是利用數(shù)值分析,主要有剪切抗壓強(qiáng)度比法、應(yīng)力比法、臨界深度法等。隨著數(shù)據(jù)挖掘技術(shù)和深度學(xué)習(xí)技術(shù)的不斷發(fā)展,全面考慮多個影響因素的非線性巖爆預(yù)測方法取得了良好的預(yù)測效果,是一種值得研究、推廣的方法[4]。
本文通過研究天生橋二級水電站、龍羊峽水電站、李家峽水電站、挪威Sewage隧道、意大利Raibl鉛硫化鋅礦、秦嶺隧道、江邊水電站、金川二礦、馬路坪礦、北洺河鐵礦、錦屏二級電站、蒼嶺隧道、二郎山隧道等22個工程,共104組巖爆分級數(shù)據(jù),通過機(jī)器學(xué)習(xí)LGBM分類算法預(yù)測隧道巖爆分級。
1 數(shù)據(jù)描述
本次所采用的數(shù)據(jù)主要由4個參數(shù)組成每組數(shù)據(jù),分別為:X1隧道巖石最大切向應(yīng)力與巖石單軸抗壓強(qiáng)度之比σθ/σc;X2巖石單軸抗壓強(qiáng)度與單軸抗拉強(qiáng)度之比σc/σt;X3彈性能量指數(shù)Wet;X4爆烈分級。巖爆可分為4個等級,輕微巖爆(Ⅰ級)、中等巖爆(Ⅱ級)、強(qiáng)烈?guī)r爆(Ⅲ級)和極強(qiáng)巖爆(Ⅳ級)。
巖爆的發(fā)生是多因素導(dǎo)致的,但是從根本上來講,巖體的內(nèi)部因素與外部條件決定了巖爆的發(fā)生。其中,內(nèi)部因素是指巖體本身的巖石力學(xué)性質(zhì),包括巖體自身的脆性、巖石的抗壓強(qiáng)度和儲存彈性能等因素;外部條件是指巖體工程的整體地質(zhì)環(huán)境以及環(huán)境的變化,如工程圍巖的地應(yīng)力水平和工程開挖方法等因素(表1、表2)。
從表2檢測結(jié)果整體描述可以看出該數(shù)據(jù)集無缺失值以及各數(shù)據(jù)的分布范圍。
2 特征重要性分析
2.1 特性向量相關(guān)性
在統(tǒng)計分析中,會用到相關(guān)系數(shù)進(jìn)行表達(dá),常用的相關(guān)系數(shù)有3種:Pearson相關(guān)系數(shù)、Spearman相關(guān)系數(shù)和Kendall相關(guān)系數(shù)。其中,Pearson相關(guān)系數(shù)是英國統(tǒng)計學(xué)家皮爾遜于20世紀(jì)提出的一種計算直線相關(guān)的方法,按照線性代數(shù)學(xué)水平理解,可以看做是兩組數(shù)據(jù)的向量夾角的余弦,計算如式(1)所示。
ρx,y=cov(X,Y)σxσy=EX-μxY-μyσxσy
=E(XY)-E(X)E(Y)EX2-E2(X)EY2-E2(Y)(1)
r通常表示樣本相關(guān)系數(shù),希臘字母ρ用于表示總體參數(shù)。相關(guān)系數(shù)的取值范圍為(-1,1),相關(guān)系數(shù)的正負(fù)號表示相關(guān)的方向,相關(guān)系數(shù)的含義理解如下:
(1)正值表示正相關(guān),負(fù)值表示負(fù)相關(guān),絕對值表示相關(guān)的程度。
(2)越接近1,表明兩個變量相程度越高。
(3)r=1為完全正相關(guān),r=-1為完全負(fù)相關(guān),r越接近0,表明兩個變量相關(guān)程度越低,r=0為零相關(guān)。
經(jīng)計算分析,與隧道巖爆分級相關(guān)因素之間的相關(guān)性如圖1所示。
根據(jù)圖1可以看出,X1與X3呈正相關(guān);X2與X3呈負(fù)相關(guān)。假定巖石單軸抗壓強(qiáng)度為定值,圍巖最大切向應(yīng)力越大,X1越大,即X3彈性能量指數(shù)越大;單軸抗拉強(qiáng)度越小,X2越大,X3彈性能量指數(shù)越小。這些規(guī)律與巖爆多發(fā)生在高地應(yīng)力區(qū)硬質(zhì)巖中的常識是一致的。
2.2 特征重要性排行
為進(jìn)一步分析各因素對的影響程度,對各特征向量的重要性進(jìn)行排行,如圖2所示。
根據(jù)圖2,可以看出對于巖爆分級的影響X1>X3>X2,硬質(zhì)巖在高賦能下,開挖出現(xiàn)臨空面,在剪應(yīng)力(切向應(yīng)力)作用下,極易發(fā)生巖爆。
3 LGBM回歸分析
3.1 LGBM計算原理
LGBM在原理上與GBDT及XGBoost類似,都是利用損失函數(shù)的負(fù)梯度作為當(dāng)前決策樹的殘差逼近來擬合新的決策樹。LGBM采用histogram算法,Histogram算法的基本思路是先把連續(xù)的浮點(diǎn)特征值離散化成k個整數(shù),同時構(gòu)造一個寬度為k的Histogram。在遍歷數(shù)據(jù)的時候,根據(jù)離散化后的值作為索引在Histogram中累積統(tǒng)計量,當(dāng)遍歷一次數(shù)據(jù)后,Histogram累積了需要的統(tǒng)計量,然后根據(jù)Histogram的離散值,遍歷尋找最優(yōu)的分割點(diǎn)[7]。
假設(shè)訓(xùn)練集中有n個實例x1,…,xn。每次梯度迭時,模型分析數(shù)據(jù)研究變量的損失函數(shù)的負(fù)梯度發(fā)展方向可表示為g1,…,gn,決策樹通過一個最優(yōu)分割點(diǎn)(最大信息系統(tǒng)增益點(diǎn))將數(shù)據(jù)分到各個不同節(jié)點(diǎn)[6]、[8]。GBDT通過分割后的方差來度量信息增益,例如O表示一個固定節(jié)點(diǎn)的訓(xùn)練集,d表示特征j的分割,定義為:
Vj|O(d)=1nO∑xi∈O:xij≤dgi2njl|O(d)+∑xi∈O:xij>dgi2njr|O(d)(2)
式中:nO=∑Ixi∈O,njlo=∑Ixi∈O:xi≥d,njr|O=∑Ixi∈O:xi>d
遍歷每個特征的每個分裂點(diǎn),找到dj=argmaxdVj(d),并計算得到最大的信息系統(tǒng)增益Vj(dj),然后,將數(shù)據(jù)可以根據(jù)不同特征j的分裂點(diǎn)dj將進(jìn)行數(shù)據(jù)分到左右子節(jié)點(diǎn)[5]。
3.2 LGBM訓(xùn)練分類
本文分析使用Python語言,安裝LGBM庫,在Jupyter Notebook中加載數(shù)據(jù)進(jìn)行分析[10]。
圖3中,y軸1~4分別對應(yīng)巖爆分級Ⅰ~Ⅳ,y軸分別為精確率(Precision)、召回率(Recall)、F1分?jǐn)?shù)、每行標(biāo)簽出現(xiàn)的次數(shù)(support)。由于訓(xùn)練數(shù)據(jù)相對較少,模型整體得分71.5。
在分類模型混淆矩陣中T、F、P、N的含義:T真,F(xiàn)假,P陽性,N陰性。其兩兩組合后,TP:預(yù)測為1,實際為1,預(yù)測正確;FP:預(yù)測為1,實際為0,預(yù)測錯誤;FN:預(yù)測為0,實際為1,預(yù)測錯誤;TN:預(yù)測為0,實際為0,預(yù)測正確[9]。
精確率(Precision)=TPTP+FP(3)
召回率(Recall)=TPTP+FN(4)
精確率和召回率以稱為查準(zhǔn)率和查全率,通常情況下,根據(jù)他們發(fā)展之間的平衡點(diǎn),定義進(jìn)行一個新的指標(biāo):F1分?jǐn)?shù)。F1評分兼顧了精確率和召回率,讓兩者同時達(dá)到最高水平,取得平衡。
F1=21Precision+1Recall(5)
3.3 模型測試
隨機(jī)選擇10行數(shù)據(jù)進(jìn)程測試,用機(jī)器學(xué)習(xí)訓(xùn)練好的模型進(jìn)行預(yù)測,結(jié)果見表3。
4 結(jié)論
(1)巖石切向應(yīng)力與蓄能指數(shù)正相關(guān),在工程中通過超前鉆孔注水,提前釋放巖石中蓄積的能量,可以有效降低巖爆發(fā)生的風(fēng)險。
(2)單軸抗拉強(qiáng)度與蓄能指數(shù)負(fù)相關(guān),也就是說硬巖抗拉強(qiáng)度越小,巖爆的風(fēng)險越大。
(3)數(shù)據(jù)集樣本數(shù)量偏少,在實踐中需要繼續(xù)搜集相關(guān)數(shù)據(jù),以提高預(yù)測的準(zhǔn)確度。
(4)本文的分析方法可用在其他室內(nèi)試驗或監(jiān)測檢測領(lǐng)域,為決策提供依據(jù)。
參考文獻(xiàn)
[1] 馮夏庭,陳炳瑞,張傳慶,等.巖爆孕育過程的機(jī)制、預(yù)警與動態(tài)調(diào)控[M].北京:科學(xué)出版社,2013.
[2] Feng X T.Rockburst: Mechanism,Monitoring,Warning and Mitigation[C] Elsevier - Health Sciences Division,2017.
[3] 中新網(wǎng)云南頻道.近期隧道坍塌事故匯總[OL].[2014-09-16].http://www.yn.chinanews.com/pub/html/spe-cial/2014/0916/20967.html.
[4] 王超,李岳峰,張成良.基于大樣本數(shù)據(jù)挖掘分析的巖爆烈度分級預(yù)測模型[J].昆明理工大學(xué)學(xué)報: 自然科學(xué)版,2020,45(1):26-31.
[5] 李航.統(tǒng)計學(xué)習(xí)方法.清華大學(xué)出版社,2012.
[6] 盧錦玲,郭魯豫,張夢雪,等.基于MGS-LGBM算法的電力系統(tǒng)暫態(tài)穩(wěn)定評估[J].電力科學(xué)與工程,2020(3):1-9.
[7] 張旭東,錢仲文,沈思琪,等.一種基于LSTM與LGBM的電力負(fù)荷預(yù)測算法[J].系統(tǒng)工程,2019,37(1):152-158.
[8] 王向鵬. 基于不平衡三分類LGBM模型的貸后風(fēng)險預(yù)警研究[D].蘭州:蘭州大學(xué),2019.
[9] 唐華松,姚耀文.數(shù)據(jù)挖掘中決策樹算法的探討[J].計算機(jī)應(yīng)用研究,2001,18(8):18-19.
[10] XGBoost:A Scalable Tree Boosting System. Chen T,Guestrin C. ACM SIGKDD International Conference on Knowledge Discovery and Data Mining . 2016.
2166500520339