国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)森林的礦壓預(yù)測(cè)方法

2021-08-26 02:17:14冀汶莉劉藝欣
關(guān)鍵詞:礦壓巖層光纖

冀汶莉,劉藝欣,柴 敬,王 斌

1. 西安科技大學(xué) 通信與信息工程學(xué)院,陜西 西安 710054;2. 西安科技大學(xué) 西部礦井開采及災(zāi)害防治教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710054;3. 西安科技大學(xué) 能源學(xué)院,陜西 西安 710054 )

煤炭一直以來(lái)都是我國(guó)的主體能源。隨著煤礦開采深度和強(qiáng)度的加大,煤壁片幫、支架“壓死”、地表坍塌等礦壓顯現(xiàn)愈加劇烈,制約著礦井的安全高效生產(chǎn)[1-2]。工作面來(lái)壓直接影響了安全生產(chǎn),其中來(lái)壓步距和強(qiáng)度是其重要特征,因此工作面來(lái)壓的準(zhǔn)確預(yù)測(cè)對(duì)于指導(dǎo)煤礦安全高效生產(chǎn)有著重要意義[3-6]。

國(guó)內(nèi)外學(xué)者從不同的角度研究了礦壓顯現(xiàn)的預(yù)測(cè)方法,第一類是基于統(tǒng)計(jì)學(xué)與數(shù)值模擬等數(shù)學(xué)方法的礦壓顯現(xiàn)預(yù)測(cè)研究。霍丙杰[7]等依據(jù)不同開采因素對(duì)礦壓顯現(xiàn)的定量影響關(guān)系,利用模糊數(shù)學(xué)理論建立了堅(jiān)硬頂板煤層礦壓顯現(xiàn)分級(jí)預(yù)測(cè)模型,可在工作面開采前較準(zhǔn)確地評(píng)估開采過(guò)程中礦壓顯現(xiàn)強(qiáng)度的等級(jí);張通[8]等采用回歸分析和概率統(tǒng)計(jì)的方法,結(jié)合淺埋工作面現(xiàn)場(chǎng)實(shí)測(cè)礦壓數(shù)據(jù)分析工作面覆巖硬度指數(shù)、工作面長(zhǎng)度、開采高度及埋深與工作面礦壓顯現(xiàn)之間的非線性關(guān)系,并估算出工作面礦壓最大值、初次及周期來(lái)壓步距等信息;金寶圣[9]等利用現(xiàn)場(chǎng)實(shí)測(cè)及數(shù)值模擬的方法對(duì)麻家梁礦的頂板破斷特征進(jìn)行研究,得出的來(lái)壓步距與現(xiàn)場(chǎng)實(shí)測(cè)數(shù)據(jù)基本一致。這類方法計(jì)算得出的礦壓顯現(xiàn)強(qiáng)度及來(lái)壓步距等參數(shù),只是在工作面開采前宏觀評(píng)估礦壓顯現(xiàn)的強(qiáng)度及來(lái)壓步距的范圍,在實(shí)際開采過(guò)程中來(lái)壓位置或來(lái)壓步距則隨工作面的推進(jìn)而動(dòng)態(tài)變化。因此,上述方法并非真正意義上的工作面礦壓預(yù)測(cè)。

第二類是基于礦壓監(jiān)測(cè)系統(tǒng)產(chǎn)生的監(jiān)測(cè)數(shù)據(jù),利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)等智能算法進(jìn)行礦壓預(yù)測(cè)研究[10]。趙毅鑫[11]等運(yùn)用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)( LSTM )深度學(xué)習(xí)方法建立了礦壓預(yù)測(cè)模型,較為準(zhǔn)確地預(yù)測(cè)了紅慶河大采高工作面礦山壓力,由于只選取位于工作面中間位置的支架壓力數(shù)據(jù),未全面反映不同支架的壓力數(shù)據(jù)和礦壓顯現(xiàn)之間的非線性關(guān)系。隨著新技術(shù)的發(fā)展,分布式感測(cè)技術(shù)被引入礦山圍巖變形監(jiān)測(cè)及礦壓顯現(xiàn)的研究中,柴敬[12-13]等將分布式光纖傳感系統(tǒng)應(yīng)用于煤層采動(dòng)過(guò)程中覆巖變形監(jiān)測(cè)及來(lái)壓判別,定義了光纖頻移平均變化度的概念,通過(guò)光纖頻移平均變化度的經(jīng)驗(yàn)閾值判別工作面礦壓的發(fā)生情況;并在此基礎(chǔ)上,引入混沌理論,采用XGBoost算法建立礦壓顯現(xiàn)預(yù)測(cè)模型,取得了一定的效果,但此方法只能預(yù)測(cè)未來(lái)的光纖頻移平均變化度,仍需以經(jīng)驗(yàn)閾值進(jìn)行來(lái)壓判別。綜上可知,目前光纖傳感技術(shù)在礦山圍巖監(jiān)測(cè)中的應(yīng)用仍處于現(xiàn)場(chǎng)應(yīng)用研究階段,將分布式光纖用于工作面礦壓監(jiān)測(cè)及預(yù)測(cè)還處于實(shí)驗(yàn)室和理論研究階段,未見實(shí)際的工程應(yīng)用[14]。

筆者以相似材料物理模擬試驗(yàn)中分布式光纖監(jiān)測(cè)數(shù)據(jù)為數(shù)據(jù)源,引入多步逆向云變換( MBCTSR ),并利用機(jī)器學(xué)習(xí)算法中的隨機(jī)森林( Random Forest,RF ),建立MBCT-SR-RF工作面來(lái)壓位置預(yù)測(cè)模型,對(duì)相似物理模型試驗(yàn)工作面開采過(guò)程中的來(lái)壓位置進(jìn)行預(yù)測(cè)。

1 試驗(yàn)背景與礦壓分析

1.1 試驗(yàn)背景與光纖頻移值

以千秋煤礦工作面上覆巖層的實(shí)際組成為原型,利用相似材料模擬搭建了工作面及上覆巖層的三維立體物理模型,模型的相似比為1∶400,尺寸為360 cm×200 cm×200 cm,模擬單個(gè)工作面長(zhǎng)度為60 cm,煤層厚度為6 cm,上覆巖層厚度為174 cm。三維立體模型如圖1( a )所示。在相似材料物理模型搭建的過(guò)程中,沿工作面開采方向在模 型的120,180,240 cm處的上覆巖層內(nèi)布設(shè)了3根垂直光纖FV1,F(xiàn)V2和FV3,垂直光纖的分布如圖1( b )所示。每根垂直光纖上可以獲得174個(gè)監(jiān)測(cè)位置的數(shù)據(jù)。

圖1 相似材料物理模型組成 Fig. 1 Physical model composition diagram of similar materials

模擬煤層厚度為6 cm,模擬工作面開挖步距為4 cm,共計(jì)開挖60次,推進(jìn)距離為240 cm。在開挖過(guò)程中,光纖監(jiān)測(cè)系統(tǒng)采集3根垂直光纖上所有測(cè)點(diǎn)的監(jiān)測(cè)值。為了表征巖體的變形情況,定義了光纖頻移值的概念[15],表達(dá)式為

通過(guò)物理模擬試驗(yàn),研究光纖頻移值與工作面周期來(lái)壓之間的表征關(guān)系。

1.2 工作面礦壓觀測(cè)及分析

在模擬試驗(yàn)過(guò)程中工作面共出現(xiàn)了1次初次來(lái)壓和15次周期來(lái)壓,記錄每次來(lái)壓的位置和來(lái)壓步距等試驗(yàn)數(shù)據(jù),見表1。

表1 三維立體模型試驗(yàn)礦壓觀測(cè)數(shù)據(jù) Table 1 Three-dimensional model test rock pressure observation data

假設(shè)在物理模型試驗(yàn)中單根垂直光纖上有n個(gè)光纖傳感器測(cè)點(diǎn),在工作面第i次開采時(shí)可得到當(dāng)前垂直光纖上每個(gè)監(jiān)測(cè)點(diǎn)的光纖頻移值集合表示當(dāng)前垂直光纖上的監(jiān)測(cè)點(diǎn)總數(shù)。每根垂直光纖在整個(gè)開采周期內(nèi)產(chǎn)生60組Xi,頻移值集合記為U,則。三維立體模型內(nèi)鋪設(shè)有3根垂直光纖,將垂直光纖獲得的頻移數(shù)據(jù)集記為D,則

研究表明光纖頻移值可以表征上覆巖層的變形、破斷及垮落的狀態(tài)[15-16],而工作面周期來(lái)壓的發(fā)生與上覆巖層的變形狀態(tài)有直接關(guān)系,光纖頻移值可以用來(lái)表征工作面初次來(lái)壓和周期來(lái)壓的發(fā)生。定義分布式光纖頻移平均變化度的概念來(lái)反映工作面來(lái)壓的發(fā)生情況[17],表達(dá)式為

式中,Dx為工作面推進(jìn)x距離時(shí)光纖頻移平均變化度;n為某根光纖傳感器上所有傳感器測(cè)點(diǎn)個(gè)數(shù)。

因此,可以通過(guò)光纖平均頻移變化度的經(jīng)驗(yàn)閾值判定周期來(lái)壓的發(fā)生情況。

上覆巖層中垂直光纖不同測(cè)點(diǎn)的光纖頻移值蘊(yùn)含了與工作面礦壓顯現(xiàn)的相關(guān)信息,即光纖頻移值與工作面周期來(lái)壓之間具有復(fù)雜的非線性關(guān)系。機(jī)器學(xué)習(xí)算法可以很好地表達(dá)這種復(fù)雜非線性關(guān)系。因此,本文提出基于隨機(jī)森林的工作面來(lái)壓位置預(yù)測(cè)模型。

2 基于隨機(jī)森林的工作面來(lái)壓位置預(yù)測(cè)模型

2.1 隨機(jī)森林算法

隨機(jī)森林算法是BREIMAN L[18]在2001年提出的以決策樹為基分類器的集成學(xué)習(xí)算法,其能夠處理分類和回歸問(wèn)題。RF在訓(xùn)練階段,使用自助法重采樣( Bootstrap )技術(shù)從輸入訓(xùn)練數(shù)據(jù)集中采集多個(gè)不同的子訓(xùn)練數(shù)據(jù)集來(lái)依次訓(xùn)練多個(gè)不同決策樹,將這些決策樹擬合到數(shù)據(jù)集的各個(gè)子樣本上。在預(yù)測(cè)階段,通過(guò)計(jì)算隨機(jī)森林內(nèi)部決策樹的預(yù)測(cè)結(jié)果的平均值得到最終預(yù)測(cè)值,以提高預(yù)測(cè)的準(zhǔn)確性。在訓(xùn)練過(guò)程中等價(jià)于式( 3 )的優(yōu)化問(wèn)題[19]。

式中,G為決策樹的平方誤差和;lc為決策樹終端葉子節(jié)點(diǎn)的預(yù)測(cè)值;yi為數(shù)據(jù)集中第i個(gè)樣本的輸出值。

隨機(jī)森林回歸算法流程如圖2所示,算法的實(shí)現(xiàn)流程如下:

圖2 隨機(jī)森林算法訓(xùn)練流程 Fig. 2 Training flowchart of random forest algorithm

( 1 ) 通過(guò)Bootstrap重采樣方法從原始樣本集X中有放回地抽取ntree個(gè)樣本,作為訓(xùn)練數(shù)據(jù)集;

( 2 ) 對(duì)抽取到的ntree個(gè)樣本分別生成對(duì)應(yīng)的ntree個(gè)回歸決策樹模型;

( 3 ) 設(shè)樣本集X包含M個(gè)特征屬性,從M個(gè)屬性中隨機(jī)選取m個(gè)屬性作為子集(m<M),根據(jù)最小Ginni系數(shù)原則從這個(gè)子集中選取最優(yōu)屬性作為分裂變量;

( 4 ) 重復(fù)步驟( 1 )~( 3 ),建立多個(gè)決策回歸樹組成隨機(jī)森林,分別利用ntree個(gè)回歸決策樹進(jìn)行回歸預(yù)測(cè)。將新樣本數(shù)據(jù)輸入隨機(jī)森林,并取每個(gè)決策樹預(yù)測(cè)結(jié)果的平均值作為最終的預(yù)測(cè)結(jié)果。

2.2 工作面來(lái)壓預(yù)測(cè)的特征提取

2.2.1 垂直光纖的加權(quán)頻移平均變化度

光纖頻移平均變化度忽略了工作面上覆巖層具有不同的巖性,隨著工作面的推進(jìn),不同巖層變形狀態(tài)不一致,對(duì)工作面周期來(lái)壓的影響程度也各不相同。為了更準(zhǔn)確地表達(dá)不同巖層變形對(duì)工作面周期來(lái)壓的影響,定義光纖加權(quán)頻移平均變化度xV,表達(dá)式為

式中,Vx為工作面推進(jìn)至x距離時(shí)光纖加權(quán)頻移平均變化度;p為上覆巖層的層數(shù);wr為權(quán)重系數(shù),表示第r層覆巖變形對(duì)礦壓顯現(xiàn)的影響程度;Dr為光纖測(cè)點(diǎn)所在第r層的光纖頻移平均變化度;為第r層內(nèi)第k個(gè)光纖測(cè)點(diǎn)在第i次開挖時(shí)的頻移值;m為第r層覆巖內(nèi)光纖的監(jiān)測(cè)點(diǎn)個(gè)數(shù)。

根據(jù)相似物理模型的配比,將工作面上覆巖層分為5類,對(duì)應(yīng)物理模型的1~16,35~96,160~174 cm為軟弱巖層,17~34 cm為亞關(guān)鍵層,97~159 cm為關(guān)鍵層。按照各層所在模型高度從上至下將巖層依次標(biāo)記為1~5。采用極端隨機(jī)樹( Etra-Trees )[20]模型計(jì)算5類巖層中埋設(shè)光纖的頻移變化度的權(quán)重系數(shù)rw。該模型的輸入為工作面開采過(guò)程中獲得第r層內(nèi)光纖頻移值的算術(shù)平均值,即,輸出為當(dāng)前時(shí)刻工作面的礦壓發(fā)生情況,用“1”表示有周期來(lái)壓發(fā)生,“0”表示無(wú)周期來(lái)壓發(fā)生,權(quán)重系數(shù)wr在隨機(jī)數(shù)迭代優(yōu)化過(guò)程中計(jì)算得出。采用Etra-Trees模型對(duì)三維立體模型試驗(yàn)中的訓(xùn)練部分歷史數(shù)據(jù)進(jìn)行計(jì)算,得到權(quán)重系數(shù)訓(xùn)練集的數(shù)據(jù),見表2。

表2 訓(xùn)練部分?jǐn)?shù)據(jù)得到各巖層內(nèi)頻移平均 變化度的權(quán)重系數(shù) Table 2 Weight distribution of the average change degree of the frequency shift within calculated from the training data

由表2可知,3根垂直光纖對(duì)應(yīng)的不同權(quán)重系數(shù)反映了開采過(guò)程中不同巖層變形對(duì)工作面周期來(lái)壓發(fā)生的影響程度。其中FV1垂直光纖離開切眼最近,也是最先監(jiān)測(cè)到第1層巖石的垮落,即第1層覆巖變形對(duì)工作面周期來(lái)壓的影響最大,權(quán)重也最大;而第4層關(guān)鍵層和第2層亞關(guān)鍵層的權(quán)重次之,說(shuō)明該層內(nèi)巖石變形對(duì)周期來(lái)壓的影響也較大;巖層最上方的軟弱巖層即第5層的權(quán)重最小,巖石變形對(duì)周期來(lái)壓的影響最小。FV2垂直光纖位于整個(gè)開采工作面的中部,其經(jīng)歷了巖石多種形態(tài)的變形過(guò)程,因此整體上對(duì)工作面來(lái)壓的影響高于第1和第3根光纖,且各層權(quán)重的均值比其他2根大。而FV3垂直光纖的位置接近工作面開采的結(jié)束部位,對(duì)工作面來(lái)壓影響最大的是關(guān)鍵層。由此可知,利用Etra-Trees模型得到的計(jì)算結(jié)果符合物理模擬試驗(yàn)的相關(guān)結(jié)論。

考慮到模型預(yù)測(cè)的有效性和準(zhǔn)確性,筆者同時(shí)采用三維立體模型試驗(yàn)的全部歷史數(shù)據(jù)進(jìn)行了光纖頻移平均變化度的權(quán)重系數(shù)的計(jì)算,計(jì)算結(jié)果見表3。 訓(xùn)練部分?jǐn)?shù)據(jù)與全部歷史數(shù)據(jù)得到的各巖層內(nèi)頻移平均變化度的權(quán)重系數(shù)偏差,見表4。

表3 全部歷史數(shù)據(jù)得到各巖層內(nèi)頻移平均 變化度的權(quán)重系數(shù) Table 3 Weight distribution of the average change degree of frequency shift within each rock layer calculated from all historical data

表4 不同數(shù)據(jù)集光纖頻移平均變化度的權(quán)重系數(shù)偏差 Table 4 Error of fiber weighted frequency shift average change degree on different data-sets

由表4可知,訓(xùn)練集部分光纖監(jiān)測(cè)數(shù)據(jù)與全部光纖監(jiān)測(cè)數(shù)據(jù)得到的頻移平均變化度的權(quán)重系數(shù)偏差均在0.087以內(nèi),說(shuō)明訓(xùn)練集和測(cè)試集對(duì)應(yīng)巖層權(quán)重系數(shù)的分布是一致的。因此,可以使用訓(xùn)練數(shù)據(jù)獲得的權(quán)重系數(shù)處理光纖頻移值,得到加權(quán)頻移平均變化度,進(jìn)而構(gòu)建預(yù)測(cè)模型的輸入樣本是可行的。

2.2.2 垂直光纖頻移值的統(tǒng)計(jì)特征

數(shù)據(jù)集的統(tǒng)計(jì)特征在宏觀上反映了數(shù)據(jù)的真實(shí)變化情況,通過(guò)1.2節(jié)分析可知,3根垂直光纖所有測(cè)點(diǎn)在某一次工作面推進(jìn)時(shí)會(huì)產(chǎn)生3個(gè)獨(dú)立的數(shù)據(jù)集U,U中每一個(gè)數(shù)據(jù)子集i X都具有獨(dú)立的統(tǒng)計(jì)特性。在機(jī)器學(xué)習(xí)中數(shù)據(jù)集的統(tǒng)計(jì)特性可以作為樣本重要的特征屬性,為了更準(zhǔn)確地描述每根光纖在工作面開挖時(shí)產(chǎn)生的頻移數(shù)據(jù)的統(tǒng)計(jì)特征,引入多步逆向云變換算法( Multi-step backward cloud transformation algorithm based on sampling with replacement,MBCT-SR )[21],該算法為基于云模型理論計(jì)算Ex,En,He的改進(jìn)方法[22-23]。

MBCT-SR算法的計(jì)算步驟如下:

Step2:對(duì)光纖頻移數(shù)據(jù)集Xi進(jìn)行隨機(jī)可重復(fù)的抽樣,每次抽取r個(gè)數(shù)據(jù)為一組,共抽取m組( 其中m,r∈N+,m和r的乘積不一定等于n),形成新的子集,并計(jì)算每組數(shù)據(jù)集的期望,計(jì)算公式為

2.3 工作面礦壓位置預(yù)測(cè)模型的構(gòu)建

預(yù)測(cè)模型整體流程框架如圖3所示,模型構(gòu)建的主要步驟如下:

圖3 工作面礦壓預(yù)測(cè)模型整體流程 Fig. 3 Overall flow chart of mine pressure of working face prediction mode

( 1 ) 數(shù)據(jù)預(yù)處理

數(shù)據(jù)預(yù)處理是模型訓(xùn)練的基礎(chǔ),為保證預(yù)測(cè)結(jié)果的準(zhǔn)確性,需要對(duì)原始頻移數(shù)據(jù)進(jìn)行預(yù)處理,包括去除噪聲和數(shù)據(jù)清洗。采用小波去噪的方法去除頻移數(shù)據(jù)的噪聲。數(shù)據(jù)清洗包含缺失值填補(bǔ)和異常數(shù)據(jù)去除,采用鄰近均值法,根據(jù)相關(guān)性分析確定離缺失值或異常數(shù)據(jù)最近樣本,對(duì)其計(jì)算加權(quán)平均值來(lái)代替異常值或缺失值。同時(shí)為減小不同值域數(shù)據(jù)樣本特征對(duì)模型訓(xùn)練的影響,通過(guò)差分歸一化方法將數(shù)據(jù)轉(zhuǎn)換成均值為0,標(biāo)準(zhǔn)差為1的形式。

( 2 ) SMOTE數(shù)據(jù)增強(qiáng)

由于相似物理模擬試驗(yàn)采集到的光纖頻移樣本數(shù)據(jù)有限,為提高模型的預(yù)測(cè)精度,采用SMOTE( Synthetic Minority Over-sampling Technique )算法對(duì)光纖頻移時(shí)間序列數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)。通過(guò)SMOTE提高樣本容量,從而提高模型的預(yù)測(cè)精度。

( 3 ) 樣本數(shù)據(jù)特征值提取

采用光纖加權(quán)頻移平均變化度作為工作面來(lái)壓位置預(yù)測(cè)方法的輸入樣本特征。采用3根垂直光纖在第i次開采時(shí)全測(cè)點(diǎn)頻移值集合的期望Ex、熵En和超熵He,作為工作面來(lái)壓位置預(yù)測(cè)方法的輸入特征。

( 4 ) 工作面來(lái)壓位置預(yù)測(cè)模型的構(gòu)建

將上述垂直光纖加權(quán)頻移平均變化度,以及光纖頻移數(shù)據(jù)的統(tǒng)計(jì)特征作為模型訓(xùn)練的輸入樣本,建立基于隨機(jī)森林算法的礦壓預(yù)測(cè)模型,模型輸出為未來(lái)時(shí)刻工作面礦壓發(fā)生位置,并評(píng)估模型的性能。

2.4 預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)

選用均方根誤差RMSE( Root Mean Squares Error )、平均絕對(duì)誤差MAE( Mean Absolute Error )和平均絕對(duì)百分比誤差MAPE( Mean Absolute Percentage Error )作為預(yù)測(cè)模型性能的評(píng)價(jià)指標(biāo),計(jì)算公式為

式中,yi為實(shí)際值;為預(yù)測(cè)值;n為樣本個(gè)數(shù)。

RMSE是回歸預(yù)測(cè)中常用的評(píng)價(jià)指標(biāo),但易受異常值的影響。MAPE用來(lái)評(píng)估相對(duì)誤差,降低了個(gè)別離群點(diǎn)帶來(lái)的絕對(duì)誤差影響。3個(gè)評(píng)價(jià)指標(biāo)的值越小表示預(yù)測(cè)值與真實(shí)值之間的偏差越小,模型的預(yù)測(cè)性能越好。

3 仿真試驗(yàn)與結(jié)果分析

3.1 預(yù)測(cè)樣本集構(gòu)成

相似材料物理模型試驗(yàn)中,3根光纖各產(chǎn)生了60組不同測(cè)點(diǎn)的頻移數(shù)據(jù)。在試驗(yàn)過(guò)程中發(fā)生了1次初次來(lái)壓和15次周期來(lái)壓,對(duì)應(yīng)的周期來(lái)壓位置見表1。構(gòu)造的樣本集見表5,其中1?Ex,1?En,1?He為垂直光纖FV1全測(cè)點(diǎn)在工作面推進(jìn)一次所獲得的光纖頻移數(shù)據(jù)的期望、熵和超熵的估計(jì)值;1xV為垂直光纖FV1頻移值的加權(quán)頻移平均變化度,垂直光纖FV2和FV3同理;Y表示模型輸出,即未來(lái)時(shí)刻工作面來(lái)壓發(fā)生的位置。

表5 樣本集部分?jǐn)?shù)據(jù) Table 5 Partial data display of sample set

將樣本數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集。3根垂直光纖上的測(cè)點(diǎn)產(chǎn)生的頻移數(shù)據(jù)具有時(shí)間序列的特征,取前40次模擬開采獲得的樣本數(shù)據(jù)作為訓(xùn)練集進(jìn)行預(yù)測(cè)模型的訓(xùn)練,并采用十折交叉法驗(yàn)證模型的有效性。利用訓(xùn)練好的模型,根據(jù)當(dāng)前時(shí)刻測(cè)點(diǎn)頻移值計(jì)算出輸入樣本就可以預(yù)測(cè)未來(lái)時(shí)刻周期礦壓發(fā)生的位置。為了驗(yàn)證預(yù)測(cè)模型的有效性和準(zhǔn)確性,將剩余20次模擬開采產(chǎn)生的數(shù)據(jù)作為測(cè)試集,與模擬試驗(yàn)中實(shí)際周期來(lái)壓位置進(jìn)行比較,評(píng)估預(yù)測(cè)模型的性能。

3.2 模型的參數(shù)設(shè)置

本文基于Python語(yǔ)言,使用scikit-learn庫(kù)中Ensemble框架內(nèi)的RandomForestRegressor. predict( )函數(shù)建立RF模型。RF算法在建模過(guò)程中首先需要設(shè)定2個(gè)參數(shù),即決策樹的數(shù)量n_estimators和每棵樹的最大特征變量max_features。若n_eatimators太小容易導(dǎo)致模型欠擬合,太大則不能顯著提升模型的性能。最大特征變量值max_features越小則隨機(jī)森林中決策樹的差異越大,導(dǎo)致模型產(chǎn)生過(guò)擬合而降低算法精度,最大特征變量值max_features越大則會(huì)降低模型的運(yùn)算速度,一般情況下max_ features=2log( n_features ),n_features為樣本集中特征向量的維度。

在RF訓(xùn)練過(guò)程中需要優(yōu)化的2個(gè)參數(shù)為決策樹最大深度max_depth和節(jié)點(diǎn)可分的最小樣本數(shù)min_samples_split。

在訓(xùn)練過(guò)程中,對(duì)n_estimators,max_depth,min_samples_split等3個(gè)參數(shù)采用網(wǎng)格搜索方法進(jìn)行尋優(yōu),即給定n_estimators的參數(shù)范圍為[10,200],步長(zhǎng)為10;max_depth和min_samples_split的參數(shù)范圍為[1,10],步長(zhǎng)為1。通過(guò)網(wǎng)格搜索遍歷給定參數(shù) 后 得 到n_estimators=100,max_depth=4,min_ samples_split=2。

為驗(yàn)證預(yù)測(cè)模型的有效性,在相同試驗(yàn)環(huán)境和數(shù)據(jù)集條件下,分別采用BP神經(jīng)網(wǎng)絡(luò)、SVM支持向量機(jī)方法建立預(yù)測(cè)模型,與隨機(jī)森林方法進(jìn)行對(duì)比分析。SVM算法的核函數(shù)選取高斯徑向基函數(shù)( RBF ),σ和懲罰因子C是影響SVM回歸性能的2個(gè)重要參數(shù),其中σ決定數(shù)據(jù)映射到在新特征空間的分布狀態(tài),不同取值會(huì)影響模型在測(cè)試集中的準(zhǔn)確率;懲罰因子C能夠平衡模型的逼近誤差和復(fù)雜度,C越大越容易過(guò)擬合,越小則容易欠擬合,2種情況都會(huì)使模型的精度變差。在模型訓(xùn)練過(guò)程中對(duì)參數(shù)進(jìn)行尋優(yōu)后得到最優(yōu)參數(shù)組合為σ=0.01,C=10。BP神經(jīng)網(wǎng)絡(luò)模型的激活函數(shù)選用relu,并通過(guò)模型的不斷迭代確定最優(yōu)的輸入權(quán)重、輸出權(quán)重和隱藏層連接的權(quán)重。

3.3 試驗(yàn)結(jié)果分析

根據(jù)RF,SVM,BP等3種學(xué)習(xí)算法的最優(yōu)參數(shù)組合建立對(duì)應(yīng)的預(yù)測(cè)模型,各模型訓(xùn)練集的預(yù)測(cè)結(jié)果如圖4所示。

圖4 工作面礦壓位置訓(xùn)練集預(yù)測(cè)訓(xùn)練結(jié)果 Fig. 4 Prediction training results of mine pressure position training set in working face

由圖4( a )可知,在模型訓(xùn)練階段,沒有打亂訓(xùn)練樣本數(shù)據(jù)集時(shí),BP,SVM和RF模型的擬合能力都較差。3個(gè)預(yù)測(cè)學(xué)習(xí)曲線在第15次和第22次開采時(shí)都出現(xiàn)了向下的尖峰,而對(duì)應(yīng)位置的真實(shí)曲線是水平的,特別是SVM模型在整個(gè)模型訓(xùn)練階段的預(yù)測(cè)結(jié)果與真實(shí)值之間的偏差較大,總體來(lái)看出現(xiàn)預(yù)測(cè)值在真實(shí)曲線上下波動(dòng)的情況,說(shuō)明模型對(duì)數(shù)據(jù)樣本的學(xué)習(xí)不夠徹底。為了在模型訓(xùn)練過(guò)程中消除數(shù)據(jù)之間的相關(guān)性,減少模型的過(guò)擬合,在訓(xùn)練過(guò)程中打亂了訓(xùn)練集順序。由圖4( b )可知,在打亂訓(xùn)練樣本數(shù)據(jù)集后,模型較全面地學(xué)習(xí)了訓(xùn)練樣本輸入和輸出之間復(fù)雜的非線性關(guān)系,BP,SVM和RF模型的預(yù)測(cè)精度均得到了提升,且均能較好地?cái)M合真實(shí)值。但相對(duì)來(lái)說(shuō)SVM的學(xué)習(xí)表現(xiàn)最差,在第3,12,29和36次都有較大的誤差,而這些點(diǎn)均與前一次樣本數(shù)據(jù)間存在較大的數(shù)據(jù)落差。表6為3種預(yù)測(cè)模型在訓(xùn)練階段的各項(xiàng)性能評(píng)估指標(biāo)。

表6 不同預(yù)測(cè)模型訓(xùn)練集性能評(píng)價(jià)指標(biāo)對(duì)比 Table 6 Comparison of performance evaluation indexes of different prediction model on training sets

由表6可知,無(wú)論是否打亂訓(xùn)練樣本順序,在訓(xùn)練集中3個(gè)模型的RMSE,MAE和MAPE均較小,但打亂訓(xùn)練樣本順序的訓(xùn)練模型性能更好。相較于BP和RF預(yù)測(cè)模型,SVM預(yù)測(cè)模型的總體誤差相對(duì)較大,RF在訓(xùn)練階段表現(xiàn)更優(yōu)。

各模型測(cè)試集的預(yù)測(cè)結(jié)果如圖5所示。

圖5 工作面礦壓位置測(cè)試集預(yù)測(cè)訓(xùn)練結(jié)果 Fig. 5 Prediction training results of mine pressure position test set in working face

由圖5可知,在測(cè)試集中BP神經(jīng)網(wǎng)絡(luò)模型、SVM支持向量機(jī)模型的預(yù)測(cè)值與真實(shí)值有較大的偏差。對(duì)于BP神經(jīng)網(wǎng)絡(luò)模型在第40,41,42,45,46,47,49次開采時(shí)的預(yù)測(cè)曲線與真實(shí)值的誤差較大,原因?yàn)锽P易陷入局部最優(yōu),在訓(xùn)練過(guò)程中出現(xiàn)了過(guò)擬合現(xiàn)象,導(dǎo)致預(yù)測(cè)模型在測(cè)試集中表現(xiàn)較差。對(duì)于SVM支持向量機(jī)模型在第40,41,42,48,49,52,53,57次預(yù)測(cè)值都與真實(shí)值有較大偏差??傮w來(lái)看,在測(cè)試集中RF預(yù)測(cè)模型整體上與真實(shí)值之間的擬合效果最優(yōu),僅在第45,46,56,57次開采時(shí)預(yù)測(cè)值與真實(shí)值有一定偏差,原因?yàn)楫?dāng)開采工作臨近結(jié)束時(shí)光纖頻移值變化較為緩慢,導(dǎo)致預(yù)測(cè)效果不佳,但與BP神經(jīng)網(wǎng)絡(luò)模型、SVM模型在對(duì)應(yīng)位置相比偏差更小,預(yù)測(cè)效果表現(xiàn)更優(yōu)。

當(dāng)利用歷史監(jiān)測(cè)數(shù)據(jù)生成的訓(xùn)練樣本集完成預(yù)測(cè)模型的訓(xùn)練后,就可以用模型進(jìn)行未來(lái)時(shí)刻工作面來(lái)壓位置的預(yù)測(cè)。如,將第42次模擬開采時(shí)3根垂直光纖所獲得的頻移值,利用2.2節(jié)特征值提取方法計(jì)算得到輸入樣本;然后輸入預(yù)測(cè)模型進(jìn)行計(jì)算,輸出結(jié)果是未來(lái)時(shí)刻發(fā)生周期來(lái)壓的位置180.3 cm,與試驗(yàn)記錄的真實(shí)值184 cm偏差為3.7 cm,可以認(rèn)為預(yù)測(cè)有效。表7為預(yù)測(cè)過(guò)程中預(yù)測(cè)值與真實(shí)值的偏差。

表7 預(yù)測(cè)值與真實(shí)值的偏差 Table 7 Error between the predicted value and the true value

表8為測(cè)試集中各預(yù)測(cè)模型的性能評(píng)價(jià)指標(biāo)。將3個(gè)預(yù)測(cè)模型的評(píng)價(jià)指標(biāo)與表6中亂序訓(xùn)練集對(duì)應(yīng)的指標(biāo)相比,每個(gè)預(yù)測(cè)模型的性能評(píng)價(jià)指標(biāo)變大,說(shuō)明3種模型在測(cè)試集上的預(yù)測(cè)性能低于訓(xùn)練集。BP模型的各項(xiàng)指標(biāo)顯著大于亂序訓(xùn)練集,說(shuō)明BP模型在訓(xùn)練階段出現(xiàn)了過(guò)擬合現(xiàn)象,導(dǎo)致測(cè)試集的誤差明顯增大。SVM預(yù)測(cè)模型在測(cè)試集的RMSE顯著低于BP模型,但MAE和MAPE值的大小與BP模型評(píng)估指標(biāo)的值非常接近。RF預(yù)測(cè)模型在測(cè)試集中的評(píng)價(jià)指標(biāo)均最小,表明RF預(yù)測(cè)模型的準(zhǔn)確性和魯棒性在3個(gè)預(yù)測(cè)模型中最優(yōu)。

表8 不同預(yù)測(cè)模型測(cè)試集性能評(píng)價(jià)指標(biāo)對(duì)比 Table 8 Comparison of performance evaluation indexes of different prediction models on test sets

3.4 工作面來(lái)壓位置預(yù)測(cè)模型泛化能力分析

3.4.1 樣本數(shù)據(jù)擴(kuò)充后預(yù)測(cè)模型性能分析

筆者使用的數(shù)據(jù)樣本屬于小樣本,為了提升預(yù)測(cè)效果及預(yù)測(cè)模型的普適性,使用SMOTE數(shù)據(jù)增強(qiáng)技術(shù)對(duì)原始數(shù)據(jù)進(jìn)行了擴(kuò)充,擴(kuò)充后訓(xùn)練集為79個(gè)樣本數(shù)據(jù),測(cè)試集保持不變。

預(yù)測(cè)結(jié)果如圖6所示,性能評(píng)價(jià)指標(biāo)見表9。由圖6和表9可知,當(dāng)樣本數(shù)據(jù)擴(kuò)充后預(yù)測(cè)效果都有了進(jìn)一步的提升,更加接近真實(shí)值。

圖6 數(shù)據(jù)擴(kuò)展后工作面來(lái)壓位置預(yù)測(cè)測(cè)試結(jié)果 Fig. 6 Predictive results of pressing position on test data sets after data augmentation

表9 數(shù)據(jù)擴(kuò)展后不同預(yù)測(cè)模型性能評(píng)價(jià)指標(biāo)對(duì)比 Table 9 Comparison of performance evaluation used different prediction models after data augmentation

從表9中可以看出,3種預(yù)測(cè)方法的各項(xiàng)評(píng)價(jià)指標(biāo)均低于未進(jìn)行數(shù)據(jù)擴(kuò)充的指標(biāo)值,同時(shí)相比于其他2種預(yù)測(cè)模型,RF模型的性能指標(biāo)也低于其他2個(gè)預(yù)測(cè)模型。說(shuō)明在進(jìn)行數(shù)據(jù)擴(kuò)充后該預(yù)測(cè)模型有更優(yōu)的表現(xiàn)和更準(zhǔn)確的預(yù)測(cè)效果。

3.4.2 預(yù)測(cè)模型泛化能力分析

為研究MBCT-SR-RF工作面礦壓位置預(yù)測(cè)模型的泛化能力,以內(nèi)蒙古某礦工作面地質(zhì)結(jié)構(gòu)為原型搭建的相似材料模擬試驗(yàn)產(chǎn)生的光纖監(jiān)測(cè)數(shù)據(jù)及工作面來(lái)壓數(shù)據(jù)作為預(yù)測(cè)模型的數(shù)據(jù)源。物理模型內(nèi)沿工作面開采方向布置3根垂直光纖,煤層厚4 cm,開挖步距為3 cm,共計(jì)開挖51步。

采用與前述相同的樣本特征提取和樣本集構(gòu)造方法,共產(chǎn)生51個(gè)樣本數(shù)據(jù),其中前35個(gè)樣本用于模型訓(xùn)練,后16個(gè)樣本用于預(yù)測(cè)模型性能測(cè)試。3種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果如圖7所示,預(yù)測(cè)性能的評(píng)估指標(biāo)見表10。

圖7 內(nèi)蒙古某礦模擬試驗(yàn)中工作面來(lái)壓位置預(yù)測(cè)結(jié)果 Fig. 7 Predictive results of pressing position on test data sets by physical model based on Inner Mongolia mine

表10 預(yù)測(cè)模型性能評(píng)價(jià)指標(biāo)對(duì)比 Table 10 Comparison of prediction performance indicators on test data sets

由圖7可知,新測(cè)試集中BP神經(jīng)網(wǎng)絡(luò)模型和SVM支持向量機(jī)的預(yù)測(cè)值與真實(shí)曲線之間存在較大的偏差,RF隨機(jī)森林預(yù)測(cè)模型的擬合效果最優(yōu),預(yù)測(cè)值與實(shí)際來(lái)壓位置基本一致,表示模型預(yù)測(cè)性能穩(wěn)定。由表10可知,RF隨機(jī)森林預(yù)測(cè)模型的RMSE,MAE和MAPE值最小,說(shuō)明RF隨機(jī)森林的預(yù)測(cè)模型具有穩(wěn)定的非線性擬合能力和較強(qiáng)的泛化能力,對(duì)于處理光纖頻移數(shù)據(jù)與工作面來(lái)壓之間的非線性關(guān)系,是一種簡(jiǎn)單、準(zhǔn)確、穩(wěn)定、可靠的方法。結(jié)合垂直光纖全測(cè)點(diǎn)頻移值的期望、熵和超熵統(tǒng)計(jì)特征和光纖加權(quán)頻移平均變化度作為輸入樣本,基于RF隨機(jī)森林工作面礦壓位置預(yù)測(cè)是一種有效的礦壓預(yù)測(cè)方法。

4 結(jié) 論

( 1 ) 針對(duì)光纖加權(quán)頻移平均變化度,采用隨機(jī)森林算法,考慮了不同巖性和厚度的巖層對(duì)工作面礦壓的影響程度,可以對(duì)工作面礦壓進(jìn)行預(yù)測(cè)。

( 2 ) 引入多步逆向云變換算法,提取了以期望、熵和超熵為重要屬性的樣本特征,融合光纖加權(quán)頻移平均變化度形成了輸入樣本數(shù)據(jù),提高了模型的預(yù)測(cè)性能。 ( 3 ) 將基于RF隨機(jī)森林的預(yù)測(cè)模型與BP神經(jīng)網(wǎng)絡(luò)、SVM支持向量機(jī)預(yù)測(cè)方法在相同樣本集下進(jìn)行預(yù)測(cè)效果對(duì)比,MBCT-SR-RF預(yù)測(cè)模型具有較強(qiáng)的準(zhǔn)確性、穩(wěn)定性和泛化能力,適用于分布式光纖監(jiān)測(cè)的礦壓顯現(xiàn)位置預(yù)測(cè)。

猜你喜歡
礦壓巖層光纖
Spain
高應(yīng)力巖層巷道鉆孔爆破卸壓技術(shù)
FIBBR King-A系列HDMI光纖線
地球故事之復(fù)理石巖層
高品質(zhì)的忠實(shí)還原 FIBBR Ultra Pro2 HDMI光纖線
一條光纖HDMI線的誕生長(zhǎng)飛/長(zhǎng)芯盛FIBBR工廠走訪實(shí)錄
全國(guó)產(chǎn)1550nm 窄脈寬光纖放大器
電子制作(2017年13期)2017-12-15 09:00:11
采煤工作面礦壓顯現(xiàn)規(guī)律影響因素分析
綜放工作面礦壓顯現(xiàn)規(guī)律研究
山西煤炭(2015年4期)2015-12-20 11:36:18
礦壓監(jiān)測(cè)系統(tǒng)在煤礦安全管理中的應(yīng)用
赤峰市| 昌乐县| 岳阳市| 中方县| 苏州市| 阿荣旗| 墨玉县| 菏泽市| 南漳县| 兴业县| 合江县| 乃东县| 伽师县| 皋兰县| 琼中| 南和县| 井陉县| 阿拉尔市| 临西县| 外汇| 呼图壁县| 陵水| 汝州市| 宁城县| 富平县| 瓦房店市| 清镇市| 报价| 泸溪县| 民乐县| 封开县| 吉木萨尔县| 静宁县| 巢湖市| 洛川县| 屏东县| 兴安盟| 新乐市| 斗六市| 罗甸县| 夏津县|