鄧 強(qiáng),張召千,王 震
(1.太原理工大學(xué) 礦業(yè)工程學(xué)院,太原 030024;2.秦皇島工程設(shè)計(jì)研究院有限公司,河北 秦皇島 066000)
煤炭是我國的戰(zhàn)略性能源,在貧油、少氣、富煤的能源結(jié)構(gòu)下,煤炭依然會(huì)被長期依賴[1]。而在煤礦開采過程中,經(jīng)常會(huì)存在大量的安全隱患[2]。其中煤層底板突水問題一直是受到專家學(xué)者關(guān)注的安全問題[3-6]。目前,煤炭開采環(huán)境復(fù)雜,煤層底板突水頻發(fā),但突水預(yù)測能力依舊不足,對(duì)煤礦的安全生產(chǎn)造成了重大威脅。
國內(nèi)外專家學(xué)者研究煤層底板突水問題時(shí),會(huì)將其與煤層底板突水機(jī)理有效地結(jié)合,科學(xué)提出煤層底板突水影響因素指標(biāo)體系,再通過一系列靜態(tài)預(yù)測模型,如回歸分析[7]、數(shù)據(jù)挖掘[8-9]、支持向量機(jī)[10-12]、神經(jīng)網(wǎng)絡(luò)[13-15]及極限學(xué)習(xí)機(jī)[16-17]等方法對(duì)煤層底板突水進(jìn)行預(yù)測。這些煤層底板突水預(yù)測模型在煤礦生產(chǎn)中的應(yīng)用,提高了煤礦突水的預(yù)測能力,防范于未然。
但在煤礦的實(shí)際開采過程中,某一回采點(diǎn)對(duì)煤層底板突水影響是由多種因素組成的,如地質(zhì)構(gòu)造、煤層厚度、煤層傾角等,并且這些因素會(huì)隨著采動(dòng)的進(jìn)行影響權(quán)重,所以煤層底板突水預(yù)測不能簡單地當(dāng)成一個(gè)靜態(tài)問題處理,需要考慮采動(dòng)影響下的動(dòng)態(tài)變化[18]。針對(duì)該問題,本文提出了動(dòng)態(tài)預(yù)測模型:門循環(huán)單元(gated recurrent unit,簡稱GRU)神經(jīng)網(wǎng)絡(luò)預(yù)測模型,該模型能夠充分利用采動(dòng)過程中收集的時(shí)間序列數(shù)據(jù),過濾監(jiān)測過程中的缺失數(shù)據(jù)及干擾數(shù)據(jù),通過對(duì)一系列樣本數(shù)據(jù)變化規(guī)律的學(xué)習(xí),實(shí)時(shí)更新影響因素的變化,精確地對(duì)煤層底板突水進(jìn)行預(yù)測,提高煤礦生產(chǎn)安全。
煤層底板突水是復(fù)雜的非線性問題,它受到多種因素的影響,并且隨著開采的進(jìn)行其影響因素也會(huì)產(chǎn)生動(dòng)態(tài)變化。早在20世紀(jì)60年代就有學(xué)者提出突水系數(shù)法用于煤層底板突水預(yù)測[19]。后來的許多學(xué)者不斷對(duì)突水系數(shù)法進(jìn)行完善,同時(shí),“下三帶”理論、薄板理論、“強(qiáng)滲通道”說及關(guān)鍵層理論等基于經(jīng)驗(yàn)公式和力學(xué)模型的突水理論也相繼發(fā)展起來[18]。
通過總結(jié)以往煤層底板突水理論,本文選擇煤礦突水實(shí)例的工作面煤層底板突水?dāng)?shù)據(jù)以及正?;夭蓪?shí)測數(shù)據(jù)進(jìn)行分析,如表1所示。
表1 礦區(qū)部分現(xiàn)場實(shí)測數(shù)據(jù)Table 1 Partial field measured data in mining area
影響突水的因素是多方面的,突水機(jī)理是非常復(fù)雜的,一般影響突水的因素包括地質(zhì)構(gòu)造、底板隔水層、底板承壓水、礦山壓力和開采活動(dòng)等幾個(gè)方面。這些因素對(duì)煤礦突水影響程度各不相同,具體到某突水事故可能是單個(gè)因素的作用結(jié)果,也可能是幾個(gè)因素組合反映的作用。我們需要具體研究分析每一種因素對(duì)礦井突水的影響方式和作用,就可以有針對(duì)性地進(jìn)行預(yù)測和采取有效的預(yù)防措施。
抗突水的唯一重要因素阻抗突水能力的大小取決于巖石的力學(xué)性質(zhì)隔水層的厚度及其組合關(guān)系。底板承壓水對(duì)突水的影響受到水壓大小和所含水量等因素的影響,水壓是造成底板突水的前提條件和動(dòng)力源泉,其作用主要是對(duì)底板巖層中的裂隙和節(jié)理進(jìn)行沖刷,使得承壓水滲透量上升,當(dāng)遇到不同路徑的通道接近煤層時(shí),承壓水可能趁勢流入導(dǎo)致突水。除了導(dǎo)水?dāng)鄬釉斐晒ぷ髅嫱凰虿删蚬ぷ鹘衣冻渌猓V山壓力對(duì)采煤工作面底板突水有著非常大的影響。因此,開采活動(dòng)對(duì)底板突水的影響是通過對(duì)以上幾個(gè)方面的部分或綜合影響表現(xiàn)出來。但是隨著回采工作的進(jìn)行,煤層自身及上覆和下覆巖層的原始應(yīng)力狀態(tài)發(fā)生了變化,承壓含水層和底板各巖層之間所處的相對(duì)平衡狀態(tài)發(fā)生改變,其開采活動(dòng)的影響正是表現(xiàn)在使原始的應(yīng)力狀態(tài)重新分布,頂?shù)装鍘r層受到破壞的過程。
本文提出了煤層底板突水影響因素指標(biāo)體系,如表2所示。煤層底板突水影響因素指標(biāo)體系被劃分成5個(gè)一級(jí)指標(biāo)和15個(gè)二級(jí)指標(biāo)。
表2 煤層底板突水影響因素指標(biāo)體系Table 2 Index system of influencing factors of water inrush from coal floor
數(shù)據(jù)在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)中傳遞是先從輸入層到隱含層,再從隱藏層進(jìn)入輸出層,層間傳播呈現(xiàn)全連接形式,而層內(nèi)的節(jié)點(diǎn)之間不存在聯(lián)系,模型無法很好地處理數(shù)據(jù)的時(shí)間序列問題。循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural networks,RNN))的提出很好地解決了數(shù)據(jù)的時(shí)間序列問題,但RNN在計(jì)算時(shí)存在梯度消失問題,GRU的出現(xiàn)徹底解決了這個(gè)問題[20]。圖1為GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖。GRU是RNN的改進(jìn)版本,它在RNN的基礎(chǔ)上通過增加狀態(tài)c來確保在長期狀態(tài)下能夠長久保存,解決了之前僅僅一個(gè)隱層狀態(tài)h的局面。
圖1 GRU神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 GRU neural network structure
圖2為GRU神經(jīng)網(wǎng)絡(luò)模型單位結(jié)構(gòu)圖。GRU單元中含更新門zt、重置門rt、輸入xt、輸出ht,t-1表示上一時(shí)刻,t表示當(dāng)前時(shí)刻。重置門決定上一時(shí)刻的單元信息是否被記住或者遺忘,更新門決定單元信息是否被刪除或新信息是否被添加。隱藏層通過使用One-Hot編碼進(jìn)行二維向量輸出,在隱藏層傳遞最后一個(gè)時(shí)間單元的輸出值給輸出層后,SoftMax分類器會(huì)對(duì)其進(jìn)行解碼,將其轉(zhuǎn)化為代表預(yù)測結(jié)果的0和1,其中1代表突水,0代表不突水。
圖2 GRU神經(jīng)網(wǎng)絡(luò)模型單元結(jié)構(gòu)圖Fig.2 GRU neural network model unit structure
式(1)表示此模型的損失函數(shù):
J(θ)=-∑(x(i),y(i))∈Dlog(p(y=y(i)|x(i),θ)) .
(1)
式中:θ為模型參數(shù);D表示樣本數(shù)據(jù)構(gòu)成的訓(xùn)練集;(x(i),y(i))表示訓(xùn)練集中第i個(gè)樣本數(shù)據(jù),x(i)是10維的向量,y(i)的取值僅有0和1,分別表示不突水和突水;p(y=y(i)|x(i)),θ)表示樣本(x(i) ,y(i))突水(不突水)的概率。
本文研究的某煤礦含煤層為侏羅系中統(tǒng)延安組,根據(jù)巖性、巖相、沉積旋回及煤巖組合特征分為三段:第一段含4、4-1、4-2煤,第二段含4上-2、4上-1煤,第三段含3煤。礦井目前開采4煤層,4煤層屬于穩(wěn)定可采煤層,底板為泥巖。礦區(qū)主要屬中生代承壓水盆地范疇,勘探階段未揭露大型斷層,僅在采掘過程中揭露部分小型斷層,因此該礦的充水通道主要受采動(dòng)影響。
回采工作面位于礦區(qū)二采區(qū)中部。煤層頂板為深灰色炭質(zhì)泥巖和灰白色中砂巖,工作面地質(zhì)構(gòu)造相對(duì)簡單。工作面三岔口以北263 m存在一正斷層,斷層面膠結(jié)性良好,透水性較差。三岔口以北516 m處存在一逆斷層,斷層發(fā)育高度較小,掘進(jìn)過程中頂板存在淋水現(xiàn)象,水量較小且持續(xù)時(shí)間較短。NY103工作面中部有一走向EW的向斜構(gòu)造,北翼傾向SW,傾角3°~8°,南翼傾向NW,傾角3°~11°.回采過程中頂板淋水、NY105工作面采空區(qū)積水等將全部流向向斜軸部,有可能造成工作面突水。
本文選取該煤礦突水實(shí)例的工作面煤層底板突水?dāng)?shù)據(jù)以及正?;夭蓪?shí)測數(shù)據(jù)進(jìn)行分析(如表1所示)。
由于原始數(shù)據(jù)中各項(xiàng)數(shù)據(jù)相互間有較大的差別,例如其數(shù)據(jù)類型有差別、數(shù)據(jù)采用的量綱也不同、絕對(duì)值存在較大的差值,因此需要對(duì)數(shù)據(jù)進(jìn)行歸一化處理,否則會(huì)對(duì)模型的運(yùn)行產(chǎn)生較大影響。輸入樣本中包含邏輯型數(shù)據(jù)和數(shù)值型數(shù)據(jù),前者使用0和1表示,后者運(yùn)用線性轉(zhuǎn)換方式把輸入數(shù)據(jù)的范圍投射到[0,1]區(qū)間,其轉(zhuǎn)換方式如式(2)所示:
(2)
式中:x(p,i)為樣本p中第i個(gè)數(shù)據(jù)進(jìn)行歸一化處理后的數(shù)值;x0(p,i)為樣本p中第i個(gè)數(shù)據(jù)進(jìn)行歸一化處理前的數(shù)值;xmin(i)為全部樣本中第i個(gè)數(shù)據(jù)的最小值;xmax(i)為全部樣本中第i個(gè)數(shù)據(jù)的最大值。
特征選擇是將冗余特征去掉,將輸入向量空間維數(shù)減小,同時(shí)將學(xué)習(xí)樣本進(jìn)行優(yōu)化,是對(duì)輸入數(shù)據(jù)使用降維操作的一個(gè)步驟,可以明顯提升訓(xùn)練效率。針對(duì)煤層底板突水預(yù)測問題,各個(gè)地區(qū)的煤礦處于不同的地理位置,并且各個(gè)地區(qū)煤礦的主控因素千差萬別,因此存在各種各樣導(dǎo)致突水的原因。在現(xiàn)場收集的數(shù)據(jù)不僅數(shù)據(jù)量非常大,同時(shí)存在許多無關(guān)緊要的冗余數(shù)據(jù),而這些數(shù)據(jù)會(huì)對(duì)模型的訓(xùn)練效率產(chǎn)生影響,所以需要預(yù)先去掉這些冗余數(shù)據(jù)。
在突水預(yù)測問題方面,可以采用Wrapper評(píng)價(jià)策略,因?yàn)樵紭颖镜臄?shù)據(jù)量比較小,其數(shù)據(jù)特征只有15維,在保證準(zhǔn)確率的情況下,運(yùn)算速度也不至于太慢。因此本文選用基于Wrapper評(píng)價(jià)策略的特征選擇方法[21]。
以下為該特征選擇方法的詳細(xì)過程和計(jì)算結(jié)果:
將原始特征集合內(nèi)的所有特征進(jìn)行編號(hào),開始第一輪的特征選擇,號(hào)碼“1,2,…,15”分別代表“煤層傾角、煤層厚度、構(gòu)造有無、斷層落差、裂隙帶有無、采動(dòng)破壞深度、采高、開采面積、走向長度、含水層厚度、水壓、距工作面距離、灰?guī)r段厚度、砂巖段厚度、泥巖段厚度”。在15維的原始特征集合內(nèi)每次刪掉號(hào)碼i的特征(i=1,2,…,15),把剩下的14維特征用特征子集Mi(i=1,2,…,15)表示,從而獲得M1,M2,…,M15共15個(gè)特征子集;并且,用子集M0表示原始特征集合。把子集M0,M1,M2,…,M15按順序輸入模型,對(duì)GRU神經(jīng)網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練,將預(yù)測準(zhǔn)確率的大小用作評(píng)判結(jié)果好壞的標(biāo)準(zhǔn),選用“十折交叉驗(yàn)證法”對(duì)錯(cuò)誤率進(jìn)行運(yùn)算。Mi(i=0,1,…,15)的錯(cuò)誤率分別由xi(i=0,1,…,15)表示。把xi(i=1,2,…,15)分別與x0做對(duì)比,如果相互間的差值很小,就假設(shè)僅去掉號(hào)碼i的特征之后,對(duì)整體的誤差率不會(huì)產(chǎn)生太大影響,將其認(rèn)定為待定冗余特征。
圖3為各個(gè)子集第一輪特征選擇時(shí)的誤差率計(jì)算結(jié)果,由圖可知,“x0,x3,x9,x12,x15”這5個(gè)點(diǎn)的誤差率較低,將不去除子集中任意特征的誤差率設(shè)為x0,“x3,x10,x13,x15”代表在原始的特征子集中僅單獨(dú)去掉“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”這四個(gè)特征后的誤差率。故而,“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”被判定為待定冗余特征。同時(shí),因?yàn)閤3和x0最為相近,因此認(rèn)定與其對(duì)應(yīng)的“構(gòu)造有無”為冗余特征,再把該特征從原始集合中剔除,集合變成14維,然后進(jìn)行第二輪特征選擇。和第一輪相同,第二輪特征選擇對(duì)每個(gè)特征重新編號(hào),重復(fù)一遍第一輪的過程。
圖3 各個(gè)子集在第一輪特征選擇時(shí)的誤差率Fig.3 Error rate of each subset in the first round of feature selection
圖4為各個(gè)子集在第五輪特征選擇時(shí)的誤差率。如圖所示,從集合中單獨(dú)去除某一特征后,都顯著影響了最后的誤差率,可以表明“煤層傾角、煤層厚度、斷層落差、裂隙帶有無、采動(dòng)破壞深度、采高、開采面積、走向長度、水壓、距工作面距離、砂巖段厚度”這11項(xiàng)特征和煤層底板突水是密切相關(guān)的。同時(shí)前四輪已去除的4項(xiàng)特征被認(rèn)定為冗余特征,分別為“構(gòu)造有無、含水層厚度、灰?guī)r段厚度、泥巖段厚度”。
圖4 各個(gè)子集在第五輪特征選擇時(shí)的誤差率Fig.4 Error rate of each subset in the fifth round of feature selection
GRU神經(jīng)網(wǎng)絡(luò)模型可以學(xué)習(xí)時(shí)間序列數(shù)據(jù)。由上文可知,數(shù)據(jù)維數(shù)已由15維降到11維,在進(jìn)行分類和劃分?jǐn)?shù)據(jù)集后,就可輸入到模型中。通過回采點(diǎn)與時(shí)間段的差異,對(duì)數(shù)據(jù)進(jìn)行排序分組,然后把分組好的數(shù)據(jù)分為訓(xùn)練集、驗(yàn)證集和測試集;每個(gè)部分所占的比例不同,其中訓(xùn)練集是分組好的數(shù)據(jù)中隨機(jī)抽取60%所構(gòu)成,驗(yàn)證集為20%,測試集為20%.
在訓(xùn)練過程中,每次訓(xùn)練輸入一組數(shù)據(jù),把模型預(yù)測結(jié)果和實(shí)際結(jié)果對(duì)比,從而得到誤差率,之后采用優(yōu)化算法對(duì)權(quán)重矩陣進(jìn)行更新,提高預(yù)測準(zhǔn)確率。在全部數(shù)據(jù)都輸入模型得到預(yù)測結(jié)果,并進(jìn)行權(quán)重調(diào)整后,對(duì)模型的一輪訓(xùn)練才算結(jié)束。同時(shí),根據(jù)實(shí)際情況確定訓(xùn)練的輪數(shù)。
圖5為GRU神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率及損失情況。圖5(a)代表訓(xùn)練集上預(yù)測的準(zhǔn)確率變化動(dòng)態(tài),圖5(b)表示訓(xùn)練集上損失值變化動(dòng)態(tài),圖5(c)表示驗(yàn)證集上預(yù)測的準(zhǔn)確率變化動(dòng)態(tài),圖5(d)表示驗(yàn)證集上損失值變化動(dòng)態(tài)。因Dropout的啟用,一部分節(jié)點(diǎn)被隱藏,模型的準(zhǔn)確率以及損失會(huì)隨迭代次數(shù)的加大而發(fā)生抖動(dòng),而訓(xùn)練集準(zhǔn)確率低于驗(yàn)證集,同時(shí)明顯的過擬合顯現(xiàn)沒有發(fā)生。由圖5可以得到,GRU預(yù)測模型在訓(xùn)練集上的準(zhǔn)確率可以達(dá)90.42%,在驗(yàn)證集上的準(zhǔn)確率可以達(dá)96.29%.
圖5 GRU神經(jīng)網(wǎng)絡(luò)模型準(zhǔn)確率及損失情況Fig.5 Accuracy and loss of GRU neural network model
結(jié)合前文礦區(qū)的現(xiàn)場實(shí)測數(shù)據(jù),本文使用支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、極限學(xué)習(xí)機(jī)這三個(gè)靜態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測模型與動(dòng)態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行對(duì)比。每個(gè)模型均按前文所述方法,將數(shù)據(jù)劃分成訓(xùn)練集、驗(yàn)證集及測試集,應(yīng)用各模型將訓(xùn)練集數(shù)據(jù)進(jìn)行訓(xùn)練,以測試集準(zhǔn)確率為準(zhǔn)進(jìn)行模型預(yù)測精度評(píng)估。
不同預(yù)測模型的準(zhǔn)確度結(jié)果如圖6所示,動(dòng)態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預(yù)測模型在訓(xùn)練、驗(yàn)證和測試三個(gè)階段的準(zhǔn)確率均要高于靜態(tài)的支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)和極限向量機(jī)。尤其是在最終的測試階段,動(dòng)態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預(yù)測模型的準(zhǔn)確率要達(dá)到95.23%,而其他的靜態(tài)預(yù)測模型的準(zhǔn)確率均低于90%.
圖6 不同預(yù)測模型在訓(xùn)練、驗(yàn)證及測試階段的準(zhǔn)確率Fig.6 Accuracy of different prediction models in the training, verification, and testing phases
GRU神經(jīng)網(wǎng)絡(luò)模型與BP神經(jīng)網(wǎng)絡(luò)等向前反饋的靜態(tài)預(yù)測模型相比,GRU神經(jīng)網(wǎng)絡(luò)模型依靠對(duì)大量的數(shù)據(jù)樣本進(jìn)行學(xué)習(xí),并自身總結(jié)出煤層底板突水的變化規(guī)律及該動(dòng)態(tài)變化對(duì)突水的影響,從而對(duì)突水變化因素進(jìn)行高精度的篩選,較其余三種靜態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測模型在煤層底板突水預(yù)測能力上具有更高的準(zhǔn)確率,運(yùn)用到煤礦開采中可以極大地提高生產(chǎn)安全。
工程現(xiàn)場表明,大部分礦井突水都與斷層、陷落柱等構(gòu)造密切相關(guān)。該礦統(tǒng)計(jì)的大部分?jǐn)?shù)據(jù)中都是有構(gòu)造的,但通過Wrapper評(píng)價(jià)的特征選擇,最終確定“構(gòu)造有無”為冗余特征;相反,“煤層厚度、開采面積”卻被特征選擇為與煤層底板突水密切相關(guān)。后續(xù)研究需要進(jìn)一步改進(jìn)相關(guān)的特征選擇方法。
1) 以煤礦突水理論及現(xiàn)場實(shí)測數(shù)據(jù)為依據(jù),建立了煤礦突水影響因素指標(biāo)體系,并基于Wrapper評(píng)價(jià)策略的特征選擇,確定“煤層傾角、煤層厚度、斷層落差、裂隙帶有無、采動(dòng)破壞深度、采高、開采面積、走向長度、水壓、距工作面距離、砂巖段厚度”這11項(xiàng)特征和煤層底板突水密切相關(guān)。
2) 煤層突水GRU神經(jīng)網(wǎng)絡(luò)模型通過對(duì)現(xiàn)場實(shí)測數(shù)據(jù)的學(xué)習(xí),確定其在訓(xùn)練集上的預(yù)測準(zhǔn)確率達(dá)90.42%,在驗(yàn)證集上的準(zhǔn)確率達(dá)到96.29%,可以很好地進(jìn)行煤層突水預(yù)測測試。
3) 將動(dòng)態(tài)的GRU神經(jīng)網(wǎng)絡(luò)預(yù)測模型與支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)及機(jī)器學(xué)習(xí)機(jī)這三個(gè)靜態(tài)的神經(jīng)網(wǎng)絡(luò)預(yù)測模型進(jìn)行比較,發(fā)現(xiàn)動(dòng)態(tài)的GRU預(yù)測模型預(yù)測的準(zhǔn)確率在訓(xùn)練、驗(yàn)證及測試階段都要高于其他的靜態(tài)模型。因此,GRU模型比其他靜態(tài)神經(jīng)網(wǎng)絡(luò)預(yù)測模型要更適合應(yīng)用到煤層底板突水預(yù)測。