趙洪寶劉瑞劉一洪張一瀟顧濤
1. 中國礦業(yè)大學(xué)(北京)能源與礦業(yè)學(xué)院,北京 100083;
2. 河北省物聯(lián)網(wǎng)監(jiān)控工程技術(shù)研究中心,河北廊坊 065201
近年來,微震監(jiān)測系統(tǒng)作為一種巖石狀態(tài)監(jiān)測手段,已廣泛應(yīng)用于礦山監(jiān)測中[1-5]。微震信號的高精度識別對于提高檢測系統(tǒng)可靠性,預(yù)測災(zāi)害發(fā)生具有重要的意義。但現(xiàn)存的礦山微震信號的識別方法精度和效率較低,因此需要開發(fā)新的識別方法進行識別。微震信號為一系列非線性隨機信號,相對于其他信號較為復(fù)雜[6-7]。同時,礦山生產(chǎn)過程中還存在大量背景或者人為干擾信號,這些干擾信號對礦山微震信號的準(zhǔn)確識別造成了困難[8-9]。國內(nèi)外學(xué)者對微震信號識別開展了廣泛研究,并取得了豐碩成果。趙國彥等[10-11]提出一種基于希爾伯特黃變換和分形維數(shù)相結(jié)合的識別方法;尚雪義等[12]將支持向量機與希爾伯特黃變換相結(jié)合,實現(xiàn)了機器學(xué)習(xí)方法與傳統(tǒng)方法的結(jié)合;董隴軍等[13]對波形參數(shù)進行擴充,將Fisher 判別法進行改進,提高了識別精度;Zhang 等[14]融合決策樹與VMD,為礦山微震信號識別模型的構(gòu)建提供了一種新思路;朱權(quán)潔等[15]采用分形維數(shù)與小波包變換結(jié)合的方法,并用支持向量機(SVM)的方法對礦山微震信號進行了分類識別;Bi 等[16]基于DCNN 和SVM 相耦合進行了礦山微震信號進行識別。目前上述方法已運用在機器學(xué)習(xí)領(lǐng)域中,但是未能深入到深度學(xué)習(xí)領(lǐng)域當(dāng)中。
王國法等[17]認(rèn)為,礦山領(lǐng)域中的深度學(xué)習(xí)是將來研究發(fā)展的重點。而目前存在的大量方法均為機器學(xué)習(xí),無法深入到深度學(xué)習(xí),因此開發(fā)深度學(xué)習(xí)識別模式非常有必要。同時,特征深度學(xué)習(xí)區(qū)別于機器學(xué)習(xí),關(guān)鍵因素是機器是否自動提取[18]。因此需要研究開發(fā)新的深度學(xué)習(xí)網(wǎng)絡(luò)識別方法,以實現(xiàn)礦山生產(chǎn)過程中信號特征的自動提取和信號種類的自動識別。
卷積是深度學(xué)習(xí)中一種常用的計算方法,最先應(yīng)用于信號處理識別方向。在深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)中存在卷積和池化兩種計算方法,可以對波形整體的信號進行把握,適合大量計算且具有較高的魯棒性[19]。故本文提出一種采用深度學(xué)習(xí)卷積神經(jīng)網(wǎng)絡(luò)對微震信號識別的模型,即VGG4-CNN 模型。
目前針對礦山微震信號的識別方法主要分為兩類,一類為時域識別,另一類為頻域識別。時域識別主要依靠信號在波形上的一些特征進行識別,該特征主要包括尾波發(fā)育特征、分形維數(shù)特征、峰值特征等。依據(jù)時域特征,可以將礦山微震信號主要分為隨機干擾信號(A)、規(guī)則干擾信號(B)和難識別信號(C)三類[15]。在數(shù)據(jù)方面,本文選取在礦山生產(chǎn)過程中具有代表性的9 類信號進行識別,9 類信號包括鏟煤、背景、爆破、鋤煤、破裂、喊話、礦車、敲擊、鎬刨,其波形圖像如圖1 所示。
如圖1 所示,對尾波衰減特征而言,巖石破裂信號、敲擊信號和爆破信號的波形較為相似,其峰值會突然出現(xiàn)并存在衰減,在該過程中擁有相似的波形;手鎬刨煤作業(yè)、鋤頭刨煤和鏟子鏟煤三類信號,波形均具有瞬時性且尾波發(fā)育較少;人員喊話是由于某一時刻的突發(fā)性事件而造成的震動,因而尾波較少。對于波形分形而言,背景噪聲所呈現(xiàn)的微震信號的波形圖像為雜亂和無序;敲擊信號與爆破信號呈現(xiàn)出一定周期;鎬煤、鋤煤和鏟煤等人為干擾信號無任何周期性。在峰值方面,爆破峰值最高,喊話與破裂信號峰值較為相近,由人員作業(yè)引起的微震信號峰值較小。
圖1 各類礦山微震信號波形Fig.1 Waveforms of microseismic signals of various types of mines
可見,從單一特征進行多類信號識別較為困難,因此開發(fā)更為細(xì)致和精確的多類型波形信號識別方法尤為關(guān)鍵。
深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在近些年被廣泛應(yīng)用于分類識別任務(wù)中,具有較強魯棒性。本文采用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型對礦山微震信號進行識別,進而提高微震信號的識別精度與速度,實現(xiàn)多類識別。深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)主要由數(shù)據(jù)預(yù)處理、主干神經(jīng)網(wǎng)絡(luò)和損失函數(shù)三部分構(gòu)成[18]。數(shù)據(jù)預(yù)處理包括數(shù)據(jù)收集、數(shù)據(jù)標(biāo)注和數(shù)據(jù)集構(gòu)建;主干神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型核心,需要依據(jù)需求進行設(shè)計;損失函數(shù)則是控制主干神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)路徑和學(xué)習(xí)結(jié)果的一種方法。
數(shù)據(jù)預(yù)處理需要先對數(shù)據(jù)進行收集,再對數(shù)據(jù)進行標(biāo)注和數(shù)據(jù)集構(gòu)建。在數(shù)據(jù)收集和數(shù)據(jù)標(biāo)注方面,本文以山西某礦的礦山微震信號為數(shù)據(jù)基礎(chǔ),由人員在現(xiàn)場跟進并記錄發(fā)生事件和時間,實現(xiàn)對數(shù)據(jù)的標(biāo)注。在數(shù)據(jù)集構(gòu)建方面,采用K 折交叉驗證方法(K-fold Cross Validation)將整體數(shù)據(jù)分為三類集合(學(xué)習(xí)集、交叉驗證集、測試集[21])。神經(jīng)網(wǎng)絡(luò)通過對學(xué)習(xí)集進行學(xué)習(xí),不斷通過交叉驗證集對訓(xùn)練過程進行修正和對已有的學(xué)習(xí)過程進行測試,最終通過測試集進行性能測試與評價。在K 折交叉驗證方法中,學(xué)習(xí)集與測試集按一定數(shù)值進行劃分,該比例值被稱為K值。在一般計算中K值取5,本文同樣取5。K 折交叉驗證流程如圖2 所示。
圖2 神經(jīng)網(wǎng)絡(luò)數(shù)據(jù)流程示意圖Fig.2 Schematic diagram of the neural network data flow
深度神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)過程,本質(zhì)上是通過數(shù)據(jù)集和損失函數(shù)對主干神經(jīng)網(wǎng)絡(luò)中參數(shù)進行求解的過程。同時,深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在進行分類時,同樣依靠主干神經(jīng)網(wǎng)絡(luò),將微震信號從一種較復(fù)雜的高維空間表達方式轉(zhuǎn)換為容易的低維空間表達方式,進而實現(xiàn)區(qū)分不同類別。主干神經(jīng)網(wǎng)絡(luò)的運算方法一般為卷積運算。結(jié)合離散卷積性質(zhì)可知,第i層主干神經(jīng)網(wǎng)絡(luò)的卷積信號可以表達如下:
式中,i為卷積層數(shù);m為離散采樣點數(shù);Si(t)為經(jīng)過i-1 層卷積核卷積后的信號特征;k為卷積核迭代次數(shù);n為卷積步伐;(n-t)為第k次迭代后的第i-1 層卷積核;a、b為池化層尺寸;L為激活函數(shù)。
對于新構(gòu)建的Si(t)信號特征,采用Softmax 損失函數(shù)進行分類和損失計算:
式中,j為Si(t)第j個數(shù);為特征向量的第j個特征。
主干神經(jīng)網(wǎng)絡(luò)作為神經(jīng)網(wǎng)絡(luò)核心,是神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)和識別的基礎(chǔ)。VGG4-CNN 模型當(dāng)中的主干神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)如下:卷積層(C)3個,池化層(P)2 個,全連接層(F)1 個,Softmax層1 個。在數(shù)據(jù)輸入C1層前,將數(shù)據(jù)由(1×10 000)的向量變換為(100×100)的矩陣進行預(yù)處理;第C1層采用(5×5)的卷積核進行16 次卷積,形成(16×100×100)張量。在C1層卷積結(jié)束以后,P1層對卷積生產(chǎn)的數(shù)據(jù)進行(2×2)池化,將大小(100×100)的數(shù)據(jù)格式轉(zhuǎn)化為單個(50×50)的數(shù)據(jù)矩陣。C2卷積層對P1層每層數(shù)據(jù)進行32 次卷積,形成深度為256 的張量;同時C3層繼續(xù)對C2層中的輸出數(shù)據(jù)進行16 次卷積,最終得到(4 096×50×50)結(jié)構(gòu)張量;在C2和C3卷積層中,卷積核大小為(3×3),步伐為(1×1)。為方便特征提取和減少計算量,在C3卷積層卷積后對產(chǎn)出數(shù)據(jù)進行池化,對(5×5)的P2池化層進行處理,形成(4 096×8×8)的池化張量;在池去化層P2結(jié)束以后,加入全連接層對P2層數(shù)據(jù)進行空間拓?fù)浠樘岣哒w神經(jīng)網(wǎng)絡(luò)預(yù)測效果,在全連接層結(jié)束后布置Softmax 層[14]。對于激活函數(shù),本次神經(jīng)網(wǎng)絡(luò)均采用Relu 激活函數(shù),分別存在于C1與P1、C2與C3、C3與P2層之間,總計3 次使用。主干神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。
圖3 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)示意圖Fig.3 Schematic diagram of VGG4-CNN neural network
為對本文提出的神經(jīng)網(wǎng)絡(luò)模型效果進行驗證,采用數(shù)據(jù)集中的測試集對神經(jīng)網(wǎng)絡(luò)進行性能測試。在本次測試中,神經(jīng)網(wǎng)絡(luò)運行訓(xùn)練采用GPU 處理器,設(shè)備型號為:GeForce RTX 2060;最高線程7、最低線程5;計算最高頻率1.2 GHz。設(shè)備性能屬于中層次。此外,為防止出現(xiàn)過擬合狀態(tài),神經(jīng)網(wǎng)絡(luò)將設(shè)置隨機失活參數(shù)(Droup Out)[12],參數(shù)設(shè)定見表1。
表1 神經(jīng)網(wǎng)絡(luò)訓(xùn)練各項參數(shù)Tab.1 Parameters of neural network training
為方便展示,將輸出信號進行繪制,對9 種波形型號的預(yù)處理圖像、VGG4-CNN 神經(jīng)網(wǎng)絡(luò)過程中卷積層和池化層進行可視化輸出,其結(jié)果見表2。
表2 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對于不同種類信號各層輸出情況Tab.2 VGG4-CNN neural network output for different types of signals
如表2 所示,因喊話、敲擊、手鎬刨煤三類信號在P2-1的輸出較為相似,對P2-2特征層進行可視化表明差異性。P2-2特征層可視化圖像見表3。
表3 三類礦山微震信號P2-2 特征層Tab.3 P2-2 layer characteristics of microseismic signals of three types of mines
由表2 和表3 可知:
(1) 在噪聲的處理方面,除喊話以外,余下信號在通過C3層時,已經(jīng)將噪聲過濾,說明VGG4-CNN 神經(jīng)網(wǎng)絡(luò)具有一定的抗干擾性和濾波性。
(2) 在數(shù)據(jù)保真方面,數(shù)據(jù)C2層處理后,數(shù)據(jù)值發(fā)生變化,其中最明顯的是喊話、礦車、敲擊、鎬煤事件等瞬發(fā)無尾波發(fā)育的信號,對峰值這一重要區(qū)分度的信息進行了保留。這表明在傳遞過程中卷積核和主干神經(jīng)網(wǎng)絡(luò)對信號中重點信息有著合理的把控。
(3) 在神經(jīng)網(wǎng)絡(luò)對各波形的差異把控方面,爆破信號P2-1輸出特征值先小幅度上升(紫色變淺黃色)再大幅度上升(紫色變黃色);在敲擊信號中,P2層體現(xiàn)了信號的后續(xù)震蕩,但短于爆破信號,體現(xiàn)了神經(jīng)網(wǎng)絡(luò)對于波形整體的把控性。
(4) 在喊話、敲擊、手鎬刨煤三類事件中,P2-1層較為相似,而在P2-2層中表現(xiàn)出來一定的差異性。該狀況符合神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程,即多層神經(jīng)網(wǎng)絡(luò)層共同作用于信息,而非采用單一神經(jīng)網(wǎng)絡(luò)層進行作用。
為對本文提出的神經(jīng)網(wǎng)絡(luò)模型性能進行合理評價,將VGG4-CNN 模型的訓(xùn)練過程、特征提取效果、訓(xùn)練結(jié)果等進行縱向分析,并與LSTM-RNN、BP 和DCNN 識別方法進行比對和分析。
訓(xùn)練過程中的損失和準(zhǔn)確率是考察學(xué)習(xí)過程變化的重要指標(biāo)。VGG4-CNN 在訓(xùn)練過程中損失和準(zhǔn)確率變化情況如圖4 所示。
圖4 VGG4-CNN 訓(xùn)練過程中準(zhǔn)確率和損失變化情況Fig.4 Accuracy and loss changes in VGG4-CNN training process
由圖4 可知,在準(zhǔn)確率方面,隨著訓(xùn)練次數(shù)增加,出現(xiàn)逐漸上升趨勢,上升速度逐漸下降,且靠近1 但永遠(yuǎn)小于1;在損失方面,損失逐漸降低收斂于0。在訓(xùn)練過程中,VGG4-CNN 模型的損失和準(zhǔn)確率變化趨勢符合神經(jīng)網(wǎng)絡(luò)訓(xùn)練的變化情況。
特征可視化是檢驗神經(jīng)網(wǎng)絡(luò)的卷積特征提取層提取效果的一種方法。因神經(jīng)網(wǎng)絡(luò)提取后特征維度高于2 維,因此需要對其進行降維處理。t-SNE 是基于SNE 提出的,是一種流行非線性降維方法,可以將高維特征進行可視化降維,以觀察神經(jīng)網(wǎng)絡(luò)模型特征提取效果。降維效果如圖5 所示。
由圖5 可知,各類微震信號出現(xiàn)了族群聚類效應(yīng);巖石破裂信號(綠色)族群明顯遠(yuǎn)離其他信號族群,表明模型有效提取了巖石破裂信號時域特征;干擾信號主要集中在中部位置,說明了噪聲信號的混雜性。
圖5 各類信號經(jīng)t-SNE 降維后的平面分布Fig.5 Plane distribution of various signals after dimensionality reduction by t-SNE
訓(xùn)練結(jié)果分析是對神經(jīng)網(wǎng)絡(luò)性能的另一種重要評價方法。該方法在神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練結(jié)束以后,采用全新數(shù)據(jù)進行預(yù)測分類,從而實現(xiàn)對神經(jīng)網(wǎng)絡(luò)性能的分析。對于訓(xùn)練結(jié)果存在著3 種重要的評價指標(biāo),分別為精準(zhǔn)率、召回率、F1系數(shù)。VGG4-CNN 神經(jīng)網(wǎng)絡(luò)測試結(jié)果及耗時見表4。
表4 VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對于各項數(shù)據(jù)識別結(jié)果及耗時Tab.4 Identification results and time consuming of VGG4-CNN neural network
由表4 可知,當(dāng)有較大數(shù)據(jù)樣本進行學(xué)習(xí)時,預(yù)測較為精準(zhǔn);當(dāng)數(shù)據(jù)集較小時,可能會出現(xiàn)一定的偏差。
對傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)、LSTM 神經(jīng)網(wǎng)絡(luò)和DCNN 分類方法進行建模和分析,并與本文提出的模型進行對比,結(jié)果見表5 和圖6。
表5 4 類神經(jīng)網(wǎng)絡(luò)耗時及準(zhǔn)確率對比Tab.5 Comparison of time consumption and accuracy of four types neural networks
由表5 和圖6 可知,傳統(tǒng)的BP 和DCNN 兩類神經(jīng)網(wǎng)絡(luò)在多分類任務(wù)方面出現(xiàn)了過擬合現(xiàn)象。DCNN 耗時過高,原因為該程序需要先對波形進行去噪、繪圖再進行識別;VGG4-CNN 與LSTM-RNN因?qū)?shù)據(jù)直接進行分析省略了繪圖步驟,降低了耗時,但VGG4-CNN 識別模型精度高于LSTM-RNN模型。
圖6 4 種神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程損失及準(zhǔn)確率對比Fig.6 Comparison of loss and accuracy of 4 types neural network training process
訓(xùn)練結(jié)果顯示,DCNN 未能有效區(qū)分爆破作業(yè)、敲擊、手鎬刨煤和鋤頭刨煤信號,其原因為它們的波形結(jié)構(gòu)較為相似。除此之外,VGG4-CNN 神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上耗時較大,存儲空間大約為2.29 GB,占用內(nèi)存較大。
(1) 本文提出的VGG4-CNN 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在對礦山微震信號識別時,正確率為94% ,且響應(yīng)時間短、正確率高、魯棒性強,具有一定的優(yōu)越性。
(2) VGG4-CNN 神經(jīng)網(wǎng)絡(luò)對于噪聲具有一定的過濾效果,在采用神經(jīng)網(wǎng)絡(luò)進行識別時,可以適當(dāng)放棄去噪過程以加速學(xué)習(xí)。
(3) 構(gòu)建的VGG4-CNN 神經(jīng)網(wǎng)絡(luò),雖然對單個識別耗時較少,但是在訓(xùn)練上存儲空間占用較大,約為2.29 GB。減少訓(xùn)練時間和存儲空間為下一步研究方向。