王英樂,左宇軍,陳 斌,林健云,鄭祿璟,萬入禎
(貴州大學(xué) 礦業(yè)學(xué)院,貴州 貴陽 550025)
微震監(jiān)測是一種有效的區(qū)域性地壓監(jiān)測手段。由于礦山環(huán)境復(fù)雜,干擾因素較多,將有效的微震事件從眾多的樣本數(shù)據(jù)中提取出來是實(shí)現(xiàn)微震監(jiān)測預(yù)警的前提[1]。微震信號是典型的非線性、非平穩(wěn)信號,受復(fù)雜的背景噪聲干擾,常規(guī)方法很難有效識別與提取。
目前,針對礦山巖體微震和爆破信號的識別方法主要有時頻分析和多參數(shù)聯(lián)合識別[2-4]。時頻分析能有效提取非線性信號的波形頻譜特征,文獻(xiàn)[5-6]借助小波包變換研究了微震和爆破信號在多頻帶內(nèi)的能量分布特征,將小波包與分形相結(jié)合提取微震信號特征,并采用支持向量機(jī)(SVM)對信號進(jìn)行分類,識別率達(dá)到94%;文獻(xiàn)[7]采用頻率切片小波變換對巖體微震與爆破信號的時頻特性、不同頻帶能量分布和相關(guān)系數(shù)進(jìn)行了研究;文獻(xiàn)[8]提出了基于經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)和奇異值分解(SVD)的礦山信號特征提取及分類方法;文獻(xiàn)[9]在經(jīng)驗(yàn)小波變換基礎(chǔ)上提出一種新的頻譜分割方法,通過SVD分解提取最大奇異值和奇異熵作為模式識別的特征向量;文獻(xiàn)[10]利用局部均值分解法(LMD)對微震信號分解,并將主分量的相關(guān)系數(shù)和能譜系數(shù)作為模式識別的特征向量。
針對EMD存在的模態(tài)混疊和端點(diǎn)效應(yīng)等問題,本文將互補(bǔ)集合經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMD)[11]結(jié)合Hilbert-Huang變換(HHT),提出改進(jìn)HHT時頻分析方法。根據(jù)相關(guān)系數(shù)和方差貢獻(xiàn)率篩選出主要IMF分量,并采用偏度、峭度、Hilbert邊際譜能量、Lempel-Ziv復(fù)雜度以及分形盒維數(shù)等5種時頻域特征參數(shù)構(gòu)成多尺度高維特征向量;利用文獻(xiàn)[12]提出的拉普拉斯得分(LS)特征降維方法,選擇有意義的敏感特征子集,改善分類性能;最后通過GA-SVM模型實(shí)現(xiàn)礦山巖體微震和爆破信號的智能識別分類。
CEEMD分解是針對EMD分解存在的端點(diǎn)效應(yīng)和模態(tài)混疊現(xiàn)象而提出的一種非線性信號分析方法。CEEMD分解由以下3個步驟組成[13]:
步驟1:在原始信號中加入n組正、負(fù)成對的輔助白噪聲,從而生成兩組集合信號:
式中S為原始信號;N為輔助噪聲;M1和M2分別為加入正負(fù)成對噪聲后的信號。這樣得到集合信號的個數(shù)為2n。
步驟2:對集合中的每一個信號進(jìn)行EMD分解,每個信號得到一組IMF分量,其中第i個信號的第j個IMF分量表示為xij。
步驟3:通過多分組分量組合的方式得到分解結(jié)果:
式中xj為CEEMD分解最終得到的第j個IMF分量。
其中所加白噪聲的殘余噪聲隨分解次數(shù)增加而逐漸減少,本文所選的白噪聲幅值標(biāo)準(zhǔn)差是原始信號幅值標(biāo)準(zhǔn)差的0.2倍,分解次數(shù)為200次。
信號x(t)進(jìn)行CEEMD分解后,對相關(guān)系數(shù)較大的IMF分量imfi(t)進(jìn)行Hilbert變換,可得Hilbert譜,記為[14]:
式中RC表示取實(shí)部運(yùn)算;Ai(t)為瞬時幅值;Fi(t)為瞬時頻率。
Hilbert邊際譜h(F)定義為:
Hilbert邊際譜能量E(F)定義為:
式中F1、F2分別為Hilbert邊際譜h(F)的頻率區(qū)間。
LS的思想是根據(jù)特征參數(shù)的局部保持能力來評價特征的重要性[14]。給定m個數(shù)據(jù)樣本,每個數(shù)據(jù)樣本包含n個特征。假設(shè)Lr為第r(r=1,2,…,n)個特征的LS,令fn為第i(i=1,2,…,m)個樣本對應(yīng)的第r個特征。
1)構(gòu)建樣本的最鄰近圖G。當(dāng)兩個樣本xi和xj(i≠j)較“近”時,將兩個樣本通過邊相連??梢匀i的k鄰近點(diǎn),建立最近鄰近圖。
2)計(jì)算相似度矩陣S:
式中T為合適的常數(shù)。
3)計(jì)算圖的拉普拉斯矩陣L:
對于第r個特征,fr可以定義為:
式中矩陣L稱為拉普拉斯變換。
第r個特征的拉普拉斯積分為:
式中Var(fr)為第r個特征對應(yīng)的方差。
Sij值越大,Laplacian分?jǐn)?shù)Lr越小,特征的重要性越高。選取前幾個LS值較小的特征作為包含幾乎全部微震信號信息的敏感特征,可提高計(jì)算效率。
基于改進(jìn)HHT的分類方法具體步驟如下:
1)將原始信號的振幅歸一化處理,對其進(jìn)行CEEMD分解得到數(shù)個IMF分量。
2)根據(jù)相關(guān)系數(shù)和方差貢獻(xiàn)率,篩選包含真實(shí)信息的IMF分量,對其進(jìn)行信號重構(gòu)。
3)計(jì)算步驟2)中篩選出的IMF分量的峭度、偏度、邊際譜能量和Lempel-Ziv復(fù)雜度以及重構(gòu)信號分形盒維數(shù),作為特征參數(shù)。
4)利用LS算法選出包含信號敏感特征的低維特征向量集。
5)根據(jù)步驟4)中的特征向量集,將訓(xùn)練集數(shù)據(jù)代入GA-SVM進(jìn)行訓(xùn)練,獲得C和g最優(yōu)時的模型,再將測試集輸入此模型進(jìn)行信號分類。
從黔西南錦豐金礦的IMS微震監(jiān)測系統(tǒng)中選取典型的微震和爆破信號,其波形和頻譜如圖1所示。它具有如下特點(diǎn):①微震信號是巖體裂紋擴(kuò)展發(fā)育中形成的,主要是剪切破壞,S波明顯,波形持續(xù)時間較長且衰減緩慢。頻帶分布較窄,能量較為集中且主要分布在0~100 Hz。②爆破信號主要為縱波,一般有重復(fù)波形,但衰減較快,尾波不發(fā)育,且幅值通常高于微震信號;頻帶豐富,但能量主要集中在150~250 Hz。
圖1 巖體破裂和爆破振動信號波形和頻譜圖
對兩類信號進(jìn)行CEEMD分解,得到數(shù)個從高頻到低頻的IMF分量。計(jì)算各分量與原信號的相關(guān)系數(shù)和方差貢獻(xiàn)率,結(jié)果見圖2,兩個指標(biāo)值越大,對應(yīng)的分量越重要。兩類信號前6個分量的相關(guān)系數(shù)和方差貢獻(xiàn)率較大,當(dāng)超過IMF6時,相關(guān)系數(shù)和方差貢獻(xiàn)率最大值僅為0.008 7和0.000 4,可認(rèn)為IMF7~I(xiàn)MF11在原始信號中所占比重較小,可以剔除。故選取IMF1~I(xiàn)MF6為主要分量進(jìn)行特征提取。
圖2 IMF分量相關(guān)系數(shù)和方差貢獻(xiàn)率
通常IMF分量包含多維信息,結(jié)合微震和爆破信號的差異特點(diǎn)和應(yīng)用場景,本文選取信號的偏度、峭度、Lempel-Ziv復(fù)雜度、Hilbert邊際譜能量、分形盒維數(shù)等參數(shù)聯(lián)合組成多維特征向量。從微震監(jiān)測系統(tǒng)中分別隨機(jī)抽取200組爆破和微震信號,通過matlab編程計(jì)算前6個IMF分量和重構(gòu)信號的上述特征參數(shù),構(gòu)成400×28特征向量集。
信號的偏度是描述信號幅值分布對稱性的特征統(tǒng)計(jì)量,為無量綱參數(shù),可以定量表征信號概率密度函數(shù)的不對稱程度。偏度的定義為信號幅值的標(biāo)準(zhǔn)三階中心矩:
信號的峭度描述信號所有取值分布形態(tài)陡緩程度的統(tǒng)計(jì)量,為無量綱參數(shù),峭度的定義為信號幅值的標(biāo)準(zhǔn)四階中心矩與方差平方的比值:
式(11)~(12)中P為信號的偏度;K為信號的峭度;μ為信號x的均值;σ為信號的標(biāo)準(zhǔn)差。
微震與爆破信號上述4個分量的偏度和峭度概率密度分布如圖3所示。圖3(a)中,小于0的區(qū)間內(nèi),微震信號偏度概率密度值均大于爆破信號,而大于0的區(qū)間則相反。該分量的偏度參數(shù)具有一定程度的識別效果,但由于集中在-0.5~0.5之間,來自不同類別集的樣本特征值差異性有限。圖3(b)中,IMF1的偏度概率密度分布均呈正態(tài)分布趨勢,微震信號偏度值集中在-0.4~0.8之間,爆破信號則集中在-0.8~0.4之間。該分量的偏度值具有較好的識別效果,雖然來自相同類別集的不同樣本的偏度值有差異,但不同類別樣本間的偏度值服從不同的正態(tài)分布。圖3(c)和(d)中,相同區(qū)間內(nèi)的概率密度分布差異較小,因此該參數(shù)識別效果有限。圖3(e)中,微震重構(gòu)分量峭度值集中在20~40區(qū)間內(nèi),該參數(shù)具有一定的差異和參考價值。從圖3(f)可知,爆破信號IMF1峭度值集中在30~60之間,而微震信號則在22.5~120之間均勻分布,不同類別樣本的參數(shù)差別較大。圖3(g)和(h)中,兩類信號的IMF2和IMF3峭度值分布相似,參數(shù)差異較小,無法有效識別兩類信號。
圖3 各IMF分量偏度和峭度概率密度分布
Lempel-Ziv復(fù)雜度算法(簡稱LZC)可反映有限時間信號序列隨長度增加、內(nèi)部出現(xiàn)新模式的速率,復(fù)雜度越大,新模式出現(xiàn)速率越快。主要計(jì)算流程參見文獻(xiàn)[15]。
圖4為兩類信號的LZC概率密度分布。圖4(a)中微震信號的LZC值集中分布在0.09~0.18,爆破信號則在0.12~0.27之間均有分布,表明隨著長度增加,微震信號內(nèi)部新模式出現(xiàn)的速率小于爆破信號。圖4(b)中,IMF1分量LZC值在0.1~0.8之間均有分布,由于兩類信號的LZC值分布區(qū)間重疊交叉部分較多,差異性略小于重構(gòu)分量。圖4(c)中,IMF2分量的LZC概率密度值分布逐漸降低,相同區(qū)間內(nèi)兩類信號之間沒有明顯分界,因此該參數(shù)識別效果較差。
圖4 各IMF分量LZC概率密度分布
圖5為兩類重構(gòu)信號的分形盒維數(shù)概率密度分布。圖中兩類信號分形盒維數(shù)值各自服從不同的正態(tài)分布,其分布中心分別是微震信號在1.275~1.35之間、爆破信號在1.38~1.475之間;兩者在1.33~1.375之間有一定重疊部分,表明兩類信號的分形盒維數(shù)特征存在一定的相似性。整體上微震信號的分形盒維數(shù)值低于爆破信號,這是由于微震事件產(chǎn)生的信號波形較單一,而爆破信號相對更復(fù)雜,該特征也符合LZC值的分布特點(diǎn)。
圖5 重構(gòu)信號分形盒維數(shù)概率密度分布
邊際譜能量分布比例均值如表1所示。表1中,兩類信號的邊際譜能量分布具有明顯的差異,具體表現(xiàn)為:隨著IMF分量階數(shù)增加,邊際譜能量比例逐漸減小,微震信號能量主要集中在前三個分量,比例為99.6%,其中IMF2比例最大,為41.18%;爆破信號主要集中在前兩個分量,比例為94.13%,其中IMF1比例為73.52%。
表1 邊際譜能量分布比例均值
GA-SVM模型構(gòu)建流程如下:
1)構(gòu)建特征向量,提取出識別對象特征參數(shù)。本文構(gòu)建400×28特征向量集,從中隨機(jī)選取微震和爆破信號各150組數(shù)據(jù)作為訓(xùn)練樣本,其余各50組數(shù)據(jù)作為預(yù)測樣本。設(shè)定微震信號標(biāo)識為1,爆破信號標(biāo)識為2。
2)將訓(xùn)練集和測試集特征向量歸一化:
式中xi和xi′分別為歸一化前后的特征向量。
計(jì)算特征向量中每個參數(shù)的LS值,選出信號的敏感信息特征,提高模型的準(zhǔn)確率。
3)設(shè)定懲罰因子C和核函數(shù)γ的取值范圍分別為[0,100]和[0,1 000]。初始種群數(shù)設(shè)為100,最大迭代次數(shù)200次,交叉概率pc=0.6,變異概率pm=0.06。
4)采用篩選后的特征向量對模型進(jìn)行訓(xùn)練,經(jīng)遺傳算法GA尋優(yōu)的參數(shù)為:懲罰因子C=4.52,核函數(shù)參數(shù)γ=3.64,選擇RBF核函數(shù)訓(xùn)練SVM網(wǎng)絡(luò)。
表2為28維特征向量的LS值。LS值越大相應(yīng)特征參數(shù)重要性越高。為驗(yàn)證LS算法的效果和所選特征向量的適用性,將不同分形維數(shù)的特征向量在GA-SVM模型中的識別率繪制成圖,如圖6所示。隨著特征向量分形維數(shù)增加,識別率逐漸增高,表明LS算法具有良好的特征選擇性能;當(dāng)分形維數(shù)增加到15左右,識別率趨于穩(wěn)定,當(dāng)分形維數(shù)增加到20以后,識別率略有降低,但仍維持在較高水平。分析認(rèn)為分形維數(shù)增加造成特征向量中冗余信息提高,降低模型計(jì)算精度,故選取前17種特征參數(shù)組成復(fù)合特征向量。
圖6 不同特征分形維數(shù)的分類性能
表2 特征參數(shù)LS值
為驗(yàn)證GA-SVM方法的優(yōu)越性,另外選取SVM、LR、Bayes算法進(jìn)行對比,其中LR、Bayes算法的先驗(yàn)概率均為0.5,4種模型均采用17維復(fù)合特征向量為識別對象,表3為分類識別結(jié)果。結(jié)果表明,在同種識別模型下,改進(jìn)HHT的識別結(jié)果整體上優(yōu)于傳統(tǒng)EMD和LMD方法,表明改進(jìn)HHT可以更充分提取兩類信號的特征;同一特征向量下,GA-SVM的分類效果明顯優(yōu)于SVM、LR和Bayes模型,并且與改進(jìn)HHT結(jié)合的準(zhǔn)確率達(dá)到95%。表明基于改進(jìn)HHT和GA-SVM算法構(gòu)建的識別模型準(zhǔn)確率高,能夠有效識別出巖體微震和爆破振動信號。
表3 分類識別結(jié)果
1)采用CEEMD對礦山信號進(jìn)行自適應(yīng)分解,通過相關(guān)系數(shù)和方差貢獻(xiàn)率篩選出信號,主要信息包含在前6個IMF分量中。
2)通過CEEMD與Hilbert-Huang變換相結(jié)合,提取微震信號特征,選取偏度、峭度、Lempel-Ziv復(fù)雜度、Hilbert邊際譜能量、分形維數(shù)等參數(shù)聯(lián)合組成的高維特征向量具有明顯的差異性;采用LS算法對特征降維,提高識別效率。
3)改進(jìn)HHT分類效果優(yōu)于傳統(tǒng)EMD和LMD方法,基于GA-SVM的識別效果優(yōu)于LR、Bayes和SVM模型;基于改進(jìn)HHT的GA-SVM模型準(zhǔn)確率達(dá)到了95%,表明基于改進(jìn)HHT和GA-SVM模型對微震和爆破信號識別是可行的,具有較高識別率,可有效減少人工識別的工作量和誤差。