樊 鑫,程建遠(yuǎn),王云宏,栗 升,段建華,王 盼,
(1.西安科技大學(xué) 地質(zhì)與環(huán)境學(xué)院,陜西 西安 710054;2.中國(guó)煤炭科工集團(tuán) 西安研究院有限公司, 陜西 西安 710077)
微震監(jiān)測(cè)技術(shù)是一種利用煤巖破裂產(chǎn)生的震動(dòng)信息來(lái)研究煤巖結(jié)構(gòu)穩(wěn)定性的實(shí)時(shí)、動(dòng)態(tài)、連續(xù)監(jiān)測(cè)方法。隨著我國(guó)煤礦開(kāi)采深度的增加,微震監(jiān)測(cè)技術(shù)在煤礦安全高效生產(chǎn)中得到廣泛應(yīng)用,并被寫入《煤礦防治水細(xì)則》。通過(guò)在監(jiān)測(cè)區(qū)域?qū)ξ⒄鹦盘?hào)進(jìn)行采集、處理和分析,可以研究煤巖體變形破壞的活動(dòng)規(guī)律及其內(nèi)部應(yīng)力分布,并對(duì)突水等煤巖動(dòng)力災(zāi)害進(jìn)行監(jiān)測(cè)預(yù)警。但是,由于微震監(jiān)測(cè)系統(tǒng)經(jīng)常工作在高噪聲環(huán)境下,各道采集的數(shù)據(jù)包含大量噪聲,嚴(yán)重干擾到微震事件拾取和震源定位等后續(xù)處理工作。因此,將微震有效信號(hào)與噪聲加以分離并進(jìn)行特征提取具有重要意義。
微震信號(hào)是一種具有隨機(jī)性的時(shí)變非平穩(wěn)信號(hào),且具有震源信號(hào)和干擾噪聲多樣的特點(diǎn)。近年來(lái),相關(guān)研究人員對(duì)微震信號(hào)的分析做了很多努力。Fourier 變換是從全局時(shí)域提取特征的一種信號(hào)分析方法,無(wú)法提取局部特征,對(duì)于非平穩(wěn)信號(hào)的分析有很大的局限性;短時(shí)傅里葉變換方法易于實(shí)現(xiàn),但分辨率單一;加窗Fourier分析同樣無(wú)法描述微震信號(hào)的局部特征。以小波變換為代表的時(shí)-頻分析方法是基于時(shí)間和頻率參照系的信號(hào)分析方法,被證明可用于描述非平穩(wěn)信號(hào)。由于小波變換具有局部形變穩(wěn)定性和多尺度性的特點(diǎn),它可以有效提取信號(hào)的局部特征,但因其會(huì)隨時(shí)移變化,容易遺漏信號(hào)特征,亦不適于時(shí)變非平穩(wěn)信號(hào)的分析以及特征向量的構(gòu)建。
2010年,ANDEN等提出了一種基于小波變換改進(jìn)的時(shí)-頻分析方法——小波散射變換(Wavelet Scattering Transform)。它具有平移不變性、局部形變穩(wěn)定性和信息完整性等特點(diǎn),解決了小波變換隨時(shí)移變化的缺陷,并在相關(guān)領(lǐng)域得到了有效應(yīng)用。2013年,HIRN和BRUNA等通過(guò)構(gòu)建小波散射分解變換網(wǎng)絡(luò),實(shí)現(xiàn)對(duì)音頻信號(hào)、手寫文字和圖像紋理的識(shí)別;2014年,ANDEN和JOAKIM等分別在經(jīng)典音樂(lè)數(shù)據(jù)集GTZAN和語(yǔ)音通話數(shù)據(jù)集TIMIT中,通過(guò)小波散射分解變換網(wǎng)絡(luò)提取到有效特征信息,取得良好的分類效果;同年,CHUDACEK等將該方法應(yīng)用到心律失常數(shù)據(jù)的分析中。2018年,WIATOWSKI等基于小波散射的性質(zhì),通過(guò)嚴(yán)格的數(shù)學(xué)推導(dǎo),證明了其優(yōu)越性并進(jìn)行了推廣,在不同的小波框架下取得了良好效果。
繼MALLAT之后,國(guó)內(nèi)學(xué)者圍繞小波分析進(jìn)行了相應(yīng)的研究,不僅在文字、圖像等二維數(shù)據(jù)的識(shí)別中取得良好效果,還在音頻、心律等時(shí)變非平穩(wěn)信號(hào)的識(shí)別中得到有效驗(yàn)證。其中,在二維數(shù)據(jù)的識(shí)別中,吳華娟等通過(guò)小波散射變換網(wǎng)絡(luò)提取每個(gè)子圖像塊的能量分布特征,對(duì)各階散射特征進(jìn)行分類,實(shí)現(xiàn)了圖像的無(wú)監(jiān)督紋理分割;伍家松等利用小波散射變換網(wǎng)絡(luò)提取特征并形成訓(xùn)練數(shù)據(jù)集,分析了在不同色彩空間進(jìn)行圖像分類的性能;文介華等以小波散射變換網(wǎng)絡(luò)所得特征系數(shù)的均值和方差作為新的特征,實(shí)現(xiàn)了大規(guī)模圖像識(shí)別,并起到有效的降維作用;WANG等利用小波散射變換網(wǎng)絡(luò)提取合成孔徑雷達(dá)圖像的特征,有效識(shí)別了移動(dòng)和固定目標(biāo)。
LI等提出了心音信號(hào)分類算法,利用小波散射變換網(wǎng)絡(luò)獲取到心音信號(hào)特征,能夠有效表達(dá)信號(hào)對(duì)應(yīng)的特征信息,進(jìn)而得到信號(hào)的特征矩陣,用于支持向量機(jī)分類;羅雨帆改進(jìn)了經(jīng)典小波散射變換網(wǎng)絡(luò),構(gòu)建了分?jǐn)?shù)階散射變換網(wǎng)絡(luò),將頻域小波變換擴(kuò)展到分?jǐn)?shù)域,并在一維音頻信號(hào)分析及特征提取中取得了良好的應(yīng)用效果;許周樂(lè)將小波散射變換網(wǎng)絡(luò)作為混合網(wǎng)絡(luò)特征提取的一部分,提取機(jī)械振動(dòng)故障信號(hào)特征,從而實(shí)現(xiàn)了軸承故障診斷。
前人利用小波散射分解技術(shù)在二維圖像識(shí)別取得了一定的成果,同時(shí)還在一維時(shí)序非平穩(wěn)信號(hào)等領(lǐng)域得到了有效應(yīng)用,如音頻信號(hào)。作為一種典型的時(shí)序非平穩(wěn)信號(hào),微震信號(hào)中攜帶大量地質(zhì)信息,對(duì)其進(jìn)行特征提取不僅可以提高震源定位的精度,而且能夠?qū)崿F(xiàn)震源的準(zhǔn)確定位。在頁(yè)巖氣開(kāi)發(fā)領(lǐng)域,TAN等提取了微震事件的時(shí)長(zhǎng)、頻域和統(tǒng)計(jì)特征,并基于主成分分析法構(gòu)建了微震事件分類識(shí)別模型,識(shí)別精度達(dá)到90%以上,取得良好效果。礦山微震信號(hào)識(shí)別領(lǐng)域的相關(guān)研究目前處于發(fā)展階段。張少泉等指出要以礦山地震學(xué)理論為基礎(chǔ)并選擇區(qū)分度較高的判據(jù),進(jìn)行礦山震動(dòng)信號(hào)識(shí)別。朱權(quán)潔等利用微震信號(hào)的小波包能量特征和分形特征構(gòu)建了相應(yīng)的特征向量,通過(guò)SVM模型對(duì)爆破、機(jī)械振動(dòng)和巖石破裂波形進(jìn)行分類。
與前述研究不同,筆者針對(duì)煤礦微震波形,提取信號(hào)特征、降低原始信號(hào)維數(shù)、構(gòu)成特征矩陣,進(jìn)而建立基于小波散射分解和SVM分類的識(shí)別模型,為實(shí)現(xiàn)微震事件的智能識(shí)別提供了一種新的技術(shù)思路。
小波變換是時(shí)變非平穩(wěn)信號(hào)分析的有效工具之一,因其具有尺度可變性和多分辨率的特點(diǎn),能同時(shí)描述信號(hào)的時(shí)域和頻域特征,因此對(duì)信號(hào)的局部分析具有良好效果。對(duì)連續(xù)有限時(shí)間內(nèi)的信號(hào),小波變換定義為
(1)
實(shí)際采集的微震信號(hào)通常會(huì)受到很多干擾,即使整體并沒(méi)有發(fā)生質(zhì)變,局部的變化也會(huì)使提取的信號(hào)特征受到干擾,從而影響信號(hào)的分析和識(shí)別。因此,需要一種兼具平移不變性和局部形變穩(wěn)定性的信號(hào)分析和特征提取方法。
對(duì)小波變換進(jìn)行取模運(yùn)算,去掉所有小波散射系數(shù)的復(fù)相位,則可以得到算子||,與輸入信號(hào)做卷積可得到小波模變換算子:
||=(*,|*|)
(2)
其中,為低通濾波器;為高頻小波;()=*稱為關(guān)于信號(hào)的局部平移不變描述符,即散射系數(shù),該描述符是對(duì)輸入信號(hào)低通濾波,具有平移不變性,提取輸入信號(hào)的低頻信息,去除了所有的高頻信息;而這些高頻信息由模變換()=|*()|恢復(fù),該變換表示在尺度上的高頻信息,通過(guò)對(duì)非線性小波變換取模,具有形變穩(wěn)定性。故小波散射變換0階的低頻信息(散射系數(shù))和高頻信息分別為
(3)
將0階高頻信息部分()作為一階散射變換的輸入,可得
|||*1|=(|*|*,||*|*|)
(4)
則一階散射系數(shù)
()=|*|*
(5)
以此類推,重復(fù)以上迭代過(guò)程即可得任意階的散射系數(shù)。
對(duì)于任意的≥1,信號(hào)的小波模變換卷積可表示為:
()=|||*|*…|*|
(6)
將()作為下一階的輸入進(jìn)行低通濾波,得到階散射系數(shù):
()=|||*|*…|*|*=()*
(7)
將|+1|應(yīng)用到()可同時(shí)計(jì)算得到()和+1(),即
|+1|()=((),+1())
(8)
通過(guò)初始化()=可定義散射分解的最高階,當(dāng)0≤≤且1≤≤時(shí),對(duì)式(1)~(8)進(jìn)行迭代運(yùn)算。
最終由0≤≤上的散射系數(shù)構(gòu)成特征向量:()={(),(),…,()},即:()=(),(0≤≤)。
綜上,小波散射變換的過(guò)程可描述為:在小波模算子||上進(jìn)行散射變換迭代,卷積計(jì)算次的小波模變換()并輸出經(jīng)低通濾波后的散射系數(shù)()(圖1)。
圖1 小波散射分解結(jié)構(gòu)Fig.1 Wavelet scattering decomposition structure
圖2(a)為使用中煤科工集團(tuán)西安研究院有限公司研發(fā)的KJ959微震監(jiān)測(cè)系統(tǒng)于西部某煤礦采集的底板破壞深度微震事件信號(hào),采用頻率響應(yīng)范圍為10~1 000 Hz的單分量檢波器,采樣率為2 kHz。
根據(jù)前文所述小波散射分析方法進(jìn)行處理,得到每一次散射分解變換產(chǎn)生的散射分解系數(shù)矩陣維數(shù)(表1),其各階散射系數(shù)矩陣由不同的散射行向量組成,每個(gè)行向量包含4個(gè)散射系數(shù)。圖2(b)為微震事件信號(hào)波形及其對(duì)應(yīng)的經(jīng)4次分解所得的0~4階散射系數(shù)數(shù)值(從各階系數(shù)矩陣中隨機(jī)抽取一行)分布。
圖2 微震事件波形及其0~4階小波散射分解系數(shù)分布Fig.2 Waveform of a microseimic event signal and its 0-4th order wavelet scattering decomposition coefficients
表1 微震事件小波散射分解系數(shù)矩陣維數(shù)Table 1 Matrix dimensions of wavelet scattering decomposition coefficients of microseismic events
圖2中,微震信號(hào)具有瞬時(shí)突變的特點(diǎn),其能量在各階散射分解變換后的分布不一致,由各階散射系數(shù)的數(shù)值可以看出:微震信號(hào)的能量主要由1~3階散射系數(shù)體現(xiàn),且與微震事件具有相同的突變特點(diǎn),而2階散射系數(shù)具有最大的能量分布,1階和3階系數(shù)的能量分布較小。
圖3為微震事件信號(hào)經(jīng)4次小波散射分解之后得到的4張時(shí)頻譜,對(duì)比后可以發(fā)現(xiàn):信號(hào)能量在微震事件發(fā)生的時(shí)刻集中出現(xiàn),并隨著散射分解次數(shù)的增加,低頻部分的能量逐漸凸顯(表2)。
圖3 微震事件信號(hào)小波散射變換各階時(shí)頻譜Fig.3 Scattergram-scalogram coefficients filter banks of wavelet scattering decomposition for a microseismic event signal
表2 微震事件4次小波散射分解對(duì)應(yīng)的頻率范圍Table 2 Frequency range of 4 times wavelet scattering decomposition of microseismic events
綜上,小波散射分解變換可以有效分析微震事件信號(hào)的能量分布和時(shí)頻特征,并由計(jì)算得到的各階散射分解系數(shù)表征,進(jìn)而形成散射系數(shù)矩陣。
利用小波散射分析方法,可得到微震噪聲信號(hào)波形及其對(duì)應(yīng)的、經(jīng)4次分解所得的0~4階散射系數(shù)數(shù)值(從各階系數(shù)矩陣中隨機(jī)抽取一行)(圖4)。表3為每一次散射分解變換產(chǎn)生的散射分解系數(shù)矩陣維數(shù),其各階散射系數(shù)矩陣由不同的散射行向量組成,每個(gè)行向量包含4個(gè)散射系數(shù)。由于截取的噪聲信號(hào)長(zhǎng)度與事件信號(hào)長(zhǎng)度一致,故對(duì)應(yīng)得到相同維數(shù)的散射系數(shù)矩陣。
圖4 微震噪聲波形及其0~4階小波散射分解系數(shù)分布Fig.4 Waveform of a noise signal and its 0-4th order wavelet scattering decomposition coefficients
從圖4(b)噪聲信號(hào)的各階小波散射分解系數(shù)可以看出:能量在各階散射分解變換后的分布大致平均,主要由1~2階散射系數(shù)體現(xiàn),并無(wú)明顯的突變特征及能量聚集的體現(xiàn),符合噪聲事件能量分散、成分雜亂的特點(diǎn),與具有瞬時(shí)突變特點(diǎn)的微震事件信號(hào)的小波散射分解系數(shù)有明顯區(qū)別(圖2)。
圖5為微震噪聲信號(hào)經(jīng)4次小波散射分解之后得到的4張時(shí)頻譜,對(duì)比后可以發(fā)現(xiàn):信號(hào)能量在噪聲信號(hào)中分散分布,并未在某一時(shí)刻集中出現(xiàn),且包含較寬頻帶的信息。
圖5 微震噪聲信號(hào)小波散射變換各階時(shí)頻譜Fig.5 Scattergram-scalogram coefficients filter banks of wavelet scattering decomposition for a noise signal
由此可見(jiàn),通過(guò)小波散射分解變換技術(shù)可以獲得微震事件信號(hào)和噪聲信號(hào)的不同特征,進(jìn)而對(duì)2類信號(hào)加以描述,為微震信號(hào)的識(shí)別提供了一種有效的特征提取方法。
2.1節(jié)和2.2節(jié)利用小波散射分解技術(shù)分別對(duì)微震事件和噪聲信號(hào)進(jìn)行了分析,本節(jié)將2類信號(hào)的分析結(jié)果進(jìn)行對(duì)比,進(jìn)一步驗(yàn)證相關(guān)結(jié)論。
表3 微震噪聲小波散射分解系數(shù)矩陣維數(shù)Table 3 Matrix dimensions of wavelet scattering decomposition coefficients of noise events
圖6分別從微震事件(Signal of microseismic events,簡(jiǎn)稱“sm”)和噪聲信號(hào)(Signal of noise events,簡(jiǎn)稱“sn”)中任意選取3條信號(hào)進(jìn)行小波散射分解變換,得到的0~3階散射系數(shù)分布(從每條信號(hào)的各階系數(shù)矩陣中隨機(jī)抽取一行),其中微震事件信號(hào)的散射系數(shù)由“實(shí)心圓”表示、點(diǎn)劃線連接;噪聲信號(hào)的散射系數(shù)由“菱形”表示、虛線連接。由圖6可知,2類信號(hào)的散射系數(shù)自一階散射分解變換開(kāi)始,逐漸表現(xiàn)出各自信號(hào)的差異特征,其中微震事件信號(hào)的散射系數(shù)的變化趨勢(shì)表現(xiàn)為瞬時(shí)突變,而噪聲信號(hào)的散射系數(shù)變化趨勢(shì)是雜亂無(wú)序的且數(shù)值遠(yuǎn)小于微震事件信號(hào)的散射系數(shù),符合前述信號(hào)分析結(jié)果,在數(shù)值大小和能量表示方面都有明顯差異,可以進(jìn)一步形成特征矩陣,用于機(jī)器學(xué)習(xí)分類模型的訓(xùn)練。
圖6 微震事件與噪聲信號(hào)小波散射分解系數(shù)對(duì)比Fig.6 Comparison of microseismic event and noise signals wavelet scattering decomposition coefficients
原始微震監(jiān)測(cè)數(shù)據(jù)的高維空間中包含冗余信息,會(huì)在模型訓(xùn)練中引入干擾和誤差,影響訓(xùn)練精度。而通過(guò)對(duì)數(shù)據(jù)進(jìn)行小波散射分解變換,既可以實(shí)現(xiàn)對(duì)監(jiān)測(cè)大數(shù)據(jù)的降維,提高計(jì)算效率;又可以提取數(shù)據(jù)本質(zhì)特征,減少冗余信息。小波散射分解系數(shù)特征矩陣是維數(shù)為×的特征矩陣,其中行數(shù)為總散射路徑數(shù),列數(shù)為散射系數(shù)分量。計(jì)算小波散射分解系數(shù)并形成最優(yōu)維數(shù)(×)的特征矩陣,需要構(gòu)建合適的小波散射分解結(jié)構(gòu)。由小波散射分解的原理和性質(zhì)可知,時(shí)不變尺度(即進(jìn)行小波散射變換時(shí),所取信號(hào)片段的采樣時(shí)長(zhǎng))、小波散射分解變換的次數(shù)以及質(zhì)量因子(Quality factor,即每個(gè)小波濾波器組中的小波數(shù)目,它隨著小波變換次數(shù)的增加而遞減,且滿足1≤<32)是重要參數(shù),以下實(shí)驗(yàn)將說(shuō)明上述3個(gè)不同參數(shù)對(duì)小波散射分解結(jié)構(gòu)性能、算法效率及最終輸出特征矩陣的影響。
考慮到微震信號(hào)特征和算法的復(fù)雜性,通過(guò)計(jì)算機(jī)程序?qū)σ延袛?shù)據(jù)進(jìn)行分析。已知實(shí)驗(yàn)所使用微震信號(hào)總長(zhǎng)度為7 000個(gè)采樣點(diǎn),共包含54條微震事件信號(hào)和54條噪聲信號(hào)。
時(shí)間不變尺度用以表征小波散射變換的平移不變性,其大小以采樣時(shí)間計(jì)算。構(gòu)建一個(gè)小波散射分解結(jié)構(gòu),并設(shè)定小波散射分解采樣頻率為1 024 Hz,小波變換次數(shù)為3,質(zhì)量因子為3,2,1。表4為不同時(shí)間不變尺度時(shí),得到的相應(yīng)散射特征訓(xùn)練矩陣、測(cè)試矩陣及總特征矩陣的構(gòu)成與對(duì)應(yīng)的特征矩陣構(gòu)成所需運(yùn)行時(shí)間。
表4 不同時(shí)間不變尺度對(duì)應(yīng)的散射特征訓(xùn)練矩陣、 測(cè)試矩陣及總特征矩陣維數(shù)Table 4 Dimensions of different time invariance scales for the train feature matrix,test feature matrix and whole feature matrix of a microseismic signal
由以上分析可知,當(dāng)小波散射采樣頻率為確定值時(shí),時(shí)不變尺度越小,小波散射分解系數(shù)特征矩陣維數(shù)越高,模型運(yùn)行時(shí)間越長(zhǎng);時(shí)不變尺度越大,特征矩陣維數(shù)越低,模型運(yùn)行時(shí)間越低。而當(dāng)散射分解采樣頻率與時(shí)間不變尺度之積近似等于采樣點(diǎn)總數(shù)時(shí),可得到最佳維數(shù)的特征矩陣,此時(shí)所需的計(jì)算時(shí)間較短,運(yùn)算效率較高。
小波散射分解變換次數(shù),即小波濾波器組的個(gè)數(shù),對(duì)于形成特征矩陣產(chǎn)生的不同影響,將在以下實(shí)例中說(shuō)明。構(gòu)建一個(gè)小波散射分解結(jié)構(gòu),設(shè)定時(shí)間不變尺度為6 s,采樣頻率為1 024 Hz,小波變換次數(shù)為1時(shí),質(zhì)量因子為3;小波變換次數(shù)為2時(shí),質(zhì)量因子為3和2;小波變換次數(shù)為3時(shí),質(zhì)量因子為3,2,1。表5為取不同小波散射變換次數(shù)時(shí),得到的相應(yīng)散射特征訓(xùn)練矩陣、測(cè)試矩陣及總特征矩陣,表6為對(duì)應(yīng)的散射變換及特征矩陣構(gòu)成所需運(yùn)行時(shí)間。
由表5,6可知,小波散射分解變換次數(shù)越多,計(jì)算得到的散射系數(shù)越多,構(gòu)成的特征矩陣維數(shù)越大,所需運(yùn)算時(shí)間越長(zhǎng)。結(jié)合文中第2部分對(duì)微震事件和噪聲信號(hào)的分析,微震事件的主要能量分布在小波散射分解變換的1~3階散射系數(shù),且集中在2階散射系數(shù);3次小波散射分解變換已得到微震事件信號(hào)的主要能量和頻率分布,同時(shí)有效表征與噪聲信號(hào)的特征差異,并且程序運(yùn)算效率高。因此,宜采用3次小波散射分解變換進(jìn)行分析,并構(gòu)成特征矩陣。
表5 不同變換次數(shù)對(duì)應(yīng)的散射特征訓(xùn)練矩陣、 測(cè)試矩陣及總特征矩陣維數(shù)Table 5 Dimensions of different transform times for the train feature matrix,test feature matrix and whole feature matrix of a microseismic signal
表6 不同變換次數(shù)對(duì)應(yīng)的散射變換及特征矩陣構(gòu)成所需運(yùn)行時(shí)間Table 6 Function time of different transform times of wavelet scattering transform and forming its feature matrix
構(gòu)建一個(gè)小波散射分解結(jié)構(gòu),設(shè)定時(shí)間不變尺度為6,采樣頻率為1 024 Hz,小波變換次數(shù)為1時(shí),質(zhì)量因子分別取8,6,4,2,得到的相應(yīng)散射特征訓(xùn)練矩陣、測(cè)試矩陣及總特征矩陣,表7,8為對(duì)應(yīng)的散射變換及特征矩陣構(gòu)成所需運(yùn)行時(shí)間。
表7 不同質(zhì)量因子對(duì)應(yīng)的散射特征訓(xùn)練矩陣、 測(cè)試矩陣及總特征矩陣維數(shù)Table 7 Dimensions of different quality factors for the train feature matrix,test feature matrix and whole feature matrix of a microseismic signal
表8 不同質(zhì)量因子對(duì)應(yīng)的散射變換及特征 矩陣構(gòu)成所需運(yùn)行時(shí)間Table 8 Function time of different quality factors of wavelet scattering transform and forming its feature matrix
由表7,8可知:當(dāng)時(shí)不變尺度和分解次數(shù)不變時(shí),質(zhì)量因子越大,形成的特征矩陣列數(shù)越多(圖7),矩陣維數(shù)越高,運(yùn)算時(shí)間越長(zhǎng)。因此,在滿足分類算法需求的基礎(chǔ)上,為提高運(yùn)算效率,質(zhì)量因子的選擇不宜過(guò)大。
圖7 質(zhì)量因子對(duì)特征矩陣維數(shù)的影響Fig.7 Influence of the quality factor to the dimension of the feature matrix
因此,以滿足運(yùn)算時(shí)效性為前提,在盡可能保留不同信號(hào)主要特征信息的情況下,特征矩陣的維數(shù)不宜過(guò)大;在訓(xùn)練過(guò)程中可以根據(jù)時(shí)間不變尺度、散射分解次數(shù)和質(zhì)量因子等主要參數(shù)的影響,調(diào)控特征矩陣的維數(shù),便于進(jìn)一步的訓(xùn)練和測(cè)試,以得到最優(yōu)的智能分類識(shí)別模型。
近年來(lái),監(jiān)督機(jī)器學(xué)習(xí)中的支持向量機(jī)SVM(Support Vector Machine)分類算法被廣泛應(yīng)用于圖像和文本識(shí)別、信號(hào)處理等領(lǐng)域,解決非線性、高維、小樣本的模式識(shí)別問(wèn)題。在本文中,筆者將微震信號(hào)的智能識(shí)別作為一種非線性二分類問(wèn)題處理。利用前文由小波散射系數(shù)構(gòu)成的特征矩陣,基于SVM分類算法,構(gòu)建微震事件自動(dòng)識(shí)別模型。
基于SVM算法的模式識(shí)別原理是通過(guò)對(duì)已標(biāo)記標(biāo)簽的信號(hào)樣本進(jìn)行訓(xùn)練,得到分類模型,進(jìn)而對(duì)未知信號(hào)樣本進(jìn)行分類處理。其中,構(gòu)建特征矩陣和分類器的訓(xùn)練是該算法的核心。圖8為SVM分類模型的訓(xùn)練及優(yōu)化流程。
圖8 SVM分類模型訓(xùn)練優(yōu)化流程Fig.8 Workflow of training and optimizing SVM classification model
(1)樣本選擇。從已有數(shù)據(jù)中選取360組微震信號(hào)樣本,微震事件和噪聲信號(hào)各180組。隨機(jī)選擇70%的樣本構(gòu)成訓(xùn)練數(shù)據(jù)集,其余30%為測(cè)試數(shù)據(jù)集。分別對(duì)兩類信號(hào)進(jìn)行標(biāo)簽化,事件信號(hào)標(biāo)記為“M”,噪聲信號(hào)標(biāo)記為“N”。
(2)特征提取。通過(guò)設(shè)定參數(shù)時(shí)不變尺度、變換次數(shù)和質(zhì)量因子,計(jì)算樣本信號(hào)的小波散射系數(shù)構(gòu)建特征矩陣。
(3)模型訓(xùn)練。SVM分類器選用多項(xiàng)式核函數(shù):
(,)=(1+′)
(9)
式中,′為的轉(zhuǎn)置;為正整數(shù),本文選擇=2。
利用前述特征提取方法得到訓(xùn)練數(shù)據(jù)集特征矩陣,訓(xùn)練得到微震事件SVM分類模型,然后將訓(xùn)練得到的分類模型對(duì)測(cè)試數(shù)據(jù)集進(jìn)行分類預(yù)測(cè)。利用小波散射系數(shù)特征矩陣識(shí)別的結(jié)果見(jiàn)表9。從表9可以看出,基于SVM分類的微震事件智能識(shí)別算法準(zhǔn)確率較高,能夠有效、準(zhǔn)確地對(duì)微震信號(hào)分類。
表9 SVM分類模型識(shí)別結(jié)果Table 9 Recognition results of SVM classification model
隨著微震監(jiān)測(cè)技術(shù)被廣泛應(yīng)用于煤礦地質(zhì)災(zāi)害監(jiān)測(cè)預(yù)警等領(lǐng)域,急劇增加的海量監(jiān)測(cè)數(shù)據(jù)面臨著傳輸效率低、區(qū)分難度大以及現(xiàn)場(chǎng)干擾因素多等問(wèn)題。因此,如何準(zhǔn)確劃分信號(hào)類型是微震監(jiān)測(cè)大數(shù)據(jù)處理效果好壞的關(guān)鍵。
綜上,該方法可以通過(guò)智能識(shí)別代替手動(dòng)識(shí)別,大大提高識(shí)別效率、減小人工工作量,通過(guò)有效識(shí)別微震事件,進(jìn)一步提高震源定位精度,同時(shí)也為實(shí)現(xiàn)震源自動(dòng)定位奠定了基礎(chǔ)。
(1)基于微震信號(hào)低寬頻特性、不可預(yù)知性和突發(fā)瞬態(tài)性的特點(diǎn),采用小波散射分解對(duì)微震事件和噪聲信號(hào)進(jìn)行特征提取,構(gòu)成相應(yīng)的特征矩陣,該方法可以提取出具有明顯區(qū)分度的微震事件和噪聲的信號(hào)特征,且效果良好。
(2)通過(guò)對(duì)比分析小波散射分解結(jié)構(gòu)的3個(gè)主要參數(shù):時(shí)不變尺度、散射分解次數(shù)和質(zhì)量因子對(duì)特征矩陣維數(shù)的影響,以及比較選取不同參數(shù)時(shí)的運(yùn)算效率,可以發(fā)現(xiàn):在特征矩陣維數(shù)相同時(shí),為有效表征微震事件信號(hào)與噪聲信號(hào)的特征差異,并且提高程序運(yùn)算效率,宜采用3次小波散射分解變換進(jìn)行分析,并構(gòu)成特征矩陣,且各階小波散射變換的質(zhì)量因子選擇不宜過(guò)大。
(3)在SVM分類模型的微震事件智能識(shí)別過(guò)程中,可以選擇二次多項(xiàng)式核函數(shù)。該方法適用于長(zhǎng)時(shí)間、大范圍的微震監(jiān)測(cè)產(chǎn)生的大數(shù)據(jù)信號(hào)特征提取,有效避免了冗余數(shù)據(jù)的干擾,提高了數(shù)據(jù)處理的效率。針對(duì)不同監(jiān)測(cè)區(qū)域,尤其是低信噪比環(huán)境下采集的數(shù)據(jù),如何選取合適的主要參數(shù),使得信號(hào)特征計(jì)算效率最高,需要后續(xù)研究進(jìn)一步驗(yàn)證、完善。