国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于改進EWT和LogitBoost集成分類器的地震事件分類識別算法

2022-10-11 00:59:24張家聲李亞南
地震工程學(xué)報 2022年5期
關(guān)鍵詞:分類器波形準(zhǔn)確率

孟 娟,張家聲,李亞南

(1.防災(zāi)科技學(xué)院 電子科學(xué)與控制工程學(xué)院,河北 三河 065201;2.中國地質(zhì)科學(xué)院 地球物理地球化學(xué)勘查研究所,河北 廊坊 065000)

0 引言

根據(jù)產(chǎn)生機理的不同,地震事件一般可分為天然地震和非天然地震兩大類,人工爆破就是最常見的非天然地震類型之一。隨著地震監(jiān)測能力的不斷提升,以及礦藏勘探和開發(fā)等人類生產(chǎn)活動干擾的急劇增加,地震臺站每天都會監(jiān)測到大量天然與人工地震數(shù)據(jù),如果不能及時、準(zhǔn)確地對這些記錄進行分類,不僅會造成地震目錄污染,降低地震觀測資料質(zhì)量,也會影響地震監(jiān)測預(yù)警的準(zhǔn)確度。因此,快速、準(zhǔn)確地從震源事件波形中識別出天然地震與人工爆破事件一直是地震學(xué)研究及相關(guān)應(yīng)用領(lǐng)域的一個熱點問題。

圍繞天然地震和人工爆破事件的分類識別,國內(nèi)外眾多學(xué)者展開了廣泛而深入的研究,通過提取地震信號波形、震相、頻譜等方面的特征,基于統(tǒng)計模式識別[1-3]、機器學(xué)習(xí)[4-6]、深度學(xué)習(xí)[7-8]等方法進行事件類型判別,取得了一定成果。其中,統(tǒng)計模式識別嚴(yán)重依賴于特征提取,深度學(xué)習(xí)需要大量的訓(xùn)練數(shù)據(jù),且對硬件要求高[9],而機器學(xué)習(xí)對數(shù)據(jù)和硬件的依賴較小,且識別準(zhǔn)確率高[10],因此利用機器學(xué)習(xí)算法進行地震事件分類成為趨勢。尤其是反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)[11]、支持向量機(Support Vector Machine,SVM)算法[6,12-13]被廣泛應(yīng)用于地震事件分類,成為主流分類識別方法。但BP神經(jīng)網(wǎng)絡(luò)容易陷入局部最優(yōu),且隱層數(shù)、隱層節(jié)點等參數(shù)無法預(yù)先確定,識別準(zhǔn)確率受限;而SVM性能優(yōu)劣取決于核函數(shù),若缺乏有效手段選取合適核函數(shù)將影響分類準(zhǔn)確率。

在地震事件性質(zhì)分類過程中,如何提取有效的地震信號屬性特征是分類準(zhǔn)確與否的關(guān)鍵。國內(nèi)外研究學(xué)者對地震事件提取了多種判別依據(jù),如波形時域特征、頻譜特征等。這些方法各有特色,也有較好效果,但由于地震信號本身的復(fù)雜性,使得單獨采用某種特征進行識別的普適性不夠,識別效果受限,因此研究人員開始綜合提取時頻域或變換域特征進行識別,取得了較好的識別效果。如王婷婷等[14]利用小波包對信號分解,使用不同分解系數(shù)中的P波和S波能量進行地震與爆破的識別;Beccar-Varela等[15]通過小波變換進行信號分解,基于分解后的時頻能量特征進行地震事件識別;楊千里等[16]利用廣義S變換獲取地震與爆炸時頻譜圖二階矩進行識別。以上方法證明提取不同變換域特征能有效進行地震識別。畢明霞等[17]利用經(jīng)驗?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)對地震信號進行分解后,提取地震記錄特征進行SVM識別,識別率高。但小波和小波包變換的小波基選擇缺乏自適應(yīng)性,廣義S變換依賴于窗函數(shù)調(diào)節(jié)參數(shù),EMD分解存在模態(tài)混疊、偽模態(tài)等問題,于是兼具EMD和小波變換優(yōu)勢的經(jīng)驗小波變換(Empirical Wavelet Transform,EWT)被提出[18]。EWT能自適應(yīng)分解信號,非常適合處理非線性、非平穩(wěn)的地震信號[19-20],但傳統(tǒng)EWT需要根據(jù)信號頻譜幅值進行頻帶劃分,易受噪聲影響,因此有必要根據(jù)地震信號的特點進行頻譜分割優(yōu)化。Wang等[21]基于尺度空間表示提取傅里葉譜的慢變分量,再根據(jù)尺度參數(shù)和中心頻率進行頻譜分割,但該方法中尺度參數(shù)依經(jīng)驗獲取,這樣會影響頻譜分割的準(zhǔn)確性。

為提高識別的準(zhǔn)確率和穩(wěn)定性,集成學(xué)習(xí)被應(yīng)用于地震事件分類識別,將識別效果受限的基分類器按照一定規(guī)則組合為強分類器,以提高識別效果。趙剛等[22]提取波形時域、小波變換特征等,以BP作為弱分類器,通過AdaBoost方法組合成強分類器,得到較高的識別率。蔡杏輝等[23]提取波形復(fù)雜度、頻譜比、自相關(guān)系數(shù)、波形復(fù)雜度和自相關(guān)系數(shù)比值為特征,用決策樹作為基分類器,用Bagging集成方法集合成一個強分類器,準(zhǔn)確率可達85%以上。Bagging只是對分類器進行簡單整合,AdaBoost能對錯誤分類的訓(xùn)練數(shù)據(jù)進行處理,準(zhǔn)確率更高,但AdaBoost易受樣本中的噪聲影響,從而產(chǎn)生過擬合。LogitBoost算法是在AdaBoost的基礎(chǔ)上改進而來的,對樣本噪聲不太敏感,泛化能力更強。

為準(zhǔn)確提取地震信號特征,提高地震事件分類識別準(zhǔn)確率,本文提出基于改進EWT和LogitBoost集成分類器的天然地震和人工爆破事件分類識別算法。首先,對地震記錄進行篩選,剔除噪聲干擾嚴(yán)重的記錄,并對篩選后的地震記錄計算P波與S波最大振幅比;在此基礎(chǔ)上,利用S變換時間頻率分析精度高的優(yōu)勢對信號進行S變換,獲取能反映信號頻率與能量特征的S譜能量曲線,再基于S譜能量曲線對傳統(tǒng)EWT進行改進,將地震信號自適應(yīng)分解為若干按頻率和能量分布的本征模函數(shù)(Intrinsic Mode Function,IMF)后去除噪聲,然后提取各IMF的香農(nóng)熵、對數(shù)能量熵,及去噪后重構(gòu)記錄的主頻等特征;最后,基于LogitBoost機制的決策樹集成分類器進行事件識別,以有效提高地震事件識別的準(zhǔn)確率。

1 基于S譜能量曲線的改進EWT

1.1 S譜能量曲線

作為小波變換和短時傅里葉變換的發(fā)展,S變換采用帶有頻率變量的高斯窗函數(shù)截取信號,實現(xiàn)信號的局部分析。由于其窗函數(shù)可隨頻率自適應(yīng)改變,具有多分辨率的特點,能較好地適應(yīng)非平穩(wěn)信號頻率不規(guī)律變化的特點,在地震信號處理領(lǐng)域應(yīng)用較廣。對某地震信號h(t)進行S變換:

(1)

式中:f為頻率;τ為平移因子,用于控制高斯窗在時間軸t上的位置;j為虛數(shù)單位。

對信號進行S變換得到信號時頻分布S譜,可同時從時域和頻域分析其特性和能量分布。對頻點i定義S譜頻點能量:

(2)

式中:fi為S變換后頻點i的頻率,S(fi,τ)為該頻點對應(yīng)的S變換值即S譜值。

獲取所有頻點的能量譜值LEi,能夠得到依頻率分布的S譜能量曲線。該S譜能量曲線能清晰描繪不同頻率處信號的能量分布情況及不同頻率成分的能量強弱。

1.2 基于S譜能量曲線的改進EWT

設(shè)地震信號s(t)的傅里葉頻譜為F(w)w∈[0,π],S譜為S(f,τ),按式(2)計算S譜能量曲線后對地震信號進行改進EWT分解。

S譜能量曲線能真實體現(xiàn)原信號低頻到高頻部分各頻率成分的能量大小分布,基于S譜能量曲線的改進EWT可將原地震信號準(zhǔn)確分解為一系列依頻率和能量分布的IMF。分解后的IMF瞬時頻譜和幅值具有較高的分辨率,不僅能刻畫原信號的時頻特征,也能更好地描述信號的局部突變或漸變特征,從而更好地獲取原信號特征。

2 數(shù)據(jù)預(yù)處理與特征提取

本文數(shù)據(jù)來源于中國地震數(shù)據(jù)共享中心。其中,人工爆破記錄是2013—2019年發(fā)生于廣西平果、武鳴、貴港、樂業(yè)等地的礦藏勘探、開采等人工爆破微震事件波形記錄,震級為ML1.3~3.0,共973條;天然地震記錄是發(fā)生于2019—2020年每年8—10月、震級ML1.3~3.0的天然微震波形記錄,共867條。由于某些地震事件的臺站波形記錄中噪聲干擾較多,因此需要對地震記錄進行預(yù)處理,對被噪聲淹沒的波形進行篩選剔除,以更精確地提取地震信號特征,消除噪聲影響。

2.1 波形篩選

對地震事件進行分類識別前需要對記錄進行篩選并拾取P波到時。目前應(yīng)用較廣泛的初至拾取方法有短時平均值/長時平均值(Short Term Averaging/Long Term Averaging,STA/LTA)、赤池信息準(zhǔn)則(Akaike Information Criterion,AIC)、無監(jiān)督聚類算法等,本文利用快速簡單的STA/LTA算法進行波形記錄篩選,具體流程如下:

(1) 截取包含P 波和S波在內(nèi)的全波段波形記錄;

(2) 設(shè)定STA,LTA和閾值,取STA=0.2 s,LTA=1 s,閾值為1.5;

(3) 基于STA/LTA進行P波拾取,取初至?xí)r間點的前10 s至后100 s的記錄波形。

按以上步驟進行波形篩選,得到天然地震記錄648條,人工爆破記錄575條。

2.2 改進EWT分解

對篩選后的記錄進行計算,得到其S譜能量曲線,取能量曲線上的前4個極大值點,以其為頻譜分割初始邊界。根據(jù)ε鄰域法重新確定新邊界,進行改進EWT分解,最終將每條記錄分解為5個IMF分量。由于隨機噪聲在地震記錄中廣泛存在,且一般以高頻為主,因此將最后一個IMF視為高頻噪聲并丟棄,盡可能降低噪聲影響。去噪后的每條地震記錄對應(yīng)4個IMF,這4個IMF主要為有效波,既保留原信號時頻特征,也能刻畫信號局部變化細(xì)節(jié),有利于提取信號特征屬性。

2.3 特征提取

為了消除各維數(shù)據(jù)之間的數(shù)量級差別,對所有輸入數(shù)據(jù)進行歸一化處理,將數(shù)據(jù)歸一化到[-1,1]區(qū)間。信號P波與S波的最大振幅比是天然地震和人工爆破波形信號中的一個重要特征[23-24],經(jīng)STA/LTA識別P波初至位置A后,按式(3)計算P波與S波最大振幅比ps:

ps=max(A-50:A+50)/max(A+50:A+1 900)

(3)

熵用于衡量信號的復(fù)雜程度,利用香農(nóng)熵可以分析信號時頻分布的聚集性,利用對數(shù)能量熵可反映信號的暫態(tài)或突變特性,因此香農(nóng)熵和對數(shù)能量熵成為微震和爆破信號識別的重要參數(shù)[25]。對分解出的4個IMF,按式(4)分別提取每個IMF的香農(nóng)熵Esh(i)和對數(shù)能量熵Elg(i)。

(4)

式中:si,j為EWT分解后分量i(即IMFi)的第j個值;M為每個分量的長度。

此外,由于爆破信號的頻譜特征與天然地震明顯不同,其能量較集中,且頻率更低[26]。基于這4個IMF進行原信號重構(gòu),對重構(gòu)后的信號進行希爾伯特變換。希爾伯特變換是一種適合非線性、非平穩(wěn)信號的時頻分析方法,常用于求解信號瞬時頻率。按式(5)求取主頻Fm:

(5)

式中:f為頻率;s(f)為希爾伯特變換幅度譜。

如上所述,從篩選后的每條記錄中提取10個特征值,所有記錄特征共組成1 223×10的波形特征向量矩陣。

3 基于LogitBoost決策樹集成分類器的天然地震與人工爆破事件分類識別

3.1 基于LogitBoost機制的決策樹集成分類器構(gòu)建

Boosting算法是一種經(jīng)典集成學(xué)習(xí)算法[27],被廣泛應(yīng)用于分類識別。該算法用初始權(quán)重從初始訓(xùn)練集訓(xùn)練出一個基分類器,根據(jù)基分類器的訓(xùn)練誤差對訓(xùn)練樣本分布進行調(diào)整,使得先前基分類器分類錯誤的訓(xùn)練樣本在下一輪的訓(xùn)練中被選中的概率增加。如此重復(fù)進行,直到完成T輪訓(xùn)練,將這T個基分類器組合成一個強分類器,使強分類器在樣本集上具有最小的預(yù)測損失,從而獲得比單個學(xué)習(xí)器更好的性能。

Boosting算法中最經(jīng)典的是AdaBoost,它采用的損失函數(shù)為ELOSS,損失隨分類錯誤呈指數(shù)變化,容易受樣本中噪聲影響而產(chǎn)生過擬合。針對這一不足,Friedman提出LogitBoost[28]。LogitBoost采用二項式對數(shù)似然損失函數(shù)LLOSS,損失隨分類錯誤呈線性變化,對樣本噪聲較不敏感,泛化能力更強。大量研究表明,利用LogitBoost進行分類識別能取得較好的效果[29-30]。LogitBoost對基分類器要求不高,只需要比隨機猜測略好。本文選用決策樹作為基分類器,決策樹是一種非參的有監(jiān)督學(xué)習(xí)方法,可從有特征和標(biāo)簽的訓(xùn)練樣本數(shù)據(jù)中學(xué)習(xí)出決策規(guī)則,自動構(gòu)造決策樹進行分類?;贚ogitBoost的決策樹集成分類器構(gòu)建過程如下:

步驟(1):選取訓(xùn)練樣本集d=(xi,yi),i=1,2,…,N,其中N為樣本個數(shù);xi為判別變量,xi=(xi,1,xi,2,…,xi,m),m=10;yi為類別標(biāo)簽,設(shè)1為正類(天然地震),-1為負(fù)類(人工爆破)。

步驟(4):樣本權(quán)重的更新。

(6)

(7)

(8)

3.2 分類器識別流程

為剔除干擾嚴(yán)重的記錄,有效提取地震信號特征,在識別前先對地震記錄進行篩選,基于STA/LTA進行P波初至拾取,截取初至點前10 s至后100 s共110 s記錄,計算P波與S波最大振幅比;其次,進行基于S譜能量曲線的改進EWT,將地震信號分解為5個IMF,視最后一個IMF為噪聲,取前4個IMF的香農(nóng)熵和對數(shù)能量熵,并計算由前4個IMF重構(gòu)的地震記錄主頻,每條記錄共提取10個特征值;最后,對所有記錄特征組成的波形特征向量矩陣,以決策樹為基分類器,基于LogitBoost機制合成強分類器進行事件識別。算法流程如圖1所示。

圖1 本文分類識別算法流程圖Fig.1 Flow chart of the proposed classification and recognition algorithm

3.3 分類器識別效果評價

為驗證算法的穩(wěn)定性及泛化能力,采用交叉驗證和獨立樣本測試方法進行檢驗。其中交叉驗證采用非重疊的隨機選取劃分策略,訓(xùn)練集和測試集獨立,選取10%~100%的樣本為訓(xùn)練集,其余為測試集(100%樣本時,全部樣本數(shù)據(jù)既做訓(xùn)練集也做測試集);獨立樣本測試是用新數(shù)據(jù)集進行測試。為評估算法性能,根據(jù)表1 所示的分類識別結(jié)果混淆矩陣,計算敏感度SE、特異性SP值和準(zhǔn)確率ACC。

表1 地震事件分類識別結(jié)果Table 1 Classification and recognition results of seismic events

(9)

敏感度SE也稱召回率,代表所有正例被正確分類的比例,能衡量分類器對正類的識別能力;特異性SP表示所有負(fù)例被正確分類的比例,能衡量分類器對負(fù)例的識別能力;準(zhǔn)確率ACC是對分類器整體正確率的評價。SE越高,越容易鑒定出負(fù)類,即越靈敏;SP越高,則越不容易誤分類,即篩選能力強。準(zhǔn)確率、召回率、特異性是分類器的常用性能度量指標(biāo),一般認(rèn)為具有高準(zhǔn)確率、高召回率和高特異性的分類器是一個優(yōu)秀的分類器。

4 實驗及分析

4.1 改進EWT信號分解

為驗證改進EWT的信號分解效果,分別對天然地震和人工爆破記錄進行分解。圖2和圖3分別為經(jīng)篩選(初至點前10 s至后100 s)并歸一化后的天然地震和人工爆破記錄,采樣率均為100 Hz。天然地震是2020年8月16日福建安溪(25.391°N,117.742°E)發(fā)生的ML2.2微地震在QZH 臺站的記錄波形。人工爆破記錄是2014年8月2日廣西武鳴地區(qū)(23.006°N,108.21°E)發(fā)生的M2.6人工爆破事件在DHX臺站的記錄波形。圖中可見,人工爆破持續(xù)時間相對較短,天然地震持續(xù)時間更長?;诖瞬ㄐ斡涗浛捎嬎鉖波與S波最大振幅比ps。

圖2 天然地震記錄Fig.2 Natural seismic record

圖3 人工爆破記錄Fig.3 Artificial blasting record

以圖2所示天然微震波形記錄為例進行改進EWT分解,所得S譜能量曲線繪于圖4。該曲線能較清晰地描繪各頻率點處原信號的能量大小,可見天然地震能量主要集中在低頻端。

圖4 S譜能量曲線Fig.4 S-transform spectrum energy curve

基于該曲線進行頻帶分割得到子頻帶,如圖5所示;傳統(tǒng)EWT頻譜分割結(jié)果如圖6所示??梢?傳統(tǒng)EWT以傅里葉頻譜的極值點為頻譜分割邊界,頻譜分割雜亂無章,從而無法有效區(qū)分有效波和噪聲;而本文改進EWT的子頻帶能根據(jù)頻率和能量大小將原信號頻譜分割開,便于信號分解。

圖5 改進EWT頻帶分割結(jié)果Fig.5 Intersection of frequency spectrum using improved EWT

圖6 傳統(tǒng)EWT頻帶分割結(jié)果Fig.6 Intersection of frequency spectrum using traditional EWT

頻譜分割后,基于改進EWT和傳統(tǒng)EWT所得的IMF分別如圖7、圖8所示。改進EWT能較好地根據(jù)信號的頻率和能量進行模態(tài)分解,如圖7中IMF1~IMF4主要為有效波,而IMF5主要為高頻隨機噪聲,將其視為噪聲去除有利于實現(xiàn)有效波與隨機噪聲的有效分離。而傳統(tǒng)EWT分解信號散亂,無法實現(xiàn)有效波與噪聲的有效分離。用改進EWT對圖3中的人工爆破信號進行分解,所得IMF如圖9所示。同理,前4個IMF為有效信號,最后一個IMF為噪聲。

圖7 改進EWT分解IMF結(jié)果(天然地震)Fig.7 Decomposed IMFs by improved EWT (natural event)

圖8 傳統(tǒng)EWT分解IMF結(jié)果(天然地震)Fig.8 Decomposed IMFs by traditional EWT (natural event)

圖9 改進EWT分解IMF結(jié)果(人工爆破)Fig.9 Decomposed IMFs based on improved EWT (manual blasting)

對IMF1~IMF4提取香農(nóng)熵和對數(shù)能量熵,將IMF5視為噪聲舍棄。再對IMF1~IMF4進行重構(gòu),計算重構(gòu)信號主頻,獲取每條記錄的特征屬性值。

4.2 基于LogitBoost的決策樹集成分類器性能

將1 223條記錄提取的特征組成1 223×10的特征矩陣,采用基于LogitBoost機制的決策樹集成分類器進行分類識別,迭代次數(shù)100次,算法基于Weka開源平臺實現(xiàn),環(huán)境為Matlab2016Ra,Win10系統(tǒng)。

基分類器個數(shù)是集成分類器的重要參數(shù)之一,理論上,樣本數(shù)據(jù)量增大,基分類器個數(shù)應(yīng)適當(dāng)增加。如圖10所示,以訓(xùn)練樣本比例70%為例,以決策樹為基分類器,將不同數(shù)量基分類器集成為強分類器,得到的分類準(zhǔn)確率均在93.1%以上,說明本文算法有較好的分類效果。隨著基分類器數(shù)量增加,分類準(zhǔn)確率有一定提高,但分類器數(shù)量越多,識別時間也將增加。綜合考慮算法時間與性能,本文以10個基分類器組成強分類器。

圖10 不同數(shù)量基分類器對應(yīng)的識別準(zhǔn)確率Fig.10 Recognition accuracy corresponding to different amounts of base classifiers

采用交叉驗證檢驗,隨機抽取一定比例(10%~100%)的數(shù)據(jù)用于訓(xùn)練,其余數(shù)據(jù)用于測試,且同一訓(xùn)練樣本比例隨機抽取、運行100次,計算SE、SP和ACC值,并取均值,得到的分類識別結(jié)果列于表2。

表2 不同訓(xùn)練樣本比例分類結(jié)果(單位:%)Table 2 Classification results with different proportions of training samples (Unit:%)

由表2可見,本文集成分類器方法中訓(xùn)練集的劃分具有較好的魯棒性,即訓(xùn)練樣本數(shù)量對分類結(jié)果影響較小,訓(xùn)練樣本數(shù)量取不同比例時,分類準(zhǔn)確率ACC較高,且差異性較小,同時SE、SP也較高,說明分類器具有較好的穩(wěn)定性。

4.3 與其他分類器對比

為了進一步分析分類器的性能,分別用BP神經(jīng)網(wǎng)絡(luò)、SVM、AdaBoost等分類算法進行分類識別,并與本文分類器的識別效果進行對比。使用BP神經(jīng)網(wǎng)絡(luò)分類時,為增強網(wǎng)絡(luò)分類性能,采用雙隱層,每個隱層4個節(jié)點,網(wǎng)絡(luò)迭代100次,學(xué)習(xí)率為0.1,訓(xùn)練誤差設(shè)置為10-5;SVM分類時,選用RBF核函數(shù),選擇有最高分類準(zhǔn)確率的懲罰參數(shù)C和核函數(shù)參數(shù)g為最佳參數(shù);AdaBoost也采用決策樹為基分類器,基分類器數(shù)為10個。同上,選擇不同的比例樣本,分別用BP神經(jīng)網(wǎng)絡(luò)、SVM、AdaBoost、本文算法各運行100次,取均值后得到的分類準(zhǔn)確率如圖11所示。

圖11 不同分類算法在不同樣本比例下的分類準(zhǔn)確率Fig.11 Classification accuracy of different algorithms under different proportions of samples

由圖11可見,本文方法與其他3種方法相比有1%以上的分類準(zhǔn)確率提升。SVM 基于結(jié)構(gòu)風(fēng)險最小化進行網(wǎng)絡(luò)訓(xùn)練,BP神經(jīng)網(wǎng)絡(luò)基于經(jīng)驗風(fēng)險最小化進行網(wǎng)絡(luò)訓(xùn)練,SVM訓(xùn)練結(jié)果略優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。AdaBoost集成分類器和本文方法均采用組合策略,能減小單個分類器誤差,具有較高識別率;二者對訓(xùn)練集的劃分均具有較好穩(wěn)定性,即訓(xùn)練樣本數(shù)量多少對分類結(jié)果影響較小。BP神經(jīng)網(wǎng)絡(luò)和SVM對訓(xùn)練集數(shù)量比較敏感,當(dāng)訓(xùn)練樣本較少時分類準(zhǔn)確率較低,隨著訓(xùn)練樣本增加,準(zhǔn)確度提升。因此,當(dāng)樣本數(shù)量較少時更適合采用集成分類器,而Logitboost由于采用二項式對數(shù)似然損失函數(shù),抗噪性較強,比AdaBoost集成分類器具有更好的性能,分類正確率更高一些。

為進一步驗證本文分類器的實用性及穩(wěn)定性,對另外兩組獨立的樣本數(shù)量不同的數(shù)據(jù)集進行分類識別。其中一組:人工爆破為2014年11—12月廣西田陽、2015年2—3月廣西柳江的ML1.7~2.7礦藏開采記錄,共452條,采樣率100 Hz;天然地震為2020年8—10月ML1.8~2.8的天然微震記錄,共481條,采樣率100 Hz。用本文方法識別該數(shù)據(jù)集,準(zhǔn)確識別人工爆破記錄422條,識別準(zhǔn)確率為93.4%;準(zhǔn)確識別天然地震記錄455條,識別準(zhǔn)確率為94.6%,整體識別準(zhǔn)確率94%。另外一組:天然地震為2021年5—8月187條ML3.0以下天然微震記錄,人工爆破為2018年4—5月廣西臨桂202條采礦爆破記錄。對該數(shù)據(jù)集進行分類預(yù)測,結(jié)果顯示對天然地震的識別準(zhǔn)確率為94.5%,人工爆破的識別準(zhǔn)確率為93.4%,整體識別準(zhǔn)確率94.2%。

實驗表明,本文所提分類器的整體分類準(zhǔn)確率較高,達94%,且訓(xùn)練樣本數(shù)量對分類結(jié)果的影響較小,說明分類器模型具有較好的穩(wěn)定性,能解決樣本不足的問題。

5 結(jié)論

本文利用S變換優(yōu)良的時頻特性,提出了基于S譜能量曲線的改進EWT,以有效獲取地震信號特征;研究了基于LogitBoost機制的集成分類器分類識別算法,并基于真實的天然微震和人工爆破記錄對不同算法性能進行測試,得到如下結(jié)論:

(1) S譜能量曲線能真實完整地反映信號能量和頻率特征,從而根據(jù)原信號的頻率和能量完成信號分解,更好地提取信號特征。

(2) 根據(jù)原信號P波與S波最大振幅比、分解后IMF的香農(nóng)熵和對數(shù)能量熵,及去噪后重構(gòu)信號主頻等特征,能有效區(qū)分天然和人工爆破的不同,可作為識別天然和人工爆破的特征參數(shù),應(yīng)用于實際的地震事件識別系統(tǒng)。

(3) 基于LogitBoost的決策樹集成分類器準(zhǔn)確率要優(yōu)于AdaBoost、BP神經(jīng)網(wǎng)絡(luò)和SVM方法,且擁有1%以上的性能提升,說明本文算法有效可靠,具有一定的實用性。

(4) 通過集成學(xué)習(xí)方法可提高分類效果,基于LogitBoost機制的集成分類器方法具有較好的魯棒性,即訓(xùn)練樣本數(shù)量多少對分類結(jié)果影響較小,能有效解決樣本不足的問題,適用性較強。

文中對分類器相關(guān)參數(shù)的研究不夠細(xì)致,下一步將進行分類器相關(guān)參數(shù)優(yōu)化,如基分類器種類、迭代次數(shù)等參數(shù)對分類結(jié)果的影響,從而獲取最優(yōu)參數(shù),提高分類器分類效果。

猜你喜歡
分類器波形準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
對《壓力容器波形膨脹節(jié)》2018版新標(biāo)準(zhǔn)的理解及分析
基于LFM波形的靈巧干擾效能分析
高速公路車牌識別標(biāo)識站準(zhǔn)確率驗證法
BP-GA光照分類器在車道線識別中的應(yīng)用
電子測試(2018年1期)2018-04-18 11:52:35
加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機的TSK分類器
基于ARM的任意波形電源設(shè)計
高要市| 盘锦市| 洪湖市| 香河县| 通化市| 长丰县| 彭阳县| 府谷县| 吴旗县| 长乐市| 大港区| 信阳市| 馆陶县| 渭南市| 长兴县| 集安市| 宜州市| 时尚| 徐汇区| 曲靖市| 沙雅县| 丰台区| 江华| 两当县| 武山县| 天镇县| 武功县| 遂溪县| 湘潭市| 新沂市| 交口县| 通渭县| 万载县| 常州市| 富顺县| 饶河县| 嘉义县| 抚州市| 甘孜县| 鄂托克旗| 长乐市|