国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

小樣本地震信號識別研究

2022-11-03 01:54:46范曉易王夫運(yùn)鄢兆倫李婷婷周康雅
大地測量與地球動力學(xué) 2022年11期
關(guān)鍵詞:超平面訓(xùn)練樣本樣本量

范曉易 王夫運(yùn) 鄢兆倫 李婷婷 周康雅 王 麗

1 江蘇省地震局,南京市衛(wèi)崗3號,210014

2 中國地震局地球物理勘探中心,鄭州市文化路75號,450002

地震信號識別是判定地震類型的首要工作。近年來,地震信號自動識別問題多集中在天然地震與人工爆破的識別上,主要從信號時頻分析、震相和波形特征等角度展開研究[1-3],基于大量數(shù)據(jù)的經(jīng)驗(yàn)總結(jié),可以實(shí)現(xiàn)較好的地震信號分類效果。然而我國東部經(jīng)濟(jì)發(fā)達(dá)地區(qū)不僅地震偏少、震級偏小,而且存在人工爆破、塌陷等干擾,在樣本量較小的情況下,需要進(jìn)一步研究有效的地震識別方法,力求解決其他方法存在的樣本庫過大和局部地區(qū)樣本不足的問題,提高地震監(jiān)測、震后應(yīng)急與地震科學(xué)研究的效率。本文給出支持向量機(jī)方法應(yīng)用于小樣本識別領(lǐng)域的原理,并通過實(shí)驗(yàn)進(jìn)一步驗(yàn)證其在不同樣本量下對地震信號分類識別的效果。

1 支持向量機(jī)多分類理論

1.1 支持向量機(jī)方法

支持向量機(jī)在解決非線性、小樣本、高維模式識別問題上有極大的優(yōu)勢[4]。其分類思想是提取樣本特征并以向量形式表達(dá),把樣本的識別問題轉(zhuǎn)化為向量空間中點(diǎn)的分類問題。如圖1所示,以二分類為例,在高維空間里建立起兩個相互平行的最大間隔超平面,把兩類點(diǎn)區(qū)分開。

1.2 小樣本識別理論基礎(chǔ)

本文所研究的地震信號包括人工爆破、天然地震與塌陷3 類,同二分類相類似,當(dāng)擴(kuò)展到多分類的情形時,對由訓(xùn)練樣本建立的相應(yīng)特征向量,劃定分類超平面,為測試樣本的分類判斷提供依據(jù)。分類超平面間的距離或差距越大,分類器的總誤差越小[5]。

為便于理解,對每個地震信號樣本取3個特征組成特征向量,即在三維特征空間中,每一個點(diǎn)代表一個樣本。如圖2(a)所示,選擇合適的訓(xùn)練樣本能夠呈現(xiàn)較好的聚類效果。圖2(b)訓(xùn)練樣本量過少,容易造成類間距離小于類別內(nèi)部距離進(jìn)而得到錯誤結(jié)果。圖2(c)在圖2(a)的基礎(chǔ)上繼續(xù)增加樣本量,特征典型的訓(xùn)練樣本增多,逐漸充滿類別內(nèi)部空間;同時特征不典型的訓(xùn)練樣本也增多,造成類間距離縮短,分類器的總誤差變大。圖2(d)訓(xùn)練樣本量過多,積累了一定的特征不典型訓(xùn)練樣本后,類間距離縮短甚至消失,聚類失敗,無法獲得分類器。

由上文分析可知,支持向量機(jī)方法的分類效果與分類超平面間的距離直接相關(guān),也就是取決于類別邊緣點(diǎn)和類別內(nèi)部點(diǎn)的距離關(guān)系,并不依賴于大量訓(xùn)練樣本的加入。加入過多的樣本僅增加了類別內(nèi)部的數(shù)據(jù)冗余,甚至?xí)斐深愰g界限不清晰甚至消失。因此理論上支持向量機(jī)方法能夠在小樣本條件下實(shí)現(xiàn)分類。

2 數(shù)據(jù)處理方法

由上文可知,支持向量機(jī)分類方法本質(zhì)上是提取特征向量,在高維空間對向量進(jìn)行分類。當(dāng)識別地震信號時,可使用小波分解產(chǎn)生的小波系數(shù)作為特征向量。如表1所示,同一類型信號的香農(nóng)熵特征值接近,容易使用數(shù)學(xué)手段在向量空間中區(qū)分。

3 小樣本研究實(shí)驗(yàn)

3.1 實(shí)驗(yàn)數(shù)據(jù)選取

本文使用山東和江蘇地區(qū)2006~2017年地震事件的近臺波形記錄數(shù)據(jù),兩地整體地震活動水平不高,就波形質(zhì)量而言,山東地區(qū)略優(yōu)。數(shù)據(jù)的選取充分考慮了地區(qū)環(huán)境、監(jiān)測能力、數(shù)據(jù)記錄質(zhì)量等因素的影響,為更好地驗(yàn)證本文方法對小樣本的支持程度,并未嚴(yán)格限制事件的震級和信噪比,以期真實(shí)全面地反映臺網(wǎng)的常見記錄。最終選取450個數(shù)據(jù),每類事件數(shù)據(jù)各150個,隨機(jī)選取其中50個數(shù)據(jù)作為測試樣本。

表1 部分樣本的香農(nóng)熵特征值

3.2 參數(shù)設(shè)計(jì)實(shí)驗(yàn)

根據(jù)文獻(xiàn)[6]可知,影響最終分類效果的因素主要有信號窗長度、小波分解方式、小波基類型、向量機(jī)算法類型、向量機(jī)核函數(shù)類型等。取識別率最高的3種最佳參數(shù)組合,設(shè)計(jì)3組實(shí)驗(yàn),訓(xùn)練樣本數(shù)120個(每種地震事件各40個),測試樣本數(shù)150個(每種地震事件各50個),結(jié)果如表2所示。

3.3 樣本數(shù)量實(shí)驗(yàn)

為驗(yàn)證訓(xùn)練樣本數(shù)量對識別率的影響,使用識別率最高的參數(shù)組合1繼續(xù)設(shè)計(jì)樣本數(shù)量實(shí)驗(yàn)。測試樣本均保持150個不變,以組1的訓(xùn)練樣本數(shù)120個為基準(zhǔn),增加或減少訓(xùn)練樣本數(shù)量,實(shí)驗(yàn)設(shè)計(jì)及結(jié)果如表3所示。

4 實(shí)驗(yàn)結(jié)果與分析

從表3可以看出,隨著樣本量的增加,3類地震信號的識別率同步出現(xiàn)先升高再降低的現(xiàn)象,與理論分類效果一致??傆?xùn)練樣本為90個時,實(shí)驗(yàn)組8實(shí)現(xiàn)了最好的分類效果。樣本量過少造成未能有效獲取分類超平面,因此識別率也降低(組9、組10);隨著樣本量的繼續(xù)增多,識別率略有下降,反映出一定的數(shù)據(jù)冗余和分類超平面間距的減小(組1、組4、組5);而過多的樣本量則使得對樣本過度學(xué)習(xí),無法建立準(zhǔn)確的分類超平面,導(dǎo)致識別率陡降(組6、組7)。由于本次研究側(cè)重于支持向量機(jī)方法對小樣本的支持程度,數(shù)據(jù)選取真實(shí)全面地反映了臺網(wǎng)的常見事件記錄,因此本文最終識別效果相較于前期研究中使用高信噪比數(shù)據(jù)的結(jié)果有所降低[6]。

表2 不同參數(shù)組合的分類識別結(jié)果

表3 不同訓(xùn)練樣本量的實(shí)驗(yàn)結(jié)果

5 結(jié) 語

本文研究支持向量機(jī)分類算法識別小樣本地震信號的可行性。使用山東和江蘇地區(qū)的實(shí)際數(shù)據(jù)開展實(shí)驗(yàn),在未篩選震級和信噪比的情況下,僅需每類事件(地震、爆破、塌陷)30個訓(xùn)練樣本即可達(dá)到85%左右的正確識別率,充分證明了支持向量機(jī)方法在小樣本識別領(lǐng)域的可靠性。

本方法的識別率不依賴于對大量訓(xùn)練樣本的學(xué)習(xí),在保證一定的訓(xùn)練樣本建立分類超平面的基礎(chǔ)上,過多的訓(xùn)練樣本反而會降低識別率。此外,支持向量機(jī)分類算法通過引入核函數(shù)解決復(fù)雜的非線性化問題,可避免非線性化導(dǎo)致算法出現(xiàn)局部極值以及其他機(jī)器學(xué)習(xí)方法中的局部極小化問題,訓(xùn)練結(jié)果具有穩(wěn)定性和可靠性。因此,本方法適用于在地震數(shù)據(jù)樣本量少的地區(qū)進(jìn)行地震信號識別,對于地震數(shù)據(jù)充足的地區(qū),也可以精簡樣本庫、提高識別效率、降低運(yùn)行成本。相較于普遍需要大量數(shù)據(jù)經(jīng)驗(yàn)的其他機(jī)器學(xué)習(xí)方法,本方法在小樣本識別領(lǐng)域表現(xiàn)出了一定的優(yōu)越性。

猜你喜歡
超平面訓(xùn)練樣本樣本量
醫(yī)學(xué)研究中樣本量的選擇
全純曲線的例外超平面
涉及分擔(dān)超平面的正規(guī)定則
人工智能
以較低截?cái)嘀財(cái)?shù)分擔(dān)超平面的亞純映射的唯一性問題
航空裝備測試性試驗(yàn)樣本量確定方法
Sample Size Calculations for Comparing Groups with Binary Outcomes
寬帶光譜成像系統(tǒng)最優(yōu)訓(xùn)練樣本選擇方法研究
融合原始樣本和虛擬樣本的人臉識別算法
基于稀疏重構(gòu)的機(jī)載雷達(dá)訓(xùn)練樣本挑選方法
保德县| 昭通市| 迭部县| 铁岭市| 金乡县| 思茅市| 水城县| 正阳县| 分宜县| 浪卡子县| 武义县| 盐亭县| 宽甸| 侯马市| 甘南县| 恩平市| 青海省| 五家渠市| 陈巴尔虎旗| 赤壁市| 阳山县| 会理县| 江口县| 安溪县| 温宿县| 额尔古纳市| 海城市| 大化| 越西县| 张家口市| 阳春市| 石景山区| 崇礼县| 南乐县| 汉源县| 满洲里市| 屯昌县| 赫章县| 雷州市| 衡南县| 琼海市|