国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于MFCC特征的水下目標(biāo)分類(lèi)網(wǎng)絡(luò)

2022-04-16 02:08:54徐曉剛羅昕煒
聲學(xué)與電子工程 2022年1期
關(guān)鍵詞:特征提取濾波器準(zhǔn)確率

徐曉剛 羅昕煒

(東南大學(xué)水聲信號(hào)處理教育部重點(diǎn)實(shí)驗(yàn)室,南京,210096)

水下目標(biāo)的分類(lèi)識(shí)別是水聲領(lǐng)域研究的熱點(diǎn)問(wèn)題,對(duì)于現(xiàn)代海洋裝備目標(biāo)探測(cè)尤為關(guān)鍵,特征向量提取的方法是水聲目標(biāo)分類(lèi)識(shí)別的研究重點(diǎn)。文獻(xiàn)[1]提出了一種基于小波包變換的水下目標(biāo)輻射噪聲特征提取算法,文獻(xiàn)[2]提出了一種基于雙譜估計(jì)的水下目標(biāo)輻射噪聲特征提取算法,文獻(xiàn)[3]提出了一種基于波數(shù)譜模態(tài)能量差特征的目標(biāo)分類(lèi)方法。由于聲吶識(shí)別不同水下輻射噪聲源的原理與人耳語(yǔ)音識(shí)別的機(jī)理類(lèi)似,因此,基于聽(tīng)覺(jué)特征的水下聲目標(biāo)特征提取方法是研究熱點(diǎn)之一,其中提取梅爾倒譜系數(shù)進(jìn)行水下聲目標(biāo)識(shí)別是常用的方法之一。文獻(xiàn)[4]介紹了差分梅爾頻率倒譜系數(shù)的概念和相應(yīng)的特征提取方法,對(duì)水下目標(biāo)進(jìn)行了基于MFCC特征提取方法仿真研究和實(shí)驗(yàn)分析;文獻(xiàn)[5]將 MFCC特征應(yīng)用于船舶和鯨類(lèi)水下聲信號(hào)的特征提取中,提取了船舶和鯨類(lèi)聲信號(hào)的MFCC特征,通過(guò)高斯混合模型對(duì)提取的MFCC特征進(jìn)行訓(xùn)練和識(shí)別分類(lèi),討論MFCC維數(shù)變化和不同MFCC特征組合對(duì)識(shí)別分類(lèi)性能的影響;文獻(xiàn)[6-8]也進(jìn)行了MFCC特征提取相關(guān)方面的研究工作,并取得了一定的研究成果。

傳統(tǒng)水下聲目標(biāo)識(shí)別分類(lèi)過(guò)程具有較強(qiáng)的人機(jī)交互特性,需要人工提取泛化能力強(qiáng)的特征數(shù)據(jù),無(wú)法滿足未來(lái)水下無(wú)人平臺(tái)只能識(shí)別分類(lèi)水聲目標(biāo)的需求。深度學(xué)習(xí)理論可以改善這一點(diǎn),它可以打破現(xiàn)有的水聲目標(biāo)識(shí)別中對(duì)先驗(yàn)知識(shí)和特征提取方法的依賴,直接通過(guò)學(xué)習(xí)獲得信號(hào)特征,目前已發(fā)展出自編碼器(Auto Encode, AE)[9]、深度置信網(wǎng)絡(luò)(Deep Belief Networks,DBN)[10]、CNN[11-12]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN)[13-15]、生成對(duì)抗網(wǎng)絡(luò)(Generative Adversarial Network,GAN)[16-17]及其相關(guān)變種等多種模型,在各個(gè)領(lǐng)域得到廣泛的應(yīng)用且都有不錯(cuò)的效果。因此,用深度學(xué)習(xí)的方法結(jié)合 MFCC對(duì)不同水下目標(biāo)進(jìn)行分類(lèi)識(shí)別,可以減少實(shí)時(shí)環(huán)境對(duì)技術(shù)人員的依賴性,使得未來(lái)水下無(wú)人平臺(tái)領(lǐng)域應(yīng)用更加廣泛和靈活。本文利用實(shí)現(xiàn)的 CNN研究了不同維度下 MFCC和LOFAR特征的分類(lèi)性能。

1 信號(hào)特征提取

1.1 梅爾頻率

通過(guò)對(duì)人耳聽(tīng)覺(jué)機(jī)理的研究發(fā)現(xiàn),人耳對(duì)不同頻率的聲音有不同的敏感度,特別是頻率200~5000 Hz的語(yǔ)音信號(hào)特別敏感。所以人耳的聽(tīng)覺(jué)系統(tǒng)是非線性的,這也是對(duì)低頻聲音信號(hào)更加敏感的原因。梅爾倒譜系數(shù)是在梅爾頻率(Mel-Frequency)域上提取出來(lái)的參數(shù),Mel頻率描述了人耳的非線性特性,它與頻率關(guān)系為

式中,fmel表示的是在Mel頻率域上的頻率,Hz。

1.2 MFCC參數(shù)提取過(guò)程

MFCC特征的提取過(guò)程,需要對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)加重、信號(hào)分幀、加窗以及濾波器處理等操作,具體流程如圖1所示,這些處理方式都是為了能夠最大化的保留語(yǔ)音的有效特征,從而達(dá)到最好的特征參數(shù)提取。

圖1 MFCC算法框圖

(a)預(yù)加重即將聲信號(hào)通過(guò)一個(gè)高通濾波器,目的是增強(qiáng)聲信號(hào)中的高頻部分,使得頻譜變得平坦,保持從低頻到高頻的整個(gè)頻帶內(nèi)可以有相同的信噪比,本實(shí)驗(yàn)選取的高通濾波器傳遞函數(shù)為:,其中μ=0.95。

(b)分幀是將N個(gè)采樣點(diǎn)集合成一個(gè)觀測(cè)單位,通常N取值為256或者512,其涵蓋時(shí)間范圍大約在20~30 ms,而且相鄰兩幀之間有1/2或者1/3的重疊區(qū)域,然后加窗。為了使信號(hào)具有連續(xù)性,窗函數(shù)表達(dá)式為

式中,N是漢明窗的長(zhǎng)度。圖2是漢明窗的時(shí)域圖像。

圖2 漢明窗時(shí)域圖

(c)對(duì)分幀和加窗后的各幀信號(hào)進(jìn)行快速傅里葉變換得到其頻譜,再對(duì)信號(hào)頻譜取平方得到語(yǔ)音信號(hào)的功率譜。

(d)將能量譜通過(guò)一組 Mel尺度的三角形濾波器組。Mel頻率尺度上的等距三角形濾波器組對(duì)應(yīng)于Hz頻率上的非等距三角形濾波器組,即Mel濾波器組,其表達(dá)式為

式中,f(m)為濾波器組的中心頻率,間距隨著m值的減小而減小。具體濾波器結(jié)構(gòu)如圖3所示,其作用可以使頻譜平滑并且消除諧波。利用對(duì)數(shù)函數(shù)對(duì)Mel濾波后的能量譜進(jìn)行壓縮,那么得到輸出的對(duì)數(shù)能量為

圖3 梅爾濾波器

(e)對(duì)得到的對(duì)數(shù)能量譜做DCT變換,這是一種用于去相關(guān)語(yǔ)音特征的最佳變換。最后得到L階倒譜系數(shù):

式中,M為梅爾濾波器個(gè)數(shù),L為MFCC特征向量的階數(shù)。一般使用26個(gè)梅爾濾波器,可以得到26個(gè)倒譜系數(shù),取13個(gè)系數(shù)出來(lái)作為所需要的MFCC特征系數(shù)。

標(biāo)準(zhǔn)的MFCC只反映聲信號(hào)的靜態(tài)特性,為了提高分類(lèi)的識(shí)別能力,加入動(dòng)態(tài)特征,也就是靜態(tài)特征的差分譜。聲信號(hào)的一階和二階MFCC特征向量為

式中,d(n)表示第n個(gè)一階差分,c(n)表示第n個(gè)倒譜系數(shù),Q代表倒譜系數(shù)的階數(shù),K代表一階系數(shù)的時(shí)間差。將上述結(jié)果再次迭代這個(gè)公式就可以得到二階差分的特征向量。

2 卷積目標(biāo)分類(lèi)實(shí)現(xiàn)

2.1 CNN模型

CNN與一般的神經(jīng)網(wǎng)絡(luò)相似,都由可學(xué)習(xí)的權(quán)重和偏差的神經(jīng)元組成,但CNN更加注重輸入數(shù)據(jù)的結(jié)構(gòu)。二維圖像包含的特征信息比一維數(shù)據(jù)要多并且隱蔽,使用一般的神經(jīng)網(wǎng)絡(luò)不好處理,CNN可以很好地解決這一問(wèn)題,它能夠從二維圖像中提取輸入數(shù)據(jù)的位移、縮放以及變形的特性。CNN主要由卷積層、激活函數(shù)層、池化層、全連接層等交叉組成前饋神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)如圖4所示。

圖4 CNN流程圖

2.2 CNN分類(lèi)實(shí)現(xiàn)與結(jié)果分析

ShipsEar數(shù)據(jù)庫(kù)為研究人員提供各類(lèi)船舶的聲音記錄和自然背景噪聲,用來(lái)訓(xùn)練船只探測(cè)器和分類(lèi)器、或者監(jiān)測(cè)海上的交通情況。本文選取 A~D四類(lèi)信號(hào),其中A為Motorboat輻射噪聲信號(hào),B為Ocean linear輻射噪聲信號(hào),C為Passenger輻射噪聲信號(hào),D為Natural ambient noise輻射噪聲信號(hào),如表1所示。

表1 數(shù)據(jù)類(lèi)別及其時(shí)長(zhǎng)和文件個(gè)數(shù)

通過(guò)第1節(jié)介紹的梅爾倒譜系數(shù)計(jì)算步驟,實(shí)驗(yàn)采用漢明窗,幀長(zhǎng)為fs/40,幀移為幀長(zhǎng)的一半。計(jì)算得到四類(lèi)不同船只輻射噪聲和自然噪聲的仿真圖如圖5所示。仿真得到A~D四類(lèi)不同艦船輻射噪聲的歸一化26階MFCC系數(shù),其中包含了13階的MFCC系數(shù)、13階的D-MFCC系數(shù)。三維圖中X、Y軸分別代表MFCC系數(shù)的階數(shù)和幀數(shù),Z軸代表MFCC特征系數(shù)。從圖中可知,MFCC系數(shù)特征在 3~17階存在比較大的區(qū)分度,因此將其作為分類(lèi)識(shí)別的有效特征。

圖5 不同船只輻射噪聲和自然噪聲的仿真圖

將上述計(jì)算得到的四類(lèi)樣本數(shù)據(jù)用 CNN神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,樣本數(shù)據(jù)按7:3劃分為訓(xùn)練集和測(cè)試集。本實(shí)驗(yàn)采用VGG網(wǎng)絡(luò)的模式,即在卷積層后加池化層,采用Dropout正則化方法避免網(wǎng)絡(luò)過(guò)擬合,其中keep-prob的值統(tǒng)一設(shè)置為 0.25,在網(wǎng)絡(luò)反向傳播時(shí),采用的是Adam梯度下降優(yōu)化算法,網(wǎng)絡(luò)參數(shù)設(shè)置如表2所示。

表2 CNN網(wǎng)絡(luò)參數(shù)表

實(shí)驗(yàn)采用二進(jìn)制交叉熵作為損失函數(shù):

式中,表示網(wǎng)絡(luò)預(yù)測(cè)輸出,y表示網(wǎng)絡(luò)的真實(shí)樣本值,k表示類(lèi)別數(shù)。epoch設(shè)置為200,CNN預(yù)測(cè)模型某次訓(xùn)練精度和loss值隨epoch的變化如圖6所示。

圖6(a) 訓(xùn)練和測(cè)試準(zhǔn)確率

圖6(b) 訓(xùn)練和測(cè)試損失

從圖6中訓(xùn)練精度、測(cè)試精度和loss值的變化曲線可以看出,epoch從125開(kāi)始時(shí),訓(xùn)練和測(cè)試的loss值基本不變,訓(xùn)練集精度變化緩慢,測(cè)試集精度趨近平衡。通過(guò)圖6~7可以發(fā)現(xiàn),訓(xùn)練集精度穩(wěn)定在93%、測(cè)試集精度穩(wěn)定在91%左右時(shí)有比較好的訓(xùn)練效果。A類(lèi)測(cè)試精度達(dá)到了79%,B類(lèi)測(cè)試精度達(dá)到了94%,C類(lèi)測(cè)試精度達(dá)到了92%,D類(lèi)測(cè)試精度達(dá)到了89%。整體而言,由于訓(xùn)練樣本自身就存在一定的噪聲干擾,并不是純凈的艦船輻射噪聲,所以精度不是特別的高,但四種類(lèi)別的分類(lèi)效果都還不錯(cuò)。

圖7 CNN網(wǎng)絡(luò)的混淆矩陣

2.3 特征維度和特征類(lèi)型影響

對(duì)不同艦船輻射噪聲進(jìn)行分類(lèi),還可以采用信號(hào)各自的LOFAR圖作為神經(jīng)網(wǎng)絡(luò)的輸入。本文用短時(shí)傅里葉變換來(lái)分析艦船輻射噪聲的LOFAR譜圖。對(duì)語(yǔ)音或噪聲信號(hào)處理和識(shí)別時(shí),由于信號(hào)的非平穩(wěn)性,其性質(zhì)隨時(shí)間發(fā)生較明顯的變化,因此不能應(yīng)用通常的傅里葉表示方法。LOFAR 譜圖從時(shí)、頻兩個(gè)角度對(duì)信號(hào)進(jìn)行描述,通過(guò)對(duì)連續(xù)的采樣數(shù)據(jù)作短時(shí)傅里葉變換而構(gòu)成信號(hào)的非平穩(wěn)特性,對(duì)信號(hào)特征提取具有很好的效果。

當(dāng)神經(jīng)網(wǎng)絡(luò)的輸入分別為MFCC和LOFAR特征,并且二者的輸入?yún)?shù)相同時(shí),A~D四類(lèi)艦船輻射噪聲信號(hào)的識(shí)別準(zhǔn)確率如圖8所示。

圖8 LOFAR和MFCC特征輸入網(wǎng)絡(luò)的準(zhǔn)確率

可以看出,當(dāng)輸入?yún)?shù)相同,MFCC作為特征輸入時(shí)的四類(lèi)艦船輻射噪聲識(shí)別準(zhǔn)確率更高,并且網(wǎng)絡(luò)的損失函數(shù)趨于平穩(wěn)的迭代次數(shù)更少,網(wǎng)絡(luò)的訓(xùn)練時(shí)間也相應(yīng)的更少;對(duì)于同一特征(MFCC或LOFAR),輸入?yún)?shù)越少,準(zhǔn)確率越低,隨著輸入?yún)?shù)的增加,神經(jīng)網(wǎng)絡(luò)的優(yōu)勢(shì)體現(xiàn)出來(lái),系統(tǒng)的識(shí)別準(zhǔn)確率慢慢提高,分類(lèi)效果慢慢變好。

由表 3可以看出,信號(hào)同類(lèi)特征(MFCC或LOFAR)不同維度作為輸入,隨著特征維度的增加,網(wǎng)絡(luò)訓(xùn)練參數(shù)能夠更好的表征信號(hào)特征,這能很好地提高網(wǎng)絡(luò)識(shí)別性能。卷積網(wǎng)絡(luò)對(duì)多參數(shù)訓(xùn)練具有很好的優(yōu)勢(shì),通過(guò)每一層卷積核大小和卷積核個(gè)數(shù)可以很好的對(duì)特征進(jìn)行壓縮,防止訓(xùn)練數(shù)據(jù)爆炸,導(dǎo)致網(wǎng)絡(luò)過(guò)擬合現(xiàn)象。對(duì)于 LOFAR特征來(lái)說(shuō),B類(lèi)識(shí)別準(zhǔn)確率提升的比較明顯;對(duì)于MFCC特征來(lái)說(shuō),B、C類(lèi)識(shí)別準(zhǔn)確率提升的比較明顯??傮w來(lái)看,對(duì)于兩種特征,A類(lèi)的識(shí)別率相比于B、C、D類(lèi)來(lái)說(shuō)相對(duì)較低。通過(guò)對(duì)A類(lèi)樣本集分析,發(fā)現(xiàn)樣本間存在明顯差異,訓(xùn)練之后網(wǎng)絡(luò)效果不佳。信號(hào)同一維度不同特征作為輸入,MFCC較LOFAR特征的識(shí)別效果更好,即使是在輸入?yún)?shù)較少的情況下,MFCC也能夠達(dá)到更好的識(shí)別效果。對(duì)于網(wǎng)絡(luò)訓(xùn)練時(shí)間,隨著輸入?yún)?shù)的增加,訓(xùn)練時(shí)間也會(huì)跟著增加,但是當(dāng)LOFAR輸入?yún)?shù)為110×110、MFCC輸入?yún)?shù)為100×100時(shí),網(wǎng)絡(luò)總體識(shí)別率不再提升。如果再增加輸入?yún)?shù),那么只會(huì)增加訓(xùn)練的時(shí)間,識(shí)別效果不會(huì)明顯提升。在相同的輸入特征維度下,雖然LOFAR特征相比MFCC特征需要訓(xùn)練的時(shí)間相對(duì)較少,但是MFCC在參數(shù)較少的情況下也能達(dá)到很好的識(shí)別準(zhǔn)確率。

表3 LOFAR和MFCC特征輸入網(wǎng)絡(luò)的準(zhǔn)確率和訓(xùn)練時(shí)間

3 結(jié)論

艦船輻射噪聲是一種非平穩(wěn)、復(fù)雜的信號(hào),為提高艦船輻射噪聲識(shí)別的準(zhǔn)確率,本文將MFCC和CNN結(jié)合構(gòu)建了一個(gè)水聲信號(hào)卷積分類(lèi)網(wǎng)絡(luò)。該分類(lèi)網(wǎng)絡(luò)通過(guò) MFCC特征提取方法逐幀提取艦船輻射噪聲信號(hào)的梅爾倒譜系數(shù),將提取的梅爾系數(shù)構(gòu)建特征矩陣輸入卷積網(wǎng)絡(luò)中進(jìn)行分類(lèi)。實(shí)驗(yàn)結(jié)果表明,對(duì)于同一種特征,隨著網(wǎng)絡(luò)輸入?yún)?shù)增加,目標(biāo)整體識(shí)別率提高,MFCC特征相比于LOFAR特征具有很好的識(shí)別效果,即使是在輸入?yún)?shù)比較少的情況下,也能達(dá)到90%的整體識(shí)別準(zhǔn)確率。在輸入?yún)?shù)相同的情況下,A~D四類(lèi)的MFCC特征識(shí)別準(zhǔn)確率都高于LOFAR,且MFCC特征的識(shí)別率最高能達(dá)到94%。

猜你喜歡
特征提取濾波器準(zhǔn)確率
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
健康之家(2021年19期)2021-05-23 11:17:39
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報(bào)參考產(chǎn)品質(zhì)量檢驗(yàn)分析
從濾波器理解卷積
電子制作(2019年11期)2019-07-04 00:34:38
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
開(kāi)關(guān)電源EMI濾波器的應(yīng)用方法探討
電子制作(2018年16期)2018-09-26 03:26:50
高速公路車(chē)牌識(shí)別標(biāo)識(shí)站準(zhǔn)確率驗(yàn)證法
Bagging RCSP腦電特征提取算法
基于Canny振蕩抑制準(zhǔn)則的改進(jìn)匹配濾波器
基于TMS320C6678的SAR方位向預(yù)濾波器的并行實(shí)現(xiàn)
开化县| 灵山县| 武隆县| 泸定县| 齐河县| 顺平县| 夹江县| 南部县| 游戏| 胶州市| 车险| 霍州市| 河津市| 库伦旗| 大兴区| 武清区| 正镶白旗| 抚顺县| 五常市| 尚志市| 郑州市| 天长市| 德令哈市| 探索| 石门县| 新平| 钦州市| 昌江| 辽中县| 玉溪市| 靖江市| 涪陵区| 通辽市| 平度市| 波密县| 潞城市| 集安市| 鹰潭市| 东乌珠穆沁旗| 河源市| 孝感市|