国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

水下聲目標(biāo)的梅爾倒譜系數(shù)智能分類方法

2019-05-22 09:39:16張少康田德艷
應(yīng)用聲學(xué) 2019年2期
關(guān)鍵詞:梅爾特征提取分類

張少康 田德艷

(1 海軍潛艇學(xué)院 青島 266000)

(2 青島海洋科學(xué)與技術(shù)試點(diǎn)國(guó)家實(shí)驗(yàn)室 青島 266000)

0 引言

傳統(tǒng)水下聲目標(biāo)識(shí)別分類方法需要人工提取具有可推廣性、泛化能力強(qiáng)的特征數(shù)據(jù),其過程繁瑣復(fù)雜,專業(yè)性強(qiáng),需要人的參與,識(shí)別分類過程具有較強(qiáng)的人機(jī)交互特性。近幾年,隨著浮標(biāo)潛標(biāo)、水下滑翔機(jī)、AUV、UUV 等水下無(wú)人潛航器的發(fā)展,基于水下無(wú)人移動(dòng)平臺(tái)的聲學(xué)探測(cè)體系正在不斷建立完善。水下聲目標(biāo)識(shí)別分類是水聲探測(cè)的“瓶頸”,同時(shí)也是關(guān)鍵技術(shù)之一。未來(lái)水下無(wú)人聲學(xué)探測(cè)預(yù)警體系要求潛航器本身具備水下聲目標(biāo)識(shí)別分類能力,而傳統(tǒng)水下聲目標(biāo)識(shí)別分類方法已無(wú)法滿足此要求,因此研究智能化水下聲目標(biāo)識(shí)別分類方法具有重要意義。

一直以來(lái),特征向量提取方法都是水下聲目標(biāo)識(shí)別分類的研究重點(diǎn),基于聽覺特征的水下聲目標(biāo)特征提取方法是研究熱點(diǎn)之一,其中,基于語(yǔ)音識(shí)別方法提取梅爾倒譜系數(shù)(Mel frequency cepstrum coefficient, MFCC)進(jìn)行水下聲目標(biāo)識(shí)別是常用的方法之一。如文獻(xiàn)[1]介紹了差分梅爾頻率倒譜系數(shù)的概念和相應(yīng)的特征提取方法,對(duì)水下目標(biāo)進(jìn)行了基于MFCC 特征提取方法仿真研究和實(shí)驗(yàn)分析;文獻(xiàn)[2]將MFCC 特征應(yīng)用于船舶和鯨類水下聲信號(hào)的特征提取中,提取了船舶和鯨類聲信號(hào)的MFCC 特征,通過高斯混合模型對(duì)提取的MFCC特征進(jìn)行訓(xùn)練和識(shí)別分類,討論MFCC維數(shù)變化和不同MFCC 特征組合對(duì)識(shí)別分類性能的影響;另外文獻(xiàn)[3–5]也進(jìn)行了MFCC 特征提取相關(guān)方面的研究工作,并取得了一定的研究成果。近幾年來(lái),以深度學(xué)習(xí)為代表的人工智能算法發(fā)展迅速,深度學(xué)習(xí)是人工神經(jīng)網(wǎng)絡(luò)的發(fā)展,于2006年被提出[6],目前已發(fā)展出自編碼器(Auto encode, AE)[7]、深度置信網(wǎng)絡(luò)(Deep belief networks,DBN)[8]、卷積神經(jīng)網(wǎng)絡(luò)(Convolutional neural network,CNN)[9?10]、循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural networks, RNN)[11?13]、生成對(duì)抗網(wǎng)絡(luò)(Generative adversarial network, GAN)[14?15]及其相關(guān)變種等多種模型,在各個(gè)領(lǐng)域得到廣泛的應(yīng)用,其中,長(zhǎng)短時(shí)記憶(Long short-term memory, LSTM)網(wǎng)絡(luò)在語(yǔ)音識(shí)別領(lǐng)域應(yīng)用效果顯著。

深度學(xué)習(xí)具備從大量數(shù)據(jù)中自動(dòng)學(xué)習(xí)特征的能力,但其在水下聲信號(hào)識(shí)別分類領(lǐng)域的應(yīng)用目前還處于起步階段。區(qū)別于語(yǔ)音識(shí)別,水下聲信號(hào)識(shí)別分類具有樣本量少、數(shù)據(jù)獲取困難等特點(diǎn),因此有必要首先對(duì)其進(jìn)行特征提取。從當(dāng)前研究情況來(lái)看,采用MFCC特征提取方法對(duì)水下聲目標(biāo)信號(hào)進(jìn)行特征提取和識(shí)別分類被證明為一種行之有效的手段,但上述方法均采用了傳統(tǒng)的BP 神經(jīng)網(wǎng)絡(luò)或支持向量機(jī)(Support vector regression, SVM)模型作為分類器,相比之下,深度學(xué)習(xí)方法更具有挖掘深層次數(shù)據(jù)特征的能力,并更好地解決了模型訓(xùn)練過程中的梯度彌散和數(shù)據(jù)規(guī)模問題。另外,當(dāng)前研究均針對(duì)水面艦船等有人平臺(tái)的水聲目標(biāo)識(shí)別分類問題,而非未來(lái)水下無(wú)人平臺(tái)。

未來(lái)水下無(wú)人平臺(tái)進(jìn)行水下目標(biāo)識(shí)別分類的主要任務(wù)是能夠正確區(qū)分水面、水下兩類目標(biāo)。因此,本文以此為研究目的,通過對(duì)水上、水下兩類水聲目標(biāo)信號(hào)進(jìn)行分析,提取MFCC 特征向量,作為樣本有監(jiān)督預(yù)訓(xùn)練長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)模型,采用訓(xùn)練好的分類模型,對(duì)實(shí)際水聲信號(hào)進(jìn)行預(yù)測(cè)分類,驗(yàn)證了模型的有效性。

1 MFCC水下聲目標(biāo)特征提取與智能識(shí)別分類

1.1 MFCC水下聲目標(biāo)特征提取

MFCC 特征提取最早應(yīng)用于語(yǔ)音識(shí)別,是一種有效的特征提取方法,其特征提取過程如圖1所示[1]。

圖1 MFCC 特征提取過程Fig.1 Feature extraction process of MFCC

(1)分幀

分幀是語(yǔ)音信號(hào)分析中常用的處理過程,由于目標(biāo)噪聲信號(hào)本質(zhì)上是非平穩(wěn)過程,具有時(shí)變特性,因此通常對(duì)信號(hào)作分幀處理進(jìn)行短時(shí)分析,提取幀特征參數(shù),最后由若干幀特征參數(shù)共同組成訓(xùn)練樣本特征向量。為保持每幀信號(hào)之間的連續(xù)性,幀與幀之間存在交疊,稱為“幀移”,本文每幀長(zhǎng)度取25 ms,幀移取10 ms。

(2)求能量譜

通過快速傅里葉變換得到幀信號(hào)頻譜,進(jìn)而得到信號(hào)能量譜,其公式可表述為

其中,x(n)為輸入幀信號(hào),X(f)為輸入幀信號(hào)頻譜。

(3)濾波

將求得的能量譜通過梅爾濾波器組,其公式可表述為

其中,N為各幀信號(hào)總點(diǎn)數(shù),Hm(f)梅爾濾波器組系數(shù)。

(4)對(duì)數(shù)運(yùn)算

將濾波后的能量譜作對(duì)數(shù)運(yùn)算,其公式可表述為

(5)求倒譜

將上述對(duì)數(shù)能量譜求離散余弦變換,即可得到MFCC參數(shù),其公式表述如下:

其中,n=1,2,··· ,p,p為MFCC階數(shù),M為濾波器個(gè)數(shù)。

通常MFCC參數(shù)只表述信號(hào)的靜態(tài)特征,而差分梅爾頻率倒譜系數(shù)則表征信號(hào)的動(dòng)態(tài)特征。一階差分及二階差分梅爾倒譜系數(shù)計(jì)算過程分別如下所示:

其中,C(n)為第n幀MFCC 系數(shù),D(n)為第n幀一階差分梅爾頻率倒譜系數(shù),D′(n)為第n幀二階差分梅爾頻率倒譜系數(shù)。上述三者共同構(gòu)成幀特征向量,即

1.2 長(zhǎng)短時(shí)記憶(LSTM)模型

圖2 LSTM 基本結(jié)構(gòu)單元Fig.2 Basic structural unit of LSTM

長(zhǎng)短時(shí)記憶(LSTM)網(wǎng)絡(luò)[12]是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)的改進(jìn)形式,其基本單元被稱為記憶塊,由一個(gè)中心節(jié)點(diǎn)和3個(gè)門控單元組成。中心節(jié)點(diǎn)通常被稱為記憶細(xì)胞,用以存儲(chǔ)當(dāng)前網(wǎng)絡(luò)狀態(tài),3 個(gè)門控單元分別被稱作輸入門、輸出門和遺忘門,用以控制記憶塊內(nèi)的信息流動(dòng)。在前向傳播過程中,輸入門用以控制輸入到記憶細(xì)胞的信息流,輸出門用以控制記憶細(xì)胞到網(wǎng)絡(luò)其他結(jié)構(gòu)單元的信息流;在反向傳播過程中,輸入門用以控制迭代誤差流出記憶細(xì)胞,輸出門用以控制迭代誤差流入記憶細(xì)胞。而遺忘門則用以控制記憶細(xì)胞內(nèi)部的循環(huán)狀態(tài),決定信息的取舍或遺忘。通過這種門控機(jī)制,LSTM網(wǎng)絡(luò)得以控制單元內(nèi)的信息流動(dòng),使其具備了保存長(zhǎng)時(shí)間信息的能力,即“記憶”能力,并使其在訓(xùn)練過程中能夠防止內(nèi)部梯度受外部干擾,避免了梯度彌散和梯度爆炸問題,其基本結(jié)構(gòu)單元如圖2所示[16]。

設(shè)單個(gè)LSTM記憶塊的輸入向量為xt,輸出向量為yt,前向傳播公式可表述為[17]

(1)長(zhǎng)期記憶單元Ct更新過程

其中,ft代表遺忘門,it代表輸入門。在每一個(gè)時(shí)刻,遺忘門會(huì)控制上一時(shí)刻記憶的遺忘程度,而輸入門則控制新記憶寫入長(zhǎng)期記憶的程度。ft、it、都是與上一時(shí)刻的短期記憶ht?1和當(dāng)前時(shí)刻輸入xt相關(guān)的函數(shù),其中,σ是sigmoid 函數(shù),取值范圍[0,1],tanh 函數(shù)取值范圍[?1,1]。另外,式(8)~(10)中Wf、Wi、Wc分別為遺忘門、輸入門及Ct更新過程的權(quán)重參數(shù),bf、bi、bc分別為這三個(gè)過程對(duì)應(yīng)的偏置參數(shù)。

(2)短期記憶單元ht更新過程

其中,ot表示輸出門,控制著短期記憶如何受長(zhǎng)期記憶影響,式(12)~(13)中Wo、bo分別為輸出門的權(quán)重和偏置參數(shù)。

1.3 MFCC特征智能識(shí)別分類

由于門控機(jī)制的作用,使LSTM 細(xì)胞單元具備“記憶”能力,因此常被用來(lái)處理帶有時(shí)間序列性質(zhì)的問題,如語(yǔ)音識(shí)別、自然語(yǔ)言處理等。水下聲目標(biāo)信號(hào)同樣帶有時(shí)間序列特性,另外,經(jīng)分幀處理獲取的MFCC 特征數(shù)據(jù)之間存在時(shí)空連續(xù)性。因此,本文將獲取的噪聲信號(hào)MFCC 特征數(shù)據(jù)作為L(zhǎng)STM輸入向量,通過有監(jiān)督預(yù)訓(xùn)練LSTM 模型,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解并保存,用以對(duì)未知類別噪聲信號(hào)進(jìn)行識(shí)別分類,其流程圖如圖3所示。

圖3 MFCC 智能識(shí)別分類流程圖Fig.3 Intelligent recognition process of MFCC

對(duì)水下聲目標(biāo)信號(hào)樣本作分幀處理,依據(jù)公式(1)~(7)MFCC 特征提取過程,獲取各幀包含36個(gè)特征參數(shù)的MFCC 特征向量Tn,這36 個(gè)特征參數(shù)由12 個(gè)MFCC 參數(shù)、12 個(gè)一階差分梅爾頻率倒譜系數(shù)和12 個(gè)二階差分梅爾頻率倒譜系數(shù)共同組成;按各幀時(shí)間先后順序,生成各樣本MFCC 特征數(shù)據(jù)D作為L(zhǎng)STM網(wǎng)絡(luò)輸入向量,

其中,m為幀數(shù)。

基于MFCC 特征的智能識(shí)別分類方法主要包括數(shù)據(jù)預(yù)處理、模型訓(xùn)練、預(yù)測(cè)分類幾個(gè)功能模塊。

通過前期數(shù)據(jù)預(yù)處理過程,獲取目標(biāo)噪聲的MFCC 特征向量,采用基于時(shí)間的反向傳播(Back propagation trough time, BPTT)算法,對(duì)LSTM網(wǎng)絡(luò)展開訓(xùn)練,通過逐步減小模型輸出與理論輸出誤差,得到網(wǎng)絡(luò)模型參數(shù)最優(yōu)解,最終訓(xùn)練好的網(wǎng)絡(luò)模型可用于對(duì)未知目標(biāo)噪聲的識(shí)別分類。該識(shí)別分類過程全程不需要人的參與,通過對(duì)水下無(wú)人平臺(tái)加裝具備MFCC 特征提取及LSTM 識(shí)別分類能力的信號(hào)處理設(shè)備,將聲學(xué)傳感器實(shí)時(shí)獲取的水下聲信號(hào)進(jìn)行MFCC 特征提取,獲取初始特征向量,作為L(zhǎng)STM 預(yù)測(cè)分類模型的輸入,經(jīng)模型的預(yù)測(cè)分類過程,可實(shí)時(shí)獲取所探測(cè)目標(biāo)的類別屬性。

2 模型驗(yàn)證

為驗(yàn)證上述模型的有效性,本文使用實(shí)際水下聲目標(biāo)信號(hào)進(jìn)行了驗(yàn)證。其中,訓(xùn)練樣本時(shí)長(zhǎng)為1 s,經(jīng)分幀后獲取MFCC特征參數(shù)維數(shù)為3861,幀長(zhǎng)設(shè)置為25 ms,幀移為10 ms。本文僅針對(duì)水面、水下兩類目標(biāo)進(jìn)行分類,屬于二分類問題,深度學(xué)習(xí)模型采用LSTM 網(wǎng)絡(luò),其相關(guān)參數(shù)設(shè)置如表1所示。

表1 網(wǎng)絡(luò)相關(guān)參數(shù)Table1 Related parameters of the network

圖4 訓(xùn)練數(shù)據(jù)分類效果圖Fig.4 Classification of Training data

模型訓(xùn)練數(shù)據(jù)庫(kù)包含各種已知類別的艦船輻射噪聲數(shù)據(jù)近1600條,按1 s 時(shí)長(zhǎng)進(jìn)行處理,MFCC特征數(shù)據(jù)作為L(zhǎng)STM 識(shí)別分類模型的樣本庫(kù)數(shù)據(jù),樣本總數(shù)為65284,其中水面目標(biāo)樣本數(shù)42375,水下目標(biāo)樣本數(shù)22909。為驗(yàn)證模型的有效性,避免因單次結(jié)果導(dǎo)致的錯(cuò)誤結(jié)論,本文采用交叉驗(yàn)證的方式獲取訓(xùn)練樣本集,即從樣本庫(kù)中隨機(jī)選取一定比例樣本生成多組訓(xùn)練集,通過綜合分析多組訓(xùn)練集條件下的模型結(jié)果得到可靠結(jié)論,本文該比例為4/5。同時(shí),為避免訓(xùn)練樣本出現(xiàn)有偏性估計(jì)問題,在抽取訓(xùn)練樣本時(shí),兩類目標(biāo)訓(xùn)練樣本數(shù)同樣滿足此比例,即隨機(jī)抽取水面目標(biāo)、水下目標(biāo)各4/5的樣本組成訓(xùn)練集,最終測(cè)試結(jié)果如表2所示。圖4為模型訓(xùn)練完成后,各組訓(xùn)練數(shù)據(jù)分類效果圖。

表2 測(cè)試結(jié)果Table2 Test results

由上述結(jié)果可以看出,該水下目標(biāo)識(shí)別分類方法在本文所采用幾組測(cè)試集條件下,對(duì)水面目標(biāo)的識(shí)別分類正確率在86%以上,對(duì)水下目標(biāo)的識(shí)別分類正確率在87%以上,說(shuō)明本文提出的基于MFCC的水下目標(biāo)識(shí)別分類方法是可行的。另外,識(shí)別分類過程僅需要輸入水下聲目標(biāo)聲壓數(shù)據(jù),其間數(shù)據(jù)處理、分類識(shí)別都不經(jīng)人工干預(yù),因此該方法可應(yīng)用于水下無(wú)人平臺(tái)對(duì)水下目標(biāo)進(jìn)行智能化識(shí)別分類。

3 結(jié)論

本文針對(duì)未來(lái)水下無(wú)人平臺(tái)智能化識(shí)別分類水下目標(biāo)的需求,提出了一種基于梅爾倒譜系數(shù)特征和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的水下聲目標(biāo)智能識(shí)別分類方法,該方法通過提取水下聲目標(biāo)的MFCC特征系數(shù)作為深度學(xué)習(xí)模型輸入向量,有監(jiān)督訓(xùn)練LSTM模型,以實(shí)現(xiàn)對(duì)未知目標(biāo)噪聲進(jìn)行識(shí)別分類。經(jīng)驗(yàn)證表明,該模型能夠有效地區(qū)分水面和水下兩類目標(biāo),且具備一定的智能識(shí)別分類能力。

猜你喜歡
梅爾特征提取分類
基于梅爾頻譜分離和LSCNet的聲學(xué)場(chǎng)景分類方法
分類算一算
分類討論求坐標(biāo)
女詩(shī)人梅爾詩(shī)集《十二背后》三人談
基于Daubechies(dbN)的飛行器音頻特征提取
電子制作(2018年19期)2018-11-14 02:37:08
數(shù)據(jù)分析中的分類討論
教你一招:數(shù)的分類
Bagging RCSP腦電特征提取算法
基于MED和循環(huán)域解調(diào)的多故障特征提取
盲人探險(xiǎn)家觸摸世界之巔
黨員文摘(2014年10期)2014-10-14 23:50:35
安陆市| 远安县| 桦甸市| 壤塘县| 双流县| 景德镇市| 苏州市| 汪清县| 仲巴县| 清丰县| 衢州市| 和田县| 广饶县| 阳春市| 吉木萨尔县| 恩施市| 南江县| 盐津县| 寿阳县| 祁门县| 通州市| 池州市| 揭西县| 镇平县| 成武县| 霍邱县| 若羌县| 宜都市| 山西省| 陆良县| 苏州市| 绥江县| 乌海市| 梧州市| 曲沃县| 重庆市| 合川市| 噶尔县| 赫章县| 墨脱县| 贺兰县|