国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MATLAB鳥(niǎo)叫聲特征提取方法的研究

2013-03-30 08:59戴天虹
森林工程 2013年2期
關(guān)鍵詞:鳥(niǎo)叫聲特征參數(shù)特征提取

戴天虹,李 野,孫 鵬

(東北林業(yè)大學(xué)機(jī)電工程學(xué)院,哈爾濱150040)

對(duì)鳥(niǎo)叫聲的研究涉及鳥(niǎo)類(lèi)行為學(xué)和聲學(xué),它們相互交叉相互滲透,使之成為了一門(mén)新的邊緣學(xué)科[1]。而且鳥(niǎo)叫聲作為鳥(niǎo)類(lèi)重要的生物學(xué)特征之一,相關(guān)研究人員早在上世紀(jì)30年代的時(shí)候已經(jīng)開(kāi)展了相關(guān)研究工作,截止到目前為止,全世界絕大部分鳥(niǎo)類(lèi)已被錄到叫聲。在對(duì)鳥(niǎo)叫聲進(jìn)行研究時(shí),需要從已得到的鳥(niǎo)叫聲的信號(hào)波形中提取多個(gè)特征參數(shù)[2],為后續(xù)研究工作提供可靠數(shù)據(jù),而本文主要介紹了如何利用MATLAB對(duì)鳥(niǎo)叫聲提取特征參數(shù)。

1 鳥(niǎo)叫聲的聲學(xué)特征

描述鳥(niǎo)叫聲的聲學(xué)形狀的主要參數(shù)及定義如下:音節(jié)庫(kù)的數(shù)量的多少及其組成,能夠反映音節(jié)時(shí)間特征的音節(jié)聲長(zhǎng),間歇,相對(duì)幅值,在所有音節(jié)中能量最高且具有一定帶寬的基本音,其個(gè)數(shù)可以體現(xiàn)出鳥(niǎo)叫聲的婉轉(zhuǎn)程度且作為一個(gè)音節(jié)中在基本音頻率之上成分的陪音。在周期性震蕩中,其頻率等于基頻整數(shù)倍的正弦量諧波,脈沖持續(xù)時(shí)間。每個(gè)音節(jié)的脈沖個(gè)數(shù),脈沖間隔時(shí)間,頻率范圍,包括很多不同頻率成分的復(fù)信號(hào)中主頻率,主頻最大值等[3]。

可以把鳥(niǎo)叫聲分解為一系列連續(xù)的正弦波,這個(gè)正弦波是一個(gè)復(fù)雜的周期函數(shù),把它看成是許多不同頻率的簡(jiǎn)諧振動(dòng)的疊加,進(jìn)而進(jìn)行傅里葉變化。

2 鳥(niǎo)叫聲的特征提取

2.1 預(yù)處理

為了更好地對(duì)語(yǔ)音信號(hào)的進(jìn)行特征提取,預(yù)處理是它能夠獲得成功的重要保障。本文使用Matlab對(duì)鷺鷥叫聲進(jìn)行了特征提取,得到如圖1~圖5所示的實(shí)驗(yàn)數(shù)據(jù)。

圖1 原始語(yǔ)音信號(hào)Fig.1 Original speech signal

圖2 鳥(niǎo)鳴叫聲的語(yǔ)音圖譜Fig.2 A bird singing map

圖3 語(yǔ)音信號(hào)的頻率響應(yīng)圖Fig.3 Frequency response chart of speech signal

圖4 鳥(niǎo)叫聲的功率譜Fig.4 Birds singing power spectrum

2.2 去噪

在鳥(niǎo)叫聲的采集過(guò)程中,難免會(huì)有噪聲的干擾,為了能更好的對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,本實(shí)驗(yàn)采用了小波去噪[4],可以直接采用Matlab語(yǔ)音信號(hào)工具箱中自帶的函數(shù)進(jìn)行去噪,結(jié)果如圖5所示。

圖5 鳥(niǎo)叫聲去噪處理結(jié)果Fig.5 Denoising processing results of a bird singing

2.3 預(yù)加重

對(duì)輸入的鳥(niǎo)叫聲信號(hào)進(jìn)行預(yù)加重是為了對(duì)叫聲信號(hào)中的高頻部分進(jìn)行加重,去除口唇輻射對(duì)信號(hào)的影響,令語(yǔ)音信號(hào)的高頻分辨率得到改善,如圖6所示。

圖6 鳥(niǎo)叫聲的預(yù)加重Fig.6 Pre-emphasis of a bird sing

由圖6可知,對(duì)鳥(niǎo)叫聲信號(hào)進(jìn)行了預(yù)加重處理,有效的濾除了低頻干擾部分,提高了語(yǔ)音高頻頻譜的識(shí)別,以遍更好的對(duì)語(yǔ)音信號(hào)進(jìn)行處理。

2.4 加窗分幀

語(yǔ)音信號(hào)是一種隨時(shí)間而變化的信號(hào),而且鳥(niǎo)叫聲復(fù)雜多樣,其叫聲波形里包含了各種不同的事件,這種波形在時(shí)域的變化同時(shí)意味著頻譜特征隨時(shí)間而進(jìn)行較大幅度變化。加窗函數(shù)為Hanning窗函數(shù),寬度為256,重疊點(diǎn)數(shù)為200。

聲音信號(hào)雖然是非線性時(shí)變信號(hào),但是它同時(shí)具有短時(shí)平穩(wěn)的特點(diǎn),所以對(duì)其進(jìn)行分幀可以提取它的這種特性。

2.5 端點(diǎn)檢測(cè)

端點(diǎn)檢測(cè)的目的是為了能夠在實(shí)時(shí)輸入的聲音信號(hào)中區(qū)分背景噪聲和環(huán)境噪聲,更加準(zhǔn)確地判斷出聲音信號(hào)的起止點(diǎn)。端點(diǎn)檢測(cè)需要由特定的算法自動(dòng)完成。常用的算法是由語(yǔ)音能量和過(guò)零率組合的雙門(mén)限法、由短時(shí)能量和過(guò)零率的乘積構(gòu)成的能頻值法。

3 提取特征的方法

語(yǔ)音信號(hào)經(jīng)過(guò)上面所介紹的預(yù)處理后,將進(jìn)行語(yǔ)音識(shí)別中的一個(gè)非常重要環(huán)節(jié)——特征參數(shù)的提取。選擇良好的特征參數(shù)不僅可以很好地反應(yīng)語(yǔ)音特征,而且計(jì)算更方便,這對(duì)系統(tǒng)的實(shí)現(xiàn)非常重要。

3.1 線性預(yù)測(cè)系數(shù)

目前為止,應(yīng)用最廣泛的特征參數(shù)提取技術(shù)是線性預(yù)測(cè) (Linear Prediction)分析技術(shù),許多成功的應(yīng)用系統(tǒng)都是基于該技術(shù)提取的倒譜參數(shù)。但是該方法采用的是純數(shù)學(xué)模型,并沒(méi)有考慮人類(lèi)聽(tīng)覺(jué)系統(tǒng)對(duì)語(yǔ)音的處理特點(diǎn)。本文中將鳥(niǎo)叫聲信號(hào)看作一個(gè)輸入序列激勵(lì)一個(gè)全極點(diǎn)的系統(tǒng)模型而產(chǎn)生的輸出。其中系統(tǒng)的傳遞函數(shù)為:

式中:G為增益常數(shù);ai為實(shí)數(shù);P為模型參數(shù)。

利用公式中的 {ai}可以定義一個(gè)P階線性預(yù)測(cè)器,即可以利用鳥(niǎo)叫聲的前P個(gè)樣本來(lái)預(yù)測(cè)當(dāng)前樣本得到公式 (2)的預(yù)測(cè)值[5]。

式中:{ai}為線性預(yù)測(cè)系數(shù) (LPC)。

3.2 Mel頻率倒譜系數(shù) (Mel Frequency Cepstrum Coefficient,MFCC)

Mel頻率依據(jù)人耳的聽(tīng)覺(jué)特性,并與Hz頻率成非線性的對(duì)應(yīng)關(guān)系。Mel頻率根據(jù)它們之間的這種關(guān)系,通過(guò)計(jì)算得到的Hz頻譜特征。MFCC參數(shù)也是以人的聽(tīng)覺(jué)特性為依據(jù),因此具有較好的魯棒性。在鳥(niǎo)叫聲的頻譜范圍內(nèi),可以設(shè)置若干個(gè)帶通濾波器,每個(gè)濾波器都具有三角形或正弦形的濾波特性,然后使鳥(niǎo)叫聲的能量譜通過(guò)該濾波器組,這樣可以求出每個(gè)濾波器的輸出,對(duì)其取對(duì)數(shù),并作DCT變換,所得結(jié)果就是MFCC系數(shù)[6]。

求解MFCC如公式 (3)所示。

式中:x(k)為語(yǔ)音信號(hào)經(jīng)DFT變換結(jié)果;M為濾波器個(gè)數(shù)。

得到MFCC系數(shù)的具體步驟如圖7所示。

圖7 計(jì)算MFCC系數(shù)的具體步驟Fig.7 The specific steps of calculating MFCC coefficient

4 軟件實(shí)現(xiàn)

本文使用MATLAB中的GUI界面設(shè)計(jì)設(shè)計(jì)了一款軟件,可以實(shí)現(xiàn)上文所描述的對(duì)鳥(niǎo)叫聲特征進(jìn)行提取處理并得到上述結(jié)論。界面如圖8所示。

圖8 鳥(niǎo)叫聲軟件截圖Fig.8 The screenshot of a bird singing software

5 結(jié)論與討論

對(duì)鳥(niǎo)叫聲進(jìn)行相應(yīng)的特征提取是鳥(niǎo)叫聲研究的基礎(chǔ)。對(duì)鳥(niǎo)叫聲進(jìn)行FFT變換的基礎(chǔ)上,對(duì)鳥(niǎo)叫聲進(jìn)行了LPC線性預(yù)測(cè)和MFCC系數(shù)分析。

本文中討論所設(shè)計(jì)一款軟件實(shí)現(xiàn)了對(duì)鳥(niǎo)叫聲的特征提取,為鳥(niǎo)叫聲更廣泛的應(yīng)用提供了一定的技術(shù)保證。并可以在以下方面可以得到良好的應(yīng)用。

(1)根據(jù)對(duì)不同地區(qū)的鳥(niǎo)類(lèi)叫聲進(jìn)行分析和判別,可以得出該地區(qū)的鳥(niǎo)類(lèi)物種及群落的分布特點(diǎn),方便相關(guān)專家作更全面的調(diào)查研究,并對(duì)該地區(qū)的鳥(niǎo)類(lèi)展開(kāi)遺傳學(xué)、行為生態(tài)學(xué)、種群生態(tài)學(xué)等多個(gè)方面的研究,并且分析它們對(duì)棲息地的選取及該棲息地對(duì)種群的影響。

(2)自古以來(lái),大部分的鳥(niǎo)類(lèi)都存在遷徙的習(xí)性,而遷徙是鳥(niǎo)類(lèi)整個(gè)生命周期中風(fēng)險(xiǎn)系數(shù)最高的行為,受到體能、天敵等各種各樣因素的制約,而且人類(lèi)的越來(lái)越多的活動(dòng)常常會(huì)有意無(wú)意地破壞了鳥(niǎo)類(lèi)遷徙的補(bǔ)給站點(diǎn),為它們的遷徙帶來(lái)了更大的困難,有時(shí)甚至對(duì)一些物種的存續(xù)產(chǎn)生非常嚴(yán)重的影響。針對(duì)旅鳥(niǎo)物種較為豐富的現(xiàn)象,定期的對(duì)各地鳥(niǎo)類(lèi)分布進(jìn)行匯總,以確定該地是否為旅鳥(niǎo)(特別是水鳥(niǎo))遷徙的重要“中轉(zhuǎn)站”,并根據(jù)對(duì)應(yīng)情況制定相應(yīng)的保護(hù)方案具有十分重要的現(xiàn)實(shí)意義[7]。

(3)目前全國(guó)多處地方出現(xiàn)鳥(niǎo)群對(duì)建筑物、飛機(jī)等進(jìn)行撞擊,這種情況的發(fā)生使鳥(niǎo)擊防災(zāi)成為了一門(mén)新興的學(xué)科,所以系統(tǒng)的掌握鳥(niǎo)類(lèi)生態(tài)習(xí)性和治理方法,對(duì)鳥(niǎo)擊災(zāi)害的減控具有十分重要的現(xiàn)實(shí)意義[8]。

但是在實(shí)際的生活中,還要克服各種各樣的困難,首先鳥(niǎo)叫聲相當(dāng),在不同環(huán)境下、不同條件下鳥(niǎo)類(lèi)叫聲有很大的區(qū)別,例如高興、傷痛、求偶、進(jìn)食、入侵、防御、飛行和營(yíng)巢時(shí)鳥(niǎo)類(lèi)都會(huì)發(fā)出不同的叫聲,因此想要獲取純粹不摻雜噪音的自然鳥(niǎo)叫聲比較困難,其次所得到的鳥(niǎo)叫聲聲源的質(zhì)量和數(shù)量對(duì)鳥(niǎo)叫聲特征提取的可靠性影響比較大,這一方面的的工作還需研究[9]。

本文通過(guò)使用軟件MATLAB2010a對(duì)鳥(niǎo)叫聲進(jìn)行預(yù)處理、LPC分析和MFCC分析等方法提取了鳥(niǎo)叫聲的特征參數(shù),為鳥(niǎo)叫聲的識(shí)別和鳥(niǎo)叫聲與鳥(niǎo)類(lèi)行為學(xué)的相關(guān)研究提供了一定的聲學(xué)依據(jù)。但是在實(shí)際應(yīng)用中還會(huì)遇到各種各樣的問(wèn)題,例如采集環(huán)境和采集設(shè)備的選擇、背景噪聲、多個(gè)鳥(niǎo)叫聲混合等,這還需要進(jìn)一步研究。

[1]雷富民.鳥(niǎo)類(lèi)鳴聲結(jié)構(gòu)地理變異及其分類(lèi)學(xué)意義[J].動(dòng)物分類(lèi)學(xué)報(bào),1999,24(2):232 -240.

[2] Weary D M,Norris K J,F(xiàn)alls J B.Song features birds use to identify individuals[J].The Auk,1990,107:623-625.

[3]偉利國(guó),張小超,吳文彪.鳥(niǎo)鳴叫聲特征提取方法的研究[J].遼寧師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2010,33(1):108-111.

[4]劉保住.Matlab7.0從入門(mén)到精通[M].北京:人民郵電出版社,2006.

[5]李宏松,蘇健民,黃英來(lái),等.基于聲音信號(hào)的特征提取方法的研究[J].信息技術(shù),2006,1(1):91 -94.

[6]李亞微,郭 敏,任建設(shè),等.基于小波分析的朱鹮聲信號(hào)預(yù)處理研究[J].數(shù)字信號(hào)處理,2007,31(10):68 -70.

[7]朱文琰,孫 平,王占彬,等.機(jī)場(chǎng)鳥(niǎo)害防治的生態(tài)學(xué)措施[J].生態(tài)經(jīng)濟(jì),2007,2(1):148 -149.

[8]雷富民,王 鋼,尹祚華.鳥(niǎo)類(lèi)鳴唱的復(fù)雜性和多樣性[J].動(dòng)物分類(lèi)學(xué)報(bào),2003,28(1):163 -171.

[9] 蘇 秀,朱 曦.鳥(niǎo)聲研究進(jìn)展[J].浙江林學(xué)院學(xué)報(bào),2006,23(3):323-327.

猜你喜歡
鳥(niǎo)叫聲特征參數(shù)特征提取
聲壓級(jí)大小對(duì)鳥(niǎo)叫聲和流水聲恢復(fù)性效應(yīng)的影響
故障診斷中信號(hào)特征參數(shù)擇取方法
基于特征參數(shù)化的木工CAD/CAM系統(tǒng)
我多想把那束光藏匿起來(lái)
基于Daubechies(dbN)的飛行器音頻特征提取
I’ve Never Thought
基于PSO-VMD的齒輪特征參數(shù)提取方法研究
鳥(niǎo)
Bagging RCSP腦電特征提取算法
統(tǒng)計(jì)特征參數(shù)及多分類(lèi)SVM的局部放電類(lèi)型識(shí)別