趙 發(fā),孫瑞霞
(安徽工程大學(xué)電氣工程學(xué)院,安徽 蕪湖 241000)
基音檢測(cè)是指對(duì)語(yǔ)音信號(hào)基因周期或頻率的這一特征的檢測(cè)[1]699,在語(yǔ)音識(shí)別、語(yǔ)音編碼、語(yǔ)音合成等語(yǔ)音應(yīng)用方面具有非常重要的作用[2]223。目前基音檢測(cè)存在的主要問(wèn)題是,當(dāng)受噪聲影響時(shí),帶噪語(yǔ)音信號(hào)的信噪比急劇下降,從而導(dǎo)致基音檢測(cè)準(zhǔn)確度降低[3-4]163。針對(duì)此問(wèn)題,目前國(guó)內(nèi)外采用的方法主要有兩類:直接法和間接法。其中,直接法是指對(duì)帶噪語(yǔ)音信號(hào)直接利用相關(guān)算法進(jìn)行基音檢測(cè);如文獻(xiàn)[2]223提出一種新的基于經(jīng)驗(yàn)?zāi)J椒纸獾钠骄群瘮?shù)與自相關(guān)函數(shù)加權(quán)的基音檢測(cè)算法。文獻(xiàn)[3]163提出的類諧波積譜基音周期檢測(cè)算法。間接法是指對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行減噪處理,然后再進(jìn)行基音檢測(cè)。如文獻(xiàn)[1]700通過(guò)基于聽(tīng)覺(jué)掩蔽的多頻帶譜減的方法對(duì)帶噪的語(yǔ)音信號(hào)進(jìn)行語(yǔ)音增強(qiáng),再利用能零積和能零比的多門(mén)限法對(duì)其進(jìn)行基音檢測(cè)。直接法由于對(duì)噪聲不進(jìn)行預(yù)處理,所以對(duì)基音檢測(cè)的準(zhǔn)確度提高有限。間接法采用譜減法對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行減噪處理,但由于譜減法算法具有自身的局限性,對(duì)平穩(wěn)的信號(hào)譜減效果較好,而語(yǔ)音信號(hào)具有一定的非平穩(wěn)性,所以用譜減法就會(huì)產(chǎn)生一定的檢測(cè)誤差?;谏厦娴姆治?,本文利用小波變換在非平穩(wěn)信號(hào)中的有效應(yīng)用,提出一種基于小波減噪[5-7]和改進(jìn)自相關(guān)函數(shù)的基音檢測(cè)算法,該算法通過(guò)小波變換來(lái)對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行減噪,然后再進(jìn)行改進(jìn)的自相關(guān)函數(shù)來(lái)進(jìn)行基音檢測(cè)。
小波減噪是利用噪聲與語(yǔ)音信號(hào)的特征區(qū)別,首先將噪聲和語(yǔ)音信號(hào)變換到小波域后,然后將噪聲對(duì)應(yīng)頻帶的小波系數(shù)置零,利用語(yǔ)音信號(hào)的小波系數(shù)進(jìn)行重構(gòu)還原語(yǔ)音信號(hào),從而達(dá)到減噪的目的。
設(shè)語(yǔ)音信號(hào)表達(dá)式為s(t),噪聲信號(hào)表達(dá)式為n(t),帶噪語(yǔ)音信號(hào)為兩種的疊加信號(hào)f(t),即
f(t)=s(t)+n(t)
(1)
然后對(duì)此帶噪語(yǔ)音信號(hào)進(jìn)行離散小波變換
(2)
(3)
小波語(yǔ)音減噪的原理框圖如圖1所示。
圖1 小波語(yǔ)音減噪原理框圖
設(shè)語(yǔ)音信號(hào)的時(shí)間序列為x(n),加窗分幀處理后得到的第i幀語(yǔ)音信號(hào)為xi(m),下標(biāo)i表示第i幀,設(shè)每幀幀長(zhǎng)為N,xi(m)的短時(shí)自相關(guān)函數(shù)[8]定義為
(4)
式中:τ是時(shí)間的延遲量。
語(yǔ)音信號(hào)可以看做是濁音與清音的結(jié)合,因?yàn)闈嵋艟哂袦?zhǔn)周期性,而清音不具有周期性,可以利用求自相關(guān)把濁音的周期檢測(cè)出來(lái),檢測(cè)出的濁音周期可以看做是語(yǔ)音信號(hào)的基音周期[9]。通過(guò)計(jì)算原始語(yǔ)音信號(hào)和延遲τ后的語(yǔ)音信號(hào)之間的自相關(guān)函數(shù),如果R(τ) 具有最大值,則τ即為信號(hào)的基音周期。圖2為一幀語(yǔ)音信號(hào)波形以及對(duì)應(yīng)的歸一化自相關(guān)函數(shù)波形,從圖中可以看出,當(dāng)τ=0 時(shí),歸一化自相關(guān)函數(shù)具有最大值為1,τ≠0時(shí),幅值都小于1。在一幀語(yǔ)音的歸一化自相關(guān)函數(shù)計(jì)算中有一個(gè)最大值,所以當(dāng)對(duì)一個(gè)語(yǔ)音信號(hào)求基音周期時(shí),統(tǒng)計(jì)幀與幀之間的最大峰值之間的延遲距離即為基音周期,但需注意圖2中歸一化函數(shù)延遲量是以樣點(diǎn)數(shù)為單位,當(dāng)采樣頻率為fs時(shí),每個(gè)樣點(diǎn)的延遲量為1/fs,可由此把延遲樣點(diǎn)數(shù)換算為時(shí)間。
樣點(diǎn)數(shù)/個(gè)(a)一帖語(yǔ)音信號(hào)波形
樣點(diǎn)數(shù)/個(gè)(b)歸一化自相關(guān)函數(shù)圖2 一幀語(yǔ)音信號(hào)波形與相應(yīng)的歸一化自相關(guān)函數(shù)
用自相關(guān)函數(shù)進(jìn)行基音檢測(cè)[10-11]也存在問(wèn)題,如聲道響應(yīng)[12]問(wèn)題,利用自相關(guān)進(jìn)行計(jì)算時(shí),由于聲道的阻尼振蕩,會(huì)造成計(jì)算出的有一定幅度值的數(shù)據(jù)太多,從而影響正確選擇出由基因周期而計(jì)算出的幅度值。所以在進(jìn)行自相關(guān)計(jì)算前要對(duì)信號(hào)進(jìn)行預(yù)處理。目前,最常用的改進(jìn)方法是先對(duì)信號(hào)進(jìn)行非線性處理[13-14],利用信號(hào)本身的特性,共振峰信息主要在幅度比較低的語(yǔ)音段豐富,所以通過(guò)對(duì)低語(yǔ)音信號(hào)幅度段進(jìn)行非線性處理,從而改善后期進(jìn)行自相關(guān)函數(shù)進(jìn)行檢測(cè)的性能。中心削波方法[15]是一個(gè)非常典型的非線性處理方法,但也有明顯的缺點(diǎn),計(jì)算量很大。為此,本文采用對(duì)中心削波方法的修正方法,其傳遞函數(shù)為
(5)
圖3 三電平中心削波函數(shù)
通過(guò)圖3可以得出,削波器輸出在x(n)>CL時(shí)為1,x(n)<-CL時(shí)為-1,除此之外為0。采用此方法可限定輸出的個(gè)數(shù),簡(jiǎn)化計(jì)算,只需要簡(jiǎn)單的邏輯組合,為實(shí)時(shí)運(yùn)算創(chuàng)造條件。
本文提出的基于小波減噪和改進(jìn)自相關(guān)函數(shù)的基因檢測(cè)算法可分為語(yǔ)音信號(hào)的預(yù)處理、小波減噪、三電平中心削波自相關(guān)函數(shù)計(jì)算,基因周期和基因頻率的提取。具體步驟如下:
1)對(duì)帶噪語(yǔ)音進(jìn)行預(yù)處理;
2)利用離散小波變換法對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行變換,得到對(duì)應(yīng)的的小波系數(shù);
3)自適應(yīng)閾值處理;常規(guī)的閾值處理一般采用固定閾值[16-17],但采用固定閾值時(shí),大尺度上的信號(hào)有一部分被濾除掉,從而引起較大的失真。本文采用自適應(yīng)閾值,使其隨尺度的增大而減??;即
(6)
式中:j為當(dāng)前的分解層數(shù)即尺度。上式為試驗(yàn)得到的經(jīng)驗(yàn)公式,調(diào)節(jié)常數(shù)C用以得到最佳的輸出SNR;
4)由處理后的小波系數(shù)估值重構(gòu)語(yǔ)音信號(hào);
5)對(duì)減噪后的語(yǔ)音信號(hào)進(jìn)行端點(diǎn)檢測(cè);
6)利用三電平中心削波自相關(guān)函數(shù)進(jìn)行基因周期和基因頻率的提取。
首先,在安靜環(huán)境下,自己錄制一段語(yǔ)音,內(nèi)容為“電子信息工程”,此語(yǔ)音可視為純語(yǔ)音信號(hào)。其次,對(duì)該語(yǔ)音信號(hào)添加高斯白噪聲形成不同信噪比的帶噪語(yǔ)音信號(hào)。圖4和圖5是基于小波變換和三電平削波自相關(guān)函數(shù)的基因檢測(cè)算法在信噪比是0dB和-5dB時(shí)的基音檢測(cè)相關(guān)波形;圖6和圖7是沒(méi)有進(jìn)行小波變換的單純?nèi)娖较鞑ㄗ韵嚓P(guān)函數(shù)法的基音檢測(cè)相關(guān)波形。圖中的豎實(shí)線部分是有效語(yǔ)音的起始點(diǎn),豎虛線部分是有效語(yǔ)音的結(jié)束點(diǎn)。比較在低信噪比條件下本文算法與單純用改進(jìn)自相關(guān)函數(shù)算法的基音檢測(cè)的性能。從圖4和圖5可知,經(jīng)過(guò)小波減噪后信噪比都得到了很大的提高,0dB時(shí)信噪比提高到10.27dB,-5dB時(shí)信噪比提高到6.17dB,經(jīng)過(guò)小波減噪后對(duì)信號(hào)進(jìn)行端點(diǎn)檢測(cè),然后再進(jìn)行三電平中心削波自相關(guān)函數(shù)進(jìn)行基音檢測(cè);基音檢測(cè)效果較好,沒(méi)有毛刺現(xiàn)象,其中最后一幅圖是把基音頻率波形與語(yǔ)譜圖進(jìn)行比較,通過(guò)波形可以看出通過(guò)本文算法的基音檢測(cè)頻率和語(yǔ)譜圖上的基音頻率曲線重合度很高。而從圖6和圖7可知,在SNR=0dB和-5dB時(shí),由于信噪比的下降,單純?nèi)娖街行南鞑ㄗ韵嚓P(guān)函數(shù)法的基音檢測(cè)頻率效果受到很大影響,基音周期的檢測(cè)出現(xiàn)了毛刺現(xiàn)象,同時(shí)比較基音頻率波形與語(yǔ)譜圖,甚至出現(xiàn)了檢測(cè)錯(cuò)誤的情況,如在0dB時(shí),“程”字沒(méi)有被檢測(cè)出來(lái)。在更低的-5dB時(shí),“子”和“程”字兩個(gè)都沒(méi)有被檢測(cè)出來(lái)。由此可知,本文基于小波減噪和改進(jìn)自相關(guān)函數(shù)法的復(fù)合基音檢測(cè)算法在處理低信噪比的帶噪語(yǔ)音信號(hào)時(shí),首先通過(guò)小波變換對(duì)帶噪語(yǔ)音信號(hào)進(jìn)行減噪,然后再利用改進(jìn)的自相關(guān)函數(shù)法進(jìn)行基音檢測(cè)。這種復(fù)合算法的檢測(cè)效果比直接用改進(jìn)自相關(guān)函數(shù)法進(jìn)行基音檢測(cè)的效果好。
圖4 SNR=0dB本文算法
圖5 SNR=-5dB的本文算法
圖6 SNR=0dB的改進(jìn)自相關(guān)算法
圖7 SNR=-5dB的改進(jìn)自相關(guān)算法
為了提高含噪語(yǔ)音信號(hào)在低信噪比情況下的基音檢測(cè)準(zhǔn)確度,利用MATLAB進(jìn)行了仿真實(shí)驗(yàn),對(duì)不同信噪比的帶噪語(yǔ)音分別進(jìn)行了改進(jìn)算法的基音檢測(cè)和未進(jìn)行小波減噪的基音檢測(cè),實(shí)驗(yàn)結(jié)果表明,利用小波減噪的改進(jìn)算法在對(duì)具有低信噪比的帶噪語(yǔ)音進(jìn)行基音檢測(cè)時(shí)具有更好的準(zhǔn)確度。
參考文獻(xiàn):
[1] 徐昕,張?zhí)扃?,石穗,?結(jié)合語(yǔ)音增強(qiáng)的基音檢測(cè)改進(jìn)方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2015,36(3):699-704.
[2] 潘崢嶸,戴芮,張寧.改進(jìn)的基音周期檢測(cè)算法研究[J].計(jì)算機(jī)工程與應(yīng)用,2015,51(10):223-226.
[3] 陳盼弟,黃華,何凌.基于自相關(guān)和倒譜法的基音檢測(cè)改進(jìn)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2015,32(1):163-166.
[4] 梅鐵民,付天嬌,朱向榮.類諧波積譜基音周期檢測(cè)算法[J].沈陽(yáng)理工大學(xué)學(xué)報(bào),2016,35(2):14-18.
[5] 薛帥強(qiáng),陳波,陳菲.改進(jìn)LVAMDF及綜合多因素基音檢測(cè)算法[J].計(jì)算機(jī)測(cè)量與控制,2016,24(4):253-256.
[6] ZHAO Y,ZHANG S,LIN X K. Improved Algorithm for Pitch Detection and Harmonic Separation[J]. Applied Mechanics and Materials,2013,24 (9):753-763.
[7] BAHJA F,DI M J,IBN E,et al. A corroborative study on improving pitch determination by time-frequency cepstrum decomposition using wavelets.[J]. SpringerPlus,2016,5(5):1-17.
[8] HAMID R T,SEYESD M A. New features for speech enhancement using bivariate shrinkage based on redundant wavelet filter-banks[J]. Computer Speech & Language,2016,35:93-115.
[9] MOHAMED B,AICHA B,NOUREDDINE E. Speech enhancement based on wavelet packet of an improved principal component analysis[J]. Computer Speech & Language,2016,35:58-72.
[10] 沈瑜,黨建武,王陽(yáng)萍,等.加權(quán)短時(shí)自相關(guān)函數(shù)的基音周期估計(jì)算法[J].計(jì)算機(jī)工程與應(yīng)用,2012,48(35):1-6.
[11] 徐敬德,常亮,崔慧娟,等.基于頻域和時(shí)域結(jié)合的基音周期提取算法[J].清華大學(xué)學(xué)報(bào),2012,52(3):413-415.
[12] 趙祎,張盛,林孝康.一種改進(jìn)的基音周期提取算法[J].數(shù)據(jù)采集與處,2014,29(2):304-308.
[13] 王民,曹繪,要趁紅.一種改進(jìn)的小波變換基音檢測(cè)算法[J].重慶郵電大學(xué)學(xué)報(bào),2012,24(3):283-287.
[14] 楊青,馬蕙,籍仙榮.利用自相關(guān)函數(shù)和雙耳自相關(guān)函數(shù)分析對(duì)交通噪聲特征參量的提取[J].聲學(xué)學(xué)報(bào),2014,39(5):624-632.
[15] 楊青,馬蕙,于博雅.交通噪聲時(shí)空因素分析的初探[J].噪聲與振動(dòng)控制,2013,33(2):60-63.
[16] 趙萍. 語(yǔ)音信號(hào)的自相關(guān)基音周期檢測(cè)[J].上海電力學(xué)院學(xué)報(bào),2011,27(3):297-300.
[17] 閆靚,陳克安.基于雙耳自相關(guān)函數(shù)的車輛噪聲煩惱度研究[J].聲學(xué)學(xué)報(bào),2011,36(1):43-50.