任永梅 肖冬瑞
摘要:針對固定閾值小波包語音增強算法在去噪時會損失語音信號的問題,文中提出了一種新的自適應(yīng)閾值小波包語音增強算法。該算法先利用帶噪語音的小波包變換系數(shù)估計出后驗信噪比,再由含有后驗信噪比因子的sigmoid函數(shù)作為平滑因子對隨尺度變化的閾值進行相鄰幀的平滑,最后由后驗信噪比自適應(yīng)修正平滑閾值,減少語音失真;仿真實驗結(jié)果表明,該算法在去噪的同時減少了語音信號的損失,有效地提高了增強語音的信噪比和分段信噪比,較固定閾值小波包語音增強算法具有明顯的優(yōu)越性。
關(guān)鍵詞:小波包變換;自適應(yīng)閾值;信噪比;分段信噪比
中圖分類號:TP301.6 文獻標識碼:A 文章編號:1009-3044(2014)26-6174-04
Abstract:Aiming at the problem of the fixed threshold wavelet packet speech enhancement algorithm loses the speech signal in denoising, this paper proposed a new adaptive threshold of wavelet packet for speech enhancement algorithm. Firstly, the algorithm uses the wavelet packet coefficients of noisy speech to estimate the posteriori SNR. Secondly, the sigmoid function contains a posteriori the signal-to-noise ratio (SNR) factor as a smooth factor smoothes adjacent frame threshold with scale changing. Finally, the posterior SNR adaptively adjusts the smoothed threshold, which reduced speech distortion. Simulation experimental results show that this algorithm in denoising reduces the loss of the speech signal, effectively improves the SNR and SSNR of the enhanced speech, and has obvious superiority than a fixed threshold wavelet packet speech enhancement algorithm.
Key words:wavelet packet transform; adaptive threshold; SNR; SSNR
語音增強有著廣泛的應(yīng)用,因此尋求一種有效的算法對帶噪語音信號進行處理以達到較高的抗噪效果的研究意義很大[1]。語音增強的目的有兩個:一是抑制背景噪聲,改善語音質(zhì)量,使聽者樂于接受;二是提高語音的可懂度,方便聽者理解。一般來說,語音增強方法分為2大類:時域方法(如子空間法)和頻域方法(如譜減法等),時域方法計算量大,頻域方法如譜減法,雖具有計算量小的特點,但在處理中存在音樂噪聲,因此達不到令人滿意的效果[2]。
小波分析又稱為多分辨率分析,是一種有力的時-頻分析工具,它既可以分析信號的概貌,又可以分析信號的細節(jié)。小波閾值去噪方法簡單有效,是目前最常用的小波去噪方法,其中閾值的選取在小波閾值去噪方法中最為關(guān)鍵。與小波分析方法不同的是,小波包分解對其沒有分解的語音信號高頻部分也進行了分解,可以更準確的分析語音信號。
Donoho和Johnstone提出非線性小波變換閾值去噪,該算法對小波各系數(shù)采用相同的閾值,在提高信噪比的同時很容易帶來語音失真[3,4]。為此,該文提出一種新的自適應(yīng)閾值小波包語音增強算法,由帶噪信號小波包系數(shù)估計出后驗信噪比,用后驗信噪比自適應(yīng)調(diào)節(jié)經(jīng)過相鄰幀修正的隨尺度變化的小波包閾值,同時針對軟閾值函數(shù)和硬閾值函數(shù)各自的缺點,該文也提出一種改進的閾值函數(shù),仿真結(jié)果表明,該算法可以有效地去除噪聲,減少語音失真。
從波形圖上可以看出,與固定閾值小波包去噪方法相比,該文算法去除了更多噪聲,波形上更接近于純凈語音信號,增強后的語音效果更佳,失真更小。
4 結(jié)論
針對固定閾值小波包去噪方法的不足,該文提出一種自適應(yīng)閾值的小波包去噪算法。仿真實驗結(jié)果表明,該文算法能夠更有效的去除帶噪語音信號中的高斯白噪聲和火車噪聲,能夠更好的保留有用信號;改進的閾值函數(shù)克服了硬閾值函數(shù)和軟閾值函數(shù)的缺點,提高了增強語音信號的信噪比和分段信噪比,減少了語音失真。
參考文獻:
[1] 張雪英.數(shù)字語音處理及Matlab仿真[M].北京:電子工業(yè)出版社,2010.
[2] 田秀榮.基于正交小波包分解的語音去噪增強[J].計算機仿真,2011,28(5):388-390.
[3] DL Donoho, IM Johnstone. Ideal spatial adaptation by wavelet shrinkage[J].Biometrika,1994,81(3):425-455.
[4] IM Johnstone,BW Silverman.Wavelet threshold estimators for data with correlated noise[J].J of the Royal Statistical Society, 1997,59(2): 319-351.
[5] 胡廣書.現(xiàn)代信號處理教程[M].北京:清華大學(xué)出版社,2004.
[6] Lei S F,Tung Y K.Speech Enhancement for Non-stationary Noises by Wavelet Packet Transform and Adaptive Noise Estimation[C].Taiwan, 2005.
[7] 邱愛中.一種新型閾值決策的小波去噪方法[J].通信技術(shù),2011,44(8):113-115.
[8] Cohen I.Enhancement of speech using bark scaled wavelet packet decomposition[C]//Proceedings of 7th European Conference on Speech Communication and Technology. Aalborg: IEEE, 2001: 1933-1936.