西安郵電大學(xué)電子工程學(xué)院 崔 旭
基于多窗譜估計(jì)的改進(jìn)的維納濾波語(yǔ)音增強(qiáng)算法
西安郵電大學(xué)電子工程學(xué)院 崔 旭
針對(duì)語(yǔ)音活動(dòng)檢測(cè)(VAD)噪聲譜估計(jì)的算法在現(xiàn)實(shí)場(chǎng)景中(噪聲譜不斷的變化)難以取得理想的效果,很容易對(duì)噪聲譜的估計(jì)偏小或者偏大的問(wèn)題,本文提出基于改進(jìn)的最小控制的遞歸平均算法(The improved minimum control recursion average,簡(jiǎn)稱IMCRA)用來(lái)進(jìn)行的噪聲譜估計(jì),與多窗譜的維納濾波相結(jié)合的算法。該算法先將帶噪語(yǔ)音進(jìn)行多窗譜估計(jì),然后用小波閾值技術(shù)進(jìn)一步改進(jìn)譜估計(jì),從而得到相應(yīng)頻點(diǎn)處的先驗(yàn)信噪比,最后通過(guò)計(jì)算增益,得出增強(qiáng)的語(yǔ)音信號(hào)。通過(guò)仿真結(jié)果表明:在不同的背景噪聲下,本文的算法和使用VAD,MCRA,Martin最小值跟蹤作為噪聲估算的語(yǔ)音增強(qiáng)算法相比,該算法能獲得更好的語(yǔ)音增強(qiáng)信號(hào)。
語(yǔ)音活動(dòng)檢測(cè);IMCRA;維納濾波;多窗譜估計(jì)
語(yǔ)音增強(qiáng)是語(yǔ)音信號(hào)處理中的關(guān)鍵步驟,在日常生活中,語(yǔ)音很容易被噪聲所污染,使得語(yǔ)音質(zhì)量下降,隨著人們對(duì)語(yǔ)音質(zhì)量的要求逐步提高,越來(lái)越多的語(yǔ)音增強(qiáng)算法被學(xué)者提了出來(lái)。
目前減噪的方法有:多頻帶譜減法[1]、小波和子空間[2]、維納濾波[3]、MMSE等。在語(yǔ)音增強(qiáng)過(guò)程中,我們都是假設(shè)能夠得到噪聲譜的估計(jì),常見(jiàn)的噪聲估計(jì)算法有VAD、Martin最小值跟蹤算法、MCRA算法、IMCRA算法等。其中,VAD算法在高度不平穩(wěn)的環(huán)境下,難以取得比較理想的效果。Martin的最小值跟蹤和MCRA算法和IMCRA算法會(huì)產(chǎn)生相應(yīng)的延遲。我們能做的就是盡量的減少引入的延遲。
2.1 維納濾波原理
其中ωk是對(duì)應(yīng)的頻率點(diǎn)。對(duì)頻率點(diǎn)的ωk的增益函數(shù)g(k)可以表示為:
有了增益函數(shù)g(k),計(jì)算增強(qiáng)的信號(hào)譜:
2.2 IMCRA算法原理
Cohen首先提出IMCRA6:帶噪語(yǔ)音功率譜密度的平滑估計(jì):
其次,對(duì)那些基本上已經(jīng)判定為噪聲的那些頻率分量,經(jīng)行第二次平滑:
為了最小化語(yǔ)音失真,對(duì)噪聲估計(jì)引入一個(gè)偏差補(bǔ)償因子β:
根據(jù)文獻(xiàn)驗(yàn)證,我們將β定為1.50。
本次仿真實(shí)驗(yàn)中,選取的語(yǔ)音來(lái)自NOIZEU,噪聲來(lái)自Noisex-92噪聲庫(kù),信噪比分別是0dB、5dB、10dB、15dB的babble、airport、restaurant、和street噪聲的帶噪語(yǔ)音信號(hào)。對(duì)比分析的對(duì)象是傳統(tǒng)維納濾波法分別基于VAD噪聲股計(jì)算、Martin最小值跟蹤、MCRA噪聲估算以及本文的多窗譜估計(jì)的維納濾波基于IMCRA噪聲估算的語(yǔ)音增強(qiáng)算法。下面分別用VAD、Martin、MCRA、IMCRA表示
在上述實(shí)驗(yàn)的基礎(chǔ)上,我們繼續(xù)求增強(qiáng)后的語(yǔ)音的分段信噪比[8],定義如下:
圖3 不同噪聲環(huán)境下的SNRseg比較
由上面的四幅圖可以清晰的看出,(1)、(2)可以看出本文的算法要比其他三種算法增強(qiáng)效果更好,尤其是在低信噪比下。
本文是基于多窗譜估計(jì)的改進(jìn)維納濾波算法,結(jié)合小于閾值,優(yōu)化譜估計(jì)。通過(guò)大量的仿真實(shí)驗(yàn)表明,本文的算法在提高信噪比方面,相比于其他的算法,有了一定的提高,減少了‘音樂(lè)噪聲’,提高語(yǔ)音清晰度。
[1]萬(wàn)義龍,張?zhí)扃?王志朝等.基于多頻帶譜減法的抗噪聲語(yǔ)音識(shí)別研究[J].電視技術(shù),2013,37(23):183-187.
[2]吳昊,魯周迅.Symlets小波和子空間聯(lián)合增強(qiáng)下的語(yǔ)音識(shí)別[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(5):141-145.
[3]白文雅,黃建群,陳智憐.基于維納濾波語(yǔ)音增強(qiáng)算法的改進(jìn)實(shí)現(xiàn)[J].語(yǔ)音技術(shù),2007,31(1):44-46+50.
崔旭(1991—),男,江蘇揚(yáng)州人,西安郵電大學(xué)碩士在讀、研究方向:語(yǔ)音信號(hào)處理。