国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于變換域稀疏度量的多級(jí)FrFT語(yǔ)音增強(qiáng)

2020-09-29 06:34范珍艷莊曉東李鐘曉
關(guān)鍵詞:階數(shù)傅里葉信噪比

范珍艷,莊曉東,李鐘曉

(青島大學(xué) 電子信息學(xué)院,山東 青島 266071)

0 引 言

語(yǔ)音增強(qiáng)技術(shù)可有效地消除周圍干擾噪聲,提高語(yǔ)音質(zhì)量,保證語(yǔ)音通信及人機(jī)交互的正常進(jìn)行[1]。目前已經(jīng)提出了很多語(yǔ)音增強(qiáng)算法,傳統(tǒng)的卡爾曼濾波法、維納濾波法和譜減法等語(yǔ)音增強(qiáng)方法對(duì)平穩(wěn)噪聲的抑制效果較好,但是非平穩(wěn)噪聲環(huán)境中很難從帶噪語(yǔ)音中分離出純凈語(yǔ)音信號(hào)[2]。近年來(lái),小波變換[3]、神經(jīng)網(wǎng)絡(luò)[4]已在語(yǔ)音增強(qiáng)方面得到了廣泛的應(yīng)用,這兩種方法也有或多或少的不足,例如小波變換中固定的小波基不能適應(yīng)語(yǔ)音信號(hào)的隨機(jī)變化,神經(jīng)網(wǎng)絡(luò)法所需樣本量大,計(jì)算復(fù)雜度高。

變換域語(yǔ)音增強(qiáng)方法是實(shí)際應(yīng)用中大量采用的方法,但傳統(tǒng)的變換域存在無(wú)法將語(yǔ)音信號(hào)和噪聲完全分離的問(wèn)題,分?jǐn)?shù)階傅里葉變換(fractional Fourier transform, FrFT)可實(shí)現(xiàn)較靈活的時(shí)頻平面上的分析,因此基于 FrFT 的語(yǔ)音增強(qiáng)方法也是一種比較有效的語(yǔ)音降噪方法。FrFT反映了信號(hào)在時(shí)頻域的信息[5],通過(guò)旋轉(zhuǎn)時(shí)頻軸可將語(yǔ)音信號(hào)和噪聲在分?jǐn)?shù)階域分離。文獻(xiàn)[6,7]提出了基于單級(jí)FrFT的語(yǔ)音增強(qiáng)算法,在某一個(gè)特定的FrFT域估計(jì)濾波器或硬閾值法進(jìn)行濾波,但實(shí)際上在復(fù)雜噪聲環(huán)境中單個(gè)分?jǐn)?shù)階域也很難將語(yǔ)音信號(hào)和噪聲完全分離,不能完全地去除噪聲,需要多次旋轉(zhuǎn)時(shí)頻軸將語(yǔ)音信號(hào)和噪聲在多個(gè)最優(yōu)FrFT域盡最大可能地分開。而且FrFT變換的最優(yōu)階數(shù)確定一直是未能很好解決的瓶頸問(wèn)題,因此本文針對(duì)上述問(wèn)題,結(jié)合語(yǔ)音信號(hào)在變換域的稀疏特性,提出了基于稀疏度量的多級(jí)FrFT語(yǔ)音增強(qiáng)方法,高效地確定多個(gè)最優(yōu)變換階數(shù),并在多個(gè)分?jǐn)?shù)階域逐幀濾波,可有效地去除噪聲,提高語(yǔ)音質(zhì)量。

1 分?jǐn)?shù)階傅里葉變換

分?jǐn)?shù)階傅里葉變換是用單一變量表示時(shí)頻信息的線性變換,避免了常用二次型時(shí)頻分布的二次變換交叉項(xiàng)干擾問(wèn)題,是一種時(shí)頻分析工具[8]。對(duì)于非平穩(wěn)信號(hào),僅用傅里葉變換并不能很好地分析其局部特征,而FrFT對(duì)信號(hào)具有很強(qiáng)的聚集性,所以可以選擇信號(hào)最集中的角度去分析信號(hào)特性。在同等條件下,F(xiàn)rFT可得到比傳統(tǒng)時(shí)頻分布更好的效果,而且有更好的分辨率。目前分?jǐn)?shù)階傅里葉變換已經(jīng)廣泛應(yīng)用于雷達(dá)、通信、信息安全等領(lǐng)域。信號(hào)的α階傅里葉變換可以理解為信號(hào)在時(shí)頻平面內(nèi)坐標(biāo)軸繞原點(diǎn)逆時(shí)針旋轉(zhuǎn)β=απ/2角度后構(gòu)成的分?jǐn)?shù)階域上的表示方法[9]。

信號(hào)x(t)的α階傅里葉變換表示為[10]

(1)

由分?jǐn)?shù)階傅里葉變換的周期性和階數(shù)可加性可知,當(dāng)α=0時(shí), F0[x(t)]=x(t) 是原信號(hào),當(dāng)α=1時(shí), F1[x(t)]=X(f) 是x(t)的普通傅里葉變換,當(dāng)α=-1時(shí), F-1[x(t)]=X(-f) 是x(t)的普通傅里葉逆變換。

分?jǐn)?shù)階傅里葉變換的特征向量是Hermite-Gaussian函數(shù)ψn(t)

Fα[ψn(t)]=e-iαnπ/2ψn(tα)

(2)

式中:n階Hermite-Gaussian函數(shù)為

(3)

核函數(shù)可以表示為

(4)

將連續(xù)時(shí)間函數(shù)對(duì)應(yīng)到離散時(shí)間函數(shù)中,可得離散分?jǐn)?shù)階傅里葉變換矩陣為

(5)

式中:uk[n] 為第k個(gè)Hermite-Gaussian函數(shù), (N)2≡Nmod 2,N為信號(hào)的樣本點(diǎn)數(shù)。離散分?jǐn)?shù)階傅里葉變換也具有與連續(xù)時(shí)間分?jǐn)?shù)階傅里葉變換相同的性質(zhì),因此當(dāng)α=1時(shí),是普通的離散傅里葉變換。

2 FrFT域語(yǔ)音增強(qiáng)

分?jǐn)?shù)階傅里葉變換對(duì)信號(hào)在變換域有一定的能量聚集性,且其能量聚集性與變換階數(shù)有關(guān),在最優(yōu)階數(shù)下能量聚集性最好。本文對(duì)若干單音信號(hào)及噪聲進(jìn)行了FrFT時(shí)頻分布實(shí)驗(yàn)分析,對(duì)每個(gè)信號(hào)計(jì)算階數(shù)α從0到1之間的1000個(gè)階數(shù)值之下的FrFT變換;并基于FrFT可看作在時(shí)頻平面上旋轉(zhuǎn)的解釋,畫出各階變換在時(shí)頻平面上的分布圖(圖1中扇形區(qū)域),結(jié)果表明分?jǐn)?shù)階傅里葉變換對(duì)濁音和清音都有一定的能量聚集性,如圖1(a)、圖1(b)所示,而分?jǐn)?shù)階傅里葉變換對(duì)噪聲的能量聚集性差,如圖1(c)所示,這個(gè)差異可被用于語(yǔ)音增強(qiáng)算法設(shè)計(jì)。

圖1 時(shí)頻域能量分布

2.1 基于變換域稀疏度量的最優(yōu)階數(shù)確定

最優(yōu)階數(shù)的確定是進(jìn)行FrFT域語(yǔ)音增強(qiáng)的必要前提,目前常用的方法有最小均方誤差(MMSE)法、最大信噪比法等,這些方法通常需要在[0,1]內(nèi)遍歷選取不同階數(shù),根據(jù)濾波后的均方誤差值最小或信噪比最大來(lái)確定最優(yōu)變換階數(shù),計(jì)算量較大,因此本文基于信號(hào)在變換域具有稀疏性的共性,提出了采用不同分?jǐn)?shù)階域的稀疏度量確定最優(yōu)變換階數(shù)的方法,該方法首先對(duì)含噪語(yǔ)音信號(hào)確定最優(yōu)變換階數(shù),在最優(yōu)階數(shù)下對(duì)含噪語(yǔ)音信號(hào)做分?jǐn)?shù)階傅里葉變換并濾波,避免大量的重復(fù)濾波運(yùn)算。信號(hào)的稀疏度由向量范數(shù)來(lái)衡量[11],信號(hào)的稀疏性越強(qiáng),能量聚集性也越強(qiáng)。

對(duì)于長(zhǎng)度為N的一維信號(hào)x=[x1,x2,…xN]T, 它的l0范數(shù)可以表示為

(6)

信號(hào)的l0范數(shù)表示信號(hào)中非零元素的個(gè)數(shù),而在實(shí)際應(yīng)用中很少有信號(hào)的元素絕對(duì)為零,且l0范數(shù)是非凸性的,求解過(guò)程比較復(fù)雜,因此l0范數(shù)作為信號(hào)的稀疏度量方法并不適用。近年來(lái)人們提出了lp范數(shù)度量信號(hào)的稀疏度[12]。信號(hào)的lp范數(shù)定義如下

(7)

設(shè)信號(hào)x=[x1,x2,…xN]T的α階傅里葉變換為FX=Fαx, 則α階傅里葉變換下的稀疏度表示為

(8)

在[0,1]之間均勻取J個(gè)點(diǎn)記作αj(j=1,2,…,J), 計(jì)算不同階數(shù)的稀疏度Lj, 則第一級(jí)FrFT的最優(yōu)階數(shù)可表示為αopt=min(Lj),j=1,2,…,J。

第二級(jí)α階傅里葉變換的稀疏度表示為

(9)

同樣在[0,1]之間取K個(gè)點(diǎn)記作αk(k=1,2,…,K), 計(jì)算不同階數(shù)的稀疏度L2k, 則第二級(jí)FrFT的最優(yōu)階數(shù)可表示為α2opt=min(L2k),k=1,2,…,K。 計(jì)算單音 /u/ 和白噪聲(white)的稀疏度隨階數(shù)的變化曲線如圖2所示。圖2(a)為單音/u/的稀疏度隨階數(shù)的變化曲線,在α=0.977處稀疏度最小,即單音 /u/ 的最優(yōu)變換階數(shù)為α=0.977。圖2(b)為白噪聲的稀疏度隨階數(shù)的變化曲線,在α=0.826處稀疏度最小,即白噪聲的最優(yōu)變換階數(shù)為α=0.826。

圖2 單音 /u/ 和白噪聲的稀疏度隨階數(shù)變化曲線

2.2 單級(jí)FrFT域語(yǔ)音增強(qiáng)算法

假設(shè)帶噪語(yǔ)音模型為

y=x+n

(10)

式中:y,x,n分別為帶噪語(yǔ)音信號(hào)、原始語(yǔ)音信號(hào)和加性噪聲,且均是長(zhǎng)度為N的列向量。

首先采用分?jǐn)?shù)階稀疏度量確定最優(yōu)變換階數(shù)α,則單級(jí)FrFT域語(yǔ)音增強(qiáng)的模型如圖3所示。

圖3 單級(jí)FrFT域語(yǔ)音增強(qiáng)模型

去噪后的增強(qiáng)語(yǔ)音為

(11)

式中:Fα(N×N)和F-α(N×N)分別為α階和-α階的離散FrFT矩陣,濾波器G(N×N)為對(duì)角矩陣,其對(duì)角元素為分?jǐn)?shù)階頻率響應(yīng)g,即g=diag(G)=(g0,g1,…,gN-1)。

為了獲得最優(yōu)的濾波器分?jǐn)?shù)階頻率響應(yīng)gopt, 本文采用均方誤差(MSE)作為優(yōu)化準(zhǔn)則,均方誤差定義為

(12)

對(duì)帶噪語(yǔ)音信號(hào)分幀,每幀信號(hào)長(zhǎng)度為l,每L幀估計(jì)一個(gè)最優(yōu)的濾波器響應(yīng)gopt, 將L幀的均方誤差表示為目標(biāo)函數(shù)C(g)

(13)

第i幀含噪語(yǔ)音信號(hào)的α階傅里葉變換為zi=[zi,0……zi,l-1]T=Fαyi, 令Gzi=Zig,zi=diag(Zi), 則目標(biāo)函數(shù)表示為

(14)

將式(14)中目標(biāo)函數(shù)寫為

C(g)=gHQg+bTg+c

(15)

為求得最優(yōu)的濾波器分?jǐn)?shù)階頻率響應(yīng)gopt, 對(duì)式(15)中的目標(biāo)函數(shù)求偏導(dǎo)得

(16)

化簡(jiǎn)得到

2Qgopt+b=0

(17)

通過(guò)求解N階線性方程式(17)可獲得最優(yōu)的分?jǐn)?shù)階濾波器頻率響應(yīng)gopt, 在最優(yōu)分?jǐn)?shù)階域?qū)胝Z(yǔ)音信號(hào)濾波去噪,可獲得較好的去噪效果。

2.3 多級(jí)FrFT域語(yǔ)音增強(qiáng)算法

單級(jí)FrFT域?yàn)V波可很好地驗(yàn)證稀疏度量確定最優(yōu)階數(shù)的準(zhǔn)確性,但若信號(hào)和噪聲在時(shí)域和頻域均有重疊,如圖4(a)所示,在時(shí)域或頻域?yàn)V波并不能很好地去除噪聲,旋轉(zhuǎn)時(shí)頻軸在單個(gè)分?jǐn)?shù)階域可將帶噪信號(hào)中的信號(hào)s(t)和噪聲n(t)分離,采用單級(jí)FrFT域?yàn)V波方法便可很好地去除噪聲。而如圖4(b)中所示,旋轉(zhuǎn)兩次時(shí)頻軸才能將帶噪信號(hào)中信號(hào)s(t)和噪聲n1(t),n2(t)分開,則需要在每次旋轉(zhuǎn)后的相應(yīng)分?jǐn)?shù)階域分別濾波以較好去除噪聲成分。因此本文提出了基于稀疏度量的多級(jí)FrFT域語(yǔ)音增強(qiáng)方法,可以更好地濾除噪聲,盡可能地還原原始語(yǔ)音信號(hào)。

圖4 信號(hào)和噪聲的Wigner分布

采用分?jǐn)?shù)階稀疏度量分別確定最優(yōu)變換階數(shù)α1,α2,…,αM, 多級(jí)FrFT域語(yǔ)音增強(qiáng)模型如圖5所示。

圖5 多級(jí)FrFT域語(yǔ)音增強(qiáng)模型

去噪后的增強(qiáng)語(yǔ)音為

(18)

式中:F-αM(N×N),Fαk+1-αk(N×N),Fα1(N×N)為離散FrFT矩陣,濾波器Gk(N×N)為對(duì)角矩陣,其元素為:g1,…,gk,…,gM即gk=diag(Gk)=[gk,0,…,gk,l-1]T。

同單級(jí)FrFT域語(yǔ)音增強(qiáng)方法相同,對(duì)帶噪語(yǔ)音信號(hào)分幀,幀長(zhǎng)為l,每L幀估計(jì)一個(gè)最優(yōu)的濾波器分?jǐn)?shù)階頻率響應(yīng)gk(k=1,2,…M), 定義目標(biāo)函數(shù)為

(19)

式中:θ表示每個(gè)階數(shù)下的濾波器響應(yīng),即θ={g1,g2,…,gM}。

設(shè)ai=Fαk-αk-1Gk-1Fαk-1-αk-2Gk-2…G1Fα1yi,B=F-αMGMFαk+2-αk+1Gk+1, 則目標(biāo)函數(shù)寫為

(20)

(21)

將式(21)簡(jiǎn)化為

(22)

為了獲得最優(yōu)的分?jǐn)?shù)階濾波器頻率響應(yīng)gkopt, 對(duì)式(22)求偏導(dǎo)得

(23)

計(jì)算得到

(Q+QT)gkopt+d=0

(24)

本文采用迭代方法求gk(k=1,2,…,M), 步驟如下:

(1)首先初始化所有的濾波器G1,G2,…,GM為單位陣I;

(2)設(shè)k=1,通過(guò)式(24)求得gk;

(3)求得gk, 即第k個(gè)濾波器Gk確定,將B,αi代入式(24)求得gk+1, 然后令k=k+1;

(4)重復(fù)步驟(3)直到求得最后的濾波器頻率響應(yīng)gM;

(5)重復(fù)步驟(2)到步驟(4)直到得到使均方誤差相對(duì)夠小的濾波器分?jǐn)?shù)階頻率響應(yīng)gk(k=1,2,…,M)。

3 仿真分析

為了能較好地檢測(cè)本文語(yǔ)音增強(qiáng)算法的去噪性能,進(jìn)行以下仿真實(shí)驗(yàn)。本文采用的純凈語(yǔ)音材料選自NOIZEUS語(yǔ)音庫(kù)[13]的‘sp01.wav’語(yǔ)音和‘sp05.wav’語(yǔ)音,背景噪聲選自Noisex-92噪聲庫(kù)[14]的粉色噪聲(pink),白噪聲(white)和F16座艙噪聲(f16),采樣頻率均為8 KHz。對(duì)語(yǔ)音信號(hào)分幀,幀長(zhǎng)取32 ms,幀移為1/2幀長(zhǎng),本文基于語(yǔ)音信號(hào)在分?jǐn)?shù)階域的稀疏性,采用稀疏度量在[0,1]之間每5幀(即L=5)確定最優(yōu)變換階數(shù),在最優(yōu)變換階數(shù)下估計(jì)最佳分?jǐn)?shù)階濾波器頻率響應(yīng)進(jìn)行單級(jí)FrFT域?yàn)V波和兩級(jí)FrFT域?yàn)V波去噪。并與現(xiàn)有的一些語(yǔ)音增強(qiáng)方法(維納濾波法、譜減法、小波去噪、MMSE估計(jì)法、子空間法和FrFT域閾值法)進(jìn)行比較。仿真實(shí)驗(yàn)是在Matlab R2014a軟件中進(jìn)行的。

實(shí)驗(yàn)1:首先通過(guò)語(yǔ)音增強(qiáng)前后波形圖,語(yǔ)譜圖和主觀聽覺感受本文語(yǔ)音增強(qiáng)方法的效果。將3種加性噪聲(粉色噪聲(pink)、白噪聲(white)和F16座艙噪聲(f16))分別加入兩段純凈語(yǔ)音信號(hào)(sp01.wav和sp05.wav)得到帶噪語(yǔ)音信號(hào),首先采用稀疏度量在[0,1]之間確定含噪語(yǔ)音信號(hào)的第一級(jí)和第二級(jí)FrFT的最優(yōu)變換階數(shù)。第一級(jí)FrFT和第二級(jí)FrFT的最優(yōu)變換階數(shù)隨時(shí)間變化曲線如圖6(a)~圖6(l)所示,圖6(a)~圖6(f)分別為語(yǔ)sp01疊加粉色噪聲(pink)、白噪聲(white)和F16座艙噪聲(f16)的第一級(jí)FrFT,第二級(jí)FrFT最優(yōu)階數(shù)變化曲線,圖6(g)~圖6(l)分別為語(yǔ)音sp05疊加粉色噪聲(pink)、白噪聲(white)和F16座艙噪聲(f16)的第一級(jí)FrFT,第二級(jí)FrFT最優(yōu)階數(shù)變化曲線。由圖6可以發(fā)現(xiàn)第一級(jí)階數(shù)主要在0.9-1之間,而第二級(jí)階數(shù)主要在 0-0.05 之間。濾波前后波形圖如圖7所示,圖7(a)~圖7(i)分別為sp01語(yǔ)音疊加粉色噪聲、白噪聲和F16座艙噪聲濾波前后的波形圖,圖7(j)~圖7(r)分別為sp05語(yǔ)音疊加粉色噪聲、白噪聲和F16座艙噪聲濾波前后的波形圖。左圖為含噪語(yǔ)音波形圖,中圖和右圖分別為單級(jí) FrFT 域?yàn)V波后的波形圖和兩級(jí)FrFT域?yàn)V波的波形圖,橫軸均為時(shí)間,縱軸均為幅值。從波形圖中可以看出,對(duì)于含3種不同噪聲的sp01語(yǔ)音和sp05語(yǔ)音,單級(jí)FrFT域?yàn)V波和兩級(jí)FrFT域?yàn)V波方法均可以有效地去除噪聲,取得不錯(cuò)的去噪效果,而且避免了語(yǔ)音和噪聲同時(shí)被抑制或保留的情況,在去除噪聲的同時(shí)很好地保留了語(yǔ)音信號(hào)的完整性,減小語(yǔ)音失真。從主觀聽覺感受,單級(jí)FrFT域?yàn)V波法可以去除部分噪聲,但有些許尖銳雜音,兩級(jí)FrFT域?yàn)V波的聽音結(jié)果可很好地分辨出原始語(yǔ)音信號(hào),可懂度和清晰度均良好。

圖6 6種不同含噪語(yǔ)音的最優(yōu)階數(shù)變化曲線

圖7 6種不同含噪語(yǔ)音信號(hào)的濾波前后波形

分別做6種不同帶噪語(yǔ)音信號(hào)及增強(qiáng)語(yǔ)音的語(yǔ)譜圖,并進(jìn)行比較分析。sp01語(yǔ)音含粉色噪聲(pink),含白噪聲(white)和含F(xiàn)16座艙噪聲(f16)增強(qiáng)語(yǔ)音語(yǔ)譜圖結(jié)果及sp05語(yǔ)音含粉色噪聲(pink),含白噪聲(white)和含F(xiàn)16座艙噪聲(f16)增強(qiáng)語(yǔ)音語(yǔ)譜圖結(jié)果分別如圖8(a)~圖8(i),圖8(j)~圖8(r)所示,橫軸均為時(shí)間,縱軸均為頻率(Hz),語(yǔ)譜圖中的點(diǎn)代表信號(hào)能量的強(qiáng)度,顏色越深代表該處語(yǔ)音信號(hào)的能量越強(qiáng)。左圖為帶噪語(yǔ)音信號(hào)的語(yǔ)譜圖,中圖和右圖分別為單級(jí)FrFT域?yàn)V波增強(qiáng)語(yǔ)音的語(yǔ)譜圖和兩級(jí)FrFT域?yàn)V波增強(qiáng)語(yǔ)音的語(yǔ)譜圖。含噪語(yǔ)音的語(yǔ)譜圖可以大體看出語(yǔ)譜圖的條帶特性,但由于噪聲的影響,語(yǔ)譜圖有些模糊,而單級(jí)FrFT濾波和兩級(jí) FrFT 濾波增強(qiáng)語(yǔ)音的語(yǔ)譜圖條帶特性均比較清晰,在有效去除噪聲的前提下,清晰地顯示出語(yǔ)音信號(hào)的諧波結(jié)構(gòu),表明采用稀疏度量確定最優(yōu)變換階數(shù)并進(jìn)行多級(jí)FrFT濾波去噪效果明顯。

實(shí)驗(yàn)2:為更好地驗(yàn)證本文算法的去噪性能,利用本文算法及現(xiàn)有的幾種語(yǔ)音去噪方法(MMSE估計(jì)法、維納濾波法、譜減法、小波去噪、子空間方法和FrFT域閾值法)對(duì)6種不同的含噪語(yǔ)音進(jìn)行降噪,計(jì)算降噪前后語(yǔ)音信號(hào)的信噪比(SNR),結(jié)果見表1、表2。表1為含3種不同噪聲的sp01語(yǔ)音降噪前后信噪比對(duì)比結(jié)果,表2為含3種不同噪聲的sp05語(yǔ)音降噪前后信噪比對(duì)比結(jié)果。從表1、表2 的信噪比對(duì)比結(jié)果可以看出,現(xiàn)有的語(yǔ)音去噪方法及本文的多級(jí)FrFT濾波方法的輸出信噪比較輸入信噪比均有所提高,但本文算法的輸出信噪比提高最大,且兩級(jí) FrFT 域?yàn)V波方法的輸出信噪比高于單級(jí)FrFT域?yàn)V波方法的輸出信噪比,較輸入信噪比分別提高了8 dB~11 dB,9 dB~13 dB。由此可以看出,本文基于稀疏度量和多級(jí)FrFT域?yàn)V波算法具有較好的降噪性能,且優(yōu)于其它幾種語(yǔ)音去噪方法。

圖8 sp01語(yǔ)音和sp05語(yǔ)音疊加3種不同噪聲增強(qiáng)語(yǔ)音語(yǔ)譜圖

實(shí)驗(yàn)3:分別向純凈語(yǔ)音信號(hào)sp01和sp05中加入不同信噪比(-10 dB、-5 dB、0 dB、5 dB、10 dB)的F16座艙噪聲(f16)和白噪聲(white),采用本文算法及其它幾種現(xiàn)有的語(yǔ)音去噪算法(MMSE估計(jì)法、維納濾波法、譜減法、小波去噪、子空間方法和FrFT域閾值法)進(jìn)行降噪,計(jì)算降噪后的輸出信噪比見表3、表4。從表3、表4可以看出,加入不同強(qiáng)度的背景噪聲情況下,維納濾波法、譜減法、小波去噪法、MMSE估計(jì)法及子空間法的輸出信噪比均有所提高,而在背景噪聲較強(qiáng)的情況下FrFT域閾值法的輸出信噪比提高較大,在背景噪聲較弱的情況下,F(xiàn)rFT域閾值法的輸出信噪比提高較小,甚至在輸入信噪比為-10 dB時(shí),輸出信噪比低于輸入信噪比。本文多級(jí) FrFT 域?yàn)V波算法的輸出信噪比均有較大提高,且高于其它幾種去噪方法的輸出信噪比,單級(jí)FrFT域?yàn)V波,兩級(jí) FrFT 域?yàn)V波的輸出信噪比依次遞增,表明在不同強(qiáng)度的背景噪聲情況下,本文的多級(jí)FrFT域?yàn)V波方法具有良好的降噪性能。

表1 含3種不同噪聲的sp01語(yǔ)音降噪前后的信噪比結(jié)果

表2 含3種不同噪聲的sp05語(yǔ)音降噪前后的信噪比結(jié)果

實(shí)驗(yàn)4:對(duì)數(shù)譜失真測(cè)度(LSD)是一種語(yǔ)音失真程度的評(píng)判方法,LSD的結(jié)果值越小,則表明增強(qiáng)語(yǔ)音越接近于原始語(yǔ)音,增強(qiáng)語(yǔ)音質(zhì)量越好[15]。向純凈語(yǔ)音sp01和sp05中加入不同信噪比(-10 dB、-5 dB、0 dB、5 dB、10 dB)的白噪聲(white)、粉色噪聲(pink)和F16座艙噪聲(f16),采用其它幾種語(yǔ)音去噪算法及本文方法降噪后,作增強(qiáng)語(yǔ)音和原始語(yǔ)音的對(duì)數(shù)譜失真測(cè)度對(duì)比如圖9所示。圖9(a)~圖9(c),圖9(g)~圖9(i)分別為sp01語(yǔ)音和sp05語(yǔ)音疊加3種不同的噪聲后采用其它幾種去噪方法和本文的多級(jí)FrFT域?yàn)V波方法的LSD對(duì)比,圖9(d)~圖9(f),圖9(j)~圖9(l)分別為sp01語(yǔ)音和sp05語(yǔ)音疊加3種不同的噪聲后本文FrFT域?yàn)V波方法的LSD對(duì)比。從圖9可以看出,譜減法去噪后增強(qiáng)語(yǔ)音的失真最嚴(yán)重,維納濾波法,子空間法,F(xiàn)rFT域閾值法,MMSE估計(jì)法及小波去噪法的失真測(cè)度依次低于譜減法,但均高于本文多級(jí)FrFT域?yàn)V波算法濾波后增強(qiáng)語(yǔ)音的失真測(cè)度。觀察FrFT域?yàn)V波方法的LSD對(duì)比圖發(fā)現(xiàn),兩級(jí)FrFT域?yàn)V波的失真測(cè)度小于單級(jí)FrFT域?yàn)V波的失真測(cè)度,表明采用基于稀疏度量的多級(jí)FrFT域?yàn)V波方法后的增強(qiáng)語(yǔ)音失真最小,更接近于原始語(yǔ)音。

表3 含不同信噪比F16座艙噪聲的sp01語(yǔ)音降噪后信噪比

表4 含不同信噪比白噪聲的sp05語(yǔ)音降噪后信噪比

圖9 sp01和sp05語(yǔ)音疊加3種不同強(qiáng)度噪聲去噪后的LSD對(duì)比

4 結(jié)束語(yǔ)

本文提出了一種基于稀疏度量的多級(jí)FrFT域語(yǔ)音增強(qiáng)方法,可利用稀疏度量準(zhǔn)確確定最優(yōu)變換階數(shù),在多個(gè)最優(yōu)分?jǐn)?shù)階域?qū)⒄Z(yǔ)音信號(hào)和噪聲分開,根據(jù)語(yǔ)音和噪聲的特性逐幀估計(jì)濾波器濾波可有效去除噪聲。將本文算法與現(xiàn)有的幾種語(yǔ)音去噪方法(MMSE估計(jì)法、維納濾波法、譜減法、小波去噪、子空間方法和FrFT域閾值法)作比較分析,仿真結(jié)果表明,本文的多級(jí)FrFT域語(yǔ)音增強(qiáng)方法可以有效地去除噪聲,提高信噪比,且輸出信噪比明顯高于其它幾種語(yǔ)音去噪方法。即使在背景噪聲強(qiáng)度較高的情況下也可以有效地去除噪聲,提升語(yǔ)音的可懂度和清晰度。對(duì)比不同強(qiáng)度噪聲情況下增強(qiáng)語(yǔ)音和原始語(yǔ)音的對(duì)數(shù)譜失真測(cè)度,驗(yàn)證了本文算法的對(duì)數(shù)譜失真測(cè)度明顯低于其它幾種語(yǔ)音去噪方法。

本文基于稀疏度量的多級(jí)FrFT域語(yǔ)音增強(qiáng)算法不需要事先知道噪聲的統(tǒng)計(jì)信息,且利用語(yǔ)音信號(hào)在分?jǐn)?shù)階域的稀疏性,采用稀疏度量確定最優(yōu)變換階數(shù),降低計(jì)算量,提高算法的執(zhí)行效率。通過(guò)均方誤差最小原則估計(jì)最優(yōu)的分?jǐn)?shù)階濾波器頻率響應(yīng),避免了閾值選擇的問(wèn)題。本文算法實(shí)現(xiàn)高效,具有較好的魯棒性,在其它類型信號(hào)去噪中也具有良好的應(yīng)用潛力。

猜你喜歡
階數(shù)傅里葉信噪比
兩種64排GE CT冠脈成像信噪比與劑量對(duì)比分析研究
確定有限級(jí)數(shù)解的階數(shù)上界的一種n階展開方法
法國(guó)數(shù)學(xué)家、物理學(xué)家傅里葉
基于深度學(xué)習(xí)的無(wú)人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
一個(gè)含有五項(xiàng)的分?jǐn)?shù)階混沌系統(tǒng)的動(dòng)力學(xué)分析
雙線性傅里葉乘子算子的量化加權(quán)估計(jì)
復(fù)變函數(shù)中孤立奇點(diǎn)的判別
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
任意2~k點(diǎn)存儲(chǔ)器結(jié)構(gòu)傅里葉處理器
基于傅里葉變換的快速TAMVDR算法
专栏| 连南| 嘉定区| 玉林市| 莱芜市| 莆田市| 灵武市| 上饶市| 天全县| 定结县| 锡林浩特市| 囊谦县| 梨树县| 怀远县| 驻马店市| 曲麻莱县| 元江| 塘沽区| 定襄县| 永年县| 新巴尔虎右旗| 新泰市| 梁山县| 桓台县| 厦门市| 镇巴县| 新蔡县| 巴彦县| 康定县| 凤阳县| 甘谷县| 浦江县| 城口县| 车致| 虎林市| 宜都市| 白河县| 兰州市| 高阳县| 张北县| 文化|