張娓娓 陳樂瑞
(1.河南工業(yè)職業(yè)技術(shù)學(xué)院電氣工程系,河南 南陽 473000;2.鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450001)
基于PSO-BP的語音增強(qiáng)方法研究
張娓娓1陳樂瑞2
(1.河南工業(yè)職業(yè)技術(shù)學(xué)院電氣工程系,河南 南陽 473000;2.鄭州鐵路職業(yè)技術(shù)學(xué)院,河南 鄭州 450001)
針對一些常用語音增強(qiáng)方法的特點和不足,本文提出將改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法用于語音增強(qiáng),仿真結(jié)果表明:基于PSO-BP神經(jīng)網(wǎng)絡(luò)的語音增強(qiáng)方法可以較大幅度的提升帶噪語音信號的信噪比,效果明顯。
語音增強(qiáng);帶噪語音信號;信噪比
語音增強(qiáng)[1]是指當(dāng)語音信號受到噪聲干擾,從含噪語音中提取盡可能純凈的原始語音的技術(shù)。目前,國內(nèi)外諸多學(xué)者對語音增強(qiáng)領(lǐng)域進(jìn)行了研究,并提出了多種方法,譜減法[2,3]因為其計算量比較小,比較容易實現(xiàn),應(yīng)用得也較多。文獻(xiàn)[2]提出了小波分層閾值處理法,其對于低信噪比下的處理結(jié)果不太理想,為此本文使用改進(jìn)的粒子群優(yōu)化神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)算法對低信噪比下的帶噪語音信號進(jìn)行了進(jìn)一步處理。
2.1 PSO優(yōu)化BP網(wǎng)絡(luò)算法
2.1.1 基本粒子群算法
在允許范圍內(nèi)隨機(jī)產(chǎn)生粒子的速度和位移,之后根據(jù)(1)、(2)式迭代,直到找到滿意的解為止。
2.1.2 粒子群算法的改進(jìn)
2.1.3 改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)步驟
第一步:初始化設(shè)置。
第二步:先對每個粒子的適應(yīng)度值進(jìn)行計算,然后將計算出來的各個粒子的適應(yīng)度值進(jìn)行比較,并對各個粒子的適應(yīng)度值進(jìn)行線性排列。
第三步:按照(1)和(2)式更新粒子的位移以及其速度,(1)式中w由w(k)代替。
第四步:計算各個個體的選擇概率,之后選擇、交叉,使得新一代種群生成。
第五步:若粒子群優(yōu)化BP網(wǎng)絡(luò)算法的終止條件被滿足,可以求出最優(yōu)解。如若終止條件沒有得到滿足,需要轉(zhuǎn)到第二步繼續(xù)進(jìn)行。
第六步:確定網(wǎng)絡(luò)參數(shù),使用相應(yīng)的訓(xùn)練樣本對網(wǎng)絡(luò)進(jìn)行分幀訓(xùn)練。
第七步:停止運算。
2.2 仿真結(jié)果分析
原始信號的時域波形圖,以及在該原始信號上加噪后的時域波形圖如圖1所示,從圖1中可以明顯看出,噪聲完全淹沒了原始的語音信號。針對這樣的情況,單靠傳統(tǒng)的濾波器沒有辦法將噪聲濾掉,即無法將原始信號從噪聲中提煉出來,而神經(jīng)網(wǎng)絡(luò)卻具備了很好的非線性映射能力,正是利用網(wǎng)絡(luò)非線性映射能力這一特點,可以對低信噪比下的帶噪信號進(jìn)行增強(qiáng)處理。
圖 1 原始語音信號波形圖和帶噪信號的波形圖
圖2 使用BP和PSO-BP網(wǎng)絡(luò)對帶噪語音的處理結(jié)果
圖2是使用BP網(wǎng)絡(luò)和改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)對同一段帶噪語音的處理結(jié)果。在處理效果上,與BP網(wǎng)絡(luò)相比,帶噪語音經(jīng)改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)處理后,其噪聲成分有了更大衰減。在主觀聽覺上,使用改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法處理后的語音中仍然有較大噪聲存在,但與BP網(wǎng)絡(luò)的處理結(jié)果相比,原始語音可以聽得更清楚。
3.1 實錄環(huán)境
錄音環(huán)境為一報告廳,可容納300人,錄音時的噪聲有腳步聲,拿東西和放東西聲,竊竊私語聲,翻動紙張聲等,即報告廳常見噪聲。錄音軟件采用Windows系統(tǒng)自帶的錄音機(jī)軟件,量化為16位,采樣頻率為11025。
3.2 仿真結(jié)果分析
實錄語音段的內(nèi)容為:“過程控制系統(tǒng)是實現(xiàn)生產(chǎn)過程自動化的平臺,而過程控制儀表與裝置是過程控制系統(tǒng)不可缺少的重要組成部分?!笔褂酶倪M(jìn)PSO-BP網(wǎng)絡(luò)對上述帶噪語音段進(jìn)行增強(qiáng)處理,在未進(jìn)行增強(qiáng)處理時,語音信號被淹沒在噪聲里,主觀聽覺上,語音段內(nèi)容幾乎聽不到。經(jīng)語音方法增強(qiáng)后有所改觀,但是譜減法的語音增強(qiáng)處理結(jié)果和小波分層閾值法語音增強(qiáng)處理結(jié)果,效果并不是太明顯,平均意見得分也僅在1.5左右。但是經(jīng)過PSO-BP網(wǎng)絡(luò)處理后,語音的內(nèi)容已經(jīng)基本上能聽清楚,語音的質(zhì)量和可懂度也得到了提高,平均意見得分為2.2。
分別使用譜減法、小波分層閾值法、BP網(wǎng)絡(luò)、改進(jìn)PSO-BP方法對同一段信噪比為-9.66dB的帶噪語音信號進(jìn)行增強(qiáng)處理的性能比較如表1所示。
表 1 不同方法的性能
本文提出了改進(jìn)粒子群優(yōu)化BP網(wǎng)絡(luò)算法,并分別用譜減法、小波分層閾值法、BP網(wǎng)絡(luò)、改進(jìn)PSO-BP對語音信號進(jìn)行了仿真處理。仿真結(jié)果表明,使用PSO-BP神經(jīng)網(wǎng)絡(luò)對帶噪語音進(jìn)行增強(qiáng)處理,可以大幅提高信噪比,效果明顯。
圖 3 極端噪聲環(huán)境下不同方法的處理結(jié)果
[1]張雄偉,陳亮,楊吉斌.現(xiàn)代語音處理技術(shù)及應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2003.
[2]靳志強(qiáng),萬紅.小波分層閾值處理在語音增強(qiáng)中的應(yīng)用[J],煤炭技術(shù),2010:54-56.
[3]李季,孫秀霞,李士波,等.基于遺傳交叉因子的改進(jìn)粒子群優(yōu)化算法[J].計算機(jī)工程,2008,34(2):181~183.
[4]韓瑞通,王書明,黃理善,等.交叉粒子群算法在大地電磁反演中的應(yīng)用[J].工程地球物理學(xué)報.2009,6(2):223~228.
[5]Adam Borowicz,Alexandr Petrovsky.Signal subspace ap?proach for psy-choacoustically motivated speech enhancement[J]. Speech Communicat-ion.2010(2).
[6]阮兆文.基于聲學(xué)模型和小波變換的語音增強(qiáng)方法研究[D].合肥:中國科技大學(xué),2009.
[7]李如瑋,鮑長春,竇慧晶.基于小波變換的語音增強(qiáng)算法綜述[J].數(shù)據(jù)采集與處理.2009(03).
[8]Stephen So,Kuldip K.Paliwal.Modulationdomain Kal?man filtering for single-channel speech enhan-cement[J]. Speech Communication.2011(6).
TN912
A
1671-0037(2014)04-60-1.7