国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語音與噪聲的特性及其研究現(xiàn)狀

2014-04-29 01:41:22梁李鵬陸永耕
電腦迷 2014年11期
關(guān)鍵詞:語音識別信噪比噪聲

梁李鵬 陸永耕

摘 要 在噪聲環(huán)境下的語音識別率將會受到嚴(yán)重的影響。語音增強(qiáng)是解決噪聲污染的有效方法。在語音增強(qiáng)技術(shù)中,語音識別和說話人識別是很重要的。因此,識別裝置通常工作在環(huán)境噪聲下。語音增強(qiáng)不僅與信號處理技術(shù)相關(guān),并涉及到人的聽覺感知和語音認(rèn)知。由于噪聲的來源有很多,在不同的應(yīng)用場合,其特點(diǎn)也各不相同,因此很難確定一個(gè)通用的適用于各種環(huán)境噪聲的語音增強(qiáng)算法。根據(jù)不同的噪聲,采用不同的語音增強(qiáng)策略。

關(guān)鍵詞 語音識別 語音增強(qiáng) 噪聲 算法 信噪比

中圖分類號:TN912 文獻(xiàn)標(biāo)識碼:A

1語音與噪聲的研究現(xiàn)狀

在言語交際中,人們不可避免地受周圍環(huán)境的影響,如傳輸介質(zhì)噪聲,通信裝置內(nèi)的電噪聲,和其他說話人的聲音等。由于噪聲干擾的存在,接收到的語音不是原來干凈的語音信號,因?yàn)樵卩须s的語音信號中存在著噪聲污染。例如,安裝在車輛上,飛機(jī)或船上的電話,街道或在戰(zhàn)場上的公共電話與機(jī)場廣播,在強(qiáng)背景噪聲下往往會受到噪音干擾,嚴(yán)重影響通信的質(zhì)量。室內(nèi)電話會議和語音廣播混合各會場的回聲,影響收聽效果。深海潛水員的演講會因?yàn)榕宕髦ぱ鯕饷嬲侄д?,歷史悠久的老唱片與舊磁帶會產(chǎn)生噪聲,從而引發(fā)失真的現(xiàn)象,這些都是語音帶噪音的實(shí)際例子。

多年來,各種語音增強(qiáng)算法的寬帶噪聲存在的人。雖然語音增強(qiáng)還沒有建立完整的理論體系,但一些語音增強(qiáng)算法已被證明是有效的。常用的語音增強(qiáng)算法大致分為兩種:基于語音產(chǎn)生模型參數(shù)的增強(qiáng)方法和基于非語音產(chǎn)生模型參數(shù)的增強(qiáng)方法。基于語音產(chǎn)生模型參數(shù)的方法主要有卡爾曼濾波方法和基于隱馬爾可夫模型的方法,他們對語言產(chǎn)生的模型參數(shù)和恢復(fù)特性做合理的估計(jì)。但由于語音生產(chǎn)模型的參數(shù)難以被評估,很難得到準(zhǔn)確的低信噪比,并且由于迭代和增加算法的復(fù)雜度,該算法沒有取得實(shí)質(zhì)性的進(jìn)展。不基于語音生成模型的語音增強(qiáng)方法主要包括自適應(yīng)噪聲濾波方法,譜減算法以及短時(shí)譜估計(jì)增強(qiáng)算法。這種算法相比于基于語音生成模型的語音增強(qiáng)算法,參數(shù)設(shè)置簡單,信噪比大大提高,在語音增強(qiáng)的實(shí)際應(yīng)用中得到了廣泛的應(yīng)用。在該算法中,譜減算法作為基本算法,簡單而易于實(shí)現(xiàn),具有良好的性能和廣泛的應(yīng)用。

在實(shí)際的需求下,語音增強(qiáng)技術(shù)早就引起了人們的關(guān)注,許多工程技術(shù)人員與科學(xué)家多年來一直鍥而不舍進(jìn)行這方面的研究。隨著數(shù)字信號處理理論的發(fā)展,上世紀(jì)七十年代,語音增強(qiáng)技術(shù)的研究已經(jīng)達(dá)到了一個(gè)高潮,得到了一些基本結(jié)果,使語音增強(qiáng)技術(shù)成為了數(shù)字語音信號處理的一個(gè)重要分支。之后,隨著大規(guī)模集成電路和計(jì)算機(jī)技術(shù)的發(fā)展,語音增強(qiáng)算法的仿真技術(shù)推動(dòng)語音增強(qiáng)技術(shù)的發(fā)展提供了必要的條件,語音增強(qiáng)中的應(yīng)用研究進(jìn)入了一個(gè)嶄新的階段。

語音增強(qiáng)的目的是提取盡可能多的從帶噪語音信號中原始的純凈語音。然而,由于干擾通常是隨機(jī)的,從帶噪語音中提取完全純粹的語音幾乎是不可能的。在這種情況下,語音增強(qiáng)的主要目的有兩個(gè):首先是語音質(zhì)量的改進(jìn),消除了背景噪聲,使人們愿意接受,不感覺疲勞,這是一個(gè)主觀的方法,其次是提高信噪比,這是一個(gè)客觀的測量。這兩個(gè)目標(biāo)往往是不相同的。目前有一種針對于低信噪比的語音增強(qiáng)方法,雖然可以顯著降低背景噪聲,提高語音信號的信噪比,但它會嚴(yán)重降低語音質(zhì)量。

2語音與噪聲的特性

2.1語音的特性

語音是一段非平穩(wěn)的隨機(jī)過程,但由于聲帶和聲道的形狀在一段相對穩(wěn)定的時(shí)間內(nèi)是不會產(chǎn)生突變的,因此可以得出結(jié)論:語音的特征是不變的,所以語音具有短時(shí)譜的相對穩(wěn)定性。這種平穩(wěn)的語音可以使用短時(shí)譜來進(jìn)行分析。

清音和濁音是語音的兩大分類。濁音在頻域中存在一個(gè)明顯的周期性,在時(shí)域中具有共振峰結(jié)構(gòu),但大部分能量集中在低頻段。清音段沒有明顯的時(shí)域和頻域特性,類似于白噪聲。在語音增強(qiáng)技術(shù)中,可以使用具備周期性特征的濁音,使用梳狀濾波器來提取語音分量或抑制非語音信號,而清音和寬帶噪聲則難以區(qū)分。

通過對語音信號的統(tǒng)計(jì)分析,可以用來描述語音的特征。由于語音是不穩(wěn)定的,是非遍歷隨機(jī)過程,所以長時(shí)域的語音增強(qiáng)技術(shù)的統(tǒng)計(jì)特性意義不大。隨時(shí)間變化的幅度統(tǒng)計(jì)特性具有短期語音頻譜,并且只有當(dāng)分析幀的長度趨向于無窮大時(shí),才近似可以被認(rèn)為是具有高斯分布的。在高斯分布模型的基礎(chǔ)上可以獲得中心極限定理。在寬帶噪聲污染的語音增強(qiáng)技術(shù)中,這種假設(shè)可以被認(rèn)為是分析的前提。

2.2噪聲的特性

不同的實(shí)際應(yīng)用中會有不同的噪聲特性,并且噪聲能發(fā)生很大變化。噪聲可以是加性的,但也可以是非加性的。一些非加性噪聲可以轉(zhuǎn)換為加性噪聲。例如,同態(tài)乘性噪聲通過噪聲卷積變換可以成為加性噪聲。加性噪聲通常分為周期性噪聲,脈沖噪聲,寬帶噪聲和語音的干擾噪聲和其他非加性噪聲,包括混響電路噪聲和傳輸網(wǎng)絡(luò)噪聲。

語音增強(qiáng)要利用到噪聲的各種參數(shù),噪聲評估的精確度對后續(xù)算法具有顯著直接的影響,因此預(yù)先準(zhǔn)確地估算噪聲對語音增強(qiáng)的影響是非常重要的。當(dāng)對噪聲進(jìn)行估計(jì)時(shí),通常假設(shè)要估計(jì)的噪聲具有零均值。在許多噪聲估計(jì)方法中,有檢測無聲語音信號和有聲語音信號的。

參考文獻(xiàn)

[1] 張俊.基于譜減算法語音增強(qiáng)的研究[J]. 信息技術(shù),2009(03).

[2] 范立,侯強(qiáng),吳題,李娟.變噪聲環(huán)境下語音增強(qiáng)算法性能比較[J]. 武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2009(02).

猜你喜歡
語音識別信噪比噪聲
噪聲可退化且依賴于狀態(tài)和分布的平均場博弈
基于深度學(xué)習(xí)的無人機(jī)數(shù)據(jù)鏈信噪比估計(jì)算法
低信噪比下LFMCW信號調(diào)頻參數(shù)估計(jì)
電子測試(2018年11期)2018-06-26 05:56:02
低信噪比下基于Hough變換的前視陣列SAR稀疏三維成像
控制噪聲有妙法
通話中的語音識別技術(shù)
面向移動(dòng)終端的語音簽到系統(tǒng)
農(nóng)業(yè)物聯(lián)網(wǎng)平臺手機(jī)秘書功能分析與實(shí)現(xiàn)
保持信噪比的相位分解反褶積方法研究
基于Android手機(jī)語音和Arduino控制板的機(jī)器人控制系統(tǒng)
花垣县| 堆龙德庆县| 扶余县| 阿拉善右旗| 长丰县| 保德县| 易门县| 磐石市| 德庆县| 阳泉市| 岳阳市| 乌鲁木齐县| 万年县| 乐至县| 山东| 青河县| 黑山县| 凌海市| 兰考县| 永顺县| 进贤县| 通化市| 江源县| 临潭县| 易门县| 东阳市| 新源县| 三原县| 大悟县| 阿城市| 南澳县| 焉耆| 浏阳市| 洪泽县| 灵宝市| 保亭| 鄂尔多斯市| 合江县| 开封县| 穆棱市| 尼勒克县|