国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種面向智能家居的語(yǔ)音端點(diǎn)檢測(cè)方法仿真

2017-02-05 06:21
關(guān)鍵詞:端點(diǎn)門(mén)限智能家居

楊 熙

?

一種面向智能家居的語(yǔ)音端點(diǎn)檢測(cè)方法仿真

楊熙

(湖南科技學(xué)院 電子與信息工程學(xué)院,湖南 永州 425199)

為了人機(jī)之間的智能化溝通,實(shí)現(xiàn)家居的真正智能化,有必要在智能家居系統(tǒng)中引入語(yǔ)音識(shí)別技術(shù),而端點(diǎn)檢測(cè)是語(yǔ)音識(shí)別前端處理中很重要的一環(huán)。文章針對(duì)傳統(tǒng)的雙門(mén)限端點(diǎn)檢測(cè)算法在實(shí)際運(yùn)用中存在的一些漏檢和虛檢情況,做了一些修正,并對(duì)改進(jìn)后的算法進(jìn)行了仿真驗(yàn)證。實(shí)驗(yàn)結(jié)果表明改進(jìn)后的算法具有一定的抗噪聲能力。

語(yǔ)音識(shí)別;智能家居;端點(diǎn)檢測(cè)

0 引言

隨著社會(huì)的進(jìn)步,人們對(duì)家居品質(zhì)的需求越來(lái)越高,智能家居成為當(dāng)今的熱點(diǎn),但人機(jī)接口方面卻仍局限于按鍵、觸摸屏等手動(dòng)操作,沒(méi)有實(shí)現(xiàn)人機(jī)之間基于自然語(yǔ)言的智能化溝通[1]。為了讓人與機(jī)器和人與人的交流方式一樣,實(shí)現(xiàn)家居的真正智能化,有必要引入語(yǔ)音識(shí)別技術(shù)。端點(diǎn)檢測(cè)是語(yǔ)音識(shí)別前端處理中很重要的一環(huán),它的工作就是確定語(yǔ)音信號(hào)的開(kāi)始位置和結(jié)束位置。精確的端點(diǎn)檢測(cè),不僅有利于讓系統(tǒng)僅處理語(yǔ)音輸入,降低對(duì)系統(tǒng)存儲(chǔ)空間的要求,還能節(jié)省處理時(shí)間,提高識(shí)別率。

實(shí)際應(yīng)用中,有效的語(yǔ)音端點(diǎn)檢測(cè)算法不僅要考慮檢測(cè)的精確性,還要求算法具有簡(jiǎn)單性。鑒于智能家居語(yǔ)音識(shí)別控制系統(tǒng)中,需要識(shí)別的語(yǔ)音樣本來(lái)自室內(nèi),故采用雙門(mén)限端點(diǎn)檢測(cè)算法。為了有一定的抗噪聲性能,對(duì)傳統(tǒng)的雙門(mén)限檢測(cè)法進(jìn)行了改進(jìn)。

1 傳統(tǒng)的雙門(mén)限端點(diǎn)檢測(cè)算法

語(yǔ)音信號(hào)通常有濁音段、清音段和靜音段之分,傳統(tǒng)的雙門(mén)限是利用兩個(gè)有效參數(shù):短時(shí)能量和過(guò)零率,來(lái)實(shí)現(xiàn)語(yǔ)音端點(diǎn)的檢測(cè)。從能量的角度來(lái)區(qū)分“靜音”還是“有聲”,但清音段的能量小,可也屬于語(yǔ)音段。那么怎么來(lái)處理?考慮到它的過(guò)零率比較大,因此用過(guò)零率來(lái)檢測(cè)。端點(diǎn)檢測(cè)時(shí),必須先分幀,分幀后再求短時(shí)能量和過(guò)零率,然后逐幀跟閾值進(jìn)行比較并判斷。

1.1短時(shí)能量

式(1)中,幀長(zhǎng)為N,n取0,1T,2T,…,這里T代表幀移。

1.2過(guò)零率

過(guò)零率指的是樣本改變符號(hào)的次數(shù)。對(duì)于語(yǔ)音信號(hào),定義為一幀信號(hào)中波形通過(guò)零電平的次數(shù)[2]。第幀語(yǔ)音信號(hào)的短時(shí)過(guò)零率Z為:

式(3)中,sgn[ ]為符號(hào)函數(shù)。

濁音能量較大,用短時(shí)能量來(lái)檢測(cè),清音的頻率較高,用過(guò)零率來(lái)找到它。經(jīng)典的雙門(mén)限端點(diǎn)檢測(cè)算法如圖1所示。能量門(mén)限有兩個(gè):一個(gè)較高的門(mén)限amp1,另外一個(gè)門(mén)限是amp2,門(mén)限amp2比門(mén)限amp1稍微要取得低些。若超過(guò)能量門(mén)限amp1,肯定是語(yǔ)音已開(kāi)始,通過(guò)低門(mén)限amp1確定語(yǔ)音的開(kāi)始N1和終止處N2,如果是清音的話,能量很弱,再用過(guò)零率進(jìn)一步來(lái)精確端點(diǎn)。

傳統(tǒng)的雙門(mén)限端點(diǎn)檢測(cè)算法在實(shí)際應(yīng)用時(shí),如果處理不當(dāng),存在錯(cuò)把干擾當(dāng)語(yǔ)音的虛檢或錯(cuò)把停頓當(dāng)語(yǔ)音結(jié)束的漏檢問(wèn)題,特別是當(dāng)有較大干擾時(shí)[3]。

圖1.用能量和過(guò)零率進(jìn)行端點(diǎn)檢測(cè)

為了克服傳統(tǒng)端點(diǎn)檢測(cè)算法的一些缺點(diǎn),因此有必要對(duì)它做一些修正。下面對(duì)傳統(tǒng)的算法做了一些改進(jìn)。

2 改進(jìn)的端點(diǎn)檢測(cè)算法

(1)采用多門(mén)限判定。除了設(shè)定短時(shí)能量的高低兩個(gè)門(mén)限amp1和amp2,過(guò)零率閾值z(mì)cr,還增設(shè)了字與字之間的最大靜音門(mén)限maxsilence;最小語(yǔ)音長(zhǎng)度門(mén)限minlen。其中maxsilence是為了防止漏檢;minlen是為了排除一些突發(fā)性的噪聲,防止誤檢。

(2)動(dòng)態(tài)設(shè)置閾值。利用語(yǔ)音前導(dǎo)無(wú)話段來(lái)估算噪聲的特性,即對(duì)前導(dǎo)無(wú)聲段,一般取200ms左右,估算背景噪聲的短時(shí)平均過(guò)零率和短時(shí)平均能量,再在這兩值的基礎(chǔ)上設(shè)置能量和過(guò)零率的閾值,這樣改進(jìn)后的端點(diǎn)檢測(cè)算法會(huì)具有一定的抗噪聲性能。這里高低能量門(mén)限分別取的是前導(dǎo)無(wú)話段平均能量值的2倍和4倍;過(guò)零率門(mén)限取前導(dǎo)無(wú)話段平均過(guò)零率的2倍;最大靜音門(mén)限maxsilence和最小語(yǔ)音長(zhǎng)度門(mén)限minlen分別取8和5,maxsilence和minlen參數(shù)還和說(shuō)話人的語(yǔ)速有關(guān)系,所以以上這些參數(shù)的選取都應(yīng)根據(jù)實(shí)際情況進(jìn)行調(diào)整。

(3)修正過(guò)零率。實(shí)際中由于噪聲的存在,系統(tǒng)存在零漂移,這時(shí)用式(3)計(jì)算出的短時(shí)過(guò)零率來(lái)區(qū)分清音段和無(wú)聲段,將會(huì)影響端點(diǎn)檢測(cè)效果。為了保證過(guò)零率計(jì)算的穩(wěn)定,需要對(duì)(3)式進(jìn)行修正。修正后的過(guò)零率按式(4)進(jìn)行計(jì)算。T為經(jīng)驗(yàn)值,這里取0.02。

算法思路是當(dāng)某幀信號(hào)大于能量低門(mén)限amp2或者大于過(guò)零率閾值ZCR時(shí),找到語(yǔ)音的起始點(diǎn),當(dāng)大于能量高門(mén)限amp1時(shí),肯定是語(yǔ)音信號(hào),如果它的持續(xù)時(shí)間還能不小于minlen,則就是我們所需的要檢測(cè)出來(lái)的語(yǔ)音信號(hào)。

整個(gè)端點(diǎn)檢測(cè)過(guò)程是基于狀態(tài)轉(zhuǎn)移的,有5個(gè)轉(zhuǎn)移狀態(tài)。其中status0表示包含噪聲的靜音態(tài),status1表示語(yǔ)音的起始過(guò)渡態(tài),status2表示真正的語(yǔ)音態(tài),status3表示字與字間的停頓態(tài),status4表示檢測(cè)完畢的結(jié)束態(tài)。設(shè)置標(biāo)志位fag,當(dāng)fag=1時(shí),繼續(xù)往后掃描后續(xù)單字的端點(diǎn),當(dāng)flag=0時(shí),表示已經(jīng)找到語(yǔ)音的結(jié)束點(diǎn),并返回。這5個(gè)狀態(tài)之間的轉(zhuǎn)換關(guān)系如圖2所示。

圖2.改進(jìn)端點(diǎn)檢測(cè)的狀態(tài)轉(zhuǎn)移示意圖

3 仿真與分析

圖3為女聲“關(guān)機(jī)”的端點(diǎn)檢測(cè)結(jié)果,從原語(yǔ)音波形可以看出來(lái)在50幀到100幀之間有明顯的突發(fā)性噪聲;圖4是女聲“打開(kāi)空調(diào)”的語(yǔ)音樣本,疊加了40dB的高斯隨機(jī)噪聲。

圖3.女聲“關(guān)燈”的端點(diǎn)檢測(cè)結(jié)果

圖4.帶噪語(yǔ)音“打開(kāi)空調(diào)”端點(diǎn)檢測(cè)結(jié)果

從圖3和圖4仿真結(jié)果可看出,用基于動(dòng)態(tài)噪聲的改進(jìn)端點(diǎn)檢測(cè)方法,對(duì)于突發(fā)性噪聲及信噪比不是太低時(shí)都有比較不錯(cuò)的端點(diǎn)檢測(cè)效果。

[1] 劉萌,趙建平,等.基于語(yǔ)音識(shí)別的家庭智能監(jiān)控系統(tǒng)設(shè)計(jì)[J].電聲技術(shù),2016,(10):58-59.

[2]孫一鳴,吳楊揚(yáng),李平.基于改進(jìn)雙門(mén)限法的語(yǔ)音端點(diǎn)檢測(cè)研究[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2016,(1):92-95.

[3] 薛勝堯.基于改進(jìn)型雙門(mén)限語(yǔ)音端點(diǎn)檢測(cè)算法的研究[J].電子設(shè)計(jì)工程,2015,(4):78-81.

(責(zé)任編校:宮彥軍)

2016-02-16

湖南省教育廳科研項(xiàng)目(項(xiàng)目編號(hào)16C0683);永州市科技計(jì)劃項(xiàng)目(項(xiàng)目編號(hào)永科[2015]9號(hào))。

楊熙(1982-),女,湖南永州人,講師,碩士研究生,研究方向?yàn)檎Z(yǔ)音識(shí)別,嵌入式系統(tǒng)。

TP391

A

1673-2219(2017)10-0037-02

猜你喜歡
端點(diǎn)門(mén)限智能家居
非特征端點(diǎn)條件下PM函數(shù)的迭代根
基于規(guī)則的HEV邏輯門(mén)限控制策略
隨機(jī)失效門(mén)限下指數(shù)退化軌道模型的分析與應(yīng)用
VoLTE感知智能優(yōu)化
基于PLC的智能家居控制系統(tǒng)研究
不等式求解過(guò)程中端點(diǎn)的確定
基于Neyman-Pearson準(zhǔn)則的自適應(yīng)門(mén)限干擾抑制算法*
基于Zigbee的無(wú)線通信技術(shù)在智能家居中的應(yīng)用
智能家居發(fā)展或?qū)?shí)現(xiàn)彎道超車
基丁能雖匹配延拓法LMD端點(diǎn)效應(yīng)處理