楊素素
(南京航空航天大學(xué)金城學(xué)院,江蘇南京,210000)
由于每個(gè)人發(fā)出的語(yǔ)音中帶有各自語(yǔ)音信號(hào)特征,因此語(yǔ)音信號(hào)同其他信號(hào)一樣具有頻率、周期、能量等特征參數(shù)[1]。姚文冰指出:短時(shí)間內(nèi)語(yǔ)音信號(hào)通過(guò)自回歸(AR)模型由均值為零的高斯白噪聲e(n)通過(guò)激勵(lì)線性時(shí)不變系統(tǒng)A(Z)產(chǎn)生,線性時(shí)不變系統(tǒng)傳輸函數(shù)最小,通過(guò)高階積累量能夠有效減少背景噪聲影像,而應(yīng)用高階譜分析技術(shù)能夠有效提高語(yǔ)音編碼中的抗噪聲能力[2]。為能夠直觀清楚的辨別擁有共同特征參數(shù)的不同說(shuō)話者的語(yǔ)音,通過(guò)AR參數(shù)模型雙譜估計(jì)計(jì)算語(yǔ)音信號(hào)雙譜,利用高階累積量抑制高斯噪聲,使得語(yǔ)音信息特征研究更趨于直觀,提高語(yǔ)音辨別效果。
兩式中x*(n)是x(n)的共軛復(fù)數(shù),通過(guò)Hilbert變換得到復(fù)數(shù)信號(hào)后,當(dāng)3ω由1ω、2ω二次相位耦合后3ω=1ω+2ω,x(t)為耦合信號(hào),此時(shí)定義①中三階累積量及對(duì)角切片均為0,定義②中三階累積量及對(duì)角切片分別為:
通過(guò)上式可知①中雙譜運(yùn)算過(guò)程及對(duì)角切片不含耦合信息成分,②中包含全部諧波分量且雙譜運(yùn)算中保留所有諧波分量,(1.5)中僅含有諧波分量1ω、2ω,對(duì)角切片中僅含有諧波分量1ω、2ω。
在Labview環(huán)境中進(jìn)行聲卡編程,自由設(shè)定聲卡參數(shù),并通過(guò)Labview圖形化編程優(yōu)勢(shì)實(shí)現(xiàn)傳統(tǒng)儀器模塊效果。語(yǔ)音信號(hào)輸入后通過(guò)信號(hào)調(diào)理電路,對(duì)信號(hào)進(jìn)行放大、濾波、隔離及線性化處理正確識(shí)別聲卡,再通過(guò)PC機(jī)聲卡線路輸入或麥克風(fēng)輸入形成信號(hào)輸入端口,將所獲取模擬語(yǔ)音信號(hào)通過(guò)A/D轉(zhuǎn)換后輸入計(jì)算機(jī),經(jīng)過(guò)Labview程序處理并保存。通過(guò)計(jì)算機(jī)聲卡特性將其設(shè)置為44.1kHz采樣頻率、雙通道、16位采樣比特?cái)?shù)、手動(dòng)采集,確保數(shù)據(jù)采樣過(guò)程中干擾程度最小,實(shí)時(shí)波形穩(wěn)定。語(yǔ)音數(shù)據(jù)采集過(guò)程中要保證環(huán)境相對(duì)安靜,外部嘈雜聲音較小,參與實(shí)驗(yàn)的人員以語(yǔ)速穩(wěn)定、心情平穩(wěn)、緩慢的形式錄制固定數(shù)字的一段話,在Labview程序中設(shè)置好保存路徑后將語(yǔ)音錄制文件保存為WAV形式[3]。Labview程序數(shù)據(jù)分析包能夠提供多種語(yǔ)音信號(hào)處理程序,包塊信號(hào)調(diào)理、波形測(cè)量、信號(hào)監(jiān)測(cè)等,常用濾波器形式也比較多樣,因此在使用過(guò)程中只需輸入對(duì)應(yīng)指標(biāo)參數(shù)即可[4]。
在實(shí)數(shù)域內(nèi)對(duì)不同性別語(yǔ)音信號(hào)雙譜運(yùn)算及對(duì)角切片結(jié)果進(jìn)行分析,對(duì)比兩組男女生語(yǔ)音信號(hào)雙譜圖可發(fā)現(xiàn),男生雙譜圖的譜峰分布比較廣泛,但女生的分布比較集中。但整體對(duì)角切片圖變化特征不夠明顯。
圖1分別對(duì)對(duì)應(yīng)的復(fù)數(shù)域內(nèi)根據(jù)公式①進(jìn)行重新分析,圖1中1.1(a)譜峰多且比較尖細(xì),對(duì)角切片中主峰位置在200Hz處,而1.1(b)中主峰比較粗大,雙譜運(yùn)算圖中下部峰也比較粗,對(duì)應(yīng)的對(duì)角切片主峰位置在175Hz處。圖1.2(a)中出現(xiàn)三個(gè)比較高的峰譜,對(duì)應(yīng)的對(duì)角切片主峰位置在168Hz處,圖1.2(b)中主峰只有一個(gè)且比較尖細(xì),對(duì)應(yīng)的對(duì)角切片主峰位置在160Hz處,從圖1中可以看出經(jīng)過(guò)公式①的運(yùn)算處理后,不同性別語(yǔ)音信號(hào)的雙譜運(yùn)算結(jié)果及對(duì)角切片結(jié)果更加清晰簡(jiǎn)潔,能夠分別出不同聲音信號(hào)的特征,區(qū)分聲音。
圖1 復(fù)數(shù)域內(nèi)根據(jù)公式①處理后的雙譜及對(duì)角切片譜
圖2分別對(duì)對(duì)應(yīng)的復(fù)數(shù)域內(nèi)根據(jù)公式②進(jìn)行重新分析,圖2.1(a)中出現(xiàn)三個(gè)比較高的峰譜,雙譜運(yùn)算圖中三個(gè)峰譜均比較粗,對(duì)應(yīng)的對(duì)角切片主峰位置在 165Hz處,圖 2.1(b)中主峰只有一個(gè),較粗,下部峰較粗,對(duì)應(yīng)的對(duì)角切片有兩個(gè)比較高的峰譜,其中主峰位置在165Hz處,兩位男生語(yǔ)音信號(hào)對(duì)角切片主峰位置雖然很接近,但其余下部峰有明顯區(qū)別。2.2(a)譜峰多、尖細(xì)且比較集中,對(duì)角切片中主峰位置約在165Hz 處,2.2(b)中主峰共有三個(gè),尖細(xì)且集中,雙譜運(yùn)算圖中下部峰基本為零,對(duì)應(yīng)的對(duì)角切片主峰位置在125Hz處。從圖2中可以看出經(jīng)過(guò)公式②的運(yùn)算處理后,對(duì)角切片圖譜的區(qū)別比較明顯,且雙譜圖較未處理過(guò)的更為集中,亦能夠分辨聲音信號(hào)特征。
圖2 復(fù)數(shù)域內(nèi)根據(jù)公式②處理后的雙譜及對(duì)角切片譜
以上分析中可以看出每個(gè)人的語(yǔ)音信號(hào)雙譜圖與性別、語(yǔ)言、音色等有一定相關(guān)性,不同之處越多,雙譜圖及對(duì)角切片圖的變化越明顯。由于三階累積量的定義方式有所區(qū)別,但不同的定義方式下處理后的雙譜圖及對(duì)角切片圖均能夠區(qū)別語(yǔ)音信號(hào)特征比較相近的信息,使譜圖更加準(zhǔn)確、清晰。
語(yǔ)音信號(hào)雙譜圖之所以有很大區(qū)別,其原因在于不同因素影響下雙譜圖差別比較明顯,影響因素越多,差別越大。通過(guò)雙譜圖能夠有效區(qū)分不同語(yǔ)音信號(hào)特征的人,提升語(yǔ)音信號(hào)辨別準(zhǔn)確水平,同時(shí)雙譜圖分析對(duì)語(yǔ)音因素變化十分敏感,可有效處理信號(hào)變化,是語(yǔ)音信號(hào)辨別的一種行之有效的手段。