呂麗鵬 張歆奕
(五邑大學(xué),廣東 江門 529020)
語音信號的處理是我們語音學(xué)中很重要的一項,它以語音學(xué)和數(shù)字信號處理為基礎(chǔ)而形成的一個綜合性的學(xué)科?,F(xiàn)有的時頻分析方法有很多,針對我們語音信號,常用的時頻分析方法有短時傅里葉變換,窗口傅里葉變換,連續(xù)小波變換,希爾伯特變換等[1]。本文針對語音信號的特點,結(jié)合常用的得到語音信號時頻圖的語譜圖方法,把小波脊提取方法運用到語音信號的頻譜提取中,并對兩種方法進(jìn)行了對比。
現(xiàn)代語音信號處理中,我們常用語譜圖方法得到語音信號的時頻譜,小波在語音信號的處理中運用的比較多,但是在語音信號的時頻圖取得方面運用比較少。
待分析的信號形式如下:
以上各個變量的物理意義是:b表示平移因子,如果變換過程中消除了偏移,b和時間t是意義對應(yīng)的,因此A(b)表示時間點b上的振幅大小,Φ′(b)表示時間點b上的瞬時頻率,Φ(b)表示時間點b上的瞬時相位[2]。
信號經(jīng)過多個尺度的連續(xù)小波變換后,得到一個小波變換平面(小波變換域),小波變換域點的位置有平移因子b和尺度因子a決定,當(dāng)信號的振幅A(t)和瞬時頻率Φ′(b)在窗函數(shù)g(t)的支集上有較小的變化,并且假定式成立忽略一些誤差,因此G(ω)在ω=0時最大,由式子可知,對每個b值,信號的連續(xù)小波變換模在ξ(b)=Φ′(b)處最大,相應(yīng)的小波變換域上的時頻點(b,ab)=(b,ω0/Φ′(b))成為脊點,其中ω0是小波基的匯總新頻率,ab表示脊點上的尺度值。在每一個脊點,式子近似為
對上式做進(jìn)一步分析可知,脊上的數(shù)據(jù)表現(xiàn)出和原信號最相似的特性,脊的起伏變化對應(yīng)著信號幅度的變化;脊所在的位置的尺度值對應(yīng)著信號瞬時頻率的變化,各個信號分量的主要參數(shù)均可以從各自對應(yīng)的脊上的信息中提取出來。
常用的小波脊線提取方法有兩種:基于模極大值的小波脊線提取算法以及基于相位信息的小波脊線提取算法。本文主要針對前者進(jìn)行論述,至于后者有興趣的讀者可見參考文獻(xiàn)[4]。
由小波脊線理論可知,形式如下的信號:
當(dāng)選擇解析小波 φ(t)=g(t)exp(iω0t)對其進(jìn)行連續(xù)小波變換時,在滿足定的條件下,其連續(xù)小波變換的近似結(jié)果如下:
式子中,a是尺度因子,b是平移因子,A(b)是信號在b點的瞬時幅度,Φ′(b)是信號在 b 點的瞬時頻率,G 是 g(t)的傅里葉變換,ξ=ω0/a 對上式求模,并作歸一化處理有:
(1)首先對信號的帶寬范圍進(jìn)行粗估計,然后設(shè)定小波變換的尺度因子范圍。
(2)離散化尺度因子。選定一個尺度因子間隔△a,在尺度因子范圍內(nèi),每隔△a,對信號作一個尺度的連續(xù)小波變換。一共要做a個尺度的連續(xù)小波變換。
(3)對于每一個b點,搜索小波變換結(jié)果的模極大值所對應(yīng)的尺度ab,然后將搜索得到所有點(b,ab)連接起來,作為提取到的小波脊線。
這種求模極大值的方法由于要計算多個尺度下的連續(xù)小波變換,因此它的計算速度慢[5]。另外,這種方法適用的條件是:在連續(xù)小波變換域上,模極大值對應(yīng)的位置是唯一確定的,是對應(yīng)著信號脊線的位置,如果噪聲較弱,該條件還能滿足,但是當(dāng)噪聲比較強是,則在變換域上不僅有信號對應(yīng)的脊,而且會因為噪聲的影響產(chǎn)生一些局部的極值點,從而對脊的提取造成影響,使得提取到的脊停留在局部極值上,而不能提取到真正的脊線,因此我們總結(jié)一下為了使我們在小波脊將信號的瞬時頻率和瞬時幅度分離出來時取得一條明顯的小波脊線,由小波脊的公式可得,必須滿足兩個根本條件:
(1)只有當(dāng)小波的調(diào)制頻率等于信號的載波頻率時才能在小波變換域上呈現(xiàn)出小波脊,在小波脊上的信號的瞬時頻率和小波的中心頻率滿足下式子:
其中ω0是弧度表示的小波基中心頻率,ω是弧度表示的信號的瞬時頻率,a是尺度因子。
(2)在小波的時窗范圍內(nèi),信號的瞬時頻率保持不變。
下圖為一個運用小波脊提取方法提取獲得頻譜圖的實例。本文利用MATLAB軟件對信號進(jìn)行仿真。所取仿真信號為兩個信號連接起來的信號,其中為兩個信號分別為:
圖1 小波脊提取時頻圖
圖2 小波脊提取時間尺度三維圖
圖3 小波脊提取的脊線圖
由圖1可以看出,原來含有多個諧波分量的信號在經(jīng)過小波脊方法得到的頻譜圖中,各個諧波分量十分清晰,其他噪音干擾等比較少,而后利用模極大值法可以得到兩條很清晰的脊線,圖4為小波脊提取的時間尺度和幅值的三維圖。圖3為最終得到的脊線圖。
與語譜圖方法的對比
本研究所采用的語音信號為阿拉伯?dāng)?shù)字的5,由錄音軟件cool edit完成,錄音者為男性,采樣頻率為16000Hz。
通過MATLAB編程分別運用快速傅里葉變換得到語譜圖以及通過小波脊提取方法得到語音信號的頻譜圖。
方法一為語音信號進(jìn)行加窗分幀然后進(jìn)行快速傅里葉變換得到其語譜圖。其中窗口函數(shù)為hanning窗,一幀處理2048個點,幀移值為32,得到的語譜圖如下:
下圖為同樣的信號經(jīng)過方法二小波脊提取方法得到的頻譜圖:
圖4 語音信號的語譜圖
圖5 小波脊提取方法得到的時頻圖
圖6 小波脊提取得到的時間尺度三維圖
圖4為語音信號進(jìn)行加窗分幀時為了得到較好的頻率特性,運用了hanning窗,并且窗長為2048,得出的頻率分辨率為7.8125Hz。在窄帶濾波語譜圖中分辨率也相當(dāng)高了,但是相對于圖五通過小波脊提取得到的時頻圖來說,精細(xì)度就差了很多。小波脊的提取方法很好分辨出每個諧波,并且在非諧波以外的頻率信號得到了很好的抑制,因此得到的時頻圖中看起來特別“干凈”。
對于小波脊線的提取,因為語音信號中的諧波分量比較多所以得到的脊線也比較多,因此在脊線的提取時需要參照由小波脊提取方法得到的頻譜圖后對頻率進(jìn)行分段然后提取,這里就不一一贅述,有興趣的讀者可以參看文獻(xiàn)[2]。
兩者進(jìn)行對比很容易得出,小波脊提取方法用于語音信號處理時,通過時頻分析可以得到低頻頻率部分光滑平整,局部單點少整個畫面清晰,頻率分辨率高,這對于得到的時頻參數(shù)后續(xù)用來進(jìn)行基頻分析,共振峰提取等有極大的幫助。
本文針對語音信號的特點為了得到語音信號的頻譜圖,分別介紹了常用的語譜圖方法以及小波脊提取方法,并著重介紹了小波脊提取方法對信號處理的實現(xiàn)方法,最后把小波脊提取的方法運用到語音信號處理中,并與語譜圖方法得到的結(jié)果進(jìn)行了對比,突出了小波脊提取方法在時頻處理中的優(yōu)點。
[1]蔡蓮紅,黃德智,蔡銳.現(xiàn)代語音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003:236-238.
[2]張緒省,朱貽盛,成曉雄,等.信號包絡(luò)提?。簭南柌刈儞Q到小波變換[J].電子科學(xué)周刊.
[3]Nathalie Delprat,Bernard Escudie Guillemain,Richard Kronland-Martinet,Philippe Ichamitechian,Bruno Torresani Asymptoic Wavelet and Gabor Analysis:Extraction of Instantaneous Frequencies[J].IEEE Transactions on information theory 1992,38(2):644-664.
[4]王兵,羿旭明.一種提取小波脊線的迭代算法[J].數(shù)學(xué)雜志,2005,25(3):295-298.
[5]袁曉,虞突厥邦.復(fù)解析小波變換與語音信號包絡(luò)提取和分析[J].電子學(xué)報,1999,27(5):142-144.