趙曉雷
(渭南師范學院網(wǎng)絡(luò)安全與信息化學院 渭南 714099)
在人類生活中,信息交換的形式多種多樣,而語音傳遞信息則成為交換信息的最有效、最常用的形式,由于在現(xiàn)實生活中獲取語言時存在著各種各樣的噪聲,勢必影響語音質(zhì)量的高低。語音信號分析方法有多種,比如從時域方面進行分析,或者從頻域這個方面進行分析,另外還有模型分析方法和非模型分析方法等等。傅立葉變換是將信號系統(tǒng)的時域和頻域的特性聯(lián)系起來的一種分析信號的方法,它不僅能夠[1]用來分析信號中的成分,也可以將分析的成分再合成信號,同時,也可以利用其他形式的波比如方波等作為信號數(shù)據(jù)來使用。因此可以將傅里葉變換應(yīng)用到語音信號處理上,在語音信號[2]處理上可以取得一定的效果。
對語音信號分析是完成語音信號參數(shù)的特點分析,只有這樣才有可能處理這些參數(shù),比如語音通信、語音合成、語音識別等,而且,對音質(zhì)而言,語音[3]由于采集過程中的限制和周圍環(huán)境的影響也有好壞之分,比如識別率和影響率的大小,這些都會影響到分析出來語音信號的準確性和精確性。
語音分析無論是在選擇使用的參數(shù)還是在分析方法上,都必須按幀[4]進行?!岸虝r分析技術(shù)”它在整個語音信號的分析過程中都有貫穿,而且在整個過程中也是一個不平穩(wěn)的過程。
時域分析顧名思義就是分析時域參數(shù),語音信號的時域分析主要是通過對采集來的語音信號本身的時域參數(shù)進行分析[5]。進行語音分析時,時域波形是我們最能夠直觀看到的。從根本上講語音信號的實質(zhì)也就是一種時域,在進行語音信號分析時最常采用的方法就是時域分析法,也是應(yīng)用與分析所采集信號的參數(shù)最基本的方法。
語音信號的頻域分析是針對語音信號的頻域特征進行分析。最常用的頻域分析法有帶通濾波器組法、傅里葉變換法、線性預(yù)測法[6]等。在用傅里葉變換表示語音信號之前,應(yīng)先用短時傅里葉變換對語音信號的頻譜進行分析,我們將所對應(yīng)的頻譜稱為“短時譜”。
假設(shè)f(t)是t函數(shù)的一個周期,其中t需要滿足一定條件,我們令其時間周期為兩個時間單位,保持連續(xù)或者第一類間斷點的各數(shù)為常數(shù)項,f(t)單調(diào)或可劃分成有限單調(diào)區(qū)間,則F(t)以周期為2T的傅里葉級數(shù)收斂,和函數(shù)F(ω)也是一個以周期函數(shù),周期為兩個時間單位,并且在這些點上并不連續(xù),這是一個有極限的函數(shù),并且在一個固定周期里面,它的極值點個數(shù)也是常數(shù)有限,這就是達到狄里赫萊。
傅立葉變換公式:
在音頻信號的研究中,常常需要對信號進行濾波,去分析某一個頻段的信號。我們經(jīng)常使用的數(shù)字濾波器有兩種,其中一種是FIR濾波器[7],有限長單位沖激響應(yīng)濾波器。它不但可以保證它的幅頻特性,而且還具有嚴格的線性相位特性,而它的單位抽樣響應(yīng)的長度是有限的,所以濾波器是一種非常穩(wěn)定的系統(tǒng)。另外一種是IIR濾波器,有延遲,不是線性相位的,同時其單位抽樣響應(yīng)是無限長的,所以兩者相比,F(xiàn)IR有線性相位上的優(yōu)勢。但是實際運用中,F(xiàn)IR雖然是線性相位,但是也存在延遲,這樣濾波后的信號總是有一定相位偏差,對信號分析造成很大干擾,即便是人為校正,也會帶來很多工作量。實際應(yīng)用中,我們需要的是一個零相移的濾波器[8],這樣在信號處理中,就能很好地保證我們非常關(guān)心的相位,而解決零相移問題,是可以實現(xiàn)的。在要求沒有具體到濾波器的實時性的時候,我們將濾波器的相位頻率特性設(shè)置為固定不變的0,從另外一個相對簡單的思路來說,就是讓一個信號序列在經(jīng)過濾波器濾波后[9~10],它的信號序列的相位沒有發(fā)生任何變化,我們就將這種濾波器稱之為零相移數(shù)字濾波器。
窗函數(shù)法的設(shè)計思想:便是用窗函數(shù)法設(shè)計FIR濾波器在時域進行。窗函數(shù)法設(shè)計FIR濾波器的流程圖如圖1所示。
圖1 窗函數(shù)法設(shè)計FIR濾波器的流程圖
這里以一個語音信號為例子,采樣時的頻率為8000Hz。將在不同頻帶(對這段語音加入不同頻段的噪聲,加入噪聲為高頻余弦噪聲振幅為0.3,頻率為3000Hz,和高頻率正弦噪聲振幅為0.3,頻率為10000 Hz,和低頻正弦頻率振幅為0.3,頻率為10 Hz),使用漢明窗設(shè)計FIR和零相移FIR,分別濾波,濾波后計算兩者的信噪比。通過對比它們?yōu)V波后的頻譜和信噪比來判斷濾波的好壞。
語音信號進行采集的部分[11~12],可以利用錄音工具進行信號的采集,然后對音頻格式進行轉(zhuǎn)換音頻格式,目的是為了使Matlab可以識別出來。
原始語音波形和頻譜如圖2,加入噪聲后的語音波形和頻譜圖如圖3所示。
使用線性FIR濾波器對語音去噪得到波形圖和頻譜圖,如圖4。
使用線性相移FIR濾波后信噪比:-3.4388。
出現(xiàn)負數(shù)的原因是:FIR濾波后信號出現(xiàn)了相位延遲變化[13~14],計算信噪比出現(xiàn)錯位,得到負數(shù),所以FIR濾波器對語音信號濾波會產(chǎn)生很大的相位缺信息丟失[15],雖然頻段上和幅值上基本符合要求,但是在加密水印等語音處理中,信號延遲,并且最后100個數(shù)據(jù)點丟掉了,意味著原始數(shù)據(jù)點信息的丟失。
圖2 原始語音波形和頻譜出圖
圖3 加入噪聲后語音波圖和語音頻譜圖
圖4 去除噪音的波形圖和頻譜圖
使用零相移FIR濾波器對信號濾波得到波形和頻譜如圖5,信噪比通過計算我們得到:加噪后信噪比:7.2679。
圖5 零相移FIR濾波器對信號濾波波形圖和頻譜圖
FIR去噪后信噪比:-3.4379。
零相移FIR去噪后信噪比:9.0203。
在以上的實驗中,相對普通濾波器使用零相移濾波器實現(xiàn)了信號的過濾,并且保留了很好的相位特性,零相移濾波器的過渡帶衰減比較大。零相移濾波器的濾波結(jié)果既保持了濾波幅度和頻域的特點,又很好地保留了相位信息,沒有造成數(shù)據(jù)損失,所以零相移濾波器在語音濾波處理中擁有比線性FIR濾波器更多的優(yōu)勢。
[1]黃克武,陶然,吳葵,王越.分數(shù)階傅里葉域與時域聯(lián)合干擾抑制研究[J]. 中國科學:技術(shù)科學,2011(10):1394-1404.
[2]Hong Kook Kim.Cepstrum-Domain Acoustic Feature Compensation Based on Decomposition of Speech and Noise for ASR in Noisy Environments[J].IEEE Transac?tions on Speech and Audio Processing,2003,11(5):435-446.
[3]Carrillo RE,Barner K E.Lorentzian based iterative hard thresholding for compressed sensing[C]//IEEE interna?tional Conference on Acoustics,Speech and Signal Pro?cessing.Prague,Czech Republic:IEEE Computer Soci?ety,2011:3664-3667.
[4]Carrillo RE,Barner K E.Lorentzian iterative hard thresh?olding:Robust compressed sensing with prior information[J].IEEE Transactions on Signal Processing,2013:4822-4833.
[5]徐巖,孟靜.基于粉紅噪聲的語音增強算法性能評價研究[J].鐵道學報,2011(04):53-58.
[6]于永江,王菲.基于DSP的語音處理教學實驗平臺設(shè)計[J]. 電子測試,2016(17)100-101.
[7]劉少華.基于獨立分量分析的語音信號分離及在數(shù)據(jù)采集卡上的實現(xiàn)[D].南京:廣西師范大學,2013.
[8]馬春.基于壓縮感知的語音信號重構(gòu)方法研究[D].合肥:安徽大學,2012.
[9]楊振,徐瓏婷.語音信號處理中魯棒性壓縮感知關(guān)鍵技術(shù)[J].數(shù)據(jù)采集與處理.2017(3):232-245.
[10]孫林慧.語音壓縮感知關(guān)鍵技術(shù)研究[D].南京:南京郵電大學,2012.
[11]陸希玉,詹杰,唐昆,崔慧娟.低功耗通用語音處理平臺的設(shè)計實現(xiàn)[J].微型機與應(yīng)用,2005(08):16-19.
[12]周偉雄.語音信號的神經(jīng)網(wǎng)絡(luò)非線性分析模型及應(yīng)用[D].廣州:華南理工大學,2010.
[13]Zhang Z,Rao B D.Recovery of block sparse signals using the framework of block sparse Bayesian learning[C]//IEEE international Conference on Acoustics,Speech and Signal Processing.Kyoto:IEEE,2012:3345-3348.
[14]劉鑫,金暄宏.基于LabVIEW的語音信號處理[J].軟件導報,2017(3):135-137.
[15]SiggCD,Dikk T,Buhmann J M.Speech enhancement us?ing generative dictionary learing[J].Audio,Speech,and Language Processing,IEEE Transactions on,2017,20(6):1689-1712.