国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于MATLAB的語(yǔ)音信號(hào)采集和語(yǔ)譜圖分析

2015-06-24 13:08劉博
電腦知識(shí)與技術(shù) 2015年11期

劉博

摘要:該文在MATLA平臺(tái)上設(shè)計(jì)了一個(gè)語(yǔ)音信號(hào)采集和語(yǔ)譜圖分析系統(tǒng),該系統(tǒng)通過計(jì)算機(jī)聲卡和MATLAB數(shù)據(jù)采集工具實(shí)現(xiàn)了語(yǔ)音信號(hào)的實(shí)時(shí)采集,然后利用MATLAB的語(yǔ)音工具箱voicebox完成了對(duì)采集的語(yǔ)音信號(hào)進(jìn)行了頻譜分析-語(yǔ)譜圖。

關(guān)鍵詞:語(yǔ)音信號(hào)采集;MATLAB;語(yǔ)譜圖

中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2015)11-0177-02

Speech Signal Collection and Spectrum Analysis Based on MATLAB

LIU Bo

(Henan University of Animal Husbandry and Economy, Zhengzhou 450044, China)

Abstract: This paper presents a visualization system based on MATLAB speech signal collection and spectrum analysis. The system through a computer sound card and MATLAB data collection tool to achieve a real-time collection of the speech signal, and then using MATLAB voicebox completed the collection of speech signal spectrum analysis - spectrogram.

Key words: speech signal collection; MATLAB; spectrogram

語(yǔ)音信號(hào)數(shù)字處理是一門涉及面很廣的交叉學(xué)科,它和語(yǔ)音學(xué)、語(yǔ)言學(xué)、數(shù)理統(tǒng)計(jì)以及神經(jīng)生理學(xué)、數(shù)字信號(hào)處理等有密切的聯(lián)系,語(yǔ)音信號(hào)是人類最有效、最常用和最便捷的交換信息方式,在信息化時(shí)代,在高度發(fā)達(dá)的信息社會(huì)中用現(xiàn)代手段研究語(yǔ)音信號(hào),使人們能夠更加有效的方法對(duì)語(yǔ)音信號(hào)進(jìn)行傳送、存儲(chǔ)、識(shí)別、合成、增強(qiáng)具有很強(qiáng)的實(shí)用意義。

語(yǔ)音信號(hào)的處理分析工作選用了MATLAB平臺(tái)。MATLAB是一種科學(xué)計(jì)算軟件,專門以矩陣的形式處理數(shù)據(jù)。MATLAB的數(shù)據(jù)分析和處理功能非常強(qiáng)大,可以用它來對(duì)語(yǔ)音信號(hào)進(jìn)行分析、處理。MATLAB 將高性能的數(shù)值計(jì)算和可視化集成在一起,并提供了大量的內(nèi)置函數(shù),在編程效率、程序可讀性、可移植性和可擴(kuò)充性上,MATLAB遠(yuǎn)遠(yuǎn)優(yōu)于其它的高級(jí)編程語(yǔ)言,而且編程易學(xué)、直觀,代碼容易符合人們的思維習(xí)慣,相比較其他編程語(yǔ)言,更加簡(jiǎn)潔直觀,具有很大的優(yōu)勢(shì)。

本文設(shè)計(jì)的語(yǔ)音信號(hào)采集和語(yǔ)譜圖可視化系統(tǒng)是通過計(jì)算機(jī)聲卡將得到的模擬語(yǔ)音信號(hào)轉(zhuǎn)換成數(shù)字信號(hào)存入計(jì)算機(jī)硬盤,然后將存儲(chǔ)的數(shù)字語(yǔ)音信號(hào)調(diào)入到MATLAB的工作空間,利用MATLAB的強(qiáng)大計(jì)算能力和可視化功能,實(shí)現(xiàn)對(duì)采集的語(yǔ)音信號(hào)的語(yǔ)譜圖顯示。低成本、高精度的完成了語(yǔ)音信號(hào)的采集和頻譜分析。

1 語(yǔ)音信號(hào)采集系統(tǒng)的設(shè)計(jì)

語(yǔ)音信號(hào)的頻譜分量主要集中在300Hz~3400Hz的范圍內(nèi)。在進(jìn)行語(yǔ)音信號(hào)數(shù)字處理時(shí),最先接觸到并且也最直觀的額是它的時(shí)域波形。為了獲取一段語(yǔ)音信號(hào)的時(shí)域波形,首先用話筒將語(yǔ)音信號(hào)轉(zhuǎn)換成電信號(hào),再用A/D轉(zhuǎn)換把電信號(hào)轉(zhuǎn)換成數(shù)字化采樣信號(hào)存進(jìn)計(jì)算機(jī),隨后再讀取,并畫出波形圖。

計(jì)算機(jī)系統(tǒng)系統(tǒng)中自帶的聲卡可用于語(yǔ)音信號(hào)的采集,性能良好并且價(jià)格低廉,一般聲卡都可以實(shí)現(xiàn)雙通道、高保真、16位分辨精度,可以滿足許多工程測(cè)量和科學(xué)實(shí)驗(yàn)。MATLAB自帶的語(yǔ)音工具箱voicebox提供了一整套專門用于語(yǔ)音信號(hào)采集的命令和函數(shù),可用來語(yǔ)音信號(hào)的采集。該部分主要使用了wavrecord該函數(shù)進(jìn)行語(yǔ)音信號(hào)的錄取,采樣率設(shè)為44100Hz,筆者錄制一句話的語(yǔ)音信號(hào)。

主要代碼如下:

fs=44100; % 采樣率

duration=2; % 采樣時(shí)間為2秒

fprintf ('按任意鍵后開始%g 秒采集:\n',duration); pause %提示信息

fprintf('采集中......\n'); %提示信息

y=wavrecord(duration*fs, fs); % 采集的數(shù)據(jù)點(diǎn)數(shù)是duration*fs個(gè)

fprintf('采集結(jié)束\n');

nbits=16; % 每個(gè)數(shù)據(jù)點(diǎn)用16位二進(jìn)制表示

wavwrite(y, fs, nbits, 'test.wav'); % 以test.wav為文件名

2 語(yǔ)音信號(hào)頻譜分析-語(yǔ)譜圖

2.1 語(yǔ)譜圖的產(chǎn)生

根據(jù)短時(shí)分析的方法,我們認(rèn)為10ms到30ms這樣長(zhǎng)度的語(yǔ)音信號(hào)是平穩(wěn)信號(hào),可以對(duì)這一段信號(hào)做傅里葉變換,稱作短時(shí)傅里葉變換。短時(shí)傅里葉變換的定義如下:

[Xn(ejω)=m=-∞∞x(m)?w(n-m)e-jωm] (1)

其中[w(n)]是窗函數(shù),[Xn(ejω)]既是[ω]的函數(shù),也是[n]的函數(shù)。

令[ω=2πk/N,(0≤k≤N-1)],則信號(hào)的短時(shí)傅里葉變換為:

[Xn(k)=Xn(e2πkj/N)=m=-∞∞x(m)?w(n-m)e-2πkj/N] (2)

由功率譜函數(shù)(能量密度譜函數(shù))的定義,短時(shí)功率譜和短時(shí)傅里葉變換有如下關(guān)系

[Sn(ejω)=Xn(ejω)?Xn(ejω)?=|Xn(ejω)|2] (3)

不難證明,它是[x(n)]的短時(shí)自相關(guān)函數(shù)的傅里葉變換

[Sn(ejω)=k=-∞∞Rn(k)ejωk] (4)

其中

[Rn(k)=m=-∞∞x(m)?w(n-m)?x(m+k)?w(n-m-k)] (5)

以時(shí)間[n]作為橫坐標(biāo),[ω]作為縱坐標(biāo),由[Sn(ejω)]的值作為點(diǎn)[(x,ω)]處的灰度級(jí),這樣畫出來的二維圖像(其實(shí)是三維圖像,第三維用灰度,即顏色深淺來表示了)被稱作語(yǔ)譜圖(Spectrogram)。

2.2 流程圖及實(shí)現(xiàn)程序

利用MATLAB的語(yǔ)音工具箱voicebox完成了對(duì)采集的語(yǔ)音信號(hào)進(jìn)行了頻譜分析-語(yǔ)譜圖,根據(jù)采集到的錄音數(shù)據(jù),將其讀入到語(yǔ)譜圖的顯示程序中,流程圖如圖1所示。

圖1 語(yǔ)譜圖顯示流程圖

實(shí)驗(yàn)結(jié)果如圖2所示,根據(jù)采集的語(yǔ)音信號(hào),對(duì)其進(jìn)行分幀加窗并計(jì)算能量譜密度,記得到語(yǔ)音信號(hào)的語(yǔ)譜圖,此圖的水平方向是時(shí)間軸,垂直方向是頻率軸,圖中或深或淺的黑色條紋表示各個(gè)時(shí)刻的短時(shí)譜。其中與時(shí)間軸平行的幾條深黑色條紋稱為“橫杠”,也就是所謂的共振峰,這些條紋越密集表示基因頻率越高。另外在某一時(shí)刻條紋顏色的深淺表示了這一刻信號(hào)的強(qiáng)度,顏色越紅表示強(qiáng)度越大,藍(lán)色表示強(qiáng)度低。因此我們可以從語(yǔ)譜圖中觀察到語(yǔ)音信號(hào)的時(shí)域和頻域的變化情況。

圖2 實(shí)驗(yàn)結(jié)果

3 小結(jié)

本文利用計(jì)算機(jī)的聲卡,非常便捷的完成了語(yǔ)音信號(hào)的采集,敘述了語(yǔ)譜圖的產(chǎn)生,并且利用MATLAB的語(yǔ)音工具箱voicebox完成了對(duì)采集的語(yǔ)音信號(hào)進(jìn)行了語(yǔ)譜圖顯示和分析,非常便捷的對(duì)語(yǔ)音信號(hào)進(jìn)行處理。

參考文獻(xiàn):.

[1]蔡蓮紅.現(xiàn)代語(yǔ)音技術(shù)基礎(chǔ)與應(yīng)用[M].北京:清華大學(xué)出版社,2003:30-31.

[2]李富強(qiáng).基于MATLAB的語(yǔ)譜圖顯示與分析[J].微計(jì)算機(jī)信息,2005,21(10-3).

[3]題原.基于MATLAB 的語(yǔ)音信號(hào)采集和分析系統(tǒng)的可視化設(shè)計(jì)[J].齊齊哈爾大學(xué)學(xué)報(bào),2006,22(6).

[4]王正林.精通MATLAB[M]. 3版.北京: 電子工業(yè)出版社,2013.

长春市| 启东市| 阿鲁科尔沁旗| 保康县| 拜泉县| 台湾省| 勐海县| 兴安盟| 湘乡市| 特克斯县| 南漳县| 应城市| 全州县| 永善县| 尼勒克县| 米脂县| 肇庆市| 连云港市| 萝北县| 苏尼特左旗| 芜湖市| 汽车| 长宁县| 资兴市| 吉林省| 北流市| 北川| 雅安市| 枣强县| 上栗县| 隆安县| 哈巴河县| 商河县| 资阳市| 静宁县| 玛纳斯县| 库尔勒市| 萝北县| 兴安盟| 循化| 新建县|