国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于波形編碼技術(shù)的IP網(wǎng)絡(luò)電話

2015-06-24 13:19郭東東馬克
電腦知識(shí)與技術(shù) 2015年11期

郭東東++馬克

摘要:為了有效利用IP網(wǎng)絡(luò)電話中的信道資源,介紹了一種波形編碼技術(shù)。利用K-L變換可以將語音信號中各分量間存在的相關(guān)性完全去除,達(dá)到語音信號最大限度的壓縮。MATLAB仿真結(jié)果表明該方案的數(shù)據(jù)壓縮率高以及自適應(yīng)性強(qiáng),解碼具有良好的清晰度和自然度。

關(guān)鍵詞:IP網(wǎng)絡(luò)電話;波形編碼;MATLAB

中圖分類號:TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號:1009-3044(2015)11-0201-02

IP Network Phone Based on Waveform Coding Technology

GUO Dong-dong, MA Ke

(College of Computer, Qinghai Normal University, Xining 810008, China)

Abstract: In order to effectively utilize the IP network telephone channel resources, introduces a waveform coding technique. K-L transform can be completely removed correlation between the components and realize maximum compression of the speech signal. MATLAB simulative results indicate that their data compression ratio is high and strongly adaptive, the decoding speech signal have good quality.

Key words: IP network telephone; waveform coding; MATLAB

1 概述

IP語音傳輸,或稱為VoIP (Voiceover IP)是指將語音信號進(jìn)行壓縮編碼和分包等處理,然后通過IP網(wǎng)絡(luò)進(jìn)行傳輸,最后在接收端重構(gòu)語音的一種語音傳輸方式。IP網(wǎng)絡(luò)電話中的語音處理主要解決兩個(gè)問題:一是在IP網(wǎng)絡(luò)環(huán)境下保證一定的通話質(zhì)量,二是在保證一定語音質(zhì)量的前提下盡可能地降低碼率。基于線形預(yù)測編碼技術(shù)及其LPC正則方程的自相關(guān)解法,在降低碼率上取得一定的成效,但其抗噪能力較差[1,2];文獻(xiàn)[3]和文獻(xiàn)[4]對三種常用的IP電話語音壓縮編碼技術(shù)進(jìn)行了闡述,三種技術(shù)分別得到了廣泛應(yīng)用。本文基于K-L變換波形編碼技術(shù)的IP網(wǎng)絡(luò)電話,它利用K-L變換最大程度地去除信號中的相關(guān)性則可達(dá)到數(shù)據(jù)壓縮的目的,該算法不僅具有較低的傳輸碼率,而且合成出的語音清晰、自然。

2 K-L變換及其編碼原理

2.1 K-L變換基本原理

K-L變換是Karhunen-Love變換的簡稱,這是一種特殊的正交變換,主要用于一維和二維信號的數(shù)據(jù)壓縮。

一個(gè)寬平穩(wěn)的實(shí)隨機(jī)向量[x=x0,x1,…,xN-1T],其協(xié)方差矩陣[Cx]定義為:

[Cx=Ex-μxx-μxT=c00c01…c0(N-1)c10c11…c1(N-1)????c(N-1)0c(N-1)1…c(N-1)(N-1)] (1)

式中[E?]代表求均值運(yùn)算,[μx=Ex]是信號的[x]均值向量,[Cx]的元素

[Cxi,j=Exi-μxxj-μx=Cxj,i]

即協(xié)方差陣是對稱的。顯然,矩陣[Cx]體現(xiàn)了信號向量的各分量之間的相關(guān)性。若[x]的各分量互不相關(guān),那么[Cx]中除對角線以外的元素皆為零。

K-L變換的思路是尋找正交矩陣[A],使得[A]對[x]的變換[y]的協(xié)方差陣[Cy]為對角矩陣,其步驟如下。

先由λ的N階多項(xiàng)式

[λI-Cx=0]

求矩陣[Cx]的特征值[λ0],[λ1],…,[λN-1],再由式

[CAi=λiAi],i=0,1,…,N-1

求矩陣[Cx]的N個(gè)特征向量[A0],[A1],…,[AN-1],然后將[A0],[A1],…,[AN-1]歸一化,即令[=1],i=0,1,…,N-1。由歸一化的向量[A0],[A1],…,[AN-1]就可構(gòu)成歸一化的正交矩陣[A],即

[A=A0,A1,…,AN-1T]

最后由[y=Ax]實(shí)現(xiàn)對信[x]號的K-L變換。

重構(gòu)信號就是解逆變換,由下式完成

[x=A-1y=ATy] (2)

對[x(n)]去除噪聲,直接對x的變換y截取即可,即

[xΛ=i=0my(i)Ai] (3)

2.2 壓縮編碼算法原理

將語音信號分成長度為180點(diǎn)的語音幀x(n),去直流后按(1)式構(gòu)造協(xié)方差矩陣Cx,作特征值分解,構(gòu)造正交變換矩陣A;用A對x(n)作K-L變換得到變換后的信號y,將y按(3)式進(jìn)行截取得到信號y;將y按(2)式進(jìn)行K-L逆變換重構(gòu)語音信號x;將重構(gòu)語音x抽取為N點(diǎn)并對其編碼傳輸?shù)浇獯a端;在解碼段通過插值技術(shù)恢復(fù)為180點(diǎn)的語音幀,通過幀間拼接技術(shù),合成出語音。

3 算法仿真實(shí)驗(yàn)

按照上面提出的方案,用Matlab進(jìn)行仿真實(shí)驗(yàn)。在仿真實(shí)驗(yàn)中,利用計(jì)算機(jī)上的錄音機(jī)功能錄制語音樣本,樣本采用采樣率為8kHz,8bit量化,PCM編碼。

3.1 解碼語音與原始語音波形比較

a 原始語音

b 解碼語音

圖1 解碼語音與原始語音波形比較

圖1是該樣本的壓縮4倍的解碼語音波形和原始語音波形比較。從以上圖中可以看出,壓縮后的解碼語音波形幾乎與原始語音波形一致。由此可以說明,當(dāng)樣點(diǎn)數(shù)壓縮4倍時(shí)解碼語音具有良好的清晰度和自然度。

3.2 同一語音樣本在不同信噪比下的仿真

在信噪比分別為18dB和10dB下,按本文算法4倍壓縮編碼后的解碼語音波形比較。

a 原始語音

b 18dB帶噪語音

c 10dB帶噪語音

d 18dB下的解碼語音

e 10dB下的解碼語音

圖2 不同信噪比下解碼語音與原始語音波形比較

由圖2可知,18dB噪聲下的解碼語音波形與原始語音波形非常逼近,表明,截取后的語音不僅信息損失很小,而且對隨機(jī)的背景噪聲具有很強(qiáng)的去噪能力。而10dB噪聲下的解碼語音稍有噪聲的影響,這是由于處理過程中有效信息損失稍大,在解碼段可選用恰當(dāng)?shù)牟逯岛瘮?shù)予以改善。

4 結(jié)束語

基于波形編碼技術(shù)的IP網(wǎng)絡(luò)電話不僅具有較低的傳輸碼率,而且合成出的語音清晰、自然。該技術(shù)不僅可用于IP網(wǎng)絡(luò)電話,亦可用于數(shù)字語音存儲(chǔ)。

參考文獻(xiàn):

[1] 蘇菊寧,董鵬飛.語音壓縮中的線性預(yù)測編碼技術(shù)[J].現(xiàn)代電子技術(shù),2000 (9):1-3.

[2] 王尚武.語音壓縮中的線性預(yù)測編碼技術(shù)[J].微機(jī)發(fā)展,2002(6):40-43.

[3] 徐春秀,武穆清.IP網(wǎng)絡(luò)電話中常用的語音壓縮編碼技術(shù)的性能分析[J].電子技術(shù)應(yīng)用,2001,27(10):6-9.

[4] 江兆祥.IP電話的語音壓縮技術(shù)[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2003,(4):89-91.