国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字對(duì)講機(jī)中語(yǔ)音信號(hào)處理的研究

2011-08-11 08:23彭天偉凌朝東
通信技術(shù) 2011年10期
關(guān)鍵詞:對(duì)講機(jī)線(xiàn)性語(yǔ)音

彭天偉, 凌朝東, 楊 驍

(華僑大學(xué) 信息科學(xué)與工程學(xué)院,福建 廈門(mén) 361008)

0 引言

在對(duì)講機(jī)技術(shù)發(fā)展的30多年歷史中,模擬技術(shù)應(yīng)用已非常成熟,關(guān)鍵器件已很可靠,能夠基本滿(mǎn)足現(xiàn)有客戶(hù)消費(fèi)群體的基本需求,可以說(shuō)為多種行業(yè)的發(fā)展都作出了巨大的貢獻(xiàn)。隨著社會(huì)經(jīng)濟(jì)與科技的發(fā)展,許多政府部門(mén)、警察、公共安全、公用設(shè)施、醫(yī)療、消防及一些特殊部門(mén)等對(duì)移動(dòng)終端又不斷提出了更加專(zhuān)業(yè)、安全、穩(wěn)定、健康、便捷的要求。

早在20世紀(jì),國(guó)外就有人將數(shù)字技術(shù)引入對(duì)講機(jī)行業(yè)。目前我國(guó)正在積極展開(kāi)自主知識(shí)產(chǎn)權(quán)的數(shù)字對(duì)講機(jī)的研發(fā)工作,以及數(shù)字對(duì)講機(jī)協(xié)議的制定。

1 關(guān)于數(shù)字對(duì)講機(jī)語(yǔ)音信號(hào)速率分析

中國(guó)信產(chǎn)部于2001年12月6日宣布開(kāi)放民用對(duì)講機(jī)市場(chǎng),其開(kāi)放的頻段為409~410 MHz,共分20個(gè)頻道,稱(chēng)為“公眾頻道”共20個(gè)頻道,具體劃分如表1。

表1 公共頻帶劃分

每個(gè)頻道的帶寬為12.5 kHz,總的帶寬為12.5×20=250 kHz。由于數(shù)字對(duì)講機(jī)每個(gè)頻道的帶寬為12.5 kHz,所以要對(duì)語(yǔ)音信號(hào)進(jìn)行壓縮算法處理,語(yǔ)音信號(hào)的數(shù)據(jù)碼流應(yīng)該壓縮到4.8 kb/s以下。

按語(yǔ)音編碼速率不同劃分為:高速率編碼16~64 kb/s、中速率編碼4.8~16 kb/s、低速率編碼2.4~4.8 kb/s、極低速率編碼即小于2.4 kb/s。應(yīng)用于數(shù)字對(duì)講機(jī)中的語(yǔ)音編碼屬于低速率編碼。

2 低速率語(yǔ)音算法比較

近年來(lái),低速率語(yǔ)音編碼技術(shù)在研究思路上有了很大的發(fā)展[3]。低速率語(yǔ)音編碼算法逐漸成熟。常見(jiàn)的低速率語(yǔ)音編碼有二元激勵(lì)線(xiàn)性預(yù)測(cè)編碼(LPC,Linear Predictive Coding)、正弦激勵(lì)線(xiàn)性預(yù)測(cè)(SELP)[5]、多帶激勵(lì)(MBE,Multi Band Excited)[1,6]、混合激勵(lì)線(xiàn)性預(yù)測(cè)(MELP,Multi Excitation Linear Prediction)[2,7]等。

2.1 二元激勵(lì)線(xiàn)性預(yù)測(cè)編碼[8]

LPC[3]是最基本的低速率語(yǔ)音編碼方法,用清/濁2個(gè)激勵(lì)源來(lái)激勵(lì)LPC濾波器合成語(yǔ)音信號(hào)。LPC-10就是二元激勵(lì)線(xiàn)性預(yù)測(cè)編碼的典型例子。

LPC-10在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果如表2所示。

表2 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果

由表2得出,平均就得分意見(jiàn)(MOS,Mean Opinion Score)僅為2.5,說(shuō)明合成語(yǔ)音質(zhì)量不能讓人滿(mǎn)意;判斷韻字測(cè)試(DRT,Diagnostic Rhyme Test)為90%,說(shuō)明具有比較良好的可懂性;判斷滿(mǎn)意度測(cè)試(DAM,Diagnostic Acceptability Measure)為55%,說(shuō)明自然度及講話(huà)人的確認(rèn)等方面不夠好。

LPC-10在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量的客觀測(cè)試平均改進(jìn)巴克譜失真度(MBSD,Modified Bark Spectral Distortion)測(cè)試結(jié)果如表3所示。

表3 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量客觀測(cè)試結(jié)果

2.2 多帶激勵(lì)聲碼器[8]

MBE[1,6]對(duì)傳統(tǒng)的二元聲碼器做了改進(jìn),主要引進(jìn)了多帶的思想。碼率為4.15 Kb/s的增強(qiáng)型MBE聲碼器在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果如表4所示。

表4 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果

由表4得出,MOS僅為3.4合成語(yǔ)音質(zhì)量達(dá)到通信質(zhì)量;DRT為94%,說(shuō)明具有比較良好的可懂性;DAM為65%,說(shuō)明自然度及講話(huà)人的確認(rèn)等方面還不是很好。

IMBE聲碼器在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量客觀測(cè)試平均MBSD測(cè)試結(jié)果如表5所示。

表5 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量客觀測(cè)試結(jié)果

2.3 混合激勵(lì)線(xiàn)性預(yù)測(cè)聲碼器[8]

MELP編碼器[2,7]在傳統(tǒng)的二元激勵(lì)線(xiàn)性預(yù)測(cè)模型的基礎(chǔ)上引進(jìn)了多帶激勵(lì)、LPC-10e等算法的思想。新增了5個(gè)特點(diǎn):多帶混合激勵(lì)、非周期脈沖、自適應(yīng)譜增強(qiáng)、脈沖離散濾波和殘差諧波譜處。能夠在2.4 Kb/s速率上得到更高質(zhì)量的合成語(yǔ)音。

MELP聲碼器在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果如表6所示。

表6 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量主觀測(cè)試結(jié)果

由表6得出,MOS僅為3.2,說(shuō)明合成語(yǔ)音質(zhì)量達(dá)到了通信質(zhì)量;DRT為94%,說(shuō)明其具有比較良好的可懂性;DAM為63%,說(shuō)明其自然度及講話(huà)人的確認(rèn)等方面還不是很好。

MELP聲碼器在無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量客觀測(cè)試的平均MBSD測(cè)試結(jié)果如表7所示。

表7 無(wú)噪聲時(shí)合成語(yǔ)音質(zhì)量客觀測(cè)試結(jié)果

從表3、表5和表7可以看出,噪聲電平越大,其MBSD的值也越大,及噪聲越強(qiáng),合成語(yǔ)音失真就越大。

3 算法的研究與確定

通過(guò)上一節(jié)對(duì)幾種度速率語(yǔ)音編碼算法合成語(yǔ)音質(zhì)量的比較,結(jié)合數(shù)字對(duì)講機(jī)通信帶寬的要求,擬定2.4 Kb/s的編碼速率,所以采用MELP算法為數(shù)字對(duì)講機(jī)的基本算法。

MELP聲碼器在經(jīng)典的二元激勵(lì)LPC聲碼器的基礎(chǔ)上,加入了一些新的特征。這些特征使得MELP聲碼器與經(jīng)典的LPC聲碼器相比可以更好的模擬人的語(yǔ)音,使其在低碼率下的合成語(yǔ)音的自然度大大提高,消除了嗡嗡聲、咔嚓聲等不自然的聲音。MELP聲碼器的語(yǔ)音質(zhì)量可以在很低的碼率下(2.4 kb/s)達(dá)到較好的聽(tīng)覺(jué)效果。

MELP編碼器的碼率為2.4 kb/s,幀長(zhǎng)為22.5 ms,每幀數(shù)據(jù)用54 bit進(jìn)行編碼。其編碼流程如圖1所示。

圖1 MELP編碼流程

首先對(duì)語(yǔ)音信號(hào)進(jìn)行預(yù)處理,濾除工頻噪聲。預(yù)處理后的信號(hào)通過(guò)1 kz的低通濾波器濾波,對(duì)濾波信號(hào)做基音分析提取基因周期;同時(shí)對(duì)與處理信號(hào)進(jìn)行分帶,分為5個(gè)子帶,分別對(duì)各個(gè)子帶做非周期標(biāo)志位判斷和子帶清/濁音判決;采用 10階線(xiàn)性預(yù)測(cè)分析預(yù)處理信號(hào),提取線(xiàn)性預(yù)測(cè)系數(shù);采用LPC逆濾波和FFT變換提取傅氏級(jí)數(shù)幅度。

提取出參數(shù)之后,對(duì)傅氏級(jí)數(shù)幅度和 LSF進(jìn)行矢量量化,最后按照一定的規(guī)定對(duì)數(shù)據(jù)組幀,發(fā)送數(shù)據(jù)。如表8所示,為MELP參數(shù)量化比特分配。

表8 參數(shù)量化比特分配

根據(jù)MELP編碼器框圖編寫(xiě)程序代碼在MATLAB R2010a平臺(tái)上進(jìn)行仿真,仿真波形,圖2(橫坐標(biāo)的數(shù)量級(jí)為104)中采用8 Kz的采樣速率采集獲得語(yǔ)音數(shù)字信號(hào),運(yùn)用MELP算法進(jìn)行分析合成。采用主觀測(cè)試的方法分析仿真結(jié)果,合成語(yǔ)音的質(zhì)量達(dá)到了通信要求,能聽(tīng)清楚發(fā)音和識(shí)別出說(shuō)話(huà)人。

圖2 MELP仿真結(jié)果

4 結(jié)語(yǔ)

通過(guò)前面的分析和實(shí)驗(yàn)結(jié)果,MELP編碼器基本能實(shí)現(xiàn)數(shù)字對(duì)講機(jī)通信中的語(yǔ)音號(hào)處理。在試驗(yàn)仿真時(shí),雖然合成語(yǔ)音質(zhì)量能達(dá)到通信質(zhì)量,但是合成語(yǔ)音的背景噪聲很大,這是在正常生活讓人無(wú)法接受的。在接下來(lái)的工作應(yīng)該對(duì)算法做改進(jìn)。針對(duì)背景噪聲大的缺點(diǎn),初步計(jì)劃對(duì)語(yǔ)音分析的基音周期[4]的提取算法、清音分析部分和語(yǔ)音合成時(shí)清音激勵(lì)源的生成部分和清音生成處理部分做改進(jìn)。

[1]崔慧娟.多帶激勵(lì)低速率語(yǔ)音壓縮編碼算法研究及實(shí)時(shí)實(shí)現(xiàn)[J].電子學(xué)報(bào),1998,26(10):129-132.

[2]劉寬海.MELP低比特率數(shù)字語(yǔ)音編碼技術(shù)研究[J].信息技術(shù),2003,27(08): 52-54.

[3]何春榮.淺析語(yǔ)音編碼的三個(gè)發(fā)展方向[J].成都紡織高等專(zhuān)科學(xué)校學(xué)報(bào),2008,25(01):33-35.

[4]胡連鋒.一種改進(jìn)的強(qiáng)噪聲背景下基音檢測(cè)算法[J].通信技術(shù),2009,42(12):164-166.

[5]趙海軍.低復(fù)雜度2400b/s聲碼器[J].通信技術(shù), 2010, 43(01):121-123.

[6]王都生.多帶混合激勵(lì)低速率語(yǔ)音編碼的研究[D].西安:西安電子科技大學(xué),1998.

[7]鄭魯杰.低速率語(yǔ)音編碼MELP算法的研究[D].成都:電子科技大學(xué),2003.

[8]王洪.低速率語(yǔ)音編碼[M].北京:國(guó)防工業(yè)出版社,2006: 72-172.

猜你喜歡
對(duì)講機(jī)線(xiàn)性語(yǔ)音
漸近線(xiàn)性Klein-Gordon-Maxwell系統(tǒng)正解的存在性
幫助聾啞人士交流的“對(duì)講機(jī)”
線(xiàn)性回歸方程的求解與應(yīng)用
家用對(duì)講機(jī)的概述
魔力語(yǔ)音
基于MATLAB的語(yǔ)音信號(hào)處理
基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
對(duì)方正在輸入……
二階線(xiàn)性微分方程的解法
耳機(jī)式對(duì)講機(jī)