王鼎 章小梅 劉云飛
摘要:語音編碼是現代語音通信系統(tǒng)的重要環(huán)節(jié)。與傳統(tǒng)的PCM編碼方式相比,增量調制具有節(jié)省頻譜資源的突出優(yōu)點。LDM、ADPCM和CVSD是三種常見的增量調制方式。該文以MATLAB Simulink平臺為基礎搭建了LDM、ADPCM和CVSD的編譯碼仿真模型,對三種編碼方式不同采樣率下的輸出波形、抗干擾能力及可懂度進行了仿真對比。仿真表明,與其他兩種編碼方式相比,CVSD在低采樣率下能保持更好的編碼性能和可懂度,且具有一定的抗干擾能力。
關鍵詞:語音編碼;增量調制;Simulink;CVSD
中圖分類號:TP274 文獻標識碼:A 文章編號:1009-3044(2016)29-0238-03
通信系統(tǒng)可分為模擬通信系統(tǒng)和數字通信系統(tǒng)兩大類。如果在數字通信系統(tǒng)中傳輸模擬信號,這種傳輸方式被稱為模擬信號的數字傳輸,這是現代通信的常見類型,比如在擴頻通信系統(tǒng)或調頻通信系統(tǒng)中傳輸語音。這時就需要在系統(tǒng)的發(fā)送端將模擬語音信號轉換為數字信號,即模數轉換(A/D);在接收端再將數字信號轉換為模擬語音信號,即數模轉換(D/A)。模數轉換包含采樣、量化、編碼三個步驟。編碼性能的好壞,直接影響語音通信系統(tǒng)的通信質量。編碼性能的好壞與采樣率、編碼位數和編碼算法有關。
脈沖編碼調制(PCM)是最簡單的一種語音編碼算法,直接將量化后的采樣值轉化為一個k位的M進制的代碼,一般采用的二進制代碼。
一位二進制碼只能代表兩種狀態(tài),不能表示模擬信號的采樣值,但一位二進制碼可以表示相鄰兩采樣值的相對大小,而相鄰采樣值的相對大小同樣能反映模擬信號的變化規(guī)律,這就出現了另外一種編碼方式,即增量調制(△M)。與PCM相比,增量調制獲得更廣泛應用的原因有:在PCM中,一個采樣值需要多位代碼表示,而在△M中只需要一位,所以△M大大降低了碼元輸出速率,因此在比特率較低時△M的量化信噪比高于PCM的量化信噪比;△M的抗誤碼性能好,能工作于誤碼率為10-3~10-2的信道中,而PCM通常要求信道誤碼率為10-6~10-4;△M的編譯碼器比PCM簡單,更易于硬件實現。
常見的增量調制方式有線性增量調制(LDM)、脈碼增量調制(DPCM)、自適應脈碼增量調制(ADPCM)、連續(xù)可變斜率增量調制(CVSD)。本文重點對LDM、ADPCM和CVSD三種編碼算法的性能進行對比。
1仿真模型的搭建
本文以MATLAB Simulink平臺為基礎搭建了驗證LDM、ADPCM和CVSD編碼性能的仿真模型,如圖1所示。
首先選用一段無損錄音作為語音信號源,利用Simulink中的From Multimedia File模塊提取文件中的語音波形,并可以通過Rate Transition模塊控制仿真的采樣率。然后將語音信號分別送人LDM、ADPCM和CVSD編碼器進行語音編碼,在Trans-mission Channel中完成調制、高斯白噪聲信道傳輸、解調,最后三路信號分別在LDM、ADPCM和CVSD譯碼器中完成譯碼和低通濾波,恢復出語音信號。為了比較分析三種編碼算法的性能,將三路輸出分別與原語音信號同時送入示波器模塊,觀察語音信號編解碼前后波形的變化。
2不同采樣率下三種編碼的性能對比
在一個通信系統(tǒng)中,較高的采樣率意味著較高的碼元傳輸速率,也就意味著占用較大的傳輸帶寬。為了提高系統(tǒng)的抗噪聲性能,采樣率越大越好;但從節(jié)省頻帶的角度考慮,采樣率越小越好,這兩者是矛盾的。綜合兩方面的要求,我們可以通過優(yōu)化編碼算法,利用盡可能低的采樣率獲得盡可能好的傳輸性能。
由于PCM的編碼位數明顯高于△M,因此在低信道傳輸速率下,PCM的性能要弱于△M,所以本文重點對LDM、ADPCM和CVSD不同采樣率下的編碼性能進行了仿真對比。
仿真中,采用了64kHz、32kHz、16kHz和8kHz四種采樣率,分別得到解調譯碼的輸出波形,如圖2所示。每張圖中自上而下依次為LDM、ADPCM和CVSD相應的輸出波形,且黑色曲線為原語音波形,灰色曲線為解調譯碼波形。每張波形圖中,灰色曲線與黑色曲線的擬合程度反映了編碼性能,兩條曲線越接近說明編碼性能越好。
從圖中可以看出,隨著采樣率的降低,LDM、ADPCM和CVSD的編碼性能都有降低的趨勢。其中,LDM在64kHz采樣率時能夠較好地恢復原語音波形,隨著采樣率的降低,性能惡化最為明顯,在32kHz采樣率時波形已出現明顯畸變(過載失真),在16kHz采樣率時波形已嚴重失真;ADPCM與LDM相比,性能改善明顯,在16kHz采樣率時波形才出現明顯畸變(毛刺增多);CVSD隨采樣率的降低,性能惡化不明顯,在8kHz采樣率時波形才出現少量毛刺,且毛刺幅度較小。通過對比可以得出,CVSD在三種編碼方式中性能最好,ADPCM次之,LDM性能最差。
在實際應用中,CCITT建議將32kbit/s的ADPCM作為長途傳輸的語音編碼方式,以32kbit/s傳信率傳輸的ADPCM信號基本能夠達到以64kbit/s傳信率傳輸的PCM話音質量。而在軍事通信中,為了進一步節(jié)約信道資源,廣泛采用以16kbit/s傳信率傳輸的CVSD信號,以更低的傳信率獲得相近的話音質量。
3三種編碼方式抗突發(fā)干擾的性能對比
前面主要討論了不同采樣率下LDM、ADPCM和CVSD三種編碼的性能對比,但在實際應用中,編碼方式的抗干擾性能也是話音質量的重要影響因素。為比較三種編碼方式的抗干擾性能,利用Simulink中的Pulse Generator模塊(如圖1所示)產生周期性的脈沖干擾,觀察干擾時段內灰色曲線與黑色曲線的擬合程度。
圖3所示為某一脈沖干擾時段內的仿真輸出波形示意圖,從圖中可以看出,在不同采樣率條件下LDM、ADPCM和CVSD相應的輸出波形都出現了不同程度的畸變,其中CVSD編碼的畸變最小,且在干擾時段外能夠迅速逼近原語音信號。由此可見,CVSD具有較強的抗突發(fā)干擾的能力。
4三種編碼方式的音質對比
以上我們通過波形對比的方式來討論LDM、ADPCM和CVSD的編碼性能,波形的擬合程度能一定程度上反映編碼方式的性能好壞,但并不全面,因此本文又直接考察了輸出信號的音質和可懂度。
利用Simulink中的To Multimedia File模塊將LDM、ADPCM和CVSD譯碼器的輸出波形分別存儲到LDM_output.avi、ADP-CM_output.avi和CVSD_output.avi三個多媒體文件中,實現了語音信號的重構,如圖4所示。然后就可以通過直接監(jiān)聽的方式比較原語音與三個已恢復語音的音質和可懂度。
通過對比發(fā)現,在64kHz采樣率時,三種編碼方式恢復的語音信號都有很好的音質和可懂度;在32kHz采樣率時,LDM已出現雜音,可懂度明顯下降,ADPCM的音質和可懂度下降不明顯;在16kHz采樣率時,CVSD依然保持了較好的音質和可懂度,甚至在8kHz采樣率時仍然可以聽懂。同時,在有突發(fā)脈沖干擾時,CVSD恢復語音信號的音質和可懂度也是最好的。
5結束語
本文以MATLAB Simulink平臺為基礎搭建了LDM、ADP-CM和CVSD的編譯碼仿真模型,對三種編碼方式不同采樣率下的輸出波形、抗干擾能力及可懂度進行了仿真對比。仿真表明,與其他兩種編碼方式相比,CVSD在低采樣率下能保持更好的編碼性能和可懂度,且具有一定的抗干擾能力。CVSD編碼以相對較低的編碼速率可以獲得較好的語音質量,是應用在語音通信系統(tǒng)中的較好的編碼方式。