国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

語音視頻信號混合編碼實時遙測技術(shù)

2016-06-02 08:07亓盛元黃如昌劉明中國飛行試驗研究院陜西西安710089
中國科技縱橫 2016年1期
關(guān)鍵詞:視頻遙測語音

亓盛元 黃如昌 劉明(中國飛行試驗研究院,陜西西安 710089)

?

語音視頻信號混合編碼實時遙測技術(shù)

亓盛元 黃如昌 劉明
(中國飛行試驗研究院,陜西西安 710089)

【摘 要】在飛行試驗中,為了全面掌握試驗機(jī)的工作狀態(tài),需要將飛行員的語音信號進(jìn)行遙測。本文提出一種將語音和視頻信號進(jìn)行混合編碼遙測傳輸?shù)臏y試方案,該方案將編碼后的數(shù)據(jù)流插入到機(jī)載測試系統(tǒng)中,通過數(shù)據(jù)采集單元的PCM數(shù)據(jù)流傳輸進(jìn)行遙測發(fā)射,地面站接收到遙測信號后,利用軟件對數(shù)據(jù)流進(jìn)行實時解碼還原出語音和視頻信號。該方案節(jié)省了遙測信號帶寬資源的占用,語音和視頻信號通過一套遙測設(shè)備進(jìn)行發(fā)射,具有系統(tǒng)設(shè)備使用成本低的優(yōu)點。

【關(guān)鍵詞】語音 視頻 編碼 遙測

1 引言

在飛行試驗中,為了掌握試驗機(jī)的人機(jī)工作狀態(tài),飛行員與地面指揮員通過無線電臺進(jìn)行語音交流傳遞信息,這種半雙工的“問、答”式工作方式易分散飛行員注意力,不利于試驗任務(wù)的執(zhí)行。如果將飛行員“全部語音”傳輸?shù)降孛?,結(jié)合“問、答”方式,試飛工程師和地面指揮員就更容易全面的掌握試驗機(jī)的工作狀態(tài)。

同樣機(jī)載測試的模擬視頻遙測是將攝像頭輸出的視頻信號直接調(diào)制發(fā)射傳輸?shù)降孛?,一路視頻信號占用一套遙測設(shè)備,非常占用資源。

為了解決上述問題,首次將語音視頻信號同時采集,采用基于ADPCM和MPEG-4的數(shù)字編碼方式[1],通過IRIG-106標(biāo)準(zhǔn)的PCM數(shù)據(jù)幀將數(shù)據(jù)流實時遙測到地面站,地面站接收信號后通過軟件解碼實時還原出語音視頻信號。

2 語音編碼方案

2.1 語音編碼的概述

語音編碼的方法有三種:波形編碼、參數(shù)編碼和混合編碼。

波形編碼能使重建語音波形保持原語音信號的波形形狀,它具有適應(yīng)能力強(qiáng)、語音質(zhì)量好的優(yōu)點,但所需的編碼速率高,如脈沖編碼(PCM)、自適應(yīng)差分脈沖編碼調(diào)制(ADPCM)等;參數(shù)編碼通過對語音信號特征參數(shù)的提取及編碼,保持了語音的語意,所需的編碼速率比較低,但合成語音質(zhì)量較差,如LPC-10、MPE-LPC;混合編碼采用了合成-分析的方法,克服了參數(shù)編碼的缺點,在中低速率上獲得了高質(zhì)量的語音編碼,大大節(jié)省了傳輸信道容量及存儲量,為不斷擁擠的通信頻帶提供了一種解決方法,混合編碼有CELP、LDCELP、ASCELP等編碼方式。

另外,語音算法的選擇除了壓縮率外, 更應(yīng)該側(cè)重低延時、低復(fù)雜度和語音的傳輸質(zhì)量。

2.2 基于ADPCM原理的語音編碼原理

之所以要對語音進(jìn)行壓縮,因為語音信號本身的A/D轉(zhuǎn)換會導(dǎo)致存儲容量需求的增加及傳送信道帶寬的增加。如一段44.1KHz,量化精度為16bit的立體聲語音信號,其一分鐘占約10M的存儲容量。如果直接用PCM碼對之進(jìn)行編碼并存儲和傳輸則存在非常大的冗余度,可對其進(jìn)行4:1或16:1的壓縮。

圖1 語音視頻混合編碼及遙測系統(tǒng)框圖

脈沖編碼調(diào)制(簡稱:PCM)是使用最為廣泛的調(diào)制方法。在PCM的調(diào)制過程中,將輸入的模擬信號進(jìn)行取樣,量化和編碼。這種方法通過用脈沖編碼來代表取樣后的模擬信號的幅度。語音信號通過PCM編碼后得到的信號,最能夠保持其真實度,但是其需要的存儲空間及傳輸帶寬也很大,所以就有了ADPCM語音編碼技術(shù),要了解ADPCM語音編碼下面先介紹其他幾種語音編碼原理。(1)差分PCM編碼原理。差分PCM(即DPCM)記錄的不是信號的絕對大小而是相對大小,因為信號的相對大小變化比信號本身要小,碼位用的也比較少。差分系統(tǒng)就是利用這種信息的冗余,不記錄信號的絕對大小,而是記錄相鄰之間差值的大小。差分編碼采用預(yù)測編碼技術(shù),從輸入中減去預(yù)測值,然后對預(yù)測誤差進(jìn)行量化,最終的編碼就是預(yù)測值與實際值之間的差值。解碼器用以前的數(shù)據(jù)對當(dāng)前樣值進(jìn)行預(yù)測。這種方法使用的比特數(shù)較少,但它的性能決定于預(yù)測編碼方法以及它對信號的變化的適應(yīng)能力。(2)增量調(diào)制(DM)編碼原理。增量調(diào)制(DM)是一種特殊簡化的DPCM,其只用1bit量化器,因為只用一個量化級來代表樣值的變化,為了跟蹤信號的變化,必須使用高的采樣頻率。在DM中,存在兩類誤差,一種是斜率過載誤差,其產(chǎn)生原因是語音波形幅度發(fā)生急劇變化時,譯碼波形不能充分跟蹤這種急劇的變化而產(chǎn)生的失真;另一種是顆粒噪聲,因為在無聲狀態(tài)或信號幅值固定式,量化輸出都呈0,1交替序列而產(chǎn)生的。(3)自適應(yīng)增量調(diào)制(ADM)編碼原理。一般情況下,顆粒噪聲對音質(zhì)的影響比較大,所以要對增量調(diào)制的△的幅值取得足夠小,但是△取得足夠小斜率過載失真就會比較大,為了減少失真就需要提高采樣率,這樣就會影響信息壓縮的效果。所以為了解決上述問題,就出現(xiàn)了自適應(yīng)增量調(diào)制(ADM),其原理為:在語音信號的幅值變化不太大的區(qū)間內(nèi),取小的△值來抑制顆粒噪音;在幅值變化大的地方,取大的△值來減小過載噪音。其具體實現(xiàn)方法為:在顆粒噪音不產(chǎn)生大的影響的前提下,確定最小的△幅值。在同樣的符號持續(xù)產(chǎn)生的情況下,將△幅值增加到原來的2倍。即當(dāng)+ △、+ △這樣持續(xù)增加時,如果下一個殘差信號還是相同的符號,那么再將△幅值增加一倍,如此下去,并且確定好某一個最大的△幅值上限,只要在這個最大的△幅值以內(nèi)同樣的符號持續(xù)產(chǎn)生,就將△幅值繼續(xù)增加下去。如果相反,殘差信號值為異號時,就將前面的幅值△設(shè)為原來的1/2,重新以△/2為幅值。

2.3 基于ADPCM原理的語音編碼原理

自適應(yīng)差分脈沖編碼調(diào)制(簡稱為:ADPCM)用預(yù)測編碼來壓縮數(shù)據(jù)量。它結(jié)合了ADM 的差分信號與PCM的二進(jìn)制碼的方法,是一種性能比較好的波形編碼。其根據(jù)語音信號具有短時平穩(wěn)性的非平穩(wěn)隨機(jī)過程及相鄰樣點間有著很強(qiáng)相關(guān)性的特點,采用自適應(yīng)量化和自適應(yīng)預(yù)測技術(shù)對語音信號進(jìn)行編碼。它的一個重要特點就是可以在較低的數(shù)據(jù)率的情況下,獲得較高質(zhì)量的重構(gòu)語音。

其核心思想為:(1)利用自適應(yīng)的思想改變量化階的大小,即使用小的量化階去編碼大的差值;(2)使用過去的樣本值去估算下一個輸入樣本的預(yù)測值, 使實際樣本值和預(yù)測值之間的差值總是最小。編碼器和譯碼器都是根據(jù)前面出現(xiàn)的PCM 抽樣值對下一個PCM抽樣進(jìn)行預(yù)測,然后在接受端再恢復(fù)成先前的PCM信號。所以,發(fā)送端只需要向接受端發(fā)送預(yù)測值與實際值的誤差。由于正常情況下,這些誤差的幅度要比原始信號的幅度小很多,所以,對此誤差進(jìn)行編碼所需代碼的位數(shù)要比對原始信號系統(tǒng)編碼所需要的位數(shù)少很多,從而達(dá)到壓縮的目的。

ADPCM編碼方法之所以是一種比較好的編碼,因為其雖然有著較好壓縮率,但其音質(zhì)也比較好(MOS值達(dá)到4.1,最好標(biāo)準(zhǔn)為5)。另外其算法延遲較小,實現(xiàn)簡單,成本較低。

我們在這里討論歐洲美元市場的重點不在于這個市場與經(jīng)濟(jì)全球化的關(guān)系,而在于它與新古典經(jīng)濟(jì)學(xué)興起的關(guān)系,二者之間的關(guān)系可以從如下幾個視角來分析。

3 視頻編碼方案

視頻編碼技術(shù)是基于MPEG標(biāo)準(zhǔn),MPEG標(biāo)準(zhǔn)的視頻壓縮編碼技術(shù)主要利用了具有運動補(bǔ)償?shù)膸g壓縮編碼技術(shù)以減小時間冗余度,利用DCT技術(shù)以減小圖像的空間冗余度,利用熵編碼以減小信息表示方面的統(tǒng)計冗余度。這幾種技術(shù)的綜合運用,大大增強(qiáng)了壓縮性能。

MPEG標(biāo)準(zhǔn)主要有以下五個:MPEG-1,MPEG-2,MPEG-4,MPEG-7和MPEG-21等。這些編碼技術(shù)都是很成熟的技術(shù),在我們的方案中,對具體原理部分我們就不加以敘述,我們會比較下各種編碼的優(yōu)缺點,然后選擇一種編碼方案作為我們系統(tǒng)的編碼方案。

3.1 基于MPEG-4視頻壓縮

在本系統(tǒng)中,我們選擇MPEG-4編碼技術(shù)作為我們的視頻編碼方案,因為在之前的MPEG-1,MPEG-2等都是采用第一代壓縮編碼技術(shù),著眼于圖像信號的統(tǒng)計特性來設(shè)計編碼器,第一代壓縮編碼方案把視頻序列按時間先后分為一系列幀,每一幀圖像又分成宏塊以進(jìn)行運動補(bǔ)償和編碼,這種編碼方案存在以下缺陷:(1)將圖像固定地分成相同大小的塊,在高壓縮比情況下會出現(xiàn)嚴(yán)重塊效應(yīng),即馬賽克效應(yīng);(2)不能對圖像內(nèi)容進(jìn)行訪問,編輯和回放等操作;(3)未充分利用人類視覺系統(tǒng)特性。

MPEG-4采用了新一代視頻編碼技術(shù),它在視頻編碼發(fā)展史上第一次把編碼對象從圖像幀拓展到具有實際意義的任意形狀視頻對象,從而實現(xiàn)了從基于像素的傳統(tǒng)編碼向基于對象和內(nèi)容的現(xiàn)代編碼的轉(zhuǎn)變,其核心編碼技術(shù)是基于AV對象(AVO,Audio visual object)的編碼、存儲、傳輸和組合。

3.2 MPEG-4視頻壓縮關(guān)鍵技術(shù)

MPEG-4除采用第一代視頻編碼的核心技術(shù)外,還提出了一些新的有創(chuàng)建性的關(guān)鍵技術(shù),并在第一代視頻編碼技術(shù)基礎(chǔ)上進(jìn)行了卓有成效的完善和改進(jìn),其關(guān)鍵技術(shù)有:(1)視頻對象提取技術(shù):MPEG-4實現(xiàn)基于內(nèi)容交互的首要任務(wù)就是把視頻/圖像分割成不同對象或者把運動對象從背景中分離出來,然后針對不同對象采用相應(yīng)編碼方法,以實現(xiàn)高效壓縮,因此視頻對象提取即視頻對象分割,是MPEG-4視頻編碼關(guān)鍵技術(shù),也是新一代視頻編碼的研究熱點和難點。(2)VOP視頻編碼技術(shù):VOP(視頻對象平面)是MPEG-4編碼的核心概念,其在編碼過程中,針對不同VO采用不同的編碼策略,即對前景VO的壓縮盡可能保留細(xì)節(jié)和平滑,對背景VO采用高壓縮率的策略。這種方法不但克服第一代視頻壓縮中的方塊效應(yīng),也提高了壓縮比。(3)運動估計與運動補(bǔ)償技術(shù):MPEG-4采用IVOP,P-VOP,B-VOP三種幀格式來表征不同的運動補(bǔ)償類型。它采用了H.263中的半像素搜索技術(shù)和重疊運動補(bǔ)償技術(shù),同時又引入重復(fù)填充技術(shù)和修改塊(多邊形)匹配技術(shù)以支持任意形狀的VOP區(qū)域。

4 語音視頻實時遙測系統(tǒng)的實現(xiàn)

MPEG-4視頻信號和ADPCM語音信號同時進(jìn)入到MPEG-2模塊形成一個MPEG-2傳輸流,一個MPEG-2傳輸流是某些固定長度(188字節(jié))的數(shù)據(jù)包。將這些數(shù)據(jù)包按照數(shù)據(jù)采集單元的底板接口通信協(xié)議分解成16位字,以參數(shù)形式插入到標(biāo)準(zhǔn)的IRIG-106 PCM數(shù)據(jù)幀中并進(jìn)行遙測。

地面接收站接收到遙測信號后,通過地面解調(diào)設(shè)備和軟件將語音信號和視頻信號從PCM流中實時解調(diào)還原出來供地面人員監(jiān)控。其系統(tǒng)框圖如圖1所示。

5 結(jié)語

通過對語音視頻信號進(jìn)行數(shù)字編碼,經(jīng)機(jī)載測試系統(tǒng)的遙測發(fā)射機(jī)進(jìn)行遙測發(fā)射,這樣既減小了帶寬,又能使多路視頻信號通過一條PCM流遙測下來;且語音信號的ADPCM碼可以加入到視頻信號的MPEG-2流中,進(jìn)行混合編碼,這樣大大提高了效率,也節(jié)省了硬件資源。

按現(xiàn)有飛機(jī)的實施方案,1路語音加視頻信號進(jìn)過PCM編碼后的位速率1.5Mb/s左右,而現(xiàn)有的機(jī)載測試系統(tǒng)PCM遙測發(fā)射機(jī)的遙測帶寬有10Mb/s,這樣1路遙測系統(tǒng)可以遙測6路視頻加語音信號,如果用傳統(tǒng)模擬視頻發(fā)射機(jī)就需要6路遙測系統(tǒng),且飛行員語音還要單獨外通過無線電臺方式與地面交流。

該方案經(jīng)過系統(tǒng)調(diào)試和飛行試驗,能夠?qū)崿F(xiàn)語音和視頻信號的同步。采用該方案,使用一套PCM遙測系統(tǒng)可以遙測多路語音視頻,大大節(jié)約了硬件資源和成本。

參考文獻(xiàn):

[1]廖廣銳,劉萍.基于ADPCM語音壓縮算法研究[J].計算機(jī)與數(shù)字工程,2007,第7期.

[2]林志鋒,黃華燦,李學(xué)等.ADPCM語音壓縮編解碼器的FPGA實現(xiàn)[J].數(shù)字信號處理,2009,第33卷第5期.

[3]戚曉晶,李治國.視頻實時傳輸中MPEG-4技術(shù)的應(yīng)用[J].科技創(chuàng)新與應(yīng)用,2012,2月(上).

作者簡介:亓盛元(1982—),男,陜西西安人,工程師,研究生,研究方向:飛行試驗機(jī)載測試技術(shù);黃如昌(1984—),男,安徽天長人,工程師,研究生,研究方向:飛行試驗機(jī)載測試技術(shù);劉明(1971-),男,吉林白城人,高級工程師,研究生,研究方向:飛行試驗機(jī)載測試技術(shù)。

猜你喜歡
視頻遙測語音
魔力語音
基于MATLAB的語音信號處理
自適應(yīng)模糊PID控制的遙測方艙溫度調(diào)節(jié)方法
基于MQ3與MP3的價廉物美的酒駕語音提醒器
對方正在輸入……
某小型無人機(jī)遙測軟件設(shè)計
淺談如何提高遙測狀態(tài)估計合格率
利用VBA處理鄰近氣象站的相關(guān)遙測數(shù)據(jù)