国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字監(jiān)控視頻MPEG-4編碼壓縮技術(shù)研究

2014-04-29 00:44劉冠群凌梓
中國(guó)電子商情 2014年5期
關(guān)鍵詞:宏塊編解碼視音頻

劉冠群 凌梓

引言:數(shù)字視頻在工農(nóng)業(yè)生產(chǎn)中的重要性日益明顯,數(shù)字視頻編碼技術(shù)也愈加顯得重要和亟待解決的問(wèn)題。近年來(lái),由于MPEG-4壓縮技術(shù)在實(shí)時(shí)視頻監(jiān)控方面,無(wú)論是壓縮率,傳輸?shù)乃俾?,清晰度都比MPEG-1具有更大的優(yōu)勢(shì),現(xiàn)在MPEG-4在視頻監(jiān)控上占有統(tǒng)治地位。同時(shí),H.264在低碼率高畫質(zhì)方面有很大的優(yōu)勢(shì),相信H.264也是未來(lái)的發(fā)展趨勢(shì)。本文首先重點(diǎn)講述MPEG-4,然后對(duì)H.264中引進(jìn)的最新視頻編碼技術(shù)及我國(guó)"數(shù)字音視頻編解碼技術(shù)標(biāo)準(zhǔn)工作組"制定的AVS標(biāo)準(zhǔn)進(jìn)行簡(jiǎn)單的對(duì)比介紹。

一、引言

我國(guó)目前在視音頻產(chǎn)業(yè)領(lǐng)域已經(jīng)具備較強(qiáng)的產(chǎn)業(yè)基礎(chǔ),但由于不掌握核心技術(shù)標(biāo)準(zhǔn),相關(guān)企業(yè)長(zhǎng)期受制于國(guó)外持有標(biāo)準(zhǔn)化專利與技術(shù)的企業(yè)和組織。視音頻編解碼軟件技術(shù)屬于在市場(chǎng)前景好、產(chǎn)業(yè)關(guān)聯(lián)度大、關(guān)系國(guó)民經(jīng)濟(jì)發(fā)展和國(guó)家安全的戰(zhàn)略性技術(shù),是數(shù)字視音頻產(chǎn)業(yè)的核心技術(shù),發(fā)展編解碼軟件技術(shù),既可以占領(lǐng)編解碼軟件市場(chǎng),也是發(fā)展數(shù)字多媒體產(chǎn)業(yè)的基礎(chǔ)。視音頻編解碼軟件技術(shù)屬于在市場(chǎng)前景好、產(chǎn)業(yè)關(guān)聯(lián)度大、關(guān)系國(guó)民經(jīng)濟(jì)發(fā)展和國(guó)家安全的戰(zhàn)略性技術(shù),是數(shù)字視音頻產(chǎn)業(yè)的核心技術(shù)。視音頻編解碼軟件的應(yīng)用場(chǎng)合相當(dāng)廣泛,包括可視電話(固定或移動(dòng))、實(shí)時(shí)視頻會(huì)議系統(tǒng)、視頻監(jiān)控系統(tǒng)、Internet網(wǎng)視頻傳輸以及多媒體信息存儲(chǔ)等。由于安防行業(yè)中對(duì)監(jiān)控的視音頻信息長(zhǎng)期大量存儲(chǔ)的迫切需求,視音頻編解碼技術(shù)的最新發(fā)展在該行業(yè)中得到了快速產(chǎn)業(yè)轉(zhuǎn)化,并形成了一定的規(guī)模。近年來(lái),迅速發(fā)展的安防市場(chǎng)極大促進(jìn)了視音頻編碼板卡和數(shù)字硬盤錄像機(jī)(DVR)的技術(shù)更新速度。而視音頻編碼板卡和DVR的關(guān)鍵技術(shù)就是數(shù)字視音頻編解碼技術(shù)。

二、MPEG-4視頻編碼壓縮技術(shù)

MPEG-4視頻編碼標(biāo)準(zhǔn)支持MPEG-1、MPEC-2中的大多數(shù)功能,它包含了H.263的核心設(shè)計(jì),并增加了優(yōu)先特性和各種各樣創(chuàng)造性的新特性。它提供不同的視頻標(biāo)準(zhǔn)源格式、碼率、幀頻下矩形圖像的有效編碼,同時(shí)也支持基于內(nèi)容的圖像編碼。采納了基于對(duì)象(Object-Based)的編碼、基于模型(Model-based)的編碼等第二代編碼技術(shù)是MPEG-4標(biāo)準(zhǔn)的主要特征。MPEG-4視頻編碼系統(tǒng)框圖(如圖)

MPEG-4視頻編碼中主要包含以下關(guān)鍵技術(shù):離散余弦編碼(DCT);量化;Intra塊DC系數(shù)和AC系數(shù)的幀內(nèi)預(yù)測(cè);之型掃描與游程編碼;變字長(zhǎng)編碼(VLC);運(yùn)動(dòng)估計(jì);運(yùn)動(dòng)補(bǔ)償;高精度、多模式運(yùn)動(dòng)估計(jì)。

DCT主要完成圖像數(shù)據(jù)由空域轉(zhuǎn)向頻域,各系數(shù)相互獨(dú)立,這意味著各系數(shù)可分開(kāi)處理,同時(shí),圖像的高頻系數(shù)大部分接近于零。人的視覺(jué)系統(tǒng)對(duì)低頻比對(duì)高頻敏感的多,因此可以用更大的量化步長(zhǎng)來(lái)量化高頻系數(shù),使大部分高頻系數(shù)為零,從得到較高的壓縮比,而人眼很難察覺(jué)。量化是針對(duì)DCT變換系數(shù)進(jìn)行的,量化過(guò)程就是以某個(gè)量化步長(zhǎng)去除DCT系數(shù)。量化步長(zhǎng)的大小稱為量化精度,量化步長(zhǎng)越小,量化精度就越細(xì),包含的信息越多,但所需的傳輸頻帶越高。不同的DCT變換系數(shù)對(duì)人類視覺(jué)感應(yīng)的重要性是不同的,因此編碼器根據(jù)視覺(jué)感應(yīng)準(zhǔn)則,對(duì)一個(gè)8×8的DCT變換塊中的64個(gè)DCT變換系數(shù)采用不同的量化精度,以保證盡可能多地包含特定的DCT空間頻率信息,又使量化精度不超過(guò)需要。由于Intra編碼方式的各塊之間的DC和AC有較強(qiáng)的連續(xù)性,所以我們量化后可以進(jìn)一步進(jìn)行預(yù)測(cè)。DC和AC的預(yù)測(cè)方向有兩個(gè):水平方向和垂直方向。其預(yù)測(cè)方向主要取決于相鄰塊DC系數(shù)的相關(guān)性,AC的預(yù)測(cè)只對(duì)塊的第一行或第一列進(jìn)行預(yù)測(cè)。是對(duì)第一行進(jìn)行預(yù)測(cè)還是對(duì)第一列進(jìn)行預(yù)測(cè)主要取決于預(yù)測(cè)方向,其預(yù)測(cè)方向和DC預(yù)測(cè)方向一致。由于經(jīng)量化后,大多數(shù)非零DCT系數(shù)集中于8′8二維矩陣的左上角,即低頻分量區(qū),之型掃描后,這些非零DCT系數(shù)就集中于一維排列數(shù)組的前部,后面跟著長(zhǎng)串的量化為零的DCT系數(shù),這些就為游程編碼創(chuàng)造了條件。所謂游程編碼就是對(duì)掃描后64個(gè)系數(shù)進(jìn)行編碼:用非0系數(shù)的大小(Level)、其前面連續(xù)0的個(gè)數(shù)(Run)及終止標(biāo)志(Last:"0"便是其后還有不為0的系數(shù);"1"表示該系數(shù)為最后不為0的數(shù),余下的系數(shù)全為0)加起來(lái)構(gòu)成一個(gè)三維矢量(Last,Run,Level)。然后就可以對(duì)這些矢量進(jìn)行Huffman編碼。游程編碼形成的三維矢量是一種有效表示方式,實(shí)際傳輸前,還須對(duì)其進(jìn)行比特流編碼,產(chǎn)生用于傳輸?shù)臄?shù)字比特流。其中用得最多的就是Huffman編碼,Huffman編碼中,根據(jù)所有編碼信號(hào)的概率生成一個(gè)碼表,碼表中對(duì)大概率信號(hào)分配較少的比特表示,對(duì)小概率信號(hào)分配較多的比特表示,使得整個(gè)碼流的平均長(zhǎng)度趨于最短。運(yùn)動(dòng)估計(jì)用于幀間編碼,即P幀和B幀編碼。通過(guò)在參考幀圖像中搜索到與當(dāng)前塊最接近的塊。從而使傳輸?shù)恼`差塊可以用更少的比特表示,從而達(dá)到壓縮目的。運(yùn)動(dòng)估計(jì)的準(zhǔn)確程度對(duì)幀間編碼的壓縮效果非常重要。運(yùn)動(dòng)估計(jì)以宏塊或塊為單位進(jìn)行,計(jì)算被壓縮圖像與參考圖像的對(duì)應(yīng)位置上的宏塊或塊間的位置偏移。這種位置偏移是叫運(yùn)動(dòng)矢量(MV),一個(gè)運(yùn)動(dòng)矢量代表水平和垂直兩個(gè)方向上的位移?,F(xiàn)在MPEG-4所用的運(yùn)動(dòng)估計(jì)算法主要有:MVFAST(Motion Vector Field Adaptive Search Technique),改進(jìn)的PMVFAST(Predictive MVFAST)和EPZS (Enhanced Predictive Zonal Search) 算法。運(yùn)動(dòng)補(bǔ)償實(shí)際上是一種預(yù)測(cè)編碼的思想,因此,運(yùn)動(dòng)補(bǔ)償又可稱為運(yùn)動(dòng)預(yù)測(cè)。運(yùn)動(dòng)預(yù)測(cè)的過(guò)程為:根據(jù)前面在運(yùn)動(dòng)估計(jì)中得到的匹配MV,在當(dāng)前宏塊/塊和參考幀中的匹配宏塊/塊之間進(jìn)行預(yù)測(cè)(即:計(jì)算差值),編碼器只需對(duì)預(yù)測(cè)誤差和使用的MV進(jìn)行碼流編碼。幀內(nèi)圖像I幀不參照任何過(guò)去的或者將來(lái)的其他圖像幀,壓縮編碼采用類似JPEG壓縮算法。每幅圖像分成8×8的圖像塊,對(duì)每個(gè)圖像塊進(jìn)行離散余弦變換DCT。DCT變換后對(duì)每個(gè)系數(shù)進(jìn)行量化,然后對(duì)量化后的系數(shù)進(jìn)行DC、AC預(yù)測(cè),對(duì)預(yù)測(cè)后的差值按照Z(yǔ)ig-zag進(jìn)行掃描,然后再進(jìn)行游程編碼,最后用霍夫曼(Huffman)編碼或者用算術(shù)編碼得到最后的碼流。其中DC預(yù)測(cè)后的DC差值可直接查表得到對(duì)應(yīng)的碼字。預(yù)測(cè)圖像P幀的編碼是以圖像宏塊為基本編碼單元,一個(gè)宏塊定義為16×16像素的圖像塊。預(yù)測(cè)圖像P使用兩種類型的參數(shù)來(lái)表示:一種參數(shù)是當(dāng)前要編碼的圖像宏塊與參考圖像的宏塊之間的差值,另一種參數(shù)是宏塊的運(yùn)動(dòng)矢量。通過(guò)運(yùn)動(dòng)估計(jì)求得最佳運(yùn)動(dòng)矢量,然后通過(guò)運(yùn)動(dòng)補(bǔ)償?shù)玫降暮陦K與編碼宏塊相應(yīng)像素值之差的到差值模塊。然后仿照I幀編碼算法對(duì)差值進(jìn)行編碼,計(jì)算出的運(yùn)動(dòng)矢量也要進(jìn)行Huffman編碼。雙向預(yù)測(cè)圖像B幀的編碼方法與預(yù)測(cè)圖像P的算法類似。不過(guò),它除了可以參考過(guò)去的圖像之外,它還參考將來(lái)的圖像,參考過(guò)去幀和將來(lái)幀的均值幀。除了這三個(gè)參考幀之外,它還有一種參考模式,即直接模式。直接模式就是以將來(lái)的P幀的運(yùn)動(dòng)矢量的一半作為自己的運(yùn)動(dòng)矢量,以此矢量進(jìn)行運(yùn)動(dòng)補(bǔ)償,這樣的方法連MV都不用編碼傳輸,加上其量化步長(zhǎng)一般比I幀和P幀大,所以可以達(dá)到高的壓縮率。

三、結(jié)束語(yǔ)

視頻監(jiān)控是安全防范行業(yè)中的一個(gè)核心組成部分,由于安防行業(yè)對(duì)系統(tǒng)間互聯(lián)互通需求較低的特殊性及其對(duì)視頻信息大量存儲(chǔ)的迫切需求,隨著視頻編解碼技術(shù)的發(fā)展,安防行業(yè)迅速完成了由模擬向數(shù)字視頻的轉(zhuǎn)變,并形成了一定的規(guī)模,這一轉(zhuǎn)變過(guò)程走在了廣播電視、通信等信息處理行業(yè)的前面。同時(shí)我們也應(yīng)當(dāng)看到,安防行業(yè)的發(fā)展趨勢(shì)是逐步走向遠(yuǎn)程化、網(wǎng)絡(luò)化、移動(dòng)化,這其中必然涉及到通信網(wǎng)的構(gòu)建技術(shù)、傳輸技術(shù)等多個(gè)不同層面。隨著安防系統(tǒng)的復(fù)雜化,安防領(lǐng)域的核心技術(shù)問(wèn)題將轉(zhuǎn)變?yōu)樾旁淳幋a、信道編碼、傳輸質(zhì)量保證(QoS)等通信領(lǐng)域一直關(guān)注的問(wèn)題。安防行業(yè)的發(fā)展必將促進(jìn)通信行業(yè)的發(fā)展,并最終將在某種層面演變成為通信網(wǎng)上的一個(gè)行業(yè)應(yīng)用。

參考文獻(xiàn)

[1]劉如京,王玲.一種NMF和SVD相結(jié)合的魯棒水印算法[J].計(jì)算機(jī)科學(xué),2011,38(2): 271-273.

[2]朱賢坤.基于小波域的雙彩色圖像數(shù)字水印算法[D].西安:西北師范大學(xué),2009.

[3]董衛(wèi)軍,周明全等.基于多小波變換的彩色數(shù)字水印[J].小型微型計(jì)算機(jī)系統(tǒng)2006,27(8):1549-1551.

作者簡(jiǎn)介

劉冠群(1981-),女,碩士學(xué)位,講師,工程師,主要研究領(lǐng)域?yàn)檐浖夹g(shù),通信技術(shù).

凌梓(1975-),男,碩士學(xué)位,講師,主要研究領(lǐng)域?yàn)樗惴ǚ治?數(shù)字圖像處理.

猜你喜歡
宏塊編解碼視音頻
1553B總線控制器編解碼設(shè)計(jì)
我國(guó)首個(gè)超高清視音頻國(guó)家重點(diǎn)實(shí)驗(yàn)室在滬啟動(dòng)建設(shè)
大型民機(jī)試飛遙測(cè)視頻編解碼方法研究
中央廣播電視總臺(tái)啟動(dòng)建設(shè)國(guó)家重點(diǎn)實(shí)驗(yàn)室
基于H.265編解碼的高清視頻傳輸系統(tǒng)研究
基于選擇特征宏塊的快速視頻穩(wěn)像
基于內(nèi)容結(jié)構(gòu)特征的Flash電影視音頻特征的提取研究
電視臺(tái)視音頻資料數(shù)字化存儲(chǔ)
主流視頻編解碼軟件的硬件性能分析與設(shè)計(jì)
基于宏塊合并的H.264模式選擇算法