蔡旻,歐揚(yáng),胡伏原,雷巖
(蘇州科技學(xué)院電子與信息工程學(xué)院,江蘇蘇州215009)
一種基于標(biāo)量量化分割的視頻多描述編碼方法
蔡旻,歐揚(yáng),胡伏原,雷巖
(蘇州科技學(xué)院電子與信息工程學(xué)院,江蘇蘇州215009)
多描述編碼技術(shù)能提高編碼的魯棒性來保證視頻流的高效穩(wěn)定傳輸,是一種重要的差錯(cuò)復(fù)原技術(shù)。結(jié)合多描述編碼理論和視頻編碼具體情況,提出了一種基于標(biāo)量量化分割的視頻多描述編碼方法,通過歸納得到兩張索引匹配表,并由此將DCT系數(shù)分割為兩路,實(shí)現(xiàn)了在編碼端的分割。而在接收端通過增加反映射模塊,實(shí)現(xiàn)每一路都能單獨(dú)解碼,兩路全部收到可以聯(lián)合解碼。最后通過實(shí)驗(yàn)證明:該方法是可行的,并取得比較好的圖像效果。
視頻編碼;多描述編碼;多描述標(biāo)量量化
在無線、因特網(wǎng)等易發(fā)生誤碼的網(wǎng)絡(luò)環(huán)境中,視頻信號(hào)傳輸面臨著很大挑戰(zhàn)。多描述編碼作為差錯(cuò)復(fù)原技術(shù)的一種,能解決傳統(tǒng)編碼方法在遭受誤碼或丟包后引起的視頻質(zhì)量下降問題。它將單個(gè)信源信號(hào)編碼成兩個(gè)或兩個(gè)以上獨(dú)立的比特流,這些獨(dú)立的比特流被稱為描述。多描述編碼兩個(gè)主要特征是:(1)可以獨(dú)立的對(duì)每個(gè)描述進(jìn)行解碼,重構(gòu)出可用的原始信號(hào);(2)多個(gè)描述之間存在互補(bǔ)信息,隨著正確的接收到的描述數(shù)量的增加,解碼出的圖像質(zhì)量也逐步提高。
近年來多描述編碼依然是視頻、圖像領(lǐng)域的研究熱點(diǎn)。劉美琴等人[1]在分形圖像編解碼領(lǐng)域引入多描述編碼方案,將變換后的分形參數(shù)形成兩個(gè)獨(dú)立描述,并利用圖像相鄰值域塊均值的相關(guān)性減少比特率。王礽曉等人[2]針對(duì)圖像的感興趣區(qū)域進(jìn)行非線性幾何變換產(chǎn)生冗余形成多描述編碼,達(dá)到保護(hù)圖像重點(diǎn)區(qū)域的效果。王相海等人[3]將多描述編碼與圖像編碼質(zhì)量可分級(jí)機(jī)制相結(jié)合,提出了一種基于DCT分層結(jié)構(gòu)的分級(jí)多描述編碼方案并運(yùn)用在遙感圖像領(lǐng)域。該方案將包含圖像細(xì)節(jié)信息的增強(qiáng)層通過下采樣形成多個(gè)描述,將包含圖像關(guān)鍵信息的基本層作為冗余引入到每個(gè)描述中,從而保證了在解碼端獲取遙感圖像基本層信息的最大可能性。陳婧等人[4]提出了一種基于H.264和雙樹小波的分層多描述視頻編碼方案,在基本層采用H.264編碼器對(duì)視頻進(jìn)行低碼率編碼,將此信息分別拷貝到各個(gè)描述;在增強(qiáng)層采用三維雙樹小波變換產(chǎn)生四組小波系數(shù),再將碼字分成兩組編碼后形成各描述的特有信息。董萌等人[5]對(duì)視頻中每幀圖像進(jìn)行水平方向和垂直方向下采樣得到四個(gè)子圖像,將四個(gè)子圖像構(gòu)成的四個(gè)視頻子序列兩兩組合形成兩路描述,提出了基于模式復(fù)制的多描述編碼算法。
隨著壓縮感知技術(shù)的成熟,劉丹華等人[6]也提出了基于壓縮感知框架的多描述編碼方法。而將空間亞采樣技術(shù)和壓縮感知技術(shù)結(jié)合起來,趙春暉等人[7]提出了基于交織抽取與分塊壓縮感知策略的圖像多描述編碼方法。鄭海波等人[8]從測(cè)量值信息分布均勻且互不相關(guān)的特性入手,在編碼端利用分塊壓縮感知技術(shù)對(duì)圖像進(jìn)行隨機(jī)測(cè)量,將得到的測(cè)量結(jié)果矩陣按行平分從而實(shí)現(xiàn)多描述編碼。
上述給出的多描述編碼方法在具體實(shí)現(xiàn)上都有其獨(dú)到之處。在實(shí)際應(yīng)用中主要是從編碼效率、編碼質(zhì)量、編碼復(fù)雜度、丟包復(fù)原能力、主觀效果等方面考察方法的優(yōu)劣。筆者提出的一種基于標(biāo)量量化分割的視頻多描述編碼方法,利用圖像經(jīng)DCT變換后的量化系數(shù)進(jìn)行映射分割,得到兩路視頻信號(hào),每一路都能單獨(dú)解碼,兩路全部收到可以聯(lián)合解碼。經(jīng)編解碼平臺(tái)測(cè)試該方法可行,并能取得較好的主客觀效果。
一般意義上,多描述編碼可以理解成:信源在發(fā)送端有多種描述形式,這些描述構(gòu)成一個(gè)集合;接收端從集合的子集中盡可能的精確恢復(fù)出信源,這和多用戶信息論中多址接入問題十分相似。多描述編碼的模型如圖1所示。信源通過多描述編碼器得到S1,S2,…,Sn多個(gè)描述,各描述通過獨(dú)立的信道傳送到解碼端,解碼器最少接收0個(gè)描述,最多接收n個(gè)描述,總共有2n種接收情況。接收到的描述個(gè)數(shù)不同,解碼器能恢復(fù)的信源程度也不同,當(dāng)所有描述都收到時(shí),可最大限度的恢復(fù)信源。
圖1 多描述編碼模型
以兩個(gè)描述為例來闡述其原理,如圖2所示。
圖2 兩描述編碼的框圖
碼率失真函數(shù)描述了碼率和失真之間的函數(shù)關(guān)系,是衡量多描述編碼方法性能的重要指標(biāo)。多描述率失真區(qū)域是指在多描述編碼中同時(shí)獲得的碼率和失真的封閉集合。若用R1、R2分別表示信道1、2的速率,D0、D1、D2分別表示解碼器1、2、3帶來的失真,針對(duì)圖2中兩個(gè)描述的情況,多描述率失真區(qū)域?yàn)榭色@得的五元組(R1,R2,D0,D1,D2)的封閉集合。
率失真函數(shù)R(D)是在率失真區(qū)域中失真為D時(shí)可獲得的最小碼率。相應(yīng)的率失真函數(shù)R(D)是在率失真區(qū)域中碼率為R時(shí)可獲得的最小失真。則對(duì)該封閉區(qū)域的最簡單約束為
若信源是方差為σ2的無記憶高斯信源,那么(R1,R2,D0,D1,D2)滿足如下條件
在式(4)中,若D1+D2>σ2+D0,則γD=1;否則
式(4)表明中央失真必須超過乘以因數(shù)γD后所得的失真碼率的最小值。當(dāng)一個(gè)或兩個(gè)邊緣失真很大時(shí),令γD=1可以得到一個(gè)很好的中央重建值[9]。Vaishampayan[10]最早研究了兩描述情況下的多描述標(biāo)量量化的問題,并指出其中的關(guān)鍵在于找到一個(gè)匹配器來產(chǎn)生一路分成兩路的映射,如圖3所示。
圖3 兩描述標(biāo)量量化框圖
在圖3中,x是信源產(chǎn)生的抽樣,經(jīng)過編碼器得到索引l,a(·)是一個(gè)匹配器,將索引l匹配為索引對(duì)(i,j)。g0,g1是邊解碼器,分別收到i和j,解碼產(chǎn)生。g2是中央解碼器,收到(i,j)后解碼產(chǎn)生。其中最難實(shí)現(xiàn)的是如何由索引l匹配索引對(duì)(i,j),并且從l到(i,j)必須是可逆的,只有這樣才能保證解碼端能準(zhǔn)確恢復(fù)出信源抽樣。
考慮到視頻編碼框架的具體情況,在DCT變換后的量化系數(shù)中引入多描述編碼方案是合理可行的。一個(gè)8*8的圖像數(shù)據(jù),經(jīng)過DCT變換,再經(jīng)過正常的標(biāo)準(zhǔn)量化,得到64個(gè)8 bit的數(shù)據(jù)。這64個(gè)數(shù)據(jù)的取值范圍是從-127~+127??疾爝@64個(gè)數(shù)據(jù),其中零數(shù)據(jù)占了很大一部分,非零數(shù)據(jù)集中在數(shù)組的左上角。需要做的是對(duì)非零數(shù)據(jù)進(jìn)行映射。
利用矩陣的直觀性,筆者將原始數(shù)據(jù)映射到矩陣的行方向(或稱水平方向)和列方向(或稱垂直方向),這樣就將一路數(shù)據(jù)映射為兩路。這里面必定要考慮的問題是如何在矩陣中擺放數(shù)據(jù)。
如圖4(a)所示,將8個(gè)數(shù)據(jù)沿主對(duì)角線擺放到8*8的矩陣中,這樣任意一個(gè)數(shù)據(jù)可以映射到矩陣的行方向和列方向。反過來,如果任意收到行方向或列方向的數(shù)據(jù),也可以通過查矩陣來得到原始數(shù)據(jù)。但這種擺放方式的問題是“太浪費(fèi)資源”。比如圖4(b)中同樣是8*8矩陣,但可以擺放22個(gè)數(shù)據(jù),擺放規(guī)律是主對(duì)角線加兩條副對(duì)角線。同圖4(a)一樣,任意一個(gè)數(shù)據(jù)可映射到矩陣行方向和列方向。但區(qū)別是:任意接收到行方向或列方向的數(shù)據(jù),不能精確恢復(fù)原始數(shù)據(jù)。舉例說明,收到行方向的數(shù)據(jù)“4”,查矩陣,對(duì)應(yīng)的原始數(shù)據(jù)有三種可能,只能在其中挑出一個(gè)作為恢復(fù)出的“有誤差的原始數(shù)據(jù)”。圖4(b)中還隱含著:如果收到行方向和列方向的兩路數(shù)據(jù),那么可以精確恢復(fù)出原始數(shù)據(jù)的。更進(jìn)一步說明,如果為了追求“節(jié)約資源”,可以在圖4(b)中再添兩條副對(duì)角線,但這樣會(huì)在恢復(fù)數(shù)據(jù)時(shí)帶來更大誤差。
圖4 在矩陣中擺放數(shù)據(jù)
由此得到兩張表,這兩張表分別對(duì)應(yīng)的是量化系數(shù)為正和為負(fù)時(shí)的映射情況,如圖5(a)、(b)所示。
以圖5(a)來分析說明。筆者把1~127這127個(gè)數(shù)據(jù)如圖5(a)所示擺放到43*43的矩陣中,擺放規(guī)律是一條主對(duì)角線加兩條副對(duì)角線。另外為了后面歸納公式,以“Z”字形從小到大擺放的。任意某個(gè)數(shù)據(jù),比如“17”,它在水平方向映射為7,垂直方向映射為6。若接收端收到水平方向的數(shù)據(jù)7,則恢復(fù)出來的數(shù)據(jù)可以是“17,19,21”三者之一,一般取中值19;若接收端收到垂直方向的數(shù)據(jù)6,則恢復(fù)出來的數(shù)據(jù)可以是“15,16,17”三者之一,一般取中值16;若接受端同時(shí)收到水平方向的數(shù)據(jù)7和垂直方向的數(shù)據(jù)6,則可以查表立刻得到精確恢復(fù)值17。
圖5 兩張映射表
另外還需要說明的是:原本的一路信源,其中每個(gè)數(shù)據(jù)都要8 bit量化。經(jīng)過如上表中映射后,每個(gè)數(shù)據(jù)只需7 bit量化,這樣帶來的結(jié)果是兩路描述中的每一路數(shù)據(jù)比原始數(shù)據(jù)有不同程度的減少。
在真正的編解碼程序中,上述的兩張表要變換成相應(yīng)的公式體現(xiàn)為:
在編碼端,分解到水平方向(第一路描述)qcoeff[i]=qcoeff[i]/3+qcoeff[i]%3,
其中qcoeff[i]是標(biāo)準(zhǔn)量化后的DCT全部系數(shù),i從0到63,(下同);
在編碼端,分解到垂直方向(第二路描述)qcoeff[i]=qcoeff[i]/3+1;
在解碼端,如果收到第一路描述,則恢復(fù)出帶誤差的信源解碼為qcoeff[i]=3*qcoeff[i]-2;
在解碼端,如果收到第一路描述,則恢復(fù)出帶誤差的信源解碼為qcoeff[i]=3*qcoeff[i]-2;
在解碼端,如果兩路描述都收到,則恢復(fù)出精確的信源聯(lián)合解碼為qcoeff[i]=a[i]+2*b[i]-2;
其中a[i],b[i]為第一路和第二路描述中的數(shù)據(jù)。
需要說明的是,以上分析的是當(dāng)量化系數(shù)為正時(shí)的情況,也即圖5(a)中的情況。圖5(b)中的情況略有不同,請(qǐng)讀者自行分析。
3.1 主觀效果
由圖6、圖7可以看出,將一路視頻分解為兩路視頻在主觀效果上是可以接受的。另外,可以發(fā)現(xiàn),第二路(數(shù)據(jù)垂直方向分解映射)的主觀效果要略好于第一路(數(shù)據(jù)從水平方向分解映射),這和筆者在文中第2部分的分析是一致的。
圖6 claire.cif序列分解為第一路的視頻截圖(連續(xù)三個(gè)截圖,分別為I,P,P幀)
圖7 claire.cif序列分解為第二路的視頻截圖(連續(xù)三個(gè)截圖,分別為I,P,P幀)
3.2 客觀效果
文中采用的實(shí)驗(yàn)測(cè)試平臺(tái)是經(jīng)典的H.263框架。在H.263標(biāo)準(zhǔn)中,量化步長QP是可以設(shè)定的,范圍從1到31。量化步長的改變對(duì)碼率(單位是kbit/s)和PSNR(對(duì)Cr,Cb,Y分量中的Y分量而言)有影響。在實(shí)驗(yàn)中,選取量化步長QP從6到26共11個(gè)數(shù)值,間隔為2。
由圖8可以分析得出,分解出的第一路和第二路這兩個(gè)單路情況下的編碼效果(體現(xiàn)在PSNR上)要略遜于H.263的標(biāo)準(zhǔn)情況。但是,換來的是每路的碼率都要比H.263情況下低,在犧牲編碼效率的同時(shí)提高了編碼魯棒性。另外還可以發(fā)現(xiàn),第二路的PSNR要優(yōu)于第一路,這和3.1節(jié)中的主觀效果一致。
圖8 claire.cif序列兩個(gè)單路與標(biāo)準(zhǔn)狀況的比較
文中分析了視頻中的多描述編碼技術(shù),結(jié)合Vaishampayan提出的多描述標(biāo)量量化方法,提出一種基于標(biāo)量量化分割的視頻多描述編碼方法。在編碼端將圖像DCT變換后的量化系數(shù)進(jìn)行映射分割,使一路視頻數(shù)據(jù)映射為兩路。解碼端收到任一路都能獨(dú)立解碼,收到兩路則可精確聯(lián)合解碼。實(shí)驗(yàn)結(jié)果表明:該方法是可行的,在犧牲少許編碼效率的同時(shí)提高了編碼魯棒性,符合多描述編碼的定義。
[1]劉美琴,趙耀.基于FGSE的快速分形圖像編碼算法及其多描述編碼方案[J].電子學(xué)報(bào),2010,38(3):658-663.
[2]王礽曉,倪林,劉權(quán).感興趣區(qū)域的非線性變換多描述編碼[J].計(jì)算機(jī)工程,2011,37(6):215-220.
[3]王相海,方錦,宋傳鳴.基于DCT分層結(jié)構(gòu)的遙感圖像分級(jí)多描述編碼算法[J].遙感學(xué)報(bào),2011,15(5):989-1007.
[4]陳婧,李莉,蔡燦輝.基于H.264和雙樹小波的多描述視頻編碼[J].信號(hào)處理,2011,27(8):1265-1270.
[5]董萌,蔡燦輝.基于模式復(fù)制的H.264多描述視頻編碼[J].信號(hào)處理,2011,27(11):1675-1679.
[6]劉丹華,石光明,周佳社,等.基于Compressed Sensing框架的圖像多描述編碼方法[J].紅外與毫米波學(xué)報(bào),2009,28(4):298-302.
[7]趙春暉,劉巍.基于交織抽取與分塊壓縮感知策略的圖像多描述編碼方法[J].電子與信息學(xué)報(bào),2011,33(2):461-465.
[8]鄭海波,朱秀昌.基于分塊壓縮感知與平均分組的圖像多描述編碼[J].數(shù)據(jù)采集與處理,2014,29(5):764-769.
[9]Goyal V K.Multiple description coding:Compression meets the network[J].IEEE Signal Processing Magazine,2001,18(9):74-93.
[10]Vaishampayan V A.Design of multiple description scalar quantizers[J].IEEE Transactions on Information Theory,1993,39(3):821-834.
A video multiple description coding approach based on scalar quantization division
CAI Min,OU Yang,HU Fuyuan,LEI Yan
(School of Electronic&Information Engineering,SUST,Suzhou 215009,China)
Multiple Description Coding(MDC)technology belongs to error-resilience,which ensures the good transmitting of video stream by enhancing the robust of coding.Considering MDC theory and situations of video coding,this paper proposes a video multiple description coding approach based on scalar quantization division by concluding two tables of index matching.In this way,we divide DCT coefficients into two pathways at the coding-end.At the decoding-end,each bit-stream can be decoded independently by adding the reverse module,joint decoding when both bit-streams were received.The result of the experiment shows that this approach is feasible,and can obtain good quality of the video.
video coding;multiple description coding;multiple description scalar quantization
TP391
A
1672-0687(2015)04-0046-05
責(zé)任編輯:艾淑艷
2015-03-16
國家自然科學(xué)基金資助項(xiàng)目(61472267);江蘇省自然科學(xué)基金資助項(xiàng)目(BK2012166)
蔡旻(1978-),男,江蘇張家港人,助教,碩士,研究方向:多媒體與圖像通信,視頻編碼。