韓予皖,師 衛(wèi)
(太原理工大學(xué)信息工程學(xué)院,山西太原 030024)
兩描述分布式視頻壓縮傳感
韓予皖,師 衛(wèi)
(太原理工大學(xué)信息工程學(xué)院,山西太原 030024)
為了滿足低功耗視頻設(shè)備的低復(fù)雜度編碼及無(wú)線網(wǎng)絡(luò)傳輸?shù)姆€(wěn)定性,提出了兩描述分布式視頻壓縮傳感(2D-DCVS)方案。在編碼端,首先把視頻序列分成兩個(gè)子序列,即兩個(gè)描述;然后將兩個(gè)描述通過(guò)分布式視頻壓縮傳感(DCVS)壓縮。由于將運(yùn)動(dòng)估計(jì)、變換編碼等復(fù)雜度較高的運(yùn)算轉(zhuǎn)移到解碼端進(jìn)行,DCVS具有低復(fù)雜度編碼的特性。在解碼端包括兩種解碼器,分別是中心解碼器和邊解碼器。當(dāng)兩個(gè)描述都被收到時(shí),中心解碼器能夠恢復(fù)出最好質(zhì)量的視頻;即使僅當(dāng)一個(gè)描述被收到時(shí),那也能夠保證得到一個(gè)尚可接受的重建視頻。實(shí)驗(yàn)結(jié)果表明,特別當(dāng)測(cè)量率低時(shí),2D-DCVS顯示出了優(yōu)越性。
2D-DCVS;DCVS;低復(fù)雜度編碼
【本文獻(xiàn)信息】韓予皖,師衛(wèi).兩描述分布式視頻壓縮傳感[J].電視技術(shù),2013,37(3).
隨著無(wú)線網(wǎng)絡(luò)和多媒體技術(shù)的快速發(fā)展,低功耗的無(wú)線視頻設(shè)備逐漸流行。由于有限的電池能量和內(nèi)存,以及不穩(wěn)定的無(wú)線網(wǎng)絡(luò),這些設(shè)備需要低復(fù)雜度的編碼算法和穩(wěn)定的傳輸。
傳統(tǒng)的視頻編碼算法,例如H.26x,MPEG系列標(biāo)準(zhǔn),由于這些算法在編碼端采用了運(yùn)動(dòng)估計(jì)、正交變換、運(yùn)動(dòng)補(bǔ)償?shù)?,造成了較高的計(jì)算復(fù)雜度,所以不符合上述要求。然而分布式視頻編碼(DVC)[1],也稱(chēng)Wyner-Ziv(WZ)視頻編碼,其主要采用了獨(dú)立編碼和聯(lián)合解碼的編碼框架,具有一定的信道傳輸?shù)聂敯粜院偷蛷?fù)雜度編碼的特點(diǎn),近幾年來(lái)在圖像/視頻編碼的研究方面,一直是人們研究的熱點(diǎn)課題。DVC把復(fù)雜的計(jì)算從編碼端轉(zhuǎn)移到解碼端,因此表現(xiàn)出低復(fù)雜度編碼特性。同時(shí),壓縮傳感(CS)[2]理論也激起人們的興趣,能同時(shí)進(jìn)行數(shù)據(jù)采集和壓縮,其采樣數(shù)量遠(yuǎn)小于奈奎斯特采樣,通過(guò)隨機(jī)測(cè)量方法,提供一個(gè)簡(jiǎn)單的編碼和高精確的重構(gòu)。所以根據(jù)DVC和CS各自的特性綜合生成一個(gè)新的框架叫做分布式視頻壓縮傳感(DCVS)[3],這不僅減少了視頻壓縮的數(shù)據(jù)量,而且降低了編碼的復(fù)雜度。
近幾年,多描述編碼(MDC)引起了人們的關(guān)注,其特點(diǎn)是延時(shí)小、無(wú)需重傳、易于實(shí)時(shí)視頻傳輸,適用于互聯(lián)網(wǎng)、無(wú)線通信網(wǎng)這些不穩(wěn)定的網(wǎng)絡(luò)的實(shí)時(shí)視頻傳輸,是一種新的面向不可靠信道傳輸?shù)木幋a方法。視頻信號(hào)被分成多個(gè)描述,每個(gè)描述通過(guò)單獨(dú)的信道傳輸。當(dāng)一些描述丟失時(shí),可以通過(guò)收到的描述來(lái)估計(jì)丟失描述,恢復(fù)出質(zhì)量可接受的視頻;當(dāng)收到的描述增多時(shí),恢復(fù)出的視頻質(zhì)量變得更好。
為了滿足低耗視頻設(shè)備的低復(fù)雜度編碼和穩(wěn)定的傳輸,筆者利用DCVS和MDC各自的特性,綜合生成一種多描述分布式視頻壓縮傳感(MD-DCVS)新的方案。在MDDCVS框架里,為了提高系統(tǒng)的性能,應(yīng)用了塊壓縮傳感(BCS)、自適應(yīng)稀疏基和雙邊運(yùn)動(dòng)估計(jì)補(bǔ)償。
Donoho[4]和 Candes[5]等人在 2004 年提出了 CS 理論,CS理論是一種全新的信號(hào)描述與處理的理論框架,其主要內(nèi)容在某一變換域內(nèi)具有稀疏表示的信號(hào),或者是此信號(hào)是可壓縮的,就可以基于與變換基不相關(guān)的少量線性觀測(cè)將變換所得的高維信號(hào)投影到一個(gè)低維空間上,最后通過(guò)求解一個(gè)最優(yōu)化問(wèn)題,可以從這些少量的觀測(cè)值中高概率地恢復(fù)出原始信號(hào)。
假設(shè)信號(hào)x為1個(gè)RN空間的M×1維列向量,則其可用1組基向量(稀疏基)ΨN×N的線性組合來(lái)表示,其數(shù)學(xué)表達(dá)式為[4]
式中:θ表示稀疏系數(shù);信號(hào)x具有可壓縮性或稀疏性,信號(hào)是可壓縮的是指在允許較少的損失情況下,具有較少的大系數(shù)和許多小系數(shù),小系數(shù)都是極小或接近于零的數(shù)。信號(hào)是稀疏的,是指只有K個(gè)非零系數(shù),K遠(yuǎn)小于N,其余所有系數(shù)都為零,這樣還可稱(chēng)作K-稀疏信號(hào)。信號(hào)的稀疏基選擇,由信號(hào)本身的特點(diǎn)決定,如離散傅里葉變換(DFT)基、離散余弦變換(DCT)基、離散小波變換(DWT)基,都可作為信號(hào)的稀疏基。
信號(hào)的采樣與壓縮是通過(guò)觀測(cè)矩陣線性投影實(shí)現(xiàn)的,設(shè)Φ為M×N(M?N)的觀測(cè)矩陣,則長(zhǎng)度為N的信號(hào)x的觀測(cè)值y可由線性測(cè)量直接獲得式中:y是M×1的觀測(cè)值向量;A=Φ·Ψ為M×N的矩陣;Φ滿足以下的條件:1)受限等距特性準(zhǔn)則(RIP)[5];2)非相干性。測(cè)量矩陣Φ的列與稀疏基矩陣Ψ的行不能相互表示。x可以憑借這些觀測(cè)值,通過(guò)貪婪追蹤算法或者轉(zhuǎn)化為凸優(yōu)化問(wèn)題求解,從而精確重建原信號(hào)。
DCVS框架[3]如圖1所示。在編碼端,一個(gè)視頻序列由幾組圖像組成,每組圖像包括一個(gè)關(guān)鍵幀和一些CS幀,關(guān)鍵幀可以作為相鄰CS幀的參考幀。在編碼端,每一幀(關(guān)鍵幀或者CS幀)都單獨(dú)被CS壓縮,而關(guān)鍵幀CS測(cè)量率比CS幀高。
圖1 DCVS框架
在解碼端,每一關(guān)鍵幀可以通過(guò)梯度投影稀疏重建(GPSR)[6]算法來(lái)恢復(fù),GPSR算法的初始值和迭代終止條件,可以通過(guò)視頻序列之間相關(guān)性進(jìn)一步改進(jìn)。對(duì)于CS幀,首先根據(jù)已解碼的關(guān)鍵幀,運(yùn)動(dòng)補(bǔ)償內(nèi)插出其邊信息,然后通過(guò)聯(lián)合稀疏模型(JSM)和邊信息進(jìn)行重建。
一個(gè)簡(jiǎn)單的兩描述編解碼框架如圖2所示,編碼端首先將一個(gè)視頻信號(hào)用多描述視頻編碼器分成兩個(gè)子序列,即描述S1和S2,然后分別單獨(dú)通過(guò)信道1和信道2傳輸;解碼端包括一個(gè)中心解碼器和兩個(gè)邊解碼器,當(dāng)兩個(gè)描述S1和S2都可以收到時(shí),中心解碼器起作用;當(dāng)描述S2完全丟失時(shí),邊解碼器1起作用;當(dāng)描述S1完全丟失時(shí),邊解碼器2起作用。由圖2可知,當(dāng)所有的描述被收到時(shí),中心解碼器將恢復(fù)出最好的質(zhì)量視頻序列;假設(shè)一個(gè)描述丟失,相應(yīng)的解碼邊將從收到的描述來(lái)估計(jì)丟失的描述,恢復(fù)出可接收的視頻序列。因?yàn)檫@兩個(gè)描述之間相關(guān),所以丟失的描述能夠用收到的描述來(lái)估計(jì)。一般來(lái)說(shuō),描述間的相關(guān)性越高,更高質(zhì)量的描述能夠被估計(jì)出來(lái)。然而,隨著相關(guān)性增加,冗余也增加,編碼的效率也隨之降低。所以,在MDC中,在編碼效率和恢復(fù)出的視頻質(zhì)量之間的權(quán)衡很重要。
圖2 兩描述編解碼框架
為了實(shí)現(xiàn)低功耗視頻設(shè)備的低復(fù)雜度編碼及無(wú)線網(wǎng)絡(luò)傳輸?shù)姆€(wěn)定性,本文根據(jù)MDC和DCVS各自特性,綜合產(chǎn)生一種2D-DCVS新的方案,該方案框架如圖3所示。
圖3 2D-DCVS框架
在編碼端,一個(gè)視頻序列通過(guò)奇偶分離法,將視頻分成兩個(gè)描述,即奇數(shù)幀子序列和偶數(shù)幀子序列。每一個(gè)描述被分成幾組圖像,每組圖像又包括一個(gè)關(guān)鍵幀和一些CS幀。每一關(guān)鍵幀按照CS方法編碼;對(duì)于每一CS幀,為了降低編碼復(fù)雜度,先把每一幀圖像分成塊,然后用塊壓縮傳感 (BCS)[7]方法進(jìn)行幀觀測(cè),對(duì)一個(gè)圖像塊xB,其觀測(cè)值為
式中:yB表示觀測(cè)值向量;ΦB表示觀測(cè)矩陣,是由結(jié)構(gòu)化隨機(jī)矩陣(SRMS)[8]方法構(gòu)造的。SRM的優(yōu)點(diǎn)是計(jì)算速度快、結(jié)構(gòu)簡(jiǎn)單。SRM建立在可靠數(shù)學(xué)模型的基礎(chǔ)上,能有效測(cè)量廣泛種類(lèi)的稀疏信號(hào),在精確恢復(fù)所需的觀測(cè)值個(gè)數(shù)的矩陣中,幾乎達(dá)到最佳效果,是一種性能優(yōu)異的觀測(cè)矩陣。
在解碼端,每一關(guān)鍵幀可以通過(guò)GPSR算法來(lái)重建;而每個(gè)圖像塊也通過(guò)GPSR算法進(jìn)行重構(gòu),這是一個(gè)無(wú)限制凸優(yōu)化問(wèn)題,表示為
式中:yB是從式(3)獲得的觀測(cè)值;A=ΦB·ΨB,ΨB是xB的稀疏基,即:xB=ΨB·θB,θB是xB在ΨB基下的系數(shù);‖·‖2表示l2范數(shù);‖·‖1表示l1范數(shù);τ是一個(gè)非平衡參數(shù)。稀疏變換矩陣在很多CS算法中,通常都選擇固定且正交的變換基向量,例如DFT,DCT,DWT等。因?yàn)橄噜彽膬蓚€(gè)視頻序列之間,存在著緊密聯(lián)系,具有很大相似性,所以自適應(yīng)稀疏基是由當(dāng)前塊的前/后已重構(gòu)的關(guān)鍵幀中相應(yīng)位置的一些相鄰的塊組成。兩個(gè)相鄰幀中的一些塊,可以線性組合起來(lái)近似表示當(dāng)前塊,在此稀疏基下,圖像塊表現(xiàn)出更好的稀疏性,因此可以得到較好的CS恢復(fù)質(zhì)量。
假設(shè)只僅收到一個(gè)描述(以描述1為例),描述1的所有關(guān)鍵幀即K幀(1,5,9,…),首先通過(guò)GPRS算法重建;然后CS幀由通過(guò)已恢復(fù)出相鄰關(guān)鍵幀運(yùn)動(dòng)補(bǔ)償內(nèi)插產(chǎn)生的邊信息,并利用自適應(yīng)稀疏基對(duì)CS幀中的每個(gè)圖像塊的恢復(fù)進(jìn)行聯(lián)合重建;最后由重構(gòu)的所有的奇數(shù)幀內(nèi)插描述2的偶數(shù)幀,以便獲得人們可接受的完整視頻序列。具體細(xì)節(jié)描述如圖4所示。
圖4 邊解碼器
假設(shè)所有描述都收到,所有的 K 幀(1,2,5,6,…)通過(guò) GPRS 算法重建;所有 CS 幀(3,4,7,8,…)通過(guò) BCS 恢復(fù)。如上文所述,利用雙邊運(yùn)動(dòng)估計(jì)補(bǔ)償,能夠恢復(fù)出更好質(zhì)量的CS幀,最后能夠獲得最好質(zhì)量的視頻序列。具體細(xì)節(jié)描述如圖5所示。
圖5 中心解碼器
本文選取2個(gè)視頻測(cè)試序列Foreman和Hall,新方案2D-DCVS和文獻(xiàn)[9]DCVS作比較。觀測(cè)率(Measurement Rate)是兩個(gè)描述之和,包括關(guān)鍵幀和CS幀;PSNR為在解碼端視頻恢復(fù)的平均值;視頻圖像組GoP大小為2;塊的大小為16×16。
從圖6可知,對(duì)于Hall,邊解碼器和中心解碼器恢復(fù)出的視頻質(zhì)量,在相同測(cè)量率下,2D-DCVS明顯優(yōu)于DCVS;2D-DCVS得到大約0.7~1.4 dB的中心質(zhì)量的提高,0~1.3 dB左右的邊質(zhì)量提高。而對(duì)于Foreman,中心質(zhì)量提高了0.2~0.8 dB,邊質(zhì)量在測(cè)量率為0.33時(shí)降低,但恢復(fù)出的視頻質(zhì)量可以接受。從實(shí)驗(yàn)結(jié)果看到,在低觀測(cè)率時(shí),2D-DCVS比DCVS更好,因?yàn)閷?duì)幀和塊平均分配觀測(cè)值是不合理的。圖7表明2D-DCVS與DCVS恢復(fù)出的連續(xù)的幀質(zhì)量幾乎相當(dāng)。另外,隨著GoP增加,2DDCVS的性能下降,因?yàn)镸DC破壞了幀之間的相關(guān)性。然而,MDC的優(yōu)點(diǎn)是當(dāng)一個(gè)描述丟失,恢復(fù)出的視頻質(zhì)量可以接受,而且對(duì)于不可靠的信道,傳輸具有一定的魯棒性。
本文提出一種新的2D-DCVS框架,考慮到低功耗視頻設(shè)備編碼端復(fù)雜度和實(shí)時(shí)性要求,應(yīng)用了塊壓縮傳感;為了進(jìn)一步利用視頻序列之間的相關(guān)性,應(yīng)用自適應(yīng)稀疏基對(duì)圖像塊解碼,圖像塊在此稀疏基下具有更強(qiáng)的稀疏性;最后,應(yīng)用雙邊運(yùn)動(dòng)估計(jì)補(bǔ)償來(lái)優(yōu)化重建的結(jié)果。實(shí)驗(yàn)結(jié)果展示本方案滿足無(wú)線網(wǎng)絡(luò)的需求。未來(lái)的研究是將兩描述分布式視頻壓縮傳感擴(kuò)展成為多描述分布式視頻壓縮傳感,以及在實(shí)際的互聯(lián)網(wǎng)和無(wú)線傳輸網(wǎng)絡(luò)中如何應(yīng)用,從而更好地提高其實(shí)用價(jià)值。
:
[1]GIROD B,AARON A,RANE S,et al.Distributed video coding[J].Proceedings of the IEEE,2005,9(1):71-83.
[2]CANDES E,WAKIN M.An introduction to compressive sampling[J].IEEE Signal Processing Magazine,2008,25(2):21-30.
[3]KANG L W,LU C S.Distributed compressive video sensing[C]//Proc.ICASP 2009.[S.l.]:IEEE Press,2009:1169-1172.
[4]DONOHO D.Compressed sensing[J].IEEE Trans.Inform.Theory,2006,52(4):1289-1306.
[5]CANDES E,ROMBERG J,TAO T.Robust uncertainty principles:exact signal recon-struction from highly incomplete frequency information[J].IEEE Trans.Inform.Theory,2006,52(2):489-509.
[6]FIGUEIREDO M,NOWAK R,WRIGHT S.Gradient projection for sparse reconstruction:application to compressed sensing and other inverse problems[J].IEEE Journal of Selected Topics in Signal Processing,2007,1(4):586-597.
[7]GAN L.Block compressed sensing of natural images[C]//Proc.Int.Conf.on Digital Signal Processing.Liverpool:IEEE Press,2007:403-406.
[8]DO T T,TRAN T,GAN L.Fast compressive sampling with structurally random matrices[C]//Proc.IEEE Int.Conf.Acoustics,Speech and Signal Processing.Las Vegas:IEEE Press,2008:3369-3372.
[9]DO T T,CHEN Y,NGUYEN D T,et al.Distributed compressed video sensing[C]//Proc.International Conference on Image Processing.Cairo:IEEE Press,2009:1393-1396.
Two Description Distributed Compressed Video Sensing
HAN Yuwan,SHI Wei
(College of Information Engineering,Taiyuan University of Technology,Taiyuan 030024,China)
To meet low-complexity encoding of low-power video devices and the robust transmission of the wireless network,a two description distributed compressed video sensing(2D-DCVS)is proposed.At the encoder side,the encoder firstly divides the video sequence into two sub-sequences(two descriptions).Then,both descriptions are compressed by the distributed compressed video sensing(DVCS).Some computation-consuming algorithms,such as motion estimation and transform coding,are moved to the decoder,so DVCS has low-complexity encoding property.At the decoder side,two kinds of decoder,respectively is central decoder and side decoder.When two descriptions are received,the central decoder provides the best quality reconstruction of the video sequence.Video with acceptable quality can be achieved even when only one description is received.The experiment results show the superiority of the 2D-DCVS,especially when the measurement rate is low.
2D-DCVS;DCVS;low-complexity encoding
TN919.8
A
韓予皖(1985— ),碩士生,主研嵌入式視頻編碼;
師 衛(wèi)(1956— ),碩士生導(dǎo)師,主研嵌入式系統(tǒng)。
責(zé)任編輯:時(shí) 雯
2012-09-15