趙慧民,郭一縝,丁曉艷,朱 立
(1.廣東技術(shù)師范學(xué)院電子與信息學(xué)院,廣東 廣州 510665;2.西安郵電學(xué)院通信與信息工程學(xué)院,陜西 西安 710121)
在不同信道條件下,研究實(shí)現(xiàn)視頻數(shù)據(jù)同時(shí)可靠地傳輸?shù)蕉嘤脩艚K端,且滿足固定碼率和低失真的要求,是目前多播通信系統(tǒng)研究的焦點(diǎn)技術(shù)。按照Shannon’s的傳統(tǒng)理論,在給定信道容量時(shí),信源和信道編碼分部進(jìn)行實(shí)現(xiàn)。但是,在多用戶環(huán)境下,這種技術(shù)很難達(dá)到信源和信道的優(yōu)化編解碼。例如,MPEG視頻采用可變長編碼(VLC)設(shè)計(jì),即使出現(xiàn)單個(gè)編碼錯(cuò)誤,也能傳播很長時(shí)間并導(dǎo)致碼率較大失真。因此,傳統(tǒng)的多播通信系統(tǒng)存在資源優(yōu)化分配問題。
根據(jù)多播通信的可變信道統(tǒng)計(jì)及其系統(tǒng)響應(yīng)的條件,文獻(xiàn)[1]提出一種聯(lián)合信源信道編碼(JSCC)的實(shí)現(xiàn)方法。其目的是,把一部分視頻失真通過信道編碼處理而不是在信源編碼時(shí)考慮。實(shí)際上,JSCC是通過多分辨率編碼結(jié)合非均勻錯(cuò)誤保護(hù) (UEP)實(shí)現(xiàn)[1-2]。但這種實(shí)現(xiàn)技術(shù)增加了系統(tǒng)實(shí)現(xiàn)的復(fù)雜性。
針對(duì)視頻多播的實(shí)際情況,本文基于最新的壓縮傳感理論,結(jié)合信源信道編碼技術(shù),提出并實(shí)現(xiàn)了一種稀疏表示的視頻數(shù)據(jù)解碼方法,旨在降低傳輸視頻數(shù)據(jù)失真并提高恢復(fù)圖像的質(zhì)量[4-5]。
對(duì)于給定的一組稀疏基Ψ∈RN×N,如果圖像信號(hào)x能表示成Ψ中K個(gè)(K?N)非零系數(shù)的線性組合,則稱x為K稀疏信號(hào),其表示形式為
ψisi=Ψs
(1)
這里,s∈RN表示K稀疏矢量系數(shù)。這說明,信號(hào)x在稀疏基Ψ上可通過s的N個(gè)系數(shù)中K個(gè)非零項(xiàng)表示。因此,把x用測量矩陣Φ投影到一個(gè)M(M?N)維的空間上,可得到一個(gè)線性測量值y∈RM:
y=Φx=ΦΨs∈RM
(2)
壓縮傳感理論說明,只要矩陣Φ和Ψ滿足約束等距性條件,且s足夠稀疏,則通過測量值y可以高概率恢復(fù)原圖像信號(hào)x。
信號(hào)的恢復(fù)是指由M次(M≥cKln(N/K))測量向量y重構(gòu)長度為N(M?N)的稀疏信號(hào)x的過程。Candes 等證明了信號(hào)重構(gòu)問題可以通過求解最小l0范數(shù)問題加以解決[5-6],即
(3)
(4)
問題(P1)可以轉(zhuǎn)換為如下最小l1范數(shù)問題:
(5)
Candes等說明了,當(dāng)測量矩陣為I.I.D隨機(jī)高斯矩陣N(0,δ2)時(shí),有條件:
(6)
公式(5)和(6)構(gòu)成了本文恢復(fù)視頻圖像的基礎(chǔ)。
圖1 多播通信系統(tǒng)研究的目標(biāo)對(duì)象 Fig.1 Research object of the multicast communication system
假設(shè)灰度圖像被分解為n×n塊,一個(gè)塊的數(shù)據(jù)通過矢量長度為N=n2列矩陣表示。對(duì)每一塊數(shù)據(jù)通過稀疏基Ψ變換得到x,用視頻幀的每一個(gè)塊數(shù)據(jù)x減去幀均值,然后通過滿秩隨機(jī)矩陣R=Φ∈RN×N對(duì)x進(jìn)行測量得到測量值y。這些測量數(shù)據(jù)y通過塊交織并成為傳輸?shù)臄?shù)據(jù)包。其中,隨機(jī)矩陣R可以用高斯隨機(jī)矩陣G、正交高斯隨機(jī)矩陣G⊥、貝努利B以及哈達(dá)瑪矩陣H實(shí)現(xiàn)。而通常的稀疏基可以根據(jù)信號(hào)本身的特點(diǎn)靈活選取,常用的有離散余弦變換DCT基、快速傅里葉變換FFT基、離散小波變換DWT基、Curvelet基、Gabor基以及冗余字典等。
為了分析傳輸性能,這里假設(shè)兩種可能的信道模型。在兩種情況下,我們都可以直接使用模擬值進(jìn)行測量轉(zhuǎn)換和基帶傳輸。
第一種信道模型是包丟失率為p的加性高斯白噪聲(AWGN)信道,其噪聲值加到測量值y使信道信號(hào)噪聲比(CSNR)滿足條件[8]:
/
(7)
第二種信道模型是無噪聲理想網(wǎng)絡(luò)信道。這種情況就是有界無窮CSNR噪聲信道。其研究的目的是,為了折中有噪信道和有損信道之間的性能參數(shù)之間的關(guān)系。
壓縮傳感測量數(shù)據(jù)y被解碼之前,按照傳輸包丟失模型,需要對(duì)每個(gè)塊構(gòu)造隨機(jī)矩陣。然后,估計(jì)噪聲級(jí)參數(shù)。如果編碼器使用隨機(jī)矩陣R∈RN×nN來生成測量數(shù)據(jù)y,那么,一個(gè)給定塊中的N個(gè)測量數(shù)據(jù)之中,可通過S∈{1,2,…,N}進(jìn)行索引,其基數(shù)性為|S|=M。則,我們?cè)诮邮斩藰?gòu)造的隨機(jī)矩陣形式為:
ΦT={(RT)i|i∈S}
(8)
因此,在稀疏基下,根據(jù)視頻幀內(nèi)圖像系數(shù)的分布特性及其視頻幀間相關(guān)性,我們研究通過如下方法提高視頻圖像恢復(fù)的性能。
2.2.1 視頻幀內(nèi)的重加權(quán)解碼 在變換域,利用圖像系數(shù)的分布特性,可以改善圖像的恢復(fù)質(zhì)量。我們定義一個(gè)對(duì)角加權(quán)矩陣Λ如下:
(9)
式中,參數(shù)0<γ?1是si的調(diào)節(jié)因子,因此,重加權(quán)l(xiāng)1范數(shù)實(shí)際上近似等于l0范數(shù),即有關(guān)系式:
‖Λs‖1=∑i|Λiisi|=
(10)
則,重加權(quán)l(xiāng)1范數(shù)最小化形式為:
(11)
代入?yún)?shù)q=Λs,上式可以寫為:
.t.ΦΨΛ-1q‖2<ε
(12)
即有
(13)
但自然圖像系數(shù)并非I.I.D均勻分布,因此,在一幀內(nèi),我們使用每個(gè)系數(shù)的方差作為幅度估計(jì),并按照下式關(guān)系在重加權(quán)最小化計(jì)算中引入此參數(shù):
(14)
2.2.2 視頻幀間解碼 由于一個(gè)連續(xù)視頻幀的相關(guān)性取決于運(yùn)動(dòng)矢量的特性,因此,借助于Prades-Nebot和Marcia等研究的分布視頻編碼DVC(Distributed Video Coding)的原理結(jié)果[9],在不增加解碼器復(fù)雜性的情況下,我們提出一種基于幀間相關(guān)性的運(yùn)動(dòng)矢量解碼方法,以實(shí)現(xiàn)多幀接收數(shù)據(jù)的解碼及其連續(xù)圖像的重構(gòu)。
首先考慮兩個(gè)連續(xù)幀之間的解碼。設(shè)前一幀(即幀1)作為下一幀(幀2)的參考,在此兩幀之間估計(jì)局部運(yùn)動(dòng)矢量。對(duì)于幀2所要恢復(fù)圖像的j塊,我們?nèi)?對(duì)應(yīng)的j塊周圍可能的取值路徑作為掃描矢量進(jìn)行稀疏表示,其形成的矩陣設(shè)為Ψ(j),但它不是一個(gè)完備基。因此,需要通過運(yùn)動(dòng)矢量使兩個(gè)幀高度相關(guān),才會(huì)形成一個(gè)完備基。這時(shí),最佳原子的索引,就是圍繞塊j在兩個(gè)幀之間對(duì)運(yùn)動(dòng)矢量v的估計(jì)。
運(yùn)動(dòng)矢量v估計(jì)之后,兩幀稀疏基的公共部分組成一個(gè)聯(lián)合基,并最終生成一個(gè)超完備字典使s高度稀疏。最終,我們得到的稀疏基形式如下:
(15)
這里,變換Tv(Ψ)(·)表示運(yùn)動(dòng)矢量v(j)生成的某種轉(zhuǎn)移矩陣。如果sjoint表示了兩個(gè)連續(xù)圖像數(shù)據(jù)塊的稀疏系數(shù),那么,連續(xù)兩個(gè)幀的稀疏值系數(shù)(s1,s2)表示如下:
Ψs=Ψ
(16)
其中,每個(gè)數(shù)據(jù)塊的大小決定了運(yùn)動(dòng)估計(jì)的搜索空間,而使用循環(huán)轉(zhuǎn)移變換T(·)可優(yōu)化稀疏基的聯(lián)合設(shè)置。同樣的方法可以應(yīng)用于3個(gè)或更多連續(xù)幀的稀疏值表示。
為了更好地估計(jì)噪聲信道和有損信道對(duì)CS解碼的影響,在定義信道各種丟失率p和CSNR的情況下,我們用MATLAB對(duì)視頻football序列進(jìn)行實(shí)驗(yàn),并用峰值信噪比PSNR作為比較的度量單位。PSNR定義如下:
(17)
1)測量矩陣和稀疏基的選取:為了更好地確定實(shí)驗(yàn)參數(shù)之間的折中關(guān)系,結(jié)合不同的測量矩陣R和稀疏基Ψ,實(shí)驗(yàn)在各種參數(shù)下的結(jié)果如圖2所示。圖2中,R=G表示高斯隨機(jī)矩陣,R=G⊥為高斯正交隨機(jī)矩陣,R=HD代表哈達(dá)瑪矩陣。Ψ=DT為DCT基,Ψ=WT表示離散小波基。由圖可見,當(dāng)G⊥和D結(jié)合并對(duì)圖像壓縮數(shù)據(jù)解碼時(shí),圖像具有最好的恢復(fù)功能,而其它情況稍差,但這種差別很小。
2)重加權(quán)解碼:在不同的CSNR噪聲環(huán)境下,圖3說明了經(jīng)過重加權(quán)l(xiāng)1范數(shù)處理后圖像的恢復(fù)結(jié)果??梢?,當(dāng)包丟失率p較大時(shí),重加權(quán)l(xiāng)1范數(shù)解碼恢復(fù)的圖像比僅采用l1范數(shù)對(duì)圖像恢復(fù)的PSNR提高了1-2 dB增益[10]。
圖2 應(yīng)用不同測量矩陣Φ和稀疏基Ψ恢復(fù)圖像的性能比較
圖3 分別采用l1范數(shù)和重加權(quán)解碼恢復(fù)圖像的性能比較
3)幀間編碼:使用8×8塊進(jìn)行運(yùn)動(dòng)估計(jì)和圖像重構(gòu)。圖4在不同的CSNR噪聲環(huán)境下,說明了基于運(yùn)動(dòng)矢量解碼與稀疏解碼恢復(fù)圖像的性能比較曲線。總體而言,在較低CSNR時(shí),基于運(yùn)動(dòng)矢量解碼形成的過完備基比稀疏解碼生成的完備基改善了1 dB的增益。
4)與軟投影解碼比較:在各種相同條件下,使用與R=G⊥與Φ=D(即本文最好的配置方案)結(jié)合重加權(quán)l(xiāng)1范數(shù)解碼和軟投影方法進(jìn)行性能比較,結(jié)果如圖5所示。圖中在較低信道噪聲和較高的包丟失率情況下,本文實(shí)現(xiàn)的重加權(quán)l(xiāng)1范數(shù)解碼方法具有較好的性能。而在較高信道噪聲和較低的包丟失率時(shí),本文方法和軟投影技術(shù)性能相當(dāng)。
基于壓縮傳感理論,在較高的傳輸包丟失率和一定的信道噪聲環(huán)境下,本文提出了一種應(yīng)用于視頻多播技術(shù)的重加權(quán)l(xiāng)1范數(shù)解碼和基于運(yùn)動(dòng)矢量的幀間編碼,并在此技術(shù)應(yīng)用條件下,研究了各種測量矩陣和稀疏基表示。本文的優(yōu)點(diǎn)是,編碼器簡單可靠且能根據(jù)用戶的數(shù)量調(diào)整資源分配問題;而在解碼端,可自由選擇稀疏基表示和視頻幀的相關(guān)性模型。其缺點(diǎn)是,增加了接收端的復(fù)雜性,需要解決優(yōu)化解碼問題。未來的工作,根據(jù)壓縮傳感技術(shù)特性,在傳輸少量邊信息情況下,進(jìn)一步研究視頻序列的相關(guān)性以實(shí)現(xiàn)更高的圖像質(zhì)量和圖像傳輸?shù)陌踩詥栴}[11-12]。
圖4 基于運(yùn)動(dòng)矢量解碼與稀疏解碼恢復(fù)連續(xù)圖像的性能比較
圖5 本文和軟投影方法恢復(fù)圖像的性能比較
參考文獻(xiàn):
[1]HE Z,CAI J,CHEN C.Joint source channel rate-distortion analysis for adaptive mode selection and rate control in wireless video coding[J].IEEE Transactions on Circuits and Systems for Video Technology,2002 (12):511-523.
[2]趙慧民,方艷梅.一種非均勻錯(cuò)誤保護(hù)實(shí)現(xiàn)最優(yōu)碼率分配的技術(shù)[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2007,46(1):43-47.
[3]JAKUBCZAK S,RAHUL H,KATABI D.One-size-fits-all wireless video[G].HotNets,2009.
[4]楊海蓉,張成,丁大為,等.壓縮傳感理論與重構(gòu)算法[J].電子學(xué)報(bào),2011(1):142-148.
[5]CANDES E,WAKIN M,BOYD S.Enhancing sparsity by reweighted l1 minimization[J].Journal of Fourier Analysis and Applications,2008(14): 877-905.
[6]DONOHO D L.Compressed sensing[J].IEEE Transactions on Information Theory,2006,52(4): 1289-1306.
[7]李樹濤,魏丹.壓縮傳感綜述[J].自動(dòng)化學(xué)報(bào),2009,35(11):1369-1377.
[8]趙慧民,朱立,張光昭.率失真最優(yōu)自適應(yīng)量化及其系數(shù)閾值的設(shè)定[J].中山大學(xué)學(xué)報(bào):自然科學(xué)版,2004,43(3):32-35.
[9]PRADES-NEBOT J,MA Y,HUANG T.Distributed video coding using compressive sampling[R].Proceedings of the Picture Coding Symposium ,2009.
[10]MARCIA R,WILLETT R.Compressive coded aperture video reconstruction[C]∥Proc European Signal Processing Conf(EUSIPCO 1),2008.
[11]SEBERT F,ZOU Y M,YING L.Toeplitz block matrices in compressed sensing and their applications in imaging[C]∥Proceedings of International Conference on Technology and Applications in Biomedicine.Washington D C,USA: IEEE,2008: 47-50.
[12]GOYAL V,FLETCHER A,RANGAN S.Compressive sampling and lossy compression[J].IEEE Signal Processing Magazine,2008,25(3): 48-56.