蔣 偉,楊俊杰
(上海電力學(xué)院 電子與信息工程學(xué)院,上海 200090)
?
率失真優(yōu)化的壓縮感知圖像編碼
蔣 偉,楊俊杰
(上海電力學(xué)院 電子與信息工程學(xué)院,上海 200090)
針對基于壓縮感知的圖像編碼系統(tǒng),分析了系統(tǒng)中編碼參數(shù)和碼率以及失真的關(guān)系,在此基礎(chǔ)上提出了基于壓縮感知的圖像編碼系統(tǒng)的碼率-失真模型。根據(jù)所提模型設(shè)計(jì)了率失真優(yōu)化的壓縮感知圖像編碼算法。在給定碼率的條件下,優(yōu)化編碼參數(shù),使得編碼器失真最小。算法在Matlab的編碼平臺(tái)上進(jìn)行了仿真和實(shí)驗(yàn),結(jié)果證明提出的碼率-失真模型能夠很好地?cái)M合實(shí)際率失真曲線,并且基于該模型的率失真優(yōu)化算法有效的提高了壓縮感知圖像編碼系統(tǒng)的性能。
壓縮感知;率失真;編碼
2006年Donoho and Candes首次提出了壓縮感知的理論[1-2]。該理論是一種將高維空間的信號(hào)轉(zhuǎn)換為低維信號(hào)的采樣方法。如果輸入信號(hào)足夠的稀疏,那么這個(gè)信號(hào)就可以很高的精度被重構(gòu)?;趬嚎s感知的圖像編碼框架摒棄了傳統(tǒng)的先采樣后處理的級(jí)聯(lián)結(jié)構(gòu),將采樣和數(shù)據(jù)壓縮結(jié)合起來,簡化了編碼框架[3-4]。通過使用壓縮感知降低了編碼器的復(fù)雜度,而解碼端由于需要求解凸優(yōu)化的問題來恢復(fù)輸入信號(hào),因而復(fù)雜度較高,所以基于壓縮感知的圖像編碼系統(tǒng)適合于能量受限的編碼場合,如傳感器網(wǎng)絡(luò)。
率失真性能是衡量圖像編碼系統(tǒng)性能的重要準(zhǔn)則。率失真技術(shù)可以不受編碼結(jié)構(gòu)和技術(shù)的限制,通過配置最優(yōu)的編碼參數(shù)提高編碼性能,是實(shí)際編碼系統(tǒng)中常用的優(yōu)化方法。量化是傳統(tǒng)的有損編碼系統(tǒng)中的主要失真來源,量化器性能很大程度上決定了編碼效率,因而可以選擇合適的量化參數(shù)使得給定編碼碼率下失真最小。然而在基于壓縮感知的圖像編碼系統(tǒng)中除了量化,采樣過程也會(huì)引起失真和碼率的變化,也就是說給定碼率條件下最優(yōu)的編碼性能由量化參數(shù)和采樣參數(shù)共同決定。因而分析量化參數(shù)、采樣參數(shù)和編碼碼率、失真之間的關(guān)系對確定最優(yōu)的參數(shù)配置至關(guān)重要。
目前在基于壓縮感知的圖像編碼系統(tǒng)的編碼參數(shù)和碼率失真之間關(guān)系的研究方面已有一些成果。文獻(xiàn)[5]中針對傳統(tǒng)的視頻編碼系統(tǒng)提出了延遲-能量-率失真模型。文獻(xiàn)[6-7]針對壓縮感知編碼視頻流提出了碼率-能量-失真模型。該模型可以用于估計(jì)接收端接收到的受信道噪聲污染的視頻流的質(zhì)量。但在基于壓縮感知的圖像編碼系統(tǒng)中最優(yōu)的編碼參數(shù)選擇方面研究成果較少。文獻(xiàn)[8]中針對分布式視頻壓縮感知編碼框架提出了壓縮感知采樣率的分配方法,該方法基于圖像區(qū)域的稀疏程度進(jìn)行采樣率的分配,稀疏度高的區(qū)域分配較低的采樣率,稀疏度低的區(qū)域分配較高的采樣率。但是該方法并沒有考慮量化對編碼碼率和失真的影響。而且算法還需要額外傳輸附加信息到接收端。文獻(xiàn)[9]提出了率失真優(yōu)化的碼率分配方案,然而算法的效率很大程度上取決于失真模型的正確性。
本文首先分析了基于壓縮感知的圖像編碼系統(tǒng)的編碼參數(shù)與碼率和失真之間的關(guān)系,然后分別提出了碼率和失真模型,最后將上述模型用于壓縮感知編碼算法的優(yōu)化,提出了基于率失真優(yōu)化的壓縮感知編碼算法,選擇最優(yōu)的采樣率和量化參數(shù),使得編碼器性能最佳。
壓縮感知(Compressive Sensing)是通過線性投影將高維信號(hào)編碼為低維信號(hào)的采樣方法。壓縮感知包括3個(gè)主要問題:稀疏表示、信號(hào)測量和信號(hào)重構(gòu)。壓縮感知理論實(shí)現(xiàn)的基礎(chǔ)是信號(hào)的稀疏性。稀疏度定義為離散時(shí)間信號(hào)中非零元素的個(gè)數(shù)。如果在某個(gè)正交基下信號(hào)是稀疏的,并且稀疏度K遠(yuǎn)小于信號(hào)的維數(shù)N,那么該信號(hào)被稱為稀疏的或可壓縮的,可以通過壓縮感知對信號(hào)壓縮。自然圖像在諸如離散余弦變換和小波變換這類變換下都是稀疏的,因此將圖像看作矢量u∈RN,那么圖像在正交基ΨN×N下的映射信號(hào)x是
x=Ψu
(1)
假設(shè)存在測量矩陣Φ,維數(shù)是L×N,L≤N,則通過非相關(guān)測量將信號(hào)x投影到測量矩陣Φ上,即
y=Φx=ΦΨu
(2)
(3)
由于L≤N,式(3)的求解是一個(gè)病態(tài)問題,有無窮多組解,計(jì)算復(fù)雜度很高。因此Donoho and Candes提出當(dāng)滿足RIP條件時(shí),可以用l1范式代替l0范式,將式(3)轉(zhuǎn)換為一個(gè)凸優(yōu)化問題進(jìn)行求解
(4)
通常采樣個(gè)數(shù)L≥αKlogN時(shí),可以精確重構(gòu)出x。其中α是一個(gè)很小的常數(shù)。在實(shí)際環(huán)境中通常存在各種各樣的噪聲,對測量數(shù)據(jù)造成干擾,比如圖像壓縮系統(tǒng)中編碼端就會(huì)引入量化誤差。在噪聲環(huán)境下信號(hào)的重構(gòu)可以進(jìn)一步寫為
(5)
其中:參數(shù)ε表示噪聲。在重構(gòu)過程中,重構(gòu)信號(hào)質(zhì)量與測量矩陣、正交基都有關(guān)系。精確重構(gòu)原信號(hào)所需的樣本個(gè)數(shù)也由正交基和測量矩陣的相關(guān)性決定[12]。正交基和測量矩陣的相關(guān)性越低,精確重建稀疏信號(hào)所需要的采樣個(gè)數(shù)就越少。
傳統(tǒng)的視頻編碼系統(tǒng)中,量化是產(chǎn)生失真的主要原因,量化參數(shù)(量化步長)越大,失真越大,編碼碼率越?。欢趬嚎s感知編碼系統(tǒng)中,失真由量化和線性測量共同產(chǎn)生。量化參數(shù)和測量數(shù)目的設(shè)置直接影響系統(tǒng)的性能。比如減小量化步長會(huì)提高碼率,減小失真;而增大量化步長會(huì)降低碼率,增加失真。增加采樣個(gè)數(shù)會(huì)增加碼率,同時(shí)減小失真;而減小測量數(shù)目會(huì)降低碼率,增加失真。由于無法保證碼率和失真同時(shí)達(dá)到最小,因此需要在碼率和失真這兩個(gè)參數(shù)中獲取最優(yōu)的Pareto均衡。
采樣個(gè)數(shù)和量化參數(shù)互不相關(guān),因此可以分別分析他們對碼率和失真的影響。當(dāng)測量值的數(shù)目固定時(shí),碼率和失真隨量化參數(shù)的變化如圖1和圖2所示。圖中,Rcs表示采樣個(gè)數(shù)占總數(shù)的百分比,失真是源圖像和重構(gòu)圖像之間的均方誤差??梢钥闯霾蓸觽€(gè)數(shù)不變時(shí),碼率隨著量化參數(shù)的增大而下降,失真隨量化參數(shù)的增大而增加。從圖1a和圖2a中可以看出,碼率和量化參數(shù)QP之間近似服從冪函數(shù)的分布,而圖1b和圖2b中失真和量化參數(shù)也近似服從冪函數(shù)分布,碼率和失真與量化階之間的關(guān)系可表示為
R1=α1·QPα2
(6)
D1=α3·R1α4
(7)
式中:α1,α2,α3和α4是模型參數(shù),取值與原信號(hào)有關(guān);R1表示碼率;D1表示失真。 當(dāng)量化參數(shù)固定時(shí),碼率和失真隨采樣個(gè)數(shù)變化如圖3和圖4所示??梢钥闯龃a率R2隨采樣個(gè)數(shù)呈線性變化,失真D2隨采樣個(gè)數(shù)呈指數(shù)分布
R2=β1·NCS
(8)
D2=β2·eβ3R2
(9)
式中:β1,β2,β3是模型參數(shù),因此可以建立碼率R和采樣個(gè)數(shù)NCS、量化參數(shù)QP之間的數(shù)學(xué)模型
R=aR·NCSβR·QpγR
(10)
式中:αR,βR和γR是模型參數(shù),取值與原信號(hào)有關(guān)??偸д嬗蓽y量模塊產(chǎn)生的失真和量化模塊產(chǎn)生的失真構(gòu)成,D=D1+D2。測量模塊產(chǎn)生的失真隨采樣個(gè)數(shù)呈指數(shù)分布,量化產(chǎn)生的失真服從冪函數(shù)分布,因此失真模型可以定義為
D=αD·RβD+γD·eθDR
(11)
式中:αD,βD和γD是模型參數(shù),取值與原信號(hào)有關(guān)。
圖1 測量值個(gè)數(shù)固定時(shí)碼率失真關(guān)系,Lena
圖2 測量值個(gè)數(shù)固定時(shí)碼率失真關(guān)系,Bank
圖3 量化參數(shù)固定時(shí)碼率失真關(guān)系,Lena
圖4 量化參數(shù)固定時(shí)碼率失真關(guān)系,Bank
理想情況下期望最優(yōu)的編碼器以最小的碼率獲得失真最小的圖像,也就是在給定碼率Rb的條件下失真最小的編碼器
minD(U,S) s.t.R(U,S)≤Rb
(12)
式中:U是源圖像;S是編碼器配置參數(shù)矢量;D(U,S),R(U,S)分別是失真和碼率。式(12)的最優(yōu)值就是碼率受限條件下最優(yōu)的視頻編碼器性能。從式(12)中可以看出,編碼器的失真受碼率的約束,無法同時(shí)使得碼率和失真最小。當(dāng)給定編碼碼率一定時(shí),如果分配較多比特用于采樣,那么用于表示每個(gè)樣值的比特?cái)?shù)較少,導(dǎo)致失真增大;反之,如果用于量化的比特?cái)?shù)較多,那么用于采樣的比特就會(huì)較少,同樣導(dǎo)致失真增大。因此根據(jù)上節(jié)提出的碼率-失真模型,分析碼率、失真和編碼參數(shù)(量化參數(shù)和采樣個(gè)數(shù))之間的關(guān)系,提出了基于率失真優(yōu)化的壓縮感知編碼算法,求解最優(yōu)的編碼參數(shù)配置,得到給定碼率條件下的失真最小的編碼器。
壓縮感知編碼框架中影響性能的因素有2個(gè),即采樣個(gè)數(shù)和量化參數(shù),因此最優(yōu)的編碼參數(shù)配置實(shí)際上就是求解能夠使編碼效率最高的采樣個(gè)數(shù)和量化參數(shù)。式(12)可以改寫為
minD(U,NCS,QP) s.t.R(U,NCS,QP)≤Rb
(13)
式中:D(U,NCS,QP)和R(U,NCS,QP)分別是在編碼參數(shù)NCS,QP下得到的失真和碼率。通過式(10)的碼率模型可以計(jì)算出每組NCS,QP的取值下對應(yīng)的編碼碼率,通過式(11)可以得到在該碼率下產(chǎn)生的失真。式(13)可以使用拉格朗日法或是動(dòng)態(tài)規(guī)劃法求解。由于動(dòng)態(tài)規(guī)劃的復(fù)雜度隨著編碼單元的增加呈指數(shù)上升,導(dǎo)致計(jì)算量巨大,因此通常采用拉格朗日法求解。當(dāng)滿足KKT條件時(shí),式(13)表示的受限優(yōu)化問題可以轉(zhuǎn)換成不受限優(yōu)化問題,可以由下式解出
minJ(U,NCS,QP,λ)=D(U,NCS,QP)+
λR(U,NCS,QP)
(14)
式中:λ≥0稱為拉格朗日因子,也是率失真曲線的斜率。λ用來衡量碼率和失真的相對重要性。λ越小失真越重要,λ越大碼率越重要。拉格朗日代價(jià)值J(U,NCS,QP,λ)用于衡量編碼性能的優(yōu)劣,代價(jià)值越小編碼性能越好。能夠使得代價(jià)值最小的參數(shù)配置S*={N*CS,Q*P}就被稱為最優(yōu)的參數(shù)配置,對應(yīng)的λ*是最優(yōu)的率失真斜率,失真D*是在該碼率Rb下的最小失真。諸如牛頓法或二分法這類快速搜索算法通常用于求解λ*,然而算法復(fù)雜度都較高,相當(dāng)耗時(shí)。本文中通過求解KKT條件計(jì)算最優(yōu)的拉格朗日因子。既然最優(yōu)的參數(shù)配置S*使得J(U,NCS,QP,λ)達(dá)到最小值,那么J(U,NCS,QP,λ)的梯度在S*的值為0,也就是
(15)
R(S*)≤Rb
(16)
λ*≥0,λ*(R(S*)-Rb)=0
(17)
(18)
因此如果存在λ*滿足KKT條件,對應(yīng)的S*也就是J(U,NCS,QP)的最小值。求解滿足KKT條件的λ*就可以得到式(14)的最優(yōu)解,也就是最優(yōu)的壓縮感知編碼器。
本文所提算法基于Matlab編碼平臺(tái)進(jìn)行了實(shí)驗(yàn)。在發(fā)送端待測圖片先進(jìn)行小波變換,得到稀疏信號(hào),然后由測量矩陣進(jìn)行采樣,采樣后的數(shù)據(jù)再經(jīng)過均勻量化和算術(shù)編碼生成編碼碼字。在接收端編碼碼字先算術(shù)解碼和反量化,然后根據(jù)得到的采樣數(shù)據(jù)進(jìn)行重構(gòu)。目前有多種重構(gòu)算法,算法的性能與圖片在小波域的稀疏性有關(guān)。本實(shí)驗(yàn)中采用OMP(Orthogonal Matching Pursuit)算法重構(gòu)信號(hào)[13]。重構(gòu)后的信號(hào)再經(jīng)過小波反變換就恢復(fù)出了原圖片。
實(shí)驗(yàn)測試了文中所提的碼率和失真模型的正確性。圖5顯示了根據(jù)碼率模型估算的碼率和實(shí)際測試碼率的比較。從圖中可以看出,由采樣數(shù)目和量化參數(shù)估算的碼率和實(shí)際編碼碼率相符。依據(jù)碼率-失真模型計(jì)算出的率失真曲線和實(shí)際測試曲線的對比如圖6所示。其中圖6a是在固定量化參數(shù)條件下得到的率失真曲線,圖6b是在固定測量數(shù)目的條件下得到的率失真曲線,并且圖中的曲線代表實(shí)際測試得到的率失真關(guān)系,菱形和星型代表模型計(jì)算結(jié)果。從圖中可以看出模型產(chǎn)生的率失真曲線和實(shí)際曲線相符。實(shí)驗(yàn)還對率失真優(yōu)化的壓縮感知編碼系統(tǒng)的性能進(jìn)行了測試。測試結(jié)果如圖7所示??梢钥闯龈鶕?jù)本文提出的碼率-失真模型對編碼系統(tǒng)進(jìn)行率失真優(yōu)化后,系統(tǒng)的編碼性能有了明顯提高,和未優(yōu)化時(shí)相比增益約有2 dB。
圖5 碼率和編碼參數(shù)的關(guān)系,Lena
圖6 碼率-失真模型曲線,Lena
圖7 率失真優(yōu)化的壓縮感知編碼性能
本文通過分析壓縮感知編碼系統(tǒng)中編碼參數(shù)和碼率以及失真的關(guān)系,提出了基于壓縮感知的圖像編碼系統(tǒng)的碼率-失真模型。并且根據(jù)所提模型設(shè)計(jì)了率失真優(yōu)化的壓縮感知圖像編碼算法。通過優(yōu)化測量數(shù)目和量化參數(shù),得到給定碼率下失真最小的編碼器。實(shí)驗(yàn)結(jié)果表明該碼率-失真模型能夠很好地?cái)M合實(shí)際率失真曲線,以此為基礎(chǔ)提出的率失真優(yōu)化算法能夠有效提高壓縮感知圖像編碼系統(tǒng)的性能。
[1]DONOHO D. Compressive sensing[J]. IEEE transactions on information theory,2006,52(4):1289-1306.
[2]CAND`ES E.,ROMBERG J,TAO T. Robust uncertainty principles,EXACT signal reconstruction from highly incomplete frequency information[J].IEEE transactions information theory,2006,52(2):489-509.
[3]左覓文,常侃,施靜蘭,等. 一種自適應(yīng)采樣率視頻壓縮感知方案[J].電視技術(shù),2015,39(2):66-70.
[4]覃遠(yuǎn)年,徐曉寧.立體視頻圖像編碼的研究進(jìn)展[J].電視技術(shù),2015,39(7):10-14.
[5]WU X L,ZHANG X J. Model-guided adaptive recovery of compressive sensing[C]// Proc. Data Compression Conf(DCC).UT,USA:IEEE ,2009:123-132.
[6]GOYAL V K,F(xiàn)LETCHER A K,RANGAN S. Compressive sensing and lossy compression[J].IEEE signal processing magazine,2008,25(2):48-52.
[7]WU S H,PENG W H,CHIANG T. Bit-plane compressive sensing with bayesian decoding for lossy compression[C]//Proc. 28th Picture Coding Symposium.Nagoya,Japan:IEEE,2010:606-609.
[8]LI C L,WU D P.Delay-power-rate-distortion model for wireless video communication under delay and energy constraints[J].IEEE transactions on CSVT,2014,24(7):1170-1183.
[9]PUDLEWSKI S,MELODIA T. A rate-energy-distortion analysis for compressed-sensing-enabled wireless video streaming on multimedia sensors[C]// IEEE Globecom.Texas,USA:IEEE,2011:1-6.
[10]CANDES E,WAKIN M. An introduction to compressive sampling[J].IEEE signal processing magazine,2008,25(2):21-30.
[11]魏從靜,唐加山.基于行列式隨機(jī)循環(huán)的壓縮感知測量矩陣研究[J]. 電視技術(shù),2015,39(19):6-10.
[12]DO T T,GAN L,NGUYEN N,et al. Sparsity adaptive matching pursuit algorithm for practical compressed sensing[C]// Asilomar Conference on Signals,System and Computer.Pacific Grove,CA:IEEE,2008:581-587.
[13]郎利影,王勇,李思騫.基于壓縮感知OMP改進(jìn)算法的圖像重構(gòu)[J]. 電視技術(shù),2015,39(6):8-12.
蔣 偉(1975— ),女,副教授,主要研究方向?yàn)閳D像壓縮;
楊俊杰(1977— ),教授,主要研究方向?yàn)殡娏νㄐ偶夹g(shù)、光纖通信技術(shù)等。
責(zé)任編輯:許 盈
Rate-distortion optimized compressive sensing based coding
JIANG Wei, YANG Junjie
(SchoolofElectronicsandInformationEngineering,ShanghaiUniversityofElectricPower,Shanghai200090,China)
In view of compressive sensing based image coding schemes, the relationship of rate and coding parameters and relationship of distortion and coding parameters are analyzed. Moreover, a source rate and distortion model is proposed. Based on the R-D model, the optimal number of measurements and quantization step size are determined according to the rate-distortion criteria. The proposed algorithm is implemented on the platform of Matlab. The accuracy of the proposed R-D model is verified through experiments. Experimental results show that the proposed algorithm improves coding performances substantially.
compressive sensing; rate-distortion; coding
蔣偉,楊俊杰. 率失真優(yōu)化的壓縮感知圖像編碼[J].電視技術(shù),2016,40(11):12-17. JIANG W,YANG J J. Rate-distortion optimized compressive sensing based coding[J].Video engineering,2016,40(11):12-17.
TN915
A
10.16280/j.videoe.2016.11.003
國家自然科學(xué)基金項(xiàng)目(61401269;61371125);上海市自然科學(xué)基金項(xiàng)目(14ZR1417400);地方能力建設(shè)項(xiàng)目(14110500900;15110500900)
2016-06-24