李瑞陽,殷海兵
(中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州 310018)
TCM模型的自適應(yīng)硬判決量化算法
李瑞陽,殷海兵
(中國(guó)計(jì)量大學(xué) 信息工程學(xué)院,浙江 杭州 310018)
在視頻編碼中,DCT系數(shù)分布模型是率失真理論模型的基礎(chǔ),視頻量化一般可分別為硬判決量化(HDQ)以及軟判決量化(SDQ),SDQ算法能實(shí)現(xiàn)最優(yōu)編碼性能,但其中維特比算法會(huì)導(dǎo)致嚴(yán)重的系數(shù)間串行處理依賴.比較而言,基于死區(qū)(deadzone)的HDQ算法率失真性能略有損失,但是不考慮系數(shù)間的相關(guān)性.提出了一種基于分段逼近TCM模型(Transparent Composite Model)的自適應(yīng)硬判決量化算法,采用更精確的DCT分布估計(jì)模型,估算不同頻率分量DCT系數(shù)的分布參數(shù).根據(jù)模型參數(shù)及DCT系數(shù)分布參數(shù),優(yōu)化構(gòu)造自適應(yīng)的死區(qū)偏移量模型.實(shí)驗(yàn)表明,相對(duì)于固定偏移量HDQ算法,其編碼性能非常接近于SDQ算法.
視頻編碼;率失真優(yōu)化;TCM模型;硬判決量化
在H.26x和MPEG-x等混合框架視頻編碼器中,量化算法很大程度上直接決定編碼器的率失真性能.DCT系數(shù)分布模型是率失真理論模型的基礎(chǔ),目前,主流的DCT系數(shù)分布模型有基于拉普拉斯的模型、基于柯西分布的模型和基于廣義高斯分布的模型等.實(shí)驗(yàn)結(jié)果表明,沒有一種模型能夠準(zhǔn)確吻合所有圖像的DCT系數(shù)分布.針對(duì)這個(gè)問題,本文采用TCM分布模型,把DCT系數(shù)分為兩個(gè)部分,分別采用不同的模型進(jìn)行估計(jì),以提高DCT系數(shù)分布模型的準(zhǔn)確度.
本文研究DCT系數(shù)在TCM分布模型下,模擬SDQ算法,在離線模式下,構(gòu)建自適應(yīng)死區(qū)偏移模型,提高硬判決量化算法的RD性能.一方面,獨(dú)立估算不同頻率分量DCT系數(shù)的統(tǒng)計(jì)分布參數(shù),在率失真優(yōu)化理論指導(dǎo)下,將參數(shù)應(yīng)用于偏移量建模.另一方面,將偏移量構(gòu)建為量化參數(shù)、TCM模型參數(shù)以及DCT系數(shù)分布參數(shù)的函數(shù),基于最大正判和最小誤判原則,模擬并逼近軟判決量化結(jié)果,構(gòu)造自適應(yīng)的死區(qū)偏移量模型,以提高改進(jìn)硬判決量化算法的率失真性能.
1.1 DCT系數(shù)分布
高性能編碼需充分考慮信源特征,預(yù)測(cè)殘差DCT系數(shù)概率分布模型是設(shè)計(jì)最優(yōu)量化器和構(gòu)建率失真模型的基礎(chǔ).學(xué)術(shù)界先后提出了高斯、拉普拉斯、廣義高斯、柯西等概率模型;YANG E H等針對(duì)實(shí)際樣本較重拖尾現(xiàn)象,提出分段逼近TCM模型[1].
在TCM模型里,根據(jù)樣本絕對(duì)值分布,將樣本y分為兩個(gè)部分,分割點(diǎn)樣本絕對(duì)值為yc.TCM模型的概率密度函數(shù)可以描述為:P(y|yc,b,θ)=
(1)
其中,參數(shù)a為實(shí)際樣本的最大絕對(duì)值.不同分布模型有各自參數(shù),假設(shè)θ為模型參數(shù),f為|y| 1.2 HDQ和SDQ量化判決 在早期視頻壓縮算法中,DCT系數(shù)的分布近似認(rèn)為服從拉普拉斯模型分布,基于此分布特點(diǎn),Gary提出了失真最小的Deadzone +UTQ(UniformThreshold Quantization)量化方案[3].基于死區(qū)的HDQ算法如下: HDQ(z)=floor([|z|+δ×q]/q). (2) 其中,z為DCT系數(shù),q表示量化步長(zhǎng),δ表示deadzone偏移量,||表示求絕對(duì)值操作,floor為向下取整操作,HDQ(z)為硬判決量化幅值.在USQ中,偏移量δ的取值為1/2.Gray在基于熵編碼的統(tǒng)計(jì)特性的研究中,提出幀內(nèi)、幀間預(yù)測(cè)模式分別采用固定死區(qū)量化偏移量1/3和1/6[3].H.264和H.265標(biāo)準(zhǔn)參考代碼JM和HM中都采用該算法[4],但是沒有考慮塊內(nèi)相鄰系數(shù)的相關(guān)影響[5].維特比網(wǎng)格搜索[6]是實(shí)現(xiàn)SDQ的一種典型方法.SDQ算法可獲得優(yōu)越的編碼性能,能實(shí)現(xiàn)6%~8%的碼率節(jié)省[6-7],但這種性能提升是以維特比算法及CABAC編碼導(dǎo)致高度串行依賴為代價(jià)的.在H.264/AVC及HEVC等標(biāo)準(zhǔn)中先后采用率失真優(yōu)化量化(RDOQ)算法,該算法可理解為SDQ算法的簡(jiǎn)化版[8].相比于SDQ全網(wǎng)格維特比搜索,RDOQ只搜索網(wǎng)格圖中部分路徑[9]. 因此,在深入分析SDQ算法的內(nèi)在特性和作用機(jī)理后,本文提出了基于TCM分布模型的自適應(yīng)死區(qū)HDQ偏移量模型.其目標(biāo)是在保留系數(shù)獨(dú)立HDQ算法并發(fā)處理優(yōu)越性前提下,最大限度接近SDQ算法的率失真性能.在這個(gè)過程中,需要充分考慮TCM模型中DCT系數(shù)的分布特性參量以及系數(shù)之間的相互影響. 1.3 軟硬判決分析 Gary在研究DCT系數(shù)分布特性的基礎(chǔ)上,提出了采用固定死區(qū)的HDQ算法,有效地提升了編碼器的率失真性能.當(dāng)DCT系數(shù)采用拉普拉斯分布時(shí),其概率密度函數(shù)如下: 其中 (3) Λ為DCT系數(shù)分布模型參數(shù),б為系數(shù)的標(biāo)準(zhǔn)差.u為DCT系數(shù).在基于拉普拉斯DCT分布模型中,采用率失真優(yōu)化確定HDQ算法中的死區(qū)偏移量δ公式如下: (4) 其中,λ為拉格朗日乘子,經(jīng)歸一化的死區(qū)偏移量δ′可表示如下: (5) 圖1 偏移量δ′分布圖Figure 1 Offset distribution 其中,λ為拉格朗日乘子.但是,此處存在一個(gè)“蛋雞悖論”的問題,參數(shù)λ和δ是相互依賴的.而且,解決該悖論問題相對(duì)比較困難.根據(jù)公式我們可以看到λ越大,死區(qū)偏移量δ越大,q越大,死區(qū)偏移量δ也應(yīng)該越大.但是實(shí)際測(cè)試的過程中發(fā)現(xiàn),隨著Qp的增大,歸一化量化偏移量δ′如圖1.圖1(a)可見有些Qp和λ組合情況下,偏移量出現(xiàn)小于0現(xiàn)象;如果將小于0的偏移量置為0,得到圖1(b)所示曲面.實(shí)驗(yàn)結(jié)果發(fā)現(xiàn),基于圖1所示偏移量HDQ算法性能距離SDQ算法有較大差距. Gary等在不考慮系數(shù)分布參數(shù)差異前提下,為HDQ算法確定了固定死區(qū)偏移量[10],死區(qū)偏移量幀內(nèi)和幀間模式分別取1/3和1/6.這種簡(jiǎn)化導(dǎo)致了一定程度編碼率失真性能損失.λ參數(shù)的準(zhǔn)確性對(duì)偏移量至關(guān)重要.事實(shí)上,不同位置的DCT系數(shù)有不同的拉普拉斯參數(shù)λ[11],類似于SDQ算法,HDQ算法中系數(shù)級(jí)量化調(diào)節(jié)對(duì)于性能提升有著重要影響. 2.1 基于TCM模型的系數(shù)分布參數(shù) 本文中使用TCM分段DCT分布模型,通過觀察TCM與拉普拉斯DCT分布模型的分布模型參數(shù)λ,對(duì)比發(fā)現(xiàn),通過改變模型參量b的大小,可以調(diào)節(jié)TCM模型里分布模型的參數(shù)值的大小,用不同分辨率的測(cè)試序列進(jìn)行實(shí)驗(yàn),橫坐標(biāo)表示圖像16個(gè)位置,縱坐標(biāo)表示兩種DCT系數(shù)分布參數(shù)λ′/λ=λTCM模型/λLaplace模型的比值如圖2,模型參數(shù)b和分布參數(shù)比值的關(guān)系如圖3所示. 圖2 DCT系數(shù)位置和分布參數(shù)比值關(guān)系圖Figure 2 DCT coefficient position and distribution parameter ratio diagram 圖3 分布模型參數(shù)比值與模型參數(shù)b的分布圖Figure 3 The ratio of the model parameters and model parameters b Distribution 2.2 基于TCM模型的自適應(yīng)偏移模型建模 本文構(gòu)建基于TCM模型的DCT分布參數(shù)以及參數(shù)b的自適應(yīng)死區(qū)偏移模型.模擬SDQ算法的數(shù)據(jù)特征和作用機(jī)理,基于統(tǒng)計(jì)分析方法在最大正判概率約束下,探索最優(yōu)死區(qū)量化偏移量,離線構(gòu)建參數(shù)自適應(yīng)模型. 如圖4,本文采用啟發(fā)式模型推導(dǎo)方法.首先,收集圖中的DCT系數(shù)樣本,即兩種量化算法(HDQ和SDQ)的量化幅值不一致情況下的DCT系數(shù).在DCT系數(shù)分布參數(shù)以及模型參數(shù)b的不同組合下,收集這些樣本數(shù)據(jù),在保證樣本兩種量化算法結(jié)果一致的前提下,得到所有DCT系數(shù)樣本偏移量的取值范圍(δmin,δmax). 然后,在DCT系數(shù)分布參數(shù)以及TCM模型參數(shù)b的所有組合下,統(tǒng)計(jì)各組合下樣本偏移量取值范圍,在最大正判概率約束下,從中抉擇出最佳偏移量.最終離線構(gòu)建自適應(yīng)偏移量模型(圖5). 圖4 自適應(yīng)偏移量模型建模示意圖Figure 4 Adaptive offset schematic modeling 圖5 偏移量δ模型圖Figure 5 Model diagram of offset δ 本文將提出的自適應(yīng)偏移量模型可應(yīng)用與H.264和H.265標(biāo)準(zhǔn)編碼器,進(jìn)行HDQ算法驗(yàn)證,與固定偏移量HDQ算法及SDQ算法進(jìn)行了率失真性能比較.所有量化算法都同時(shí)應(yīng)用于最終模式編碼以及率失真優(yōu)化模式選擇回路中.仿真采用D1、720p和1080p格式視頻序列;關(guān)閉碼率控制,量化參數(shù)選擇22,27,32,37,覆蓋低、中和高比特率應(yīng)用.GOP結(jié)構(gòu)采用IPBBPBB.采用主流的BD-PSNR及BD-RATE參數(shù)進(jìn)行率失真性能比較[12]. 表1 固定偏移量HDQ、基于本文自適應(yīng)偏移量模型HDQ與最佳SDQ算法性能對(duì)比 圖6給出了D1格式Silent-D1 flowergarden序列的率失真曲線圖,圖中對(duì)比了SDQ算法、固定偏移量HDQ算法以及本文自適應(yīng)偏移量HDQ算法.此外,表1給出不同測(cè)試序列的BD-PSNR及BD-RATE參數(shù)[12].根據(jù)表1結(jié)果,在高分辨率視頻序列情況下,本文算法有相對(duì)較高的率失真性能提升.本文提出的算法率失真性能上明顯優(yōu)于固定偏移量HDQ算法,十分接近最佳SDQ算法性能.計(jì)算復(fù)雜度方面,相比于固定偏移量HDQ算法,本文算法的額外計(jì)算是DCT系數(shù)分布參數(shù),總體上而言,額外增加的計(jì)算復(fù)雜度基本可以忽略,且本文算法可保持HDQ算法系數(shù)級(jí)并發(fā)處理優(yōu)勢(shì). 圖6 典型測(cè)試序列率失真曲線示Figure 6 A typical test sequence in shows the rate-distortion curve 算法內(nèi)在的串行依賴阻礙了SDQ算法硬件并發(fā)流水有效實(shí)現(xiàn).HDQ算法相較于SDQ算法,編碼率失真性能有顯著的損失.基于統(tǒng)計(jì)分析及啟發(fā)式建模,本文根據(jù)DCT系數(shù)分布參數(shù)以及TCM模型參數(shù),構(gòu)建自適應(yīng)死區(qū)偏移量模型,提出一種內(nèi)容自適應(yīng)偏移量死區(qū)量化算法,可減少傳統(tǒng)死區(qū)HDQ算法和SDQ算法之間性能的差異.實(shí)驗(yàn)仿真結(jié)果表明,相比于固定偏移量HDQ算法,本文算法峰值信噪比有0.080 17 dB性能提升,平均節(jié)省2.941 9%碼率.和SDQ算法相比,本文算法PSNR性能僅有0.047 4 dB損失,相當(dāng)于1.665 3%碼率增加.此外,本文算法額外的復(fù)雜度適中,保持了HDQ算法系數(shù)級(jí)并發(fā)處理優(yōu)勢(shì). [1] YANG E H, YU X, MENG J, et al. Transparent composite model for DCT coefficients: Design and analysis[J].IEEE Transactions on Image Processing,2014,23(3):1303-1316. [2] LIU L, YOURAPIS A M, et al. Rate distortion optimized quantization in the JM reference software[C]//Joint Video Team of ISO/IEC Conference. Geneva: IEEE, 2008:1124-1135. [3] SULLIVAN G J. Efficient scalar quantization of exponential and Laplacian random variables[J].IEEE Transactions on Information Theory,1996,42(5):1365-1374. [4] BJONTEGAARD G. Calculation of average PSNR differences between RD-Curves[C]//13th video coding experts group(VCEG) meeting. TX, USA:IEEE,2001:1022-1034. [5] WEN J, LUTTRELL M, VILLASENOR J. Trellis-based RD optimal quantization in H. 263+[J].IEEE Transactions on Image Processing,2000,9(8):1431-1434. [6] YANG E H, YU X. Rate distortion optimization of H. 264 with main profile compatibility[C]//2006 IEEE International Symposium on Information Theory. Seattle, Washington: IEEE,2006:282-286. [7] YIN H B, YANG E H, YU X, et al. Fast soft decision quantization with adaptive preselection and dynamic trellis graph[J].IEEE Transactions on Circuits & Systems for Video Technology,2015,25(8):1362-1375. [8] KARCZEWICZ M, YE Y, CHONG I. Rate distortion optimized quantization[J].IEEE Transactions on Circuits and Systems for Video Technology,2008,6(2):182-190. [9] SUN J, DUAN Y, Li J, et al. Rate-Distortion analysis of Dead-Zone plus uniform threshold scalar quantization[J].IEEE Transactions on Image Processing,2013,22(1):215-228. [10] LEE H, YANG S, PARK Y, et al. Fast quantization method with simplified rate-distortion optimized quantization for HEVC Encoder[J].IEEE Transactions on Circuits & Systems for Video Technology,2016,26(1):107-116. [11] HUANG T Y, CHEN H H. Efficient quantization based on rate-distortion optimization for video coding[J].IEEE Transactions on Circuits and Systems for Video Technology,2016,26(6):1099-1106. An adaptive hard-decision quantization algorithm based on TCM model LI Ruiyang, YIN Haibing In video coding, the DCT coefficient distribution model is the basis of the rate-distortion theory model. Video quantization includes hard-decision quantization(HDQ) and soft decision quantization(SDQ). The SDQ algorithm can achieve optimal coding performance, but the Viterbi algorithm can cause severe serial processing dependencies between coefficients. In comparison, the dead-zone-based HDQ algorithm has some loss of rate-distortion performance, while it does not consider the correlation between coefficients. In this paper, an adaptive hard-decision quantization algorithm based on the Transparent Composite Model(TCM)is proposed to estimate the distribution parameters of DCT coefficients of different frequency components using a more accurate DCT estimation model. Based on the quantization parameters and DCT coefficient distribution parameters, an adaptive dead-zone offset model was established and optimized. Experimental results show that the HDQ algorithm is close to the SDQ algorithm with respect to the fixed offset HDQ algorithm. video coding; rate-distortion optimization; TCM model; hard-decision quantization 2096-2835(2017)01-0103-05 10.3969/j.issn.2096-2835.2017.01.018 2016-11-08 《中國(guó)計(jì)量大學(xué)學(xué)報(bào)》網(wǎng)址:zgjl.cbpt.cnki.net 李瑞陽(1994- ),男,河南省商丘人,碩士研究生,主要研究方向?yàn)閿?shù)字視音頻處理.E-mail:997813298@qq.com 通信聯(lián)系人:殷海兵,男,教授.E-mail:yinhb@cjlu.edu.cn TP919.81 A2 基于TCM模型自適應(yīng)偏移量的HDQ算法
3 實(shí)驗(yàn)結(jié)果
4 結(jié) 論
(College of Information Engineering, China Jiliang University, Hangzhou 31018, China)