夏德春,2,何小海**,韓興陽(yáng)2,葉宇昀,吳小強(qiáng)
(1.四川大學(xué) 電子信息學(xué)院,成都 610065;2.聯(lián)合保障中心 信息中心,成都 610015)
面向HEVC的Golomb-Rice編碼參數(shù)自適應(yīng)策略*
夏德春1,2,何小海**1,韓興陽(yáng)2,葉宇昀1,吳小強(qiáng)1
(1.四川大學(xué) 電子信息學(xué)院,成都 610065;2.聯(lián)合保障中心 信息中心,成都 610015)
為了進(jìn)一步降低高性能視頻編碼(HEVC)的輸出碼率,針對(duì)基于上下文的自適應(yīng)算術(shù)編碼(CABAC),提出了一種改進(jìn)算法。利用大尺寸變換單元(TU)和變換跳過(guò)模式系數(shù)塊大值系數(shù)較多的特點(diǎn),首先在32×32變換單元中,根據(jù)已編碼4×4系數(shù)組(CG)系數(shù)值的分布特性,自適應(yīng)決定下一個(gè)CG的哥倫布-萊斯(Golomb-Rice)初始參數(shù)值;其次,在變換跳過(guò)模式系數(shù)塊中設(shè)置初始Golomb-Rice參數(shù)為1,再利用相鄰系數(shù)的相關(guān)性,根據(jù)已編碼系數(shù)絕對(duì)值大小自適應(yīng)決定下一系數(shù)的編碼參數(shù)值。實(shí)驗(yàn)結(jié)果表明,與HEVC標(biāo)準(zhǔn)算法HM16.0相比,所提算法能達(dá)到0.09%~2.75%的比特率下降,平均有效率90%以上,且峰值信噪比(PSNR)無(wú)損失,編碼時(shí)間平均只增加了0.08%。與代表文獻(xiàn)相比,所提算法平均節(jié)省0.49%比特率,PSNR平均提高0.01 dB。
高性能視頻編碼;哥倫布-萊斯(Golomb-Rice)參數(shù);變換跳過(guò)模式;自適應(yīng)策略
為了進(jìn)一步提高新一代視頻編碼標(biāo)準(zhǔn)-高性能視頻編碼(High Efficiency Video Coding,HEVC)的壓縮性能,眾多學(xué)者先后基于客觀工程學(xué)框架和人類視覺感知模型[1-2]提出了不同改進(jìn)算法,并且都達(dá)到了降低輸出碼率的目的。而針對(duì)熵編碼的改進(jìn)是其中的重要研究之一。HEVC中采取的熵編碼策略是基于上下文的自適應(yīng)算術(shù)編碼(Context-based Adaptive Binary Arithmetic Coding,CABAC)。與其他熵編碼方法相比,CABAC熵編碼能夠取得更好的壓縮效果,特別是當(dāng)信源概率分布比較均勻時(shí),它的編碼效率要高于哈夫曼編碼。
近年來(lái),針對(duì)CABAC的改進(jìn)成為了眾多學(xué)者研究的熱點(diǎn),提出了一系列改進(jìn)算法[3]。文獻(xiàn)[4]中提出了相比于CABAC更復(fù)雜的上下文樹加權(quán)建模(Context-tree Weighting,CTW)方法,在計(jì)算復(fù)雜度成本顯著增加的前提下,能達(dá)到約1%~3%的比特率節(jié)約。文獻(xiàn)[5]在文獻(xiàn)[4]的基礎(chǔ)上,提出了一種基于CTW的概率估計(jì)模型,使編碼符號(hào)的概率估計(jì)更加精確,從而能達(dá)到0.7%~4.5%的比特率節(jié)約,但解碼復(fù)雜度增加了32%~38%。文獻(xiàn)[6]將變換單元分成不同區(qū)域,同尺寸變換塊的相同區(qū)域使用同一個(gè)上下文模型,并利用一個(gè)局部模板下的鄰域系數(shù)確定當(dāng)前上下文模型的索引值,實(shí)驗(yàn)結(jié)果顯示在低延遲配置條件下,能達(dá)到0.9%的比特率節(jié)約。文獻(xiàn)[7]針對(duì)屏幕內(nèi)容變換跳過(guò)模式編碼塊系數(shù)的分布特點(diǎn),對(duì)絕對(duì)系數(shù)值進(jìn)行區(qū)間截?cái)?,然后進(jìn)行有限長(zhǎng)度的哥倫布-萊斯編碼,能達(dá)到0.6%~1.13%的比特率節(jié)省。
但是,文獻(xiàn)[4-5]對(duì)CABAC的改進(jìn)主要集中在概率模型的精確估計(jì)上,沒有直接從編碼系數(shù)的分布特性來(lái)考慮。雖然有一定比特率節(jié)約,但編解碼復(fù)雜度卻大大增加。文獻(xiàn)[6]雖然區(qū)分了變換塊的不同區(qū)域,并利用了相鄰系數(shù)的相關(guān)性,但是對(duì)系數(shù)的分布特性考慮不夠,因此碼率降低有限。文獻(xiàn)[7]盡管考慮了變換跳過(guò)模式系數(shù)塊系數(shù)較大的特點(diǎn),卻沒有區(qū)分不同尺寸變換塊系數(shù)幅值的差異性,故而主要對(duì)屏幕內(nèi)容序列有一定效果,對(duì)普通序列效果不太明顯。而且在熵編碼階段采用了有損的系數(shù)處理方式,造成了一定的峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)損失。因此,本文結(jié)合編碼塊系數(shù)的能量分布特性,綜合考慮大尺寸變換塊和跳過(guò)模式編碼塊兩個(gè)方面,對(duì)熵編碼階段的哥倫布-萊斯(Golomb-Rice)編碼參數(shù)提前預(yù)測(cè),在PSNR無(wú)損失、編解碼時(shí)間幾乎不增加的前提下,實(shí)現(xiàn)一定比特率的節(jié)約。
HEVC的CABAC熵編碼采用常規(guī)編碼和旁路編碼相結(jié)合的編碼方式。常規(guī)編碼模式為每個(gè)語(yǔ)法元素建立一個(gè)上下文模型,根據(jù)編碼過(guò)程自適應(yīng)更新概率值,而旁路編碼模式無(wú)需為每個(gè)編碼符號(hào)分配概率模型。HEVC標(biāo)準(zhǔn)算法中對(duì)常規(guī)編碼后剩余絕對(duì)值部分的語(yǔ)法元素coeff_abs_level_remaining采取哥倫布-萊斯編碼。CABAC熵編碼涉及的其他語(yǔ)法元素參見文獻(xiàn)[7]。
HEVC中變換單元(Transformation Unit,TU)分為4×4、8×8、16×16、32×32四種尺寸,每一個(gè)TU都被分為4×4的系數(shù)組(Coefficient Group,CG)進(jìn)行熵編碼。HEVC標(biāo)準(zhǔn)算法中對(duì)一個(gè)CG的熵編碼過(guò)程如圖1所示。
圖1 一個(gè)CG的哥倫布-萊斯編碼過(guò)程Fig.1 Golomb-Rice code flow chart in a CG
經(jīng)過(guò)DCT變換的TU塊能量主要集中于左上角,其表現(xiàn)為左上角的CG塊大幅值系數(shù)較多,并且這種系數(shù)分布特性隨著TU尺寸的增大表現(xiàn)得越明顯。為了說(shuō)明這種系數(shù)分布特性和TU尺寸的關(guān)系,我們對(duì)序列Kimono1(1 920×1 080,24 frame/s)在量化參數(shù)(Quantization Parameter,QP)為17和27時(shí)的系數(shù)絕對(duì)值分布區(qū)間進(jìn)行統(tǒng)計(jì),如圖2。從圖2可以看出,尺寸為32×32的TU塊大幅值系數(shù)明顯較多。另外,我們發(fā)現(xiàn)在一些序列中,采用變換跳過(guò)模式的編碼塊也具有大幅值系數(shù)較多的特征。
(a)QP=17
(b)QP=27圖2 TU的系數(shù)絕對(duì)幅值分布特性Fig.2 The distribution of coefficient absolute amplitude in a TU
在HEVC標(biāo)準(zhǔn)算法中采用圖1所示的算法對(duì)CG進(jìn)行哥倫布-萊斯編碼,這種算法設(shè)置初始哥倫布-萊斯參數(shù)為0,當(dāng)初始編碼系數(shù)絕對(duì)值較大時(shí),編碼一個(gè)系數(shù)所需的比特較多。因此,我們將尺寸為32×32的TU塊和變換跳過(guò)模式編碼塊與其他編碼塊區(qū)分開來(lái),依據(jù)編碼塊及系數(shù)絕對(duì)幅值之間的相關(guān)性自適應(yīng)決定哥倫布-萊斯參數(shù)值,并調(diào)整參數(shù)范圍為[0,6]。本算法只作用于最終熵編碼階段,不參與率失真優(yōu)化等其他過(guò)程。
3.1大尺寸TU哥倫布-萊斯初始參數(shù)的決策
區(qū)分不同的TU尺寸設(shè)置不同的哥倫布-萊斯初始參數(shù)K:
(1)
式中:s為TU塊的尺寸,Ki為通過(guò)閾值決策的初始萊斯參數(shù)值。Ki的具體決策過(guò)程如下式:
(2)
式中:τ1、τ2、τ3、τ4為閾值因子;Ai-1為前一CG的絕對(duì)系數(shù)幅值均值,其定義為
(3)
式中:N為編碼塊中非零系數(shù)的個(gè)數(shù),xj為一個(gè)編碼塊中的第j個(gè)元素。
3.2變換跳過(guò)模式編碼塊哥倫布-萊斯參數(shù)的決策
對(duì)采用變換跳過(guò)模式的編碼塊設(shè)置K=1,當(dāng)編碼完一個(gè)coeff_abs_level_remaining后,根據(jù)當(dāng)前coeff_abs_level_remaining值判斷下一個(gè)編碼參數(shù)Kj:
(4)
式中:Vj-1為前一個(gè)coeff_abs_level_remaining值;μ1、μ2、μ3為閾值因子;j為系數(shù)序號(hào),且j∈[1,3]。
本文的實(shí)驗(yàn)平臺(tái)為HEVC的標(biāo)準(zhǔn)測(cè)試軟件HM16.0,共選擇了6個(gè)不同分辨率的序列做測(cè)試,每個(gè)序列編碼前50幀,本算法需要對(duì)變換跳過(guò)模式編碼塊進(jìn)行處理,因此將變換跳過(guò)模式參數(shù)transformskip設(shè)置為1。為了說(shuō)明算法在較大量化區(qū)間具有有效性,選擇了4個(gè)QP(12、17、22、27)進(jìn)行測(cè)試。其他均為HEVC推薦配置,如表1所示。全I(xiàn)幀編碼配置文件為encoder_intra_main.cfg,幀間編碼配置文件為encoder_lowdelay_P_main.cfg。
表1 編碼參數(shù)配置Tab.1 Configuration of coding parameters
首先,為了說(shuō)明算法的有效性,特定義有效率η如下:
(5)
式中:∑Feff代表編碼比特率有下降的幀數(shù)之和;∑Ftotal代表總幀數(shù);η表示相比于HM16.0比特率有下降的幀數(shù)占總幀數(shù)的比值,比值越大,說(shuō)明提出的方法越有效。有效率統(tǒng)計(jì)如表2,從表中我們可以看出,η的平均值在90%以上,充分說(shuō)明了本文算法的有效性。
表2 相比于HM16.0本文算法有效率統(tǒng)計(jì)Tab.2 Efficiency of the algorithm compared with HM16.0 %
其次,實(shí)驗(yàn)在碼率、峰值信噪比(Peak Signal-to-Noise Ratio,PSNR)和編碼時(shí)間3個(gè)方面將本文算法與HEVC標(biāo)準(zhǔn)測(cè)試算法HM16.0的性能進(jìn)行比較。ΔB、ΔP、ΔT分別表示本文算法與HM16.0標(biāo)準(zhǔn)的碼率差值百分比、PSNR差值、編碼時(shí)間差值百分比,則
(6)
ΔP=Pproposed-PHM16.0,
(7)
(8)
式中:Bproposed、Pproposed、Tproposed分別表示本文算法的編碼碼率、PSNR和編碼時(shí)間,BHM16.0、PHM16.0、THM16.0分別表示HM16.0標(biāo)準(zhǔn)的編碼碼率、PSNR和編碼時(shí)間。實(shí)驗(yàn)結(jié)果顯示,ΔP均為0,其余指標(biāo)如表3和表4所示。
表3 全I(xiàn)幀編碼性能比較Tab.3 Comparison of intra frame coding performance %
表4 幀間編碼性能比較Tab.4 Comparison of inter frame coding performance %
從表3和表4可以看出,本文所提算法與HEVC標(biāo)準(zhǔn)測(cè)試算法HM16.0相比,比特率有一定下降,且?guī)瑑?nèi)效果優(yōu)于幀間。這是由于幀內(nèi)編碼系數(shù)絕對(duì)幅值比幀間更大。其次,所提算法只作用于最終熵編碼階段,通過(guò)解碼序列與重構(gòu)序列的比較,PSNR完全沒有損失。另外,本算法不額外增加迭代等復(fù)雜運(yùn)算,因此編碼時(shí)間增加不大。
圖3給出了PeopleOnStreet(2 560×1 600,30 frame/s)、Kimono1(1 920×1 080,24 frame/s)、SlideEditing(1 280×720,30 frame/s)和ChinaSpeed(1 024×768,30 frame/s)4個(gè)序列的率失真曲線。從圖中曲線可以看出,本文所提算法率失真性能優(yōu)于HM16.0。
(a)PepoleOnstreet
(b)Kimomol
(c)SlideEditing
(d)ChinaOnspeed
為了進(jìn)一步驗(yàn)證本文算法的良好性能,本文算法在與文獻(xiàn)[7]算法相同配置條件下進(jìn)行實(shí)現(xiàn),表5給出了本文算法在全I(xiàn)幀配置下對(duì)比文獻(xiàn)[7]算法的率失真結(jié)果。表中ΔB、ΔP為兩種算法與標(biāo)準(zhǔn)測(cè)試軟件碼率差值百分比、PSNR差值。從表5的數(shù)據(jù)可以看出,在相同的配置條件下,本文算法相比文獻(xiàn)[7]的算法能節(jié)約0.49%比特率。這是因?yàn)楸疚乃惴軌蚋鶕?jù)系數(shù)的分布特性提前預(yù)測(cè)編碼參數(shù)值,減少了輸出比特。其次,本文算法沒有PSNR的損失,而文獻(xiàn)[7]的算法PSNR平均損失0.01 dB。這是因?yàn)槲墨I(xiàn)[7]的算法對(duì)系數(shù)進(jìn)行截?cái)?,本身就?duì)系數(shù)造成一定損失,而本文算法只作用于最后熵編碼階段,只是根據(jù)編碼塊及系數(shù)絕對(duì)幅值之間的相關(guān)性預(yù)測(cè)編碼參數(shù)值,對(duì)PSNR無(wú)影響。
表5 本文算法文獻(xiàn)[7]算法的率失真性能比較Tab.5 Comparison of the rate distortion performance between the propsed algorithm and the algorithm in Referen[7]
圖4給出了序列SlideEditing(1 280×720,30 frame/s)的率失真曲線,可以明顯看出本文算法優(yōu)于文獻(xiàn)[7]的算法。
圖4 SlideEditing的率失真曲線Fig.4 Rate distortion curve of SlideEditing
本文通過(guò)對(duì)編碼系數(shù)分布特性的分析,得出了大尺寸TU和采用變換跳過(guò)模式編碼塊大幅值系數(shù)較多的結(jié)論。在尺寸為32×32的TU塊中,根據(jù)已編碼CG的系數(shù)自適應(yīng)決定下一CG的初始哥倫布-萊斯參數(shù)值;在采用變換跳過(guò)模式的系數(shù)塊中,設(shè)置初始哥倫布-萊斯參數(shù)為1,再根據(jù)已編碼系數(shù)絕對(duì)值大小自適應(yīng)決定下一系數(shù)的編碼參數(shù)值。實(shí)驗(yàn)結(jié)果表明,本文算法相比于HM16.0標(biāo)準(zhǔn)算法,在PSNR無(wú)損失的情況下,達(dá)到了0.09%~2.75%的比特率下降。與代表文獻(xiàn)相比,本文算法能平均節(jié)省0.49%比特率,PSNR平均提高0.01 dB。從實(shí)驗(yàn)數(shù)據(jù)可以看出,本文算法能一定程度降低輸出碼率,且對(duì)不同分辨率視頻及較大QP區(qū)間都具有較好效果。隨著4K和8K等高清視頻逐漸成為主流視頻,TU尺寸的增大成為了必然趨勢(shì)[8],因此本文算法將具有更廣闊的應(yīng)用前景。下一步將考慮怎樣將本文算法應(yīng)用到更大尺寸TU之中。
[1] 林國(guó)川,何小海,李向群,等.基于感興趣區(qū)域的HEVC壓縮性能優(yōu)化[J].電訊技術(shù),2016,56(1):38-43.
LIN Guochuan,HE Xiaohai,LI Xiangqun,et al.ROI-based HEVC video compression optimization[J].Telecommunication Engineering,2016,16(1):38-43.(in Chinese)
[2] 王曉龍.基于感興趣區(qū)域的自適應(yīng)幀內(nèi)更新編碼算法[J].電訊技術(shù),2014,54(5):569-573.
WANG Xiaolong. Adaptive intra update coding algorithm based on region of interest video coding[J].Telecommunication Engineering,2014,54(5):569-573.(in Chinese)
[3] ZHANG H,SONG L,YANG X K,et al.Evaluation of beyond-HEVC entropy coding methods for DCT transform coefficients[C]. //Proceedings of 2016 Visual Communication and Image Processing(VCIP). Chengdu:IEEE,2016:1-4.
[4] HONG D,VANSCHAAR M D,PESQUETPOPESCU B. Arithmetic coding with adaptive context-tree weighting for the H.264 video coders[C]. // Proceedings of SPIE The International Society for Optical Engineering. San Jose,CA:SPIE,2004:1226-1235.
[5] KARWOWSKI D,DOMASKI M. Context-adaptive binary arithmetic coding with precise probability estimation and complexity scalability for high-efficiency video coding[J].Journal of Electronic Imaging,2016,25(1):1-16.
[6] GAO M,FAN X P,ZHAO D B,et al.An enhanced entropy coding scheme for HEVC[J].Signal Processing:Image Communication,2016,44:108-123.
[7] CHOI J A,HO Y S. Improved entropy coding for quantized transform coefficients in HEVC screen content coding[J].Signal,Image and Video Processing,2015,9(5):1067-1079.
[8] ALSHIN A,ALSHINA E,BUDAGAVI M,et al.Coding efficiency improvements beyond HEVC with known tools[C]//Proceedings of SPIE9599(Applications of Digital Image Processing XXXVIII).San Diego,California:SPIE,2015:1-14.
HEVC-orientedGolomb-RiceParameterAdaptiveStrategy
XIA Dechun1,2,HE Xiaohai1,HAN Xingyang2,YE Yuyun1,WU Xiaoqiang1
(1.College of Electronics and Information,Sichuan University,Chengdu 610065,China;2.Information Center,Joint Support Center,Chengdu 610015,China)
In order to further reduce high efficiency video coding(HEVC) output rate,this paper presents an improved algorithm of Context-based Adaptive Arithmetic Coding(CABAC). Firstly,by using the feature that the large size transform unit(TU) and the transform skip mode coefficient block has more large coefficients in CABAC,according to the distribution characteristics of the coded 4×4 coefficients array(CG) in 32×32 transform unit,the initial Golomb-Rice parameter of the next CG is adaptively determined.Then,in the transform skip mode coefficient block,the initial Golomb-Rice parameter is set to 1,and then the coding parameter of the next coefficient is adaptively determined according to the absolute value of the coded coefficients. The experimental results show that,compared with the HEVC standard algorithm HM16.0,the proposed algorithm brings down the bit rate by 0.09%~2.75%,the average efficiency is more than 90%,peak signal-to-noise ratio(PSNR) has no loss and coding time is only increased by 0.08%. Compared with the representative literature,the proposed algorithm can save the average bit rate by 0.49%,and PSNR is increased by an average of 0.01 dB.
high efficiency video coding(HEVC);Golomb-Rice parameter;transform skip mode;adaptive strategy
date:2017-01-06;Revised date:2017-04-10
國(guó)家自然科學(xué)基金資助項(xiàng)目(61471248);四川省科技計(jì)劃項(xiàng)目(2015JY0189);四川省教育廳2014年研究生教育改革項(xiàng)目(2014-教-034)
**通信作者:hxh@scu.edu.cn Corresponding author:hxh@scu.edu.cn
TN919.81
A
1001-893X(2017)10-1218-06
夏德春(1984—),男,四川廣元人,2008年于四川大學(xué)獲學(xué)士學(xué)位,現(xiàn)為碩士研究生,主要研究方向?yàn)閳D像與視頻編碼;
Email:xiazhi2003169@163.com
何小海(1964—),男,四川綿陽(yáng)人,2002年于四川大學(xué)獲博士學(xué)位,現(xiàn)為教授,主要研究方向?yàn)閳D像處理、模式識(shí)別和圖像通信;
Email:hxh@scu.edu.cn
韓興陽(yáng)(1979—),男,四川廣元人,2009年于國(guó)防大學(xué)獲碩士學(xué)位,現(xiàn)為助理工程師,主要研究方向網(wǎng)絡(luò)安全與信息建設(shè)、圖像處理;
葉宇昀(1993—),男,福建漳州人,2015年于東北大學(xué)獲學(xué)士學(xué)位,現(xiàn)四川大學(xué)碩士研究生,主要研究方向?yàn)橐曨l壓縮和圖像通信;
吳小強(qiáng)(1969—),男,廣西柳州人,1991年于成都科技大學(xué)獲學(xué)士學(xué)位,現(xiàn)為高級(jí)工程師,主要研究方向?yàn)閳D像處理、圖像通信及計(jì)算機(jī)應(yīng)用。
10.3969/j.issn.1001-893x.2017.10.019
夏德春,何小海,韓興陽(yáng),等.面向HEVC的Golomb-Rice編碼參數(shù)自適應(yīng)策略[J].電訊技術(shù),2017,57(10):1218-1223.[XIA Dechun,HE Xiaohai,HAN Xingyang,et al.HEVC-oriented Golomb-Rice parameter adaptive strategy[J].Telecommunication Engineering,2017,57(10):1218-1223.]
2017-01-06;
2017-04-10