国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

H.265/HEVC視頻編碼標準性能評估與分析

2018-11-26 02:32徐山峰王兆偉孫治水王行建
中國電子科學研究院學報 2018年5期
關鍵詞:壓縮率編碼器時延

謝 佳,徐山峰,王兆偉,孫治水,王行建

(中國電子科學研究院,北京 100041)

0 引 言

目前,安防監(jiān)控、在線聊天,視頻會議、數(shù)字電視、圖像識別等領域,對視頻編碼的需求越來越大,要求也越來越高。隨著專業(yè)硬編碼芯片性能的不斷提升,傳輸帶寬的大幅拓寬,硬件平臺和傳輸網(wǎng)絡能夠容忍的視頻編碼的計算開銷和帶寬開銷越來越大。隨著視頻編碼技術的更新?lián)Q代,業(yè)界先進的視頻編碼標準層出不窮,H.265、Thor、AOMedia Video1、Daala等新標準百家爭鳴。華為、中國電科??低?、思科、谷歌、Mozilla等高新技術企業(yè)或相關專業(yè)組織對視頻編碼專利池和市場份額的競爭也趨于白熱化。縱觀劍拔弩張、競爭激烈的視頻編碼領域,H.265/HEVC是比較主流的標準之一,同時也是主流芯片廠商兼容的標準之一。H.265/HEVC相對于H.264/AVC在性能方面究竟提升了多少,同時在開銷方面是否能夠接受,H.265/HEVC的“性價比”到底高不高,在業(yè)界有一定爭議。怎樣基于成本投入所決定的硬件性能,更好的選擇H.265/HEVC的應用場景,是需求方需要慎重考慮的。本文基于這個問題,展開分析與研究。

2013年6月7日,ITU-T網(wǎng)站上正式發(fā)布了H.265/HEVC標準[1]。2013年11月25日,ISO/IEC正式發(fā)布了H.265/HEVC標準[2]。H.265/HEVC最大可以支持8192X4320分辨率的視頻編解碼處理。

類似于以往的國際標準,H.265/HEVC采用混合編碼框架,如圖所示,包括變換、量化、熵編碼、幀內(nèi)預測、幀間預測和環(huán)路濾波等模塊[3]。

圖1 H.265/HEVC編碼框架[4]

圖2 H.265/HEVC的宏塊劃分比H.264/AVC更靈活、更高效

H.265/HEVC采用了基于四叉樹的靈活塊分割結(jié)構(gòu)[5、6]、不同角度的幀內(nèi)預測模式[7~10]、自適應的運動矢量預測AMVP、合并技術Merge、可變尺寸的離散余弦變換、模式依賴的離散正弦變換[11]、性能更高的CABAC[12],以及新的樣點自適應補償SAO[13]等更加先進的技術。

1 H.265/HEVC采用的新技術

編碼單元方面, H.264/AVC中僅采用了4X4/8X8的DCT變換,而H.265/HEVC中DCT變換的最大尺寸為32X32,這種大尺寸變換單元的選擇可以是編碼器在處理高分辨率畫面中經(jīng)常出現(xiàn)平坦區(qū)域時能充分提高壓縮率。

幀內(nèi)預測方面,在H.264/AVC中,基于4X4大小的編碼塊采用9中預測模式,基于16X16大小的編碼塊采用4種預測模式。為了應對高清視頻紋理的多樣性,H.265/HEVC針對亮度信號提供了35種預測模式,包括33種角度預測和DC預測模式、Plannar預測模式,從而更好地匹配視頻中復雜的紋理,提高預測效果,去除冗余空間。

圖3 H.265/HEVC和H.264/AVC幀內(nèi)預測模式比較

幀間預測方面,相對于H.264/AVC,為了提升性能,H.265/HEVC引入了運動信息融合技術(Merge)、運動矢量預測技術(AMVP)和基于Merge的Skip模式。這些技術利用空域相關性和時域相關性來減少相鄰編碼單元之間的運動參數(shù)冗余。

圖4 H.265/HEVC基于四叉樹的轉(zhuǎn)換單元分割方式

每個編碼單元可以以四叉樹的方式遞歸分割為轉(zhuǎn)換單元。與H.264主要以4×4轉(zhuǎn)換,偶爾以8×8轉(zhuǎn)換所不同的是,H.265有若干種轉(zhuǎn)換尺寸:32×32、16×16、8×8和4×4。從數(shù)學的角度來看,更大的轉(zhuǎn)換單元可以更好地編碼靜態(tài)信號,而更小的轉(zhuǎn)換單元可以更好地編碼動態(tài)信號,大大提高了編碼效率。

H.265/HEVC采用的SAO濾波技術,對編碼后重構(gòu)圖像的方塊失真,起到了補償重構(gòu)、減少振鈴效應失真的目的。H.265/HEVC采用的IBDI技術,提高了編碼器的編碼精度、降低了幀內(nèi)/幀間預測誤差。同時通過引入?yún)⒖紟瑝嚎s算法,降低了重構(gòu)圖像的數(shù)據(jù)量。H.265/HEVC采用的ACS技術[14],基于4X4編碼單元,即將一個TU劃分成多個4X4塊單元,每個4X4塊單元內(nèi)部和各個4X4塊單元之間都按照相同的掃描順序進行掃描。

綜上,H.265/HEVC在編碼方面引入了大量新的技術體制,編碼壓縮率和圖像質(zhì)量都比H.264/AVC有了顯著提高。同時,不可避免的,H.265/HEVC的算法復雜度更高,計算開銷也更大。

2 圖像質(zhì)量評價指標

本文綜合運用PSNR和SSIM對視頻編碼圖像質(zhì)量進行聯(lián)合評價。

PSNR是一種客觀評價指針,其值通常為20~60,且和圖像質(zhì)量呈正比例關系。對于第n幀圖像,大小為Ncal×Nrow的數(shù)字化圖像Ys(n,i,j)和參考圖像YD(n,i,j),其PSNR計算公式如下:

PSNR(n)=

其中,Vpeak=2k-1,k是對于亮度部分用幾個位來表示一個像素的值。

SSIM是一種接近人眼主觀感受的評價指針,其值為0~1,且和圖像質(zhì)量呈正比例關系。SSIM相關的亮度比較公式如下:

式中,uXuX和uYuY表示XX和Y圖像的均值,C1=(K1L)2C1=(K1L)2,SSIM相關的對比度比較公式如下:

式中,σX和σY表示XX和Y圖像的方差,C2=(K2L)2C2=(K2L)2,SSIM相關的結(jié)構(gòu)比較公式如下:

式中,σXYσXY表示XX和Y圖像的協(xié)方差,C3=C2/2C3=C2/2,XX和Y圖像的結(jié)構(gòu)相似度表示為:

SSIM(X,Y)=l(X,Y)·c(X,Y)·s(X,Y)=

式中,C1、C2、C3為常數(shù),一般取K1=0.01,K2=0.03,L=255。

3 性能評估實驗

為了對H.265/HEVC的編碼性能進行綜合評價,本文從https://people.xiph.org/~tdaede/sets/video-hd-1/sintel_trailer_2k_1080p24_2s.y4m下載原始視頻序列,通過H.265/HEVC編碼器對該視頻序列進行編碼壓縮。該視頻序列共48幀,持續(xù)2秒,分辨率1920X1080,大小149.3MB。為了直觀體現(xiàn)H.265/HEVC的性能,本文將H.265/HEVC和H.264/AVC的編碼性能進行比較。其中以X265作為H.265/HEVC的工程實現(xiàn),以X264作為H.264/AVC的工程實現(xiàn)。主要分析H.265/HEVC、H.264/AVC的壓縮比、壓縮圖像質(zhì)量、編碼時延等技術指標。

本實驗的步驟如下:

(1)通過ffmpeg將原始Y4M視頻序列轉(zhuǎn)換為YUV視頻序列;

(2)通過設置X265/X264編碼進程的命令行參數(shù)“—crf”(取值0~51,取值越大圖像質(zhì)量越差,壓縮率越高),對YUV視頻序列按照不同的壓縮比進行編碼壓縮,形成.265/.264視頻編碼文件,并通過時間戳計時折算編碼時延;

(3)通過ffmpeg將編碼壓縮后的.265/.264文件分拆成48幀靜態(tài)編碼BMP圖片;

(4)通過ffmpeg將YUV文件分拆成48幀靜態(tài)原始BMP圖片;

(5)按照PSNR和SSIM公式計算比較每幀編碼BMP相對于原始BMP的SSIM和PSNR;

(6)利用GNUPLOT繪制SSIM和PSNR曲線變化圖。

3.1 圖像質(zhì)量

詳見下圖

3.2 編碼時延

視頻壓縮中,每幀代表一幅靜止的圖像。為了提高壓縮率,通常采用I/P/B幀編碼序列來提高壓縮率。I幀是關鍵幀,只做幀內(nèi)預測;P幀相對于前面的I幀做幀間預測;B幀是雙向預測幀,即相對于前、后I/P幀做幀間預測。B幀的壓縮率更高,但計算開銷也更大。

圖5 H.264/AVC每幀圖像的編碼后質(zhì)量(PSNR/SSIM)

圖6 H.265/HEVC每幀圖像的編碼后質(zhì)量(PSNR/SSIM)

圖7 不同壓縮比條件下H.264/AVC和H.265/HEVC的平均圖像質(zhì)量(PSNR/SSIM)

X264相對于X265的優(yōu)點是“性價比”高,X265相對于X264的優(yōu)點是壓縮率高、畫質(zhì)高。為了在壓縮率和計算開銷之間進行折衷,同時更好的突出編碼器自身的優(yōu)點,在默認情況下:X264采用I/P幀編碼序列,即計算開銷相對較小的方式進行處理;X265采用I/P/B幀編碼序列,即壓縮率相對較高的方式進行處理。

為了衡量計算開銷,本文在同一臺Intel P8400 2.26 GHz雙核處理器、1.9 GiB內(nèi)存的筆記本電腦上,進行編碼實驗,分析X264、X265的編碼時延。其中編碼時延的計算是通過時間戳計時折算得到。

表1 H.264編碼時延有關信息

表2 H.265編碼時延有關信息

3.3 編碼效果圖

圖8 視頻序列原圖

圖9 H.264編碼效果圖(壓縮比1:503.2)

圖10 H.265編碼效果圖(壓縮比1:482)

從圖8、9、10的編碼效果圖可以看出,在相近壓縮率的條件下,H.265對于諸如頭發(fā)、腰帶等圖像細節(jié)部分和扣衣服扣子的手等圖像運動部分的處理上,比H.264畫質(zhì)更高、更清晰。

4 實驗結(jié)論

(1)在同等圖像質(zhì)量情況下,H.265比H.264平均節(jié)省約30%~50%的碼率,且壓縮的越狠,這種趨勢越明顯;

(2)H.264每幀圖像的質(zhì)量波動比H.265相對平滑;

(3)H.265在提高壓縮率和圖像質(zhì)量方面性能的同時,計算開銷比H.264擴大了10~20倍。換句話說,H.265需要更加強大的硬件支撐。

本實驗對H.264和H.265的編碼性能進行了理論計算和綜合比較,并完成了可視化評估。通過以上工作,系統(tǒng)、直觀得洞悉了H.265相對于H.264在編碼性能方面的提升,同時對二者的編碼開銷進行了評估,為在不同應用場景和設備條件下視頻編碼器的選擇提供了依據(jù)。

猜你喜歡
壓縮率編碼器時延
融合CNN和Transformer編碼器的變聲語音鑒別與還原
5G承載網(wǎng)部署滿足uRLLC業(yè)務時延要求的研究
基于GCC-nearest時延估計的室內(nèi)聲源定位
水密封連接器尾部接電纜的優(yōu)化設計
纏繞墊片產(chǎn)品質(zhì)量控制研究
某型飛機靜密封裝置漏油故障分析
基于雙增量碼道的絕對式編碼器設計
分布式多視點視頻編碼在應急通信中的應用
簡化的基于時延線性擬合的寬帶測向算法
基于數(shù)字信號處理的脈沖編碼器