張明輝, 馮桂
(華僑大學 信息科學與工程學院, 福建 廈門 361021)
采用HEVC的視頻內(nèi)容認證
張明輝, 馮桂
(華僑大學 信息科學與工程學院, 福建 廈門 361021)
提出一種基于高效視頻編碼(HEVC)的視頻內(nèi)容認證算法.根據(jù)圖像紋理特征產(chǎn)生特征碼,將特征碼用于修改幀間8×8編碼單元的分割模式、幀間預測模式和運動向量,并保留最佳的編碼單元分割模式及相應的預測模式和運動向量.實驗結(jié)果表明:該算法對視頻質(zhì)量影響很小,嵌入水印后碼率的變化也很小;同時,該算法具有較好的脆弱性,可以用于視頻認證.
高效視頻編碼; 內(nèi)容認證; 運動向量; 幀間預測模式
Abstract: In this paper, a video content authentication scheme based on high efficiency video coding (HEVC) has been proposed, the scheme used the feature codes generated from image texture to modify partition modes, inter-prediction modes and the value of motion vector of inter-frame 8×8 coding unit, and reserve the optimal coding unit splitting mode with corresponding prediction mode and motion vector. The experimental results show that our proposed algorithm has very small effect on video quality and bitrate. And our scheme can be used for authenticating video content owing to its good fragility.
Keywords: high efficiency video coding; content authentication; motion vector; inter-frame prediction mode
高效視頻編碼(high efficiency video coding,HEVC)是ITU-T視頻編碼專家組和ISO/IEC運動圖像專家組聯(lián)合推出的最新視頻編碼標準.在相同的感知視頻質(zhì)量下,HEVC比現(xiàn)有的標準減少50%的比特率[1-2].視頻內(nèi)容認證一般采用脆弱視頻水印算法,與之相關(guān)的文獻多以H.264為基礎.王美華等[3]提出修改幀內(nèi)4×4塊量化離散余弦變換(DCT)高頻系數(shù)的奇偶性嵌入水印,然而奇偶性的脆弱性并不好.Xu等[4]選擇中頻部分嵌入水印,算法在嵌入過程中修改了非零系數(shù),因此嵌入水印后碼率增加較大.Zhang等[5]提出的可逆脆弱算法中,將水印嵌入4×4塊最后一個非零量化DCT系數(shù)中,雖然算法是可逆的,但水印的嵌入?yún)^(qū)域不定,從低頻到高頻都有可能,因而脆弱性受限.除了幀內(nèi)量化DCT系數(shù)外,幀間運動向量(motion vector,MV)也常用來實現(xiàn)脆弱水印嵌入.文獻[6-7]選擇修改MV的奇偶性嵌入水印.Li等[8]選擇修改P幀或B幀滿足條件的運動向量差的分量,實現(xiàn)水印嵌入,由于算法嵌入過程要滿足一定條件,因而嵌入容量受限.以HEVC為平臺的水印算法較少見.王家驥等[9]提出了在紋理塊區(qū)域,根據(jù)水印修改幀內(nèi)預測模式的奇偶性,此方案能獲得良好的視覺質(zhì)量,只是奇偶性的脆弱性并不好.因此,本文提出一種基于HEVC的視頻內(nèi)容認證算法.
圖1 PB分割模式Fig.1 Splitting mode for PB
相比H.264編碼標準中的宏塊,HEVC采用了一個新的編碼結(jié)構(gòu)——編碼樹單元(coding tree unit,CTU)作為基本處理單元.根據(jù)圖像的內(nèi)容,每個CTU被自適應地分割為編碼單元(coding unit,CU).CU的大小有8×8,16×16,32×32和64×64.HEVC將每個CU劃分成預測單元(prediction unit,PU),如圖1所示.圖1中,幀間8×8 CU不允許采用N×N分割,這是為了最小化最壞情況下的內(nèi)存帶寬;而對非對稱分割,只有在2N≥16時才允許[10].對于每個PU,HEVC采用了兩種幀間預測模式,分別為幀間模式和合并模式.幀間模式采用高級運動向量預測,此模式下要傳輸MV的值給解碼端;合并模式,HEVC從候選列表中選出代價最小的合并候選,此模式下只要傳輸合并索引給解碼端,并產(chǎn)生一個合并標志[11].
2.1特征碼的產(chǎn)生
一般來說,HEVC對紋理復雜的區(qū)域采用小尺寸的CU;對較平滑的區(qū)域采用大尺寸的CU.然而,紋理特性在同一個場景中變化不大,因此,利用紋理特性產(chǎn)生特征碼.S表示區(qū)域平滑度,定義為
式(3)中:T取值在[Smin,Smax]之間,根據(jù)T值劃分出紋理塊與非紋理塊,S>T的塊認為是紋理塊.α的取值要適中,α過大時,T趨于Smin,會影響特征碼的魯棒性;α過小時,T趨于Smax,影響紋理塊的個數(shù).
圖2 不同QP下紋理塊劃分為4個8×8 CU的概率Fig.2 Probability that texture block is divided into 4 CUs of 8×8 size under different QP
在編碼過程中,HEVC通常會將16×16的紋理塊劃分成4個8×8的CU.因而,統(tǒng)計當前紋理塊劃分為4個8×8 CU的概率.在HM14.0的平臺上,測試4個不同序列,分辨率為416×240,編碼30個Ⅰ幀,每幀令α=0.5劃分出紋理塊.在不同量化參數(shù)(quantiztion parameter,QP)下,統(tǒng)計紋理塊的劃分情況,如圖2所示.圖2中:P為概率.
由圖2可知:對于運動很緩慢的圖像BQsquare,不同QP下紋理塊被劃分為4個8×8的概率在98%以上,其他的測試序列也在90%以上,說明紋理塊劃分具有很好的魯棒性.因而根據(jù)紋理塊確定特征碼,即
將特征碼作為水印w=mcode嵌入到P幀中.
2.2水印嵌入
Liu等[12]提出了一種用水印修改幀內(nèi)和幀間分割模式的算法,過程較為復雜.文中將該算法簡化以適應HEVC的分割模式,并結(jié)合HEVC特有的幀間預測模式實現(xiàn)水印嵌入.算法選擇對8×8的CU進行修改,具體有以下5個步驟.
步驟1在編碼過程中,如果當前16×16 CU的代價比4個8×8 CU的代價大,則對這個16×16的CU進行重編碼,在重編碼過程中嵌入水印.這么做是為了減小算法對視頻質(zhì)量和碼率的影響.
步驟2假設要嵌入的二值水印序列為W={w1,w2,…,wk,wk+1,wk+2,…},如果當前水印wk=1,則在編碼時跳過2N×2N的分割模式;反之,則跳過2N×N和N×2N分割模式.
步驟3對于修改后CU下的PU,如果當前水印值wk+1=0,則強制當前PU的預測模式為合并模式;否則,強制為幀間模式.這一步處理只針第一個PU,PU序號,如圖3所示.
圖3 PU的序號Fig.3 PU order
步驟4經(jīng)過步驟3后,N×2N和2N×N的分割方式下PU會有剩余.為了擴大容量,對步驟3中剩下的PU也進行處理.然而,繼續(xù)修改預測模式會對碼率產(chǎn)生較大影響,故這一步只處理剩下PU的MV.Wang等[13]指出,對MV進行加1或減1操作對視頻質(zhì)量影響很小.因此,如果當前PU的最佳預測模式為幀間,就需要傳輸MV給解碼端.根據(jù)水印wk+2的值修改MV的水平分量MVx和垂直分量MVy中絕對值較大的分量的奇偶性,令MVmax=max{|MVx|,|MVy|}為水平和垂直分量中絕對值的最大值,有
1) 如果MVmax存在,則
2) 如果MVmax不存在,則MVx=MVy,兩者同時處理.即
這里只列舉MVx的處理步驟,MVy的處理與其類似.
步驟5保留最佳的CU分割模式及其相應PU的預測模式和MV值.
2.3水印的提取
水印提取不需要位置信息,只需對幀間8×8 CU進行相應地提取,是一種盲提取.其具體提取分以下3個步驟.
步驟1如果當前CU的大小為8×8,獲得當前CU的分割模式,分割模式為2N×2N,則提取水印mk=1;反之,提取水印mk=0.
步驟2由步驟1可知,區(qū)分幀間預測模式的關(guān)鍵在于合并標志.獲取當前PU的合并標志,如果合并標志位true,則提取水印mk+1=0;反之,提取為1.
步驟3在執(zhí)行完步驟2后,如果CU分割模式為N×2N或2N×N,則有PU剩余.對于剩余的PU,如果其預測模式為幀間模式,則繼續(xù)從PU的MV進行提取,即
算法采用HEVC參考軟件HM14.0進行測試.原始QP=30,編碼方式為IPPP…,總共編碼28幀,其余參數(shù)都為標準配置.分別測試了6個具有4種分辨率的測試序列,分別是3個416×240的序列(BQSquare,BlowingBubbles,RaceHorses),832×480的序列(BQMall),1 024×768的序列(ChinaSpeed)和1 920×1 080的序列(BasketballDrive).
3.1視覺質(zhì)量和不可見性分析
表1 不同QP下的RPSN值Tab.1 RPSN values corresponding to different QP dB
3.2比特率分析和容量測試
不同QP(28,30)下,無水印與有水印視頻序列的比特率,如表2所示.表2中:R和R′分別表示原始視頻序列比特率和嵌入水印后視頻序列的比特率;Rvar表示比特率的增長百分比,定義為
由表2可知:Rvar的最大值發(fā)生在QP=28時的BlowingBubbles序列,為0.94%;Rvar的最小值發(fā)生在QP=28時的BQMall序列,為0.14%;碼率的增長不超過1%,說明文中算法對比特率的影響很小.
表2 不同QP下的比特率Tab.2 Bitrate corresponding to different quantization parameters
不同QP(28,30)下,28幀的容量,如表3所示.由表3可知:對于每一個視頻序列,QP值越小,容量越大.這是由于QP越小,滿足重編碼條件的16×16塊越多,8×8尺寸的CU個數(shù)越多,故容量越大.
表3 不同QP下28幀的容量CTab.3 Capacity C of all 28 frames corresponding to different QP bits
3.3視頻認證
定義正確提取率η,于衡量算法的脆弱性,表示為
式(12)中:right_bits表示正確提取的比特數(shù);total_bits表示總的水印比特數(shù).η越小表明提取的水印與原始的水印差別越大,脆弱性越好.不同QP值含水印視頻重編碼下的η值,如表4所示.表4中:ηave表示η的平均值.在重編碼的過程中,P幀8×8 CU的分割模式、幀間預測模式以及MV的值都有可能發(fā)生改變.對比不同的測試序列可知:ChinaSpeed視頻序列的ηave值最小,為0.43;RaceHorses和BQMall視頻序列的ηave值最大,為0.48.說明文中算法具有較好的脆弱性,能夠用于視頻認證.
表4 不同QP下的η值Tab.4 η values under different QP
3.4對比測試
為了衡量文中算法的整體性能,將文中算法與文獻[9]提出的算法作比較.采用與文獻[9]相同的配置,周期為16,GOP為8,編碼96幀.對BlowingBubbles序列進行了測試,對比結(jié)果如表5所示.由表5可知:文中算法在RPSN的變化上與文獻[9]算法相差不多,碼率的增長稍大;但文中算法的嵌入容量大很多,這是因為將水印嵌入了P幀,而文獻[9]只將水印嵌入了Ⅰ幀.同時,文中算法的脆弱性比文獻[9]好.這主要是因為文獻[9]只根據(jù)水印修改幀內(nèi)預測模式的奇偶性,而文中算法綜合了幀間分割模式、預測模式和MV的脆弱性.因此,文中算法的脆弱性更好.
表5 不同算法性能對比結(jié)果Tab.5 Comparison results of performance of different algorithms
針對重編碼敏感,提出一種基于HEVC的脆弱水印算法.首先,根據(jù)圖像的紋理特征產(chǎn)生特征碼,將其作為水印嵌入P幀中;然后,根據(jù)水印值修改幀間8×8 CU的分割模式;最后,在不同的分割模式下,修改幀間預測模式和MV的值,保留最佳的CU分割模式及其相應的預測模式和MV.實驗結(jié)果表明:文中算法對視頻質(zhì)量的影響幾乎可以忽略不計,嵌入水印后碼率的增長也很小;同時,該算法具有較好的脆弱性,表明該算法能夠用于視頻內(nèi)容認證.
[1] SULLIVAN G J,OHM J,HAN W J,etal.Overview of the high efficiency video coding (HEVC) standard[J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1649-1668.
[2] OHM J R,SULLIVAN G J,SCHWARZ H,etal.Comparison of the coding efficiency of video coding standards-including high efficiency video (HEVC)[J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1-12.
[3] 王美華,裴慶祺,范科峰.基于脆弱水印的 H.264 視頻完整性認證方案[J].西安電子科技大學學報,2007,34(5):823-827.
[4] XU Dawen,WANG Rangding,WANG Jicheng.A novel watermarking scheme for H.264/AVC video authentication[J].Signal Processing: Image Communication,2011,26(6):267-279.
[5] 張維緯,張茹,劉建毅,等.一種基于H.264/AVC的視頻可逆脆弱水印算法[J].電子與信息學報,2013,35(1):106-132.
[6] SAADI K S,BOURIDANE A,GESSOUM A.H.264/AVC video authentication based video content[C]∥5th International Symposium on Communications and Mobile Network.Rabat:IEEE Press,2010:1-4.
[7] 楊高波,李俊杰,王小靜,等.基于脆弱水印的H.264視頻流完整性認證[J].湖南大學學報(自然科學版),2009,36(6):67-71.
[8] LI Qian,WANG Rangding,XU Dawen.Fragile video watermarking algorithm based on H.264/AVC[J].Materials Research Innovations,2013,17(S1):94-100.
[9] 王家驥,王讓定,李偉,等.一種基于幀內(nèi)預測模式的HEVC視頻信息隱藏算法[J].光電子·激光,2014,25(8):1578-1585.
[10] KIM I K,MIN J,LEE T,etal.Block partitioning structure in the HEVC standard[J].IEEE Transactions on Circuits and Systems for Video Technology,2012,22(12):1697-1706.
[11] LIN Jianliang,CHEN Yiwen,HUANG Yuwen,etal.Motion vector coding in the HEVC standard[J].IEEE Journal of Selected Topics in Signal Processing,2013,7(6):957-968.
[12] LIU C H,CHEN O T.Data hiding in inter and intra prediction modes of H.264/AVC[C]∥International Symposium on Circuits and Systems.Seattle W A:IEEE Press,2008:3025-3028.
[13] WANG Keren,ZHAO Hong,WANG Hongxia.Video steganalysis against motion vector based steganography by adding or subtracting one motion vector value[J].IEEE Transactions on Information Forensics and Security,2014,9(5):741-751.
(責任編輯: 黃曉楠英文審校: 吳逢鐵)
VideoContentAuthenticationSchemeforHEVC
ZHANG Minghui, FENG Gui
(College of Information Science and Engineering, Huaqiao University, Xiamen 361021, China)
10.11830/ISSN.1000-5013.201502004
2015-02-03
馮桂(1960-),女,教授,博士,主要從事信號與信息處理、通信系統(tǒng)信息安全理論、多媒體通信的研究.E-mail:fengg@hqu.edu.cn.
福建省自然科學基金資助項目(2014J01242, 2016J01306)
TP 391
A
1000-5013(2017)05-0721-06