基于量化表的圖像篡改檢測算法*

2014-12-10 05:38萬榮澤莫洪武余思東

電子技術(shù)應(yīng)用 2014年10期

萬榮澤，莫洪武，余思東

(廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院現(xiàn)代教育技術(shù)與網(wǎng)絡(luò)信息中心，廣西南寧 530007)

0 引言

JPEG壓縮技術(shù)十分先進(jìn)，應(yīng)用也非常廣泛。現(xiàn)實(shí)中照相機(jī)拍攝的圖像、網(wǎng)絡(luò)中傳播的圖像等大部分都是JPEG格式。因此檢測JPEG圖像是否經(jīng)過photoshop、光影魔術(shù)手等軟件的編輯具有十分重要的意義。并且JPEG是一種很靈活的格式，具有調(diào)節(jié)圖像質(zhì)量的功能，允許用不同的壓縮比例對文件進(jìn)行壓縮，支持多種壓縮級(jí)別，壓縮比越大，品質(zhì)就越低；壓縮比越小，品質(zhì)就越高。因此，檢測雙重JPEG壓縮圖像是否經(jīng)過篡改操作具有非常重要的應(yīng)用價(jià)值?；陔p重JPEG壓縮特性的篡改取證技術(shù)是近年來數(shù)字圖像盲取證技術(shù)的研究熱點(diǎn)問題，研究者提出了許多盲取證的方法。利用塊效應(yīng)來檢測 BMP圖像的壓縮歷史被 FAN Z等人[1]提出；同時(shí)以Farid為核心的研究團(tuán)隊(duì)[2]則利用JPEG圖像經(jīng)過壓縮后其DCT系數(shù)直方圖的DFT域有周期效應(yīng)來檢測圖像壓縮歷史，取得顯著效果；Fridrich團(tuán)隊(duì)[3]也對其進(jìn)行了深入研究；然而SHI Y Q等人提出了一種新的思路進(jìn)行BMP圖像壓縮歷史和JPEG圖像重壓縮檢測[4-5]；現(xiàn)在已有很多更優(yōu)的方法[6-7]能夠準(zhǔn)確估計(jì)雙重JPEG壓縮圖像第一次壓縮量化步長的低頻部分，但是不能準(zhǔn)確估計(jì)量化步長的高頻區(qū)域；Peng Yuanyuan等[8]提出了一種新的方法來估計(jì)圖像首次壓縮量化表并具有很好的效果，但是不能準(zhǔn)確定位圖像篡改區(qū)域。

本文利用一種簡單的方法能夠非常準(zhǔn)確估計(jì)出量化表，并定位篡改區(qū)域。首先對數(shù)字圖像進(jìn)行壓縮消除圖像本身的噪聲，然后利用圖像壓縮模型估計(jì)首次壓縮量化表，最后提出一種高效率的方法通過利用量化表來定位圖像篡改區(qū)域。實(shí)驗(yàn)結(jié)果表明，該算法能夠有效地對雙重JPEG壓縮的圖像進(jìn)行檢測和定位，并具有很好的魯棒性。

1 消除噪聲

數(shù)字圖像經(jīng)過處理后變成JPEG圖像的過程中產(chǎn)生大量噪聲[9-10]。HUANG F等利用JPEG圖像壓縮過程中產(chǎn)生的噪聲來檢測圖像是否經(jīng)過二次JPEG壓縮[9]。LI H等利用JPEG圖像壓縮過程中產(chǎn)生的噪聲來檢測圖像是否反取證[10]。采用HUANG F的方法對圖像進(jìn)行多次壓縮，消除噪聲對圖像質(zhì)量的影響。對Lena圖像分別以質(zhì)量因子為 70、80、90進(jìn)行壓縮，然后從圖像文件頭中得到壓縮質(zhì)量因子，對其進(jìn)行JPEG壓縮，得到圖1所示結(jié)果。

圖1 壓縮次數(shù)對噪聲的影響

從實(shí)驗(yàn)中發(fā)現(xiàn)，質(zhì)量因子越大，經(jīng)過壓縮之后，消除的噪聲也大。重復(fù)壓縮10次后，噪聲基本上完全消除。

2 圖像壓縮模型

對處理后的圖像建立圖像壓縮模型并利用它們之間的關(guān)系來估計(jì)第一次壓縮量化表，在已準(zhǔn)確估計(jì)出量化表的基礎(chǔ)上提出了一種簡單的方法來定位篡改區(qū)域，令u1為未量化的數(shù)字圖像的DCT系數(shù)，u2為第二次量化后的DCT系數(shù)，圖像壓縮模型[8]描述如下：

其中，q1和q2分別為圖像第一次壓縮量化步長和圖像第二次壓縮量化步長，Qq1q2用來描述u1與 u2之間的關(guān)系，因此可以得到：

式(2)可轉(zhuǎn)化為：

式(3)可以簡化為：

其中，e、A、B 分別代表 q2/q1、u2-0.5 和 u2+0.5。顯而易見，B與 A的差為 1。因?yàn)閇u1/q1]是一個(gè)整數(shù)，當(dāng)e＜1時(shí)，得到如下結(jié)果：

利用上述原理和圖像壓縮規(guī)律，可以從JPEG圖像的頭文件中得到第二次壓縮的量化表。假設(shè)q1是1～100之間的整數(shù)，q1′是估計(jì)的量化步長，當(dāng) q1′=q1時(shí)，u的值全部為0。定義一個(gè)測量概率函數(shù)如下：

其中，num是量化步長在q1的情況下統(tǒng)計(jì)元素變量的數(shù)量，當(dāng) q1′=q1時(shí)，p達(dá)到最大值。但是對于一幅自然圖像，量化表高頻區(qū)域中大量的DCT系數(shù)量化為0，于是有很多點(diǎn)導(dǎo)致p最大，并且把它們當(dāng)作候選點(diǎn)，僅把這些大于q2的候選點(diǎn)的中值當(dāng)作q1′。實(shí)驗(yàn)結(jié)果如圖2所示。

圖2 概率矩形圖

圖 2(a)和(b)的實(shí)驗(yàn)素材是 Lena圖像，第一次壓縮質(zhì)量因子為80，第二次壓縮質(zhì)量因子為90。圖2(a)是p(q1)函數(shù)，量化步長q1=5和q2=3在量化表的低頻區(qū)域，圖2(b)是p(q1)函數(shù)，量化步長 q1=27和 q2=14在量化表的高頻區(qū)域。然后第二次壓縮的量化表可以從圖像頭文件中得到，從而可以準(zhǔn)確估計(jì)出第一次壓縮的量步長。

利用上述原理得到量化表的部分量化步長，尤其是低頻區(qū)域的量化步長，然后利用下式：其中Qij為量化表第i行j列的量化步長，Q(k)為質(zhì)量因子為k的量化表。利用式(8)得到第一次壓縮的量化表。為了說明算法的有效性，對一幅大小為512×512的Lena圖像，首次壓縮質(zhì)量因子80，第二次壓縮質(zhì)量因子90，其中m和n的取值為4，估計(jì)的量化表實(shí)驗(yàn)結(jié)果如圖3所示。

圖3 量化表對比效果圖

圖3(a)是質(zhì)量因子為80的量化表，圖3(b)是BIANCHI T提出的方法[7]估計(jì)的量化表，圖3(c)是本文提出的方法估計(jì)的量化表。通過對比發(fā)現(xiàn)，BIANCHI T對低頻區(qū)域的量化表估計(jì)很準(zhǔn)確，卻不能準(zhǔn)確估計(jì)高頻區(qū)域的量化表。本文提出的方法能夠準(zhǔn)確估計(jì)高頻區(qū)域量化表。圖3中可明顯看出，本文提出的方法估計(jì)量化表的誤差小于參考文獻(xiàn)[7]中的方法，尤其在高頻區(qū)域相對誤差更小。

3 篡改區(qū)域定位

本文利用eA和eB的關(guān)系來定位圖像篡改區(qū)域。Peng Yuanyuan等[8]利用塊效應(yīng)定位篡改區(qū)域，即對篡改圖像以首次壓縮量化表再進(jìn)行壓縮，此操作使得篡改圖像有信息丟失，不能準(zhǔn)確定位篡改區(qū)域。利用eA與eB的關(guān)系來定位圖像篡改區(qū)域，篡改圖像沒有信息丟失，因此能夠準(zhǔn)確定位圖像篡改區(qū)域。得到u后對其進(jìn)行分類：

M1：未經(jīng)過篡改的u矩陣差異度

M2：經(jīng)過篡改的u矩陣差異度

利用EM方法[7]得到其期望和方差如下：

得到特征矩陣AL如下：

將AL矩陣通過3×3中值濾波，將濾波后的結(jié)果進(jìn)行二值化處理，從而得到模糊篡改區(qū)域。

4 實(shí)驗(yàn)結(jié)果

本文對提出的算法進(jìn)行了驗(yàn)證，若待測圖像為彩色圖像，則將彩色圖像轉(zhuǎn)換為灰度圖像進(jìn)行檢測。對一幅彩色圖像利用Photoshop軟件對圖像中的部分?jǐn)?shù)據(jù)進(jìn)行篡改，然后應(yīng)用所研究的算法對篡改圖像進(jìn)行檢測，實(shí)驗(yàn)結(jié)果如圖4、圖5所示。

為了說明算法的有效性，對另一幅圖像進(jìn)行篡改操作，利用提出的算法對其進(jìn)行檢測，實(shí)驗(yàn)效果如圖5所示。

從圖4、5中可以看出，本文提出的方法對篡改圖像具有很好的效果，并且能夠準(zhǔn)確定位篡改區(qū)域。圖4、5中，(a)為原始圖像，(b)為篡改圖像，(c)是參考文獻(xiàn)[7]檢測結(jié)果，(d)是提出方法檢測的結(jié)果。由實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn)，參考文獻(xiàn)[7]中的算法可以比較準(zhǔn)確地檢測出篡改圖像中的篡改偽造區(qū)域，但其檢測結(jié)果存在一些漏檢區(qū)域與虛警區(qū)域。而本文算法可以對篡改圖像中的篡改偽造區(qū)域準(zhǔn)確定位，同時(shí)檢測精度要明顯好于參考文獻(xiàn)[7]中所提算法，并且能夠很好地定位圖像篡改區(qū)域。

5 結(jié)論

針對雙重JPEG壓縮篡改操作，本文提出一種高效率的方法定位圖像篡改區(qū)域。首先對圖像進(jìn)行壓縮消除圖像自身的噪聲影響，然后利用圖像壓縮模型估計(jì)圖像首次壓縮量化表，估計(jì)的量化表比參考文獻(xiàn)[7]估計(jì)的量化表誤差更小。最后提出一種高效率的方法定位圖像篡改偽造區(qū)域，檢測結(jié)果優(yōu)于參考文獻(xiàn)[7]提出的方法。實(shí)驗(yàn)結(jié)果表明，該算法能夠有效地對篡改偽造的圖像進(jìn)行檢測和定位，并且具有很好的魯棒性。

圖5 定位圖像篡改區(qū)域

[1]NEELAMANI R，QUEIROZ R L，F(xiàn)AN Z.JPEG compression history estimation for color images[J].IEEE Transaction on Image Processing，JUNE，2006，15(6)：1365-1378.

[2]POPESCU A C.Statistical tools for digital forensics[C].December 2004.Dartmouth Computer Science Tech.Rep.，2005：128-147.

[3]PEVNY T，F(xiàn)RIDRICH J.Detection of double-compression in JPEG Images for applications in steganography[J].IEEE Transactions on Information Forensics and Security，2008，3(2)：247-258.

[4]FU D D，SHI Y Q，SU W.A generalized benford’s law for JPEG coefficients and its applications in image forensics[Z].In：proc of SPIE Security，Steganography，and Watermarking of Multimedia Contents IX.B Ellingham，Washington：SPIE Press，2007.

[5]Chen Chunhua，SHI Y Q，Su Wei.A machine learning based scheme for double JPEG compression detection[C].Pattern Recognition，2008，The 19 international conferences on，2008：1-4.

[6]LIN S，CHANG M，CHEN Y.A passive-blind forgery detection scheme based on content-adaptive quantization table estimation[J].IEEE Trans Circuits Syst Video Technol，2011，21(4)：421-434.

[7]BIANCHI T，PIVA A.Image forgery localization via blockgrained analysis of JPEG artifacts[J].IEEE Transactions on Information Forensics and Security，June 2012，7(3)：1003-1017.

[8]Peng Yuanyuan，Liu Benyong.Accurate estimation of primary quantization table with applications to tampering detection[J].IET Electronics Letters，2013，49(23)：1452-1454.

[9]HUANG F，HUANG J，SHI Y Q.Detecting double JPEG compression with the same quantization matrix[J].IEEE Transactions on Information Forensics and Security，2010，5(4)：848-856.

[10]Li Haodong，Luo Weiqi，Huang Jiwu.Anti-forensics of double JPEG compression with the same quantization matrix[J].Multimedia Tools and Applications，2014(3)：1-16.