萬榮澤,莫洪武,余思東
(廣西農(nóng)業(yè)職業(yè)技術(shù)學(xué)院 現(xiàn)代教育技術(shù)與網(wǎng)絡(luò)信息中心,廣西 南寧 530007)
JPEG壓縮技術(shù)十分先進(jìn),應(yīng)用也非常廣泛。現(xiàn)實(shí)中照相機(jī)拍攝的圖像、網(wǎng)絡(luò)中傳播的圖像等大部分都是JPEG格式。因此檢測JPEG圖像是否經(jīng)過photoshop、光影魔術(shù)手等軟件的編輯具有十分重要的意義。并且JPEG是一種很靈活的格式,具有調(diào)節(jié)圖像質(zhì)量的功能,允許用不同的壓縮比例對文件進(jìn)行壓縮,支持多種壓縮級(jí)別,壓縮比越大,品質(zhì)就越低;壓縮比越小,品質(zhì)就越高。因此,檢測雙重JPEG壓縮圖像是否經(jīng)過篡改操作具有非常重要的應(yīng)用價(jià)值?;陔p重JPEG壓縮特性的篡改取證技術(shù)是近年來數(shù)字圖像盲取證技術(shù)的研究熱點(diǎn)問題,研究者提出了許多盲取證的方法。利用塊效應(yīng)來檢測 BMP圖像的壓縮歷史被 FAN Z等人[1]提出;同時(shí)以Farid為核心的研究團(tuán)隊(duì)[2]則利用JPEG圖像經(jīng)過壓縮后其DCT系數(shù)直方圖的DFT域有周期效應(yīng)來檢測圖像壓縮歷史,取得顯著效果;Fridrich團(tuán)隊(duì)[3]也對其進(jìn)行了深入研究;然而SHI Y Q等人提出了一種新的思路進(jìn)行BMP圖像壓縮歷史和JPEG圖像重壓縮檢測[4-5];現(xiàn)在已有很多更優(yōu)的方法[6-7]能夠準(zhǔn)確估計(jì)雙重JPEG壓縮圖像第一次壓縮量化步長的低頻部分,但是不能準(zhǔn)確估計(jì)量化步長的高頻區(qū)域;Peng Yuanyuan等[8]提出了一種新的方法來估計(jì)圖像首次壓縮量化表并具有很好的效果,但是不能準(zhǔn)確定位圖像篡改區(qū)域。
本文利用一種簡單的方法能夠非常準(zhǔn)確估計(jì)出量化表,并定位篡改區(qū)域。首先對數(shù)字圖像進(jìn)行壓縮消除圖像本身的噪聲,然后利用圖像壓縮模型估計(jì)首次壓縮量化表,最后提出一種高效率的方法通過利用量化表來定位圖像篡改區(qū)域。實(shí)驗(yàn)結(jié)果表明,該算法能夠有效地對雙重JPEG壓縮的圖像進(jìn)行檢測和定位,并具有很好的魯棒性。
數(shù)字圖像經(jīng)過處理后變成JPEG圖像的過程中產(chǎn)生大量噪聲[9-10]。HUANG F等利用JPEG圖像壓縮過程中產(chǎn)生的噪聲來檢測圖像是否經(jīng)過二次JPEG壓縮[9]。LI H等利用JPEG圖像壓縮過程中產(chǎn)生的噪聲來檢測圖像是否反取證[10]。采用HUANG F的方法對圖像進(jìn)行多次壓縮,消除噪聲對圖像質(zhì)量的影響。對Lena圖像分別以質(zhì)量因子為 70、80、90進(jìn)行壓縮,然后從圖像文件頭中得到壓縮質(zhì)量因子,對其進(jìn)行JPEG壓縮,得到圖1所示結(jié)果。
圖1 壓縮次數(shù)對噪聲的影響
從實(shí)驗(yàn)中發(fā)現(xiàn),質(zhì)量因子越大,經(jīng)過壓縮之后,消除的噪聲也大。重復(fù)壓縮10次后,噪聲基本上完全消除。
對處理后的圖像建立圖像壓縮模型并利用它們之間的關(guān)系來估計(jì)第一次壓縮量化表,在已準(zhǔn)確估計(jì)出量化表的基礎(chǔ)上提出了一種簡單的方法來定位篡改區(qū)域,令u1為未量化的數(shù)字圖像的DCT系數(shù),u2為第二次量化后的DCT系數(shù),圖像壓縮模型[8]描述如下:
其中,q1和q2分別為圖像第一次壓縮量化步長和圖像第二次壓縮量化步長,Qq1q2用來描述u1與 u2之間的關(guān)系,因此可以得到:
式(2)可轉(zhuǎn)化為:
式(3)可以簡化為:
其中,e、A、B 分別代表 q2/q1、u2-0.5 和 u2+0.5。 顯而易見,B與 A的差為 1。因?yàn)閇u1/q1]是一個(gè)整數(shù),當(dāng)e<1時(shí),得到如下結(jié)果:
利用上述原理和圖像壓縮規(guī)律,可以從JPEG圖像的頭文件中得到第二次壓縮的量化表。假設(shè)q1是1~100之間的整數(shù),q1′是估計(jì)的量化步長,當(dāng) q1′=q1時(shí),u的值全部為0。定義一個(gè)測量概率函數(shù)如下:
其中,num是量化步長在q1的情況下統(tǒng)計(jì)元素變量的數(shù)量,當(dāng) q1′=q1時(shí),p達(dá)到最大值。但是對于一幅自然圖像,量化表高頻區(qū)域中大量的DCT系數(shù)量化為0,于是有很多點(diǎn)導(dǎo)致p最大,并且把它們當(dāng)作候選點(diǎn),僅把這些大于q2的候選點(diǎn)的中值當(dāng)作q1′。實(shí)驗(yàn)結(jié)果如圖2所示。
圖2 概率矩形圖
圖 2(a)和(b)的實(shí)驗(yàn)素材是 Lena圖像,第一次壓縮質(zhì)量因子為80,第二次壓縮質(zhì)量因子為90。圖2(a)是p(q1)函數(shù),量化步長q1=5和q2=3在量化表的低頻區(qū)域,圖2(b)是p(q1)函數(shù),量化步長 q1=27和 q2=14在量化表的高頻區(qū)域。然后第二次壓縮的量化表可以從圖像頭文件中得到,從而可以準(zhǔn)確估計(jì)出第一次壓縮的量步長。
利用上述原理得到量化表的部分量化步長,尤其是低頻區(qū)域的量化步長,然后利用下式:其中Qij為量化表第i行j列的量化步長,Q(k)為質(zhì)量因子為k的量化表。利用式(8)得到第一次壓縮的量化表。為了說明算法的有效性,對一幅大小為512×512的Lena圖像,首次壓縮質(zhì)量因子80,第二次壓縮質(zhì)量因子90,其中m和n的取值為4,估計(jì)的量化表實(shí)驗(yàn)結(jié)果如圖3所示。
圖3 量化表對比效果圖
圖3(a)是質(zhì)量因子為80的量化表,圖3(b)是BIANCHI T提出的方法[7]估計(jì)的量化表,圖3(c)是本文提出的方法估計(jì)的量化表。通過對比發(fā)現(xiàn),BIANCHI T對低頻區(qū)域的量化表估計(jì)很準(zhǔn)確,卻不能準(zhǔn)確估計(jì)高頻區(qū)域的量化表。本文提出的方法能夠準(zhǔn)確估計(jì)高頻區(qū)域量化表。圖3中可明顯看出,本文提出的方法估計(jì)量化表的誤差小于參考文獻(xiàn)[7]中的方法,尤其在高頻區(qū)域相對誤差更小。
本文利用eA和eB的關(guān)系來定位圖像篡改區(qū)域。Peng Yuanyuan等[8]利用塊效應(yīng)定位篡改區(qū)域,即對篡改圖像以首次壓縮量化表再進(jìn)行壓縮,此操作使得篡改圖像有信息丟失,不能準(zhǔn)確定位篡改區(qū)域。利用eA與eB的關(guān)系來定位圖像篡改區(qū)域,篡改圖像沒有信息丟失,因此能夠準(zhǔn)確定位圖像篡改區(qū)域。得到u后對其進(jìn)行分類:
M1:未經(jīng)過篡改的u矩陣差異度
M2:經(jīng)過篡改的u矩陣差異度
利用EM方法[7]得到其期望和方差如下:
得到特征矩陣AL如下:
將AL矩陣通過3×3中值濾波,將濾波后的結(jié)果進(jìn)行二值化處理,從而得到模糊篡改區(qū)域。
本文對提出的算法進(jìn)行了驗(yàn)證,若待測圖像為彩色圖像,則將彩色圖像轉(zhuǎn)換為灰度圖像進(jìn)行檢測。對一幅彩色圖像利用Photoshop軟件對圖像中的部分?jǐn)?shù)據(jù)進(jìn)行篡改,然后應(yīng)用所研究的算法對篡改圖像進(jìn)行檢測,實(shí)驗(yàn)結(jié)果如圖4、圖5所示。
為了說明算法的有效性,對另一幅圖像進(jìn)行篡改操作,利用提出的算法對其進(jìn)行檢測,實(shí)驗(yàn)效果如圖5所示。
從圖4、5中可以看出,本文提出的方法對篡改圖像具有很好的效果,并且能夠準(zhǔn)確定位篡改區(qū)域。圖4、5中,(a)為原始圖像,(b)為篡改圖像,(c)是參考文獻(xiàn)[7]檢測結(jié)果,(d)是提出方法檢測的結(jié)果。由實(shí)驗(yàn)結(jié)果可以發(fā)現(xiàn),參考文獻(xiàn)[7]中的算法可以比較準(zhǔn)確地檢測出篡改圖像中的篡改偽造區(qū)域,但其檢測結(jié)果存在一些漏檢區(qū)域與虛警區(qū)域。而本文算法可以對篡改圖像中的篡改偽造區(qū)域準(zhǔn)確定位,同時(shí)檢測精度要明顯好于參考文獻(xiàn)[7]中所提算法,并且能夠很好地定位圖像篡改區(qū)域。
針對雙重JPEG壓縮篡改操作,本文提出一種高效率的方法定位圖像篡改區(qū)域。首先對圖像進(jìn)行壓縮消除圖像自身的噪聲影響,然后利用圖像壓縮模型估計(jì)圖像首次壓縮量化表,估計(jì)的量化表比參考文獻(xiàn)[7]估計(jì)的量化表誤差更小。最后提出一種高效率的方法定位圖像篡改偽造區(qū)域,檢測結(jié)果優(yōu)于參考文獻(xiàn)[7]提出的方法。實(shí)驗(yàn)結(jié)果表明,該算法能夠有效地對篡改偽造的圖像進(jìn)行檢測和定位,并且具有很好的魯棒性。
圖5 定位圖像篡改區(qū)域
[1]NEELAMANI R,QUEIROZ R L,F(xiàn)AN Z.JPEG compression history estimation for color images[J].IEEE Transaction on Image Processing,JUNE,2006,15(6):1365-1378.
[2]POPESCU A C.Statistical tools for digital forensics[C].December 2004.Dartmouth Computer Science Tech.Rep.,2005:128-147.
[3]PEVNY T,F(xiàn)RIDRICH J.Detection of double-compression in JPEG Images for applications in steganography[J].IEEE Transactions on Information Forensics and Security,2008,3(2):247-258.
[4]FU D D,SHI Y Q,SU W.A generalized benford’s law for JPEG coefficients and its applications in image forensics[Z].In:proc of SPIE Security,Steganography,and Watermarking of Multimedia Contents IX.B Ellingham,Washington:SPIE Press,2007.
[5]Chen Chunhua,SHI Y Q,Su Wei.A machine learning based scheme for double JPEG compression detection[C].Pattern Recognition,2008,The 19 international conferences on,2008:1-4.
[6]LIN S,CHANG M,CHEN Y.A passive-blind forgery detection scheme based on content-adaptive quantization table estimation[J].IEEE Trans Circuits Syst Video Technol,2011,21(4):421-434.
[7]BIANCHI T,PIVA A.Image forgery localization via blockgrained analysis of JPEG artifacts[J].IEEE Transactions on Information Forensics and Security,June 2012,7(3):1003-1017.
[8]Peng Yuanyuan,Liu Benyong.Accurate estimation of primary quantization table with applications to tampering detection[J].IET Electronics Letters,2013,49(23):1452-1454.
[9]HUANG F,HUANG J,SHI Y Q.Detecting double JPEG compression with the same quantization matrix[J].IEEE Transactions on Information Forensics and Security,2010,5(4):848-856.
[10]Li Haodong,Luo Weiqi,Huang Jiwu.Anti-forensics of double JPEG compression with the same quantization matrix[J].Multimedia Tools and Applications,2014(3):1-16.