如先姑力·阿布都熱西提, 亞森·艾則孜*, 米日古麗·艾則孜
(1. 新疆警察學(xué)院 信息安全工程系, 烏魯木齊 830013;2. 新疆烏魯木齊市第三十四中學(xué), 烏魯木齊 830000)
對(duì)圖像取證來(lái)驗(yàn)證圖像的真實(shí)性和完整性具有重要意義。復(fù)制-移動(dòng)(Copy-Move)是一種常見(jiàn)的創(chuàng)建偽造圖像的方法[1]。在實(shí)際應(yīng)用過(guò)程中,復(fù)制區(qū)域在進(jìn)行粘貼前可以先進(jìn)行轉(zhuǎn)換,檢測(cè)這種圖像篡改的關(guān)鍵在于從局部圖像區(qū)域塊中提取具有不變性的特征[3]。其中應(yīng)用最多的就是利用尺度不變特征變換(Scale Invariant Feature Transform, SIFT)[3]來(lái)提取特征向量。
目前,學(xué)者也提出了一些基于其他特征來(lái)檢測(cè)復(fù)制-移動(dòng)攻擊。例如,文獻(xiàn)[4]提出了一種基于局部二值模式(Local Binary Patter,LBP),通過(guò)灰度圖像紋理的空間結(jié)構(gòu)來(lái)提取圖像特征的新方法。文獻(xiàn)[5]在彩色圖像的情況下,首先使用I=0.299R+0.587G+0.114B將其轉(zhuǎn)換成灰度圖像,并應(yīng)用低通濾波器來(lái)獲得更多的比高頻特征穩(wěn)定的低頻特征。與之前的方法一樣,其特征匹配是基于閾值來(lái)定義的。而且,在檢測(cè)過(guò)程中還考慮了特殊設(shè)計(jì)的濾波器和形態(tài)運(yùn)算處理。該方法對(duì)JPEG壓縮,噪聲污染,模糊,旋轉(zhuǎn)和翻轉(zhuǎn)具有魯棒性。文獻(xiàn)[6]提出了一種基于無(wú)抽取離散小波變換(UDWT)和Zernike矩的新方法來(lái)進(jìn)行復(fù)制-移動(dòng)圖像的偽造檢測(cè)。首先采用UDWT方法來(lái)采集低頻(LL)組件。然后利用Zernike矩以產(chǎn)生LL上重疊塊的特征向量,并從這些向量中找到復(fù)制的區(qū)域。然后利用詞典排序?qū)ふ蚁嗨频氖噶?,并利用自帶閾值的相關(guān)系數(shù)確定偽造塊。文獻(xiàn)[7]利用了模糊不變量來(lái)產(chǎn)生復(fù)制-移動(dòng)圖像偽造檢測(cè)中的特征向量。將圖像DWT的LL子帶劃分成小的重疊塊,每個(gè)塊特征向量由灰度圖像的24個(gè)模糊不變量和RGB中的72個(gè)模糊不變量組成,并且通過(guò)應(yīng)用PCA來(lái)減小尺寸。通過(guò)考慮歐式距離和用戶(hù)定義的閾值進(jìn)行塊相似性分析,以此來(lái)檢測(cè)重復(fù)的區(qū)域。
通過(guò)對(duì)現(xiàn)有文獻(xiàn)的分析,復(fù)制-移動(dòng)攻擊檢測(cè)的關(guān)鍵點(diǎn)在于特征向量的提取。為此,本文提出了一種新的特征向量提取方法,稱(chēng)為基于灰度差分統(tǒng)計(jì)法(Gray-level Difference Statistics,GDS)的特征提取。即根據(jù)灰度圖像的灰度差分矩陣性質(zhì),通過(guò)統(tǒng)計(jì)法獲得5個(gè)特征,以此來(lái)表示一個(gè)圖像塊。另外,為了更好地對(duì)圖像塊進(jìn)行偽造分類(lèi),采用了多層感知機(jī)(Multi-layer Perceptron, MLP)神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器。實(shí)驗(yàn)結(jié)果表明,提出的方法能夠有效檢測(cè)出復(fù)制-移動(dòng)攻擊,具有有效性和可行性。
灰度差分統(tǒng)計(jì)法(GDS)[8]是一種特征提取方法,其考慮了紋理元素特征。從灰度差的分布(Distribution of Gray Difference,DGD)來(lái)看,GDS計(jì)算了五個(gè)特征向量,包括最大差分分析,銳度,DGD二次矩,平均灰度差(DOD)分布的二次矩,最長(zhǎng)距離分析。
對(duì)于二維圖像平面域D中的矩形灰度圖像F,F(xiàn)和D之間的關(guān)系可以定義如式(1)(2)。
D={(x,y):x,y∈I,x∈[0,Nx],y∈[0,Ny]}
(1)
F={((x,y),k):(x,y)∈D,k∈I,k∈[0,ng),k=f(x,y)}
(2)
式中,Nx和Ny為F的水平和垂直維度;ng為F中的灰度級(jí)數(shù),I為整數(shù)集。
(3)
(4)
差分矩陣被定義為一個(gè)r和給定方向θ的灰度差的函數(shù),表示為GDS(r,dif):(以下GDS和dif的正斜體格式照此改,我不一一做了)如式(5)。
(5)
式中,式(5)中dθ(r)是兩個(gè)像素點(diǎn)之間距離的坐標(biāo)表示,分母N是等于配對(duì)像素總數(shù)的歸一化因子,表示為式(6)。
(6)
對(duì)于圖像的差分矩陣,分別定義了3個(gè)向量,包括灰度差分布(DGD),每行GDS的平均差分布(DOD)和平均距離分布(DAD),表示如式(7)~式(9)。
(r,j)
(7)
(8)
(9)
式中,c是r的最大距離。圖像的差分矩陣如圖1所示。
圖1 灰度差分矩陣
基于DGD,DOD和DAD 3個(gè)向量,LDE,SHP,DGD的第二個(gè)瞬間(Second Moment of DGD,SMG),DOD的第二個(gè)瞬間(Second Moment of DOD,SMO)和長(zhǎng)距離分析(Long Distance Emphasis,LDEL)五個(gè)特征也被定義為式(10)~式(14)。
.ln(K/j)
(10)
其中K是常數(shù)。
·j3
(11)
(12)
(13)
(14)
這5個(gè)參數(shù)被認(rèn)為是圖像的五個(gè)特征,并用于圖像特征提取中。
在傳統(tǒng)利用SIFT方法提取特征中,首先需要找出在不同方向觀察物體時(shí)都不會(huì)受影響的位置和尺度[9]。假設(shè)潛在尺度空間核是高斯函數(shù),為此一個(gè)圖像空間可以描述為一個(gè)函數(shù)。通過(guò)一個(gè)連續(xù)尺度函數(shù)來(lái)尋找穩(wěn)定的特征點(diǎn),即將一個(gè)尺度可變的高斯函數(shù)Gx,y,σ與二維圖像Ix,y進(jìn)行卷積,表達(dá)式如[10]式(15)。
Lx,y,σ=Gx,y,σ*Ix,y
(15)
式中,x,y表示空間坐標(biāo),σ為高斯標(biāo)準(zhǔn)差,用來(lái)表示尺度大小,*表示x和y上的卷積操作,Gx,y,σ為高斯函數(shù)[11]為式(16)。
(16)
為了正確感知在尺度空間中檢測(cè)穩(wěn)定關(guān)鍵點(diǎn)的位置,借助于高斯函數(shù)微分中的尺度空間峰值Dx,y,σ,兩個(gè)鄰近尺度中的不相似性通過(guò)穩(wěn)定性k來(lái)表示。在任何情況下,都需要對(duì)尺度空間特征描述進(jìn)行計(jì)算,因此D可以通過(guò)簡(jiǎn)單的圖像相減來(lái)計(jì)算,表示如式(17)。
Dx,y,σ=Gx,y,kσ-Gx,y,σ*Ix,y
=Lx,y,kσ-Lx,y,σ
(17)
式中,L表示圖像的平滑操作。
(18)
(19)
高斯函數(shù)的差分具有不同的尺度,因?yàn)楝F(xiàn)在σ2尺度進(jìn)行了歸一化,以用于拉普拉斯算子。由于(k-1)恒定,所以不會(huì)影響最大峰值。當(dāng)k接近于1時(shí),這意味著在實(shí)際情況下近似誤差趨近于零。
本文根據(jù)所提取的特征,利用MLP神經(jīng)網(wǎng)絡(luò)對(duì)圖像像素點(diǎn)進(jìn)行偽造分類(lèi)。MLP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程是基于反向傳播(BP)和LM訓(xùn)練算法來(lái)實(shí)現(xiàn)[12],不斷調(diào)整權(quán)值等參數(shù),使模型達(dá)到最優(yōu)。其訓(xùn)練過(guò)程如圖2a所示。
(a) MLP神經(jīng)網(wǎng)絡(luò)建模過(guò)程
(b) MLP神經(jīng)網(wǎng)絡(luò)架構(gòu)
MLP神經(jīng)網(wǎng)絡(luò)為三層結(jié)構(gòu),分別為輸入層、隱藏層和輸出層。各層之間的神經(jīng)元通過(guò)鏈路連接,每條鏈路具有自己的權(quán)重參數(shù)。權(quán)重參數(shù)用于表示輸入與輸出的映射關(guān)系。圖2b舉例描述了一個(gè)MLP神經(jīng)網(wǎng)絡(luò)的架構(gòu),其中輸入層有兩個(gè)神經(jīng)元(X和Y軸),隱藏層包括“j”個(gè)神經(jīng)元,輸出層有一個(gè)神經(jīng)元(Z軸偏差)。
各層中第j個(gè)神經(jīng)元激活函數(shù)“net”為式(20)。
*Xi+θj}
(20)
式中,“W”表示神經(jīng)元之間鏈接的權(quán)重,“X” 表示輸入向量,“n”表示輸入數(shù)據(jù)維數(shù),即神經(jīng)元輸入數(shù)量。
設(shè)定網(wǎng)絡(luò)中的傳遞函數(shù)為單極性sigmoid函數(shù),則神經(jīng)元的輸出為式(21)。
(21)
上式中,λ為比例縮放因子。
LM訓(xùn)練算法中,以最小化層中第j個(gè)神經(jīng)元的誤差平方和(SSE)為目標(biāo)進(jìn)行迭代優(yōu)化,目標(biāo)函數(shù)為[13]式(22)。
(22)
因此,對(duì)于所有數(shù)據(jù)類(lèi)別模式都訓(xùn)練net,并計(jì)算均方誤差(MSE)為式(23)。
(23)
當(dāng)MSE達(dá)到預(yù)定最小值或迭代次數(shù)達(dá)到限定值時(shí),訓(xùn)練過(guò)程結(jié)束。
在迭代訓(xùn)練中,通過(guò)下式來(lái)更新第j個(gè)神經(jīng)元的鏈路權(quán)重為式(24)。
(24)
式中,p為訓(xùn)練迭代次數(shù),α為學(xué)習(xí)率,mu為動(dòng)量常量。
輸出層和隱藏層的誤差傳播項(xiàng)δj,(p)分別由下式確定為式(25)、(26)。
(25)
(26)
這里采用LM算法進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練,基于高斯-牛頓法和梯度下降算法,最小化非線性目標(biāo)函數(shù)尋優(yōu)問(wèn)題的最優(yōu)解。
本文采集了80張圖像構(gòu)建一個(gè)數(shù)據(jù)集,其中40張圖像包含復(fù)制-移動(dòng)偽造,另外40張圖像是原始的。所提出的算法在Matlab2013中實(shí)現(xiàn),運(yùn)行平臺(tái)為配備處理器Intel(R)Core i5-2400 CPU@3.10GHz,內(nèi)存 8GB的PC機(jī)。
定義的3個(gè)性能參數(shù),稱(chēng)為準(zhǔn)確率(Precision),召回率(Recall)和F1度量。精確度用來(lái)度量精確檢測(cè)偽造圖像的可能性,召回率用來(lái)度量偽造圖像被成功檢測(cè)的可能性。F1度量綜合考慮了準(zhǔn)確率和召回率如式(27)-式(29)。
(27)
(28)
(29)
式中,TP、FP和FN分別表示正確檢測(cè)偽造像素、錯(cuò)誤檢測(cè)偽造像素和遺漏偽造像素的數(shù)量。
在本文中,由于基于灰度差分統(tǒng)計(jì)法提取的特征維度為5,所以MLP神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元數(shù)量為5。輸出層輸出為是否偽造,所以神經(jīng)元數(shù)量為1。為了確定隱藏層神經(jīng)元的最佳數(shù)量,進(jìn)行了一些實(shí)驗(yàn)。
隱藏層中不同神經(jīng)元數(shù)量下的準(zhǔn)確率,如表1所示。
表1 不同神經(jīng)元數(shù)量下的檢測(cè)性能
召回率和F1度量。可以看出,在一定范圍內(nèi),檢測(cè)性能隨著神經(jīng)元數(shù)量的增加而增加。當(dāng)達(dá)到一定數(shù)量后,性能基本穩(wěn)定。結(jié)合實(shí)驗(yàn)結(jié)果,在綜合考慮檢測(cè)性能和算法運(yùn)行時(shí)間下,本文選擇隱藏層神經(jīng)元數(shù)量為20。
首先,在一些包含復(fù)制-移動(dòng)偽造的案例圖像中,執(zhí)行本文提出的GDS+MLP檢測(cè)方法以驗(yàn)證其有效性,檢測(cè)結(jié)果如圖3所示。
(a)偽造圖像(b)檢測(cè)結(jié)果
圖3 復(fù)制-移動(dòng)偽造圖像的檢測(cè)案例
其中圖3a為偽造后的圖像,圖3b為檢測(cè)出的復(fù)制-移動(dòng)區(qū)域??梢钥闯觯缘谝环鶊D為例,其中的3顆松樹(shù)為復(fù)制偽造區(qū)域,且本文方法成功的進(jìn)行了檢測(cè),證明其具有有效性。
將本文提出的基于灰度差分統(tǒng)計(jì)法(GDS)的特征提取與基于SIFT的特征提取方法進(jìn)行比較。同時(shí),為了比較本文采用的MLP神經(jīng)網(wǎng)絡(luò)分類(lèi)器的性能,將其與常見(jiàn)的SVM分類(lèi)器進(jìn)行比較。即構(gòu)建4種圖像偽造檢測(cè)方法:GDS+MLP; GDS+SVM;SIFT+MLP;SIFT+ SVM。檢測(cè)性能結(jié)果如表2所示。
表2 各種方法之間的比較
可以看出,本文提出的GDS+MLP檢測(cè)方法獲得了最佳的檢測(cè)性能。另外,還可以看出,提出的GDS特征提取方法優(yōu)于SIFT特征提取。采用的MLP分類(lèi)器優(yōu)于SVM分類(lèi)器。
本文提出了一種用于數(shù)字圖像復(fù)制-移動(dòng)偽造檢測(cè)的特征提取方法。即利用圖像的灰度差分矩陣表示,通過(guò)灰度差分統(tǒng)計(jì)法(GDS)來(lái)統(tǒng)計(jì)灰度差分布、距離分布等信息,獲得圖像塊的5個(gè)特征構(gòu)成特征向量。同時(shí),利用MLP神經(jīng)網(wǎng)絡(luò)作為分類(lèi)器進(jìn)行分類(lèi),以此來(lái)檢測(cè)該圖像塊是否為偽造區(qū)域。通過(guò)實(shí)驗(yàn)比較了提出的GDS特征與傳統(tǒng)SIFT特征,結(jié)果表明,提出方法的性能更加優(yōu)越,非常適合復(fù)制-移動(dòng)偽造的檢測(cè)。