鐘碧瑩
(西南石油大學(xué) 四川省成都市 610000)
在新媒體時(shí)代,人們通過(guò)借助先進(jìn)的圖像編輯軟件和圖像修改工具,從而使得對(duì)數(shù)字圖像的控制變得非常的簡(jiǎn)單。如Adobe Photoshop[1],GIMP(GNU 圖像處理程序)[2]等。這些被控制的圖像可以用來(lái)欺騙公眾,甚至是誹謗一個(gè)人的人格,特別是會(huì)改變政治觀點(diǎn)或影響刑事調(diào)查。隨著圖像編輯工具的發(fā)展,圖像被篡改后不會(huì)留下任何可察覺(jué)的痕跡。針對(duì)于這種情況,圖像的真實(shí)性和完整性面臨著巨大的威脅和挑戰(zhàn)。圖像篡改檢測(cè)成為維護(hù)信息安全所亟待解決的關(guān)鍵問(wèn)題之一。例如,找到一種方法來(lái)發(fā)現(xiàn)和定位圖像的篡改部分[3]。
本課題重點(diǎn)研究了一種圖像拼接檢測(cè)技術(shù),通過(guò)比較不同源圖像的區(qū)域來(lái)發(fā)現(xiàn)偽造圖像。通常在圖像采集和傳輸過(guò)程中不可避免地會(huì)受到噪聲的干擾,這將會(huì)導(dǎo)致不同的采集設(shè)備獲得的圖像之間存在著噪聲差異。因此噪聲類型的不一致性可以作為檢測(cè)圖像拼接識(shí)別的依據(jù),目前已經(jīng)提出了多種用于噪聲水平估計(jì)的算法,從而達(dá)到檢測(cè)的結(jié)果。首先,圖像拼接識(shí)別方法僅適用于單一類型的篡改識(shí)別[4]。為了檢測(cè)這類篡改圖像,采用特征提取分類方法。其中用于圖像拼接識(shí)別的特征提取器很少,它們都是在預(yù)處理特征提取后進(jìn)行的。例如DCT(離散余弦變換)[5],SIFT(尺度不變特征變換)[6],SURF(加速魯棒特征)[7]等。我們的圖像拼接識(shí)別方法是基于大多數(shù)數(shù)字圖像的采集和傳輸,其都不可避免地受到各種噪聲的干擾。因此噪聲的不一致性可以作為檢測(cè)拼接區(qū)域內(nèi)噪聲方差差異顯著的圖像識(shí)別的依據(jù)。
在圖像拼接識(shí)別中,從圖像的不同區(qū)域估計(jì)噪聲方差是一個(gè)關(guān)鍵步驟。眾所周知,自然的峰度值在一般的帶通濾波域中對(duì)圖像是正的[8],并且也接近常數(shù)[9]。自然圖像的峰度在穿過(guò)不同的帶通濾波通道時(shí)是恒定的。建立目標(biāo)函數(shù),并利用圖像峰度和噪聲方差之間的關(guān)系來(lái)估計(jì)整個(gè)圖像的噪聲方差[10]。從定義的角度出發(fā),偏度與峰度的定義相似。因此,本文中我們考慮了偏度與噪聲方差之間的關(guān)系來(lái)估計(jì)整幅圖像的噪聲方差。
在本文中,我們利用峰度和偏度的理論相似性來(lái)解決這個(gè)問(wèn)題。算法[10]是一種基于峰度的方法,不需要知道峰度值就可以估計(jì)噪聲。類似的,本文利用偏度來(lái)建立與噪聲的關(guān)系。
峰度又稱為峰態(tài)系數(shù)。其可以表示為概率密度分布曲線在平均值處峰值高低的特征數(shù)。從直觀看來(lái),峰度反映了一個(gè)峰部的尖度。而且樣本的峰度是作為和正態(tài)分布相比較而言的統(tǒng)計(jì)量,如果峰度大于三,則峰的形狀就會(huì)比較尖,比正態(tài)分布峰要陡峭,反之亦然。在統(tǒng)計(jì)學(xué)當(dāng)中,峰度可以用來(lái)衡量實(shí)數(shù)隨機(jī)變量概率分布的峰態(tài)。峰度高就意味著方差增大是由低頻度的大于或小于平均值的極端差值引起的。在實(shí)際應(yīng)用中,我們通常將峰度值做減3 處理,使得正態(tài)分布的峰度0。
人們會(huì)期望在邊際系數(shù)分布的偏度中看到某種尺度不變性。自然場(chǎng)景的整體是尺度不變的。這意味著,在給定尺度上定義的任何量,其統(tǒng)計(jì)量對(duì)該尺度的任何變化都是不變的。具體來(lái)說(shuō),一個(gè)合理的假設(shè)是,斜度在整個(gè)尺度上應(yīng)該是恒定的。鑒于圖像是由所有距離的對(duì)象組成的事實(shí),因此這似乎是明智的,因此不應(yīng)突出任何特定的角度比例。這并不意味著任何特定的圖像都是分形的!相反,場(chǎng)景的整體具有不變的統(tǒng)計(jì)量。場(chǎng)景的整體具有不變的統(tǒng)計(jì)量,場(chǎng)景的整體是尺度不變的,在給定尺度上定義的任何量,其統(tǒng)計(jì)量對(duì)該尺度的任何變化都是不變的。
在本文中,我們假設(shè)干凈的自然圖像的邊緣分布的偏度在各個(gè)尺度上都應(yīng)該是恒定的,并且在制作的各個(gè)階段添加到圖像的噪聲會(huì)導(dǎo)致偏度值發(fā)生變化,這樣便會(huì)違反尺度不變性原則。然而,情況并非總是如此。隨著噪聲標(biāo)準(zhǔn)偏差上升,偏度值下降,對(duì)于更高的頻率更是如此。
廣義高斯分布的峰態(tài)是直接依賴于其形狀參數(shù)α,廣義高斯分布假設(shè)x 是x~GG(μ,σ2,α),μ 是均值,σ2方差和α 是形狀參數(shù),x的峰度是一般的高斯分布,我們定義它的峰度為:其四階中心矩和方差分別為和特別地,根據(jù)這個(gè)定義,高斯變量的峰度為零。在最近的研究成果當(dāng)中,我們觀察到,對(duì)于自然圖像,不同帶通濾波器通道的峰度值趨向于一個(gè)常數(shù),我們將這種現(xiàn)象稱為峰度濃度[10]。同樣的,對(duì)于一個(gè)隨機(jī)變量x,我們將其偏度定義為:其中是x 的三階中心矩,σ2是x 的方差。
在偏度的定義中,任何對(duì)稱分布的偏度都為零。當(dāng)偏度向左偏時(shí),它是負(fù)偏度,而向右偏的分布是正偏度。如圖1 所示。
圖1
當(dāng)樣本增加時(shí),偏度均值趨于正態(tài)分布。中位數(shù)受分布偏態(tài)的影響不強(qiáng),單峰分布具有較強(qiáng)的偏態(tài)形態(tài),中位數(shù)常被用來(lái)反映偏態(tài)分布的集中趨勢(shì)。
如圖2 所示,頻率分布分為正態(tài)分布和偏態(tài)分布。正態(tài)分布是指大部分頻率集中在中心,兩端的頻率分布大致對(duì)稱。偏態(tài)分布是指頻率分布不對(duì)稱,集中位置偏于一側(cè),如果集中位置偏于值較小的一側(cè),則稱為正偏態(tài)分布;集中位置偏向值較大的一側(cè),稱為負(fù)偏態(tài)分布。偏態(tài)分布只有在滿足一定條件(如樣本數(shù)量足夠大等)的情況下才能被視為近似正態(tài)分布。
圖2
偏度可以反映分布的對(duì)稱性。根據(jù)偏度的定義,樣本的偏度為樣本的三階標(biāo)準(zhǔn)矩。同樣,偏度可以用三階原點(diǎn)矩表示:
偏態(tài)分布的集中趨勢(shì)主要由中位數(shù)來(lái)表示。當(dāng)單峰分布具有較強(qiáng)的偏態(tài)形狀時(shí),中位數(shù)受分布的偏態(tài)影響較小,因此它在描述分布的集中趨勢(shì)方面具有優(yōu)勢(shì)。實(shí)際上,當(dāng)你找到分布的中值時(shí),你可以在分布的任意一邊取一個(gè)分?jǐn)?shù)然后把它移離中值。只要分?jǐn)?shù)還在中間值的一邊,你就可以把它移動(dòng)到任何你想要的遠(yuǎn)的位置,中間值也不會(huì)改變它原來(lái)的位置。但均值就不是這樣了,它受分布中的任何分?jǐn)?shù)的影響。
我們首先對(duì)因?yàn)樘砑恿烁咚乖肼暥鸬膹V義高斯分布隨機(jī)變量的偏度變化進(jìn)行建模。將其用來(lái)表示一個(gè)廣義高斯隨機(jī)變量,使得并表示獨(dú)立的高斯隨機(jī)變量,均值和方差為零。設(shè)一個(gè)隨機(jī)變量,使得:
y=x+η。
我們希望能夠計(jì)算出y 的偏度Sy。將上述公式代入到圖像當(dāng)中,可知x 代表沒(méi)有噪聲的圖像中局部系數(shù)的原始分布,η 表示為添加任何噪聲,從而形成一個(gè)噪聲圖像y。這樣代入到圖像當(dāng)中,我們的x 可以代表噪聲污染圖像的原始分布。
在本文中,我們將偏度稱為方差平方歸一化的三個(gè)中心矩,可以得到如下公式:
這與多余的偏度不同,后者也包括使高斯分布的偏度為零的-3項(xiàng)。由于噪聲的獨(dú)立性,y 的方差簡(jiǎn)單為與的和,可以得到如下等式:
將其與峰度對(duì)比可知,峰度可以直接求出四階中心矩的表達(dá)式,但是偏度是間接求解。不能直接從三階矩出發(fā)。
盡管以上模型假定高斯白噪聲,但僅假定它在濾波器域中是高斯白噪聲。由于像素域中的許多類型的獨(dú)立噪聲將在頻域中混入高斯噪聲,因此該方法可與其他類型的噪聲一起使用。在計(jì)算基于DCT 的響應(yīng)圖像時(shí),以像素為單位的噪聲總和導(dǎo)致由于中心極限定理和噪聲獨(dú)立性而使總和的分布呈高斯分布。
定義y=x+n 表示為源圖像x 添加了噪聲的結(jié)果圖像,則y=x+n是帶有高斯白噪聲的自然圖像,n 為高斯白噪聲噪聲且其均值為零,方差為未知的σ2。其中我們的目標(biāo)是利用一些關(guān)于x 的一般統(tǒng)計(jì)知識(shí)單獨(dú)從被噪聲污染的圖像y 中估計(jì)σ2。
我們想指出的是,高斯假設(shè)并不像看起來(lái)那樣嚴(yán)格,特別是當(dāng)圖像從像素域轉(zhuǎn)換為帶通濾波域時(shí),例如離散余弦變換(DCT)和小波。這是因?yàn)橄袼赜蛑械姆歉咚躬?dú)立噪聲在經(jīng)過(guò)帶通濾波器線性混合后接近高斯,這是中心極限定理的直接結(jié)果。
對(duì)于通道的帶通濾波域,我們分別表示信道kth中原始圖像和噪聲圖像的偏度為S(x)和S(y)。我們使用的噪聲圖像y 的信道kth可以表示出方差σ2(y)。等式如下:
如果我們考慮自然圖像在帶通濾波域的統(tǒng)計(jì)規(guī)律——它們往往具有超高斯邊緣分布[8],或者等效地可以考慮正偏度值(S(x)>0)。也是正的,因?yàn)樗菬o(wú)噪聲圖像在信道中的方差。因此,我們可以在等式(1)兩邊開平方根得到:
現(xiàn)在我們利用自然圖像在帶通濾波區(qū)域的偏度分布行為(第3節(jié))。這表明無(wú)噪聲自然圖像x 在帶通濾波通道K 的偏度可以近似為一個(gè)常數(shù),或S(y)≈S(x)(S=1,...,K)。然后我們形成一個(gè)目標(biāo)函數(shù),使等式(2)兩邊的差值最小,結(jié)果如下:
考慮到這些方差和峰度度量,我們希望估計(jì)附加噪聲的方差。其最優(yōu)解提供了噪聲方差的估計(jì)。
本文提出了一種基于偏度擬合的噪聲水平估計(jì)的方法。通過(guò)對(duì)比推導(dǎo)得到了噪聲與偏度之間的關(guān)系式,擬合得到其最優(yōu)解為所需噪聲,其最小值即為所求噪聲。為后續(xù)圖像拼接檢測(cè)定下了基礎(chǔ)。