郭繼昌,劉曉娟,田煜衡
(天津大學(xué)電子信息工程學(xué)院,天津 300072)
?
基于預(yù)分類(lèi)和特征擴(kuò)展的JPEG圖像隱寫(xiě)分析
郭繼昌,劉曉娟,田煜衡
(天津大學(xué)電子信息工程學(xué)院,天津 300072)
聯(lián)合圖像專(zhuān)家組(joint photographic experts group,JPEG)圖像的隱寫(xiě)分析性能不僅與信息嵌入方式有關(guān),同時(shí)與其自身的內(nèi)容復(fù)雜度也緊密相關(guān)。本文提出一種基于預(yù)分類(lèi)和特征擴(kuò)展的新方法以提高JPEG圖像通用隱寫(xiě)分析準(zhǔn)確性。首先采用圖像內(nèi)容復(fù)雜度度量準(zhǔn)則將訓(xùn)練樣本劃分為若干互相重疊的類(lèi)別,并對(duì)每一類(lèi)子庫(kù)分別提取更加有效的擴(kuò)展特征集以及構(gòu)造各自的分類(lèi)器模型;對(duì)于給定的待測(cè)圖像,根據(jù)其內(nèi)容復(fù)雜度與各類(lèi)復(fù)雜度均值的最小距離進(jìn)行預(yù)分類(lèi),提取特征并進(jìn)行相應(yīng)類(lèi)別的分類(lèi)器測(cè)試。實(shí)驗(yàn)結(jié)果表明,該方法對(duì)典型的JPEG圖像隱寫(xiě)算法具有更好的檢測(cè)性能。
隱寫(xiě)分析; 圖像內(nèi)容復(fù)雜度; 預(yù)分類(lèi); 特征擴(kuò)展
隱寫(xiě)分析的目的在于檢測(cè)多媒體數(shù)據(jù)中隱藏信息的存在性[1]。聯(lián)合圖像專(zhuān)家組(joint photographic experts group,JPEG)圖像由于壓縮比高、質(zhì)量好且獲取方便,成為隱寫(xiě)術(shù)的主要載體之一,相應(yīng)的隱寫(xiě)分析也成為研究熱點(diǎn)。
作為隱寫(xiě)分析技術(shù)的主流,通用隱寫(xiě)分析主要采用“特征提取-分類(lèi)器訓(xùn)練-決策”的模式,通過(guò)構(gòu)建敏感特征提高檢測(cè)準(zhǔn)確率[2]。針對(duì)JPEG圖像,文獻(xiàn)[3]利用移位剪切重壓縮的校準(zhǔn)方法提取離散余弦變換(discrete cosine transform,DCT)系數(shù)特征,對(duì)部分隱寫(xiě)術(shù)取得了較好的檢測(cè)效果。文獻(xiàn)[4]提出基于Markov模型的塊內(nèi)和塊間轉(zhuǎn)移概率矩陣,文獻(xiàn)[5]融合了DCT系數(shù)特征和Markov特征,均能實(shí)現(xiàn)對(duì)多種隱寫(xiě)算法的有效檢測(cè)。隨后,文獻(xiàn)[6]通過(guò)分析轉(zhuǎn)移概率的缺陷,構(gòu)建了相鄰系數(shù)的聯(lián)合概率密度矩陣;文獻(xiàn)[7]從特征選擇的角度出發(fā),對(duì)兩類(lèi)矩陣的檢測(cè)性能進(jìn)行了理論分析和實(shí)驗(yàn)對(duì)比。近幾年來(lái),研究者們又提出一系列包含豐富DCT系數(shù)模型的高維特征集[8-10],充分反映和刻畫(huà)了JPEG圖像的紋理和邊緣特征,進(jìn)一步提高了隱寫(xiě)分析的準(zhǔn)確性。
隨著隱寫(xiě)分析算法性能的提升,其特征維數(shù)和運(yùn)算復(fù)雜度也越來(lái)越高。此外,傳統(tǒng)算法對(duì)所有圖像采用相同的處理過(guò)程,忽略了圖像內(nèi)容對(duì)隱寫(xiě)分析結(jié)果的影響。由于圖像相鄰系數(shù)之間存在較強(qiáng)的相關(guān)性且不同內(nèi)容圖像具有明顯的統(tǒng)計(jì)差異,決定隱寫(xiě)分析準(zhǔn)確性的因素除了秘密信息的嵌入機(jī)制,還包括圖像自身的內(nèi)容特征。文獻(xiàn)[11]提出一種基于圖像復(fù)雜度的通用隱寫(xiě)分析框架,該方法通過(guò)對(duì)圖像庫(kù)分類(lèi),有效提高了對(duì)多種隱寫(xiě)算法的檢測(cè)性能,但其假設(shè)載體和相應(yīng)載密圖像的復(fù)雜度一致并不符合實(shí)際情況,這是因?yàn)樵诿孛苄畔⑶度牒?系數(shù)相關(guān)性的改變使得圖像內(nèi)容復(fù)雜度也發(fā)生了變化。文獻(xiàn)[12]通過(guò)對(duì)圖像分塊進(jìn)行聯(lián)合判決,在提高檢測(cè)準(zhǔn)確率的同時(shí)大大增加了特征維數(shù);文獻(xiàn)[13]采用的圖像分割模型同樣提高了隱寫(xiě)分析的運(yùn)算復(fù)雜度。
本文從圖像內(nèi)容描述出發(fā),提出一種基于預(yù)分類(lèi)和特征擴(kuò)展的JPEG圖像通用隱寫(xiě)分析方法。該方法以JPEG圖像的DCT系數(shù)分布特征作為其內(nèi)容復(fù)雜度的測(cè)度,通過(guò)預(yù)分類(lèi)將特性相似的圖像劃分至同一子庫(kù),使每類(lèi)子庫(kù)中圖像的隱寫(xiě)檢測(cè)特征更加聚合;通過(guò)特征擴(kuò)展提高檢測(cè)特征對(duì)嵌入信息的敏感性,使載體和載密圖像特征具有更佳的可分性。實(shí)驗(yàn)結(jié)果表明,在不明顯增加特征維數(shù)和運(yùn)算復(fù)雜度的前提下,本文方法對(duì)典型JPEG圖像隱寫(xiě)算法的檢測(cè)性能優(yōu)于現(xiàn)有方法。
隱寫(xiě)分析可看作模式識(shí)別問(wèn)題,其關(guān)鍵在于尋找對(duì)嵌入變化敏感的檢測(cè)特征。設(shè)xi和yj分別表示載體和載密樣本集的隱寫(xiě)分析向量,其中i=1,…,Nc,j=1,…,Ns,則有
(1)
(2)
(3)
(4)
為了區(qū)分兩類(lèi)數(shù)據(jù),定義判別函數(shù)[14]:
(5)
由于圖像內(nèi)容千差萬(wàn)別,而秘密信息嵌入引起的變化非常微小,通常情況下,載體和載密兩類(lèi)數(shù)據(jù)的類(lèi)間距離很小,同類(lèi)數(shù)據(jù)的類(lèi)內(nèi)分布卻差異很大。基于此,本文從減小類(lèi)內(nèi)散度和擴(kuò)大類(lèi)間距離兩個(gè)角度出發(fā),在不明顯增加運(yùn)算量的前提下,提出一種新的JPEG圖像通用隱寫(xiě)分析方法,具體流程如圖1所示。
在訓(xùn)練階段,首先從圖像庫(kù)中隨機(jī)選取部分載體圖像和相應(yīng)的載密圖像形成訓(xùn)練樣本集,根據(jù)圖像的內(nèi)容復(fù)雜程度將其劃分為若干個(gè)互相重疊的類(lèi)別,使每一類(lèi)子庫(kù)所包含的圖像都具有相同或相似的統(tǒng)計(jì)特性;然后對(duì)每一類(lèi)子庫(kù)分別提取擴(kuò)展后對(duì)嵌入變化更加敏感的檢測(cè)特征并建立分類(lèi)器進(jìn)行訓(xùn)練。在測(cè)試階段,同樣先計(jì)算待測(cè)圖像的內(nèi)容復(fù)雜度及其與各類(lèi)子庫(kù)復(fù)雜度均值的歐氏距離,按照最小距離原則將待測(cè)圖像劃分至相應(yīng)類(lèi)別中,提取擴(kuò)展的隱寫(xiě)檢測(cè)特征并使用對(duì)應(yīng)的分類(lèi)器進(jìn)行測(cè)試,進(jìn)而得到最終的判決結(jié)果。
圖1 JPEG圖像通用隱寫(xiě)分析方法流程圖Fig.1 Framework of JPEG image universal steganalysis
2.1圖像內(nèi)容復(fù)雜度度量
對(duì)于數(shù)字圖像而言,經(jīng)過(guò)DCT變換和量化后,平滑區(qū)域的能量聚集在系數(shù)的直流和交流低頻部分,復(fù)雜區(qū)域的能量聚集在系數(shù)的交流高頻部分。由于大多數(shù)隱寫(xiě)算法不在直流系數(shù)中嵌入秘密信息,因此本文以JPEG圖像中非零交流系數(shù)個(gè)數(shù)與交流系數(shù)總數(shù)的比值(non-zero AC-DCT coefficients ratio,NZAR)作為圖像內(nèi)容復(fù)雜度度量,部分圖例如圖2所示。
圖2 圖像及圖像內(nèi)容復(fù)雜度示例Fig.2 Example of images and image content complexity
由圖2可以看出,圖像的平滑區(qū)域越多,NZAR值越小;圖像的紋理細(xì)節(jié)越豐富,NZAR值就越大,這與人眼的視覺(jué)判斷基本相符,說(shuō)明NZAR特征可以在一定程度上反映圖像內(nèi)容的復(fù)雜程度。
2.2分類(lèi)方法
在文獻(xiàn)[11]的分類(lèi)方法中,假設(shè)載體和相應(yīng)載密圖像的復(fù)雜度一致,并將它們分至同一類(lèi)子庫(kù)中進(jìn)行隱寫(xiě)檢測(cè)。實(shí)際上在秘密信息嵌入后,相鄰系數(shù)相關(guān)性的改變使得圖像復(fù)雜度也發(fā)生了變化,載體和相應(yīng)的載密圖像有可能不屬于同一類(lèi)別。以nsF5[15]算法為例,對(duì)圖2中4幅圖分別嵌入0.2 bpnz(bits per non-zero AC-DCT coefficient)秘密信息,隱寫(xiě)前后圖像DCT系數(shù)的分布變化如圖3所示??梢钥闯?圖像內(nèi)容越復(fù)雜,嵌入的秘密信息比特?cái)?shù)就越多,載體和載密圖像之間的統(tǒng)計(jì)量差異就越大,NZAR值的改變就越明顯。
圖3 不同內(nèi)容圖像在隱寫(xiě)前后的DCT系數(shù)分布變化Fig.3 DCT coefficients distribution change of different content images before and after steganography
此外,由于JPEG圖像的NZAR特征范圍較窄,如果采用簡(jiǎn)單的平均分類(lèi)方法對(duì)按復(fù)雜度排序后的訓(xùn)練樣本集進(jìn)行分類(lèi),就會(huì)使部分內(nèi)容復(fù)雜度相等的圖像被劃分至不同類(lèi)別中;隨著分類(lèi)數(shù)目的增加,每一類(lèi)子庫(kù)的圖像數(shù)量明顯下降,使得分類(lèi)器的檢測(cè)性能也受到影響。針對(duì)文獻(xiàn)[11]所提方法的不足,本文提出一種新的圖像庫(kù)分類(lèi)方法,詳細(xì)步驟如下:
步驟1對(duì)于給定的訓(xùn)練樣本集,計(jì)算所有載體圖像的NZAR特征。
步驟2按照載體圖像NZAR特征的大小對(duì)其進(jìn)行升序排列,并將排序后的圖像平均分為K類(lèi);第i類(lèi)子庫(kù)中NZAR特征的最大值記作MAX(i),最小值記作MIN(i),其中1≤i≤K。
步驟3令R(I)表示第i類(lèi)子庫(kù)中圖像I的NZAR值,如果滿足以下任何一種情況,則I同樣屬于第j類(lèi),其中1≤j≤K且j≠i:
(1)當(dāng)j>i時(shí),如果
(2)當(dāng)j
步驟4對(duì)所有的載體圖像分別重復(fù)步驟3的過(guò)程,最終將其劃分為K個(gè)互相重疊的類(lèi)別。
步驟5按照步驟1~步驟4的過(guò)程,將所有的載密圖像也劃分為K個(gè)互相重疊的類(lèi)別。在此基礎(chǔ)上,組合載體圖像和載密圖像的對(duì)應(yīng)類(lèi)別,構(gòu)成訓(xùn)練樣本集的各個(gè)子圖像庫(kù)。
通過(guò)上面的步驟,訓(xùn)練樣本集中內(nèi)容復(fù)雜度相等的圖像被完全劃分至同類(lèi)子庫(kù),且每一類(lèi)子庫(kù)所包含的圖像都具有相等或相近的NZAR特征;由于各類(lèi)子庫(kù)中訓(xùn)練樣本數(shù)目的增加,相應(yīng)分類(lèi)器的檢測(cè)性能也有所提升。在測(cè)試階段進(jìn)行預(yù)分類(lèi)時(shí),同樣先計(jì)算待測(cè)圖像的NZAR值,然后計(jì)算其與各類(lèi)子庫(kù)復(fù)雜度均值的歐氏距離,并按照最小距離將待測(cè)圖像劃分至相應(yīng)類(lèi)別中。
CCPEV(cartesian calibrated PEV)[5]是一種廣泛應(yīng)用的基于校準(zhǔn)技術(shù)的JPEG圖像隱寫(xiě)檢測(cè)特征,包括全局直方圖、單頻直方圖、對(duì)偶直方圖、塊間總偏差、空域塊邊界不連續(xù)性、共生矩陣和塊內(nèi)Markov轉(zhuǎn)移概率矩陣。其中,直方圖、塊間總偏差和空域塊邊界不連續(xù)性屬于全局特征,能夠統(tǒng)計(jì)較大范圍的系數(shù)改變,但有些隱寫(xiě)算法會(huì)采取修補(bǔ)技術(shù)來(lái)控制全局特征的擾動(dòng),因此需要補(bǔ)充描述局部相關(guān)性的特征。轉(zhuǎn)移概率矩陣主要關(guān)心修改DCT系數(shù)后對(duì)局部引起的變化,CCPEV中直接將不同方向的塊內(nèi)特征加權(quán)平均,雖然能夠降低特征維度,但檢測(cè)性能也有所下降,同時(shí)也缺少合理性的解釋。此外,為抵抗直方圖等一階統(tǒng)計(jì)特征的檢測(cè),某些隱寫(xiě)算法會(huì)刻意保持相鄰DCT系數(shù)間的統(tǒng)計(jì)特性不變,但對(duì)于相鄰的8×8塊,同一頻率系數(shù)之間的相關(guān)性難以保持。據(jù)此,本文對(duì)CCPEV的塊內(nèi)和塊間特征進(jìn)行了擴(kuò)展以提高隱寫(xiě)檢測(cè)特征對(duì)不同嵌入變化的敏感性。
假設(shè)I為一幅尺寸為M×N的JPEG圖像,該圖像的量化DCT系數(shù)的絕對(duì)值矩陣為A(u,v),其中1≤u≤M,1≤v≤N。對(duì)于擴(kuò)展的塊內(nèi)特征,首先計(jì)算水平(h)、垂直(v)、對(duì)角(d)和反對(duì)角(m)4個(gè)方向的差分矩陣:
(6)
(7)
(8)
(9)
式中,Ah是M×(N-1)的矩陣;Av是(M-1)×N的矩陣;Ad和Am均為(M-1)×(N-1)的矩陣。為了降低運(yùn)算復(fù)雜度,設(shè)置閾值T,令差分矩陣中數(shù)值大于T的元素設(shè)定為T(mén),小于-T的元素設(shè)定為-T,其余元素的數(shù)值保持不變。
把差分矩陣中的單個(gè)元素看作Markov變量的實(shí)現(xiàn),可以得到4個(gè)不同方向的轉(zhuǎn)移概率矩陣。而文獻(xiàn)[6]指出,與轉(zhuǎn)移概率相比,聯(lián)合概率更能捕捉由于信息嵌入造成的系數(shù)微小變化,因此本文采用聯(lián)合概率密度矩陣來(lái)描述DCT系數(shù)的塊內(nèi)相關(guān)性。
(10)
(11)
(12)
(13)
式中
令A(yù)T表示矩陣A的轉(zhuǎn)置,按照式(6)~式(13)的計(jì)算過(guò)程,由矩陣AT可以得到4個(gè)方向的聯(lián)合概率密度矩陣{Ch,2,Cv,2,Cd,2,Cm,2}。根據(jù)各向同性的假設(shè),可近似認(rèn)為A和AT具有相同的分布,從而兩組特征{Ch,1,Cv,1,Cd,1,Cm,1}和{Ch,2,Cv,2,Cd,2,Cm,2}中相應(yīng)的每對(duì)特征也都是同分布的[16]。將這些具有相同分布的特征合并可得
(14)
此外,由式(6)~式(13)的構(gòu)成,可以看出一些矩陣是相等的,如Ch,1= Cv,2,Cv,1= Ch,2,所以Ch= Cv,Ch可由Ch,1和Cv,1合并得到;由Cd,1= Cd,2得到Cd= Cd,1;而Cm,1和Cm,2關(guān)于u=-v對(duì)稱(chēng),約減Cm,1即可得到Cm。綜上,擴(kuò)展后的塊內(nèi)特征為{Ch,Cd,Cm},共 (5T+3)(2T+1)維??紤]到圖像統(tǒng)計(jì)特性的描述和特征維數(shù)之間的均衡,通常選擇閾值T=4。
對(duì)于擴(kuò)展的塊間特征,由于DCT系數(shù)的塊間相關(guān)性較弱,因此特征提取的過(guò)程中需要考慮幅值和符號(hào)兩個(gè)方面的相關(guān)性。設(shè)圖像I的量化DCT系數(shù)矩陣為D(u,v),其中1≤u≤M,1≤v≤N。首先計(jì)算水平和垂直兩個(gè)方向的塊間差分矩陣:
(15)
(16)
式中,Dh是M×(N-8)的矩陣;Dv是(M-8)×N的矩陣。則DCT系數(shù)的塊間差分直方圖為
(17)
式中,-5≤r≤5。相鄰塊的差分聯(lián)合概率密度矩陣為
(18)
式中,-2≤s;t≤2。
綜上所述,結(jié)合CCPEV中的直方圖、塊間總偏差、空域塊邊界不連續(xù)性和共生矩陣特征以及圖像校準(zhǔn)技術(shù),擴(kuò)展后的特征集共872維。各部分特征如表1所示。
表1 擴(kuò)展特征集
BOWS2[17]是隱寫(xiě)分析中常用的圖像庫(kù),包含10 700幅分辨率為512×512的灰度圖像,主題涉及自然風(fēng)景、人文建筑、動(dòng)植物等。實(shí)驗(yàn)中隨機(jī)選取10 000幅圖像經(jīng)JPEG壓縮后作為隱寫(xiě)載體,分別使用nsF5[15]、MB1[18]和PQt[19]生成載密圖像。其中,nsF5和MB1的載體圖像質(zhì)量因子為75,PQt的載體圖像質(zhì)量因子為85。所有算法的嵌入率根據(jù)其自身的檢測(cè)難度進(jìn)行選擇,并以bpnz為單位度量。
為了測(cè)試算法的檢測(cè)性能,本文采用集成分類(lèi)器[8]進(jìn)行分類(lèi)。從載體和相應(yīng)的載密圖像中隨機(jī)選擇50%作為訓(xùn)練樣本,剩余50%作為測(cè)試樣本,以最小總誤差作為衡量指標(biāo):
(19)
4.1不同分類(lèi)方法的性能對(duì)比
為了驗(yàn)證本文分類(lèi)方法的有效性,分別對(duì)以下幾種方法的檢測(cè)性能進(jìn)行對(duì)比:
方法 1將訓(xùn)練樣本庫(kù)隨機(jī)分為若干類(lèi),保證每一類(lèi)的圖像數(shù)目與本文方法基本一致;
方法 2按照文獻(xiàn)[11]提出的方法對(duì)訓(xùn)練樣本庫(kù)進(jìn)行平均分類(lèi),載體和相應(yīng)的載密圖像在同一類(lèi)中;
方法 3本文提出的圖像庫(kù)分類(lèi)方法。
實(shí)驗(yàn)中提取CCPEV作為各種分類(lèi)方法的隱寫(xiě)檢測(cè)特征,結(jié)果如圖4~圖6所示。
圖4 nsF5在不同分類(lèi)方法下的檢測(cè)錯(cuò)誤率Fig.4 Detection error rates for nsF5 steganography among different classification methods
圖5 MB1在不同分類(lèi)方法下的檢測(cè)錯(cuò)誤率Fig.5 Detection error rates for MB1 steganography among different classification methods
從圖中可以看出,本文分類(lèi)方法能有效提高對(duì)多種隱寫(xiě)算法的檢測(cè)準(zhǔn)確性。與隨機(jī)分類(lèi)相比,本文依據(jù)圖像自身的內(nèi)容復(fù)雜度進(jìn)行分類(lèi),使得同類(lèi)圖像之間的統(tǒng)計(jì)特性較為相似,有效降低了類(lèi)內(nèi)總散度,因而檢測(cè)性能有較大提升;與文獻(xiàn)[11]的分類(lèi)方法相比,本文提出按照載體和載密圖像各自的NZAR特征進(jìn)行預(yù)分類(lèi)的方法更加符合實(shí)際情況,且分類(lèi)使得內(nèi)容復(fù)雜度相等的圖像被完全劃分至同類(lèi)子庫(kù)中,由于每一類(lèi)子庫(kù)中訓(xùn)練樣本數(shù)目的增加,相應(yīng)的分類(lèi)器模型也具有更好的檢測(cè)性能,因此整體的檢測(cè)錯(cuò)誤率明顯下降。此外,當(dāng)圖像庫(kù)分為2~5類(lèi)時(shí),本文方法的檢測(cè)性能較穩(wěn)定;綜合考慮運(yùn)算復(fù)雜度和隱寫(xiě)檢測(cè)性能,將圖像分類(lèi)數(shù)目設(shè)為2。
圖6 PQt在不同分類(lèi)方法下的檢測(cè)錯(cuò)誤率Fig.6 Detection error rates for PQt steganography among different classification methods
4.2不同隱寫(xiě)檢測(cè)特征的性能對(duì)比
為了驗(yàn)證本文所提取的擴(kuò)展特征集的有效性,分別在不同實(shí)驗(yàn)方法下將其與CCPEV的檢測(cè)性能進(jìn)行對(duì)比,結(jié)果如表2所示。
表2 不同特征的檢測(cè)錯(cuò)誤率比較
從表中數(shù)據(jù)可以看出,相較于CCPEV,擴(kuò)展特征集能顯著降低檢測(cè)錯(cuò)誤率。分析隱寫(xiě)算法可知,nsF5利用濕紙碼技術(shù)消除了嵌密引起的直方圖收縮現(xiàn)象,但無(wú)法保持DCT系數(shù)的塊間相關(guān)性不變;MB1使圖像在隱寫(xiě)后出現(xiàn)了較為明顯的塊效應(yīng);PQt通過(guò)二次壓縮使整體的嵌入變化最小,但無(wú)法修復(fù)局部系數(shù)變化。擴(kuò)展特征集補(bǔ)充描述了DCT系數(shù)的塊內(nèi)和塊間統(tǒng)計(jì)特性,因而提高了對(duì)多種隱寫(xiě)算法的檢測(cè)性能。
此外,與圖像預(yù)分類(lèi)相比,特征集的擴(kuò)展對(duì)錯(cuò)誤率的改善效果更加明顯,原因在于:擴(kuò)展特征集通過(guò)豐富所提特征的多樣性,大大增加了載體和載密兩類(lèi)數(shù)據(jù)的類(lèi)間距離,使其變得更易區(qū)分;而采用NZAR特征衡量圖像內(nèi)容復(fù)雜度時(shí),由于JPEG圖像的NZAR特征范圍較窄,分類(lèi)后不同類(lèi)別圖像之間的NZAR值差異不大,同一類(lèi)中載體和載密數(shù)據(jù)的類(lèi)內(nèi)總散度降低較少,因而檢測(cè)性能提升不多。
4.3不同隱寫(xiě)分析方法的性能對(duì)比
為了驗(yàn)證本文方法對(duì)不同隱寫(xiě)算法的檢測(cè)性能,分別將其與文獻(xiàn)[4]、文獻(xiàn)[5]、文獻(xiàn)[6]、文獻(xiàn)[16]、文獻(xiàn)[12]和文獻(xiàn)[14]中的隱寫(xiě)分析方法進(jìn)行對(duì)比,結(jié)果如表3所示。從表中數(shù)據(jù)可以看出,對(duì)于3種不同的隱寫(xiě)算法,本文所提方法的檢測(cè)性能在大多數(shù)情況下優(yōu)于其他方法。相較于文獻(xiàn)[4]、文獻(xiàn)[5]、文獻(xiàn)[6]和文獻(xiàn)[16]中直接在整體圖像上提取特征進(jìn)行隱寫(xiě)分析的方法,本文通過(guò)對(duì)圖像庫(kù)預(yù)分類(lèi)和特征擴(kuò)展使檢測(cè)錯(cuò)誤率下降了2%~7%;與文獻(xiàn)[12]和文獻(xiàn)[14]中基于圖像內(nèi)容的隱寫(xiě)分析方法相比,本文方法對(duì)多種隱寫(xiě)算法的檢測(cè)性能都略有提升,且比文獻(xiàn)[12]的特征維數(shù)和運(yùn)算復(fù)雜度有了明顯降低。
表3 不同隱寫(xiě)分析方法的檢測(cè)錯(cuò)誤率比較
本文考慮圖像內(nèi)容對(duì)JPEG通用隱寫(xiě)分析的影響,提出了一種基于預(yù)分類(lèi)和特征擴(kuò)展的新方法來(lái)提高檢測(cè)準(zhǔn)確性。通過(guò)預(yù)分類(lèi)將特性相似的圖像劃分至同一子庫(kù)中,通過(guò)特征擴(kuò)展來(lái)提高檢測(cè)特征對(duì)嵌入信息的敏感性。實(shí)驗(yàn)結(jié)果表明,與現(xiàn)有隱寫(xiě)分析方法相比,本文方法對(duì)典型的JPEG圖像隱寫(xiě)算法具有更好的檢測(cè)性能。下一步將對(duì)圖像統(tǒng)計(jì)特性展開(kāi)更深入的研究以尋找更有效的內(nèi)容復(fù)雜度度量準(zhǔn)則。
[1] Li F Y,Wu K,Lei J S,et al.Steganalysis over large-scale social networks with high-order joint features and clustering ensembles[J].IEEE Trans.on Information Forensics and Security,2016,11(2):344-357.
[2] Zhu T T,Wang L N,Hu D H,et al.JPEG image steganalysis method based on uncertainty reasoning theory[J].Acta Electronica Sinica,2013,41(2):233-238.(朱婷婷,王麗娜,胡東輝,等.基于不確定性推理的JPEG圖像通用隱藏信息檢測(cè)技術(shù)[J].電子學(xué)報(bào),2013,41(2):233-238.)
[3] Fridrich J.Feature-based steganalysis for JPEG images and its implications for future design of steganographic schemes[C]//Proc.of the 6th International Workshop on Information Hiding,2004:67-81.
[4] Chen C H,Shi Y Q.JPEG image steganalysis utilizing both intrablock and interblock correlations[C]//Proc.of the IEEE International Symposium on Circuits and Systems,2008:3029-3032.
[5] Kodovsky J,Fridrich J.Calibration revisited[C]//Proc.of the 11th ACM Multimedia and Security Workshop,2009:63-73.
[6] Liu Q Z,Sung A H,Qiao M Y.Neighboring joint density-based JPEG steganalysis[J].ACM Trans.on Intelligent Systems and Technology,2011,2(2):1-16.
[7] Lu J C,Liu F L,Luo X Y.A study on JPEG steganalytic features:co-occurrence matrix vs.markov transition probability matrix[J].Digital Investigation,2015,12:1-14.
[8] Kodovsky J,Fridrich J,Holub V.Ensemble classifiers for steganalysis of digital media[J].IEEE Trans.on Information Forensics and Security,2012,7(2):432-444.
[9] Li F Y,Zhang X P,Chen B,et al.JPEG steganalysis with high-dimensional features and bayesian ensemble classifier[J].IEEE Signal Processing Letters,2013,20(3):233-236.
[10] Chen B,Feng G R,Zhang X P,et al.Mixing high-dimensional features for JPEG steganalysis with ensemble classifier[J].Signal Image and Video Processing,2014,8(8):1475-1482.
[11] Amirkhani H,Rahmati M.New framework for using image contents in blind steganalysis systems[J].Journal of Electronic Imaging,2011,20(1):013016-1-013016-14.
[12] Cho S G,Cha B H,Gawecki M,et al.Block-based image steganalysis:algorithm and performance evaluation[J].Journal of Visual Communication and Image Representation,2013,24(7):846-856.
[13] Wang R,Xu M K,Ping X J,et al.Steganalysis of JPEG images by block texture based segmentation[J].Multimedia Tools and Applications,2015,74(15):5725-5746.
[14] Li W X,Zhang T,Hu G E,et al.Image pre-classification to improve accuracy of universal steganalysis[C]//Proc.of the 5th IEEE International Conference on Software Engineering and Service Science,2014:364-368.
[15] Fridrich J,Pevny T.Statistically undetectable JPEG steganography:dead ends challenges,and opportunities[C]//Proc.of the 9th ACM Multimedia and Security Workshop,2007:3-13.
[16] Zhang H,Ping X J.New design of markov steganalytic features[J].Journal of Electronics & Information Technology,2013,35(8):1907-1913.(張昊,平西建.Markov隱寫(xiě)檢測(cè)特征的一種新設(shè)計(jì)[J].電子與信息學(xué)報(bào),2013,35(8):1907-1913.)
[17] Bas P,Furon T.BOWS-2[EB/OL].[2015-07-10].http://bows2.ec-lille.fr.
[18] Sallee P.Model-based steganography[J].Lecture Notes in Computer Science,2004,2939:154-167.
[19] Fridrich J,Goljan M,Soukal D.Perturbed quantization steganography[J].Multimedia Systems,2005,11(2):98-107.
JPEG image steganalysis based on pre-classification and feature extension
GUO Ji-chang,LIU Xiao-juan,TIAN Yu-heng
(School of Electronic Information Engineering,Tianjin University,Tianjin 300072,China)
The performance of joint photographic experts group (JPEG)image steganalysis is related not only to the information-hiding methods but also to the complexity of image content.A novel approach based on pre-classification and feature extension is proposed to improve the accuracy of JPEG universal steganalysis.Firstly,an image content complexity evaluation criterion is exploited to divide the training samples into several overlapping categories.After that,the more effective extended feature set is extracted from each category respectively to build a classifier.Given a testing image,its category is determined according to the minimum distance from its complexity to the average value of each category.Then,the feature set is extracted and sent to the corresponding classifier.Experimental results indicate that this new approach exhibits excellent performance for the detection of typical JPEG steganography algorithms.
steganalysis; image content complexity; pre-classification; feature extension
2016-03-24;
2016-07-04;網(wǎng)絡(luò)優(yōu)先出版日期:2016-08-05。
國(guó)家重點(diǎn)基礎(chǔ)研究發(fā)展計(jì)劃(973計(jì)劃)(2014CB340400);天津市自然科學(xué)基金(15JCYBJC15500)資助課題
TP 391
ADOI:10.3969/j.issn.1001-506X.2016.11.31
郭繼昌(1966-),男,教授,博士,主要研究方向?yàn)閿?shù)字圖像處理及DSP應(yīng)用系統(tǒng)、語(yǔ)音信號(hào)處理、數(shù)字和模擬濾波器設(shè)計(jì)。
E-mail:jcguo@tju.edu.cn
劉曉娟(1991-),女,碩士研究生,主要研究方向?yàn)閿?shù)字圖像處理、圖像隱寫(xiě)分析。
E-mail:xiaojuan@tju.edu.cn
田煜衡(1986-),男,博士研究生,主要研究方向?yàn)閿?shù)字圖像處理、模式識(shí)別、隱寫(xiě)與隱寫(xiě)分析。
E-mail:tianyuheng2004@163.com
網(wǎng)絡(luò)優(yōu)先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20160805.1523.002.html