熊翹楚, 藍 海, 陳 晶*
(1. 武漢大學(xué) 國家網(wǎng)絡(luò)安全學(xué)院,湖北 武漢 430072; 2. 武漢烽火信息集成技術(shù)有限公司, 湖北 武漢 430072)
隨著計算機技術(shù)和互聯(lián)網(wǎng)的飛速發(fā)展,信息安全已經(jīng)與人們的生活密不可分.隱寫術(shù)和隱寫分析是信息安全領(lǐng)域中的熱門研究方向[1],隱寫術(shù)以多媒體數(shù)據(jù)為載體,如文本、圖像、音頻和視頻等,通過將隱秘信息以無感知的形式嵌入到多媒體數(shù)據(jù)中,生成載密樣本進行隱秘信息的傳播[2].隱寫術(shù)在提高信息通訊安全性和隱蔽性的同時,也易被不法分子利用.目前,越來越多的惡意軟件采用隱寫術(shù)進行隱秘通信,造成了巨大的安全隱患.隱寫分析技術(shù)作為隱寫術(shù)的對抗技術(shù),主要通過對可疑樣本進行各個維度的統(tǒng)計特征分析,判斷可疑樣本是否被嵌入了秘密信息,進而分析可疑隱寫通道、信息長度等,達到完整提取秘密信息的目的[3].
目前,音視頻通信和數(shù)字化服務(wù)已經(jīng)在互聯(lián)網(wǎng)上得到了廣泛應(yīng)用,數(shù)字音頻在人們的生活中無處不在.AAC音頻是3GPP(3rd Generation Partnership Project,3GPP)組織指定的移動互聯(lián)網(wǎng)音頻壓縮編碼標(biāo)準(zhǔn)之一[4],在相同碼率條件下,相較于MP3音頻格式具有更好的聽覺質(zhì)量,被廣泛應(yīng)用于多種主流高清電視標(biāo)準(zhǔn)以及其他軟硬件設(shè)備,例如,iTunes、YouTube、Twitter、QQ Music、iPhone和Sony PlayStation等[5].
AAC音頻因其編碼原理[6]復(fù)雜,涉及的編碼模塊較多,在被廣泛應(yīng)用的同時,也帶來了非常豐富的隱寫空間.目前,針對AAC音頻已經(jīng)出現(xiàn)了多種隱寫方法,根據(jù)隱寫嵌入域的不同,可分為以下三種:量化MDCT系數(shù)域、比例因子域以及Huffman編碼域.MDCT系數(shù)作為AAC音頻的主要編碼參數(shù),占音頻數(shù)據(jù)總量的60%以上,對MDCT系數(shù)的微量修改不會對聽覺感知造成明顯影響,具有良好的不可感知性和較大的嵌入容量.AAC音頻編碼流程及主要隱寫域見圖1所示.
圖1 AAC音頻編碼流程及主要隱寫域Fig.1 AAC audio coding procedure and main embedding domains
目前已經(jīng)出現(xiàn)了多種針對MDCT系數(shù)的隱寫算法.文獻[7](以下稱MIN方法)中,王昱潔等在編碼過程中,根據(jù)采用的碼書序號將每一幀的MDCT系數(shù)劃分為小值區(qū)、中值區(qū)和大值區(qū),其中小值區(qū)MDCT系數(shù)值的范圍為1、2號碼書對應(yīng)的4個MDCT系數(shù)區(qū)域.在進行隱寫時,根據(jù)秘密信息來修改末位的MDCT系數(shù)值.文獻[8](以下稱SIGN方法)中,Zhu等利用編碼過程中MDCT系數(shù)的符號位會被單獨編碼這一特點,根據(jù)選定的閾值T和待嵌入的秘密信息,對范圍在[-T, T]內(nèi)的MDCT系數(shù)對應(yīng)的符號位進行修改,從而實現(xiàn)秘密信息的隱寫.Pinel等[9]通過秘密信息來控制MDCT系數(shù)的量化區(qū)間,利用QIM算法對MDCT系數(shù)進行修改,實現(xiàn)了音頻水印的嵌入.朱杰[10]提出在Huffman編碼過程中通過設(shè)計矩陣編碼算法,對溢出的MDCT系數(shù)進行LSB(Least Significant Bit,LSB)位嵌入.Wei等[11]通過修改比例因子來控制量化后MDCT系數(shù)比特位,在MDCT系數(shù)冗余位上進行秘密信息的嵌入.Zhu等[12]通過對音頻每一幀的分區(qū)過程進行修改,實現(xiàn)基于分區(qū)過程的隱寫操作.由于MP3與AAC音頻在編碼過程中均采用濾波器MDCT變換對音頻采樣數(shù)據(jù)進行處理,因此,針對MP3音頻MDCT系數(shù)域的隱寫算法原理同樣也適用于AAC音頻.常見的MP3隱寫工具以及隱寫算法包括MP3Stego[13]、UnderMP3Cover[14]、MP3Stegz[15]、EECS(Equal length Entropy Code Substitution,EECS)[16]、AHCM(Adaptive Huffman Coding Mapping,AHCM)[17]和JED(Joint Embedding Distortion function,JED)[18]等.
針對以上隱寫算法,現(xiàn)有的隱寫分析方法主要是利用音頻的短時相關(guān)性原理,利用專家先驗知識來構(gòu)造具有差異性的隱寫分析特征模型.王昱潔[19]通過提取MDCT系數(shù)的Markov轉(zhuǎn)移概率特征,實現(xiàn)針對MDCT系數(shù)的有效隱寫分析檢測.Ren等[20]通過構(gòu)建富模型特征,提取幀間和幀內(nèi)MDCT系數(shù)的一階和二階差分Markov轉(zhuǎn)移概率及聯(lián)合概率密度作為隱寫分析特征,對特征組進行概率加權(quán)融合,并使用SVM分類器進行分類.MP3音頻的隱寫分析算法對設(shè)計AAC隱寫分析算法具有啟發(fā)性.Yan等[21]根據(jù)MP3相鄰幀量化步長間的差異實現(xiàn)針對MP3Stego的有效隱寫分析.Yan等[22]和Yu等[23]利用重壓縮技術(shù)設(shè)計基于音頻統(tǒng)計特征的隱寫分析方法實現(xiàn)有效檢測.Qiao等[24]、Kuriakose等[25]及Jin等[26]通過分析MP3音頻子帶中MDCT系數(shù)的幀間相關(guān)性,設(shè)計基于MDCT系數(shù)統(tǒng)計分布特征的隱寫分析方法.
以上通過專家經(jīng)驗設(shè)計出的傳統(tǒng)隱寫分析特征具有特征覆蓋面較窄、檢測層面有限和無法對樣本進行小粒度檢測等缺點,在面對未知隱寫算法時,檢測效果難以保證.深度學(xué)習(xí)作為一種由算法進行自動特征挖掘和表示的有效學(xué)習(xí)方法,已經(jīng)在圖像語音識別等很多領(lǐng)域得到廣泛應(yīng)用,并取得了非常好的效果.張堅等[27]提出一種基于重壓縮預(yù)處理的CNN(Convolutional Neural Networks,CNN)低嵌入率MP3stego隱寫分析方法.Wang等[28]使用高通濾波器對音頻數(shù)據(jù)進行預(yù)處理,實現(xiàn)基于CNN的MP3隱寫分析檢測.目前,基于深度學(xué)習(xí)的音頻音協(xié)分析方法還處于發(fā)展階段,相較于傳統(tǒng)方法在檢測效果和通用性上已經(jīng)有了很大的進展.
本文針對AAC音頻MDCT系數(shù)隱寫域,提出一種基于深度殘差網(wǎng)絡(luò)的通用隱寫分析方法.利用多元線性擬合函數(shù)設(shè)計合適的濾波器,通過濾波操作減少音頻內(nèi)容對隱寫分析的影響,增大隱寫所引入噪聲在整個音頻內(nèi)容信號上的比例.通過設(shè)計包含三類卷積模塊的深度殘差網(wǎng)絡(luò),對兩種AAC音頻MDCT系數(shù)隱寫算法[8-9]進行隱寫分析特征提取和分類.實驗結(jié)果表明,本文提出的隱寫分析方法具有良好的檢測效果,相較于傳統(tǒng)隱寫分析特征檢測性能有明顯提升.
根據(jù)AAC音頻的編碼原理,在音頻碼流中存在兩種類型的音頻幀:長幀和短幀.當(dāng)音頻信號平滑且舒緩時,使用1個長窗進行MDCT變換,每個長幀包含1 024個MDCT系數(shù);當(dāng)音頻信號比較激烈時,將1 024個MDCT系數(shù)使用8個短窗分別進行編碼,每個短幀包含128個MDCT系數(shù).圖2為AAC音頻的幀結(jié)構(gòu).
圖2 AAC音頻的幀結(jié)構(gòu)Fig.2 The construction of AAC audio frame
在AAC音頻編碼過程中對音頻模擬信號進行有損壓縮,其中在MDCT系數(shù)量化編碼過程中對音頻信號的采樣點進行了有損量化.雖然量化對其原始載體信號造成了一些損失,但是在很短的時間內(nèi),MDCT系數(shù)依舊能夠表現(xiàn)出時序和頻域的連續(xù)性,即語音音頻具有短時的連續(xù)性和相關(guān)性.面向MDCT系數(shù)域的隱寫方法通過不同的策略修改MDCT系數(shù)值,則會破壞這種短時相關(guān)性.
受圖像空域富模型特征[29](Rich models for steganalysis)隱寫分析方法啟發(fā),本小節(jié)利用多元線性擬合函數(shù),對AAC音頻的MDCT系數(shù)矩陣進行短時相關(guān)性度量.使用FAAC[30]編碼器對100段WAV音頻進行編碼,本文所采用的WAV音頻均為16 KHz采樣頻率、16位采樣、時長2 s的單聲道音頻,得到100段32 Kbps的cover樣本.提取cover樣本的MDCT系數(shù)矩陣MN×1 024={f1,f2,…,fi,…,fN},其中,N表示音頻幀數(shù),1 024表示每一幀含有1 024個MDCT系數(shù),fi表示第i幀的MDCT系數(shù)向量值.由于音頻在編碼過程中是按幀進行編碼,因此,在提取MDCT系數(shù)矩陣時,將音頻每一幀的MDCT系數(shù)作為一行進行分析.根據(jù)式(1)所描述的多元線性回歸模型進行相關(guān)性計算:
y=β0+β1×x1+β2×x2+…+βn×xn+E
(1)
其中,x為自變量,β為回歸多項式系數(shù),y為待預(yù)測的期望值,E為偏置.
針對100段cover樣本的MDCT系數(shù)矩陣,分別構(gòu)建3×3和5×5兩個維度的線性回歸系數(shù)矩陣,結(jié)果如圖3所示.在MDCT系數(shù)矩陣的水平方向(幀內(nèi))和垂直方向(幀間)均具有較強的相關(guān)性,且水平方向相關(guān)性強于垂直方向,而斜對角方向的相關(guān)性較弱.
圖3 cover樣本MDCT系數(shù)矩陣線性回歸擬合結(jié)果Fig.3 The results of the linear regression about MDCT coefficients of cover audio samples
基于以上分析,本文提出一種針對MDCT系數(shù)域的深度殘差網(wǎng)絡(luò)隱寫分析框架,整體結(jié)構(gòu)如圖4所示,主要包括三個部分:MDCT系數(shù)特征預(yù)處理模塊、隱寫分析網(wǎng)絡(luò)主體模塊及分類模塊.
圖4 AAC音頻MDCT系數(shù)域隱寫分析網(wǎng)絡(luò)框架Fig.4 Architecture of the proposed steganalysis scheme for MDCT coefficients
MDCT系數(shù)特征預(yù)處理模塊是利用專家先驗知識,根據(jù)MDCT系數(shù)的幀間與幀內(nèi)相關(guān)性,設(shè)計合適的濾波器,最大程度減少音頻內(nèi)容對隱寫噪聲的掩蔽,提高隱寫噪聲在整個音頻數(shù)據(jù)流中的比例.隱寫分析網(wǎng)絡(luò)主體模塊為深度殘差網(wǎng)絡(luò)結(jié)構(gòu),針對特定濾波后的特征信號進行深層次的隱寫分析特征提取.分類模塊采用二分類方式,將待測音頻根據(jù)預(yù)測概率分類為載體樣本或載密樣本.
MDCT系數(shù)特征預(yù)處理模塊的具體結(jié)構(gòu)如圖5所示.首先,提取原始音頻信號的MDCT系數(shù)矩陣,然后對系數(shù)矩陣進行濾波,將濾波后的殘差信號輸入到截斷線性單元激活函數(shù),并將結(jié)果輸入至網(wǎng)絡(luò)主體結(jié)構(gòu)中.
圖5 MDCT系數(shù)特征預(yù)處理模塊Fig.5 Preprocess module of MDCT coefficients
根據(jù)前述分析可知,音頻MDCT系數(shù)在幀間與幀內(nèi)均具有較強的相關(guān)性,為降低需要訓(xùn)練的網(wǎng)絡(luò)參數(shù)數(shù)量,本文將特征預(yù)處理中的濾波器尺寸設(shè)定為3×3,以提高網(wǎng)絡(luò)的收斂速度.固定值濾波器設(shè)計如圖6所示,其中加粗的圓形符號表示中心點.
待測音頻的MDCT系數(shù)矩陣經(jīng)預(yù)處理模塊后,得到的殘差信號將會作為隱寫分析框架的數(shù)據(jù),進行深層次的隱寫分析特征提取.主體框架中主要包括一個初始卷積層和A、B、C三類卷積單元,通道數(shù)量分別為16、32、64,卷積核尺寸為3×3,步長為1,卷積單元具體結(jié)構(gòu)如圖7所示.
圖7 卷積單元結(jié)構(gòu)Fig.7 The structure of the convolutional units
每隔兩個卷積單元進行一次shortcut鏈接,最后將提取的隱寫分析特征輸入到分類模塊中進行分類.隱寫分析框架的主體結(jié)構(gòu)如圖8所示.
圖8 基于深度殘差網(wǎng)絡(luò)的MDCT系數(shù)的隱寫分析框架主體架構(gòu)Fig.8 The main structure of the proposed deep residual steganalysis network
隱寫分析框架中分類模塊如圖9所示,對提取的隱寫分析特征圖譜進行全局平均池化操作,最后使用SoftMax函數(shù)對輸出進行二分類,從而得到每個待測樣本的cover與stego分類概率.
圖9 基于深度殘差網(wǎng)絡(luò)的MDCT系數(shù)的隱寫分析框架分類模塊Fig.9 The classification module of the proposed deep residual steganalysis network
本文通過三個不同維度的實驗來評估所提出的隱寫分析算法的有效性.針對MIN和SIGN兩種隱寫算法,在不同相對嵌入率的條件下進行隱寫分析檢測,同時與文獻[20]中的隱寫分析方法進行對比實驗,實驗結(jié)果采用TPR(Ture Positive Rate,TPR)和TNR(Ture Negative Rate,TNR)來表示.
由于目前沒有大型公開的AAC音頻樣本庫,本文通過自建AAC音頻樣本庫進行實驗,音頻樣本庫具體描述如下:
WAV_DB:無損WAV音頻樣本來自于互聯(lián)網(wǎng)上的公開音頻網(wǎng)站,音頻樣本的內(nèi)容覆蓋不同語言、不同性別、不同音樂風(fēng)格.將其制作為采樣率16 KHz、16位采樣、音頻時長2 s的10 000段單聲道WAV音頻.
Cover_DB:將WAV_DB中10 000段音頻通過公開的AAC音頻編碼器FAAC進行編碼,得到10 000段編碼碼率為32 Kbps的cover樣本.
Stego_MIN:采用MIN隱寫算法對cover樣本進行隨機秘密信息嵌入,編碼碼率為32 Kbps,相對嵌入率為10%、20%、30%、50%和100%,分別得到對應(yīng)的stego樣本,共10 000×5=50 000段.
Stego_SIGN:采用SIGN隱寫算法對cover樣本進行隨機秘密信息嵌入,編碼碼率為32 Kbps,相對嵌入率為10%、20%、30%、50%和100%,分別得到對應(yīng)的stego樣本,共10 000×5=50 000段.
(1)隱寫分析特征有效性測試
分別針對MIN和SIGN兩種隱寫算法的每個相對嵌入率樣本集合進行隱寫分析模型訓(xùn)練,以驗證該隱寫分析方法的有效性.以Cover_DB和Stego_MIN(10%)為例,將樣本集合中的20 000個樣本(cover和stego樣本各10 000個)劃分為訓(xùn)練集、驗證集和測試集三個集合,其中,訓(xùn)練集占70%,驗證集占10%,測試集占20%.
在訓(xùn)練隱寫分析網(wǎng)絡(luò)時,采用Adam優(yōu)化算法加速神經(jīng)網(wǎng)絡(luò)的收斂速度, 每個BatchSize為64,其中包括32組cover和32組stego,權(quán)值衰減率為2×10-4,學(xué)習(xí)率衰減為0.9,每隔500次迭代進行一次衰減,實驗結(jié)果如表1所示.
根據(jù)表1的實驗結(jié)果分析可知,在嵌入率為10%時,MIN和SIGN隱寫算法的檢測結(jié)果中,cover樣本和stego樣本的檢測正確率均達到了0.92以上.本文所提出的隱寫分析方法能有效區(qū)分cover和stego,但在不同相對嵌入率上的表現(xiàn)有所差異,隨著相對嵌入率的降低,隱寫分析檢測正確率也在下降.
表1 隱寫分析特征有效性測試結(jié)果Table 1 The validity and performance of the steganalysis features
在實際檢測中,檢測方一般處于盲檢測狀態(tài),無法知曉待測樣本的實際相對嵌入率,且相對嵌入率的范圍較廣,在構(gòu)建模型時無法做到枚舉全部的相對嵌入率.因此,通過設(shè)計隱寫分析特征的嵌入率泛化能力測試實驗,來驗證本文所提出的隱寫分析方法對不同嵌入率具有較好的隱寫分析能力.
(2)隱寫分析特征嵌入率泛化能力測試
為驗證本文提出的隱寫分析方法對不同嵌入率具有良好的泛化能力,針對MIN和SIGN隱寫算法分別進行隱寫分析網(wǎng)絡(luò)模型訓(xùn)練,每個網(wǎng)絡(luò)模型訓(xùn)練樣本均包含該隱寫算法對應(yīng)的全部5種相對嵌入率的stego樣本.以Cover_DB和Stego_MIN為例,選取cover樣本7 000個、Stego_MIN(20%)樣本3 500個、Stego_MIN(30%)樣本3 500個作為訓(xùn)練樣本,從5種相對嵌入率的stego樣本中各選取1 000個作為校準(zhǔn)樣本,利用訓(xùn)練好的隱寫分析網(wǎng)絡(luò)模型對余下的所有cover和stego樣本進行檢測.實驗結(jié)果如表2所示.
表2 隱寫分析特征泛化能力測試結(jié)果Table 2 The generalization and performance of the steganalysis features
根據(jù)表2的實驗結(jié)果分析可知,在對MIN和SIGN隱寫算法的檢測結(jié)果中,cover樣本的檢測正確率均達到了0.92以上;在相對嵌入率為10%時,針對兩種隱寫算法所生成的stego樣本的檢測正確率均達到了0.85以上;在相對嵌入率為20%時,針對兩種隱寫算法所生成的stego樣本的檢測正確率均達到了0.93以上.實驗結(jié)果表明,該隱寫分析方法針對同一種隱寫算法的不同相對嵌入率樣本集合,在保證了較高檢測正確率的同時,也具有較好的對于不同嵌入率的泛化檢測能力.
(3)隱寫分析特征通用能力測試
為了進一步驗證所提出的隱寫分析方法在面向不同隱寫算法時,依舊具有較好的通用隱寫分析檢測性能,本文設(shè)計了隱寫分析特征的通用能力實驗,對面向MIN和SIGN隱寫算法的全部5種相對嵌入率進行通用隱寫分析網(wǎng)絡(luò)模型訓(xùn)練.選取cover樣本7 000個、Stego_MIN(20%)樣本1 000個、Stego_MIN(30%)樣本1 500個、Stego_SIGN(20%)樣本2 000個,Stego_SIGN(30%)樣本1 000個及Stego_SIGN(50%)樣本1 500個進行混合模型訓(xùn)練.從不同隱寫算法不同相對嵌入率的stego樣本中各選取1 000個作為校準(zhǔn)樣本,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型對余下的所有樣本進行檢測.
同時,將該實驗結(jié)果與文獻[20]中所提出的基于AAC音頻MDCT系數(shù)的馬爾科夫轉(zhuǎn)移概率和累積鄰接密度矩陣隱寫分析特征進行對比.由于文獻[20]中所提出的隱寫分析特征所針對的是時長為20 s的AAC音頻載體,而本文所針對的音頻載體時長為2 s,為保證在音頻時長維度上的一致性,有效地進行隱寫分析方法的對比評估,本文利用文獻[20]中所提出的隱寫分析方法,針對自建音頻時長為2 s的樣本庫進行特征提取,采用SVM分類器對隱寫分析特征進行分類.同時,根據(jù)原始WAV_DB,制作1 000段音頻時長為20 s的AAC音頻Cover_20s、Stego_MIN_20s及Stego_SIGN_20s樣本,利用SVM分類器對文獻[20]中的隱寫分析特征信息檢測.具體實驗結(jié)果如表3所示.
表3 隱寫分析特征通用性對比結(jié)果Table 3 The universality and performance of the steganalysis features
根據(jù)表3的實驗結(jié)果分析可知,當(dāng)音頻時長為2 s時,本文所提出的隱寫分析混合模型對cover樣本的平均檢測正確率達到了0.82以上;在相對嵌入率為10%時,針對兩種隱寫算法所生成的stego樣本的平均檢測正確率達到了0.84以上;在相對嵌入率為100%時,平均檢測正確率達到了0.90以上.
對比隱寫分析算法,在音頻時長為20 s時,針對高嵌入率(相對嵌入率為50%、100%)具有較好的檢測效果,平均檢測正確率高于本文所提出的方法.在低嵌入率(相對嵌入率為10%、20%)條件下,隱寫分析檢測效果低于本文所提出的隱寫分析算法.在音頻時長為2 s的條件下,文獻[20]所提出的隱寫分析特征組合的檢測性能較差;在相對嵌入率不超過30%時,該隱寫分析特征對于cover和stego樣本幾乎沒有區(qū)分能力.相比較之下,本文提出的基于深度殘差網(wǎng)絡(luò)的隱寫分析模型在音頻時長較短、相對嵌入率較低的情況下,依舊具有良好的隱寫分析檢測性能,且優(yōu)于對比算法,證明本隱寫分析方法針對不用隱寫算法的不同嵌入率具有較好的通用性.
以上三個實驗綜合表明,本文提出的基于深度殘差神經(jīng)網(wǎng)絡(luò)的隱寫分析方法具有良好的隱寫分析特征表達能力,且針對不同的隱寫算法和相對嵌入率具有較好的泛化能力和通用性.與現(xiàn)有的針對MDCT系數(shù)域的隱寫分析方法進行對比,在音頻市場較短且相對嵌入率較低時,檢測效果具有明顯提升,在高嵌入率時,隱寫分析性能依舊表現(xiàn)良好.
本文利用深度殘差網(wǎng)絡(luò)的強大特征表達能力,將專家先驗知識與深度殘差網(wǎng)絡(luò)相結(jié)合,提出了一種面向AAC音頻MDCT系數(shù)域的隱寫分析方法,實現(xiàn)了對MDCT系數(shù)域的有效隱寫分析檢測.隱寫分析框架主要包括:MDCT系數(shù)預(yù)處理模塊、網(wǎng)絡(luò)主體模塊以及分類模塊.在MDCT系數(shù)預(yù)處理模塊中,構(gòu)建MDCT系數(shù)的多元線性擬合預(yù)測函數(shù),量化分析音頻幀間與幀內(nèi)MDCT系數(shù)之間的連續(xù)性和相關(guān)性.根據(jù)分析結(jié)果設(shè)計出4種固定值濾波器,以降低音頻內(nèi)容對隱寫分析特征的干擾.在隱寫分析網(wǎng)絡(luò)主體結(jié)構(gòu)中,設(shè)計了3種不同的卷積單元,完成了對待測音頻的深度隱寫分析特征提取,在提高深度神經(jīng)網(wǎng)絡(luò)收斂速度的同時,提升了隱寫分析檢測結(jié)果,最終實現(xiàn)針對AAC音頻MDCT系數(shù)域的隱寫分析方法.實驗結(jié)果表明,在編碼碼率為32 Kbps、音頻時長為2 s的情況下,針對cover樣本的平均檢測正確率能達到0.82以上,針對相對嵌入率為10%的stego,平均檢測正確率能達到0.84以上,針對相對嵌入率為100%的stego,平均檢測正確率能達到0.90以上.相較于對比算法,本文提出的隱寫分析方法的檢測性能具有明顯提升.
鑒于AAC音頻與MP3音頻在編碼原理上的相似性,本文提出的隱寫分析網(wǎng)絡(luò)框架也可應(yīng)用于基于MP3音頻MDCT系數(shù)修改的隱寫算法檢測分析.同時,該隱寫分析方法可作為生成式對抗網(wǎng)絡(luò)(Generative adversarial networks)模型中的判別模型,用以提升對應(yīng)隱寫算法的安全性和不可檢測性.