国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于廣義高斯模型的音頻篡改盲檢測(cè)

2013-09-10 01:18林曉丹
關(guān)鍵詞:廣義高斯錄音

林曉丹

(華僑大學(xué) 信息科學(xué)與工程學(xué)院,福建 廈門361021)

0 引 言

圖像、音頻和視頻編輯處理技術(shù)的發(fā)展使得篡改多媒體信息變得容易和快捷,數(shù)字媒體的真實(shí)性也正面臨著前所未有的挑戰(zhàn)。人們獲取信息的來源越來越廣泛,然而精心制作的圖像和音視頻可以輕而易舉地蒙蔽人們的感官,即使專業(yè)人士也很難辨識(shí)真?zhèn)?。特別是圖像和錄音作為法庭證據(jù)時(shí),其可靠性往往會(huì)影響司法判決的公正。網(wǎng)絡(luò)上獲取的新聞圖片和錄音是否可信,也對(duì)傳播行業(yè)造成了巨大的沖擊。因此,如何保證多媒體信息的真實(shí)性和完整性的問題變得迫在眉睫,數(shù)字多媒體取證技術(shù)[1]應(yīng)運(yùn)而生?,F(xiàn)有的取證技術(shù)根據(jù)是否需要輔助信息分為兩種,即主動(dòng)取證和被動(dòng)取證。數(shù)字水印是主動(dòng)取證技術(shù)的典型代表,要求預(yù)先在數(shù)字媒體中嵌入水印,接收者則利用水印信息的受損程度檢驗(yàn)數(shù)字媒體的完整性[2]。這項(xiàng)技術(shù)要求錄制設(shè)備必須具有水印嵌入能力,而目前大多數(shù)設(shè)備并不具備這樣的功能。此外,嵌入的水印信息也可能遭受各種惡意攻擊而被破壞,失去了它本應(yīng)具有的驗(yàn)證功能。與主動(dòng)取證不同,被動(dòng)取證不依賴于任何標(biāo)識(shí)信息就能完成對(duì)數(shù)字媒體真?zhèn)涡缘蔫b別,因而更具實(shí)用性。然而,被動(dòng)取證技術(shù)所能利用的信息非常有限——只有待認(rèn)證的媒體內(nèi)容本身,因此也增加了取證的難度。

數(shù)字圖像的被動(dòng)取證方法主要圍繞著幾個(gè)方面進(jìn)行[3-4]:①基于自然圖像的統(tǒng)計(jì)特征,例如雙相干系數(shù)、鄰域像素分布重心等;②基于場景約束的方法,例如利用光照方向的一致性;③基于成像設(shè)備特征的方法,例如CFA插值檢測(cè);④針對(duì)特定篡改方法和特殊格式圖像的取證,例如針對(duì)JPEG圖像合成偽造[5]、圖像雙重壓縮的檢測(cè)[6-7]。相對(duì)數(shù)字圖像取證而言,現(xiàn)有的數(shù)字音頻被動(dòng)取證研究還相對(duì)匱乏。鑒于數(shù)字音頻在時(shí)域體現(xiàn)的非平穩(wěn)性、幅值的連續(xù)變化特性,以及音頻錄制與圖像成像過程的不同,數(shù)字圖像取證方法對(duì)音頻信號(hào)并不適用。已有的音頻被動(dòng)取證方法主要有幾種:①基于錄音中電網(wǎng)頻率的分析,檢測(cè)內(nèi)容的完整性和錄音時(shí)間[8-9];②基于音頻自身特性的變化分析篡改痕跡,由于音頻篡改引入的非線性,分析雙譜特征和高階統(tǒng)計(jì)量可檢測(cè)是否有篡改發(fā)生[10];③基于錄音設(shè)備的分析,例如文獻(xiàn) [11]提取近似無音段的傅里葉系數(shù)直方圖作為特征,實(shí)現(xiàn)對(duì)麥克風(fēng)的分類;④基于錄音環(huán)境的分析,文獻(xiàn) [12]利用房間的反射效應(yīng)產(chǎn)生的音頻回響,估計(jì)回響時(shí)間并利用該特征進(jìn)行取證,文獻(xiàn) [13]提出了一種估計(jì)背景噪聲的方法,利用噪聲一致性進(jìn)行檢測(cè);⑤針對(duì)特殊音頻格式和特定篡改方法的取證,例如文獻(xiàn) [14]利用幀偏移檢測(cè) MP3音頻是否被篡改,文獻(xiàn)[15]通過分析音頻二次壓縮引起的頻域系數(shù)變化檢測(cè)MP3音頻的真實(shí)性,文獻(xiàn) [16]則通過分析音頻信號(hào)各子帶頻譜的波動(dòng)程度檢測(cè)音頻是否經(jīng)過重采樣和拼接,并且該方法能夠估算信號(hào)插值前的原始采樣率。

針對(duì)目前大多數(shù)音頻被動(dòng)取證技術(shù)仍無法定位篡改位置的問題,且直接獲取的錄音信號(hào)通常未經(jīng)壓縮。本文選取未壓縮音頻作為研究對(duì)象,在對(duì)原始音頻和偽造音頻的MDCT系數(shù)分析的基礎(chǔ)上,采用廣義高斯模型對(duì)兩類音頻MDCT域統(tǒng)計(jì)特性進(jìn)行建模,獲取其形狀參數(shù)的變化特征,提出了一種能夠鑒別音頻真?zhèn)蔚姆椒ú⑦M(jìn)行篡改定位。

1 MDCT域統(tǒng)計(jì)建模

1.1 MDCT子帶濾波原理

和大多頻域變換方法類似,MDCT子帶濾波是對(duì)DCT(離散余弦變換)的一種改進(jìn),能夠?qū)r(shí)域內(nèi)相關(guān)性很強(qiáng)的信號(hào)轉(zhuǎn)換成變換域的一組系數(shù),有效減弱了變換域內(nèi)系數(shù)的相關(guān)性。并且,變換域中的大部分系數(shù)接近于零,信號(hào)能量有效地集中在少數(shù)系數(shù)上。相對(duì)DCT變換而言,由于MDCT變換采用了時(shí)域混疊消除技術(shù),能夠有效降低量化失真所引起的邊界效應(yīng)。MDCT定義如下

式中:h(n)——滿足時(shí)域混疊消除的窗函數(shù)。由式 (1)可見,MDCT變換實(shí)質(zhì)上是一種子帶分析濾波方法,將輸入信號(hào)x(n)調(diào)制到N個(gè)不同的子帶上輸出。圖1給出了一個(gè)包含2048個(gè)樣點(diǎn)音頻幀的MDCT系數(shù)。由圖1結(jié)果可見,音頻信號(hào)經(jīng)過MDCT變換后,大部分系數(shù)接近于0,能量幾乎都集中在低頻成分上。

此外,由式 (1)可知,對(duì)于輸入長度為2 N的音頻幀,輸出只有N個(gè)MDCT系數(shù)。因此對(duì)信號(hào)加窗時(shí),使前一幀和后一幀存在50%的混疊。對(duì)于音頻篡改而言,由于篡改可能發(fā)生在幀邊界處,所以這種混疊技術(shù)有利于檢測(cè)發(fā)生在幀邊界的篡改。

1.2 MDCT系數(shù)統(tǒng)計(jì)建模

圖1 音頻MDCT變換結(jié)果

圖2(a)和圖2(b)分別給出了原始音頻和偽造音頻經(jīng)過分幀后,進(jìn)行MDCT變換取其高頻成分得到的統(tǒng)計(jì)直方圖。圖2中結(jié)果可見,兩類音頻高頻成分的統(tǒng)計(jì)直方圖,在0附近均出現(xiàn)尖銳的峰值,而遠(yuǎn)離0處則出現(xiàn)嚴(yán)重的拖尾,呈現(xiàn)出非高斯分布。對(duì)于此類具有尖銳峰值及厚重拖尾的分布,較有效的做法是采用更為靈活的廣義高斯模型進(jìn)行擬合。為此,本文采用廣義高斯模型對(duì)各音頻幀MDCT系數(shù)分布進(jìn)行建模。

圖2 音頻MDCT系數(shù)直方圖及廣義高斯擬合

1.3 廣義高斯模型的參數(shù)估計(jì)

廣義高斯分布具有如下概率密度函數(shù)形式

圖2(a)和圖2(b)還分別給出了原始音頻和篡改音頻采用廣義高斯擬合的結(jié)果,圖2結(jié)果可見,MDCT系數(shù)呈指數(shù)衰減,廣義高斯模型對(duì)其擬合的結(jié)果較為準(zhǔn)確。盡管原始音頻和偽造音頻的MDCT系數(shù)都可用廣義高斯分布進(jìn)行擬合,然而其衰減速度不同。因此,本文利用這一特征實(shí)現(xiàn)對(duì)音頻真?zhèn)蔚臋z測(cè)。有效估計(jì)廣義高斯分布的形狀參數(shù)α對(duì)檢測(cè)準(zhǔn)確率非常重要,本文采用最大似然估計(jì)(MLE)算法對(duì)α進(jìn)行估計(jì)。對(duì)于變換后的一組MDCT系數(shù)x=(x1,…xN),定義似然函數(shù)

式 (3)分別對(duì)參數(shù)α和β求取一階導(dǎo)數(shù),并令一階導(dǎo)數(shù)為0。得到

其中 Ψ(z)= ?!洌▃)/Γ(z)。

求解上述方程得到尺度參數(shù)的估值

代入式 (4)可得

利用Newton-Raphson迭代法對(duì)式 (7)進(jìn)行求解,得到形狀參數(shù)α的最大似然估計(jì)。將α的估值代入式 (6)得到尺度參數(shù)的估值β∧。

2 音頻篡改檢測(cè)

由于高頻分量對(duì)樣本不連續(xù)性更為敏感,而低頻分量則更多地反映了音頻內(nèi)容。因此,本文對(duì)音頻分幀后計(jì)算MDCT系數(shù)并取其高頻成分進(jìn)行分析,用上述方法擬合MDCT域高頻系數(shù)直方圖,得到各音頻幀廣義高斯分布的形狀參數(shù)α。圖3(a)和圖3(b)分別為一段原始語音信號(hào)以及對(duì)該語音進(jìn)行局部替換后的偽造信號(hào)。圖4則給出了對(duì)上面兩段語音各音頻幀擬合得到的形狀參數(shù)。由圖4(a)可見,對(duì)于未篡改的音頻信號(hào),形狀參數(shù)的取值集中在一定的區(qū)間。在對(duì)大量原始音頻進(jìn)行測(cè)試的基礎(chǔ)上,發(fā)現(xiàn)其形狀參數(shù)也幾乎落在同一區(qū)間內(nèi)。而經(jīng)過篡改的音頻信號(hào),在篡改發(fā)生處的音頻幀和前面音頻幀的相關(guān)性大大減弱,導(dǎo)致上述范圍的形狀參數(shù)無法準(zhǔn)確擬合該位置的MDCT系數(shù)。因此,通過設(shè)置合適的形狀參數(shù)閾值可以檢測(cè)出篡改發(fā)生的位置。這里需要設(shè)置檢測(cè)閾值的上限λ2和下限λ1。當(dāng)α>λ2或α<λ1時(shí)都認(rèn)為在該位置發(fā)生了篡改。圖4(b)可見,在音頻的第17幀和20幀之間發(fā)生了篡改。

3 仿真實(shí)驗(yàn)與結(jié)果分析

實(shí)驗(yàn)中采用不同的錄音設(shè)備錄制了50段原始語音 (包含男聲和女聲各25段),采樣率都為16kHz。在不改變采樣率的情況下,分別對(duì)這50段錄音進(jìn)行拼接、替換,刪除篡改得到150段偽造的語音信號(hào),將這200段錄音作為測(cè)試樣本。此外,實(shí)驗(yàn)中還采用50段采樣率為44.1kHz的wav音樂信號(hào)作為另一組測(cè)試信號(hào),保持原有的采樣率,分別對(duì)這組測(cè)試信號(hào)進(jìn)行拼接、替換和刪除得到150段篡改的音樂信號(hào),因此也得到200個(gè)測(cè)試音頻。實(shí)驗(yàn)中采用的音頻幀長為2048。

表1給出了對(duì)上述400段測(cè)試音頻,檢測(cè)閾值λ1和λ2分別設(shè)為0.5和2時(shí),針對(duì)不同篡改本文方法的檢測(cè)正確率。表1結(jié)果可見,本文方法對(duì)于語音和音樂信號(hào)篡改檢測(cè)都具有較高的準(zhǔn)確率。表1還給出了本文方法與經(jīng)典的基于信號(hào)雙譜特征檢測(cè)方法 (文獻(xiàn) [10])的性能比較。盡管文獻(xiàn) [10]對(duì)于拼接、替換和刪除篡改同樣具有良好的檢測(cè)準(zhǔn)確率,然而對(duì)100段原始音頻信號(hào)的測(cè)試,虛警率卻比本文方法高了許多。此外,文獻(xiàn) [10]無法定位發(fā)生在幀邊界處的篡改。由于采用了改進(jìn)離散余弦變換,下一幀MDCT變換需要利用前一幀的樣點(diǎn),因此,對(duì)于發(fā)生在幀邊界處的篡改,本文的方法也能正確定位。圖5分別給出了對(duì)200段語音和200段音樂進(jìn)行測(cè)試得到的ROC曲線。圖5結(jié)果可見,本文方法對(duì)語音信號(hào)的檢測(cè)正確率更高一些,因?yàn)檎Z音信號(hào)的短時(shí)相關(guān)性更為明顯,且具有較穩(wěn)定的頻譜分布。

表1 本文算法的檢測(cè)正確率

圖5 語音和音樂信號(hào)ROC曲線

4 結(jié)束語

本文闡述了一種數(shù)字音頻被動(dòng)取證方法。在分析音頻篡改前后MDCT域統(tǒng)計(jì)特性變化的基礎(chǔ)上,本文采用廣義高斯模型對(duì)音頻的MDCT系數(shù)進(jìn)行概率分布建模。采用最大似然法估計(jì)各音頻幀MDCT系數(shù)的形狀參數(shù),并將估計(jì)得到的形狀參數(shù)與閾值比較,實(shí)現(xiàn)了音頻篡改盲檢測(cè)。在不改變采樣率的情況下,對(duì)200段語音和200段音樂片段進(jìn)行了篡改檢測(cè)實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,對(duì)于拼接、刪除和替換,無論是語音還是音樂信號(hào),本文方法都能夠正確檢測(cè),檢測(cè)準(zhǔn)確率高于95%。此外,本文方法還能夠準(zhǔn)確定位篡改發(fā)生位置。與現(xiàn)有算法相比,提高了檢測(cè)的可靠性。

[1]HU Yongjian,LIU Feibei,HE Qianhua.Survey on techniques of digital multimedia forensics [J].Journal of Computer Application,2010,30 (3):657-662 (in Chinese).[胡永健,劉緋貝,賀前華.數(shù)字多媒體取證技術(shù)綜述 [J].計(jì)算機(jī)應(yīng)用,2010,30 (3):657-662.]

[2]ZHAO Xuemin,GUO Yuhong,ZOU Xueqiang,et al.Digital audio watermarking algorithm for media copyright management[J].Journal of Electronics &Information Technology,2011,33 (10):2384-2389 (in Chinese). [趙學(xué)敏,郭宇弘,鄒學(xué)強(qiáng),等.用于版權(quán)管理的數(shù)字音頻水印算法 [J].電子與信息學(xué)報(bào),2011,33 (10):2384-2389.]

[3]Sencar H T,Memon N.Overview of state-of-the-art in digital image forensics [M].Part of Indian Statistical Institute Platinum Jubilee Monograph Series Titled Statistical Science and Interdisciplinary Research.USA:World Scientific Press,2008.

[4]WU Qiong,LI Guohui,TU Dan,et al.A survey of blind digital image forensics technology for authenticity detection[J].ACTA Automatica Sinica,2008,34 (12):1458-1466(in Chinese).[吳瓊,李國輝,涂丹,等.面向真實(shí)性鑒別的數(shù)字圖像盲取證技術(shù)綜述 [J].自動(dòng)化學(xué)報(bào),2008,34(12):1458-1466.]

[5]ZHENG Ergong,PING Xijian.Passive-blind forensics for a class of JPEG image forgery [J].Journal of Electronics &Information Technology,2010,32 (2):394-399 (in Chinese).[鄭二功,平西建.針對(duì)一類JPEG圖像偽造的被動(dòng)盲取 [J].電子與信息學(xué)報(bào),2010,32 (2):394-399.]

[6]WANG Junwen,LIU Guangjie,DAI Yuewei,et al.A new method for estimating the primary quantization step of JPEG double-compression [J].Journal of Electronics &Information Technology,2009,31 (4):836-839 (in Chinese). [王俊文,劉光杰,戴躍偉,等.一種估計(jì)JPEG雙重壓縮原始量化步長 的 新 方 法 [J].電 子 與 信 息 學(xué) 報(bào),2009,31 (4):836-839.]

[7]LIU Xiaoteng,JING Tao,LU Yanfei,et al.Blind detection of color forgeries using double JPEG quantization properties [J].Signal Processing,2011,27 (1):136-142 (in Chinese).[劉曉騰,荊濤,盧燕飛,等.基于JPEG雙量化特性的彩色偽造圖像盲檢測(cè) [J].信號(hào)處理,2011,27 (1):136-142.]

[8]Huijbregtse M,Geradts Z.Using the ENF criterion for determining the time of recording of short digital audio recordings[C]//Proc 3rd Int’l Workshop Computational Forensics.Springer Verlag,2009:116-124.

[9]Grigoras C.Applications of ENF criterion in forensic audio,video,computer and telecommunication analysis [J].Forensic Science Int’l,2007,167 (2):136-145.

[10]GAO Yang,HUANG Zheng,XU Che.Detection of audio forgeries based on bispectral analysis [J].Information Security and Communications Privacy,2008 (2):94-96 (in Chinese).[高陽,黃征,徐徹.基于高階頻譜分析的音頻篡改鑒定 [J].信息安全與通信保密,2008 (2):94-96.]

[11]Buchholz R,Kraetzer C,Dittman J.Microphone classification using fourier coefficients,information hiding [G].LNCS 5806:11th International Workshop.Springer Berlin Heidelberg,2009:235-246.

[12]Malik H,F(xiàn)arid H.Audio forensics from acoustic reverberation [C]//International Conference on Acoustics,Speech,and Signal Processing,2010:1710-1713.

[13]Ikram S,Malik H.Digital audio forensics using background noise [C]//Magdeburg,Germany:Proc of 6th ACM Multimedia and Security Workshop,2004:25-34.

[14]Yang R,Qu Z,Huang J.Detecting digital audio forgeries by checking frame offsets [C]//Proc 10th ACM Workshop Multimedia and Security,ACM Press,2008:21-26.

[15]Liu Q,Sung A H,Qiao M.Detection of double MP3compression [J].Cognitive Computing,2010,2 (4):291-296.

[16]DING Qi,PING Xijian.Audio tampering detection based on band-partitioning spectral smoothness [J].Journal of Applied Science,2010,28 (2):142-146 (in Chinese). [丁琦,平西建.基于子帶平滑度的音頻篡改檢測(cè) [J].應(yīng)用科學(xué)學(xué)報(bào),2010,28 (2):142-146.]

猜你喜歡
廣義高斯錄音
Rn中的廣義逆Bonnesen型不等式
Funny Phonics
funny phonics
Listen and Choose
數(shù)學(xué)王子高斯
Listen and Color
天才數(shù)學(xué)家——高斯
從廣義心腎不交論治慢性心力衰竭
王夫之《說文廣義》考訂《說文》析論
廣義RAMS解讀與啟迪