徐子棟,張 中
(中國政法大學(xué) 證據(jù)科學(xué)研究院,北京100088)
視頻篡改取證是取證過程中的一個重要研究方向。利用視頻水印判斷視頻的真實性時,需要將數(shù)據(jù)嵌入原始數(shù)據(jù)中,從而破壞原始數(shù)據(jù)的結(jié)構(gòu)[1]。根據(jù)視頻取證的特點,可以將其分為3類:自然視頻統(tǒng)計特征、偽造痕跡和成像設(shè)備一致性。但大部分視頻取證方法的計算過程較為復(fù)雜,且只對某種篡改偽造視頻有效,在轉(zhuǎn)角、裁減等篡改手段中被動取證技術(shù)難以改變固有操作方式,因此是無效的[2]。在實際生活中篡改者通常會采用多種方式對視頻進(jìn)行篡改,因此需要對數(shù)字視頻篡改取證方法進(jìn)行分析和研究。
郭繼昌等[3]提出基于馬爾科夫特征和LBP(Local Binary Patterns)的視頻篡改取證方法,采用LBP算子對視頻進(jìn)行處理,通過壓縮處理獲取數(shù)字視頻的JPEG(Joint Photographic Experts Group)矩陣,并計算矩陣在不同方向中對應(yīng)的一階差分矩陣,在一階差分矩陣的基礎(chǔ)上獲取視頻圖像的馬爾科夫特征,利用支持向量機(jī)完成取證。但該方法無法消除數(shù)字視頻中存在的噪聲,導(dǎo)致取證結(jié)果的誤差較大使取證偏差大。梅臘臘等[4]提出基于噪聲水平估計的數(shù)字視頻篡改取證方法,該方法首先利用小波變換處理各視頻幀,其次由傅立葉變換其時域序列,根據(jù)計算結(jié)果對幅頻譜在視頻幀中對應(yīng)的峰均比進(jìn)行計算,對數(shù)字視頻是否被篡改進(jìn)行識別,實現(xiàn)數(shù)字視頻篡改取證。但該方法在取證過程中容易受到噪聲的干擾,提取的視頻證據(jù)缺失值較大。李猛等[5]提出基于TCS-LBP(Temporal Center-Symmetric LBP)算子的數(shù)字視頻篡改取證方法,該方法利用TCS-LBP算子分析不同像素幀在空間中存在的位置關(guān)系,根據(jù)分析結(jié)果對TCS-LBP特征值進(jìn)行計算,將其作為判斷值對數(shù)字視頻中的篡改區(qū)域進(jìn)行檢測,實現(xiàn)數(shù)字視頻篡改取證。但該方法對篡改視頻進(jìn)行取證前沒有消除數(shù)字視頻中存在的噪聲,導(dǎo)致提取的視頻片段變形嚴(yán)重。為解決上述方法中存在的問題,筆者提出基于人工免疫的數(shù)字視頻篡改取證方法。
基于人工免疫的數(shù)字視頻篡改取證方法是結(jié)合塊和低秩張量實現(xiàn)數(shù)字視頻的去噪處理。
張量屬于矩陣和向量的高階推廣,通常情況下最小需要3個變量描述張量元素所處的位置,高維數(shù)據(jù)的結(jié)構(gòu)可通過這種多線性的結(jié)構(gòu)得以體現(xiàn)[6]。用D∈RI1×I2…×IN描述N階張量,其大小為I1×I2…×IN。
按照第n維重新對張量D中存在的元素進(jìn)行排列,獲得大小為In(In+1…INI1…In-1)的n-模式展開矩陣D(n)=unfold(D,n),矩陣中(in,j)處的元素與張量中(i1,i2,…,iN)處的元素相對應(yīng)。
重新對n-模式展開矩陣D(n)中存在的元素進(jìn)行組合,獲得張量D=fold(D(n),n)。
用rankn(D)描述張量D的n-秩矩陣D(n),Tucker秩表示張量D中的N個n-秩構(gòu)成的集合。
對低秩張量矩陣進(jìn)行恢復(fù)處理。其中λ為固定常量。在Tucker分解原理的基礎(chǔ)上用凸優(yōu)化問題代替張量恢復(fù)問題
5)設(shè)定收斂條件‖D-Ak+1-Ek+1‖F(xiàn)/‖Di‖F(xiàn)<ε2,其中參數(shù)ε2為大于零的正數(shù)。
張量D通過上述過程分離出低秩部分A和稀疏部分D。
基于人工免疫的數(shù)字視頻篡改取證方法對數(shù)字視頻去噪的過程如下。
1)當(dāng)視頻中存在大量噪聲時,噪聲會對相似塊的匹配過程產(chǎn)生干擾[8]。針對上述問題,基于人工免疫的數(shù)字視頻篡改取證方法采用中值濾波器預(yù)濾波處理含噪視頻,提取去噪處理后的視頻序列。
2)設(shè)置di,j為參考塊,其大小為n×n,在參考塊的基礎(chǔ)上選取窗口Ω(i,j)=l×(n×n)×f,其中f為視頻幀數(shù),l為正整數(shù)。在窗口中利用l2范數(shù)獲取與di,j相似度較高的圖像塊dx,y,構(gòu)建集合Γi,j
設(shè)DΓi,j=(dΓi,j(1),dΓi,j(2),…,dΓi,j(m))為三階張量,由相似度較高的m個圖像塊構(gòu)成,其中di,j為第k個與參考塊相似的圖像塊。
3)通過
基于人工免疫的數(shù)字視頻篡改取證方法采用人工免疫算法構(gòu)建數(shù)字視頻篡改取證模型,實現(xiàn)數(shù)字視頻的篡改取證。
人工免疫系統(tǒng)結(jié)構(gòu)如圖1所示。
圖1 人工免疫系統(tǒng)結(jié)構(gòu)Fig.1 Structure of artificial immune system
處于未成熟狀態(tài)的免疫細(xì)胞經(jīng)過耐受期后會進(jìn)化為成熟的免疫細(xì)胞,處于成熟狀態(tài)下的免疫細(xì)胞的生命周期輕易不會發(fā)生改變,若免疫細(xì)胞在生命周期內(nèi)不能匹配抗原,就會逐漸死亡;反之,則會被激活。當(dāng)細(xì)胞處于活化狀態(tài)時,如果不能被共刺激,就會產(chǎn)生誤認(rèn),即抗原被識別為自身的抗原,錯誤的免疫細(xì)胞需要被清除;反之,處于活化狀態(tài)時,則會變成記憶細(xì)胞。如果記憶細(xì)胞找到合適的抗原并與之匹配,它們就會被激活。在免疫過程中,成熟的免疫細(xì)胞或記憶細(xì)胞與相應(yīng)的抗原匹配,激活取證細(xì)胞,進(jìn)行數(shù)字視頻篡改取證。
基于人工免疫的數(shù)字視頻篡改取證方法通過集合代數(shù)法描述時間變化下記憶細(xì)胞集合Mb、抗原集合G、自體集合SSelf、成熟細(xì)胞集合Tb、未成熟細(xì)胞集合Ib和動態(tài)取證細(xì)胞的整個演化過程。
1)自體動態(tài)演化模型。通過模型
描述自體在時間變化下的動態(tài)演化過程。其中xi∈D為自體在初始進(jìn)化過程中構(gòu)成的集合,δ為抗原更新周期。自體集合SSelf在抗原更新周期δ內(nèi)保持不變,新的自體集合在抗原周期δ結(jié)束后會代替自體集合SSelf。
動態(tài)自體模型的主要目的是分析自體在網(wǎng)絡(luò)環(huán)境中的演化情況。
2)抗原動態(tài)演化模型
其中集合sG為由一定比例η自體和非自體元素構(gòu)成的,GNonself(t)為非自體抗原,時在免疫網(wǎng)絡(luò)中獲取的,Mnew(t)為新生的記憶細(xì)胞。
3)數(shù)字視頻篡改取證模型
其中Γnew(t)為t時刻收集的視頻篡改證據(jù),x為被截獲的數(shù)據(jù),y′為間接證據(jù)呈供,s′為證據(jù)對應(yīng)的數(shù)字簽名。
為驗證基于人工免疫的數(shù)字視頻篡改取證方法的整體有效性,需要對基于人工免疫的數(shù)字視頻篡改取證方法進(jìn)行測試,實驗所用的計算機(jī)配置為Windows7系統(tǒng)、處理器3.6 GHz。分別采用基于人工免疫的數(shù)字視頻篡改取證方法(方法1)、基于馬爾科夫特征和LBP的視頻篡改取證方法(方法2)以及基于噪聲水平估計的數(shù)字視頻篡改取證方法(方法3)對相同數(shù)字篡改視頻進(jìn)行取證,測試結(jié)果如圖2所示。
圖2 不同方法的取證結(jié)果Fig.2 Forensic results of different methods
圖2中虛線框是不同方法的取證結(jié)果。對圖2進(jìn)行分析可知,采用方法1對3段視頻進(jìn)行取證時,取證結(jié)果就是視頻被篡改的部分,采用方法2和方法3對3段視頻進(jìn)行取證時,難以準(zhǔn)確圈定視頻被篡改的區(qū)域。通過上述分析可知,方法1可以準(zhǔn)確地實現(xiàn)數(shù)字視頻篡改取證,因為方法1對數(shù)字視頻進(jìn)行取證前,對數(shù)字視頻進(jìn)行了去噪處理,可以在無噪聲干擾下準(zhǔn)確實現(xiàn)數(shù)字視頻篡改取證。
對不同方法的有效性進(jìn)行測試,將視頻缺失值和視頻變形情況作為測試指標(biāo),測試結(jié)果分別如圖3和圖4所示。
圖3 視頻缺失值測試結(jié)果Fig.3 Video missing value test results
圖4 視頻變形情況測試結(jié)果Fig.4 Video distortion test results
由圖3可知,方法1提取的視頻幀的缺失值均在50以下,對取證產(chǎn)生的影響極小,可忽略不計,方法2和方法3提取的視頻幀的缺失值在100~150內(nèi)波動,影響取證結(jié)果。根據(jù)圖4可知,方法1提取的視頻變形系數(shù)在0.2附近波動,方法2提取的第3幀視頻的變形系數(shù)高達(dá)0.6,方法3提取的第2幀視頻的變形系數(shù)高達(dá)0.7。通過上述分析可知,方法1提取的視頻證據(jù)存在輕微的變形,可準(zhǔn)確實現(xiàn)視頻篡改取證。
總之,筆者采用基于張量的增強(qiáng)拉格朗日乘子方法重建視頻稀疏低階部分,將噪聲與數(shù)字視頻分離,避免了取證過程中的噪聲干擾導(dǎo)致視頻丟失和變形,從而提高了整體性能。
圖像視頻處理軟件功能日益強(qiáng)大,數(shù)碼相機(jī)的質(zhì)量不斷提高,在此背景下,越來越容易對數(shù)字視頻進(jìn)行篡改,人眼難以發(fā)現(xiàn)被篡改的數(shù)字視頻,因此需要對數(shù)字視頻篡改取證方法進(jìn)行研究。目前數(shù)字視頻篡改取證方法存在取證誤差大、視頻缺失值高和視頻變形嚴(yán)重的問題,為此,筆者提出了基于人工免疫的數(shù)字視頻篡改取證方法。首先對數(shù)字視頻進(jìn)行去噪處理,其次采用人工免疫算法構(gòu)建取證模型,完成數(shù)字視頻的篡改取證,解決了目前方法中存在的問題,提高了視頻的真實性。