包 清 ,王世全,呂 晨
(1.上海市公安局刑事偵查總隊(duì),上海200083;2.上海理工大學(xué),上海 200093;3.中國刑事警察學(xué)院,沈陽110035)
隨著現(xiàn)代化辦公設(shè)備的普及,激光打印文件的出現(xiàn)率顯著上升。對(duì)于激光打印文件來說目前的檢驗(yàn)所依靠的特征主要是感光鼓損傷或劃痕,這類特征價(jià)值雖然高但出現(xiàn)率低,目前對(duì)于機(jī)具類的檢驗(yàn)尚無使用率高、可靠的方法[1]。本文旨在利用傅里葉級(jí)數(shù)展開的算法找出不同型號(hào)激光打印機(jī)具甚至是同型號(hào)不同臺(tái)激光打印機(jī)打印過程中形成的差異。
不同品牌、型號(hào)的激光打印機(jī)內(nèi)部結(jié)構(gòu)及傳動(dòng)部件之間存在差異,同一型號(hào)的激光打印機(jī)在生產(chǎn)和使用中存在公差和裝配、磨損上的差異,這些差異會(huì)導(dǎo)致掃描線在走紙方向上速度周期性振蕩,在紙面上形成周期性疏密分布的掃描線,導(dǎo)致紙面上的電荷密度也產(chǎn)生上述分布,引起吸附墨粉數(shù)量的變化,產(chǎn)生灰度的周期性變化[2-3]。對(duì)于不同型號(hào)的打印機(jī)具,內(nèi)部可能存在著結(jié)構(gòu)性差異,所使用齒輪、多棱鏡等部件參數(shù)上也有著較大差異。而同一型號(hào)的激光打印機(jī)則不存在上述差異,個(gè)體間的差異來源于裝配誤差、使用時(shí)的磨損和生產(chǎn)時(shí)的公差[4]。所以理論上不同型號(hào)機(jī)具之間的差異顯著大于相同型號(hào)機(jī)具之間的差異。為了考察算法的普適性,將實(shí)驗(yàn)分為不同型號(hào)機(jī)具之間的比對(duì)與相同型號(hào)機(jī)具之間的比對(duì)。目前對(duì)于這種掃描線疏密分布周期性變化而產(chǎn)生的特征采用的處理辦法為快速傅里葉變換算法。快速傅里葉變換實(shí)質(zhì)是傅里葉變換的近似替代,可將計(jì)算量下降到原有的1%[5-6],本次實(shí)驗(yàn)所采用的方法是帶有圖像預(yù)處理的傅里葉展開算法。
本實(shí)驗(yàn)基于Matlab平臺(tái),處理步驟大致如下所述:1)把使用數(shù)碼相機(jī)拍攝獲得的筆畫轉(zhuǎn)化為灰度圖像;2)通過圖像處理濾去筆畫周邊的小墨粉顆粒;3)沿著走紙方向提取灰度信息,以水平線上的所有像素點(diǎn)的灰度值均值作為該水平線的灰度反映值,構(gòu)成一維數(shù)組;4)以走紙方向偏移的像素點(diǎn)即數(shù)組中元素的序號(hào)為x值,以該序號(hào)所對(duì)應(yīng)的數(shù)組的值為y值構(gòu)建函數(shù),對(duì)該函數(shù)進(jìn)行級(jí)數(shù)為80級(jí)的傅里葉展開,分別提取正弦和余弦的逐項(xiàng)展開式的系數(shù)并分別保存于兩個(gè)數(shù)組之中;5)分別找出正弦和余弦系數(shù)中比較大的系數(shù),即為灰度信息中包含的掃描線周期性疏密變化的特征,計(jì)算出峰的位置、寬度和高度;6)將從檢材與樣本中提取到的這些峰的特征進(jìn)行適當(dāng)?shù)仄ヅ渑c計(jì)算,得出檢材與樣本的綜合差異值,該值越大檢材與樣本之間的差異越大,反之則說明檢材與樣本越相似。
使用不同型號(hào)的激光打印機(jī)具在默認(rèn)條件下打印相同內(nèi)容一份,字體大小為72。本次實(shí)驗(yàn)所涉及的激光打印機(jī)的型號(hào)有:Cannon LBP 5050N,HP 2035n,HP LjM401n,HP Lj500 M551,HP CP2025甲,HP CP2025乙。其中HP CP2025甲與HP CP2025乙為同型號(hào)但不同臺(tái)。對(duì)于該批次的樣本在型號(hào)后加標(biāo)“-1”。經(jīng)過一個(gè)月后,不更換零部件與硒鼓,仍然使用上述相同的機(jī)具再次在默認(rèn)條件下打印相同內(nèi)容一份,對(duì)于該批次的樣本在型號(hào)后加標(biāo)“-2”。為了排除掃描儀掃描所引入的干擾,使用專業(yè)級(jí)的佳能數(shù)碼單反相機(jī)和100 mm微距鏡頭,將打印文件翻拍獲得原始圖像,控制每次翻拍時(shí)的光照條件和翻拍條件:M1畫質(zhì);光圈F-18;感光度iso200;快門速度1.6 s,防止光照條件的變化對(duì)結(jié)果產(chǎn)生影響。本次實(shí)驗(yàn)所選取的筆畫均為較長的豎直走向的筆畫,依次為“像”“于”“葉”三字的長豎畫,其它類型筆畫實(shí)驗(yàn)效果差,原因詳見討論部分。
使用Matlab編程核心內(nèi)容如下。
第一部分:圖像的預(yù)處理。把圖像轉(zhuǎn)化為灰度圖像,去除筆畫邊緣的“毛刺”,截取一定長度的筆畫,以水平線上所有像素點(diǎn)的平均灰度值代表該水平位置的灰度值,沿著豎直方向得到一個(gè)灰度曲線。
第二部分:選取與計(jì)算。從圖像中截取出一段固定起點(diǎn)的1000像素點(diǎn)長度的灰度曲線,以1000像素點(diǎn)長度為基頻長度進(jìn)行80級(jí)傅里葉展開,獲得80個(gè)正弦展開系數(shù)和余弦展開系數(shù)各一組,從這80個(gè)系數(shù)中分別取出絕對(duì)值最大的15個(gè)能夠反映出掃描線周期性疏密變化的“特征峰”。
第三部分:綜合評(píng)判。即使同臺(tái)機(jī)具兩次的結(jié)果也不會(huì)完全一致,如何區(qū)別該差異是不同臺(tái)間的本質(zhì)性差異還是同臺(tái)的正常變動(dòng)對(duì)于該方法是否可行具有決定性的意義。為此該程序通過對(duì)于“峰”的位置、高度、寬度的全面提取,建立了一個(gè)三維歐式空間,利用智能匹配的算法對(duì)檢材與樣本的“峰”進(jìn)行匹配,匹配結(jié)果以一個(gè)數(shù)值形式輸出,該數(shù)值表示檢材與樣本在峰的位置、高度、寬度的三維空間中的“距離”,數(shù)值越小說明檢材與樣本越相似。
本次實(shí)驗(yàn)以Cannon LBP 5050N-1為檢材,其余打印內(nèi)容為比對(duì)樣本。所得實(shí)驗(yàn)結(jié)果如表1~表3所示。
表2 “于”字豎畫比對(duì)結(jié)果Table 2 The comparison of printed Chinese letter “于” (yu)
表3 “葉”字豎畫比對(duì)結(jié)果Table 3 The comparison of printed Chinese letter “葉” (ye)
程序處理后獲得的墨粉顆粒堆積形成的灰度變化曲線如圖1、2所示,其中左側(cè)為檢材灰度曲線,右側(cè)為樣本灰度曲線。
圖1 同臺(tái)機(jī)具實(shí)驗(yàn)結(jié)果(a:檢材;b:樣本)Fig.1 The spectral graph of grayness made by same one printer (ɑ:tested specimen; b: sample)
圖2 不同型號(hào)機(jī)具實(shí)驗(yàn)結(jié)果(a:檢材;b:樣本)Fig.2 The spectral graph of grayness made by the different printer from the one of Fig. 1's (a: tested specimen; b: sample)
本次實(shí)驗(yàn)以HP CP2025甲-1為檢材,HP CP2025甲-2、HP CP2025乙-1、HP CP2025乙-2為比對(duì)樣本。所得實(shí)驗(yàn)結(jié)果如表4~表6所示。
表4 “像”字比對(duì)結(jié)果Table 4 The comparison of Chinese letter “像” (xiang) printed by same one or model-same-yet-machine-different printer
表5 “于”字比對(duì)結(jié)果Table 5 The comparison of Chinese letter “于” (yu) printed by the printer as indicated of Table 4
表6 “葉”字比對(duì)結(jié)果Table 6 The comparison of Chinese letter “葉” (ye) printed by the printer as indicated of Table 4
程序處理后獲得的墨粉顆粒堆積形成的灰度變化曲線如圖3、4所示,其中左側(cè)為檢材灰度曲線,右側(cè)為樣本灰度曲線。
圖3 同臺(tái)機(jī)具實(shí)驗(yàn)結(jié)果(a:檢材;b:樣本)Fig.3 The spectral graph of grayness made by same one printer (a:tested specimen; b: sample)
圖4 相同型號(hào)不同臺(tái)機(jī)具實(shí)驗(yàn)結(jié)果(a:檢材;b:樣本)Fig.4 The spectral graph of grayness made by different printer of the same model as of Fig. 3's (a: tested specimen; b: sample)
從實(shí)驗(yàn)結(jié)果的圖片看,由掃描線疏密變化引起墨粉顆粒附著量差異導(dǎo)致的圖像灰度差異變化很小,灰度曲線在一個(gè)很小的范圍內(nèi)進(jìn)行波動(dòng),通常波動(dòng)范圍僅在10個(gè)灰度值左右,無法從灰度圖像上直接作出判斷。對(duì)該曲線進(jìn)行傅里葉展開將函數(shù)變換到頻域空間所得到的一系列“峰”之間的差異也較小,未見到相關(guān)文獻(xiàn)中極個(gè)別顯著懸殊穩(wěn)定的“超高峰”[7-8],從相關(guān)實(shí)驗(yàn)與理論分析可能與選取的機(jī)具與實(shí)驗(yàn)樣本有著很大的關(guān)系。本次實(shí)驗(yàn)所選取的實(shí)驗(yàn)樣本均未出現(xiàn)嚴(yán)重的瑕疵,墨跡均勻飽滿,若墨跡在走紙方向上已反映出較為明顯的周期性露白,經(jīng)過放大后明顯可見,可作為特征來利用,無需傅里葉變換處理。若對(duì)上述圖像進(jìn)行傅里葉展開,這些固有露白所反映出的頻率信息就會(huì)遮蔽那些細(xì)微的掃描線疏密變化引起的差異。實(shí)驗(yàn)一的比對(duì)結(jié)果中,不同臺(tái)之間的距離值僅有一次小于同臺(tái)間,符合率為95.8%,不同臺(tái)間結(jié)果為同臺(tái)間比對(duì)兩倍以上的樣本共有19個(gè),占79.2%,對(duì)于大部分樣本來說不同臺(tái)間結(jié)果與同臺(tái)間比對(duì)存在著數(shù)量級(jí)上的差異。可以得出結(jié)論,在上述實(shí)驗(yàn)條件下,同臺(tái)機(jī)具所打印出的文件存在著自身的穩(wěn)定性和個(gè)體的差異性并且能夠被上述算法識(shí)別出來。該實(shí)驗(yàn)結(jié)果與理論有著較高的符合度,說明該方法和算法可以用于區(qū)別不同型號(hào)的機(jī)具。
從實(shí)驗(yàn)二中的數(shù)據(jù)可以發(fā)現(xiàn)相同型號(hào)機(jī)具之間的比對(duì)也大致存在上述規(guī)律,但從差異幅度上來說遠(yuǎn)不及不同型號(hào)之間的差異,該實(shí)驗(yàn)結(jié)果也與理論有著較好的符合度。從目前的實(shí)驗(yàn)結(jié)果來看,利用該算法識(shí)別相同型號(hào)的不同臺(tái)機(jī)具雖有一定的依據(jù),但區(qū)分能力還有待提高。
1)翻拍條件必須被嚴(yán)格固定。一系列與翻拍有關(guān)的條件必須保持一致,因?yàn)樗崛〕龅幕叶惹€僅僅是在一個(gè)很窄的范圍內(nèi)波動(dòng),是一個(gè)細(xì)微的特征,一旦上述條件發(fā)生變化會(huì)導(dǎo)致灰度曲線產(chǎn)生巨大的變動(dòng)導(dǎo)致比對(duì)結(jié)果明顯增大喪失同臺(tái)之間的相對(duì)穩(wěn)定性。
2)選取長度較長且與走紙方向相同的筆畫檢驗(yàn)結(jié)果效果好。如果不選取上述筆畫會(huì)使比對(duì)結(jié)果數(shù)值明顯偏小,喪失不同臺(tái)之間的差異性。將處理過程中各階段的圖片放大,并對(duì)灰度曲線進(jìn)行測(cè)量,找到了合理的解釋。對(duì)于與走紙方向垂直的橫畫,邊緣會(huì)出現(xiàn)大幅度與筆畫寬度近似的灰度值波動(dòng),在走紙方向上會(huì)出現(xiàn)由于字的結(jié)構(gòu)而形成寬度穩(wěn)定的大幅波動(dòng),相當(dāng)于形成了固有條紋的特征。這嚴(yán)重影響傅里葉展開時(shí)的各項(xiàng)系數(shù),由于傅里葉變換提取主要頻率部分時(shí),這種“振幅”遠(yuǎn)遠(yuǎn)大于本次實(shí)驗(yàn)所需利用的波動(dòng),“遮蔽”由于傳動(dòng)周期性變化而導(dǎo)致的灰度變化。該情況與選取樣本墨跡已有明顯的周期性露白會(huì)導(dǎo)致的結(jié)果相類似,在提取傅里葉展開的級(jí)數(shù)時(shí)由于這種現(xiàn)象的發(fā)生會(huì)使得不同臺(tái)之間的結(jié)果十分相近消除了差異。由于周期性露白和橫條紋的干擾的結(jié)果類似,所以以橫條紋干擾后不同臺(tái)機(jī)具之間的差異被消除的灰度曲線為示例,如圖5所示。
圖5 遮蔽現(xiàn)象示例圖片(左右為不同機(jī)具打印的文件灰度曲線)Fig.5 The graph of grayness out of “defilading” phenomenon resulted from one horizontal stroke in a printed Chinese letter (Left: printed by one printer; Right: printed by one different printer from L's)
3)綜合評(píng)判的難度大。與其它圖譜相比,對(duì)于沒有明顯瑕疵的機(jī)具來說,特征波動(dòng)與隨機(jī)波動(dòng)之間“信噪比”較小,同臺(tái)機(jī)具前后兩次的比對(duì)結(jié)果簡單地從峰出現(xiàn)的位置來看也存在一定的差異性,如果簡單比對(duì)峰位置會(huì)使比對(duì)結(jié)果喪失同臺(tái)的穩(wěn)定性,所以必須盡可能地挖掘并使用數(shù)據(jù)。在編程中沒有簡單比對(duì)峰的位置而是通過一定的算法將檢材與樣本的各個(gè)峰進(jìn)行匹配,在三維歐式空間中定量地比對(duì)峰位置、峰高、峰寬,通過正相反相兩次運(yùn)算綜合提升區(qū)分能力,對(duì)于不同頻率的峰乘以相應(yīng)的加權(quán)系數(shù)以區(qū)別不同頻率區(qū)間價(jià)值大小的不同,以達(dá)到在較高的置信度下給出評(píng)判。
通過上述實(shí)驗(yàn)可以發(fā)現(xiàn)在一定的實(shí)驗(yàn)條件下同臺(tái)激光打印機(jī)具所形成的文件其自身具有穩(wěn)定性,不同臺(tái)之間存在著差異,該種差異在不同型號(hào)之間的反映尤為顯著,可以作為有力的否定依據(jù)或是同一認(rèn)定過程中的一個(gè)有價(jià)值的參考指標(biāo)。就目前的結(jié)果來看2×105可以作為排除同一的臨界值,對(duì)于綜合差異結(jié)果大于臨界值的2份樣本,在明確未更換零部件、未更改打印設(shè)置的前提下可以認(rèn)為來源于不同的機(jī)具。為了使該方法更有實(shí)用價(jià)值,今后將在如下方面進(jìn)行改進(jìn)和更深入的研究:1) 實(shí)驗(yàn)采用的字的大小較大為72,多見于標(biāo)題,為了增加該方法的實(shí)用性,可在之后的實(shí)驗(yàn)中逐步減小字的大小。2) 實(shí)驗(yàn)所用的紙張均為歐迪牌A4復(fù)印紙,為了考查紙張的質(zhì)量差異是否會(huì)對(duì)墨粉的吸附產(chǎn)生顯著性的影響,在后續(xù)的實(shí)驗(yàn)中可以更換不同品牌的紙張加以驗(yàn)證。3)實(shí)驗(yàn)是在未更換零部件與墨盒的條件下獲得的,所以通過進(jìn)一步實(shí)驗(yàn)探尋上述條件變化對(duì)于比對(duì)結(jié)果產(chǎn)生的影響幅度和變化規(guī)律對(duì)于該方法的應(yīng)用有較強(qiáng)的實(shí)際價(jià)值。4) 實(shí)驗(yàn)的原理是掃描線周期性的疏密變化經(jīng)過圖像通過傅里葉級(jí)數(shù)展開,從理論上分析,應(yīng)用小波變換可能會(huì)取得更好的效果。