張清華,楊 旭,羅儀文,孫其然,王雅晨,施少培,徐 徹
(司法部司法鑒定科學(xué)技術(shù)研究所,上海200063)
打印文件的偽造與篡改在各類(lèi)案件中時(shí)有發(fā)生,其來(lái)源與真?zhèn)蔚蔫b別已成為法庭科學(xué)領(lǐng)域的重要研究?jī)?nèi)容。墨粉作為激光打印文件的重要組成部分,其化學(xué)組成主要為樹(shù)脂、染料、電荷調(diào)節(jié)劑、輔助添加劑、磁粉/載體等[1]。不同廠家、不同型號(hào)的打印機(jī)所使用的墨粉化學(xué)成分及相對(duì)含量存在一定差異,通過(guò)分析墨粉的化學(xué)組成從而判斷打印文件的來(lái)源具有良好的有效性[2]。
紅外光譜法分析墨粉,最初采用的是溴化鉀壓片傅里葉變換紅外分析技術(shù)[3],隨著顯微紅外技術(shù)的發(fā)展顯微紅外光譜法成為常用分析方法[4]。由于墨粉是一種由樹(shù)脂、染料等多種物質(zhì)組成的混合物,采用紅外光譜分析獲得是多組分混合光譜信息,在傳統(tǒng)比對(duì)檢驗(yàn)中難以確定不同墨粉差異的規(guī)律性特征?;瘜W(xué)計(jì)量學(xué)[5-6]是一種集化學(xué)、統(tǒng)計(jì)學(xué)、線性代數(shù)及計(jì)算機(jī)技術(shù)為一體的化學(xué)信息處理方法,廣泛應(yīng)用于化學(xué)信息的整合、提取與再分析,從而揭示樣本間的相關(guān)關(guān)系與本質(zhì)差異,國(guó)內(nèi)采用紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法來(lái)研究墨粉及打印機(jī)種類(lèi)的研究還未見(jiàn)報(bào)道。
本文采用顯微紅外光譜技術(shù)結(jié)合化學(xué)計(jì)量學(xué)方法對(duì)不同品牌、不同型號(hào)的激光打印原裝黑色墨粉進(jìn)行比較分析,根據(jù)特征信息的提取探討不同墨粉間的本質(zhì)差異,同時(shí)針對(duì)黑白與彩色激光打印原裝黑色墨粉的光譜特征進(jìn)行總結(jié),為墨粉的進(jìn)一步區(qū)分與鑒別提供依據(jù)。
Nicolet Continum iN10顯微紅外光譜儀(美國(guó)Thermal-Fisher公司),配有150X紅外顯微鏡,MCT/A檢測(cè)器;EZ4D顯微鏡(德國(guó)Leica公司)。
收集市售10個(gè)品牌不同型號(hào)激光打印機(jī)共31臺(tái),其中16臺(tái)為黑白激光打印機(jī),15臺(tái)為彩色激光打印機(jī),打印機(jī)信息見(jiàn)表1。
表1 不同品牌、不同型號(hào)激光打印機(jī)信息列表
采用1.1表1中的激光打印機(jī)分別打印制備31份樣品材料,其中彩色激光打印機(jī)選用灰度打印模式。將兩片2 mm厚石英玻璃置于待測(cè)樣本兩側(cè),采用預(yù)熱到200℃的電熨斗加熱2 min,使墨粉轉(zhuǎn)移到石英玻璃后利用手術(shù)刀片刮取適量墨粉進(jìn)行金剛石壓片顯微紅外光譜分析。
顯微紅外光譜儀器,常溫透射模式,掃描范圍為4000~400 cm-1,分辨率16 cm-1,累計(jì)掃描次數(shù)64次。
1.4.1 主成分分析
主成分分析(Principal Component Analysis,PCA)[5,7]是一種常用的多元統(tǒng)計(jì)分析方法,通常用于數(shù)據(jù)信息的提取或者變量維數(shù)的壓縮。其基本原理是將一組相關(guān)變量通過(guò)線性變換后得到一組維數(shù)不變而相互正交的變量,即為主成分。主成分根據(jù)信息量的多少依次排序,前幾個(gè)主成分包含了絕大部分的信息,選擇前幾個(gè)主成分進(jìn)行數(shù)據(jù)再分析不會(huì)導(dǎo)致主要信息的丟失。主成分分析過(guò)程的實(shí)現(xiàn),常選用奇異值分解(Singular Value Decomposition,SVD)[8],它主要基于如下線性代數(shù)原理:對(duì)任意的n×m階量測(cè)數(shù)據(jù)矩陣X(其中n為樣本數(shù),m為變量數(shù),且n>m)分解為三個(gè)矩陣的乘積:
其中S收集了所有特征值,U和Vt分別為每個(gè)特征值對(duì)應(yīng)的特征變量所組成的標(biāo)準(zhǔn)列正交與標(biāo)準(zhǔn)行正交矩陣,記 T=US,P=V,有
在多元統(tǒng)計(jì)分析方法中,T和P通常稱(chēng)為得分矩陣與載荷矩陣。當(dāng)X為訓(xùn)練集數(shù)據(jù)Xtrain時(shí),T與P分別記為T(mén)train、Ptrain。Ttrain前幾列收集了訓(xùn)練集數(shù)據(jù)的大部分信息,選擇前兩列或者三列數(shù)據(jù)做得分投影圖,構(gòu)建標(biāo)準(zhǔn)投影空間可以直觀的實(shí)現(xiàn)訓(xùn)練集樣本 “物以類(lèi)聚”的效果;而載荷矩陣Ptrain前幾列值反映了原有變量在分類(lèi)過(guò)程中的相關(guān)關(guān)系,其絕對(duì)值的大小反映了原有變量對(duì)于聚類(lèi)貢獻(xiàn)率的大小。當(dāng)X為測(cè)試集數(shù)據(jù)Xtest時(shí),根據(jù)線性代數(shù)運(yùn)算法則有
其中Ttest表示測(cè)試集數(shù)據(jù)的得分矩陣,選擇相應(yīng)的得分值投影到標(biāo)準(zhǔn)投影空間從而實(shí)現(xiàn)測(cè)試集數(shù)據(jù)的投影預(yù)報(bào)。
1.4.2 系統(tǒng)聚類(lèi)法
系統(tǒng)聚類(lèi)法(Hierarchical cluster analysis,HCA)[9]是一種經(jīng)典的多元統(tǒng)計(jì)分析方法。其基本思路是:首先將所有n個(gè)樣本各自看做一個(gè)類(lèi),即共有n類(lèi);其次計(jì)算n類(lèi)樣本之間的距離,把距離最小的兩類(lèi)合并為一類(lèi),并計(jì)算出新類(lèi)的坐標(biāo)值,再用相同的方法合并距離相近的類(lèi),重復(fù)此過(guò)程,直到所有分類(lèi)歸為一類(lèi)為止。系統(tǒng)聚類(lèi)通常采用圖形的形式來(lái)表達(dá)聚類(lèi)過(guò)程,稱(chēng)為聚類(lèi)圖。實(shí)現(xiàn)系統(tǒng)聚類(lèi)最關(guān)鍵的是計(jì)算樣本間與類(lèi)間距離,樣本間的距離計(jì)算方法有:歐式距離、馬氏距離、曼哈坦距離,藪爾格距離,本文選用的是最常用的歐式距離法,其公式如下:
式中A,B分別代表兩個(gè)樣本,DAB為兩樣本間的距離,m為變量數(shù)。類(lèi)間距計(jì)算有:平均距離法、重心距離法、最短距離法以及最小距離法,本文選擇的是最短距離法,其定義Gi與Gj兩類(lèi)樣本間的距離為:
式中dab為樣本xa與xb之間的距離。
根據(jù)激光打印機(jī)原裝黑色墨粉紅外光譜的主要差異,31個(gè)樣品可分為兩類(lèi)(見(jiàn)表2):第I類(lèi)為 S7、S8、S29 3臺(tái)黑白激光打印機(jī)與S19、S20 2臺(tái)彩色激光打印機(jī),其墨粉的紅外光譜整體相似,均反映了1 608 cm-1,1 583 cm-1,1 510 cm-1處苯環(huán)對(duì)位取代后的骨架振動(dòng),831 cm-1處對(duì)位取代苯環(huán)上相鄰兩個(gè)氫原子的C-H面外彎曲振動(dòng),1 721 cm-1處羰基伸縮振動(dòng),731 cm-1,1 272 cm-1處對(duì)苯二甲酸的特征吸收,1 249 cm-1處芳香-脂肪醚Ar-O-C的反對(duì)稱(chēng)伸縮振動(dòng)以及1 115 cm-1處C-O對(duì)稱(chēng)伸縮振動(dòng)(見(jiàn)圖1)。第II類(lèi)包括13臺(tái)黑白激光打印機(jī)與13臺(tái)彩色激光打印機(jī),其墨粉的紅外光譜與第I類(lèi)墨粉的紅外光譜不同,主要表現(xiàn)為755 cm-1,699 cm-1處的苯環(huán)單取代吸收;1 602 cm-1,1 160 cm-1,1 494 cm-1,1 451 cm-1處的苯環(huán)骨架振動(dòng)吸收譜帶以及1725cm-1處的羰基伸縮振動(dòng)吸收(見(jiàn)圖2)。
根據(jù)以上實(shí)驗(yàn)結(jié)果,所有墨粉樣品的紅外光譜主要反映了樹(shù)脂的紅外特征吸收,這是由墨粉本身的性質(zhì)所決定的:樹(shù)脂作為墨粉的重要組成部分,是一類(lèi)有較強(qiáng)的紅外特征吸收的有機(jī)物,并且在墨粉組成中占有較高比例(約為60%~80%)。另外,兩類(lèi)墨粉樣品紅外光譜間的差異主要源于不同的樹(shù)脂,第I類(lèi)墨粉使用的樹(shù)脂是聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂,而第II類(lèi)墨粉為聚苯乙烯/甲基丙烯酸甲酯樹(shù)脂。兩類(lèi)樹(shù)脂均是生產(chǎn)黑白與彩色激光打印墨粉的常用原料,因此難以通過(guò)墨粉樹(shù)脂的種類(lèi)實(shí)現(xiàn)黑白與彩色激光打印機(jī)的區(qū)分。
表2 基于樹(shù)脂種類(lèi)的原裝墨粉分類(lèi)表
圖1 聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂類(lèi)墨粉紅外光譜圖
圖2 聚苯乙烯/甲基丙烯酸甲酯類(lèi)墨粉紅外光譜圖
根據(jù)不同的顯影方式,墨粉具有雙組份和單組份之分,雙組份墨粉除含有顯影碳粉外還需要載體(通常為鐵屑)作為起電劑,而單組份墨粉又分為單組份磁性墨粉與非磁性墨粉,單組分磁性墨粉中含有黑色的鐵氧化物,在墨粉的生產(chǎn)使用過(guò)程中具有染色與運(yùn)載墨粉的功能[1,10]。
實(shí)驗(yàn)表明,樣本 S1~S6、S21、S24~S26、S28、S30 與S31共13臺(tái)黑白激光打印機(jī)墨粉的紅外光譜在568cm-1處有一中等強(qiáng)度的鐵氧化物寬峰,表明此類(lèi)墨粉為單組份磁性墨粉;其余3臺(tái)黑白激光打印機(jī)和15臺(tái)彩色激光打印機(jī)墨粉的紅外光譜中未出現(xiàn)鐵氧化物的特征吸收峰,表明相應(yīng)墨粉為雙組份或者單組份非磁性墨粉。
對(duì)于黑白激光打印機(jī),S7,S8和S29(見(jiàn)圖 1)與其余13臺(tái)黑白激光打印機(jī)(見(jiàn)圖2-a)墨粉紅外光譜存在明顯差異,前者基線斜率較低(起點(diǎn)透射率通常高于30%),主要表現(xiàn)為聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂特征吸收,同時(shí)在568 cm-1處未發(fā)現(xiàn)鐵氧化物的紅外吸收峰;后者基線斜率偏高(起點(diǎn)透射率通常低于30%),主要表現(xiàn)為聚苯乙烯/甲基丙烯酸甲酯特征吸收,同時(shí)在568 cm-1處檢出有鐵氧化物的特征吸收。對(duì)于彩色激光打印機(jī),S19、S20號(hào)打印機(jī)墨粉主要為聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂類(lèi)墨粉,其余13臺(tái)打印機(jī)墨粉主要為聚苯乙烯/甲基丙烯酸甲酯類(lèi)墨粉,就整體而言彩色激光打印墨粉的紅外光譜基線斜率偏低,同時(shí)不含有鐵氧化物特征吸收。因此,在檢案過(guò)程中可以依據(jù)墨粉紅外光譜基線斜率的大小、樹(shù)脂成分以及是否檢出鐵氧化物特征吸收峰綜合判斷激光打印機(jī)的類(lèi)型:若墨粉紅外光譜基線的斜率偏高,且檢出有鐵氧化物吸收峰,則該樣品為黑白激光打印形成;若墨粉紅外光譜基線斜率較低,樹(shù)脂為聚苯乙烯/甲基丙烯酸甲酯,并且未檢出鐵氧化物特征吸收,則該樣品為彩色激光打印形成;若墨粉紅外光譜基線斜率較低,樹(shù)脂為聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂,并且未檢出鐵氧化物特征吸收,則無(wú)法判斷該樣品為黑白還是彩色激光打印形成,比如S7、S8、S29三臺(tái)黑白激光打印機(jī)與S19、S20兩臺(tái)彩色激光打印機(jī)的墨粉紅外光譜較為相似,難以通過(guò)紅外光譜的直接比較分析實(shí)現(xiàn)其區(qū)分與識(shí)別,如圖1所示。
2.4.1 基線校正
理想情況下,待測(cè)樣品沒(méi)有吸收的光譜區(qū)域被視為整張光譜的基線,基線的透過(guò)率應(yīng)該是100%,即吸光度為0。但是在實(shí)際檢測(cè)中由于受樣品粒徑、壓片厚度、雜質(zhì)等光散射光吸收的影響,使光譜基線出現(xiàn)傾斜現(xiàn)象。為了比較分析墨粉的本質(zhì)差異,本文采用多項(xiàng)式曲線擬合法[11]對(duì)樣本的紅外光譜進(jìn)行基線校正(見(jiàn)圖3),校正后譜峰位置沒(méi)有發(fā)生變化,而傾斜程度獲得明顯改善,有利于后續(xù)數(shù)據(jù)分析與信息提取。
圖3 基線校正前后的墨粉紅外光譜圖
2.4.2 不同型號(hào)打印機(jī)原裝墨粉的PCA投影分析
在31個(gè)樣本中隨機(jī)選擇25個(gè)樣本作為訓(xùn)練集數(shù)據(jù),其余6個(gè)樣本作為測(cè)試集數(shù)據(jù)。采用自編軟件中的PCA方法對(duì)基線校正、標(biāo)準(zhǔn)正態(tài)變量變換(Standard Normal Variate Transform,SNV)后的訓(xùn)練集數(shù)據(jù)進(jìn)行主成分分析,提取前兩個(gè)主成分構(gòu)建標(biāo)準(zhǔn)投影空間(圖4A),不同樹(shù)脂成分的墨粉樣本聚類(lèi)效果明顯,但是黑白與彩色激光打印墨粉未能獲得良好區(qū)分;當(dāng)選擇前三個(gè)主成分構(gòu)建標(biāo)準(zhǔn)投影空間時(shí),發(fā)現(xiàn)不同樹(shù)脂成分墨粉獲得良好區(qū)分的同時(shí),同種樹(shù)脂成分的黑白與彩色激光打印墨粉也獲得了良好區(qū)分,包括直接比較分析不能區(qū)分的S7、S8、S29黑白激光打印墨粉與S19、S20彩色激光打印墨粉(見(jiàn)圖4B)。
圖4 不同激光打印墨粉的得分投影圖
選擇載荷矩陣前三個(gè)主成分?jǐn)?shù)據(jù)分別對(duì)波數(shù)做圖(見(jiàn)圖5A,B,C)。第一主成分提取信息主要源于聚苯乙烯/甲基丙烯酸甲酯的光譜信息;第二主成分信息主要表現(xiàn)為聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂的特征吸收;第三主成分主要為568cm-1處鐵氧化物的光譜信息,它是區(qū)分黑白與彩色激光打印墨粉的關(guān)鍵組分。前三個(gè)主成分總共解釋了63.3%的方差,剩余信息基本為噪聲信息(見(jiàn)圖5D)。
圖5 不同激光打印墨粉的載荷曲線圖
6個(gè)測(cè)試集樣本經(jīng)基線校正與SNV數(shù)據(jù)變換后投影到三維標(biāo)準(zhǔn)投影空間(見(jiàn)圖6),投影預(yù)報(bào)結(jié)果準(zhǔn)確,表明采用主成分投影預(yù)報(bào)方法能夠快速直觀區(qū)分黑白與彩色激光打印墨粉。
圖6 測(cè)試集墨粉樣本的投影預(yù)報(bào)
2.4.3 不同型號(hào)打印機(jī)原裝墨粉的HCA分析
主成分分析能夠直觀的反映墨粉樣本的整體分類(lèi)關(guān)系,為了更進(jìn)一步研究各樣本間的距離關(guān)系,以主成分分析得分值為基礎(chǔ)采用系統(tǒng)聚類(lèi)法構(gòu)建不同種類(lèi)墨粉樣本間的聚類(lèi)圖(見(jiàn)圖7)。所有現(xiàn)有樣本形成了三個(gè)大類(lèi):聚苯乙烯/甲基丙烯酸甲酯樹(shù)脂類(lèi)黑白激光打印墨粉樣本為一類(lèi);聚苯乙烯/甲基丙烯酸甲酯樹(shù)脂類(lèi)彩色激光打印墨粉為另一類(lèi);聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂類(lèi)黑白與彩色激光打印墨粉,由于紅外光譜較為相似,整體歸為一類(lèi),就局部而言兩者距離各自相近,形成 S19、S20(彩色激光打?。┡c S7、S8、S29(黑白激光打?。﹥蓚€(gè)子類(lèi),與主成分聚類(lèi)效果分布一致。
圖7 不同激光打印機(jī)墨粉的系統(tǒng)聚類(lèi)圖
本文采用紅外光譜法研究了31臺(tái)不同品牌、不同型號(hào)激光打印機(jī)原裝黑色墨粉間的光譜差異。根據(jù)墨粉紅外光譜圖的比較分析,實(shí)現(xiàn)了聚對(duì)苯二甲酸/環(huán)氧樹(shù)脂類(lèi)墨粉與聚苯乙烯/甲基丙烯酸甲酯樹(shù)脂類(lèi)墨粉的區(qū)分與識(shí)別;采用主成分分析結(jié)合系統(tǒng)聚類(lèi)法完成了同種樹(shù)脂不同激光打印類(lèi)型墨粉的聚類(lèi)分析與建模預(yù)報(bào),方法可行、結(jié)果準(zhǔn)確可靠。
參考文獻(xiàn):
[1]張志才,靜電復(fù)印技術(shù)與設(shè)備[M].北京:中國(guó)計(jì)量出版社,1999:26.
[2]Cantu,A.A.,Analytical Methods For Detecting Fraudulent Documents.Analytical Chemistry,1991,63(17):847A-854A.
[3]Egan,W.J.,et al.,F(xiàn)orensic discrimination of photocopy and printer toners II.Discriminant analysis applied to infrared reflection-absorption spectroscopy[J].Analytical&Bioanalytical Chemistry,2003,376(8):1279-1285.
[4]Almeida Assis,A.C.,et al.,Diamond cell Fourier transform infrared spectroscopy transmittance analysis of black toners on questioned documents[J].Forensic Science International,2012,214(1-3):59-66.
[5]梁逸曾.復(fù)雜體系儀器分析-白、灰、黑分析體系及其多變量解析方法[M].北京:化學(xué)工業(yè)出版社,2012:
[6]許祿,邵學(xué)廣.化學(xué)計(jì)量學(xué)方法[M].第2版.北京:科學(xué)出版社,2004.
[7]Billard,L.E.Diday.Principal Component Analysis,in Symbolic Data Analysis[J].John Wiley&Sons,Ltd.2007:145-187.
[8]Jackson,J.E.Singular Value Decomposition:Multidimensional Scaling I,in A User's Guide to Principal Components.John Wiley&Sons,Inc,2004:189-232.
[9]Murtagh,F(xiàn).,P.Contreras.Algorithms for hierarchical clustering:an overview[J].Wiley Interdisciplinary Reviews:Data Mining and Knowledge Discovery,2012,2(1):86-97.
[10]王英強(qiáng),馮計(jì)民,汪聰慧.傅立葉變換紅外光譜法檢驗(yàn)靜電復(fù)印墨粉[J].刑事技術(shù),2004,(4):3-7.
[11]馮昕韡,朱仲良,沈夢(mèng)潔,等.基于多項(xiàng)式擬合的拉曼光譜基線漂移校正方法[J].計(jì)算機(jī)與應(yīng)用化學(xué),2009,(6):759-762.