衡 磊, 孟朝陽
(遼寧警察學院, 遼寧大連 116036)
基于顏色數(shù)字化特征的朱墨時序判斷研究
衡 磊, 孟朝陽
(遼寧警察學院, 遼寧大連 116036)
目的 建立朱墨時序的量化、數(shù)字化研判方法。朱墨時序判斷的依據(jù)不是基于外觀特征和理化性質,而是將肉眼難以辨識的朱墨交疊區(qū)域的顏色特征進行數(shù)字化,從而實現(xiàn)數(shù)字化模式下的朱墨時序科學研判。方法 采用RGB、Lab兩種顏色模式方法,將顏色信息轉化為具體的數(shù)字,應用多元參數(shù)的方法進行顏色表征。采用統(tǒng)計學的原理和方法對大量的數(shù)據(jù)進行處理,直接得到朱墨時序的判定結論。結果 通過黑色簽字筆書寫字跡、打印字跡分別與印泥、印油印文的朱墨時序實驗表明,只要選定適當?shù)念伾J奖韰?shù),根據(jù)顯著性差異P值就可以進行朱墨時序的研判。結論 這種基于顏色數(shù)字化特征的朱墨時序研判方法,為朱墨時序的檢驗提供新方法,為文件檢驗數(shù)字化提供借鑒。
文件檢驗; 朱墨時序; 顏色模式; RGB; Lab
目前,朱墨時序的研究和應用基于外觀特征和理化性質兩個方向。外觀特征是交叉點處色料表觀的顏色變化、層次結構等表觀特征。理化性質是指溶解性、光學特性、吸附能力和化學成分等[1-2]。檢驗方法包括:光學(電子)顯微鏡法、電子探針(EPMA)和能譜(EDAX)法[3]、顯微分光光度法[4]、顯微紅外光學成像技術[5]、拉曼光譜陣列掃描成像技術[6-7]、三維光譜法[8-9]、熒光檢測法[10]、剝離法、脫色法[11]等。
各類不同朱墨交疊中,“墨”和“朱”彼此之間存在著程度不同的交融、覆蓋等相互作用,這些內(nèi)在的作用體現(xiàn)在表觀上就是顏色的差異性,這些極微弱的差異性肉眼難以進行辨識。通過數(shù)字化提取過程,將顏色由感官表象轉為具體的數(shù)據(jù)。再采用科學的數(shù)據(jù)處理方法,直接得到研判結論。
本文采用的是數(shù)字化特征檢驗方法。將顏色特征數(shù)據(jù)化,采用多元參數(shù)表征,用數(shù)據(jù)挖掘原理和方法進行結果研判,保證結論的科學性,有效地避免檢驗者個體原因導致的偏差。
1.1 Lab和RGB顏色模式
Lab和RGB顏色模式是色度學的理論體系。Lab顏色模式是國際照明委員會(CIE)制定的與設備無關的顏色模式。Lab顏色由亮度(或亮度分量L)和兩個色度分量(a和b)構成。亮度分量L范圍從0~100,a分量(從綠到紅)和b分量(從藍到黃)范圍為-120~+120。L值決定了顏色的亮度。而色度分量決定了色彩,a值越大,越接近紅色,b值越大,越接近黃色。
RGB是基于自然界紅、綠、藍3種基色光的混合原理,將紅(R)、綠(G)、藍(B)3種光線按照不同數(shù)值進行混合產(chǎn)生圖像的顏色。RGB的取值范圍分別都是0~225。當取值都是255時產(chǎn)生純白色,取值都是0時產(chǎn)生純黑色,按照RGB不同的取值組合就可以得到大約1670萬種色彩。
這兩種顏色模式都可以對顏色進行表征,二者之間的區(qū)別在于構成不同。Lab模式是由亮度和顏色分量構成;紅、綠、藍3種顏色構成RGB模式。由于這兩種顏色模式可以表達非常豐富的顏色內(nèi)容,日常所見的色彩,尤其是難以分辨的顏色可以應用上述兩種顏色模式表征。由于這兩種顏色模式使用數(shù)字形式進行表達,因此肉眼難以辨識的很接近的顏色,用Lab或RGB模式都能夠有效地進行區(qū)分和辨識。
1.2 數(shù)據(jù)處理方法
由于數(shù)據(jù)復雜且量大,實驗數(shù)據(jù)處理應用SPSS統(tǒng)計分析軟件進行。SPSS軟件是目前國際學術界重要的數(shù)據(jù)處理軟件,SPSS能夠通過數(shù)據(jù)挖掘,揭示出不同事物之間的聯(lián)系,發(fā)現(xiàn)彼此間內(nèi)在的規(guī)律[12-13][14-15]。
在進行“先朱后墨”,“先墨后朱”的研判中,采用的是統(tǒng)計學中的顯著性檢驗原理。顯著性差異(P值)是統(tǒng)計學上對數(shù)據(jù)差異性的評價,當數(shù)據(jù)之間有了顯著性差異,就說明參與比對的數(shù)據(jù)不是來自同一總體,而是來自有差異性的兩個不同總體。統(tǒng)計學上差異性技術標準(P值)是,P>0.05差異性不顯著,0.01
由于分析樣本的數(shù)據(jù)是非連續(xù)型的級數(shù)類,根據(jù)樣本數(shù)據(jù)的分布特點,采用非參數(shù)檢驗法。根據(jù)檢驗樣本差異的兩組樣本之間的關系,選擇獨立樣本模式。
2.1 實驗器材
EPSON office 510掃描儀(精工愛普生株式會社,菲律賓);HP P1106激光打印機(惠普中國有限公司,中國);歐標Mate-1印油印臺(上海辦公伙伴貿(mào)易發(fā)展有限公司,上海);工字681印泥(上海汽槍廠,上海);得力思達6600ES中性筆(得力集團有限公司,寧波);Photoshop軟件(Adobe公司,美國);SPSS 19軟件(SPSS公司,美國)。
2.2 實驗方法
2.2.1 實驗樣本制作
用上述實驗器材,分別制作印油、印泥和簽字筆字跡,印油、印泥和激光打印字跡形成的不同朱墨時序的樣本。本實驗首先選擇不同的“墨”與不同的“朱”之間分別形成的樣本,其中,“墨”選擇了12種簽字筆,一種激光打印機,“朱”分別選擇印泥和印油。文中所體現(xiàn)只是其中的一個樣本數(shù)據(jù)。這12種簽字筆如表1所示。
表1 簽字筆品牌型號
2.2.2 樣本掃描
將樣本進行掃描,掃描分辨率1 200 dpi,圖像類型設置為24位全彩。掃描中要進行覆蓋遮蔽,避免由于光照不均勻在數(shù)據(jù)采集中所帶來的背景干擾。掃描文件存儲為JPEG格式。
2.2.3 數(shù)據(jù)采集方法
將掃描圖片在Photoshop的“導航器”中設置為60%,圖像調整為16位/通道,顏色模式分別設置為Lab,RGB模式。采用“吸管工具”進行采樣,取樣大小為3×3像素平均。選取朱墨交疊區(qū)域,用上述方法選取任意50~80個位置分別采集Lab,RGB不同的顏色模式條件下的數(shù)據(jù)。
3.1 Lab顏色模式數(shù)據(jù)的采集和處理分析
在朱墨交疊區(qū)域隨機對50個位置進行Lab數(shù)據(jù)的采集,在朱墨不同的時序兩個樣本分別采集50組數(shù)據(jù),其中1標號的是“先墨后朱”,2標號的是“先朱后墨”(下面實驗標號相同)。應用SPSS19對數(shù)據(jù)進行Mann-Whitney檢驗。
3.1.1 黑色書寫字跡與印油印文的朱墨時序的檢驗
Mann-Whitney檢驗結果包括秩表2和檢驗統(tǒng)計量表3。表2中L,a,b的秩均值一組大一組小,說明朱墨時序不同的兩組樣本總體可能不同。進一步的檢驗統(tǒng)計量中L、a、b的漸進顯著性分別是0.374,0 和0 。其中a和b的漸進顯著性均小于0.05,說明檢驗的兩組不同時序的數(shù)據(jù)中,a和b的這兩個色度分量存在著顯著性差異,可以通過Lab色彩模式中a和b的色度分量數(shù)據(jù),判定朱墨時序。而L的P>0.05,沒有統(tǒng)計學意義,朱墨交疊區(qū)域的明度沒有顯著差異。
表2 秩
表3 Mann-Whitney檢驗統(tǒng)計量
3.1.2 黑色書寫字跡與印泥印文的朱墨時序的檢驗
Mann-Whitney檢驗結果包括秩表4和檢驗統(tǒng)計量表5,秩均值有差異,說明朱墨時序不同的兩種樣本總體可能不同。進一步的檢驗統(tǒng)計量中L,a這兩項數(shù)據(jù)組的漸進顯著性P<0.05,不同的朱墨時序中L和a兩項參數(shù)具有顯著性差異,而b參數(shù)沒有統(tǒng)計學意義。
表4 秩
表5 Mann-Whitney檢驗統(tǒng)計量
朱墨時序所呈現(xiàn)的顏色,是紅色的印文和黑色的字跡彼此疊加交融的效果,影響其外觀顏色的因素有:先后時序,印文材料和書寫材料的融合性能,文件形成的時間等。不同時序條件下所形成的顏色差異性非常小,用肉眼難以對顏色的微弱差異進行分辨。因此,采用數(shù)字化的顏色分析方法,將顏色分解為不同的數(shù)據(jù),通過統(tǒng)計學的計算結果,可以直接進行朱墨時序研判。突破了肉眼對于顏色辨識的局限性,以及人為因素對檢驗結論的影響。
黑色書寫字跡和印油印文形成的朱墨文件的Lab顏色模式中,L亮度分量數(shù)據(jù)沒有差異性,而a和b這兩個色度分量的數(shù)據(jù)具有明顯差異,應用統(tǒng)計學的計算結論,可以作為黑色書寫字跡與印油印文朱墨時序的研判數(shù)據(jù)。而黑色書寫字跡和印泥印文形成的朱墨文件的Lab顏色模式中,作為朱墨時序判斷的數(shù)據(jù)是L和a。這說明黑色書寫字跡和印油、印泥形成的朱墨顏色特征不同。印油形成的不同時序的朱墨區(qū)域,亮度相同,而色度不同,可以根據(jù)色度數(shù)據(jù)進行時序的研判。印泥形成的不同時序的朱墨區(qū)域亮度和從綠色到紅色區(qū)域的色度都不同,只是從藍色到黃色部分沒有差異,可以根據(jù)朱墨交疊部分的亮度L和a(從綠色到藍色的色度)進行朱墨時序的研判。利用Lab顏色模式,將顏色進行數(shù)據(jù)量化,通過統(tǒng)計處理方法,直接得朱墨時序的科學研判結論。
3.1.3 激光打印字跡與不同印文的朱墨時序檢驗
激光打印字跡采樣是在朱墨交疊區(qū)域隨機對80個位置進行Lab數(shù)據(jù)的采集,在朱墨不同的時序兩個樣本分別采集80組數(shù)據(jù)。表6是打印字跡分別與印泥和印油形成的朱墨時序的Mann-Whitney檢驗結果中漸進顯著性數(shù)據(jù)。
表6 Mann-Whitney檢驗P值
表6中Lab各組參數(shù)的P值,均小于0.05,這表明激光打印字跡無論與印泥還是印油形成的朱墨,不同的時序間具有極顯著的差異性。
3.2 RGB數(shù)據(jù)的采集和處理分析
在朱墨交疊區(qū)域隨機對80個位置進行RGB參
數(shù)的采集,在兩種不同的時序分別采集80組數(shù)據(jù),其中1標號的是“先墨后朱”,2標號的是“先朱后墨”。應用SPSS19對數(shù)據(jù)進行Mann-Whitney檢驗。
3.2.1 黑色書寫字跡與印油印文的朱墨時序的檢驗
Mann-Whitney檢驗結果包括秩表7和檢驗統(tǒng)計量表8。秩均值存在差異說明二者樣本總體可能不同。進一步檢驗R,G ,R+G+B,R/R+G+B,G/R+G+B,B/R+G+B的P<0.05,通過上述各組數(shù)據(jù)的比較,不同的朱墨時序具有顯著性差異。黑色書寫字跡與印油印文的朱墨時序,可以通過R,G,R+B+G,R/R+G+B,G/R+G+B,B/R+G+B這些數(shù)據(jù)進行研判。
表7 秩
表8 Mann-Whitney檢驗統(tǒng)計量
3.2.2 黑色書寫字跡與印泥印文的朱墨時序的檢驗
檢驗結果包括秩表9和檢驗統(tǒng)計量表10。秩均值存在差異,說明二者樣本總體可能不同。進一步檢驗結果表明所有參數(shù)的P都小于0.05,RGB檢驗參數(shù)對印泥印文與書寫字跡的朱墨時序檢驗是一種很有效的方法。
表9 秩
3.2.3 激光打印字跡與印泥、印油印文的檢驗
在激光打印和不同印文朱墨交疊區(qū)域隨機對80個位置進行RGB數(shù)據(jù)的采集,在朱墨不同的時序兩個樣本分別采集80組數(shù)據(jù),用SPSS 19進行處理。表11是激光打印字跡分別與印泥、印油交疊區(qū)域的RGB參數(shù)P值。
R,G和G/R+B+G,B/R+G+B數(shù)據(jù)的P值均小于0.05,激光打印和印泥印油形成的朱墨時序,可以采用上述幾類參數(shù)進行時序的判斷。
通過大量的實驗數(shù)據(jù)表明,這種“先朱后墨”或“先墨后朱”的顏色數(shù)據(jù)統(tǒng)計特征具有穩(wěn)定性?;诓煌炷珪r序交疊區(qū)域顏色的Lab和RGB數(shù)據(jù),采用Mann-Whitney檢驗方法,依據(jù)顯著性差異P值,直接利用統(tǒng)計學結果對印油、印泥與書寫字跡、激光打印字跡形成的朱墨時序進行科學研判。
激光打印字跡形成的朱墨時序中,相對RGB顏色模式,其Lab模式的3個參數(shù)都具有明顯差異性,可以根據(jù)L,a,b的具體數(shù)據(jù),通過Mann-Whitney檢驗結論,直接進行朱墨時序的判斷。
黑色字跡與印泥、印油印文形成的朱墨時序中,采用RGB顏色模式數(shù)據(jù)的分析,針對不同分析對象,有的數(shù)據(jù)需要進行加和處理,有的則需要比值處理。所有的數(shù)據(jù)都可以通過統(tǒng)計結論直接對分析對象進行研判,也可以根據(jù)印文的材料分別采用Lab顏色模式的L和a數(shù)據(jù)(印泥),a和b數(shù)據(jù)(印油)進行研判。
表10 Mann-Whitney檢驗統(tǒng)計量
表11 檢驗統(tǒng)計量(P值)
文件檢驗的量化、數(shù)字化以及文件檢驗方法的科學研判是一個不斷探索的過程。本文針對朱墨時序進行檢驗的依據(jù)是定量分析,研判結論更為客觀,避免了檢驗者個體主觀因素對結論的影響,為文件檢驗數(shù)字化進程提供了借鑒。
[1] 李彪,馮明帥.朱墨時序檢驗方法綜述[J].廣東公安科技,2012(1):10-17.
[2] 謝鵬,李彪,羅瓊.朱墨時序的表現(xiàn)特征及其判定[J].中國人民公安大學學報(自然科學版),2012(2):16-21.
[3] 楊曉紅,馬子寧,吉曉瑞等.掃描電鏡在打印、復印文字與印油印文交疊時序綜合研究[J].電子顯微鏡學報,2013(10):447-451.
[4] 李彪.顯微分光光度計法判定朱墨時序的初步研究[J].法庭科學,2012(1):103-105.
[5] 黃紅娟,鄭一平,樓壽松.傅里葉顯微紅外成像在朱墨時序鑒定中的應用研究[J].刑事技術,2010(4):29-32.
[6] 連園園,李偉,梁魯寧等.拉曼光譜面掃描成像判斷黑色圓珠筆交叉筆畫書寫先后順序[J].刑事技術,2009(6):14-17.
[7] 相樹珍.共焦顯微拉曼光譜技術分析判斷朱墨時序[J].中國人民公安大學學報(自然科學版),2014(3):5-7.
[8] 暴仁,張淙溪.光譜成像檢驗法在朱墨時序鑒定中的應用[J].中國司法鑒定,2008(5):36-38.
[9] 王連昭.超景深三維微系統(tǒng)在印章印文檢驗中的應用[J].江西警察學院學報,2012(2):121-123.
[10] 程向偉,張仕龍,褚建新.熒光法判斷激光打印文件朱墨時序的研究[J].中國司法鑒定,2012,65(6):43-45.
[11] 何祖康,李堅.激光打印文件朱墨時序適用檢驗方法[J].廣西警官高等??茖W校學報,2013,26(6):18-20.
[12] 胡桔州,侯木舟,歐陽資生.數(shù)據(jù)挖掘的統(tǒng)計方法及其軟件實現(xiàn)[J].知識叢林,2007,233(3):134-135.
[13] 王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟大學學報,2004,32(2):246-252.
[14] 邢莉.統(tǒng)計分析的新模式- 數(shù)據(jù)挖掘技術[J].統(tǒng)計與咨詢,2006(4):17-18.
[15] 朱凌云,吳寶明,曹長修.醫(yī)學數(shù)據(jù)挖掘技術、方法及應用[J].生物醫(yī)學工程學雜志,2004,20(3):559-562.
(責任編輯 于瑞華)
遼寧省教育廳科學研究一般項目“基于數(shù)據(jù)挖掘的朱墨時序研判方法研究”(L2015247)。
衡 磊(1967—),女,遼寧大連人,碩士,教授。研究方向為刑事技術。
D918.92