李志榮
(中國刑事警察學院文件檢驗技術系,沈陽 110035)
在辦理刑事案件時常常會涉及對文件的鑒別等,如果案件中出現(xiàn)復印文件,送檢人員一般會判斷復印文件的內容或者復印該文件的復印機品牌以及型號,以此來縮小偵查范圍[1-2]。因此對復印文件中筆畫的檢驗結果非常重要。
目前,對有關復印文件檢驗的方法主要有兩種:一是利用確定噴墨復印機墨水成分對其品牌與型號進行判斷;二是通過筆畫邊緣墨點形態(tài)特征對文件內容和復印機型號進行判斷[3-4]。但由于現(xiàn)有的檢驗方法在提取邊緣墨點特征前缺少形態(tài)學濾波過程,導致檢驗結果受噪聲影響大、檢驗結果不可靠、方法實用性低,因此提出一種新的復印文件筆畫邊緣墨點形態(tài)特征定量檢驗方法,以期為復印文件的內容及其復印機品牌和型號的判斷提供依據(jù)。
數(shù)學形態(tài)學主要被應用在數(shù)字圖像處理與模式識別領域,其依據(jù)數(shù)學理論與集合論,利用對結構元的合理選擇對提取圖像中相應形狀進行衡量,實現(xiàn)對圖像的分析[5-6]。數(shù)學形態(tài)學技術不但能夠簡化圖像數(shù)據(jù),零目標區(qū)域形狀特征保持不變,還可過濾無關孤立點、斷點、毛刺等噪聲。因此通過數(shù)學形態(tài)學濾波對復印文件筆畫邊緣墨點圖像進行邊緣提取前的預處理。
膨脹與腐蝕運算是形態(tài)學的兩種基本運算,二者能夠組成多種復合運算[7]。二值形態(tài)學運算一般會給出圖像集合與結構元素集合,通過結構元素對圖像進行處理。在實際應用中,結構元素自身也是一個圖像集合,由0與1構成[8]。
假設A是復印文件筆畫邊緣墨點二值圖像矩陣,B是結構元素矩陣,形態(tài)學運算過程就是通過B對A進行處理。腐蝕運算通過Θ進行描述,復印文件筆畫邊緣墨點圖像集合A通過結構元素B進行腐蝕的操作可記作AΘB,則有:
AΘB={x|(B)x?A}
(1)
式(1)中:(B)x代表將B平移x。式(1)表明A通過B腐蝕的結果為全部x的集合,其中B平移x后仍處于A中。
膨脹運算用⊕進行描述[9],復印文件筆畫邊緣墨點圖像集合A通過結構元素B進行膨脹的操作可記作A⊕B,則有:
(2)
式(2)中:B′用于描述B的映像,也就是B有關原點對稱的集合。式(2)表明通過B膨脹A的過程為首先對B進行有關原點的映射,然后將其映像平移x。
腐蝕與膨脹并非互逆計算,將二者級聯(lián)可組成各種運算[10]。開啟與閉合運算就是將膨脹與腐蝕運算依據(jù)不同順序級聯(lián)組成的。
開啟運算可記作°,A通過B開啟可描述成A°B,即:
A°B=(AΘB)⊕B
(3)
閉合運算可記作·,A通過B閉合可描述成A·B,即:
A·B=(A⊕B)ΘB
(4)
開啟運算用于去除較小的過亮細節(jié),閉合運算用于去除較小的過暗細節(jié),使得圖像色度更加均勻,有效濾除噪聲干擾。
復印文件筆畫邊緣墨點圖像形態(tài)學邊緣提取可通過膨脹運算與腐蝕運算實現(xiàn)[11]。采用膨脹運算對邊緣進行提取的基礎思想如下:通過合理的結構算子完成對圖像的膨脹運算,零圖像邊緣灰度被增強,然后通過膨脹后的圖像和原圖相減,獲取圖像輪廓邊緣。當前圖像邊緣和原圖相比稍大,放大程度和邊緣粗細主要取決于結構算子[12];采用腐蝕運算對邊緣進行提取的基本思想如下:通過合理的結構算子完成對圖像的腐蝕運算,削弱圖像邊緣灰度,然后通過腐蝕后的圖像和原圖相減,獲取圖像輪廓邊緣。腐蝕運算區(qū)別于膨脹運算的原因主要在于當前獲取的圖像邊緣和原圖相比稍小,縮小程度和邊緣粗細主要取決于結構算子[13-14]。因此為使檢驗方法的適用范圍跟光,考慮將腐蝕運算和膨脹運算相結合,優(yōu)化對墨點邊緣的提取效果。
在對數(shù)學形態(tài)學邊緣進行提取時,結構元素的選擇非常重要。選擇8×8方形結構算子,將局部灰度最小點當成膨脹的條件,腐蝕運算選擇局部灰度最大點作為腐蝕條件,在此基礎上給出復印文件筆畫邊緣墨點圖像邊緣檢測過程如下。
(1)對復印文件筆畫邊緣墨點圖像進行預處理,濾除隨機噪聲,通過結構元素對圖像進行開運算處理,將圖像中小的雜質濾除[15]。
(2)對復印文件筆畫邊緣墨點圖像進行增強處理??紤]逐點修正圖像灰度,過程如下。
G(x,y)=f(x,y)+e(x,y)
(5)
式(5)中:G(x,y)用于描述經(jīng)增強處理后復印文件筆畫邊緣墨點圖像的灰度;f(x,y)用于描述實際灰度;e(x,y)用于描述修正過程中采用的比例因子,其值可依據(jù)圖像選擇[16]。
選擇的比例因子:
(6)
(3)通過膨脹運算與腐蝕運算對復印文件筆畫邊緣墨點圖像進行邊緣提取,并對得到的結果進行二值化處理,獲取墨點邊緣信息,為復印文件筆畫邊緣墨點形態(tài)特征定量檢驗提供依據(jù)。
對復印文件筆畫邊緣墨點形態(tài)特征進行定量檢驗后,6個形態(tài)特征,依次是復印文件筆畫邊緣墨點邊界周長、墨點區(qū)域寬度與高度、墨點的面積、墨點圓度、墨點矩形度以及墨點伸長度。
假設復印文件筆畫邊緣墨點圖像相鄰像素點間的間隔用D進行描述,即點距[17],則形態(tài)特征定量檢驗過程如下。
邊緣包圍的復印文件筆畫邊緣墨點區(qū)域長度l可描述成:
(7)
式(7)中:me用于描述偶數(shù)邊緣像素的數(shù)量;m0用于描述奇數(shù)邊緣像素的數(shù)量。墨點邊界周長體現(xiàn)了墨點邊界線長度,其計量單位是點距。
假設方向碼ci在水平方向的分量用cix進行描述,在垂直方向的分量用ciy進行描述,cix和ciy的取值如表1所示。
表1 方向碼水平與垂直方向分量取值
墨點區(qū)域的寬度W可描述成:
(8)
式(8)中:ckx為橫坐標方向的寬度。
墨點區(qū)域的高度H可描述成:
(9)
式中:cky為縱坐標方向的高度;墨點區(qū)域寬度W與墨點區(qū)域高度H的計量單位為mm。
墨點面積S計算公式如式(10)所示:
S=-ysub(xi+xsub/2)
(10)
式(10)中:xsub=[c1x,c1x,…,cnx]T,代表邊緣數(shù)據(jù)在x軸的分向量;ysub=[c1y,c1y,…,cny]T,代表邊緣數(shù)據(jù)在y軸的分向量;xi=[x0,xi],x0為邊緣像素初始點。
墨點面積是墨點區(qū)域在圖像中覆蓋像素點集區(qū)域大小的體現(xiàn),其計量單位為mm2。
墨點圓度可通過式(11)計算:
(11)
式(11)中:C為墨點圓度,在[0,1]范圍內取值,可體現(xiàn)墨點區(qū)域和圓形的偏離程度[18]。在面積一致的情況下,墨點區(qū)域邊界光滑同時是圓形,則周長最短,圓度是1。墨點區(qū)域形狀和圓形差異越大,其值越小。
墨點矩形度Q計算公式如式(12)所示:
(12)
式(12)中:Q在[0,1]范圍內取值,是墨點區(qū)域和矩形偏離程度的體現(xiàn)。在墨點區(qū)域是矩形的情況下,Q取最大值1。
墨點伸長度R可通過式(13)計算:
(13)
式(13)中:墨點伸長度R在[0,1]范圍內取值,可體現(xiàn)墨點拉伸程度。墨點區(qū)域越細長,R越小。在墨點區(qū)域是圓形的情況下,R為1。
為驗證所提方法在復印文件筆畫邊緣墨點形態(tài)特征定量檢驗中的有效性,設計如下實驗,從形態(tài)學濾波效果和墨點形態(tài)特征檢驗效果兩個方面進行驗證。
隨機選取一幅復印文件,對其中筆畫邊緣墨點部分進行提取并做放大處理,結果如圖1所示。
對圖1所示的墨點圖像進行形態(tài)學濾波處理,得到的結果用圖2進行描述。
圖1 復印文件筆畫邊緣墨點放大圖像
圖2 形態(tài)學濾波處理結果
將經(jīng)形態(tài)學濾波處理過的墨點圖像進行邊緣提取,為接下來的邊緣特征檢驗奠定基礎。邊緣提取結果如圖3所示。
由圖3可知,采用所提方法對墨點邊緣提取的效果較好,邊緣信息清楚、邊界明顯。這主要是因為雖然墨點圖像受噪聲影響較大,但所提到的中含有形態(tài)學濾波處理這一過程,能有效去除圖像中較小的過亮和過暗細節(jié),使圖像色度更加均勻,有效避免了噪聲的干擾,對邊緣信息的提取更加準確。
圖3 墨點邊緣提取結果
選擇5臺不同的復印機進行復印,通過MATLAB 7.0軟件對復印文件筆畫邊緣墨點形態(tài)特征進行定量檢驗方法程序進行編寫,對5 臺復印機復印的共120 份文件的筆畫邊緣墨點形態(tài)特征進行定量檢驗。5 臺復印機分別是惠普LaserJet MFP M436nda黑白激光A3數(shù)碼復合機、佳能G3800 大容量連供加墨彩色多功能無線一體機、愛普生墨倉式L4166彩色無線多功能一體機、兄弟DCP-7180DN 黑白激光多功能一體機、聯(lián)想M7206 黑白激光三合一多功能一體機。
所提取的形態(tài)特征定量參數(shù)主要包括兩類,其中面積、周長與直徑能體現(xiàn)墨點的大小,矩形度、圓度與伸長度能體現(xiàn)墨點的形狀。
如圖4、圖5所示,依次描述的是直徑、面積、周長間的相關性分析結果。
圖4 直徑與面積的相關性分析
圖5 直徑與周長相關性分析
分析圖4可知,直徑與面積的線性相關系數(shù)為1,說明直徑與面積有很高的相關性。分析圖5可知,直徑與周長的線性相關系數(shù)為0.52,說明二者間相關性較低。因此將直徑與周長當成體現(xiàn)墨點大小的指標。
圖6~圖8依次描述的是矩形度、圓度與伸長度間的相關性分析結果。
圖6 圓度與矩形度相關性分析
圖7 伸長度與矩形度相關性分析
圖8 伸長度與圓度相關性分析
分析圖6~圖8可知,矩形度與圓度相關系數(shù)為0.169,伸長度與矩形度相關系數(shù)為0.903,伸長度和圓度相關系數(shù)為0.041,說明圓度和伸長度及矩形度的相關性較差,因此將圓度與矩形度作為體現(xiàn)墨點形狀的特征參數(shù)。
為了驗證所提方法的有效性,將5 臺復印機復印的文件編號為1~5 組,分別采用所提方法、文獻[6]方法和文獻[7]方法進行畫筆邊緣墨點形態(tài)特征定量檢測,檢驗墨點的直徑、周長、圓度和矩形度,結果取均值,如表2所示。
表2 不同方法下畫筆邊緣墨點形態(tài)特征定量檢測結果
分析表2可知,通過所提方法獲取的邊緣墨點形態(tài)特征檢驗結果與實際結果最為接近,證明所提方法能夠對5臺不同復印機復印出的文件的畫筆邊緣墨點形態(tài)特征進行有效檢驗,能有效判斷復印機的類型,并且不受噪聲干擾且檢驗結果更可靠,整體更加有效。
(1)針對現(xiàn)有方法因缺少形態(tài)學濾波過程而導致的受噪聲影響大、檢驗結果不可靠、實用性低的問題,提出一種新的復印文件筆畫邊緣墨點形態(tài)特征定量檢驗方法。
(2)通過膨脹與腐蝕運算對墨點圖像進行形態(tài)學濾波處理,均勻圖像色度,并對墨點邊緣進行提取,在此基礎上檢驗出復印文件筆畫邊緣墨點邊界周長、墨點區(qū)域寬度與高度、墨點的面積、墨點圓度、墨點矩形度以及墨點伸長度六個特征,實現(xiàn)特征定量檢驗。
(3)所提方法可有效濾除噪聲干擾,對邊緣墨點特征的檢驗與實際情況最為接近,實用價值最高。