張 云, 李育革, 石 惠
(1.北京市刑事科學(xué)技術(shù)研究所, 北京 100054; 2.中國政法大學(xué), 北京 100088)
?
漢字筆跡間不同人相似度和同一人穩(wěn)定度的量化實驗研究
張云1,李育革1,石惠2
(1.北京市刑事科學(xué)技術(shù)研究所, 北京100054; 2.中國政法大學(xué), 北京100088)
摘要對200人書寫的漢字筆跡進行分析研究,通過對筆跡鑒定工作者所依據(jù)的筆跡特征進行選取、賦值、量化比對,統(tǒng)計得出了不同人筆跡的單字相似度和多字相似度情況,以及同一人筆跡的單字穩(wěn)定度和多字穩(wěn)定度情況,發(fā)現(xiàn)有不同人書寫單字的相似度會高于同一人書寫單字的穩(wěn)定度的情況出現(xiàn)。但隨著組合單字數(shù)量的增多,不同人筆跡的相似度會降低,而同一人筆跡的穩(wěn)定度會提高,當組合單字數(shù)量達到一定的量時,穩(wěn)定度要遠高于相似度。實驗的統(tǒng)計結(jié)果為筆跡鑒定的科學(xué)性提供了一定的數(shù)據(jù)支持,也擴展了筆跡鑒定量化研究的思路。
關(guān)鍵詞筆跡特征; 相似度; 穩(wěn)定度; 量化實驗
0引言
在筆跡的同一認定過程中,無論是不同人書寫的筆跡間,還是同一人書寫的筆跡間都會存在符合特征,如何判斷符合特征是不同人筆跡的相似[1],還是來自于同一人的筆跡?目前,筆跡鑒定工作者大多是根據(jù)自己長期積累的經(jīng)驗對筆跡特征進行分析,從而認定同一或否定同一。但是不同人書寫的筆跡間其特征到底相似到何種程度?同一人書寫的筆跡間其特征相同到什么程度?僅憑主觀分析判斷是否會影響同一認定的準確性?筆者收集了不同書寫水平、不同文化程度的200人正常書寫的漢字筆跡樣本,對樣本筆跡中所反映出的筆跡鑒定工作者所依據(jù)的特征進行了量化賦值比對[2],得出了不同人筆跡相似程度和同一人筆跡穩(wěn)定程度的科學(xué)數(shù)據(jù),為漢字筆跡的同一認定提供了科學(xué)依據(jù)[3]。
1實驗?zāi)康?/p>
為筆跡鑒定工作者判斷兩份漢字筆跡是否由同一人書寫提供數(shù)據(jù)支持,避免漢字筆跡鑒定出現(xiàn)錯誤意見。
2實驗設(shè)計
書寫工具:市場上常見的晨光牌0.5 mm黑色簽字筆。
承載客體:打印有自制表格的A4打印紙。
本次實驗選取了漢字筆跡鑒定中出現(xiàn)頻率相對較高的10個漢字:中、國、政、法、大、學(xué)、張、王、李、貳。
選擇對象共計200人,其中大學(xué)文化50名,碩士研究生文化130名,博士研究生文化20名;其中女性124名,男性76名。
要求書寫人在書寫樣本文字時,使用其平時正常書寫的字體,按照平時正常書寫速度書寫,字跡不要過于潦草,不要刻意寫大字或?qū)懶∽帧?/p>
200名書寫者每人在相同的條件下書寫相同的樣本文字,用于不同人漢字筆跡間相似度的實驗研究樣本。其中選擇個別書寫人相隔7日后,再次在相同的條件下書寫相同的樣本筆跡,用于同一人書寫漢字筆跡穩(wěn)定度的實驗研究樣本。
(1)選定一段樣本文字,隨機選擇實驗對象200名。
(2)要求每個實驗對象在A4紙表格中用黑色簽字筆書寫樣本文字,并填寫書寫者的性別和文化程度。
(3)整理全部樣本,根據(jù)書寫水平分成高、低兩個檔次。運筆規(guī)范,結(jié)構(gòu)合理,布局得當且美觀的,視為書寫水平高的樣本,共計142份;其余樣本在運筆、結(jié)構(gòu)及布局方面相對較差,視為書寫水平低樣本,共計58份。對高低檔次選取的筆跡樣本分別以A、B標示,并對每檔中的所有樣本分別編號為A1…A142和B1…B58。
(4)選擇1份書寫水平高的筆跡樣本A1和1份書寫水平低的筆跡樣本B1,作為標準樣本。逐個單字選取筆跡鑒定中所依據(jù)的字形、寫法、筆順、搭配、比例及運筆等特征[4]。每個單字盡量多選取特征。
(5)將其余樣本筆跡在同檔次范圍內(nèi)逐一與標準樣本筆跡進行量化比對,并對實驗結(jié)果數(shù)據(jù)統(tǒng)計分析。
(6)選擇標準樣本(A1和B1)的書寫人,再次書寫樣本文字,與先前本人書寫的樣本筆跡分別進行量化比對,并對實驗結(jié)果數(shù)據(jù)統(tǒng)計分析。
(7)總結(jié)并得出實驗結(jié)論。
為了便于進行統(tǒng)計分析,本文引入概念“相似度”和“穩(wěn)定度”。相似度和穩(wěn)定度是指比對樣本特征點和標準樣本特征點之間的整體符合情況。當標準樣本與比對樣本是不同人的筆跡時,稱為相似度;當標準樣本與比對樣本是同一人的筆跡時,稱為穩(wěn)定度。
在不同人筆跡相似度的統(tǒng)計中,筆者在書寫水平高、低兩個檔次各取一份樣本作為標準樣本,對其每個字進行特征點選取并賦值。對于相對特征價值一般的特征,賦值1,一些非常特殊的特征可以適當增加權(quán)重,根據(jù)特征的特殊情況加大賦值為2或3。其余樣本作為比對樣本,與標準樣本按照選定的特征點進行分別比對,統(tǒng)計出相同特征點數(shù)值占總特征點數(shù)值的比例,計算出單字的相似度。
同一人筆跡穩(wěn)定度的統(tǒng)計,筆者對書寫水平高、低兩個檔次各取一份樣本,以標準樣本書寫人1個星期后再次書寫的樣本作為比對樣本,比對統(tǒng)計方法與相似度比對統(tǒng)計方法相同。
單字相似度(穩(wěn)定度)=單字的相同特征點數(shù)值之和/標準樣本單字所有特征點數(shù)值之和百分比。
兩個單字組合,3個單字組合,以此類推,計算出多字的相似度(穩(wěn)定度)。
計算公式為:r=(a+b+…+n)÷m
r為多字相似度(穩(wěn)定度),a,b…n代表各單字符合特征點數(shù)值之和,m為標準樣本中各單字所有特征點數(shù)值總和。
3不同人筆跡相似度的實驗結(jié)果數(shù)據(jù)統(tǒng)計分析
本次實驗結(jié)果數(shù)據(jù)統(tǒng)計分析,主要根據(jù)書寫水平不同分成高低兩種類型進行討論。
3.1.1書寫水平高者漢字筆跡相似度
書寫水平高者筆跡樣本共142份,其中標準樣本1份,比對樣本141份,相似度統(tǒng)計結(jié)果如表1。
表1 10個單字的142份書寫水平高群體樣本筆跡間相似度情況
3.1.2書寫水平低者漢字筆跡相似度
書寫水平低者筆跡樣本共58份,其中標準樣本1份,比對樣本57份,相似度統(tǒng)計結(jié)果如表2。
3.1.3小結(jié)
(1)書寫水平較高群體間筆跡的相似度高于書寫水平較低群體間筆跡的相似度。如80%以上相似度最高的單字份數(shù)比,較高群體為28.4%,較低群體為21.1%。10個單字中達到90%以上相似度的樣本份數(shù),較高群體為49份,占總份數(shù)的34.8%,而較低群體的樣本份數(shù)僅為7份,占總份數(shù)的12.3%。
表2 10個單字的58份書寫水平低群體樣本筆跡間相似度情況
(2)對于一些筆畫少,字形結(jié)構(gòu)簡單的字,其平均相似度相對較高,相對容易出現(xiàn)相似度在90%以上的情況;而對于一些筆畫較多,字形結(jié)構(gòu)較為復(fù)雜的字,其平均相似度與字形結(jié)構(gòu)簡單的字相比平均相似度相對較低,相似度高于90%的情況不多。
(3)在個別樣本、個別單字中,有與標準樣本所選特征點完全符合的情況。如在書寫水平較高群體中,有3份比對樣本分別在“中”、“大”、“王”單字上,相似度達到了100%。
(4)大多數(shù)筆跡的單字相似度集中在50%~80%之間,筆畫較為簡單的單字相似度略有升高。
3.2.1書寫水平高者漢字筆跡相似度
書寫水平高者筆跡樣本共142份,其中標準樣本1份,比對樣本141份,相似度統(tǒng)計結(jié)果如表3。
表3 多字組合的142份樣本筆跡間相似度情況
3.2.2書寫水平低者漢字筆跡相似度
書寫水平低者筆跡樣本共58份,其中標準樣本1份,比對樣本57份,相似度統(tǒng)計結(jié)果如表4。
表4 多字組合的58份樣本筆跡間相似度情況
3.2.3小結(jié)
(1)多字間較高相似度樣本的份數(shù)明顯少于單字的數(shù)量,并且隨著字數(shù)的增多,高相似度的份數(shù)逐漸降低,低相似度的數(shù)量逐漸升高。
(2)多字相似度的整體呈下降趨勢,其中書寫水平低者較書寫水平高者明顯,下降幅度大。
(3)當多字字數(shù)為2、3時,相似度達到80%的只有極個別樣本,而隨著字數(shù)的不斷增加,到達4~6個字時,已經(jīng)完全沒有相似度較高的樣本。
4同一人書寫筆跡穩(wěn)定度的實驗結(jié)果數(shù)據(jù)統(tǒng)計分析
筆者在一個星期后讓標準樣本A1和B1的書寫者再次書寫樣本筆跡,與標準樣本進行量化比對,計算同一人書寫筆跡的穩(wěn)定度。
書寫水平高低的兩個標準樣本(A1和B1)的兩名書寫者,其筆跡的單字穩(wěn)定度統(tǒng)計結(jié)果如表5。
表5 書寫水平高、低兩人的筆跡單字穩(wěn)定度情況表 (單位:%)
書寫水平高低的兩個標準樣本(A1和B1)的兩名書寫者,其筆跡的多個漢字的穩(wěn)定度統(tǒng)計結(jié)果如表6。
表6 書寫水平高、低兩人筆跡的多字穩(wěn)定度情況表 %
(1)無論是書寫水平高者還是書寫水平低者,除個別單字外,其單字穩(wěn)定度總體保持在較高的水平,其中書寫水平高者的穩(wěn)定度要略高于書寫水平低者。
(2)雖然在個別單字上沒有達到高穩(wěn)定度,但是隨著字數(shù)的增加,整體穩(wěn)定度逐漸趨于平緩,基本保持在相對較高的水平。書寫水平低者的總體穩(wěn)定性在80%周圍浮動,書寫水平高者的整體穩(wěn)定性略高于書寫水平低者,在84%周圍浮動。
5結(jié)論
(1)不同人書寫的筆跡中,一個單字存在相似度較高的情況,尤其是結(jié)構(gòu)簡單、筆畫較少的單字,但多個單字的特征總和的相似度逐漸變低。
(2)同一人書寫的筆跡中,存在個別單字的穩(wěn)定度較低的情況,但多個單字的特征總和的穩(wěn)定度逐漸變高。
(3)有不同人書寫單字的相似度高于同一人書寫單字的穩(wěn)定度的情況發(fā)生。但隨著字數(shù)的增多,不同人筆跡的相似度要遠低于同一人筆跡的穩(wěn)定度。
(4)在筆跡鑒定過程中,面對少量字,尤其是筆畫較少、結(jié)構(gòu)簡單的漢字時,在沒有高價值的符合特征的情況下,少量字的同一認定,如果出具明確性意見,存在著錯誤意見風(fēng)險。
參考文獻
[1]張娟. 相似性在筆跡鑒定中的運用研究[J]. 山西警官高等??茖W(xué)校學(xué)報,2007,15(3):76-78.
[2]唐啟明. 量化數(shù)據(jù)分析:通過社會研究檢驗想法[M]. 北京:社會科學(xué)文獻出版社,2012:20-44,184-212.
[3]黃建同,梁立崢,等. 文件的科學(xué)檢驗:方法與技術(shù)[M]. 北京:中國人民公安大學(xué)出版社,2012:35-44.
[4]賈玉文,鄒明理. 中國刑事科學(xué)技術(shù)大全文件檢驗[M]. 北京:中國人民公安大學(xué)出版社,2002:109-176.
(責(zé)任編輯陳小明)
作者簡介張云(1963—),女,北京人,高級工程師。研究方向為文件檢驗。
中圖分類號D918.92