姬瑞軍,湯澄清,王明月
(中國刑事警察學(xué)院 遼寧沈陽 110035)
基于Logistic回歸模型的赤足跡的性別分析
姬瑞軍,湯澄清,王明月
(中國刑事警察學(xué)院 遼寧沈陽 110035)
目的:犯罪現(xiàn)場(chǎng)遺留足跡的性別。方法:選取足跡長(zhǎng)、足跡掌寬和足跡跟寬特征作為自變量,性別作為因變量,建立左、右足logistic回歸模型。樣本:410名男女左、右赤足跡樣本(其中男性207名,女性203名),測(cè)量了足跡長(zhǎng)、足跡掌寬和足跡跟寬等特征。結(jié)論:所獲取的模型對(duì)左足赤足跡的性別預(yù)測(cè)正確率為88.8%,對(duì)右足赤足跡的性別預(yù)測(cè)正確率為90.0%,均具有較高的性別預(yù)測(cè)準(zhǔn)確率。在一定條件下,所建立的數(shù)學(xué)模型可以為現(xiàn)場(chǎng)勘驗(yàn)人員對(duì)赤足跡的性別分析提供參考。
赤足跡;性別;足跡長(zhǎng);足跡掌寬;足跡跟寬;logistic回歸
近年來,隨著社會(huì)的發(fā)展,犯罪現(xiàn)象呈現(xiàn)出新的規(guī)律和特點(diǎn),犯罪主體的新特點(diǎn)主要表現(xiàn)在女性犯罪的增多。在我國“文化大革命”以前,女性犯罪占犯罪總數(shù)的5%左右,20世紀(jì)70-80年代,占整個(gè)犯罪的6-7%,現(xiàn)在則達(dá)10-20%,數(shù)量直逼德國[1]。眾所周知,犯罪必然會(huì)留下痕跡,足跡又是犯罪現(xiàn)場(chǎng)的重要痕跡之一,隨著女性犯罪的比例增多,對(duì)犯罪現(xiàn)場(chǎng)遺留足跡的性別研究是非常必要的。本文結(jié)合我國足跡勘驗(yàn)技術(shù),選取赤足跡的足跡長(zhǎng)、足跡掌寬和足跡跟寬作為變量,性別作為因變量,運(yùn)用統(tǒng)計(jì)學(xué)的方法,建立logistic線性回歸模型,用量的方法對(duì)赤足跡進(jìn)行性別分析。
(一)材料。
隨機(jī)選取身體健康,無殘疾,無足病史的207名成年男性和203名成年女性,分別收集每人左、右足清晰的靜態(tài)油墨捺印足跡樣本各一枚。其中,男性年齡在25±5歲,女性年齡在25±5歲。對(duì)獲取的赤足跡捺印樣本使用傳統(tǒng)的足跡測(cè)量方法[2]對(duì)足跡長(zhǎng)、足跡掌寬、足跡跟寬進(jìn)行測(cè)量。其中,足跡長(zhǎng)是赤足跡沿足跡中心線方向上的最長(zhǎng)距離;足跡掌寬是赤足跡掌內(nèi)外側(cè)突點(diǎn)間的距離;足跡跟寬是赤足跡跟內(nèi)、外側(cè)突點(diǎn)間的距離。為了便于實(shí)驗(yàn)數(shù)據(jù)的處理,規(guī)定左足跡長(zhǎng)、左足跡掌寬、左足跡跟寬、右足跡長(zhǎng)、右足跡掌寬、右足跡跟寬分別記為L(zhǎng)FL、LFB、LFHB、RFL、RFB、RFHB。
(二)方法。
將所獲取的數(shù)據(jù)輸入到SPSS 20.0軟件進(jìn)行統(tǒng)計(jì)學(xué)分析。為了獲取男性和女性足跡中差異較明顯的變量,使用獨(dú)立樣本T檢驗(yàn)比較變量在性別間是否存在顯著性差異。使用配對(duì)樣本T檢驗(yàn)比較左、右足間的數(shù)據(jù)是否存在顯著性差異。對(duì)左、右足跡的足長(zhǎng)、足掌寬和足跟寬進(jìn)行兩兩相關(guān)性分析,從而防止變量間存在高度的共線性。最后,使用Wald統(tǒng)計(jì)量檢驗(yàn)變量的顯著性并建立分析性別的logistic回歸模型。
(三)logistic回歸模型分析性別的原理。
Logistic回歸又稱邏輯回歸分析,用于處理因變量為定性變量的數(shù)據(jù),常用于疾病和財(cái)務(wù)風(fēng)險(xiǎn)預(yù)測(cè)等領(lǐng)域。其計(jì)算原理如下:假設(shè)Y取值為0,1兩個(gè)值,Y=1的概率為P(Y=1),則m個(gè)自變量分別為X1,X2,,……,Xm所對(duì)應(yīng)的logistic回歸模型為:或者寫為:式中:β0為截距;βi為Xi對(duì)應(yīng)的偏回歸系數(shù),也可理解為在控制了其他因素的條件下變量的預(yù)測(cè)能力。當(dāng)P值大于0.5時(shí),Y=1;當(dāng)P值小于0.5時(shí)Y=0?;趌ogistic回歸模型的特點(diǎn),可以建立性別(定性變量)作為因變量,足跡長(zhǎng)、足跡掌寬和足跡跟寬作為自變量用于分析性別的logistic回歸模型。
表1分別給出了男性和女性關(guān)于左、右足的各項(xiàng)描述性統(tǒng)計(jì)量。由表1可知,男性的左足和右足的足跡長(zhǎng)、足跡掌寬、足跡跟寬的均值均大于女性的相應(yīng)值,這與我們?nèi)粘UJ(rèn)識(shí)男性足比女性腳大相一致。
表1 男女赤足跡左右足長(zhǎng)、足掌寬和足跟寬的描述性統(tǒng)計(jì)量
(一)變量在性別間的差異性檢驗(yàn)結(jié)果。
為了獲取男性和女性足跡中差異較明顯的變量,需對(duì)足跡長(zhǎng)、足跡掌寬和足跡跟寬進(jìn)行獨(dú)立樣本T檢驗(yàn)。經(jīng)過獨(dú)立樣本T檢驗(yàn),男性和女性的左足和右足的足跡長(zhǎng)、足跡掌寬和足跡跟寬的P值均小于0.05(見表2),說明男性和女性的左足和右足的足跡長(zhǎng)、足跡掌寬和足跡跟寬均存在顯著性差異,此結(jié)論與文獻(xiàn)[3][4]研究結(jié)論一致,從而可以將足跡長(zhǎng)、足跡掌寬和足跡跟寬作為三個(gè)自變量用于構(gòu)建分析性別的logistic回歸模型。
表2 變量在性別間的獨(dú)立樣本T檢驗(yàn)結(jié)果
(二)變量在左右足間的差異性檢驗(yàn)結(jié)果。
為了確定變量在左、右間是否存在顯著性差異,從而是否需要分別建立左、右足的logistic回歸模型,需要對(duì)男性和女性的左、右足相應(yīng)數(shù)據(jù)進(jìn)行配對(duì)樣本T檢驗(yàn)。表3顯示了男性和女性的左、右足相應(yīng)變量間的配對(duì)樣本T檢驗(yàn)結(jié)果。由表3可知,在男性中,左足和右足的足跡長(zhǎng)和足跡跟寬的P值均大于0.05,足跡掌寬的P值小于0.05,說明在男性中,左足和右足的足跡長(zhǎng)和足跡跟寬不存在顯著性差異,而足跡掌寬存在顯著性差異;在女性中,左足和右足的足跡長(zhǎng)和足跡跟寬的P值均小于0.05,足跡掌寬的P值大于0.05,說明在女性中,左足和右足的足跡長(zhǎng)和足跡跟寬存在顯著性差異,而足跡掌寬不存在顯著性差異。這些變量雖然經(jīng)過統(tǒng)計(jì)檢驗(yàn)存在顯著異性,但是P值并不大,這些差異可能是由于男性和女性在左足和右足間的足底壓力分布的不同[5],進(jìn)而對(duì)足部肌肉產(chǎn)生不同的擠壓,從而產(chǎn)生了略微顯著的統(tǒng)計(jì)差異。由于這些變量在左足和右足間的顯著性差異不同,所以分別建立用于分析性別的左足和右足的logistic回歸模型是必要的。
表3 變量在左右足間的配對(duì)樣本T檢驗(yàn)結(jié)果
(三)變量間共線性診斷結(jié)果。
在建立logistic回歸模型前,需要考慮變量間的共線性問題。表4和表5給出了左足和右足的足跡長(zhǎng)、足跡掌寬和足跡跟寬的相關(guān)性分析結(jié)果。由表4和表5可知,左足和右足的足跡長(zhǎng)、足跡掌寬和足跡跟寬的Pearson相關(guān)性系數(shù)r均小于0.8,說明三變量間不存在高度的共線性,可以作為建立logistic回歸模型的三個(gè)獨(dú)立變量。
表4 左足變量間的相關(guān)性
在α=0.01水平(雙側(cè))上。
表5 右足變量間的相關(guān)性
在α=0.01水平(雙側(cè))上。
(四)logistic回歸模型的建立。
將男性和女性的左、右足的足跡長(zhǎng)、足跡掌寬和足跡跟寬輸入SPSS軟件建立logistic回歸模型,采用向后Wald逐步剔除法確定最終模型。向后Wald逐步剔除法的計(jì)算過程是先將所有變量建立回歸模型,然后計(jì)算每個(gè)變量的Wald統(tǒng)計(jì)量值,對(duì)于不滿足顯著性水平的變量逐步從回歸模型中排除。經(jīng)計(jì)算,SPSS軟件對(duì)左、右足分別建立一個(gè)logistic回歸模型(見表6,7)。
表6 左足logistic回歸模型
a.在步驟1中輸入的變量:LFL,LFB,LFHB;
b.在步驟2中輸入的變量:LFL,LFB。
表7 右足logistic回歸模型
a.在步驟1中輸入的變量:RFL,RFB,RFHB;
b.在步驟2中輸入的變量:RFL,RFB。
1.左足logistic回歸模型。由表6可知,步驟1所建立的左足回歸模型中變量LFHB的Wald檢驗(yàn)的顯著性水平等于0.638大于0.05,說明在利用回歸模型對(duì)性別進(jìn)行預(yù)測(cè)時(shí),變量LFBH對(duì)性別預(yù)測(cè)的貢獻(xiàn)較小,即變量LFHB與性別關(guān)聯(lián)性較小,故將其排除獲得步驟2建立的左足回歸模型:
步驟2建立的回歸模型中變量的Wald檢驗(yàn)的顯著性水平均小于0.05,說明在利用所建立的回歸模型對(duì)性別進(jìn)行預(yù)測(cè)時(shí),變量LFL、LFB對(duì)性別預(yù)測(cè)的貢獻(xiàn)較大,即變量LFL、LFB與性別的關(guān)聯(lián)性較大,可以有效預(yù)測(cè)和解釋性別。
將男性和女性左足的相應(yīng)數(shù)據(jù)分別代入到以上步驟2建立的左足logistic回歸模型中進(jìn)行預(yù)測(cè),當(dāng)P值大于0.5時(shí)預(yù)測(cè)為女性,當(dāng)P值小于0.5時(shí)預(yù)測(cè)為男性。步驟2建立的左足logistic回歸模型預(yù)測(cè)結(jié)果見表8。
表8 左足步驟2回歸模型的預(yù)測(cè)結(jié)果
a.切割值為0.500。
由表6可知,步驟2建立的左足logistic回歸模型具有統(tǒng)計(jì)學(xué)意義,并且,由表8可知,步驟2建立的回歸模型對(duì)男性左足赤足跡預(yù)測(cè)正確的百分比為89.9%,對(duì)女性左足赤足預(yù)測(cè)正確的百分比為87.7%,對(duì)左足赤足跡性別預(yù)測(cè)正確的總百分比為88.8%。
2.右足logistic回歸模型。同理,由表7可知,步驟1所建立的右足回歸模型中變量RFHB的Wald檢驗(yàn)的顯著性水平等于0.844大于0.05,說明在利用回歸模型對(duì)性別進(jìn)行預(yù)測(cè)時(shí),變量RFHB對(duì)性別預(yù)測(cè)的貢獻(xiàn)較小,即變量RFHB與性別關(guān)聯(lián)性較小,故將其排除獲得步驟2建立的右足回歸模型:
步驟2建立的回歸模型中變量的Wald檢驗(yàn)的顯著性水平均小于0.05,說明在利用所建立的回歸模型對(duì)性別進(jìn)行預(yù)測(cè)時(shí),變量RFL、RFB對(duì)性別預(yù)測(cè)的貢獻(xiàn)較大,即變量RFL、RFB與性別存在關(guān)聯(lián)性較大,可以有效預(yù)測(cè)和解釋性別。
將男性和女性右足的相應(yīng)數(shù)據(jù)分別代入到步驟2建立的右足logistic回歸模型中進(jìn)行預(yù)測(cè),當(dāng)P值大于0.5時(shí)預(yù)測(cè)為女性,當(dāng)P值小于0.5時(shí)預(yù)測(cè)為男性。步驟2建立的右足logistic回歸模型預(yù)測(cè)結(jié)果見表9。
表9 右足步驟2回歸模型的預(yù)測(cè)結(jié)果
a.切割值為0.500
由表7可知,步驟2建立的logistic回歸模型具有統(tǒng)計(jì)學(xué)意義,并且,由表9可知步驟2所建立的回歸模型對(duì)男性右足赤足跡預(yù)測(cè)正確的百分比為89.4%,對(duì)女性右足赤足跡預(yù)測(cè)正確的百分比為90.6%,對(duì)右足赤足跡性別預(yù)測(cè)正確的總百分比為90.0%。
本文通過提取男、女赤足跡中足長(zhǎng)、足掌寬和足跟寬,用獨(dú)立樣本T檢驗(yàn)比較了男性和女性在赤足跡中的足長(zhǎng)、足掌寬和足跟寬的統(tǒng)計(jì)學(xué)差異,用配對(duì)樣本T檢驗(yàn)比較了左足和右足在赤足跡中的足長(zhǎng)、足掌寬和足跟寬的統(tǒng)計(jì)學(xué)差異,用Wald逐步剔除法分別建立了左、右足關(guān)于足跡長(zhǎng)和足跡掌寬的logistic回歸模型。所建立的左、右足logistic回歸模型對(duì)樣本進(jìn)行性別預(yù)測(cè),預(yù)測(cè)正確的百分比分別為88.8%、90.0%,均具有較高的預(yù)測(cè)準(zhǔn)確率,說明建立的logistic回歸模型擬合度較好,可以為現(xiàn)場(chǎng)勘驗(yàn)人員對(duì)現(xiàn)場(chǎng)赤足跡的性別分析提供參考。同時(shí),在辦案的實(shí)際工作中,現(xiàn)場(chǎng)勘驗(yàn)人員在運(yùn)用上述模型時(shí),也應(yīng)結(jié)合足型特征和案件的其他情況進(jìn)一步提高對(duì)性別分析的準(zhǔn)確率,從而為分析犯罪嫌疑人人身特點(diǎn)提供更有力的依據(jù)。
[1]尚金萍.女性犯罪增多的性別視角淺析[J].山西警官高等專科學(xué)校學(xué)報(bào),2010,(3):18-21.
[2]史力民.足跡學(xué)[M].北京:中國人民公安大學(xué)出版社,2007.
[3]湯澄清.利用足跡足型特征分析性別的研究[J].山西警官高等專科學(xué)校學(xué)報(bào),2009,(3):78-80.
[4]Jaydip Sen,等.Sex Estimation from Foot Dimensions in an Indigenous Indian Population[J].Forensic Sic,2011,56:S148-S153.
[5]張騰丹,等.青年大學(xué)生行走步態(tài)足底區(qū)域壓力特征變化的研究[J].遼寧警察學(xué)院學(xué)報(bào),2016,1:85-91.
[6]榮泰生.SPSS與研究方法[M].大連:東北財(cái)經(jīng)大學(xué)出版社,2012.
[7]郭志剛.社會(huì)統(tǒng)計(jì)分析方法[M].北京:中國人民大學(xué)出版社,2015.
[8]DM Fessler,等.Sexual dimorphism in foot length proportionate to stature[J].Taylor&Francis,2005,32(1):44-59.
[9]Jacqueline Domjanic,等.A Combined Morphometric Analysis of Foot Form and Its Association with Sex,Stature,and Body Mass[J].American Journal of Physical Anthropology,2015,157(4):582-291.
[10]Kewal Krishan,等.Sex Determination from Hand and Foot Dimensions in a North Indian Population[J].Forensic Sic,2011,56 (2):453-459.
[11]Naomi Hemy,等.Sex estimation using anthropometry of feet and footprints in a Western Australian population[J].Forensic SciInt,2013,231(2013):402e1-102e6.
Gender-analysis of Bare Footprints Based on Logistic Regression Model
JI Ruijun,TANG Cheng-qing,WANG Ming-yue
t:Objective:To investigate the gender of the footprints left at the crime scene.Methods:Select the footprint length,footprint width and footprint heel width as independent variables,and gender as the dependent variable,then establish the logistic regression model.Sample:Collected 410 men and women left and right bare footprint samples(male 207,female,203),and the characteristics of footprint length,footprint width and footprint are measured.Conclusion:The prediction’s accuracy of the model acquired by left bare footprints on gender was 88.8%,and the right footprints was 90.0%.Gender prediction has a higher accuracy.On certain conditions,the mathematical model can provide a reference for the crime scene examiner for gender analysis by bare footprints.
Bare footprint;Gender;Footprint Length;Footprint width;Footprint heel width;Logistic regression
D981.912
:A
:1674-5612(2017)01-0062-07
(責(zé)任編輯:吳良培)
2017-01-12
姬瑞軍,(1991-),男,河南鶴壁人,中國刑事警察學(xué)院碩士生,研究方向:痕跡檢驗(yàn)學(xué);湯澄清,(1969-),男,遼寧沈陽人,碩士,中國刑事警察學(xué)院教授,研究方向:痕跡檢驗(yàn)學(xué);王明月,(1993-),男,山東濱州人,中國刑事警察學(xué)院碩士生,研究方向:痕跡檢驗(yàn)學(xué)。