林凡琦, 姜 紅*, 王嘉庚, 滿 吉
(1.中國人民公安大學偵查學院,北京 100038;2.北京市公安局豐臺分局,北京 100071;3.北京華儀宏盛技術(shù)有限公司,北京 100123)
橡膠作為常見的鞋底制作材料,是法庭科學中的常見物證。對現(xiàn)場提取的橡膠鞋底微量物證進行比對檢驗,可以為劃定偵查范圍、確定或排除嫌疑人提供依據(jù)。橡膠鞋底材料是高分子混合物,其中既含有天然橡膠成分,也含有順丁橡膠、異戊橡膠、丁苯橡膠等合成橡膠成分[1]。橡膠鞋底成分多樣,制造工藝不同導致其內(nèi)部成分不均勻,這對橡膠鞋底中有機成分的檢測造成困難。在生產(chǎn)過程中廠家為了適應(yīng)不同的使用需求,會在橡膠鞋底制作中加入硫化劑、促進劑、補強劑、填充劑、防老劑等添加劑[2],這使得橡膠鞋底中含有大量金屬元素,且具有易檢測、出現(xiàn)率高、成分穩(wěn)定的特點。由于不同鞋種、不同品牌的橡膠鞋底所用的添加劑和其它助劑不同,所含金屬元素也就不同,這為利用無機元素檢測區(qū)分不同橡膠鞋底提供了條件。
目前法庭科學對于橡膠物證的檢驗方法,主要有紅外光譜法[3]、拉曼光譜法[4]、裂解氣相色譜法[5,6]、X射線熒光光譜法[2]等。X射線熒光光譜法是利用高能的X射線照射樣本,根據(jù)發(fā)出的具有一定特征的X射線光譜確定元素種類的一種光學檢驗技術(shù)。X射線熒光光譜儀能夠根據(jù)樣本中各元素能量的高低來測定各元素的量,實現(xiàn)對樣本中無機元素成分的定性與半定量,在土壤檢測[7]、材料成分辨別[8]、礦業(yè)勘探[9]等領(lǐng)域都有廣泛應(yīng)用。在公安實踐中,因為X射線熒光光譜具備檢驗過程無損、分析速度快、靈敏度高的特點,被廣泛用于文件檢驗[10]、理化分析[11]、爆炸現(xiàn)場勘查[12]等方面。已有研究針對X射線熒光光譜法檢驗橡膠鞋底進行實驗,但主要停留于定性分析層面,在公安實踐中的應(yīng)用效果有限[13,14]。本實驗利用X射線熒光光譜法對50個不同品牌、不同鞋種的橡膠鞋底樣本進行檢驗,并結(jié)合多元分類模型實現(xiàn)對不同鞋種樣本的有效區(qū)分,可為現(xiàn)場快速鑒別橡膠鞋底微量物證提供參考。
X-MET8000能量色散型熒光光譜儀(日本,日立公司)。靶極為Rh陽極靶,工作電壓為45 kV,工作電流為40 μA,檢測時間為60 s。
不同品牌、不同鞋種的橡膠鞋底樣本共50個,其中包括皮鞋樣本25個,休閑鞋樣本11個,籃球鞋樣本5個,跑鞋樣本2個、足球鞋樣本3個、拖鞋樣本4個,共30個品牌。具體樣本信息如表1所示。
表1 50個橡膠鞋底樣本列表
用手術(shù)刀切取厚度在2~3 mm左右,面積約1 cm×1 cm大小的橡膠鞋底碎塊,分別進行裝袋并編號記錄。將處理好的樣品分別放置在測試臺上,在上述的相同實驗條件下,對樣品分別進行3次測定后,取平均值。
多層感知器(MLP)神經(jīng)網(wǎng)絡(luò)是一種前向結(jié)構(gòu)的人工神經(jīng)網(wǎng)絡(luò),包含輸入層、輸出層及多個隱藏層。網(wǎng)絡(luò)數(shù)據(jù)由輸入層向下層傳輸,由隱藏層中帶有激活函數(shù)的神經(jīng)元對輸入數(shù)據(jù)進行計算,同時將信息傳遞至輸出層[15]。MLP作為一種高度并行的信息處理系統(tǒng),對于系統(tǒng)的參數(shù)變化及外界干擾都有很好的魯棒性,被廣泛用于解決各種分類問題[16,17]。
二元logistic回歸是一種廣義的線性回歸分類模型,適合數(shù)值型的二值型輸出的擬合,常用于疾病診斷、經(jīng)濟預(yù)測等領(lǐng)域。其基本原理為:以Y表示二分類反應(yīng)變量,假設(shè)自變量為m個,記為X1,X2,X3,…Xm。設(shè)P=(Y=1),則構(gòu)建logistic模型如下:
(1)
其中,β0為常數(shù)項(截距),βi為自變量Xi的回歸系數(shù)。當e(β0+β1X1+β2X2+…+βmXm)在(-∞,+∞)之間變動時,P在0到1之間變動??蓳?jù)此分析反應(yīng)變量和自變量之間的關(guān)系,并計算變量取特定值的概率[18]。
Fisher線性判別分析是一種常見的以統(tǒng)計模型進行模式識別的方法。其思想為:將原來在R維空間的自變量組合投影到維度較低的D維空間上,再根據(jù)類間差異最大、類內(nèi)方差最小的原則建立線性判別方程。
皮鞋是最常見的檢材之一,故主要研究建立的模型對于皮鞋類橡膠鞋底與其他鞋種橡膠鞋底的區(qū)分。以X射線熒光光譜檢驗所得各橡膠鞋底類樣本中穩(wěn)定出現(xiàn)的元素為自變量建立MLP模型,得到樣本重要性正態(tài)化分布圖如圖1所示。分析圖1可知,F(xiàn)e、Pb、Zn元素對于模型構(gòu)建的影響相對較大。
圖1 自變量重要性圖Fig.1 Importance of independent variables
實驗以樣本中穩(wěn)定出現(xiàn)的元素為自變量建立二元logistic 回歸模型,對各自變量的顯著性進行統(tǒng)計分析。結(jié)果見表2,其中1單位Exp表示每增加1個單位目標變量,模型判定為“是”的可能性增加1倍。分析表2可知,Cu、Pb、Zn元素的顯著性均小于0.1,可以顯著影響模型分類結(jié)果。綜上所述,實驗選擇以“是否為皮鞋類樣本”作為因變量,Pb、Fe、Zn、Cu元素為協(xié)變量構(gòu)建模型。
表2 自變量顯著性分析
分別構(gòu)建基于MLP、二元logistic回歸和Fisher判別的分類模型,得到橡膠鞋底樣本在3種模型下的識別率如表3所示。在MLP模型中,皮鞋類樣本實現(xiàn)了全部歸類,非皮鞋類樣本的識別準確率為88%,總體識別準確率為94%,其分類結(jié)果較理想;二元logistic回歸模型總體分類準確率達86%,皮鞋類樣本歸類準確率為84%,而非皮鞋類樣本的歸類準確率為88%;Fisher判別分析模型對于皮鞋類樣本的歸類準確率為84%,非皮鞋類樣本歸類準確率僅64%,總體準確率為74%,分類結(jié)果不理想。結(jié)果表明,MLP模型對于橡膠鞋底樣本種類的區(qū)分能力明顯高于另外兩種。Fisher判別分析的結(jié)果則表明,將高緯度特征進行降維處理,按照同一類別投影盡可能靠近,不同類別投影盡可能分離的數(shù)據(jù)識別方式,難以對皮鞋類橡膠鞋底樣本與非皮鞋類橡膠鞋底樣本進行有效區(qū)分。
表3 不同模型分類結(jié)果
3種分類模型的誤分樣本基本信息如表4所示。分析表4可知,相較于Fisher判別分析與二元logistic回歸,MLP模型對于籃球鞋樣本與皮鞋樣本都有更好的識別準確率。與前者相比,后二者模型對于非皮鞋類樣本的分析判別能力較弱,判斷這與樣本的不平衡有關(guān)。非皮鞋類樣本種類各樣,相互之間存在一定不同,這為模型的識別增加了難度。MLP模型在這類因素的干擾下,顯示出更好的魯棒性。
表4 誤分樣本信息
實驗中3種分類模型均無法正確識別26#樣本,MLP模型無法正確識別4#、37#樣本。這3個樣本中,4#與26#樣本為跑鞋,37#樣本為軍用底材質(zhì)的休閑鞋。上述誤分樣本的特征元素含量見表5。
表5 誤分樣本元素含量(μg/g)
分析表5可知,樣本4#、26#中含有的Pb元素較少,與皮鞋類樣本的Pb元素含量接近,由于Pb元素在模型中的顯著性達0.061,對于分類結(jié)果的影響大,故判斷這是導致分類錯誤的主要原因。后續(xù)可相應(yīng)增加跑鞋類樣本,訓練提高模型對此類樣本的區(qū)分能力。樣本37#與其他休閑鞋樣本相比Pb元素含量較少而Cu元素含量較高,與皮鞋類樣本接近,判斷是因為樣本37#為軍用底休閑鞋,其加工材質(zhì)與皮鞋類鞋底樣本相近。
本實驗利用X射線熒光光譜技術(shù)對50個不同橡膠鞋底樣本進行了檢驗,通過多元分類模型對樣本進行準確識別和分類,并依據(jù)自變量顯著性篩選出了影響皮鞋類橡膠鞋底樣本識別的主要特征元素。結(jié)果表明,相較于Fisher判別分析和二元logistic回歸,多層感知器神經(jīng)網(wǎng)絡(luò)對于外界與樣本自身因素干擾有更好的魯棒性,其模型總體識別準確率達94%,皮鞋類樣本歸類準確率達100%,實驗結(jié)果理想。本文提出的將X射線熒光光譜與多層感知器神經(jīng)網(wǎng)絡(luò)算法相結(jié)合構(gòu)建橡膠鞋底分類模型的方法,可以實現(xiàn)對現(xiàn)場提取的橡膠鞋底微量物證的快速、無損檢驗,具有一定的實踐價值,能為后續(xù)的偵查提供方向。在后續(xù)實驗中,可針對性擴大不同鞋種橡膠鞋底樣本的容量,提高識別模型的準確性。