托婭,黎世瑩,張吉,鄧愷飛,羅儀文,孫其然,董賀文,黃平
(1.上海健康醫(yī)學院基礎(chǔ)醫(yī)學院,上海 201318;2.司法鑒定科學研究院 上海市法醫(yī)學重點實驗室 司法部司法鑒定重點實驗室 上海市司法鑒定專業(yè)技術(shù)服務平臺,上海 200063)
皮膚電流斑是電擊傷的特征形態(tài)學改變[1]。目前對電擊死的診斷除了結(jié)合案情外,通過電流斑大體形態(tài)學及顯微鏡進行確認,但是某些電流斑大體形態(tài)不典型,鏡下表皮細胞極化現(xiàn)象也會出現(xiàn)在燒傷、擦傷中。因此,確定皮膚損傷是否為電流斑給法醫(yī)實踐帶來一定的困難。國內(nèi)外學者[2-5]通過動物和人尸體電擊傷研究,發(fā)現(xiàn)電擊傷、燒傷、擦傷細胞核極化程度和形態(tài)具有一定的差異。但上述研究仍需要法醫(yī)對不同類型損傷進行形態(tài)學觀察,具有較大的主觀性。如何尋找一種客觀、定量方法鑒定電擊傷是目前亟待解決的問題。傅里葉變換顯微紅外光譜(Fourier transform infrared microspectroscopy,F(xiàn)TIR-MSP)可以檢測組織、細胞的化學成分變化,該項技術(shù)被廣泛用于生物學、醫(yī)學、微生物學等領(lǐng)域[1,6-10]。FTIR-MSP技術(shù)與機器學習算法相結(jié)合,可以有效進行分類和定量研究,在大數(shù)據(jù)分析方面發(fā)揮出獨特優(yōu)勢[11]。機器學習中常用主成分分析(principal component analysis,PCA)對多元變量數(shù)據(jù)進行降維后無監(jiān)督聚類分析、偏最小二乘法判別分析(partial least squares discrimination analysis)及用線性判別分析(linear discriminant analysis,LDA)對線性數(shù)據(jù)變量進行分類識別、支持向量機(support vector machine,SVM)對非線性數(shù)據(jù)變量進行有效分類、因子載荷算法(loading)篩選出特征性變量。
本研究通過FTIR-MSP結(jié)合機器學習算法構(gòu)建電擊傷、燒傷、擦傷的判別模型,尋找電擊傷的光譜學特征性標志物,為電流斑的鑒定提供新方法。
成年6個月巴馬豬,雄性,5只,由上海交通大學醫(yī)學院提供。實驗動物研究通過上海健康醫(yī)學院倫理委員會審批。每只豬左前肢皮膚分別制作電擊傷、燒傷、擦傷的模型,正常皮膚為對照組。220V交流電電擊皮膚30s形成電流斑,酒精燈外圍火焰灼燒皮膚5 s形成燒傷,金屬銼刀搓擦皮膚形成擦傷。取各組豬皮膚組織10mm×10mm,用生理鹽水洗凈,置于甲醛溶液固定,石蠟包埋。
皮膚組織蠟塊連續(xù)切片,一張用于蘇木精-伊紅(hematoxylin-eosin,HE)染色,連續(xù)下一張切片行FTIRMSP檢測。光譜檢測:從石蠟包埋的組織塊中作厚10 μm組織貼于氟化鋇載玻片(76.2 mm×25.4 mm×20.0mm)上,隨后將切片脫蠟、水合、空氣干燥。使用Thermo ScientificTMNicoletTMiNTM10顯微紅外光譜儀(美國Thermo Fisher Scientific公司)收集表皮極化細胞光譜。設(shè)置顯微紅外測量像素為50μm×50μm,分辨率為8cm-1,波數(shù)范圍4000~1000cm-1,每個像素點掃描16次。從具有相似病理變化的區(qū)域中隨機選擇光譜點,以確保重現(xiàn)性和均勻性,隨機選取各組20個光譜作為樣本。
使用The Unscrambler? X(挪威Camo公司)構(gòu)建損傷和對照組的光譜矩陣,并使用該軟件對光譜矩陣進行平滑處理,歸一化及多元散射校正。使用The Unscrambler?X中機器學習算法開展分類、建模、變量篩選等數(shù)據(jù)分析。對電擊傷、燒傷、擦傷與對照組進行PCA、PLS處理,loading算法對特征峰進行篩選。LDA與SVM對不同損傷建模,模型采用內(nèi)部交互驗證(cross validation,CV),留一交叉驗證(leaveone-out cross validation,LOOCV)對模型進行驗證。采用混淆矩陣(confusion matrix)對LDA和SVM模型進行質(zhì)量評估。IBM SPSS statistics 22.0軟件(美國IBM公司)對篩選峰位進行單因素方差分析,最小顯著性差異法(least significant difference,LSD)對篩選峰位峰強行組間比較分析。
對照組(圖1A)與電擊傷組(圖1B)相比,電擊傷組表皮層變薄,伴皮下分離,表皮細胞核固縮、伸長,部分與基底膜平行排列,表皮細胞呈現(xiàn)極化現(xiàn)象;其下真皮層膠原纖維均質(zhì)化、排列緊密,表現(xiàn)為腫脹、嗜伊紅染色增強,部分毛囊細胞核伸長、染色加深。燒傷組(圖1C)鏡下表現(xiàn)與電擊傷組類似。擦傷組(圖1D)與對照組(圖1A)相比,表皮層未見明顯變薄,少見皮下分離,部分近基底膜處表皮細胞核伸長、固縮,其下真皮層膠原纖維均質(zhì)化、排列緊密,深度較淺。表皮細胞極化程度擦傷組程度最輕,電擊傷、燒傷組表皮細胞極化程度相似。
圖2顯示各損傷組和對照組平均光譜,4組平均光譜峰位相似,皮膚電流斑紅外光譜在3000~2825cm-1、1700~1350cm-1區(qū)域峰強高于燒傷組和擦傷組,燒傷組略高于擦傷組,各損傷組峰強高于對照組。
圖1 豬皮膚HE染色結(jié)果Fig.1 HE staining results of pig skin
圖2 各組豬皮膚平均光譜Fig.2 Average spectrum of pig skin in each group
對全波段進行主成分提取,由圖3可見,前2個主成分的累積貢獻率達到92%,PC1與PC2二維圖可將4組皮膚區(qū)分,對照組和各損傷組明顯區(qū)分。對照組與電擊傷組分布于PC1軸的左、右兩側(cè),燒傷組和擦傷組布于PC1軸中間部位,電擊傷組、燒傷組與擦傷組有部分樣本重疊分布,但大部分具有各自的區(qū)域性分布特點。燒傷組與擦傷組于PC2軸上、下分布。
PLS與PCA分布圖具有相似分布特點,電擊傷和對照組分布于Factor 1軸左、右兩側(cè),燒傷和擦傷組分布于中間位置。在Factor 2軸上擦傷和燒傷分布于上、下位置(圖4)。從位置分布圖上,PLS比PCA區(qū)分能力更強。圖5為全波段loading分析結(jié)果。2923、2 854、1 623、1 535 cm-1具有上、下極值分布,反映出4個吸收峰對區(qū)分不同損傷貢獻最高。圖6顯示了4個特征吸收峰均值和標準差,經(jīng)單因素方差分析和LSD檢驗,4組之間差異具有統(tǒng)計學意義。
圖3 各組皮膚光譜數(shù)據(jù)PCA圖Fig.3 PCA map of skin spectrum data of each group
圖4 各組皮膚光譜數(shù)據(jù)PLS圖Fig.4 PLS map of skin spectrum data of each group
圖5 各組皮膚光譜數(shù)據(jù)loading圖Fig.5 Loading chart of skin spectral data of each group
圖6 各組吸收峰峰強均值與標準差Fig.6 Mean value and standard deviation of absorption peak intensity in each group
LDA(圖7)比PLS和PCA區(qū)分能力更強,4組之間重疊分布樣本明顯少于PCA和PLS,LDA判別模型的驗證準確率達97.5%。LDA混淆矩陣(圖8)顯示,正常組和電擊傷組各1個樣本被判定為燒傷,其他樣本判定正確。SVM模型混淆矩陣(圖8)顯示,正常組和電擊傷組各1個樣本被判定為燒傷,擦傷組1個樣本被認為是電擊傷,其他樣本判斷正確。SVM判別驗證模型準確率達96.25%。SVM準確率略低于LDA。
圖7 電擊傷組、燒傷組、擦傷組及正常組皮膚光譜數(shù)據(jù)LDA分布圖Fig.7 LDA distribution of skin spectrum data of electric injury group,burn group,abrasion group and normal group
圖8 各組皮膚光譜分類模型的混淆矩陣Fig.8 Confusion matrix of skin spectral classification models in each group
電擊傷時表皮細胞核會發(fā)生固縮、伸長的極化現(xiàn)象。傳統(tǒng)觀點認為,這種改變是由于電磁效應和熱效應共同作用引起。實際上,在燒傷及擦傷中亦會檢見類似表皮細胞核伸長的極化現(xiàn)象[3],多是由皮膚的熱效應引起的。法醫(yī)學實踐中電擊傷、燒傷及擦傷在形態(tài)學上有時難以區(qū)分,給電擊死的鑒定帶來困難。
TAKAMIYA等[12]通過觀察大鼠皮膚電擊傷、燒傷的組織病理學特點進行研究,電擊傷和燒傷中,表皮細長核下的真皮均勻,膠原束和真皮成纖維細胞之間沒有空隙。在電擊傷中,表皮細胞核伸長率更高。üZüN等[3]對電擊傷、燒傷及擦傷進行研究發(fā)現(xiàn),表皮細胞極化程度在電擊傷中最為顯著,但在燒傷和擦傷中表皮細胞也有不同程度極化改變。中國學者XU等[13]使用形態(tài)學結(jié)合顯微定量測量技術(shù),發(fā)現(xiàn)電擊傷與擦傷表皮細胞具有明顯差異。ACAR等[14]使用原子吸收光譜檢測電擊傷皮膚金屬元素含量,發(fā)現(xiàn)銅元素在電擊傷皮膚中含量顯著升高。但上述形態(tài)學鑒定和觀察主觀性較大,金屬元素檢測指標單一,且受環(huán)境因素影響。因此,本研究使用了FTIR-MSP結(jié)合機器學習算法,構(gòu)建不同損傷的鑒定模型,篩選電擊傷的特異性標志物。
原始光譜存在基線偏移,切片厚度不同導致每個樣本峰強存在差異,尋找預處理的最佳參數(shù)是后期機器學習計算的基礎(chǔ)。此次研究對光譜采用歸一化處理,消除樣品厚度對光譜的影響,平滑處理提高了光譜信噪比,去除了高頻噪聲對信號的干擾。多元散射校正修正光譜光程誤差,消除了反射光譜和擴散投射光譜中的光散射影響。通過光譜預處理從而提高模型的準確性和可靠性,為校正模型的建立和未知樣本預測奠定了基礎(chǔ)[15]。
PCA是通過數(shù)據(jù)降維,以排除多元變量共線性相互重疊影響的無監(jiān)督分類方法。PLS適用于處理變量多且樣本少的數(shù)據(jù),因而具有較高的模型穩(wěn)定性,是一種高效降維抽提信息的方法[15-16]。本研究顯示,PCA和PLS均可以將不同類型損傷分離,但兩種算法分布圖可以看出部分樣本均存在重疊現(xiàn)象。電擊傷組和對照組皮膚有著分布差異,燒傷組、擦傷組分布位于對照組和電擊傷組中間,且燒傷組和擦傷組樣本重疊現(xiàn)象更為明顯。形態(tài)學上,電擊傷表皮極化程度最為嚴重,燒傷、擦傷分別次之,故PCA與PLS樣本聚類分布與形態(tài)學上極化程度有著一定相關(guān)性,且PLS分類效果優(yōu)于PCA。PCA和PLS兩種降維無監(jiān)督聚類分析可以有效將電擊傷、燒傷和擦傷進行分類。
構(gòu)建穩(wěn)定、最優(yōu)的損傷鑒定模型是此次研究重點。PCA和PLS是無監(jiān)督分類,為了鑒定皮膚電擊傷需構(gòu)建有監(jiān)督診斷模型。本研究選取了LDA、SVM算法構(gòu)建分類識別模型[15-16],LDA是有監(jiān)督的降維方法,是降維和模式分類領(lǐng)域應用中最為廣泛采用且極為有效的方法之一。本研究顯示,LDA模型可以有效分離不同類型損傷,且分類效果優(yōu)于PCA和PLS,準確率達到了97.5%,LDA混淆矩陣顯示僅有2個樣本預測錯誤,不排除2個樣本具有測量誤差或者樣本量少的干擾因素。由于多元變量分析數(shù)據(jù)可能為非線性分布,故本研究引入了SVM非線性分析手段,可將樣本分開,采用非線性映射到高維空間,高維空間中對樣本進行線性分類。本研究中SVM分類模型準確率為96.25%,低于LDA模型準確率,且SVM混淆矩陣錯誤率也比LDA模型高。這說明本研究不同類型損傷數(shù)據(jù)矩陣更加符合線性數(shù)據(jù)。
特征變量篩選是loading算法核心內(nèi)容,本研究通過該算法篩選出4個電擊傷特征性吸收峰。2923、2 854 cm-1符合酯類C-H結(jié)構(gòu)酯類吸收峰,1 623、1 535 cm-1符合蛋白質(zhì)酰胺Ⅰ、Ⅱ結(jié)構(gòu)蛋白吸收峰。通過單因素方差分析和LSD檢驗,發(fā)現(xiàn)上述特征吸收峰在損傷組和對照組中具有明顯差異。上述4個特征性吸收峰可以作為電擊傷鑒定特征性指標。
本研究通過動物試驗構(gòu)建了皮膚電擊傷、燒傷、擦傷的診斷模型,篩選出4個電擊傷特征性吸收峰。但本研究樣本量有限,且為動物學試驗,動物研究結(jié)果是否與人體研究一致,需要后期人尸體樣本深入研究進行驗證。在后續(xù)研究中加大人尸體樣本數(shù)量,以獲取更全面的數(shù)據(jù),為電擊傷診斷和電擊死的鑒定提供嶄新、可靠及客觀的鑒定依據(jù)。