国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

掃描電鏡/能譜法結(jié)合多元統(tǒng)計(jì)學(xué)無損檢驗(yàn)煙用接裝紙的研究

2021-08-12 08:17:34付鈞澤
中國造紙 2021年4期
關(guān)鍵詞:煙用判別函數(shù)均值

付鈞澤 姜 紅

(中國人民公安大學(xué)偵查學(xué)院,北京,100038)

我國煙民數(shù)量日益增多,同時(shí)香煙具有鎮(zhèn)定和緩解緊張情緒的作用,所以作案人常常會(huì)在作案時(shí)吸煙。香煙在燃滅后常會(huì)遺留下煙蒂部分,接裝紙是包在香煙煙蒂外面的裝飾用紙,與吸煙者嘴部直接接觸,所以在案件現(xiàn)場常會(huì)提取到煙用接裝紙物證,公安實(shí)戰(zhàn)中通常會(huì)對(duì)接裝紙物證上附著的生物物證做DNA鑒定,但由于生物物證極易受到環(huán)境的影響,故檢出率不高。通過對(duì)接裝紙物證的理化性質(zhì)進(jìn)行檢驗(yàn),可確定香煙種類,縮小偵查范圍。接裝紙是生產(chǎn)卷煙的重要材料,其作用是將濾嘴和卷煙煙支卷接起來,屬于特種工業(yè)用紙[1]。接裝紙的用途不僅是單純的包裝,更具有裝飾性的作用,這使得不同品牌的接裝紙組成成分具有差異。接裝紙的顏色大部分為黃色,黃色基本為烤煙型香煙,如駱駝香煙、紅塔山等。雜色香煙種類較少,如紅色過濾嘴的中華5000、藍(lán)色過濾嘴的芙蓉王(蔚藍(lán)星空)、白沙(尚品藍(lán))等。薄荷型香煙基本上是白色,如萬寶路[2]。目前,檢驗(yàn)香煙接裝紙的方法主要有原子吸收光譜法[3-4]、X射線熒光光譜法[5-6]、氣相色譜法[7]、液相色譜法[8]、氣質(zhì)聯(lián)用法[9]和液質(zhì)聯(lián)用法[10]等。但上述方法主要針對(duì)樣品有機(jī)成分進(jìn)行檢驗(yàn),并且檢測成本價(jià)格高,樣品的制備過程復(fù)雜,最佳操作條件遴選過程周期較長[11]。

本課題利用掃描電子顯微鏡結(jié)合X射線能譜儀對(duì)煙用接裝紙樣品進(jìn)行檢驗(yàn)。通過鑒別接裝紙物證可大致判斷購買人群,縮小檢查范圍。掃描電子顯微鏡可對(duì)樣品微觀放大成像,放大倍數(shù)達(dá)40萬倍以上且分辨率高[12],X射線能譜儀可對(duì)樣品無機(jī)元素進(jìn)行無損分析。由于掃描電子顯微鏡及能譜儀可對(duì)樣品同時(shí)做表面形貌分析和元素含量分析,在犯罪現(xiàn)場的物證快速檢驗(yàn)有很大的應(yīng)用前景。但獲得樣品元素?cái)?shù)據(jù)后進(jìn)行簡單描述性統(tǒng)計(jì)并不能消除偶然誤差和系統(tǒng)誤差的影響,故引入多元統(tǒng)計(jì)學(xué)對(duì)樣品能譜數(shù)據(jù)進(jìn)行分析,可最大程度上克服誤差達(dá)到準(zhǔn)確分類與預(yù)判的目的。該研究可為煙用接裝紙物證快速檢驗(yàn)提供借鑒,為公安基層實(shí)際辦案提供參考。

1 實(shí) 驗(yàn)

1.1 實(shí)驗(yàn)儀器及條件

Hitachi-3400N型掃描電子顯微鏡(SEM);EDAX Apollo型X射線能譜儀(EDS),低真空,加速電壓20 kV,時(shí)間常數(shù)1.6μs,譜采集時(shí)間29 s,工作距離10 mm。

1.2 實(shí)驗(yàn)樣品

從公共場所收集的煙用接裝紙樣品60個(gè),樣品具體名稱見表1。

表1 煙用接裝紙樣品表Table 1 Samples of cigarette tipping paper

1.3 實(shí)驗(yàn)方法

用手術(shù)刀對(duì)接裝紙樣品進(jìn)行取樣,樣品規(guī)格為2 mm×2 mm,固定于SEM導(dǎo)電膠樣品臺(tái),進(jìn)行檢驗(yàn)分析。

2 結(jié)果與討論

2.1 接裝紙樣品的初篩

通過觀察,絕大部分接裝紙主色調(diào)為黃色,說明黃色過濾嘴的香煙更受市場歡迎[13],其他少部分為紅色、藍(lán)色和白色等,所以可根據(jù)接裝紙顏色將60個(gè)樣品分為兩大類:第Ⅰ類樣品為黃色接裝紙;第Ⅱ類為雜色接裝紙。而后根據(jù)SEM圖進(jìn)一步對(duì)Ⅰ、Ⅱ類樣品進(jìn)行再分類,由于接裝紙是由纖維相互交織而形成,樣品表面存在大量的孔隙和凹凸不平處,加入細(xì)小顆粒填料后能提高紙張的柔軟性、平滑性和可塑性。所以根據(jù)SEM圖中顯示的填料的多少,來判斷接裝紙平滑度的高低,并依此分為粗糙型和平滑型,其中45#接裝紙是粗糙型的代表樣品,52#接裝紙是平滑型的代表樣品,SEM圖分別見圖1、能譜圖分別見圖2。綜合考慮接裝紙樣品外觀顏色和表面微觀形貌初步分為:Ⅰ-1(黃色粗糙型)、Ⅰ-2(黃色平滑型)、Ⅱ-1(雜色粗糙型)、Ⅱ-2(雜色平滑型),具體結(jié)果分類見表2。

圖1 接裝紙45#和52#樣品掃描電鏡圖Fig.1 SEM images of 45#and 52#tipping paper

圖2 接裝紙45#和52#樣品能譜圖Fig.2 EDS spectra of 45#and 52#tipping paper

由表2可知,對(duì)于Ⅰ-2、Ⅱ-1、Ⅱ-2類的樣品,樣品數(shù)量均不大于10個(gè)。Ⅰ-2類各樣品中元素種類和含量均有不同,對(duì)于未知的黃色平滑型的接裝紙樣品,可計(jì)算其與Ⅰ-2類各樣品元素含量的歐氏距離,以此確定樣品品牌。對(duì)于雜色樣品,由于雜色接裝紙本身就具有很強(qiáng)的特征性,結(jié)合元素含量與成分的不同,將未知的雜色接裝紙樣品與Ⅱ-1、Ⅱ-2類樣品比較,也可快速鎖定樣品品牌。故以樣品數(shù)量最多的Ⅰ-1為例,結(jié)合多元統(tǒng)計(jì)學(xué),建立未知煙用接裝紙的歸類模型。

表2 接裝紙樣品分類結(jié)果表Table 2 Classification results of tipping paper sample

2.2 K-均值聚類

K-均值聚類算法是一種迭代求解的聚類分析算法,其步驟是預(yù)先把數(shù)據(jù)分為K組,再選取K個(gè)對(duì)象作為初始聚類中心,計(jì)算每個(gè)對(duì)象和每個(gè)聚類中心的距離,把對(duì)象依次分配給它距離最近的聚類中心。每分配給聚類中心1個(gè)樣品,聚類中心會(huì)根據(jù)聚類中現(xiàn)有的樣品被重新計(jì)算,不斷重復(fù)直到滿足終止條件為止。

經(jīng)典的K均值算法是一種無監(jiān)督分類算法,使用貪心策略,多重迭代求得近似解。其目標(biāo)函數(shù)如式(1)所示[14]。

式中,k為聚類的個(gè)數(shù),xi為第i個(gè)樣本點(diǎn),θj為第j個(gè)類別質(zhì)心。每次迭代,通過最小化歐幾里得距離將每個(gè)樣本點(diǎn)xi分配到指定類別Ci。

在進(jìn)行K-均值聚類時(shí)要提前設(shè)定1個(gè)K值,即樣品被分為K個(gè)類別,K值的確定影響整個(gè)算法。在K值接近于真實(shí)值時(shí),組內(nèi)平方和(sum of squares due to error,SSE)的斜率會(huì)發(fā)生驟變,從而在圖像上形成1個(gè)“肘部”,該拐點(diǎn)即為真實(shí)的K值。其中SSE可作為評(píng)價(jià)聚類結(jié)果好壞的標(biāo)準(zhǔn)。Ⅰ-1類樣品SSE折線圖見圖3。

圖3 SSE與聚類數(shù)目關(guān)系圖Fig.3 The quantitative graph of SSE and clusters

當(dāng)聚類數(shù)目逐漸增多時(shí),每個(gè)類別中樣品數(shù)量逐漸減少,故SSE的下降幅度會(huì)突然放慢,隨著K值的增大而逐漸平緩。當(dāng)SSE減少很緩慢時(shí),存在的這個(gè)“肘部”就是最佳聚類數(shù)目,由圖3可知,SSE在1~4時(shí)下降得很快,當(dāng)K值>4后,曲線下降逐漸變緩,所以最佳聚類個(gè)數(shù)為4。K-均值聚類結(jié)果見表3。

表3 I-1接裝紙樣品聚類結(jié)果表Table 3 Classification results of I-1 tipping paper

煙用接裝紙的填料主要有CaCO3、TiO2、高嶺土(Al2(Si2O5)(OH)4)等[15],顏料主要為鐵黃和鐵紅。通過分析表3聚類結(jié)果中各組樣品能譜數(shù)據(jù)中元素含量的差異(結(jié)果略),發(fā)現(xiàn)I-1-1組中所有樣品均含有Ca、Si、Ti 3種元素,說明I-1-1組樣品填料種類最多,均包含CaCO3、高嶺土和TiO2這3種填料。I-1-2組樣品中所含元素種類最少;I-1-3組樣品Al元素含量最多,說明該組樣品填料主要是高嶺土。I-1-4組樣品Fe元素含量最多,說明該組樣品的顏料含量最多。通過K-均值聚類和樣品成分元素信息的相互印證,完成樣品進(jìn)一步分組。

2.3 主成分分析

主成分分析是因子分析的一種,是一種將多個(gè)變量通過線性變換達(dá)到降維的目的,選出少數(shù)幾個(gè)重要變量的多元統(tǒng)計(jì)分析方法,幾個(gè)較少的綜合變量就可以盡可能多地反映原來變量的信息[16]。為了驗(yàn)證K-均值聚類結(jié)果的準(zhǔn)確性,將聚類結(jié)果作為樣品分組標(biāo)簽,提取貢獻(xiàn)率最高的前3個(gè)因子。對(duì)聚類結(jié)果三維可視化驗(yàn)證,各因子累計(jì)方差解釋率見表4。

表4 累計(jì)解釋方差貢獻(xiàn)率Table 4 Contribution rate of cumulative explanatoryvariance

由表4可知,前3個(gè)主成分(PC)累計(jì)貢獻(xiàn)率達(dá)到了96.395%,可認(rèn)為前3個(gè)因子承載了原始數(shù)據(jù)絕大部分信息。計(jì)算38個(gè)煙用接裝紙樣品在各因子上的得分,即各元素變量在PC1、PC2、PC3的重要程度,得分圖如圖4所示。

圖4 主成分得分圖Fig.4 Principal component score

圖4顯示38個(gè)煙用接裝紙樣品在三維主成分得分圖中被明顯地分為了4類,1代表I-1-1組,2代表I-1-2組,3代表I-1-3組,4代表I-1-4組(下同)。除I-1-1組內(nèi)2個(gè)樣品外,各組內(nèi)空間距離較小,組間距離較大,各組在三維空間上顯著區(qū)分開來。

2.4 多元線性回歸分析

2.3 中前3個(gè)主成分并不能完全保留全部數(shù)據(jù)信息,可能是導(dǎo)致I-1-1組中2個(gè)樣品距離組內(nèi)質(zhì)心較遠(yuǎn)的原因。所以引入多元線性回歸分析驗(yàn)證K-均值聚類中不同組別和各個(gè)元素變量之間的依賴關(guān)系?;貧w分析可以用來研究變量之間相關(guān)關(guān)系,運(yùn)用十分廣泛,這種技術(shù)通常用于預(yù)測分析[16]?;貧w模型的方差分析結(jié)果見表5,標(biāo)準(zhǔn)化殘差預(yù)期累積概率-累積目標(biāo)概率如圖5所示。

表5 方差分析結(jié)果表Table 5 Analysis of variance results

圖5 標(biāo)準(zhǔn)化殘差預(yù)期累積概率-累積目標(biāo)概率圖Fig.5 Expected cumulative probability-cumulative probability of observation of standardized residual

由表5可知,線性回歸模型的顯著性水平為0.001(預(yù)測變量:常數(shù)、Cl、Si、Cu、Fe、Mg、K、Ti、Na、O、S、Al、Ca),其顯著性概率遠(yuǎn)遠(yuǎn)小于0.01,可說明該模型內(nèi)各個(gè)元素變量對(duì)組別變量具有顯著影響。

由圖5可知,標(biāo)準(zhǔn)化殘差的預(yù)期累積概率-累積目標(biāo)概率圖中樣品散點(diǎn)密集分布在斜線兩側(cè),和直線擬合度較高,可認(rèn)為殘差符合正態(tài)分布。殘差正態(tài)性檢驗(yàn)的結(jié)果表明數(shù)據(jù)基本滿足線性回歸要求,即2.2中K-均值聚類得到的樣品組別與各元素之間可建立良好的擬合關(guān)系,印證了聚類結(jié)果的準(zhǔn)確性。

2.5 判別模型的建立

判別分析是化學(xué)模式識(shí)別中的熱點(diǎn),目前應(yīng)用較多的是貝葉斯判別和Fisher判別預(yù)測樣品的某一指標(biāo)[17]。判別分析可以在已知分組的基礎(chǔ)上,建立判別函數(shù)模型,判別觀測樣品歸屬。

2.5.1 貝葉斯判別分析

給定1個(gè)輸入的x,目的是確定它是屬于w1類還是w2類,根據(jù)貝葉斯判別思想,需要計(jì)算x屬于w1類概率和w2類概率并判斷樣品的歸屬。若P(w1|x)>P(w2|x),則x∈w1;相反,則x∈w2。由貝葉斯定理可知,后驗(yàn)概率P(wi|x)可由類別的先驗(yàn)概率P(wi|x)和x的先驗(yàn)概率P(x|wi)得到,具體計(jì)算見式(2)。

式(2)中,P(x|wi)也被成為似然函數(shù)。所以原判別式可改寫為,若P(x|w1)P(w1)>P(x|w2)P(w2),則x∈w1;相反,則x∈w2。上述貝葉斯判別式函數(shù)系數(shù)見表6。

表6 分組函數(shù)系數(shù)Table 6 Coefficient of group function

由表6可知,將各樣品的自變量值代入上述4個(gè)貝葉斯判別函數(shù),得到4個(gè)函數(shù)值。比較這4個(gè)函數(shù)值,函數(shù)值較大的組別就可以將樣品判入該組。

2.5.2 Fisher判別分析

Fisher判別的原理也是一種降維的思想,是將多維度空間的樣品進(jìn)行降維,并投射到低位空間,使樣品在新的子空間上有最小的組內(nèi)距離和最大的組間距離,使其在該子空間上有最佳的可分離性。Fisher判別式通過計(jì)算各觀測值在低維空間上的坐標(biāo),從而確定各樣品的具體空間位置。群組重心為各組別重心在空間中的坐標(biāo)位置。只要計(jì)算出各觀測值的具體坐標(biāo)位置后,再計(jì)算出它們分別離各重心的距離,就可以得知它們的分類了。

2.2 中4個(gè)類別Wilk的Lambda檢驗(yàn)判別結(jié)果見表7。

表7 Wilk的Lambda檢驗(yàn)判別結(jié)果Table 7 Wilk Lambda test discriminant result

由表7可知,在Fisher判別分析中建立了3個(gè)判別函數(shù),函數(shù)1、2、3的顯著性水平均小于閾值0.05,可說明前3個(gè)判別函數(shù)顯著成立[18],所以利用這3個(gè)函數(shù)作為Fisher判別函數(shù),其特征值見表8。

表8 判別函數(shù)特征值Table 8 Eigenvalue of discriminant function

表8反映了判別函數(shù)的累積貢獻(xiàn)率和方差變異程度,判別函數(shù)1的方差貢獻(xiàn)率為60.0%,判別函數(shù)2的方差貢獻(xiàn)率為38.4%,判別函數(shù)3的方差貢獻(xiàn)率為1.7%。判別函數(shù)1和判別函數(shù)2攜帶的信息遠(yuǎn)大于判別函數(shù)3。判別函數(shù)1與判別函數(shù)2之間典型相關(guān)性系數(shù)分別為0.966和0.949,說明樣品在函數(shù)1和函數(shù)2這兩個(gè)維度上具有顯著差異。故選擇函數(shù)1和函數(shù)2建立二維空間分布圖,見圖6。

圖6 判別函數(shù)聯(lián)合分布圖Fig.6 Joint distribution of discriminant functions

由圖6可知,實(shí)心三角形代表組質(zhì)心,1代表I-1-1,2代表I-1-2,3代表I-1-3,4代表I-1-4。4組樣品在函數(shù)1、函數(shù)2組成的二維空間上區(qū)分明顯,同組的樣品都落在了同一區(qū)域,結(jié)果顯示樣品回判正確率為100%,說明該判別模型與K-均值聚類結(jié)果相互印證,將未知樣品元素變量輸入判別函數(shù)中,根據(jù)在聯(lián)合分布圖上反映的位置找到與之距離最近的組質(zhì)心就可完成對(duì)未知樣品的準(zhǔn)確歸類。

2.6 未知樣品的檢驗(yàn)

選取模擬案件現(xiàn)場提取到的紅云紅河煙草有限公司生產(chǎn)的“云煙(塞上江南)”和河南中煙工業(yè)有限責(zé)任公司生產(chǎn)的“黃金葉(摩卡)”2個(gè)接裝紙樣品驗(yàn)證上述歸類模型的準(zhǔn)確性與應(yīng)用性。首先通過觀察外觀顏色,驗(yàn)證樣品的接裝紙顏色均為黃色,故將其歸入Ⅰ類,再利用掃描電子顯微鏡對(duì)其微觀形貌進(jìn)行觀察,發(fā)現(xiàn)為粗糙型,應(yīng)歸入I-1類,如圖7所示。

圖7 云煙和黃金葉的SEM圖Fig.7 SEM images of Yunyan(Saishangjiangnan)and Huangjinye(Moka)

將上述2個(gè)樣品的X射線能譜數(shù)據(jù)分別代入貝葉斯判別函數(shù)和Fisher判別函數(shù)中,結(jié)果顯示在貝葉斯判別中I-1-1組的判別函數(shù)值最大。Fisher判別函數(shù)顯示驗(yàn)證樣品質(zhì)心距離I-1-1組質(zhì)心最近,見圖6(5和6代表驗(yàn)證樣品)。故可認(rèn)為2個(gè)驗(yàn)證樣品被判入I-1-1組。I-1-1組樣品和驗(yàn)證樣品的X射線能譜數(shù)據(jù)見表9。

表9 樣品元素含量表Table 9 Element content of samples %

由表9可知,I-1-1組的13個(gè)樣品中只有15#和60#樣品元素種類與云煙(塞上江南)、6#和37#與黃金葉(摩卡)的元素種類相同;分別計(jì)算15#、60#樣品與云煙(塞上江南),6#、37#樣品與黃金葉(摩卡)元素的歐幾里得距離,發(fā)現(xiàn)60#樣品成分特征與云煙(塞上江南)、6#樣品與黃金葉(摩卡)最為相似,通過查詢樣品表可知60#樣品品牌同樣為“云煙”、6#樣品為黃金葉。說明該驗(yàn)證樣品的預(yù)測結(jié)果與實(shí)際情況吻合,檢驗(yàn)了該分類模型的應(yīng)用性和可靠性。

3 結(jié)論

本課題采用掃描電子顯微鏡/能譜儀對(duì)煙用接裝紙樣品進(jìn)行了快速檢測,首先通過樣品顏色和表面形貌對(duì)樣品初篩分類,而后對(duì)樣品進(jìn)行K-均值聚類,進(jìn)一步對(duì)煙用接裝紙樣品聚類。通過主成分分析和線性回歸分析驗(yàn)證了K-均值聚類的可行性,最后建立了2種判別函數(shù)模型,借助判別函數(shù)對(duì)未知樣品進(jìn)行預(yù)測并得出了準(zhǔn)確的結(jié)論。對(duì)于現(xiàn)場提取到的未知煙用接裝紙物證,可通過該模型進(jìn)行快速分類識(shí)別,縮小偵查范圍。在后續(xù)的研究中,將進(jìn)一步擴(kuò)大樣品庫并融入深度學(xué)習(xí)模型,提高該模型的精確度。

猜你喜歡
煙用判別函數(shù)均值
一種基于常壓消解儀同時(shí)測定煙用有機(jī)肥中總氮、總磷、總鉀含量的樣品前處理方法
云南化工(2020年11期)2021-01-14 00:50:44
游樂設(shè)施事故與危險(xiǎn)量化判別函數(shù)的構(gòu)建
小議煙用物資的精益化管理
探究上市公司財(cái)務(wù)預(yù)警的數(shù)學(xué)模型
均值不等式失效時(shí)的解決方法
均值與方差在生活中的應(yīng)用
關(guān)于均值有界變差函數(shù)的重要不等式
對(duì)偶均值積分的Marcus-Lopes不等式
基于Fisher判別函數(shù)的酒店員工離職預(yù)警研究
基于判別函數(shù)算法的圖像分類器設(shè)計(jì)
钟祥市| 改则县| 左云县| 陆良县| 成武县| 石河子市| 石嘴山市| 浦北县| 延吉市| 张家川| 思茅市| 香河县| 正阳县| 榕江县| 军事| 丹阳市| 绥德县| 内丘县| 顺昌县| 团风县| 涡阳县| 建宁县| 东港市| 安泽县| 彭水| 佛坪县| 威远县| 武平县| 东港市| 炉霍县| 建始县| 乌兰察布市| 阿瓦提县| 葵青区| 陇西县| 新安县| 彰武县| 嘉善县| 岳阳市| 钟山县| 浠水县|