鄧 軒,孟慶浩,侯惠讓,鄧震宇,李宏躍*
(1.天津大學電氣自動化與信息工程學院,天津市過程檢測與控制重點實驗室,機器人與自主系統(tǒng)研究所,天津 300072;2.應急管理部天津消防研究所,天津 300381)
蓄意縱火是一種犯罪行為,對社會的穩(wěn)定以及人民財產(chǎn)和生命安全均構成了極大威脅。 根據(jù)《中國消防年鑒》[1]和公安部消防局的報告[2],從2015—2019 年,我國共發(fā)生火災141 萬起,其中人為的蓄意縱火案件約占每年總火災發(fā)生次數(shù)的7%,死亡人數(shù)共計7 613 人,受傷人數(shù)共計4 794人,直接經(jīng)濟損失達189.67 億元。 在縱火案件中,犯罪分子往往借助易燃液體(本文稱之為助燃劑)放火。 火災發(fā)生之后,火災現(xiàn)場通常破壞嚴重、情況復雜,準確地找到起火點、提取物證并確定火場中是否存在助燃劑成分是是縱火案件確定與偵破的關鍵[3]。
大多數(shù)縱火犯采用基于石油基底的助燃劑,如汽油、柴油[4]等。 但隨著政府部門加大對石油相關產(chǎn)品的市場監(jiān)督以及犯罪分子反偵查能力的增強,犯罪分子也會使用酒精、稀料(油漆稀釋劑)等液體作為助燃物質。 由于火場影響因素較多,導致火場助燃劑殘留物的檢測和識別的研究極具挑戰(zhàn)[5]。
助燃劑鑒定結果是認定放火嫌疑案件的有效證據(jù)。 目前,用于助燃劑鑒定的方法包括氣相色譜-質譜(GC-MS)法、拉曼光譜法、薄層色譜法、傅里葉紅外光譜法及熱分析-質譜聯(lián)用等,其中GC-MS 法是國內(nèi)外最為公認的助燃劑鑒定方法[6-10]。 但是,GC-MS 設備昂貴,識別過程耗時長,對結果的解釋高度依賴于分析人員的經(jīng)驗,且無法在火災現(xiàn)場及時地識別助燃劑殘留物。 基于傳感器陣列的電子鼻是一種仿生的氣味指紋圖譜識別技術,由氣體傳感器陣列、信號處理系統(tǒng)和模式識別方法組成。 因其具有較好的便攜性、較低的成本、較快的識別速度等優(yōu)點,近些年在食品監(jiān)測、疾病診斷、環(huán)境監(jiān)測和安全保護等領域得到了越來越多的應用[11]。 火場助燃劑一般具有較強的揮發(fā)性,且釋放到空氣中多為復合氣體或氣味,因此電子鼻有望在此領域發(fā)揮作用。 據(jù)本文作者所知,目前應用于火場助燃劑識別的傳感器陣列式電子鼻相關研究較少,傅得鋒[12]利用快速氣相色譜式電子鼻實現(xiàn)了不同標號汽油的區(qū)分,Marta 等[13]利用頂空-質譜電子鼻識別五種不同助燃劑。 由于目前在助燃劑鑒定領域使用的電子鼻采用的技術為氣相色譜分析、質譜分析等,而非通過氣體傳感器陣列采集氣味指紋圖譜,與本文提到的基于傳感器陣列式的電子鼻采用不同機理和思路,導致其不具備傳感器陣列式電子鼻的便攜性、低成本、快速識別等優(yōu)點。
為解決在火災現(xiàn)場快速、準確鑒別殘留助燃劑的難題,本研究設計了一種面向火場助燃劑檢測的電子鼻系統(tǒng)(簡稱火鼻Ⅰ號),并采用此電子鼻采集燃燒和未燃燒兩種條件下四種常見助燃劑(汽油、柴油、酒精和稀料)釋放的氣味,建立了2 套數(shù)據(jù)集。 在此基礎上,給出了通道分離CNN(CS-CNN)算法并與四種傳統(tǒng)的機器學習算法和兩種深度學習算法進行了對比,初步的結果驗證了電子鼻用于火場助燃劑識別的可行性。
針對不同應用領域的電子鼻,所需氣體傳感器類型也不同,常見的氣體傳感器有金屬氧化物半導體(Metal-Oxide Semiconductor,MOS)型、導電聚合物型、質量敏感型、電化學型、催化燃燒型和光學型等。其中,MOS 傳感器具有使用壽命長、靈敏度較高、體積小、價格低等優(yōu)點,因此在電子鼻領域得到了廣泛的應用。 MOS 型傳感器具有廣譜響應特性,一般需要使用多個具有不同敏感特性的傳感器構成陣列,以提升電子鼻系統(tǒng)的選擇性。
在進行傳感器選型時,需要保證傳感器陣列對助燃劑有明顯響應且具有一定區(qū)分度。 經(jīng)查閱助燃劑成分相關文獻[14-16],汽油主要成分為烷烴類物質、芳烴類物質等,柴油主要成分為烷烴、烯烴、芳香烴和稠環(huán)芳烴等,稀料主要成分為乙醇、環(huán)烷烴化合物、酯類化合物以及甲苯、二甲苯、三甲苯等芳香烴化合物。 在綜合考慮傳感器的檢測性能、對助燃劑主要成分敏感性、成本及尺寸的基礎上,本研究選取了15 個貼片式MOS 傳感器構成陣列。 所選傳感器的具體型號及其對應的敏感氣體、檢測下限和生產(chǎn)廠家如表1 所示,其中MICS-4514 產(chǎn)生兩路輸出,這樣傳感器陣列共輸出16 路電壓信號。 出于最大化利用空間的考慮,傳感器被分別焊接于兩塊PCB 板上,兩塊PCB 板分別包含9 個傳感器(ASMLV-P2、CCS801、TGS8100、MICS-4514、MICS-5914、GM-102B、GM-602B、GM-702B、GM-802B)
表1 火鼻Ⅰ號傳感器陣列具體信息
與6 個傳感器(GM-202B、GM-302B、GM-402B、GM-512B、MICS-2714、MICS-5524),兩塊PCB 板上的15 個不同型號傳感器共同組成傳感器陣列,板間信號通過柔性印刷電路(FPC)線連接。 傳感器陣列分布如圖1 所示。 為使各傳感器和待測氣體接觸的時間和氣體的流速盡可能相同,傳感器被盡量對稱地安放到氣室中軸線的兩側。
圖1 傳感器陣列分布圖
密閉性好且空間小的氣室便于待測氣體與傳感器的充分接觸,有利于傳感器產(chǎn)生明顯響應且縮短氣室清洗時間。 氣室外形及實物如圖2 所示。 基于課題組前期大量的氣室結構研究,本文氣室設計采用了簡單、有效的長條形結構[17]。 此外,在氣室進出口處設有縮緊結構,便于平穩(wěn)進出口處的氣流流速,進而使氣室內(nèi)各傳感器附近的氣流方向、流速等盡可能一致,從而有效增強各傳感器響應條件的一致性[18]。
圖2 火鼻Ⅰ號電子鼻氣室外形及實物圖
氣室通過3D 打印技術制作,所使用材料為無異味的高性能尼龍,具有良好的耐高溫性能、化學惰性以及氣密性。 氣室壁厚為6 mm,頂面及底面開口,氣室四周留有四個內(nèi)徑0.5 mm 的螺絲孔,通過螺絲固定氣室和上下兩個電路板,氣室內(nèi)部因此形成了一個密閉的空間,在氣室與PCB 板交接處留有1 mm 深的凹槽,在其中填入無異味密封圈,以加強氣室與PCB 板貼合的緊密性,使氣室具有更好的氣密性。
本研究設計的火鼻Ⅰ號整體結構如圖3 所示。
圖3 火鼻Ⅰ號系統(tǒng)框圖
火鼻Ⅰ號系統(tǒng)主要由氣路和電路(包括信號采樣、傳輸和控制)兩部分組成。 氣路部分的氣體流動由真空泵抽氣控制,氣泵位于氣路的末端,通過透明膠管連接氣室后端以及氣泵吸氣口,氣室前端連接用于氣路切換的電磁閥,三者構成氣體流通路徑。信號采集和傳輸部分包括傳感器陣列、運算放大器、阻容(RC)濾波電路和模/數(shù)(A/D)轉換四個模塊。傳感器供電電壓為5 V,傳感器陣列與待測氣體在氣室內(nèi)反應輸出響應信號(電壓值),信號經(jīng)過運算放大器和阻容電路放大濾波后,由模/數(shù)轉換電路轉換為16 位數(shù)字信號,并通過串行外設接口(SPI)通訊發(fā)送給控制器。 控制部分選用Jetson Nano 核心板,實現(xiàn)數(shù)據(jù)的采集、顯示和保存等功能調控。 以上功能集成在一個操作簡便的人機交互界面內(nèi),通過點擊液晶觸摸顯示屏實現(xiàn)相應功能。
火鼻Ⅰ號整體尺寸為260 mm × 140 mm ×132 mm,整機功耗不高于20 W,配備15 000 mAh 電池,可持續(xù)工作10 h 以上,便于研究人員在火災發(fā)生后進行長時間現(xiàn)場操作。 該電子鼻系統(tǒng)進行單次識別不超過30 s,可實現(xiàn)助燃劑的快速檢測。
火場環(huán)境較為復雜,可以作為助燃劑的可燃液體種類眾多,本研究選取了最常見的四種典型助燃劑作為主要實驗材料,包括汽油、柴油、酒精以及稀料。
本研究首先分析了助燃劑氣體濃度對其識別的影響,通過采集一定體積比的待測氣體和空氣來控制目標氣體濃度。 例如,使用流量為1 L/min 的氣泵抽取5 min 的待測氣體至采樣袋,將此采樣袋內(nèi)氣體濃度定為100%,使用流量為1 L/min 的氣泵抽取2.5 min 的待測氣體以及2.5 min 空氣至采樣袋,將此采樣袋內(nèi)氣體濃度定為50%,以此類推,最終獲取了100%、50%及20%共三種濃度氣體。
各類助燃劑樣本數(shù)量如表2 所示。
表2 助燃劑樣本數(shù)量表
由于汽油為混合物,不同種類汽油成分不同,為分析成分對助燃劑識別結果的影響,2 號汽油以及3號汽油僅采集100%濃度。
為模擬真實火場環(huán)境,本研究將助燃劑與輪胎混合燃燒,并將燃燒后的氣體采集至氣袋中。 為了判斷是否有助燃劑參與燃燒,選取火災中常見的干擾物如紙張、木材、棉花(表3)等在不加入助燃劑的情況下單獨燃燒,并用氣袋采集燃燒后的氣體。
表3 燃燒后樣本數(shù)量表
為了保證實驗安全,燃燒在應急管理部天津消防所的燃燒實驗室進行,保證了燃燒實驗的安全性。
在火鼻Ⅰ號進行氣體采集之前,需要提前0.5 h上電預熱,保證傳感器處于適宜反應的溫度,在預熱過程中真空泵抽取清潔空氣清洗氣路及傳感器。 在實際應用中,火災調查是在消防人員趕至現(xiàn)場撲滅火勢并冷卻后的才開始進行,而電子鼻可在接到報警時進行上電,從消防人員出警至火災調查階段一般超過0.5 h,因此火鼻Ⅰ號可以實現(xiàn)災后現(xiàn)場的快速檢測。 由于災后現(xiàn)場環(huán)境復雜、存在大量干擾因素,通過氣袋進行氣體采集后識別雖然在一定程度上降低了檢測與識別的快速性,但有助于提升識別準確率,且這種方式仍然遠快于目前常用的氣相色譜質譜方式。
待MOS 傳感器陣列基線穩(wěn)定后將火鼻Ⅰ號的進氣管連接至氣袋出氣口,打開氣袋閥門,真空泵將氣體抽至氣室中與傳感器陣列發(fā)生反應。 一個采樣周期過程為:空氣基線采集(5 s)—待測氣體采集(8 s)—恢復階段(17 s)。 采樣周期持續(xù)30 s,之后進行2 min 的清洗階段使傳感器響應恢復至基線階段。 采樣頻率設置為60 Hz。 對于酒精氣體的單次采集結果如圖4 所示。 其中橫坐標對應時間,縱坐標對應傳感器響應值,不同線型對應不同傳感器,其中響應值為與氣體傳感器串聯(lián)的負載電阻兩端電壓值,由于串聯(lián)分壓作用,基線值并非為0 V。 判斷傳感器是否有響應的依據(jù)是電壓是否有上升,電子鼻所采用的模數(shù)轉換芯片精度為1.22 mV,若傳感器未與氣體發(fā)生反應,響應電壓一般穩(wěn)定在基線或呈下降趨勢,當響應電壓值出現(xiàn)1.22 mV 及以上時,即可認定傳感器產(chǎn)生響應。 當進入待測氣體采集階段(5 s~13 s)后,所有響應曲線均呈現(xiàn)上升趨勢,且各傳感器響應幅值不同,恢復階段(13 s~30 s)傳感器響應值逐漸下降。
圖4 火鼻Ⅰ號采集酒精氣體的響應圖
目前國內(nèi)外電子鼻信號分類領域常用的模式識別算法有k近鄰[19]、支持向量機[20](SVM)以及人工神經(jīng)網(wǎng)絡[21]等。 近年來,以人工神經(jīng)網(wǎng)絡為基礎的深度學習技術在語音和圖像識別及自然語言處理等領域取得了可喜的進展。 卷積神經(jīng)網(wǎng)絡[22](Convolutional Neural Network,CNN)是一類包含卷積計算且具有深度結構的前饋神經(jīng)網(wǎng)絡,與其他深度神經(jīng)網(wǎng)絡相比具有更少的參數(shù),便于實現(xiàn)輕量化并嵌入便攜式電子鼻系統(tǒng)中。 本文采用通道分離卷積神經(jīng)網(wǎng)絡(CS-CNN)網(wǎng)絡建立助燃劑識別模型,并與在電子鼻信號分類領域廣泛應用的一維卷積神經(jīng)網(wǎng)絡(1D CNN)、二維卷積神經(jīng)網(wǎng)絡(2D CNN)網(wǎng)絡以及k近鄰、SVM、決策樹及隨機森林四種傳統(tǒng)機器學習算法進行對比。
由于火鼻Ⅰ號采集到的初始數(shù)據(jù)維度過高,無法直接輸入到分類器中,因此在建立分類模型前要對初始數(shù)據(jù)預處理,包括特征提取與特征降維。
根據(jù)傳感器響應曲線的形狀特點,提取七個典型時域特征,分別為采樣階段變化值F1、一階微分最大值F2、一階微分最大值對應值F3、一階微分最小值F4、一階微分最小值對應值F5、二階微分最大值F6、二階微分最小值F7,七種特征對應計算方法如式(1)~式(7)所示:
式中:V代表傳感器的響應值,ts代表開始待測氣體采集時刻,te代表結束待測氣體采集時刻,tmax、tmin分別代表一階微分最大、最小值對應時刻,max(·)和min(·)分別代表取最大和最小值。
對電子鼻的15 個傳感器輸出的16 條響應曲線分別提取上述7 個特征,共112 個特征,之后通過主成分分析法降維至10 維,并對新生成的10 維特征進行標準化處理。 最終生成的標準化特征可直接輸入分類器模型中。
火鼻Ⅰ號傳感器陣列采集的原始數(shù)據(jù)為多變量時間序列,其數(shù)據(jù)維度為m×n×1(其中m為傳感器數(shù)量,n為采樣點個數(shù))。
常規(guī)的卷積運算使用的是與輸入的特征圖具有相同通道數(shù)的卷積核,卷積核的每個通道與輸入的每個通道對應卷積后相加就得到輸出特征的一個通道上的一個數(shù)據(jù)點。 常規(guī)的卷積操作實現(xiàn)通道相關性和空間相關性的聯(lián)合映射,單個卷積核的任務是同時映射通道相關性和空間相關性。 電子鼻的傳感器數(shù)量相當于通道數(shù)量,每一個傳感器采集的時間序列代表空間維度。 對于電子鼻數(shù)據(jù)而言,通道維度間的相關性與空間維度間的相關性可以分開映射,以達到更好的特征提取效果。 因此,本研究采用CSCNN[23]進行特征提取。 通道分離卷積主要分為兩個過程,分別為逐通道卷積(Depthwise Convolution,DW)和逐點卷積(Pointwise Convolution,PW)。
DW 過程中一個卷積核負責一個通道,一個通道只被一個卷積核處理。 輸出的特征圖與原始輸入通道數(shù)相同。 PW 的卷積核尺寸為C×1×1,C為上一層的通道數(shù)。 PW 運算會將上一步DW 輸出的特征圖在通道上進行加權組合,生成新的特征圖,輸出特征圖的數(shù)量與PW 核的個數(shù)相同。 本文所使用的CS-CNN 整體模型如圖5 所示。
圖5 CS-CNN 模型圖
將通道分離卷積單元與其他網(wǎng)絡結構整合構成的CS-CNN,整體網(wǎng)絡結構與參數(shù)設置如表4 所示。
表4 網(wǎng)絡結構與參數(shù)設置
假設輸入特征圖尺寸為H×W×Cin,其中H、W、Cin依次代表輸入特征圖的高、寬和通道數(shù),卷積核尺寸為KH×KW×Cin,其中KH、KW代表卷積核的高和寬,生成一個尺寸為H×W×Cout的輸出特征圖,所需參數(shù)量為KH×KW×Cin×Cout。
使用通道分離卷積單元,通道卷積負責濾波,尺寸為KH×KW×1,共Cin個,作用在輸入的每個通道上,參數(shù)量為KH×KW×1×Cin;逐點卷積負責轉換通道,尺寸為1×1×Cin,共Cout個,作用在通道卷積的輸出特征映射上,參數(shù)量為1×1×Cin×Cout,通道分離單元參數(shù)量與常規(guī)卷積參數(shù)量對比如式(8)所示:
由上式可知,通道分離卷積單元與常規(guī)卷積運算相比可以大幅度減少參數(shù)量與計算量,便于算法嵌入便攜式電子鼻平臺上。
本研究網(wǎng)絡模型使用PyTorch 框架搭建。 訓練時網(wǎng)絡參數(shù)優(yōu)化算法選用Adam 優(yōu)化器,損失函數(shù)選擇交叉熵,初始學習率設置為0.000 3,批尺寸設置為16,epoch 設置為50。
CS-CNN 網(wǎng)絡與1D CNN 網(wǎng)絡、2D CNN 網(wǎng)絡模型大小以及Flops 對比如表5 所示。
表5 網(wǎng)絡模型大小與Flops 對比圖
由表5 可見,CS-CNN 網(wǎng)絡通道具有較小的網(wǎng)絡參數(shù)量、較低的模型復雜度和更快的運算速度,便于嵌入到運算能力相對較低的便攜式電子鼻系統(tǒng)中。
本研究對未燃燒實驗與燃燒實驗分別建立識別模型,并對比不同識別算法的識別效果。
將未燃燒助燃劑共2 440 個樣本與200 個空氣樣本劃分為5 類(汽油、柴油、酒精、油漆稀釋劑、空氣),并進行訓練集與測試集劃分,采用2 折交叉驗證方法。 首先按比例將不同標簽的樣本均勻劃為2份子集,挑選其中1 份作為測試集,另1 份作為訓練集用于模型訓練,重復2 次,分別建立2 個模型,取2 個模型在測試集上準確率的平均值作為識別準確率。
分別繪制CS-CNN 模型、1D CNN 模型、2D CNN模型以及SVM 分類器下的混淆矩陣如圖6 所示。
圖6 混淆矩陣對比圖
由混淆矩陣可見,各分類器均能較好地區(qū)分四種不同助燃劑與空氣。
在此基礎上進一步按照濃度將助燃劑細分為表2中的14 個類別,和200 個空氣樣本混合對分類模型進行訓練,以此檢驗各算法對助燃劑內(nèi)部細微差別的區(qū)分能力。 不同分類器在兩種分類情況下的平均準確率如表6 所示。
表6 未燃燒助燃劑不同分類器分類效果
由表6 可見,當不考慮濃度因素影響(5 分類)時,分類模型均能取得較高識別準確率,當考慮濃度影響因素(15 分類)后,各分類器識別準確率均有一定程度的下降,其中CS-CNN 網(wǎng)絡模型在兩種分類情況下均取得了最佳結果,且濃度因素對其識別結果影響較小,說明CS-CNN 網(wǎng)絡模型具有較好的泛化性,當目標氣體濃度不低于傳感器的檢測下限時,有望在任意濃度下均可準確識別助燃劑類別。
將燃燒后的1 240 個樣本與200 個空氣樣本劃分為5 類(汽油+輪胎、柴油+輪胎、酒精+輪胎、干擾物、空氣),采用2 折交叉驗證方法,各分類算法的識別準確率如表7 所示,各分類算法均可準確區(qū)分各類助燃劑與干擾物,其中CS-CNN 取得了最優(yōu)的識別準確率。 由于同類氣體均來源于相同采氣袋,使得氣體類內(nèi)差異性小,故各算法的識別率普遍較高。
表7 燃燒助燃劑不同分類器分類效果
由于CS-CNN 在進行逐通道卷積后使用逐點卷積提取不同通道之前的耦合特征,通過選取不同的逐點卷積核數(shù)量改變逐點卷積對通道間的耦合特征提取能力。 固定網(wǎng)絡其他參數(shù),分別設置逐點卷積核數(shù)量為8、16、32、64、128,對比不同逐點卷積核數(shù)量對模型分類準確率的影響。 對五種不同卷積核數(shù),在未燃燒助燃劑數(shù)據(jù)集上分別采用2 折交叉驗證方法,模型準確率對比結果如圖7 所示。
圖7 不同逐點卷積核個數(shù)下的模型準確率對比結果
由圖7 可見,隨著逐點卷積核個數(shù)由8 個增大到32 個時,通道間耦合特征提取能力增強,模型準確率隨之增加,當逐點卷積核個數(shù)進一步增大時,反而提取了通道間的冗余特征,造成模型過擬合,導致模型準確率下降,因此本文選取逐點卷積核個數(shù)為32。
本文設計了一種用于火場助燃劑檢測與識別的電子鼻系統(tǒng),并基于此電子鼻采集四種助燃劑在未燃燒與燃燒兩種情況下釋放的氣體,從而建立了2套助燃劑氣體數(shù)據(jù)集。 分別采用支持向量機、k近鄰、決策樹、隨機森林、1D CNN、2D CNN 和通道分離CNN 七種算法進行了助燃劑識別實驗,結果表明通道分離CNN 優(yōu)于其他六種算法。 在類別增多后,通道分離CNN 的分類準確率沒有出現(xiàn)明顯下降,具有更強的魯棒性。 電子鼻系統(tǒng)單次檢測時長不超過30 s,初步實現(xiàn)了對四種常見助燃劑以及干擾物之間的準確識別。
在實際助燃劑檢測與識別應用中,電子鼻會受到火災現(xiàn)場復雜環(huán)境的干擾,因此需要提高電子鼻硬件的穩(wěn)定性。 目前的研究只針對4 種典型助燃劑在燃燒與未燃燒情況下進行實驗與分析,在后續(xù)的研究中需要建立更為完善的燃燒助燃劑氣體數(shù)據(jù)庫。 此外,深度學習網(wǎng)絡依賴大量訓練數(shù)據(jù),且訓練時間長。 為了提升深度學習網(wǎng)絡的適用性,可以考慮建立云端數(shù)據(jù)處理系統(tǒng),將電子鼻采集數(shù)據(jù)上傳至云端進行分析識別。 本研究采用的電子鼻自初次使用至今已有8 個多月,依然可以準確識別四種典型助燃劑,初步證明傳感器穩(wěn)定性較好,后續(xù)將繼續(xù)檢測該方面性能,同時將嘗試加入其他氣體環(huán)境監(jiān)測傳感器以實現(xiàn)如PM2.5、PM10、溫濕度、風速風向、大氣壓等參數(shù)監(jiān)測,并將探索電子鼻在長期環(huán)境監(jiān)測方面的性能。