唐 瀟,王明松,柏 凌,劉桂武,喬冠軍
(江蘇大學 材料科學與工程學院,江蘇 鎮(zhèn)江 212013)
目前市面上的裝修材料大都會通過化學處理[1],同時,人們日常生活中使用的殺蟲劑、清潔劑等大都會揮發(fā)出有毒有害氣體。而揮發(fā)性有機物(VOC)占空氣污染物的比例是最大的[2]。為了人體健康,對VOC氣體的識別顯得尤為重要。
氣體傳感器是一種檢測特定氣體的傳感器。電阻式氣體傳感器利用半導體材料與氣體接觸時其自身電阻值的變化來檢測特定氣體,所用敏感材料以金屬氧化物為主[3],具有制作方法簡單、靈敏度高、檢測限低、使用壽命長、成本低等優(yōu)點,但也同時存在交叉敏感性的問題,導致電阻式氣體傳感器的氣體選擇性普遍較差。
解決電阻式氣體傳感器選擇性差的方法之一,是通過機器學習對多維的原始數(shù)據(jù)進行處理分析,實現(xiàn)對氣體類型和濃度的定性與定量預測。在非監(jiān)督學習[4-6]中,Xu 等[4]基于ZnO@TiO2納米棒制備的傳感器,以響應值、響應時間和恢復時間作為特征量,采用主成分分析(PCA)法進行分析,結果表現(xiàn)出對正丁醇良好的選擇性。Li 等[5]通過調節(jié)氫氟酸濃度制備了不同形貌的TiO2納米片,搭建傳感器陣列,結合PCA和雷達圖分析,在室溫下對11 種爆炸氣體進行了識別。在監(jiān)督學習[7-9]中,Acharyya 等[8]基于水熱法制備的SnO2空心球,在200~350 ℃工作溫度下對VOC氣體進行測試,對比隨機森林(RF)、多層感知器(MLP)、支持向量機(SVM)和樸素貝葉斯(NB)四種算法結果,顯示RF 可以精確識別所有氣體。鄭堯軍等[9]采用不分光紅外法對CO 進行測試,通過粒子群優(yōu)化SVM 參數(shù),對20 組不同濃度的CO 進行了定量分析,相比BP 網(wǎng)絡,SVM 建模時間更短,預測精度更高。在混合算法[10-16]中,Ji 等[15]采用SnO2氣敏傳感器,先采用PCA 結合多項式回歸對特征量進行提取分離,減少了氣體濃度的干擾,再采用K-近鄰算法對多種有毒有害氣體實現(xiàn)了快速定性與定量識別。余道洋等[16]基于快速色譜與氣敏傳感器陣列結合檢測方法,采用PCAPSO-SVM 算法,實現(xiàn)對痕量多組分氣體的快速識別。目前獲取多維原始數(shù)據(jù)的方式大都來自不同氣敏材料搭建的傳感器陣列,鑒于此,本文擬采用一種氣敏材料,基于其在不同工作溫度下對氣體的響應表現(xiàn)出不同的特征,以此構建多維響應矩陣,并結合PCA-SVM 算法優(yōu)化其選擇性。
本文基于化學浴沉積法制備WO3氣敏薄膜,在250,300,350 和400 ℃工作溫度下,對甲醛、丙酮、甲苯、甲醇、乙醇和異丙醇六種VOC 氣體進行氣敏測試獲取樣本信息。首先采用PCA 對樣本數(shù)據(jù)進行降維,根據(jù)結果進行初步的定性分析;再采用SVM 算法,選取36 組數(shù)據(jù)作為訓練集進行建模,剩下18 組數(shù)據(jù)作為測試集進行驗證,對VOC 類型進行預測,并與傳統(tǒng)SVM 模型與PCA-SVM 模型的處理結果進行對比,實現(xiàn)WO3氣敏薄膜對VOC 選擇性的優(yōu)化。
化學浴沉積法是一種經常使用的濕法制備薄膜的方法,將有機或無機鹽溶于特定溶劑中形成穩(wěn)定的溶液,再將基板放入其中,并在適當溫度下緩慢反應,就能在基板上發(fā)生結晶形成前驅體物質的薄膜,最后通過高溫熱處理獲得最終的薄膜樣品。
首先,分別稱取0.3 g 分析純的鎢酸鈉和0.6 g 一水合檸檬酸溶于30 mL 去離子水中,在室溫下攪拌0.5 h 直至完全溶解,再逐滴加入3 mol/L 的稀鹽酸溶液調節(jié)pH 值至2 左右,繼續(xù)攪拌0.5 h 后得到澄清透明的前驅體溶液。其中一水合檸檬酸起絡合作用:
Al2O3基板電極片結構示意圖,如圖1 所示,將印刷Pt 電極(用于加熱和電阻測量)的Al2O3基板斜放入溶液中,在叉指電極區(qū)域進行膜沉積,再放入60 ℃恒溫烘箱內保溫3 h 后取出,用去離子水沖洗基板去除雜質和不穩(wěn)固沉淀,獲得純凈的WO3前驅體薄膜。
圖1 Al2O3基板電極片結構示意圖Fig.1 Structure diagram of Al2O3 substrate electrode sheet
最后,將其置于干燥箱中烘干,在400 ℃下熱處理3 h,WO3?H2O 在高溫下分解,得到最終的WO3氣敏薄膜樣品。
圖2 為氣敏測試模塊示意圖,將WO3薄膜作為敏感材料的電極片插入測試模塊內,并接入測試軟件,檢測其在250,300,350 和400 ℃工作溫度下對濃度為50ppm,200ppm 和500ppm 的甲醛、丙酮、甲苯、甲醇、乙醇和異丙醇共六種VOC 氣體的氣敏響應,得到響應曲線圖,如圖3 流程所示從中提取數(shù)據(jù)得到多維響應矩陣。
圖2 氣敏測試模塊Fig.2 Gas sensing test module
圖3 多維響應矩陣測試流程圖Fig.3 Flow chart for testing of multidimensional response matrices
由于WO3為n 型半導體,VOC 為還原性氣體,根據(jù)公式可計算出響應值:
式中:R為響應值;Rg為半導體在空氣中的電阻值;Ra為半導體在被測氣體中的電阻值。
響應時間(τres)指的是傳感器接觸待測氣體后,電阻值變化90%時所需要的時間。恢復時間(τrecov)指的是待測氣體被抽離后,傳感器電阻值恢復到90%時所需要的時間。
將甲醛、丙酮、甲苯、甲醇、乙醇和異丙醇分別命名為gas-1、gas-2、gas-3、gas-4、gas-5 和gas-6;[Xij]為多維響應矩陣,i為測試樣本數(shù),i=1,2,3,…,m;j為特征量(如響應值、響應時間、恢復時間),j=1,2,3,…,n。
如圖4 所示,實驗采用靜態(tài)測試的方式,根據(jù)公式計算對應濃度VOC 的有機液體體積,再將其注入到靜態(tài)測試腔內的加熱板上,經完全蒸發(fā)后通過混氣風扇實現(xiàn)均勻配氣。氣體狀態(tài)方程為:
圖4 靜態(tài)測試腔Fig.4 Static test chamber
式中:P為壓強;V為體積;n為摩爾數(shù);R為氣體常數(shù);T為溫度。待測氣體體積為:
式中:C為待測氣體濃度;VC為靜態(tài)測試腔體積。液體體積與摩爾數(shù)的關系式為:
式中:M為分子量;ρ為液體密度。由此可以推算出有機液體體積與濃度的關系式:
在本實驗條件下,氣體壓強P為101 kPa,R為8.314,溫度T為298 K,測試腔體積為50 L。如表1所示,計算得出待測VOC 每1ppm 所需注射進測試腔的有機液體體積。
表1 待測氣體濃度及其對應的液體體積Tab.1 The concentration of the gas to be measured and the corresponding liquid volume
1.3.1 數(shù)據(jù)的預處理
由于原始數(shù)據(jù)的響應值、響應時間和恢復時間數(shù)值差距較大,并且為了避免不同指標間量綱帶來的誤差,要對原始數(shù)據(jù)進行歸一化預處理,使得各數(shù)據(jù)處于同一量級。本文將多維響應矩陣歸一化到[-1,1]區(qū)間。歸一化函數(shù)定義如下:
式中:x為多維響應矩陣;y為歸一化后矩陣;ymax和ymin為定義區(qū)間的極值。
1.3.2 主成分分析
主成分分析(PCA)[13]主要用作降低特征量之間的相關性,實現(xiàn)對原始數(shù)據(jù)的降維。將多維的輸入矩陣投影到低維空間中,把原始數(shù)據(jù)的特征量在低維空間中展示,根據(jù)數(shù)據(jù)點分布情況能夠定性地看出樣本間的相關程度,也能用作后續(xù)的數(shù)據(jù)分析,減小數(shù)據(jù)計算量,提高算法運行速率。計算步驟如下:
①輸入k維的矩陣,k為多維響應矩陣的特征量,如響應值、響應時間或恢復時間;
②計算協(xié)方差矩陣;
③計算協(xié)方差矩陣的特征向量和特征值;
④按照特征值大小排序,選擇前p個(p 通過PCA 實現(xiàn)對多維響應矩陣的降維,繪制二維或三維的主成分分析結果圖,定性地對VOC 類型進行區(qū)分。并選取累計貢獻率大于90%的主成分作為后續(xù)算法的輸入矩陣。 1.3.3 支持向量機 支持向量機(SVM)的核心思想是將輸入矩陣非線性地映射到高維的空間中,在此空間中選擇適當算法,構造一個最優(yōu)的超平面對輸入數(shù)據(jù)實現(xiàn)分類。算法模型構建步驟如下: ①設定輸入和輸出矩陣。以歸一化后的多維響應矩陣或累計貢獻率大于90%的主成分作為輸入,VOC 類型矩陣作為輸出。并將樣本數(shù)據(jù)分為訓練集與測試集。 ②選定核函數(shù)。核函數(shù)的目的是為了替換高維空間的內積運算,并不需要顯式地指定非線性變化,提高算法模型的收斂速率。選用徑向基函數(shù)(RBF)作為該SVM 的核函數(shù),RBF 可以將輸入數(shù)據(jù)映射到更高維,而且模型參數(shù)較少,具體公式如下: ③設定模型參數(shù)。在訓練模型中,需要對懲罰系數(shù)c和松弛變量g進行優(yōu)化,從而提高分類準確性,采用交叉驗證法[17]來尋找模型的最佳c值和g值。首先設定并初始化懲罰系數(shù)c、松弛變量g、預測準確率Accuracy 和最佳準確率AccuracyBest 為0,設定誤差Epsilon 為10-3,在[2-10,210]的范圍建立[c,g]的網(wǎng)格矩陣。圖5 為交叉驗證法尋找最佳c值和g值的流程圖,其中[c,g]best為當前最佳c值與g值,當準確率接近時,以較小的c值作為最佳c值,因為過高的懲罰系數(shù)可能會造成模型過擬合。重復此流程,依次對[c,g]的網(wǎng)格矩陣每一對參數(shù)進行驗證,最后輸出[c,g]best作為最佳c值和g值。 圖5 交叉驗證法尋找最佳[c,g]流程圖Fig.5 Flow chart of cross-validation to find the best[c,g] ④對測試集進行驗證。通過訓練集設定好最佳參數(shù)后,建立SVM 模型,以測試集作為驗證,計算對VOC 分類的準確率,并輸出模型的運行耗時。 通過SVM 算法分析,對氣體類型進行預測,實現(xiàn)對VOC 的精確分類,并將傳統(tǒng)SVM 模型與PCASVM 模型的分析結果進行對比。 圖6 是WO3氣敏薄膜的XRD 圖譜,如圖所示樣品的全部衍射峰相對強度和位置基本與標準相WO3(JCPDS#83 -0950) 吻合,樣品的衍射峰主要在24.33°,34.14°,49.95°(三強蜂)左右,這些衍射峰與標準PDF 卡片的衍射峰(200)、(202)和(400)重合,由此可以斷定樣品的主要成分為WO3,可以看出樣品的峰型尖銳,說明薄膜的結晶度比較好,且在圖中未觀察到雜峰存在,表明薄膜具有很好的純度。 圖6 WO3氣敏薄膜的XRD 譜圖Fig.6 X-ray diffraction pattern of WO3 gas sensing film 如圖7 掃描電鏡圖所示,所制備的WO3氣敏薄膜由厚約20 nm 的納米片組成,納米片垂直基片生長,形成網(wǎng)絡狀結構。 圖7 WO3氣敏薄膜的掃描電子顯微鏡圖Fig.7 SEM image of WO3 gas sensing film 在250,300,350 和400 ℃工作溫度下,分別將濃度為50ppm,200pmm 和500ppm 的甲醛、丙酮、甲苯、甲醇、乙醇和異丙醇所對應體積的有機液體注射到靜態(tài)測試腔的加熱板上,待揮發(fā)完全后,打開風扇實現(xiàn)均勻混氣,其中注入氣體時間的間隔為300 s。濃度梯度測試完畢后,在500ppm 濃度下進行循環(huán)穩(wěn)定性測試。重復測試三次,得到多組WO3氣敏薄膜的響應曲線圖,由于數(shù)據(jù)量較大,本文只對第一次測試的響應曲線圖進行展示。 圖8 分別為WO3氣敏薄膜對不同濃度的六種VOC氣體的動態(tài)響應曲線圖。如圖所示,WO3氣敏薄膜的基態(tài)電阻隨工作溫度升高而降低;待測氣體濃度越高,響應值越大,且不同溫度下響應值變化幅度不同。圖9 分別為六種VOC 氣體在500ppm 的濃度下進行3 次循環(huán)測試,響應均能保持一定的穩(wěn)定性,表明其重復性較好。 圖8 WO3氣敏薄膜對不同濃度的六種VOC 氣體的動態(tài)響應曲線圖。(a)甲醛;(b)丙酮;(c)甲苯;(d)甲醇;(e)乙醇;(f)異丙醇Fig.8 Graphs of dynamic response of WO3 gas sensing film to six VOC gases with different concentrations.(a) Formaldehyde;(b) Acetone;(c) Toluene;(d) Methanol;(e) Ethanol;(f) Isopropyl alcohol 圖9 WO3氣敏薄膜對500ppm 的六種VOC 氣體的3 次循環(huán)響應曲線圖。(a)甲醛;(b)丙酮;(c)甲苯;(d)甲醇;(e)乙醇;(f)異丙醇Fig.9 Graphs of the 3-cycle response of WO3 gas sensing film to six VOC gases at 500ppm.(a) Formaldehyde;(b) Acetone;(c) Toluene;(d) Methanol;(e) Ethanol;(f) Isopropyl alcohol 根據(jù)響應曲線圖,計算對應的響應值,獲得54 組樣本數(shù)據(jù)。對相同條件下的響應值取平均值,并計算標準差: 式中:σ為標準差;x為樣本數(shù)據(jù);為樣本數(shù)據(jù)平均值;n為樣本數(shù)。 圖10 為甲醛、丙酮、甲苯、甲醇、乙醇和異丙醇在濃度為50ppm,200ppm 和500ppm 下的響應值立方圖。標準差較小,表明3 次測試沒有明顯誤差;WO3氣敏薄膜對甲苯響應值最高,選擇性最好;對其他氣體響應難以通過立方圖直接判斷,尤其甲醛和甲醇在4 種工作溫度下響應值均很接近。如圖11 和圖12 所示,通過計算甲醛和甲醇的響應時間和恢復時間,增加樣本數(shù)據(jù)的特征量。 圖10 六種VOC 氣體在不同濃度下的響應值立方圖Fig.10 Cube plots of response values of six VOC gases with different concentrations 圖11 WO3氣敏薄膜在不同溫度下對3 種濃度甲醛的動態(tài)響應曲線圖Fig.11 Graphs of dynamic response of WO3 gas sensing film to formaldehyde with three concentrations at different temperatures 圖12 WO3氣敏薄膜在不同溫度下對3 種濃度甲醇的動態(tài)響應曲線圖Fig.12 Graphs of dynamic response of WO3 gas sensing film to methanol with three concentrations at different temperatures 以VOC 氣體在250,300,350 和400 ℃工作溫度下的響應值作為特征量,分別在50ppm,200ppm 和500ppm 濃度下,構建18×4 矩陣作為PCA 的輸入數(shù)據(jù),選取累計貢獻率大于90%的主成分(PC1 和PC2)作二維圖。如圖13 所示,在3 種濃度下,甲苯和異丙醇數(shù)據(jù)點與其他數(shù)據(jù)點分離得最遠,丙酮和乙醇數(shù)據(jù)點也具有一定的分離程度,說明降維后能夠對甲苯、異丙醇、丙酮和乙醇進行區(qū)分;而如上節(jié)所述,甲醛和甲醇在各個工作溫度下的響應值均很接近,降維后數(shù)據(jù)點分布區(qū)域的重疊性較高,難以區(qū)分甲醛和甲醇。 圖13 不同濃度下PCA 分析散點圖Fig.13 Scatter plots of PCA analysis at different concentrations 結果表明以響應值作為特征量輸入,通過PCA 降維處理,能夠初步對甲苯、異丙醇、丙酮和乙醇實現(xiàn)定性識別,但不足以區(qū)分甲醛和甲醇。 針對甲醛和甲醇的數(shù)據(jù)組,進一步以響應時間和恢復時間作為新增特征量,通過增加樣本信息,提高識別分辨率。構建18×12 矩陣作為PCA 的輸入數(shù)據(jù),選取累計貢獻率大于90%的主成分(PC1 和PC2)作二維圖。如圖14 所示箭頭方向為濃度梯度增加方向,甲醛-1 和甲醇-1 為僅以響應值作為特征量進行PCA 降維后的數(shù)據(jù)點,甲醛-2 和甲醇-2 為以響應值、響應時間和恢復時間作為特征量進行PCA 降維后的數(shù)據(jù)點。結果表明,在增加特征量后,甲醛與甲醇的數(shù)據(jù)點分離程度變高,說明能夠提高對甲醛和甲醇定性識別的效果。 圖14 甲醛和甲醇兩組不同特征量的PCA 分析散點圖Fig.14 Scatter plot of PCA analysis of two groups of formaldehyde and methanol with different characteristic quantities 整體分析,將50ppm,200ppm 和500ppm 濃度下的樣本數(shù)據(jù)整合,構建54×4 矩陣作為PCA 輸入數(shù)據(jù),選取PC1、PC2 和PC3 作三維圖。如圖15 所示箭頭方向為濃度梯度增加方向,高濃度時數(shù)據(jù)點分離較遠,選擇性較好;低濃度時數(shù)據(jù)點團聚密集,難以識別各類VOC。分析得出,高濃度時氣敏響應值較高,在歸一化過程中所占權重較大,使得各低濃度下的響應值在歸一化后數(shù)值較為接近,對定性識別影響較大。 圖15 在三種濃度下整體的PCA 分析散點圖Fig.15 Scatter plot of overall PCA analysis at three concentrations 結果表明,通過PCA 降維分析,在相同濃度下能夠實現(xiàn)對VOC 的定性識別,針對難分辨氣體,可以通過增加響應時間和恢復時間作為補充的特征量提高識別效果,但在濃度差距較大的情況下,定性識別也存在一定的局限性。 為了準確判斷各氣體類型,采用SVM 模型對VOC 進行精確分類。以RBF 作為該模型的核函數(shù),通過交叉驗證法尋找最佳懲罰系數(shù)c和松弛變量g。 首先以響應值作為特征量,對樣本數(shù)據(jù)進行歸一化后作為傳統(tǒng)SVM 模型的輸入數(shù)據(jù),VOC 類型作為輸出數(shù)據(jù),選擇36 組數(shù)據(jù)作為訓練集,建立SVM 模型進行訓練,得到最佳懲罰系數(shù)c=36.76,最佳松弛變量g=6.96,并選擇剩余的18 組數(shù)據(jù)作為測試集。 然后再整合2.3 節(jié)3 種濃度下的主成分分析結果,以累計貢獻率大于90%的主成分(PC1 和PC2)作為PCA-SVM 模型的輸入數(shù)據(jù),以VOC 類型作為輸出數(shù)據(jù)。選擇36 組數(shù)據(jù)作為訓練集,建立SVM 模型進行訓練,得到最佳懲罰系數(shù)c=8.00,最佳松弛變量g=724.08,并選擇剩余的18 組數(shù)據(jù)作為測試集。表2 為兩種算法模型的詳細數(shù)據(jù),可以看出通過SVM 處理,分類準確率均能達到100%。 表2 兩種算法模型的詳細數(shù)據(jù)表Tab.2 Detailed data table of two algorithm models 為了比較傳統(tǒng)SVM 和PCA-SVM 模型的差異,表3 為兩種算法模型運行耗時表,表中所列僅包括總時間和耗時占比前三的函數(shù)語句。從總時間來看,PCA-SVM 的運行速率明顯優(yōu)于傳統(tǒng)SVM 模型,耗時減少40%,其中,速率的提升主要來自對數(shù)據(jù)的訓練過程,同樣36 組訓練集,傳統(tǒng)SVM 模型需要4.7 s,由于通過PCA 降維后,特征量從四維降為二維,保留關鍵樣本信息的同時減少了模型的計算量,PCASVM 模型僅需要2.8 s。 表3 SVM 和PCA-SVM 運行耗時表Tab.3 Running time table of SVM and PCA-SVM 本文基于制備的WO3氣敏薄膜,在250,300,350 和400 ℃工作溫度下,對50ppm,200ppm 和500ppm 濃度的六種VOC 進行測試,獲取多維響應矩陣作為樣本信息。通過PCA 對VOC 實現(xiàn)初步的定性分析,其中針對難分辨的甲醛和甲醇氣體,通過增加響應時間和恢復時間作為補充的特征量,使各VOC 之間均有一定的區(qū)分度。在SVM 模型中,采用交叉驗證法尋求最佳懲罰系數(shù)和松弛變量,對VOC 分類的準確率達到了100%,其中PCA-SVM 模型對比傳統(tǒng)SVM模型,耗時減少40%,速率提升主要來自于對降維后數(shù)據(jù)計算量的降低,PCA 和SVM 相結合更適合處理具有多維特征量的數(shù)據(jù)樣本。通過PCA 與SVM 算法分析,對WO3氣敏薄膜鑒別VOC 實現(xiàn)了定性識別與精確分類,減少了半導體傳感器的交叉敏感性問題,優(yōu)化了WO3氣敏薄膜選擇性。2 結果和討論
2.1 WO3氣敏薄膜的表征
2.2 氣敏響應特性
2.3 PCA 定性識別
2.4 SVM 精確分類
3 結論