張敏 郭天太 洪博 孫睿
摘 要:礦井氣體的定量分析對于是實現(xiàn)礦井安全實時檢測反饋的基礎(chǔ)。采用傅里葉變換紅外光譜法獲取甲烷、乙烷等5種煤礦井氣體的光譜數(shù)據(jù),并基于支持向量回歸機(jī)(SVR)建立非線性回歸模型,對未知樣本進(jìn)行定量分析。使用SVR對氣體紅外光譜進(jìn)行定量分析時,懲罰系數(shù)和核參數(shù)的選擇直接決定了算法的精度和耗時。該文分別采用網(wǎng)格搜索法、遺傳算和及粒子群算法對SVR模型的重要參數(shù)對進(jìn)行優(yōu)化,并比較上述3種算法優(yōu)化后的模型性能。結(jié)果表明:3種算法的回歸精度基本都能達(dá)到10-4,但預(yù)測精度差異較大。其中,粒子群算法計算時間較短,最小均方差為2×10-4,能達(dá)到較高的精度,在實踐中值得推廣。
關(guān)鍵詞:礦井氣體 紅外吸收光譜 支持向量機(jī)回歸 參數(shù)優(yōu)化 粒子群算法
中圖分類號:TP181 文獻(xiàn)標(biāo)識碼:A 文章編號:1674-098X(2015)12(b)-0095-02
礦井氣體組分主要包括一氧化碳、二氧化碳、甲烷、乙烷、丙烷等[1-2]。根據(jù)氧化氣體產(chǎn)物的構(gòu)成、濃度及其變化速率等特性,可對煤炭自然發(fā)火做出準(zhǔn)確的預(yù)測預(yù)報[3-4],用來指導(dǎo)煤礦的防滅火安全生產(chǎn)工作。紅外光譜法作為檢測有害氣體的主要方法之一,具有較高的信噪比和較快的分析速度,在礦井氣體分析領(lǐng)域有廣泛的應(yīng)用[5]。
由于氣體特征譜帶較寬,而且烷烴類氣體的特征峰嚴(yán)重重疊,以致單獨預(yù)測每種氣體的屬性和濃度較為困難。目前主要使用的方法有主成分回歸、偏最小二乘法等風(fēng)險經(jīng)驗最小化方法,和以支持向量回歸機(jī)(SVR)為代表的非線性建模方法,其中SVR具有較高的回歸精度和預(yù)測性能。
1 支持向量機(jī)回歸算法概述
SVM是基于結(jié)構(gòu)風(fēng)險最小化原理的新型學(xué)習(xí)機(jī)。SVR是建立在SVM思想上,可用于解決回歸問題的新型算法。SVR不但具有SVM的優(yōu)點,而且其通過將數(shù)據(jù)映射到高維空間進(jìn)行線性擬合,較傳統(tǒng)非線性擬合方法具有更低的過擬合風(fēng)險,但是SVR的理論優(yōu)勢取決于其關(guān)鍵參數(shù)懲罰系數(shù)C和核參數(shù)g是否合適。
C、和g這3種參數(shù)優(yōu)選法的實現(xiàn),都基于將SVR的模型結(jié)構(gòu)及其預(yù)測算法嵌入對應(yīng)的算法步驟中。網(wǎng)格搜索法(GRID)、遺傳算法(GA)以及粒子群算法(PSO)作為成熟的優(yōu)化算法,在理論上較高的精度和可靠性,且耗時更短。文章比較這3種優(yōu)化SVR,并選取均方差(MSE)作為評判精度的指標(biāo):
(1)
式中,為新樣本的估計值;n為樣本數(shù)。
2 基于SVR的礦井氣體預(yù)測模型
礦井氣體組分濃度的定量分析是指在待測氣體濃度或其他性質(zhì)與測試儀器的測量結(jié)果之間構(gòu)建定量關(guān)聯(lián)關(guān)系。對紅外光譜分析而言,則是用統(tǒng)計的方法在礦井氣體組分的種類和濃度值與紅外光譜數(shù)據(jù)之間建立一個關(guān)聯(lián)模型(校正模型),應(yīng)用建立的校正模型即可對待測氣體組分濃度進(jìn)行預(yù)測。定量模型建立之后,必須對其進(jìn)行驗證,以確保模型對光譜信息和樣品濃度信息之間的回歸關(guān)系表征正確,模型的預(yù)測能力滿足定量分析的精度要求。
文章采用選用RBF核函數(shù),分別使用GRID、GA、PSO算法進(jìn)行參數(shù)優(yōu)化,對甲烷、乙烷、丙烷等5種典型礦井氣體的組分濃度進(jìn)行回歸預(yù)測。
3 不同算法下礦井氣體定量分析結(jié)果對比
文章使用美國賽默飛世爾科技公司的Nicolet-Nexus870型傅里葉變換紅外光譜儀,共測得186組模擬礦井氣體的光譜數(shù)據(jù),將其中136組作為訓(xùn)練樣本,剩余50組樣本數(shù)據(jù)作為測試集。用優(yōu)化所得的C和g對校正集各維進(jìn)行訓(xùn)練建立SVR校正模型,利用原始數(shù)據(jù)對模型進(jìn)行回歸驗證。
通過計算得到,采用不同優(yōu)化算法時的MSE值都小于0.06,且R值接近1,說明各模型的學(xué)習(xí)能力較好。為進(jìn)一步評價各參數(shù)優(yōu)選法對礦井氣體組分濃度的預(yù)測性能優(yōu)劣,對不同參數(shù)設(shè)置下模型的預(yù)測結(jié)果進(jìn)行了對比(如表1所示),其中T為各SVR完成訓(xùn)練校正集以并獲得預(yù)測結(jié)果參數(shù)所需的總時長。
由表1可以看出,3種SVR計算時長都在80 s以下,但PSO和GA的計算時長普遍短于GRID。甲烷、乙烷以及二氧化碳在混合氣體中的濃度均能被這3種SVR實現(xiàn)較為準(zhǔn)確的預(yù)測,其中相關(guān)系數(shù)R均大于0.9,且最小MSE都在0.02以下,而乙烷、丙烷的濃度預(yù)測誤差則相對較大。由于烷類氣體的紅外吸收光譜在波段以及波峰吸收值上存在較大的重疊,丙烷和丁烷尤為嚴(yán)重,其預(yù)測結(jié)果如圖1所示。
由圖1可以看出,對于丙烷和丁烷,基于PSO優(yōu)化模型明顯優(yōu)于其他兩種算法,且其對丙烷和丁烷預(yù)測后所得均方差均低于其他兩種算法,相關(guān)系數(shù)也高于其他算法優(yōu)化的SVR,從而證明利用PSO優(yōu)化SVR模型參數(shù)對(C,g)的適用性。
4 結(jié)語
礦井氣體的紅外吸收光譜能夠反映其組分種類及其濃度的信息,但是烷烴類氣體存在較為嚴(yán)重的波峰重疊,所以需要通過非線性建模的方法對其進(jìn)行定量分析。SVR在對礦井氣體紅外光譜進(jìn)行定量分析時,具有較高的精度;但是實現(xiàn)此優(yōu)勢的前提則是選取到最佳參數(shù)對(C,g)。經(jīng)過試驗分析,對現(xiàn)階段較為常用的參數(shù)選擇法如GRID、GA以及PSO的性能進(jìn)行了對比,發(fā)現(xiàn)使用PSO優(yōu)化的模型在對礦井氣體的定量回歸預(yù)測上的綜合性能更好。
參考文獻(xiàn)
[1]張國樞.通風(fēng)安全學(xué)[M].徐州:中國礦業(yè)大學(xué)出版社,2007.
[2]王顯政.煤礦安全新技術(shù)[M].北京:煤炭科學(xué)出版社,2002.
[3]梁運濤.煤炭自然發(fā)火預(yù)測預(yù)報的氣體指標(biāo)法[J].煤炭科學(xué)技術(shù),2008(6):5-8.
[4]羅海珠,梁運濤.煤自然發(fā)火預(yù)測預(yù)報技術(shù)的現(xiàn)狀與展望[J].中國安全科學(xué)學(xué)報,2003(3):79-81.
[5]Naoual Makhoukhia,Eve Pere.Determination of the composition of a mixture of gases by infrared analysis and chemometric methods[J]. Journal of Molecular Structure,2005(744-747): 855-859.