程文娟,黃星星,湯世祥,童 兵,周淼淼
(合肥工業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,安徽 合肥230009)
常用煤礦瓦斯檢測(cè)儀按其工作方式可分為催化型、熱傳導(dǎo)式、氣敏半導(dǎo)體型和紅外型等[1]。但是催化型存在零點(diǎn)漂移和靈敏度衰減的問(wèn)題[2]、熱傳導(dǎo)式易受到水蒸汽等其他氣體的影響、氣敏半導(dǎo)體型的測(cè)量范圍窄而且精確度低。因?yàn)榧t外型瓦斯檢測(cè)儀具有測(cè)量范圍廣、響應(yīng)速度快、壽命長(zhǎng)、不易中毒等優(yōu)點(diǎn)已被廣泛應(yīng)用于煤礦環(huán)境中易燃易爆氣體濃度的檢測(cè)[3]。但由于紅外瓦斯傳感器檢測(cè)儀易受煤礦環(huán)境中的溫度、濕度、壓力等復(fù)雜的物理環(huán)境因素影響,使檢測(cè)瓦斯?jié)舛戎挡粶?zhǔn)確,一般有硬件和軟件兩種方法來(lái)解決這一問(wèn)題。但由于通過(guò)硬件改進(jìn)的方法價(jià)格昂貴,一般傾向于采用軟件方法。近些年有很多文獻(xiàn)撰寫(xiě)了關(guān)于采取軟件的方法設(shè)計(jì)紅外瓦斯傳感器,如參考文獻(xiàn)[4~6]等,其中較為經(jīng)典的軟件方法是參考文獻(xiàn)[4]所述選用防脈沖平均濾波算法,該算法的基本思想是去掉n個(gè)采集數(shù)據(jù)集中最大值和最小值,然后計(jì)算剩下所有樣本的平均值。此方法比較簡(jiǎn)單且易行,但存在著如果采集數(shù)據(jù)量n 值偏大時(shí)靈敏度會(huì)降低的缺點(diǎn)。參考文獻(xiàn)[5]用線性最小二乘法分別計(jì)算出采集數(shù)據(jù)集中的最大和最小的理想值,將最大和最小理想值的差值帶入相應(yīng)公式計(jì)算出瓦斯?jié)舛戎?。這樣不僅保證數(shù)據(jù)的連續(xù)性,而且具有較高檢測(cè)響應(yīng)時(shí)間,但該方法工作效率低。參考文獻(xiàn)[6]基于RBF 神經(jīng)網(wǎng)絡(luò)對(duì)采集數(shù)據(jù)處理,這種方法能夠消除環(huán)境中溫度和濕度因素對(duì)瓦斯?jié)舛葯z測(cè)的影響,但沒(méi)有考慮其他物理環(huán)境和硬件本身因素對(duì)瓦斯?jié)舛葴y(cè)量值的影響。
本文將與基準(zhǔn)數(shù)據(jù)偏差較大的點(diǎn)定義為噪聲點(diǎn)。首先,利用分化距離與K-means 算法結(jié)合方法找出采集數(shù)據(jù)中可能的噪聲點(diǎn);其次,根據(jù)孤立度系數(shù)判斷真正的噪聲點(diǎn);再次,對(duì)噪聲點(diǎn)做直接丟棄處理,這樣做可以提高軟件工作效率;最后,對(duì)處理之后的剩余采集數(shù)據(jù)集計(jì)算平均值即為測(cè)量的瓦斯?jié)舛戎?,?shí)驗(yàn)結(jié)果表明:該方法測(cè)試出的瓦斯?jié)舛鹊恼`差小于1%,精度高。
紅外型瓦斯傳感器是基于分子振動(dòng)和轉(zhuǎn)動(dòng)吸收譜與發(fā)光光譜的一致性原理而制成的[7]。當(dāng)紅外光透過(guò)待測(cè)氣體時(shí),紅外光的強(qiáng)度會(huì)變?nèi)?,氣體對(duì)紅外光的吸收遵循朗伯—比爾(Lambert-Beer)定律
式中 I 為透射光強(qiáng)度;I0為入射光強(qiáng)度;K 為吸收截面系數(shù);L 為紅外光透過(guò)氣體層的厚度;C 為待測(cè)氣體的濃度。根據(jù)入射光和透射光的強(qiáng)度便可計(jì)算出氣體的濃度C。
分化距離是指計(jì)算任意兩數(shù)據(jù)點(diǎn)的實(shí)際距離D(i,j)和任意兩點(diǎn)距離中最大距離dmax,選取分化度φ(0 <φ <1),對(duì)所有的D(i,j)做分化處理,便得到分化距離d(i,j)[8],其關(guān)系式為
式中 d(i,j)為分化距離;φ 為分化度;D(i,j)為兩點(diǎn)間實(shí)際距離。任意兩點(diǎn)距離D(i,j)與距離集中最大距離dmax的比值Θ(i,j)為
式中 D(i,j)為兩點(diǎn)間實(shí)際距離;dmax為距離集中的最大距離。如果Θ(i,j)<φ,則D(i,j)<d(i,j);否則D(i,j)≥d(i,j),分化距離的思想是使原本能靠近的兩個(gè)數(shù)據(jù)更緊密,原本距離較遠(yuǎn)的兩個(gè)數(shù)據(jù)變得更遠(yuǎn)。
K-means 算法是關(guān)于數(shù)據(jù)集相似度的聚類(lèi)算法,是一種非監(jiān)督學(xué)習(xí)方法[9]。在中小規(guī)模的樣本數(shù)據(jù)的聚類(lèi)采用此方法有很好的效果。
根據(jù)參考文獻(xiàn)[10]中所述K-means 算法主要思想,首先,需要隨機(jī)選取初始聚類(lèi)的K 個(gè)中心點(diǎn);其次,計(jì)算所有剩余的數(shù)據(jù)集到中心點(diǎn)的歐氏距離,將距某一中心點(diǎn)最近的數(shù)據(jù)點(diǎn)歸并到該聚類(lèi);最后,用均值法調(diào)整聚類(lèi)的中心點(diǎn)計(jì)算收斂函數(shù),不斷重復(fù)上述步驟,直至收斂函數(shù)的值最小為止。
對(duì)于一系列時(shí)間間隔相同的數(shù)據(jù)點(diǎn),可將K-means 算法的思想簡(jiǎn)化為如下步驟:
1)在數(shù)據(jù)集D 中隨機(jī)的選擇K 個(gè)點(diǎn)β1,β2,β3,…,βk作為聚類(lèi)簇C1,C2,C3,…,CK的聚類(lèi)中心點(diǎn);
2)計(jì)算不在聚類(lèi)簇的數(shù)據(jù)集中的點(diǎn)di各個(gè)簇類(lèi)中心點(diǎn)的歐氏距離,并將距di最近的點(diǎn)分配到Cj類(lèi)
3)對(duì)于簇Cj,重新計(jì)算簇Cj的質(zhì)心βj;
4)計(jì)算收斂函數(shù),并判斷收斂函數(shù)的值是不是最小,其中收斂函數(shù)如式(5)所示
實(shí)驗(yàn)設(shè)計(jì)紅外瓦斯傳感器選用單光路雙波長(zhǎng)的設(shè)計(jì)方案,紅外瓦斯傳感器系統(tǒng)示意圖如圖1 所示。
圖1 紅外瓦斯傳感器系統(tǒng)示意圖Fig 1 Diagram of infrared gas sensor system
紅外瓦斯傳感器系統(tǒng)中光源為IRL715;探測(cè)器為PYS3228,該探測(cè)器含兩個(gè)獨(dú)立的濾光片和探測(cè)器。其中,單片機(jī)不僅控制光源調(diào)制電路和光源驅(qū)動(dòng)電路,而且可以顯示檢測(cè)的瓦斯?jié)舛戎怠?/p>
用實(shí)驗(yàn)設(shè)計(jì)的系統(tǒng)采集120 個(gè)數(shù)據(jù)作為采集數(shù)據(jù)集D={x1,x2,…,xi…,x120},將此120 個(gè)數(shù)據(jù)分為3 組,每組40 個(gè)數(shù)據(jù)點(diǎn),首先,計(jì)算相鄰兩個(gè)數(shù)據(jù)xi,xi+1絕對(duì)值ai,絕對(duì)值的集合為A={a1,a2…,ai,…,a39},如果相鄰數(shù)據(jù)差的絕對(duì)值較小,則這兩個(gè)數(shù)據(jù)點(diǎn)很可能是在同一聚類(lèi)簇中;其次,對(duì)集合A 中的數(shù)據(jù)點(diǎn)做分化距離處理后得到的集合S={s1,s2,…,sx,…,s39};最后,用K-means 算法對(duì)集合S進(jìn)行聚類(lèi),可得到不同的聚類(lèi)簇中心值和各個(gè)聚類(lèi)簇中的數(shù)據(jù)點(diǎn),選擇聚類(lèi)中心點(diǎn)值最大的簇作為虛擬噪聲點(diǎn)的集V={d1,d2,…,dm}。
根據(jù)虛擬噪聲集合V 中數(shù)據(jù)點(diǎn)查找在集合D 中對(duì)應(yīng)的數(shù)據(jù)值,求出這些數(shù)據(jù)點(diǎn)的前后相鄰數(shù)據(jù)點(diǎn)的孤立系數(shù),并分別將某一數(shù)據(jù)點(diǎn)與其前后相鄰的數(shù)據(jù)點(diǎn)計(jì)算的孤立系數(shù)的值分別叫前孤立系數(shù)和后孤立系數(shù)。孤立系數(shù)的表達(dá)式為
式中 xi與xi+1為相鄰的兩數(shù)據(jù)點(diǎn),f 為采樣頻率。將θ 與給定的閾值ε 比較,如果θ≥ε,則孤立度高;否則,孤立度低。
如果一個(gè)數(shù)據(jù)點(diǎn)的前孤立系數(shù)和后孤立系數(shù)均大于閾值ε,則此數(shù)據(jù)點(diǎn)為噪聲點(diǎn),如果一個(gè)數(shù)據(jù)點(diǎn)與其前相鄰的孤立系數(shù)高與其后相鄰的孤立系數(shù)低,或者相反,如圖2 所示,可將其視為轉(zhuǎn)折點(diǎn)。
圖2 轉(zhuǎn)折點(diǎn)示意圖Fig 2 Diagram of turning point
根據(jù)以上設(shè)想,將某一數(shù)據(jù)點(diǎn)的前、后孤立系數(shù)與給定的閾值比較,即可判斷此數(shù)據(jù)點(diǎn)是不是噪聲點(diǎn)??捎萌绫?所示的噪聲點(diǎn)判定表判斷。
表1 噪聲點(diǎn)判斷表Tab 1 Noise point determination
如果判定xi是噪聲點(diǎn),可以直接將其丟棄,假設(shè)噪聲點(diǎn)有m 個(gè),分別為{x1,x2,…,xm},丟棄噪聲點(diǎn)之后的有用數(shù)據(jù)為{x1,x2,…,x40-m},選用式(7)均值法計(jì)算濃度值
通過(guò)上述對(duì)數(shù)據(jù)集處理過(guò)程的描述,得到樣本處理點(diǎn)的流程圖如圖3 所示。
圖3 樣本處理流程圖Fig 3 Flow chart of sample processing
本文中K-means 算法中K=4,f=0.5 Hz,根據(jù)經(jīng)驗(yàn)可知孤立系數(shù)閾值為ε=arctan 0.03,分化度為φ=0.01。
本文選取濃度為2%的標(biāo)準(zhǔn)瓦斯?jié)舛确謩e選用基于分化距離與K-means 算法結(jié)合的方法處理采樣值與不做任何處理采樣數(shù)據(jù)集可得到如圖4 所示的實(shí)驗(yàn)結(jié)果對(duì)比圖。由圖4 可以看出:基于分化距離與K-means 結(jié)合的方法處理數(shù)據(jù)集之后的數(shù)據(jù)集中的噪聲點(diǎn)明顯比不做任何處理的采集數(shù)據(jù)集中的噪聲點(diǎn)的數(shù)目減少,所以,此方法檢測(cè)的瓦斯?jié)舛戎档臏?zhǔn)確度高。
圖4 實(shí)驗(yàn)結(jié)果對(duì)比圖Fig 4 Comparison of experimental results
本文對(duì)標(biāo)準(zhǔn)瓦斯?jié)舛鹊倪x取值小于5%,經(jīng)過(guò)采用基于分化距離與K-means 算法結(jié)合方法,通過(guò)聚類(lèi)和判斷噪聲點(diǎn)等過(guò)程的處理,可得實(shí)驗(yàn)結(jié)果對(duì)比分析表如表2。
表2 實(shí)驗(yàn)結(jié)果對(duì)比分析表Tab 2 Comparison and analysis of experimental results
從表2 可以看出:基于分化距離與K-means 算法結(jié)合方法檢測(cè)瓦斯?jié)舛刃∮?%,而且具有較高的精確度。
本文提出了一種基于分化距離與K-means 算法結(jié)合的方法,對(duì)采集一段時(shí)間采集數(shù)據(jù)集處理,再根據(jù)前后孤立系數(shù)判斷噪聲點(diǎn),計(jì)算濃度值。經(jīng)過(guò)實(shí)驗(yàn)證明了此方法的有效性,由實(shí)驗(yàn)結(jié)果可看出:此方法檢測(cè)的瓦斯?jié)舛戎敌∮?%,測(cè)量精確度高,適用于礦井的復(fù)雜環(huán)境。除此之外,本方法還可應(yīng)用于其他氣體測(cè)試。
[1] 張 雷,尹王保.基于紅外光譜吸收原理的紅外瓦斯傳感器實(shí)驗(yàn)[J].煤炭學(xué)報(bào),2006,31(4):480-483.
[2] 于 震,張正勇.熱催化瓦斯傳感器的特性及其補(bǔ)償方法[J].傳感器與微系統(tǒng),2010,29(1):42-44.
[3] 葉瑋琳,鄭傳濤.中紅外甲烷檢測(cè)儀穩(wěn)定性實(shí)驗(yàn)及溫度補(bǔ)償研究[J].光學(xué)學(xué)報(bào),2014,34(3):273-277.
[4] 呂光潔.光譜吸收式煤礦瓦斯紅外檢測(cè)技術(shù)的應(yīng)用研究[D].西安:西安科技大學(xué),2009.
[5] 趙 聰.基于非色散紅外光譜吸收原理的瓦斯?jié)舛葯z測(cè)儀設(shè)計(jì)[J].計(jì)算機(jī)測(cè)量與控制,2009,17(6):1229-1231.
[6] 張 麗,王汝琳.基于神經(jīng)網(wǎng)絡(luò)的礦用紅外瓦斯傳感器檢測(cè)模型的研究[J].工礦自動(dòng)化,2009(8):18-21.
[7] 羅達(dá)峰,楊建華.基于紅外吸收光譜的瓦斯氣體濃度檢測(cè)技術(shù)[J].光譜學(xué)與光譜析,2011,31(2):384-386.
[8] 劉 歡,吳介軍.基于分化距離的離群點(diǎn)檢測(cè)算法[J].計(jì)算機(jī)應(yīng)用研究,2010,27(9):3316-3318.
[9] Han Jiawei,Kamber Micheling,Pei Jian,et al.數(shù)據(jù)挖掘概念與技術(shù)[M].范 明,孟小峰,譯.北京:機(jī)械工業(yè)出版社,2012.
[10]周愛(ài)武,于亞飛.K-means 聚類(lèi)算法的研究[J].計(jì)算機(jī)技術(shù)與發(fā)展,2011(2):62-65.