鮑 立,陳紅巖,郭晶晶,袁月峰,李孝祿
(中國計量大學(xué)機(jī)電工程學(xué)院,杭州 310018)
基于改進(jìn)PSO算法的SVM在甲烷測量中的應(yīng)用*
鮑 立,陳紅巖*,郭晶晶,袁月峰,李孝祿
(中國計量大學(xué)機(jī)電工程學(xué)院,杭州 310018)
針對甲烷氣體定量分析過程中,傳統(tǒng)SVM模型預(yù)測精度低、收斂速度慢等問題,提出了一種基于改進(jìn)PSO算法的SVM回歸模型。該模型在傳統(tǒng)PSO算法尋優(yōu)的基礎(chǔ)上,引入動量項的同時增加隨機(jī)粒子個體極值的追隨因子,使粒子不僅追隨全局最優(yōu)解和局部最優(yōu)解,還跟隨種群中任一粒子的個體極值,使得尋優(yōu)算法后期收斂速度較快,不易陷入局部最小值。實驗中,對0~5.05%濃度的25組標(biāo)準(zhǔn)甲烷樣氣進(jìn)行建模分析,并與傳統(tǒng)PSO算法尋優(yōu)模型和Grid搜索法尋優(yōu)模型進(jìn)行對比。結(jié)果表明,采用改進(jìn)PSO算法建立的SVM回歸模型均方根誤差小,收斂速度快。
檢測技術(shù)與自動化裝置;SVM;改進(jìn)PSO算法;回歸分析;紅外甲烷傳感器
隨著國民經(jīng)濟(jì)的不斷發(fā)展,對采礦行業(yè)的需求與日俱增,但要保證煤礦開采安全順利的進(jìn)行,對甲烷的測量精度具有較高的要求,因為甲烷氣體屬于易燃易爆危險氣體,稍有不慎就會引發(fā)爆炸,造成重大的人員傷亡和經(jīng)濟(jì)損失。目前,由于紅外甲烷傳感器[1]測量精度較高,使用壽命較長,越來越多的被用于煤礦開采過程中甲烷氣體的測量。但其測量精度仍需進(jìn)一步提高,以確保工作人員的生命財產(chǎn)安全。
近些年來,眾多國內(nèi)外學(xué)者致力于如何減小甲烷氣體的測量誤差,提出了許多方法,如分段插值法、最小二乘法、多元回歸、小波神經(jīng)網(wǎng)絡(luò)以及SVM等。John Leis等[2]針對固態(tài)紅外光源的光學(xué)通量易受溫度影響的問題,提出了利用脈沖結(jié)電壓測量發(fā)射的紅外通量并引入補(bǔ)償算法;梁永直等[3]在最小二乘法的基礎(chǔ)上提出了改進(jìn)的分段最小二乘法,減小了擬合誤差,節(jié)省了存儲空間,加快了運(yùn)算速度;李卯東等[4]提出了改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)算法,克服了傳統(tǒng)最小二乘法擬合時計算復(fù)雜、誤差較大的缺點(diǎn);曲健等[5]提出了利用改進(jìn)的網(wǎng)格搜索法進(jìn)行SVM核函數(shù)參數(shù)尋優(yōu),建立出預(yù)測精度較高、用時較短的SVM回歸模型;劉文貞等[6]在傳統(tǒng)單核SVM的基礎(chǔ)上提出了一種混合核ε-SVM,對汽車尾氣進(jìn)行定量分析,提高了模型的泛化能力以及預(yù)測精度。
由于SVM具有小樣本學(xué)習(xí)能力強(qiáng)、預(yù)測誤差小以及泛化能力好等突出優(yōu)點(diǎn),已被廣泛應(yīng)用于許多領(lǐng)域。本文在前人的基礎(chǔ)上提出了一種基于改進(jìn)PSO算法的SVM,采用紅外甲烷傳感器對濃度范圍在0~5.05%的25組甲烷標(biāo)準(zhǔn)樣氣進(jìn)行采集,將其中20組數(shù)據(jù)作為訓(xùn)練集建立SVM回歸模型,5組數(shù)據(jù)作為測試集驗證模型的預(yù)測精度。
SVM[7-8]是由Vapnik等人根據(jù)統(tǒng)計學(xué)習(xí)理論中結(jié)構(gòu)風(fēng)險最小化原則提出的,它能夠盡量提高學(xué)習(xí)機(jī)的推廣能力,即使由有限數(shù)據(jù)集得到的判別函數(shù)對獨(dú)立的測試集仍能夠取得較小的誤差,此外,SVM是一個凸二次優(yōu)化問題,能夠保證找到的極值解就是全局最優(yōu)解。SVM回歸分析模型利用核函數(shù)將紅外甲烷傳感器測量得到的原始數(shù)據(jù)映射到高維空間,然后在高維空間進(jìn)行回歸分析,建立紅外甲烷傳感器測量輸出的電壓差值比與待測甲烷氣體濃度的回歸模型。
本文將甲烷濃度值和對應(yīng)的紅外甲烷傳感器測量輸出的電壓差值比構(gòu)成數(shù)據(jù)集T={(x1,y1),…,(xl,yl)}∈(R×R),其中,xi∈R為紅外甲烷傳感器輸出的電壓差值比,yi∈R為對應(yīng)的甲烷濃度值,i=1,2,…,l。按照式(1)進(jìn)行回歸分析:
f(xi)=ω·φ(xi)+b
(1)
式中:ω為回歸系數(shù),φ(xi)為輸入空間到特征空間的映射函數(shù),b為閾值。
優(yōu)化問題可以轉(zhuǎn)化為如下最小化式:
(2)
(3)
引入Lagrange函數(shù)求解式(2)和式(3),通過核函數(shù)K(xi,xj)將高維空間的內(nèi)積運(yùn)算轉(zhuǎn)換到原二維空間計算,有:
(4)
(5)
經(jīng)求解得到:
(6)
從而可以得到SVM模型的回歸函數(shù)為:
(7)
在SVM建模過程中常用到的核函數(shù)有線性核函數(shù)、多項式核函數(shù)、徑向基(RBF)核函數(shù)以及兩層感知器核函數(shù)。本文選擇RBF核函數(shù),其表達(dá)式如下:
K(xi,xj)=exp(-g‖xi-xj‖2)g>0
(8)
式中:參數(shù)g為核函數(shù)中g(shù)amma參數(shù),若k為屬性的數(shù)目,則g默認(rèn)為1/k。
在使用SVM建立回歸模型分析時,想要得到較滿意的結(jié)果,需要調(diào)整相關(guān)參數(shù)(主要是懲罰因子C和核函數(shù)參數(shù)g)才能得到比較理想的預(yù)測準(zhǔn)確率。本文選擇PSO算法實現(xiàn)SVM的參數(shù)尋優(yōu)[9-10],但是傳統(tǒng)的PSO 算法存在后期收斂速度緩慢、易陷入局部極小點(diǎn)等問題,為了同時克服這些缺陷,本文在引入動量項的同時增加隨機(jī)粒子個體極值的追隨因子,使得粒子不僅追隨全局最優(yōu)解和局部最優(yōu)解,還跟隨種群中任一粒子的個體極值以達(dá)到既緩和后期震蕩又解決后期趨同的目的。
傳統(tǒng)的PSO算法速度和位置更新公式為:
(9)
(10)
(11)
改進(jìn)后的粒子群速度和位置更新公式為:
(12)
動量項的引入使得算法在修正粒子速度時,不僅考慮了個體最優(yōu)值和全局最優(yōu)值,還考慮了速度修正量歷史變化趨勢的影響,從而減小了進(jìn)化過程中的震蕩。此外,在粒子的迭代過程中,通過pgbest、pibest和pi共同向下一代傳遞信息,增大了粒子所獲得的信息量。由于pi的權(quán)重值很小,相當(dāng)于在原有基礎(chǔ)上增加了一個小能量干擾以實現(xiàn)粒子的多樣性,從而避免了算法的過分早熟。
圖1 紅外甲烷傳感器檢測原理框圖
本實驗采用紅外吸收光譜原理[1]制作的甲烷傳感器對濃度范圍在0~5.05%的25組標(biāo)準(zhǔn)甲烷樣氣進(jìn)行測量,其輸出為測量通道和參考通道的電壓差與參考通道電壓的比值。該紅外甲烷傳感器檢測原理框圖如圖1所示,上位機(jī)界面如圖2所示,測量數(shù)據(jù)見表1。選擇其中20組數(shù)據(jù)作為訓(xùn)練集,建立SVM回歸模型并檢驗?zāi)P驮谟?xùn)練集上的回歸效果;選擇濃度為0.35、1.38、2.42、3.52、4.79的5組數(shù)據(jù)作為測試集,用建立好的回歸模型進(jìn)行預(yù)測,驗證SVM回歸模型的預(yù)測精度和水平[11]。
圖2 上位機(jī)界面
甲烷濃度/%電壓差值比甲烷濃度/%電壓差值比0-2.31422.42-1.93150.18-2.27762.68-1.90470.35-2.25342.88-1.86960.57-2.21323.13-1.83970.78-2.18083.34-1.81230.94-2.15683.52-1.78111.13-2.12563.77-1.75871.38-2.08853.98-1.72961.55-2.05474.26-1.69311.71-2.03214.53-1.66231.89-1.99854.79-1.63592.01-1.97935.05-1.60212.25-1.9562
模型的建立需要找到最優(yōu)的懲罰因子C和RBF核函數(shù)參數(shù)g,本文采用改進(jìn)的PSO算法進(jìn)行參數(shù)尋優(yōu),選擇最小化式(13)所示的均方根誤差函數(shù)為目標(biāo)函數(shù),選擇適應(yīng)度函數(shù)為式(14)所示,
(13)
Ffitness=Fmse(C,g)
(14)
參數(shù)尋優(yōu)具體步驟如下:
輸入:粒子的維數(shù)和個數(shù);
輸出:SVM最佳參數(shù)組合(C,g)。
①初始化。隨機(jī)初始化SVM參數(shù)組合(C,g)在解空間中的位置、粒子的初始位置和速度,設(shè)置粒子的最大速度vmax、最大迭代次數(shù)、權(quán)重取值范圍以及SVM各參數(shù)取值范圍。
②計算每個粒子的適應(yīng)度值。設(shè)置每個粒子的個體極值pibest為當(dāng)前位置,根據(jù)式(14)計算每個粒子的適應(yīng)度值,取適應(yīng)度值最優(yōu)的粒子個體極值為最初的全局極值pgbest。
③根據(jù)式(12)更新粒子的速度和位置,根據(jù)式(13)、式(14)更新適應(yīng)度值Ffitness,令pipresent=Ffitness。
④比較當(dāng)前粒子的個體最優(yōu)極值pibest和當(dāng)前適應(yīng)度值pipresent,若pipresent>pibest,則pipresent=Fibest。
⑤比較更新之后pipresent和全局最優(yōu)位置pgbest的大小,其中較小的即為最終的全局最優(yōu)解。
⑥判斷是否滿足迭代終止條件,滿足則停止迭代,輸出最優(yōu)的SVM參數(shù)組合,不滿足則轉(zhuǎn)步驟②。當(dāng)使得最優(yōu)解的參數(shù)組合不唯一時,取C值最小的那組。
目前,學(xué)者們普遍采用傳統(tǒng)PSO算法和Grid搜索法[5]來進(jìn)行SVM參數(shù)尋優(yōu)。為了顯示改進(jìn)PSO算法優(yōu)化SVM參數(shù)的優(yōu)勢,本文分別采用3種尋優(yōu)方法建立SVM回歸模型,進(jìn)行對比分析。表2為3種尋優(yōu)方法建立SVM回歸模型時的最優(yōu)參數(shù)、所需時間以及均方根誤差。
表2 模型參數(shù)尋優(yōu)對比
圖3~圖5分別為3種尋優(yōu)方法建立SVM回歸模型時在訓(xùn)練集上驗證模型回歸效果圖[12-13]。
圖5 改進(jìn)PSO算法-SVM
圖3 傳統(tǒng)PSO算法-SVM
圖4 Grid搜索法-SVM
由表2可知采用改進(jìn)PSO算法尋優(yōu)得到的參數(shù)C明顯小于傳統(tǒng)PSO算法和Grid搜索法,而過大的C容易引起模型的過學(xué)習(xí);尋優(yōu)時間明顯縮短;并且均方根誤差最小。由圖3到圖5對比可知采用改進(jìn)PSO算法建立SVM回歸模型的回歸效果最好。
將改進(jìn)PSO算法尋優(yōu)得到的最優(yōu)參數(shù)組合(C,g)=(1.253 8,1.624 5)代入SVM建立模型并進(jìn)行預(yù)測分析,可以得到模型的預(yù)測結(jié)果如圖6所示[14]。從圖6可以看出基于改進(jìn)PSO算法的SVM模型預(yù)測曲線很好的逼近期望曲線,達(dá)到較高的預(yù)測精度。
圖6 甲烷氣體模型預(yù)測輸出與期望輸出對比圖
3種模型預(yù)測誤差對比如表3所示。
表3 模型預(yù)測誤差對比
由表3可知,基于改進(jìn)PSO算法-SVM模型預(yù)測的絕對誤差和相對誤差都明顯低于傳統(tǒng)PSO算法-SVM模型和Grid搜索法-SVM模型,并且絕對誤差小于0.1%,相對誤差小于5%,滿足行業(yè)內(nèi)對甲烷測量誤差的要求。
本文在傳統(tǒng)的PSO算法尋優(yōu)的基礎(chǔ)上,引入動量項的同時使得粒子不僅追隨全局最優(yōu)解和局部最優(yōu)解,還跟隨種群中任一粒子的個體極值以達(dá)到既緩和后期震蕩又解決后期趨同的目的,使得尋優(yōu)算法后期收斂速度較快,不易陷入局部最小值。通過采用3種尋優(yōu)方法建立SVM回歸模型進(jìn)行對比分析,結(jié)果表明,改進(jìn)的PSO算法尋優(yōu)速度最快,建立的SVM模型回歸效果最好,預(yù)測精度最高。因此,該方法可以考慮用于煤礦開采過程中甲烷氣體的定量分析,在一定程度上可以提高甲烷的預(yù)測精度,給工作人員的生命財產(chǎn)安全增加保障。
[1] 譚秋林. 紅外光學(xué)氣體傳感器及檢測系統(tǒng)[M]. 北京:機(jī)械工業(yè)出版社,2013:1-139.
[2] John Leis,David Buttsworth. A Temperature Compensation Technique for Near-Infrared Mathane Gas Threshold Detection[J]. IEEE Transactions on Industrial Electronics,2016,63(3):1813-1821.
[3] 梁永直,李卯東,夏路易,等. 紅外甲烷傳感器檢測中的算法研究[J]. 儀表技術(shù)與傳感器,2012,27(11):149-150.
[4] 李卯東,梁永直. 基于遺傳優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)法在甲烷檢測中的應(yīng)用[J]. 工礦自動化,2013,39(2):51-53.
[5] 曲健,陳紅巖,劉文貞,等. 基于改進(jìn)網(wǎng)格搜索法的支持向量機(jī)在氣體定量分析中的應(yīng)用[J]. 傳感技術(shù)學(xué)報,2015,28(5):774-778.
[6] 劉文貞,陳紅巖,李孝祿,等. 基于自適應(yīng)變異粒子群算法的混合核ε-SVM在混合氣體定量分析中的應(yīng)用[J]. 傳感技術(shù)學(xué)報,2016,29(9):1464-1470.
[7] 王宏偉,韓云濤,彭繼慎. 基于TSPSO支持向量機(jī)紅外甲烷傳感器動態(tài)補(bǔ)償[J]. 傳感技術(shù)學(xué)報,2013,26(9):1193-1197.
[8] 張麗. 基于支持向量機(jī)的礦用紅外瓦斯檢測系統(tǒng)研究[D]. 北京:中國礦業(yè)大學(xué)(北京),2010.
[9] 鄒心遙,陳敬偉,姚若河. 采用粒子群優(yōu)化的SVM算法在數(shù)據(jù)分類中的應(yīng)用[J]. 華僑大學(xué)學(xué)報(自然科學(xué)版),2016,37(2):171-174.
[10] 王利霞. 改進(jìn)的粒子群優(yōu)化算法及其在數(shù)據(jù)分類中的應(yīng)用[D]. 西安:西安電子科技大學(xué),2014.
[11] 曲健,陳紅巖,劉文貞,等. 基于自適應(yīng)變異粒子群優(yōu)化的SVM在混合氣體分析中的應(yīng)用[J]. 傳感技術(shù)學(xué)報,2015,28(8):1262-1268.
[12] 王小川,史峰,郁磊,等. MATLAB神經(jīng)網(wǎng)絡(luò)43個案例分析[M]. 北京:北京航空航天大學(xué)出版社,2013:1-394.
[13] 余勝威. MATLAB優(yōu)化算法案例分析與應(yīng)用(進(jìn)階篇)[M]. 北京:清華大學(xué)出版社,2015:298-310.
[14] 徐云升,黎瑞珍,張鐵濤,等. 實驗數(shù)據(jù)處理與科技繪圖[M]. 華南理工大學(xué)出版社,2010:1-176.
鮑立(1991-),男,漢族,安徽省安慶市,在讀研究生,主要研究方向為檢測技術(shù)與物聯(lián)網(wǎng),2298926413@qq.com;
陳紅巖(1965-),男,浙江杭州市,教授,研究生導(dǎo)師,浙江大學(xué)內(nèi)燃機(jī)工程專業(yè)碩士、博士學(xué)位;上海交通大學(xué)動力與機(jī)械工程專業(yè)博士后。主要研究領(lǐng)域為汽車電子、發(fā)動機(jī)排放與控制、氣體檢測等,bbchy@163.com。
ApplicationofSVMBasedonImprovedParticleSwarmOptimizationAlgorithminMethaneMeasurement*
BAOLi,CHENHongyan*,GUOJingjing,YUANYuefeng,LIXiaolu
(College of Mechanical and Electrical Engineering,China Jiliang University,Hangzhou 310018,China)
In the process of methane gas quantitative analysis,the traditional SVM model has some problems of low prediction precision and slow convergence speed and so on. To solve these problems,a SVM regression model based on improved PSO algorithm is presented. On the basis of the traditional PSO algorithm,the model introduces momentum and simultaneously increases following factors for the individual extremum of random particles to make the particles not only follow the global optimal solution and local optimal solution,follow the individual extremum of any particle in the population. This method makes optimum algorithm have a faster convergence speed and be not easy to fall into local minimum. In experiments,building a model and analyzing for 25 groups of methane gas that the concentration is range from 0 to 5.05%,and then doing a comparison with traditional PSO algorithm and Grid search method. Results show that the SVM regression model based on improved PSO algorithm has a smaller root-mean-square error and faster convergence speed.
detection technique and automatic device;SVM;improved particle swarm optimization algorithm;regression analysis;infrared methane sensor
項目來源:浙江省大學(xué)生科技創(chuàng)新活動計劃暨新苗人才計劃項目(省級)(2016R409)
2017-02-23修改日期:2017-04-14
TP274.2
:A
:1004-1699(2017)09-1454-05
10.3969/j.issn.1004-1699.2017.09.026