国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于變量選擇技術(shù)的FTIR光譜識別算法研究

2021-06-13 00:56:12沈先春徐亮孫永豐胡運優(yōu)金嶺楊偉鋒徐寒揚劉建國劉文清
量子電子學報 2021年3期
關(guān)鍵詞:定性光度光譜

沈先春,徐亮,孫永豐,胡運優(yōu),金嶺,楊偉鋒,徐寒揚,劉建國,劉文清

(1中國科學院合肥物質(zhì)科學研究院安徽光學精密機械研究所環(huán)境光學與技術(shù)重點實驗室,安徽 合肥 230031;2中國科學技術(shù)大學,安徽 合肥 230026;3安徽省環(huán)境光學監(jiān)測技術(shù)重點實驗室,安徽 合肥 230031)

0 引言

被動傅里葉變換紅外光譜(Passive-FTIR)在測量毒害危險氣體時具有在線、遠距離、非接觸等特點,廣泛應(yīng)用各種監(jiān)測場合[1?6],在危險氣體預(yù)警監(jiān)測過程中,光譜識別算法是預(yù)警功能的核心技術(shù)。傳統(tǒng)的FTIR定性識別算法一般采用譜庫檢索的方式[7?11]在低維度的光譜數(shù)據(jù)庫中進行識別分析,例如點積運算、混合匹配校正等方法,然而此類算法不能夠在光譜吸收種類較多或者干擾成分較多的情況下進行定性識別分析[10,11]。近年來,在模式識別和人工智能技術(shù)的蓬勃發(fā)展環(huán)境下,FTIR光譜定性識別算法的研究也更加普及。例如2012年Lavinea等[12]采用基于模式識別的譜庫檢索方法對化合物進行識別分析;2015年Zhou等[13]通過半監(jiān)督支持向量機的方法實現(xiàn)對食用油和地溝油的快速識別,2006年Bai等[14]利用基于核主成分分析的支持向量回歸方法對混合烷烴進行了識別分析;2004年Liu等[15]采用多重交叉與定量變異、自適應(yīng)變異相結(jié)合的遺傳算法對FTIR測量的光譜進行定性定量分析,利用選擇概率和適應(yīng)度值控制整個識別過程,并用101種有毒有機化合物的標準數(shù)據(jù)庫對6個未知樣本進行了定性定量分析,取得了理想的識別效果。

隨著標準光譜數(shù)據(jù)庫種類的不斷擴增,用傳統(tǒng)的方法對光譜數(shù)據(jù)庫進行建?;蛴?xùn)練需要大量的時間,除此之外,在利用大光譜數(shù)據(jù)庫進行定性識別分析時,光譜之間存在一定的多重共線性問題。為了克服以上問題,本文根據(jù)SFS、LASSO和Elastic Net變量選擇方法[16?18],結(jié)合廣義交互驗證方法[19]對采集的光譜進行變量的初步選擇,然后利用實際氣體濃度大于0的物理特征,對初步選擇的濃度變量小于0的予以剔除,再用最小二乘法對剩余變量重新擬合,計算得到新的濃度大小,循環(huán)該步驟直到所有變量的濃度均大于0為止,此步驟稱為迭代最小二乘,然后利用待選變量在擬合向量中的占比大小對變量進行篩選,得到最終的目標識別組分。以上所有步驟組合形成定性識別算法。下文中,為了簡便描述,不同識別算法用各自的變量選擇方法名稱來表示。最后用兩組外場試驗驗證了不同算法的識別性能,并將識別的結(jié)果與基于數(shù)字光譜合成校準思想的非線性最小二乘方法(NLLSQ)[20]定量分析濃度的相對誤差進行聯(lián)合分析。實驗結(jié)果表明所建立的識別分析算法具有無需進行樣本訓(xùn)練分析、平均識別一條目標波段內(nèi)的光譜成分速度為秒級響應(yīng)、并且識別準確率高達98%以上等優(yōu)點,能夠為被動FTIR光譜實時在線預(yù)警監(jiān)測應(yīng)用提供技術(shù)支持。

1 方法原理

基于朗伯-比爾定律將FTIR測量得到的透過率光譜表示為吸光度形式,并依據(jù)光譜數(shù)據(jù)庫的光譜參數(shù)信息,把目標氣體吸光度的線性表達式表示為

式中:Am×1為測量得到的一列含有m個光譜數(shù)據(jù)點的吸光度光譜數(shù)據(jù);Km×n為m行n列標準光譜的吸光度矩陣,其中m為光譜數(shù)據(jù)點個數(shù),即波數(shù)點個數(shù),n為參與吸收的成分個數(shù);Cn×1為n個成分的濃度組成的列矩陣;L為氣體吸收的光程。定性識別方法的本質(zhì)就是要選出變量Km×i使得擬合的結(jié)果與測量吸光度的差值平方和最小,其中i即為識別出的氣體成分。

1.1 序列前向選擇

經(jīng)典的SFS算法應(yīng)用于定性識別中的本質(zhì)是將光譜從標準數(shù)據(jù)庫集合T中一個個篩選到集合S中,然后利用待選集U中的光譜與當前殘差譜的絕對相關(guān)性進行不斷篩選,最終初步篩選得到光譜組分,算法的一般流程如下:

1)初始化:令組分選擇集合S為空集,對集合T進行編號,初始化i為0時,代表濃度的自變量Ci=0,其中i為循環(huán)變量,i∈ {0,1,···,n?1}。

2)搜索原理:先求出殘差向量A?KCi與未選中組份KU的相關(guān)系數(shù)R,并利用相關(guān)系數(shù)的最大值進行篩選得到初步目標組分,而KU為集合K中與未選擇集合U中編號對應(yīng)的列矩陣。最大相關(guān)系數(shù)對應(yīng)的組分R可表示為

式中上標T為矩陣轉(zhuǎn)置運算,然后將R從集合U中不斷篩選到集合S中。

3)迭代:通過CLS方法迭代更新濃度自變量,則

4)循環(huán):迭代計算以上2)、3)兩步,直至i達到n?1時停止計算,最終識別得到組分變量的集合V=[C(0)···C(n)]。

上述流程便是完整的SFS識別方法。

1.2 LASSO

LASSO方法的本質(zhì)是在CLS算法的最優(yōu)化目標函數(shù)基礎(chǔ)上,增添一個L1范數(shù)的懲罰項,達到對模型系數(shù)壓縮的目的,使一些系數(shù)變小甚至變成0,達到選擇變量的功能。根據(jù)線性模型(1)式,LASSO方法的最優(yōu)化目標函數(shù)可表示為

式中第一項為CLS的最優(yōu)目標函數(shù),第二項為添加的正則化項。其中λ為非負數(shù)的懲罰參數(shù),控制參數(shù)壓縮程度,其值越大,參數(shù)的懲罰壓縮力度越大,導(dǎo)致LASSO方法估計得到的非零變量個數(shù)越少,易得到稀疏解。數(shù)學原理上,(4)式第一項表示模型準確性,該項值越小,模型的擬合誤差越小,精度越高;第二項表示模型的穩(wěn)定性,通常情況下,其值越小,模型越穩(wěn)定。LASSO方法應(yīng)用于光譜識別算法的具體步驟如下所示:

3)輸出結(jié)果:完成循環(huán)步驟2)后輸出變量選擇的集合V=[C(0)···C(k)]。以上算法步驟稱為LASSO識別分析算法。

1.3 Elastic Net

Elastic Net方法集成了嶺回歸和LASSO方法的特點,懲罰項中既有L1范數(shù)項又有L2范數(shù)項,故Elastic Net方法可表示為

由(5)式可知,λ=0時就是嶺回歸方法,而δ=0時則為LASSO方法。故Elastic Net方法不僅具備組效應(yīng)性質(zhì),還具備LASSO方法的變量選擇能力。

對于嶺回歸確定的參數(shù)δ,(6)式的變換過程說明Elastic Net問題可轉(zhuǎn)換為LASSO問題,進而可用上述LASSO解的步驟解Elastic Net問題,此處不再重復(fù)贅述。以上變量選擇方法選擇出來的結(jié)果用廣義交互驗證進行變量評判,基于以上變量選擇方法的定性識別分析方法在整體算法分析流程上可表示為圖1。

2 實驗與分析

為驗證以上各識別算法的準確性和實用性,分別采用兩組不同方式的模擬排放實驗進行驗證分析。

2.1 CH4排放實驗與結(jié)果分析

在空曠場地上,利用濃度為2%的CH4標準氣體進行排放實驗對識別算法進行驗證,而被動FTIR遙測系統(tǒng)的檢出能力取決于目標氣體與背景的溫差,實驗時氣溫為32.7°C,濕度約為21%。將光譜儀固定在三腳架上,讓遠處的樓墻充滿光譜儀的視場,然后打開光譜儀,儀器參數(shù)設(shè)置為32次平均,分辨率為1 cm?1,掃描頻率選擇375 kHz擋,待儀器穩(wěn)定后,連續(xù)采集當前的背景光譜,在光譜儀視場上釋放CH4氣體,然后用以上建立的定性識別算法對采集的CH4氣體吸收光譜進行定性識別分析,試驗現(xiàn)場和采集得到未定標的原始光譜數(shù)據(jù)如圖2所示。

用簡化的三層大氣傳輸模型對采集的CH4透過率光譜進行反演,并根據(jù)朗伯-比爾定律轉(zhuǎn)換成吸光度光譜,再用自動基線校正方法[21]對得到的CH4吸光度光譜進行基線校正,校正后的光譜如圖3中黑色實線所示,并用不同識別分析方法對得到的吸光度光譜進行識別分析,識別的組分結(jié)果如表1所示,并且識別過程中的擬合光譜如圖3中虛線所示。

圖1 光譜識別算法流程圖Fig.1 Flow chart of the spectral identification algorithms

圖2 (a)實驗場地;(b)原始光譜數(shù)據(jù)Fig.2 (a)Experimental field;(b)Original spectral dataset

根據(jù)圖3和表1結(jié)果可知,三種不同的變量選擇算法能夠準確地識別出目標氣體CH4,除此之外,也能夠識別出干擾成分H2O,并且各自的擬合光譜譜形相似,且LASSO與Elastic Net的擬合光譜幾乎相同,SFS、LASSO、Elastic Net三種不同識別算法耗時分別為0.376、2.06、2.02 s,各自擬合均方根誤差分別為0.576、0.579、0.579,滿足實際應(yīng)用的需求,表明所建立的識別算法可以應(yīng)用于簡單的被動遙測應(yīng)用場景。

表1 不同算法下CH4的識別結(jié)果Table 1 Identification results of CH4gas by different algorithms

圖3 基線校正后的吸光度光譜和識別算法對應(yīng)的擬合光譜Fig.3 Absorbance spectrum with baseline corrected and spectrum fitted by recognition algorithm

2.2 SF6分間斷連續(xù)排放實驗與結(jié)果分析

上述CH4排放實驗是光譜識別分析方法最初級的外場應(yīng)用研究[22],因為其只對單次CH4測量光譜進行了識別分析方法研究,而此次采用不同時間段內(nèi)連續(xù)排放SF6氣體的實驗對光譜識別算法的準確性和靈敏性進行驗證,用識別結(jié)果中準確的個數(shù)與確切目標個數(shù)的比值衡量識別準確率,用不同時間段內(nèi)目標波段氣體的識別耗時來衡量靈敏性。實驗采用自主研制的OP-FTIR光譜儀對SF6氣體釋放區(qū)進行連續(xù)測量,SF6氣體的釋放間隔人為控制為由短到長,采集光譜數(shù)據(jù)參數(shù)設(shè)置為2次平均,分辨率為1 cm?1。整個過程的SF6釋放氣體時間紀錄如表2所示,OP-FTIR光譜儀連續(xù)采集的光譜如圖4所示,此次實驗共采集124條光譜。

圖4 SF6原始光譜數(shù)據(jù)Fig.4 Original spectra of SF6

表2 放氣時間表Table 2 Outgassing schedule

用所提出識別算法對上述采集到的124條光譜進行識別分析,識別分析波段采用900~980 cm?1,選擇變量在擬合向量中的占比值設(shè)置為0.5,為了檢驗識別結(jié)果的準確性,采用精準的非線性最小二乘(NLLSQ)方法對測量的光譜進行定量分析,在定量擬合分析過程中,如果強行擬合不存在的目標氣體種類,定量結(jié)果的相對誤差較大,故識別結(jié)果的準確性可依據(jù)此現(xiàn)象來輔助判斷。如圖5顯示了不同算法的識別結(jié)果和NLLSQ定量計算濃度的相對誤差大小,圖中方型曲線中的1表示識別出SF6氣體,0則表示未識別出SF6氣體,SF6定量計算濃度的相對誤差用星號表示,其中虛線代表相對誤差為0.1的直線,根據(jù)以上判斷規(guī)則,定量計算的相對誤差高于0.1的光譜可看作沒有SF6氣體,反之則有。

從圖5可以看出,各識別算法識別的結(jié)果與實際放氣時間相一致,并且不同識別算法的識別結(jié)果基本一致,除了第110條光譜,LASSO和Elastic Net方法未識別出SF6氣體,而SFS識別出SF6氣體,為了進一步驗證兩者之間的準確性,給出了第109、110和111條原始數(shù)據(jù)和第110條光譜的不同識別算法擬合圖,如圖6所示。由圖6(a)可知,110和111號光譜的SF6氣體的特征吸收峰很弱,幾乎接近噪聲水平,但是三種識別方法均識別出111號光譜中含有SF6氣體,從圖6(b)的擬合效果可以看出SFS算法識別擬合誤差小,再根據(jù)實際現(xiàn)場氣體排放過程和順序信息對應(yīng)關(guān)系,第110號光譜中應(yīng)含有少量的SF6氣體,定量濃度為2.68μmol/mol,符合閾值基準線判斷標準。綜上可得,當光譜信噪比較低時,LASSO與Elastic Net方法的識別準確率下降。不同時間段內(nèi)的SF6氣體識別結(jié)果反映了各識別算法能夠快速識別出目標成分,識別準確率達99%以上,三種不同識別算法在氣體目標波段內(nèi)識別的平均時間為0.16、1.37、1.31 s,充分說明建立的FTIR光譜識別算法能夠滿足危險氣體預(yù)警監(jiān)測的需求。

圖6 (a)基線校正后的三條光譜;(b)不同算法的擬合結(jié)果Fig.6 (a)Three spectra after baseline correction;(b)Spectra fitted by different algorithms

3 結(jié)論

提出了基于變量選擇技術(shù)的光譜識別分析算法并進行了實驗研究,巧妙地利用NLLSQ定量分析濃度相對誤差來輔助判斷識別結(jié)果的準確性,實驗結(jié)果表明各識別算法均能夠有效且快速準確地識別目標氣體成分,還能識別出干擾組分水汽,整個過程無需采樣建模和模型訓(xùn)練,平均識別一條目標波段范圍內(nèi)的光譜所需時間為秒級,是快速有效的識別分析方法,大大提高了被動FTIR對有毒有害氣體泄露的預(yù)警監(jiān)測能力,為災(zāi)害現(xiàn)場的智能防控提供了技術(shù)支持。

SF6連續(xù)間斷排放實驗表明:當光譜信噪比較低時,LASSO和Elastic Net光譜識別算法的準確性降低,而對于不同信噪比的光譜定性識別算法需要進一步研究分析。根據(jù)吸光度光譜進行識別分析時,需要對測量得到的吸光度譜中漂移的基線進行校正,而基線校正的程度決定了定性識別過程中的濃度大小,想要在識別目標組分的同時獲取準確的濃度信息則需要準確的基線校正方法,基線校正的準確性對識別算法的影響也值得深入研究。

猜你喜歡
定性光度光譜
基于三維Saab變換的高光譜圖像壓縮方法
分裂平衡問題的Levitin-Polyak適定性
乘用車后回復(fù)反射器光度性能試驗研究
汽車電器(2019年1期)2019-03-21 03:10:46
當歸和歐當歸的定性與定量鑒別
中成藥(2018年12期)2018-12-29 12:25:44
Interaction Study of Ferrocene Derivatives and Heme by UV-Vis Spectroscopy
星載近紅外高光譜CO2遙感進展
中國光學(2015年5期)2015-12-09 09:00:28
黑洞的透射效應(yīng)和類星體的光度
河南科技(2015年8期)2015-03-11 16:24:18
共同認識不明確的“碰瓷”行為的定性
毆打后追趕致人摔成重傷的行為定性
苦味酸與牛血清蛋白相互作用的光譜研究
404 Not Found

404 Not Found


nginx
赤壁市| 花垣县| 河西区| 海兴县| 定结县| 如皋市| 潼关县| 奉化市| 陕西省| 油尖旺区| 霍山县| 筠连县| 礼泉县| 石泉县| 彩票| 同仁县| 绵阳市| 诏安县| 门源| 宁远县| 井冈山市| 巨鹿县| 封开县| 锡林浩特市| 新化县| 定襄县| 和静县| 孙吴县| 西畴县| 兴化市| 藁城市| 文山县| 滦南县| 青州市| 南岸区| 丹巴县| 金平| 清镇市| 黄陵县| 象州县| 武陟县|