廉小親,劉 鈺,陳彥銘,黃 靜,龔永罡,霍亮生
1.北京工商大學(xué)人工智能學(xué)院,北京 100048 2.北京工商大學(xué)中國(guó)輕工業(yè)工業(yè)互聯(lián)網(wǎng)與大數(shù)據(jù)重點(diǎn)實(shí)驗(yàn)室,北京 100048
電感耦合等離子體原子發(fā)射光譜儀法(inductively coupled plasma atomic emission spectrometer,ICP-AES),一定濃度的元素試樣溶液經(jīng)過(guò)ICP-AES儀霧化、在炬管中進(jìn)入等離子態(tài),試樣中的組分被原子化、電離、激發(fā),以光的形式發(fā)射出能量,通過(guò)測(cè)定試樣溶液光譜圖的特征與光強(qiáng)值進(jìn)而對(duì)元素進(jìn)行定性和定量分析,該測(cè)量方法具有靈敏度高、檢出限低及多元素可同時(shí)測(cè)定的優(yōu)點(diǎn),因此被廣泛應(yīng)用于稀土分析、合金冶煉、石油化工等領(lǐng)域。然而ICP光源激發(fā)能高,所以在元素測(cè)定過(guò)程中,會(huì)產(chǎn)生大量發(fā)射譜線,幾乎每種元素分析線都會(huì)受到不同程度的光譜干擾。
光譜干擾分為背景干擾和譜線重疊干擾。背景干擾是指均勻分布的帶狀光譜疊加在被測(cè)元素分析線上造成的干擾,這是ICP光譜儀的固有問題;譜線重疊干擾是指其他元素的譜線重疊在被測(cè)元素分析線上產(chǎn)生的干擾[1],被測(cè)元素分析線與干擾線疊加后的合成曲線作為混合光譜分析線,導(dǎo)致被測(cè)元素分析結(jié)果不精確,因此研究光譜干擾校正方法就尤為重要。
近年來(lái),數(shù)學(xué)和統(tǒng)計(jì)學(xué)方法常用于ICP-AES信號(hào)處理,為ICP-AES光譜干擾校正提供了新的途徑,李劃新等[2]提出用自適應(yīng)平方根卡爾曼濾波法校正ICP-AES光譜干擾,需要在合適的參數(shù)條件下測(cè)定加入回收率及相對(duì)標(biāo)準(zhǔn)偏差,此方法對(duì)參數(shù)設(shè)定要求較高;沈蘭蓀等[3]提出以目標(biāo)元素譜圖作為目標(biāo)數(shù)據(jù)輸入,選擇元素理論譜線經(jīng)儀器函數(shù)映射得到的元素物理譜線作為參考輸入,通過(guò)自適應(yīng)濾波器輸出元素譜線的最佳估計(jì),其操作較為復(fù)雜。本文基于自適應(yīng)粒子群優(yōu)化(adaptive particle swarm optimization,APSO)算法在多峰函數(shù)優(yōu)化、全局尋優(yōu)方面具有的良好優(yōu)勢(shì),以及基于多峰譜線分離的理論扣除譜線重疊干擾的方法,利用多個(gè)Voigt線型函數(shù)疊加構(gòu)造多峰譜線模型,提出將APSO算法作為校正算法的設(shè)計(jì)思路,通過(guò)APSO算法尋求重疊干擾線函數(shù)和被測(cè)元素分析線函數(shù)相關(guān)參數(shù)的最優(yōu)解,實(shí)現(xiàn)ICP-AES的多峰譜線分離。
激發(fā)態(tài)原子或離子由于不均勻展寬所致形成服從Gaussian函數(shù)分布的發(fā)射譜線,均勻展寬的發(fā)射譜線具有Lorentzian函數(shù)分布特征。在ICP-AES工作條件下,激發(fā)態(tài)原子或離子的譜線是在均勻和不均勻展寬效應(yīng)綜合作用下形成的混合型譜線,ICP-AES發(fā)射光譜譜線為L(zhǎng)orentzian函數(shù)與Gaussian函數(shù)卷積得到的Voigt線型函數(shù)[4],如式(1)所示。
(1)
為了簡(jiǎn)便計(jì)算,原子發(fā)射光譜譜線可以用Voigt線型近似函數(shù)來(lái)描述,如式(2)所示。
(2)
式(2)中,I0為譜峰高度,λ0為特征譜線中心位置,ΔλV為譜線半峰寬,η為L(zhǎng)orentz-Gauss比例系數(shù),0≤η≤1,I0,λ0,ΔλV和η為Voigt線型近似函數(shù)的待確定參數(shù)。
ICP-AES實(shí)驗(yàn)曲線通常是由M條Voigt線型曲線與一個(gè)背景值疊加而成,構(gòu)成的多峰譜線疊加模型如式(3)所示。
(3)
(4)
本文考慮到APSO算法可以有效解決函數(shù)尋優(yōu)問題、具有較快的收斂速度的特點(diǎn),能夠通過(guò)粒子的個(gè)體經(jīng)驗(yàn)以及種群內(nèi)的信息共享實(shí)現(xiàn)問題求解的智能化,擬利用APSO算法實(shí)現(xiàn)ICP-AES多峰譜線的分離。
粒子群優(yōu)化算法(particle swarm optimization,PSO)的根本思想來(lái)源于對(duì)鳥群捕食行為的研究,模擬鳥群覓食的過(guò)程把每個(gè)粒子的運(yùn)動(dòng)過(guò)程比作小鳥,為了尋找未知位置的食物即適應(yīng)度值搜尋目前離食物最近的鳥的周圍區(qū)域,并根據(jù)自己的飛行經(jīng)驗(yàn)找到最近的路線,即算法中尋找最優(yōu)解的過(guò)程[6]。粒子群算法以適應(yīng)度函數(shù)值作為判別標(biāo)準(zhǔn),每個(gè)粒子都有自己的位置和速度屬性,代表適應(yīng)度函數(shù)的一種可能解,在每次迭代中更新粒子個(gè)體最優(yōu)解Pbest和全局最優(yōu)解Gbest,每一次迭代粒子在D維空間下搜索移動(dòng),追蹤當(dāng)前最優(yōu)粒子得到這兩個(gè)適應(yīng)度值,根據(jù)式(5)和式(6)來(lái)更新粒子的速度和位置。
(5)
(6)
為了解決PSO算法易陷入局部最優(yōu)問題,本文提出帶壓縮因子的自適應(yīng)慣性權(quán)重和線性學(xué)習(xí)因子的APSO算法。該算法中自適應(yīng)慣性權(quán)重變化可以根據(jù)早熟收斂情況和粒子個(gè)體適應(yīng)度值動(dòng)態(tài)調(diào)整權(quán)重值,學(xué)習(xí)因子線性變化能夠有效解決粒子群算法在后期多樣性減少陷入局部最優(yōu)的問題,引入的壓縮因子能夠均衡APSO算法局部搜索能力和全局搜索能力,保持算法在整個(gè)迭代過(guò)程中全局收斂性和收斂速度的動(dòng)態(tài)平衡[8]。
標(biāo)準(zhǔn)PSO算法中慣性權(quán)重ω決定了粒子上一次迭代速度與當(dāng)前次迭代速度的關(guān)聯(lián)程度。結(jié)合前期算法收斂情況,為了提高PSO算法搜索效果的精準(zhǔn)性,在標(biāo)準(zhǔn)PSO算法的基礎(chǔ)上將慣性權(quán)重ω改進(jìn)為自適應(yīng)權(quán)重變化,慣性權(quán)重ω根據(jù)粒子適應(yīng)度值進(jìn)行動(dòng)態(tài)調(diào)整,如式(7)所示[9]。
(7)
式(7)中,f為當(dāng)前粒子的適應(yīng)度值,favg和fmin分別為當(dāng)前所有粒子的平均適應(yīng)度值和最小適應(yīng)度值。若當(dāng)前粒子的適應(yīng)度值優(yōu)于所有粒子的平均適應(yīng)度值,說(shuō)明該粒子當(dāng)前位置接近全局最優(yōu)解,慣性權(quán)重ω應(yīng)選擇較小值,以達(dá)到保護(hù)該粒子的目的,若當(dāng)前粒子的適應(yīng)度值差于平均適應(yīng)度值,則表明該粒子需要向接近全局最優(yōu)的搜索區(qū)域靠攏,慣性權(quán)重ω應(yīng)選擇較大值[10]。
(8)
(9)
式中,T為當(dāng)前迭代次數(shù),Tmax為算法最大迭代次數(shù)。自我學(xué)習(xí)因子c1先大后小動(dòng)態(tài)變化,社會(huì)學(xué)習(xí)因子c2則先小后大動(dòng)態(tài)調(diào)整[11],則算法在前期階段搜索時(shí),移動(dòng)粒子變化更多依據(jù)自身經(jīng)驗(yàn),在后期階段搜索時(shí),粒子位置變化則需要根據(jù)整個(gè)種群的社會(huì)經(jīng)驗(yàn),追蹤全局最優(yōu)粒子位置,維持收斂速度與搜索效果的穩(wěn)定性[12]。
在算法計(jì)算過(guò)程中,若種群內(nèi)的粒子多樣性減少,且種群粒子遠(yuǎn)離全局最優(yōu)位置時(shí),需要增強(qiáng)種群全局搜索能力探索粒子的全局最優(yōu)位置,當(dāng)種群內(nèi)粒子多樣性不斷增加時(shí),需要增強(qiáng)種群局部開發(fā)能力,使種群內(nèi)的粒子向全局最優(yōu)位置靠近[13],為了維護(hù)算法全局探索能力與局部開發(fā)能力的平衡,在標(biāo)準(zhǔn)PSO算法速度更新公式的基礎(chǔ)上乘以收縮因子,加快收斂速度,保證算法的收斂性,此時(shí)速度更新根據(jù)式(10)調(diào)整。
(10)
式(10)中,χ為收縮因子,用式(11)表示。
(11)
式(11)中,φ通常取4.1,能夠適當(dāng)保持種群粒子的多樣性。
本文采取慣性權(quán)重和學(xué)習(xí)因子動(dòng)態(tài)變化,同時(shí)引入壓縮因子的改進(jìn)粒子群優(yōu)化算法,該算法可以有效保證前期迭代盡可能全局探索最優(yōu)解和后期迭代局部收斂于全局最優(yōu)解,具有更優(yōu)的性能。
APSO算法設(shè)置粒子個(gè)數(shù)為50個(gè),最大迭代次數(shù)Tmax=1 500,慣性權(quán)重最大值ωmax=0.6,慣性權(quán)重最小值ωmin=0.4,收縮因子參數(shù)φ=4.1,由于需要尋找9個(gè)參數(shù)變量的最優(yōu)解,因此種群維數(shù)D=9,粒子速度和位置矢量初始化根據(jù)目標(biāo)數(shù)據(jù)點(diǎn)(λk,Ik)分布范圍隨機(jī)賦值。粒子的位置矢量即所求特征參數(shù)向量,特征參數(shù)向量包含五類參數(shù),分別是譜峰高度I0、特征譜線中心位置λ0、譜線半峰寬ΔλV、Lorentz-Gauss比例系數(shù)η以及背景值BK,每類參數(shù)的取值范圍如表1所示。速度矢量初始化范圍為位置最大矢量的±15%。
表1 粒子位置矢量初始化參數(shù)范圍表Table 1 Particle position vector initialization parameter range table
由于在粒子群尋優(yōu)算法程序中粒子的速度和位置初始化具有隨機(jī)性,所以測(cè)試數(shù)據(jù)每次通過(guò)改進(jìn)粒子群算法搜索得到的最優(yōu)適應(yīng)度值以及特征參數(shù)向量值會(huì)有小范圍變化,為了保證算法結(jié)果的準(zhǔn)確性與穩(wěn)定性,在程序中設(shè)定算法重復(fù)處理同組目標(biāo)數(shù)據(jù)20次,最終20組數(shù)據(jù)結(jié)果中選取五組較小的全局最小值及相應(yīng)的粒子最優(yōu)解向量作為算法結(jié)果,并將五組粒子最優(yōu)解向量包含的每個(gè)對(duì)應(yīng)的參數(shù)變量取五組平均,得到的一組平均結(jié)果作為該組目標(biāo)數(shù)據(jù)下多峰譜線疊加模型擬合曲線的特征參數(shù)向量。APSO算法程序設(shè)計(jì)流程圖如圖1所示。
圖1 APSO算法程序設(shè)計(jì)流程圖Fig.1 APSO algorithm program design flow chart
(12)
(1)算法測(cè)試數(shù)據(jù)
本文選取兩類數(shù)據(jù)作為目標(biāo)數(shù)據(jù)進(jìn)行算法性能測(cè)試,分別是模擬數(shù)據(jù)以及實(shí)測(cè)數(shù)據(jù)。第一類模擬數(shù)據(jù)是由兩個(gè)Voigt線型近似函數(shù)構(gòu)成的三種不同重疊程度的疊加合成曲線上的坐標(biāo)點(diǎn)作為三組模擬目標(biāo)數(shù)據(jù),x軸坐標(biāo)表征為目標(biāo)數(shù)據(jù)點(diǎn)的所在位置點(diǎn),y軸坐標(biāo)值表征為所在位置點(diǎn)的函數(shù)值,Voigt線型函數(shù)模擬數(shù)據(jù)1的目標(biāo)數(shù)據(jù)曲線兩峰幾乎不重疊,相互干擾很?。籚oigt線型函數(shù)模擬數(shù)據(jù)2的目標(biāo)數(shù)據(jù)曲線兩峰部分重疊,峰形發(fā)生變化,但兩峰中心位置清晰;Voigt線型函數(shù)模擬數(shù)據(jù)3的目標(biāo)數(shù)據(jù)曲線兩峰嚴(yán)重混疊難以分辨,兩峰變形同時(shí)峰中心位置移位,峰值大小也受到嚴(yán)重影響。
第二類實(shí)測(cè)數(shù)據(jù)是通過(guò)ICP-AES系統(tǒng)檢測(cè)含有Pr元素溶液的譜線,選擇Pr的特征波長(zhǎng)為390.844 nm;檢測(cè)汞燈譜線,選擇Hg的特征波長(zhǎng)為313.183 nm,ICP-AES檢測(cè)器返回的以上述兩條譜線所在位置點(diǎn)與光強(qiáng)AD采樣值的光譜數(shù)據(jù)點(diǎn)作為兩組實(shí)測(cè)目標(biāo)數(shù)據(jù),目標(biāo)數(shù)據(jù)點(diǎn)的波長(zhǎng)λk用對(duì)應(yīng)波長(zhǎng)所在位置點(diǎn)pos表示,所在位置點(diǎn)檢測(cè)到的光強(qiáng)AD采樣值即為該目標(biāo)數(shù)據(jù)點(diǎn)的Ik。實(shí)測(cè)數(shù)據(jù)與模擬數(shù)據(jù)均選擇了50個(gè)能夠包含曲線全部特征參數(shù)信息的點(diǎn)作為目標(biāo)數(shù)據(jù),通過(guò)APSO算法搜索最優(yōu)適應(yīng)度值,求解構(gòu)成擬合曲線的兩組Voigt線型近似函數(shù)待定參數(shù)和背景值。
(2)算法測(cè)試結(jié)果
兩類目標(biāo)數(shù)據(jù)經(jīng)過(guò)APSO算法計(jì)算得到的平均粒子最優(yōu)解以及平均相對(duì)誤差結(jié)果如表2所示,在相同坐標(biāo)下五組目標(biāo)數(shù)據(jù)點(diǎn)(λk,Ik)曲線與最優(yōu)粒子位置解作為多峰譜線疊加模型相關(guān)參數(shù)的擬合曲線圖如圖2—圖6所示。圖2—圖4中模擬數(shù)據(jù)的目標(biāo)數(shù)據(jù)曲線以及擬合數(shù)據(jù)曲線以所在位置點(diǎn)x為橫坐標(biāo),目標(biāo)數(shù)據(jù)和擬合曲線在所在位置點(diǎn)處的函數(shù)值y為縱坐標(biāo);圖5和圖6中實(shí)測(cè)數(shù)據(jù)的目標(biāo)數(shù)據(jù)曲線以及擬合數(shù)據(jù)曲線以所在位置點(diǎn)的波長(zhǎng)λ為橫坐標(biāo),目標(biāo)數(shù)據(jù)曲線以光強(qiáng)AD采樣值為縱坐標(biāo),擬合曲線以在λ下的pos求解函數(shù)值為縱坐標(biāo)。
表2 五組目標(biāo)數(shù)據(jù)APSO算法平均結(jié)果Table 2 The average results of five sets of target data APSO algorithm
圖2 Voigt線型函數(shù)模擬數(shù)據(jù)1曲線與擬合曲線Fig.2 Simulated data1 of Voigt linear function and fitting curve
圖3 Voigt線型函數(shù)模擬數(shù)據(jù)2曲線與擬合曲線Fig.3 Simulated data2 of Voigt linear function and fitting curve
圖4 Voigt線型函數(shù)模擬數(shù)據(jù)3曲線與擬合曲線Fig.4 Simulated data 3 of Voigt linear function and fitting curve
圖5 390.844 nm Pr元素實(shí)測(cè)數(shù)據(jù)與擬合曲線Fig.5 390.844 nm Pr element measured data and fitting curve
圖6 313.183 nm Hg元素實(shí)測(cè)數(shù)據(jù)與擬合曲線Fig.6 313.183 nm Hg element measured data and fitting curve
經(jīng)過(guò)五組測(cè)試數(shù)據(jù)結(jié)果表明,通過(guò)APSO算法得到的Voigt線型近似函數(shù)相關(guān)參數(shù)能夠較準(zhǔn)確地?cái)M合出目標(biāo)曲線,相對(duì)誤差較低,同組目標(biāo)數(shù)據(jù)下選擇最小的最優(yōu)適應(yīng)度值相應(yīng)的特征參數(shù)向量作為Voigt線型近似函數(shù)的相關(guān)參數(shù)擬合出的曲線精準(zhǔn)度越高,相對(duì)誤差越小??梢姡疚奶岢龅腁PSO算法具有較強(qiáng)的泛化能力,收斂速度快,逼近能力強(qiáng)。
針對(duì)ICP-AES光譜重疊干擾問題,以多峰譜線分離的數(shù)學(xué)原理作為理論依據(jù),提出用Voigt線型近似函數(shù)和背景值構(gòu)成的多峰譜線疊加模型擬合目標(biāo)曲線,以二者之間的均方根誤差構(gòu)造APSO算法適應(yīng)度函數(shù),設(shè)計(jì)APSO算法得到全局最優(yōu)粒子解作為分離曲線的特征參數(shù)向量。通過(guò)對(duì)實(shí)測(cè)目標(biāo)數(shù)據(jù)和模擬目標(biāo)數(shù)據(jù)的APSO算法處理,結(jié)果表明該算法具有較好的泛化能力,算法結(jié)果精確度較高,能夠成功實(shí)現(xiàn)元素光譜重疊譜線分離,可以有效應(yīng)用于ICP-AES在元素定性、定量方面的分析研究。但對(duì)于目標(biāo)數(shù)據(jù)由兩條譜線中心位置較近、譜線半峰寬較小的Voigt線型近似函數(shù)合成譜線的情況,需要進(jìn)行多次算法處理才能取得較為精準(zhǔn)的特征參數(shù)向量結(jié)果,算法有待完善。