江 晟,葉 新,劉妍秀,李開太,趙 鵬,李 野
(長春理工大學(xué) 物理學(xué)院,長春 130022)
隨著光譜科學(xué)研究的發(fā)展和光譜分析技術(shù)應(yīng)用領(lǐng)域的不斷擴(kuò)大,基于光譜信息的樣品成分分析技術(shù)的實(shí)際需求越來越大,物質(zhì)元素及含量檢測(cè)技術(shù)的快捷性和準(zhǔn)確性成為兩個(gè)關(guān)鍵因素[1].X射線熒光光譜由于具有快速、無損、精確等優(yōu)點(diǎn)被廣泛應(yīng)用于土壤元素探測(cè)領(lǐng)域[2].但土壤中元素眾多,基底效應(yīng)和背景對(duì)元素的檢出精度存在極大影響,針對(duì)能量色散型X射線熒光(EDXRF)能譜背景估算的研究目前已取得了很多成果[3].劉中平等[4]利用蒙特卡洛(Monte Carlo,MC)模擬構(gòu)建本底實(shí)測(cè)譜線,并借此對(duì)多種傳統(tǒng)連續(xù)本底估算方法進(jìn)行了對(duì)比分析,結(jié)果表明,自適應(yīng)迭代重加權(quán)懲罰最小二乘(airPLS)算法的本底估算效果較好,但這種本底估算方法受背景實(shí)際值的設(shè)定影響,存在精確度不穩(wěn)定的問題; 陳偉等[5]利用多次高斯平滑對(duì)X射線熒光能譜進(jìn)行處理,并基于此模擬出本底背景,這種方法改善了濾波效果不佳對(duì)后續(xù)數(shù)據(jù)分析帶來的不利影響,但僅適用于高背景下的單能峰核素信息提取場(chǎng)合,該方法存在適用性較差的問題.針對(duì)上述問題,本文提出一種基于改進(jìn)徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡(luò)模型的土壤背景估計(jì)算法,解決了背景估計(jì)方法參數(shù)確定后適應(yīng)性差的問題,減少了由于增加實(shí)驗(yàn)環(huán)節(jié)帶來的誤差影響,提高了背景估計(jì)算法的有效性和準(zhǔn)確性,能夠快速簡便地進(jìn)行背景估計(jì).
剝峰法是基于譜中變化迅速的特征通過比較與其附近道址信息的一種方法,其顯著優(yōu)點(diǎn)是不使用精確的數(shù)學(xué)模型,避免了采用不同數(shù)學(xué)模型而導(dǎo)致的誤差[6].其核心是通過比較與其相鄰兩個(gè)道址的平均值大小進(jìn)行處理,具體方法: 通過比較各道址與其相鄰兩個(gè)道址的平均值大小,如果該道址的計(jì)數(shù)值大于其相鄰兩個(gè)道址的平均值,則將該道址內(nèi)容替換為平均值,在所有道址上依次運(yùn)算一遍,峰位處的幅度降低,其他位置保持不變,經(jīng)過多次循環(huán)后,剝離收斂留下光滑的譜數(shù)據(jù),該光滑譜數(shù)據(jù)可視為原始譜信號(hào)的背景估計(jì)值.利用剝峰法估計(jì)背景,循環(huán)次數(shù)對(duì)估計(jì)背景的有效性和精確性影響極大,不同譜線循環(huán)的次數(shù)取決于峰寬,選擇合適的循環(huán)次數(shù)有利于提高估計(jì)背景的有效性和精確性.
小波分析是一種局部分析工具,這種局部特性使小波分析適合于信號(hào)的時(shí)間-頻率分析,而X射線光譜可視為是自變量為頻率和時(shí)間的函數(shù),使得對(duì)EDXRF光譜進(jìn)行多分辨分析成為可能.
圖1 3層多分辨率分析樹結(jié)構(gòu)Fig.1 Structure of three-layer multi-resolution analysis tree
圖1為三層多分辨率分析樹的結(jié)構(gòu).由圖1可見,小波變換的多分辨率分析只對(duì)低頻部分進(jìn)行進(jìn)一步的分解,而高頻部分則不予考慮,則有S=A3+D3+D2+D1,其中A表示低頻近似部分,D表示高頻細(xì)節(jié)部分.
在EDXRF譜線中背景對(duì)應(yīng)頻率較低的部分,而真實(shí)的譜線頻率較高,因此小波變換將分析信號(hào)分解為不同頻率范圍內(nèi)信號(hào)分量的特性,與X熒光譜線不同成分的頻率特征相適應(yīng),為小波變換用于X熒光譜線的背景扣除提供了理論基礎(chǔ).對(duì)X射線熒光譜線進(jìn)行多分辨率分析,實(shí)際上就是對(duì)譜峰不斷剝離的過程,當(dāng)分解到一定尺度水平上時(shí),剩余的即為一些頻率較低的信號(hào)分量,可認(rèn)為是X熒光譜線的背景.因此,用小波變換的方法剝?nèi)ジ哳l信號(hào)分量扣除X射線熒光譜線的背景可行[7].
但在實(shí)際扣除EDXRF譜線背景的應(yīng)用中,還會(huì)面臨以下問題: 小波基的選取要保證經(jīng)過小波變換處理后獲得的X射線能譜曲線不失真,且不允許發(fā)生峰值位移和峰的形狀改變; 考慮緊支撐與支撐寬度,要盡可能使變換后得到的數(shù)據(jù)更簡便; 同時(shí)在小波變換扣除背景的過程中,要多次抽取不同尺度的近似部分或細(xì)節(jié)部分用來逼近背景,因此,分解尺度和抽取哪一個(gè)尺度的近似部分或細(xì)節(jié)部分是關(guān)鍵.
圖2 RBF神經(jīng)網(wǎng)絡(luò)模型算法結(jié)構(gòu)Fig.2 Sructure of RBF neural network model algorithm
誤差反饋(BP)神經(jīng)網(wǎng)絡(luò)是一種按誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),具有信息前向傳遞、誤差反向傳遞的特點(diǎn),是目前最常用的神經(jīng)網(wǎng)絡(luò)之一[8].將BP神經(jīng)網(wǎng)絡(luò)應(yīng)用于EDXRF技術(shù)中的優(yōu)勢(shì)在于可有效避免實(shí)驗(yàn)校正法需制備大量標(biāo)樣和數(shù)學(xué)校正法計(jì)算復(fù)雜且依賴待測(cè)樣品與標(biāo)樣種類的相似性等問題,優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型應(yīng)用于EDXRF銅、鋅元素含量預(yù)測(cè)的研究中具有良好的有效性和適應(yīng)性[9].RBF神經(jīng)網(wǎng)絡(luò)是在BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上發(fā)展而來的,RBF神經(jīng)網(wǎng)絡(luò)對(duì)神經(jīng)元和訓(xùn)練方式給出了限定,采用3層前向網(wǎng)絡(luò),由于輸入層空間到輸出層空間是一個(gè)非線性映射,而隱含層空間到輸出層空間是一個(gè)線性映射,因此使得系統(tǒng)自我學(xué)習(xí)速度大幅度提高,并能有效防止出現(xiàn)局部極小值問題[10].RBF神經(jīng)網(wǎng)絡(luò)可對(duì)任意非線性函數(shù)進(jìn)行逼近,具有非線性映射能力強(qiáng)、運(yùn)算速度快等優(yōu)點(diǎn),目前已廣泛應(yīng)用于多個(gè)領(lǐng)域.RBF神經(jīng)網(wǎng)絡(luò)模型由輸入層、徑向基函數(shù)層及線性輸出層組成,其算法結(jié)構(gòu)如圖2所示.
由RBF構(gòu)成的隱含層空間,可將輸入矢量直接映射到隱含層空間,不需要通過權(quán)連接,因此輸入層與隱含層之間的連接權(quán)值均為1.隱含層實(shí)現(xiàn)對(duì)輸入向量的非線性投影,而輸出層則負(fù)責(zé)最后的線性加權(quán)求和[11].隱含層中神經(jīng)元的變換函數(shù)采用徑向基函數(shù),徑向基函數(shù)是一個(gè)取值僅依賴于距定點(diǎn)距離的實(shí)值函數(shù),常用的徑向基函數(shù)是高斯核函數(shù),表達(dá)式為
(1)
其中φ(xi-cj)為徑向基函數(shù),‖xi-cj‖為樣本xi到中心點(diǎn)cj的歐氏距離,cj為第j個(gè)神經(jīng)元的核函數(shù)中心點(diǎn),σj為高斯核的寬度參數(shù),用于控制函數(shù)的徑向作用范圍.
RBF神經(jīng)網(wǎng)絡(luò)的輸出為
(2)
其中yi表示神經(jīng)網(wǎng)絡(luò)的輸出,xi表示第i個(gè)輸入樣本,cj表示第j個(gè)中心點(diǎn),σj表示函數(shù)第j個(gè)中心點(diǎn)的寬度參數(shù),m表示隱含層的節(jié)點(diǎn)數(shù),n表示輸出的樣本數(shù)或分類數(shù),wj表示第j個(gè)神經(jīng)元的權(quán)重,將RBF層神經(jīng)元與輸出層的連接權(quán)陣定為w,表示為
w=(w1,w2,…,wj,…,wm)T.
(3)
利用RBF神經(jīng)網(wǎng)絡(luò)模型進(jìn)行擬合估計(jì)的核心是對(duì)參數(shù)的訓(xùn)練,即對(duì)核函數(shù)中心點(diǎn)cj、高斯核的寬度參數(shù)σj和RBF層神經(jīng)元與輸出層的連接權(quán)陣w進(jìn)行訓(xùn)練.
RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行背景擬合的精度及穩(wěn)定性由相關(guān)參數(shù)因子決定,確定相關(guān)參數(shù)因子的方法是建立損失函數(shù),并利用梯度下降法和粒子數(shù)尋優(yōu)法等算法進(jìn)行訓(xùn)練尋優(yōu).用RBF神經(jīng)網(wǎng)絡(luò)進(jìn)行土壤背景估計(jì)時(shí),為最小化誤差函數(shù),傳統(tǒng)損失函數(shù)的構(gòu)建是基于均方誤差的計(jì)算方法,對(duì)土壤的真實(shí)背景信號(hào)進(jìn)行擬合逼近,其損失函數(shù)為
(4)
其中y為RBF神經(jīng)網(wǎng)絡(luò)的輸出,g(x)為擬合的真實(shí)值函數(shù),即土壤EDXRF檢測(cè)的真實(shí)背景.
土壤真實(shí)背景數(shù)據(jù)的獲取一般可采用空白實(shí)驗(yàn)法,即將SiO2粉末作為樣品模擬真實(shí)土壤,進(jìn)行EDXRF探測(cè),先將多次測(cè)量的能譜結(jié)果取平均值,再將該平均值作為真實(shí)背景的估計(jì)值,但由于SiO2粉末無法完全模擬出土壤基體效應(yīng)及土壤中各元素特征峰間的干擾,因此用空白實(shí)驗(yàn)法得到的背景估計(jì)值和真實(shí)背景的差別較大,導(dǎo)致利用傳統(tǒng)損失函數(shù)模型所估計(jì)的背景可靠性較低,對(duì)土壤元素進(jìn)行定量分析的誤差較大.
研究表明,各元素的各系特征峰的熒光強(qiáng)度分布是確定的[12],通常情況下,在特征譜中,Kα1系、Kα2系、Kβ系的熒光強(qiáng)度分布關(guān)系如下:
IKα1∶IKα2∶IKβ=100∶50∶13.8,
(5)
其中IKα1,IKα2,IKβ分別表示在特征譜中Kα1系、Kα2系、Kβ系的熒光強(qiáng)度.
理論上元素發(fā)出的特征X射線譜是一能量值確定的線狀譜,由于能級(jí)本身存在一定寬度和探測(cè)器分辨率有限等因素的影響,使得元素的特征譜成為具有一定寬度的類高斯分布的譜峰,且對(duì)于絕大部分元素,Kα1和Kα2的特征峰的譜線位置特別接近,從而導(dǎo)致Kα1和Kα2的特征峰重疊為一個(gè)類高斯分布的譜峰,對(duì)應(yīng)的熒光強(qiáng)度進(jìn)行疊加,所以各元素的Kα和Kβ系熒光強(qiáng)度分布滿足如下關(guān)系:
IKα∶IKβ=150∶13.8≈10.87,
(6)
其中IKα,IKβ分別表示在特征譜中Kα,Kβ系的熒光強(qiáng)度.
在計(jì)算某個(gè)元素的熒光強(qiáng)度時(shí),通常對(duì)元素特征峰進(jìn)行高斯擬合,將擬合后的譜峰面積作為該特征峰的熒光強(qiáng)度[13],或者計(jì)算特征峰所在探測(cè)器道址及半峰寬內(nèi)道址的計(jì)數(shù)值累加值作為該特征峰的熒光強(qiáng)度,二者的計(jì)算結(jié)果近似,用公式表示為
(7)
其中:I為熒光強(qiáng)度;a,b,c為特征峰高斯擬合的相關(guān)參數(shù);z為相應(yīng)元素z的特征峰峰值所在的道址;d為相應(yīng)元素特征峰的半峰寬.
基于上述思想及式(6)和式(7),原始譜線和背景信號(hào)應(yīng)滿足以下關(guān)系:
(8)
其中f(x)為原始譜線,y為背景信號(hào),zα為相應(yīng)元素z的Kα1和Kα2系特征峰重疊峰峰值所在的道址,dα為相應(yīng)元素z的Kα1和Kα2系特征峰重疊峰的半峰寬,zβ為相應(yīng)元素z的Kβ系特征峰重疊峰峰值所在的道址,dβ為相應(yīng)元素z的Kβ系特征峰重疊峰的半峰寬,K=10.87.
基于式(2)和式(8),建立新的損失函數(shù)模型為
(9)
由于土壤中各元素間存在重峰的問題,因此選擇合適的元素特征峰位置,可規(guī)避重峰的影響,并將選取的元素作為高斯核函數(shù),基于式(9)的損失函數(shù)模型進(jìn)行訓(xùn)練.
實(shí)驗(yàn)選取銠靶作為射線源,電壓為40 kV,電流為100 μA,分別對(duì)國家標(biāo)準(zhǔn)土壤樣品GSS-4,GSS-5,GSS-17,GSS-20,GSS-23進(jìn)行EDXRF檢測(cè),并分別利用剝峰法、小波變換法和基于RBF神經(jīng)網(wǎng)絡(luò)模型背景估計(jì)算法對(duì)譜線進(jìn)行背景擬合及扣除,然后建立Cr,Zn,As等元素的擬合曲線,用擬合系數(shù)R2衡量判斷模型估計(jì)背景的能力和效果.
圖3 不同背景估計(jì)及扣除方法對(duì)比Fig.3 Comparison of different background estimation and deduction methods
圖3為針對(duì)GSS-17采用不同背景估計(jì)及扣除方法的對(duì)比結(jié)果,其中: (A)為針對(duì)GSS-17的剝峰法背景估計(jì)及扣除效果; (B)為針對(duì)GSS-17的小波變換法背景估計(jì)及扣除效果; (C)為針對(duì)GSS-17的基于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)模型背景估計(jì)及扣除效果.利用本文算法扣除背景后可進(jìn)行擬合,擬合效果如圖4所示.
圖4 本文方法提取的Cr,Zn,As數(shù)據(jù)分布及擬合效果Fig.4 Distribution and fitting effect of Cr,Zn and As data extracted by proposed method
由圖4可見,本文擬合效果較好,能很好地為定量分析提供支持.將本文算法與其他方法進(jìn)行對(duì)比,表1列出了不同背景估計(jì)方法及對(duì)應(yīng)土壤元素的特征峰面積及其擬合效果.
表1 不同背景估計(jì)方法及對(duì)應(yīng)土壤元素的特征峰面積
由表1可見: 利用剝峰法對(duì)土壤樣品進(jìn)行背景估計(jì)定量擬合的相關(guān)系數(shù)為Cr: 0.951 4,Zn: 0.976 6,As: 0.990 3; 利用小波變換法對(duì)土壤樣品進(jìn)行背景估計(jì)定量擬合的相關(guān)系數(shù)為Cr: 0.952 0,Zn: 0.986 9,As: 0.990 8; 利用基于RBF神經(jīng)網(wǎng)絡(luò)模型的土壤背景估計(jì)算法定量擬合的相關(guān)系數(shù)為Cr: 0.994 4,Zn: 0.999 7,As: 0.998 3.結(jié)果表明,基于改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)模型的土壤背景估計(jì)算法相比于剝峰法和小波變換法,能更好地反應(yīng)土壤元素?zé)晒鈴?qiáng)度與元素含量的關(guān)系,提升了土壤探測(cè)的精度和穩(wěn)定性[14-15].相比于傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò),改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)不需要利用空白實(shí)驗(yàn)測(cè)量背景的估計(jì)值,從而減小了實(shí)驗(yàn)誤差,能快速簡便地進(jìn)行背景估計(jì).