劉浩森,楊再榮,麻仲愷
(1.西安石油大學化學化工學院,陜西 西安 710065;2.中國石油天然氣股份有限公司大港石化分公司,天津300280)
隨著社會的發(fā)展和人口數量的持續(xù)增長,人們對各類資源的需求不斷提高。我國是一個農業(yè)大國,對鉀肥的需求更是有增無減,但我國的鉀資源有限,儲量僅占世界的2.36%[1-3],所以我國將鉀鹽礦的開采作為民生重點項目,必須實行高效綠色的開采。
在鉀鹽的開采過程中,鉀含量的測定非常重要,直接決定礦區(qū)鉀鹽的等級以及開發(fā)的必要性。目前鉀的常用測定方法有火焰光度法、四苯硼鉀重量法、四苯硼鈉-季銨鹽容量法、四苯硼鈉溶液電導滴定法、原子吸收光譜法和電感耦合等離子體發(fā)射光譜法。這6種方法[4-6]的測試條件以及鉀鹽含量的適用范圍,都不能滿足鉀鹽礦床所要求的快速準確便捷檢測。激光誘導擊穿光譜法(laser induced breakdown spectroscopy,LIBS)是基于原子發(fā)射光譜法(atomic emission spectroscopy,AES)的一種新的材料和元素分析技術[7],該技術可以使用光譜線的波長和強度來執(zhí)行LIBS技術的定性和定量分析。LIBS光譜技術不需要復雜的樣品制備,能夠實現(xiàn)快速、實時、現(xiàn)場、無損和遠程檢測,并可以進行多組分分析,因此已廣泛應用于食品監(jiān)督、環(huán)境監(jiān)測、文物鑒定、太空探索等領域[8-9]。
目前可以應用于鉀鹽礦LIBS光譜定量分析的算法主要有偏最小二乘(PLS)、支持向量機(SVM)、隨機森林(RF)等,可以提高校正的準確度及精度。支持向量機對校正集的要求較高,預測性能差[10];隨機森林作為一種非線性數據處理算法,準確率高,不易出現(xiàn)過度擬合的情況,也有很好的抗噪能力,但是對數據數量的要求較高,建模及處理時間較長[11];偏最小二乘作為經典的多元數據統(tǒng)計分析方法,有著很好的噪聲過濾能力,同時有著較強的穩(wěn)定性。在進行LIBS數據處理時,需要對原始LIBS光譜進行預處理,以減少光譜采集中的環(huán)境噪聲、儀器噪聲以及實驗誤差帶來的干擾。搭配定量分析算法常用的預處理方法有標準正態(tài)變換(SNV)、多元散射校正(MSC)、小波變換(WT)等。
本文基于LIBS光譜結合PLS法,對青海湖鉀鹽礦中鉀含量的快速定量分析方法進行研究。采用便攜式LIBS光譜儀,對30個鉀鹽樣品進行LIBS光譜采集,探究不同的光譜預處理方法對PLS模型預測性能的影響[12]。將30個樣品按2∶1的比例,隨機分為校正集和預測集,然后構建原始PLS模型,采用五折交叉驗證法對模型的潛變量數目進行優(yōu)化,最后采用特征波段提取法,對鉀元素的特征光譜數據進行提取,以構成新的輸入變量。
本實驗共計30個鉀鹽樣品,均采自青海省鹽湖。原始樣品的主要成分均為氯化鉀,鉀的含量在47%~50%之間。為了減少實驗誤差,提高模型的準確度,添加了氯化鈉和氯化鉀以擴大鉀的濃度范圍。原始樣品中存在水分,會對光譜采集產生影響,為了提高光譜數據的質量,將所有樣品在60℃下干燥6h,然后研磨碾碎。每個樣品稱取2g,用壓片機在20MPa的壓力下制成φ20mm×1.5mm的薄片,用于采集LIBS光譜數據。同時將30個樣品配置成溶液,用原子發(fā)射光譜儀(ICP)測定鉀元素含量,表1為30個樣品的鉀元素含量結果。
表1 鉀鹽礦樣品中的鉀含量Table 1 Contents of potassium in potash mine samples
采用臺式激光誘導擊穿光譜儀(LIBS-Tracer-10),設置脈沖能量為100mJ,持續(xù)時間為8ns,檢測環(huán)境溫度為16℃。每個樣品隨機選擇20個不同的位置進行LIBS數據收集,為確保實驗的可靠性以及最小化樣品的異質性,每個收集點重復10個激光脈沖,取平均值,30個樣品共獲得600條光譜。
首先輸入原始光譜數據,建立初始PLS模型,研究原始數據所建立的模型的預測性能。探究了3種光譜預處理方法即一階求導、歸一化及小波變換,對鉀鹽LIBS光譜的預處理效果。比較了3種不同預處理方法的結果,結果顯示小波變換結合PLS的預測效果更好一些。小波變換的原理是將光譜信號分解成一系列的小波函數疊加,由單個母小波函數通過平移和尺度伸縮而獲得小波函數,實質是將光譜信號投影到小波函數族上。小波系數的處理因分析需求而異,對小波系數進行反變換后得到最終的處理信號。當選擇不同的小波函數對同一個問題進行分析時,結果會全然不同,因此,目前只能通過不斷的嘗試和經驗法對比去分析結果,以選擇出最優(yōu)的小波函數[13-14]。
圖1為鉀鹽樣品的LIBS光譜圖,鉀元素的光譜特征峰主要在404.41nm、766.48nm和769.89nm波段,對照光譜圖可知鉀元素的特征峰較明顯。
圖1 鉀元素的LIBS光譜圖Fig. 1 LIBS of Potassic Salt
30個樣品按照濃度范圍依次排序,間隔選出20個樣品作為訓練集,剩余10個樣品作為測試集,測試集樣品的濃度范圍在訓練集之間。先對原始光譜數據建模的表現(xiàn)性能進行預測,沒有經過預處理的數據所構建的模型,五折交叉驗證的R2為0.7856,RMSE為0.1546,MRE為0.2530。
分別采用一階導數、歸一化及小波變換的預處理方法對光譜數據進行預處理。使用一階導數,探究了不同的平滑點數(3、5、7等)對LIBS光譜的預處理效果,結果表明,平滑點數為11時模型的預測性能最好。小波變換在不同的小波基函數和分解層數進行自由組合,結果表明,小波基函數為4、分解層數為6時的預測效果最好。交叉驗證數據如表2所示。
表2 不同光譜預處理方法的PLS模型預測性能比較Table 2 Comparison of performance of PLS calibration models based on different spectral pretreatment methods
對預處理后的光譜數據進行建模優(yōu)化,對PLS變量性閾值進行優(yōu)化。PLS模型的閾值過高或者過低,則會產生過擬合或欠擬合的現(xiàn)象,對模型的預測性能有著極大的影響。五折交叉驗證優(yōu)化結果顯示,LVs為4時模型的預測性能最好,此時R2cv為0.9022,RMSEcv為0.1723。
考慮到該實驗僅對鉀元素進行探究,所以對原始LIBS光譜數據進行了鉀元素特征波段提取。提取后的光譜數據數量大幅減少,每個樣品有58個數據點,再對每個樣品的20個提取數據進行驗證并平均。圖2為單個樣品的20個光譜數據點的平均相對誤差,對與平均數據的相對誤差超過20%的點進行剔除,之后再進行平均,圖3為提取并平均之后的特征波段譜圖。
圖2 單個樣品的20個光譜數據點的平均相對誤差Fig. 2 Average relative error of 20 spectral data points of a single sample
圖3 平均之后30個樣品的特征波段譜圖Fig. 3 Characteristic band spectra of 30 samples after averaging
得到30條不同濃度鉀鹽樣品的特征波段光譜數據后,仍然按照2∶1的比例將數據分為訓練集和測試測集,輸入優(yōu)化后的變量,最終的預測結果和實際含量如圖4所示。
圖4 鉀元素預測含量對比圖Fig. 4 Comparison chart of predicted potassium content
本文建立了一種基于LIBS光譜技術結合PLS模型,對鉀鹽礦中的鉀元素進行快速準確定量分析的方法。采用3種不同的預處理方法對30個鉀鹽樣品的光譜數據進行預處理,通過交叉驗證選擇最優(yōu)方法,對PLS模型的LVs參數進行優(yōu)化,最后在該模型下對輸入變量進行優(yōu)化選擇,對鉀元素的特征變量進行波段提取,作為最終輸入變量進行預測。最終結果顯示,該模型的R2p從原始光譜的0.7856提升到0.9575,RMSEp從0.2176降低到0.1546,MRE從0.2530降低到0.1632。研究結果表明,基于LIBS技術結合偏最小二乘法,是一種可用于鉀鹽礦成分快速準確分析的方法,可為鉀鹽礦開采過程中鉀元素的定量分析提供一種新思路、新方法。