李奇辰, 李民贊*, 楊 瑋, 孫 紅, 張 瑤
1. 中國農(nóng)業(yè)大學(xué)煙臺研究院, 山東 煙臺 264003 2. 中國農(nóng)業(yè)大學(xué)智慧農(nóng)業(yè)系統(tǒng)集成研究教育部重點(diǎn)實(shí)驗(yàn)室, 北京 100083 3. 中國農(nóng)業(yè)大學(xué)農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)信息獲取技術(shù)重點(diǎn)實(shí)驗(yàn)室, 北京 100083
土壤磷素是植物最重要的養(yǎng)分之一。 土壤中施入磷肥以后, 絕大部分被固定于土壤中, 成為植物難以吸收利用的形態(tài)[1]。 水溶性磷素是植物可以直接利用的養(yǎng)分形態(tài), 決定著土壤養(yǎng)分的供給能力。 過量施用磷肥會導(dǎo)致土壤微量元素養(yǎng)分流失, 以及環(huán)境污染等問題。 因此, 開發(fā)土壤磷素的快速檢測技術(shù), 從而優(yōu)化施肥方法很有意義[2]。 傳統(tǒng)實(shí)驗(yàn)室化學(xué)試劑提取方法不僅耗時費(fèi)力、 而且難以提供準(zhǔn)確的土壤磷素的形態(tài)信息。 基于光譜學(xué)技術(shù)的土壤速測方法為土壤磷素快速檢測提供了新的可能性。 一些研究探索證明, 利用可見光-近紅外光譜分析技術(shù)可以快速檢測土壤磷素含量[3-4]。 然而, 由于磷素在土壤中形態(tài)復(fù)雜, 在可見光-近紅外范圍沒有明顯的吸收波段, 以往基于可見光-近紅外光譜的土壤磷素快速檢測一般是通過間接預(yù)測的方式[5-6], 使得檢測結(jié)果缺乏重現(xiàn)性。
由于拉曼光譜選擇性好、 受到土壤水分、 粒度等基質(zhì)特性影響小的特點(diǎn), 在土壤成分的速測技術(shù)中具有優(yōu)勢。 并且, 拉曼光譜與紅外吸收光譜有互補(bǔ)特性, 在土壤成分的定量分析中有望增強(qiáng)模型的穩(wěn)定性及預(yù)測精度。 但是, 拉曼光譜存在信號強(qiáng)度弱、 受熒光干擾強(qiáng)等問題, 限制了拉曼光譜在土壤成分檢測中的應(yīng)用。 如何揚(yáng)長避短成為利用拉曼光譜檢測土壤成分的研究熱點(diǎn)。 近年來, 隨著激光半導(dǎo)體技術(shù)、 共焦顯微拉曼技術(shù)、 以及表面增強(qiáng)拉曼技術(shù)的發(fā)展, 為提升拉曼信號的穩(wěn)定性、 信噪比提供了技術(shù)保障。 在土壤成分的速測技術(shù)中, 國內(nèi)外很多學(xué)者都嘗試了應(yīng)用拉曼光譜對土壤成分的定性與定量分析[7-10]。
在土壤磷素的檢測中, Lanfranco等測試了拉曼光譜對土壤中混合金屬磷酸鹽的識別能力。 結(jié)果表明, 拉曼光譜是識別土壤中不同磷酸鹽形態(tài)的極其有效的工具, 較傳統(tǒng)檢測方法具有較低的檢測限。 但是, 作者在檢測中遭遇了熒光干擾等問題, 為有效拉曼信號獲取帶來一定困難[11]。 Nkebiwe等應(yīng)用人工土、 自然土、 以及農(nóng)田土三種土壤作為基底, 測試了共焦拉曼顯微光譜對土壤中添加三種磷酸鈣的識別能力。 發(fā)現(xiàn)共焦顯微拉曼技術(shù)可以對土壤中不同形態(tài)磷酸鹽進(jìn)行精確識別及定位[12]。 在土壤磷素含量的快速檢測中, Bogrekci與Lee開發(fā)了一種便攜式的基于拉曼光譜技術(shù)的土壤磷素檢測儀。 應(yīng)用該檢測儀測試土壤磷素的預(yù)測能力, 建立基于偏最小二乘法(PLSR)預(yù)測模型決定系數(shù)R2達(dá)到了0.98[13]。 Zheng等使用磷酸鈣[Ca3(PO4)2]、 磷酸鐵(FePO4·2H2O)、 磷酸鎂[Mg3(PO4)2·2H2O]、 以及磷酸鋁(AlPO4)配制了不同磷素濃度的土壤來測試?yán)庾V對土壤中磷素定量分析的效果。 采用了小波包分解方法濾除背景噪聲, 應(yīng)用分解后拉曼光譜建立PLSR預(yù)測模型決定系數(shù)(R2)為0.94[14]。
綜上可知拉曼光譜在土壤磷素的定性分析中具有較強(qiáng)的優(yōu)勢, 在定量分析中也具有很大潛力。 然而, PLSR模型具有模糊性, 為減少冗余變量, 提升預(yù)測模型的可重復(fù)性或重現(xiàn)性, 需進(jìn)一步弄清拉曼光譜與磷酸根濃度的定量關(guān)系。 本文以水溶性磷為研究對象, 分析了水溶性磷濃度對拉曼光譜的影響, 建立了二者之間的定量關(guān)系模型。
采用磷酸二氫鉀試劑KH2PO4(AR分析純, 西隴科學(xué)化工)作為測試樣品, 分別配制了低濃度區(qū)間(0.02~5 g·L-1)與高濃度區(qū)間(5.21~93.87 g·L-1)的KH2PO4溶液。 低濃度區(qū)間根據(jù)土壤肥際微域中磷含量濃度進(jìn)行配制[1]; 高濃度區(qū)間從KH2PO4室溫飽和度到低濃度區(qū)的最高值之間進(jìn)行配制。 各個區(qū)間配制濃度如表1所示。 以下為各濃度區(qū)間溶液的配制方法:
表1 KH2PO4樣本溶液配制Table 1 Preparation of KH2PO4 sample solutions
(1) 低濃度區(qū)間KH2PO4溶液配制
選取KH2PO4試劑在110 ℃烘干2 h, 在烘干爐里冷卻至室溫, 稱取4.793 9 g, 放入燒杯用水溶解, 轉(zhuǎn)移到500 mL容量瓶, 加去離子水稀釋至標(biāo)線。 此時配制的溶液濃度為5 g·L-1(P2O5計(jì))的標(biāo)準(zhǔn)液。 準(zhǔn)確移取0.40、 1.00、 2.00、 4.00、 8.00、 16.00和32.00 mL于100 mL容量瓶中, 加去離子水稀釋至刻度, 搖勻。 此時配制成濃度分別為0.02、 0.05、 0.1、 0.2、 0.4、 0.8和1.6 g·L-1的使用溶液(P2O5計(jì))。
(2) 高濃度區(qū)間KH2PO4溶液配制
選取KH2PO4試劑在110 ℃烘干2 h, 在烘干爐里冷卻至室溫, 稱取1、 5、 8、 10、 12、 15和18 g KH2PO4試劑, 分別加入100 mL去離子水充分混合。 此時配制濃度分別為5.21、 26.07、 41.72、 52.15、 62.58、 78.22和93.87 g·L-1的使用溶液(P2O5計(jì))。
實(shí)驗(yàn)設(shè)備采用實(shí)驗(yàn)室用拉曼光譜儀(LRS-2/3, 天津港東科技有限公司)。 該儀器由外光路系統(tǒng)、 單色儀、 數(shù)據(jù)展示端組成。 采用波長為532 nm、 功率40 mW激光器作為激發(fā)光源。 激光束從下向上垂直射入液體樣品管, 激發(fā)散射光由物鏡組匯集到單色儀分光, 掃描范圍200~800 nm, 分辨率0.1 nm。 檢測器為單光子計(jì)數(shù)形式, 將檢測到的光強(qiáng)在軟件界面按波長順序逐一顯示。 在檢測樣本以前以四氯化碳標(biāo)準(zhǔn)溶液為參照, 首先對光強(qiáng)、 波峰位置進(jìn)行調(diào)整。 通過調(diào)節(jié)聚光透鏡的相對位置、 以及單色儀狹縫寬度, 確保數(shù)據(jù)顯示界面可觀測到清晰的拉曼散射特征峰。 由于拉曼信號強(qiáng)度微弱, 采集拉曼光譜時使用遮光布覆蓋儀器, 屏蔽外界光的干擾。
表2 磷酸根離子的拉曼頻移Table 2 Raman shifts of phosphorus bonds
由以往實(shí)驗(yàn)及群論方法推測, 可知在411和466 cm-1附近也可能存在磷素的拉曼波峰[14-15]。 同時, 研究也表明2 000 cm-1以上H鍵相關(guān)振動對模型預(yù)測干擾較大[14]。 并且, 考慮瑞利峰干擾以及單波長掃描的檢測方式比較費(fèi)時, 本實(shí)驗(yàn)選擇掃描范圍是544~600 nm(拉曼頻移401~2 130 cm-1), 分辨率0.1 nm, 積分時間150 ms。 每個樣品采集5次, 取均值作為樣本代表。 由于激光對樣本有損傷, 發(fā)現(xiàn)異常光譜時則更換樣本重新檢測。
首先對每個光譜進(jìn)行5點(diǎn)移動平均(MA)處理, 之后分別采用基線校正(BL)、 標(biāo)準(zhǔn)正態(tài)變量(SNV)變換, 多元散射校正(MSC)來去除基線漂移。 采用偏最小二乘回歸(PLSR)建模, 交叉驗(yàn)證法(CV)確定PLSR因子數(shù)(nF), 避免模型過擬合。 采用PLSR模型回歸系數(shù)確認(rèn)特征峰位置, 選取特征峰作為獨(dú)立變量應(yīng)用多元線性回歸(MLR)建模。 光譜預(yù)處理及建模采用軟件The Unscrambler X(version 10.5, CAMO software AS, Norway)執(zhí)行。
圖1(a)為MA處理后的低濃度區(qū)間KH2PO4的拉曼光譜數(shù)據(jù)。 在低濃度區(qū)間, 不同濃度展現(xiàn)為光譜基線的變動。 0.4 g·L-1濃度以下的光譜數(shù)據(jù)沒有明顯變動, 從0.4 g·L-1開始可以觀測到明顯的基線上升趨勢, 但是未能辨認(rèn)出拉曼波峰。 圖1(b)為經(jīng)過MA+MSC處理后的高濃度區(qū)間KH2PO4的拉曼光譜數(shù)據(jù)。 如圖1(b)所示, MSC可以濾除雜散光帶來的基線漂移。 5.21 g·L-1的光譜沒有觀測到明顯的拉曼波峰, 從26.07 g·L-1開始可以觀測到兩處明顯的拉曼特征峰, 分別位于拉曼頻移863與1 070 cm-1。 由過往文獻(xiàn)可知這兩處波峰為磷酸根離子的伸縮振動引起[16]。 并且這兩處波峰的峰高隨著溶液濃度的增加有增強(qiáng)的趨勢。
圖1 (a)低濃度區(qū)間KH2PO4拉曼光譜; (b)MSC濾波后的高濃度區(qū)間KH2PO4拉曼光譜Fig.1 (a) Raman spectrum of KH2PO4 in low concentration range (0.02~5 g·L-1); (b) MSC filtered Raman spectrum of KH2PO4 in high concentration range
制約拉曼光譜在定量分析中推廣應(yīng)用的主要因素之一是信號弱。 熒光信號通常會淹沒強(qiáng)度較弱的拉曼信號, 為拉曼光譜的譜學(xué)分析帶來困難。 熒光以及背景光對拉曼信號的干擾通常反映在光譜基線的變動上。 為進(jìn)一步研究影響拉曼譜線變動的原因, 本文統(tǒng)計(jì)了每個樣本5次重復(fù)檢測獲取的拉曼光譜的變異系數(shù), 對每個波長算得的變異系數(shù)求均值作為該樣本的代表, 來反映熒光等背景光干擾的強(qiáng)弱。 圖2比較了低濃度區(qū)間與高濃度區(qū)間變異系數(shù)的離散特征。 如圖2所示, 高濃度區(qū)間變異系數(shù)的離散程度較大, 變化范圍在0.08~0.30之間。 中位數(shù)、 下四分位數(shù)、 上四分位數(shù)分別為0.15、 0.13、 0.23。 低濃度區(qū)間變異系數(shù)的離散程度較小, 變化范圍在0.03~0.1之間。 中位數(shù)、 下四分位數(shù)、 上四分位數(shù)分別為0.07、 0.05、 0.1。
圖2 低濃度與高濃度區(qū)間單一樣本5次重復(fù)檢測的變異系數(shù)Fig.2 Coefficient of variation of five repetitions in the low and high concentratioos
結(jié)果說明樣本濃度對拉曼信號穩(wěn)定性影響較大, 低濃度區(qū)間與高濃度區(qū)間變異系數(shù)具有顯著差異。 可以推測高濃度樣本受到熒光等干擾較強(qiáng), 從而增大了拉曼光譜數(shù)據(jù)的離散程度。 其次, 磷酸根離子的成核、 結(jié)晶過程也會影響拉曼光譜的采集[16]。 高濃度磷酸根溶液更易結(jié)晶, 晶體對光的反射也會造成較大的背景光波動, 成為增加光譜離散程度的主要原因。
圖3 不同光譜預(yù)處理的PLSR模型的預(yù)測精度RS: 原始光譜; MA: 移動平均、 MA+BL: 移動平均+基線校正; MA+SNV: 移動平均+標(biāo)準(zhǔn)正態(tài)變量變換; MA+MSC: 移動平均+多元散射校正Fig.3 PLSR results of different spectra pretreatment methodsRS: Raw spectra; MA: Moving average; MA+BL: Moving average+baseline offset; MA+SNV: Moving average+standard normal variable transform; MA+MSC: Moving average+multiple scatter correction
低濃度區(qū)間模型精度最高為MA+BL數(shù)據(jù)集, 其次為MA數(shù)據(jù)集。 高濃度區(qū)間精度最高為MA+BL數(shù)據(jù)集, 其次為MA+MSC。 全濃度區(qū)間最高為原始光譜數(shù)據(jù)集RS, 其次為MA+SNV。 SNV與MSC可以濾除背景光、 熒光等引起的基線漂移, 所以模型主要貢獻(xiàn)因子為拉曼特征峰。 低濃度區(qū)間由于沒有明顯拉曼波峰, 模型貢獻(xiàn)因子為拉曼散射以外的因素(比如熒光引起的基線漂移), 所以MA+MSC與MA+SNV處理比MA單獨(dú)處理降低了模型精度。 而高濃度區(qū)間則相反, SNV與MSC都增加了模型精度。 全濃度原始光譜數(shù)據(jù)集(RS)預(yù)測精度最高, 說明了濃度的變異造成了光譜基線的漂移, 對PLSR模型精度起到了積極作用。
PLSR模型通過特征向量與特征值建立獨(dú)立變量(拉曼頻移)與響應(yīng)變量(P2O5)之間的聯(lián)系, 并使用較少的因子(主成分)解釋待測目標(biāo)的大部分變異。 由于這些特性, 可以推知PLSR模型對拉曼信號以外的噪聲信號(熒光等)的抗干擾能力較強(qiáng), 有時可以利用干擾因子增強(qiáng)模型的精度。 然而, PLSR的問題是算法中對于獨(dú)立變量賦予的權(quán)重具有隨機(jī)性, 通常難以解釋其產(chǎn)生原因及物理意義。
為進(jìn)一步研究磷濃度與拉曼光譜的關(guān)系, 降低PLSR模型中的模糊性, 嘗試選取少的獨(dú)立變量進(jìn)行建模。 選取高濃度區(qū)間PLSR模型的回歸系數(shù)作為研究對象。 圖4(a)為高濃度區(qū)間PLSR模型獨(dú)立變量(拉曼位移)對應(yīng)的回歸系數(shù)。 回歸系數(shù)曲線對應(yīng)的波峰(波谷)說明了該波段所占權(quán)重大小。 如圖4(a)所示, 回歸系數(shù)中在磷酸根的拉曼特征峰863與1 070 cm-1處有明顯的波峰, 與拉曼光譜數(shù)據(jù)的波峰位置吻合[圖1(b)], 進(jìn)一步說明高濃度區(qū)間模型中磷酸根的拉曼特征峰對模型精度的貢獻(xiàn)程度較大。
圖4 (a)高濃度區(qū)間PLSR模型的回歸系數(shù); (b)根據(jù)回歸系數(shù)選取特征波峰建立MLR預(yù)測模型的1∶1散點(diǎn)圖Fig.4 (a) Regression coefficients of PLSR results in high concentration range; (b) Scatter plot of MLR result of cross-validation using characteristic Raman peaks
采用不同濃度的KH2PO4溶液作為研究對象, 研究了拉曼光譜對水溶性磷定量分析的能力。 應(yīng)用波長532 nm激光光源的實(shí)驗(yàn)室拉曼光譜分析儀, 分別獲取了低濃度區(qū)間(0.02~5 g·L-1)與高濃度區(qū)間(5.21~93.87 g·L-1)KH2PO4溶液的拉曼光譜。 使用RS、 MA、 MA+BL、 MA+SNV、 MA+MSC方法對光譜進(jìn)行預(yù)處理, 應(yīng)用PLSR方法對處理后的光譜進(jìn)行建模。 并且, 根據(jù)PLSR回歸系數(shù)選取特征波長作為獨(dú)立變量建立MLR模型, 結(jié)果表明:
(1)低濃度區(qū)間與高濃度區(qū)間光譜的變異系數(shù)具有顯著差異, 高濃度區(qū)間光譜的離散程度較大, 說明樣本濃度對拉曼光譜的穩(wěn)定性影響較大。
(5)通過PLSR模型回歸系數(shù), 選取645、 863、 1 070和1 412 cm-1四點(diǎn)波段建立MLR模型, 決定系數(shù)接近1。 說明這四點(diǎn)峰值的變化幾乎可以解釋所有磷濃度的變異。 同時說明敏感波段選取可以濾除背景光干擾, 揭示了拉曼光譜在磷酸根溶液定量分析的潛力。
(6)以上結(jié)果說明普通拉曼光譜難以滿足土壤肥際微域中麟素含量快速分析的需求。 降低背景光干擾、 提高拉曼信號的穩(wěn)定性的同時, 開發(fā)特征波段選擇方法、 提高模型可重復(fù)性及抗干擾能力是未來高分辨率拉曼光譜快速檢測技術(shù)開發(fā)的關(guān)鍵。