孫小鵬,馬瑞峻,陳 瑜,甄歡儀,馬創(chuàng)立
華南農(nóng)業(yè)大學(xué)工程學(xué)院,廣東 廣州 510642
磷是生物體也是水生生態(tài)系統(tǒng)重要的組成元素之一,水生植物的生長(zhǎng)雖說(shuō)需要磷元素,但并不是說(shuō)水體中磷含量越多越好,當(dāng)其含量大于0.2 mg·L-1時(shí)將會(huì)引發(fā)一系列重大的環(huán)境問題,如全球頻發(fā)的海洋、湖泊富營(yíng)養(yǎng)化和赤潮、藍(lán)藻水華等,進(jìn)而污染天然水體并破壞生態(tài)平衡[1]。長(zhǎng)期以來(lái),我國(guó)農(nóng)村農(nóng)業(yè)生產(chǎn)中濫用化肥現(xiàn)象比較嚴(yán)重,錯(cuò)誤地認(rèn)為肥料用的越多,農(nóng)作物的產(chǎn)量就會(huì)越高,導(dǎo)致化肥利用率低,農(nóng)業(yè)面源污染嚴(yán)重; 另一方面,農(nóng)村污染防治意識(shí)薄弱,含有高濃度磷的禽畜養(yǎng)殖廢水和生活污水被肆意排放; 除此之外還有含磷工業(yè)廢水的排放等,這些都是導(dǎo)致我國(guó)水體污染問題較為嚴(yán)峻的原因。所以為了有效的防止水體富營(yíng)養(yǎng)化等問題的發(fā)生,避免含高濃度磷的污水進(jìn)入自然水體顯得尤為重要。
研究表明水體中的磷主要是以各種磷酸鹽的形式存在的[2],對(duì)水體中磷形態(tài)的分析,是將其他形式的磷酸鹽分別通過(guò)消解、提取等方式轉(zhuǎn)化為正磷酸鹽進(jìn)行測(cè)定的。目前國(guó)內(nèi)主要測(cè)定方法有離子色譜法、鉬藍(lán)比色法、和連續(xù)流動(dòng)分析法等。其中離子色譜法[3]實(shí)驗(yàn)過(guò)程復(fù)雜且耗時(shí),不能滿足快速檢測(cè)的要求; 鉬藍(lán)比色法[4]雖然操作較為簡(jiǎn)單,但其精度還有待提高; 連續(xù)流動(dòng)分析法[5]檢出限低,精確度高,但其測(cè)定樣品成本高,實(shí)驗(yàn)儀器十分昂貴,且不宜大規(guī)模作常規(guī)分析用。另外,國(guó)外研究人員還采用富集與光催化和液體波導(dǎo)管分光光度法來(lái)[6-7]檢測(cè)海水中的無(wú)機(jī)磷,但實(shí)驗(yàn)過(guò)程繁瑣費(fèi)時(shí)。
隨著光譜技術(shù)的日益成熟,越來(lái)越多的研究學(xué)者采用光譜技術(shù)對(duì)作物病害和水質(zhì)評(píng)價(jià)等方面進(jìn)行實(shí)驗(yàn)研究[8-9],而對(duì)于水體中無(wú)機(jī)磷的濃度研究卻較少。所以本研究采用吸收光譜,結(jié)合偏最小二乘(partial least squares,PLS)模型來(lái)探究光譜技術(shù)檢測(cè)水體中磷酸三鈉濃度的可行性,旨在為實(shí)現(xiàn)水體中無(wú)機(jī)磷濃度的快速檢測(cè)提供理論依據(jù)。
實(shí)驗(yàn)樣品為純度99.5%的磷酸三鈉標(biāo)準(zhǔn)樣品。用分析天平稱取1.226 g磷酸三鈉(12個(gè)結(jié)晶水),將稱取好的樣品放入燒杯中,并加入適量蒸餾水溶解,定容到1 000 mL容量瓶后搖勻,配置初始濃度為100 mg·L-1(以P計(jì))的磷酸三鈉樣液。再次使用蒸餾水作為稀釋劑,配置濃度范圍為0.01~100 mg·L-1共計(jì)65個(gè)實(shí)驗(yàn)樣品。其具體濃度配置為: 0.01,0.05,0.1~1.0(濃度梯度為0.1 mg·L-1),1.5~10.0(濃度梯度為0.5 mg·L-1),11.0~20.0(濃度梯度為1.0 mg·L-1),22.0~50.0(濃度梯度為2.0 mg·L-1)和55.0~100.0 mg·L-1(濃度梯度為5.0 mg·L-1)。
為了增加實(shí)驗(yàn)結(jié)果的可靠性,同時(shí)為了探究不同光源和不同光程對(duì)實(shí)驗(yàn)結(jié)果的影響,采用3種實(shí)驗(yàn)裝置進(jìn)行實(shí)驗(yàn)。3種實(shí)驗(yàn)裝置及實(shí)驗(yàn)條件如下:
裝置1: 將型號(hào)為Hamamatsu S10420的探測(cè)器、型號(hào)為PHX-5W的脈沖氙燈和比色皿支架組合在一起。
裝置2: 將型號(hào)為Hamamatsu S10420的探測(cè)器、型號(hào)為ZWH-3000的氘鹵燈和比色皿支架組合在一起。
采用上述兩裝置實(shí)驗(yàn)時(shí),比色皿光程均為100 mm,選定波長(zhǎng)范圍為200~900 nm,積分時(shí)間為9 ms,平均次數(shù)為20,平滑寬度為2,儀器分辨率為1.1 nm(FWHM)。
裝置3: 美國(guó)Ocean Optics海陽(yáng)光學(xué)公司的便攜式吸光度測(cè)量?jī)x(型號(hào)為FLAME-CHEM-UV-VIS),探測(cè)器為Sony ILX511B linear silicon CCD array,光源為氘鹵燈,比色皿光程為10 mm。積分時(shí)間為25 ms,平均次數(shù)為20,平滑寬度為2,選定波長(zhǎng)范圍190~750 nm,儀器分辨率為1.5 nm(FWHM)。
1.2.1 樣本集的劃分與數(shù)據(jù)處理及建模
采用Kennard-Stone(K-S)樣本劃分方法,基于樣本光譜計(jì)算樣本之間的歐氏距離,在特征空間中,按3∶1的比例劃分校正集(49個(gè)樣本)和預(yù)測(cè)集(16個(gè)樣本)。
為了消除光譜數(shù)據(jù)所包含的無(wú)關(guān)信息以及其他背景的干擾,將實(shí)驗(yàn)所得光譜數(shù)據(jù)分別采用移動(dòng)平均平滑(move smoothing)、S-G卷積平滑、一階導(dǎo)數(shù)(1-Der)和二階導(dǎo)數(shù)(2-Der)等預(yù)處理方法進(jìn)行預(yù)處理并建立PLS模型,通過(guò)對(duì)比分析模型結(jié)果確定最優(yōu)預(yù)處理方法; 接著采用蒙特卡洛交叉驗(yàn)證(Monte-Carlo cross validation,MCCV)法剔除預(yù)處理之后校正集樣本中的奇異樣本; 最后采用相關(guān)系數(shù)法選取特征波長(zhǎng)和特征波段,建立特征波長(zhǎng)和特征波段PLS模型,并同全波段數(shù)據(jù)所建立的PLS模型進(jìn)行對(duì)比分析。
1.2.2 模型評(píng)估
采用決定系數(shù)R2,均方根誤差RMSE和預(yù)測(cè)殘差RPD對(duì)模型進(jìn)行評(píng)估。其中R2表示模型的擬合度,RMSE表示模型的預(yù)測(cè)能力,RPD體現(xiàn)模型的分辨能力和穩(wěn)健性。當(dāng)RPD≥3時(shí)表示此模型預(yù)測(cè)能力較好[10]。
樣本集劃分、光譜數(shù)據(jù)預(yù)處理、奇異樣本剔除以及建模均在The Unscrambler X10.4和Matlab R2017b軟件平臺(tái)進(jìn)行。
使用3種實(shí)驗(yàn)裝置采集的不同濃度下磷酸三鈉樣液的原始吸收光譜如圖1所示。
圖1 三種實(shí)驗(yàn)裝置磷酸三鈉原始吸收光譜圖(a): 100 mm光程脈沖氙燈實(shí)驗(yàn); (b): 100 mm光程氘鹵燈實(shí)驗(yàn);(c): 10 mm光程氘鹵燈實(shí)驗(yàn)Fig.1 Original absorption spectra of trisodium phosphateinby using three types experimental system(a): Pulse xenon lamp with 100 mm optical path;(b): Deuterium halide lamp with 100 mm optical path;(c): Deuterium halide lamp with 10 mm optical path
由圖1可知,磷酸三鈉在紫外區(qū)域(<350 mm)出現(xiàn)明顯吸收峰。圖1(b)在靠近380 nm處出現(xiàn)小的“吸收峰”是因?yàn)樵撎幨亲贤鈪^(qū)域與可見光區(qū)域的交界處,可能是光源能量不同導(dǎo)致的; 圖1(c)在700nm附近出現(xiàn)小的“吸收峰”可能是因?yàn)樵撎幙拷鼨z測(cè)波長(zhǎng)范圍的末端,光源不穩(wěn)定、背景噪聲較大引起的; 圖1(c)吸光度值在約240~300 nm范圍內(nèi)顯著高于圖1(a)和(b),可能原因是隨著實(shí)驗(yàn)進(jìn)行時(shí)間的增加,裝置3的光源出現(xiàn)能量不穩(wěn)定現(xiàn)象,造成基線漂移,使圖1(c)的光譜曲線整體略向上抬高。所以為了避免引入較多的無(wú)用信息,對(duì)選定的紫外區(qū)域光譜數(shù)據(jù)(a實(shí)驗(yàn)和b實(shí)驗(yàn)選取波長(zhǎng)范圍為200~350 nm,波長(zhǎng)變量由1 543個(gè)減少到320個(gè),c實(shí)驗(yàn)選取波長(zhǎng)范圍為190~350 nm,波長(zhǎng)變量由1 608個(gè)減少到428個(gè))采用不同預(yù)處理方法進(jìn)行處理。
不同預(yù)處理方法對(duì)光譜數(shù)據(jù)處理后PLS模型結(jié)果如表1所示,通過(guò)對(duì)比分析可知,三組實(shí)驗(yàn)數(shù)據(jù)均采用S-G卷積平滑預(yù)處理方法效果最好,將預(yù)處理后的光譜數(shù)據(jù)用于后續(xù)的處理分析。預(yù)處理后的吸收光譜圖如圖2所示。
表1 三種實(shí)驗(yàn)不同預(yù)處理方法PLS模型結(jié)果Table 1 PLS model results of three types experimentswith different pretreatment methods
用光譜數(shù)據(jù)建立相關(guān)預(yù)測(cè)模型時(shí),光譜異常樣本的存在會(huì)對(duì)預(yù)測(cè)模型的精度產(chǎn)生嚴(yán)重影響。異常樣本的產(chǎn)生主要與光譜儀本身、實(shí)驗(yàn)測(cè)量時(shí)的環(huán)境因素和樣品前處理不當(dāng)?shù)仍蛴嘘P(guān)。
蒙特卡洛交叉驗(yàn)證算法(MCCV)[11]具有較高的識(shí)別奇異樣本的能力,并且可以在某種程度上降低由掩蔽效應(yīng)帶來(lái)的風(fēng)險(xiǎn)。將三組實(shí)驗(yàn)校正集樣本數(shù)據(jù)用蒙特卡洛隨機(jī)取樣(Monte Carlo sampling,MCS)法取80%的樣本作校正集建立PLS回歸模型,余下的20%作預(yù)測(cè)集,循環(huán)2 500次,得到各樣本的一組預(yù)測(cè)殘差,并求得各樣本預(yù)測(cè)殘差(residual)的均值(MEAN)與方差(STD),作MEAN-STD圖如圖3所示。
圖2 三種實(shí)驗(yàn)S-G預(yù)處理后磷酸三鈉吸收光譜圖(a): 100 mm光程脈沖氙燈; (b): 100 mm光程氘鹵燈;(c): 10 mm光程氘鹵燈Fig.2 Absorption spectra of trisodium phosphate after S-Gpretreatment bu using three types experimental system(a): Pulse xenon lamp with 100 mm optical path;(b): Deuterium halide lamp with 100 mm optical path;(c): Deuterium halide lamp with 10 mm optical path
圖3 MCCV法均值-方差(MEAN-STD)分布圖(a): 100 mm光程脈沖氙燈實(shí)驗(yàn); (b): 100 mm光程氘鹵燈實(shí)驗(yàn); (c): 10 mm光程氘鹵燈實(shí)驗(yàn)Fig.3 MEAN-STD distribution of MCCV method(a): Experiment of pulse xenon lamp with 100 mm optical path; (b): Experiment of deuterium halide lamp with 100 mm optical path;(c): Experiment of deuterium halide lamp with 10 mm optical path
由圖3可知,有些樣本偏離主體樣本較為明顯,需要剔除掉。圖3(a)中剔除6個(gè)奇異樣本,樣本編號(hào)分別為36,43,45,47,48和49; 圖3(b)中剔除8個(gè)奇異樣本,樣本編號(hào)分別為1,17,24,26,30,47,48和49; 圖3(c)中剔除7個(gè)奇異樣本,樣本編號(hào)分別為3,39,40,45,47,48和49。三種實(shí)驗(yàn)剔除奇異樣本后實(shí)驗(yàn)樣本由原來(lái)的65個(gè)分別減少到59個(gè)、57個(gè)和58個(gè)。剔除奇異樣本前后PLS模型結(jié)果如表2所示。
表2 剔除奇異樣本前后磷酸三鈉全波段數(shù)據(jù)PLS模型預(yù)測(cè)結(jié)果Table 1 PLS model results of all band data of trisodium phosphate before and after singular sample removed
由表2可知,三種實(shí)驗(yàn)剔除奇異樣本前后全波段PLS模型結(jié)果的RPD值都在15以上,均達(dá)到定量分析的要求。剔除奇異樣本后三種實(shí)驗(yàn)PLS模型的RMSEC值和RMSEP值均有不同程度的降低,其中c實(shí)驗(yàn)PLS模型RMSEC值從1.909 5降低到0.869 6,RMSEP值從0.826 2降低到0.743 5,降低最為顯著; 而且可以看出剔除奇異樣本后三種實(shí)驗(yàn)PLS模型的RMSEC與RMSEP之間的差值均有所降低。所以經(jīng)MCCV法剔除奇異樣本后的PLS模型不僅建模樣本量減少,而且模型的準(zhǔn)確性和穩(wěn)定性更高。
相關(guān)系數(shù)法是將光譜矩陣中的每個(gè)波長(zhǎng)對(duì)應(yīng)的吸光度向量x與濃度矩陣中的待測(cè)組分濃度向量y進(jìn)行相關(guān)性計(jì)算,得到波長(zhǎng)-吸光度相關(guān)系數(shù)圖,對(duì)應(yīng)相關(guān)系數(shù)絕對(duì)值越大的波長(zhǎng)處包含的信息越多。三種實(shí)驗(yàn)相關(guān)系數(shù)圖如圖4所示。
根據(jù)圖4的相關(guān)系數(shù)圖,挑選出相關(guān)系數(shù)絕對(duì)值最大處和波峰處或波谷處所對(duì)應(yīng)的波長(zhǎng)為其特征波長(zhǎng),三種實(shí)驗(yàn)選取的特征波長(zhǎng)分別為214.099 8,258.528 9 nm; 218.837 1,309.760 6 nm和204.66,316.17 nm。并建立PLS模型,結(jié)果如表3所示。
圖4 三種實(shí)驗(yàn)磷酸三鈉吸光度與波長(zhǎng)相關(guān)系數(shù)圖(a): 100 mm光程脈沖氙燈實(shí)驗(yàn); (b): 100 mm光程氘鹵燈實(shí)驗(yàn); (c): 10 mm光程氘鹵燈實(shí)驗(yàn)Fig.4 The correlation coefficient between absorbance and wavelength of trisodium phosphate for three types experiments(a): Pulse xenon lamp with 100 mm optical path; (b): Deuterium halide lamp with 100 mm optical path;(c): Deuterium halide lamp with 10 mm optical path
表3 磷酸三鈉特征波長(zhǎng)及其PLS模型結(jié)果Table 3 Characteristic wavelengths of trisodium phosphate and its PLS model results
由表3可知,三種實(shí)驗(yàn)特征波長(zhǎng)PLS模型的RPD值分別為6.009 8,6.242 5和5.330 5; 對(duì)比表2和表3可知,雖然三種實(shí)驗(yàn)特征波長(zhǎng)模型均滿足定量分析的要求,但是相對(duì)剔除奇異樣本后全波段PLS模型來(lái)說(shuō),三種實(shí)驗(yàn)特征波長(zhǎng)模型的R2均降低,RMSE值均增加,導(dǎo)致RPD值也降低,這可能是因?yàn)閰⑴c建模波長(zhǎng)變量數(shù)太少,含有效信息的波長(zhǎng)變量未被選取到,導(dǎo)致特征波長(zhǎng)PLS模型分辨能力和穩(wěn)健性降低。
雖然三種實(shí)驗(yàn)選取的特征波長(zhǎng)均為2個(gè),但從圖1可以看出,磷酸三鈉在200~230 nm波段內(nèi)出現(xiàn)明顯吸收峰,所以三種實(shí)驗(yàn)分別選擇由相關(guān)系數(shù)法得到的214.099 8,218.837 1和204.66 nm作為磷酸三鈉的主要特征波長(zhǎng)。三種實(shí)驗(yàn)的實(shí)驗(yàn)對(duì)象均為磷酸三鈉溶液,理論上來(lái)說(shuō)得到的特征波長(zhǎng)應(yīng)該是一致的,但實(shí)驗(yàn)得到了三個(gè)不同的特征波長(zhǎng),這可能是三種實(shí)驗(yàn)裝置不同造成的。并且,由圖1可以看出,三種實(shí)驗(yàn)各自的最大吸收峰均發(fā)生了不同程度的偏移。所以為了保證每個(gè)特征波長(zhǎng)均被分析到,從而建立一個(gè)精度較高且具有普適性的模型,采用特征波段建模。
以三種實(shí)驗(yàn)選取的214.099 8,218.837 1和204.66 nm主要特征波長(zhǎng)為中心,左右各取3nm波寬作為特征波段,即211.730 2~216.942 5,215.995 1~221.678 3和201.99~207.33 nm,綜合選取200~222 nm作為磷酸三鈉的特征波段,并建立PLS模型,建模結(jié)果如表4所示。
表4 磷酸三鈉特征波段PLS模型結(jié)果Table 4 Characteristic band of trisodium phosphate and its PLS model results
由表4可知,三種實(shí)驗(yàn)特征波段PLS模型的RPD值分別為23.288 8,17.568 8和13.428 5,RMSEP值均小于1,模型均表現(xiàn)出較好的預(yù)測(cè)性能,說(shuō)明綜合三種實(shí)驗(yàn)選取200~222 nm作為磷酸三鈉的特征波段較為合適; 而且與全波段PLS模型相比,a實(shí)驗(yàn)和b實(shí)驗(yàn)的波長(zhǎng)變量由320個(gè)減少到48個(gè),c實(shí)驗(yàn)的波長(zhǎng)變量由428個(gè)減少到61個(gè),特征波段PLS模型都僅使用約全波段15%的波長(zhǎng)變量,大大簡(jiǎn)化了模型,減少建模所消耗的時(shí)間。
對(duì)比a實(shí)驗(yàn)和b實(shí)驗(yàn),當(dāng)光程(100 mm)相同,光源不同時(shí),特征波段PLS模型R2都在0.99以上,但是a實(shí)驗(yàn)PLS模型的RMSEC值和RMSEP值相對(duì)于b實(shí)驗(yàn)來(lái)說(shuō)均有所降低,并且RPD值更高,所以脈沖氙燈實(shí)驗(yàn)結(jié)果優(yōu)于氘鹵燈實(shí)驗(yàn)結(jié)果; 對(duì)比b實(shí)驗(yàn)和c實(shí)驗(yàn),當(dāng)光程不同,光源(氘鹵燈)相同時(shí),b實(shí)驗(yàn)特征波段PLS模型的RMSEP值相對(duì)于c實(shí)驗(yàn)來(lái)說(shuō)降低了約27%,RPD值增加了約31%,所以相對(duì)于10 mm光程比色皿實(shí)驗(yàn)來(lái)說(shuō),100 mm光程比色皿實(shí)驗(yàn)?zāi)P偷念A(yù)測(cè)能力更高。
(1)通過(guò)3種實(shí)驗(yàn)裝置對(duì)不同濃度磷酸三鈉溶液進(jìn)行實(shí)驗(yàn),經(jīng)S-G卷積平滑預(yù)處理和MCCV法剔除奇異樣本后所建立的全波段、特征波長(zhǎng)和特征波段PLS模型均有較高的精度和預(yù)測(cè)性能。
(2)通過(guò)原始吸收光譜圖和相關(guān)性分析得到214 nm附近是紫外可見吸收光譜檢測(cè)磷酸三鈉溶液濃度的一個(gè)主要特征波長(zhǎng),選取200~222 nm作為磷酸三鈉溶液的特征波段,建立的特征波段PLS模型滿足實(shí)際定量分析的要求,且模型精度較高,魯棒性更好。
(3)不同光程和不同光源對(duì)磷酸三鈉溶液濃度的測(cè)定都有一定程度的影響。在200~222 nm特征波段內(nèi),光程(100 mm)相同情況下,使用脈沖氙燈作為光源對(duì)磷酸三鈉溶液濃度測(cè)定的實(shí)驗(yàn)結(jié)果更優(yōu),所建模型的精度更高; 光源(氘鹵燈)相同情況下,使用100 mm比10 mm光程比色皿對(duì)磷酸三鈉溶液濃度測(cè)定的實(shí)驗(yàn)結(jié)果更優(yōu),其模型分辨力更高。
(4)本研究為實(shí)現(xiàn)水體中磷酸三鈉濃度的快速檢測(cè)提供實(shí)驗(yàn)基礎(chǔ)和理論參考,但利用光譜技術(shù)對(duì)水體中其他無(wú)機(jī)磷的定量分析還有待進(jìn)一步探究。