摘要:為了準(zhǔn)確預(yù)測(cè)場(chǎng)地土壤重金屬分布狀況,實(shí)現(xiàn)土壤重金屬污染快速調(diào)查,以某廢棄助劑廠填埋區(qū)土壤為研究對(duì)象,基于高光譜數(shù)據(jù),利用單變量回歸模型、偏最小二乘回歸模型和支持向量機(jī)模型估算土壤重金屬Cr、Ni、Cu、Zn、Cd、Pb、As和Hg的含量。結(jié)果表明,土壤光譜反射率與各重金屬含量均呈負(fù)相關(guān);偏最小二乘回歸模型和支持向量機(jī)模型對(duì)8種重金屬的預(yù)測(cè)精度均優(yōu)于單變量回歸模型,偏最小二乘回歸模型為Cd、Pb、Cr和Ni的最佳估算模型,支持向量機(jī)模型為Cu、As、Zn和Hg的最佳預(yù)測(cè)模型;研究區(qū)土壤重金屬反演結(jié)果在趨勢(shì)上與實(shí)驗(yàn)室分析結(jié)果基本一致,高值區(qū)和極值點(diǎn)分布亦較為吻合,能夠圈定存在重金屬污染風(fēng)險(xiǎn)的區(qū)域,同時(shí)提供技術(shù)支撐,實(shí)現(xiàn)場(chǎng)地土壤重金屬污染的快速調(diào)查。
關(guān)鍵詞:土壤;重金屬;高光譜反射率;偏最小二乘回歸模型;支持向量機(jī)模型
中圖分類(lèi)號(hào):S153.6 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1008-9500(2024)06-0-06
DOI:10.3969/j.issn.1008-9500.2024.06.052
Study on Rapid Investigation of Heavy Metal Pollution in Site Soil Based on Hyperspectral Technology
CHEN Haofeng1,2, FANG Yanqi1,2, YANG Kui1,2, PENG Jiangying1,2, ZHAO Guofeng1,2, JIA Shuo1,2
(1. Jiangsu Province Engineering Research Center of Airborne Detecting and Intelligent Perceptive Technology;
2. Geological Exploration Technology Institute of Jiangsu Province, Nanjing 210049, China)
Abstract: In order to accurately predict the distribution of heavy metals in the soil of the site and achieve rapid investigation of soil heavy metal pollution, the soil in the landfill area of a certain waste additive factory is taken as the research object, based on hyperspectral data, univariate regression model, partial least squares regression model, and support vector machine model are used to estimate the content of heavy metals such as Cr, Ni, Cu, Zn, Cd, Pb, As, and Hg in the soil. The results show that there is a negative correlation between soil spectral reflectance and the content of various heavy metals; the partial least squares regression model and support vector machine model have better prediction accuracy for 8 heavy metals than univariate regression model, and the partial least squares regression model is the best estimation model for Cd, Pb, Cr, and Ni, while the support vector machine model is the best prediction model for Cu, As, Zn, and Hg; the trend of soil heavy metal inversion results in the research area is basically consistent with the laboratory analysis results, and the distribution of high value areas and extreme points is also relatively consistent, which can delineate areas with heavy metal pollution risks and provide technical support to achieve rapid investigation of soil heavy metal pollution on the site.
Keywords: soil; heavy metals; hyperspectral reflectance; partial least squares regression model; support vector machine model
隨著現(xiàn)代工業(yè)的飛速發(fā)展,社會(huì)經(jīng)濟(jì)發(fā)展水平不斷提高,但重金屬污染給生態(tài)環(huán)境造成嚴(yán)重危害。當(dāng)前,土壤重金屬檢測(cè)多采用地球化學(xué)分析法,但該方法需要投入較多的人力和物力,分析周期較長(zhǎng)。高光譜遙感以其動(dòng)態(tài)、快速、宏觀獲取地表信息的特點(diǎn),已廣泛應(yīng)用于土壤重金屬檢測(cè)[1-2]。解憲麗等[3]研究表明,土壤重金屬含量與光譜反射率存在顯著相關(guān)關(guān)系。黃長(zhǎng)平等[4]使用偏最小二乘回歸模型預(yù)測(cè)土壤Cu含量,獲得較為可靠的結(jié)果。鐘亮等[5]對(duì)農(nóng)業(yè)土壤重金屬進(jìn)行研究,結(jié)果顯示,不同重金屬預(yù)測(cè)結(jié)果存在一定的差異。王穎等[6]利用地理加權(quán)模型估算礦區(qū)土壤砷含量,驗(yàn)證高光譜技術(shù)應(yīng)用于土壤砷含量預(yù)測(cè)的可行性。
揚(yáng)州市某廢棄助劑廠周?chē)祻?fù)雜,緊挨農(nóng)田。研究區(qū)屬亞熱帶季風(fēng)氣候區(qū),年平均氣溫為15 ℃,年平均降水量為1 030 mm,年平均相對(duì)濕度為67%,無(wú)霜期為217 d。氣候溫和,雨量充沛,四季分明,日光充足,無(wú)霜期長(zhǎng)。土壤類(lèi)型主要為黏土,土層較厚。因此,有必要對(duì)研究區(qū)開(kāi)展土壤重金屬污染快速調(diào)查,避免對(duì)環(huán)境造成污染,保障周邊居民身體健康。以廢棄助劑廠土壤高光譜數(shù)據(jù)為基礎(chǔ),分別采用單變量回歸法、偏最小二乘回歸法[7]和支持向量機(jī)[8]建立8種土壤重金屬含量預(yù)測(cè)模型,驗(yàn)證區(qū)域土壤重金屬含量反演實(shí)現(xiàn)場(chǎng)地土壤重金屬污染快速調(diào)查的可行性,以期為土壤重金屬污染快速調(diào)查提供參考。
1 數(shù)據(jù)與方法
1.1 數(shù)據(jù)來(lái)源
2020年5月,在研究區(qū)采集土壤樣品,采樣深度為10~20 cm,每份樣品質(zhì)量約為2 kg。剔除雜物后,將土壤裝入帶有編號(hào)的樣品袋,共采集147份土壤樣品。將采集的土壤樣品進(jìn)行曬干、雜質(zhì)篩選、研磨與過(guò)篩(篩孔直徑0.85 mm)后重新封裝,用于高光譜檢測(cè)。同時(shí),篩選32份土壤樣品送往實(shí)驗(yàn)室,測(cè)定Cr、Ni、Cu、Zn、Cd、Pb、As和Hg的含量。以功率恒定的鹵素?zé)魹楣庠?,使用地物波譜儀在室內(nèi)對(duì)土壤樣品進(jìn)行高光譜檢測(cè),測(cè)量時(shí)間為晚上,規(guī)避外界光源干擾。每份土壤樣品重復(fù)測(cè)定5次,剔除異常后求算數(shù)平均值,并進(jìn)行濾波平滑處理,獲得各土壤樣品的光譜反射率。
1.2 評(píng)價(jià)方法
以單變量回歸法、偏最小二乘回歸法和支持向量機(jī)構(gòu)建土壤重金屬含量預(yù)測(cè)模型,對(duì)比分析各重金屬含量估算效果,選取最優(yōu)模型對(duì)研究區(qū)土壤重金屬含量進(jìn)行估算,土壤樣品按照3∶1的比例劃分訓(xùn)練集和測(cè)試集[9]。使用決定系數(shù)(R2)和均方根誤差(Root Mean Squared Error,RMSE)來(lái)評(píng)價(jià)模型精度,其中R2用于檢驗(yàn)?zāi)P头€(wěn)定性,RMSE用來(lái)反映模型估算能力。R2越大,RMSE越小,模型估算越準(zhǔn)確。
2 結(jié)果與分析
2.1 土壤重金屬含量統(tǒng)計(jì)特征
實(shí)驗(yàn)室對(duì)32份土壤樣品的8種重金屬含量進(jìn)行測(cè)定,結(jié)果如表1所示。數(shù)據(jù)顯示,研究區(qū)8種重金屬含量均存在異常值,說(shuō)明研究區(qū)各重金屬含量存在異常。Cr、Ni和Hg的變異系數(shù)大于100%,呈強(qiáng)變異性;Cu、Zn、Cd、Pb和As的變異系數(shù)大于10%,但小于100%,呈中等變異性。因此,土壤樣品檢測(cè)數(shù)據(jù)具有離散性。
2.2 土壤光譜特征
如圖1所示,研究區(qū)土壤樣品的光譜反射率變化曲線形態(tài)相似,整體變化較小。土壤樣品光譜特征顯示,波長(zhǎng)為400~800 nm時(shí),土壤樣品光譜反射率上升較快,斜率較陡;波長(zhǎng)為800~1 360 nm時(shí),反射率上升變慢,斜率較緩;波長(zhǎng)為1 450~1 520 nm時(shí),反射率變化曲線近似平行于橫軸;波長(zhǎng)為1 560~2 138 nm時(shí),反射率上升緩慢;波長(zhǎng)大于2 138 nm時(shí),反射率呈下降趨勢(shì),斜率較緩。研究區(qū)土壤樣品光譜反射率曲線在波長(zhǎng)1 410 nm、1 910 nm和2 210 nm處存在光譜吸收特征峰,這是由土壤吸附H2O及其OH基團(tuán)振動(dòng)的倍頻與合頻產(chǎn)生,波長(zhǎng)2 210 nm處的吸收峰是黏土礦物中金屬-OH振動(dòng)合頻產(chǎn)生[10]。
2.3 土壤重金屬含量與光譜反射率的相關(guān)性分析
32份土壤樣品中,8種重金屬含量與各波段光譜反射率的相關(guān)性分析結(jié)果如圖2所示。數(shù)據(jù)顯示,8種重金屬含量均與反射率呈負(fù)相關(guān),說(shuō)明土壤重金屬含量越高,反射率越低。其中,As含量與反射率的相關(guān)性最弱,波長(zhǎng)為1 913 nm時(shí),相關(guān)系數(shù)為-0.491;Cr、Ni含量與反射率的相關(guān)系數(shù)均大于-0.6,極小值分別出現(xiàn)于波長(zhǎng)1 800 nm、476 nm附近;Hg含量與反射率的相關(guān)系數(shù)最小值為-0.678,出現(xiàn)在波長(zhǎng)993 nm處;Cu、Zn、Cd和Pb含量與反射率的相關(guān)性總體較強(qiáng),最小相關(guān)系數(shù)均小于-0.7,呈顯著相關(guān)。
2.4 單變量回歸模型土壤重金屬含量估算
結(jié)合圖2的相關(guān)性分析結(jié)果,以不同波段的光譜反射率(x)為橫坐標(biāo),以土壤重金屬含量(y)為縱坐標(biāo),建立8種重金屬的單變量回歸模型,結(jié)果如表2所示。8種重金屬含量預(yù)測(cè)模型均通過(guò)顯著性檢驗(yàn),表明單變量回歸模型成立,但模型準(zhǔn)確性存在較大差異。其中,Cd和Pb的決定系數(shù)較好,分別為0.811和0.765,Cr、Ni、Zn和Cu的均方根誤差較大。
2.5 偏最小二乘回歸模型土壤重金屬含量估算
使用偏最小二乘回歸法建立土壤中8種重金屬含量的估算模型,結(jié)果如表3所示。除Hg以外,各重金屬訓(xùn)練集R2均取得較好的結(jié)果,均大于0.9。測(cè)試集R2的表現(xiàn)存在一定差異,其中,Cu、Cd和Pb的決定系數(shù)較大,R2分別為0.906、0.926和0.882,Cr和Ni的決定系數(shù)與訓(xùn)練集相比下降明顯。相比訓(xùn)練集,測(cè)試集的RMSE有顯著的提升,這與土壤樣品存在異常值有直接關(guān)系??傊瑥腞2和RMSE可以看出,偏最小二乘回歸模型具有較高的精度。
2.6 支持向量機(jī)模型土壤重金屬含量估算
將各土壤樣品的光譜反射率數(shù)據(jù)進(jìn)行一階導(dǎo)數(shù)變換,增大其特征的差異性,降低線性背景和噪聲干擾,再采用自適應(yīng)重加權(quán)采樣法進(jìn)行特征選擇,獲得各重金屬的特征波段,建立支持向量機(jī)模型,估算土壤中8種重金屬含量,結(jié)果如表4所示。數(shù)據(jù)顯示,各重金屬支持向量機(jī)模型訓(xùn)練集、測(cè)試集的R2和RMSE較為相近,二者的R2精度較好,說(shuō)明該模型具有較好的泛用性和適應(yīng)性,能夠?qū)崿F(xiàn)土壤重金屬含量估算。
2.7 模型精度分析
結(jié)合土壤的光譜反射率數(shù)據(jù),分別采用單變量回歸法、偏最小二乘回歸法和支持向量機(jī)建立土壤重金屬含量預(yù)測(cè)模型,并通過(guò)比較各方法的精度來(lái)確定最優(yōu)模型。從建模方法來(lái)看,偏最小二乘回歸模型和支持向量機(jī)模型的精度明顯優(yōu)于單變量回歸模型;Cd和Pb的偏最小二乘回歸模型精度要優(yōu)于支持向量機(jī)模型,Cr、Ni的偏最小二乘回歸模型R2要略小于支持向量機(jī)模型,但RMSE明顯大于支持向量機(jī)模型,其余元素相差不大。從8種重金屬來(lái)看,Cd估算精度最好,R2為0.926,RMSE為0.008;Cr、Ni、Pb、Cu、As和Zn次之,Hg最差,R2為0.743,RMSE為0.074。不同重金屬反演精度的差異與土壤樣品含量檢測(cè)數(shù)據(jù)、建模樣品數(shù)據(jù)和預(yù)測(cè)模型等都有密切關(guān)系。經(jīng)模型精度分析,偏最小二乘回歸法為Cd、Pb、Cr和Ni的最佳預(yù)測(cè)模型,支持向量機(jī)為Cu、As、Zn和Hg的最佳預(yù)測(cè)模型。從精度上看,8種重金屬的預(yù)測(cè)模型可以應(yīng)用于研究區(qū)土壤重金屬含量反演。
2.8 區(qū)域土壤重金屬含量反演
以147份土壤樣品為基礎(chǔ),使用8種重金屬含量的最佳預(yù)測(cè)模型,開(kāi)展研究區(qū)土壤重金屬含量反演。研究區(qū)土壤中,8種重金屬的實(shí)際分布和反演分布如圖3所示。比較發(fā)現(xiàn),Cr、Ni、Cu、Zn、Cd、Pb、As和Hg含量的反演結(jié)果在趨勢(shì)上均與實(shí)驗(yàn)室分析結(jié)果保持基本一致,高值區(qū)和極值點(diǎn)分布均有顯示,與實(shí)驗(yàn)室分析結(jié)果較為吻合,但局部存在一定差異。這些差異的存在與模型精度有關(guān),也與土壤樣品檢測(cè)數(shù)據(jù)的準(zhǔn)確性有一定聯(lián)系。總體來(lái)看,研究區(qū)土壤重金屬含量的高光譜檢測(cè)結(jié)果在精度上能較好地滿足調(diào)查需求,能夠圈定存在重金屬污染風(fēng)險(xiǎn)的區(qū)域,實(shí)現(xiàn)場(chǎng)地土壤重金屬污染的快速調(diào)查。
3 結(jié)論
以廢棄助劑廠土壤樣品為研究對(duì)象,分析土壤光譜特征,開(kāi)展土壤中8種重金屬含量與光譜反射率的相關(guān)性分析,然后分別利用單變量回歸模型、偏最小二乘回歸模型和支持向量機(jī)模型對(duì)研究區(qū)土壤中8種重金屬含量進(jìn)行預(yù)測(cè)。結(jié)果發(fā)現(xiàn),研究區(qū)土壤高光譜反射率與8種重金屬含量均呈負(fù)相關(guān)。其中,As含量與光譜反射率的相關(guān)性最弱,相關(guān)系數(shù)為-0.491;Cd含量與光譜反射率的相關(guān)性最強(qiáng),相關(guān)系數(shù)為-0.877;其他6種重金屬含量與光譜反射率的相關(guān)性強(qiáng)于As,但弱于Cd。偏最小二乘回歸模型和支持向量機(jī)模型對(duì)土壤中8種重金屬含量的預(yù)測(cè)精度均優(yōu)于單變量回歸模型,其中偏最小二乘回歸模型對(duì)Cd、Pb、Cr和Ni的預(yù)測(cè)具有明顯優(yōu)勢(shì),RMSE更??;支持向量機(jī)模型對(duì)Cu、As、Zn和Hg的估算效果最佳,R2更大。不同重金屬含量估算具有一定的差異性,Cd估算精度最好,R2為0.926,RMSE為0.008,Hg估算精度最差,R2為0.743,RMSE為0.074。研究區(qū)土壤中8種重金屬含量反演結(jié)果在趨勢(shì)上與實(shí)驗(yàn)室分析結(jié)果基本一致,高值區(qū)和極值點(diǎn)分布亦較為吻合,能夠圈定存在重金屬污染風(fēng)險(xiǎn)的區(qū)域,同時(shí)提供重要的技術(shù)支持,實(shí)現(xiàn)場(chǎng)地土壤重金屬污染的快速調(diào)查。
參考文獻(xiàn)
1 肖潔蕓,周 偉,石佩琪,等.土壤重金屬含量高光譜反演[J].生態(tài)環(huán)境學(xué)報(bào),2023(1):175-182.
2 付 馨,趙艷玲,李建華,等.高光譜遙感土壤重金屬污染研究綜述[J].中國(guó)礦業(yè),2012(1):65-82.
3 解憲麗,孫 波,郝紅濤,等.土壤可見(jiàn)光-近紅外反射光譜與重金屬含量之間的相關(guān)性[J].土壤通報(bào),2007(6):982-993.
4 黃長(zhǎng)平,劉 波,張 霞,等.土壤重金屬Cu含量遙感反演的波段選擇與最佳光譜分辨率研究[J].遙感技術(shù)與應(yīng)用,2010(3):353-357.
5 鐘 亮,錢(qián)家煒,儲(chǔ)學(xué)遠(yuǎn),等.利用高光譜遙感技術(shù)監(jiān)測(cè)小麥土壤重金屬污染[J].農(nóng)業(yè)工程學(xué)報(bào),2023(5):265-270.
6 王 穎,王志一,黃 勇,等.礦區(qū)土壤重金屬砷含量高光譜反演研究[J].世界核地質(zhì)科學(xué),2023(1):89-97.
7 魏丹萍,鄭光輝.高光譜反射率的濱海地區(qū)土壤全磷含量反演[J].光譜學(xué)與光譜分析,2022(2):517-523.
8 孟 珊,李新國(guó),焦 黎,等.基于機(jī)器學(xué)習(xí)算法的湖濱綠洲土壤電導(dǎo)率高光譜估算模型[J].土壤通報(bào),2023(2):286-294.
9 肖云飛,高小紅,李冠穩(wěn),等.土壤有機(jī)質(zhì)可見(jiàn)光-近紅外光譜預(yù)測(cè)樣本優(yōu)化選擇[J].土壤,2020(2):404-413.
10 程先鋒,宋婷婷,陳 玉,等.滇西蘭坪鉛鋅礦區(qū)土壤重金屬含量的高光譜反演分析[J].巖石礦物學(xué)雜志,2017(1):60-69.
基金項(xiàng)目:江蘇省地礦局科研項(xiàng)目(2019KY11、202004196K1K、2021KY14)。
作者簡(jiǎn)介:陳浩峰(1990—),男,浙江蘭溪人,碩士,工程師。研究方向:高光譜遙感。