趙玉玲,楊楠楠*,張海霞,王小劍,孫秀云,王煒
1.河北工程大學(xué)礦業(yè)與測(cè)繪工程學(xué)院,河北 邯鄲 056038;2.邯鄲市自然資源空間信息重點(diǎn)實(shí)驗(yàn)室,河北 邯鄲 056038;3.河北工程大學(xué)能源與環(huán)境工程學(xué)院,河北 邯鄲 056038
土壤是人類賴以生存、發(fā)展的基礎(chǔ),工礦產(chǎn)業(yè)的發(fā)展不斷危及周邊城市土壤環(huán)境,城市重金屬問題越發(fā)顯著(葛曉穎等,2019),定量監(jiān)測(cè)重金屬對(duì)居民健康意義重大(肖捷穎等,2013)。傳統(tǒng)實(shí)驗(yàn)室法土壤重金屬監(jiān)測(cè)較為精準(zhǔn),但在實(shí)驗(yàn)設(shè)備、經(jīng)濟(jì)、實(shí)用性等方面有待考究(龔海明等,2013),高光譜遙感基于高空成像技術(shù)和地物高光譜(Liu et al.,2015;Lausch et al.,2015),具有多波段、光譜分辨率高、光譜區(qū)分力強(qiáng)等特點(diǎn),可用于更精細(xì)的土壤重金屬分布制圖(羅甫林,2017)。因而目前趨向于由地面光譜儀數(shù)據(jù)或星載高光譜數(shù)據(jù)(Liu et al.,2015;楊靈玉等,2016)進(jìn)行土壤重金屬高光譜監(jiān)測(cè),實(shí)現(xiàn)由點(diǎn)到面、由定性到定量分析的大范圍立體監(jiān)測(cè)(周斌等,2016)。研究證實(shí),電子躍遷是土壤光譜形成特征波段的主要成因,重金屬含量與其光譜響應(yīng)特征波段的相關(guān)性是進(jìn)行土壤重金屬光譜反演的基礎(chǔ)(Stazi et al.,2014;付萍杰等,2018)。土壤重金屬研究目前多集中于礦區(qū)、煤田區(qū)與農(nóng)田污灌區(qū)(Tan et al.,2014;榮媛等,2017;周烽松等,2019),而鮮有對(duì)城市土壤重金屬高光譜反演的研究,且大多探索城市不同功能區(qū)土壤重金屬反演模型,如李瓊瓊等(2019)和劉曉清等(2019)基于土壤Zn、Pb高光譜特征,分別構(gòu)建了上海閔行居民區(qū)和城市交通綠地的SMLR和PLSR模型,驗(yàn)證了運(yùn)用土壤光譜估算城市土壤重金屬的可行性,且PLSR模型取得了較佳預(yù)測(cè)效果;王榮華(2017)則通過對(duì)上海城市樣帶土壤光譜特征進(jìn)行分析,建立了不同土地利用類型下的高光譜反演模型,研究表明SMLR和PLSR模型在不同功能區(qū)的預(yù)測(cè)效果明顯不同,并認(rèn)為該點(diǎn)與人類干預(yù)相關(guān)。城市重金屬污染因素繁雜,規(guī)律難尋,且嚴(yán)重威脅居民生命安全,因而對(duì)城市重金屬含量及其分布特征進(jìn)行定量監(jiān)測(cè)具有重大意義。
模型方法中,遙感技術(shù)、統(tǒng)計(jì)學(xué)建模等方法的綜合應(yīng)用,拓寬了重金屬動(dòng)態(tài)監(jiān)測(cè)的分析維度,從而達(dá)到從宏觀定性到微觀定量的本質(zhì)飛躍(譚林等,2017)。預(yù)測(cè)模型相對(duì)常規(guī)檢測(cè)能便捷、精準(zhǔn)的分析判斷土壤重金屬污染現(xiàn)狀和趨勢(shì),是監(jiān)測(cè)土壤重金屬的重要手段之一(趙忠明等,2012)?;谕寥乐亟饘俟庾V的多響應(yīng)帶及其波段間的強(qiáng)相關(guān)性,目前多采用基于光譜變換指標(biāo)的神經(jīng)網(wǎng)絡(luò)、SMLR、PLSR等非線性預(yù)測(cè)模型,模型預(yù)測(cè)精度得到提高。然而,任紅艷等(2009)在構(gòu)建礦區(qū)農(nóng)田土壤As、Fe預(yù)測(cè)模型時(shí)發(fā)現(xiàn),主成分分析比PLSR模型反演精度更高,因此,需要根據(jù)具體的重金屬研究對(duì)象確定適合的反演模型。城市土壤重金屬污染問題關(guān)乎國計(jì)民生,引發(fā)社會(huì)各界重視,依靠傳統(tǒng)手段進(jìn)行土壤重金屬研究相對(duì)落后,目前高光譜遙感以其波段多、數(shù)據(jù)量大、圖譜合一等優(yōu)勢(shì)應(yīng)用廣泛。因此本文基于重金屬含量實(shí)測(cè)數(shù)據(jù)和ASD采集的高光譜數(shù)據(jù),研究并建立邯鄲市重金屬SMLR、PLSR定量反演模型,旨在定量估算邯鄲市土壤重金屬含量,提高土壤重金屬監(jiān)測(cè)時(shí)效性,對(duì)城市居民健康具有重要意義,同時(shí)也可在波段設(shè)置方面為后續(xù)邯鄲市土壤重金屬監(jiān)測(cè)和土壤環(huán)境保護(hù)工作提供借鑒和支持。
本文研究區(qū)是河北省第三大城市——邯鄲市,該區(qū)域四季分明,溫帶大陸性季風(fēng)氣候顯著,氣候宜人。邯鄲市地勢(shì)自西向東傾斜,地貌類型復(fù)雜多樣,土地利用地域分異明顯(吳旭等,2010)。自西向東依次為山地、丘陵、平原,中西部山地丘陵區(qū)地形破碎、植被稀疏,水土流失嚴(yán)重,礦井塌陷面積大,灰塵污染隨處可見。全市人口眾多,近年來邯鄲市耕地劇減,人地矛盾突出(陳風(fēng)云,2014),另外人類活動(dòng)如化工生產(chǎn)、農(nóng)藥化肥施用、畜禽養(yǎng)殖等,導(dǎo)致外源重金屬進(jìn)入土壤富集,土壤退化嚴(yán)重,造成該區(qū)域土壤重金屬高污染現(xiàn)狀。基于上述研究,在研究區(qū)內(nèi)隨機(jī)選取31個(gè)樣本,在采樣的同時(shí)用手持GPS定位,挖取0—20 cm深的淺表土樣約1 kg,用標(biāo)號(hào)的保鮮袋密封運(yùn)回實(shí)驗(yàn)室,經(jīng)自然風(fēng)干去除草根石礫后研磨,過100目篩子后分成兩份,以備重金屬含量分析和光譜測(cè)定(王小劍等,2019)。圖1為研究區(qū)土壤樣本分布圖。
1.2.1 土壤重金屬含量檢測(cè)與分析
土壤樣品經(jīng)三酸消解后采用 ICP-OES法獲得Fe、Cd、Co、Cr、Cu、Mn、Ni、Pb、Zn、As、Hg共11種土壤重金屬含量數(shù)據(jù),檢測(cè)出限均小于0.05 mg·kg-1,測(cè)定均由空白樣和加標(biāo)回收樣控制質(zhì)量(王小劍等,2019),得到表1所示重金屬元素含量統(tǒng)計(jì)特征。由表1可知,除As外,其余重金屬元素均呈現(xiàn)中等變異性(>20%),元素含量呈近似正態(tài)分布,進(jìn)一步由K-S正態(tài)檢驗(yàn)的P值均大于0.05,接受樣區(qū)土壤樣本呈正態(tài)分布,即土壤樣本具有隨機(jī)代表性。內(nèi)梅羅綜合污染指數(shù)P綜表明,研究區(qū)Cd、Hg、Pb污染最為嚴(yán)重,Cr、Cu、Ni、Zn污染較輕。
1.2.2 光譜測(cè)定與預(yù)處理
圖1 研究區(qū)土壤采樣點(diǎn)分布圖Fig.1 Distribution map of soil samples in the study area
表1 土壤重金屬元素含量統(tǒng)計(jì)特征Table 1 Statistical characteristics of heavy metal elements content in soil
采用美國ASD Field 4地物波譜儀自帶的高密度反射探頭進(jìn)行光譜數(shù)據(jù)采集,實(shí)驗(yàn)于暗箱中進(jìn)行,土壤樣本分別放置于直徑10 cm,深1 cm的盛樣器皿中,垂直照射刮平的樣本表面。采樣前進(jìn)行儀器預(yù)熱并使用參考白板進(jìn)行標(biāo)定,每個(gè)土樣采集8條光譜曲線,用光譜處理軟件ViewSpecPro查看并剔除明顯錯(cuò)誤光譜,求平均值作為光譜反射率初始數(shù)據(jù)(易興松等,2018)。光譜預(yù)處理能凸顯光譜的特征波段,消減光譜信息的隨機(jī)誤差,提高模型的預(yù)測(cè)能力,因而在光譜分析中十分必要(Galvez-sola et al.,2010),主要處理方法包括光譜平滑、光譜變換、連續(xù)統(tǒng)去除等。因此,本文使用光譜儀軟件自帶的斷點(diǎn)修正工具消除不同探測(cè)元件造成的誤差,于ENVI中采用9點(diǎn)加權(quán)移動(dòng)平均法對(duì)光譜平滑降噪,圖2為經(jīng)斷點(diǎn)修正和平滑處理前后的土樣反射光譜,光譜較為穩(wěn)定,且經(jīng)修正后的曲線在1000 nm和1700 nm處變的更平滑。目標(biāo)光譜測(cè)定受儀器、背景環(huán)境等影響,光譜信息被削弱,因而變換光譜數(shù)據(jù)指標(biāo),以消除或減弱背景噪聲誤差,增強(qiáng)目標(biāo)光譜信息,提高信噪比(汪大明,2018)。本文將經(jīng)修正和平滑降噪處理后的反射率光譜稱為反射光譜R,分別提取R,R的一階微分(R′)、二階微分(R″),R的倒數(shù)對(duì)數(shù),R的倒數(shù)對(duì)數(shù)的一階微分、二階微分,R的平方根,R的連續(xù)統(tǒng)去除(CR)等共8種指標(biāo)的光譜值,以備后續(xù)土壤重金屬反演。
1.2.3 土壤重金屬高光譜建模
目前研究多從統(tǒng)計(jì)學(xué)角度入手,利用實(shí)測(cè)高光譜數(shù)據(jù)與土壤重金屬含量數(shù)據(jù)之間的相關(guān)性,通過特征波段選取建立經(jīng)驗(yàn)統(tǒng)計(jì)模型,實(shí)現(xiàn)重金屬高光譜定量估算(張秋霞等,2017)。在SPSS 24.0中,計(jì)算重金屬元素含量與 8種指標(biāo)光譜值的相關(guān)系數(shù),結(jié)果表明微分指標(biāo)與土壤重金屬的相關(guān)性較原始反射光譜得到大幅度提高,尤其是二階微分。剔除噪聲明顯的 350—400 nm和2480—2500 nm兩個(gè)邊緣波段,其余波段按照微分指標(biāo)值與重金屬元素含量相關(guān)性大小排序,并篩選出在0.05或0.01水平顯著相關(guān)且相關(guān)性最大的前15個(gè)波段作為光譜特征候選波段(徐夕博等,2018),若光譜指標(biāo)值與某一重金屬含量最大相關(guān)性絕對(duì)值低于0.5,則該重金屬不再建立相應(yīng)指標(biāo)模型。將提取特征波段的不同指標(biāo)值作為自變量,元素含量值作為因變量,在SPSS中建立SMLR模型,在SIMCA-P 11.0中建立偏最小二乘PLSR模型。研究中將各重金屬含量從小到大對(duì)樣本排序,每隔2個(gè)樣本抽取一個(gè)樣本,共抽取10個(gè)樣本作為模型預(yù)測(cè)集,剩余21個(gè)樣本作為建模集,分別用于模型建立與驗(yàn)證。
圖2 土壤光譜反射率R曲線處理前后對(duì)比Fig.2 Comparison of soil spectral reflectance R before and after treatment
1.2.4 模型驗(yàn)證與評(píng)價(jià)
土壤重金屬光譜反演受空間非連續(xù)性、光譜預(yù)處理、樣本數(shù)量等因素影響,模型選擇和反演精度不同(葉明亮等,2018;Wei et al.,2011)。決定系數(shù)R2常用來評(píng)價(jià)回歸模型的優(yōu)劣,但隨著模型引入自變量個(gè)數(shù)的增加,R2將不斷增大,因而對(duì)自變量個(gè)數(shù)不同的回歸模型進(jìn)行比較時(shí),不能簡單地用R2作為評(píng)價(jià)回歸方程的標(biāo)準(zhǔn),還必須考慮方程所包含的自變量個(gè)數(shù)的影響。因此本文通過校正決定系數(shù)AdjustedR2評(píng)估回歸模型的擬和優(yōu)度,通過建模均方根誤差RMSEC和預(yù)測(cè)均方根誤差RMSEP對(duì)模型的預(yù)測(cè)能力進(jìn)行評(píng)價(jià),計(jì)算公式如下:
其中,xi為土樣重金屬元素含量實(shí)測(cè)值,模型樣本重金屬含量平均值,為模型預(yù)測(cè)值,P為模型入選特征波段數(shù),n為模型樣本數(shù),Nc、Np分別為建模和預(yù)測(cè)模型樣本個(gè)數(shù)。AdjustedR2可抵消樣本數(shù)量對(duì)模型決定系數(shù)R2的影響,是衡量所建模型好壞的重要指標(biāo)之一,其值越大代表模型擬合效果越好,而RMSE表征模型誤差,其值越小模型精度越高。表2、3所示,統(tǒng)計(jì)了R′、R′′以及這4種主要指標(biāo)的相關(guān)模型信息,而其他4種指標(biāo)因與重金屬相關(guān)性差、建模效果普遍較差而不再探討。
表2 重金屬含量與各微分指標(biāo)值最大相關(guān)波段統(tǒng)計(jì)Table 2 Statistical analysis of the maximum correlation band between heavy metal content and each differential index value
通過相關(guān)分析發(fā)現(xiàn),光譜指標(biāo)變換可以增強(qiáng)光譜信號(hào),提高重金屬與波譜相關(guān)性r,突出光譜特征波段,對(duì)模型的精度影響較大。圖3所示為反射光譜R及其相關(guān)微分指標(biāo)與重金屬含量的相關(guān)性圖,研究發(fā)現(xiàn),二階微分指標(biāo)與重金屬的相關(guān)性大于一階微分指標(biāo)與重金屬的相關(guān)性,反射率倒數(shù)對(duì)數(shù)的一階導(dǎo)數(shù)與重金屬的相關(guān)性大于反射率的一階導(dǎo)數(shù)的相關(guān)性。表2所示為微分指標(biāo)與土壤重金屬含量最大相關(guān)波段統(tǒng)計(jì),表中可以看出Co、Cu、As、Hg的反射率倒數(shù)對(duì)數(shù)的一階導(dǎo)數(shù)、Cr的反射率倒數(shù)對(duì)數(shù)的二階倒數(shù)、Pb的反射率的一階導(dǎo)數(shù)等與重金屬的最大相關(guān)性低于 0.5,這些重金屬將不再建立光譜指標(biāo)波段不能用于相應(yīng)重金屬的光譜指標(biāo)模型的建立。
基于4種微分光譜指標(biāo),分別建立各重金屬元素的PLSR與SMLR預(yù)測(cè)模型,統(tǒng)計(jì)并分析不同微分指標(biāo)預(yù)測(cè)模型的均方根誤差 RMSE和修正決定系數(shù)AdjustedR2,根據(jù)AdjustedR2越大、RMSE越小模型效果越好的原則,統(tǒng)計(jì)得到表3、表4基于4種微分指標(biāo)的最優(yōu)SMLR、PLSR模型信息。
對(duì)比各重金屬4種相應(yīng)指標(biāo)的所有模型信息,研究表明,(1)土壤重金屬元素基于各微分指標(biāo)的PLSR模型的建模和預(yù)測(cè)精度整體上大于SMLR模型,且二階微分模型建模精度優(yōu)于一階微分模型;各土壤元素基于微分指標(biāo)的SMLR和PLSR模型驗(yàn)證精度均低于建模精度,模型預(yù)測(cè)均方根誤差RMSEP均大于建模均方根誤差RMSEC。(2)所有微分模型中,反射率倒數(shù)對(duì)數(shù)的二階微分PLSR模型建模精度高達(dá)99.8%,反射率的二階導(dǎo)數(shù)、反射率倒數(shù)對(duì)數(shù)的二階導(dǎo)數(shù)的PLSR模型建模精度區(qū)間分別為 0.768—0.903、0.752—0.998,且二階微分SMLR建模AdjustR2均大于0.6,表明光譜微分處理可以有效提高建模精度;(3)除Hg、Zn元素外,其余元素的最優(yōu)反演模型都為二階微分模型;幾種金屬的最優(yōu) PLSR預(yù)測(cè)模型精度范圍為 0.216—0.854,按預(yù)測(cè) AdjustR2從高到低排序依次為:Hg>Ni>Cu>As>Co>Cd>Zn>Mn>Pb>Fe>Cr,其中以反射率導(dǎo)數(shù)對(duì)數(shù)的二階導(dǎo)微分模型為主,說明光譜倒數(shù)對(duì)數(shù)的微分處理可以有效提高建模預(yù)測(cè)精度。(4)幾種金屬的最優(yōu) SMLR模型建模精度區(qū)間為0.719—0.936,按建模AdjustR2從高到低排序依次為:Cu>Hg>Fe>Cd>Mn>Zn>Cr>Co>Ni>As>Pb,預(yù)測(cè)模型精度而SMLR預(yù)測(cè)模型中僅Hg元素預(yù)測(cè)模型AdjustR2大于0.5,其余元素預(yù)測(cè)效果欠佳。(5)綜合考慮土壤元素基于微分指標(biāo)的SMLR和PLSR模型建模和預(yù)測(cè)的AdjustedR2、RMSE,從而得出Hg、Fe、Cd、Co、As元素可以得到較好的預(yù)測(cè)結(jié)論。采用 PLSR與 SMLR方法建模和預(yù)測(cè)相比,PLSR建模和預(yù)測(cè)的均方根誤差總體較小,模型擬合較優(yōu),預(yù)測(cè)能力較好,且基于二階導(dǎo)指標(biāo)的兩種模型均取得了較好的預(yù)測(cè)結(jié)果。
表3 基于4種微分指標(biāo)的重金屬最優(yōu)SMLR模型預(yù)測(cè)分析Table 3 Prediction analysis of the optimal SMLR model for heavy metals based on four differential indexes
表4 基于4種微分指標(biāo)的重金屬最優(yōu)PLSR模型預(yù)測(cè)分析Table 4 Prediction analysis of the optimal PLSR model for heavy metals based on four differential indexes
圖3 反射光譜R及其相關(guān)微分指標(biāo)與重金屬含量的相關(guān)性rFig.3 Correlation r of reflection spectrum R and its related differential indexes with heavy metal content
本研究 SMLR模型中基于倒數(shù)對(duì)數(shù)的微分預(yù)測(cè)模型取得了較好的預(yù)測(cè)效果,但相對(duì)于PLSR效果稍差,驗(yàn)證了基于不同光譜變換指標(biāo)的PLSR模型比SMLR模型預(yù)測(cè)效果更好。研究使用風(fēng)干篩選研磨后的土樣,模型精度受土壤水分、顆粒大小等客觀條件影響較小,但土壤組成混雜,光譜信息微弱難以被清晰提取,因此選取合適的特征波段建模十分重要。此外,受外界環(huán)境因素影響,以及土壤數(shù)據(jù)采集、處理存在偏差,某些指標(biāo)下金屬建模和預(yù)測(cè)精度欠佳。本研究在一定程度上實(shí)現(xiàn)了對(duì)幾種重金屬元素含量的預(yù)測(cè),但不同重金屬應(yīng)嘗試采用不同光譜指標(biāo)建模,以期達(dá)到最佳預(yù)測(cè)效果,且后續(xù)研究應(yīng)充分考慮土壤空間異質(zhì)性,以及不同尺度效應(yīng)與反演模型的耦合關(guān)系,對(duì)模型的適用性展開研究。此外,基于高光譜數(shù)據(jù)量大的特點(diǎn),開發(fā)專用的智能處理系統(tǒng),從而促進(jìn)高光譜遙感技術(shù)的應(yīng)用和發(fā)展也是未來的研究趨勢(shì)。
本文基于樣本實(shí)測(cè)高光譜數(shù)據(jù),結(jié)合地學(xué)統(tǒng)計(jì)理論和相關(guān)分析方法研究并建立不同重金屬基于不同光譜指標(biāo)的遙感估算模型,研究表明:重金屬含量與土壤光譜之間的相關(guān)性,是建立重金屬含量預(yù)測(cè)模型的必須考慮因素;特征波段的選取以及光譜指標(biāo)的選擇對(duì)預(yù)測(cè)模型的優(yōu)劣起著重要作用;模型統(tǒng)計(jì)結(jié)果顯示,光譜變換可以提高特征波段選取的精準(zhǔn)性,從而提高模型效果;基于不同光譜變換指標(biāo)的 PLSR模型比 SMLR模型總體預(yù)測(cè)效果較好。本研究中基于光譜倒數(shù)對(duì)數(shù)的微分模型,其預(yù)測(cè)精度最高可達(dá)到 0.854,一定程度上能滿足對(duì)邯鄲市土壤重金屬預(yù)測(cè)要求。隨著遙感以及計(jì)算機(jī)技術(shù)的發(fā)展,土壤重金屬預(yù)測(cè)模型不斷豐富和完善,對(duì)土壤重金屬的監(jiān)測(cè)將更加高效簡捷,從而為土壤環(huán)境保護(hù)和城市居民健康提供保障。