陳銀瑩,柳云龍, *
1. 上海師范大學地理系,上海 200234;2. 上海師范大學城市生態(tài)與環(huán)境研究中心,上海 200234
土壤反射光譜中隱藏著土壤信息,不同反射波段的反射值是不同土壤特性綜合信息的反映。分析土壤高光譜特性并利用其研究土壤問題,已廣泛應用于土壤方面的研究(黃淑玲等,2015;賴寧等,2015;Casa et al.,2012)。隨著工業(yè)化進程發(fā)展,大量重金屬污染物通過各類生產排放進入土壤中,由于重金屬不易被分解、易在土壤中富集,導致土壤重金屬污染(蔡茜茜,2018;遲光宇等,2017;Li et al.,2017)。且由于工業(yè)區(qū)受人為干擾強烈,污染源眾多,重金屬污染呈現種類多、差異大、空間分布變異大等特點,使得監(jiān)測難度上升(蔣煜峰等,2015;李小平等,2010)。傳統(tǒng)的實驗室重金屬含量測量方法雖然能夠獲取較高測量精度,但采樣效率低下且無法獲取連續(xù)的空間信息,在對重金屬污染源眾多、重金屬分布空間異質性高的工業(yè)區(qū)的研究中,傳統(tǒng)的研究方法無法較好地滿足對工業(yè)區(qū)土壤重金屬含量的檢測。
國內外研究發(fā)現,利用土壤光譜反射率反演預測土壤重金屬含量,較之傳統(tǒng)的實驗室測定方法,具有便捷快速、大批量、低成本、對土地破壞性低的特點(Lewis et al,2004;Viscarra et al.,2007)。一般地,自然環(huán)境中的土壤重金屬含量較低,并且對土壤光譜反射率在可見光-近紅外反射波譜內的影響微弱,甚至沒有任何影響(郭穎等,2018;Alloway,2013)。因此通過直接分析土壤重金屬元素的光譜特征來估算其含量的工作難以進行。然而,工業(yè)區(qū)受人類活動影響強烈,如工業(yè)生產排放、生活垃圾排放、汽車尾氣排放、汽車零部件磨損等,土壤中重金屬元素富集現象嚴重,較高的含量使得利用土壤高光譜進行土壤重金屬含量預測成為可能。此外,土壤中富集的重金屬元素與土壤中有機質、粘土礦物、鐵錳氧化物、碳酸鹽礦物等土壤組分存在一定相關關系——主要為吸附與賦存作用,使土壤組分對光譜反射率有所影響,為在可見光-近紅外反射波譜內間接預測土壤重金屬元素含量提供可能性參考(程先鋒,2017;Pinheiro et al.,2017),這是高光譜遙感探究土壤重金屬含量的機理所在。國內外研究表明,利用可見光-近紅外光譜能夠進行較大面積的土壤重金屬含量反演估算(王維等,2011;Tan et al.,2014;呂杰等,2015),但由于各研究區(qū)土壤類型不同,所受氣候、成土母質、生物以及人為活動影響不同,土壤物質組成具備差異性;且該物質本身的獨特光譜特征會導致土壤所反映的特征波段位置不同,同時由于各研究所采用的反演模型不同,導致最優(yōu)模型的選擇也有所差異(Kooistra et al.,2001;張威等,2014;張龍龍等,2015)。
在對多種土地利用類型,包括礦區(qū)、河流沉積區(qū)、郊區(qū)等區(qū)域的土壤重金屬的研究過程中,偏最小二乘回歸模型(Partial Least Squares Regression Model,PLSR)是利用土壤光譜反演土壤重金屬含量最常用的模型,一般適用于變量多而樣本少的數據;多元逐步回歸線性模型(Stepwise Multiple Linear Regression Model,SMLR)則是最為傳統(tǒng)的擬合模型,擬合過程自動剔除影響不明顯的變量,直接選擇具備突出影響的變量作為輸入變量進行擬合。多項研究表明,這兩種模型均能夠滿足較大區(qū)域的土壤重金屬含量反演需求,適用于本研究中變量多的數據特點(Shi et al.,2013;Shi et al.,2014;王菲等,2016;郭穎等,2018)。目前利用受強烈人為干擾的工業(yè)區(qū)土壤光譜反演土壤重金屬含量方面的研究為數不多,本研究選取上海閔行區(qū)西南部工業(yè)區(qū)土壤重金屬為研究對象,分析工業(yè)區(qū)土壤的光譜特征,確定反演土壤重金屬 Cu、Cr、Mn、Pb、Zn的特征波段,并采用偏最小二乘法及多元逐步回歸線性法建立重金屬高光譜預測模型,探討在城市工業(yè)區(qū)中利用高光譜數據估算土壤重金屬含量的適用性。
研究區(qū)為上海市閔行區(qū)西南部工業(yè)區(qū)(121°22′E,31°00′N),總面積 3.5 km2。重點發(fā)展機電產業(yè)(軌道交通、電站設備),以醫(yī)藥療產業(yè)(常用藥物)和輕工業(yè)(食品飲料)為輔。根據研究區(qū)域內地形分布、土地利用與覆蓋的狀況,在數字底圖上通過網格布點大致確定采樣點和取樣數,使采樣點分布相對均勻。實際取樣時,根據工業(yè)區(qū)內工業(yè)企業(yè)、建筑物和道路的實際分布特點,對采樣點數量和空間分布進行適度調整,土壤采樣深度為0~20 cm,采樣點GPS精確定位,共采集土壤樣品63個。采樣點分布如圖1所示。樣品帶回實驗室后,經風干、碾碎、過100目篩后,密封保存?zhèn)溆?。將樣品分為兩份,一份用于高光譜測定,一份用于重金屬含量分析。
圖1 研究區(qū)土壤采樣點分布圖Fig. 1 Distribution of soil sampling points in the study area
土壤樣本的反射光譜使用荷蘭 Ava Field-2便攜式高光譜地物波譜分析儀采集,波段范圍在300~1700 nm。在300~1040 nm范圍內采樣間隔為0.59 nm,在1040~1700 nm范圍內采樣間隔為3.8 nm,光譜分辨率為5 nm,輸出波段為1421個。選取預處理后的2 cm樣品放入直徑為10 cm的器皿內,為減少因土壤樣品表面凹凸不平所產生的散射光影響所測精度,對樣品表面進行刮平處理。選擇距離土壤表面20 cm的能夠提供平行光的鹵光燈作為光源,探頭采用 15°光源照射角度、5°視角場和15 cm探頭距離,同時利用標準白板進行定標,獲取絕對反射率。為減少測量不穩(wěn)定性所帶來的誤差,每個土樣采集 10條光譜曲線,去掉異常光譜曲線后取平均值,得到的平均值作為土壤樣品的實際反射光譜數據。采用X熒光分析檢測法進行土壤Cu、Cr、Mn、Pb、Zn全量分析,該方法具有制樣簡便、可分析種類多、無損、快速、準確的優(yōu)點,能夠同時檢測多種金屬元素且不產生廢棄物(王世芳等,2016;王鑫等,2018;Bilo et al.,2017;侯張明,2016;鐘山等,2014)。
光譜測定過程中由于光譜儀或外界其他光源的干擾會產生誤差,為消除背景噪聲、增大原始光譜曲線的特征、減弱原始數據的誤差,需要對數據進行平滑處理及數據變換,以提高光譜的性噪比(吳明珠等,2014)。利用 ENVI(Exelis Visual Information Solutions,Boulder,CO,USA)軟件對光譜數據進行平滑處理與包絡線去除處理,把反射率進行歸一化處理(0~1),消除光譜曲線背景噪音,突出光譜特征值。對光譜數據進行低階微分變換能夠有效去除背景漂移與基線干擾,放大原始數據所表達的信息,突出土壤原始光譜隱藏的反射特征。本研究對原始光譜數據進行一階微分(First Derivative,FD)、二階微分(Second Derivative,SD)、均方根一階微分(Root Mean Square First Derivative,RMSFD)、均方根二階微分(Root Mean Square Twice Derivative,RMSTD)、倒數一階微分(Reciprocal Transformation First Derivative,RTFD)、倒數二階微分(Reciprocal Transformation Second Derivative,RTSD)、倒數對數一階微分(Absorbance Transformation First Derivative,ATFD)、倒數對數二階微分(Absorbance Transformation Second Derivative,ATSD)共8種變換形式的處理(張秋霞等,2017;吳明珠等,2014;Shi et al.,2013)。
圖2 研究區(qū)樣本點土壤光譜曲線走勢圖Fig. 2 Spectral curve of soil in sampling points in the study area
為減少光譜測定過程中所產生的誤差和數據記錄的冗余、增強相似光譜之間的差別,需要對原始光譜進行平滑處理,處理后的 63個樣本點光譜曲線走勢見圖 2。土壤光譜曲線基本走勢大致分為4種基本類型,包含平直型(富含有機質的土壤)、緩斜型(與水耕熱化聯系的水稻土)、陡坎型(富鐵鋁土壤)、波浪型(干旱地區(qū)土壤)(戴昌達,1981)。由圖2可知,63個樣點土壤光譜反射率在10.01%~50.20%之間變化,土壤光譜反射率曲線基本平行且緩慢抬升,走勢基本一致,均屬于緩斜型。光譜曲線在可見光區(qū)域增加較快,在近紅外區(qū)域增加緩慢。光譜曲線在近紅外區(qū)域差異較大。土壤有機質和鐵氧化物對其產生的影響主要在可見光和近紅外波段,土壤含水量的增加使光譜反射率下降(徐彬彬等,1991)。圖3(a)所示為樣本光譜曲線去包絡線圖,經處理的光譜曲線突出顯示了光譜的吸收特征和反射特征。在可見光至部分近紅外(400~1650 nm)譜段內,受鐵氧化物的影響,最低反射率出現在409.55 nm處??傮w光譜反射率的吸收谷出現在425 nm處,吸收深度為0.43。在825~900 nm譜段受有機質的影響存在 C-H吸收帶,在1400~1425 nm譜段受粘土礦物中所含OH-基團和H2O的影響存在結晶水的吸收峰(程先鋒等,2017;江振藍等,2017)。圖3(b)所示為63個樣點中重金屬含量最高與最低樣點的光譜反射率及平均光譜反射率圖,重金屬含量最高的樣點光譜反射率低于重金屬含量最低的樣點光譜反射率,重金屬含量最低樣點的光譜反射率在400~600 nm之間,低于平均反射率(600~840 nm),二者反射率幾乎相等,840 nm之后雖然重金屬含量最低樣點的光譜反射率略低于平均反射率,但仍十分接近。這些差異性可作為分析土壤反射光譜與重金屬關系的基礎(肖捷穎等,2013)。
圖3 樣點光譜去包絡線圖和研究區(qū)重金屬含量最高與最低點光譜曲線以及所有樣點平均光譜曲線圖Fig. 3 Sample spectrum to the envelope graph and the spectral curves of the highest and lowest soil samples in the study area and the average spectral curves of all sample
對工業(yè)區(qū)土壤重金屬含量進行統(tǒng)計分析,結果如表1所示。由表1可知,土壤重金屬Cu、Cr、Mn、Pb、Zn含量平均值依次為 29.38、106.32、583.14、34.13、111.15 mg·kg-1,工業(yè)區(qū)土壤重金屬平均含量均超過上海市土壤環(huán)境背景值。變異系數表示各樣點重金屬含量的平均變異程度,在一定程度上能反映樣品受人為影響的程度。工業(yè)區(qū)土壤中Cr、Mn變異系數較小,分別為0.13、0.18,說明這兩種元素受外界影響比較一致,空間分異相對較小。土壤Cu、Pb、Zn的變異系數分別為0.6、0.86和0.55,空間分異較大,說明土壤Cu、Pb、Zn受外界干擾比較顯著,易受到較強的工業(yè)生產排放、交通運輸等人為活動因素影響(蔣煜峰等,2015)。對土壤5種重金屬含量進行相關分析,分析結果如表2所示。由表可知,土壤 Cu與 Pb、Zn,土壤Pb與Zn的含量在0.01水平呈顯著相關,土壤Cr與Mn在0.05水平呈顯著相關,表明工業(yè)區(qū)土壤重金屬之間表現為復合污染或者具有同源性,多數土壤樣品被2種以上重金屬元素污染(韓玉麗等,2015)。
為了獲取土壤重金屬含量與反射光譜之間的關系,對土壤重金屬含量與土壤光譜數據不同變換形式進行相關性分析。通過相關系數的大小確定特征波段范圍及最優(yōu)特征波段,結果見表 3,特征波段將作為反演因子進行數據建模??傮w而言,原始光譜數據經微分變換后能夠在某種程度上提高其與重金屬含量的相關性,但不同重金屬與不同光譜變換數據的相關性不同,特征波段也不同。土壤重金屬Cu與二階微分光譜變換數據相關性最強,特征波段范圍在1088.17~1440.21 nm,最優(yōu)特征波段為1440.21 nm。土壤重金屬Cr與方根二階微分光譜變換數據相關性最強,特征波段范圍在584.06~985.52 nm,最優(yōu)特征波段為834.44 nm。土壤重金屬 Mn與倒數一階光譜變換數據相關性最強,特征波段范圍在 756.22~1047.57 nm,最優(yōu)特征波段為984.98 nm。土壤重金屬Pb與方根二階微分光譜變換數據相關性最強,特征波段范圍在1372.65~1440.21 nm,最優(yōu)特征波段為 1440.21 nm。土壤重金屬Zn與二階微分光譜變換數據相關性最強,特征波段范圍在1011.18~1649.15 nm,最優(yōu)特征波段為1642.50 nm。一般認為,原始光譜的低階微分能夠放大數據特征,提高其與重金屬含量的相關性(于慶等,2018;賀軍亮等,2015)。本研究中,Cr、Mn、Pb含量與光譜原始數據的方根低階微分變換、倒數低階微分變換以及對數低階微分變換之后的相關性更強,也能夠用于反演模型的建立,這能夠為光譜數據預處理提供新的參考方法。5種重金屬的最優(yōu)特征波段均在近紅外波段范圍內,但不同重金屬的最優(yōu)特征波段位置不同,特征波段范圍也不一致,這與工業(yè)區(qū)內土壤組分受強烈人為活動影響較復雜,以及不同土壤組分對不同重金屬的吸附與賦存作用不同有關(張靜靜等,2018)。
表2 土壤重金屬含量相關系數矩陣Table 2 Soil heavy metal content correlation matrix
表1 工業(yè)區(qū)土壤重金屬含量的描述性統(tǒng)計分析Table 1 Descriptive statistical analysis of soil heavy metal content mg·kg-1
表3 不同重金屬與反射光譜相關波段分析結果Table 3 Results of analysis of bands associated with different heavy metals and reflectance spectra
隨機選取 51個樣本作為建模樣本用于模型建立,12個樣本作為驗證樣本用于模型精度檢驗。將土壤光譜數據的8種變換形式與重金屬含量在0.01水平上顯著相關的波段(即特征波段)作為自變量,5種重金屬含量作為因變量,分別采用偏最小二乘回歸模型(PLSR)以及多元逐步線性回歸模型(SMLR)構建工業(yè)區(qū)重金屬含量預測模型,分析建模效果,確定最優(yōu)模型并利用驗證樣本進行檢驗,最優(yōu)建模結果及其光譜變換形式如表4所示。
最優(yōu)模型的選擇要求檢驗所建模型的決定系數(Coefficient of Determination,R2)與均方根誤差(Root Mean Square Error,RMSE)的大?。ㄏ姆嫉?,2015;徐良驥等,2017)。決定系數R2反映模型的建模精度與穩(wěn)定性,一般認為R2<0.5,模型無法對所求變量進行預測;0.5≤R2<0.65時,模型具備初步預測能力;0.65≤R2<0.81時,模型具備較好的預測能力;R2≥0.81時,模型預測能力良好(Vohland et al.,2011)。均方根誤差則檢驗模型對樣本的擬合度,在對同種重金屬的不同預測模型進行檢驗時,誤差越低越好(程先鋒等,2017)。由表4可知,每種重金屬的最優(yōu)預測模型所選用的數據變換形式不同。土壤Cu、Pb、Zn偏最小二乘回歸最優(yōu)模型選用二階變換,土壤 Cr選用方根二階變換,土壤Mn選用倒數二階變換。多元逐步線性回歸模型中,土壤Cu、Mn最優(yōu)模型選用方根二階變換,土壤Cr、Pb選用倒數一階變換,土壤Zn選用倒數對數二階變換。從建模效果來看,PLSR建模與驗證的決定系數R2除Zn外均低于0.5,建模精度較低,不具備預測變量的能力。而SMLR建模的R2均達到0.65以上,其中Zn的R2達到0.974,均具備較好的預測能力;驗證的R2除Mn外其他均達到0.5以上。與PLSR建模精度相比,SMLR建模精度與驗證精度均明顯提高,RMSE均有所下降,說明SMLR預測模型反演預測效果更好,對樣本的擬合度更高,更具有穩(wěn)定性與可靠性。一般地,數據低階微分變換形式能夠提高反演精度,但多數研究僅采用一階微分、二階微分形式,而較少利用其他變換形式的低階微分形式進行模型反演(于慶等,2018;賀軍亮等,2015;龔紹琦等,2010)。本研究所建的5種重金屬的最優(yōu)反演模型中,精度最高的模型所使用的數據變換形式分別是方根二階變換、倒數一階變換、倒數對數二階變換,說明使用其他變換形式的低階微分能夠獲得比原數據的低階微分更高的模型精度,這可為今后的數據處理研究特別是工業(yè)區(qū)等受人為活動強烈影響區(qū)域的反演研究提供參考。
(1)經統(tǒng)計,上海閔行區(qū)西南部工業(yè)區(qū)土壤重金屬Cu、Cr、Mn、Pb、Zn存在明顯積累,含量平均值依次為29.38、106.32、583.14、34.13、111.15 mg·kg-1,且表現為復合污染或具有同源性。空間分布上,土壤Pb、Cu、Zn空間分異較大,變異系數分別為 0.86、0.6和 0.55,受到工業(yè)生產等強烈人為活動因素干擾;土壤Cr、Mn空間分異小,受外界干擾小。
(2)經降噪處理后工業(yè)區(qū)土壤光譜反射曲線整體走勢一致,呈緩斜型,反射率在10.01%~50.20%之間。除特定譜段受鐵氧化物(409.55 nm)、有機質(825~900 nm)、水(1400~1425 nm)的影響存在光譜曲線吸收帶外,光譜反射曲線走勢均隨波長增加而上升。
(3)土壤重金屬含量與不同光譜變換數據相關性分析結果表明,土壤Cu最優(yōu)特征波段為1440.21 nm;土壤Cr為834.44 nm;土壤Mn為984.98 nm;土壤Pb為1440.21 nm;土壤Zn為1642.50 nm。最優(yōu)特征波段均在近紅外波段范圍內。
表4 工業(yè)區(qū)土壤光譜反射率預測重金屬含量模型建模及驗證精度比較Table 4 Prediction of spectral reflectance of soil in industrial area comparison of modeling and verification accuracy of heavy metal content model
(4)與PLSR建模精度相比,SMLR建模的R2均達到0.65以上,其中Zn的R2達到0.974;驗證的R2除Mn外其他均達到0.5以上。SMLR的建模效果優(yōu)于PLSR,各項系數檢驗說明SMLR反演預測效果更好,對樣本的擬合度更高,更具有穩(wěn)定性與可靠性,所建模型基本能滿足工業(yè)區(qū)土壤重金屬含量反演預測需求。