国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

土壤氧化鐵的特征波長選擇和高光譜反演*

2022-08-13 05:58趙海龍王俊杰
關(guān)鍵詞:反演波長光譜

趙海龍, 甘 淑, 2**, 王俊杰, 胡 琳

(1. 昆明理工大學(xué)國土資源工程學(xué)院 昆明 650093; 2. 云南省高校高原山區(qū)空間信息測繪技術(shù)應(yīng)用工程研究中心 昆明650093)

鐵是土壤礦物中主要的元素之一, 是最重要的過渡元素, 而土壤中鐵大多是以化合態(tài)的形式存在。由于氧化鐵的聚集和遷移活動(dòng)受到化學(xué)風(fēng)化、生物循環(huán)等因素影響, 反映了土壤的淋溶過程、風(fēng)化發(fā)育程度以及土壤的地帶性分布特征, 常被作為描述土壤發(fā)育和土壤分類的指標(biāo)之一。因此, 掌握土壤中氧化鐵含量信息對(duì)于揭示土壤環(huán)境狀況, 指導(dǎo)農(nóng)作物生產(chǎn)具有重要意義。

常規(guī)的氧化鐵含量測定技術(shù)成本高、周期長, 利用高光譜技術(shù)可以快速而高效測定土壤氧化鐵含量。高光譜以其光譜分辨率高、波長連續(xù)性強(qiáng)的特點(diǎn), 被廣泛用來進(jìn)行土壤理化屬性的反演。目前已有許多學(xué)者對(duì)氧化鐵和反射光譜之間的關(guān)系做出了許多成果。何挺等指出土壤中氧化鐵含量與反射率呈負(fù)相關(guān), 且在400 nm、450 nm、490 nm、700 nm、870 nm等處存在吸收峰。彭杰等指出氧化鐵含量與斜率呈線性負(fù)相關(guān), 與截距呈線性正相關(guān), 由此說明了利用土壤線的參數(shù)預(yù)測氧化鐵含量具有可行性。熊俊峰等利用偏最小二乘回歸法將全反射波段分別與土壤中的全鐵、游離鐵、無定形鐵的含量進(jìn)行回歸建模, 結(jié)果表明游離鐵和無定形鐵精度變化不大, 全鐵的估算精度變化較大, 因?yàn)槿F中的硅酸鐵易受到有機(jī)質(zhì)和土壤深度的干擾。譚潔等指出不同森林土壤氧化鐵含量和不同土壤類型光譜曲線在可見光-近紅外波段內(nèi)變化趨勢(shì)基本一致, 均形似陡坎?;谔卣鞑ㄩL篩選方面的研究, 丁海寧等利用相關(guān)系數(shù)峰值-逐步分析方法篩選出氧化鐵的特征波長, 構(gòu)建的估算模型均較穩(wěn)定。李雙權(quán)等利用相關(guān)性達(dá)<0.05顯著性水平的波長構(gòu)建氧化鐵的偏最小二乘回歸估算模型, 模型的決定系數(shù)達(dá)0.791。陽洋等提取的敏感波長是把通過<0.01顯著性檢驗(yàn)的波長進(jìn)一步進(jìn)行多元逐步線性手段剔除共線性波長獲取的, 最終構(gòu)建的模型決定系數(shù)達(dá)0.790。朱亞星等利用無信息變量消除(UVE)、競爭性自適應(yīng)重采樣(CARS)、無信息變量消除結(jié)合競爭性自適應(yīng)重采樣(UVE-CARS)、競爭性自適應(yīng)重采樣結(jié)合無信息變量消除(CARS-UVE)這4種變量篩選方法, 得到有機(jī)質(zhì)最佳的變量篩選方法為UVE-CARS, 基于變量篩選后的模型性能優(yōu)于全波段模型。

綜上, 當(dāng)前學(xué)者們對(duì)氧化鐵反演研究已經(jīng)取得了較好的成果, 土壤氧化鐵的吸收特征都已明確, 但是土壤的理化性質(zhì)比較復(fù)雜, 不同地區(qū)其特征波長有所差異, 導(dǎo)致在定量研究氧化鐵時(shí), 只根據(jù)吸收特征波段來反演氧化鐵含量的精度不夠理想。同時(shí), 由于光譜數(shù)據(jù)的高度冗余性, 僅利用相關(guān)性分析不能達(dá)到去除冗余性的效果。云南祿豐恐龍谷南緣地區(qū)分布有多種土壤類型, 其土地利用類型多樣, 同時(shí)有著特殊的地形構(gòu)造。因此, 本文以云南祿豐恐龍谷南緣地表土壤氧化鐵為研究對(duì)象, 在基于相關(guān)性分析的基礎(chǔ)上, 利用IRIV、CARS和SPA等波長篩選算法對(duì)光譜數(shù)據(jù)進(jìn)一步的降維, 從而確定該地區(qū)土壤氧化鐵的特征波長, 并利用隨機(jī)森林和偏最小二乘回歸方法構(gòu)建土壤氧化鐵的反演模型, 用以實(shí)現(xiàn)該地區(qū)氧化鐵含量快速、準(zhǔn)確地預(yù)測。

1 研究區(qū)概況

恐龍谷南緣地區(qū)位于云南省中部滇中高原的楚雄彝族自治州祿豐市境內(nèi)(24°55′25″~25°22′05″N, 102°00′00″~102°9′00″E)。研究區(qū)東西寬約6 km、南北長約8 km, 面積約為32 km, 整體呈現(xiàn)四周高, 中間低的凹陷坑, 最高海拔為2200 m, 最低海拔為1302 m。研究區(qū)所在的祿豐市屬亞熱帶低緯度高原季風(fēng)氣候。該地區(qū)是一個(gè)小型的中生代紅色沉積盆地, 屬于奧陶系下統(tǒng)紅石頁巖組, 簡要的巖性為紫紅色、灰綠色粉砂巖。據(jù)祿豐市1982年及1985年兩次土壤調(diào)查資料顯示, 市內(nèi)有棕壤、黃棕壤、紅壤、紫色土和水稻土5個(gè)土類、10個(gè)亞類、20個(gè)土屬、40個(gè)土種。其中紫色土占土地面積的56.9%, 為轄區(qū)內(nèi)最主要的土壤類型; 其次為紅壤, 占土地面積的22.8%; 黃棕壤占7.8%; 水稻土占6.3%。

2 研究方法

2.1 樣本采集與數(shù)據(jù)獲取

土壤樣品于2021年7月底采于云南省楚雄彝族自治州祿豐市恐龍谷南緣山地, 根據(jù)地勢(shì)地貌差異進(jìn)行采樣點(diǎn)布設(shè)。每個(gè)樣本點(diǎn)采樣范圍為5 m×5 m。在采樣范圍內(nèi), 根據(jù)5點(diǎn)采樣法, 采集5~20 cm的表層土壤, 取約1 kg土壤裝袋保存, 并用手持GPS記錄該點(diǎn)的經(jīng)緯度坐標(biāo), 共135份樣品, 采樣點(diǎn)分布如圖1所示。采集的土壤類型有紫壤、紅壤和黃棕壤。將采集回來的土壤首先去除雜草、石塊等雜質(zhì), 然后進(jìn)行自然風(fēng)干處理, 最后用瑪瑙球碾磨機(jī)研磨并過100目篩。將處理后的每份樣品分成兩份, 一份用于測定土壤氧化鐵的含量, 另一份進(jìn)行土壤的高光譜數(shù)據(jù)測量。結(jié)合樣品分析質(zhì)量要求等技術(shù)規(guī)范, 在滿足樣品的檢出限、準(zhǔn)確度、精密度的前提下, 參照《土壤農(nóng)業(yè)化學(xué)分析方法》, 選用X射線熒光光譜法進(jìn)行土壤氧化鐵含量的測定。

圖1 土壤采樣點(diǎn)分布圖Fig.1 Distribution map of soil sampling points

土壤光譜測量在暗室中進(jìn)行, 光譜儀為ASD Field Spec 3 地物光譜分析儀, 光源為探頭內(nèi)置鹵素光源, 探頭內(nèi)徑為21 mm, 前視場角為25°, 波段范圍為350~2500 nm。在300~1000 nm間隔內(nèi), 光譜采樣間隔和分辨率分別為1.4 nm和3 nm; 在1000~2500 nm內(nèi), 光譜采樣間隔和分辨率分別為2 nm和10 nm。將光譜采樣間隔重采樣為1 nm后, 得到的波長數(shù)為2151個(gè)。光譜測量時(shí), 把土壤樣品放在寬10 cm、高2 cm的容器內(nèi), 并把土壤樣品刮平, 以減少土壤樣品粗糙度對(duì)光譜測量的影響。探頭與土壤樣品保持2 cm的高度, 并垂直對(duì)準(zhǔn)樣品。每個(gè)樣品采集5條光譜曲線, 對(duì)5條光譜曲線取平均后作為樣本的實(shí)際光譜反射率曲線。

2.2 數(shù)據(jù)預(yù)處理

受儀器自身的影響, 300~399 nm、2451~2500 nm處信噪比較低, 因此把該兩段光譜數(shù)據(jù)作去除處理, 共得到2051個(gè)波長。為了消除由于周圍環(huán)境引起的干擾誤差, 去除隨機(jī)因素的干擾, 采用窗口數(shù)為9, 多項(xiàng)式階數(shù)為2的Savizky-Golay平滑之后的曲線作為原始光譜曲線(origin spectral reflectance, OR)。為了進(jìn)一步降低環(huán)境對(duì)光譜數(shù)據(jù)的干擾, 加強(qiáng)土壤氧化鐵含量與光譜反射率之間的相關(guān)性, 對(duì)OR進(jìn)行一階微分(first-order differential reflectance, FD)、倒數(shù)的對(duì)數(shù)(reciprocal logarithm reflectance, RL)變換處理。

2.3 特征波長選取

由于高光譜數(shù)據(jù)冗余度較大, 在進(jìn)行回歸分析時(shí), 并不是所有的波長都對(duì)建模精度的提高有益, 如果把所有的波長都進(jìn)行建模分析, 不僅運(yùn)算量巨大, 而且會(huì)降低建模精度。因此在建模之前進(jìn)行特征波長選取是必要的。

利用相關(guān)系數(shù)法(correlation coefficient method, CC)對(duì)氧化鐵含量與原始光譜及其各變換光譜進(jìn)行皮爾森相關(guān)性分析, 計(jì)算每個(gè)波長與土壤樣本氧化鐵含量的相關(guān)系數(shù), 把通過=0.01顯著性檢驗(yàn)的波長作為特征波長。相關(guān)系數(shù)的公式如下:

迭代保留信息變量(iteratively retaining informative variables, IRIV)是一種通過隨機(jī)組合來考慮變量之間可能存在的交互作用的策略, 基于模型集群分析方法, 逐個(gè)波長變量計(jì)算包含或者不包含該變量時(shí)的均方根誤差平均值, 得到兩者之差(DMEAN)和非參數(shù)檢驗(yàn)方法曼-惠特尼檢驗(yàn)的值, 從而確定該變量的重要性。每次迭代都保留強(qiáng)信息變量和弱信息變量, 直至消除無信息變量和干擾變量, 最后逆向消除獲得最佳的特征變量。通過相關(guān)性分析獲得的波長中, 并不是所有波長都對(duì)建模效果有益, 有些波長信息量可能對(duì)建模效果有干擾。因此, 進(jìn)一步利用IRIV處理可以獲得對(duì)建模效果有益的強(qiáng)信息變量和弱信息變量。

競爭性自適應(yīng)重加權(quán)算法(competitive adaptive reweighted sampling, CARS)是一種基于蒙特卡洛采樣和PLS回歸系數(shù)的特征波長選擇方法, 把每個(gè)變量當(dāng)成一個(gè)個(gè)體, 選擇適應(yīng)性能力較強(qiáng)的個(gè)體。具體步驟為: 隨機(jī)選取固定比率的樣本作為校正集并建立PLS模型, 然后計(jì)算模型的回歸系數(shù)的絕對(duì)值和每個(gè)波長對(duì)應(yīng)的權(quán)重, 利用指數(shù)衰減函數(shù)和自適應(yīng)重加權(quán)采樣法對(duì)變量進(jìn)行選擇, 同時(shí)計(jì)算交叉驗(yàn)證均方根誤差,次采樣后, 選擇均方根誤差最小的子集作為最優(yōu)變量子集。本研究中, 對(duì)通過相關(guān)性分析獲得的波長中, 進(jìn)一步利用CARS可以消除無信息變量, 最終選擇對(duì)模型起關(guān)鍵作用的變量。

連續(xù)投影法(successive projections algorithm, SPA)是一種前向變量選擇算法, 運(yùn)用變量投影操作尋找冗余度最低、共線性最小的光譜特征變量, 從而提高模型的穩(wěn)定性和準(zhǔn)確性。本研究中, 通過相關(guān)性分析獲得的波長之間具有共線性, 利用連續(xù)投影法, 可以消除波長之間的共線性。

2.4 模型建立與評(píng)價(jià)

隨機(jī)森林回歸(random forest regression, RF)是一種基于決策樹的集成算法, 對(duì)于數(shù)據(jù)是非線性以及較大時(shí)應(yīng)用較多。它本身不是一個(gè)單獨(dú)的機(jī)器學(xué)習(xí)算法, 而是通過在數(shù)據(jù)上構(gòu)建多個(gè)模型, 集成所有模型的建模結(jié)果, 以此來獲取比單個(gè)模型更好的結(jié)果。隨機(jī)森林模型構(gòu)建在python第三方庫scikit-learn中實(shí)現(xiàn)。

偏最小二乘回歸(partial least squares regression, PLSR)集合了多元線性回歸分析、相關(guān)性分析和主成分分析的優(yōu)點(diǎn), 可以很好地解決變量之間的多重共線性問題, 同時(shí)能夠揭示光譜數(shù)據(jù)中最大氧化鐵含量變化的主成分。在模型構(gòu)建時(shí)采用交叉檢驗(yàn)可以確定最佳的主成分因數(shù)。偏最小二乘回歸利用Minitab分析軟件實(shí)現(xiàn)。

采用Kennard-Stone (K-S)算法進(jìn)行建模集和驗(yàn)證集的劃分, 選用70%的樣本劃分為建模集, 剩下的30%為驗(yàn)證集。根據(jù)CC和基于CC的CARS、IRIV、SPA算法篩選出的波長分別作為自變量, 土壤氧化鐵含量作為因變量, 建立反演模型。由于土壤樣本呈現(xiàn)非正態(tài)分布, 采用RPIQ可以給出模型更真實(shí)的評(píng)價(jià)。因此反演模型的精度指標(biāo)采用決定系數(shù)(R)、均方根誤差(RMSE)、性能與四分位數(shù)間距比(RPIQ)和1∶1線4個(gè)參數(shù)來衡量。

3 結(jié)果與分析

3.1 氧化鐵含量統(tǒng)計(jì)分析

利用K-S法選出來的建模集共有95個(gè)樣本, 驗(yàn)證集共有40個(gè)樣本。利用Origin 2021經(jīng)過統(tǒng)計(jì)分析可以看出研究區(qū)土壤氧化鐵最小值為18.293 g?kg, 最大值為66.978 g?kg, 均值為41.201 g?kg, 變異系數(shù)為28.393%, 屬于中等變異。氧化鐵統(tǒng)計(jì)特征如表1所示。氧化鐵含量與諸多因素有關(guān), 地類、成土母巖以及地質(zhì)地貌都會(huì)影響土壤氧化鐵含量, 而其中影響最大的是成土母巖。該地區(qū)主要的巖性為紫紅色、灰綠色粉砂巖。

表1 研究區(qū)氧化鐵含量統(tǒng)計(jì)特征Table1 Statistical characteristics of iron oxide content of the study area

3.2 土壤光譜特征

圖2為研究區(qū)全部土壤樣本的反射率光譜曲線, 其反射率整體較低, 范圍為0.02~0.49, 但其光譜曲線變化趨勢(shì)大致相同。

圖2 研究區(qū)全部土壤樣品的光譜反射率曲線Fig.2 Soil spectral reflectance curves of all soil samples of the study area

在可見光波段, 光譜反射率較低, 但增加較快;在近紅外波段, 光譜反射率較高, 光譜曲線變化較為平緩; 在短波紅外波段, 光譜反射率略有下降。同時(shí), 在波長500 nm、900 nm處有微弱氧化鐵吸收峰; 在波長1400 nm、1900 nm和2210 nm處分別是OH和HO兩者的合成峰、HO吸收峰和黏土礦物中金屬-OH振動(dòng)合頻產(chǎn)生的吸收峰。為了探明不同氧化鐵含量的光譜特征, 將樣本集的氧化鐵含量先從高到低排序, 并分成6份, 計(jì)算每一部分的平均氧化鐵含量和平均光譜反射率曲線, 得到如圖3所示的不同氧化鐵含量的光譜反射率曲線圖??梢园l(fā)現(xiàn)土壤的氧化鐵含量越高,相應(yīng)的光譜反射率越低。

圖3 不同氧化鐵含量的土壤樣本的光譜反射率曲線Fig.3 Spectral reflectance curves of soil samples with different iron oxide contents

3.3 特征波長選取

如果將全波段直接利用變量優(yōu)選算法去篩選波長, 不僅效率太低, 且可能會(huì)丟失對(duì)建模有用的信息。因此, 本文先利用相關(guān)性分析進(jìn)行變量的粗選, 然后利用IRIV、CARS和SPA算法進(jìn)行變量的精選。具體步驟為: 首先將訓(xùn)練集樣本的原始光譜(OR)、OR一階微分(FD)以及OR的倒數(shù)對(duì)數(shù)(RL)與氧化鐵含量進(jìn)行相關(guān)性分析, 把通過<0.01顯著性檢驗(yàn)的波長作為粗選的特征波長, 然后利用IRIV、CARS和SPA對(duì)光譜數(shù)據(jù)進(jìn)一步的降維。

OR、FD以及RL與氧化鐵含量相關(guān)性分析后, 通過<0.01顯著性檢驗(yàn)的波長分別達(dá)2051個(gè)、1252個(gè)和2051個(gè), 即原始光譜和倒數(shù)的對(duì)數(shù)光譜全波長都通過了<0.01顯著性檢驗(yàn)(圖4)。

圖4 原始光譜及其變換光譜與土壤氧化鐵含量的相關(guān)系數(shù)Fig.4 Correlation coefficient of original spectrum and its transformed spectrum with iron oxide content

經(jīng)過相關(guān)性篩選后的波長仍然較多, 波長之間的共線性強(qiáng), 因此需要利用變量優(yōu)選算法進(jìn)一步減少波長的數(shù)量。特征波長選擇的結(jié)果如圖5所示。

圖5 不同算法選擇的特征波長Fig.5 Feature bands selected by different algorithms

以FD為例, 本文設(shè)置IRIV波長篩選算法為5折交叉驗(yàn)證, 最大主成分為10。隨著迭代次數(shù)的增加, 保留的變量逐漸減少, 之后進(jìn)行反向消除從而保留52個(gè)變量, 迭代次數(shù)為8。選擇的波長在可見光波段有431 nm、436 nm和461 nm, 其他波長集中在近紅外和短波紅外波段。

設(shè)置CARS算法為5折交叉驗(yàn)證, 最大主成分為10, 重采樣次數(shù)為50。在指數(shù)衰減函數(shù)的作用下, 選擇的變量隨著運(yùn)行次數(shù)的增加呈指數(shù)減少, 其交叉驗(yàn)證均方根誤差值呈現(xiàn)先減小后增加的趨勢(shì), 在第22次采樣有最小的交叉驗(yàn)證均方根誤差值, 即選擇的變量子集為最佳。最終選擇的變量數(shù)為79個(gè), 選擇的波長在447 nm、1100 nm、1440 nm、1900 nm、2000 nm和2300 nm附近。

SPA對(duì)FD進(jìn)行特征波長篩選時(shí), 隨著篩選變量的增加, RMSE先是迅速下降, 當(dāng)變量數(shù)為92時(shí), RMSE值達(dá)到穩(wěn)定。SPA篩選出來的波長分布較廣, 大致分布在400~476 nm、804 nm、838 nm、842 nm、1080 nm、1354 nm等波長。總體來說, 選擇的特征波長分布在近紅外和短波紅外波段的居多, 其余區(qū)間分布較少。

3.4 反演模型構(gòu)建

3.4.1 隨機(jī)森林反演模型構(gòu)建

隨機(jī)森林回歸將相關(guān)性分析和在相關(guān)性分析基礎(chǔ)上進(jìn)一步進(jìn)行IRIV、CARS和SPA算法獲得的特征波長作為輸入自變量, 氧化鐵含量作為因變量進(jìn)行回歸建模。為了模型更穩(wěn)定和結(jié)果更可靠, 模型訓(xùn)練過程中使用5折交叉驗(yàn)證, 同時(shí)對(duì)隨機(jī)森林中的最重要的兩個(gè)參數(shù): n_estimators (決策樹的數(shù)量)和max_depth (樹的最大深度)調(diào)優(yōu)利用網(wǎng)格搜索法實(shí)現(xiàn)。隨機(jī)森林反演結(jié)果如表2所示。

從表2可以看出, 不同的光譜變換以及不同的波長篩選方法, 精度有一定的差異。從光譜變換對(duì)精度的影響來看, FD的驗(yàn)證集精度總體比其他光譜高, OR和RL均較低, 不能很好地預(yù)測土壤氧化鐵含量, 這與FD能夠消除背景噪聲的干擾同時(shí)對(duì)重疊混合光譜進(jìn)行分解有關(guān)。從波長篩選對(duì)精度的影響來看, OR和FD中, CC-CARS比CC、CC-IRIV和CC-SPA的驗(yàn)證集精度高, 且變量數(shù)量也比較少, 具有較好的預(yù)測性和穩(wěn)定性。OR中, CC-CARS的驗(yàn)證集最高, 達(dá)0.5, 但只能粗略估算氧化鐵含量。而CC、CCIRIV和CC-SPA的均未達(dá)0.5, 不能進(jìn)行該地區(qū)的氧化鐵含量估算; FD中, 4種波長篩選方法均能預(yù)測土壤氧化鐵的含量, 其中CC-CARS精度最高, 建模集達(dá)0.929, RMSE為2.832 g?kg, 驗(yàn)證集為0.709, RMSE為7.252 g?kg, RPIQ值為2.794, 具有很強(qiáng)的預(yù)測能力; RL中, 4種波長篩選方法的驗(yàn)證集均未達(dá)0.5, 不能進(jìn)行該地區(qū)的氧化鐵含量估算。

表2 土壤氧化鐵含量隨機(jī)森林反演結(jié)果Table2 Random forest inversion results for soil iron oxide content

3.4.2 偏最小二乘反演模型構(gòu)建

偏最小二乘回歸建模輸入的自變量和因變量和上述隨機(jī)森林回歸建模相同, 建模過程中的交叉驗(yàn)證采用逐一剔除方法。偏最小二乘回歸建模結(jié)果如表3所示。

表3 土壤氧化鐵含量偏最小二乘反演結(jié)果Table3 Partial least squares inversion results for soil iron oxide content

從光譜變換對(duì)精度的影響來看, RL的驗(yàn)證集中除CC-IRIV之外, 其他波長篩選方法的精度均比OR和FD要高。這與RL能夠放大吸收特征, 降低背景噪聲的影響有關(guān)。從特征波長篩選對(duì)精度的影響來看, OR中, CC-IRIV的驗(yàn)證集最高, 為0.570, 其次為CC-SPA、CC和CC-CARS, 驗(yàn)證集分別為0.569、0.540和0.498; FD中, CC-IRIV的驗(yàn)證集最高, 達(dá)0.609, 其次為CC、CC-CARS和CC-SPA, 驗(yàn)證集分別為0.496、0.485和0.447; RL中, CC-CARS處理后精度最高, 其建模集和驗(yàn)證集分別為0.833和0.826, RMSE分別為4.361 g·kg和5.600 g·kg, RPIQ為3.618, 具有優(yōu)秀的模型穩(wěn)定性和預(yù)測能力, 其次為CC-SPA、CC和CC-IRIV, 其驗(yàn)證集分別為0.745、0.632和0.420。所有模型中, OR-CC-CARS-PLSR、FDCC-PLSR、FD-CC-CARS-PLSR、FD-CC-SPA-PLSR和RL-CC-IRIV-PLSR驗(yàn)證集均低于0.5, 且其RPIQ值分別為2.128、2.125、2.102、2.029和1.980, 不能預(yù)測土壤中氧化鐵含量。

3.4.3 模型對(duì)比

為了對(duì)比土壤氧化鐵在不同模型的反演效果, 選擇兩種建模方法中預(yù)測效果最好的模型, 繪制了驗(yàn)證集的氧化鐵實(shí)測值與預(yù)測值的1∶1散點(diǎn)圖。如圖6所示。

圖6 驗(yàn)證集土壤氧化鐵含量實(shí)測值與預(yù)測值散點(diǎn)圖Fig.6 Scatter plot of the observed and predicted values of soil iron oxide content in the validation set

從圖中可以看出, 兩種模型的預(yù)測值和實(shí)測值基本分布在1∶1線周圍, 其中RL-CC-CARS-PLSR更接近1∶1線, 模型的預(yù)測精度最高。通過綜合比較建模集和驗(yàn)證集的精度, 認(rèn)為RL-CC-CARS-PLSR模型的預(yù)測精度更高, 模型更加穩(wěn)定, 因此可作為預(yù)測該地區(qū)土壤氧化鐵含量的最佳模型。

4 討論

本研究以云南祿豐恐龍谷南緣地表土壤的室內(nèi)高光譜數(shù)據(jù)結(jié)合氧化鐵含量的化驗(yàn)數(shù)據(jù), 反演該地區(qū)的氧化鐵含量。研究表明, 原始光譜反射率與氧化鐵含量呈負(fù)相關(guān)性, 這與何挺等的研究結(jié)果一致。

RF建模中, FD的整體精度要比OR和RL高。而PLSR建模中, RL整體精度比其他光譜高。這說明, 在面對(duì)土壤的復(fù)雜性、氧化鐵含量變異系數(shù)較高時(shí), 組合不同的光譜變換建模方法, 可通過比較最后的精度選擇最佳的光譜變換和建模方法。總體來說, PLSR比RF具有更高的預(yù)測精度, 因?yàn)镻LSR可以運(yùn)用主成分分析提取到對(duì)土壤氧化鐵含量相關(guān)性最大的波長, 從而減少了光譜維度。這與眾多研究成果相似。

由于高光譜的波長冗余性, 進(jìn)行特征波長提取是必要的。不同研究者在特征波長提取方法中存在差異, 包括利用不同的光譜變換與氧化鐵含量進(jìn)行相關(guān)性分析提取特征波長, 或者在相關(guān)性分析基礎(chǔ)上利用逐步回歸和主成分分析進(jìn)行特征波長的選取。本文首先利用相關(guān)性分析進(jìn)行特征波長的粗選, 然后在相關(guān)性分析的基礎(chǔ)上利用IRIV、CARS和SPA算法進(jìn)一步進(jìn)行特征波長的精選?;诖朔椒ǖ腞F和PLSR模型均比僅基于相關(guān)性篩選變量的模型精度高, 且篩選出來的波長數(shù)遠(yuǎn)比基于相關(guān)性篩選的波長少, 不僅降低了模型的復(fù)雜度, 而且提高了模型精度。不同的波長篩選方法, 模型精度有差異。最好的波長篩選方法為CC-CARS, 篩選出的波長大部分都分布在500 nm、700 nm和900 nm處, 這與鐵的吸收峰一致, 其他波段分布在1400 nm、2200 nm處, 這是由于受到各種功能基團(tuán)的影響, 與前人的研究一致。因此該方法可以作為一種有效的波長篩選方法。

土壤光譜是土壤屬性的綜合反映, 本文在估算氧化鐵含量時(shí), 未考慮有機(jī)質(zhì)對(duì)氧化鐵的影響。根據(jù)圖6的實(shí)測值與預(yù)測值散點(diǎn)圖發(fā)現(xiàn), FD-CC-CARSRF模型在氧化鐵含量低于30 g·kg時(shí), 預(yù)測值不穩(wěn)定, 使預(yù)測值偏高。這可能是氧化鐵含量較低, 光譜反射率受有機(jī)質(zhì)影響導(dǎo)致的。氧化鐵含量較低時(shí), 光譜反射率將由有機(jī)質(zhì)主導(dǎo)。根據(jù)本次研究區(qū)氧化鐵含量統(tǒng)計(jì)分析, 存在部分點(diǎn)位氧化鐵含量較低, 對(duì)于有機(jī)質(zhì)是否對(duì)該點(diǎn)位土壤的光譜反射率造成影響暫不可知。因此下一步研究要考慮有機(jī)質(zhì)對(duì)氧化鐵的影響, 以實(shí)現(xiàn)更高精度的反演。

對(duì)于研究區(qū)不同土壤類型, 僅利用原始光譜進(jìn)行分析達(dá)不到精度要求, 往往需要進(jìn)行光譜變換。結(jié)合相關(guān)系數(shù)法和波長選擇算法, 可提升模型的預(yù)測精度。對(duì)比發(fā)現(xiàn)RL-CC-CARS-PLSR模型的預(yù)測精度最高, 這與倒數(shù)的對(duì)數(shù)光譜可以放大光譜的吸收特征和降低背景噪聲的影響有關(guān), 同時(shí), 由于氧化鐵含量與光譜反射率呈負(fù)相關(guān), 且CARS算法是根據(jù)PLS回歸系數(shù)來進(jìn)行波長的選擇, 因此線性模型在進(jìn)行土壤氧化鐵含量的反演有著更好的表現(xiàn)。該方法可為不同土壤類型的氧化鐵含量反演提供參考。

5 結(jié)論

本研究以云南祿豐恐龍谷南緣為研究區(qū), 以研究區(qū)的紫壤、紅壤和黃棕壤為研究對(duì)象, 利用實(shí)測高光譜土壤數(shù)據(jù)和土壤氧化鐵含量信息, 選用3種光譜和4種變量篩選方法, 結(jié)合隨機(jī)森林和偏最小二乘回歸對(duì)氧化鐵含量進(jìn)行定量反演。結(jié)果表明, 將OR、FD和RL與氧化鐵含量分別進(jìn)行相關(guān)性分析, 發(fā)現(xiàn)利用CC進(jìn)行特征波長的篩選后, 保留的波長數(shù)仍然過多, 這對(duì)后續(xù)模型的精度帶來負(fù)影響。在相關(guān)性分析基礎(chǔ)上利用IRIV、CARS和SPA算法可以使特征波長數(shù)量進(jìn)一步減少。

隨機(jī)森林和偏最小二乘回歸建模, 分別以篩選后的特征波長為自變量, 氧化鐵含量為因變量構(gòu)建氧化鐵的反演模型。通過結(jié)合光譜變換、波長篩選方法以及建模方法, 反演模型結(jié)果有所不同。隨機(jī)森林構(gòu)建的模型中, FD結(jié)合特征波長選擇算法構(gòu)建的模型較優(yōu), 其中FD-CC-CARS-RF的建模集為0.929, 驗(yàn)證集為0.709, RMSE為7.252 g·kg, RPIQ為2.794。偏最小二乘回歸中, RL結(jié)合特征波長選擇算法構(gòu)建的模型較優(yōu), 其中RL-CC-CARS-PLSR的建模集為0.833, RMSE為4.361 g·kg, 驗(yàn)證集為0.826, RMSE為5.600 g·kg, RPIQ為3.618。綜合1∶1散點(diǎn)圖, 發(fā)現(xiàn)RL-CC-CARS-PLSR的實(shí)測值和預(yù)測值均比較靠近1∶1線, 具有較好的預(yù)測結(jié)果。因此以RL-CC-CARS-PLSR為該地區(qū)的氧化鐵最佳反演模型。

猜你喜歡
反演波長光譜
煤炭礦區(qū)耕地土壤有機(jī)質(zhì)無人機(jī)高光譜遙感估測
杯中“日出”
郭守敬望遠(yuǎn)鏡獲取光譜數(shù)破千萬
基于紅外高光譜探測器的大氣CO2反演通道選擇
反演變換的概念及其幾個(gè)性質(zhì)
基于ModelVision軟件的三維磁異常反演方法
淺析光譜技術(shù)在200 nm以上和以下尺度范圍內(nèi)的不同
紫外分光光度法測定溶血率的研究