周益安,周 昊,勞聰聰
(1.杭州市南排工程建設(shè)管理服務(wù)中心,杭州310019;2.浙江省水利河口研究院(浙江省海洋規(guī)劃設(shè)計(jì)研究院),杭州310020;3.河海大學(xué)水利水電學(xué)院,南京210098)
土壤含水率(SMC)是土壤最重要的組成部分之一,影響著土壤的物理性質(zhì)和土壤養(yǎng)分的溶解、轉(zhuǎn)移,故而對土壤含水率進(jìn)行監(jiān)測具有重要意義。傳統(tǒng)的土壤含水率監(jiān)測方法主要有依靠土壤介電特性、土壤電導(dǎo)率、電磁波、中子法等[1,2],但這些方法易受土壤物理化學(xué)特性的影響而產(chǎn)生局限性,無法滿足實(shí)時(shí)、在線以及高精度測量的要求[3]。而高光譜技術(shù)能夠高效且精準(zhǔn)的性能[4,5],彌補(bǔ)了傳統(tǒng)方法的局限性。
高光譜技術(shù)憑借其高效、快速的優(yōu)勢在土壤含水率監(jiān)測的研究中得到重視。以往的研究主要是利用光譜反射率進(jìn)行直接反演,如彭翔等[6],尹業(yè)彪等[7]和姚艷敏等[8]的研究。雖然這些研究對土壤含水率也具有較好的效果,但是模型具有多個(gè)自變量,相對復(fù)雜。Wang 等[9]發(fā)現(xiàn)利用光譜指數(shù)在預(yù)測土壤含水率方面是可行,而且利用光譜指數(shù)建模有效降低了模型的復(fù)雜程度。但是未探索三維光譜指數(shù)在土壤含水率預(yù)測方面的效果。已有研究表明在土壤有機(jī)質(zhì)含量預(yù)測方面,三維光譜指數(shù)相比于一維二維光譜指數(shù)更有優(yōu)勢[10]。所以有必要研究三維光譜指數(shù)在土壤含水率預(yù)測方面的效果,為土壤含水率快速估算提供參考。
本文選取浙江永康地區(qū)的土壤樣本進(jìn)行研究,測定土樣的光譜反射率,并對原始光譜反射率(R)進(jìn)行一階微分(FD)和二階微分(SD)等處理,再構(gòu)建不同維度的光譜指數(shù),最后采用偏最小二乘回歸模型(PLSR)分析不同光譜指數(shù)與土壤含水率之間的定量關(guān)系,以期找到對土壤含水率最敏感的光譜指數(shù)。
研究區(qū)域?yàn)檎憬揽档貐^(qū)(28°45′N,119°53′E)。該地區(qū)海拔96 m,為亞熱帶季風(fēng)氣候,夏熱冬溫,四季分明,季風(fēng)發(fā)達(dá),年降水量介于800~1 600 mm 之間。該地區(qū)主要農(nóng)作物為水稻,因此,有效監(jiān)測土壤含水率,對該地區(qū)的精準(zhǔn)農(nóng)業(yè)發(fā)展是必要的。
本次研究以永康地區(qū)采集的159個(gè)不同含水率的土樣為研究樣本,采樣深度為0~20 cm。收集時(shí)剔除浸入體,然后將土樣放入采樣袋中密封、編號、稱重并帶回實(shí)驗(yàn)室。從采樣袋內(nèi)取20 g 左右有代表性的土樣放入鋁盒內(nèi),蓋上蓋稱重,并記錄鋁盒的編號和重量。將沒加蓋的鋁盒放入干燥箱內(nèi),在105 ℃、24 h 恒溫條件下用干燥法[11]測得土壤樣本質(zhì)量含水率ωm。其中土壤樣本質(zhì)量含水率ωm的公式為:
式中:M1為土樣質(zhì)量(含鋁盒);M2為干燥后土樣質(zhì)量(含鋁盒);M3為空鋁盒質(zhì)量。
利用ASD 公司生產(chǎn)的FieldSpec 3 光譜儀(波長350~2 500 nm),在照明控制的暗室中測量土壤的光譜反射率。該光譜儀的采樣間隔:350 到1 000 nm 為1.4 nm,1 000 到2 500 nm 為2 nm,重采樣間隔為1 nm。將159 份制備好的土壤樣品裝入黑色容器(直徑10cm,深度2cm),填充后將表面刮平。光譜測定的光源為50 W 鹵素?zé)?,使用視場?°的光纖探頭,根據(jù)洪永勝等[12]的研究將測量時(shí)距土壤樣品表面距離定為50 cm,光源的天頂角定為50°,探頭至待測樣品的表面距離定為15 cm。每次光譜測定之前,去除暗電流并校準(zhǔn)白板。每個(gè)土壤樣品分別在4 個(gè)方向測量(3 次旋轉(zhuǎn),每次90°),每個(gè)方向保存5 條光譜曲線,總共20 條。最后利用ViewSpecProV6.0.11 軟件進(jìn)行算術(shù)平均計(jì)算,得到土壤樣品的實(shí)際反射光譜數(shù)據(jù)。
為消除光譜測試環(huán)境、高頻隨機(jī)噪聲和雜散光等干擾因素引起的噪聲,提高數(shù)據(jù)的信噪比。故剔除信噪比較低的邊緣波長350~400 nm 和2 401~2 500 nm,并利用Savitzky-Golay(SG)濾波法對所有光譜數(shù)據(jù)(400~2 400 nm)進(jìn)行平滑去噪。為了降低光譜數(shù)據(jù)的冗余,將光譜數(shù)據(jù)按10 nm 的間隔重采樣,得到400~2 400 nm,采樣間隔為10 nm,共201 個(gè)波長數(shù)據(jù)用以后續(xù)的分析計(jì)算。此外,利用Matlab 軟件計(jì)算光譜曲線的一階微分(FD)及二階微分(SD),以此降低基線漂移的影響,突出曲線特征。
選取了六種光譜指數(shù),包括3 個(gè)二維光譜指數(shù)(RI,DI,NDI),3 個(gè)三維光譜指數(shù)(TBI1,TBI2及TBI3),用以分析比較不同維度指數(shù)在土壤含水率預(yù)測方面的效果[13]。具體公式如下:
式中:Rλ1,Rλ2和Rλ3為400~2 400 nm 中任意3 個(gè)波長,且Rλ1≠Rλ2≠Rλ3。
偏最小二乘回歸模型(PLSR)集成了主成分分析、典型相關(guān)分析和多元線性回歸等的優(yōu)點(diǎn)。在建模過程中,降維、信息集成和波長優(yōu)選等方法極大地提高了系統(tǒng)提取主成分的能力,因而在光譜數(shù)據(jù)建模中得到了廣泛的應(yīng)用[14,15]。本文選取偏最小二乘回歸模型進(jìn)行建模分析。
利用K-S 算法將159 個(gè)樣本劃分為兩部分,其中106 個(gè)樣本用于建模,其余53 個(gè)樣本用以精度驗(yàn)證。土壤含水率的樣本特征見圖1。由圖1 可知,3 個(gè)樣本集的最大值及最小值接近,平均土壤含水率值均在23%左右。由圖中3個(gè)小提琴子圖的形狀可以看出,3個(gè)樣本集之間的樣本分布基本一致,這為后面的分析建模提供了一定的數(shù)據(jù)基礎(chǔ)。
圖1 描述樣本特征的小提琴圖Fig.1 Violin diagram describing the characteristics of the sample
利用偏最小二乘回歸模型建立土壤含水率的預(yù)測模型,通過對比各模型的建模均方根誤差(RMSEc)、建模決定系數(shù)()、預(yù)測均方根誤差(RMSEv)、預(yù)測決定系數(shù)(Rv2)、相對分析誤差(RPD),篩選出最優(yōu)模型并對研究區(qū)土壤含水率進(jìn)行預(yù)測。Rc 2,用以判定模型的穩(wěn)定程度,越接近于1 說明模型的穩(wěn)定性越好;RMSEc及RMSEp用于表征模型的準(zhǔn)確性,其值越小表明模型的精度越高。另外,利用RPD對模型性能進(jìn)行評估。當(dāng)RPD<1.5 時(shí),模型幾乎不能對樣本進(jìn)行預(yù)測;當(dāng)1.5<RPD<2時(shí),模型對樣本可以粗略估計(jì);當(dāng)2<RPD<2.5時(shí)表明模型具有較好的定量預(yù)測能力;當(dāng)2.5<RPD<3 時(shí)模型具有很好的預(yù)測能力;當(dāng)RPD>3.0 時(shí)表示模型具有極好的預(yù)測能力[16]。其中計(jì)算R2、RMSE及RPD的公式如下:
式中:yi和分別為檢驗(yàn)樣本的觀測值和預(yù)測值;為樣本觀測值的平均值;n為預(yù)測樣本數(shù)。
式中:yi和y^i分別為驗(yàn)證樣本的觀測值和預(yù)測值;n為預(yù)測樣本數(shù)。
式中:S.D為樣本觀測值的方差;RMSE為均方根誤差。
變量投影重要性分析(VIP)是基于PLSR 的一種變量重要性分析方法,通過計(jì)算VIP得分來表征各自變量對因變量的解釋能力,并根據(jù)解釋能力實(shí)現(xiàn)自變量的排序[17],計(jì)算公式為:
式中:p是自變量的個(gè)數(shù);m是主成分的總數(shù);SSYf是第f個(gè)主成分解釋方差的平方和;SSYtotal是因變量平方和;F是主成分總數(shù);給出了第f個(gè)主成分中第j個(gè)變量的重要性。VIPj值越大,自變量重要性越高。一般認(rèn)為,當(dāng)自變量的VIP值大于1時(shí),該自變量被判定為重要的自變量。
圖2為不同預(yù)處理的土壤光譜曲線。由圖2(a)可知,土壤光譜在1 400、1 900 和2 200 nm 等3 個(gè)波長處,均有明顯的吸收谷,有研究表明這些吸收谷與土壤含水率有關(guān)[18]。經(jīng)過一階微分處理之后,見圖2(b),可以發(fā)現(xiàn)光譜曲線水分吸收谷進(jìn)一步凸顯,也在一定程度上消除光譜曲線的基線漂移。而二階微分[見圖2(c)]雖然有效消除了基線漂移,但是同時(shí)也凸顯了許多噪聲,可能會(huì)對后面的建模分析造成一定的影響。
圖2 不同預(yù)處理的土壤光譜曲線Fig.2 Soil spectral curves of different pretreatments
由圖3可知,原始光譜反射率與SMC之間的敏感波長主要集中在1 400~1 600 nm 以及1 900~2 300 nm 區(qū)間。這個(gè)區(qū)間與土壤水分敏感區(qū)間一致。經(jīng)過一階微分處理之后,進(jìn)一步加強(qiáng)對SMC 敏感的波長,削弱對SMC 敏感度不高的波長,出現(xiàn)“強(qiáng)者越強(qiáng),弱者越弱”的現(xiàn)象。而二階微分光譜更加突出了此現(xiàn)象,只有幾個(gè)較強(qiáng)波長的R2較大,其余的波長的R2都相對較小,甚至接近于零(呈現(xiàn)紫色)。通過提取原始光譜反射率和一階微分光譜及二階微分光譜的最佳波長反射率作為一維光譜指數(shù),用以建模分析。具體的指數(shù)見表1。
圖3 一維決定系數(shù)矩陣圖Fig.3 One-dimensional determination coefficient matrix diagram
通過Matlab 編程實(shí)現(xiàn)二維相關(guān)矩陣的計(jì)算,計(jì)算結(jié)果如圖4 所示。由圖4 可知,不同形式的二維光譜指數(shù)和不同光譜曲線均會(huì)影響R2的值,R-NDI 和R-RI 具有較好的效果,其R2可達(dá)0.88?;诙A微分光譜的指數(shù),R2普遍偏低,均小于0.8。光譜經(jīng)過二階微分處理后,其光譜反射率值明顯減小,大部分波長都集中在0附近,而且曲線邊緣震蕩明顯,凸顯了噪聲,如圖4(c)所示。這些因素可能導(dǎo)致基于二階微分的二維光譜指數(shù)效果較差。但二維光譜指數(shù)與一維光譜指數(shù)相比仍具有較大的提升,主要是通過在二維空間中搜尋波長的最佳組合,為指數(shù)的選擇提供了更多的可能。通過各個(gè)矩陣中選取R2最大的指數(shù)作為二維光譜指數(shù)用以建模分析,具體見表1。
圖4 二維決定系數(shù)矩陣圖Fig.4 Two-dimensional determination coefficient matrix diagram
通過Matlab 編程實(shí)現(xiàn)三維相關(guān)矩陣的計(jì)算,計(jì)算結(jié)果如圖5~圖7所示。由這3個(gè)圖可知,不同形式的三維光譜指數(shù)和不同光譜曲線均會(huì)影響R2的值,R-TBI1和FD-TBI1具有較好的效果,其R2可達(dá)0.89。除SD-TBI3較低以外,三維光譜指數(shù)的R2值都在0.84 以上。三維光譜指數(shù)與二維光譜指數(shù)相比具有一定的優(yōu)勢,說明將組成指數(shù)的波長擴(kuò)展至3個(gè)具有一定的作用。本文選取三維相關(guān)矩陣中R2最高值的指數(shù)作為三維光譜指數(shù)用以后續(xù)的建模分析,具體見表2。
圖5 TBI1的三維決定系數(shù)矩陣圖Fig.5 Three-dimensional determination coefficient matrix diagram of TBI1
圖6 TBI2的三維決定系數(shù)矩陣圖Fig.6 Three-dimensional determination coefficient matrix diagram of TBI2
圖7 TBI3的三維決定系數(shù)矩陣圖Fig.7 Three-dimensional determination coefficient matrix diagram of TBI3
由表1可知,不同維度的光譜指數(shù)波長組成有所不同,但主要集中在1 400、1 900及2 100 nm 這幾個(gè)對水分較為敏感的波長附近。三維光譜指數(shù)具有較高的R2可能綜合考慮了3個(gè)波長組成效果。在選擇指數(shù)時(shí),主要通過統(tǒng)計(jì)方法,對指數(shù)的機(jī)理性解釋還有一定的欠缺,即使指數(shù)具有較好的效果。
表1 不同光譜指數(shù)的波長組成Tab.1 Wavelength composition of different spectral indices
利用不同維度的指數(shù)分別建立PLSR 模型,具體結(jié)果見表2。由表2 知,基于TBI2的土壤含水率模型具有最佳的效果,其Rv2可達(dá)0.92,RPD可達(dá)3.32,說明模型具有精確預(yù)測的性能。與一維光譜指數(shù)的模型相比具有明顯的優(yōu)勢,其RPD僅為2.28。但是和二維指數(shù)模型相比只具有一定的優(yōu)勢。
表2 基于光譜指數(shù)的偏最小二乘回歸建模與預(yù)測效果Tab.2 Partial least squares regression modeling and prediction effect based on spectral index
為了更加直觀的分析各個(gè)模型的預(yù)測性能,繪制圖8基于不同模型預(yù)測值與實(shí)測值的散點(diǎn)圖。由圖8可以發(fā)現(xiàn),TBI2[見圖8(f)]的預(yù)測帶最窄,說明其預(yù)測的精度最高,推薦TBI3模型作為所研究區(qū)域的土壤含水率預(yù)測模型。
圖8 基于不同光譜指數(shù)模型的預(yù)測精度對比Fig.8 Comparison of prediction accuracy based on different spectral index models
為了確定各個(gè)指數(shù)的相對重要性,計(jì)算了各個(gè)指數(shù)的VIP值并繪制成圖9。由圖9 可以發(fā)現(xiàn)三維光譜指數(shù)只有兩個(gè)在1以下,而二維光譜指數(shù)有4 個(gè)在1 以下,一維光譜指數(shù)均在1以下,說明三維光譜指數(shù)重要性高于二維及一維光譜指數(shù)。且VIP 最高的為R-TBI1,這與最佳土壤含水率預(yù)測模型(TBI2)的建模指數(shù)具有一定的偏差。但兩者都是三維光譜指數(shù),說明三維光譜指數(shù)具有一定的優(yōu)勢,但是在以后的研究中仍需進(jìn)一步探索更適用于土壤含水率的三維光譜指數(shù)形式。
圖9 不同光譜指數(shù)的VIP圖Fig.9 VIP diagrams of different spectral indices
以浙江永康地區(qū)土壤為研究對象,使用159個(gè)樣品的土壤含水率數(shù)據(jù)和相應(yīng)的高光譜數(shù)據(jù),用不同維度的光譜指數(shù)分別構(gòu)建土壤含水率偏最小二乘回歸模型,通過模型對比分析,得到以下結(jié)論:
(1)三維光譜指數(shù)相比于一維二維光譜指數(shù)對土壤含水率更加敏感。利用三維光譜指數(shù)構(gòu)建土壤含水率預(yù)測模型更有利。
(2)基于TBI2 的偏最小二乘回歸模型具有最佳的預(yù)測效果,其RPD可達(dá)3.32。
(3)對于土壤含水率預(yù)測模型而言,R-TBI1 相比于其他的光譜指數(shù)更具重要性,其VIP 值達(dá)1.04。基于三維光譜指數(shù)的土壤含水率模型的構(gòu)建,對遙感精準(zhǔn)監(jiān)測土壤墑情具有重要的意義。