王甜 王雪峰 袁瑩 劉嘉政
( 中國林業(yè)科學(xué)研究院資源信息研究所,北京,100091) ( 國家林業(yè)和草原局森林經(jīng)營與生長模擬重點實驗室)
沉香(Aquilariasinensis)是我國珍貴的藥材植物資源,多生長于南方山地雨林[1]。沉香苗期經(jīng)營離不開氮肥的施用,然而目前氮肥施用方式粗放、利用率低[2],這不僅污染環(huán)境[3],同時降低林業(yè)經(jīng)濟效益,因此在沉香經(jīng)營過程中及時診斷、按需施肥對于沉香生長及提高經(jīng)濟效益具有重要意義。葉片顏色變化是反映植物營養(yǎng)元素變化的重要指標(biāo)[4],傳統(tǒng)營養(yǎng)診斷費時費力且精度較低;高光譜成像數(shù)據(jù)豐富,但不適用于小尺度監(jiān)測;手持光譜儀技術(shù)獲得的數(shù)據(jù)之間冗余度大[5];相比之下,多光譜相機獲取圖像信息豐富,適用于地面和航空攝影,因而利用多光譜相機進行圖像氮素?zé)o損檢測技術(shù)被廣泛用于林木氮素營養(yǎng)狀況評價研究中。
近年來,數(shù)字圖像技術(shù)日益成熟,為植物營養(yǎng)診斷提供了有力的技術(shù)支持,國內(nèi)外研究者先后對不同生育期小麥(TriticumaestivumL.)[6-7]、玉米(ZeamaysL.)[8-10]、大豆(Glycinemax)[11]、水稻(OryzasativaL.)[12]等植物進行含氮量預(yù)測。人工智能的迅速發(fā)展,使神經(jīng)網(wǎng)絡(luò)模型預(yù)測含氮量的算法更為成熟[13-17]。人工智能的發(fā)展為小樣本、非線性、高維空間的樣本數(shù)據(jù)提供了更有效的擬合方法,但各方法所得的預(yù)測精度也受到權(quán)值、閾值以及輸入特征的影響。支持向量機(SVM)具有自主學(xué)習(xí)、自主適應(yīng)和強大的非線性處理能力的優(yōu)點,但是支持向量機也存在著自主學(xué)習(xí)能力不穩(wěn)定、收斂速度較慢、出現(xiàn)局部收斂和模型過擬合的現(xiàn)象[18];隨機森林(RF)是集成學(xué)習(xí)思想一種算法[19],但存在當(dāng)數(shù)據(jù)噪音較大時,出現(xiàn)過擬合的問題;最小二乘支持向量機(LSSVM)是在支持向量機的基礎(chǔ)上采用最小二乘函數(shù),進一步提高支持向量機的計算效率,將輸入的樣本信息映射到高維特征空間,采用結(jié)構(gòu)風(fēng)險最小原則,得出分類結(jié)果[20],但對于數(shù)據(jù)量較大時,計算效率較低,模型需要花費大量時間進行計算;粒子群優(yōu)化算法(PSO)具有收斂速度快、參數(shù)簡化、計算效率高、結(jié)果精度高的特點,對非線性問題具有良好的處理能力[21]。而粒子群和隨機森林融合算法可以解決模型收斂慢、計算效率低的問題,對數(shù)據(jù)的適應(yīng)能力和預(yù)測結(jié)果的精度都有較大提升。
為此,本研究在海南省文昌市的生態(tài)站選擇生長良好的2年生幼齡沉香進行盆栽試驗,采用根部埋施法,設(shè)計不施氮(為對照)、低氮、中氮、高氮4個脅迫梯度;使用紅外和普通相機進行圖像、養(yǎng)分?jǐn)?shù)據(jù)獲?。灰杂g沉香可見光-近紅外5個波段的圖像為例,提出一種分割高效且模型精度較高的無損營養(yǎng)診斷的圖像方法,分析不同施氮量對盆栽沉香生長的影響,旨在為實現(xiàn)沉香生長過程中對氮素需求的機器智能判定提供參考。
試驗為單因素試驗設(shè)計,試驗區(qū)在海南省文昌市的生態(tài)站(19°36′~20°3′N、109°12′~111°2′E)。選擇生長良好的2年生幼齡沉香進行盆栽試驗,每盆(高×直徑=25 cm×20 cm)裝入5 kg風(fēng)干濱海沙壤土。氮源為尿素(氮質(zhì)量分?jǐn)?shù)為46.4%),采用根部埋施法,試驗設(shè)不施氮(對照)、低氮(施氮5 g·m-2·a-1)、中氮(施氮10 g·m-2·a-1)、高氮(施氮20 g·m-2·a-1)4個脅迫梯度,每個施氮量種植15棵沉香。之后每2個月進行1次補肥,施肥量與初始施入量一致,其他營養(yǎng)元素不再施加。數(shù)據(jù)采集時間為2019年7—11月份,每隔2個月進行圖像、養(yǎng)分?jǐn)?shù)據(jù)獲取,數(shù)據(jù)總量為120個。
使用紅外和普通相機2種。普通相機通過USB線與筆記本連接,使用軟件gphoto-2或者佳能自帶的EOS Utility進行攝影控制。紅外相機通過無線鏈接,利用IP控制攝影,由美國生產(chǎn)的MicaSense RedEdge 3多光譜相機(分辨率為1 280×960像素)獲取圖像,該相機有5個波段,其中心波段分別為475、560、668、717、840 nm;帶寬分別為20、20、10、40、10 nm。獲取圖像時,分別從東、西、南、北4個方向進行拍攝,對于所有的拍攝對象,保持三腳架的中心位置在幼樹4個方向的軸線上,相機與植株距離固定為2.1 m,三腳架高度設(shè)置為80 cm,鏡頭的方向與地面保持平行,拍攝時間為每天的09:00—16:00。
圖像獲取完成后,將幼齡沉香在莖基部切斷,保留完整的根系,分別稱取根莖葉的鮮質(zhì)量,分別在烘箱中83 ℃烘干24 h至恒質(zhì)量,冷卻至室溫后進行稱量干質(zhì)量。將葉片碾成粉末后,采用H2SO4-H2O2消煮-鉬銻抗吸光光度法測定氮質(zhì)量分?jǐn)?shù)。氮效率及相關(guān)指標(biāo)參照Moll et al.[22]方法計算。具體計算公式:氮累積量=植株生物量×植株氮質(zhì)量分?jǐn)?shù);氮素吸收率=氮累積量/供氮量;氮效率=地上部生物量/供氮量。
本研究圖像涉及可見光-近紅外5個波段,圖像噪聲較大,普通的圖像分割算法難以準(zhǔn)確分割,不能滿足研究需要[23]。針對此問題,本研究使用了改進的模糊局部信息C均值聚類(FLICM)算法,該算法主要針對模糊聚類(FCM)算法需要人工確定不同像素間權(quán)重比例的問題,提出利用隸屬度矩陣和像素空間距離自動確定權(quán)重的方法,對噪聲圖像有較好的分割效果。
首先對圖像進行歸一化處理,之后取圖像(250,500)坐標(biāo)點處的矩形區(qū)域,采用histeq函數(shù)進行直方圖均衡化處理,增強植物對比度,由于圖像中間部分噪聲較多,采用模糊C均值聚類算法分割,然后采用bwareaopen函數(shù)去除面積小于200的噪聲區(qū)域獲得植物,最后對植物圖像進行水平投影,找到花盆位置,即投影最大的地方,然后取花盆以上部分分割,再將原始灰度圖像相乘,獲得只有植物的圖像(見圖1)。
圖1 圖像分割過程及不同波段分割結(jié)果
沉香幼苗圖像分割及所有的圖像數(shù)據(jù)處理均在Matlab R2018a中進行。分割后的圖像相關(guān)參數(shù),包括:藍(lán)光波段反射率(RB)、綠光波段反射率(RG)、紅光波段反射率(RR)、紅邊波段反射率(RRE)、近紅外波段反射率(RNIR)、各波段比值植被指數(shù)(IV,R)[24]、差值植被指數(shù)(IV,D)[25]、寬動態(tài)范圍植被指數(shù)(IV,WD)[26]、調(diào)整三角指數(shù)(IV,MT)[27]、改進紅邊比值植被指數(shù)(IV,MRR)[28]。
各波段比值植被指數(shù)(IV,R)=RNIR/Ri;
差值植被指數(shù)(IV,D)=RNIR-Ri;
寬動態(tài)范圍植被指數(shù)(IV,WD)=(0.12RNIR-Ri)/(0.12RNIR+Ri);
調(diào)整三角指數(shù)(IV,MT)=1.2[1.2(RNIR-RG)-2.5(RNIR+RG)];
改進紅邊比值植被指數(shù)(IV,MRR)=(RRE-RB)/(RRE+RB)。
式中:Ri為藍(lán)光、綠光、紅光、紅邊、近紅外波段反射率。
隨機森林(RF)是依據(jù)分類回歸樹的機器學(xué)習(xí)方法。設(shè)原始數(shù)據(jù)中有N個含水率數(shù)據(jù),M個圖像因子,先從原始訓(xùn)練集中有放回的抽取n個樣本,生成n個子訓(xùn)練集并構(gòu)成n個決策樹,選取其中最具有分類能力的評價指標(biāo)進行分枝,最后對n個決策樹得到的n個分類結(jié)果進行投票表決,得到最終結(jié)果。經(jīng)過反復(fù)調(diào)試,將隨機森林中生長樹的數(shù)目設(shè)置為5 000,在每一個分裂節(jié)點處樣本預(yù)測器的個數(shù)設(shè)置為20。
為提升模型的收斂速度和精度,消除各位數(shù)據(jù)間數(shù)量級差別,本研究采用最小最大法,將原始建模數(shù)據(jù)進行歸一化處理,以防止由于輸入輸出數(shù)量級差別大而造成網(wǎng)絡(luò)估測誤差,模擬結(jié)果通過反歸一化處理將其還原。以紅邊波段反射率(RRE)、近紅外波段反射率(RNIR)、調(diào)整三角指數(shù)(IV,MT)、改進紅邊比值植被指數(shù)(IV,MRR)特征值作為影響因素,以氮素質(zhì)量分?jǐn)?shù)作為評價指標(biāo),將建模數(shù)據(jù)歸一化處理后,輸入進粒子群-隨機森林融合模型(PSO-RF)中,在隨機森林(RF)神經(jīng)網(wǎng)絡(luò)模型中加入一個種群數(shù)量為20、迭代終止次數(shù)為50的粒子群優(yōu)化算法(PSO),并且添加慣性權(quán)重因子提高模型的收斂能力,初始慣性權(quán)重因子設(shè)置為0.8,終止慣性權(quán)重因子設(shè)置為0.1。
計算4個月試驗期內(nèi),沉香植株生物量、氮素累積的變化(見表1)。由表1可見:低施氮量時,植株氮質(zhì)量分?jǐn)?shù)、地上部生物量、氮累積量的均值,顯著小于中施氮量的、高施氮量的、對照的,其中以中施氮量時最高;而低施氮量、中施氮量、高施氮量時,植株氮素吸收率、氮效率的均值顯著大于對照的。根系生物量均值則大小相近,4種施氮量時,根系生物量由大到小依次為中施氮量的、對照的、高施氮量的、低施氮量的。在高施氮量時,根系生物量變異系數(shù)最大,氮累積量、氮素吸收率的變異系數(shù)次之,植株氮質(zhì)量分?jǐn)?shù)的變異系數(shù)最??;在低施氮量、對照時,地上部生物量、氮累積量、根系生物量、氮素吸收率、氮效率的變異系數(shù),均小于中施氮量的,而植株氮質(zhì)量分?jǐn)?shù)的變異系數(shù)大于中施氮量的。總體看,不同脅迫時,各生物量性狀的變異系數(shù),由大到小依次為低施氮量的、高施氮量的、對照的、中施氮量的。氮素脅迫對沉香地上部的影響更大,因此可以根據(jù)地上部的生物量變化評價沉香氮素營養(yǎng)狀況。
表1 不同施氮量時沉香氮素指標(biāo)的變化
當(dāng)模型中的各影響因素之間具有較高的相似度時,擬合效果會出現(xiàn)不同程度的降低。在多元統(tǒng)計模型中,最理想的狀態(tài)是各影響因素之間相互獨立,在現(xiàn)實中很難實現(xiàn),為了降低模型的復(fù)雜度,必須在建模之前進行模型篩選或降維,以提高模型的實用性。
將多波段沉香葉片反射率與圖像特征值分別與氮營養(yǎng)指標(biāo)進行皮爾遜(Pearson)相關(guān)性分析(見表2)。結(jié)果表明:紅邊波段、近紅外波段反射率,與植株氮質(zhì)量分?jǐn)?shù)、地上部生物量、氮累積量呈顯著負(fù)相關(guān),與氮素吸收率、氮效率呈極顯著正相關(guān);各波段比值植被指數(shù)特征值,與植株氮質(zhì)量分?jǐn)?shù)呈負(fù)相關(guān),與氮素吸收率、氮效率呈正相關(guān),與根系生物量呈顯著正相關(guān);藍(lán)光波段、紅光波段反射率,與地上部生物量、氮累積量呈顯著負(fù)相關(guān),與氮素吸收率、氮效率呈顯著正相關(guān),與根系生物量呈正相關(guān);調(diào)整三角指數(shù)值和氮素指標(biāo)之間的相關(guān)性,與改進紅邊比值植被指數(shù)相似,但改進紅邊比值植被指數(shù)與根系生物量呈顯著負(fù)相關(guān);綠光波段反射率,與植株氮質(zhì)量分?jǐn)?shù)、氮累積量呈顯著正相關(guān),與氮素吸收率、氮效率呈顯著負(fù)相關(guān);差值植被指數(shù),與植株氮質(zhì)量分?jǐn)?shù)、氮累積量呈負(fù)相關(guān),與氮素吸收率、氮效率呈正相關(guān);寬動態(tài)范圍植被指數(shù)特征值,與氮素指標(biāo)間的相關(guān)性均較低。說明紅邊波段、近紅外波段反射率,比藍(lán)光波段、綠光波段、紅光波段反射率更能預(yù)測作物氮素營養(yǎng)狀況,調(diào)整三角指數(shù)、改進紅邊比值植被指數(shù)與氮素營養(yǎng)指標(biāo)相關(guān)性較好,而各波段比值植被指數(shù)特征值、差值植被指數(shù)、寬動態(tài)范圍植被指數(shù)特征值與氮素營養(yǎng)指標(biāo)之間的相關(guān)性較差。
表2 沉香葉片圖像特征值與氮素指標(biāo)的相關(guān)系數(shù)
由表3可見:不同施氮量對紅邊波段反射率、近紅外波段反射率、調(diào)整三角指數(shù)、改進紅邊比值植被指數(shù)特征值影響不同,其中紅邊波段反射率、近紅外波段反射率、調(diào)整三角指數(shù)隨氮素質(zhì)量分?jǐn)?shù)的增加呈現(xiàn)先增加后減少的趨勢,在中施氮量時達(dá)到最大值;而改進紅邊比值植被指數(shù)特征值趨勢相反,隨施氮量的增加而降低,且在中施氮量時達(dá)到最低點。
表3 不同施氮量時沉香葉片圖像特征值
沉香葉片圖像特征與氮素指標(biāo)相關(guān)性表明,植株氮質(zhì)量分?jǐn)?shù)與圖像特征的相關(guān)性總體較高,因此,對不同梯度的施氮量和光譜數(shù)據(jù)進行平均處理,建立不同施氮量與光譜反射率的相關(guān)關(guān)系(見表4)。由表4可見:沉香的光譜反射率趨勢與典型植物光譜趨勢大體一致,且可見光區(qū)域反射率較低,而近紅外區(qū)域反射率相對較高,這是葉片內(nèi)部結(jié)構(gòu)多次散射的結(jié)果。在560、668 nm波段,施氮量越高,光譜反射率越低;717、840 nm波段,反射率隨施氮量增加先高后低,表明不同施氮量對沉香植株葉片光譜反射率存在不同影響。
表4 不同施氮量時沉香植株葉片不同波段光譜反射率
由粒子群-隨機森林融合模型的訓(xùn)練集和測試集結(jié)果(見圖2)可見:訓(xùn)練集預(yù)測結(jié)果決定系數(shù)(R2)達(dá)到0.98以上,測試集預(yù)測結(jié)果決定系數(shù)(R2)達(dá)到0.94以上,預(yù)測結(jié)果良好,且均方根誤差分別為5.127、5.784,能夠達(dá)到準(zhǔn)確估測的目的,也進一步證實了粒子群算法優(yōu)化隨機森林模型可準(zhǔn)確估測沉香葉片氮質(zhì)量分?jǐn)?shù)。
圖2 對沉香植株全氮質(zhì)量分?jǐn)?shù)估測結(jié)果
為證明粒子群-隨機森林融合模型的估測效果,采用單獨粒子群模型、隨機森林模型作為對照,對試驗數(shù)據(jù)進行同步建模估測(見表5)。由表5可見:粒子群-隨機森林融合模型在訓(xùn)練集和測試集都表現(xiàn)出良好的估測結(jié)果,決定系數(shù)分別達(dá)到了0.984、0.945,均方根誤差分別為5.127、5.784,并且訓(xùn)練集決定系數(shù)分別高于單獨的隨機森林和粒子群模型35%、33%;測試集決定系數(shù)分別高25%、35%;進一步證明粒子群算法對于提升隨機森林神經(jīng)網(wǎng)絡(luò)在實值回歸方面的性能是可行的。
表5 3種模型的預(yù)測結(jié)果
(1)本研究圖像包含可見光-近紅外5個波段,圖像信息量豐富但圖像模糊,噪聲較大,常規(guī)分割算法難以準(zhǔn)確分割,模糊局部信息C均值聚類可直接利用隸屬度矩陣和像素空間距離自動確定權(quán)重,算法運行速度快,對模糊圖像分割效果良好。
(2)在不同施氮量時,根系生物量值的變異系數(shù)較大,而植株氮質(zhì)量分?jǐn)?shù)的變異系數(shù)最小,說明氮素對這些指標(biāo)的影響較小,低施氮量時的地上部生物量、氮累積量、植株氮質(zhì)量分?jǐn)?shù),均顯著小于中施氮量的,表明低氮脅迫條件會抑制植株地上部的生長,適量提高施氮量對地上部的促進作用明顯,且容易累積較大比例的氮素。低施氮量、中施氮量、高施氮量時的氮素吸收率、氮效率,均顯著大于對照(不施氮)的,表明氮肥供應(yīng)量的增加,對氮素的吸收和利用效率均增高。氮素質(zhì)量分?jǐn)?shù),對沉香地上部分生長影響較大,對根系生物量生長影響較小,說明低氮脅迫時沉香依然具有較高的氮素吸收能力。
(3)植物體內(nèi)氮含量充足時,對可見光吸收增大,葉片反射率降低;而當(dāng)全氮含量不足時,植物出現(xiàn)缺氮現(xiàn)象,葉片黃化,對可見光的吸收減小,反射率增大。本研究表明,紅邊波段反射率、近紅外波段反射率,與調(diào)整三角指數(shù)、改進紅邊比值植被指數(shù)、氮素營養(yǎng)指標(biāo)間有良好的相關(guān)關(guān)系;而各波段比值植被指數(shù)、差值植被指數(shù)、寬動態(tài)范圍植被指數(shù)特征值,與氮素營養(yǎng)指標(biāo)之間的相關(guān)性相對較差;不同施氮量對紅邊波段反射率、近紅外波段反射率、調(diào)整三角指數(shù)、改進紅邊比值植被指數(shù)特征值影響不同,紅邊波段反射率、近紅外波段反射率、調(diào)整三角指數(shù)隨施氮量的增加呈現(xiàn)先增加后減少的趨勢,在中施氮量時達(dá)到最大值,而改進紅邊比值植被指數(shù)趨勢相反,則隨著施氮量的增加而降低,且在中施氮量時達(dá)到最低點。
(4)本研究充分利用機器學(xué)習(xí)算法處理非線性問題的良好能力,采用依據(jù)粒子群算法優(yōu)化的隨機森林模型,對沉香葉片全氮質(zhì)量分?jǐn)?shù)進行建模估測,解決模型收斂慢、計算效率低的問題,對數(shù)據(jù)的適應(yīng)能力和預(yù)測結(jié)果的精度都有較大提升,對沉香葉片全氮質(zhì)量分?jǐn)?shù)進行準(zhǔn)確估測,模型決定系數(shù)分別達(dá)到了0.984、0.945,均方根誤差也分別為5.127、5.784。并且訓(xùn)練集決定系數(shù),分別高于單獨隨機森林模型、粒子群模型35%、33%;測試集決定系數(shù),分別高于單獨隨機森林模型、粒子群模型25%、35%;為今后稀有樹種的元素含量估測提供了新的思路。