国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于RFE_RF算法的幼齡沉香葉片含水率預(yù)估模型

2022-11-29 12:00:16王雪峰劉嘉政
關(guān)鍵詞:幼齡含水率水分

王 甜,王雪峰*,劉嘉政

(1.中國林業(yè)科學(xué)研究院資源信息研究所,北京 100091;2.國家林業(yè)和草原局森林經(jīng)營與生長模擬重點實驗室,北京 100091)

沉香(土沉香)(Aquilariasinensis)是生長在沿海一帶的珍貴樹種,具有極高的經(jīng)濟價值,其苗期對水分變化敏感,不易成活加之過度采伐及生態(tài)環(huán)境的破壞,造成沉香資源銳減[1]。近年來,海南省大力推廣種植珍貴樹種,但由于缺乏先進的監(jiān)測管理技術(shù),推廣效果并不理想。因此,為更好地保護及利用該資源,亟須探索一種便捷可靠的水分診斷方法。

傳統(tǒng)林業(yè)經(jīng)營中,大量工作需借助于對樹木外觀形態(tài)、色澤、紋理等外部特征進行判斷,高光譜遙感成像[2]、手持光譜儀[3]等方法所獲信息少、穩(wěn)定性差、影響因素復(fù)雜,且傳統(tǒng)測定對樣品破壞性較大,難以提供實時、準確的植物需水信息。圖像處理技術(shù)檢測便捷、精確、無破壞性,為植物水分診斷提供了一種數(shù)據(jù)獲取的新方法。目前利用圖像處理技術(shù)通過對植物顏色特征進行分析以建立植物生長狀況與水分關(guān)系的研究較多。例如:Kacira等[4]、Ahmad等[5]利用非線性最小二乘擬合方法建立圖像顏色特征的Log-Modified回歸模型,并建立了RGB值與HSI值之間的色度坐標變換關(guān)系;不同學(xué)者分別建立水分梯度下葉片含水率與圖像顏色特征的模型關(guān)系[6-8],相關(guān)系數(shù)均達到0.70以上;Li等[9]、江朝暉等[10]基于偏最小二乘法(GA-PLS)分別建立新鮮樹葉和冬小麥(Triticumaestivuml)可見光圖像中相關(guān)性較高的顏色、紋理、形態(tài)特征參量與含水率之間的關(guān)系模型,該模型檢測的相對誤差均值小于1.28%。

隨著機器學(xué)習(xí)的發(fā)展,神經(jīng)網(wǎng)絡(luò)逐漸應(yīng)用到植物含水率的監(jiān)測中來。Vesali等[11]通過建立人工神經(jīng)網(wǎng)絡(luò)模型,研究蘋果(Malusdomestica)果皮皺褶圖像中密度、紋理等特征與含水率的關(guān)系,驗證方法的可行性;顧金梅等[12]等研究煙葉圖像中 RGB、HSI及HSV 3種顏色模型下各顏色分量對煙葉等級的影響,以煙葉圖像等級間差異較大的顏色分量作為輸入因子,建立神經(jīng)網(wǎng)絡(luò)模型,其預(yù)測準確率可達89.16%;陳珠琳等[13]使用極限學(xué)習(xí)機算法分割提取幼齡檀香(Foliumosyris)葉片圖像、葉片顏色特征,結(jié)果表明,隨著含水率的增加,彩色圖像的R、G、B(紅、綠、藍)通道值均會減小,但當葉片含水率小于40%時,會出現(xiàn)R通道值大于G通道值的現(xiàn)象。

國內(nèi)外有關(guān)通過構(gòu)建模型對植物含水量反演的研究較多[14-16],但對沉香類珍貴樹種含水率的反演卻鮮見報道。從現(xiàn)有研究中得出,雖然隨機森林算法能夠處理高維度數(shù)據(jù),且不用做特征選擇,但該算法處理數(shù)據(jù)時,會陷入局部最優(yōu)解或在某些包含一定噪聲數(shù)據(jù)的分類上出現(xiàn)過擬合問題;因此,本研究以幼齡沉香圖像顏色、形狀特征作為輸入變量,葉片含水率作為訓(xùn)練及測試樣本,擬采用遞歸特征消除與隨機森林融合的方法,解決建模過程中的過擬合問題,提高幼齡沉香含水率預(yù)測模型的精度,探索珍貴樹種水分無損檢測新方法。

1 材料與方法

1.1 研究區(qū)概況

研究區(qū)位于海南省文昌市龍樓鎮(zhèn)島東林場(110°57′34″~111°01′54″E,19°43′58″~19°44′58″N),屬沿海平原地帶,海拔5~10 m。試驗地土壤類型為濱海沙壤土,有機質(zhì)含量為10.5 g/kg,有效氮含量98.2~114.7 mg/kg,有效磷含量3.38~4.56 mg/kg,速效鉀含量69.9~78.2 mg/kg,田間持水量18.23%。

1.2 試驗設(shè)計與數(shù)據(jù)獲取

選擇長勢一致的2年生幼齡沉香,將其移入裝有5 kg風(fēng)干濱海沙壤土的25 cm×20 cm花盆中,試驗以田間持水量(50%~55%)為對照(CK),設(shè)計重度水淹脅迫(T1)、輕度水淹脅迫(T2)、干旱脅迫(T3),其土壤含水量分別為田間持水量的75%~80%、55%~65%、30%~40;每個水平種植11棵,共計44棵,其平均樹高、冠幅和地徑分別為40 cm、24 cm和7 mm,整個脅迫周期持續(xù)21 d。由于植物的水分蒸騰和土壤水分蒸發(fā)導(dǎo)致土壤含水量不斷變化,因此,根據(jù)土壤水分狀況采用鋁盒取土烘干法及時補充土壤水分,控制土壤含水量。沉香葉片在脅迫期平均含水率數(shù)據(jù)見表1。

表1 不同程度水淹脅迫下各沉香幼樹葉片平均含水率

試驗使用Cannon EOS700(分辨率為5 184×3 456)獲取幼齡沉香圖像,光圈值設(shè)定為f/22,曝光時間設(shè)定為0.4 s,焦距設(shè)定為18 mm,ISO設(shè)定為 200,保持三腳架中心點與盆栽中心點在一條直線上,拍攝距離固定為2.1 m,高度為80 cm。拍攝時間為9:00—16:00,從東、西、南、北4個不同方向拍攝,每拍攝一個方向,將盆栽按照順時針方向旋轉(zhuǎn)45°,直到旋轉(zhuǎn)至初始位置,獲得沉香整株圖像。圖像獲取完成后,將沉香的葉全部摘下用精度為0.01g的電子天平稱取每個沉香幼苗植株葉片樣本質(zhì)量,記為鮮質(zhì)量(WF),最后將葉片樣本放入烘箱(83 ℃)烘到質(zhì)量恒定,稱取干質(zhì)量(WD)。將44個沉香幼苗植株樣本隨機分為兩組:一組為建模樣本(30株,約占總數(shù)的70%),用于沉香葉片含水率預(yù)測模型的建立;另一組為驗證樣本(14株,約占總數(shù)的30%),用于驗證建立的葉片含水率估算模型。本研究以葉片含水率(相對含水量)代表植株整體。相對含水量(CRW)計算公式如下:

(1)

1.3 自變量提取

RGB[紅色(R)、綠色(G)、藍色(B)]與HSV[色度(H)、飽和度(S)、亮度(V)]色彩空間是最常用的顏色模型,分別計算RGB顏色系統(tǒng)的通道值,并對RGB各個分量進行歸一化處理分別得到標準紅光值(INR)、綠光值(ING)、藍光值(INB),之后利用RGB通道值得到HSV單通道均值,并計算黃色分量(EY)、深綠色顏色指數(shù)(IDGC)、Kawasaki指數(shù)(IKAW)[17],具體計算公式如下:

EY=(R+G)/2;

(2)

(3)

IKAW=(R-B)/(R+B);

(4)

INR=R/(R+G+B);

(5)

ING=G/(R+G+B);

(6)

INB=B/(R+G+B)。

(7)

因此,選取顏色指標分別為:R、G、B、H、S、V、EY、IKAW、ING、INB、IDGC。葉片的形狀在水分脅迫下同樣具有差異,這種差異不僅表現(xiàn)在葉片的伸展過程中,還表現(xiàn)在葉片黃化部位的發(fā)展過程中。因此,從葉片整體區(qū)域提取多種形態(tài)特征,從而進一步應(yīng)用于水分脅迫的識別。選取形狀指標分別為:最小外接矩形面積(AL),即區(qū)域中包含的像素數(shù);最小外接矩形周長(PL),即區(qū)域輪廓線上像素間的距離之和;矩形度(ER),即葉片區(qū)域面積與最小外接矩形面積之比。

1.4 數(shù)據(jù)預(yù)處理

如果直接將原始數(shù)據(jù)全部放進模型中,不僅加大了模型構(gòu)建的復(fù)雜度,而且降低回歸分析的精度。為提升神經(jīng)網(wǎng)絡(luò)模型的收斂速度和精度、消除數(shù)據(jù)間數(shù)量級差別、防止由于輸入輸出數(shù)量級差別大而造成網(wǎng)絡(luò)估測誤差較大等問題,采用最小最大法對原始數(shù)據(jù)進行歸一化處理,最后的模擬結(jié)果通過反歸一化處理將其還原。歸一化公式為:

(8)

式中:Z為歸一化處理值;x為圖像特征值;μ為所有圖像特征指標的均值;σ為所有圖像特征指標的標準差。

1.5 遞歸特征消除及建模方法

遞歸特征消除(RFE)本質(zhì)是一種反復(fù)構(gòu)建模型,直至選出最優(yōu)特征子集的過程[18]。根據(jù)篩選結(jié)果首先把系數(shù)最小的特征移除,然后在剩余的特征集合中重復(fù)這個過程,直到所有特征都遍歷為止[19-20]。算法循環(huán)過程為:訓(xùn)練分類器,計算置換的重要度,剔除相關(guān)性最低的變量,用剔除后的特征再次訓(xùn)練分類器。

隨機森林(RF)是基于分類回歸樹的機器學(xué)習(xí)方法[21-22]。設(shè)原始數(shù)據(jù)中有N個含水率數(shù)據(jù),M個圖像因子,先從原始訓(xùn)練集中有放回地抽取n個樣本,生成n個子訓(xùn)練集并構(gòu)成n個決策樹,選取其中最具有分類能力的變量進行分枝,最后對n個決策樹得到的n個分類結(jié)果進行投票表決,得到最終結(jié)果。經(jīng)過反復(fù)調(diào)試,將隨機森林中生長樹的數(shù)目設(shè)置為5 000,將每一個分裂節(jié)點處樣本預(yù)測器的個數(shù)設(shè)置為20。

最小二乘法支持向量機(LSSVM)是Suykens等[23]對傳統(tǒng)支持向量機(SVM)進行改進提高求解速度和收斂精度的方法,主要采用結(jié)構(gòu)風(fēng)險最小化(SRM)原則,利用等式約束替換不等式約束,將求解二次規(guī)劃問題轉(zhuǎn)化為求解線性問題。經(jīng)過反復(fù)調(diào)試,確定正則化參數(shù)gam為1,RBF核函數(shù)參數(shù)sig 2為0.7。RFE-RF(遞歸特征消除和隨機森林融合)算法流程如圖1所示。

基于RFE_RF的特征選擇方法,通過計算模型的均方根誤差值確定最優(yōu)特征子集。步驟如下:

1)設(shè)定輸入訓(xùn)練數(shù)據(jù)集F(N個樣本,P個特征)。初始特征集合Fx為原始數(shù)據(jù)集,最優(yōu)特征集合Fy為空集,最優(yōu)特征子集均方根誤差值為Rx。

3)刪除子集Fx中排名靠后的特征Fi。若特征子集Fy的均方根誤差值Ry小于Rx,那么Ry=Rx,否則執(zhí)行第2步和第3步,最后輸出最優(yōu)特征子集。

2 結(jié)果與分析

2.1 沉香幼苗圖像分割結(jié)果

通過分析背景色和植株的單像素點RGB的通道值,發(fā)現(xiàn)兩者差異較大,于是利用彩色圖像單通道值的差異性原理作為圖像背景分割方法。沉香幼苗圖像分割及所有的圖像數(shù)據(jù)處理均在 Matlab R 2018a中實現(xiàn),提取圖像中的顏色和形狀特征,形成研究的基礎(chǔ)數(shù)據(jù),并分析與沉香含水率的相關(guān)性。由于沉香圖像背景簡單無土壤、雜草或其他樹種影響,因此分割較為容易。根據(jù)彩色圖像的基本性質(zhì)利用沉香幼苗外觀顏色與背景圖像顏色中RGB單通道值的差異性將其進行分割,得到較好效果。分割算法可對水分脅迫下葉片發(fā)黃沉香進行較好的分割,且保留莖葉部分,最終分割結(jié)果如圖2所示。

分析圖像背景的RGB 3通道信息和植株的RGB 3通道信息,確定不同之處進行區(qū)分;分析發(fā)現(xiàn),圖像背景RGB單像素點3通道中的最大與最小值相差不大,而植株的單像素點RGB 3通道的最大與最小值相差較大,所以以植株最大、最小值的差值作為特征進行區(qū)分。由于底部盆邊也滿足要求,但是盆邊的單像素點RGB通道,最大值在R和B通道,而植株的最大值在G通道,得出分割條件為:

Vmax-Vmin<20;

(9)

bRate<0.27。

(10)

式中:Vmax表示RGB通道最大值;Vmin表示RGB通道最小值;bRate表示花盆邊緣分割閾值。

由圖2可見,干旱脅迫下沉香葉色變黃變暗,而對照組相比于重度水分脅迫與輕度水分脅迫葉片更為明亮飽滿。

2.2 基于RFE-RF算法的特征選擇

首先利用隨機森林過程中bootstrap重抽樣方法從原始樣本中抽取構(gòu)建決策樹的樣本,并最終構(gòu)成隨機森林,然后在回歸模型中計算特征重要度。之后利用遞歸特征消除算法刪除特征重要度小的特征再次建模,直至剩下最后1個特征。RF-RFE算法中生長樹的數(shù)目(ntree)和每次輸入變量的個數(shù)(mtry)為算法中最重要的參數(shù)設(shè)置,經(jīng)反復(fù)試驗,設(shè)置RF-RFE算法的ntree=300,mtry的大小通常為輸入變量數(shù)的1/3,當變量數(shù)<3時mtry取1。

RFE_RF算法使用平均下降均方誤差(MSE)值作為特征選擇過程中特征篩選的原則。首先算法將刪除最小MSE值的特征,如圖3A所示,刪除第13個,即最小外接矩形面積(AL)的特征,然后利用RFE-RF重新計算剩余特征的平均下降MSE值,再次刪除MSE值最小的特征,以此循環(huán),不斷迭代刪除特征。圖3B表示最終剩余3個特征時的平均下降MSE值,剩余的3個特征為飽和度(S)、標準紅光值(INR)、矩形度(ER)。每一步迭代時所刪除特征的MSE值見圖4,迭代結(jié)束后,根據(jù)均方根誤差(RSME)值的大小選取最優(yōu)特征集合,最優(yōu)特征集為:飽和度(S)、標準紅光值(INR)、矩形度(ER)。

2.3 不同水分脅迫下沉香顏色和形狀的變化

對不同水分脅迫水平數(shù)據(jù)進行分析,觀察不同水分條件對沉香幼苗顏色、形狀因子的影響。按脅迫組別繪制時間序列顏色變化曲線,如圖5所示。在重度水淹脅迫處理(T1)下,隨著水淹時間的延長,INR分量先減小后增大,ER分量和飽和度(S)總體呈現(xiàn)下降的趨勢,葉片表現(xiàn)為沉香葉片變暗,逐漸黃化;輕度水淹脅迫(T2)下,ER、INR值呈先減后增的趨勢,S分量數(shù)值波動明顯,先減小后逐漸增大,最終保持平穩(wěn),葉片亮度增加;持續(xù)干旱脅迫(T3)下,葉片的INR分量和S值先增再減后逐漸增高,ER值先增后減,葉片變暗,顏色變黃,葉片逐漸蜷曲,說明沉香葉片細胞膜受傷害的程度逐漸加大,細胞內(nèi)有害物質(zhì)不斷增加,且14 d時超過了沉香幼苗的耐受能力,但并未出現(xiàn)植株死亡現(xiàn)象[24]。對照組(CK)試驗中,葉片的變化趨勢為:整體呈亮度略有升高,INR值總體逐漸增加,ER先減小后呈平緩趨勢,S值總體呈下降趨勢。水淹脅迫組在整個脅迫周期內(nèi)葉片顏色變化不同(圖5),這是由于水淹脅迫下,沉香仍能夠有效調(diào)節(jié)氣孔開閉,保證充足的CO2吸收,進而提高水分利用率,對干旱脅迫做出響應(yīng)[25];干旱脅迫組葉片變黃時間早于水淹脅迫組,超出2周后葉片開始嚴重受損,這是由于干旱造成植物生理性脫水,進而導(dǎo)致植物呼吸、光合系統(tǒng)的紊亂和細胞膜透性損壞及代謝失調(diào),最終抑制植株生長甚至萎蔫、局部壞死[26];對照組與輕度脅迫組變化類似,但拐點出現(xiàn)較晚。因此,沉香最適生長葉片含水率范圍為50%~65%,適度增加水分有利于沉香幼苗生長。

2.4 沉香葉片含水率預(yù)測模型及算法比較

2.4.1 RFE_RF模型

以飽和度(S)、標準紅光值(INR)、矩形度(ER)特征值作為自變量,以含水率作為因變量,將建模數(shù)據(jù)歸一化處理后,輸入RFE_RF模型中,即在RF神經(jīng)網(wǎng)絡(luò)模型中加入1個種群數(shù)量為20、迭代終止次數(shù)為50的PSO算法,并且添加慣性權(quán)重因子提高模型的收斂能力。初始慣性權(quán)重因子設(shè)置為0.8,終止慣性權(quán)重因子設(shè)置為0.1。模型訓(xùn)練過程如圖6 所示。RFE_RF模型的訓(xùn)練集和測試集結(jié)果見圖7。

從圖7可見,訓(xùn)練集預(yù)測結(jié)果R2超過0.91,測試集預(yù)測結(jié)果R2超過0.88,預(yù)測結(jié)果良好,能夠達到準確估測的目的。

2.4.2 模型比較

為比較最小二乘法支持向量機算法(LSSVM)、隨機森林算法(RF)與遞歸特征消除與隨機森林融合算法(RFE_RF)3種算法在幼齡沉香葉片含水率預(yù)測中的效果差異,分別構(gòu)建LSSVM、RF和RFE_RF 3種預(yù)測模型。模型均采用十折交叉驗證法,重復(fù)計算10次,最后將3種算法預(yù)測模型的敏感度、特異性、誤報率及精度取平均值在相同的獨立測試集中進行對比(表2)。敏感度是陽性樣本分類的準確度,又稱真陽性率;特異性是陰性樣本分類的準確度,又稱真陰性率;誤報率是陰性樣本的錯誤率,又稱假陽性率;精度是預(yù)測值為陽性樣本的正確率。其中,敏感度、特異性、精度3項指標越大模型分類效果越好,誤報率越小模型分類效果越好。由表2可以看出:預(yù)測的模型中,LSSVM算法構(gòu)建的模型與RF算法構(gòu)建的模型在敏感度、特異性、誤報率及精度4項指標上結(jié)果均接近,基于RF算法構(gòu)建的預(yù)測模型效果略優(yōu);基于RFE_RF融合算法構(gòu)建的預(yù)測模型其敏感度、特異性、誤報率和精度分別達到88.65%、85.31%、14.39%和91.62%,與RF預(yù)測模型相比,敏感度提高3.34%,特異性提高10.87%,誤報率降低36.83%,精度提高13.39%;證明RFE_RF融合算法構(gòu)建預(yù)測模型有更好的識別能力和泛化能力。

表2 幼齡沉香葉片含水率預(yù)測試驗3種算法結(jié)果比較

3 結(jié) 論

在干旱環(huán)境中,葉綠素含量的降低有利于調(diào)整光能分配,保證整個光合系統(tǒng)的正常運行[27]。如張世柯等[28]發(fā)現(xiàn)濱海植物紅厚殼(Calophylluminophyllum),相較于西沙群島優(yōu)勢喬木欖仁樹(Terminaliacatappa)和海濱木巴戟(Morindacitrifolia),葉綠素含量更低,以此來減少干旱環(huán)境引起的傷害,并增強抗旱能力和對強光環(huán)境的適應(yīng)能力;但李婕等[29]認為,在干旱環(huán)境中,珊瑚島上的植物主要通過降低蒸騰速率的方式提高水分利用效率,抵御干旱脅迫。由此可見,熱帶植物對干旱脅迫有著不同的響應(yīng)機制。本研究以熱帶珍貴樹種沉香為對象,研究結(jié)果表明,相較于重度水淹脅迫,幼齡沉香對于長期重度干旱脅迫更加敏感,且幼齡沉香雖有一定的自我調(diào)節(jié)能力,但干旱時間超出2周會使幼苗葉片嚴重受損,威脅沉香正常生長,說明沉香幼苗在兩周內(nèi)持續(xù)干旱下,可通過調(diào)節(jié)自身清除細胞內(nèi)有害物質(zhì);但當持續(xù)干旱時間超出2周時,則威脅幼齡沉香正常生長。此外,幼齡沉香最適葉片含水率范圍為50%~65%,適度增加水分,有利于沉香苗生長。

隨機森林算法在高維回歸中篩選預(yù)測因子是一項繁雜的任務(wù),本研究基于遞歸特征消除的自身變量多輪訓(xùn)練避免過度擬合的優(yōu)勢與隨機森林算法結(jié)合,提出了基于遞歸特征消除和隨機森林融合算法的預(yù)測方法。該方法可以對相關(guān)性預(yù)測和排名的重要性加以描述,研究驗證了該融合算法的正確性和有效性,發(fā)現(xiàn)RFE_RF方法可以提高機器學(xué)習(xí)算法的預(yù)測精度,證明基于遞歸特征消除和隨機森林融合算法預(yù)測方法具有理論意義和應(yīng)用價值。

基于遞歸特征消除與隨機森林融合算法的幼齡沉香葉片含水率預(yù)測模型精度達到91.62%,降低了重要性度量相關(guān)性,避免了過度擬合,是一種有效的特征選擇方法。RFE_RF較單獨使用RF和LSSVM算法構(gòu)建的預(yù)測模型精度分別提高了15.22%和17.41%,證明遞歸特征消除方法與隨機森林算法融合使用,可應(yīng)用到幼齡沉香葉片含水率預(yù)測模型中提高模型性能。對比RF模型,RFE_RF的敏感度和特異性分別提高3.34%和10.87%,誤報率降低36.83%,證明RFE_RF融合算法構(gòu)建預(yù)測模型有更好的識別能力和泛化能力。

猜你喜歡
幼齡含水率水分
葉子會釋出水分嗎?
幼齡腰果園套種番薯栽培技術(shù)
基于多光譜圖像的幼齡白木香含鋅量無損診斷
昆明森林可燃物燃燒機理研究
基于表面能的濕煤顆粒含水率表征方法
弱膨脹土增濕變形量試驗及路堤填筑分析
減鹽不如減水分
特別健康(2018年9期)2018-09-26 05:45:42
原油含水率在線測量技術(shù)研究
電子制作(2016年1期)2016-11-07 08:42:56
高山幼齡果園套種蔬菜技術(shù)
中國果菜(2016年9期)2016-03-01 01:28:45
完形填空Ⅳ
即墨市| 永吉县| 鹤壁市| 东源县| 南通市| 巴林左旗| 府谷县| 吉林省| 高雄县| 赤壁市| 昂仁县| 嘉义县| 卢湾区| 永泰县| 盐边县| 科技| 南通市| 洱源县| 通渭县| 汉中市| 邯郸市| 马关县| 潢川县| 海宁市| 共和县| 措美县| 武穴市| 长治市| 改则县| 泰宁县| 托克逊县| 汕头市| 白朗县| 万全县| 孝昌县| 河池市| 陇南市| 北京市| 景泰县| 兴安盟| 晋州市|