蘭玉彬,王天偉,郭雅琦,楊冬子,林韶明,胡宇琦,林曉晴,鄧小玲
·農(nóng)業(yè)信息與電氣技術(shù)·
柑橘黃龍病光譜特征波段選擇及光譜檢測儀研制
蘭玉彬1,2,3,4,王天偉1,郭雅琦1,楊冬子1,林韶明1,胡宇琦1,林曉晴1,鄧小玲1,2,3,4※
(1. 華南農(nóng)業(yè)大學(xué)電子工程學(xué)院(人工智能學(xué)院),廣州 510642;2. 國家精準(zhǔn)農(nóng)業(yè)航空施藥技術(shù)國際聯(lián)合研究中心,廣州 510642;3. 嶺南現(xiàn)代農(nóng)業(yè)科學(xué)與技術(shù)廣東省實驗室,廣州 510642;4. 廣東省智慧農(nóng)業(yè)工程技術(shù)中心,廣州 510642)
黃龍?。℉uanglongbing,HLB)被稱為柑橘的癌癥,及早檢測出患病植株可防止病情蔓延,降低病情災(zāi)害程度。高光譜分析技術(shù)因其豐富的光譜信息,成為近年來作物病害檢測的研究熱點。然而高光譜設(shè)備昂貴,波段數(shù)較多,計算量大,在實際應(yīng)用中尚未形成規(guī)模應(yīng)用。使用合理的波段選擇方法,可以去掉冗余信息,避免“維數(shù)災(zāi)難”,減輕數(shù)據(jù)存儲、計算與傳輸壓力,并降低設(shè)備成本。該研究利用地物譜儀獲取了柑橘冠層葉片的高光譜信息,提出一種基于典型成分分析(Exemplar Component Analysis,ECA)的柑橘黃龍病特征波段優(yōu)選方法,并與其他3種波段優(yōu)選算法進行比較,分別優(yōu)選了7個光譜波段的組合。基于優(yōu)選波段,采用6種機器學(xué)習(xí)方法進行建模分類,對4種波段選擇方法的魯棒性進行了分析。此外,基于優(yōu)選的特征波段設(shè)計了一款多光譜儀應(yīng)用于柑橘黃龍病的檢測。結(jié)果表明,用ECA算法選擇的特征波段,其結(jié)合6種分類器在測試集上的準(zhǔn)確率達到92%以上,并具有較好的魯棒性。自研基于特征波段的多光譜儀對于HLB的檢測精確度最高可達95%。試驗表明用少量特征波段表征HLB作為檢測手段具有可行性,合理的特征波段有助于降低專門農(nóng)業(yè)病害光譜檢測的設(shè)計成本,提高果園病情防控精準(zhǔn)度。
高光譜;遙感;智能檢測;柑橘黃龍?。还庾V儀;波段選擇
黃龍?。–itrus Huanglongbing,HLB)一直以來被視為柑橘的“癌癥”,患病植株表現(xiàn)為生長緩慢、低產(chǎn)、頂梢枯死、逐漸死亡[1-4]。中國最早在1919年,于廣東潮汕地區(qū)發(fā)現(xiàn)有類似病害,當(dāng)?shù)厝擞^察到染病柑橘新梢及葉片黃化,故稱之為“黃龍病”,由寄生在韌皮部內(nèi)的革蘭氏陰性細菌引起,能夠侵染柑橘屬、枳屬、金柑屬和九里香等多種蕓香科柑橘亞科的近緣屬植物[5]。1995年第13屆國際柑橘病毒病學(xué)家會議決定以柑橘黃龍病[6]作為該病的正式名稱。柑橘黃龍病目前尚無行之有效的藥品用于應(yīng)對,也不能培養(yǎng)出抗病品種,因此苗木一旦感染將無法救治[7],感染枝干上的果實在正常采摘前就已脫落,雖然有部分果實能夠停留在枝上,但果實品質(zhì)已經(jīng)發(fā)生了變化[8],農(nóng)戶往往選擇在采摘季過后就將病樹連根鏟除,以免病情擴散,這嚴(yán)重阻礙了柑橘產(chǎn)業(yè)的可持續(xù)發(fā)展。
傳統(tǒng)農(nóng)業(yè)中農(nóng)戶依靠經(jīng)驗、目視來判定植株是否患病,但柑橘黃龍病的癥狀較為復(fù)雜,生產(chǎn)中常以柑橘樹葉片黃化作為典型癥狀來加以判斷,主要包括均勻黃化、斑駁黃化和缺素黃化3種類型[9]。但是澇害、環(huán)割過重、蟲害等引起的生理性黃化亦可呈現(xiàn)均勻黃化;缺素型黃化到底是由黃龍病引起的還是僅僅因為植株缺少氮、鈣、鎂、鋅、鐵、硼等礦質(zhì)元素導(dǎo)致僅憑觀察難以下結(jié)論;斑駁黃化較為典型,葉片表現(xiàn)為左右不對稱、葉基先黃化、斑塊交界不明顯、病葉脆而滑這4個特征,可實際中,在不同的季節(jié)黃龍病癥狀也會有所變化,田間復(fù)雜的光照情況也會影響人的判斷。實驗室生化分析能夠提供精確的診斷結(jié)果,其中以分子檢測技術(shù)效果尤為顯著[10-11],但往往需要投入大量的人力和時間進行樣本采集與標(biāo)注,后續(xù)分析也對相關(guān)人員的知識儲備有較高要求,整個流程周期較長,難以在農(nóng)戶間推廣。
光譜技術(shù)是一種可以反應(yīng)物體微觀差異的手段,具有很高的靈敏度,其檢測精度不低于一般的化學(xué)方法,而且在檢測速度上比生化方法快很多[12],其中高光譜技術(shù)能夠獲取電磁波譜位于可見光-近紅外VIS-NIR(Visible-Near Infrared)和短波紅外SWIR(Shortwave Infrared)范圍內(nèi)的數(shù)百個波段光譜信息[13-14],其在農(nóng)業(yè)應(yīng)用中表現(xiàn)出的優(yōu)秀性能已經(jīng)得到很多研究者的證實[15-17],一些學(xué)者用高光譜技術(shù)檢測柑橘黃龍病并取得了研究進展。Moriya等[18]通過輕型飛機搭載高光譜相機獲取巴西柑橘種植園的遙感圖像,使用Spectral Angle Mapper(SAM)算法對數(shù)據(jù)進行分類,檢測感染HLB植株的準(zhǔn)確率為61.2%。Weng等[19]針對處于不同生長季節(jié)的柑橘,提出一種基于高光譜成像結(jié)合碳水化合物代謝分析的HLB檢測方法,對健康、感染HLB和缺乏營養(yǎng)葉片的3類精度在涼季、熱季和整個生長期分別達到了90.2%、96.0%和92.6%。
由于高光譜具有極高的光譜分辨率,其數(shù)據(jù)的眾多波段之間,尤其是相鄰或相近波段存在嚴(yán)重的信息冗余,波段選擇[20]作為一種重要的特征提取技術(shù),是解決這一問題的有效途徑。肖懷春[21]利用連續(xù)投影算法(Successive Projections Algorithm,SPA)和主成分分析(Principal Component Analysis,PCA)對輕度、中度、重度3類黃龍病葉片分別提取了特征波段,并結(jié)合葉片紋理特征構(gòu)建了黃龍病診斷模型,其中,使用SPA篩選了27個特征波段,使用PCA篩選了20個特征波段。但SPA和PCA本質(zhì)上是線性特征提取方法,高光譜數(shù)據(jù)具有較高的維數(shù),在特征空間(Feature space)中可能具有復(fù)雜的非線性結(jié)構(gòu),線性特征提取方法難以描述高光譜數(shù)據(jù)的非線性結(jié)構(gòu)。王克健[22]以雞尾葡萄柚為試驗對象,通過分析HLB樹和健康樹的綠色葉片和黃化葉片的可見-近紅外高光譜信息篩選出十個特征光譜,構(gòu)建了基于特征波段的最小二乘-支持向量機HLB預(yù)測模型,對于建模集和預(yù)測集中罹病樹葉片的識別精度分別達到97.9%和96.6%。Deng等[23-24]使用地物光譜儀和無人機搭載高光譜相機,分別獲取了柑橘葉片高光譜數(shù)據(jù)和柑橘園遙感高光譜圖像,針對葉片光譜數(shù)據(jù)計算了所有波段的信息熵及其之間的熵距離,利用后續(xù)搜索算法選擇出了13個特征波段,利用遺傳算法(Genetic Algorithm,GA)對高光譜遙感圖像進行特征波段選擇,提取了10個特征波段。這些試驗都是基于專業(yè)儀器設(shè)備來獲取柑橘葉片的光譜信息,通常在預(yù)處理階段需要手動剔除異常數(shù)據(jù)和噪聲以克服方法本身魯棒性較低的問題,且采用的高光譜相機和地物譜儀均價格不菲,對技術(shù)落實到田間形成了阻礙。
本研究旨在探索一種高效且魯棒性較好的柑橘黃龍病光譜特征波段選擇方法;并基于少量的優(yōu)選波段,研制低成本的柑橘黃龍病光譜檢測儀,以實現(xiàn)實際生產(chǎn)的大規(guī)模應(yīng)用。
本試驗數(shù)據(jù)主要采集于廣東省惠州市博羅縣楊村鎮(zhèn)井水龍村柑橘黃龍病綠色防控與新栽培模式研發(fā)示范基地。該地屬南亞熱帶海洋性季風(fēng)氣候,生態(tài)環(huán)境保護完好,上游有國家小二型的寶溪水庫,灌溉便利土壤肥沃,適合柑橘果樹的種植?;貎?nèi)種植的柑橘品種為砂糖橘,由專人對園區(qū)進行管理。本次試驗采集的光譜采集自于3種情況的柑橘樹:健康(healthy)、確診HLB、疑似癥狀(suspected,除去健康和確診HLB之外的缺素但疑似黃龍病癥狀的大類)。
圖1 數(shù)據(jù)采集園區(qū)的柑橘圖像
試驗區(qū)域包括healthy、HLB和suspected 3種柑橘植株,如圖1所示。本研究使用英國ASD FieldSpec HandHeld 2(下文簡稱HH2)手持式地物光譜儀采集柑橘植株冠層的光譜信息。試驗時間為2021年1月15日和20日,當(dāng)日天空為淡積云量,無卷云、濃積云等,光照穩(wěn)定,在11:30—14:30開展數(shù)據(jù)采集試驗。試驗人員身著深色衣物以防止光污染,采集時避免有陰影落在HH2光學(xué)接收端25°視場角采集范圍,HH2光學(xué)接收端與目標(biāo)葉片的距離為葉片較短直徑(如圖2中a,b為葉片較長直徑,c為HH2視場)的2倍,如圖2所示。每顆植株上隨機選取4個點進行數(shù)據(jù)采集,每采集完一棵樹的光譜數(shù)據(jù),將地物光譜儀對準(zhǔn)標(biāo)準(zhǔn)參考白板進行定標(biāo)校準(zhǔn),得到接近100%的基線,然后再采集下一棵樹,依次進行試驗。
圖2 數(shù)據(jù)采集過程
為確保試驗樣本真實病況與后期分析具有一致性,在采集光譜數(shù)據(jù)后,將對應(yīng)區(qū)域的葉片進行采集放于樣本袋中,同時用記號筆在袋上標(biāo)記,使樣本與光譜數(shù)據(jù)一一對應(yīng),平均每棵樹采集10片葉片。所采集的葉片樣本存放在備有冰塊的盒子中,試驗結(jié)束后進行了聚合酶鏈反應(yīng)(Polymerase Chain Reaction,PCR)檢測確認(rèn)。試驗期間獲取的HLB、healthy、suspected數(shù)據(jù)分別為707、289和108個。
通過Viewspec Pro軟件觀察到地物光譜儀所采集的數(shù)據(jù)在兩端存在明顯機器噪聲,信噪比較低,如圖3所示。因此從HLB數(shù)據(jù)集中剔除325~349 nm和1 000~1 075 nm的數(shù)據(jù),采用350~1 000 nm的光譜數(shù)據(jù)進行特征波段分析。
圖3 地物光譜儀機器噪聲
在沒有先驗分析的情況下,在高光譜數(shù)據(jù)的眾多波段中,通常無法確定應(yīng)選擇的波段數(shù)量作為感興趣目標(biāo)的特征波段數(shù)量。主流的波段選擇算法往往也需要手動輸入所需要的波段數(shù)量,基于聚類分析的波段選擇方法可以解決這個問題。但是例如K-means、DBSCAN等聚類算法依賴于對其中某些參數(shù)的調(diào)整,需要依靠經(jīng)驗去不斷嘗試;層次聚類應(yīng)對噪聲表現(xiàn)不理想,奇異值會對效果產(chǎn)生很大影響,聚類結(jié)果可能形成鏈狀,不利于特征波段的篩選。針對上述問題,本研究借助典型成分分析(Exemplar Component Analysis,ECA)的聚類思想[25-26],將其應(yīng)用于柑橘黃龍病特征波段的提取,即從651個有效波段中,提取對柑橘黃龍病診斷最有效的特征波段,去除冗余波段信息。HLB波段優(yōu)選步驟如下:
存在以下4種情況:
各波段的ES值如圖4a;然后將所有波段的ES按照降序排列,如圖4b。從圖4b中可以看到,ES降序曲線存在一個明顯的“拐點”,在拐點之前ES下降的很快,而在拐點之后,ES下降的速度明顯減慢。因此,ES可以視為衡量波段重要性的指標(biāo),越重要的波段對應(yīng)越大的ES。
圖4 HLB數(shù)據(jù)的ES分布圖
將圖4b中的拐點對應(yīng)到圖4a中的橫線,并將圖4a中ES密集區(qū)域局部放大,如圖5,可以看出對HLB數(shù)據(jù)而言,有7個波段的ES大于拐點(其中有5個ES的數(shù)值過大,在局部放大圖中未能顯示頂端圓點),這預(yù)示著HLB特征波段的數(shù)目可能為7個。通常,波長相近的波段往往具有較高的相關(guān)性,從圖中可以看出,所選出的特征波段大致均勻分布在整個波段集合中,因此所選擇的HLB特征波段具有較小的相關(guān)性,ECA對波段相關(guān)性有較好的抑制作用。
圖5 確定HLB特征波段數(shù)目
使用ECA,已經(jīng)確定HLB的特征波段數(shù)為7,為了進一步確定7個波段可較好表征HLB,本試驗比較了其他3種波段選擇方法:遺傳算法(Genetic Algorithm,GA)、最大橢球體積法(Maximum Ellipsoid Volume,MEV)和基于正交投影(Orthogonal Projections,OP)的波段選擇方法(OP-based Band selection,OPBS),同樣從651個波段中選擇7個波段,然后分別將選出的7個波段使用多種方法進行分類。
為了評價4種波段優(yōu)選算法的有效性,本研究測試了噪聲對波段算法的影響,數(shù)據(jù)集上分成了去除噪聲的數(shù)據(jù)集和包含噪聲的數(shù)據(jù)集。在模型訓(xùn)練中將數(shù)據(jù)集按8∶2比例隨機劃分為訓(xùn)練集和測試集,并保證訓(xùn)練集和測試集中3類數(shù)據(jù)比例相同。為了全面評價優(yōu)選特征波段的魯棒性,本研究采用了7種經(jīng)典機器學(xué)習(xí)建模方法,對優(yōu)選波段的有效性進行評估。盡管目前深度神經(jīng)網(wǎng)絡(luò)的建模效果普遍優(yōu)于傳統(tǒng)的機器學(xué)習(xí)算法,由于本研究樣本集有限,采用深度神經(jīng)網(wǎng)絡(luò)容易產(chǎn)生過擬合,因此本文采用的算法主要是經(jīng)典學(xué)習(xí)算法:邏輯回歸(Logistic regression)、支持向量機(Support Vector Machine,SVM)和多個集成學(xué)習(xí)算法如:隨機森林(Random forest)、引導(dǎo)聚類算法(Bagging)、迭代算法(Adaboot)、分布式梯度增強庫(Xgboost)。然后針對訓(xùn)練集采用5折交叉驗證的方法避免過擬合,使用Grid Search搜索方法進行超參數(shù)優(yōu)化,獲取最優(yōu)參數(shù)后,用測試集對最終模型的泛化能力進行測試。如圖6所示:
基于前面優(yōu)選的7個特征波段,本研究比較了AMS光譜傳感器的3個型號(AS7341、AS7421和AS7263)作為光探測器的選型,采用嵌入式技術(shù)研制低成本的多光譜儀,用于在田間檢測柑橘黃龍病。AMS光譜傳感器可采集400~1050nm范圍的波段數(shù)據(jù),基本覆蓋了黃龍病的特征波段。通過軟件可選擇性采集指定特征波段的光譜數(shù)據(jù)[27-30]。3個傳感器的通道數(shù)量和中心波長如表1所示,其中AS7421有64個通道(中心波長從750 nm到1 050 nm,每隔5 nm取值),表中僅列出了所使用到8個通道。測量原理表明,芯片測量某波長的線寬越窄,測量精度越高。所以,設(shè)計時應(yīng)滿足偏差盡量小的原則,偏差為測量波長與待測波長差值的絕對值,即所選特征波段應(yīng)盡量靠近傳感器通道中心波長。
圖6 數(shù)據(jù)處理步驟
表1 傳感器通道中心波長與特征波段比較
注:上述傳感器都是一個×的光電二極管陣列,每個光電二極管都有自己的濾波器專用響應(yīng),即通道F,每個光電二極管之間的間距為200m。因為不是所有×個通道都對應(yīng)著待測波段,表中只列出了位于待測波段附近的通道。
Note: The above sensors features an×-photodiode arrays. Each photodiode has its own filter with a dedicated response, that is channel F. The pitch between each photodiode is 200m.Because not all×channels correspond to the band to be measured, only the channels near the band to be measured are listed in the table.
通過圖7可知,采集的光譜曲線大致可以劃分為3個區(qū)域:350~680 nm屬于葉片的低反射率區(qū)(A區(qū));680~740 nm屬于快速變化區(qū)域(B區(qū));740~1 000 nm屬于葉片的高反射率區(qū)域(C區(qū))。A區(qū)和C區(qū)相對平緩,B區(qū)快速變化,波長偏移對試驗結(jié)果影響較大,所以應(yīng)在該區(qū)域盡量減小單個波長測量的線寬。所選取的3個型號傳感器參數(shù)如,但相比于地物光譜儀,所選取傳感器的光譜分辨率較低,本研究優(yōu)選得到的特征波段只有707 nm位于B區(qū)。
圖7 HLB光譜的3個區(qū)域
自研多光譜儀整個系統(tǒng)采用STM32F407作為主控制器,使用2節(jié)18650鋰電池串聯(lián)供電,通過RT7C4337時鐘定時去控制DC-DC的使能腳EN來控制整個電路的電源。RT7C4337的I2C不從單節(jié)電池端取電上拉而使用后端的VDD_3V3進行上拉,以防止高電壓倒灌給STM32。AS7341、AS7421、AS7263多光譜傳感器模塊測量作物的反射光譜,通過I2C總線將數(shù)據(jù)傳輸給STM32F407處理器。數(shù)據(jù)經(jīng)處理器處理后,由NB-IoT/4G模塊通過無線網(wǎng)絡(luò)上傳至服務(wù)器。STM32F407處理器提供一個Mini-USB接口,用于導(dǎo)出多光譜儀內(nèi)存中的數(shù)據(jù)。通過預(yù)留的接口,在多光譜儀外接手柄上擴展了操作按鈕和一個LCD顯示屏。通過外接手柄,可以實現(xiàn)工作人員手持多光譜儀進行數(shù)據(jù)采集,在未接手柄時,多光譜儀可以通過三腳架部署在固定位置。自研多光譜儀的研發(fā)和調(diào)試由本研究團隊與廣州思林杰科技股份有限公司聯(lián)合完成,自研多光譜儀包含固定式和手持式兩種,其外觀圖和使用方式如圖8所示。
圖8 固定式和手持式的自研多光譜儀
傳統(tǒng)的非監(jiān)督高光譜波段選擇技術(shù)中,信息量大且相似性低的波段集合被認(rèn)為是理想的波段選擇對象。然而,這些波段由于受到噪聲或者異常的影響,往往具有較低的魯棒性和可靠性。為了進一步評估波段選擇方法應(yīng)用于柑橘黃龍病光譜特征波段選擇的性能,包含噪聲的原始數(shù)據(jù)作為比較,直接進入波段優(yōu)選環(huán)節(jié)。該數(shù)據(jù)中325~350 nm和1 000~1 075 nm為機器噪聲波段,以下稱為原始數(shù)據(jù)集。4種方法選擇的特征波段如表 2所示。
表2 所選波段子集的比較
由表2可知,針對兩種數(shù)據(jù)集,使用ECA中的拐點選取的7個特征波段中,有5個波段完全相同。有兩個波段緊鄰,561 nm和562 nm?;谠紨?shù)據(jù)集選擇出的特征波段里,摻雜進來一個噪聲波段1 008 nm;而在GA算法選擇的特征波段差異較大,未剔除噪聲的數(shù)據(jù)集所選擇的特征波段中摻雜有兩個噪聲波段;MEV和OPBS在兩種情況下所選擇的特征波段表現(xiàn)出了一致性,未剔除噪聲時也有兩個噪聲波段被選擇到。
除ECA外,其他3種方法均在原始數(shù)據(jù)中選擇到了2個噪聲波段,尤其是GA受噪聲的干擾,兩次選擇的特征波段有較大差異。事實上經(jīng)過試驗,當(dāng)所選取的特征波段超過7個時,除ECA之外,其他3種方法所選取的特征波段隨著數(shù)量增加,其中摻雜的噪聲數(shù)目也會增加。
本試驗針對地物譜儀HH2采集到的高光譜數(shù)據(jù),采用7種機器學(xué)習(xí)建模方法,基于4種波段優(yōu)選算法優(yōu)選的3組特征波段組合,表3展示了僅包含兩類數(shù)據(jù)集(HLB、healthy)的分類效果,表4展示了包含3類數(shù)據(jù)集(HLB、healthy和suspected)3類的分類效果。三分類中suspected類別包含了除健康和黃龍病確診類別之外的所有缺素大類。表中給出了各模型的超參數(shù)設(shè)置以及分類準(zhǔn)確率。
表3 二分類時分類器的超參數(shù)和分類精度
為了直觀對比性能,將不同波段選擇方法下各模型的精度繪制成條形圖,如圖9所示??梢钥闯?,使用ECA選擇的7個特征波段所建立的模型在各種情況下均表現(xiàn)優(yōu)異,在兩類區(qū)分的情況下,各模型更是達到了百分之百的準(zhǔn)確率,在3類區(qū)分的情況下,各個模型在測試集的表現(xiàn)也優(yōu)于其他3種波段選擇方法。在同種波段選擇方法下,使用Xgboost作為分類器的模型相較于其他5種有更為穩(wěn)定的表現(xiàn)。ECA所選取的波段結(jié)合Xgboost分類,平均準(zhǔn)確率達到92%以上。
為了進一步定量確定優(yōu)選的波段數(shù)量對柑橘黃龍病檢測的影響,本試驗將選擇的特征波段數(shù)從7個變化到35個,間隔為5,如圖10所示。針對包含HLB和healthy兩類的數(shù)據(jù),將各方法選擇的波段子集用SVM分類。各方法獲得的整體分類精度如圖11所示。從圖可以看出,無論波段選擇數(shù)目為多少,ECA選擇的波段子集總能獲得較高的分類精度,可以確定使用ECA篩選出的7個特征波段在具有良好檢測效果的同時,具有最大簡約性,這種效果符合設(shè)計光譜儀的要求。
表4 三分類時分類器的超參數(shù)和分類精度
采用自研多光譜儀在柑橘園中采集,如圖11b,每次對于同一目標(biāo)分別獲取3組(MEV和OPBS為同一組)特征波段的光譜數(shù)據(jù)。采集規(guī)范、葉片樣本獲取及處理方法同使用地物光譜儀時一致。通過系統(tǒng)設(shè)置,在存儲的.txt格式光譜反射率文件中可以只顯示特征波段,方便后續(xù)試驗。經(jīng)PCR驗證葉片樣本統(tǒng)計后,本次獲取的HLB、healthy和suspected樣本個數(shù)分別為:215、121、98。將3組特征波段下采集的數(shù)據(jù)使用之前訓(xùn)練好的模型進行測試,將準(zhǔn)確率結(jié)果繪制成條形圖可以更直觀了解,如圖11所示。相比圖9,自研多光譜儀獲取的特征波段數(shù)據(jù)輸入模型后,無論是二分類還是三分類,相對于地物光譜儀數(shù)據(jù)選擇的特征波段數(shù)據(jù),各模型的準(zhǔn)確率略有下降。但基于ECA的波段優(yōu)選方法和基于Xgboost的分類效果最佳,二分類和三分類的準(zhǔn)確率可以達到95%。
圖10 不同波段選擇方法效果隨子集波段數(shù)量的變化
在4種波段優(yōu)選算法中,當(dāng)優(yōu)選的特征波段數(shù)較少時,GA具有較大的優(yōu)勢,隨著數(shù)量的增加,GA選擇的波段子集性能開始下降,一個可能的原因是,由于GA本身不是精確算法,而是一種元啟發(fā)式算法[31-34],只能搜索到近似解,并有可能陷入局部最優(yōu),無法保證是全局最優(yōu),解的優(yōu)劣和種群數(shù)量、迭代規(guī)則的設(shè)置有較大相關(guān)性,而且每次計算,會重新生成初始解,最終結(jié)果可能會有較大偏差,并且算法對初始種群的選擇有一定的依賴性,可結(jié)合其他算法進行改進。MEV和OPBS的表現(xiàn)較為穩(wěn)定,且當(dāng)波段數(shù)設(shè)為7時,兩種算法優(yōu)選到的特征波段完全一致。隨著選擇波段數(shù)的增加,OPBS選擇的波段子集表現(xiàn)略有提升。然而,MEV和OPBS兩種算法都需要尋求使得某準(zhǔn)則函數(shù)取得極值的波段子集[35],更傾向于選擇集合中處于邊緣位置的波段,但這些波段往往很不穩(wěn)定,極有可能受到環(huán)境干擾,優(yōu)選到的7個特征波段在整個光譜集合上呈現(xiàn)分布不均勻,有些波段相鄰緊密,這對于設(shè)計一臺低成本的多光譜儀不利,因為低成本的光譜傳感器其采集通道較寬,不能滿足緊鄰波段的細致區(qū)分。因此,利用自研多光譜儀采集的特征波段數(shù)據(jù)建模后,MEV和OPBS的各個模型表現(xiàn)較差,這也證實了這一分析。
本研究仍存在一些不足,例如受限于發(fā)病季節(jié)性原因,參與試驗的樣本偏少,普適性有待增強;相比于地物光譜儀,自研多光譜儀所采集的特征波段光譜數(shù)據(jù)在各個模型上表現(xiàn)有所下降,主要原因有3個方面:首先,所選取的AMS芯片光譜分辨率較低;其次,3種型號的光譜傳感器的光譜通道中心波段算法優(yōu)選特征波段存在一定的偏差,所以未能達到地物譜儀數(shù)據(jù)的精度;再者,自研多光譜儀在光學(xué)結(jié)構(gòu)的設(shè)計上仍有待改進。雖然多光譜儀的設(shè)計經(jīng)歷了多次迭代,如在第1代設(shè)計基礎(chǔ)上縮小了進光孔以減少雜光的干擾,但與專業(yè)光學(xué)設(shè)備的采光孔徑相比仍然較大,沒有鏡頭缺少了對入射光進行準(zhǔn)直處理等環(huán)節(jié),光線在到達傳感器前仍會有多次反射,這都會降低光譜數(shù)據(jù)的質(zhì)量。
然而,ECA選擇的特征波段在自研多光譜儀數(shù)據(jù)分析中仍獲得了最佳的表現(xiàn),由前人的研究可知[36-39],染病顯狀和缺素疑似柑橘葉片在450~700 nm的光譜反射率明顯高于健康葉片,ECA所選擇的7個波段中有4個位于此區(qū)間中;感染黃龍病的柑橘葉片(包含顯狀和未顯狀)的光譜反射率在730~1 023 nm波長范圍內(nèi)呈現(xiàn)升高,而單純?nèi)彼匾伤频娜~片則呈現(xiàn)降低,兩者表現(xiàn)出相反的變化趨勢,所以此區(qū)間波段也有助于區(qū)分健康與染病植株,ECA所選擇的7個波段中有2個位于此區(qū)間。選擇的7個黃龍病特征波段在整個光譜集合上分布均勻,相關(guān)性不高,并且每個波段與所選光譜傳感器通道的中心波段偏差較小,使得獲取的數(shù)據(jù)質(zhì)量較高。
本文研制的低成本光譜檢測儀具有可拓展性,不僅可以應(yīng)用于本文的柑橘黃龍病檢測,也可以在其他作物病蟲害和營養(yǎng)脅迫的特征波段基礎(chǔ)上,進行特定應(yīng)用的波段定制,從而實現(xiàn)多種作物多種病害、營養(yǎng)成分的分析和診斷。
本研究探索了柑橘黃龍病光譜特征波段提取以及光譜檢測儀研制方法。針對柑橘黃龍病的檢測,提出了基于典型成分分析(Exemplar Component Analysis,ECA)的波段優(yōu)選方法。ECA算法優(yōu)選了7個柑橘黃龍病特征波段,分別為377、460、561、630、669、802 m和856 nm?;谝陨蟽?yōu)選的特征波段,采用AMS光譜傳感器和嵌入式技術(shù)設(shè)計了一款低成本的多光譜儀。得出主要結(jié)論如下:
1)本文提出的基于ECA的柑橘黃龍病波段優(yōu)選方法,可以較好得獲得柑橘黃龍病的特征波段,魯棒性高,不僅可以區(qū)分健康葉片和黃龍?。℉LB)葉片,也可區(qū)分HLB葉片與因缺素表現(xiàn)為與黃龍病高度相似的葉片,在包含機器噪聲的情況下仍然可以較準(zhǔn)確地獲得較一致的特征波段。
2)相較于類似研究,本文基于ECA的波段優(yōu)選方法僅優(yōu)選7個波段,最大程度去掉了冗余的波段,面對大量樣本的應(yīng)用場景,可以減少數(shù)據(jù)傳輸與存儲的壓力。
3)不同分類器的比較表明,分布式梯度增強庫在光譜數(shù)據(jù)方面表現(xiàn)最好,并且效果較為穩(wěn)定?;谔卣鞑ǘ危渌诸惼饕矊崿F(xiàn)了較高的檢測準(zhǔn)確率,但在不同波段選擇方法的表現(xiàn)并不穩(wěn)定。
4)設(shè)計了一款低成本多光譜儀。光譜儀數(shù)據(jù)結(jié)合基于特征波段搭建的模型能夠獲得不錯的HLB檢測效果,雖然仍有一定的錯誤率,但在三分類情況下最高識別準(zhǔn)確率可達95%,相比于高精度、高價格的專業(yè)儀器,其應(yīng)用前景未來可期。
[1] 袁亦文,戈麗清,王德善,等. 柑橘黃龍病對柑橘產(chǎn)量和品質(zhì)的影響[J]. 浙江農(nóng)業(yè)科學(xué),2007(1):87-88.
Yuan Yiwen, Ge Liqing, Wang Deshan, et al. Effect of citrus huanglong disease on citrus yield and quality[J]. Journal of Zhejiang Agricultural Sciences, 2007(1): 87-88. (in Chinese with English abstract)
[2] 程春振,曾繼吾,鐘云,等. 柑橘黃龍病研究進展[J]. 園藝學(xué)報,2013,40(9):1656-1668.
Cheng Chunzhen, Zeng Jiwu, Zhong Yun, et al. Research progress on citrus huanglongbing disease[J] Acta Horticulturae Sinica, 2013,40(9):1656-1668.(in Chinese with English abstract)
[3] 柏自琴,周常勇. 柑橘黃龍病病原分化及發(fā)生規(guī)律研究進展[J]. 中國農(nóng)學(xué)通報,2012,28(1):133-137.
Bai Ziqin, Zhou Changyong. The research progress of citrus huanglongbing on pathogen diversity and epidemiology [J]. Chinese Agricultural Science Bulletin, 2012, 28(1): 133-137. (in Chinese with English abstract)
[4] Rosales R, Burns J K. Phytohormone changes and carbohydrate status in sweet orange fruit from Huanglongbing-infected trees[J]. Journal of Plant Growth Regulation, 2011, 30(3): 312-321.
[5] Bové J M. Huanglongbing: A destructive, newly-emerging, century-old disease of citrus[J]. Journal of Plant Pathology, 2006, 88(1): 7-37.
[6] 林孔湘. 柑桔黃梢(黃龍)病研究Ⅱ. 關(guān)于病原的探討[J]. 植物病理學(xué)報,1956(1):13-42,102-104.
Lin Kongxiang. Studies on citrus yellow shoot (Huang long) disease Ⅱdiscussion on pathogen[J]. Acta Phytopathologica Sinica, 1956(1): 13-42,102-104. (in Chinese with English abstract)
[7] 鹿連明,范國成,胡秀榮,等. 田間柑橘植株不同部位黃龍病菌的 PCR 檢測及發(fā)病原因分析[J]. 植物保護,2011,37(2):45-49.
Lu Lianming, Fan Guocheng, Hu Xiurong, et al. PCR detection of huanglongbing pathogen in different parts of citrus plants in the field and analysis of the cause of the disease [J]. Plant Protection, 2011, 37(2): 45-49. (in Chinese with English abstract)
[8] Bassanezi R B, Montesino L H, Stuchi E S. Effects of huanglongbing on fruit quality of sweet orange cultivars in Brazil[J]. European Journal of Plant Pathology, 2009, 125(4): 565-572.
[9] 張超. 柑橘黃龍病病菌亞洲種Sec依賴分泌蛋白的預(yù)測、鑒定及功能研究[D]. 北京:中國農(nóng)業(yè)科學(xué)院,2020.
Zhang Chao. Prediction, Validation and Functional Study of Candidatus Liberibacter Asiaticus Sec Dependent Secretary Proteins[D]. Beijing: Chinese Academy of Agricultural Sciences, 2020. (in Chinese with English abstract)
[10] 錢文娟. 基于核酸擴增技術(shù)的柑橘黃龍病檢測方法研究[D].杭州:浙江大學(xué),2018.
Qian Wenjuan. Detection of Citrus Huanglongbing Based on Nucleic Acid Amplification Technique[D]. Hangzhou: Zhejiang University, 2018. (in Chinese with English abstract)
[11] 王愛民,鄧曉玲. 柑桔黃龍病診斷技術(shù)研究進展[J]. 廣東農(nóng)業(yè)科學(xué),2008(6):101-103.
Wang Aimin, Deng Xiaoling. Research progress in diagnostic techniques of citrus huanglong disease[J]. Guangdong Agricultural Sciences, 2008(6): 101-103. (in Chinese with English abstract)
[12] 袁波,楊青. 光譜技術(shù)及應(yīng)用[M]. 浙江:浙江大學(xué)出版社. 2019:44-79.
[13] 張凝,楊貴軍,趙春江,等. 作物病蟲害高光譜遙感進展與展望[J]. 遙感學(xué)報,2021,25(1):403-422.
Zhang Ning, Yang Guijun, Zhao Chunjiang, et al. Progress and prospects of hyperspectral remote sensing technology for crop diseases and pests[J]. National Remote Sensing Bulletin, 2021, 25(1): 403-422. (in Chinese with English abstract)
[14] 童慶禧,張兵,張立福. 中國高光譜遙感的前沿進展[J]. 遙感學(xué)報,2016,20(5):689-707.
Tong Qingxi, Zhang Bing, Zhng Lifu. Current progress of hyperspectral remote sensing in China [J]. National Remote Sensing Bulletin, 2016, 20(5): 689-707. (in Chinese with English abstract)
[15] 姚云軍,秦其明,張自力,等. 高光譜技術(shù)在農(nóng)業(yè)遙感中的應(yīng)用研究進展[J]. 農(nóng)業(yè)工程學(xué)報,2008,24(7):301-306.
Yao Yunjun, Qin Qiming, Zhang Zili, et al. Research progress of hyperspectral technology applied in agricultural remote sensing [J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2008, 24(7): 301-306. (in Chinese with English abstract)
[16] 桂江生,費婧怡,傅霞萍. 三維小樣本元學(xué)習(xí)模型的大豆食心蟲蟲害高光譜檢測[J]. 光譜學(xué)與光譜分析,2021,41(7):2171-2174.
Gui Jiangsheng, Fei Jingyi, Fu Xiaping. Hyperspectral imaging for detection of leguminivora glycinivorella based on 3D few-shot meta-learning model[J]. Spectroscopy and Spectral Analysis, 2021, 41(7): 2171-2174. (in Chinese with English abstract)
[17] Pascucci S, Pignatti S, Casa R, et al. Special issue “hyperspectral remote sensing of agriculture and vegetation”[J]. Remote Sensing, 2020, 12(21): 3665-3665.
[18] Moriya é A S, Imai N N, Tommaselli A M G, et al. Detecting citrus huanglongbing in Brazilian orchards using hyperspectral aerial images[J]. The International Archives of Photogrammetry, Remote Sensing and Spatial Information Sciences, 2019, 42: 1881-1886.
[19] Weng H, Lv J, Cen H, et al. Hyperspectral reflectance imaging combined with carbohydrate metabolism analysis for diagnosis of citrus Huanglongbing in different seasons and cultivars[J]. Sensors and Actuators B: Chemical, 2018, 275: 50-60.
[20] 孫康,陳金勇. 高光譜圖像波段選擇技術(shù)[M]. 北京:電子工業(yè)出版社,2020:40.
[21] 肖懷春. 基于高光譜成像技術(shù)的柑橘黃龍病診斷方法研究[D]. 上海:華東交通大學(xué),2019.
Xiao Huaichun. Study on Diagnosis Methods of Citrus Greening Based on Hyperspectral Imaging[D]. Shanghai: East China Jiaotong University, 2019. (in Chinese with English abstract)
[22] 王克健. 柑橘黃龍病光譜檢測與柑橘木虱UAV防控技術(shù)探索[D]. 重慶:西南大學(xué),2018.
Wang Kejian. Exploration of the Spectrum Monitoring Technology of Huanglongbing and the UAV Control Technology of Citrus Psyllid[D]. Chongqing: Southwest University, 2018. (in Chinese with English abstract)
[23] Deng X, Huang Z, Zheng Z, et al. Field detection and classification of citrus Huanglongbing based on hyperspectral reflectance[J]. Computers and Electronics in Agriculture, 2019, 167: 105006.
[24] Deng X, Zhu Z, Yang J, et al. Detection of citrus huanglongbing based on multi-input neural network model of UAV hyperspectral remote sensing[J]. Remote Sensing, 2020, 12(17): 2678.
[25] Rodriguez A, Laio A. Clustering by fast search and find of density peaks[J]. Science, 2014, 344(6191): 1492-1496.
[26] Sun K, Geng X, Ji L. Exemplar component analysis: A fast band selection method for hyperspectral imagery[J]. IEEE Geoscience and Remote Sensing Letters, 2014, 12(5): 998-1002.
[27] 朱豪男,胡孟晗,張健,等. 低成本便攜式多光譜成像系統(tǒng)的研發(fā)及優(yōu)化[J]. 中國圖象圖形學(xué)報,2021,26(8):1796-1808.
Zhu Haonan, Hu Menghan, Zhang Jian, et al. Development and optimization of a low-cost and portable multispectral imaging system [J]. Journal of Image and Graphics, 2021, 26(8): 1796-1808. (in Chinese with English abstract)
[28] 萬會江. 多光譜成像系統(tǒng)研究[D]. 杭州:浙江大學(xué),2011.
Wan Huijiang. Research of Multi-spectral Imaging System[D]. Hangzhou: Zhejiang University, 2011. (in Chinese with English abstract)
[29] 喬鼎恒. 多光譜成像系統(tǒng)硬件設(shè)計與實現(xiàn)[D]. 北京:北京工業(yè)大學(xué),2018.
Qiao Dingheng. Multispectral Imaging System Hardware Design and Implementation[D]. Beijing: Beijing University of Technology, 2018. (in Chinese with English abstract)
[30] 殷文鑫. 基于多旋翼無人機的多光譜成像遙感系統(tǒng)開發(fā)及應(yīng)用[D]. 杭州:浙江大學(xué),2018.
Yin Wenxin. Development and Application of a Multispectral Remote Sensing System Based on the Multi-rotor Drone[D]. Hangzhou: Zhejiang University, 2018. (in Chinese with English abstract)
[31] 席裕庚,柴天佑,惲為民. 遺傳算法綜述[J]. 控制理論與應(yīng)用,1996(6):697-708.
Xi Yugeng, Chai Tianyou, Yu Weimin. Survey on genetic algorithm[J]. Control Theory & Applications, 1996(6): 697-708. (in Chinese with English abstract)
[32] 李浩光,于云華,逄燕,等. 基于遺傳算法的近紅外光譜定性分析特征波長提取方法研究[J]. 光譜學(xué)與光譜分析,2021, 41(8):2437-2442.
Li Haoguang, Yu Yunhua, Pang Yan, et al. Study on characteristic wavelength extractin method for near infrared spectroscopy identification based on genetic algorithm[J]. Spectroscopy and Spectral Analysis, 2021, 41(8): 2437-2442. (in Chinese with English abstract)
[33] 趙冬,趙光恒. 基于改進遺傳算法的高光譜圖像波段選擇[J].中國科學(xué)院研究生院學(xué)報,2009,26(6):795-802.
Zhao Dong, Zhao Guangheng. Band selection of hyperspectral image based on improved genetic algorithm[J]. Journal of University of Chinese Academy of Sciences, 2009, 26(6): 795-802. (in Chinese with English abstract)
[34] Lucas C, Leon N, Yiannis A, et al. A new visible band index (vNDVI) for estimating NDVI values on RGB images utilizing genetic algorithms[J]. Computers and Electronics in Agriculture, 2020, 172: 105334-105334.
[35] Sheffield C. Selecting band combinations from multispectral data[J]. Photogrammetric Engineering and Remote Sensing, 1985, 51(6): 681-687.
[36] 吳越,蘇華楠,黃愛軍,等. 柑橘黃龍病菌侵染對甜橙葉片糖代謝的影響[J]. 中國農(nóng)業(yè)科學(xué),2015,48(1):63-72.
Wu Yue, Su Huanan, Huang Aijun, et al. Effect of candidatus liberibacter asiaticus infection on carbohydrate metabolism in citrus sinensis[J]. Scientia Agricultura Sinica, 2015, 48(1): 63-72. (in Chinese with English abstract)
[37] 梅慧蘭, 鄧小玲,洪添勝,等. 柑橘黃龍病高光譜早期鑒別及病情分級[J]. 農(nóng)業(yè)工程學(xué)報,2014,30(9):140-147.
Mei Huilan, Deng Xiaoling, Hong Tinsheng, et al. Early detection and grading of citrus huanglongbing using hyperspectral imaging technique[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2014, 30(9): 140-147.
[38] 樊晶. 柑橘宿主對黃龍病病原菌侵染的應(yīng)答機制[D]. 重慶:重慶大學(xué),2010.
Fan Jing. Response of Citrus to the Infection of Huanglongbing-associated Bacteria[D]. Chongqing: Chongqing University, 2010. (in Chinese with English abstract)
[39] 翁海勇. 基于光學(xué)成像技術(shù)的柑橘黃龍病快速檢測方法研究[D]. 浙江:浙江大學(xué),2019.
Weng Haiyong. Optical Imaging for Rapid Detection of Citrus Huanglongbing[D]. Zhe Jiang: Zhejiang University, 2019. (in Chinese with English abstract)
Selection of spectral characteristic bands of HLB disease of citrus and spectrum detector development
Lan Yubin1,2,3,4, Wang Tianwei1, Guo Yaqi1, Yang Dongzi1, Lin Shaoming1, Hu Yuqi1, Lin Xiaoqing1, Deng Xiaoling1,2,3,4※
(1.,,,510642,;2.,510642,;3.,510642,;4.,510642,)
Huanglongbing (HLB) is known as one of the most important diseases in citrus production. Early detection of diseased plants can be used to prevent the disease from the spreading, in order to reduce the severity of the disease. Hyperspectral analysis can be expected in the crop disease detection in recent years, due to the rich spectral information. However, the hyperspectral equipment is too expensive to apply in large scale, particularly with a large amount of calculation for a large number of bands. An accurate band selection can be utilized to remove the redundant information for the less data storage, calculation, and transmission, in order to avoid the "dimension disaster", and equipment costs. In this study, an Exemplar Component Analysis (ECA)-based method was proposed to optimize the characteristic wavebands of HLB diseases using a ground feature spectrometer. The spectrum detector was also selected the spectral characteristic bands from the hyperspectral information of citrus plants. Three algorithms were utilized to optimize the combination of sever spectral wavebands for comparison. The optimal bands were obtained to evaluate the robustness of the four band selection. Among them, the six machine learning methods were used for the modeling and classification. In addition, a multi-spectrometer was designed using the optimal characteristic band for the detection of citrus HLB. The results show that an accuracy of more than 92% was achieved in the test set of the feature band that selected by the ECA algorithm combined with the six classifiers, indicating the excellent robustness. The self-developed multi-spectrometer was detected up to 95% accuracy for the HLB using the characteristic band. Experiments show that the multiple spectrometer was feasible to characterize the HLB for a small number of characteristic bands. A reasonable characteristic band was greatly reduced the design cost of spectrum detection in the special agricultural disease, and then improved the accuracy of disease prevention and control in orchards. As such, the HLB spectral feature bands were extracted to develop a spectral detector. The proposed ECA-based band selection can be expected to obtain the characteristic bands of citrus HLB with the high robustness. Specifically, the healthy leaves were distinguished from the HLB leaves, particularly from the high similarity to the HLB disease due to deficiency. Moreover, the ECA-based band preference was only preferred seven bands. The redundant bands were removed to reduce the data transmission and storage in the application scenario of large number of samples. The comparison of different classifiers showed that the Xgboost performed the best, in terms of the stable spectral data. The high detection accuracy was also achieved in the rest classifiers using the feature bands. A low-cost multispectral instrument was also designed to promote the unstable performance in different band selection. Anyway, the accurate HLB detection was obtained using the spectrometer data with the feature bands model, where the highest recognition accuracy was close to 95% in the case of triple classification. The promising application prospect was given in the future, compared with the rest high precision and high price professional instruments. The data analysis and spectrometer can be affordable to promote the smart agriculture, compared with the generally expensive spectrometers on sale. Low-cost spectrometers are more likely to be popularized, in order to reduce the amount of generated data for the less hardware requirements. A balance between detection accuracy and production cost can lay a strong foundation for the wide popularization of intelligent equipment.
hyperspectral; remote sensing; intelligent detection; citrus Huanglongbing; customized spectrometer; band selection
10.11975/j.issn.1002-6819.2022.20.014
S127;S157.9
A
1002-6819(2022)-20-0119-10
蘭玉彬,王天偉,郭雅琦,等. 柑橘黃龍病光譜特征波段選擇及光譜檢測儀研制[J]. 農(nóng)業(yè)工程學(xué)報,2022,38(20):119-128.doi:10.11975/j.issn.1002-6819.2022.20.014 http://www.tcsae.org
Lan Yubin, Wang Tianwei, Guo Yaqi, et al. Selection of spectral characteristic bands of HLB disease of citrus and spectrum detector development[J]. Transactions of the Chinese Society of Agricultural Engineering (Transactions of the CSAE), 2022, 38(20): 119-128. (in Chinese with English abstract) doi:10.11975/j.issn.1002-6819.2022.20.014 http://www.tcsae.org
2021-10-28
2022-10-12
廣東省引進領(lǐng)軍人才項目(2016LJ06G689);廣東省重點領(lǐng)域研發(fā)計劃項目(2019B020214003);廣州市重點研發(fā)計劃項目(202103000090);廣東高校重點領(lǐng)域(人工智能)專項項目(2019KZDZX1012);廣東省科技創(chuàng)新戰(zhàn)略專項資金項目(pdjh2020b0089);嶺南現(xiàn)代農(nóng)業(yè)實驗室科研項目(NT2021009);國家自然科學(xué)基金面上項目(61675003)
蘭玉彬,博士,教授,研究方向為精細農(nóng)業(yè)、農(nóng)業(yè)航空施藥、農(nóng)業(yè)航空和地面遙感、農(nóng)業(yè)航空導(dǎo)航、智能農(nóng)業(yè)裝備和新型傳感器等。Email:ylan@scau.edu.cn
鄧小玲,博士,副教授,研究方向為智慧果園、農(nóng)業(yè)人工智能和無人機遙感。Email: dengxl@scau.edu.cn