李亞文 趙杰 陳月星
摘 要:針對(duì)蘋果葉部常見(jiàn)病害實(shí)現(xiàn)綠色、無(wú)損檢測(cè),提出了一種基于SVM和小波基特征提取的蘋果葉部病害識(shí)別算法。該算法通過(guò)對(duì)蘋果葉片圖像進(jìn)行小波變換,提取出小波系數(shù)后,進(jìn)一步執(zhí)行小波包變換,再提取出具有代表性的小波基特征,根據(jù)每個(gè)區(qū)域的特征參數(shù),得到一組小波基特征向量,然后通過(guò)SVM進(jìn)行模型訓(xùn)練,使用SVM分類器對(duì)不同病害進(jìn)行分類識(shí)別。試驗(yàn)結(jié)果表明,基于小波基特征提取的蘋果葉部病害識(shí)別算法,識(shí)別常見(jiàn)五種蘋果葉部病害準(zhǔn)確率較高,可靠性較好,滿足實(shí)際生產(chǎn)中對(duì)蘋果葉部病害無(wú)損檢測(cè)的需求,為綠色、智慧果業(yè)提供技術(shù)支持。
關(guān)鍵詞:小波基特征;SVM訓(xùn)練;特征提??;召回率
中圖分類號(hào):TP391.41? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ?文章編號(hào):1674-0033(2024)02-0026-09
引用格式:李亞文,趙杰,陳月星.基于小波基特征提取的蘋果葉部病害檢測(cè)算法設(shè)計(jì)[J].商洛學(xué)院學(xué)報(bào),2024,38(2):26-34.
A Design of Apple Leaf Disease Detection Algorithm
Based on Wavelet Feature Extraction
LI Ya-wen1, ZHAO Jie1, CHEN Yue-xing2
(1.College of Electronic Information and Electrical Engineering of Shangluo University / Shangluo Artificial Intelligence Research Center? 726000, Shaanxi; 2.College of Biopharmaceutical and Food Engineering, Shangluo University, Shangluo? 726000, Shaanxi)
Abstract: For the green and non-destructive detection of common apple leaf diseases, an apple leaf disease recognition algorithm is proposed based on SVM and wavelet feature extraction. The algorithm performs wavelet transform on the apple leaf image. After extracting the wavelet coefficients, the wavelet packet transform is further performed to extract the representative wavelet basis features. According to the characteristic parameters of each region, a set of wavelet basis feature vectors is obtained. Then, the model is trained by SVM, and the SVM classifier is used to classify and identify different diseases. The experimental results show that the apple leaf disease recognition algorithm based on wavelet feature extraction has high accuracy and good reliability in identifying five common apple leaf diseases, which meets the needs of non-destructive detection of apple leaf diseases in actual production and provides technical support for green and intelligent fruit industry.
Key words: wavelet base characteristics; SVM training; feature extraction; recall rate
蘋果葉部病害的鑒別主要是通過(guò)技術(shù)人員到現(xiàn)場(chǎng),根據(jù)病株的發(fā)病部位、時(shí)期、病斑形狀和顏色等診斷,存在主觀性強(qiáng)、誤差大的缺點(diǎn)[1]。隨著機(jī)器學(xué)習(xí)和計(jì)算機(jī)視覺(jué)技術(shù)的發(fā)展,基于圖像處理和特征提取的自動(dòng)化算法被廣泛應(yīng)用于農(nóng)業(yè)研究領(lǐng)域,以實(shí)現(xiàn)對(duì)蘋果病害的自動(dòng)識(shí)別和分類。早期病害圖像分類以傳統(tǒng)機(jī)器學(xué)習(xí)為主,經(jīng)過(guò)圖像預(yù)處理、圖像分割和特征提取后,再通過(guò)特定的機(jī)器學(xué)習(xí)算法訓(xùn)練其對(duì)特定特征向量的分類能力,從而達(dá)到識(shí)別病害圖像的目的[2]。近幾年,一些研究者利用深度學(xué)習(xí)的相關(guān)算法提高了蘋果葉部病害識(shí)別的精度,江鵬等[3]提出了利用深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)(CNN)和SSD檢測(cè)器,通過(guò)對(duì)蘋果葉片圖像進(jìn)行卷積和檢測(cè),提高了病害檢測(cè)的準(zhǔn)確率和魯棒性,可以有效地識(shí)別蘋果葉片病害的類型和位置。李鑫然等[4]建立了一種改進(jìn)Faster R-CNN算法的蘋果葉片病害檢測(cè)模型,在RPN網(wǎng)絡(luò)中引入空洞卷積和級(jí)聯(lián)ROI池化層,提高蘋果葉片病害檢測(cè)的速度和準(zhǔn)確率。潘仁勇等[5]通過(guò)利用DTS和ResNet結(jié)構(gòu),在卷積層之間添加殘差連接,加快信息傳遞和提高特征提取能力。趙嘉威等[6]提出了一種基于改進(jìn)的YOLOv4算法的蘋果葉片病害檢測(cè)方法,針對(duì)網(wǎng)絡(luò)結(jié)構(gòu)、數(shù)據(jù)增強(qiáng)和損失函數(shù)的改進(jìn),實(shí)現(xiàn)對(duì)蘋果葉片病害特征的精準(zhǔn)分類和定位。Erveen Kahkashan等[7]提出了一種基于多維注意力機(jī)制的CNN模型,在基于多維注意力機(jī)制的CNN模型中卷積和池化的基礎(chǔ)上,加入了注意力機(jī)制,從而更加有效地提取蘋果葉片病害的特征參數(shù)。本文提出了一種基于SVM和小波基特征提取的蘋果葉部病害識(shí)別算法,通過(guò)提取蘋果葉部的小波基特征參數(shù)并進(jìn)行SVM分類訓(xùn)練,實(shí)現(xiàn)對(duì)蘋果常見(jiàn)的五種病害的快速、高效的檢測(cè)識(shí)別。
1? 小波基特征
小波特征提取[8]是一種信號(hào)處理技術(shù),通過(guò)對(duì)信號(hào)進(jìn)行小波變換來(lái)獲取有用的特征信息。其原理是利用小波分析對(duì)信號(hào)進(jìn)行多尺度、多分辨率的分解,將信號(hào)分解為不同頻率的子帶,進(jìn)而從中提取出與應(yīng)用相關(guān)的特征。特征提取是指從數(shù)據(jù)中提取有用特征的降維或函數(shù)映射的過(guò)程。特征提取、選擇和構(gòu)造是篩選數(shù)據(jù)或?qū)嵗群?jiǎn)約的有效方法,其目標(biāo)是減少數(shù)據(jù)量、關(guān)注相關(guān)數(shù)據(jù)、提高數(shù)據(jù)質(zhì)量。
小波特征提取主要包括5個(gè)參數(shù):均值、標(biāo)準(zhǔn)差、方差、水平高頻能量和垂直高頻能量。
1)均值:表示子帶信號(hào)中各個(gè)采樣點(diǎn)的平均值,是描述信號(hào)整體趨勢(shì)的一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其均值為:
Meanj=[][N][i=1][ωj,i](1)
式(1)中,ωj,i表示第j層第i個(gè)小波包系數(shù),N表示第j層小波包系數(shù)的個(gè)數(shù)。
2)標(biāo)準(zhǔn)差:表示子帶信號(hào)中各個(gè)采樣點(diǎn)與均值之間的離散程度,是描述信號(hào)波動(dòng)性的一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其標(biāo)準(zhǔn)差為:
SDj=(2)
3)方差:表示子帶信號(hào)中各個(gè)采樣點(diǎn)與均值之間的離散程度的平方,是描述信號(hào)波動(dòng)性的另一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其方差為:
Varj=[N][][i=1][(ωj,i-Meanj)2](3)
4)水平高頻能量:表示子帶信號(hào)中水平方向上的高頻分量的能量大小,是描述信號(hào)在水平方向上的細(xì)節(jié)特征的一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其水平高頻能量為:
EH,j=[N][][i=1][ω](4)
式(4)中,ω表示第j層第i個(gè)小波包系數(shù),N表示第j層小波包系數(shù)的個(gè)數(shù)。
5)垂直高頻能量:表示子帶信號(hào)中垂直方向上的高頻分量的能量大小,是描述信號(hào)在垂直方向上的細(xì)節(jié)特征的一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其垂直高頻能量為:
EV,j=[N][][i=1][ω](5)
6)對(duì)角線高頻能量:表示子帶信號(hào)中對(duì)角線方向上的高頻分量的能量大小,是描述信號(hào)在對(duì)角線方向上的細(xì)節(jié)特征的一個(gè)指標(biāo)。對(duì)于第j層小波包系數(shù),其對(duì)角線高頻能量為:
ED,j=[N][][i=1][ω](6)
式(6)中,ωj,i表示第j層第i個(gè)小波包系數(shù),N表示第j層小波包系數(shù)的個(gè)數(shù)。
這些參數(shù)可以用于信號(hào)處理、特征提取和模式識(shí)別等領(lǐng)域,對(duì)于理解和分析信號(hào)的特征具有重要的意義。
2? 支持向量機(jī)
SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)和凸優(yōu)化的方法,可用于模式識(shí)別和回歸估計(jì)[9],它屬于機(jī)器學(xué)習(xí)、模式識(shí)別和人工神經(jīng)網(wǎng)絡(luò)等多個(gè)學(xué)科,SVM是基于統(tǒng)計(jì)學(xué)習(xí)理論建立的模型,因此它需要大量的訓(xùn)練數(shù)據(jù)來(lái)保證分類器的準(zhǔn)確性和魯棒性。
設(shè)置訓(xùn)練樣本為xi,i=1,2,…,n,相對(duì)應(yīng)的期望輸出為yi={+1,-1},+1和-1分別表示不相同的兩個(gè)類型。假定分類面的方程為:
wx+b=0(7)
yi(xi+b)-1≥0(8)
可以計(jì)算出分類間隔為:
-=(9)
訓(xùn)練目標(biāo)是最大化分類間隔,使‖w2‖最小化。然后,將最優(yōu)分類問(wèn)題變換成以下約束條件下優(yōu)化問(wèn)題,就可以得到式(10)的最小值[10-11]。
Φ(w)=‖w2‖(10)
yi(xiw+b)-1≥0(11)
使用拉格朗日乘子的方法,可以進(jìn)行相應(yīng)的轉(zhuǎn)換。
[l][][i=1][aiyi(xiw+b)+][l][][i=1][ai][L=‖w‖2-](12)
[*][ai]{[xiw+b]yi-1}=0(13)
對(duì)于大多數(shù)的樣本,[*][ai]取0,而對(duì)取值不是0的[*][ai],yi(xiw+b)-1≥0等號(hào)成立,這些樣本稱為支持向量(Support Vector)。
3? 算法實(shí)現(xiàn)
3.1 算法實(shí)現(xiàn)技術(shù)方案
本算法以蘋果葉部5種病害為研究對(duì)象,建立采集蘋果葉部病害數(shù)據(jù)集,對(duì)圖像經(jīng)過(guò)前期預(yù)處理,針對(duì)預(yù)處理后的5種蘋果葉部病害圖像數(shù)據(jù)集,使用小波包變換進(jìn)行圖像特征提取,并通過(guò)特征選擇算法篩選出最能表征這5種葉部病害的特征向量,然后利用訓(xùn)練集的特征向量和對(duì)應(yīng)的病害標(biāo)簽訓(xùn)練SVM分類器,并將其應(yīng)用于測(cè)試集中的葉片圖像分類,算法實(shí)現(xiàn)的具體技術(shù)路線如圖1所示。
3.2 數(shù)據(jù)采集和環(huán)境搭建
本研究使用的蘋果葉部病害圖像數(shù)據(jù)集來(lái)源于飛槳數(shù)據(jù)集(https://aistudio.baidu.com/aistudio/datasetdetail/11591/0),選取其中1 000張圖片作為測(cè)試集,其中包括:花葉病216張圖像(如圖2)、銹病190張圖像(如圖3)、灰斑病192張圖像(如圖4)、斑點(diǎn)落葉病210張圖像(如圖5)、褐斑病192張圖像(如圖6)等,以5種蘋果病害葉部作為訓(xùn)練樣本,訓(xùn)練集用來(lái)訓(xùn)練模型,驗(yàn)證集用來(lái)調(diào)整模型的超參數(shù)(如學(xué)習(xí)率、正則化強(qiáng)度等),測(cè)試集用來(lái)評(píng)估模型的泛化能力。
算法模型訓(xùn)練試驗(yàn)環(huán)境設(shè)置如表1所示,試驗(yàn)中深度學(xué)習(xí)框架是由Pytorch平臺(tái)搭建。
表1? 算法模型訓(xùn)練試驗(yàn)環(huán)境
3.3 小波基特征提取
試驗(yàn)中定義了一個(gè)函數(shù)(extract_features)來(lái)從圖像中提取特征[12-13]。該函數(shù)通過(guò)執(zhí)行小波分解(具體使用db2小波,分解級(jí)別為2)來(lái)提取紋理特征中的統(tǒng)計(jì)特征,然后將得到的所有系數(shù)串聯(lián)成一個(gè)特征向量。
運(yùn)用小波基特征提取方法時(shí),使用Python編程語(yǔ)言的學(xué)習(xí)庫(kù)(scikit-learn庫(kù))。調(diào)用 extract_features函數(shù)對(duì)圖像進(jìn)行紋理特征提取,使用選定的小波基函數(shù)db2對(duì)信號(hào)進(jìn)行小波變換,得到小波系數(shù),從小波系數(shù)中提取小波包特征使用小波包分解方法,計(jì)算每個(gè)小波包子帶的能量、熵、標(biāo)準(zhǔn)差等特征,將其作為特征向量,并將結(jié)果存儲(chǔ)在feature變量中。先提取數(shù)據(jù)集1 000張圖像的小波系數(shù),再計(jì)算小波包特征的均值、標(biāo)準(zhǔn)差、方差、水平高頻能量、垂直高頻能量和對(duì)角線高頻能量,表2中展示20張樣本測(cè)試的小波特征數(shù)據(jù)值。
4? 試驗(yàn)測(cè)試與結(jié)果分析
4.1 參數(shù)指標(biāo)
準(zhǔn)確率(precision)、召回率(recall)和F1值是用于評(píng)估二分類問(wèn)題模型性能的常用指標(biāo)[14],與SVM模型的訓(xùn)練和評(píng)估密切相關(guān)。準(zhǔn)確率是指模型正確分類的樣本數(shù)與總樣本數(shù)之比。準(zhǔn)確率高表示模型的分類精度高,但無(wú)法反映模型的分類能力在正例和負(fù)例兩個(gè)類別上的表現(xiàn)。TP表示真正例(分類器將正例正確分類為正例的樣本數(shù)),TN表示真負(fù)例(分類器將負(fù)例正確分類為負(fù)例的樣本數(shù)),F(xiàn)P表示假正例(分類器將負(fù)例錯(cuò)誤分類為正例的樣本數(shù)),F(xiàn)N表示假負(fù)例(分類器將正例錯(cuò)誤分類為負(fù)例的樣本數(shù))。
準(zhǔn)確率代表分類器正確分類的正例占所有分類為正例的樣本數(shù)的比例:
Precision=(14)
召回率是指模型能夠正確識(shí)別正例樣本的能力,即模型對(duì)于所有真實(shí)正例中識(shí)別出的正例樣本的比例[15]。召回率高說(shuō)明模型能夠覆蓋較多的正例樣本,但無(wú)法保證對(duì)負(fù)例樣本的分類效果。召回率代表真實(shí)正例中被分類器正確分類的比例:
Recall=(15)
F1值綜合考慮了準(zhǔn)確率和召回率,是一個(gè)綜合評(píng)價(jià)指標(biāo)[16]。在SVM中,F(xiàn)1值由精度和召回率的調(diào)和平均數(shù)得到。F1值越高說(shuō)明模型的分類效果越好,在正例和負(fù)例兩個(gè)類別上的表現(xiàn)都較好。
F1值將準(zhǔn)確率和召回率進(jìn)行平均,是綜合評(píng)價(jià)分類器性能的指標(biāo):
F1-score=(16)
精確率代表分類器正確分類的比例:
Accuracy=(17)
4.2 試驗(yàn)測(cè)試的結(jié)果與分析
通過(guò)小波基特征提取訓(xùn)練樣本后,送入SVM中進(jìn)行分類訓(xùn)練,SVM的核心思想是尋找一個(gè)最優(yōu)的決策邊界或者超平面,將數(shù)據(jù)點(diǎn)分為兩個(gè)不同的類別,并具有優(yōu)秀的泛化性能,使用測(cè)試集來(lái)評(píng)估訓(xùn)練好的模型,計(jì)算出分類精度,試驗(yàn)中計(jì)算了測(cè)試集樣本精度的核心指標(biāo)參數(shù)準(zhǔn)確率、召回率和F1值等,測(cè)試樣本精度如表3所示。
歸納分析蘋果葉部病害中:花葉病、銹病、灰斑病、斑點(diǎn)落葉病和褐斑病樣本測(cè)試的核心指標(biāo)參數(shù):準(zhǔn)確率(precision)、召回率(recall)和F1值,檢測(cè)結(jié)果如表4所示。
表4? 蘋果葉部病害檢測(cè)結(jié)果
分析表4可知,銹病的準(zhǔn)確率、召回率和F1值均較高,說(shuō)明模型對(duì)蘋果銹病的檢測(cè)效果較好;蘋果褐斑病的準(zhǔn)確率、召回率和F1值也較高,但相比于銹病還是稍微有所退步;蘋果花葉病的準(zhǔn)確率、召回率和F1值較低,說(shuō)明模型對(duì)蘋果花葉病的識(shí)別效果較差,需要進(jìn)一步優(yōu)化算法或增加樣本量;蘋果灰斑病和蘋果斑點(diǎn)落葉病的準(zhǔn)確率、召回率和F1值都處于中等水平,但相對(duì)來(lái)說(shuō)還是比蘋果花葉病的檢測(cè)效果好。
試驗(yàn)結(jié)果顯示,該算法在蘋果葉部病害識(shí)別方面取得了較好的效果,分類報(bào)告則提供了更詳細(xì)的信息,包括每個(gè)類別的準(zhǔn)確率(precision)、召回率(recall)和F1值,準(zhǔn)確率反映了模型分類正確的比例;召回率反映了模型對(duì)真實(shí)樣本的分類能力;F1值綜合了準(zhǔn)確率和召回率兩個(gè)指標(biāo),可作為評(píng)價(jià)模型綜合性能的重要指標(biāo)。
5? 結(jié)語(yǔ)
本文設(shè)計(jì)了一種基于小波基特征提取的蘋果葉部病害識(shí)別算法,該算法基于采集到的蘋果葉部圖像,通過(guò)小波變換得到小波基特征,然后使用SVM分類器對(duì)不同病害進(jìn)行分類識(shí)別。使用小波變換對(duì)每個(gè)區(qū)域進(jìn)行特征提取,得到一組小波基特征向量。利用支持向量機(jī)(SVM)對(duì)特征向量進(jìn)行分類訓(xùn)練。本研究表明,該算法利用小波變換對(duì)圖像進(jìn)行特征提取,具有更好的非線性逼近能力和更高的分類準(zhǔn)確率。該算法在識(shí)別不同病害方面具有較高的準(zhǔn)確率和魯棒性,為智慧農(nóng)業(yè)的推廣提供了一種快速、準(zhǔn)確、可靠的綠色無(wú)損病害檢測(cè)方法,同時(shí)也為蘋果葉部病害分類等相關(guān)領(lǐng)域的研究提供了新的思路和方法。
參考文獻(xiàn):
[1]? 王遠(yuǎn)志,施子珍,張艷紅.改進(jìn)的Faster R-CNN用于蘋果葉部病害檢測(cè)[J].安慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2022,28(2):26-30.
[2]? 黨榮輝,寧紀(jì)鋒.基于MATLAB的陜西蘋果葉片病害識(shí)別研究[J].農(nóng)村科學(xué)實(shí)驗(yàn),2017(2):116-118.
[3]? 江鵬,陳躍翰.基于SSD蘋果葉片病害檢測(cè)方法[J].電子技術(shù)與軟件工程,2019(10):56.
[4]? 李鑫然,李書(shū)琴,劉斌.基于改進(jìn)Faster R_CNN的蘋果葉片病害檢測(cè)模型[J].計(jì)算機(jī)工程,2021,47(11):298-304.
[5]? 潘仁勇,張欣,陳孝玉龍,等.基于DTS-ResNet的蘋果葉片病害識(shí)別方法[J].國(guó)外電子測(cè)量技術(shù),2022,41(9):142-148.
[6]? 趙嘉威,田光兆,邱暢,等.基于改進(jìn)YOLOv4算法的蘋果葉片病害檢測(cè)方法[J].江蘇農(nóng)業(yè)科學(xué),2023,51(9):193-199.
[7]? PERVEEN K, KUMAR S, KANSAL S, et al. Multidimensional attention-based CNN model for identifying apple leaf disease[J].Journal of Food Quality,2023,2023:1-12.
[8]? YAN Q, YANG B H, WANG W Y, et al. Apple leaf diseases recognition based on an improved convolutional neural network[J].Sensors,2020,20(12):256-274.
[9]? 張穎,馬承澤,楊平,等.基于小波變換和改進(jìn)PCA的人臉特征提取算法[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2021,59(6):1499-1503.
[10] 王曉柱,鈕賽賽,張凱,等.基于小波變換與特征提取的紅外弱小目標(biāo)圖像融合[J].西北工業(yè)大學(xué)學(xué)報(bào),2020,38(4):723-732.
[11] 王云露.基于深度遷移學(xué)習(xí)的蘋果病害識(shí)別方法研究[D].泰安:山東農(nóng)業(yè)大學(xué),2022:9-11.
[12] 楊春艷,陳英,劉飛,等.蘋果葉部病害的傅里葉變換紅外光譜鑒別研究[J].河南農(nóng)業(yè)科學(xué),2017,46(6):156-160.
[13] 晁曉菲.基于深度學(xué)習(xí)的常見(jiàn)蘋果葉片病害識(shí)別與病斑分割方法研究[D].楊凌:西北農(nóng)林科技大學(xué),2021:13-15.
[14] 金海彬,呂志賢,侯木舟,等.基于特征融合與SVM的內(nèi)鏡圖像分類算法研究[J].中北大學(xué)學(xué)報(bào)(自然科學(xué)版),2023,44(1):86-96.
[15] 于雪瑩,高繼勇,王首程,等.基于生成對(duì)抗網(wǎng)絡(luò)和混合注意力機(jī)制殘差網(wǎng)絡(luò)的蘋果病害識(shí)別[J].中國(guó)農(nóng)機(jī)化學(xué)報(bào),2022,43(6):166-174.
[16] 姜紅花,楊祥海,丁睿柔,等.基于改進(jìn)ResNet18的蘋果葉部病害多分類算法研究[J].農(nóng)業(yè)機(jī)械學(xué)報(bào),2023,54(4):295-303.