張風(fēng)偉 朱成杰 朱洪波
張風(fēng)偉,朱成杰,朱洪波. 基于改進(jìn)MobileNet v3的蘋果葉片病害識別方法及移動端應(yīng)用[J]. 江蘇農(nóng)業(yè)科學(xué),2024,52(7):205-213.
doi:10.15889/j.issn.1002-1302.2024.07.028
(安徽理工大學(xué)電氣與信息工程學(xué)院,安徽淮南 232001)
摘要:準(zhǔn)確識別蘋果葉片病害種類以進(jìn)行及時防治對于蘋果增量增產(chǎn)具有重要的意義,為實(shí)現(xiàn)在移動設(shè)備實(shí)時對蘋果葉片進(jìn)行病害識別,提高蘋果的產(chǎn)量,減少種植者的損失。首先收集了黑星病、斑點(diǎn)落葉病、銹病、白粉病、混合病、褐斑病等6種蘋果葉部病害和健康葉片的圖像,并使用Retinex算法對圖像進(jìn)行數(shù)據(jù)增強(qiáng),以提高數(shù)據(jù)集質(zhì)量,然后將數(shù)據(jù)集按照8 ∶[KG-*3]1 ∶[KG-*3]1的比例劃分為訓(xùn)練集、驗(yàn)證集和測試集;其次對MobileNet v3網(wǎng)絡(luò)模型進(jìn)行改進(jìn)優(yōu)化調(diào)整,在精簡網(wǎng)絡(luò)結(jié)構(gòu)的同時減少冗余參數(shù),并在非線性激活層后加入批歸一化層,以提高網(wǎng)絡(luò)的特征提取能力;同時,為了提升在低精度移動設(shè)備上的準(zhǔn)確性和模型運(yùn)行效率,將全連接層中的激活函數(shù)替換為ReLU6函數(shù);最后,在模型訓(xùn)練時使用動量隨機(jī)梯度下降優(yōu)化器來進(jìn)行模型權(quán)重系數(shù)的尋優(yōu),以減少訓(xùn)練時間和達(dá)到更高的分類準(zhǔn)確率。試驗(yàn)結(jié)果表明,改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)對蘋果葉片病害圖像的識別準(zhǔn)確率為96.48%,模型權(quán)重為2.98 MB,識別速率為8.82 ms/幅圖片,與其他同量級卷積神經(jīng)網(wǎng)絡(luò)相比識別精度更高、模型更小、識別速度更快。本研究使用Android Studio將權(quán)重模型封裝到安卓軟件中,實(shí)現(xiàn)了移動設(shè)備對蘋果葉片病害的準(zhǔn)確快速識別。
關(guān)鍵詞:蘋果;葉部病害;圖像識別;MobileNet v3;Android
中圖分類號:TP391.41? 文獻(xiàn)標(biāo)志碼:A? 文章編號:1002-1302(2024)07-0205-09
蘋果具有極其豐富的營養(yǎng)成分,含有多種維生素、礦物質(zhì)以及微量元素。隨著我國蘋果行業(yè)的快速發(fā)展,蘋果病害已經(jīng)成為日益嚴(yán)重的問題[1]。常見的蘋果病害包括銹病、黑星病、斑點(diǎn)落葉病和白粉病等,而正確識別和有效防治這些病害對于提高蘋果產(chǎn)量和質(zhì)量至關(guān)重要,是影響我國蘋果產(chǎn)業(yè)發(fā)展的關(guān)鍵因素[2]。蘋果病害的發(fā)生范圍極其廣泛,從果實(shí)、葉片到根、莖都可能發(fā)生病害,其中葉片部位病害的發(fā)生頻率最高,而且特征明顯,容易被采集和獲取,因此成為診斷蘋果植株健康的主要依據(jù)。然而,傳統(tǒng)的病害識別方法仍然存在著靈活性、可靠性和時效性上的不足,無法滿足對病害的快速診斷需求[3-4]。通過計(jì)算機(jī)視覺技術(shù),可以從植物葉片的形態(tài)結(jié)構(gòu)、色彩紋理等信息中提取出有價值的特征,從而實(shí)現(xiàn)多維度、多參數(shù)數(shù)據(jù)的可視化,使人工智能成為一種有效的疾病診斷手段,可以更快更準(zhǔn)確地發(fā)現(xiàn)病癥。
隨著深度學(xué)習(xí)領(lǐng)域研究的不斷加深,卷積神經(jīng)網(wǎng)絡(luò)(CNN)被廣泛運(yùn)用在計(jì)算機(jī)視覺處理上[5],成為植物葉片病害識別的不二選擇。劉陽等使用PlantVillage公開的數(shù)據(jù)集加以試驗(yàn),并使用改進(jìn)的SqueezeNet模型運(yùn)用遷移學(xué)習(xí)和梯度下降法加以訓(xùn)練,成功實(shí)現(xiàn)了對多類葉片病害的識別[6]。黃英來等將ResNet-50模型中的ReLU激活函數(shù)替換為LeakyReLU函數(shù),提出了一種改進(jìn)的深度殘差網(wǎng)絡(luò)模型對玉米葉片病害進(jìn)行識別[7]。李鑫然等通過特征金字塔網(wǎng)絡(luò)整合了具有細(xì)節(jié)信息的淺層特征和具有語義信息的深層次特征,提出了改進(jìn)的Faster_RCNN模型,提煉出蘋果葉片病害的有效特征[8]。劉洋等基于MobileNet與Inception v3提出2種輕量級卷積神經(jīng)網(wǎng)絡(luò)作物病害分類模型[9]。楊森等以Xception網(wǎng)絡(luò)模型為基礎(chǔ)的馬鈴薯外部缺陷改進(jìn)無損分級方法[10]。以上研究都證明了卷積神經(jīng)網(wǎng)絡(luò)運(yùn)用在植物葉片檢測方面的可行性,其中不乏使用輕量化模型取得較好分類結(jié)果的案例,并呈現(xiàn)出了模型結(jié)構(gòu)小型化的趨勢。通常情況下,擁有更多層數(shù)的CNN性能會更加優(yōu)秀,但也帶來了更大的內(nèi)存需求和計(jì)算負(fù)荷量,如何解決這一問題,成為CNN在智能手機(jī)等嵌入式設(shè)備上大規(guī)模應(yīng)用的關(guān)鍵點(diǎn)。
本研究以MobileNet v3網(wǎng)絡(luò)為基礎(chǔ)網(wǎng)絡(luò),通過減少卷積層、通道數(shù)量、調(diào)整卷積核大小等方法精簡網(wǎng)絡(luò)結(jié)構(gòu),結(jié)合批歸一化和替換激活函數(shù)等方法,實(shí)現(xiàn)基于手機(jī)圖像的蘋果病害葉片分類,提高網(wǎng)絡(luò)對病害葉片的識別能力和在移動端運(yùn)行的性能。經(jīng)過對MobileNet v3的系統(tǒng)性改進(jìn),模型的體積進(jìn)一步縮小,計(jì)算速率也更快,因此,本研究將改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)模型進(jìn)行格式轉(zhuǎn)換,利用Android Studio軟件將其移植到移動端,開發(fā)出了一款蘋果葉片病害識別手機(jī)應(yīng)用程序。
1 材料與方法
1.1 試驗(yàn)圖像數(shù)據(jù)及預(yù)處理
本研究以飛槳AI Studio網(wǎng)站上開源的Plant-Pathology數(shù)據(jù)集為基礎(chǔ),通過對數(shù)據(jù)集中的圖片進(jìn)行逐一校對篩選,選出4 826張黑星病、4 624張健康葉片、3 181張斑點(diǎn)落葉病、1 860張銹病、1 184張白粉病、混合病1 602張、褐斑病686張等7個類別的蘋果葉片圖片,共17 963張。圖像格式為.jpg,并將圖片分辨率統(tǒng)一為1 000像素×668像素,以減少模型訓(xùn)練時間。Plant-Pathology數(shù)據(jù)集中各類葉片數(shù)量為686~4 826張,直接采用這樣的數(shù)據(jù)會造成樣本分級不均的嚴(yán)重問題,會對訓(xùn)練模型的準(zhǔn)確率造成不良影響。通過采用多種數(shù)據(jù)增廣方法,對樣本量較少的類別原始數(shù)據(jù)進(jìn)行處理,可以顯著提升訓(xùn)練模型的泛化能力,進(jìn)而大大提高其魯棒性[11]。
Retinex圖像增強(qiáng)算法可以抑制圖像中不均勻的光照,并能進(jìn)行亮度增強(qiáng)、細(xì)節(jié)保護(hù)和圖像去噪。本研究采用Retinex圖像增強(qiáng)算法對原始圖像數(shù)據(jù)集中、樣本量少的類別進(jìn)行圖像增強(qiáng)處理,使用多尺度視網(wǎng)膜算法 (MSR)增強(qiáng)銹病、白粉病和混合病圖片,使用單尺度視網(wǎng)膜算法(SSR)、多尺度視網(wǎng)膜算法和色彩恢復(fù)的多尺度視網(wǎng)膜增強(qiáng)算法(MSRCP)等增強(qiáng)褐斑病圖片,部分增強(qiáng)后的樣本示例如圖1 所示。黑星病、健康葉片和斑點(diǎn)落葉病圖片數(shù)據(jù)樣本充足,且識別結(jié)果較好,因此未進(jìn)行數(shù)據(jù)增強(qiáng)。試驗(yàn)葉片樣本的數(shù)量在數(shù)據(jù)增強(qiáng)后增加到23 696張,按照8 ∶1 ∶1的比例劃分訓(xùn)練集、驗(yàn)證集和測試集,擴(kuò)充后的葉片病蟲害種類和數(shù)目如表1所示。
1.2 MobileNet v3 網(wǎng)絡(luò)模型
伴隨AlexNet、VGGNet、GoogleNet和ResNet等卷積神經(jīng)網(wǎng)絡(luò)的開發(fā),網(wǎng)絡(luò)性能和穩(wěn)定性獲得了顯著提升,但網(wǎng)絡(luò)層數(shù)也在不斷增加,帶來了運(yùn)行效率上的問題[12-16]。輕量化模型采用更高效的計(jì)算方式,擁有的參數(shù)較少,解決了內(nèi)存占用和計(jì)算速度的問題,使CNN真正走出了實(shí)驗(yàn)室。MobileNet v3是谷歌提出的一種輕量化卷積神經(jīng)網(wǎng)絡(luò)[17],其基本網(wǎng)絡(luò)單元如圖2所示。它延用了MobileNet v2模型中的倒置殘差構(gòu)造,即先升維,采用深度可分解卷積,然后再降維,這樣可以降低網(wǎng)絡(luò)參數(shù),提高運(yùn)行速度[18]。模型中還引入SE架構(gòu)輕量級的注意力機(jī)制,在訓(xùn)練過程中能有效地提升有用特征的權(quán)重,同時抑制無用特征的權(quán)重[19]。
本研究旨在改進(jìn)MobileNet v3模型,以提高其識別精度和減小模型尺寸,使其能夠更好地應(yīng)用于移動終端,以實(shí)現(xiàn)將蘋果葉片病害識別模型應(yīng)用于移動終端的任務(wù)。為此,本研究對表2中MobileNet v3-[JP]large網(wǎng)絡(luò)模型的結(jié)構(gòu)進(jìn)行了調(diào)整優(yōu)化,以實(shí)現(xiàn)在大樣本數(shù)據(jù)集上快速訓(xùn)練和模型部署。
深度可分離卷積是MobileNet v3模型的核心單元,它可以將普通卷積分解為深度卷積和逐點(diǎn)卷積。根據(jù)圖3可對卷積的工作過程及計(jì)算量進(jìn)行深度可分離分析。在圖3-a中,深度卷積先對輸入的特征圖進(jìn)行分解,得到M個通道的特征圖,而后,每個特征通道會分別被1×1的卷積核進(jìn)行卷積,經(jīng)卷積后的M個特征會被合并,輸出計(jì)算深度卷積為Dk×Dk×M×DF×DF的結(jié)果;逐點(diǎn)卷積運(yùn)算與常規(guī)卷積運(yùn)算比較相似,即對深度卷積輸出的特征圖使用1×1×M的卷積核在深度方向上進(jìn)行加權(quán)組合,所以從圖3-b可以看出,逐點(diǎn)卷積的計(jì)算量是M×DF×DF×N。與傳統(tǒng)的卷積計(jì)算量相比深度可分離卷積的計(jì)算量為
Dk·Dk·M·DF·DF+M·N·DF·DFDF·DF·M·Dk·Dk·N=1N+1D2k。(1)
通過對普通卷積和深度可分離卷積的計(jì)算量對比,可以看出,輕量化卷積網(wǎng)絡(luò)MobileNet v3在使用了這種卷積以后,網(wǎng)絡(luò)層的計(jì)算量大大下降了。
1.3 模型改進(jìn)設(shè)計(jì)
由于本研究需要識別的葉片類型為7類,因此,首先將最后一個卷積層的輸出通道數(shù)由1 000修改為7。一般來說,較深的網(wǎng)絡(luò)系統(tǒng)具備更強(qiáng)的非線性表達(dá)能力,可以更準(zhǔn)確地捕捉復(fù)雜的特征,但是如果網(wǎng)絡(luò)深度過深,就會導(dǎo)致梯度不穩(wěn)、網(wǎng)絡(luò)退化等問題。為選擇合適的模型深度,首先將超參數(shù)reduce_divider從1調(diào)整為4,超參數(shù)reduce_divider會影響bneck13的輸出通道數(shù)和bneck14、15的輸入、輸出通道以及bneck內(nèi)倒殘差結(jié)構(gòu)升維后的通道數(shù),其表現(xiàn)公式為
finalchannels=channels/reduce_divider。(2)
式中:finalchannels為最終通道數(shù),channels為原始通道數(shù)。經(jīng)調(diào)整后bneck13的輸出通道由160縮減為40,bneck14、15的輸入通道和輸出通道由160縮減為40,倒殘差結(jié)構(gòu)升維后的通道數(shù)由960縮減為240。其次,移除bneck3、6、8~10層模塊,以壓縮網(wǎng)絡(luò)深度,避免可能出現(xiàn)的梯度問題,并將改動后的模型命名為MobilenNet v3-A1。改進(jìn)后的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
通過合理配置圖像輸入分辨率、網(wǎng)絡(luò)深度和寬度3個參數(shù),網(wǎng)絡(luò)性能可以得到有效的改善。網(wǎng)絡(luò)的[CM(21]寬度大,深度淺,要想學(xué)到更深層次的特征是非常困難的。因此,為在捕捉更多的特征同時,減少寬度特征提取過程中的性能浪費(fèi),將超參數(shù)寬度系數(shù)α從默認(rèn)值1調(diào)整至0.8。對MobileNet v3網(wǎng)絡(luò)從深度、寬度和通道數(shù)等方面進(jìn)行精簡優(yōu)化,使得網(wǎng)絡(luò)運(yùn)行時計(jì)算的數(shù)據(jù)量變少,降低了訓(xùn)練負(fù)擔(dān),提升了運(yùn)行效率,使得網(wǎng)絡(luò)部署在移動端更加方便。
MobileNet v3網(wǎng)絡(luò)模型利用SE通道注意力模塊作為網(wǎng)絡(luò)的全連接層,可以將學(xué)習(xí)到的通道注意力信息與輸入特征圖相結(jié)合,最終得到具有通道注意力的特征圖[19]。該注意力機(jī)制模塊中的第一個全連接層使用ReLU作為激活函數(shù),ReLU激活函數(shù)將輸入的負(fù)值置為0,而其余的值不變,其公式為
ReLU[x]=max(0,x)。(3)
ReLU激活函數(shù)在特征擬合上的表現(xiàn)很不錯,但是這個激活函數(shù)輸出范圍為0~+∞,當(dāng)激活值很大時,在低精度移動設(shè)備上運(yùn)行會帶來精確度的損耗。
為解決移動端精度損失問題,本研究選擇ReLU6激活函數(shù)替換原網(wǎng)絡(luò)SE通道模塊中的ReLU函數(shù),ReLU6激活函數(shù)在ReLU激活函數(shù)的基礎(chǔ)上將輸出最大值限制為6,公式為
ReLU6[x]= min[6,max(0,x)]。(4)
該激活函數(shù)將激活范圍限制在0~6之間,可以很好地解決低精度移動嵌入式設(shè)備計(jì)算能力不足帶來的精度下降和運(yùn)行耗時長的問題。經(jīng)試驗(yàn)發(fā)現(xiàn),將激活函數(shù)替換為ReLU6后,帶來的訓(xùn)練準(zhǔn)確率下降微乎其微,可忽略不計(jì),并將改動后的模型命名為MobilenNet v3-A2。
批歸一化可以保證每層網(wǎng)絡(luò)的輸入和輸出數(shù)據(jù)分布不會產(chǎn)生較大的變化,從而避免了內(nèi)部協(xié)變量發(fā)生偏移的現(xiàn)象,避免了樣本數(shù)據(jù)分布不均帶來的模型預(yù)測更傾向大量樣本類別的問題[20]。此外,批歸一化還能夠使深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練更加順暢,對初始值的敏感性降低,從而提高了訓(xùn)練效率,并且能夠通過較大的學(xué)習(xí)率來加速收斂。在先前改進(jìn)的基礎(chǔ)上,本研究對神經(jīng)網(wǎng)絡(luò)中非線性激活函數(shù)的輸出信息再一次批歸一化處理,以平衡中間層的數(shù)據(jù)分布,減少輸出層信息對下一級的負(fù)面影響,從而提高網(wǎng)絡(luò)系統(tǒng)的性能和準(zhǔn)確性。通過對樣本的重新選擇,可以有效適應(yīng)不同的數(shù)據(jù)集,解決數(shù)據(jù)分布不均帶來的小數(shù)量樣本識別率低的問題,同時也大大提升了原有網(wǎng)絡(luò)結(jié)構(gòu)的泛化能力,將改動后的模型命名為MobilenNet v3-A3。結(jié)合批歸一化改進(jìn)后的BN結(jié)構(gòu)如圖5所示。
2 結(jié)果與分析
2.1 試驗(yàn)平臺和試驗(yàn)參數(shù)設(shè)置
在Windows11 64位系統(tǒng)上,使用PyTorch作為深度學(xué)習(xí)框架,硬件環(huán)境為計(jì)算機(jī)內(nèi)存16 GB,搭載Intel?CoreTM i5-1135G7 @ 2.40GHz數(shù)據(jù)處理器,GPU為NVIDIA GeForce MX450。軟件環(huán)境:PyTorch 1.10.1,cuDNN V8.2,Python 3.8,CUDA Tookit 11.2。
2.2 模型參數(shù)對改進(jìn)MobileNet v3網(wǎng)絡(luò)模型的影響分析驗(yàn)平臺和試驗(yàn)參數(shù)設(shè)置
過大或過小的學(xué)習(xí)率都會對訓(xùn)練準(zhǔn)確率曲線的收斂造成影響,過小的學(xué)習(xí)率會導(dǎo)致收斂速度降低,增加訓(xùn)練時間,而過大的學(xué)習(xí)率可能會導(dǎo)致曲線無法收斂,使模型的訓(xùn)練無法找到最優(yōu)解。因此,本研究首先對隨機(jī)梯度下降優(yōu)化器(SGD)、自適應(yīng)矩估計(jì)優(yōu)化器(Adam)、指數(shù)加權(quán)平均梯度下降優(yōu)化器(RMSprop)和動量隨機(jī)梯度下降優(yōu)化器(Momentum SGD) 4種常用的優(yōu)化器進(jìn)行試驗(yàn)對比,以選擇合適的優(yōu)化器,提高模型的訓(xùn)練效率。將4種優(yōu)化器的學(xué)習(xí)率設(shè)置為0.01和0.001,來研究MobileNet v3網(wǎng)絡(luò)在2個學(xué)習(xí)率下2種優(yōu)化器的訓(xùn)練表現(xiàn),訓(xùn)練準(zhǔn)確率變化趨勢如圖6所示。由圖6可知,經(jīng)過100輪迭代訓(xùn)練后,2種優(yōu)化器的訓(xùn)練準(zhǔn)確率曲線都趨于收斂。其中,學(xué)習(xí)率為0.01時的Momentum SGD優(yōu)化器曲線表現(xiàn)最好,訓(xùn)練準(zhǔn)確率始終高于其他7條曲線。由表3可知,采用0.01學(xué)習(xí)率時的Momentum SGD優(yōu)化器比0.01學(xué)習(xí)率的SGD優(yōu)化器準(zhǔn)確率高出3.29百分點(diǎn),比0.001學(xué)習(xí)率的Adam優(yōu)化器準(zhǔn)確率高出0.85百分點(diǎn),比0.001學(xué)習(xí)率的RMSprop優(yōu)化器準(zhǔn)確率高出2.94百分點(diǎn)。因此,本研究選用0.01學(xué)習(xí)率、動量設(shè)置為0.9的Momentum SGD優(yōu)化器作為后續(xù)試驗(yàn)的優(yōu)化器,訓(xùn)練輪數(shù)統(tǒng)一設(shè)置為200輪,批次樣本設(shè)置為16。
2.3 數(shù)據(jù)增強(qiáng)對模型分類能力的影響
本研究對銹病、白粉病、混合病和褐斑病4類樣本圖片進(jìn)行了數(shù)據(jù)增強(qiáng),其他類別樣本數(shù)量充足未進(jìn)行增強(qiáng),這4類病害樣本增強(qiáng)前后的識別精確率如表4所示。以MobileNet v3網(wǎng)絡(luò)數(shù)據(jù)增強(qiáng)前后精確率為例,在使用Retinex圖像增強(qiáng)算法的MSR方法后,銹病識別精確率由93.6%增長到95.7%,白粉病識別精確率由95.1%增長到96.8%,混合病識別精確率由81.7%增長到83.8%,在使用Retinex圖像增強(qiáng)算法的SSR、MSR和MSRCP這3種方法后,褐斑病識別精確率由89.6%增長到93.2%,是識別準(zhǔn)確率提高幅度最大的類別。以上結(jié)果表明,通過使用Retinex圖像增強(qiáng)算法處理原始數(shù)據(jù),在提高了數(shù)據(jù)多樣性的同時,網(wǎng)絡(luò)模型的識別精確率也得到了一定提升。
2.4 改進(jìn)MobileNet v3網(wǎng)絡(luò)模型逐步改進(jìn)性能對比
利用7種蘋果葉片病害圖像數(shù)據(jù)集,經(jīng)過數(shù)據(jù)增強(qiáng),在200輪迭代后,模型逐步改進(jìn)的性能參數(shù)如表5所示,MobileNet v3-A1模型與MobileNet v3模型相比,準(zhǔn)確率有1.09百分點(diǎn)的提升,權(quán)重下降了11.29 MB,說明在精簡網(wǎng)絡(luò)結(jié)構(gòu)的同時對網(wǎng)絡(luò)深度進(jìn)行降低,不僅可以減小模型計(jì)算量,還能在一定程度上提高準(zhǔn)確率。
MobileNet v3-A2模型與MobileNet v3-A1模型相比,準(zhǔn)確率下降0.37百分點(diǎn),權(quán)重下降了2.33 MB,說明收窄模型的寬度并替換SE通道注意力機(jī)制中的ReLU6激活函數(shù),在降低計(jì)算量的同時也會帶來一定的準(zhǔn)確率下降。MobileNet v3-A3模型較MobileNet v3-A2模型準(zhǔn)確率提升了1.43百分點(diǎn),權(quán)重增大0.4 MB,說明結(jié)合批歸一化對BN進(jìn)行改進(jìn),在提高準(zhǔn)確率的同時也帶來了計(jì)算量的增加。
本研究改進(jìn)的MobileNet v3-A3模型訓(xùn)練準(zhǔn)確率高達(dá)96.48%。模型改進(jìn)前后的準(zhǔn)確率和損失函數(shù)變化分別如圖7-a和圖7-b所示。
從圖7可以看出,改進(jìn)后的模型訓(xùn)練準(zhǔn)確率曲線在大約120次迭代后已經(jīng)基本收斂,而且損失函數(shù)的波動變化較原來的網(wǎng)絡(luò)要小一些,收斂的速度也要快一些。從準(zhǔn)確率曲線來看,改進(jìn)后的模型,準(zhǔn)確率的提升速度更快,曲線波動也更小,訓(xùn)練準(zhǔn)確率始終高于原網(wǎng)絡(luò),改進(jìn)效果較為明顯。
在對MobileNet v3、MobileNet v3-A3、ShuffleNet v2、EfficientNet-B0、RegNet、MobileViT、ConvNeXt、ResNet-50和DenseNet-121等網(wǎng)絡(luò)模型進(jìn)行200次迭代訓(xùn)練后,得到了表6所示的試驗(yàn)結(jié)果。
改進(jìn)后的MobileNet v3模型,參數(shù)量是0.76 M,約為原模型的1/5,模型大小僅有2.98 MB,[JP3]約是原模型的1/5,運(yùn)算速度減少到0.092×109次/s,準(zhǔn)確率達(dá)到了96.48%,較原模型高出2.15百分點(diǎn)。從表6可以看出,與其他圖像分類網(wǎng)絡(luò)相比,改進(jìn)后的MobileNet v3-A3模型在參數(shù)量、訓(xùn)練時間和模型大小方面有著很大的優(yōu)勢,準(zhǔn)確率及其他各項(xiàng)指標(biāo)都有一定的提高。其他網(wǎng)絡(luò)模型中,準(zhǔn)確率最高的是EfficientNet-BO網(wǎng)絡(luò),準(zhǔn)確率為94.75%,但與改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)相比,準(zhǔn)確率低1.73百分點(diǎn),訓(xùn)練模型多12.62 MB,參數(shù)量多4.52×10 M,訓(xùn)練時間更是多出680 min。
2.5 改進(jìn)MobileNet v3模型病害種類識別情況分析[HT]
在圖像分類問題中,判斷模型性能優(yōu)劣,僅靠識別準(zhǔn)確率是不夠的,當(dāng)數(shù)據(jù)集的數(shù)據(jù)分布不均衡時,會出現(xiàn)總體準(zhǔn)確率很高,但對少數(shù)樣本的類別識別錯誤的情況。因此,本研究分析了各網(wǎng)絡(luò)模型對蘋果葉片不同病害的分類精確率、召回率和F1得分,具體情況如表7所示。從表7可以看出,改進(jìn)后的MobileNet-A3網(wǎng)絡(luò)對健康葉片的識別效果最好,F(xiàn)1得分接近99%,其次是銹病、斑點(diǎn)落葉病、黑星病,F(xiàn)1得分均在96%以上,對混合病和褐斑病的識別效果較差,F(xiàn)1得分在94%以下。
改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)模型混淆矩陣如圖8-a所示,可以看出,使用改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)模型對2 370張葉片病害圖片測試集進(jìn)行測試,僅有84張病害圖像分類錯誤,錯分類別數(shù)量最大的是混合病,共錯分23張,其次是黑星病錯分19張,其他類別的病害圖片分類錯誤較少,總體分類效果優(yōu)異。本研究通過進(jìn)一步分析不同葉片病害數(shù)據(jù)集的錯分情況可知,葉片病害部位的顏色和形狀特征是其分類過程中的重要依據(jù),當(dāng)樣本葉片中含有多種病害時,某一病害特征表現(xiàn)不明顯時易發(fā)生分類錯誤。
2.6 Android手機(jī)端識別軟件開發(fā)
本研究Windows操作系統(tǒng)下的Android軟件開發(fā)環(huán)境包含JDK、Android Studio和AndroidSDK共3個部分。JDK包含JAVA運(yùn)行環(huán)境(JVM+JAVA系統(tǒng)庫)和JAVA工具,是整個JAVA開發(fā)的核心;Android Studio是安卓應(yīng)用程序開發(fā)IDE,可以幫助開發(fā)者進(jìn)行安卓程序的編寫;AndroidSDK是Google公司向開發(fā)者免費(fèi)提供Android軟件開發(fā)工具包,可以幫助開發(fā)者進(jìn)行安卓程序的封裝[21-24]。
為了更準(zhǔn)確快速地檢測蘋果葉片的不同病害,本次研發(fā)使用PyTorch Mobile框架,將經(jīng)過訓(xùn)練的改進(jìn)MobileNet v3-A3訓(xùn)練模式配備到安卓設(shè)備上。首先,在電腦端將訓(xùn)練模式轉(zhuǎn)換成TorchScript形式的.pt格式文件。然后,在Android Studio軟件環(huán)境中開發(fā)蘋果葉片病害分類手機(jī)應(yīng)用APP,APP主要包括前端界面和后端處理程序。在.xml文件上進(jìn)行前端顯示界面的布局設(shè)計(jì), 設(shè)置了3個標(biāo)簽按鈕,分別是本地圖庫、拍照識別、實(shí)時檢測。點(diǎn)擊拍照識別按鈕,軟件會調(diào)用手機(jī)攝像頭,可以對蘋果葉片進(jìn)行拍攝,點(diǎn)擊本地圖庫按鈕可在本地內(nèi)存選擇照片。通過拍照獲取的圖片和本地圖庫的圖片信息將被傳輸?shù)紸PP的主界面顯示,后端用Java語言編寫的處理程序?qū)D像進(jìn)行處理后,對這些圖片進(jìn)行壓縮,并使用.pt格式的TorchScript模型進(jìn)行識別,最終將識別結(jié)果呈現(xiàn)在主界面上,以便用戶更加直觀地查看病害信息。點(diǎn)擊實(shí)時檢測按鈕,會出現(xiàn)新的相機(jī)界面,在這個界面中,程序后端會實(shí)時調(diào)用攝像頭獲取圖片,并將顯示在屏幕中的圖片信息實(shí)時調(diào)用TorchScript模型進(jìn)行判斷識別, 識別的結(jié)果可以實(shí)時顯示在界面上方。圖9-a顯示的是使用本地圖庫圖片識別功能后,對1張?zhí)O果銹病的準(zhǔn)確識別圖,圖9-b則是對蘋果葉片實(shí)時檢測的準(zhǔn)確識別圖。
在將網(wǎng)絡(luò)的訓(xùn)練模型遷移部署到移動端制成蘋果葉片病害識別APP后,對網(wǎng)絡(luò)的軟件內(nèi)存占用和識別速度進(jìn)行了測試,改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)APP,僅有9.7 MB大小,識別1張圖片的時間僅需8.82 ms。
3 結(jié)論
本研究使用了包含蘋果健康、銹病、黑星病、斑點(diǎn)落葉病、褐斑病、白粉病和混合病葉片共7種蘋果葉片公開圖像數(shù)據(jù)集,并使用Retinex算法進(jìn)行圖像增強(qiáng),為使模型更好地運(yùn)行在移動端對MobileNet v3進(jìn)行了針對性的改進(jìn),通過加入批歸一化層,來提高網(wǎng)絡(luò)的特征提取能力,同時,將全連接層中的激活函數(shù)替換為ReLU6函數(shù),提升在低精度移動設(shè)備上的準(zhǔn)確性和效率。在經(jīng)過對模型的改進(jìn)后,模型對各類蘋果葉片的分類準(zhǔn)確率達(dá)到了96.48%,分類效果較好。使用改進(jìn)后的MobileNet v3-A3網(wǎng)絡(luò)進(jìn)行模型訓(xùn)練,將識別準(zhǔn)確率最高的模型轉(zhuǎn)換成TorchScript格式模型后,將模型封裝制成APP后移植部署到移動端設(shè)備, 實(shí)現(xiàn)了使用移動端軟件對蘋果葉片病害的快速準(zhǔn)確識別。
參考文獻(xiàn):
[1]胡清玉,胡同樂,王亞南,等. 中國蘋果病害發(fā)生與分布現(xiàn)狀調(diào)查[J]. 植物保護(hù),2016,42(1):175-179.
[2]Sun H N,Xu H W,Liu B,et al. MEAN-SSD:a novel real-time detector for apple leaf diseases using improved light-weight convolutional neural networks[J]. Computers and Electronics in Agriculture,2021,189:106379.
[3]王云露,吳杰芳,蘭 鵬,等. 基于改進(jìn)Faster R-CNN的蘋果葉部病害識別方法[J]. 林業(yè)工程學(xué)報(bào),2022,7(1):153-159.
[4]Singh V,Misra A K. Detection of plant leaf diseases using image segmentation and soft computing techniques[J]. Information Processing in Agriculture,2017,4(1):41-49.
[5]Zeiler M D,F(xiàn)ergus R. Visualizing and understanding convolutional networks[C]//European Conference on Computer Vision.Cham:Springer International Publishing,2014:818-833.
[6]劉 陽,高國琴. 采用改進(jìn)的SqueezeNet模型識別多類葉片病害[J]. 農(nóng)業(yè)工程學(xué)報(bào),2021,37(2):187-195.
[7]黃英來,艾 昕. 改進(jìn)殘差網(wǎng)絡(luò)在玉米葉片病害圖像的分類研究[J]. 計(jì)算機(jī)工程與應(yīng)用,2021,57(23):178-184.
[8]李鑫然,李書琴,劉 斌. 基于改進(jìn)Faster R_CNN的蘋果葉片病害檢測模型[J]. 計(jì)算機(jī)工程,2021,47(11):298-304.
[9]劉 洋,馮 全,王書志. 基于輕量級CNN的植物病害識別方法及移動端應(yīng)用[J]. 農(nóng)業(yè)工程學(xué)報(bào),2019,35(17):194-204.
[10]楊 森,馮 全,張建華,等. 基于輕量卷積網(wǎng)絡(luò)的馬鈴薯外部缺陷無損分級[J]. 食品科學(xué),2021,42(10):284-289.
[11]鮑文霞,吳 剛,胡根生,等. 基于改進(jìn)卷積神經(jīng)網(wǎng)絡(luò)的蘋果葉部病害識別[J]. 安徽大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,45(1):53-59.
[12]Krizhevsky A,Sutskever I,Hinton G E. ImageNet classification with deep convolutional neural networks[J]. Communications of the ACM,2017,60(6):84-90.
[13]Simonyan K,Zisserman A. Very deep convolutional networks for large-scale image recognition[J]. ArXiv e-Prints,2014:arXiv:1409.1556.
[14]Szegedy C,Liu W,Jia Y Q,et al. Going deeper with convolutions[C] //2015 IEEE Conference on Computer Vision and Pattern Recognition.June 7-12,2015,Boston,MA.IEEE,2015:1-9.
[15]Howard A,Sandler M,Chen B,et al. Searching for MobileNet v3[C]//2019 IEEE/CVF International Conference on Computer Vision (ICCV).Seoul,Korea (South).IEEE,2019:1314-1324.
[16]熊夢園,詹 煒,桂連友,等. 基于ResNet模型的玉米葉片病害檢測與識別[J]. 江蘇農(nóng)業(yè)科學(xué),2023,51(8):164-170.
[17]Sandler M,Howard A,Zhu M L,et al. MobileNet v2:inverted residuals and linear bottlenecks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City,UT,USA.IEEE,2018:4510-4520.
[18]劉夢倫,趙希梅,魏 賓. 基于MobileNet v2-ELM的肝硬化識別[J]. 青島大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,32(4):17-21.
[19]Hu J,Shen L,Sun G. Squeeze-and-excitation networks[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition.Salt Lake City,UT,USA.IEEE,2018:7132-7141. [HJ1.6mm]
[20]Ioffe S,Szegedy C. Batch normalization:accelerating deep network training by reducing internal covariate shift[C]//Proceedings of the 32nd International Conference on Machine Learning. New York:ICML Press,2015:448-456.
[21]Prasad S,Peddoju S K,Ghosh D. Multi-resolution mobile vision system for plant leaf disease diagnosis[J]. Signal,Image and Video Processing,2016,10(2):379-388.
[22]Li D F,Wang Z G,Xue Y B. Fine-grained Android Malware Detection based on Deep Learning[C]//2018 IEEE Conference on Communications and Network Security (CNS).Beijing,China.IEEE,2018:1-2.
[23]戴建國,賴軍臣. 基于圖像規(guī)則與Android手機(jī)的棉花病蟲害診斷系統(tǒng)[J]. 農(nóng)業(yè)機(jī)械學(xué)報(bào),2015,46(1):35-44.
[24]馬艷娜,唐 華,柯紅軍. 基于移動終端的遙感監(jiān)測數(shù)據(jù)采集系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 測繪與空間地理信息,2017,40(4):120-122.? [ZK)][HT][HJ][FL)]
基金項(xiàng)目:國家自然科學(xué)基金(編號:62003001)。
作者簡介:張風(fēng)偉(1998—),男,山東濰坊人,碩士研究生,主要從事圖像處理研究。E-mail:1014678682@qq.com。
通信作者:朱成杰,博士,副教授,碩士生導(dǎo)師,主要從事嵌入式系統(tǒng)的研究與應(yīng)用、圖像處理與分類算法的研究。E-mail:ahhbzcj@126.com。