国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于微調(diào)卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)模式下被害棉葉圖像的識別

2019-10-31 09:29雷聲淵馬本學(xué)王文霞羅秀芝李玉潔戴建國
新疆農(nóng)業(yè)科學(xué) 2019年7期
關(guān)鍵詞:準(zhǔn)確率卷積神經(jīng)網(wǎng)絡(luò)

雷聲淵 ,馬本學(xué),2, 王文霞 ,羅秀芝 ,李玉潔 ,戴建國

( 1.石河子大學(xué)機(jī)械電氣工程學(xué)院, 新疆石河子 832003;2.農(nóng)業(yè)部西北農(nóng)業(yè)裝備重點實驗室,新疆石河子 832003;3.石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,新疆石河子 832003)

0 引 言

【研究意義】棉花在整個生長期中會不斷的受到病蟲害的影響[1],可使棉花產(chǎn)量和質(zhì)量下降,嚴(yán)重制約棉花產(chǎn)業(yè)的發(fā)展[2]。病蟲害防治對于提高棉花產(chǎn)量和質(zhì)量尤為重要,為了提升棉花病蟲害識別的準(zhǔn)確率,減少勞動力成本,許多研究人員利用機(jī)器學(xué)習(xí)和模式識別實現(xiàn)棉花病蟲害自動化檢測識別。【前人研究進(jìn)展】王獻(xiàn)鋒等[3]提出了一種基于自適應(yīng)判別深度置信網(wǎng)絡(luò)的棉花病蟲害預(yù)測模型,解決了深度置信網(wǎng)絡(luò)(DBN)在作物病蟲害預(yù)測中易收斂于局部最優(yōu)解的問題。張建華等[4]利用圖像處理技術(shù)結(jié)合徑向基支持向量機(jī)識別棉蚜、棉盲蝽、煙粉虱、棉葉螨、斜紋夜蛾等蟲害及正常葉片,識別正確率為88.1%。Alexandre等[5]利用小波變換提取棉葉圖像病害特征,并應(yīng)用支持向量機(jī)進(jìn)行分類,分類正確率為89.5%。翟智芬等[6]提出一種圖像處理結(jié)合樸素貝葉斯分類器的方法對棉花盲蝽象蟲害等級識別,平均正確率為90%。伴隨著深度學(xué)習(xí)[7]的研究熱潮,越來越多的學(xué)者將深度卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于農(nóng)作物病蟲害識別領(lǐng)域:植物病害識別[8]、茶園害蟲定位識別[9]、水稻病害識別[10]、蘋果葉片病害識別[11]、果體病理圖像識別[12],并取得了較好的結(jié)果。【本研究切入點】雖然使用上述方法在一定程度上提高了棉花病蟲害識別的準(zhǔn)確率,但是研究中均有繁瑣的圖像預(yù)處理過程,且在特征選擇時存在人為主觀判斷性。為提高棉花病蟲害的識別準(zhǔn)確率,避免識別過程中人工干涉特征提取,研究基于Caffe深度學(xué)習(xí)框架,微調(diào)CaffeNet網(wǎng)絡(luò)結(jié)構(gòu)并結(jié)合遷移學(xué)習(xí)對網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練?!緮M解決的關(guān)鍵問題】研究采用微調(diào)卷積神經(jīng)網(wǎng)絡(luò)結(jié)合遷移學(xué)習(xí)的方式對病蟲害棉葉進(jìn)行分類識別研究,對網(wǎng)絡(luò)模型主要參數(shù)(學(xué)習(xí)率)進(jìn)行選擇確定。為建立基于微調(diào)卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)模式下被害棉葉精準(zhǔn)圖像識別技術(shù)奠定基礎(chǔ)。

1 材料與方法

1.1 材 料

圖像采集過程中,在保證獲取圖像不失真的條件下,使用智能手機(jī)采集圖像數(shù)據(jù)具有方便快捷的優(yōu)勢。研究使用榮耀STF-AL00手機(jī)作為圖像數(shù)據(jù)采集設(shè)備,于2017和2018年的6月中旬至8月上旬棉花病蟲害高發(fā)季節(jié),于新疆石河子大學(xué)棉花試驗田中采集,在自然光條件下分別拍取特定背景下的健康及7種棉花病蟲害圖像各975張,總計7 800張。列出健康和7種病蟲害棉葉圖像[13-14]。圖1

a.健康 ;b.紅葉莖枯;c.紅蜘蛛;d.枯萎;e.黃萎;f.雙斑螢葉甲;g.蚜蟲;h.褐斑

a.Healthy;b.Red leaf blight;c.Red spider;d.Fusarium wilt;e.Verticillium wilt;f.Double-spotted leaf beetle;g.Aphid h.Brow spot

圖1 被害棉葉圖像
Fig. 1 Damaged cotton leaf image

1.2 方 法

1.2.1 圖像預(yù)處理和標(biāo)簽

在訓(xùn)練研究模型前將所有的圖像都調(diào)整為227×227像素。為了確保數(shù)據(jù)集中類型的準(zhǔn)確性,以棉葉病蟲害類型名稱標(biāo)記所有圖像。并將各類數(shù)據(jù)集以訓(xùn)練集與測試集為4∶1進(jìn)行標(biāo)記。具體被害棉葉圖像數(shù)據(jù)集。表1

表1 被害棉葉圖像數(shù)據(jù)統(tǒng)計
Table 1 Statistics on damaged cotton leaf image

健康Healthy紅葉莖枯Redleafblight紅蜘蛛Redspider枯萎Fusariumwilt黃萎Verticilliumwilt雙斑螢葉甲Double-spottedleafbeetle蚜蟲Aphid褐斑Browspot總計Total訓(xùn)練集Testset7807807807807807807807806240測試集Trainingset1951951951951951951951951560總計9759759759759759759759757800

1.2.2 卷積神經(jīng)網(wǎng)絡(luò)

caffe[15]深度學(xué)習(xí)框架,有完整的測試和微調(diào)工具包,其更新速度快可擴(kuò)展性強(qiáng)。CaffeNet[15]是AlexNet[16]的衍生模型。AlexNet共由5個卷積層和3個全連接層構(gòu)成,池化層包含于前兩個卷積層以及第五個卷積層中。CaffeNet只是將AlexNet在結(jié)構(gòu)上做了簡單的調(diào)整,在CaffeNet模型基礎(chǔ)上增加一層之后的模型結(jié)構(gòu)。顯示的各特征面圖像是在CaffeNet模型基礎(chǔ)上新增一層全連接層結(jié)構(gòu)上經(jīng)遷移學(xué)習(xí)所得模型的各卷積層及全連接層可視化后的圖像,輸入網(wǎng)絡(luò)模型的圖像為227×227×3的三通道RGB棉花葉片圖像;卷積層conv1~conv5的卷積核數(shù)目分別為96、256、384、384、256,卷積核的大小分別為11×11, 5×5, 3×3, 3×3像素,滑動步長分別為4、1、1、1、1,填充值分別為0、2、1、1、1,池化層pool1、pool2、pool5的池化類型均為最大池化,池化核大小均為3 × 3像素,滑動步長均為2,填充值均為0;全連接層fc6、fc7、Fc8_1(新增的全連接層)、output包含神經(jīng)元個數(shù)分別為4 096、4 096、512、6。圖2

圖2 CaffeNet微調(diào)后的網(wǎng)絡(luò)結(jié)構(gòu)
Fig. 2 Fine tuning the CaffeNet model structure

1.2.3 卷積層

卷積是卷積神經(jīng)網(wǎng)絡(luò)中最重要的操作,即圖像中不同窗口中的數(shù)據(jù)與卷積核(也稱為濾波器)做內(nèi)積,其本質(zhì)是提取圖像不同頻段的特征。多個濾波器疊加便形成了卷積層。通常情況下CNN中的第一個卷積層用于提取輸入圖像的低級特征,而其他卷積層則用來獲取圖像的高級特征[10]。

輸出圖像特征yi與輸入圖像特征xi之間的對應(yīng)關(guān)系通常可用下式(1)表示:

(1)

式中:l:卷積神經(jīng)網(wǎng)絡(luò)的第l層;

kij:卷積核;

bj閾值(也稱作偏置值);

Mj:輸入圖像

f(·):激活函數(shù);

常用的激活函數(shù)有sigmoid函數(shù)、tanh函數(shù)[17],以及線性糾正函數(shù)(ReLU)[18]。研究中采用ReLU激活函數(shù),ReLU激活函數(shù)可加快深度卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練時間,提升網(wǎng)絡(luò)性能[16]。對于輸入x,ReLU激活函數(shù)定義為(2):

(2)

1.2.4 池化層

池化層(也稱作下采樣層)的作用是將語義相似的特征合并為一個[19],保留主要特征的同時減少參數(shù),降低緯度防止過擬合。池化操作一般有均值池化、隨機(jī)池化、最大池化三種。為了更少的減少病蟲害棉葉圖像紋理信息的損失,在研究中采用最大池化,其表達(dá)式如下[20]:

(3)

式中:ai:輸入圖像的一個鄰域;

u(x,y):窗口函數(shù)。

圖3 全連接
Fig. 3 Full Connection

1.2.5 全連接層

全連接層的每個神經(jīng)元與其前一層的所有的神經(jīng)元進(jìn)行全連接,其作用是整合卷積層或池化層中有類別區(qū)分的局部信息。一個簡單的全連接層如圖3所示,它的每條邊都有其自身的參數(shù)。圖3

其中:x1,x2,x3, … ,xn-1,xn是全連接層的輸入

s1,s2,s3, … ,sn-1,sn是全連接層的輸出

圖2描述的全連接層可用數(shù)學(xué)公式表達(dá)為(4):

(4)

式中:wij:權(quán)重值(i,j = 1, ,2, 3, …,n-1,n)

bj:偏置值。

1.2.6 損失函數(shù)

損失函數(shù)的作用是用來表現(xiàn)預(yù)測與實際數(shù)據(jù)的差距程度,假設(shè)有n個訓(xùn)練樣本,記i為訓(xùn)練樣本的索引,k為訓(xùn)練樣本類別的索引,則關(guān)于連接權(quán)重w的損失函數(shù)可定義為(5):

(5)

式中:yik= 0, 1:如果第i個樣本屬于第k種類型,則yik= 1,否則yik= 0 ,

P(xi=k):輸入xi屬于模型預(yù)測的第k類的概率,是參數(shù)w的函數(shù)

網(wǎng)絡(luò)訓(xùn)練的目的就是找到使損失函數(shù)E最小的w的值[21]。在研究中,采用隨機(jī)梯度下降(Stochastic Gradient Descent,SGD)算法,w迭代更新可描述為下式(6):

wk=w(k-1)-α(?E(w)/?w).

(6)

式中:α:學(xué)習(xí)率 ;

k:類別的索引,其含義與(5)相同。

1.3 數(shù)據(jù)處理

遷移學(xué)習(xí)指利用不同學(xué)習(xí)任務(wù)之間的共性在任務(wù)間遷移知識,能夠?qū)默F(xiàn)有數(shù)據(jù)或環(huán)境中學(xué)到的知識用于新的數(shù)據(jù)或環(huán)境中。通過遷移學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)在小樣本圖像數(shù)據(jù)集上可使模型準(zhǔn)確率大幅地提升。研究采用模型微調(diào)的遷移學(xué)習(xí)方式,充分利用CaffeNet預(yù)訓(xùn)練模型在ImageNet數(shù)據(jù)集上學(xué)習(xí)得到的大量知識,將其用于優(yōu)化病蟲害棉葉圖像識別問題。

2 結(jié)果與分析

2.1 模型訓(xùn)練與測試

用于承載caffe框架進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練與測試的操作平臺為Windows7 64位系統(tǒng),計算機(jī)內(nèi)存為8GB,搭載Intel(R) Core(TM) i5-4590 CPU @ 3.30GHz處理器,顯存類型AMD Radeon R7 200 Series,容量4GB。

模型訓(xùn)練與測試均使用CPU完成,采用SGD算法對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,動量因子momentum設(shè)置為0.9,訓(xùn)練的批次樣本數(shù)設(shè)置為260,設(shè)置每20次迭代測試和顯示一次,最大迭代次數(shù)設(shè)置為1 520。以全新學(xué)習(xí)和遷移學(xué)習(xí)兩種方式對原始CaffeNet網(wǎng)絡(luò)及CaffeNet+1進(jìn)行訓(xùn)練。學(xué)習(xí)率是影響網(wǎng)絡(luò)模型分類識別準(zhǔn)確率的重要因素,通常情況下網(wǎng)絡(luò)訓(xùn)練中的初始學(xué)習(xí)率是依據(jù)經(jīng)驗設(shè)置的,為找到適宜于訓(xùn)練網(wǎng)絡(luò)模型的較優(yōu)的初始學(xué)習(xí)率,分別設(shè)置初始學(xué)習(xí)率為0.01、0.005、0.001共進(jìn)行12次試驗,得到12個模型,模型的訓(xùn)練與測試結(jié)果如表2所示(記錄迭代1 500次時的識別準(zhǔn)確率,并保存迭代1 500次時得到的模型)。

表2 模型訓(xùn)練與測試的準(zhǔn)確率和損失率
Table 2 Loss and Accuracy of Model Training and Testing

試驗編號Experimentnumber學(xué)習(xí)方式Learningmethod模型結(jié)構(gòu)Model學(xué)習(xí)率Learningrate訓(xùn)練準(zhǔn)確率Trainingaccuracy(%)訓(xùn)練損失Trainingloss測試準(zhǔn)確率Testaccuracy(%)測試損失Testloss123456全新學(xué)習(xí)CaffeNetCaffeNet+10.0110.12.07912.52.0790.0059.72.07912.52.0790.00196.40.09894.20.1760.0112.52.07912.52.0790.00512.52.07912.52.0790.00166.00.87465.90.727789101112遷移學(xué)習(xí)CaffeNetCaffeNet+10.0116.92.07912.52.0790.0051000.00197.60.0100.0011000.00296.80.0130.0116.92.07916.72.0790.0051000.00198.90.0020.0011000.00197.80.006

2.2 模型訓(xùn)練與測試準(zhǔn)確率和損失率

研究表明,全新學(xué)習(xí)方式下的CaffeNet及CaffeNet+1網(wǎng)絡(luò)模型在學(xué)習(xí)率取0.001時取得了較高的識別準(zhǔn)確率,而在學(xué)習(xí)率取0.01和0.005時,模型訓(xùn)練及測試準(zhǔn)確率只達(dá)到隨機(jī)猜測水平。而在遷移學(xué)習(xí)方式下在學(xué)習(xí)率取0.005和0.001時,CaffeNet和CaffeNet+1網(wǎng)絡(luò)模型均取得了較高的識別準(zhǔn)確率,其中改進(jìn)后的模型CaffeNet+1在0.005的學(xué)習(xí)率下,測試識別準(zhǔn)確率可達(dá)98.9%,其訓(xùn)練過程中準(zhǔn)確率及損失率變化曲線如圖4所示, 研究表明,僅經(jīng)過約200次迭代模型便達(dá)到穩(wěn)定狀態(tài)。表2,圖4

圖4 CaffeNet+1模型在遷移學(xué)習(xí)方式下訓(xùn)練過程中準(zhǔn)確率和損失變化曲線
Fig. 4 Accuracy and loss curve of CaffeNet+1 model in training process undertransferlearningmode

2.2.1 學(xué)習(xí)率對模型的影響

研究表明,學(xué)習(xí)率對卷積神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練影響較大。對于同一模型結(jié)構(gòu)在其他條件相同的情況下,設(shè)置不同的學(xué)習(xí)率,以此確定適合于模型訓(xùn)練較優(yōu)的學(xué)習(xí)率。當(dāng)學(xué)習(xí)率設(shè)置不恰當(dāng)時,模型訓(xùn)練時易發(fā)生振蕩,導(dǎo)致模型訓(xùn)練失敗[22],其訓(xùn)練過程中的準(zhǔn)確率和損失率的變化曲線。表2,圖5

圖5 學(xué)習(xí)率設(shè)置不當(dāng)時準(zhǔn)確率和損失變化曲線
Fig. 5 Loss and accuracy curves under training with an improper learning rate

2.2.2 遷移學(xué)習(xí)對模型的影響

較全新學(xué)習(xí)而言,遷移學(xué)習(xí)可是模型訓(xùn)練提前收斂并且獲得較高的識別準(zhǔn)確率,很大程度上節(jié)省了模型訓(xùn)練時間。遷移學(xué)習(xí)方式下的CaffeNet模型訓(xùn)練過程中僅40次迭代后測試準(zhǔn)確率便超過97%,約迭代260次后達(dá)到穩(wěn)定狀態(tài),然而在全新學(xué)習(xí)方式下模型經(jīng)20次迭代后測試準(zhǔn)確率低于20%,僅達(dá)到隨機(jī)猜測的水平,約1 060次迭代后才達(dá)到穩(wěn)定狀態(tài)。圖6

圖6 學(xué)習(xí)率取0.001時CaffeNet模型在兩種學(xué)習(xí)方式下準(zhǔn)確率變化曲線
Fig. 6 The accuracy curve of the CaffeNet model in two learning modes when the learning rate is 0.001

2.2.3 改進(jìn)模型與原模型對比

研究表明,微調(diào)改進(jìn)后的模型CaffeNet+1在遷移學(xué)習(xí)方式下學(xué)習(xí)率取0.005時,經(jīng)1 500次訓(xùn)練迭代后,在測試集上的識別準(zhǔn)確率可達(dá)98.9%,高于同等條件下的caffeNet模型(97.6%)。表2

3 討 論

研究中進(jìn)過改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)模型可以有效地提高模型在受害棉葉癥狀圖像測試集上的識別準(zhǔn)確率,優(yōu)于傳統(tǒng)的網(wǎng)模型結(jié)構(gòu)。相比較前人所提出的方法而言,研究所提的方法可以識別更多種類的受害棉葉特征圖像,但也受數(shù)據(jù)量以及圖片采集環(huán)境的限制,所以后續(xù)將進(jìn)一步研究復(fù)雜環(huán)境下更多種類的受害棉葉特征圖像的識別。

4 結(jié) 論

利用遷移學(xué)習(xí)和微調(diào)卷積神經(jīng)網(wǎng)絡(luò)模型對棉葉被病害危害后癥狀圖像進(jìn)行了分類試驗,改進(jìn)的卷積神經(jīng)網(wǎng)絡(luò)模型CaffeNet+1在遷移學(xué)習(xí)方式下取學(xué)習(xí)率為0.005時,在未參與訓(xùn)練的數(shù)據(jù)集上的分類準(zhǔn)確率可達(dá)98.9%,高于相同條件下的CaffeNet模型;相對于全新學(xué)習(xí)而言,遷移學(xué)習(xí)可充分利用在大型數(shù)據(jù)集上學(xué)習(xí)得到的知識,可以顯著加速網(wǎng)絡(luò)收斂和提高分類性能,為建立基于微調(diào)卷積神經(jīng)網(wǎng)絡(luò)遷移學(xué)習(xí)模式下被害棉葉精準(zhǔn)圖像識別技術(shù)創(chuàng)造了有利條件。

猜你喜歡
準(zhǔn)確率卷積神經(jīng)網(wǎng)絡(luò)
基于遞歸模糊神經(jīng)網(wǎng)絡(luò)的風(fēng)電平滑控制策略
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
乳腺超聲檢查診斷乳腺腫瘤的特異度及準(zhǔn)確率分析
不同序列磁共振成像診斷脊柱損傷的臨床準(zhǔn)確率比較探討
2015—2017 年寧夏各天氣預(yù)報參考產(chǎn)品質(zhì)量檢驗分析
頸椎病患者使用X線平片和CT影像診斷的臨床準(zhǔn)確率比照觀察
卷積神經(jīng)網(wǎng)絡(luò)的分析與設(shè)計
神經(jīng)網(wǎng)絡(luò)抑制無線通信干擾探究
從濾波器理解卷積
基于神經(jīng)網(wǎng)絡(luò)的中小學(xué)生情感分析
武陟县| 抚顺县| 紫金县| 广元市| 枣阳市| 张北县| 江北区| 乐清市| 贺兰县| 聂拉木县| 古田县| 新巴尔虎右旗| 甘德县| 黄骅市| 湖南省| 黑水县| 平利县| 承德县| 甘德县| 荃湾区| 城步| 清河县| 延边| 镇远县| 航空| 岳阳县| 台安县| 日土县| 蕲春县| 方城县| 天津市| 枣庄市| 宁安市| 宾阳县| 托克逊县| 宁乡县| 台北县| 安图县| 罗定市| 团风县| 上虞市|