国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于機(jī)器視覺(jué)的水下河蟹識(shí)別方法

2019-04-01 12:28趙德安劉曉洋孫月平吳任迪洪劍青阮承治
關(guān)鍵詞:河蟹卷積尺寸

趙德安 劉曉洋 孫月平 吳任迪 洪劍青 阮承治

(江蘇大學(xué)電氣信息工程學(xué)院, 鎮(zhèn)江 212013)

0 引言

我國(guó)河蟹養(yǎng)殖業(yè)增長(zhǎng)迅速,養(yǎng)殖面積約47萬(wàn)hm2,年產(chǎn)量約80萬(wàn)t,總產(chǎn)值超過(guò)500億元,現(xiàn)已成為中國(guó)漁業(yè)生產(chǎn)中最具潛力的支柱產(chǎn)業(yè)[1]。但是相關(guān)河蟹養(yǎng)殖技術(shù)以及自動(dòng)化養(yǎng)殖機(jī)械方面仍然比較落后,不能滿足工業(yè)化、規(guī)?;酿B(yǎng)殖需求[2]。其中河蟹的自動(dòng)化投餌是工業(yè)化養(yǎng)殖的重要發(fā)展方向。

目前國(guó)內(nèi)外有關(guān)水下河蟹識(shí)別研究較少,但是機(jī)器視覺(jué)在漁業(yè)生產(chǎn)中的應(yīng)用研究已經(jīng)得到部分學(xué)者的關(guān)注。JIANG等[3]采用粒子濾波算法實(shí)現(xiàn)了實(shí)驗(yàn)室環(huán)境下河蟹的自動(dòng)視頻跟蹤,但并未涉及河蟹的識(shí)別。王勇平等[4]和胡利永等[5]采用攝像頭對(duì)魚(yú)群進(jìn)食的水面進(jìn)行監(jiān)控,通過(guò)分析魚(yú)群搶食時(shí)造成的水花和波浪確定進(jìn)食面積變化,從而實(shí)現(xiàn)精確投餌。馬國(guó)強(qiáng)等[6]采用K-均值聚類算法識(shí)別海中水箱養(yǎng)殖的石斑魚(yú),在圖像清晰、干擾較小的情況下能夠達(dá)到較高的識(shí)別率。

河蟹主要在池塘底部活動(dòng),且水質(zhì)條件較差,水中存在氣泡和懸浮物等雜質(zhì)。因此水體會(huì)對(duì)光線產(chǎn)生較大的衰減作用,對(duì)采集圖像的質(zhì)量有較大影響。此外河蟹的形狀與姿態(tài)存在較大差異,這給河蟹識(shí)別帶來(lái)了難度,傳統(tǒng)目標(biāo)識(shí)別方法難以滿足河蟹的識(shí)別需求。近年來(lái)深度卷積神經(jīng)網(wǎng)絡(luò)的迅猛發(fā)展,為水下河蟹的識(shí)別提供了新的方向[7-8]?,F(xiàn)已有學(xué)者將此類基于卷積神經(jīng)網(wǎng)絡(luò)的目標(biāo)檢測(cè)框架應(yīng)用于農(nóng)業(yè)和漁業(yè)生產(chǎn)中,并取得了較好的效果[9-11]。傅隆生等[12]采用1998年提出的經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)LeNet成功地實(shí)現(xiàn)了獼猴桃的識(shí)別。熊俊濤等[13]采用更快速卷積神經(jīng)網(wǎng)絡(luò)(Faster regions with convolutional neural networks,F(xiàn)aster RCNN)實(shí)現(xiàn)了自然環(huán)境下綠色柑橘的識(shí)別。薛月菊等[14]采用YOLO V2實(shí)現(xiàn)了綠色芒果的識(shí)別。

為實(shí)現(xiàn)自動(dòng)投餌船的精確投餌,本文提出基于機(jī)器視覺(jué)的水下河蟹識(shí)別方法。針對(duì)水下環(huán)境采用優(yōu)化的Retinex算法對(duì)水下圖像進(jìn)行增強(qiáng),以提高圖像對(duì)比度,增強(qiáng)河蟹在圖像中的細(xì)節(jié)表現(xiàn),然后采用最新的YOLO V3深度學(xué)習(xí)模型對(duì)河蟹進(jìn)行識(shí)別。為科學(xué)確定投餌量以及根據(jù)河蟹分布進(jìn)行精確投餌提供可靠的反饋信息。

1 圖像采集與增強(qiáng)

1.1 圖像采集

實(shí)驗(yàn)樣本圖像采集于江蘇省常州市長(zhǎng)蕩湖河蟹養(yǎng)殖基地。圖像采集裝置是廣州海豹光電公司研發(fā)的游弋式渾濁水下監(jiān)控系統(tǒng),型號(hào)為HB-HZSJC-AK。該系統(tǒng)由船體和控制箱兩部分組成。船體如圖1a所示,在船體下方安裝有可伸縮水下攝像頭以及LED輔助照明光源。攝像頭采集的圖像和視頻通過(guò)無(wú)線網(wǎng)絡(luò)傳輸至控制箱,如圖1b所示。在傍晚河蟹覓食時(shí)進(jìn)行圖像采集,如圖1c所示。所采集圖像格式為jpg,圖像分辨率為960像素×576像素。

圖1 圖像采集系統(tǒng)Fig.1 Image acquisition system

1.2 圖像增強(qiáng)

水下攝像頭采集的圖像如圖2a所示。由于水中光線衰減較大造成圖像對(duì)比度低,同時(shí)由于受到水中雜質(zhì)等影響使得圖像較為模糊。因此,首先需要對(duì)圖像進(jìn)行必要的增強(qiáng),以便于在后續(xù)識(shí)別中提取河蟹特征。水下圖像增強(qiáng)方法主要分為3類:①基于空間域的圖像增強(qiáng)算法,如對(duì)比度拉伸、直方圖均衡等。②基于頻域的圖像增強(qiáng)方法,如同態(tài)濾波[15-16]、小波變換等。③基于顏色恒常性理論的增強(qiáng)方法,如自動(dòng)白平衡、Retinex算法[17-18]等。

實(shí)驗(yàn)分別采用全局直方圖均衡、自適應(yīng)直方圖均衡、同態(tài)濾波和Retinex算法對(duì)水下圖像進(jìn)行增強(qiáng)。因河蟹與背景并沒(méi)有顯著的顏色差異,因此將拍攝的彩色圖像轉(zhuǎn)換為灰度圖像,并針對(duì)灰度圖像進(jìn)行增強(qiáng)。全局直方圖均衡的增強(qiáng)效果如圖2b所示,從圖中可以看出該方法對(duì)光照不均圖像的增強(qiáng)效果較差,易造成局部過(guò)亮從而丟失部分圖像信息。自適應(yīng)直方圖均衡的增強(qiáng)效果如圖2c所示,自適應(yīng)直方圖均衡通過(guò)改變圖像局部對(duì)比度增強(qiáng)了圖像細(xì)節(jié)同時(shí)也克服了全局直方圖均衡的缺陷,但是增強(qiáng)效果并不顯著。圖2d是同態(tài)濾波的效果圖,增強(qiáng)后的圖像雖然在視覺(jué)上更加純凈,但是其對(duì)比度弱于圖2c。相對(duì)于圖2c,Retinex算法的增強(qiáng)效果(圖2e)更差,且圖像整體偏亮。因此,上述4種圖像增強(qiáng)方法均未達(dá)到預(yù)期的增強(qiáng)效果。

圖2 不同方法增強(qiáng)效果對(duì)比Fig.2 Comparisons of different image enhancement methods

圖3 優(yōu)化算法的增強(qiáng)效果對(duì)比Fig.3 Comparisons of optimized image enhancement methods

為了達(dá)到理想的圖像增強(qiáng)效果,結(jié)合上述結(jié)果,采用自適應(yīng)直方圖均衡分別對(duì)同態(tài)濾波和Retinex算法進(jìn)行優(yōu)化。優(yōu)化后的圖像增強(qiáng)效果如圖3所示。對(duì)比圖3a和圖3b可以看出,經(jīng)優(yōu)化的同態(tài)濾波算法增強(qiáng)后,圖像中的暗區(qū)域都得到了相應(yīng)增強(qiáng);而優(yōu)化的Retinex算法對(duì)細(xì)節(jié)不顯著的區(qū)域增強(qiáng)效果較優(yōu)化的同態(tài)濾波算法差。河蟹作為圖像檢測(cè)對(duì)象,自身具有大量的細(xì)節(jié)特征。兩種方法對(duì)檢測(cè)對(duì)象河蟹的增強(qiáng)效果是相當(dāng)?shù)?,?yōu)化的Retinex算法對(duì)細(xì)節(jié)不顯著區(qū)域的增強(qiáng)效果較差,能夠減少后續(xù)識(shí)別的干擾,因此選擇優(yōu)化的Retinex算法作為水下圖像的增強(qiáng)算法。

Retinex算法將圖像理解為入射圖像和反射圖像的乘積,即

T(x,y)=G(x,y)H(x,y)

(1)

式中T——給定圖像

G——反射圖像

H——入射圖像

x、y——圖像中像素的橫、縱坐標(biāo)值

入射圖像對(duì)應(yīng)圖像的低頻部分,而反射圖像對(duì)應(yīng)圖像的高頻部分。優(yōu)化的Retinex算法對(duì)水下圖像進(jìn)行增強(qiáng)的流程如圖4所示。首先將原圖轉(zhuǎn)換為灰度圖像,然后通過(guò)頻域低通濾波估算出入射圖像,接著將灰度圖像和入射圖像轉(zhuǎn)換到對(duì)數(shù)域相減,從而得到反射圖像,最后采用自適應(yīng)直方圖均衡再次對(duì)反射圖像進(jìn)行增強(qiáng)。其中,對(duì)數(shù)變換是為了實(shí)現(xiàn)式(1)中入射圖像和反射圖像的分離,以便于通過(guò)減法操作得到反射圖像。

圖4 Retinex算法增強(qiáng)圖像流程圖Fig.4 Flow chart of image enhancement by Retinex

2 水下河蟹識(shí)別

YOLO是近年來(lái)被廣泛應(yīng)用的目標(biāo)檢測(cè)深度學(xué)習(xí)框架[19],本文采用最新提出的YOLO V3對(duì)河蟹進(jìn)行識(shí)別定位。

2.1 建立數(shù)據(jù)集

圖5 數(shù)據(jù)集樣本標(biāo)注Fig.5 Labelled images in dataset

深度學(xué)習(xí)對(duì)于訓(xùn)練樣本的數(shù)量要求較大,數(shù)據(jù)量的多少會(huì)直接影響河蟹的識(shí)別精度。為建立可供YOLO V3訓(xùn)練和測(cè)試的數(shù)據(jù)集,實(shí)驗(yàn)通過(guò)多渠道采集實(shí)驗(yàn)圖像。在長(zhǎng)蕩湖河蟹養(yǎng)殖基地采集的水下河蟹圖像共計(jì)1 731幅,抽取其中1 500幅(圖5b)進(jìn)行圖像增強(qiáng),然后用于YOLO V3模型的訓(xùn)練和性能測(cè)試,剩余圖像用于后續(xù)的對(duì)比實(shí)驗(yàn)。為了進(jìn)一步豐富數(shù)據(jù)集并提高網(wǎng)絡(luò)泛化能力,在實(shí)驗(yàn)室環(huán)境下采集河蟹圖像1 000幅(圖5a),此外在互聯(lián)網(wǎng)上下載河蟹圖像1 000幅(圖5c)。共計(jì)3 500幅河蟹圖像用于YOLO V3模型的訓(xùn)練和測(cè)試,其中70%用于訓(xùn)練,30%用于測(cè)試。但是仍然達(dá)不到模型訓(xùn)練的數(shù)量要求,因此需要對(duì)數(shù)據(jù)集進(jìn)行擴(kuò)增。通過(guò)沿縱向和橫向翻轉(zhuǎn)圖像、平移圖像、縮放圖像、添加高斯噪聲、旋轉(zhuǎn)圖像以及裁剪圖像等方法,對(duì)圖像數(shù)據(jù)集進(jìn)行擴(kuò)增。

完善的數(shù)據(jù)集除了包括大量的樣本圖像,還需要對(duì)圖像中的檢測(cè)目標(biāo)進(jìn)行標(biāo)注。實(shí)驗(yàn)采用矩形框?qū)有愤M(jìn)行標(biāo)注,但是河蟹具有1對(duì)蟹螯和4對(duì)蟹腿,若將其全部框選進(jìn)行標(biāo)注則會(huì)使得標(biāo)注區(qū)域包含大量背景。背景中存在的無(wú)用特征會(huì)干擾模型的訓(xùn)練和性能表現(xiàn)。因此,人工標(biāo)注河蟹時(shí)只關(guān)注河蟹的主要特征,主要對(duì)河蟹的身體和1對(duì)蟹螯進(jìn)行框選。具體標(biāo)注情況如圖5所示,標(biāo)注框包含了河蟹的身體和大部分蟹螯以及小部分蟹腿。圖像標(biāo)注信息采用PASCAL VOC數(shù)據(jù)集的格式進(jìn)行保存,具體包含所標(biāo)注圖像在硬盤(pán)中的地址、矩形標(biāo)注框左上角在圖像中的坐標(biāo)、標(biāo)注框的長(zhǎng)和寬以及標(biāo)注的類別。因?yàn)楹有返念伾⒉皇瞧滹@著的特征,為了減少數(shù)據(jù)量并提高YOLO V3的訓(xùn)練和識(shí)別效率,實(shí)驗(yàn)室采集的圖像和網(wǎng)絡(luò)下載的圖像均轉(zhuǎn)換為灰度圖像。

2.2 YOLO網(wǎng)絡(luò)結(jié)構(gòu)

YOLO深度卷積神經(jīng)網(wǎng)絡(luò)一直以其識(shí)別的快速性受到廣泛關(guān)注,但是其目標(biāo)檢測(cè)的準(zhǔn)確性還相對(duì)欠佳。近幾年,YOLO模型通過(guò)自身不斷優(yōu)化并吸收單次多類檢測(cè)器(Single shot multibox detector,SSD)、Faster RCNN等其他目標(biāo)檢測(cè)模型的優(yōu)點(diǎn)已經(jīng)經(jīng)歷了3個(gè)版本的迭代。最新的YOLO V3在識(shí)別速度和準(zhǔn)確性上都有了顯著改善,并被應(yīng)用于多個(gè)領(lǐng)域。不同于Faster RCNN、區(qū)域全卷積神經(jīng)網(wǎng)絡(luò)(Region-based fully convolutional network, R-FCN)等采用區(qū)域建議和分類器相結(jié)合的算法思想,YOLO將圖像分為S×S個(gè)網(wǎng)格,通過(guò)回歸方法一次性預(yù)測(cè)所有網(wǎng)格所含目標(biāo)的包圍框、置信度以及類別概率。因此,YOLO能夠在識(shí)別速度上遠(yuǎn)超其他目標(biāo)檢測(cè)網(wǎng)絡(luò),其識(shí)別速度能夠滿足實(shí)際應(yīng)用場(chǎng)景對(duì)實(shí)時(shí)性的要求。

YOLO V3網(wǎng)絡(luò)結(jié)構(gòu)如圖6a所示,其采用類殘差網(wǎng)絡(luò)構(gòu)造[20]的DarkNet-53作為基礎(chǔ)網(wǎng)絡(luò)對(duì)目標(biāo)特征進(jìn)行學(xué)習(xí)。殘差網(wǎng)絡(luò)的基本結(jié)構(gòu)單元如圖6b所示,該結(jié)構(gòu)使得網(wǎng)絡(luò)能夠不斷加深且不會(huì)造成梯度消失或梯度爆炸,從而加強(qiáng)對(duì)圖像特征的學(xué)習(xí),提高識(shí)別的精確度。從圖6中可以看出,YOLO V3抽取3個(gè)不同尺度的圖像特征進(jìn)行回歸預(yù)測(cè),提高了對(duì)不同尺度目標(biāo)的檢測(cè)能力。該網(wǎng)絡(luò)已經(jīng)在COCO等數(shù)據(jù)集上進(jìn)行了相應(yīng)的訓(xùn)練,但為了提高其對(duì)水下河蟹的識(shí)別速率和準(zhǔn)確性,實(shí)驗(yàn)對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行了必要的調(diào)整。原網(wǎng)絡(luò)輸入是尺寸為416像素×416像素×3通道的彩色圖像,這使得YOLO V3的首個(gè)卷積層必須采用3維卷積核,以適應(yīng)對(duì)彩色圖像的識(shí)別。因?yàn)樗袌D像為灰度圖像,因此采用2維卷積核替代3維卷積核,從而可以將首個(gè)卷積層的權(quán)值數(shù)量減少到原來(lái)的1/3,從而提高網(wǎng)絡(luò)訓(xùn)練和識(shí)別的效率。此外,水下河蟹的識(shí)別中需要檢測(cè)的目標(biāo)只有河蟹1個(gè)類別,因此通過(guò)修改YOLO V3的輸出類別數(shù)量,可以極大地減少網(wǎng)絡(luò)所預(yù)測(cè)張量的維度,使得每個(gè)尺度所預(yù)測(cè)張量的長(zhǎng)度僅為18,從而減少不必要的運(yùn)算量。

圖6 YOLO V3網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 YOLO V3 network structure

2.3 河蟹檢測(cè)網(wǎng)絡(luò)的訓(xùn)練

首先將數(shù)據(jù)集中的圖像樣本全部轉(zhuǎn)換為416像素×416像素,以便于輸入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。訓(xùn)練時(shí)以128幅圖像為一個(gè)批次進(jìn)行小批量訓(xùn)練,每訓(xùn)練一批圖像,權(quán)值進(jìn)行一次更新。權(quán)值的衰減速率設(shè)為0.000 5,動(dòng)量設(shè)置為0.9,初始學(xué)習(xí)率設(shè)為0.001。模型訓(xùn)練的硬件平臺(tái)配置為2個(gè)Intel E5-2683處理器,4個(gè)顯存為11 GB的 Nvidia GTX1080Ti 顯卡和2根32 GB內(nèi)存條。共對(duì)YOLO V3模型進(jìn)行了6 000次迭代,網(wǎng)絡(luò)損失函數(shù)L的輸出如圖7所示。為了清晰地展示損失值的變化,將縱坐標(biāo)設(shè)置為lg(L+1)。從圖7中可以看出,在前250次的迭代中損失值迅速下降,在250次到2 000次迭代中損失值緩慢減小,而2 000次后損失值保持穩(wěn)定沒(méi)有顯著變化。在訓(xùn)練過(guò)程中每迭代1 000次輸出一個(gè)模型,因此本次訓(xùn)練共輸出6個(gè)模型,依次為模型1~6。

圖7 損失函數(shù)的輸出結(jié)果Fig.7 Output result of loss function

為選取合適的模型,需要采用多種指標(biāo)對(duì)模型的性能進(jìn)行評(píng)判。常用的評(píng)價(jià)標(biāo)準(zhǔn)包括交并比I,即人工標(biāo)記框與網(wǎng)絡(luò)預(yù)測(cè)框的交集與并集的比例, 準(zhǔn)確率P、召回率R、F1分?jǐn)?shù)與平均精度均值Q的計(jì)算公式為

(2)

(3)

(4)

(5)

式中U——真正,即網(wǎng)絡(luò)預(yù)測(cè)的正樣本中包含正樣本的數(shù)量

V——假正,即網(wǎng)絡(luò)預(yù)測(cè)的正樣本中包含負(fù)樣本的數(shù)量

W——假負(fù),即未被網(wǎng)絡(luò)預(yù)測(cè)的正樣本數(shù)量

J——精度均值函數(shù),即準(zhǔn)確率P與召回率R所構(gòu)成P-R曲線與橫縱坐標(biāo)所圍成的面積

C——所檢測(cè)目標(biāo)類別的數(shù)量

k——類別序號(hào)

實(shí)驗(yàn)只需要檢測(cè)河蟹這一類目標(biāo),因此,本文C取1。其中,交并比的閾值選擇是直接影響準(zhǔn)確率和召回率的重要因素。該閾值越大,準(zhǔn)確率越大,召回率反之。實(shí)驗(yàn)?zāi)康臑闄z測(cè)河蟹的數(shù)量和分布,因此對(duì)交并比的要求不高,但為了保證檢測(cè)的準(zhǔn)確率,交并比也不能過(guò)低,因此選擇交并比I>50%作為判斷目標(biāo)是否被正確檢測(cè)的標(biāo)準(zhǔn)。表1列出了每個(gè)模型相應(yīng)的性能參數(shù)。從表中可以看出,模型1性能最差,而模型3~6性能較好且沒(méi)有顯著差異,因此,只在后4個(gè)模型中選擇合適的模型進(jìn)行河蟹識(shí)別。為了對(duì)4個(gè)模型的性能進(jìn)行恰當(dāng)?shù)呐判?,需要明確性能參數(shù)的優(yōu)先級(jí)。實(shí)驗(yàn)采用的性能參數(shù)優(yōu)先級(jí)由大到小為Q、F1、R、P、I。Q是對(duì)模型性能衡量最為全面的參數(shù),排在首位。按照此優(yōu)先級(jí)進(jìn)行排序,模型5的性能最佳,只在準(zhǔn)確率和交并比上略差于其他模型。因此選擇模型5對(duì)水下河蟹進(jìn)行檢測(cè)。

表1 輸出網(wǎng)絡(luò)模型的性能參數(shù)Tab.1 Performance parameters of output network model %

3 實(shí)驗(yàn)與討論

3.1 不同類型河蟹的識(shí)別

為了進(jìn)一步測(cè)試所選取的網(wǎng)絡(luò)模型對(duì)河蟹的識(shí)別能力,對(duì)實(shí)驗(yàn)室和水下采集的河蟹圖像以及水下不同尺寸河蟹的圖像分別進(jìn)行識(shí)別。實(shí)驗(yàn)室環(huán)境下采集的河蟹圖像背景簡(jiǎn)單,干擾少,河蟹特征清晰。通過(guò)對(duì)比所選模型對(duì)水下河蟹與實(shí)驗(yàn)室環(huán)境下河蟹的識(shí)別效果,可以看出水下環(huán)境對(duì)河蟹識(shí)別的影響。此外,由于池塘底部的起伏造成拍攝的河蟹圖像尺寸存在較大差異,且YOLO V3模型對(duì)不同尺寸的目標(biāo)識(shí)別能力存在一定的差異,因此對(duì)水下河蟹按尺寸進(jìn)行分類,驗(yàn)證所選取模型對(duì)不同尺寸河蟹的識(shí)別能力。河蟹尺寸按照河蟹占圖像總面積的百分比進(jìn)行分類,百分比為5%及以下的河蟹為小尺寸河蟹(圖8a),百分比5%~20%的河蟹為中尺寸河蟹(圖8b),百分比20%及以上的河蟹為大尺寸河蟹(圖8c)。

表2列出了所選取模型對(duì)不同類型河蟹識(shí)別結(jié)果的相關(guān)統(tǒng)計(jì)參數(shù),表中“數(shù)量”表示測(cè)試圖像中人工統(tǒng)計(jì)的河蟹數(shù)量。從表中可以看出,所選模型對(duì)實(shí)驗(yàn)室采集的河蟹圖像的識(shí)別準(zhǔn)確率100%,既沒(méi)有誤識(shí)別也不存在漏識(shí)別,并且交并比也同樣很高。這說(shuō)明所選模型在簡(jiǎn)單背景下能夠保證超高的識(shí)別準(zhǔn)確率。從所選模型對(duì)水下圖像的識(shí)別統(tǒng)計(jì)參數(shù)可以看出,水下環(huán)境對(duì)河蟹的檢測(cè)產(chǎn)生了較大的干擾,使得各項(xiàng)參數(shù)都有所下降,而其中小尺寸河蟹的識(shí)別效果最差。一方面是因?yàn)樾〕叽绾有放c攝像頭和光源距離較遠(yuǎn)且光線在水中衰減過(guò)快,使得小尺寸河蟹圖像較為模糊,特征不明顯,另一方面是因?yàn)閅OLO V3模型自身對(duì)小尺寸目標(biāo)的檢測(cè)效果稍有欠缺。中尺寸河蟹的識(shí)別效果較為理想,識(shí)別準(zhǔn)確率能夠達(dá)到較高水平。而大尺寸河蟹圖像中河蟹的特征清晰,其識(shí)別效果近似于實(shí)驗(yàn)室環(huán)境下的識(shí)別效果,水下環(huán)境對(duì)所選模型的識(shí)別并未產(chǎn)生顯著影響。

圖8 不同尺寸的河蟹圖像Fig.8 Crab images in different sizes

類型數(shù)量I/%UVWP/%R/%F1/%實(shí)驗(yàn)室圖像9693.869600100100100水下圖像 25381.2623182296.6591.3093.90小尺寸河蟹6873.825341592.9877.9484.80中尺寸河蟹13384.621263797.6794.7496.18大尺寸河蟹5285.34521098.1110099.05

圖9展示了部分識(shí)別錯(cuò)誤的河蟹圖像,圖9a和圖9c是因?yàn)榫W(wǎng)絡(luò)所預(yù)測(cè)的目標(biāo)位置與實(shí)際目標(biāo)位置偏差較大被判斷為識(shí)別錯(cuò)誤。圖9b存在漏識(shí)別,下方的河蟹沒(méi)有被成功檢測(cè),而圖9d則存在誤識(shí)別。

3.2 不同方法的檢測(cè)效果對(duì)比

為進(jìn)一步驗(yàn)證YOLO V3對(duì)于水下河蟹識(shí)別的可靠性,分別與基于區(qū)域建議機(jī)制的Faster RCNN[21]和傳統(tǒng)的梯度方向直方圖(Histogram of oriented gradient,HOG)+支持向量機(jī)(Support vector machine,SVM)[22]的方法進(jìn)行比較。Faster RCNN經(jīng)歷了從RCNN、Fast RCNN等多個(gè)版本的迭代,通過(guò)加入?yún)^(qū)域建議網(wǎng)絡(luò)(Region proposal net, RPN)實(shí)現(xiàn)了端到端的目標(biāo)檢測(cè),使得識(shí)別速率和準(zhǔn)確率都得到了較大的提高。HOG+SVM最早用于行人檢測(cè),該方法通過(guò)多尺度滑窗提取圖像的HOG形狀特征并采用SVM對(duì)特征向量進(jìn)行分類,對(duì)于不規(guī)則形狀物體的檢測(cè)具有較好的效果。這兩種方法與YOLO V3在相同的數(shù)據(jù)集上進(jìn)行訓(xùn)練并在同一硬件平臺(tái)上運(yùn)行,該硬件平臺(tái)配置為i5-7400 處理器,主頻3 GHz,8 GB內(nèi)存。

圖9 部分存在錯(cuò)誤識(shí)別的圖像Fig.9 Examples of falsely detected crabs

表3列出了3種方法對(duì)于水下河蟹識(shí)別效果的統(tǒng)計(jì)參數(shù)。從表中可以看出,F(xiàn)aster RCNN的識(shí)別效果與YOLO V3相當(dāng),且略優(yōu)于YOLO V3的識(shí)別效果,但是其識(shí)別速率與YOLO V3相差較大。HOG+SVM對(duì)于河蟹的識(shí)別效果最差,存在較多的漏識(shí)別和誤識(shí)別且識(shí)別速率也最慢。通過(guò)具體分析錯(cuò)誤識(shí)別的圖像可知,HOG+SVM對(duì)于較為模糊的圖像識(shí)別能力較差,從而產(chǎn)生較多的漏識(shí)別。此外,不同于行人在圖像中的方向具有一致性,河蟹在圖像中的姿態(tài)和朝向存在較大差異,這使得HOG特征分布離散,SVM難以分類,因此造成較多的誤識(shí)別。綜合識(shí)別效果和運(yùn)行速率來(lái)看,YOLO V3是3種方法中最適合用于搭載在河蟹自動(dòng)投餌船上對(duì)水下河蟹進(jìn)行識(shí)別的算法。

表3 不同方法識(shí)別統(tǒng)計(jì)參數(shù)Tab.3 Statistical parameters of different methods

4 結(jié)論

(1)針對(duì)水下環(huán)境采集圖像質(zhì)量差的特點(diǎn),提出了有效的水下圖像增強(qiáng)方法。通過(guò)對(duì)比多種圖像增強(qiáng)方法,最終選擇優(yōu)化的Retinex算法對(duì)水下河蟹圖像進(jìn)行增強(qiáng),使得水下河蟹特征更加明顯,為后續(xù)模型訓(xùn)練和特征學(xué)習(xí)提供了基礎(chǔ)。

(2)基于深度卷積神經(jīng)網(wǎng)絡(luò)的YOLO V3模型目標(biāo)檢測(cè)框架,通過(guò)修改網(wǎng)絡(luò)的輸入輸出構(gòu)建適合河蟹識(shí)別的網(wǎng)絡(luò)結(jié)構(gòu),并構(gòu)建數(shù)據(jù)集對(duì)模型進(jìn)行訓(xùn)練和性能測(cè)試,最終輸出模型的平均精度均值達(dá)86.42%,對(duì)水下河蟹識(shí)別準(zhǔn)確率為96.65%,召回率為91.30%。

(3)對(duì)比了所選訓(xùn)練模型對(duì)不同環(huán)境下河蟹的識(shí)別效果,表明YOLO V3模型在河蟹特征清晰、環(huán)境干擾小的情況下能夠?qū)崿F(xiàn)接近100%的識(shí)別精度,對(duì)水下小尺寸河蟹這類特征模糊、干擾較多的情況識(shí)別率較低。

(4)通過(guò)與Faster RCNN、HOG+SVM進(jìn)行河蟹識(shí)別效果對(duì)比,只有YOLO V3能夠在保證識(shí)別效果的同時(shí)確保識(shí)別速率。在同一硬件平臺(tái)上YOLO V3識(shí)別速率達(dá)10.67 f/s。

猜你喜歡
河蟹卷積尺寸
河蟹池塘高效混養(yǎng)新模式探析
北方地區(qū)湖泊河蟹養(yǎng)殖技術(shù)探討
CIIE Shows Positive Energy of Chinese Economy
基于3D-Winograd的快速卷積算法設(shè)計(jì)及FPGA實(shí)現(xiàn)
智能精準(zhǔn)投餌 河蟹吃飽吃好
卷積神經(jīng)網(wǎng)絡(luò)的分析與設(shè)計(jì)
從濾波器理解卷積
基于傅里葉域卷積表示的目標(biāo)跟蹤算法
D90:全尺寸硬派SUV
佳石選賞
明光市| 大新县| 涿鹿县| 大埔区| 黄平县| 镇平县| 读书| 肥城市| 隆子县| 滨海县| 左贡县| 张家川| 静乐县| 惠安县| 栖霞市| 咸宁市| 南乐县| 烟台市| 同江市| 盐池县| 云安县| 德州市| 库伦旗| 托克逊县| 襄樊市| 宁城县| 从化市| 宁安市| 昭觉县| 湟源县| 文成县| 措美县| 调兵山市| 双牌县| 辛集市| 即墨市| 醴陵市| 田东县| 永城市| 抚宁县| 玛曲县|