摘要:針對(duì)光伏面板缺陷檢測(cè)存在的小目標(biāo)檢測(cè)精度低、泛化能力差等問題,提出基于特征重組和注意力機(jī)制的YOLOv5光伏面板缺陷檢測(cè)方法。首先,分別使用卷積注意力模塊和壓縮激勵(lì)模塊,提取目標(biāo)圖像在通道和空間維度上的特征,使網(wǎng)絡(luò)更有效地學(xué)習(xí)目標(biāo)特征;然后,使用感受野擴(kuò)展模塊進(jìn)行特征融合,確保網(wǎng)絡(luò)能夠結(jié)合大感受野特征和微小特征進(jìn)行綜合判斷;最后,引入特征重組模塊,對(duì)不同尺寸的特征圖進(jìn)行特征重組,解決了網(wǎng)絡(luò)對(duì)小目標(biāo)信息缺失和不敏感的問題。通過消融實(shí)驗(yàn)和對(duì)比實(shí)驗(yàn),驗(yàn)證了該方法的有效性。
關(guān)鍵詞:特征重組;注意力機(jī)制;光伏面板;缺陷檢測(cè);YOLOv5;神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):TP183 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-2605(2024)05-0007-07
DOI:10.3969/j.issn.1674-2605.2024.05.007 開放獲取
YOLOv5 Photovoltaic Panel Defect Detection Method Based on Feature Recombination and Attention Mechanism
WU Guo1 GAO Shouzheng2 ZHANG Defu3
XIAO Guolong1 GONG Zhengping1 QIN Jian1
(1.Guangzhou Electronic Technology Co., Ltd., CAS, Guangzhou 510070, China
2.School of Automation Science and Engineering, South China University of Technology, Guangzhou 510641, China 3.Guangzhou Institute of Technology, College of Intelligent Manufacturing and Electrical Engineering, Guangzhou 510800, China)
Abstract: Aiming at the problems of low small object detection accuracy and poor generalization ability in defect detection of photovoltaic panels, a YOLOv5 photovoltaic panel defect detection method based on feature recombination and attention mechanism is proposed. Firstly, the convolutional attention module and compression excitation module are used separately to extract the features of the target image in the channel and spatial dimensions, enabling the network to learn the target features more effectively; Then, the receptive field extension module is used for feature fusion to ensure that the network can combine large receptive field features and small features for comprehensive judgment; Finally, a feature recombination module was introduced to perform feature recombination on feature maps of different sizes, solving the problem of missing and insensitive information for small targets in the network. The effectiveness of this method was verified through ablation experiments and comparative experiments.
Keywords: feature recombination; attention mechanism; photovoltaic panel; defect detection; YOLOv5; neural network
0 引言
光伏發(fā)電能提供清潔和可持續(xù)的能源。然而,光伏發(fā)電系統(tǒng)長期暴露在戶外環(huán)境中,不僅受溫度、雨水和風(fēng)等氣候變化的影響,還可能被人類活動(dòng)或生物破壞,造成電力生產(chǎn)損失。同時(shí),光伏面板的表面缺陷,如劃痕、破損、污漬等,也降低了光伏發(fā)電系統(tǒng)的穩(wěn)定性。因此,對(duì)光伏面板進(jìn)行缺陷檢測(cè),有助于提高光伏發(fā)電系統(tǒng)的可靠性,并降低運(yùn)行成本[1]。
目前,光伏面板缺陷檢測(cè)的研究主要包括構(gòu)建模型和優(yōu)化算法兩方面。文獻(xiàn)[2]提出一種基于改進(jìn)Alexnet模型的光伏電池片瑕疵分類方法,融合了多層級(jí)特征進(jìn)行分類,提升了瑕疵分類的穩(wěn)定性、實(shí)時(shí)性和正確率。文獻(xiàn)[3]提出一種基于改進(jìn)U-Net網(wǎng)絡(luò)模型的光伏電池板缺陷檢測(cè)方法,有效減少了模型參數(shù)量并提升了檢測(cè)精度。文獻(xiàn)[4]設(shè)計(jì)了一種包含12層卷積的殘差網(wǎng)絡(luò),并與特征金字塔結(jié)合,以獲取輸入圖像不同尺度的特征;將特征圖分割池化后作為Transformer的輸入,在不增加計(jì)算量的情況下,提升了缺陷識(shí)別的準(zhǔn)確度。文獻(xiàn)[5]針對(duì)動(dòng)態(tài)開放場(chǎng)景設(shè)計(jì)了一種光伏缺陷檢測(cè)數(shù)據(jù)歸一化控制器,以提高網(wǎng)絡(luò)的域適應(yīng)能力,解決了光伏部件圖像質(zhì)量低和易失真的問題。文獻(xiàn)[6]針對(duì)光伏面板缺陷類內(nèi)差異大、類間差異小和背景特征復(fù)雜的特點(diǎn),提出融合局部和全局特征的卷積視覺Transformer網(wǎng)絡(luò),有效提升了光伏面板缺陷檢測(cè)的精度。文獻(xiàn)[7]提出基于超分辨率網(wǎng)絡(luò)和雙池化融合的光伏組件缺陷檢測(cè)算法,可有效應(yīng)對(duì)無人機(jī)巡檢光伏組件時(shí)效率和識(shí)別準(zhǔn)確率低的問題。但光伏面板缺陷檢測(cè)仍存在如下問題:1) 采集的圖像缺少多樣性,因光伏面板處于室外,受光照、雨水等因素的影響,其環(huán)境多變,而目前研究實(shí)驗(yàn)大多在單一場(chǎng)景下進(jìn)行,缺少不同場(chǎng)景下的檢測(cè)圖像,導(dǎo)致網(wǎng)絡(luò)泛化性能較低;2) 在實(shí)際部署中,攝像頭捕捉的光伏面板目標(biāo)大小不一,而距離較遠(yuǎn)的光伏面板目標(biāo)較小,神經(jīng)網(wǎng)絡(luò)對(duì)小目標(biāo)的檢測(cè)精度較低。
針對(duì)上述問題,本文提出一種基于特征重組和注意力機(jī)制的YOLOv5光伏面板缺陷檢測(cè)方法。通過改進(jìn)的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu),提高光伏面板的缺陷檢測(cè)精度。
1 改進(jìn)的YOLOv5網(wǎng)絡(luò)
YOLOv5網(wǎng)絡(luò)主要分為Backbone、Neck、Head三部分。針對(duì)YOLOv5網(wǎng)絡(luò)存在特征表達(dá)能力有限的問題,對(duì)其結(jié)構(gòu)進(jìn)行如下改進(jìn):1) 在Backbone部分引入注意力機(jī)制,使YOLOv5網(wǎng)絡(luò)能夠選擇性地關(guān)注圖像中更重要的信息;2) 在Neck部分引入感受野擴(kuò)展模塊(receptive field expansion module, RFEM),以提高網(wǎng)絡(luò)的特征感知能力;3) 用特征重組模塊(feature reorganization module, FRM)替換Head部分的Detect層,以增強(qiáng)網(wǎng)絡(luò)的檢測(cè)性能。改進(jìn)的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 改進(jìn)的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)
在改進(jìn)的YOLOv5網(wǎng)絡(luò)結(jié)構(gòu)中,快速空間池化金字塔(space pooling pyramid fast, SPPF)是一種多尺度的特征融合技術(shù)[8],可捕獲圖像中不同尺度和大小的信息,擴(kuò)大網(wǎng)絡(luò)的感知范圍,提高網(wǎng)絡(luò)理解圖像全局和局部信息的能力。
C3模塊采用跨階段連接的方式,將不同階段的特征進(jìn)行拼接,使網(wǎng)絡(luò)能夠跨層級(jí)傳遞信息,有效避免了梯度消失的問題,同時(shí)增強(qiáng)了網(wǎng)絡(luò)的表征能力。此外,C3模塊還具有特征重組功能。通過一層卷積支路和殘差塊支路對(duì)輸入進(jìn)行拼接,可生成更豐富和更具有表征能力的特征,幫助網(wǎng)絡(luò)更好地理解目標(biāo)的語義信息,提高檢測(cè)的準(zhǔn)確性和穩(wěn)定性。
Conv模塊由卷積層、BatchNorm和Sigmoid激活函數(shù)構(gòu)成。其中,BatchNorm能加快網(wǎng)絡(luò)的學(xué)習(xí)速度,并有效緩解梯度衰減或過沖的問題;Sigmoid激活函數(shù)提供了非線性的變換功能,增強(qiáng)了網(wǎng)絡(luò)的表征能力。
UpSample和concat分別表示上采樣和拼接操作。
1.1 注意力模塊
為了使網(wǎng)絡(luò)能夠選擇性地關(guān)注圖像中更重要的信息,提升網(wǎng)絡(luò)的表征能力和魯棒性,本文引入卷積注意力模塊(convolutional block attention module, CBAM)[9]和壓縮激勵(lì)模塊(squeeze-and-excitation block, SE-Block)[10]。
1.1.1 CBAM
CBAM結(jié)合了通道注意力和空間注意力機(jī)制,旨在增強(qiáng)網(wǎng)絡(luò)的特征表達(dá)能力,有助于網(wǎng)絡(luò)在卷積操作過程中更好地分類。YOLOv5網(wǎng)絡(luò)通過卷積運(yùn)算將淺層特征變?yōu)楦顚拥某橄筇卣鳎⑦@些抽象特征輸入到注意力模塊,使網(wǎng)絡(luò)聚焦于主要的抽象特征[9]。輸入被送到通道注意力模塊(channel attention module, CAM),可獲得通道注意力權(quán)重。先利用高速分叉路徑和通道注意力路徑提取關(guān)鍵特征,再把這些特征傳遞給空間注意力模塊(spatial attention module, SAM),以獲得空間注意力權(quán)重。利用高速分叉路徑和空間注意力路徑來提取特征,并將它們應(yīng)用于原始圖像上,可生成含有焦點(diǎn)信息的關(guān)鍵特征圖像。
在CAM中,首先,數(shù)據(jù)經(jīng)過最大池化和平均值聚合函數(shù)處理后,被多層感知機(jī)(multilayer perceptrons, MLP)的輸出覆蓋,并通過元素級(jí)別的相乘方式計(jì)算新的特征信息;然后,將S型曲線作為非線性轉(zhuǎn)換器,產(chǎn)生通道注意力特征的圖形表示形式。通道注意力機(jī)制可表示為
(1)
式中:F為輸入特征, 為 層對(duì)輸入的作用, 和 分別為對(duì)輸入進(jìn)行平均池化和最大池化操作, 和 分別為特征F經(jīng)過平均池化和最大池化操作后的輸出, 和 為組成 的兩個(gè)全連接層, 為Sigmoid函數(shù)對(duì)輸入的激活作用。
SAM用于捕捉特征圖在空間維度上的重要性,重新分配特征圖中不同空間位置的權(quán)重,使網(wǎng)絡(luò)更關(guān)注圖像的重要信息。
CBAM關(guān)注基于圖像的局部關(guān)系生成區(qū)域注意力的特性映射表征。與傳統(tǒng)的流向式處理方式相比,CBAM更注重捕捉有用的視覺元素位置,而非其流動(dòng)方向或路徑長度等屬性。為此,首先,在通道維度進(jìn)行平均池化和最大池化操作;然后,將它們生成的特征圖拼接起來;最后,將拼接后的特征圖輸入到濾波器,得到具有顯著性的空間注意力特征圖。記空間注意力函數(shù)為 ,則在通道維度上利用平均池化和最大池化操作產(chǎn)生的二維特征圖為
(2)
的計(jì)算公式為
(3)
1.1.2 SE-Block
SE-Block由壓縮和激勵(lì)兩個(gè)模塊組成。首先,對(duì)特征進(jìn)行擠壓操作,通過在主干結(jié)構(gòu)上添加特征映射來形成通道信息的表現(xiàn)形式,這種表現(xiàn)形式能夠?qū)⑼ǖ捞卣鞣从车娜址植技{入考慮范圍,使整個(gè)神經(jīng)網(wǎng)絡(luò)都能夠利用整體視野獲取的信息;然后,在激勵(lì)階段采用Sigmoid激活函數(shù):
(4)
式中: 為ReLU函數(shù), 、 ,z為激勵(lì)階段的輸入,W為可訓(xùn)練的參數(shù)。
為了增加模型的復(fù)雜性和靈活性,在下一次變換前,對(duì)濾波器響應(yīng)進(jìn)行擠壓和激勵(lì),重新校準(zhǔn)響應(yīng),
可有效提升模型性能。
1.2 RFEM
隨著網(wǎng)絡(luò)層數(shù)的增加,小目標(biāo)的局部語義可能會(huì)缺失,需要較大感受野的非局部上下文信息作為重要補(bǔ)充。為此,在Neck部分引入了RFEM。RFEM結(jié)構(gòu)如圖2所示。
x
RFEM計(jì)算過程可以用公式(5)~(8)表示:
式中: 為上一層獲得的特征圖; 為中間變量; 為 的擴(kuò)張卷積; 、 為 的擴(kuò)張卷積,擴(kuò)張速率分別為 、 ; 為 的標(biāo)準(zhǔn)卷積; 為通道拼接操作;P為輸出特征圖;RFEM結(jié)束處的 標(biāo)準(zhǔn)卷積用于調(diào)整輸出的特征映射通道; 為RFEM的輸出通道。
當(dāng) 和 的步幅為8,輸入圖像大小為640 × 640時(shí), 的分辨率為80 × 80。若 的感受野為1,則 的感受野分別擴(kuò)展為5、13、29、29。此時(shí) 的感受野幾乎覆蓋了 的一半,包含了足夠多的非局部信息。RFEM的密集連接金字塔結(jié)構(gòu)對(duì)原始感受野和不同擴(kuò)展感受野進(jìn)行疊加和重用,緩解了網(wǎng)格化問題。
1.3 FRM
FRM從網(wǎng)絡(luò)的不同層收集特征,并通過特征提取、特征融合、特征重組3個(gè)步驟重新組合這些特征,以形成更豐富的特征表示。本文利用FRM替換YOLOv5網(wǎng)絡(luò)Head部分的Detect層,以增強(qiáng)網(wǎng)絡(luò)對(duì)輸入不同尺寸特征圖的表征能力。
1.3.1 特征提取
對(duì)從Neck中獲得的特征圖 、 、 分別進(jìn)行上采樣、不做處理、下采樣操作,得到3個(gè)尺寸一致的特征圖 、 、 。
1.3.2 特征融合
將 、 、 輸入到兩條特征融合支路中進(jìn)行特征提取。采用通道注意力機(jī)制,即先對(duì)輸入圖像進(jìn)行最大池化和平均池化操作,再通過卷積運(yùn)算和ReLU激活函數(shù)處理得到特征映射 ,i表示上下兩條支路。在特征融合的另一條支路上,輸入圖像通過Softmax函數(shù)獲得特征圖中比較活躍的特征點(diǎn)。
1.3.3 特征重組
特征重組操作可表示為
(9)
通過特征重組操作融合了網(wǎng)絡(luò)的深層和淺層特征,有效改善了模型對(duì)小目標(biāo)的檢測(cè)性能。將融合后的特征圖輸入到Head部分的輸出層,用于預(yù)測(cè)對(duì)象的類別、邊界框坐標(biāo)和置信度。
2 實(shí)驗(yàn)
2.1 數(shù)據(jù)集構(gòu)建與預(yù)處理
為驗(yàn)證本文缺陷檢測(cè)方法的有效性,從roboflow上的“Broken Solar Panel Detection”、“clean-dirty solar Panel Computer Vision Project”、“Yeni Computer Vision Project”和“solar-panel1 Computer Vision Project”開源數(shù)據(jù)集中選出4 890幅光伏面板缺陷圖像,制作為實(shí)驗(yàn)數(shù)據(jù)集,圖像大小為640×640。這些圖像被標(biāo)注為正常(normal,951幅)、覆蓋(cover,1 320幅)、碎裂(crack,1 743幅)、塵土(dust,1 633幅)4種類型,并按7∶2∶1的比例劃分為訓(xùn)練集(3 423幅)、驗(yàn)證集(978幅)和測(cè)試集(489幅)。
在深度學(xué)習(xí)中,通常數(shù)據(jù)量越大,數(shù)據(jù)種類越多,訓(xùn)練的模型越準(zhǔn)確,泛化性能越好。但現(xiàn)實(shí)中少有方法可以獲得豐富多樣的圖像,且本實(shí)驗(yàn)數(shù)據(jù)集還存在不同類型的樣本數(shù)量不平衡的問題。為此,本文采用自適應(yīng)旋轉(zhuǎn)、隨機(jī)裁剪、直方圖均衡化等方法進(jìn)行數(shù)據(jù)增強(qiáng),以提高實(shí)驗(yàn)數(shù)據(jù)集的規(guī)模。
本實(shí)驗(yàn)優(yōu)化算法采用小批量梯度下降方法,初始學(xué)習(xí)率設(shè)置為0.01,最終循環(huán)的學(xué)習(xí)率設(shè)置為0.001。YOLOv5的損失函數(shù)由邊界框損失( )、分類損失( )、置信度損失( )三部分組成,總損失函數(shù)計(jì)算公式為
(10)
式中: 、 、 分別為邊界框損失、分類損失、置信度損失的權(quán)重。本實(shí)驗(yàn)設(shè)置 0.05, , 。
YOLOv5的邊界框損失函數(shù)用于衡量邊界框的交并比(intersection of union, IoU):
(11)
YOLOv5的邊界框損失函數(shù)的計(jì)算公式為
(12)
式中: 、 分別為預(yù)測(cè)框和真實(shí)目標(biāo)框的中心坐標(biāo), 為 與 的歐氏距離, 為預(yù)測(cè)框和真實(shí)目標(biāo)框的最小閉包區(qū)域的對(duì)角線距離。
YOLOv5的分類損失函數(shù)是二元交叉熵?fù)p失:
(13)
式中: 為二元標(biāo)簽值, 為預(yù)測(cè)為正樣本的概率。
YOLOv5的置信度損失包括有物體時(shí)的置信度損失和無物體時(shí)的置信度損失。其中,有物體時(shí)的置信度損失用于評(píng)估含有目標(biāo)邊界框的預(yù)測(cè)置信度的精確程度,如果模型提供的邊界框與真實(shí)目標(biāo)框交疊,那么該損失會(huì)激勵(lì)模型給出更高的置信度,若模型提供的邊界框并未覆蓋到真實(shí)目標(biāo)框,則該損失對(duì)過分自信的預(yù)測(cè)做出處罰,以提升模型識(shí)別目標(biāo)的能力;無物體時(shí)的置信度損失用于衡量模型預(yù)測(cè)邊界框覆蓋對(duì)象的程度,可增強(qiáng)模型捕捉目標(biāo)的效果。
2.2 評(píng)價(jià)指標(biāo)
本實(shí)驗(yàn)采用的評(píng)價(jià)指標(biāo)有準(zhǔn)確率(precision)、召回率(recall)、均值平均精度(mean average precision, mAP)。
準(zhǔn)確率是指正確預(yù)測(cè)為正樣本的樣本數(shù)與所有預(yù)測(cè)為正樣本的樣本數(shù)之比,計(jì)算公式為
(14)
式中: 為正確預(yù)測(cè)為正樣本的樣本數(shù), 為錯(cuò)誤預(yù)測(cè)為正樣本的樣本數(shù)。
召回率是指正確預(yù)測(cè)為正樣本的樣本數(shù)占所有實(shí)際正樣本的比例,能夠反映模型的漏檢狀況,計(jì)算公式為
(15)
式中: 為錯(cuò)誤預(yù)測(cè)為負(fù)樣本的樣本數(shù)。
mAP用于計(jì)算多類別的平均精度,而平均精度(AP)則表示不同類別的平均精度,其關(guān)系為
(16)
(17)
實(shí)驗(yàn)訓(xùn)練過程中,將計(jì)算置信度為0.5時(shí)的均值平均精度表示為 ,置信度為0.5~0.95時(shí)的均值平均精度表示為 。
2.3 實(shí)驗(yàn)過程
本實(shí)驗(yàn)采用小批量梯度下降的優(yōu)化算法,以及上文所述的損失函數(shù)進(jìn)行訓(xùn)練。訓(xùn)練集設(shè)置batchsize為16,圖像大小為640×640,每次訓(xùn)練100個(gè)epochs。
在本實(shí)驗(yàn)中,對(duì)YOLOv5s網(wǎng)絡(luò)的改進(jìn)(在Backbone部分引入CBAM或SE-Block;在Neck部分引入RFEM;在引入RFEM的同時(shí)添加CBAM或SE-Block)進(jìn)行消融實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表1所示。
由表1可以看出:YOLOv5s網(wǎng)絡(luò)引入CBAM或SE-Block后,準(zhǔn)確率和召回率有明顯提升,說明模型的正類預(yù)測(cè)準(zhǔn)確性、目標(biāo)的漏檢情況有所改善;引入RFEM后,mAP和準(zhǔn)確率都有所提升。綜上所述,在消融實(shí)驗(yàn)中,YOLOv5s網(wǎng)絡(luò)引入RFEM和CBAM的效果最好。
表1 消融實(shí)驗(yàn)
先利用FRM替換YOLOv5s網(wǎng)絡(luò)Head部分的Detect層,再分別引入CBAM、SE-Block及RFEM進(jìn)行對(duì)比實(shí)驗(yàn),實(shí)驗(yàn)結(jié)果如表2所示。
由表2可以看出,用FRM替換Head部分的Detect層后,準(zhǔn)確率和mAP均有明顯提升,其中引入RFEM后提升效果最為明顯,但召回率比替換前有所下降,這是因?yàn)樘卣髦亟M后,目標(biāo)識(shí)別能力雖然上升,但存在關(guān)鍵信息漏檢的情況。
利用FRM+RFEM模型對(duì)可見光圖像光伏面板的表面缺陷進(jìn)行檢測(cè),獲得的圖像目標(biāo)錨框和類別如圖3所示。
由圖3可知,本文提出的檢測(cè)方法能夠有效檢測(cè)出光伏面板的覆蓋(cover)、灰塵(dust)、破損(crock)等表面缺陷。
3 結(jié)論
本文基于YOLOv5網(wǎng)絡(luò)提出了光伏面板缺陷檢測(cè)方法。通過引入注意力機(jī)制,提升了網(wǎng)絡(luò)對(duì)缺陷目標(biāo)的聚焦和識(shí)別能力;引入RFEM,減少了因樣本本身或類內(nèi)差異大等問題導(dǎo)致的訓(xùn)練效果不佳的情況;引入FRM,提高了網(wǎng)絡(luò)對(duì)目標(biāo)位置的判斷能力,從而有效地提升了模型檢測(cè)的準(zhǔn)確率和精度。
?The author(s) 2024. This is an open access article under the CC BY-NC-ND 4.0 License (https://creativecommons.org/licenses/ by-nc-nd/4.0/)
參考文獻(xiàn)
[1] 劉玉淇,吳一全.基于機(jī)器視覺的太陽能電池片缺陷檢測(cè)算法綜述[J].光學(xué)精密工程,2024,32(6):868-900.
[2] 沈凌云,張潔,孫甲云,等.基于改進(jìn)Alexnet模型的光伏電池片瑕疵分類方法[J].自動(dòng)化與信息工程,2022,43(4):42-47.
[3] 汪方斌,李文豪.基于改進(jìn)輕量化U-Net模型的光伏電池EL圖像缺陷檢測(cè)[J].電子測(cè)量技術(shù),2024,47(5):102-111.
[4] 呂瀟涵.基于改進(jìn)Vision Transformer的光伏電池缺陷識(shí)別研究[J].計(jì)算技術(shù)與自動(dòng)化,2023,42(4):33-40.
[5] 陳海永,史世杰.基于歸一化控制器的光伏圖像無監(jiān)督域適應(yīng)缺陷檢測(cè)[J].太陽能學(xué)報(bào),2024,45(7):540-547.
[6] 陶志勇,何燕,林森,等.局部和全局特征融合的太陽能電池片表面缺陷檢測(cè)[J].光電工程,2024,51(1):93-107.
[7] 艾上美,周劍峰,張必朝,等.基于改進(jìn)SSD算法的光伏組件缺陷檢測(cè)研究[J].智慧電力,2023,51(12):53-58.
[8] HE K, ZHANG X, REN S, et al. Spatial pyramid pooling in deep convolutional networks for visual recognition[J]. IEEE Trans-actions on Pattern Analysis and Machine Intelligence, 2015, 37(9):1904-1916.
[9] WOO S, PARK J, LEE J Y, et al. CBAM: Convolutional block attention module[C]. Proceedings of the European Conference on Computer Vision (ECCV), 2018:3-19.
[10] HU J, SHEN L, SUN G. Squeeze-and-excitation networks[C]. Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition(CVPR), 2018:7132-7141.
作者簡(jiǎn)介:
武果,男,1984年生,本科,工程師,主要研究方向:電子電路、工業(yè)自動(dòng)化、光機(jī)電一體化。E-mail: 312830590@163.com
高守正,男,2001年生,本科,主要研究方向:圖像處理、目標(biāo)檢測(cè)方法。E-mail: 1213449232@qq.com
張德福(通信作者),男,1967年生,本科,高級(jí)工程師,主要研究方向:機(jī)器人系統(tǒng)集成與應(yīng)用、智能裝備設(shè)計(jì)研發(fā)。E-mail: 13760841878@163.com
肖國龍,男,1965年生,碩士研究生,高級(jí)工程師,主要研究方向:電路、信號(hào)信息系統(tǒng)。E-mail: jxdrui@giet.ac.cn
龔正平,男,1972年生,本科,高級(jí)工程師,主要研究方向:工業(yè)電氣自動(dòng)化、儀器儀表技術(shù)。E-mail: zpjiong@giet.ac.cn
覃健,男,1992年生,本科,主要研究方向:設(shè)備自動(dòng)化、視覺檢測(cè)、軟件開發(fā)。E-mail: qinjian@giet.ac.cn