蔡緒明,王文武
(1.中石化石油機(jī)械股份有限公司沙市鋼管分公司,荊州 434001;2.武漢科技大學(xué)信息科學(xué)與工程學(xué)院,武漢 430081)
鋼管廣泛應(yīng)用于石油、化工、天然氣、頁(yè)巖氣傳輸?shù)雀呶8邏旱膱?chǎng)景,如果鋼管焊接處存在某種缺陷,則可能導(dǎo)致嚴(yán)重事故,因此鋼管焊縫缺陷檢測(cè)在實(shí)際作業(yè)中具有重要意義。隨著中國(guó)市場(chǎng)對(duì)鋼管的需求量的不斷增長(zhǎng),越來(lái)越多的企業(yè)、甚至國(guó)家都開始重視鋼管焊接的質(zhì)量,鋼管焊縫缺陷檢測(cè)和評(píng)價(jià)技術(shù)也成為科研工作者熱衷的研究課題。當(dāng)前X光無(wú)損探傷(non-destructive testing,NDT)是工業(yè)無(wú)損檢測(cè)的主要方法之一,其檢測(cè)結(jié)果已作為焊縫缺陷分析和質(zhì)量評(píng)定的重要判定依據(jù)。NDT檢測(cè)能有效地檢測(cè)出鋼管焊接過(guò)程中可能存在的缺陷,但還是離不開人工的參與來(lái)確定鋼管焊縫缺陷的類型和位置[1]。因此,研究鋼管焊縫缺陷智能檢測(cè)和識(shí)別方法能有效提高檢測(cè)效率和推動(dòng)工業(yè)自動(dòng)化的發(fā)展。
鋼管焊縫的缺陷通常獨(dú)立于焊縫背景,適合采用計(jì)算機(jī)視覺(jué)領(lǐng)域中的目標(biāo)檢測(cè)技術(shù)以實(shí)現(xiàn)缺陷的自動(dòng)化檢測(cè)和識(shí)別。在之前的工作中大多使用傳統(tǒng)的計(jì)算機(jī)視覺(jué)的方法做鋼管焊縫缺陷檢測(cè)[1]。WANG等[2]使用多閾值支撐向量機(jī)(support vector machine,SVM)的方法對(duì)鋼管焊縫裂紋的X光圖像檢測(cè)的準(zhǔn)確率達(dá)到了96.15%;MALARVEL[5]用固定閾值分割結(jié)合多類支撐向量機(jī)(multi-class support vector machine,MSVM)的方法對(duì)X射線圖像的焊縫缺陷實(shí)現(xiàn)了多分類檢測(cè),并且準(zhǔn)確率達(dá)到了95.23%。如今隨著基于深度學(xué)習(xí)的目標(biāo)檢測(cè)算法不斷發(fā)展[5],識(shí)別準(zhǔn)確率和檢測(cè)時(shí)間相比于傳統(tǒng)的計(jì)算機(jī)視覺(jué)方法有了很大的提升。已有研究將基于深度網(wǎng)絡(luò)的模型應(yīng)用于鋼管焊縫缺陷的檢測(cè),且取得了不錯(cuò)的效果,但仍然存在一些不足,比如:①準(zhǔn)確率有待進(jìn)一步提升;②缺陷類型單一,難以應(yīng)用至工業(yè)領(lǐng)域;③檢測(cè)時(shí)間過(guò)長(zhǎng),不能做到實(shí)時(shí)檢測(cè)。本論文針對(duì)以上問(wèn)題,先對(duì)輸入X光圖像去模糊處理,其次嘗試將動(dòng)態(tài)區(qū)域感知卷積,高效的特征融合機(jī)制和可學(xué)習(xí)權(quán)重參數(shù)檢測(cè)頭技術(shù)引入到業(yè)界領(lǐng)先的YOLOv5算法中,并應(yīng)用于鋼管焊縫缺陷檢測(cè)任務(wù),并取得了一定的成果。
YOLOv5是在YOLO系列算法[6-10]基礎(chǔ)上改進(jìn)后提出的,根據(jù)模型參數(shù)規(guī)模分為YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x四個(gè)版本,依次參數(shù)量越大,精度越高,單張圖片的檢測(cè)越慢。YOLOv5的網(wǎng)絡(luò)結(jié)構(gòu)由輸入端、Backbone特征提取網(wǎng)絡(luò)、Neck中間層和Prediction輸出層4個(gè)部分。
YOLOv5輸入端使用Mosaic數(shù)據(jù)增強(qiáng),自適應(yīng)錨框計(jì)算與自適應(yīng)圖片縮放方法提升模型的訓(xùn)練速度和網(wǎng)絡(luò)的精度。Mosaic數(shù)據(jù)增強(qiáng)對(duì)4張圖片進(jìn)行隨機(jī)裁剪,隨機(jī)排列和隨機(jī)縮放的方式拼接得到一張新圖,同時(shí)將標(biāo)注的目標(biāo)框映射到新圖送入網(wǎng)絡(luò)進(jìn)行訓(xùn)練。該方法一次讀入4張圖片,豐富了檢測(cè)物體的背景,減小了對(duì)batch size的依賴。在早期YOLO系列算法針對(duì)不同的目標(biāo)和數(shù)據(jù)集,通過(guò)單獨(dú)的程序回歸出特定長(zhǎng)寬的初始錨點(diǎn)框,YOLOv5訓(xùn)練程序根據(jù)數(shù)據(jù)集自適應(yīng)的計(jì)算出最佳的錨點(diǎn)框。在目標(biāo)檢測(cè)算法中將原始圖片統(tǒng)一縮放到一個(gè)標(biāo)準(zhǔn)尺寸,再送入檢測(cè)網(wǎng)絡(luò)中。很多圖片長(zhǎng)寬比不同,縮放填充之后,兩端的黑邊大小不相同,如果填充過(guò)多,會(huì)存在大量的信息冗余。YOLOv5中采用一種自適應(yīng)的添加最少的黑邊到縮放之后的圖片中,進(jìn)一步提高了推理速度。
YOLOv5的Backbone 網(wǎng)絡(luò)主要由Focus、CBS、BottleneckCSP和SPP等模塊組成。Focus對(duì)圖片進(jìn)行切片操作,實(shí)現(xiàn)下采樣功能,減少計(jì)算量,加快計(jì)算速度。CBS的功主要功能為卷積,獲取特征。CSPNet[11]的作者認(rèn)為推理計(jì)算過(guò)高的問(wèn)題是由于網(wǎng)絡(luò)優(yōu)化中的梯度信息重復(fù)導(dǎo)致的,CSP模塊先將基礎(chǔ)層的特征映射劃分為兩部分,然后通過(guò)跨階段層次結(jié)構(gòu)將它們合并,在減少了計(jì)算量的同時(shí)可以保證準(zhǔn)確率。圖像進(jìn)入BottleneckCSP[12]結(jié)構(gòu)后分為兩條支路,第一條將輸入圖像進(jìn)行Bottleneck操作,降低輸入圖像的維度,另一條將輸入圖像按照網(wǎng)絡(luò)結(jié)構(gòu)不斷進(jìn)行Bottleneck,保證輸入和輸出的圖像大小保持不變,最終得到所有層的輸出,將所有輸出拼接再進(jìn)行1×1的卷積減少輸出通道數(shù)得到最終的輸出。
YOLOv5的Neck和YOLOv4中一樣,都采用FPN+PAN的結(jié)構(gòu)。FPN使用自頂向下的側(cè)邊連接,在所有尺度上構(gòu)建出基于特征金字塔的高級(jí)語(yǔ)義特征圖;FPN中間經(jīng)過(guò)多層的網(wǎng)絡(luò)后,底層的目標(biāo)信息非常模糊,因此PAN加入了自底向上的路線,彌補(bǔ)并加強(qiáng)了目標(biāo)的定位信息。YOLOv5的輸出端包括損失函數(shù)(分類損失、目標(biāo)置信度損失和定位損失)、邊界框計(jì)算和目標(biāo)高寬比匹配3部分。
輸入圖像預(yù)處理模塊包括去運(yùn)動(dòng)模糊和數(shù)據(jù)增強(qiáng)3部分。
2.1.1 去除運(yùn)動(dòng)模糊
當(dāng)圓柱型的鋼管在流水線上旋轉(zhuǎn)時(shí),用于拍攝鋼管焊縫缺陷X光攝像機(jī)和鋼管在焊縫的方向上會(huì)有相對(duì)運(yùn)動(dòng),所以當(dāng)攝像機(jī)拍攝焊縫缺陷時(shí)會(huì)產(chǎn)生運(yùn)動(dòng)模糊。根據(jù)KUPYN等[13]的研究,運(yùn)動(dòng)模糊會(huì)對(duì)YOLO系列的目標(biāo)檢測(cè)算法產(chǎn)生精度上的影響,所以有必要將有些圖片中的運(yùn)動(dòng)模糊去除。運(yùn)動(dòng)模糊去除的過(guò)程如圖1所示。首先,本文用霍夫變換將缺陷邊緣的直線檢測(cè)出來(lái),由直線的角度可以估計(jì)鋼管運(yùn)動(dòng)的方向(也就是圖片模糊的角度);然后,本文使用估計(jì)的模糊核對(duì)原始的模糊圖像進(jìn)行反卷積操作得到圖1c的結(jié)果。
(a) 原始模糊圖像 (b) Hough直線檢測(cè)結(jié)果 (c) 去模糊結(jié)果
2.1.2 數(shù)據(jù)增強(qiáng)
卷積神經(jīng)網(wǎng)絡(luò)往往需要大量的訓(xùn)練樣本才能有效提取圖像特征并分類,為了有效提升數(shù)據(jù)質(zhì)量、增加數(shù)據(jù)特征多樣性。本文使用明暗變化,隨機(jī)旋轉(zhuǎn),隨機(jī)減去,添加高斯噪聲,水平翻轉(zhuǎn),飽和度、對(duì)比度、銳度隨機(jī)調(diào)整,長(zhǎng)寬比變化及隨機(jī)裁剪將原始數(shù)據(jù)增強(qiáng)到原來(lái)的3倍。從而有效地減少了訓(xùn)練階段的過(guò)擬合,提升網(wǎng)絡(luò)的泛化能力。
傳統(tǒng)的卷積操作在空間域進(jìn)行權(quán)值共享,在全局區(qū)域通過(guò)增加卷積的數(shù)量來(lái)獲取更豐富的信息,這樣既增大了計(jì)算量,又帶來(lái)網(wǎng)絡(luò)優(yōu)化困難。局部卷積在不同的像素位置使用不同的權(quán)值,高效地提取豐富的信息,但是破壞了平移不變性,帶來(lái)與特征圖大小相關(guān)的大量參數(shù)。動(dòng)態(tài)區(qū)域感知卷積[14]先使用可學(xué)習(xí)的引導(dǎo)掩模將特征圖中的像素劃分為不同的區(qū)域,然后使用卷積核生成模塊針對(duì)不同的區(qū)域動(dòng)態(tài)生成對(duì)應(yīng)的卷積核。如圖2所示,引導(dǎo)掩模中不同顏色區(qū)域?yàn)椴煌瑓^(qū)域,G(X)為生成的卷積核。相較于標(biāo)準(zhǔn)卷積,動(dòng)態(tài)區(qū)域感知卷積在保持計(jì)算量的基礎(chǔ)上,增加了卷積的表征能力;同時(shí)相對(duì)于局部卷積,減少參數(shù)量的同時(shí),仍然保持局部卷積的表征能力。
圖2 m個(gè)卷積核大小為k×k的動(dòng)態(tài)區(qū)域感知卷積示意圖
2.2.1 可學(xué)習(xí)的引導(dǎo)掩模
圖3 可學(xué)習(xí)引導(dǎo)掩模示意圖
(1)
在獲得可學(xué)習(xí)的引導(dǎo)掩模過(guò)程中進(jìn)行式的argmax(·)操作,該操作不可導(dǎo),導(dǎo)致梯度不能進(jìn)行反向傳播。Mu,v具有[0,0,1,0,0]的one-hot形式,利用式近似引導(dǎo)掩模中的argmax(·)操作,實(shí)現(xiàn)梯度傳播。
(2)
2.2.2 卷積核動(dòng)態(tài)生成模塊
動(dòng)態(tài)區(qū)域感知卷積[14]另外一個(gè)重要結(jié)構(gòu)為卷積核動(dòng)態(tài)生成模塊,可學(xué)習(xí)的引導(dǎo)掩模先將特征圖中的像素劃分為不同的區(qū)域,然后使用卷積核生成模塊針對(duì)不同的區(qū)域動(dòng)態(tài)生成對(duì)應(yīng)的卷積核。卷積核動(dòng)態(tài)生成模塊如圖4所示,先對(duì)維度為U*V*C的輸入特征圖X進(jìn)行自適應(yīng)平均池化,得到K*K*C的特征圖,然后通過(guò)1×1的卷積,sigmoid激活得到K*K*m2的特征圖,再將特征圖均分成m組,每組進(jìn)行1×1的卷積,最后得到對(duì)應(yīng)的m個(gè)區(qū)域的卷積核。
圖4 卷積核動(dòng)態(tài)生成模塊示意圖
在檢測(cè)頭引入自適應(yīng)空間特征融合(adaptively spatial feature fusion,ASFF)[15],在FPN將各層特征相加的基礎(chǔ)上,引入可學(xué)習(xí)權(quán)重參數(shù),實(shí)現(xiàn)檢測(cè)頭中的特征自適應(yīng)融合。以融合后特征ASFF-3為例:N1、N2和N3分別來(lái)自對(duì)應(yīng)尺度RFF輸出的特征,與來(lái)自不同層的特征乘上權(quán)重參數(shù)α、β和γ后相加求和,得到新的融合特征。權(quán)重參數(shù)α、β和γ通過(guò)對(duì)相應(yīng)N1、N2和N3應(yīng)用1×1卷積獲得,并通過(guò)網(wǎng)絡(luò)反向傳播進(jìn)行學(xué)習(xí)。ASFF能夠在空間上過(guò)濾沖突信息以抑制梯度反傳時(shí)不一致,實(shí)現(xiàn)融合特征的比例自適應(yīng)變化,同時(shí)降低推理開銷。
一般來(lái)說(shuō),特征融合技術(shù)是當(dāng)前目標(biāo)檢測(cè)網(wǎng)絡(luò)中必備的模塊,用于融合主干模塊輸出的多尺度特征。簡(jiǎn)單來(lái)說(shuō),其作用是將低層級(jí)特征中的細(xì)節(jié)信息補(bǔ)充到高層級(jí)特征中,同時(shí)將高層級(jí)特征中的語(yǔ)義信息注入低層級(jí)特征中。然而,現(xiàn)有的特征融合模型存在融合準(zhǔn)則過(guò)于簡(jiǎn)單的問(wèn)題,難以從原理上分析不同層級(jí)中哪些有用的信息在融合過(guò)程中進(jìn)行了交互。本文引入高效特征金字塔(efficient feature aggregation-FPN,EFA-FPN),提出了一個(gè)基于加權(quán)注意機(jī)制的全局特征聚合模塊。在每個(gè)尺度上,首先通過(guò)整合上下文特征和那些跨尺度的抽象特征獲得一個(gè)自適應(yīng)的權(quán)重圖。該權(quán)重生成過(guò)程以一種原理上可解釋的方式很好地聚合了精細(xì)和粗略的特征。圖5為提出的高效特征融合模型框圖。
圖5 特征融合模塊示意圖
圖5中,Ci為主干網(wǎng)絡(luò)第i個(gè)尺度輸出的特征。Fi為通過(guò)一個(gè)1×1的卷積層將Ci的通道數(shù)進(jìn)行縮減的結(jié)果。由于從主干網(wǎng)中提取的特征本身具有不同的屬性,包括尺度和語(yǔ)義層次,因此基于FPN的方法通常致力于設(shè)計(jì)合理的聚合標(biāo)準(zhǔn)來(lái)以最佳方式處理這些屬性,提高輸入特征的表示能力。同樣,在第階段,本文提出的豐富特征聚合模塊(rich feature fusion,RFF)利用具有不同屬性的特征圖來(lái)生成富含上下文的特征Ni,即Fi的優(yōu)化特征圖。同時(shí),本研究還從RFF中提取一個(gè)輔助特征圖Ni*,為第i階段的特征聚合提供豐富的特征信息。需要注意的是,本文精心設(shè)計(jì)了不同尺度之間的特征交互準(zhǔn)則,以充分考慮從不同層提取的特征的特點(diǎn)。即RFF的輸入在每個(gè)階段都有不同的特征融合路徑。
為了捕捉來(lái)自多個(gè)階段的全局信息,RFF的職責(zé)是雙重的:①通過(guò)融合不同屬性的特征來(lái)優(yōu)化當(dāng)前階段的特征;②同時(shí)為下一階段的另一個(gè)全局特征聚合模塊提供輔助信息。為了有效地利用具有不同屬性的特征,本文使用分組卷積來(lái)生成每個(gè)特征圖的特征權(quán)重表示,RFF用它來(lái)使金字塔的特征連接得更緊密。在不同尺度的特征圖之間,RFF上的輸入是不同的。以附屬于F5的RFF為例,其實(shí)現(xiàn)細(xì)節(jié)如圖6所示。
圖6 以附屬于F5的RFF為例,其輸入特征結(jié)構(gòu)圖
(3)
式中:Fi是用來(lái)優(yōu)化Fi的權(quán)重,fC是通道串聯(lián)操作,[·]g1×1,g3×3是分組卷積操作。最后,空間權(quán)重要經(jīng)過(guò)非局部運(yùn)算,用來(lái)學(xué)習(xí)不同尺度的特征圖之間的像素的位置關(guān)系。本文采用的非局部(non local,NL)操作如圖7所示。
圖7 非局部操作流程圖
由于NL操作協(xié)調(diào)了整個(gè)空間中特征之間的相關(guān)信息,本文把它作為一個(gè)全局表示Ni*來(lái)解決兩個(gè)任務(wù)。一方面,它為其他階段的特征聚合提供輔助信息。另一方面,Ni*在第i階段被進(jìn)一步用來(lái)增強(qiáng)原始的降維輸出,從而得到優(yōu)化的特征Ni,它將取代Fi用于檢測(cè)。
與F5生成的過(guò)程類似,式(4)分別描述了RFF在處理其他尺度特征時(shí)的融合路徑。
(4)
本文改進(jìn)的YOLOV5模型訓(xùn)練硬件配置為:Intel Xeon Silver 4210R、運(yùn)行內(nèi)存64 GB、顯卡型號(hào)為NVIDIA GeForce RTX 3090、顯存24 GB。軟件環(huán)境為:操作系統(tǒng)Linux-5.4.0、深度學(xué)習(xí)框架Pytorch 1.80、CUDA11.1。YOLOV5網(wǎng)絡(luò)模型訓(xùn)練時(shí),特征提取網(wǎng)絡(luò)初始權(quán)重采用ImageNet上預(yù)訓(xùn)練好的模型參數(shù),參數(shù)優(yōu)化算法為自適應(yīng)矩估計(jì)。具體的參數(shù)設(shè)置為:批處理數(shù)設(shè)為4,衰減系數(shù)為0.000 5,總訓(xùn)練次數(shù)為2000個(gè)世代,學(xué)習(xí)率采用warmup優(yōu)化方法:在0~50個(gè)世代期間,學(xué)習(xí)率為0.001;在51~1200個(gè)世代期間,學(xué)習(xí)率為0.01;在1201~2000個(gè)世代期間,學(xué)習(xí)率為0.002。
本文試驗(yàn)樣本從某鋼管廠車間,收集了5000張包含各類缺陷的鋼管焊縫靜態(tài)DR圖像,圖像大小為1024×1024,DR平板為某公司PaxScan1313DX。焊縫缺陷包括裂紋、未焊透、未熔合、咬邊、氣孔等。用LabelImg軟件對(duì)圖像進(jìn)行手工標(biāo)注;然后對(duì)圖像進(jìn)行適當(dāng)增廣,隨機(jī)對(duì)圖像進(jìn)行對(duì)比度、亮度變換、變換,水平,垂直反轉(zhuǎn),最終圖像擴(kuò)充至15 000張。將上述數(shù)據(jù)集隨機(jī)分為3組,訓(xùn)練集10 500張,驗(yàn)證集1500,測(cè)試集3000張。
3.3.1 定性結(jié)果與分析
對(duì)改進(jìn)前后的YOLOV5網(wǎng)絡(luò)模型(都選用YOLOv5s網(wǎng)絡(luò))分別進(jìn)行訓(xùn)練和測(cè)試,主要評(píng)價(jià)使用模板檢測(cè)模型中常用的每秒處理幀數(shù)(frame per second,FPS)、 平均缺陷的(average precision,AP)和平均精度均值(mean average precision,mAP)。FPS數(shù)值越大,代表檢測(cè)的速度越快,AP值為P-R曲線包圍的面積,mAP為所有類別AP值的均值,mAP值越高意味著目標(biāo)檢測(cè)的準(zhǔn)確度越高。改進(jìn)YOLOv5算法對(duì)各類缺陷檢測(cè)結(jié)果如圖8所示。
(a) 氣孔 (b) 咬邊
(c) 裂紋 (d) 未熔合
3.3.2 定量結(jié)果與分析
在3000張測(cè)試集上,將原始YOLOv5與改進(jìn)YOLOv5算法進(jìn)行對(duì)比測(cè)試,檢測(cè)結(jié)果如表1所示。
表1 改進(jìn)YOLOv5與原始YOLOv5對(duì)比結(jié)果
由表1可以看出,改進(jìn)YOLOv5算法由于增加了部分模塊,檢測(cè)速度雖然從32.2 fps下降到27.5 fps,但是檢測(cè)速度仍然達(dá)到實(shí)時(shí)檢測(cè)水平。原始YOLOv5算法表現(xiàn)相對(duì)較差的未焊透、未熔合和夾渣缺陷,共同特點(diǎn)是缺陷部位不太顯著,在改進(jìn)YOLOv5算法中增加了去模糊圖像增強(qiáng)算法后,檢測(cè)精度取得了相對(duì)較大的提高。通過(guò)引入動(dòng)態(tài)區(qū)域感知卷積和改進(jìn)檢測(cè)頭模塊,算法模型提取各類缺陷的特征能力進(jìn)一步增強(qiáng),檢測(cè)進(jìn)度有2~3個(gè)百分點(diǎn)的提高。最終改進(jìn)YOLOv5算法的mAP達(dá)到94.6%,基本滿足實(shí)用需求。
3.3.3 消融實(shí)驗(yàn)分析
同上小節(jié)實(shí)驗(yàn)配置相同,這里針對(duì)本文中對(duì)YOLOv5進(jìn)行的改進(jìn)進(jìn)行了消融實(shí)驗(yàn),具體實(shí)驗(yàn)結(jié)果如表2所示。
表2 改進(jìn)YOLOv5中各項(xiàng)模塊對(duì)于最終性能的貢獻(xiàn)
其中,DRConv表示主干網(wǎng)絡(luò)中引入動(dòng)態(tài)區(qū)域感知卷積;EFA-FPN表示采用本文中引入的高效特征金字塔替代原始YOLOv5中基于CSP的FPN模塊;ASFF為引入的自適應(yīng)空間特征融檢測(cè)頭。
表2的結(jié)果顯示了本文采用的改進(jìn)方法均能夠一致提高原有YOLOv5的檢測(cè)性能。同時(shí)也注意到,采用的高效特征金字塔在3個(gè)改進(jìn)中對(duì)檢測(cè)性能的提升最大。
本文以工業(yè)生產(chǎn)場(chǎng)景下的鋼管焊縫缺陷實(shí)時(shí)檢測(cè)為研究對(duì)象,提出一種改進(jìn)的YOLOv5鋼管焊縫缺陷檢測(cè)算法,實(shí)現(xiàn)了焊縫缺陷自動(dòng)檢測(cè)。本文結(jié)合數(shù)字DR圖像的特點(diǎn),對(duì)原始YOLOv5算法進(jìn)行了輸入圖像增強(qiáng),引入動(dòng)態(tài)區(qū)域感知卷積和改進(jìn)檢測(cè)頭模塊3方面的改進(jìn)。在訓(xùn)練階段,采用Mosaic數(shù)據(jù)增強(qiáng)方法,增加了訓(xùn)練數(shù)據(jù)集的規(guī)模,有效得減少了訓(xùn)練的過(guò)擬合。從實(shí)驗(yàn)結(jié)果看,圖像中對(duì)比度不太顯著的缺陷類別,經(jīng)過(guò)圖像增強(qiáng)算法后,檢測(cè)精度的提高較明顯,AP值從85.5%增大到91.3%。引入動(dòng)態(tài)區(qū)域感知卷積、高效特征金字塔和改進(jìn)檢測(cè)頭模塊,進(jìn)一步提高了檢測(cè)網(wǎng)絡(luò)提取缺陷特征的能力,各類缺陷的mAP值從91.3%提高到94.6%,基本達(dá)到實(shí)用的要求。在測(cè)試過(guò)程中發(fā)現(xiàn)當(dāng)前算法對(duì)兩類缺陷表現(xiàn)相對(duì)較差:特別小的目標(biāo)和由系列小目標(biāo)隨機(jī)組合構(gòu)成而成的缺陷,比如疏松缺陷由大量小氣孔隨機(jī)組合而成,提高這兩類缺陷的檢測(cè)率是下一步研究的重點(diǎn)。