費佳杰 李宏勝 任飛 吳敏寧 王光榮
摘? 要:加工而成的鋼材表面可能會存在一定的缺陷,對鋼材的外觀和質(zhì)量造成嚴重的影響,這些缺陷可以通過多種方法來完成分類和分割。傳統(tǒng)檢測方法精度不高且效率低下,采用基于深度學習的鋼表面缺陷檢測方法可有效提高檢測性能。文章總結了近年來諸多學者提出的基于深度學習的缺陷分類和分割方法,介紹了這些算法的特點以及基于這些算法得到的改進算法,并對各類算法進行了比較,得出各種算法的優(yōu)缺點。最后,總結了現(xiàn)階段基于深度學習的缺陷檢測技術存在的問題,并對未來的發(fā)展進行了展望。
關鍵詞:缺陷檢測;深度學習;目標檢測;卷積神經(jīng)網(wǎng)絡;缺陷分類
中圖分類號:TP391? ? ? ? 文獻標識碼:A? 文章編號:2096-4706(2023)19-0107-06
Overview of Steel Surface Defect Detection Methods Based on Deep Learning
FEI Jiajie1, LI Hongsheng1, REN Fei2, WU Minning3, WANG Guangrong2
(1.School of Automation, Nanjing Institute of Technology, Nanjing? 211167, China; 2.Digital Intelligent Mine Research Institute/Artificial Intelligence Research Institute, Sinoma (Nanjing) Mining Research Institute Co., Ltd., Nanjing? 210000, China;
3.School of Information Engineering, Yulin University, Yulin? 719000, China)
Abstract: The surface of processed steel may have certain defects that seriously affect the appearance and quality of the steel. These defects can be classified and segmented through various methods. Traditional detection methods have low accuracy and efficiency, and using deep learning-based steel surface defect detection methods can effectively improve detection performance. This paper summarizes the defect classification and segmentation methods based on deep learning proposed by many scholars in recent years, introduces the characteristics of these algorithms and the improved algorithms based on these algorithms, and compares various algorithms to identify their advantages and disadvantages. Finally, the existing problems of defect detection technology based on deep learning at the current stage are summarized, and the future development is prospected.
Keywords: defect detection; deep learning; object detection; convolutional neural network; defect classification
0? 引? 言
近年來,我國正處于從制造業(yè)大國向制造業(yè)強國轉變的過渡時期,而鋼鐵行業(yè)是我國較為重要的原材料行業(yè)之一。鋼鐵產(chǎn)品被廣泛應用于航空航天、機械、船舶、汽車和建筑等各類行業(yè)中[1]。鋼鐵作為原材料在上述行業(yè)中發(fā)揮著重要作用,若鋼鐵的質(zhì)量存在問題可能會導致整個產(chǎn)品存在質(zhì)量缺陷,因此鋼鐵產(chǎn)品的質(zhì)量檢測就顯得愈發(fā)重要。鋼鐵表面缺陷檢測屬于鋼鐵質(zhì)量檢測的一個方面。鋼鐵表面的缺陷類型大致分為裂紋、刮傷、重皮和氣泡等[2]。這幾類缺陷中,有的缺陷人眼較難分辨識別;有的缺陷雖可通過人眼分辨,但大批量生產(chǎn)過程中的人工檢測會消耗大量的人力,且檢測質(zhì)量不穩(wěn)定。因此通過計算機圖像智能識別來完成鋼鐵產(chǎn)品的表面缺陷檢測就成為一種有效的方法。
隨著人工智能的迅速發(fā)展,深度學習被廣泛應用于分類、分割及跟蹤等圖像處理任務中,鋼材缺陷檢測也是其中之一。運用合適的神經(jīng)網(wǎng)絡算法完成鋼材表面的缺陷檢測,既能滿足對檢測精度的要求,還能提高檢測的實時性、穩(wěn)定性,另外還能降低成本。已有許多學者將深度學習應用到鋼表面缺陷檢測技術之中并取得了較好的檢測效果。利用深度學習完成缺陷檢測的結果如圖1所示,圖像中用矩形框標出缺陷所在位置,并在框上方標注判斷的缺陷類型以及對應的置信度。
1? 鋼表面缺陷檢測數(shù)據(jù)集
目前,鋼表面缺陷檢測方面的數(shù)據(jù)集較少,部分數(shù)據(jù)集包含的樣本數(shù)據(jù)更是有限。下面對兩個具有代表性的鋼表面缺陷檢測的數(shù)據(jù)集進行介紹。
1.1? 謝韋爾公司提供的帶鋼缺陷數(shù)據(jù)集
該數(shù)據(jù)集包含12 568張數(shù)據(jù)樣本,數(shù)據(jù)樣本大小為1 600×256,涉及四種缺陷,且含有缺陷的樣本中可能存在1~4種缺陷。該數(shù)據(jù)集被用于Kaggle比賽中。
1.2? 東北大學提供的NEU-DET數(shù)據(jù)集
該數(shù)據(jù)集包含1 800張數(shù)據(jù)樣本,涉及六種缺陷,每種缺陷有300張樣本。該數(shù)據(jù)集是時下最為熱門的鋼表面缺陷檢測數(shù)據(jù)集,被大量學者用來訓練算法模型,具有很好的代表性。
上述兩個數(shù)據(jù)集是鋼表面缺陷檢測領域很有代表性的數(shù)據(jù)集。謝韋爾帶鋼表面缺陷檢測數(shù)據(jù)集含有更多的數(shù)據(jù)樣本,對模型訓練較為有利,但同時對計算機硬件的要求也很高。相形之下,東北大學所提供數(shù)據(jù)集的樣本數(shù)量較少,包含的缺陷類型更多。這兩個數(shù)據(jù)集各有優(yōu)缺點,缺陷描述也有所不同。
2? 基于深度學習的缺陷分類算法
基于深度學習的缺陷檢測算法主要是利用目標檢測算法來完成鋼材表面的缺陷檢測,可以完成對目標圖片中缺陷的分類及定位。截至目前,常見基于深度學習的缺陷檢測算法可分為兩類:第一類算法是兩階段檢測算法[3],該算法需要先得到候選框,再對候選框中的目標做進一步的定位及分類(此類算法以FasterR-CNN最具代表性);第二類算法是單階段檢測算法[4],該算法可直接生成缺陷目標的位置信息、分類信息及其對應概率,省去了獲得候選框的過程(此類算法以YOLO算法和SSD算法最具代表性)。兩階段檢測算法可以得到更高的檢測精度,而單階段檢測算法在犧牲部分檢測精度的同時贏得了更快的檢測速度。
2.1? CNN算法
在深度學習中,CNN(卷積神經(jīng)網(wǎng)絡)算法[5]被率先提出,用來替代由人工提取特征的傳統(tǒng)機器學習,可以通過計算機提取圖片中的特征并對圖片中的信息進行分類。CNN算法主要通過卷積計算層來提取圖片中的特征信息;激活函數(shù)可以幫助解決非線性問題;通過池化(Pooling)減小模型的參數(shù),提高算法的速度,防止模型算法過擬合現(xiàn)象的出現(xiàn);最后使用全連接層(Fully Connected Layers, FC)完成圖片中信息的分類。與傳統(tǒng)機器學習相比,CNN算法的分類效果更好,網(wǎng)絡模型參數(shù)更少。
RCNN(Region with CNN Feature)屬于典型的兩階段檢測算法,該算法通過候選框算法如SS(Selective Search)確定約2 000個候選框,運用CNN算法進行候選框中特征的提取,利用SVM進行候選框的分類,并使用非極大值抑制的方法消除重疊程度較大的候選框;最后通過最小二乘等方法解決候選框的回歸問題,其框架如圖2所示。運用典型的RCNN在PASCAL VOC2012數(shù)據(jù)集可將檢測率從35.1%提升至53.7%,極大地提高了檢測的精度。但其缺點也非常的明顯,即訓練和測試速度緩慢且所需存儲空間巨大。
Fast RCNN是在原算法的基礎上,將特征提取、候選框分類及回歸融合在一起,通過CNN算法實現(xiàn),且此部分可以使用GPU進行加速,大大縮減了操作時間。其缺點是候選框提取的部分仍是依賴CPU運行,耗時較長。Faster RCNN[6]中將前兩代的SS算法替換成RPN(Region Proposal Network)算法,并將該算法與另外三個部分相融合,利用CNN網(wǎng)絡完成整個檢測過程。該算法的優(yōu)點在于進一步提高了檢測速度,實現(xiàn)了端到端的檢測,缺點是對候選框的處理仍需較長的時間,所以仍無法做到實時檢測。
卷積神經(jīng)網(wǎng)絡可以通過改變特征信息的提取方式來實現(xiàn)檢測精度的提高,有很多學者致力于此方向的研究和應用。Shi [7]等人使用ConvNeXt結構替代主干網(wǎng)絡中的VGG模塊,減少模型的參數(shù)數(shù)量,并引入CBAM注意力機制,增加重要特征的比重,減少不重要特征的比重。相較于RPN中錨框的人為選取,此試驗中選用K-means均值類算法實現(xiàn)了更好的錨框,相較于使用VGG16作為主干網(wǎng)絡的Faster RCNN,其mAP從65.18%提升至80.78%,大幅提高了檢測的精度,但卻以犧牲一定的檢測速度為代價。張鑫[8]等人提出一種基于Faster RCNN網(wǎng)絡結構的改進方法,采用ResNet-101網(wǎng)絡來完成特征的提取,取代了原來模型網(wǎng)絡中的VGG16網(wǎng)絡,并加入了可形變卷積和密集型結構,檢測精度較未改進模型提升了4.3%。同時針對不完全標簽的數(shù)據(jù)集提出一種基于Mask-RCNN的檢測方法,并額外使用了優(yōu)化迭代的方法,使其檢測精度最終接近于完全標簽的數(shù)據(jù)集檢測后的精度。王延舒[9]等人提出一種自適應全局定位網(wǎng)絡,將ResNet50網(wǎng)絡與FPN相結合,用來完成不同維度特征的提取,同時提出一種自適應候選框提取模塊,該模塊可自動更改錨框的大小,以提高檢測的精度,此外,采用全局點定位回歸,進而得到更加準確的目標定位信息。該網(wǎng)絡的mAP可以達到79.90%,與Faster RCNN網(wǎng)絡的檢測精度相同,遠超YOLOv3的69.40%,且保持著接近12的FPS。
卷積神經(jīng)網(wǎng)絡還可通過改變卷積的類型來實現(xiàn)提高特征信息提取精度的目的,目前已有不少學者在此方面做出了貢獻。Duan[10]等提出了基于Faster RCNN的改進分類算法,利用ResNet50解決隨著網(wǎng)絡深度的增加精度飽和甚至衰退的問題,利用可變性卷積解決特征點與ROI不匹配的問題。在此試驗中,數(shù)據(jù)集采用NEU-DET,共1 800個數(shù)據(jù),分為6類,每類300個數(shù)據(jù)。由于數(shù)據(jù)集樣本不大,此試驗通過Albumentation數(shù)據(jù)增強庫對整個圖片區(qū)域進行數(shù)據(jù)增強,還對圖片中存在缺陷的部分進行增強,增強后數(shù)據(jù)集中的圖像達5 400張,能夠得到更好的訓練效果。本試驗中mAP達到了0.774,相較于原Faster RCNN的0.711有較大幅度的提升,最低類別的AP為0.571,仍有較高的提升空間,作為兩階段檢測法,在檢測速度上仍需要提升。Ren[11]等人在Faster R-CNN中以深度可分離卷積替代了普通的卷積,加入了中心損耗,利用存有4 000多張圖片的數(shù)據(jù)集進行訓練后,準確度達到98%,且每張圖片的檢測用時為0.05 s,實現(xiàn)了高實時性和高精度的檢測目標。
運用神經(jīng)網(wǎng)絡算法進行檢測往往需要大量的數(shù)據(jù)集,數(shù)據(jù)集過少的情況下會出現(xiàn)過擬合的現(xiàn)象,從而導致深度學習訓練的結果不夠理想。針對此問題,Kim[12]等人提出一種使用CNN的Siamese神經(jīng)網(wǎng)絡結構,在NEU鋼材表面缺陷數(shù)據(jù)集中選取少量的數(shù)據(jù)進行學習,取得了良好的訓練成果。趙月[13]等基于小樣本提出一種深度學習算法,由于試驗中原始數(shù)據(jù)集僅有275張圖像,分為4類(包括一類無缺陷),本試驗通過DCGAN網(wǎng)絡生成更多的樣本數(shù)據(jù),相較于傳統(tǒng)圖像處理方法中增加數(shù)據(jù)集數(shù)量,使用DCGAN網(wǎng)絡生成的數(shù)據(jù)有更好的隨機性和組合方式,并可自行對數(shù)據(jù)進行標注。此試驗中采用了遷移學習,運用Faster RCNN先對ImageNet進行訓練,得到訓練模型后,以該訓練模型中的權重參數(shù)作為預設置參數(shù),再對上述訓練集中的數(shù)據(jù)進行訓練,得到訓練模型,其檢測結果精度均高于90%。上述兩個試驗較好地解決了工業(yè)現(xiàn)場無法獲得大量樣本數(shù)據(jù)的弊端,提出了小樣本情況下利用深度學習完成缺陷檢測的方法,具有較高的工程實踐意義。
2.2? YOLO算法
YOLO算法[14]已經(jīng)發(fā)展升級至YOLOv8網(wǎng)絡結構,以現(xiàn)階段應用較為廣泛的YOLOv7為例,對YOLO系列的網(wǎng)絡結構進行介紹,如圖3所示為YOLOv7的網(wǎng)絡結構圖。
YOLOv7大致可分為輸入端、backbone和head。backbone中的CBS模塊與YOLOv5中的CBL模塊大致相同,唯一的不同之處在于最后選用的激勵函數(shù),YOLOv7選用的是Silu激勵函數(shù)而YOLOv5選用的是LeakyReLU激勵函數(shù)。YOLOv7中的CBS模塊依據(jù)不同的卷積核和步長被分為三種類型,分別起到改變通道數(shù)、特征提取和下采樣的功能。ELAN是YOLOv7中新增的模塊,該模塊進行了多個卷積,結果將初始模塊、完成一次卷積后的模塊、完成三次卷積后的模塊和完成五次卷積后的模塊進行疊加,可以獲得更好的特征提取。ELAN-W與ELAN模塊非常的相似,僅僅在結果中多疊加了兩個卷積后的模塊。SPPCSPC模塊中分別存在四條不同的最大池化通道,正是借助于這四條不同的通道才能更好地區(qū)別圖片中物體的大小。REP模塊也是YOLOv7中新增的模塊,分為Train和Deploy模塊,分別應用于項目的訓練和推理,REP模塊主要作用是將一個原有的模塊進行分割再組成新的模塊。
YOLO模型算法的改進主要通過改進主干網(wǎng)絡,改進特征金字塔模型和增加注意力機制來完成,可以達到提高檢測精度、加快檢測速度和減小模型參數(shù)等目的,已有不少學者對YOLO算法進行了改進。Qian[15]等人提出了基于YOLOv3的輕量化特征網(wǎng)絡模型,采用ShuffleNetv2作為主干網(wǎng)絡,基于FPN特征金字塔網(wǎng)絡提出了輕量化特征金字塔網(wǎng)絡LFPN,可以獲得更快的推理速度及更高的檢測精度。時下熱門的深度可分離卷積和GhostNet網(wǎng)絡也能完成模型參數(shù)的減少,形成輕量化模型,但這兩種網(wǎng)絡會導致網(wǎng)絡的推理速度減慢。為了實現(xiàn)鋼材表面更小缺陷的檢測,Liu[16]等人以YOLOv5為基礎進行了改進。在YOLOv5四種模型中選用了YOLOv5s,以此來確保檢測的高速性,并采用了可變性卷積法以及雙注意力模塊,用來完成對更小物體的檢測,經(jīng)數(shù)據(jù)集訓練后,可完成相較于YOLOv5原檢測目標四分之一至三分之一大小物體的檢測,且保持著高檢測精度和高實時性。Wang[17]等人提出一種基于YOLOv7的改進算法模型,將加權雙向金字塔模型(BiFPN)加入原有網(wǎng)絡,能夠提高對主干網(wǎng)絡中特征信息的提取和融合,并加入了ECA注意力機制,該注意力機制可以避免特征信息在空間上的缺失,增加重要信息的權重;采用SIoU損失函數(shù)代替原來的CIoU損失函數(shù),得到更好的輸出結果。
2.3? SSD算法
典型的分類算法中存在較多利用全連接層來完成特征提取和分類的算法,這些算法通過采用全連接層能夠較好地提取全局特征,但僅有助于完成單個目標的檢測和分類。SSD算法則將全連接層替換成卷積層,能夠更好地完成多個目標的檢測任務,SSD算法運算中也采用了錨點技術,利用錨點生成不同大小的錨框,分別在不同的特征提取層中提取特征,能夠依次完成從小目標到大目標的檢測,進而可更好地完成目標檢測任務。SSD算法運算中還采用了放大和縮小兩種不同的數(shù)據(jù)增強方法,提高了數(shù)據(jù)集的樣本數(shù)量,有利于生成更優(yōu)秀的模型。
針對小目標的缺陷檢測問題,劉艷菊等人[18]研究一種能夠提高小目標檢測效率并減少誤檢概率的算法,該算法中將SSD中的VGGNet結構替換成ResNet結構,并通過反卷積將深度不同的特征進行融合,在利用NEU-CLS和NEU-DET兩個數(shù)據(jù)集進行訓練后,mAP增長了約5%達到94.13%,可滿足工業(yè)生產(chǎn)時的精度要求,但檢測速度和模型參數(shù)仍需要不斷改進才能達到實時檢測的目的。王艷玲等人[19]則是將SSD算法與傳統(tǒng)的圖像處理算法相結合,首先通過傳統(tǒng)的圖像處理算法對CCD相機拍攝到的圖像進行預處理,再利用SSD算法完成模型的預訓練,隨后對圖像進行在線檢測,此方法中的mAP達到了85%,但存在誤檢現(xiàn)象,需要通過數(shù)量更大的數(shù)據(jù)集進行訓練才有可能減少誤檢的發(fā)生。
3? 缺陷圖像的分割算法
分割網(wǎng)絡主要完成圖像中缺陷和背景分割的任務,大多采用錨點來完成普通分割的任務,如YOLO系列和RCNN系列,其原始算法運算中均采用矩形框將圖像中的缺陷標記出來。隨后發(fā)展出能夠完成像素級語義分割任務的FCN(Fully Convolutional Networks)全卷積神經(jīng)網(wǎng)絡模型、U-Net網(wǎng)絡模型及DeepLab網(wǎng)絡模型等。
3.1? U-Net網(wǎng)絡模型
U-Net網(wǎng)絡模型[20]是一個較為對稱的網(wǎng)絡模型,如圖4所示,其左端為下采樣將圖像縮小,其右端為上采樣將圖像放大,在上采樣的同時通過跳層連接(Skip Connection)將下采樣時的特征圖融合到上采樣時的特征圖中,特征圖大小不同則采取填充的方式,由此能較好地完成語義分割的任務。
語義分割網(wǎng)絡已經(jīng)有了較為成熟的發(fā)展,其在鋼表面缺陷檢測領域也有較好的發(fā)展前景,有越來越多的學者開始將語義分割網(wǎng)絡應用于缺陷檢測領域。為了更好地定位鋼材表面的缺陷,Liu[21]等人使用U-Net網(wǎng)絡實現(xiàn)缺陷定位的語義分割任務而不是僅僅局限于用方框將缺陷框出。Amin[22]利用機器學習來完成鋼材表面缺陷的檢測,選取一萬多張數(shù)據(jù)集進行訓練,其中存在缺陷和不存在缺陷的圖片各占50%,具有比較好的訓練特性。該研究中利用語義分割U-Net和殘差U-Net對圖像進行處理,并將兩種算法進行比較,得出殘差U-Net具有較好表面檢測功能的結論。
3.2? DeepLab網(wǎng)絡模型
DeepLab也是較為優(yōu)秀的語義分割網(wǎng)絡,該網(wǎng)絡首先提出了空洞卷積,并在網(wǎng)絡的最后一層利用CRF(條件隨機場)更精準地完成了目標的定位任務。同時,該網(wǎng)絡采用ASPP(空洞空間金字塔池化)模塊更高效地提取多尺度特征。該網(wǎng)絡已發(fā)展為DeepLabv3+,在語義分割領域也發(fā)揮著重要的作用,為不少學者所使用。
黃怡[23]等人提出GAUDeepLab檢測模型,此模型基于DeepLabv3+網(wǎng)絡,利用語義分割來完成檢測的分類及缺陷的定位,以ResNet50作為主干網(wǎng)絡,并加入了全局注意力機制,防止重要細節(jié)信息的丟失。采用Kaggle比賽中謝韋爾鋼鐵公司的帶鋼缺陷數(shù)據(jù)集,該數(shù)據(jù)集具有非常好的訓練性能。相較于原網(wǎng)絡,經(jīng)改進的網(wǎng)絡訓練后IoU提高了2.78%,Dice系數(shù)提高了0.66%。針對邊緣分割模糊、漏檢等情況,范瑤瑤等人[24]提出一種能夠更好分割鋼表面缺陷的算法,該算法以DeepLabv3+為基礎,在主干網(wǎng)絡中加入了坐標注意力機制,并利用多尺度融合網(wǎng)絡對不同深度的特征進行融合,從而達到更精確提取邊緣特征,更精細分割缺陷圖像的目的。此算法采用謝韋爾帶鋼缺陷數(shù)據(jù)集,針對數(shù)據(jù)集樣本分類均勻程度較差的情況,設計了結合兩種損失函數(shù)的新型損失函數(shù)來攻克這一難題。
4? 結? 論
鋼表面的缺陷檢測目前仍處于研究階段,距離在工業(yè)現(xiàn)場的廣泛應用還有著不小的距離。鋼表面的缺陷檢測包含兩個類別:缺陷分類和缺陷分割。缺陷分類是指將圖像中的缺陷按照預設類別進行分類,這是缺陷檢測中的一個重要環(huán)節(jié),只有深度學習模型能夠在工程中高精度地完成缺陷分類的任務,這樣的網(wǎng)絡模型才有存在的意義。而只有當網(wǎng)絡模型能夠在現(xiàn)場計算機中實現(xiàn)實時檢測,這樣的模型才有可能被應用到大多數(shù)的工業(yè)現(xiàn)場。
一般來說,兩階段檢測算法具有更好的檢測精度,而單階段檢測算法具有較好的檢測速度。研究開發(fā)的多數(shù)算法在提升檢測精度的同時會伴隨著檢測速度的下降,這就是一個需要解決的問題。U-Net等語義分割網(wǎng)絡較之YOLO等網(wǎng)絡具有更好的缺陷分割能力,能夠更精確地標記出缺陷的位置。現(xiàn)階段所研究的模型在檢測精度上能夠達到較高的水準,但一般都犧牲了檢測的實時性,同時具有高檢測精度和高檢測速度的模型還有待更深層次的研究和開發(fā)。現(xiàn)階段研究中可用數(shù)據(jù)集樣本量較少,創(chuàng)建樣本量較大的數(shù)據(jù)集并對其進行標記需要耗費大量的時間,此外還存在數(shù)據(jù)集不均衡的問題,這也是現(xiàn)階段需要解決的問題之一。缺陷分割則是為了完成圖像中缺陷與背景的分割,缺陷分割經(jīng)過長期以來的發(fā)展已經(jīng)涌現(xiàn)出很多優(yōu)秀的模型,能夠很好地完成語義分割的任務。同時,缺陷分割也面臨著數(shù)據(jù)集較少、分類單一的問題。目前的研究大多處于理論階段,需要在工業(yè)現(xiàn)場進行模擬試驗,實現(xiàn)缺陷檢測的任務。
參考文獻:
[1] 王浩然.基于YOLOv5的鋼材表面缺陷檢測研究 [D]. 桂林:廣西師范大學,2023.
[2] 張宇杰,蔡樂才,成奎,等.改進YOLOv5金屬表面缺陷檢測方法 [J].四川輕化工大學學報:自然科學版,2022,35(4):32-41.
[3] 金映谷,張濤,楊亞寧,等.基于深度學習的產(chǎn)品缺陷檢測方法綜述 [J].大連民族大學學報,2020,22(5):420-427.
[4] 陶顯,侯偉,徐德.基于深度學習的表面缺陷檢測方法綜述 [J/OL].自動化學報:1-19[2023-02-16].http://kns.cnki.net/kcms/detail/11.2109.TP.20200402.1101.002.html.
[5] 楊延西,趙夢.基于CNN的帶鋼表面缺陷檢測 [J].重型機械,2019,348(2):25-29.
[6] 胡江宇,賈樹林,馬雙寶.基于改進級聯(lián)Faster RCNN的PCB表面缺陷檢測算法 [J].儀表技術與傳感器,2022(7):106-110+126.
[7] SHI X C,ZHOU S,TAI Y C,et al. An Improved Faster R-CNN for Steel Surface Defect Detection [C]//2022 IEEE 24th International Workshop on Multimedia Signal Processing (MMSP).Shanghai:IEEE,2022:1-5.
[8] 張鑫.基于改進RCNN的鋼鐵表面缺陷檢測方法的研究與實現(xiàn) [D].沈陽:東北大學,2022.
[9] 王延舒,余建波.基于自適應全局定位算法的帶鋼表面缺陷檢測 [J/OL].自動化學報:1-16[2023-02-05].http://kns.cnki.net/kcms/detail/11.2109.tp.20230214.2146.005.html.
[10] DUAN H,HUANG J,LIU W K,et al. Defective Surface Detection based on Improved Faster R-CNN [C]//2022 IEEE International Conference on Industrial Technology (ICIT). Shanghai:IEEE,2022:1-6.
[11] REN Q R,GENG J H,LI J Y. Slighter Faster R-CNN for real-time detection of steel strip surface defects [C]//2018 Chinese Automation Congress (CAC). Xi'an:IEEE,2018:2173-2178.
[12] KIM M S,PARK T,PARK P. Classification of Steel Surface Defect Using Convolutional Neural Network with Few Images [C]//2019 12th Asian Control Conference (ASCC). Kitakyushu:IEEE,2019:1398-1401.
[13] 趙月,張運楚,孫紹涵,等.基于深度學習的螺紋鋼表面缺陷檢測 [J].計算機系統(tǒng)應用,2021,30(7):87-94.
[14] 蔡嘉倫.基于改進YOLO算法的金屬表面缺陷檢測研究 [D].江門:五邑大學,2023.
[15] QIAN X H,WANG X,YANG S Y,et al. LFF-YOLO: A YOLO Algorithm With Lightweight Feature Fusion Network for Multi-Scale Defect Detection [J].IEEE Access,2022,10:130339-130349.
[16] LIU Y J,WANG J,YU H T,et al. Surface Defect Detection of Steel Products Based on Improved YOLOv5 [C]//2022 41st Chinese Control Conference (CCC). Hefei:IEEE,2022:5794-5799.
[17] WANG Y,WANG H Y,XIN Z H. Efficient Detection Model of Steel Strip Surface Defects Based on YOLO-V7 [J].IEEE Access,2022,10:133936-133944.
[18] 劉艷菊,王秋霽,張惠玉,等.基于改進SSD的工件表面缺陷檢測 [J/OL].熱加工工藝,2024(2):134-139[2023-02-15].https://doi.org/10.14158/j.cnki.1001-3814.20211221.
[19] 王艷玲,蘇盈盈,羅妤,等.基于SSD模型的鋼帶表面缺陷檢測系統(tǒng)設計 [J].重慶科技學院學報:自然科學版,2021,23(3):95-98.
[20] 楊彬,亞森江·木沙,張凱.改進U-Net網(wǎng)絡的高紋理表面缺陷檢測方法 [J].機械設計與制造,2023(3):160-164.
[21] LIU M S,HUANG Y F,XIE Y L. Design of Steel Surface Defect Detection System Based on deep Learning [C]//2022 IEEE International Conference on Artificial Intelligence and Computer Applications (ICAICA). Dalian:IEEE,2022:743-749.
[22] AMIN D,AKHTER S. Deep Learning-Based Defect Detection System in Steel Sheet Surfaces [EB/OL].[2023-01-16].https://www.researchgate.net/publication/341978292_Deep_Learning-Based_Defect_Detection_System_in_Steel_Sheet_Surfaces.
[23] 黃怡.基于卷積神經(jīng)網(wǎng)絡的鋼表面缺陷檢測研究 [D].桂林:桂林電子科技大學,2023.
[24] 范瑤瑤,王興芬,劉亞輝.改進Deeplabv3+網(wǎng)絡的鋼板表面缺陷檢測研究 [J/OL].計算機工程與應用,2023:1-10(2023-02-20).http://kns.cnki.net/kcms/detail/11.2127.TP.20230220.1105.008.html.
作者簡介:費佳杰(2000—),男,漢族,江蘇無錫人,碩士研究生在讀,主要研究方向:缺陷檢測、人工智能;通訊作者:李宏勝(1966—),男,漢族,江蘇南京人,教授,博士,主要研究方向:人工智能、機器人控制等;任飛(1994—),男,漢族,安徽無為人,所長,博士研究生,主要研究方向:機器視覺與人工智能;吳敏寧(1984—),女,漢族,陜西榆林人,副教授,博士研究生,主要研究方向:智慧農(nóng)業(yè)與智能制造;王光榮(1971—),男,漢族,天津人,教授級高工,本科,主要研究方向:智能礦山與智能制造。
收稿日期:2023-03-22
基金項目:南京工程學院大學生科技創(chuàng)新基金項目(TB202317004);榆林市2021產(chǎn)學研項目(CXY-2021-102-02)