国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于YOLOv4和AlexNet的吊弦尼龍?zhí)兹笔z測方法

2022-07-08 13:29張慧源孫木蘭
控制與信息技術(shù) 2022年3期
關(guān)鍵詞:尼龍卷積分類

張慧源,孫木蘭,陳 豪

(株洲中車時代電氣股份有限公司, 湖南 株洲 412001)

0 引言

吊弦是高速鐵路弓網(wǎng)的重要組成部分之一,它連接著承力索和接觸線,通過調(diào)節(jié)吊弦可以保證接觸線與軌面間距離的一致性,改善接觸懸掛的彈性,使得接觸線與受電弓良好滑擦,從而提高電力機車的取流質(zhì)量[1]。目前國內(nèi)的吊弦主要分為可調(diào)式整體吊弦和整體吊弦(剛性/柔性)兩大種類。剛性整體吊弦由尼龍?zhí)住~棒(吊弦本體)和吊弦線夾等構(gòu)成,其中尼龍?zhí)子兄乐钩辛λ鬏d流的作用,這種類型的吊弦被廣泛應(yīng)用于廣佛肇、廣深港高鐵線路。在高鐵運行過程中,吊弦既要承受列車高速運行時的沖擊、振動和電流的熱侵蝕,又要經(jīng)受日曬、酸堿環(huán)境等惡劣條件的考驗,導(dǎo)致吊弦尼龍?zhí)子袝r會出現(xiàn)破損和缺失的現(xiàn)象,致使吊弦與承力索載流而形成電位差,存在重大安全隱患,甚至可能導(dǎo)致承力索燒損[2]。

剛性整體吊弦的故障模式主要分為3種:剛性吊弦斷裂、剛性吊弦脫落和絕緣套磨損丟失[3]。長期以來,吊弦異常都是通過人工巡視的方法進(jìn)行檢測,存在巡檢周期長、效率低下、容易漏檢等問題[4]。隨著列車攝像頭應(yīng)用的普及,基于圖像處理技術(shù)的非接觸巡檢方法也應(yīng)運而生[5]。文獻(xiàn)[6]從時頻分析角度提取統(tǒng)計特征,再利用分類算法對接觸網(wǎng)吊弦進(jìn)行故障檢測。文獻(xiàn)[7]以接觸網(wǎng)系統(tǒng)圖像為研究對象,提出了一種將深度可分卷積與目標(biāo)檢測網(wǎng)絡(luò)相結(jié)合的吊弦故障檢測方法。文獻(xiàn)[8]提出一種長短時記憶卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network-long short-term memory, CNN-LSTM) 和CNN-LSTM-Attention相融合的網(wǎng)絡(luò)模型,并在網(wǎng)絡(luò)訓(xùn)練過程中使用貝葉斯優(yōu)化方法進(jìn)行超參數(shù)選擇,從而實現(xiàn)對吊弦斷裂和松弛故障的檢測。文獻(xiàn)[9]提出通過Faster R-CNN方法定位吊弦位置后再利用傳統(tǒng)圖像識別算法對吊弦狀態(tài)進(jìn)行檢測。文獻(xiàn)[10]利用膠囊網(wǎng)絡(luò)模型和Chan-Vese(簡稱“CV”)模型對吊弦和絕緣子進(jìn)行識別定位和故障分類。文獻(xiàn)[11-12]利用YOLOv3定位吊弦并通過SqueezeNet對吊弦松弛、斷裂的異常狀態(tài)進(jìn)行判斷。文獻(xiàn)[13]通過基于卷積神經(jīng)網(wǎng)絡(luò)的端點定位算法對吊弦兩端進(jìn)行定位,然后利用直線檢測算法實現(xiàn)吊弦斷裂故障的檢測。

隨著檢測數(shù)據(jù)暴發(fā)式增長以及計算機硬件和卷積神經(jīng)網(wǎng)絡(luò)技術(shù)的發(fā)展,基于深度學(xué)習(xí)的計算機視覺技術(shù)逐漸受到鐵路科研工作者的關(guān)注,也被廣泛地應(yīng)用到弓網(wǎng)智能檢測系統(tǒng)中,如吊弦松脫檢測和定位器檢測[14]。然而大多數(shù)關(guān)注點都側(cè)重于吊弦整體,對吊弦尼龍?zhí)椎年P(guān)注甚少。這一方面主要是因為“尼龍?zhí)兹笔А边@種小目標(biāo)往往依賴于精妙的算子,需要開發(fā)者具有豐富的技術(shù)積累以及大量的開發(fā)時間來進(jìn)行嘗試,而且高速列車上鏡頭抖動造成的圖像模糊以及接觸網(wǎng)所處的復(fù)雜背景也會引起算法魯棒性不夠的問題;另一方面,由于尼龍?zhí)兹笔颖据^少、單一深度學(xué)習(xí)的卷積神經(jīng)網(wǎng)絡(luò)推理的局限性等原因,采用深度學(xué)習(xí)方法同樣沒能很好地解決類似尼龍?zhí)走@樣的小目標(biāo)檢測問題。為此,本文采用“先檢測,再分類”的方法構(gòu)建了一種吊弦尼龍?zhí)兹笔z測模型,介紹了尼龍?zhí)兹笔z測方案框架,詳細(xì)描述方案中所述吊弦定位、小目標(biāo)尼龍?zhí)讌^(qū)域檢測以及尼龍?zhí)谞顟B(tài)識別算法原理和檢測過程,并采用真實樣本驗證方案的可行性和準(zhǔn)確性。通過這種方法,可以避免單一目標(biāo)檢測算法對小目標(biāo)檢測識別率低的缺陷,并且通過簡單的分類網(wǎng)絡(luò),在避免人工提取分類算子復(fù)雜性的同時也能保證算法的計算效率,滿足實際運用中的實時性要求。

1 吊弦定位及尼龍?zhí)谞顟B(tài)檢測

為了實現(xiàn)尼龍?zhí)讌^(qū)域定位,本文首先使用YOLOv4目標(biāo)檢測網(wǎng)絡(luò)對吊弦這一較大目標(biāo)進(jìn)行檢測,然后利用吊弦與尼龍?zhí)孜锢砦恢霉潭ㄟ@一特點計算出尼龍?zhí)讌^(qū)域,再將裁剪出的尼龍?zhí)讌^(qū)域使用數(shù)據(jù)增強方法提高數(shù)據(jù)質(zhì)量,最后利用AlexNet分類算法來判斷尼龍?zhí)谞顟B(tài),從而實現(xiàn)尼龍?zhí)椎娜笔z測(圖1)。

圖1 尼龍?zhí)兹笔z測流程Fig.1 Flow chart of missing nylon bush detection

1.1 基于YOLOv4的吊弦檢測

YOLO算法由Joseph Redmon于2015年提出,2020年4月已發(fā)展到v4版本,其網(wǎng)絡(luò)模型結(jié)構(gòu)如圖2所示。

圖2 YOLOv4 網(wǎng)絡(luò)結(jié)構(gòu)[15]Fig.2 Structure of YOLOv4[15]

YOLOv4[15]由 Alexey Bochkovskiy 提出,其使用跨階段部分鏈接網(wǎng)絡(luò)CSPDarknet53[16]作為骨架網(wǎng)絡(luò)(backbone),“SSP+PAN”作為特征增強器(neck),并沿用YOLOv3[17]的頭部網(wǎng)絡(luò)(head)。其中,CSPDarknet53是具有更大感受野、更大參數(shù)的模型,可以更好地提取目標(biāo)特征;而“SSP+PAN”特征增強器可以更好地放大由backbone提取出的特征;YOLOv3的head可以精確地對目標(biāo)進(jìn)行種類分類和區(qū)域回歸。除了使用更加先進(jìn)的整體網(wǎng)絡(luò),YOLOv4中還添加了許多小技巧來增加目標(biāo)檢測的準(zhǔn)確率,如CutMix和馬賽克數(shù)據(jù)增強的外在引入技巧,Mish激活函數(shù)、跨階段部分鏈接(cross stage partial,CSP)等網(wǎng)絡(luò)改進(jìn)技巧,CIoU損失函數(shù)、DropBlock正則化等外在檢測器引入技巧,空間金字塔池化(spatial pyramid pooling,SPP)模板等檢測器網(wǎng)絡(luò)改進(jìn)技巧。

吊弦檢測過程包括視頻抽幀、圖像預(yù)處理、圖像標(biāo)注以及基于YOLOv4的模型訓(xùn)練和目標(biāo)檢測,如圖3所示。

圖3 吊弦檢測流程Fig.3 Flow chart of dropper detection

1.2 基于YOLOv4的尼龍?zhí)讌^(qū)域定位

根據(jù)吊弦檢測模型,檢測吊弦位置以及吊弦和尼龍?zhí)椎膸缀侮P(guān)系,定位尼龍?zhí)孜恢?,由此得到尼龍?zhí)讌^(qū)域的左上(L,U)和右下(D,R)兩個對角坐標(biāo)。為提高數(shù)據(jù)的多樣性,在感興趣區(qū)域(region of interest,ROI)提取過程中進(jìn)行隨機裁剪,如式(1)~式(4)所示。圖4為隨機截取的尼龍?zhí)讌^(qū)域示意圖。

圖4 尼龍?zhí)讌^(qū)域示意圖Fig.4 Illustration of nylon brush

式中:(L,U)——尼龍?zhí)讌^(qū)域的左上角位置坐標(biāo);(D,R)——尼龍?zhí)讌^(qū)域的右下角位置坐標(biāo);(x,y)——吊弦矩形框的中心點坐標(biāo);h和w——吊弦矩形框的長和寬;γ——在一定范圍內(nèi)隨機生成的浮點數(shù)。

1.3 基于AlexNet的尼龍?zhí)追诸惸P?/h3>

在深度學(xué)習(xí)技術(shù)發(fā)展過程中,出現(xiàn)了很多經(jīng)典的分類網(wǎng)絡(luò),如首個卷積神經(jīng)網(wǎng)絡(luò)LeNet[18]、標(biāo)志現(xiàn)代圖像分類技術(shù)開始的AlexNet[19]以及通過將網(wǎng)絡(luò)之間前面所有層與后面層密集連接來提高分類性能的DenseNet[20]等。本文根據(jù)吊弦與尼龍?zhí)椎膸缀侮P(guān)系定位尼龍?zhí)讌^(qū)域,通過隨機截取、旋轉(zhuǎn)和縮放等方法進(jìn)行數(shù)據(jù)增強,以此提高數(shù)據(jù)量和數(shù)據(jù)多元性,解決數(shù)據(jù)不平衡和單一性問題,然后利用AlexNet網(wǎng)絡(luò)建立二分類模型,判斷尼龍?zhí)资欠袢笔А?/p>

AlexNet是2012年由Alex Krizhevsky和Ilya Sutskever等人提出的一種卷積神經(jīng)網(wǎng)絡(luò)。AlexNet網(wǎng)絡(luò)共有5層卷積層及3層全連接層,網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。該算法創(chuàng)新地在第一層優(yōu)化了傳統(tǒng)的卷積神經(jīng)網(wǎng)絡(luò),使用11×11大卷積核代替了5×5小卷積核,這樣可以更快地縮小圖像尺寸和獲得尺度合適的特征圖;在激勵函數(shù)上首次使用了ReLU函數(shù),其收斂速度會比Sigmoid/tanh函數(shù)的快很多;使用了重疊池化技術(shù),有效避免了過擬合。

圖5 AlexNet結(jié)構(gòu)圖[19]Fig.5 Structure of AlexNet[19]

2 實驗過程及實驗結(jié)果

本實驗首先對吊弦尼龍?zhí)渍?、?fù)樣本進(jìn)行清洗和標(biāo)注,然后選取不同的網(wǎng)絡(luò)參數(shù)對YOLOv4網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測試,得到最佳的吊弦尼龍?zhí)讌^(qū)域定位模型。除此之外,還詳細(xì)描述了數(shù)據(jù)增強的過程及其對分類效果的提升程度,并對經(jīng)典分類網(wǎng)絡(luò)LeNet、DenseNet與AlexNet的實驗結(jié)果進(jìn)行了分析比對,從而得到最有效的分類模型。

本文應(yīng)用GeForce RTX 2080Ti顯卡進(jìn)行加速計算,YOLOv4及AlexNet依賴的軟件環(huán)境中跨平臺計算機視覺和機器學(xué)習(xí)軟件庫OpenCV[21]的版本為3.4.0,運算平臺CUDA版本為10.0,深度神經(jīng)網(wǎng)絡(luò)庫CUDNN[22]的版本為7.5.0。

2.1 吊弦檢測

2.1.1 吊弦檢測圖像預(yù)處理及標(biāo)注

本次實驗數(shù)據(jù)來自2017年到2020年的CRH車型的3C弓網(wǎng)檢測視頻,共750 000幀圖像,其中尼龍?zhí)兹笔У呢?fù)樣本13幀。

由于圖像存在著冗余性高、環(huán)境復(fù)雜甚至多余的因素,需要對圖像進(jìn)行預(yù)處理。本文采用感知哈希值來對圖片進(jìn)行去重處理,具體如下:

(1)縮小尺寸。將圖片尺寸縮小到8×8,總共64個像素;去除細(xì)節(jié)信息,只保留結(jié)構(gòu)、明暗等基本信息。

(2)簡化色彩。將縮小后的圖片轉(zhuǎn)為64級灰度。

(3)計算平均值并比較像素的灰度。計算所有像素(64個)的灰度平均值,將每個像素的灰度與平均值進(jìn)行比較,大于或等于平均值記為1,否則記為0。

(4)計算哈希值。將第三步的比較結(jié)果組合在一起,就構(gòu)成了一個64位、由0和1組成的整數(shù)。這串64位的整數(shù)就是圖片的哈希值。

(5)篩選圖片。根據(jù)哈希值開始篩選圖片,具體方法是看64位中有多少位是不一樣的。在理論上,這等同于計算漢明距離[23]。不相同數(shù)據(jù)位的數(shù)量如果未超過閾值,說明兩張圖片很相似;如果大于閾值的兩倍,則判斷為兩張不同的圖片。閾值在一般情況下設(shè)定為5。

(6)剔除遮擋場景。為了保證訓(xùn)練圖片具有足夠的弓網(wǎng)信息量,訓(xùn)練集和測試集還需要剔除列車經(jīng)過隧道、站臺等地方時接觸網(wǎng)被遮擋的場景。

經(jīng)篩選,最終得到10 000幀有效數(shù)據(jù)。本次實驗從有效數(shù)據(jù)中隨機選取8 000幀作為訓(xùn)練集,2 000幀為測試集。

2.1.2 吊弦檢測模型訓(xùn)練

本實驗YOLOv4網(wǎng)絡(luò)的總訓(xùn)練次數(shù)為8 000次。隨著訓(xùn)練次數(shù)的增加,損失函數(shù)逐漸變小,如圖6所示。大約訓(xùn)練到1 600次時,下降速率減少并開始逐漸收斂。損失函數(shù)平均值在0.309 0,訓(xùn)練時間為7.92 h。

圖6 YOLOv4訓(xùn)練損失函數(shù)Fig.6 Loss function of train based on YOLOv4

2.1.3 吊弦檢測測試結(jié)果

隨著置信度的提高,接觸網(wǎng)吊弦檢測準(zhǔn)確率逐漸提高,召回率逐漸降低,基于YOLOv4的吊弦檢測效果見表1??紤]到精確度和召回率的均衡,選擇0.1作為模型的置信度閾值,網(wǎng)絡(luò)訓(xùn)練模型的超參數(shù)batch,width,height,channels,momentum,decay,learning_rate,max_batches分別為64,416,416,3,0.949,0.000 5,0.001,12 000。

表1 基于YOLOv4的吊弦檢測效果Tab.1 Results of the dropper detection based on YOLOv4

平均精度(average precision,AP)是反映吊弦坐標(biāo)檢測值與真實值之間差距的評價指標(biāo)。由表2可以看到,在交并比(intersection over union,IoU)閾值為0.5時,AP為0.82,這說明吊弦坐標(biāo)的位置準(zhǔn)確率較高。如圖7所示,該模型能較精確地識別出圖像中所有未被遮擋的吊弦,保證了尼龍?zhí)讌^(qū)域分類模塊輸入的準(zhǔn)確性。

表2 基于YOLOv4的吊弦檢測AP指標(biāo)Tab.2 AP of the YOLOv4 based dropper detection

圖7 吊弦檢測結(jié)果示意圖Fig.7 Illustration of dropper detection

2.2 尼龍?zhí)兹笔z測

由于正、負(fù)樣本數(shù)量嚴(yán)重不均衡,為提高模型的準(zhǔn)確度和魯棒性,需要進(jìn)行數(shù)據(jù)增強處理。本文使用的數(shù)據(jù)增強方法包括幾何變換、旋轉(zhuǎn)變換、縮放變換、翻轉(zhuǎn)變換和注入噪聲等,效果如圖8所示。可以看出,數(shù)據(jù)增強后,尼龍?zhí)兹笔^(qū)域的形狀、尺寸和清晰度的多樣性有所增強,有效模擬了實際故障的形態(tài)。經(jīng)過數(shù)據(jù)增強后樣本量的變化如圖9所示。

圖8 數(shù)據(jù)增強示意Fig.8 Illustration of data augmentation

圖9 數(shù)據(jù)增強前后樣本數(shù)量對比Fig.9 Comparison of sample size before and after data augmentation

為檢驗數(shù)據(jù)增強的效果,基于AlexNet分類網(wǎng)絡(luò)對樣本增強前后的分類結(jié)果進(jìn)行了比較。同時,還對經(jīng)典網(wǎng)絡(luò)LeNet、DenseNet與AlexNet的分類結(jié)果進(jìn)行了分析比對。表3示出數(shù)據(jù)增強前后的AlexNet分類網(wǎng)絡(luò)性能的變化。經(jīng)對比分析發(fā)現(xiàn),數(shù)據(jù)增強后AlexNet分類準(zhǔn)確率為84.1%,準(zhǔn)確率提高了約21%,而尼龍?zhí)兹笔z測準(zhǔn)確率更是提高了約55%。

表3 數(shù)據(jù)增強前后性能對比Tab.3 Characteristic comparison before and after data augmentation

本文還對LeNet,DenseNet與AlexNet分類網(wǎng)絡(luò)在尼龍?zhí)兹笔z測中的性能進(jìn)行了比較。在相同參數(shù)下,3種分類網(wǎng)絡(luò)的測試結(jié)果如表4所示,其中batch_size,input_size,max_epoch,GPU,weight_decay,learning_rate參數(shù)分別設(shè)為32,64,80,1,0.000 5,0.01??梢钥闯?,相比之下AlexNet有著更高的準(zhǔn)確率和更為簡單的網(wǎng)絡(luò)結(jié)構(gòu)。

表4 AlexNet,LeNet與DenseNet分類網(wǎng)絡(luò)的性能對比Tab.4 Characteristic comparison among AlexNet,LeNet and DenseNet

3 結(jié)語

為解決3C弓網(wǎng)檢測中尼龍?zhí)兹笔н@種小目標(biāo)檢測難度過大、精度不高的問題,本文提出一種將YOLOv4目標(biāo)檢測算法和AlexNet圖像分類算法相結(jié)合的接觸網(wǎng)吊弦尼龍?zhí)兹笔z測方案。其通過3C弓網(wǎng)檢測裝置獲取視頻數(shù)據(jù)并訓(xùn)練YOLOv4模型,以識別出圖像中吊弦的位置,之后通過AlexNet算法對尼龍?zhí)资欠袢笔нM(jìn)行分類。實驗結(jié)果顯示,采用這種先檢測再分類的方法,能有效解決尼龍?zhí)兹笔z測過程中存在的誤判、漏判問題。

目前可以用來訓(xùn)練和測試模型的負(fù)樣本都過少,在實際運用中可能會遇到訓(xùn)練模型中沒有的復(fù)雜情況,由此導(dǎo)致誤報的發(fā)生。后續(xù),一方面希望可以通過擴(kuò)充負(fù)樣本的數(shù)量,探索出更好的數(shù)據(jù)增強方法來提高算法的魯棒性和穩(wěn)定性;另一方面希望樣本多元化,以此提高識別場景的廣泛性,使模型可以識別如夜間道路、隧道等更加復(fù)雜的場景。

猜你喜歡
尼龍卷積分類
基于全卷積神經(jīng)網(wǎng)絡(luò)的豬背膘厚快速準(zhǔn)確測定
一種基于卷積神經(jīng)網(wǎng)絡(luò)的地磁基準(zhǔn)圖構(gòu)建方法
基于3D-Winograd的快速卷積算法設(shè)計及FPGA實現(xiàn)
多元創(chuàng)造
一種并行不對稱空洞卷積模塊①
尼龍空間
尼龍新定義
按需分類
教你一招:數(shù)的分類
說說分類那些事