摘要:針對當(dāng)前目標(biāo)車輛因遮擋、天氣等因素造成的漏檢,以及跟蹤過程中車輛身份丟失和變換等現(xiàn)象,本文提出了一種改進的YOLOv5與DeepSort車輛檢測跟蹤算法。在車輛目標(biāo)檢測部分,本文在YOLOv5網(wǎng)絡(luò)中添加了注意力模塊CBAM,以更有效地提取目標(biāo)特征;同時,引入了SIoU作為邊界框損失函數(shù),不僅提升了邊界框定位的準(zhǔn)確性,也加快了邊界框的回歸速度。在車輛跟蹤部分,改進了DeepSort算法,使用擴展卡爾曼濾波器預(yù)測非線性環(huán)境下的車輛位置,并且使用匈牙利算法將預(yù)測軌跡和檢測軌跡進行最優(yōu)匹配,從而在復(fù)雜環(huán)境下優(yōu)化由車輛相互覆蓋引起的漏檢問題。最終,通過改進后的YOLOv5與DeepSort算法進行檢測和跟蹤,并使用UA-DETRAC數(shù)據(jù)集進行驗證。實驗結(jié)果表明:改進后的YOLOv5用于目標(biāo)追蹤算法后,平均精確度較原算法提高了4%;結(jié)合改進后的DeepSort追蹤算法,平均精確度提高至63.6%,比原算法提高了3.6%;車輛目標(biāo)身份轉(zhuǎn)換的次數(shù)比原算法減少了53次,降低了6.6%。改進后的算法模型在追蹤精確度和實時性上均表現(xiàn)良好。
關(guān)鍵詞:YOLOv5;DeepSort;目標(biāo)檢測;多目標(biāo)跟蹤;注意力機制
中圖分類號:TP18 文獻標(biāo)識碼:A
文章編號:1009-3044(2024)19-0001-05
0 引言
近幾年,計算機視覺技術(shù)常被用于車輛多目標(biāo)檢測跟蹤領(lǐng)域[1],該技術(shù)的發(fā)展有助于推動智能駕駛車輛和視頻監(jiān)控等[2-5]相關(guān)方向的發(fā)展。在多目標(biāo)跟蹤問題的研究中,解決方案通常分為兩個步驟:目標(biāo)檢測和目標(biāo)數(shù)據(jù)關(guān)聯(lián)。這兩個步驟共同構(gòu)成了車輛跟蹤研究中的核心問題,即如何準(zhǔn)確地將不同幀中的目標(biāo)識別為同一目標(biāo)?,F(xiàn)階段多目標(biāo)跟蹤可分為兩類:一類是將Re-ID(re-identification) 模塊與目標(biāo)檢測網(wǎng)絡(luò)分離的DBT(detection-based tracking) [6]方法;另一類是將Re-ID模塊整合到目標(biāo)檢測網(wǎng)絡(luò)中的JDT(joint detectiontracking) 方法。DBT方法通過兩個獨立的網(wǎng)絡(luò)來實現(xiàn)目標(biāo)檢測和Re-ID,從而提高追蹤的準(zhǔn)確性,而JDT方法則在一個統(tǒng)一的網(wǎng)絡(luò)中完成這兩個任務(wù),這兩類方法均是基于視覺的目標(biāo)跟蹤的主流方法。
提升目標(biāo)跟蹤的推測速率是近年來一個熱門的研究方向。毛昭勇等[7]通過將原有的耗時主干網(wǎng)絡(luò)替換為輕量級EfficientNet網(wǎng)絡(luò),不僅加快了推理速度,還通過小目標(biāo)檢測的網(wǎng)絡(luò)設(shè)計,縮短了推理時間并提升了效率。這一改進使得YOLOv3在處理速度和檢測準(zhǔn)確度上都得到了顯著提高,特別是在小目標(biāo)檢測方面表現(xiàn)更加優(yōu)異。武明虎等[8]結(jié)合SORT算法,在完善YO?LOv3的損失函數(shù)和網(wǎng)絡(luò)結(jié)構(gòu)后,其目標(biāo)檢測可以實現(xiàn)最快14.39 fps 的追蹤速度。Zuraimi 等[9]驗證了YO?LOv3不如YOLOv4網(wǎng)絡(luò),采用YOLOv4作為目標(biāo)檢測網(wǎng)絡(luò)的DeepSort整體上達到了14.12 fps的追蹤速度。
自YOLO算法推出以來,其多個版本在目標(biāo)檢測與追蹤領(lǐng)域都有著廣泛應(yīng)用。趙桂平等[10]在YOLOv5 的框架基礎(chǔ)上改良了生成目標(biāo)邊界框的過程,從而提升了檢測的準(zhǔn)確度。Wang等[11]在目標(biāo)檢測過程中采用了YOLOv5s網(wǎng)絡(luò),而在單目標(biāo)跟蹤任務(wù)中則選用了SiamRPN算法。這兩種算法的結(jié)合使得綜合檢測速度達到了20.43 fps。
上述目標(biāo)檢測算法難以兼顧檢測的精確性和實時性;另外在車輛被遮擋和復(fù)雜路況等環(huán)境下,解決身份變換問題也是一大挑戰(zhàn)。基于以上情況,本文改進了YOLOv5和DeepSort算法。模型通過增加注意力模塊CBAM來增強特征提取能力,使得模型能夠更加關(guān)注關(guān)鍵特征,并快速分析復(fù)雜場景中的信息。同時,采用SIoU Loss損失函數(shù)改進邊界框定位精度,提升了模型訓(xùn)練時的收斂速度和推理時的準(zhǔn)確性。此外,通過應(yīng)用擴展卡爾曼濾波器改進目標(biāo)跟蹤算法,有效避免了因遮擋引起的車輛身份變換問題。