摘要:道路裂縫檢測的及時(shí)性對于降低交通事故風(fēng)險(xiǎn)、延長道路使用壽命以及提升運(yùn)輸效率具有至關(guān)重要的作用。在當(dāng)前大數(shù)據(jù)和人工智能的背景下,本文提出了一種結(jié)合數(shù)據(jù)挖掘和SCDYOLO的道路顛簸異常檢測方案,旨在為道路裂縫檢測提供一種高效、準(zhǔn)確的新方法。該方法顯著提升了道路裂縫檢測的精準(zhǔn)度和效率。通過優(yōu)化數(shù)據(jù)清洗方法并引入創(chuàng)新的計(jì)算機(jī)視覺技術(shù),我們有效降低了時(shí)間與計(jì)算成本,并增強(qiáng)了模型的通用性和魯棒性。
關(guān)鍵詞:道路裂縫檢測;卡爾曼濾波算法;模擬退火算法;SCDYOLO
路面是至關(guān)重要的基礎(chǔ)設(shè)施,而路面裂縫的存在對交通安全存在重大危害。2022年3月,交通運(yùn)輸部、科學(xué)技術(shù)部聯(lián)合發(fā)布的《“十四五”交通領(lǐng)域科技創(chuàng)新規(guī)劃》提出要推動智慧交通與智慧城市協(xié)同發(fā)展,大力發(fā)展智慧交通,推動云計(jì)算、大數(shù)據(jù)、物聯(lián)網(wǎng)、移動互聯(lián)網(wǎng)、區(qū)塊鏈、人工智能等新一代信息技術(shù)與交通運(yùn)輸融合,開展智能交通先導(dǎo)應(yīng)用試點(diǎn)。因此,本研究擬針對智慧交通領(lǐng)域開展研究,符合我國現(xiàn)代信息技術(shù)與交通運(yùn)輸管理和服務(wù)全面融合戰(zhàn)略發(fā)展需求,具有重要的理論研究意義與實(shí)際應(yīng)用價(jià)值。立足于智慧交通領(lǐng)域,旨在以數(shù)據(jù)賦能推動智慧交通建設(shè),聚焦于道路顛簸檢測,針對以往道路顛簸檢測需要耗費(fèi)大量成本、時(shí)間和檢測精度有待提升的痛點(diǎn),提出了一種新的基于數(shù)據(jù)挖掘和SCDYOLO的道路顛簸異常檢測方案。
一、當(dāng)前面臨的問題和解決方案
(一)路面裂縫檢測數(shù)據(jù)量龐大,檢測耗費(fèi)時(shí)間成本和計(jì)算資源高
路面裂縫檢測復(fù)雜,涉及大量圖像數(shù)據(jù)的處理。道路網(wǎng)絡(luò)廣泛分布,狀況多樣,收集和標(biāo)注的數(shù)據(jù)集耗時(shí)耗力。裂縫類型、尺寸和方向各異,增加數(shù)據(jù)多樣性和復(fù)雜性,需更多數(shù)據(jù)提升模型泛化能力。高分辨率、多角度拍攝進(jìn)一步增加數(shù)據(jù)量和處理需求,數(shù)據(jù)量增大,傳統(tǒng)算法尤其是機(jī)器視覺方法需要更強(qiáng)的計(jì)算資源,導(dǎo)致硬件成本、能源消耗和時(shí)間成本上升。
(二)當(dāng)前的路面裂縫檢測算法的精度有待進(jìn)一步提高
盡管深度學(xué)習(xí)在圖像識別和分割上有所突破,但路面裂縫檢測算法的精度仍有待提高。裂縫形態(tài)多樣,受光照、材料、老化等因素影響,算法難以準(zhǔn)確識別和定位所有類型裂縫。此外,背景噪聲、路面標(biāo)記等干擾因素也影響算法性能。
道路裂縫形態(tài)各異,背景環(huán)境復(fù)雜多變,這使得特征提取成為一項(xiàng)具有挑戰(zhàn)性的任務(wù)。針對道路裂縫特征難以提取的問題,設(shè)計(jì)全新特征提取模塊SWC2f,該模塊的設(shè)計(jì)結(jié)合了shiftwiseoperator(SW)。此外,不同型號的道路裂縫圖像分辨率各異,導(dǎo)致在同一數(shù)據(jù)集中裂縫像素的區(qū)域大小存在顯著差異,這里就需要考慮到特征融合方法。特征金字塔網(wǎng)絡(luò)(FPN)[1]雖能有效融合多尺度特征以改善目標(biāo)檢測性能,但其局限性在于未將低級定位信息反饋至高級語義特征,且層間特征傳遞限于相鄰層級,導(dǎo)致融合不均衡。為解決此問題,PANet網(wǎng)絡(luò)通過自底向上路徑增強(qiáng)結(jié)構(gòu)融合了淺層與FPN特征。而NASFPN則利用神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)搜索自動優(yōu)化特征網(wǎng)絡(luò)設(shè)計(jì)。
二、數(shù)據(jù)集
RDD2022是全球首個(gè)道路損傷數(shù)據(jù)集,旨在推動損傷自動檢測與分類算法的研發(fā)。它涵蓋了六國的高質(zhì)量道路圖像,含55000個(gè)以上損傷實(shí)例,包括縱向、橫向裂縫、鱷魚裂縫和坑洞等。該數(shù)據(jù)集經(jīng)過兩年迭代,引入多國新數(shù)據(jù),采用多種采集方式。為了增強(qiáng)模型的泛化能力,采用了多種數(shù)據(jù)增強(qiáng)技術(shù)來豐富RDD2022數(shù)據(jù)集,包括調(diào)整圖像的亮度和飽和度、添加噪聲以及進(jìn)行隨機(jī)平移。這些操作使得數(shù)據(jù)集得到有效擴(kuò)展,樣本數(shù)量增加至95068個(gè),進(jìn)一步增強(qiáng)了模型的魯棒性和適應(yīng)性。
三、基于移動傳感器的數(shù)據(jù)清洗方法
采用卡爾曼濾波算法降低數(shù)據(jù)噪聲。卡爾曼濾波是一種通過結(jié)合傳感器測量和預(yù)測模型來估算動態(tài)系統(tǒng)狀態(tài)的方法,能降低測量噪聲對結(jié)果的影響。它通過區(qū)分測量噪聲和模型誤差,并在不同時(shí)間更新狀態(tài)估計(jì)值,同時(shí)考慮測量誤差,從而提高數(shù)據(jù)的質(zhì)量和可靠性?;静襟E包括狀態(tài)預(yù)測、協(xié)方差預(yù)測、測量更新和協(xié)方差更新。
模擬退火算法是一種全局優(yōu)化方法,模擬固體退火過程,通過溫度變化規(guī)律在復(fù)雜搜索空間中尋找最優(yōu)解。
四、SCDYOLO道路裂縫檢測模型
(一)YOLOv8網(wǎng)絡(luò)介紹
YOLOv8,作為YOLO系列物體檢測模型的最新版本,被細(xì)分為YOLOv8n、YOLOv8s、YOLOv8m、YOLOv8l和YOLOv8x等不同配置。鑒于模型大小與精度的權(quán)衡,本文選用了體積小巧且精度出眾的YOLOv8n網(wǎng)絡(luò)。YOLOv8n模型檢測網(wǎng)絡(luò)的核心結(jié)構(gòu)包括以下四大部分。
Input階段,采用Mosaic數(shù)據(jù)增強(qiáng)技術(shù)以豐富數(shù)據(jù)集,但在最后10個(gè)epoch時(shí),這一增強(qiáng)技術(shù)會被關(guān)閉。此外,YOLOv8n采用anchorfree機(jī)制,直接預(yù)測對象的中心,而非依賴于已知錨框的偏移量,從而減少了錨框預(yù)測的數(shù)量,并加速了非最大抑制(NMS)過程。Backbone部分,負(fù)責(zé)從輸入圖像中提取關(guān)鍵特征圖。YOLOv8的主干網(wǎng)絡(luò)與YOLOv5相似,但關(guān)鍵差異在于使用C2f模塊替換了C3模塊,這一改進(jìn)顯著降低了模型的復(fù)雜度。Neck部分,專注于多特征融合。YOLOv8通過引入PANFPN方法,顯著增強(qiáng)了不同尺度特征圖之間的融合與利用。Head部分,負(fù)責(zé)預(yù)測目標(biāo)的位置、類別以及置信度分?jǐn)?shù)等關(guān)鍵信息。
(二)位移感知卷積模塊(SWC2f)
在路面裂縫檢測中,多樣的裂縫形態(tài)增加了識別難度[2]。盡管YOLOv8的C2f結(jié)構(gòu)在目標(biāo)檢測中表現(xiàn)出色,但在裂縫檢測方面,其有限的感受也難以捕獲所有關(guān)鍵特征。為解決這一問題,研究通常采用大卷積核如LKA和SlaK,但這增加了計(jì)算負(fù)擔(dān)和內(nèi)存消耗。基于shiftwiseoperator對C2f結(jié)構(gòu)進(jìn)行了優(yōu)化,通過分解大卷積核為多個(gè)小卷積核,并利用位移操作,實(shí)現(xiàn)了在降低計(jì)算資源消耗的同時(shí)提高模型對裂縫的感知能力,旨在提升檢測的精確度和魯棒性。
ShiftWiseOperator方法首先指定一個(gè)focus長度和focus寬度的矩形區(qū)域,然后選擇尺寸小于或等于焦距寬度的卷積核,并調(diào)整這些卷積組的分布以進(jìn)行信息融合。focus長度不需要小于當(dāng)前特征圖的大小,其公式如下:
y(p(i,j))=∏f(kw,kh,A)k=0∑Am=0∑An=0w(p(Δm,Δn)+Δp)·x(p(i,j)+p(Δm,Δn)+Δp)
Δm=m-A2;Δn=n-A2
Δp=g(kh,k),(k∈[0,f(kw,kh,A)])
其中,w表示所有預(yù)先確定的非重疊小卷積;A表示小卷積核的大?。籯w和kh分別表示focus長度和focus寬度;f(kw,kh,A)表示與(kw,kh,A)相關(guān)的函數(shù)。相應(yīng)地,權(quán)重和特征偏移量Δp是與(kh,k)相關(guān)的函數(shù),將這個(gè)函數(shù)表示為g。
(三)跨尺度注意力融合模塊(CCAFM)
針對背景復(fù)雜、噪聲多的道路裂縫圖像,采用了通道融合變形卷積注意力機(jī)制,以提升模型對狹長裂縫的特征識別能力。該機(jī)制結(jié)合通道融合和形變卷積,克服了傳統(tǒng)CAM注意力機(jī)制在局部細(xì)節(jié)和多尺度特征交互上的不足,通過增強(qiáng)特征圖交互和空間信息捕獲,提高了模型在道路裂縫檢測的準(zhǔn)確性和泛化性[3]。
假設(shè)輸入特征圖為x∈瘙 綆
C×H×W,其中C表示通道數(shù),H和W分別表示高度和寬度:
k=Conv(x)⊙σx+IConvPool(x)CW=ChannelAttention(out)
out=k⊙CW+DC(k)⊙(1-CW)
這個(gè)模塊的前向傳播過程可以描述為對輸入特征圖x進(jìn)行卷積操作得到特征圖Conv(x),然后應(yīng)用形變卷積操作DC提取特征。同時(shí),對經(jīng)過平均池化和卷積操作得到的特征圖ConvPool(x)進(jìn)行Interpolation插值操作調(diào)整尺寸與輸入特征圖相同,然后通過通道注意力模塊ChannelAttention計(jì)算通道權(quán)重。最終將通道注意力模塊的輸出與插值后的特征圖相加,并經(jīng)過Sigmoid激活函數(shù)σ處理,得到最終輸出。將CFD注意力機(jī)制融入CCFM結(jié)構(gòu)中,能夠有效提升特征的提取精度,并實(shí)現(xiàn)特征間的協(xié)同融合。
(四)動態(tài)檢測頭(Dyhead)
道路裂縫具有尺度和形態(tài)的多樣性,以及多變的旋轉(zhuǎn)角度和位置。為了有效檢測,本研究采用了DynamicHead技術(shù),它結(jié)合了尺度、空間和任務(wù)三種注意力機(jī)制,提高了對裂縫的精確檢測能力,并增強(qiáng)了模型在復(fù)雜場景中的目標(biāo)識別和理解。
給定特征張量F∈RL×S×C,自注意力的表達(dá)式就是:
W(F)=π(F)·F
其中π(·)是注意力函數(shù)。一個(gè)簡單的實(shí)現(xiàn)方法就是用全連接層來實(shí)現(xiàn)該注意力函數(shù)。但直接在所有的維度上學(xué)習(xí)該注意力函數(shù)是非常消耗算力的,由于張量的維度很高,這不太現(xiàn)實(shí)。于是將該注意力函數(shù)轉(zhuǎn)化為三個(gè)連續(xù)的注意力,每個(gè)只關(guān)注于一個(gè)角度:
W(F)=πC(πS(πL(F)·F)·F)eq4·F
其中πL(·),πS(·),πC(·)分別是三個(gè)不同的注意力函數(shù),應(yīng)用在L、S、C三個(gè)維度上。
1.尺度自適應(yīng)注意力(ScaleAdaptiveAttention)
為了有效應(yīng)對不同尺度的對象,研究設(shè)計(jì)了一種尺度自適應(yīng)注意力模塊。該模塊通過學(xué)習(xí)特征層之間的相對重要性,能夠動態(tài)地調(diào)整特征表示,從而實(shí)現(xiàn)對不同尺度對象的靈活適應(yīng)。這一設(shè)計(jì)有助于提高模型的尺度不變性,進(jìn)一步提升其在處理多尺度目標(biāo)時(shí)的性能。數(shù)學(xué)上,這可以通過以下公式表示:
πL(F)·F=σ(f(F))·F
其中,F(xiàn)是輸入的特征張量;f(·)是一個(gè)線性函數(shù)通過1×1卷積層近似;σ(x)是sigmoid激活數(shù)。
2.空間一致性注意力(SpatialCoherenceAttention)
本研究引入空間一致性注意力模塊,通過可變形卷積和跨層級特征匯聚,增強(qiáng)模型對對象空間連貫性的理解,提升任務(wù)表現(xiàn)。其公式可以表示為:
πS(F)·F=1L∑Ll=1∑Kk=1wl,k·F(l;pk+Δpk;c)·Δmk
其中,L是特征層的數(shù)量;K是稀疏采樣位置的數(shù)量;+Δpk是通過自學(xué)習(xí)的空間偏移量;mk是在位置k的自學(xué)習(xí)重要性標(biāo)量。
3.任務(wù)導(dǎo)向注意力(TaskOrientedAttention)
本研究開發(fā)了任務(wù)導(dǎo)向注意力模塊[4],它能動態(tài)調(diào)整特征通道,按需激活或抑制通道以優(yōu)化分類和邊界框回歸等任務(wù),提升了模型在多樣檢測任務(wù)中的適應(yīng)性和表現(xiàn)。其公式如下:
πC(F)·F=maxα1(F)·Fc+β1(F),α2(F)·Fc+β2(F)
其中,F(xiàn)c是第c個(gè)通道的特征切片;α1、α2、β1、β2是通過全局平均池化和全連接層學(xué)習(xí)的超函數(shù),用于控制激活閾值。
最后,由于上述三個(gè)注意力機(jī)制是按照一定順序進(jìn)行應(yīng)用的,研究采用了串聯(lián)嵌套方式,并通過對串聯(lián)數(shù)量的調(diào)整實(shí)現(xiàn)了最佳效果。
結(jié)語
我們提出一種結(jié)合移動傳感器的道路裂縫檢測,這一創(chuàng)新方法顯著降低了所需的計(jì)算資源和時(shí)間成本。通過應(yīng)用卡爾曼濾波算法去除數(shù)據(jù)噪聲,并結(jié)合啟發(fā)式算法來精確識別路面的顛簸點(diǎn),我們能夠準(zhǔn)確地定位道路裂縫。
此外,我們引入了SCDYOLO,這是一種新型的計(jì)算機(jī)視覺方法,專門為提高道路裂縫檢測的精確度而設(shè)計(jì)。SCDYOLO模型采用了獨(dú)特的架構(gòu),集成了SWC2f特征提取模塊、CCAFM特征融合機(jī)制和Dyhead檢測頭,這些均構(gòu)建在YOLOv8n的基礎(chǔ)之上。SWC2f模塊擴(kuò)展了模型的感受,提升了特征提取效率;CCAFM機(jī)制優(yōu)化了特征融合過程,增強(qiáng)了模型的表征能力;而Dyhead的集成則強(qiáng)化了檢測頭,確保了結(jié)果的準(zhǔn)確性和穩(wěn)定性。這些創(chuàng)新使得SCDYOLO在平均精度均值(mAP)上比基準(zhǔn)模型提高了4.1%,并在性能上超越了當(dāng)前主流的目標(biāo)檢測算法。
參考文獻(xiàn):
[1]李朝勇,張成,韋海丹.基于多尺度特征融合網(wǎng)絡(luò)的路面裂縫分割方法研究[J].時(shí)空信息學(xué)報(bào),2023,30(03):425430.
[2]劉毅,陳一丹,高琳,等.基于多尺度特征融合的輕量化道路提取模型[J].浙江大學(xué)學(xué)報(bào)(工學(xué)版),2024,58(05):951959.
[3]王恒濤,張上,張朝陽,等.基于YOLOv5的輕量化PCB缺陷檢測[J].無線電工程,2022,52(11):20942100.
[4]羅禹杰,張劍,陳亮,等.基于自適應(yīng)空間特征融合的輕量化目標(biāo)檢測算法[J].激光與光電子學(xué)進(jìn)展,2022,59(04):302312.
基金項(xiàng)目:2020年海南省哲學(xué)社會科學(xué)規(guī)劃課題資助“海南省海洋漁業(yè)生態(tài)經(jīng)濟(jì)系統(tǒng)脆弱性及發(fā)展效率研究”[HNSK(QN)2012]
作者簡介:李佳霖(1988—),女,漢族,碩士研究生,博士在讀,講師,研究方向:應(yīng)用數(shù)學(xué);曹威威(1985—),男,漢族,博士,副教授,研究方向:自然地理學(xué)。