張志華 鄧硯學(xué) 張新秀
(1.蘭州交通大學(xué)測(cè)繪與地理信息學(xué)院 蘭州 730070;2.蘭州交通大學(xué)地理國(guó)情監(jiān)測(cè)技術(shù)應(yīng)用國(guó)家地方聯(lián)合工程研究中心 蘭州 730070;3.甘肅省地理國(guó)情監(jiān)測(cè)工程實(shí)驗(yàn)室 蘭州 730070;4.甘肅省公路路網(wǎng)檢測(cè)重點(diǎn)實(shí)驗(yàn)室 蘭州 730070)
裂縫和灌封裂縫作為瀝青路面最主要的2類(lèi)病害,其檢測(cè)結(jié)果為路面養(yǎng)護(hù)管理決策提供可靠的技術(shù)支持。
現(xiàn)階段,大多數(shù)瀝青路面病害檢測(cè)方法通過(guò)道路檢測(cè)車(chē)快速采集路面圖像,運(yùn)用基于圖像視覺(jué)的路面病害檢測(cè)方法,如自適應(yīng)閾值分割法、邊緣檢測(cè)法、形態(tài)法、小波分析等算法[1],實(shí)現(xiàn)瀝青路面病害提取。道路檢測(cè)車(chē)采集的圖像包含各種道路場(chǎng)景、車(chē)道線(xiàn)、油漬、不同的光照背景和其他污漬?;陂撝捣ǜ倪M(jìn)的路面病害檢測(cè)方法只能處理特定類(lèi)型的病害圖像[2],易受光照條件的影響[3-4],效率較低[5-6]。Hu等[7]開(kāi)發(fā)了基于簡(jiǎn)化局部二值模式子集的裂縫提取器,假設(shè)該子集可以使用邊緣、角點(diǎn)和平面區(qū)域信息提取路面裂縫,但忽略了背景紋理的復(fù)雜性。Zalama 等[8]使用Gabor 濾波器提取的視覺(jué)特征進(jìn)行裂縫檢測(cè),為了克服參數(shù)選擇困難的問(wèn)題,使用Ada-Boosting 組合多組弱分類(lèi)器進(jìn)行特征提取,并取得較好的結(jié)果。Shi 等[9]提出CrackForest,它將隨機(jī)森林結(jié)構(gòu)應(yīng)用于裂縫檢測(cè),用統(tǒng)計(jì)特征直方圖和統(tǒng)計(jì)鄰域直方圖之間的分布差異區(qū)分真實(shí)裂縫和噪聲。但是CrackForest無(wú)法去除連接到真實(shí)裂縫區(qū)域的噪聲。Nejad等[10]開(kāi)發(fā)了1個(gè)基于小波理論的路面破損檢測(cè)專(zhuān)家系統(tǒng)。這些方法無(wú)法準(zhǔn)確地將裂縫像素從復(fù)雜的背景紋理中分離出來(lái),因?yàn)闊o(wú)法捕獲足夠的全局結(jié)構(gòu)信息[9]。
得益于深度學(xué)習(xí)強(qiáng)大的非線(xiàn)性擬合能力和高效的圖像處理能力,基于深度學(xué)習(xí)的路面病害檢測(cè)方法提高了檢測(cè)效率。Cha 等[11]結(jié)合卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNN)和滑動(dòng)窗口技術(shù)識(shí)別裂縫,驗(yàn)證精度和測(cè)試速度均有明顯提升。Dorafshan等[12]結(jié)合CNN和邊緣檢測(cè)識(shí)別裂縫圖像,識(shí)別效率高于邊緣檢測(cè)方法。沙愛(ài)民等[13]使用3 個(gè)CNN模型級(jí)聯(lián)檢測(cè)路面裂縫和坑槽,檢測(cè)效果優(yōu)于傳統(tǒng)的圖像處理方法。Zhang 等[14]設(shè)計(jì)了1 個(gè)6 層CNN,用于檢測(cè)利用手機(jī)采集的裂縫數(shù)據(jù)集。盡管圖像質(zhì)量高、噪音低、易于處理,但與實(shí)際情況相去甚遠(yuǎn),參考價(jià)值不大;此外,網(wǎng)絡(luò)體系結(jié)構(gòu)的泛化能力較弱,難以處理包含真實(shí)路面的不同數(shù)據(jù)集。以上基于CNN的路面病害檢測(cè)方法效率較好,但檢測(cè)結(jié)果包含病害目標(biāo)、回歸框和背景,不能精確提取病害目標(biāo)。而基于深度學(xué)習(xí)的圖像語(yǔ)義分割能夠更精確地提取病害的幾何尺寸信息。全卷積網(wǎng)絡(luò)(fully convolutional network,F(xiàn)CN)[15]被運(yùn)用于圖像語(yǔ)義分割,即對(duì)圖像中不同對(duì)象進(jìn)行語(yǔ)義信息標(biāo)注,將圖像分割成和語(yǔ)義相關(guān)的不同圖像區(qū)域,包括背景和離散對(duì)象[16]?;诟怕首詣?dòng)編碼器[17]改進(jìn)的編解碼器網(wǎng)絡(luò)(encoder-decoder network)[18],其編碼器通過(guò)卷積與池化操作,提取圖像數(shù)據(jù)特征,生成高度抽象特征圖;解碼器通過(guò)反卷積與卷積操作恢復(fù)空間分辨率特征,逐步恢復(fù)為與原始數(shù)據(jù)相同維度的特征圖。SegNet[19]是語(yǔ)義分割中最經(jīng)典的編解碼網(wǎng)絡(luò)結(jié)構(gòu),對(duì)作為編碼器的VGG16 進(jìn)行改進(jìn),保留VGG16前13 層,刪除全連接層。在解碼器中,通過(guò)池化索引和上采樣運(yùn)算,網(wǎng)絡(luò)最終輸出的特征圖尺寸與輸入圖像一致。SegNet對(duì)路面街景圖像的分割效果較好,但對(duì)細(xì)小病害的分割能力較弱。U-Net[20]是基于SegNet 改進(jìn)的U 型編解碼結(jié)構(gòu),應(yīng)用于分割遙感圖像和生物醫(yī)學(xué)圖像。與SegNet 相比,U-Net 在解碼器中拼接了不同網(wǎng)絡(luò)層提取的特征圖,獲取了特征信息更豐富的特征圖,由于其中的裁剪等操作導(dǎo)致輸出圖像的尺寸與輸入圖像不一致。Yu等[21]使用雙邊分割網(wǎng)絡(luò)(bilateral segmentation network,BiSeNet),同時(shí)提高實(shí)時(shí)語(yǔ)義分割的精度和速度。BiSeNet 由空間路徑、上下文路徑和特征融合模塊組成,空間路徑提取空間信息并生成特征圖;上下文路徑由主干網(wǎng)和注意力模塊組成;提取紋理特征;特征融合模塊融合2 個(gè)部分特征。Bang 等[22]提出編碼器網(wǎng)絡(luò)由ResNet[23]組成,解碼器網(wǎng)絡(luò)由ZFNet[24]和反卷積層組成的編解碼網(wǎng)絡(luò),檢測(cè)由黑盒相機(jī)拍攝的街景圖像裂縫,但由于街景圖像包含各類(lèi)復(fù)雜物體且裂縫尺寸小,誤檢率較高。
綜上分析,路面病害提取存在以下問(wèn)題:①?gòu)?qiáng)度不均勻性和亮度不均勻性使得圖像總體質(zhì)量較差;②復(fù)雜的路面紋理在不同尺度下差異較大,大多數(shù)分割方法都難以取得較好的分割結(jié)果;③SegNet 對(duì)灌封裂縫的分割效果優(yōu)于裂縫,難以分割具有相似特征的灌封裂縫和裂縫,提取的裂縫不完整。為此,研究基于改進(jìn)SegNet的瀝青路面病害提取方法,采用標(biāo)線(xiàn)去除+MSRCR 方法增強(qiáng)圖像對(duì)比度;實(shí)驗(yàn)選擇ResNet50 和空洞卷積層組成編解碼網(wǎng)絡(luò);針對(duì)裂縫分割不連續(xù)的問(wèn)題,運(yùn)用形態(tài)學(xué)方法連接裂縫,實(shí)現(xiàn)對(duì)路面病害的精確提取。
瀝青路面病害提取流程見(jiàn)圖1。提取方法主要由圖像預(yù)處理、數(shù)據(jù)集構(gòu)建、語(yǔ)義分割和形態(tài)學(xué)閉運(yùn)算4 個(gè)部分組成。圖像預(yù)處理包括標(biāo)線(xiàn)去除,圖像對(duì)比度調(diào)整;數(shù)據(jù)集構(gòu)建包括圖像裁剪和樣本擴(kuò)增;語(yǔ)義分割包含SegNet改進(jìn)及參數(shù)調(diào)整;形態(tài)學(xué)閉運(yùn)算去除假陽(yáng)性,連通不連續(xù)的裂縫。
圖1 裂縫和灌封裂縫提取流程Fig.1 The workflow of extraction crack and sealed crack
實(shí)驗(yàn)中的圖像由安裝在道路檢測(cè)車(chē)上、距離路面約1 m 的相機(jī)拍攝獲得,分辨率為1 688×1 874。這些圖像包含各種道路場(chǎng)景、車(chē)道線(xiàn)、油漬、不同的光照條件和其他污漬,導(dǎo)致所采集圖像的對(duì)比度、色調(diào)和亮度差異較大。實(shí)驗(yàn)的研究目標(biāo)為裂縫(crack):橫向裂縫和縱向裂縫;灌封裂縫(sealed crack):人工使用瀝青混合料對(duì)橫向裂縫和縱向裂縫進(jìn)行灌封后形成的病害。如圖2(a)所示,路面標(biāo)線(xiàn)和光照不均勻均能降低圖像對(duì)比度,而改善對(duì)比度能夠提高病害的檢測(cè)精度。Wang 等[25]針對(duì)Retinex算法,提出了1 種GPU 加速的數(shù)據(jù)并行算法來(lái)改善圖像質(zhì)量。侯越等[26]利用卷積自編碼重構(gòu)圖像,擴(kuò)增數(shù)據(jù)集。Rizzi等[27]運(yùn)用自動(dòng)色彩均衡調(diào)整圖像的對(duì)比度,降低漏檢率。圖2(b)和圖2(c)分別是帶色彩恢復(fù)的多尺度視網(wǎng)膜增強(qiáng)算法(multi-scale retinex with color restoration,MSRCR)和色彩自動(dòng)均衡算法的處理結(jié)果;圖2(d)是運(yùn)用卷積自編碼算法對(duì)分辨率為256×256 的496 幅圖像迭代訓(xùn)練1 000 次后,算法的圖像重構(gòu)結(jié)果。MSRCR的性能優(yōu)于另外2種方法,但由于路面圖像中道路標(biāo)線(xiàn)的亮度遠(yuǎn)高于標(biāo)線(xiàn)四周路面,上述3 種方法均存在圖2 中的問(wèn)題,即箭頭處像素值與病害像素值相似,以及病害不清晰,這會(huì)導(dǎo)致裂縫誤檢和漏檢。利用白色道路標(biāo)線(xiàn)形狀有規(guī)則、整體像素值遠(yuǎn)大于其周?chē)访娴奶攸c(diǎn),取標(biāo)線(xiàn)四周4個(gè)點(diǎn)(不在標(biāo)線(xiàn)內(nèi))的像素值均值逐一填充標(biāo)線(xiàn)。在此基礎(chǔ)上利用MSRCR 方法可以消除標(biāo)線(xiàn)和光照對(duì)圖像質(zhì)量的影響,圖像效果見(jiàn)圖2(e),病害清晰,圖像質(zhì)量最好。
圖2 圖像增強(qiáng)處理效果Fig.2 The results of image enhancement processing
卷積神經(jīng)網(wǎng)絡(luò)網(wǎng)絡(luò)中,樣本尺寸越大,提取的信息就愈多,但相應(yīng)地對(duì)計(jì)算機(jī)的計(jì)算能力要求越高,模型訓(xùn)練、預(yù)測(cè)時(shí)間就越長(zhǎng)。路面檢測(cè)車(chē)所采集圖像的尺寸為1 688×1 874,選擇經(jīng)標(biāo)線(xiàn)去除+MSRCR處理后的1 031 幅圖像,使用labelme 標(biāo)注工具進(jìn)行精確標(biāo)注。受限于計(jì)算機(jī)的計(jì)算能力,將每幅圖像裁剪為9幅512×512尺寸的圖像,挑選出裂縫或者灌封裂縫面積占圖像面積比例較大的1 485 幅圖像。為了豐富樣本容量,將其上下、左右翻轉(zhuǎn)及旋轉(zhuǎn)180o后得到5 940幅圖像,見(jiàn)圖3。數(shù)據(jù)集的構(gòu)成見(jiàn)表1。
圖3 樣本擴(kuò)增Fig.3 Sample amplification
表1 數(shù)據(jù)集構(gòu)成Tab.1 Dataset composition
與隨機(jī)初始化CNN初始權(quán)重不同,遷移學(xué)習(xí)使用已訓(xùn)練模型的權(quán)重參數(shù)作為新模型的初始權(quán)重,有效減少模型對(duì)數(shù)據(jù)的需求。同時(shí),基于遷移學(xué)習(xí)的訓(xùn)練方法顯著地節(jié)省了訓(xùn)練時(shí)間[28]。遷移學(xué)習(xí)已被成功引入到路面病害檢測(cè)算法。文獻(xiàn)[29-30]結(jié)合數(shù)據(jù)驅(qū)動(dòng)、遷移學(xué)習(xí)和深度卷積神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)自動(dòng)檢測(cè)路面病害。Hang等[31]提出由基于張量投票的曲線(xiàn)檢測(cè)、遷移學(xué)習(xí)和分塊閾值組成的路面裂縫和灌封裂縫檢測(cè)方法,解決了裂縫和灌封裂縫易混淆的問(wèn)題。Chen等[32]使用基于SegNet的集成方法,檢測(cè)混凝土路面、瀝青路面和橋面裂縫。
遷移學(xué)習(xí)中選擇恰當(dāng)?shù)念A(yù)訓(xùn)練權(quán)重參數(shù)顯得尤為重要。網(wǎng)絡(luò)框架、訓(xùn)練樣本(訓(xùn)練域)和預(yù)訓(xùn)練權(quán)重所采用的樣本(原域)均需要仔細(xì)考慮。不同的網(wǎng)絡(luò)框架所獲的預(yù)訓(xùn)練權(quán)重的結(jié)構(gòu)不同。而原域與訓(xùn)練域之間需要考慮相似度和樣本容量的問(wèn)題。此處的相似度是訓(xùn)練域和原域的相似樣本量,樣本容量指的是原域的樣本容量。樣本容量越大,相似度越高,則訓(xùn)練時(shí)間越少,獲取的模型其預(yù)測(cè)精度越高,反之亦然。因此,在預(yù)訓(xùn)練權(quán)重的選擇考慮相似度的同時(shí),還需考慮樣本容量。當(dāng)樣本容量足夠大,但相似度很小甚至為零,那么預(yù)訓(xùn)練權(quán)重的引入對(duì)減少模型的訓(xùn)練時(shí)間和提高預(yù)測(cè)精度沒(méi)有明顯改善。
FCN 解碼時(shí)用反卷積操作來(lái)獲得特征圖,再和對(duì)應(yīng)編碼器的特征圖融合,得到輸出特征。SegNet結(jié)構(gòu)見(jiàn)圖4,在編碼器部分的最大池化操作時(shí)記錄了最大值索引,在解碼器部分通過(guò)對(duì)應(yīng)的池化索引實(shí)現(xiàn)非線(xiàn)性上采樣,得到1個(gè)稀疏特征圖,再通過(guò)卷積得到稠密特征圖。重復(fù)上采樣,最后用激活函數(shù)得到one-hot 分類(lèi)結(jié)果。
圖4 SegNet網(wǎng)絡(luò)結(jié)構(gòu)Fig.4 SegNet network structure
SegNet網(wǎng)絡(luò)用以識(shí)別路面裂縫時(shí)存在一般裂縫分割不連續(xù)、細(xì)微裂縫易漏檢、具有相似特征的裂縫和灌封裂縫的誤檢率較高的問(wèn)題。這是由以下2個(gè)原因所導(dǎo)致:①SegNet 網(wǎng)絡(luò)中連續(xù)的卷積和最大池化操作會(huì)丟失大量的特征信息;②路面裂縫病害本身的尺寸較小。因此,減少特征信息的損失并充分利用圖像的上下文信息是SegNet 網(wǎng)絡(luò)提高對(duì)病害識(shí)別精度的關(guān)鍵。實(shí)驗(yàn)對(duì)SegNet 網(wǎng)絡(luò)進(jìn)行3 點(diǎn)改進(jìn):①引入ResNet網(wǎng)絡(luò)作為編碼器。ResNet網(wǎng)絡(luò)只含有1 個(gè)池化層,且上個(gè)卷積層提取的信息會(huì)加入到下1個(gè)卷積層中。相比于VGG網(wǎng)絡(luò)的多個(gè)卷積和最大池化操作,ResNet 網(wǎng)絡(luò)減少了特征信息的丟失。②實(shí)驗(yàn)在ResNet 網(wǎng)絡(luò)中設(shè)計(jì)4 個(gè)空洞卷積層,空洞率分別為4,8,12,16??斩淳矸e層在不增加參數(shù)的同時(shí)增大了感受野,從而獲得更多的特征信息。每個(gè)空洞卷積層的空洞率是根據(jù)其對(duì)應(yīng)的特征圖確定的,空洞率過(guò)大或者過(guò)小都不合適。③實(shí)驗(yàn)運(yùn)用卷積核為1×1的卷積層對(duì)下采樣過(guò)程中獲取的特征圖進(jìn)行提取,并用跳躍連接方式將其拼接到上采樣對(duì)應(yīng)尺度的特征圖,跳躍連接能夠充分利用圖像的上下文特征信息。具體步驟如下。
網(wǎng)絡(luò)輸入層的圖像分辨率為512×512×3,分別代表寬度、長(zhǎng)度和通道數(shù)。編碼器網(wǎng)絡(luò)最終輸出特征圖的寬度、高度和卷積核數(shù)量為16×16×2 048。圖5 左側(cè)為ResNet50 的結(jié)構(gòu)示意圖。在解碼器中,如圖5 右側(cè)所示,特征圖F1:32×32×3 由2 條路徑共同產(chǎn)生:①用卷積核為1×1 的卷積層對(duì)編碼器所輸出的特征圖進(jìn)行卷積,得到特征圖16×16×3;②用空洞率為4、卷積核為3×3的卷積層,對(duì)編碼器提取的32×32×3的特征圖進(jìn)行卷積,得到特征圖16×16×3。將2條路徑獲得的特征圖融合后進(jìn)行2 倍上采樣,得到F1。特征圖F2:64×64×3 由3 條路徑共同產(chǎn)生:①F1;②用空洞率為8、卷積核為3×3的卷積層,對(duì)編碼器提取的64×64×3的特征圖進(jìn)行卷積,得到第2組特征圖;③用卷積核為1×1 的卷積層對(duì)32×32×3 特征圖進(jìn)行卷積,得到第3組特征圖。將3組特征圖融合并進(jìn)行2倍上采樣,得到F2。特征圖F3:128×128×3由3 條路徑共同產(chǎn)生:①F2;②用空洞率為12、卷積核為3×3 的卷積層,對(duì)編碼器提取的128×128×3 的特征圖進(jìn)行卷積,得到第2組特征圖;③用卷積核為1×1的卷積層對(duì)64×64×3特征圖進(jìn)行卷積,得到第3組特征圖。將3組特征圖融合并進(jìn)行2倍上采樣,得到F3;F4:256×256×3 的獲得過(guò)程與F3 相似。相比SegNet的上采樣+直接池化索引,上述操作能避免因池化操作引起的特征減少問(wèn)題。同時(shí),不同空洞率的空洞卷積層增加了感受野,提取不同尺度的特征,融合后的特征圖充分利用了病害圖像的上下文信息,包含更多細(xì)微病害的特征。
圖5 改進(jìn)的編解碼網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Improved encoder-decoder network structure
對(duì)F4 進(jìn)行2 倍上采樣,并通過(guò)SoftMax 層生成特征圖,其分辨率為512×512×3,代表其寬度、高度和類(lèi)別數(shù)。SoftMax 函數(shù)的值確定單個(gè)像素屬于特定類(lèi)別的概率,解碼器網(wǎng)絡(luò)選擇具有最大概率值的類(lèi)作為預(yù)測(cè)類(lèi)。
實(shí)驗(yàn)環(huán)境為windows10,anaconda 4.9.2,tensorflow-gpu 1.15.4,顯卡為微星Tesla T4,運(yùn)行內(nèi)存為16 GB。
衡量圖像語(yǔ)義分割方法性能的指標(biāo)包括準(zhǔn)確度、運(yùn)行時(shí)間和內(nèi)存占用[33],隨著計(jì)算機(jī)硬件及其計(jì)算性能的提高,準(zhǔn)確度顯得更總要。因此主要采用MIoU和F1。MIoU可以理解為各類(lèi)像素的預(yù)測(cè)區(qū)域和真實(shí)區(qū)域交并比的平均值,能夠反映出分割目標(biāo)和真實(shí)目標(biāo)的重合度。F1 是統(tǒng)計(jì)學(xué)中用來(lái)衡量分類(lèi)模型精確度的1 種指標(biāo),它同時(shí)兼顧了分類(lèi)模型的精確率(Precision)和召回率(Recall)。MIoU和F1的計(jì)算見(jiàn)式(1)~(2)。
式中:pii為分割正確的數(shù)量;pij為本屬于i類(lèi)但預(yù)測(cè)為j類(lèi)的像素?cái)?shù)量;pji為本屬于j類(lèi)但預(yù)測(cè)為i類(lèi)的像素?cái)?shù)量;K為圖像數(shù)量。
式中:TP為真陽(yáng)性,實(shí)際為正樣例預(yù)測(cè)為正樣例;FP為假陽(yáng)性,實(shí)際為負(fù)樣例預(yù)測(cè)為正樣例;FN為假陰性,實(shí)際為正樣例預(yù)測(cè)為負(fù)樣例;TN為真陰性,實(shí)際為負(fù)樣例預(yù)測(cè)為負(fù)樣例。TP+FP表示預(yù)測(cè)為正樣例的總數(shù),TP+FN表示實(shí)際的正樣例總數(shù)。
為了使與CNN參數(shù)相關(guān)的代價(jià)函數(shù)值最小,采用隨機(jī)梯度優(yōu)化方法訓(xùn)練模型。以交叉熵作為損失函數(shù),判定實(shí)際輸出與期望輸出的相似程度,見(jiàn)式(3)。
式中:J(θ)為代價(jià)函數(shù);pi為第i個(gè)像素的目標(biāo)值;qi為第i個(gè)像素的預(yù)測(cè)值;m為圖像中像素的總數(shù)。
同時(shí)采用適應(yīng)性距估計(jì)(adaptive moment estimation,Adam)優(yōu)化算法,Adam 優(yōu)化器的計(jì)算見(jiàn)式(4)。
式中:t為迭代指數(shù),設(shè)為200;θ為網(wǎng)絡(luò)參數(shù);mt和vt分別為一階動(dòng)量項(xiàng)和二階動(dòng)量項(xiàng);β1和β2為動(dòng)力值大小,分別取0.90 和0.995;m′t和v′t分別為mt和vt的無(wú)偏值;θt表示t時(shí)刻即第t迭代模型的參數(shù);?θJ(θ)為t次迭代代價(jià)函數(shù)關(guān)于θ的梯度大?。沪艦?個(gè)取值很小的數(shù),取10-8,η為學(xué)習(xí)率,取0.001。
以上為Adam 優(yōu)化器的網(wǎng)絡(luò)參數(shù),與其他優(yōu)化器相比,Adam具備計(jì)算高效、梯度下降平滑、適應(yīng)不穩(wěn)定的目標(biāo)函數(shù)和參數(shù)調(diào)整相對(duì)簡(jiǎn)單的優(yōu)點(diǎn),同時(shí)避免了局部最小化問(wèn)題。學(xué)習(xí)率使用多項(xiàng)式衰減策略,權(quán)重衰減使用L2 正則化,衰減系數(shù)設(shè)置為0.000 01。
實(shí)驗(yàn)使用訓(xùn)練集訓(xùn)練SegNet 模型,并對(duì)其進(jìn)行測(cè)試,結(jié)果見(jiàn)圖6(b)。燕尾箭頭所示的裂縫被分割成灌封裂縫,部分裂縫分割不連續(xù)。實(shí)線(xiàn)箭頭所指的假陽(yáng)性有2 類(lèi):①斑點(diǎn)狀病害。路面檢測(cè)車(chē)在不同條件下拍攝的圖像,質(zhì)量差異較大。路面光照條件良好、勻速行駛等條件下所拍攝的圖像質(zhì)量較好。路面光照條件較差、隧道、非勻速行駛等條件下拍攝的圖像質(zhì)量較差。此外,道路標(biāo)線(xiàn)同樣影響圖像對(duì)比度。由圖2 和圖6(a)可見(jiàn):雖然標(biāo)線(xiàn)去除+MSRCR方法提高圖像整體對(duì)比度,但部分非病害的像素值變得與病害的像素值相同,被預(yù)測(cè)為病害。②標(biāo)線(xiàn)裂縫,不屬于路面病害類(lèi)型。文中只去除嚴(yán)重影響圖像對(duì)比度的明亮標(biāo)線(xiàn),沒(méi)有去除不明顯且不影響圖像質(zhì)量的破損標(biāo)線(xiàn),破損標(biāo)線(xiàn)伴隨著標(biāo)線(xiàn)裂縫。虛線(xiàn)箭頭所指為分割不完整的裂縫。
實(shí)驗(yàn)對(duì)改進(jìn)的網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試,測(cè)試結(jié)果與SegNet相比,改進(jìn)網(wǎng)絡(luò)對(duì)細(xì)微裂縫的漏檢率和對(duì)特征相似的裂縫和灌封裂縫的誤檢率均得以改善,少量裂縫的分割結(jié)果不連續(xù)。部分裂縫的尺寸較小,尤其是毫米級(jí)的細(xì)微裂縫,因路面紋理復(fù)雜,其輪廓不連續(xù),致其分割結(jié)果不連續(xù)。在實(shí)際工作中,將上下或左右相鄰且間隔較小的2 條裂縫視為同1條裂縫。因此,先將裂縫膨脹運(yùn)算,將不連續(xù)的裂縫連通,再腐蝕運(yùn)算,恢復(fù)裂縫原尺寸,確保裂縫的分割精度。圖6(c)為最終的輸出結(jié)果。
圖6 實(shí)驗(yàn)結(jié)果Fig.6 Experiment results
為比較提出方法的檢測(cè)性能,將其與語(yǔ)義分割中典型的編解碼網(wǎng)絡(luò)BiSeNet 和SegNet 進(jìn)行對(duì)比。在相同數(shù)據(jù)集上,圖7 顯示3 種方法訓(xùn)練過(guò)程中MIoU和Loss的變化情況。提出方法的初始MIoU為59.1%,這是因?yàn)槭褂肦esNet50 的權(quán)重參數(shù)初始化編碼器。隨著訓(xùn)練次數(shù)增加到200 次,改進(jìn)方法的MIoU漸增至84.8%,Loss減小至0.009。
圖7 比較3種方法的MIoU 和LossFig.7 Comparing the MIoU and Loss of three methods
圖8顯示3種方法分割結(jié)果:SegNet分割效果較差,難以分割具有相似特征的裂縫和灌封裂縫,細(xì)微裂縫分割效果差,假陽(yáng)性較多;BiSeNet 的分割效果一般,預(yù)測(cè)結(jié)果中的假陽(yáng)性較少,但病害輪廓缺失嚴(yán)重,裂縫分割不完整;改進(jìn)方法對(duì)裂縫和灌封裂縫的分割結(jié)果與原圖中的病害輪廓一致,裂縫分割完整。
圖8 對(duì)比3種方法的分割結(jié)果Fig.8 Comparision segmentation results of three metholds
改進(jìn)算法在測(cè)試集中的測(cè)試性能見(jiàn)表2,檢測(cè)性能優(yōu)于BiSeNet和SegNet。
表2 對(duì)比3 種方法的平均測(cè)試結(jié)果Tab.2 Comparision the average testing results of three metholds
為了測(cè)試改進(jìn)方法的應(yīng)用性能,分別運(yùn)用3 種方法檢測(cè)甘肅省部分路段的168幅(1 688×1 874)病害圖像,檢測(cè)結(jié)果見(jiàn)表3。由表3 可見(jiàn):提出方法檢測(cè)裂縫102條(漏檢3條,誤檢2條),灌封裂縫165條(漏檢0條,誤檢1條)。SegNet檢測(cè)檢測(cè)裂縫107條(漏檢11條,誤檢15條:灌封裂縫預(yù)測(cè)成裂縫),灌封裂縫154條(漏檢15條,誤檢5條)。BiSeNet檢測(cè)裂縫109 條(漏檢7 條,誤檢13 條:灌封裂縫預(yù)測(cè)成裂縫),灌封裂縫156 條(漏檢13 條,誤檢5 條)。手動(dòng)提取裂縫103、灌封裂縫164 條。與手動(dòng)提取相比,本文方法對(duì)灌封裂縫的分割結(jié)果與其基本一致,裂縫的漏檢率,誤檢率分別為2.91%和1.94%。
表3 3 種方法的漏檢率和誤檢率Tab.3 The missed detection rate and false detection rate of the three methods
針對(duì)檢測(cè)車(chē)采集的圖像質(zhì)量差異大,SegNet 對(duì)細(xì)微裂縫分割性能較弱的問(wèn)題,提出融合語(yǔ)義分割和形態(tài)學(xué)方法的瀝青路面病害自動(dòng)提取方法,并通過(guò)實(shí)驗(yàn)驗(yàn)證得出如下結(jié)論。
1)標(biāo)線(xiàn)去除+MSRCR 可以減弱光照對(duì)圖像對(duì)比度的影響,凸顯病害特征。
2)利用改進(jìn)的編解碼網(wǎng)絡(luò)分割測(cè)試集中的裂縫和灌封裂縫,MIoU和F1分別為82.4%,98.9%。
3)提出的方法能夠完整地提取瀝青路面圖像中的裂縫和灌封裂縫,與人工手動(dòng)提取相比,裂縫的漏檢率和誤檢率分別為(2.91%,1.94%),優(yōu)于Seg-Net(10.68%,14.56%)和BiSeNet(6.80%,12.62%)。
瀝青路面病害包括橫向裂縫、縱向裂縫、龜裂、塊狀裂縫、塊狀修補(bǔ)、松散、坑槽等11 類(lèi)病害,文中研究了裂縫(橫向裂縫、縱向裂縫)和灌封裂縫。在今后的研究中,進(jìn)一步提高對(duì)瀝青路面病害的提取精度,提高算法對(duì)公路路面多種病害的泛化能力。