張 軍, 姜文濤, 張 云, 羅婷倚, 余秋琴, 楊 哲
(1.長安大學(xué) 公路養(yǎng)護(hù)裝備國家工程實(shí)驗(yàn)室,陜西 西安 710064;2.長安大學(xué) 道路施工技術(shù)與裝備教育部重點(diǎn)實(shí)驗(yàn)室,陜西 西安 710064;3.廣西北投公路建設(shè)投資集團(tuán)有限公司,廣西 南寧530028;4.廣西交科集團(tuán)有限公司,廣西 南寧 530007)
水泥路面具有強(qiáng)度高、耐久性好的特點(diǎn),但存在水泥路面層與基層剛度不匹配問題。在溫度和車輛荷載的重復(fù)作用下,面層底部出現(xiàn)脫空區(qū)域并逐步擴(kuò)展,最終導(dǎo)致路面出現(xiàn)斷板。脫空區(qū)域的橫向尺寸是影響路面結(jié)構(gòu)承載力的重要參數(shù)[1],因此準(zhǔn)確識別水泥路面脫空的橫向尺寸對水泥路面的養(yǎng)護(hù)工作具有指導(dǎo)意義。
探地雷達(dá)(GPR)是利用高頻電磁波在介質(zhì)中的反射和散射來實(shí)現(xiàn)淺層成像和定位的高分辨率深層無損探測技術(shù),通過路面電磁特性變化定性或定量地識別地下目標(biāo)體,因此被廣泛應(yīng)用于地下空洞[2]、管線[3-4]和路面病害[5]的定位與識別。路面病害的識別集中于基于B-scan 的圖譜分析和基于A-scan 的機(jī)器學(xué)習(xí)。圖譜分析法是借助深度遷移學(xué)習(xí)對雷達(dá)B-scan圖譜中的病害區(qū)域進(jìn)行識別[6-8],已用于傳力桿[9-10]、管道[11]、裂縫[12]和其他目標(biāo)的智能識別[13]。王輝等[14]設(shè)計了級聯(lián)結(jié)構(gòu)的卷積神經(jīng)網(wǎng)絡(luò),用于雙曲線目標(biāo)分類。針對脫空區(qū)域的圖譜特征識別,筆者采用淺層混合網(wǎng)絡(luò)Resnet18-YOLOv2 實(shí)現(xiàn)了機(jī)場跑道空洞區(qū)域的定位[6]。然而,深度遷移學(xué)習(xí)需要大量準(zhǔn)確標(biāo)記的樣本圖譜和大量取芯驗(yàn)證,加上路面病害區(qū)域無固定的寬高比,難以在圖譜上準(zhǔn)確標(biāo)注病害區(qū)域,導(dǎo)致病害區(qū)域的邊界定位存在誤差,因此需要研究病害邊界的高精度識別方法。
相比圖譜識別,基于A-scan信號特征的病害識別在橫向尺寸上獲得更高的精度,目前常見的建模方法有支持向量機(jī)(SVM)[15-16]、人工神經(jīng)網(wǎng)絡(luò)(ANN)[7]、隨 機(jī) 森 林(RF)[17]和 極 限 梯 度 提 升(XGBoost)等方法[18-19]。覃暉等[20]將GPR 信號分段并提取方差、標(biāo)準(zhǔn)絕對偏差和四階矩等3個特征,對隧道襯砌空洞病害的識別準(zhǔn)確率為93.56%,但時域特征抗強(qiáng)干擾能力較差。為提高模型的抗干擾能力,周輝林等[21]采用2 個時域信號特征(幅值、平均絕對偏差)和4 個小波近似系數(shù)作為SVM 輸入建模,公路路基病害檢測識別的準(zhǔn)確率為92.7%,但未明確病害類型。為獲得路面病害的敏感特征參數(shù),筆者借鑒旋轉(zhuǎn)設(shè)備的故障識別方法,用28個時頻特征表征病害,通過主成分分析(PCA)降維和ANN構(gòu)建了瀝青路面水損害識別模型,識別準(zhǔn)確率達(dá)到92.4%[7]。杜豫川等[19]將每道A-scan 數(shù)據(jù)劃分為p段,分別提取能量、方差、偏度和對數(shù)功率譜等特征值,并將特征值輸入XGBoost用于模型訓(xùn)練,對路面脫空病害的識別準(zhǔn)確率為96%,但段數(shù)p需要根據(jù)經(jīng)驗(yàn)設(shè)置?,F(xiàn)有研究為脫空病害識別提供了參考,但仍存在以下問題:①未考慮不同的GPR設(shè)備天線頻率和采樣頻率之間存在的差異;②模型的泛化能力不強(qiáng),需要人工設(shè)置合理的模型參數(shù);③模型中病害區(qū)域的數(shù)據(jù)樣本量小。因此,還需要研究高效、高精度的脫空病害識別方法。
以水泥路面脫空病害為研究對象,采用正演模擬、室內(nèi)模型和現(xiàn)場試驗(yàn)相結(jié)合的方法建立了標(biāo)準(zhǔn)脫空數(shù)據(jù)集,其中包含10 732 條脫空數(shù)據(jù)和10 251條正常數(shù)據(jù)。針對GPR 天線頻率和采樣參數(shù)不一致的問題,提出用重采樣和標(biāo)準(zhǔn)化方法統(tǒng)一數(shù)據(jù)采樣信息和幅值范圍。在時頻特征提取方法[22]的基礎(chǔ)上,增加了平均能量和偏度[19]2 個時域特征,將脫空數(shù)據(jù)集進(jìn)行特征處理,構(gòu)建了30 個時頻特征數(shù)據(jù)集。采用XGBoost 算法建立脫空識別模型,并通過取芯驗(yàn)證了模型的準(zhǔn)確性。
在實(shí)際服役中水泥路面受到溫度荷載和車輛荷載的耦合作用,出現(xiàn)由板底塑性變形導(dǎo)致的板底脫空,最終形成斷板。板底脫空包括充氣脫空和含水脫空,充氣脫空是板底脫空的早期形態(tài)。圖1 展示了板底脫空的部位。隨著時間的推移,脫空尺寸逐漸擴(kuò)大,雨水滲透后形成含水脫空。
圖1 水泥路面板底脫空Fig.1 Void under cement pavement slab
以板底充氣脫空為例,簡化充氣脫空的形狀,使用16~300 mm不等的矩形脫空和圓形脫空進(jìn)行室內(nèi)試驗(yàn)和正演模擬,并綜合現(xiàn)場試驗(yàn)數(shù)據(jù)構(gòu)建脫空數(shù)據(jù)集。正演模擬和室內(nèi)試驗(yàn)提供標(biāo)準(zhǔn)脫空特征,并為現(xiàn)場判斷脫空提供依據(jù),現(xiàn)場試驗(yàn)數(shù)據(jù)用于模型訓(xùn)練和驗(yàn)證模型的準(zhǔn)確性。脫空數(shù)據(jù)集構(gòu)成如圖2所示。
圖2 脫空數(shù)據(jù)集構(gòu)建Fig.2 Void dataset construction
1.2.1 正演模擬
gprMax 正演模擬是以時域有限差分為基礎(chǔ)的雷達(dá)信號仿真算法,被廣泛應(yīng)用于GPR 的病害模擬,以獲得病害區(qū)域的信號特征[23-24]。構(gòu)建如圖3所示的脫空模型,C1~C4為圓形脫空,R1~R4為矩形脫空。根據(jù)實(shí)際路面的材料特性,設(shè)置脫空、水泥混凝土和半剛性基層的介電常數(shù)分別為1、7和9,水泥混凝土厚度為240 mm,仿真參數(shù)如表1所示。采用gprMax 3.1.5 進(jìn)行正演模擬,獲得如圖4 所示的結(jié)果,脫空病害區(qū)域均表現(xiàn)為雙曲線特征,其寬度與病害橫向尺寸相關(guān)。
表1 gprMax仿真模型參數(shù)Tab.1 Parameters of gprMax simulation model
圖3 正演脫空模型(單位:mm)Fig.3 Simulated void model(unit:mm)
圖4 正演脫空模型的B-scan結(jié)果Fig.4 B-scan results of simulated void model
1.2.2 室內(nèi)試驗(yàn)
從仿真結(jié)果可知,脫空形狀并不影響脫空特征。為此,室內(nèi)模型僅考慮不同尺寸的矩形脫空,構(gòu)建了橫向尺寸分別為100、90、80、70、60、50、40、30、25、16 mm 的10 個矩形脫空區(qū)域A1~A10,脫空區(qū)域的中心深度和中心間隔分別為200 mm和150 mm。模型材料為型號C30 的水泥混凝土,尺寸為2 070 mm×400 mm,如圖5 所示。意大利IDS 公司的RIS 型900 MHz 和美國US 公司的1 000 MHz 天線沿著如圖5所示的雷達(dá)測線方向?qū)δP椭械拿摽諈^(qū)域進(jìn)行多次數(shù)據(jù)采集,具體雷達(dá)參數(shù)設(shè)置如表2所示。獲得的雷達(dá)圖譜如圖6 所示,分別為RIS 和US雷達(dá)實(shí)測剖面圖譜。
表2 探地雷達(dá)系統(tǒng)參數(shù)設(shè)置Tab.2 GPR system parameter settings
圖5 室內(nèi)試驗(yàn)水泥板模型Fig.5 Model of lab test
圖6 室內(nèi)模型雷達(dá)實(shí)測剖面圖譜Fig.6 GPR results of lab model
探地雷達(dá)的縱向分辨率與雷達(dá)天線的頻率有關(guān),具體關(guān)系如下所示:
式中:Δr為探地雷達(dá)的縱向分辨率;λe為探地雷達(dá)波在介質(zhì)中傳播的波長。
以波速0.1 m·ns-1為例,900 MHz和1 000 MHz的電磁波在混凝土的波長分別為111 mm 和100 mm,根據(jù)式(1)可得最小可探測脫空尺寸分別約為28 mm 和25 mm,因此2 個天線難以分辨25 mm 和16 mm兩處脫空區(qū)域,導(dǎo)致這兩處區(qū)域的GPR圖譜不清晰,但可以使用更高天線頻率的GPR設(shè)備或者三維GPR檢測小尺寸的脫空區(qū)域。
1.2.3 現(xiàn)場試驗(yàn)
對廣西桂林永??h永鹿路部分路面進(jìn)行數(shù)據(jù)采集,部分路面已經(jīng)出現(xiàn)斷板(見圖7b)。由專業(yè)檢測人員和安全員協(xié)調(diào)下進(jìn)行GPR 檢測,如圖7d 所示。試驗(yàn)設(shè)備包括MALA ProEx 系統(tǒng)、800 MHz 天線和安裝了GroundVision 的個人電腦,采樣頻率為14.5 GHz,每道采樣點(diǎn)數(shù)為308,時窗觸發(fā)間隔為0.01 s。 典型路面圖譜如圖8所示。
圖7 現(xiàn)場試驗(yàn)Fig.7 Field test
圖8 現(xiàn)場路面B-scan圖譜Fig.8 B-scan results of field test
采用以上3 種試驗(yàn)方法,共獲取60 萬道A-scan數(shù)據(jù),正演模擬5萬道,室內(nèi)模型5萬道,現(xiàn)場檢測50萬道。使用ReflexW 軟件對上述數(shù)據(jù)進(jìn)行分析,并對數(shù)據(jù)集中的脫空區(qū)域數(shù)據(jù)給出“1”的真值標(biāo)簽,正常區(qū)域數(shù)據(jù)給出“0”的真值標(biāo)簽。經(jīng)過人工篩選后,選擇20 983 道A-scan 數(shù)據(jù)作為數(shù)據(jù)集,其中10 623道為室內(nèi)和現(xiàn)場數(shù)據(jù)(脫空6 745道,正常3 878道),10 360道為正演數(shù)據(jù)(脫空3 987道,正常6 373道),合計脫空數(shù)據(jù)10 732道,正常數(shù)據(jù)10 251道。
對正反演GPR 數(shù)據(jù)進(jìn)行分析,如圖9 所示。與現(xiàn)場數(shù)據(jù)相比,正演數(shù)據(jù)中沒有噪聲和干擾,而室內(nèi)試驗(yàn)與現(xiàn)場試驗(yàn)數(shù)據(jù)均存在干擾和噪聲。因雷達(dá)設(shè)備的不同,室內(nèi)模型數(shù)據(jù)的幅值明顯低于現(xiàn)場路面數(shù)據(jù)的幅值,但在脫空病害部位具有相似的回波形狀。因此,需要對GPR 數(shù)據(jù)進(jìn)行預(yù)處理,才能將正反演數(shù)據(jù)結(jié)果都用于后期建模。
圖9 正演模擬、室內(nèi)和現(xiàn)場試驗(yàn)的A-scan數(shù)據(jù)對比Fig.9 Comparison of GPR signal among simulation,lab and field tests
通過對比,確定了如圖10所示的七步預(yù)處理方法以增強(qiáng)脫空特征,包括去直流漂移(去除直流漂移)、零點(diǎn)矯正(去除天線與地面距離的誤差)、能量增益(增強(qiáng)深層病害信號)、背景去除(減去平均道)、巴特沃斯帶通濾波(濾除高頻雜波干擾)、滑動平均和F-K 偏移(糾正脫空區(qū)域偏移成分)。同時,為了解決采樣頻率不一致,采用重采樣方法將原始數(shù)據(jù)轉(zhuǎn)為具有相同采樣頻率的數(shù)據(jù)。
圖10 雷達(dá)數(shù)據(jù)預(yù)處理流程Fig.10 Flow chart of radar data preprocessing
不同天線頻率以及數(shù)據(jù)源差異均導(dǎo)致電磁波幅值差異,因此采用標(biāo)準(zhǔn)化處理方法,將GPR 數(shù)據(jù)處理成均值為0 和標(biāo)準(zhǔn)差為1 的數(shù)據(jù),具體方法如下所示:
式中:X為探地雷達(dá)采集的數(shù)據(jù)矩陣;為標(biāo)準(zhǔn)化后的數(shù)據(jù)矩陣;σ為整體數(shù)據(jù)方差;μ(X)為整體數(shù)據(jù)均值。
參照水損害的特征提取方法[7],對每一條Ascan數(shù)據(jù)提取了16個時域特征和12個頻域特征,另外增加平均能量和偏度(P18)2 個時域特征,累計30個特征(P1~P30)。P8、P17、P18的計算式如下所示:
式中:xi為該道A-scan第i個采樣點(diǎn)數(shù)據(jù),i=1,2,…,n,n是每條A-scan的采樣點(diǎn)數(shù)。對提取的30個時頻域特征采用式(2)進(jìn)行標(biāo)準(zhǔn)化處理。圖11為3種數(shù)據(jù)源中脫空區(qū)域和正常區(qū)域特征參數(shù)的對比結(jié)果。對比正常和脫空的信號特征,發(fā)現(xiàn)正演模型的特征中除P6、P9、P19、P27外,其余特征存在明顯的差異;在室內(nèi)模型的特征數(shù)據(jù)中,除P19、P21和P22外,其余特征均存在明顯差異;在實(shí)際路面特征中,除P3和P5外,其余特征數(shù)據(jù)均存在明顯差異。結(jié)果表明,在這3種數(shù)據(jù)源中,正常與脫空數(shù)據(jù)的特征P2、P4、P7、P8、P10、P11、P13~P17、P20、P24~P26、P28和P30均存在明顯的差異,說明所選的時頻域特征可用于脫空病害表征。
圖11 30個時頻域特征值對比Fig.11 Comparison of 30 time-frequency domain feature values
為了實(shí)現(xiàn)脫空識別,對數(shù)據(jù)集的20 983 道數(shù)據(jù)進(jìn)行時域和頻域特征的提取,提取的時頻域特征組成一個30×N(N=20 983)的特征數(shù)據(jù)集矩陣。將1.2節(jié)中給出的對應(yīng)每一條A-scan數(shù)據(jù)的真值標(biāo)簽移植到時頻域特征數(shù)據(jù)集中,構(gòu)成含有真值標(biāo)簽的31×N特征數(shù)據(jù)集,這個數(shù)據(jù)集用于后續(xù)模型訓(xùn)練。
對提取的30 個時頻域特征進(jìn)行特征重要性分析,選擇最小的特征子集,可加快模型訓(xùn)練速度和提升識別性能。特征重要性分析常用的方法有卡方檢驗(yàn)、互信息、基于樹模型和費(fèi)希爾信息的方法。由于各種特征分析方法存在評價指標(biāo)的差異,因此采用基于多種方法融合的分析方法來選取重要特征。特征重要性分析流程如圖12所示。
圖12 特征重要性分析流程Fig.12 Flow chart of feature significance analysis
由于4種特征重要性分析方法的評價得分范圍存在差異,單純地將得分相加不能得到客觀的最終得分,因此對4種分析方法的得分進(jìn)行歸一化處理,歸一化結(jié)果相加得到最終的重要性評價得分。4 種分析方法歸一化和相加的最終得分如圖13所示,時頻域特征重要性分析的最終得分排序如圖14所示。
圖13 特征重要性得分歸一化結(jié)果Fig.13 Normalization results of feature significance score
圖14 特征重要性得分排序Fig.14 Ranking of feature significance
選取綜合得分大于1的21個時頻域特征作為識別模型的輸入。進(jìn)一步地去除31×N數(shù)據(jù)集中非重要的特征,得到含有真值標(biāo)簽的22×N數(shù)據(jù)集,用于識別模型的訓(xùn)練。
對于XGBoost算法,為避免模型過擬合,加快訓(xùn)練速度,提升擬合及預(yù)測精度,損失函數(shù)應(yīng)用了二階泰勒展開,在目標(biāo)函數(shù)中加入正則項(xiàng)。將含有N個樣本m個特征的數(shù)據(jù)集分為2類,數(shù)據(jù)集
建立二分類模型,樣本Xi在第k輪預(yù)測值的表達(dá)式如下所示:
式中:K表示模型中總的決策樹數(shù);F表示回歸樹空間;ω表示回歸樹葉子節(jié)點(diǎn)權(quán)重;q表示回歸樹結(jié)構(gòu),把每個樣本節(jié)點(diǎn)映射到對應(yīng)葉子節(jié)點(diǎn)的索引;q(Xi)表示樣本Xi所在的葉子節(jié)點(diǎn);T表示葉子節(jié)點(diǎn)數(shù)。
XGBoost算法的目標(biāo)函數(shù)包括損失函數(shù)和正則項(xiàng)兩部分,定義如下:
GPR 檢測過程中存在噪聲、干擾和天線跳動問題,連續(xù)的GPR數(shù)據(jù)中存在單道或者連續(xù)幾道的干擾信號,致使識別模型對此類數(shù)據(jù)給出錯誤的識別結(jié)果。小尺寸的脫空病害也會對識別結(jié)果產(chǎn)生干擾,降低識別結(jié)構(gòu)的可讀性。采用如圖15所示的高斯權(quán)重系數(shù),當(dāng)連續(xù)的GPR數(shù)據(jù)識別結(jié)果中存在孤立點(diǎn)時,將雷達(dá)圖譜的識別結(jié)果中孤立點(diǎn)兩側(cè)的識別結(jié)果乘以高斯權(quán)重系數(shù)進(jìn)行綜合考慮。應(yīng)用時將圖15中的中心點(diǎn)(第i個識別結(jié)果)對應(yīng)的數(shù)據(jù)作為該道識別結(jié)果的權(quán)重,其左右5 個權(quán)重系數(shù)分別賦給該道左右相鄰5 道,通過與設(shè)定的閾值進(jìn)行比較來過濾孤立點(diǎn)。
圖15 高斯權(quán)重系數(shù)曲線Fig.15 Gaussian weight coefficient curve
將GPR 信號數(shù)據(jù)集通過特征提取和歸一化后構(gòu)建特征數(shù)據(jù)集,并分為訓(xùn)練集和測試集,訓(xùn)練集用于XGBoost 模型訓(xùn)練,測試集用于模型的識別性能測試。預(yù)測模型建立流程如圖16所示。
圖16 XGBoost模型訓(xùn)練流程Fig.16 Flow chart of XGBoost model training
(1) 將含有真值標(biāo)簽的時頻特征數(shù)據(jù)集(22×N)隨機(jī)抽取70%作為XGBoost 模型訓(xùn)練集樣本,30%作為模型測試集樣本。
(2) 將訓(xùn)練集樣本輸入算法模型中進(jìn)行訓(xùn)練,并采用交叉驗(yàn)證和網(wǎng)格搜索方法調(diào)整模型的max_depth(最大樹深)和n_estimators(子學(xué)習(xí)器個數(shù))等超參數(shù),獲得最優(yōu)的預(yù)測模型。
(3) 將測試集樣本輸入預(yù)測模型,檢驗(yàn)?zāi)P偷念A(yù)測準(zhǔn)確率,并存儲預(yù)測模型。訓(xùn)練后獲得的最優(yōu)模型將用于后續(xù)路面脫空病害識別。
模型識別結(jié)果的評價指標(biāo)可以從混淆矩陣中導(dǎo)出。具體的分類評價標(biāo)準(zhǔn)及其公式和含義如表3所示。表3中,N表示測試集樣本總數(shù),Mii表示模型對類別ci準(zhǔn)確識別的樣本個數(shù),M*i表示類別ci樣本個數(shù),Mi*表示模型識別為類別ci的樣本個數(shù)。上述指標(biāo)越接近1,代表模型的分類效果越好。
表3 準(zhǔn)確性評價指標(biāo)Tab.3 Accuracy evaluation index
為提高模型的準(zhǔn)確率,采用五折交叉驗(yàn)證和網(wǎng)格搜索方法調(diào)優(yōu)模型的關(guān)鍵參數(shù)[25]。XGBoost模型中max_depth和n_estimators對預(yù)測模型的過擬合性敏感,并影響模型收斂的穩(wěn)定性。根據(jù)XGBoost 模型超參數(shù)調(diào)參時的經(jīng)驗(yàn),將max_depth 調(diào)優(yōu)范圍設(shè)置為[2,20],n_estimators 調(diào)優(yōu)范圍設(shè)置為[10,2 000],比較在不同的最大樹深和不同的子學(xué)習(xí)器個數(shù)的情況下模型的收斂速度與識別精度。根據(jù)圖17a 中模型max_depth 參數(shù)調(diào)優(yōu)曲線,將max_depth設(shè)置為11,模型的準(zhǔn)確率為94.12%。根據(jù)圖17b中n_estimators調(diào)優(yōu)曲線,將n_estimators設(shè)置為1 000,模型的準(zhǔn)確率為94.14%。對預(yù)測模型其他參數(shù)采取同樣的調(diào)優(yōu)操作,最終確定模型的最優(yōu)參數(shù)組合,如表6所示。
圖17 參數(shù)調(diào)優(yōu)曲線Fig.17 Parameter tuning curve
使用表4中調(diào)優(yōu)后的模型超參數(shù)數(shù)值和70%的數(shù)據(jù)集進(jìn)行XGBoost 模型訓(xùn)練。為比較模型性能,相同的數(shù)據(jù)集還用于RF和ANN模型訓(xùn)練。模型建模平臺均使用Python 語言,在CPU-AMD R7 5800H(3.20 GHz)、16 GB RAM 和GPU-NVIDIA GeForce RTX 3060 Laptop(6 GB)計算機(jī)上進(jìn)行。將驗(yàn)證集(30%的數(shù)據(jù)集)輸入建立的3種識別模型中,計算3 種識別模型在驗(yàn)證集上的評價指標(biāo)。由表5可見,3種模型在測試集上的識別準(zhǔn)確率排序?yàn)閄GBoost (99.63%) >ANN (99.30%) >RF(99.28%)。從識別準(zhǔn)確率看,XGBoost模型比另外2 種模型更有效地區(qū)分雷達(dá)數(shù)據(jù)中的脫空病害和正常數(shù)據(jù),對測試集中的脫空數(shù)據(jù)產(chǎn)生的誤判率更低。
表4 模型參數(shù)調(diào)優(yōu)值Tab.4 Parameter values of optimal model
表5 模型識別性能評價Tab.5 Performance evaluation of recognition models
為了確定所提方法的有效性,在測試數(shù)據(jù)集(950 道數(shù)據(jù))上進(jìn)行對比,結(jié)果如圖18 所示??梢钥闯?,3 種識別模型結(jié)果中都存在如圖18 中E 標(biāo)識所指的單道(孤立點(diǎn))A-scan誤判結(jié)果。XGBoost模型的識別結(jié)果中存在的單道A-scan 誤判情況明顯優(yōu)于RF和ANN模型的識別結(jié)果。統(tǒng)計3種模型的識別準(zhǔn)確率和消耗時間,如表6 所示。 XGBoost 模型對水泥路面雷達(dá)數(shù)據(jù)的識別準(zhǔn)確率可達(dá)98.10%,識別過程共耗時0.141 s;RF 算法的識別準(zhǔn)確率為93.17%,識別過程共耗時0.196 s; ANN 模型的識別準(zhǔn)確率為95.10%,識別過程共耗時0.203 s。與RF 和ANN 模型相比,XGBoost 模型具有更高的預(yù)測準(zhǔn)確率和更快的識別速度 。
表6 模型識別性能Tab.6 Performance of recognition models
圖18 XGBoost、RF和ANN模型識別結(jié)果Fig.18 Performance of XGBoost, RF and ANN models
將圖4中的正演模型數(shù)據(jù)采取與訓(xùn)練集相同的預(yù)處理流程,提取雷達(dá)數(shù)據(jù)的時頻域特征,輸入XGBoost 識別模型中,獲得如圖19 所示的預(yù)測結(jié)果??梢钥闯?,XGBoost 模型對正演圖譜中大多數(shù)脫空區(qū)域都給出了“1”的識別結(jié)果,準(zhǔn)確給出圓形脫空的雙曲線特征范圍,對矩形脫空的橫向尺寸給出了較高準(zhǔn)確率的識別。圖20 為XGBoost 正演模型識別脫空尺寸和實(shí)際脫空尺寸的對比。從圖20 可見,XGBoost 正演模型對矩形脫空和圓形脫空的橫向尺寸的誤差在8 mm以內(nèi)。造成此現(xiàn)象的原因是:F-K偏移對仿真數(shù)據(jù)中的圓形脫空雙曲線特征產(chǎn)生了誤差。
圖20 脫空橫向尺寸對比Fig.20 Comparison of lateral dimension
任取2 段存在脫空區(qū)域的數(shù)據(jù),考慮單個脫空和多處脫空的狀態(tài),現(xiàn)場檢測GPR 結(jié)果如圖21a、b所示。按照圖10預(yù)處理流程進(jìn)行了特征提取后,將特征數(shù)據(jù)輸入XGBoost 模型,識別結(jié)果如圖21 所示。圖21c、e為模型直接輸出的識別結(jié)果??芍?,脫空區(qū)域被準(zhǔn)確識別,但識別結(jié)果中存在多道孤立點(diǎn),具體原因如下:
圖21 實(shí)際路面脫空病害識別Fig.21 Identification of actual pavement void disease
(1) XGBoost 模型給出連續(xù)的“1”的識別結(jié)果比孤立的“1”的識別結(jié)果更能說明此處路面脫空病害的存在,在對路面脫空病害尺度的評估中占有更大權(quán)重。
(2) XGBoost 模型識別結(jié)果中存在稀疏的孤立“1”的結(jié)果,可能不是由路面脫空病害造成的,如數(shù)據(jù)集不全面;在進(jìn)行雷達(dá)數(shù)據(jù)采集時存在干擾造成的雷達(dá)信號波動;存在早期的脫空病害(橫向尺寸小于2 cm),但尺寸過小難以驗(yàn)證。
實(shí)際項(xiàng)目中主要關(guān)注大范圍脫空區(qū)域,為減少孤立點(diǎn)對識別結(jié)果的干擾,引入識別結(jié)果的后處理方法。當(dāng)一條A-scan的XGBoost模型識別結(jié)果為“1”,左右相鄰的連續(xù)10條雷達(dá)數(shù)據(jù)的識別結(jié)果與高斯判斷系數(shù)相乘并相加的和等于或大于5時,此條A-scan識別結(jié)果才為“1”。此外,如果一個測試段(10條Ascan)雷達(dá)數(shù)據(jù)中有90%的A-scan都被XGBoost模型識別為“1”,整個測試段就被視為一個連續(xù)的脫空區(qū)域,XGBoost模型的結(jié)果都修改為“1”。
對XGBoost 模型識別結(jié)果進(jìn)行后處理,得到如圖21d、f 所示的后處理結(jié)果,后處理可以有效地去除孤立點(diǎn)的影響。在圖21d 中,已經(jīng)形成了長尺寸的脫空區(qū)域,連續(xù)脫空區(qū)域會在車輛交變荷載等作用下發(fā)展為更大的脫空,需要及時采取補(bǔ)救措施。GPR 專家可以識別圖21f 中的脫空區(qū)域。然而,在對比度較低的雷達(dá)圖譜中脫空區(qū)域很難評價。在0~100 條和300~400 條A-scan 之間存在兩處小尺寸的脫空區(qū)域,說明此脫空區(qū)域處于早期階段;在200~300 條A-scan 存在相鄰很近的兩處脫空區(qū)域,說明這兩處脫空會發(fā)展為連續(xù)的脫空區(qū)域。
上述驗(yàn)證結(jié)果表明,所構(gòu)建的模型可有效地確定路面脫空區(qū)域。為進(jìn)一步驗(yàn)證模型的準(zhǔn)確性,在封閉交通的條件下,對模型識別出脫空的位置(見圖22a)采用破碎鎬進(jìn)行破碎,并通過針孔攝像頭對破碎孔進(jìn)行觀察,結(jié)果如圖22b所示。針孔成像結(jié)果驗(yàn)證了脫空病害的存在,進(jìn)一步驗(yàn)證了算法的準(zhǔn)確性。
圖22 取芯驗(yàn)證Fig.22 Verification by coring
(1)分析了GPR在脫空和正常區(qū)域的時域和頻域響應(yīng)差異,提出了18個時域和12個頻域的時頻域特征,用以表征脫空和正常區(qū)域的GPR數(shù)據(jù)。通過正演模擬、室內(nèi)試驗(yàn)和現(xiàn)場試驗(yàn)構(gòu)建脫空數(shù)據(jù)集來訓(xùn)練XGBoost模型,實(shí)現(xiàn)了脫空病害的自動識別。
(2) 提出了重采樣和標(biāo)準(zhǔn)化的GPR數(shù)據(jù)處理方法,統(tǒng)一不同GPR 數(shù)據(jù)的采樣頻率,解決了不同采樣頻率和不同天線頻率對識別模型的影響,可以解決不同源的數(shù)據(jù)使用和識別問題。
(3) 對 比 了XGBoost、RF 和ANN 的 模 型,XGBoost 模型最優(yōu),脫空識別準(zhǔn)確率達(dá)到了98.10%,高于ANN(95.10%)和RF(93.17%)。
作者貢獻(xiàn)聲明:
張 軍:論文構(gòu)思,論文撰寫和修改。
姜文濤:模型構(gòu)建,程序設(shè)計,論文撰寫及修改。
張 云:開展室內(nèi)和現(xiàn)場試驗(yàn)。
羅婷倚:開展現(xiàn)場試驗(yàn)和數(shù)據(jù)分析。
余秋琴:試驗(yàn)數(shù)據(jù)分析。
楊 哲:孤立點(diǎn)的權(quán)重系數(shù)設(shè)計。