許有成,杜亞冰
(1.安徽理工大學(xué) 土木建筑學(xué)院,安徽 淮南 232001;2.河南城建學(xué)院 數(shù)理學(xué)院,河南 平頂山 467036)
車轍指道路路面在受到行車荷載、路面材料、氣候環(huán)境條件等因素長期影響下,引起面層、基層以及底基層的塑性變形(見圖 1)[1-2]。車轍是瀝青路面的主要病害形式,也是MEPDG(《力學(xué)-經(jīng)驗(yàn)路面設(shè)計(jì)指南》)中衡量瀝青路面關(guān)鍵性能的一項(xiàng)標(biāo)準(zhǔn)。MEPDG是由美國NCRHP(國家合作高速公路研究計(jì)劃項(xiàng)目)于1996年資助并在2004年正式出版發(fā)行的一項(xiàng)路面設(shè)計(jì)指南,代表著美國最先進(jìn)的道路路面設(shè)計(jì)方法,對(duì)于路面病害防治有著重要的意義[3-5]。MEPDG中建立的車轍預(yù)測(cè)模型能夠?yàn)檠芯咳藛T以及從業(yè)者提供參考,并在其模型基礎(chǔ)上進(jìn)行改進(jìn)來提高預(yù)測(cè)準(zhǔn)確性。近年來,研究人員投入了大量的時(shí)間與金錢用于改進(jìn)工作[6]。但是,根據(jù)Pierce Linda M和McGovern Ginger的觀點(diǎn),僅有三個(gè)機(jī)構(gòu)將原始的MEPDG方法作為設(shè)計(jì)工具,原因是MEPDG使用的線性回歸模型用于預(yù)測(cè)路面破壞與壽命在準(zhǔn)確性方面還有待提高[7]。所以,在MEPDG設(shè)計(jì)方法的基礎(chǔ)上搭建更全面、效果更突出的預(yù)測(cè)模型就顯得十分重要。
近年來,機(jī)器學(xué)習(xí)領(lǐng)域備受各個(gè)行業(yè)關(guān)注,通過不斷學(xué)習(xí)輸入變量的數(shù)據(jù)特征探尋當(dāng)中的規(guī)律從而選擇合適的權(quán)重參數(shù),成為解決眾多回歸以及分類問題的一種優(yōu)異方法,逐步應(yīng)用于道路工程。其中,最具有代表性的就是集成學(xué)習(xí)里面的RFR(隨機(jī)森林回歸)算法。RFR指的是利用多棵決策樹對(duì)樣本進(jìn)行訓(xùn)練并預(yù)測(cè)的一種分類器,如圖2所示,該分類器能夠用于建立高預(yù)測(cè)性能的模型[8]并具有可以同時(shí)處理十分龐大的數(shù)據(jù)量、準(zhǔn)確預(yù)估未知值、魯棒性較好的優(yōu)點(diǎn)。例如Gong Hongren成功地用RFR算法準(zhǔn)確地預(yù)測(cè)了道路IRI(國際平整度指數(shù))[9]。Luo Xiaohua通過RFR算法對(duì)路面密封層數(shù)據(jù)進(jìn)行處理并得出密封層厚度對(duì)車轍和IRI性能至關(guān)重要的結(jié)論[10]。
本文通過使用Python編程語言下的Scikit-learn擴(kuò)展包建立一個(gè)RFR模型以提高車轍預(yù)測(cè)的準(zhǔn)確性,并分析輸入變量之間的影響因素。構(gòu)建模型的數(shù)據(jù)來源于從美國28個(gè)州收集的包含88個(gè)站點(diǎn)在內(nèi)的共計(jì)440個(gè)樣本[11-12]。將RFR模型結(jié)果與傳統(tǒng)線性回歸模型進(jìn)行比較,并對(duì)模型的性能進(jìn)行評(píng)價(jià)。
(a)結(jié)構(gòu)性車轍
(b)失穩(wěn)性車轍
圖2 決策樹結(jié)構(gòu)圖
由于瀝青層直接與車輛輪胎接觸,因此也是發(fā)生車轍破壞的主要層面。MEPDG中關(guān)于瀝青層車轍的計(jì)算公式為:
Δp(AC)=εp(AC)hAC=β1rkzεr(AC)10k1rnk2rβ2rTk3rβ3r
(1)
其中:Δp(AC)——AC(瀝青)層累積永久變形(英寸,1英寸=2.54 cm);εp(AC)——AC層累積塑性軸向應(yīng)變;h(AC)——AC層厚度(英寸);β1r,β2r,β3r——地方標(biāo)定系數(shù);kz——深度圍壓系數(shù);k1r,k2r,k3r——全體標(biāo)定系數(shù);εr(AC)——瀝青層中部回彈應(yīng)變。
其他未結(jié)合層塑性變形的計(jì)算公式為:
(2)
其中:Δp(unbound)——未結(jié)合層永久變形(英寸);ks1——修正系數(shù);εv——平均豎向回彈應(yīng)變;hunbound——未結(jié)合層厚度(英寸);ε0——材料參數(shù);εr——室內(nèi)實(shí)驗(yàn)時(shí)回彈應(yīng)變;n——交通荷載數(shù)。
根據(jù)式(1)和式(2),將道路各個(gè)層位的塑性變形計(jì)算后進(jìn)行加權(quán)求和得出車轍值,因此需要選擇合適的權(quán)重參數(shù)確保達(dá)到最佳組合。根據(jù)式(1)選擇適當(dāng)?shù)膋2r和k3r值后,再利用式(3)的參數(shù)最小化函數(shù)確定式(2)中的ks1值。ΔTotal的最終結(jié)果通過式(4)計(jì)算線性組合后得到。
arg min∑k1rk2rk3rks1(ΔTotal-ΔActual)2
(3)
(4)
其中:ΔTotal——計(jì)算得出的車轍深度(英寸);ΔActual——實(shí)際測(cè)得的車轍深度(英寸);kij——標(biāo)定系數(shù)矩陣;Δlayers——每層的塑性變形矩陣。
在完成上述線性回歸模型的構(gòu)建后,需要對(duì)評(píng)估模型的質(zhì)量進(jìn)行評(píng)價(jià)。常用的評(píng)價(jià)指標(biāo)是計(jì)算相關(guān)系數(shù)R2和標(biāo)準(zhǔn)差Se。R2表示未來樣本中有多少可以被該模型解釋,其值介于0~1。R2越高,能夠被解釋的樣本越多,模型的效果越好。Se是總體各單位標(biāo)準(zhǔn)值與其平均數(shù)離差平方的算術(shù)平均數(shù)的平方根,反映組內(nèi)個(gè)體間的離散程度,Se越小,數(shù)據(jù)點(diǎn)越向中心線集中,模型擬合得越好。R2和Se的計(jì)算公式為:
(5)
(6)
(7)
決策樹是機(jī)器學(xué)習(xí)領(lǐng)域中常用的一種監(jiān)督學(xué)習(xí)方法,監(jiān)督學(xué)習(xí)就是在結(jié)果已知的情況下對(duì)給定樣本進(jìn)行訓(xùn)練[13]。如圖 2所示,決策樹主要有決策根節(jié)點(diǎn)、決策節(jié)點(diǎn)和葉子節(jié)點(diǎn)構(gòu)成,樣本數(shù)據(jù)由根節(jié)點(diǎn)開始往下將數(shù)據(jù)進(jìn)行分類,每一層都有自己的分類規(guī)則,直到數(shù)據(jù)達(dá)到不可再分為止,整體看上去像個(gè)倒立的樹,由此得名[14]。數(shù)據(jù)在學(xué)習(xí)的時(shí)候需要根據(jù)結(jié)果對(duì)權(quán)重值進(jìn)行優(yōu)化,提升模型的性能。單棵樹計(jì)算產(chǎn)生的結(jié)果可能具有偶然性,隨機(jī)森林通過構(gòu)造一組隨機(jī)創(chuàng)建的決策樹并預(yù)測(cè)每棵樹所屬類模式(分類)或均值(回歸)來進(jìn)行工作[15-16]。簡(jiǎn)單來說,隨機(jī)森林就是將眾多決策樹并行地集成到一起,再根據(jù)每一棵樹的計(jì)算結(jié)果將它們按一定權(quán)重值組合到一起。
大量且可靠的數(shù)據(jù)集對(duì)于成功構(gòu)建監(jiān)督學(xué)習(xí)方法模型至關(guān)重要,在本次RFR訓(xùn)練中,使用了從LTPP(長期路面性能)數(shù)據(jù)庫中收集的來自美國28個(gè)州包含在內(nèi)的88個(gè)站點(diǎn)共計(jì)440個(gè)樣本數(shù)據(jù)集,目前可以在NCHRP 項(xiàng)目01-37A發(fā)布的兩個(gè)報(bào)告當(dāng)中的附錄EE-1和附錄GG-1中查看這些數(shù)據(jù),交通相關(guān)數(shù)據(jù)來源于LTPP InfoPave網(wǎng)站。數(shù)據(jù)有10列輸入變量特征值和1列實(shí)際測(cè)得的車轍作為目標(biāo)值,表1列出了這些變量的具體內(nèi)容。
表1 輸入變量以及來源
2.3.1 數(shù)據(jù)集劃分
訓(xùn)練模型開始前需要對(duì)樣本進(jìn)行數(shù)據(jù)集劃分,根據(jù)實(shí)際需求一般分成三個(gè)相互獨(dú)立的部分:訓(xùn)練集、驗(yàn)證集和測(cè)試集。訓(xùn)練集用于估計(jì)模型,驗(yàn)證集用于確定模型結(jié)構(gòu),而測(cè)試集用于檢驗(yàn)?zāi)P托阅躘17]。對(duì)于本次RFR模型搭建,隨機(jī)選擇了352個(gè)樣本(數(shù)據(jù)的80%)用于訓(xùn)練,其余的88個(gè)樣本(數(shù)據(jù)的20%)用于測(cè)試。考慮到樣本數(shù)據(jù)量有限,單獨(dú)設(shè)置驗(yàn)證集非常浪費(fèi),為了充分利用現(xiàn)有數(shù)據(jù),在機(jī)器學(xué)習(xí)中引入了交叉驗(yàn)證方法[14]。經(jīng)過多次嘗試,最終使用了四重交叉驗(yàn)證。在驗(yàn)證特定結(jié)果時(shí),整個(gè)過程需要分為四次迭代計(jì)算。在第一次中,將前三個(gè)用作訓(xùn)練集,最后一個(gè)用作驗(yàn)證集以得到結(jié)果,每次使用不同于之前的數(shù)據(jù)作為驗(yàn)證集,其余作為訓(xùn)練集。以這種方式經(jīng)過四次迭代計(jì)算后,獲得四個(gè)結(jié)果,然后將最后的四個(gè)結(jié)果取平均值,從而獲得最終的模型評(píng)估結(jié)果。
2.3.2 模型調(diào)參
在配置模型時(shí)需要確定適當(dāng)?shù)某瑓?shù),例如樹的個(gè)數(shù)、最大深度、節(jié)點(diǎn)最小分裂所需樣本個(gè)數(shù)以及葉子節(jié)點(diǎn)最小樣本數(shù)等。超參數(shù)的選擇主要影響RFR的預(yù)測(cè)精度以及計(jì)算速度。為了選擇最佳模型配置,在一定限制范圍內(nèi)利用隨機(jī)搜索方法來確定最佳模型,最終結(jié)果見表2。
表2 超參數(shù)選擇
圖3 誤差衰減過程
圖4 變量重要性分析
如圖3所示,經(jīng)過800次循環(huán)迭代計(jì)算后,模型的誤差達(dá)到最小。圖4展示了不同變量對(duì)車轍產(chǎn)生的影響程度,AC層的塑性變形和AADTT是主要因素,因?yàn)楸砻鎸又苯映惺苘囕v施加荷載,在輪胎的反復(fù)滾動(dòng)摩擦作用下容易累積產(chǎn)生塑性變形。為了更好地評(píng)價(jià)模型,使用相同數(shù)據(jù)按照MEPDG方法構(gòu)建了一個(gè)線性回歸模型,并將所得結(jié)果與RFR模型進(jìn)行比較,圖5繪制出了兩種模型的最終效果,具體參數(shù)見表 3。
表3 模型結(jié)果比較
圖5 模型訓(xùn)練效果
對(duì)于線性回歸模型,R2與Se在訓(xùn)練集中分別為0.27和3.256 mm,在測(cè)試集中分別為0.392和3.23 mm。對(duì)于隨機(jī)森林回歸模型,R2與Se在訓(xùn)練集中分別為0.84和1.93 mm,在測(cè)試集中分別為0.875和1.41 mm。與線性回歸模型相比,在訓(xùn)練集中,R2提升了211%,Se下降了40.7%;在測(cè)試集中,R2提升了123%,Se下降了56.3%。因此RFR模型的預(yù)測(cè)能力比線性回歸模型表現(xiàn)更為出色。由于傳統(tǒng)的線性模型處理數(shù)據(jù)過于單一,很難對(duì)整體樣本進(jìn)行全面解釋,RFR模型通過不斷監(jiān)督學(xué)習(xí)樣本數(shù)據(jù)特征進(jìn)行反復(fù)迭代運(yùn)算,能夠充分利用數(shù)據(jù),因此得到的模型也能更好地解釋數(shù)據(jù),從而表現(xiàn)出較高的預(yù)測(cè)能力。
通過構(gòu)建RFR模型并預(yù)測(cè)瀝青路面性能車轍的深度。利用來自NCHRP項(xiàng)目01-37A的兩個(gè)最終報(bào)告以及LTPP網(wǎng)站數(shù)據(jù),通過考慮相關(guān)的影響因素來控制RFR的輸入變量,調(diào)整了RFR的超參數(shù)以優(yōu)化模型,最大程度地提升了最終結(jié)果的準(zhǔn)確性和可靠性。通過結(jié)果分析,得出以下結(jié)論:
(1)與線性回歸模型相比,使用RFR模型預(yù)測(cè)車轍深度時(shí),在訓(xùn)練集中,R2提升了211%,Se下降了40.7%;在測(cè)試集中,R2提升了123%,Se下降了56.3%;預(yù)測(cè)結(jié)果準(zhǔn)確性有了大幅提升。
(2)通過變量的重要性分析可以看出,不同的變量對(duì)模型的影響程度不同。最主要的影響因素是AC層的塑性變形和AADTT,因?yàn)楸砻鎸又苯映惺苘囕v施加荷載,并且在輪胎的反復(fù)擠壓摩擦作用下,容易使塑性變形發(fā)生累積。
(3)該模型是通過在機(jī)器學(xué)習(xí)領(lǐng)域隨機(jī)森林算法對(duì)數(shù)據(jù)進(jìn)行監(jiān)督學(xué)習(xí)而建立的,可以很好地計(jì)算并預(yù)估瀝青路面的車轍深度,不僅為獲悉路面破壞狀況提供了參考,而且能夠指導(dǎo)道路的周期檢測(cè)和維護(hù)。
河南城建學(xué)院學(xué)報(bào)2022年2期