楊書杰 彭 嫣
(同濟大學道路與交通工程教育部重點實驗室 上海 201804)
路面結構處于復雜的環(huán)境變化中,在與外界環(huán)境進行熱交換的過程中,路面溫度也隨之發(fā)生變化。路面材料的使用性能直接受到溫度影響。例如,路表溫度過高易使車輛輪胎內(nèi)氣壓升高進而有爆胎的危險、路表溫度過低則易結冰降低路面安全性能。因此,對中短期時間尺度內(nèi)的路表溫度進行預測具有重要的社會經(jīng)濟價值?,F(xiàn)有的路面溫度預估方法主要有理論法與統(tǒng)計法兩類。
嚴作人[1]依據(jù)熱傳導理論建立了層狀體的溫度場問題求解方法。理論法基于傳熱學原理,建立并求解了路面溫度場偏微分方程,得到了未來某時刻的路面溫度。該方法物理意義明確、普適性強,然而需要的參數(shù)較多,在實際運用中,方程中的熱工參數(shù)也難以準確獲取,這些因素限制了模型的應用。
傳統(tǒng)的統(tǒng)計法在對路面溫度進行長期監(jiān)測后采集到大量的相關數(shù)據(jù),基于數(shù)理統(tǒng)計的原理,建立了路面溫度與各種氣象因素之間的多元回歸模型,該方法所需參數(shù)較少且較易獲得。李伊[2]、張曦[3]等采用多元回歸模型建立了路面溫度與氣象參數(shù)之間的回歸方程,但由于不同研究人員在方程的形式、參數(shù)等關鍵問題處理上均有一定的差異,限制了模型的推廣使用。
近年來,機器學習理論廣泛運用于各學科中,由于其具有數(shù)據(jù)處理效率高、解決非線性問題能力強的特點,在預估路面溫度的課題當中得到了一定的應用,取得了良好的效果[4-6]。
依托于山西大同國家氣象觀測站,在站點內(nèi)鋪設了水泥、瀝青2種路面結構試驗區(qū),利用溫度傳感器采集路表溫度,傳感器于路面結構層施工時埋設,埋設位置位于結構表面中心處,采集頻率為10 min/次,精度為±0.5 ℃,無限傳輸設備可以定時上傳數(shù)據(jù)至計算機中。同時,氣象站點每隔1 h采集1次氣溫、相對濕度、太陽輻射、風速等氣象數(shù)據(jù),時間自2009年7月-2010年7月。數(shù)據(jù)上傳后,氣象數(shù)據(jù)由氣象站工作人員進行校驗,路面溫度數(shù)據(jù)則依據(jù)傳感器測溫范圍進行了異常值處理。鋪面結構示意見圖1。
圖1 鋪面結構示意圖
模型特征應基于路面結構的實際熱交換過程。故當路面各結構層之間接觸良好且無熱阻情況下,路面溫度場θi(z,t)的偏微分方程可表示為
(1)
在路表處有
(2)
式中:θi(z,t)為第i層距路表深度z處t時刻的溫度;αi為第i層導熱系數(shù);q1(0,t)為t時刻的路表熱流;λ1為路表結構層的導熱系數(shù)。
對于接近表面的結構層而言,其熱交換主要由以下兩部分構成。
1) 與下層結構的熱交換。路表與表面以下的結構層存在溫度梯度,這導致兩者之間發(fā)生一定的熱交換。由于底部溫度在24 h內(nèi)振幅一般小于0.5 ℃,故結構層內(nèi)的熱源主要是路表,談至明[7]指出,可以根據(jù)歷史時刻的路表溫度對結構層的溫度進行估計。故有必要將歷史時刻的路表溫度作為特征。本文選取過去4 h的路表溫度納入模型中。
2) 與外界環(huán)境的熱交換。外界氣象要素的變化是路表溫度變化的根本原因,太陽輻射與天空逆輻射是路表的熱源,同時在風的作用下,路表與空氣通過熱對流進行熱量交換。因此,應將太陽輻射、氣溫、風速等氣象參數(shù)納入模型當中,模型輸入的參數(shù)見表1。
表1 模型輸入?yún)?shù)
LightGBM是微軟公司提出的一種實現(xiàn)梯度提升決策樹(GBDT)的集成學習框架,其核心是GBDT算法,基于boosting的集成思想,通過若干個CART決策樹作為基學習器進行模型的迭代,并最終生成了一個強學習器,實現(xiàn)了對目標變量的預測。相較于傳統(tǒng)GBDT框架,其在不降低精度的條件下能大幅加快訓練速度,廣泛應用于各種預測問題中。
模型的輸入為訓練樣本D={(x1,y1),(x2,y2),…,(xm,ym)},損失函數(shù)L(y,c),基學習器的個數(shù)N。輸出為路面溫度預估值yi。GBDT算法的訓練流程如下。
步驟1。初始化模型,得到初始學習器
(3)
步驟2。迭代n=1,2,…,N個基學習器:
1) 遍歷i=1,2,…,m個訓練樣本,對第i個樣本,計算當前模型在損失函數(shù)中的負梯度。
(4)
2) 擬合上一步得到的殘差,得到1棵新回歸樹。新回歸樹的葉子節(jié)點區(qū)域為Rnk,k=1,2,…,J。J為回歸樹的葉子節(jié)點個數(shù)。
3) 遍歷k=1,2,…,J個葉子節(jié)點,計算最優(yōu)擬合結果。
(5)
4) 更新學習器
(6)
損失函數(shù)采用實際意義明確的均方差函數(shù)
(7)
式中:xi為輸入變量;yi為輸出變量;f(xi)為預測值;n為樣本數(shù)。
現(xiàn)場實驗共對水泥、瀝青2種路面進行了為期1年、10 min/次的數(shù)據(jù)采集,各得到了5×104余條路面溫度數(shù)據(jù)。氣象數(shù)據(jù)每個整點記錄1次,其中,太陽輻射為小時內(nèi)輻射總量,其余參數(shù)為小時內(nèi)平均值。為了確保路面溫度數(shù)據(jù)與氣象數(shù)據(jù)相匹配,取整點時刻的路表溫度作為訓練數(shù)據(jù),與氣象數(shù)據(jù)共同送入模型中訓練。利用python平臺的LightGBM、scikit-learn等相關庫開展實驗,訓練集與測試集的劃分比例為4∶1,利用網(wǎng)格搜索得到最佳的超參數(shù)后,分別得到了1 h與3 h的預估結果。
預估結果的評價指標采用均方根誤差RMSE與預報準確率Accuracy 2個指標進行評價,以允許誤差為3 ℃計算準確率[8],兩指標的計算公式分別見式(8)和式(9)。
(8)
(9)
式中:yi_true為實測溫度,℃;yi_pred為預估溫度,℃;n為樣本數(shù)。
預估未來1 h的路面溫度時,測試樣本上瀝青路面的RMSE為1.12 ℃,水泥路面為0.82 ℃,2種路面的預估溫度與實測溫度對比圖均圍繞45°等值線上下波動。1 h預估溫度與實測溫度比對結果見圖2。
圖2 2種路面1 h預估結果
預估未來3 h內(nèi)的路面溫度時,氣象要素的時間尺度從1 h增加為3 h,將未來3 h內(nèi)的太陽輻射、風速、氣溫輸入模型當中,測試樣本上水泥路面的RMSE為1.31 ℃,瀝青路面為1.86 ℃,2種路面的預估精度均出現(xiàn)了一定程度的下降。3 h預估溫度與實測溫度比對結果見圖3。
圖3 2種路面3 h預估結果
比較圖2與圖3發(fā)現(xiàn),在低溫階段3 h與1 h的預測效果均較好,實測溫度與預測溫度均勻分布在45°等值線上下,當路面溫度大于40 ℃時,3 h時間尺度的預估結果精度出現(xiàn)了明顯下降,這表明誤差的增大主要是由于高溫階段預估結果的精度下降造成的。其主要原因可能是夏季正午前后路表溫度快速上升,由于云對太陽輻射有削弱作用且其分布具有隨機性,導致路面溫度變化的不確定性增加,進而導致預估精度下降。
由圖2、圖3還可知,2種時間尺度下水泥路面的RMSE均小于瀝青路面,準確率也高于瀝青路面,水泥路面的預估效果優(yōu)于瀝青路面的原因可能在于瀝青的體積熱容較小而輻射吸收能力較強,導致瀝青路面溫度變化對外界環(huán)境的噪音更為敏感。
預估結果的精度與準確度比較結果見表2,除瀝青路面3 h的預估結果外,2種時間尺度下路表溫度的預估精度都達到了95%以上。
表2 預估結果精度比較
在相同地區(qū)同一數(shù)據(jù)集上的研究中,使用理論法進行預估時RMSE在2.5 ℃上下[9-10],其他學者使用多元回歸等方法進行預估時RMSE在2~3 ℃之間。機器學習的方法對路表溫度進行預估具有較好的效果,在未來進一步的研究中,隨著數(shù)據(jù)量的增加與氣象參數(shù)的拓展,其預估效果仍有一定的優(yōu)化空間。
本文采用了LightGBM這一機器學習集成框架在中短期時間尺度內(nèi)對路面溫度進行了預估,得到了如下結論:
1) 相較于理論法與傳統(tǒng)的經(jīng)驗法,該方法具有需要參數(shù)少、中間參數(shù)處理簡單的特點,特別是在數(shù)據(jù)量較大時,機器學習的方法能夠更充分有效地利用數(shù)據(jù)。
2) 在瀝青、水泥2種路面結構上,1 h與3 h 2個時間尺度的預估結果均取得了良好的效果,RMSE在0.82~1.86 ℃之間,準確度在93.2%~98.9%之間,水泥路面的預估效果優(yōu)于瀝青路面。
3) 低溫狀況下2種路面在中短期時間尺度下預估精度均較好,預估溫度與實測溫度均勻分布在45 ℃等值線上下;高溫狀況下預估精度有所下降。
4) 影響預估結果的主要因素有估計時效、結構類型與氣象因素。其中,由于氣象因素較為復雜,難以全面考慮,且不可避免地存在著各種噪音,造成了預估結果存在一定誤差。預估時效的延長,造成了預估誤差的疊加;相對與水泥路面,瀝青路面的溫度變化對環(huán)境因素更加敏感,當氣象因素存在一定的不確定性時,其預估結果的誤差將大于水泥路面。
由于不同地區(qū)具有不同的氣候特點,加之路面結構的熱工參數(shù)也有差異,模型能否進一步推廣于其他地區(qū)尚需在新的數(shù)據(jù)集上加以驗證。如何進一步合理納入云等氣象要素作為特征以降低高溫狀況下路表溫度的預估誤差,仍有待進一步研究。