摘要 文章將基于高速公路沿線自建觀測站樁和氣象站收集的長序列能見度觀測數(shù)據(jù)作為輸入,利用長短時(shí)記憶模型(LSTM)構(gòu)建了能見度的監(jiān)測和外推模型,分別開展逐5 min間隔、30 min時(shí)效的外推試驗(yàn),同時(shí)定量評估了不同模型結(jié)構(gòu)、訓(xùn)練時(shí)間及有無遺忘層對結(jié)果的影響。外推結(jié)果表明,LSTM模型的最大RMSE可達(dá)3.75 km,調(diào)整訓(xùn)練輸入尺度參數(shù)后,RMSE減小幅度達(dá)33.3%;調(diào)整訓(xùn)練時(shí)間步長后,RMSE進(jìn)一步減少了3.5%;加入遺忘層后RMSE又進(jìn)一步減少了10.9%,為0.73 km,但也存在10 min外推時(shí)效內(nèi)RMSE增大的情況。由于能見度在10 km以下的事件對交通安全的影響較大,提取了10 km以下的能見度事件進(jìn)行了獨(dú)立評估,發(fā)現(xiàn)增加遺忘層對10 km以下的RMSE有增大的趨勢。該研究能夠提前預(yù)判低能見度的演變過程,相關(guān)結(jié)果已應(yīng)用在交管部門并協(xié)助其提前決策,一定程度上減少了惡劣天氣對交通造成的不利影響。
關(guān)鍵詞 短臨監(jiān)測;LSTM;能見度
中圖分類號 U495 文獻(xiàn)標(biāo)識碼 A 文章編號 2096-8949(2024)22-0007-03
0 引言
高速公路提供高速、便捷的運(yùn)輸手段,是社會(huì)經(jīng)濟(jì)發(fā)展的重要條件。隨著交通事業(yè)不斷發(fā)展,截至2022年底[1],我國當(dāng)前公路里程已達(dá)到535.48萬公里,其中高速公路里程11.99萬公里。然而,相關(guān)研究也指出,我國高速公路交通事故頻次居高不下,在造成大量生命和財(cái)產(chǎn)損失的同時(shí),也嚴(yán)重影響路網(wǎng)運(yùn)行效率[2],因此其事故危害性遠(yuǎn)高于普通公路[3]。能見度是用來衡量大氣透明度的距離指標(biāo),代表水平方向的可見距離。研究指出,當(dāng)能見度小于100 m時(shí),交通事故發(fā)生的概率密度會(huì)比其他情況高出30%[4]。面對頻繁出現(xiàn)的低能見度惡劣天氣,高速公路沿線氣象產(chǎn)品與服務(wù)的準(zhǔn)確性和精細(xì)化,對于提高交通運(yùn)輸?shù)陌踩燥@得尤為重要[5]。
許多學(xué)者已在利用氣象數(shù)據(jù)輔助道路決策中開展了大量工作,唐亞平等[6]利用沈山高速公路沿線10個(gè)交通氣象站的氣象觀測資料建立了數(shù)學(xué)模型,對公路路面溫度、能見度及冰雪路面等交通氣象環(huán)境進(jìn)行了判識。同時(shí),也有學(xué)者采用天氣學(xué)與統(tǒng)計(jì)學(xué)相結(jié)合的方法,以及直接使用環(huán)境氣象數(shù)值預(yù)報(bào)模式,針對高速公路能見度開展了相應(yīng)研究,賀皓等[7]依據(jù)陜西省的三條高速公路的大霧天氣,制作了大霧氣象成因的概念模型;林云等[8]根據(jù)空氣質(zhì)量觀測和相對濕度建立了與能見度時(shí)空特征的統(tǒng)計(jì)關(guān)系,構(gòu)建了適合深圳市區(qū)的能見度統(tǒng)計(jì)模型;美國大氣研究中心、美國環(huán)境預(yù)報(bào)中心等科研機(jī)構(gòu)[9-10]基于WRF建立了氣象化學(xué)耦合模式(WRF-Chem)等。
交管部門對于形成突然、范圍較小的局地性事件[11]進(jìn)行實(shí)際決策時(shí),需要提前15~30 min預(yù)判惡劣天氣可能對交通安全造成的不利影響,進(jìn)而采取限流或封路等措施。目前針對能見度的相關(guān)研究,一方面統(tǒng)計(jì)方法雖然時(shí)效上滿足,但準(zhǔn)確性上仍有待于提高[12];另一方面數(shù)值預(yù)報(bào)模式物理機(jī)理清楚且誤差容易追溯,但其spin-up時(shí)間久,時(shí)效性上無法滿足,同時(shí)初始場精度也影響模型最終的預(yù)報(bào)效果[13]。近年來,隨著機(jī)器學(xué)習(xí)技術(shù)蓬勃發(fā)展,使用機(jī)器學(xué)習(xí)方法解決氣象問題也越來越受到關(guān)注,殷美祥等[14]使用GRU神經(jīng)網(wǎng)絡(luò)對雷州半島近海岸進(jìn)行能見度1 h的短臨監(jiān)測與外推研究,為能見度的精細(xì)化應(yīng)用提供了新思路。
該文將基于高速公路沿線布置的自動(dòng)觀測站樁數(shù)據(jù),使用長短時(shí)記憶模型(LSTM)機(jī)器學(xué)習(xí)方法進(jìn)行建模,開展基于公路沿線逐站樁尺度的能見度監(jiān)測和外推試驗(yàn),分析機(jī)器學(xué)習(xí)模型結(jié)構(gòu)、訓(xùn)練時(shí)間及遺忘層對結(jié)果的影響,并探討了低能見度事件下的參數(shù)敏感性。
1 研究區(qū)域、數(shù)據(jù)和方法
1.1 研究區(qū)域
北京—秦皇島高速公路,簡稱“京秦高速”,是我國境內(nèi)連接北京市和河北省秦皇島市的高速公路,為我國國家高速公路網(wǎng)北京—哈爾濱高速公路(國家高速G1)的并行線之一。京秦高速始建于2015年12月,并于2023年2月4日實(shí)現(xiàn)全線貫通,全長264 km。為更好地獲取公路沿線小尺度天氣事件的發(fā)生情況,京秦高速擬以3 km等間距安裝自動(dòng)觀測站樁進(jìn)行能見度實(shí)時(shí)觀測。
1.2 數(shù)據(jù)獲取
為提前獲取高速公路沿線小尺度低能見度天氣事件的發(fā)生情況,延長道路調(diào)度決策時(shí)間,該試驗(yàn)擬通過構(gòu)建LSTM模型,開展5 min步長30 min外推時(shí)效的高速公路沿線站樁級能見度要素的監(jiān)測和外推數(shù)據(jù)集的制作。由于京秦高速站點(diǎn)多為新建站樁,數(shù)據(jù)的時(shí)間長度不足,為此,收集河北區(qū)域的國家站2021—2022年長序列數(shù)據(jù)插補(bǔ)到京秦高速的站樁位置,從而構(gòu)建數(shù)據(jù)集,用于模型的建設(shè)和檢驗(yàn)。
1.3 模型構(gòu)建
使用序貫(sequential)構(gòu)建方式線性堆疊輸入層、LSTM連接層和全連接層,輸入變量經(jīng)LSTM連接層轉(zhuǎn)換后,將輸入層維數(shù)轉(zhuǎn)換為LSTM細(xì)胞數(shù)(設(shè)置為50)。在非線性計(jì)算之后,經(jīng)全連接層處理后(設(shè)置為6)進(jìn)行輸出。對比輸出的預(yù)測和觀測目標(biāo),然后進(jìn)行迭代優(yōu)化(初始設(shè)置為最大500代),從而構(gòu)建歷史輸入數(shù)據(jù)和輸出目標(biāo)數(shù)據(jù)之間的關(guān)系。
1.4 模型評估
該試驗(yàn)使用驗(yàn)證期預(yù)測序列值和觀測值之間的絕對誤差(AE)表示預(yù)測序列和觀測值之間的偏差情況;使用平均絕對誤差(MAE)和均方根誤差(RMSE)表示預(yù)測序列相對于觀測序列的誤差大??;使用相關(guān)系數(shù)(CC)表示預(yù)測序列相對于觀測序列在變化趨勢上的相關(guān)性,以全方位評估模型的外推結(jié)果。
1.5 模型調(diào)整
以改善能見度30 min外推時(shí)效RMSE(即最大預(yù)見期時(shí)效)為目的,設(shè)計(jì)多種類型的試驗(yàn),并和上一步修改的基準(zhǔn)進(jìn)行對比,其試驗(yàn)設(shè)計(jì)主要如下(見表1所示):
(1)訓(xùn)練輸入尺度。該試驗(yàn)組以5站1年(合計(jì)5年)長度數(shù)據(jù),最大迭代數(shù)為500的訓(xùn)練作為基準(zhǔn)試驗(yàn),控制輸入訓(xùn)練站的點(diǎn)數(shù)進(jìn)行測試,采取最合適的試驗(yàn)作為下一步調(diào)整的基準(zhǔn)。
(2)時(shí)間步長參數(shù)。該試驗(yàn)組以60步長(1 h)為基準(zhǔn)試驗(yàn),控制時(shí)間的步長變量進(jìn)行測試,采取最合適的試驗(yàn)作為下一步調(diào)整的基準(zhǔn)。
(3)模型遺忘層設(shè)定。該試驗(yàn)組以無遺忘層為基準(zhǔn)試驗(yàn),控制遺忘層的遺忘參數(shù)進(jìn)行測試,采取最適宜參數(shù)作為最終的調(diào)整依據(jù)。
2 結(jié)果與分析
2.1 外推結(jié)果評估
從空間尺度上看,短臨監(jiān)測與外推和觀測能見度相比:在大多數(shù)站點(diǎn)情況下略低于觀測能見度;誤差方面,平均絕對誤差最小值為0.72 km,最大值為3.75 km;RMSE最小值為1.11 km,最大值為8.36 km,最低相關(guān)系數(shù)為0.82。從時(shí)間尺度上看,平均絕對誤差在最大預(yù)報(bào)時(shí)效上為0.3 km,RMSE則為1.27 km,相關(guān)系數(shù)為0.97。
篩選低于10 km的能見度事件進(jìn)行評估,從空間尺度上看:短臨監(jiān)測與外推能見度和觀測能見度相比,在大多數(shù)站點(diǎn)略低于觀測能見度;誤差方面,平均絕對誤差最小值為0.64 km,最大值為3.91 km;RMSE最小值為0.94 km,最大值為7.15 km,最低相關(guān)系數(shù)為0.22。從時(shí)間尺度上看,平均絕對誤差在最大預(yù)報(bào)時(shí)效上為1.0 km,RMSE則為2.31 km,相關(guān)系數(shù)為0.72。
2.2 參數(shù)調(diào)整的影響分析
修改訓(xùn)練輸入數(shù)據(jù)量的大小。結(jié)果顯示,增加訓(xùn)練數(shù)據(jù)如7站,引入較多的數(shù)據(jù)能夠讀取到更多的非線性變化趨勢。經(jīng)過訓(xùn)練后,30 min監(jiān)測和外推時(shí)效的RMSE達(dá)到了0.85 km,相較于初始的1.27 km提升了33%。
測試訓(xùn)練時(shí)間步長對模型預(yù)測的影響。結(jié)果顯示,經(jīng)過訓(xùn)練后,時(shí)間步長為30 min的試驗(yàn)表現(xiàn)出較好的RMSE提升,其RMSE為0.82 km,相對于參考試驗(yàn),RMSE進(jìn)一步改良了3.5%。
修改遺忘參數(shù)。試驗(yàn)結(jié)果表明:在遺忘系數(shù)為0.3情況下,30 min監(jiān)測和外推時(shí)效的RMSE達(dá)到了0.73 km,進(jìn)一步提升了10.9%;遺忘系數(shù)過大時(shí),RMSE反而會(huì)增大。同時(shí),在5 min監(jiān)測和外推時(shí)效時(shí),遺忘系數(shù)為0.3的RMSE為0.15 km,相比于對照試驗(yàn)的0.08 km,惡化了87%,如圖1所示:
2.3 低能見度下的結(jié)果分析
在低能見度情形下,7站試驗(yàn)在30 min監(jiān)測和外推時(shí)效的RMSE達(dá)到了1.54 km,相較于初始的2.31 km提升了33%。
訓(xùn)練的時(shí)間步長參數(shù)調(diào)整結(jié)果顯示,時(shí)間步長為30 min的試驗(yàn)表現(xiàn)出較好的RMSE提升,其RMSE為1.502 km,相對于參考試驗(yàn)的1.54 km,RMSE進(jìn)一步改良了2.4%。
增加遺忘層的試驗(yàn)結(jié)果顯示,對于低能見度情形,遺忘層的增加使得RMSE和平均絕對誤差均出現(xiàn)了不同程度的惡化,如圖2所示:
3 結(jié)論
該試驗(yàn)使用序貫式堆疊建立了LSTM模型的方法,使用2021—2022年長序列氣象觀測,插補(bǔ)到京秦高速河北段自動(dòng)觀測站樁的預(yù)設(shè)位置,分別組成訓(xùn)練和測試數(shù)據(jù)集進(jìn)行模型的訓(xùn)練調(diào)整,制作了短臨監(jiān)測外推數(shù)據(jù)集。以觀測數(shù)據(jù)集為基準(zhǔn),對外推數(shù)據(jù)序列使用的絕對誤差、平均絕對誤差、RMSE和相關(guān)系數(shù)進(jìn)行了評估,得出結(jié)論如下:
短臨監(jiān)測與外推能見度在大多數(shù)站點(diǎn)略低于觀測值,平均絕對誤差在最大預(yù)報(bào)時(shí)效為0.3 km,RMSE則為1.27 km,相關(guān)系數(shù)為0.97;10 km以下的低能見度情形下,平均絕對誤差在最大預(yù)報(bào)時(shí)效上為1.0 km,RMSE則為2.31 km,相關(guān)系數(shù)為0.72。
調(diào)整能見度模型的模型結(jié)構(gòu)和訓(xùn)練參數(shù),以獲得較好的擬合效果,可首先考慮對輸入數(shù)據(jù)尺度進(jìn)行調(diào)整,其RMSE提升幅度可達(dá)33.6%;對于訓(xùn)練時(shí)間步長的調(diào)整,RMSE進(jìn)一步改良了3.5%;遺忘層的加入能夠減小較長監(jiān)測時(shí)效情形的RMSE;但在10 min內(nèi)監(jiān)測時(shí)效情形下,遺忘層的加入會(huì)增加RMSE,提升達(dá)10.9%。在低能見度情形下,遺忘層的加入會(huì)對能見度短臨監(jiān)測與外推造成負(fù)面的影響。
該試驗(yàn)為進(jìn)一步發(fā)掘基于高速公路沿線觀測站樁的數(shù)據(jù)價(jià)值,延長小尺度突發(fā)事件的預(yù)警外推時(shí)效長度,使用較為簡易的數(shù)據(jù)輸入和預(yù)處理方法開展了監(jiān)測和外推試驗(yàn),雖然在部分驗(yàn)證試驗(yàn)中取得了較好效果,然而在低能見度情形下仍需對模型進(jìn)一步改進(jìn),或加入更豐富的監(jiān)測數(shù)據(jù),以改善外推質(zhì)量。
參考文獻(xiàn)
[1]交通運(yùn)輸部.2022年交通運(yùn)輸行業(yè)發(fā)展統(tǒng)計(jì)公報(bào)[Z].北京:交通運(yùn)輸部,2022.
[2]張馳,周郁茗,張敏,等.交通事故導(dǎo)致的高速公路擁堵狀態(tài)判別方法[J].交通信息與安全,2023(1):23-33.
[3]沈靜.高速公路事故風(fēng)險(xiǎn)實(shí)時(shí)預(yù)測及事后時(shí)空影響分析[D].南京:東南大學(xué),2018.
[4]馮蕾,鄧毅萍,李藹恂,等.霧天高速公路交通事故的特征及與能見度的關(guān)系[J].科技導(dǎo)報(bào),2020(11):160-168.
[5]劉東,馬社強(qiáng),牛學(xué)軍.我國高速公路交通事故特點(diǎn)分析[J].中國人民公安大學(xué)學(xué)報(bào)(自然科學(xué)版),2008(4):65-68.
[6]唐亞平,張晉廣,張凱,等.北方公路交通氣象環(huán)境識別及安全管理策略研究[J].氣象科學(xué),2012(4):466-471.
[7]賀皓,劉子臣,徐虹,等.陜西省高等級公路大霧的預(yù)報(bào)方法研究[J].陜西氣象,2003(1):7-10.
[8]林云,孫向明,張小麗,等.深圳市大氣能見度與細(xì)粒子濃度統(tǒng)計(jì)模型[J].應(yīng)用氣象學(xué)報(bào),2009(2):252-256.
[9]周廣強(qiáng),謝英,吳劍斌,等.基于WRF-Chem模式的華東區(qū)域PM2.5預(yù)報(bào)及偏差原因[J].中國環(huán)境科學(xué) ,2016(8):2251-2259.
[10]王曉君,馬浩.新一代中尺度預(yù)報(bào)模式(WRF)國內(nèi)應(yīng)用進(jìn)展[J].地球科學(xué)進(jìn)展,2011(11):1191-1199.
[11]胡思濤,王雪梅,朱艷茹.團(tuán)霧天氣下高速公路交通事故特征分析[J].交通信息與安全,2014(4):69-73+101.
[12]張小玲,楊波,盛杰,等.中國強(qiáng)對流天氣預(yù)報(bào)業(yè)務(wù)發(fā)展[J].氣象科技進(jìn)展,2018(3):8-18.
[13]Wood, E. F., Roundy, J. K., Troy, T. J., et al. Hyperresolution global land surface modeling: Meeting a grand challenge for monitoring Earth's terrestrial water[J]. Water Resource Research, 2011(47): W05301.
[14]殷美祥,羅瑞婷,陳榮泉,等.基于GRU神經(jīng)網(wǎng)絡(luò)的雷州半島近海岸能見度短臨預(yù)報(bào)研究[J].熱帶氣象學(xué)報(bào),2023(2):267-275.
收稿日期:2024-06-06
作者簡介:劉俊江(1997—),男,碩士,助理工程師,研究方向:交通專題應(yīng)用產(chǎn)品研發(fā)。
基金項(xiàng)目:國家氣象信息中心專題應(yīng)用產(chǎn)品研發(fā)重點(diǎn)創(chuàng)新團(tuán)隊(duì)“交通安全氣象監(jiān)測產(chǎn)品研發(fā)及應(yīng)用項(xiàng)目”(NMIC-2024-ZD07),國家自然科學(xué)基金委員會(huì)“中國民用航空局民航聯(lián)合研究基金項(xiàng)目”(U2033207)。