国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于圖卷積循環(huán)神經(jīng)網(wǎng)絡(luò)的城市軌道客流預(yù)測(cè)

2022-04-29 03:01劉曉磊段征宇余慶毛孝鑫馬忠政
關(guān)鍵詞:工作日客流量斷面

劉曉磊 段征宇? 余慶 毛孝鑫 馬忠政

(1.同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海 201804;2.同濟(jì)大學(xué) CAD研究中心,上海 201804; 3.上海申通地鐵集團(tuán)有限公司,上海 201102)

城市軌道交通具有運(yùn)量大、準(zhǔn)時(shí)、環(huán)保等優(yōu)勢(shì),已成為解決城市交通問(wèn)題的重要交通方式。隨著城市軌道交通建設(shè)進(jìn)程加快及成網(wǎng)運(yùn)營(yíng),城市軌道交通客流量快速增長(zhǎng),客流時(shí)空分布失衡現(xiàn)象時(shí)有發(fā)生,上海地鐵2018年的日均客流量為1 016.5萬(wàn)乘次[1],工作日高峰時(shí)段部分?jǐn)嗝婵土黠柡投瘸__(dá)130%[2],一旦出現(xiàn)運(yùn)營(yíng)異常,會(huì)迅速波及整個(gè)軌道網(wǎng)絡(luò),造成嚴(yán)重的經(jīng)濟(jì)損失及安全隱患。因此,準(zhǔn)確、合理的進(jìn)行城市軌道交通網(wǎng)絡(luò)客流分布預(yù)測(cè),可為管理者掌握線網(wǎng)客流狀態(tài)演化、制定站點(diǎn)客流組織策略、調(diào)整列車(chē)運(yùn)行組織方案提供依據(jù),同時(shí)也能使乘客掌握軌道線網(wǎng)的擁擠程度,合理選擇出行時(shí)間和出行路徑。

目前,客流預(yù)測(cè)模型主要分為參數(shù)模型和非參數(shù)模型兩大類(lèi)。參數(shù)模型計(jì)算快速、模型簡(jiǎn)潔、所需數(shù)據(jù)量少,如歷史平均模型、時(shí)間序列模型[3]、線性回歸模型和卡爾曼濾波模型[4]等。但參數(shù)模型是以選定函數(shù)形式的方式來(lái)學(xué)習(xí),通常只能應(yīng)對(duì)簡(jiǎn)單的問(wèn)題,難以反映數(shù)據(jù)的非線性、不確定性特征。非參數(shù)模型能夠憑借自身學(xué)習(xí)能力和自適應(yīng)能力對(duì)非線性規(guī)律進(jìn)行有效捕捉,可以有效解決以上問(wèn)題,常見(jiàn)的非參數(shù)模型有:支持向量回歸[5]、貝葉斯網(wǎng)絡(luò)模型[6]和神經(jīng)網(wǎng)絡(luò)模型[7- 8]等。

近年來(lái),基于神經(jīng)網(wǎng)絡(luò)的客流預(yù)測(cè)或交通流預(yù)測(cè)方法受到眾多學(xué)者的關(guān)注。循環(huán)神經(jīng)網(wǎng)絡(luò)及其變體長(zhǎng)短期記憶網(wǎng)絡(luò)[9- 10]和門(mén)控循環(huán)單元在預(yù)測(cè)中取得了良好的效果[11]。但這些模型只考慮了時(shí)間特征,忽略了空間特征。為表征空間特征,許多學(xué)者引入卷積神經(jīng)網(wǎng)絡(luò)[12- 13],卷積神經(jīng)網(wǎng)絡(luò)適用于具有歐幾里德結(jié)構(gòu)的數(shù)據(jù),如圖像、柵格等,但對(duì)于具有復(fù)雜的拓?fù)浣Y(jié)構(gòu)的軌道交通網(wǎng)絡(luò)仍有一定的局限性。圖卷積網(wǎng)絡(luò)[14]則可以有效捕捉網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu),為考慮網(wǎng)絡(luò)特征的軌道交通客流預(yù)測(cè)帶來(lái)可能。本研究組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)大規(guī)模城市軌道客流的預(yù)測(cè),同時(shí)考慮其他因素對(duì)客流的影響,并通過(guò)隨機(jī)森林方法進(jìn)行影響因素特征選擇。

1 組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)的 預(yù)測(cè)模型

1.1 圖卷積網(wǎng)絡(luò)

圖卷積網(wǎng)絡(luò)GCN是卷積神經(jīng)網(wǎng)絡(luò)CNN在圖領(lǐng)域的拓展,可以從圖數(shù)據(jù)中提取特征從而進(jìn)行節(jié)點(diǎn)分類(lèi)、圖分類(lèi)、邊預(yù)測(cè)等。圖由若干節(jié)點(diǎn)和連接兩個(gè)節(jié)點(diǎn)的邊組成,節(jié)點(diǎn)所具有的特征構(gòu)成了特征矩陣X,不同節(jié)點(diǎn)相互連通的邊的特征構(gòu)成了特征矩陣A。圖卷積網(wǎng)絡(luò)能夠考慮節(jié)點(diǎn)之間的結(jié)構(gòu)關(guān)聯(lián)性,實(shí)現(xiàn)對(duì)圖結(jié)構(gòu)的結(jié)構(gòu)信息和節(jié)點(diǎn)屬性信息同時(shí)學(xué)習(xí),通過(guò)考慮圖節(jié)點(diǎn)及節(jié)點(diǎn)的一階鄰域的譜卷積實(shí)現(xiàn)捕捉圖的空間特征,層與層之間的傳播方式可以表示為[15]

(1)

城市軌道交通網(wǎng)絡(luò)是具有非歐幾里德結(jié)構(gòu)的復(fù)雜拓?fù)渚W(wǎng)絡(luò),該網(wǎng)絡(luò)上下游斷面的客流量相互影響,本文在進(jìn)行客流預(yù)測(cè)時(shí),將上下游斷面客流量的關(guān)聯(lián)關(guān)系考慮在內(nèi),通過(guò)圖卷積網(wǎng)絡(luò)學(xué)習(xí)城市軌道交通網(wǎng)絡(luò)的拓?fù)潢P(guān)系和斷面的屬性特征,實(shí)現(xiàn)捕捉空間特征。

1.2 循環(huán)神經(jīng)網(wǎng)絡(luò)

循環(huán)神經(jīng)網(wǎng)絡(luò)在處理時(shí)間序列數(shù)據(jù)方面有著廣泛應(yīng)用,但傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)具有梯度消失和梯度爆炸的缺陷,無(wú)法解決長(zhǎng)時(shí)依賴(lài)問(wèn)題。由此,循環(huán)神經(jīng)網(wǎng)絡(luò)的變體長(zhǎng)短期記憶模型(LSTM)及門(mén)控循環(huán)單元(GRU)出現(xiàn),兩者原理相似,預(yù)測(cè)效果相近,但GRU比LSTM少一個(gè)門(mén)控,參數(shù)更少,訓(xùn)練速度更快,過(guò)擬合風(fēng)險(xiǎn)低。

zt=σ(Wz[ht-1,Xt])

(2)

rt=σ(Wr[ht-1,Xt])

(3)

(4)

(5)

GRU將前一時(shí)刻的隱藏狀態(tài)及當(dāng)前的客流信息作為輸入,來(lái)預(yù)測(cè)當(dāng)前時(shí)刻的客流狀態(tài)。根據(jù)其原理可知GRU在預(yù)測(cè)時(shí)保留了歷史數(shù)據(jù)的變化趨勢(shì)特征,可以實(shí)現(xiàn)捕捉客流數(shù)據(jù)的時(shí)間特征。

1.3 組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)模型

本文中考慮了城市軌道交通網(wǎng)絡(luò)中不同斷面間客流的相互影響,并以斷面為節(jié)點(diǎn),斷面與斷面之間的關(guān)聯(lián)關(guān)系為邊構(gòu)造圖結(jié)構(gòu)G,G=(V,E),其中,V={v1,v2,…,vN}表示斷面節(jié)點(diǎn)集合,E為邊集合[14]。鄰接矩陣A表示斷面之間的連接關(guān)系,A∈RN×N,矩陣中的元素表示斷面之間是否連接,如果連接,表示為1,否則為0。網(wǎng)絡(luò)節(jié)點(diǎn)的屬性特征用特征矩陣X∈RN×P表示,P表示節(jié)點(diǎn)屬性特征的數(shù)目,包括歷史時(shí)間序列的長(zhǎng)度和其他特征等。

組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建深度學(xué)習(xí)模型,實(shí)現(xiàn)通過(guò)城市軌道交通m個(gè)歷史斷面客流狀態(tài)來(lái)預(yù)測(cè)未來(lái)某一時(shí)段t的狀態(tài),模型結(jié)構(gòu)見(jiàn)圖1。首先將鄰接矩陣A和特征矩陣X輸入到GCGRU模型中,通過(guò)圖卷積網(wǎng)絡(luò)(GCN)學(xué)習(xí)斷面之間的關(guān)聯(lián)關(guān)系,得到邊的權(quán)重特征值,經(jīng)過(guò)激活函數(shù)后進(jìn)入門(mén)控循環(huán)單元(GRU)學(xué)習(xí)不同斷面的時(shí)間序列規(guī)律特征,加入激活函數(shù)提高神經(jīng)網(wǎng)絡(luò)對(duì)模型的表達(dá)能力。在提取到城市軌道交通網(wǎng)絡(luò)客流的空間特征和時(shí)間特征后,通過(guò)全連接層實(shí)現(xiàn)預(yù)測(cè)任務(wù),得到N個(gè)包含時(shí)空特征的輸出狀態(tài)ht,即{h1_t,h2_t,…,hN_t}。GCGRU的具體計(jì)算過(guò)程如下:Gc表示圖卷積過(guò)程。

zt=σ(Wz[ht-1,Gc(A,Xt)])

(6)

rt=σ(Wr[ht-1,Gc(A,Xt)])

(7)

(8)

(9)

圖1 組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)

2 實(shí)驗(yàn)設(shè)計(jì)

2.1 實(shí)驗(yàn)數(shù)據(jù)

文中旨在實(shí)現(xiàn)對(duì)大規(guī)模城市軌道交通網(wǎng)絡(luò)的客流預(yù)測(cè),以上海市地鐵網(wǎng)絡(luò)客流預(yù)測(cè)為例展開(kāi)研究。數(shù)據(jù)來(lái)源于上海地鐵2019年不同軌道線的上行斷面客流,2019年共有16條線路正常運(yùn)行,運(yùn)行時(shí)間基本為5:00~24:00。經(jīng)過(guò)數(shù)據(jù)處理,得到上海市地鐵網(wǎng)絡(luò)共計(jì)408個(gè)斷面,每個(gè)斷面全年共6 935個(gè)客流值。

2.2 因素集構(gòu)建

2.2.1 影響因素分析

地鐵客流變化受多種因素的影響,文中考慮不同因素對(duì)客流量的影響,并將具有相關(guān)性且影響顯著的因素納入特征集中。

月份:客流量在不同的月份展現(xiàn)出不同特征,見(jiàn)圖2,12月客流量最少,2月客流量其次,而4月、8月、10月的客流量較多。

圖2 客流量按月份分布

星期:選取日常連續(xù)兩周的客流量進(jìn)行可視化,如圖3所示,可以看出,周一至周五客流量較高,周六客流量大幅降低,周日客流量最小。

圖3 客流量周變化趨勢(shì)

時(shí)段:選取工作日與非工作日兩個(gè)特征日,分別繪制某斷面的客流時(shí)變圖,見(jiàn)圖4(a)及圖4(b),

(a)工作日

(b)非工作日

在工作日客流量呈現(xiàn)3個(gè)高峰,分別在9:00、13:00、18:00左右??土髁吭谠绺叻鍟r(shí)段最集中,晚高峰時(shí)段其次;在非工作日,客流量較低,且整體呈現(xiàn)出一個(gè)峰值。

工作日:將所有節(jié)假日及不被調(diào)休的周末視為非工作日,其余視為工作日,繪制工作日與非工作日客流量的箱型圖,如圖5(a)所示,工作日客流量分布更集中,非工作日客流量分布表現(xiàn)為分散,兩者日均客流量均值相當(dāng)。

節(jié)假日:探究法定節(jié)假日對(duì)客流量的影響,繪制箱型圖,如圖5(b)所示,節(jié)假日客流分布更分散,非節(jié)假日客流量分布更集中,非節(jié)假日日均客流大于節(jié)假日日均客流量。

(a)非工作日與工作日

(b)非節(jié)假日與節(jié)假日

2.2.2 特征選擇

采用隨機(jī)森林的平均不純度減少方法進(jìn)行特征重要度計(jì)算。平均不純度減少表示每個(gè)特征對(duì)誤差的平均減少程度,在隨機(jī)森林中,決策樹(shù)每次分裂都是針對(duì)一個(gè)可以使誤差最小化的特征。通過(guò)計(jì)算特定變量使得誤差減少的情況得到該特征貢獻(xiàn)程度,即特征重要程度。特征重要度排序如圖6所示。

通過(guò)圖6可知,在以上分析的6個(gè)因素中,時(shí)段特征最重要,其次重要的因素是月份、星期、工作日和節(jié)假日。工作日和節(jié)假日重要度評(píng)分均較低,非工作日特征中包含了節(jié)假日部分,且不同節(jié)假日對(duì)客流量影響程度不一樣,因此,這里刪掉節(jié)假日這一特征,保留其余4個(gè)特征。

圖6 特征重要度排序

2.3 模型設(shè)定

將數(shù)據(jù)集按照8:2的比例劃分訓(xùn)練集和測(cè)試集。目前上海城市軌道交通以小時(shí)為單位調(diào)整運(yùn)行圖,因此,文中采用1天的客流歷史數(shù)據(jù)實(shí)現(xiàn)對(duì)未來(lái)1 h客流量的預(yù)測(cè),預(yù)測(cè)結(jié)果可識(shí)別最大客流斷面,為運(yùn)營(yíng)管理者調(diào)整運(yùn)行圖提供參考依據(jù)。由此,設(shè)定模型輸入的歷史時(shí)間窗口為19 h,加入時(shí)間、月份、星期及工作日4個(gè)特征,輸入的屬性特征為23個(gè),用以預(yù)測(cè)未來(lái)1小時(shí)的客流量。

使用Adam優(yōu)化器和均方誤差訓(xùn)練模型,模型在多次調(diào)參對(duì)比試驗(yàn)后,最終確定的參數(shù)設(shè)置為:學(xué)習(xí)率0.001,迭代次數(shù)5 000;批量64。

2.4 評(píng)價(jià)指標(biāo)

指標(biāo)1 均方根誤差R

(10)

指標(biāo)2 平均絕對(duì)誤差M

(11)

指標(biāo)3 準(zhǔn)確率A

(12)

指標(biāo)4 判定系數(shù)r2

(13)

R和M用于衡量預(yù)測(cè)誤差,值越小代表預(yù)測(cè)效果越好;A用于衡量預(yù)測(cè)精度,值越大代表預(yù)測(cè)效果越好;r2用于衡量預(yù)測(cè)能力,值越大代表預(yù)測(cè)能力越好。

3 結(jié)果分析

模型在訓(xùn)練過(guò)程中,測(cè)試集的損失函數(shù)值及模型準(zhǔn)確率變化如圖7、圖8所示,可以看出,模型收斂速度較快,損失函數(shù)收斂值最終小于100,模型準(zhǔn)確率接近90%。

圖7 損失函數(shù)值變化

圖8 模型準(zhǔn)確率

將預(yù)測(cè)結(jié)果進(jìn)行可視化分析,如圖9所示,可看出GCGRU預(yù)測(cè)的客流結(jié)果與實(shí)際客流變化趨勢(shì)基本一致,證明GCGRU能夠很好的捕捉上海地鐵全網(wǎng)的拓?fù)浣Y(jié)構(gòu)及客流量的變化規(guī)律,預(yù)測(cè)效果較好。

圖9 斷面客流預(yù)測(cè)可視化結(jié)果

測(cè)試集中一周內(nèi)不同天的預(yù)測(cè)結(jié)果比較見(jiàn)圖10(a),周一至周五預(yù)測(cè)精度相近,預(yù)測(cè)準(zhǔn)確率達(dá)90%以上;周末的預(yù)測(cè)誤差較大;周末居民出行更易受到是否調(diào)休、天氣好壞、是否有大型活動(dòng)等因素的影響。對(duì)比工作日和非工作日預(yù)測(cè)結(jié)果精度,如圖10(b)所示,工作日預(yù)測(cè)準(zhǔn)確率達(dá)到91%,而非工作日預(yù)測(cè)準(zhǔn)確率為87%,非工作日居民出行需求彈性較大,是否節(jié)假日、天氣好壞、是否有大型活動(dòng)等會(huì)影響居民的出行需求。

(a)周一至周日

(b)工作日與非工作日

為評(píng)價(jià)GCGRU模型的預(yù)測(cè)結(jié)果,選取歷史平均模型(HA)、移動(dòng)平均自回歸模型(ARIMA)、循環(huán)神經(jīng)網(wǎng)絡(luò)(LSTM、GRU)及卷積循環(huán)神經(jīng)網(wǎng)絡(luò)(CNGRU)來(lái)進(jìn)行對(duì)比。歷史平均法和移動(dòng)平均自回歸模型是傳統(tǒng)的時(shí)間序列預(yù)測(cè)模型。歷史平均法是根據(jù)歷史時(shí)間序列,逐項(xiàng)推移,依次計(jì)算包含一定項(xiàng)數(shù)的序時(shí)平均數(shù)來(lái)進(jìn)行預(yù)測(cè)的方法;移動(dòng)平均自回歸模型是在將非平穩(wěn)時(shí)間序列轉(zhuǎn)化為平穩(wěn)時(shí)間序列的過(guò)程中,將因變量?jī)H對(duì)它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸,建立模型來(lái)進(jìn)行預(yù)測(cè)的方法。循環(huán)神經(jīng)網(wǎng)絡(luò)變體能夠捕捉時(shí)間特征,被廣泛地應(yīng)用于時(shí)間序列預(yù)測(cè)中,其原理見(jiàn)1.2節(jié)。卷積循環(huán)神經(jīng)網(wǎng)絡(luò)為神經(jīng)網(wǎng)絡(luò)組合模型,是新興的用于時(shí)間序列預(yù)測(cè)的模型。CNGRU模型通過(guò)組合卷積神經(jīng)網(wǎng)絡(luò)CNN與循環(huán)神經(jīng)網(wǎng)絡(luò)變體GRU實(shí)現(xiàn)預(yù)測(cè),CNN實(shí)現(xiàn)特征提取,保留有用信息并傳輸給GRU,GRU接收上層傳輸?shù)男畔⒉W(xué)習(xí)時(shí)間序列的特征進(jìn)而實(shí)現(xiàn)預(yù)測(cè)。

通過(guò)表1可以看出,神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)精度高于參數(shù)模型HA和ARIMA,說(shuō)明傳統(tǒng)的時(shí)間序列預(yù)測(cè)模型對(duì)于非線性變化的客流數(shù)據(jù)的擬合能力較差,具有局限性。LSTM與GRU的預(yù)測(cè)效果較好且近似,說(shuō)明LSTM和GRU能夠?qū)W習(xí)到客流時(shí)間變化規(guī)律。與GRU相比,組合模型CNGRU和GCGRU預(yù)測(cè)精度進(jìn)一步提升,RMSE預(yù)測(cè)誤差分別降低了15.25%、35.37%,精度分別提高了3.00%、6.95%。圖卷積循環(huán)神經(jīng)網(wǎng)絡(luò)模型GCGRU的預(yù)測(cè)效果最好,預(yù)測(cè)準(zhǔn)確率達(dá)到89.38%。證明GCGRU能夠同時(shí)捕捉城市軌道交通網(wǎng)絡(luò)的空間拓?fù)涮卣骱涂土鳡顟B(tài)變化的時(shí)間特征,具有良好的時(shí)空預(yù)測(cè)能力。

表1 預(yù)測(cè)結(jié)果比較

4 結(jié)論

文中組合圖卷積網(wǎng)絡(luò)和循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建深度學(xué)習(xí)模型實(shí)現(xiàn)對(duì)大規(guī)模城市軌道交通網(wǎng)絡(luò)的客流量預(yù)測(cè),將斷面客流視為圖結(jié)構(gòu)中節(jié)點(diǎn)的屬性,斷面間的聯(lián)系視為邊的屬性,利用圖卷積捕捉網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)從而得到空間特征,利用門(mén)控循環(huán)單元捕捉客流序列的變化規(guī)律從而得到時(shí)間特征。利用上海地鐵一年的客流數(shù)據(jù)進(jìn)行研究,應(yīng)用隨機(jī)森林提供的不純度減少方法進(jìn)行影響因素特征選擇,預(yù)測(cè)結(jié)果表明,組合模型GCGRU的預(yù)測(cè)精度明顯優(yōu)于傳統(tǒng)時(shí)間序列預(yù)測(cè)模型HA、ARIMA,循環(huán)神經(jīng)網(wǎng)絡(luò)變體LSTM、GRU,以及神經(jīng)網(wǎng)絡(luò)組合模型CNGRU,說(shuō)明GCGRU能夠同時(shí)捕捉城市軌道客流的空間依賴(lài)性和時(shí)間依賴(lài)性,預(yù)測(cè)效果較好。全網(wǎng)客流預(yù)測(cè)結(jié)果可識(shí)別最大客流斷面,為管理者調(diào)整列車(chē)運(yùn)行組織方案、制定應(yīng)急管控措施提供依據(jù),同時(shí)也為出行者提供軌道線網(wǎng)客流擁擠預(yù)警信息,從而合理選擇出行時(shí)間及路徑。

猜你喜歡
工作日客流量斷面
小斷面輸水隧洞施工安全管理存在的不足點(diǎn)及對(duì)策
基于數(shù)據(jù)挖掘的景區(qū)客流量預(yù)測(cè)模型研究
超大斷面隧道初期支護(hù)承載力學(xué)特性及形變研究
地鐵開(kāi),玩起來(lái)
茂名市開(kāi)展全面攻堅(jiān)劣Ⅴ類(lèi)國(guó)考斷面行動(dòng)!
基于灰色預(yù)測(cè)理論在交通樞紐客流量的實(shí)際應(yīng)用
基于灰色預(yù)測(cè)理論在交通樞紐客流量的實(shí)際應(yīng)用
對(duì)于馬克思關(guān)于工作日的思考
關(guān)于休閑的量的問(wèn)題的考察
基于電氣分區(qū)的輸電斷面及其自動(dòng)發(fā)現(xiàn)