国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于時(shí)空網(wǎng)絡(luò)的地鐵進(jìn)出站客流量預(yù)測

2021-09-26 10:46:08陳靜嫻郝宇辰甄俊濤
關(guān)鍵詞:解碼器客流量編碼器

劉 臣,陳靜嫻,郝宇辰,李 秋,甄俊濤

上海理工大學(xué) 管理學(xué)院,上海200093

由于地鐵具有安全、準(zhǔn)時(shí)和環(huán)保等特點(diǎn),已逐漸成為人們出行的首選交通方式。以上海地鐵為例,2018年日均客運(yùn)量為1 015.28萬人次,總客運(yùn)量達(dá)37.05萬億人次。大客流量已成為各地鐵站的運(yùn)營常態(tài),精確的客流量預(yù)測不僅可以為出行者提供準(zhǔn)確的路況信息,也有助于相關(guān)部門提前部署安保措施,因此預(yù)測地鐵客流量具有重要的實(shí)際應(yīng)用價(jià)值。

根據(jù)之前學(xué)者的研究,交通流預(yù)測大致可以分為模型驅(qū)動(dòng)和數(shù)據(jù)驅(qū)動(dòng)兩大類。模型驅(qū)動(dòng)是基于數(shù)學(xué)工具和物理知識,通過計(jì)算模擬來形式化交通問題,如排隊(duì)論[1]、用戶行為仿真[2]等。然而,上述模型往往需要大量的假設(shè)來簡化問題,導(dǎo)致模型無法精確預(yù)測現(xiàn)實(shí)環(huán)境中復(fù)雜的交通流變化情況。數(shù)據(jù)驅(qū)動(dòng)方法則是從統(tǒng)計(jì)學(xué)角度來分析數(shù)據(jù)的變化規(guī)律,不考慮其物理性質(zhì),因此具有良好的泛化性。早期的傳統(tǒng)統(tǒng)計(jì)學(xué)方法如歷史平均模型(History Average,HA)和ARIMA(Autoregressive Integrated Moving Average model)[3]等,雖然計(jì)算簡單快速,但依賴時(shí)間序列平穩(wěn)分布假設(shè),無法表達(dá)具有高度非線性特點(diǎn)的交通流數(shù)據(jù)。

而機(jī)器學(xué)習(xí)方法如支持向量機(jī)[4](Support Vector Regression,SVR)與人工神經(jīng)網(wǎng)絡(luò)可以自主地從歷史數(shù)據(jù)中學(xué)習(xí)到這些非線性特征,從而能較好地反映交通數(shù)據(jù)。近年來,隨著數(shù)據(jù)爆炸式增長以及計(jì)算機(jī)性能的提高,深度學(xué)習(xí)成功地應(yīng)用于自然語言處理、計(jì)算機(jī)視覺、目標(biāo)檢測等領(lǐng)域,引起了學(xué)者的注意,為交通流預(yù)測提供了新思路。Ma等人[5]在2015年首次將長短期記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)應(yīng)用于交通領(lǐng)域,Liu等人[6]采用自編碼器這種特殊結(jié)構(gòu)來提取數(shù)據(jù)的非線性特征,從而實(shí)現(xiàn)無監(jiān)督學(xué)習(xí)。

然而,交通數(shù)據(jù)是典型的時(shí)空數(shù)據(jù),不僅具有時(shí)間維度屬性,同時(shí)對道路空間結(jié)構(gòu)有著較強(qiáng)的依賴性[7-8]。為了更好地刻畫數(shù)據(jù)空間特征,一些學(xué)者嘗試采用卷積網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)來捕獲空間特征[9-10]。然而CNN各層之間的連接方式,使得其只適用于鄰接點(diǎn)數(shù)量相同且有序的數(shù)據(jù)。Bruna等人[11]提出的圖卷積(Graph Convolutional Network,GCN)能夠較好地提取非歐數(shù)據(jù)的特征,為復(fù)雜拓?fù)淇臻g特征提取提供了很好的解決方案。為降低計(jì)算復(fù)雜度,Defferrad等人[12]使用切比雪夫多項(xiàng)式來近似過濾器參數(shù)提出了ChebNet模型,Kipf等人[13]使用一階近似來進(jìn)一步簡化該模型。Seo等人[14]將GCN與隨機(jī)游走相結(jié)合,把交通流建模為擴(kuò)散過程,提出的GCRNN模型能較為準(zhǔn)確地預(yù)測車速。

之前學(xué)者研究大多集中于短時(shí)客流量預(yù)測(一般指30 min跨度內(nèi)的預(yù)測),然而現(xiàn)實(shí)生活中,長期預(yù)測更具有實(shí)際指導(dǎo)意義和參考價(jià)值,如為人們出行規(guī)劃預(yù)留充足時(shí)間等。為此,本文提出基于編碼器解碼器(Encoder-Decoder)架構(gòu)設(shè)計(jì)[15-16]的地鐵客流量進(jìn)出站預(yù)測模型,其中解碼器和編碼器都由時(shí)空預(yù)測模塊組成。同時(shí)采用進(jìn)出站雙時(shí)間序列作為輸入,使得模型在長期預(yù)測上獲得較高的精確度。

1 地鐵客流量預(yù)測

1.1 地鐵數(shù)據(jù)時(shí)間維度特征

地鐵網(wǎng)絡(luò)是一個(gè)開放的復(fù)雜大系統(tǒng),隨著時(shí)間的推進(jìn),網(wǎng)絡(luò)上的客流量在稀少、擁擠與飽和等狀態(tài)間反復(fù)轉(zhuǎn)化,形成了客流量時(shí)間序列。以南京西路站2016年7月1日、8月2日和9月1日的進(jìn)站數(shù)據(jù)為例,客流量隨時(shí)間的變化如圖1所示。

從圖1中可以看出,在較長時(shí)間范圍內(nèi)呈現(xiàn)出一定的周期性與相似性,如反復(fù)出現(xiàn)的早晚高峰期等。而在短時(shí)間內(nèi),客流量除了表現(xiàn)出一定的相關(guān)性外,還具有時(shí)變性,如列車故障等突發(fā)性事件,從而導(dǎo)致客流量數(shù)據(jù)具有高度的非線性特征。

圖1 南京西路站三天客流量數(shù)據(jù)Fig.1 Passenger flow of Nanjing West Road Station for three day

1.2 地鐵數(shù)據(jù)空間維度特征

在地鐵靜態(tài)拓?fù)渎肪W(wǎng)基礎(chǔ)上,各站點(diǎn)客流量隨著時(shí)間的推進(jìn)不斷變化,形成了客流量時(shí)空數(shù)據(jù)[17],因此除時(shí)間外還需挖掘出客流量數(shù)據(jù)空間維度的隱藏屬性[18]。然而,不同于鄰接點(diǎn)相同且有序的網(wǎng)格數(shù)據(jù),如圖片和視頻等,地鐵站具有復(fù)雜的拓?fù)浣Y(jié)構(gòu)。一方面,地鐵各站點(diǎn)的鄰接點(diǎn)數(shù)不盡相同,如圖2所示,世紀(jì)大道站有8個(gè)鄰接站點(diǎn),而楊高中路站只有1個(gè)。另一方面,各站點(diǎn)受城市地理環(huán)境、區(qū)域功能劃分和道路網(wǎng)布局等影響,地鐵站點(diǎn)在空間上呈現(xiàn)出不均勻與無序的排列特點(diǎn)。

圖2 局部地鐵站點(diǎn)的拓?fù)浣Y(jié)構(gòu)示意圖Fig.2 Topological structure of local subway stations

1.3 地鐵進(jìn)出站客流量協(xié)同預(yù)測

站點(diǎn)的出站客流量除了在自身時(shí)間線上呈現(xiàn)一定規(guī)律,同時(shí)與其他站點(diǎn)的進(jìn)站客流量緊密相關(guān)。因此,本文采用進(jìn)出站雙時(shí)間序列作為輸入,協(xié)同預(yù)測各站點(diǎn)的進(jìn)出站人數(shù)。為驗(yàn)證采用雙序列作為輸入的有效性,選用相關(guān)系數(shù)ρ[19]來衡量進(jìn)出站序列間的相關(guān)性:

其中,cov(x,y)為x,y兩條時(shí)間序列數(shù)據(jù)的協(xié)方差,D(x)、D(y)分別為x,y序列的方差;|ρ|≤1,|ρ|值越大,表明兩條序列越相關(guān)。

選用莘莊站與陸家嘴站的早高峰時(shí)段客流量進(jìn)行分析,由于從莘莊站出發(fā)至陸家嘴站需要一定的時(shí)間,因此將時(shí)間滯后值設(shè)為40 min。xin、xout分別表示莘莊站7:02—9:50的進(jìn)站與出站客流量時(shí)間序列,yout表示陸家嘴7:42—10:30的出站客流量。通過公式(1)計(jì)算得出xin與yout的相關(guān)性系數(shù)ρ1=0.92,而xout與yout的相關(guān)性系數(shù)ρ2=0.64。相比于xout,xin與yout具有更為相似的變化趨勢。由上述分析可知,采用進(jìn)出站雙序列協(xié)同預(yù)測能更好地捕捉序列潛在的非線性特征。

1.4 地鐵客流量預(yù)測問題

基于上述對地鐵客流量數(shù)據(jù)的分析,本文將地鐵網(wǎng)絡(luò)表示為圖G=(V,E),其中V=(v1,v2,…,vn)為頂點(diǎn)集,對應(yīng)網(wǎng)絡(luò)中n個(gè)地鐵站點(diǎn)。E∈Rn×n為邊的集合。由于地鐵各相鄰兩站點(diǎn)間的距離較為相似,且相鄰兩站點(diǎn)間的距離并不會對乘客出行路線產(chǎn)生影響,故本文采用無權(quán)無向圖,鄰接矩陣A∈Rn×n只表示各站點(diǎn)間的連接關(guān)系。如圖3,以東昌路站為例,其與世紀(jì)大道站直接相連,則鄰接矩陣對應(yīng)位置的值為1;與商城路不相連,則對應(yīng)值為0。

圖3 地鐵站點(diǎn)鄰接矩陣Fig.3 Adjacency matrix of subway station

將地鐵客流量表示為圖上的圖信號X∈Rn×2,n表示地鐵站點(diǎn)個(gè)數(shù),節(jié)點(diǎn)特征數(shù)為2,分別表示進(jìn)站與出站人數(shù)。令Xt∈Rn×2表示t時(shí)刻的圖信號,客流量預(yù)測問題則可以轉(zhuǎn)化為學(xué)習(xí)一個(gè)函數(shù)f(?),給定m個(gè)歷史圖信號,預(yù)測接下來h個(gè)圖信號:

2 地鐵進(jìn)出站客流量預(yù)測模型

總的來說,本文模型基于編碼器解碼器架構(gòu)設(shè)計(jì),編碼器解碼器均由時(shí)空預(yù)測模塊組成。在該模塊中,采用GCN來學(xué)習(xí)地鐵站空間結(jié)構(gòu),再將帶有空間特征的數(shù)據(jù)放入門控循環(huán)單元(Gated Recurrent Unit,GRU)中進(jìn)行時(shí)間上的建模。

2.1 時(shí)間特征提取

編碼器解碼器架構(gòu)允許輸出與輸入為不定長序列,因此常被用于序列到序列的學(xué)習(xí)。為了實(shí)現(xiàn)不同時(shí)間步長的預(yù)測,本文模型基于編碼器解碼器架構(gòu)設(shè)計(jì)。在編碼過程中,編碼器將輸入的不定長序列X=(x1,x2,…,xt)變換為一個(gè)定長的上下文向量C,該向量包含輸入序列的全部信息:

其中,ht∈Rn、ht-1∈Rn分別為t、t-1時(shí)刻的隱藏狀態(tài)值;f和q為自定義非線性函數(shù),通過函數(shù)q將各個(gè)時(shí)間步的隱藏狀態(tài)值變換為上下文向量。

在解碼過程中,采用C初始化解碼器,再結(jié)合之前預(yù)測的所有值,解碼器被訓(xùn)練預(yù)測t′時(shí)刻的值:

其中,St′、St′-1分別為t′、t′-1時(shí)刻的隱藏狀態(tài)值,yt′、yt′-1為t′、t′-1時(shí)刻的預(yù)測值;f和g都為非線性函數(shù),前者表示解碼器隱藏層狀態(tài)變換函數(shù),后者為輸出yt′的概率函數(shù)。

為避免傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡(luò)容易產(chǎn)生梯度爆炸或梯度消失等問題,本文編碼器和解碼器均選用GRU。即令上述式(3)和式(5)中的f=GRU。GRU單元中共含有兩個(gè)門:更新門(update gate)和復(fù)位門(reset gate),各個(gè)門的計(jì)算公式如下:

其中,⊙表示哈達(dá)瑪積,σ(?)為sigmoid激活函數(shù),tanh(?)為雙曲正切函數(shù);u、r分別為更新門和復(fù)位門向量,C為候選值向量,bu、br、bc分別為更新門、重置門以及候選值的偏置向量;Θ為過濾器參數(shù),Xt、Ht分別為t時(shí)刻的輸入和輸出向量。

2.2 空間特征提取

由1.2節(jié)分析可知,地鐵網(wǎng)絡(luò)具有復(fù)雜的拓?fù)浣Y(jié)構(gòu),傳統(tǒng)的CNN無法很好地處理此類數(shù)據(jù)。為此,本文選用Defferrad等人提出的ChebNet提取地鐵數(shù)據(jù)的空間特征,簡化后的圖卷積可以被寫為:

其中,p為節(jié)點(diǎn)特征數(shù),取值為1或2;?G為雙通道圖卷積操作;Θ∈R2×F為過濾器參數(shù)矩陣,F(xiàn)為過濾器個(gè)數(shù)。

2.3 時(shí)空特征融合

目前的時(shí)空數(shù)據(jù)挖掘方法大多只是簡單拼接時(shí)間和空間維度特征,會導(dǎo)致特征向量維度過高,并包含大量冗余信息,一定程度上約束了特征的表達(dá)能力。為解決上述問題,本文將GRU與GCN算法進(jìn)行有機(jī)融合,構(gòu)建了時(shí)空預(yù)測模塊。該模塊通過將式(7)~(10)的矩陣乘法置換為式(12)中的雙通道圖卷積?G,使得輸入的數(shù)據(jù)先經(jīng)過GCN捕捉空間結(jié)構(gòu),再將帶有空間特征的數(shù)據(jù)放入GRU中進(jìn)行時(shí)間上的建模,從而可以同時(shí)提取地鐵數(shù)據(jù)的時(shí)空特征。該模塊不僅可以減少模型訓(xùn)練參數(shù),提升模型訓(xùn)練速度,還可以使時(shí)空特征結(jié)合更緊密,減少融合后的冗余信息,模塊結(jié)構(gòu)如圖4所示。

圖4 時(shí)空預(yù)測模塊圖Fig.4 Spatiotemporal prediction module diagram

在時(shí)空特預(yù)測模塊中,輸入的t時(shí)刻圖信號Xt與t-1時(shí)刻的隱藏狀態(tài)值Ht-1先經(jīng)過圖卷積?G捕捉數(shù)據(jù)的空間特征。再將帶有空間特征的數(shù)據(jù)輸入GRU,首先通過更新門和重置門,來決定輸入的信息多少需要被遺忘,以及加入哪些有用信息:

其中,⊙表示哈達(dá)瑪積;ΘC′、bC′分別為隱藏狀態(tài)層的過濾器參數(shù)和偏置。

2.4 模型整體框架

為了減弱傳統(tǒng)Encoder-Decoder的編碼器在訓(xùn)練和預(yù)測時(shí)輸入存在差異的問題,本文在解碼器加入Bengio等人[20]提出的計(jì)劃采樣(scheduled sampling)。訓(xùn)練時(shí),不再完全將真實(shí)觀測值做為下一次的輸入,而是在第i次迭代中,以概率εi使用真實(shí)觀測值,以1-εi的概率使用模型自身的預(yù)測值。

模型的整體框架如圖5所示,模型基于解碼器編碼器架構(gòu)設(shè)計(jì),包含編碼與解碼過程。在編碼器中,輸入歷史t個(gè)時(shí)刻的進(jìn)站和出站兩條結(jié)構(gòu)化時(shí)間序列,經(jīng)過時(shí)空預(yù)測模塊同時(shí)捕獲數(shù)據(jù)的時(shí)間和空間特征。最終輸出固定長度的上下文向量C。在解碼過程中,首先用向量C初始化解碼器,再結(jié)合計(jì)劃采樣,解碼器被訓(xùn)練預(yù)測未來各站點(diǎn)的客流量。

圖5 地鐵進(jìn)出站客流量時(shí)空預(yù)測模型Fig.5 Spatiotemporal passenger flow prediction model of subway station

3 實(shí)驗(yàn)

3.1 數(shù)據(jù)介紹與預(yù)處理

本文采用2016年SODA大賽所提供的一卡通刷卡數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),該數(shù)據(jù)集包含2016年7月1日、8月2日以及9月1日上海市一卡通的刷卡記錄,共計(jì)約3 000萬條記錄。原始數(shù)據(jù)集共包括7個(gè)數(shù)據(jù)段:用戶ID、日期、時(shí)間、站點(diǎn)名稱等。

首先篩選出乘車類型為地鐵的數(shù)據(jù),由于地鐵剛開始運(yùn)營和結(jié)束時(shí)人流較為稀疏,故本文抽取7:30至21:58的刷卡數(shù)據(jù)。再根據(jù)刷卡價(jià)格來區(qū)分進(jìn)出站,若票價(jià)為0則為進(jìn)站,反之則為出站。最后,綜合考慮實(shí)驗(yàn)的數(shù)據(jù)量與列車平均發(fā)車時(shí)間間隔,本文按照4 min的時(shí)間間隔對各站點(diǎn)的進(jìn)出站人數(shù)進(jìn)行聚合,三天共計(jì)654個(gè)時(shí)間段。以7月1日為例,處理后的數(shù)據(jù)樣本如表1所示,每個(gè)站點(diǎn)均包含進(jìn)站和出站兩條時(shí)間序列數(shù)據(jù)。

表1 地鐵站點(diǎn)客流量統(tǒng)計(jì)表Table 1 Passenger flow statistics of subway station

為消除單位時(shí)間內(nèi)客流量波動(dòng)較大造成的影響,分別對進(jìn)出站客流量序列進(jìn)行標(biāo)準(zhǔn)化處理,使數(shù)據(jù)按比例縮小至[-1,1]。編碼器步長設(shè)為15,為此將原進(jìn)出站時(shí)間序列滑動(dòng)切分為15單位長度的短序列,經(jīng)過處理三天共計(jì)612個(gè)時(shí)間段。再為該序列添加時(shí)間,最后得到四維數(shù)組。各維度分別表示樣本數(shù)量、步長、站點(diǎn)數(shù)、特征數(shù),其中特征數(shù)量為3,依次表示進(jìn)站人數(shù)、出站人數(shù)和時(shí)間。最后將數(shù)據(jù)按7∶1∶2的比例劃分訓(xùn)練集、評估集和測試集。整理后得到的最終數(shù)據(jù)集如表2所示。

表2 數(shù)據(jù)集Table 2 Dataset

3.2 評價(jià)指標(biāo)

本文采用平均絕對誤差MAE(Mean Absolute Error)與標(biāo)準(zhǔn)誤差RMSE(Root Mean Square Error)來量化衡量模型的預(yù)測精度,計(jì)算公式如下所示:

其中,N為樣本數(shù)量,yi為真實(shí)值,y?i為預(yù)測值。MAE和RMSE越小,表明預(yù)測值的總體與真實(shí)值的偏差越小,即模型的預(yù)測性能越好。

3.3 實(shí)驗(yàn)介紹

為了評價(jià)提出的模型在地鐵客流量預(yù)測方面的有效性,本文構(gòu)建了4個(gè)模型進(jìn)行對比:

(1)HA(History Average),即歷史均值模型,僅將歷史周期的加權(quán)均值作為輸入預(yù)測未來客流量。

(2)VAR(Vector Autoregression),即向量自回歸模型,基于數(shù)據(jù)的統(tǒng)計(jì)性質(zhì)建立模型,利用客流量時(shí)間序列自身的滯后項(xiàng)來擬合預(yù)測未來客流量。

(3)SVR(Support Vector Regression),是基于機(jī)器學(xué)習(xí)的方法,核函數(shù)選擇線性基函數(shù),懲罰因子C=0.001。

(4)GCN-GRU模型,即本文提出的基于深度學(xué)習(xí)的客流量進(jìn)出站預(yù)測模型。模型采用Tensorflow來搭建,學(xué)習(xí)率衰減,為了增強(qiáng)模型的泛化性能,batchsize設(shè)為16。隱藏單元數(shù)是模型的重要參數(shù),直接影響預(yù)測的精度,因此通過實(shí)驗(yàn)來選取最優(yōu)值。

以預(yù)測1 h客流量為例,進(jìn)出站的MAE指標(biāo)對比如圖6所示,橫坐標(biāo)表示隱藏層單元個(gè)數(shù),左、右軸分別表示進(jìn)出站指標(biāo)。從圖中可以看出,當(dāng)隱藏層單元數(shù)為64時(shí)效果最優(yōu),故本文隱藏單元數(shù)為64。模型的主要參數(shù)設(shè)置如表3所示。

表3 參數(shù)設(shè)置Table 3 Parameter setting

圖6 不同隱藏單元數(shù)對模型性能對比Fig.6 Comparison of performance under different hidden units

3.4 實(shí)驗(yàn)結(jié)果與分析

3.4.1 各模型優(yōu)劣對比

根據(jù)評價(jià)指標(biāo)公式(17)、(18),計(jì)算得到4種模型預(yù)測未來4 min、20 min、40 min與60 min客流量的MAE、RMSE指標(biāo)值,實(shí)驗(yàn)結(jié)果如表4所示。

表4 各模型預(yù)測性能對比Table 4 Performance comparison of different models

通過預(yù)測結(jié)果的對比分析可知,本文提出的客流量預(yù)測模型在短期和長期預(yù)測上均取得最好的精確度。GCN-GRU模型與SVR模型的預(yù)測精度均優(yōu)于HA與VAR模型,這意味著機(jī)器學(xué)習(xí)相較于傳統(tǒng)的統(tǒng)計(jì)學(xué)方法能更好表達(dá)非線性交通流數(shù)據(jù),體現(xiàn)對非線性時(shí)間依賴建模的重要性。GCN-GRU預(yù)測精度優(yōu)于SVR,表明同時(shí)考慮地鐵站點(diǎn)空間結(jié)構(gòu)的重要性。此外,各模型的進(jìn)站預(yù)測均優(yōu)于出站,可能是由于出站客流量相較于進(jìn)站分布更為分散,并且存在較多客流量為0或?yàn)檩^小值的時(shí)間段,一個(gè)很小的預(yù)測差異可能會導(dǎo)致相對較大的誤差。

3.4.2 長短期預(yù)測對比

隨著預(yù)測步長的增加,三個(gè)模型的平均絕對誤差和標(biāo)準(zhǔn)誤差都在顯著提高。各模型進(jìn)出站預(yù)測結(jié)果的MAE值如圖7(a)、(b)所示,當(dāng)預(yù)測步長為15時(shí),即預(yù)測未來1 h的客流量,GCN-GRU進(jìn)出站的MAE分別達(dá)到了15.66和25.30,VAR進(jìn)出站的MAE甚至達(dá)到了31.5和49.13。

圖7 MAE指標(biāo)對比Fig.7 Comparison of MAE indexes

值得注意的是,相較于VAR與SVR方法,GCNGRU模型的誤差增速明顯放緩。一方面由于GRU可以從輸入的時(shí)間序列數(shù)據(jù)中遞歸學(xué)習(xí)長時(shí)動(dòng)態(tài)特征,有選擇地選取歷史數(shù)據(jù)進(jìn)行預(yù)測。另一方面,數(shù)據(jù)的空間維度屬性的提取,使得模型能夠?qū)⑧徑诱军c(diǎn)的進(jìn)出站客流量變化信息考慮進(jìn)去,從而提高長期預(yù)測的精確度。

3.4.3 序列標(biāo)準(zhǔn)化與反標(biāo)準(zhǔn)化對比

模型在預(yù)測結(jié)束后,首先對輸出結(jié)果進(jìn)行反標(biāo)準(zhǔn)化處理,然后計(jì)算損失函數(shù)。為衡量此操作的有效性,進(jìn)行了實(shí)驗(yàn)對比,從圖8中可以看出,使用反標(biāo)準(zhǔn)化的模型4 min進(jìn)出站預(yù)測精度分別提高了0.5%和1.6%,60 min進(jìn)出站預(yù)測精度分別提高了4.3%和2.6%。這一結(jié)果表明將輸出結(jié)果反標(biāo)準(zhǔn)化后計(jì)算損失函數(shù)能有效地提高模型預(yù)測的準(zhǔn)確度。

圖8 標(biāo)準(zhǔn)化與反標(biāo)準(zhǔn)化預(yù)測對比Fig.8 Comparison of standardized and anti-standardized prediction

3.4.4 典型站點(diǎn)分析

為更好地展示模型預(yù)測效果,本文對南京西路站預(yù)測結(jié)果進(jìn)行可視化展示。圖9、10分別展示了進(jìn)出站4 min、60 min預(yù)測值與實(shí)際值的對比。其中,橫坐標(biāo)表示時(shí)間,縱坐標(biāo)表示進(jìn)出站客流量人次。從圖中可以觀察出以下幾種情況:

圖9 4 min客流量預(yù)測可視化Fig.9 Visualization results for prediction of 4 min

(1)本文提出的模型能較好地預(yù)測客流量的波動(dòng),表明模型能有效捕獲時(shí)間序列的非線性特征。

(2)能較為準(zhǔn)確地預(yù)測高峰的起始和終止,得益于模型的進(jìn)出站協(xié)同預(yù)測,同時(shí)采用GCN捕獲空間依賴,將鄰接站點(diǎn)的客流量變化信息考慮進(jìn)去。

(3)進(jìn)站的短期和長期預(yù)測均優(yōu)于出站預(yù)測,這主要是由于出站人數(shù)分布相較進(jìn)站更為分散,數(shù)據(jù)的波動(dòng)也較頻繁,給模型的預(yù)測帶來一定的困難。

(4)長期的早高峰較難預(yù)測,如圖10(a)、(b)所示,7:30—8:02的預(yù)測結(jié)果存在較大誤差,主要由于歷史數(shù)據(jù)較少且人數(shù)短時(shí)間內(nèi)波動(dòng)較大導(dǎo)致。

圖10 60 min客流量預(yù)測可視化Fig.10 Visualization results for prediction of 60 min

4 結(jié)束語

本文針對地鐵站客流量預(yù)測問題,提出了基于時(shí)空網(wǎng)絡(luò)的進(jìn)出站預(yù)測模型。該模型基于編碼器解碼器架構(gòu)設(shè)計(jì),編碼器解碼器均由時(shí)空預(yù)測模塊組成。在時(shí)空模塊中,通過將GRU中的矩陣乘法置換為GCN中的雙通道圖卷積,實(shí)現(xiàn)了時(shí)空特征的融合提取。在上海地鐵一卡通數(shù)據(jù)集上進(jìn)行了對比實(shí)驗(yàn),結(jié)果表明本文提出的模型在短期和長期預(yù)測上均取得較好的預(yù)測性能。

在下一步工作中,可以將車站周邊用地性質(zhì)以及天氣、溫度等外部因素考慮進(jìn)去,這些都會對車站客流量產(chǎn)生影響。此外,由于條件限制,本文模型只采用三天客流量數(shù)據(jù)進(jìn)行訓(xùn)練。在未來工作中,通過收集更多的客流量數(shù)據(jù)作為輸入,進(jìn)一步提高模型長期預(yù)測的精度。

猜你喜歡
解碼器客流量編碼器
科學(xué)解碼器(一)
科學(xué)解碼器(二)
科學(xué)解碼器(三)
線圣AudioQuest 發(fā)布第三代Dragonfly Cobalt藍(lán)蜻蜓解碼器
基于FPGA的同步機(jī)軸角編碼器
基于嵌入式系統(tǒng)的商場客流量統(tǒng)計(jì)算法
基于PRBS檢測的8B/IOB編碼器設(shè)計(jì)
JESD204B接口協(xié)議中的8B10B編碼器設(shè)計(jì)
電子器件(2015年5期)2015-12-29 08:42:24
基于AFC數(shù)據(jù)的城軌站間客流量分布預(yù)測
多總線式光電編碼器的設(shè)計(jì)與應(yīng)用
三原县| 莱州市| 平利县| 顺义区| 麻阳| 丁青县| 闸北区| 克拉玛依市| 广西| 托克托县| 玉溪市| 伽师县| 桐乡市| 琼海市| 和顺县| 台州市| 弋阳县| 黄山市| 临汾市| 库伦旗| 察哈| 塔城市| 五大连池市| 息烽县| 江永县| 广丰县| 裕民县| 沾化县| 宁武县| 石河子市| 赤壁市| 岳西县| 韶关市| 乌苏市| 胶南市| 海阳市| 湘乡市| 祥云县| 白玉县| 思南县| 永州市|