国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于WiFi探針數(shù)據(jù)的短時交通狀態(tài)預測

2021-09-09 00:54:44吳啟用廖嘉欣蘭小機
江西理工大學學報 2021年4期
關(guān)鍵詞:交通流量步長探針

吳啟用, 廖嘉欣, 蘭小機

(江西理工大學土木與測繪工程學院,江西 贛州341000)

0 引 言

社會經(jīng)濟的快速發(fā)展和城市規(guī)模的不斷擴大促使城市機動車保有量迅速增長,城市道路通行承載壓力不斷加大,交通擁堵現(xiàn)象已呈常態(tài)化蔓延趨勢。智能交通系統(tǒng)(Intelligent Traffic System,ITS)作為智慧城市的重要組成部分可以有效緩解交通擁堵,準確的短時交通預測則是其實現(xiàn)的關(guān)鍵。一般而言,對下一階段交通狀態(tài)預測的時間間隔不超過15 min稱為短時交通預測[1-2]。然而,交通狀態(tài)具有隨機性和復雜性,特別是隨著時間間隔的縮短,其呈現(xiàn)的非線性越強,預測難度也越大[3]。

目前,廣泛部署于城市內(nèi)的各類傳感器為交通狀態(tài)的預測提供了可靠的數(shù)據(jù)支撐,按傳感器的運動狀態(tài)可將其劃分為固定位置的傳感器(微波傳感器、環(huán)路感應器、視頻檢測器、紅外檢測器及雷達檢測器等[4-5])和移動式傳感器(如GPS傳感器[6-7])。近年來,無線技術(shù)的快速發(fā)展使得配備有藍牙、WiFi等功能的智能移動設備大量普及,為交通信息的采集提供了新的思路。例如:Ahmed等初步驗證了無線探測技術(shù)在交通領(lǐng)域應用的可行性[8];文獻[9-10]研究了藍牙傳感技術(shù)在ITS中的應用,進一步揭示了無線技術(shù)服務于交通的潛力。

國內(nèi)外針對短時交通狀態(tài)預測已開展了大量研究,相關(guān)方法可分為參數(shù)方法和非參數(shù)方法。常用的參數(shù)方法有自回歸綜合移動平均(Autoregressive Integrated Moving Average,ARIMA)和Kalman濾波模型,二者在處理平穩(wěn)時序數(shù)據(jù)時表現(xiàn)良好,但由于交通狀態(tài)并非一直是平穩(wěn)的,因此該方法不能很好地捕捉交通特征。非參數(shù)方法由于彌補了參數(shù)方法的這一不足而受到研究學者的關(guān)注,如傅貴等采用支持向量機回歸 (Support Vector Regression,SVR)構(gòu)建預測模型,并以此預測交通流量[11];王雪菲等提出一種面向高速公路大數(shù)據(jù)的K近鄰(KNearest Neighbor,KNN)交通流預測方法,并驗證其相比ARIMA模型有更高的預測精度[12];薛紅軍等基于決策樹理論構(gòu)建分類回歸樹模型,并對短時交通流參數(shù)進行了預測[13];Chen等將改進的小波神經(jīng)網(wǎng)絡引入短時交通流預測模型中,獲得了更加穩(wěn)定、準確的預測結(jié)果[14]。

從現(xiàn)有研究來看,交通預測建模大多采用的是傳統(tǒng)交通檢測數(shù)據(jù),而鮮有涉及無線探測數(shù)據(jù)。為此本文利用WiFi探針獲取交通數(shù)據(jù),結(jié)合長短期記憶(Long Short-Term Memory,LSTM)網(wǎng)絡進行交通預測建模,以交通狀態(tài)指數(shù)(Traffic State Index,TSI)作為道路交通擁堵預測目標,并通過試驗證明該方法的有效性和可行性,以期為未來交通預測方案提供新思路。

1 研究區(qū)及數(shù)據(jù)源

1.1 研究區(qū)概況

東莞市是珠三角區(qū)域中心城市之一,同時也是廣東省重要的交通樞紐和外貿(mào)口岸。近年來,東莞市汽車保有量不斷攀升,目前已突破300萬輛,交通擁堵現(xiàn)象時有發(fā)生。東莞大道是市內(nèi)的主要交通干線,貫穿整個東莞的中心區(qū),每天交通流量巨大。本文在東莞大道選取5個路段作為研究對象,每條路段兩端各安置一個WiFi探針,以東城中路路口至旗峰公園路口為待預測目標路段RP,其上游路段分別用RU1、RU2表示,下游路段分別用RD1、RD2表示,探針設備的分布地點如圖1所示。

圖1 探針設備的分布地點

1.2 WiFi探針數(shù)據(jù)

信息技術(shù)的快速發(fā)展使得以WiFi為代表的無線通信技術(shù)逐漸普及,WiFi探針可根據(jù)WiFi技術(shù)的特點來捕獲周圍環(huán)境中可用的無線接入點(Access Point,AP)及開啟WiFi的終端所發(fā)出的請求幀信號,其中包含了部分不涉及用戶安全性的設備基礎信息,如媒體訪問控制 (Media Access Control,MAC)地址、信號強度、時間戳等[15-16]。WiFi探針的安裝和維護成本較低,其采樣頻率為毫秒至秒級,在實際中設備的漏檢率較低,因此,在特定的路口或路邊安裝WiFi探針可作為交通信息的采集工具。本文使用的WiFi探針數(shù)據(jù)為捕獲的車載AP發(fā)出的信號,其部分數(shù)據(jù)形式如表1所列。表1中g(shù)wid為探針的MAC地址;stamac為探針在某一時刻探測到的車載AP的MAC地址,可用作對車輛的唯一標識;ssid為車載AP的網(wǎng)絡名稱;ctime為時間戳;power為探測的信號強度。

表1 原始探針數(shù)據(jù)

由于收集到的WiFi探針數(shù)據(jù)集中存在部分低質(zhì)量數(shù)據(jù),需對其進行如下預處理:①剔除只出現(xiàn)一次的數(shù)據(jù)。該類數(shù)據(jù)無法構(gòu)成有效的車流數(shù)據(jù),故選擇刪除。②刪除異常記錄的數(shù)據(jù)。由于探針設備布設在路口,信號在傳輸過程中可能會受周圍環(huán)境的影響而產(chǎn)生異常,如同一個探測點在同一時間記錄兩條甚至多條相同的MAC數(shù)據(jù),或在記錄過程中時間戳出現(xiàn)亂碼,這些數(shù)據(jù)對本研究無意義,故將此類數(shù)據(jù)也剔除。研究期間共獲得321 851 848條WiFi探針數(shù)據(jù),經(jīng)預處理后獲得有效數(shù)據(jù)175 970 793條。

1.3 構(gòu)建TSI數(shù)據(jù)集

當車載AP的MAC地址在某時刻被檢測點Oi探測到,在另一時刻又被其相鄰的下游檢測點Oi+1探測到,則可將此MAC地址記為一條數(shù)據(jù)流,在時間間隔T內(nèi)該路段交通流數(shù)據(jù)可表示為fT={x1,x2,x3,…,xk}。為獲得更加接近實際車流量的樣本數(shù),采用人工計數(shù)法輔以驗證,并通過式(1)獲得擴樣比例系數(shù)r。

式(1)中:fT表示15 min內(nèi)通過MAC地址提取出的車流量;fK表示在同一時間段內(nèi)通過人工統(tǒng)計的車流量,后經(jīng)試驗得到比例系數(shù)r為0.25。

雖然交通流量是造成交通擁堵的一個重要因素,但車流量的大小與交通狀態(tài)并沒有直接關(guān)系,當車流量很小時,可能是路段擁堵嚴重無法通行或者路段空曠車輛較少[17]。目前不少城市采取交通狀態(tài)指數(shù)(TSI)衡量道路交通運行狀況,本文采用式(2)量化描述擁堵情況,并以此作為擁堵預測的目標。TSI的取值范圍為0~10,數(shù)值越大表示擁堵越嚴重。

式(2)中:vi表示路段i的平均車速,可通過探測到的MAC時差和連續(xù)探測點之間的距離進行計算;vi表示路段i的自由流車速,即指在交通量很小的條件下,車輛通過沒有信號交叉口的城市干道的最大速度。結(jié)合東莞大道實際情況,本文以該路段設計最大限速80 km/h作為自由流車速。

基于獲取的WiFi探針數(shù)據(jù),以15 min為時間間隔構(gòu)建完整的TSI時間序列。圖2展示了2019年11月第4周RP路段周四至周日的TSI變化趨勢。可以看出,周四與周五的TSI時間序列具有相似性,一天中TSI分別在8:00和18:00左右出現(xiàn)兩次高峰,即工作日具有明顯的早晚高峰,早晚高峰時TSI值較大,路況較為擁堵,而在周末則沒有表現(xiàn)出明顯的早晚高峰變化趨勢,圖2所描繪情況與實際情況較為吻合,可在一定程度上反映道路交通運行狀態(tài)。

圖2 工作日與非工作日TSI時間序列

2 預測模型

2.1 長短期記憶(LSTM)網(wǎng)絡

長短期記憶(LSTM)網(wǎng)絡是一種基于循環(huán)神經(jīng)網(wǎng)絡的變體網(wǎng)絡,其具備學習序列數(shù)據(jù)中長期依賴關(guān)系的能力,因此可以有效彌補傳統(tǒng)循環(huán)神經(jīng)網(wǎng)絡的不足[18-19]。LSTM使用記憶模塊取代傳統(tǒng)的隱層神經(jīng)元,并在其中添加細胞單元狀態(tài)用于存儲和訪問長期信息。單個LSTM記憶塊的結(jié)構(gòu)如圖3所示。

圖3 LSTM模塊的結(jié)構(gòu)

LSTM記憶塊結(jié)構(gòu)的關(guān)鍵在于通過輸入門it、遺忘門ft和輸出門ot控制長期狀態(tài)c以達到長期記憶的目的。輸入門負責將即時狀態(tài)更新到長期狀態(tài)c,遺忘門負責控制前一時刻單元狀態(tài)中部分信息的取舍,輸出門負責控制是否將長期狀態(tài)c作為當前LSTM的輸出。當前一時刻的單元狀態(tài)ct-1沿圖3中最上方的記憶線傳播時,首先受到遺忘門ft的作用舍棄部分信息,保留下來的部分信息通過輸入門it和當前輸入的單元狀態(tài)c~進行信息的更新,最后經(jīng)過一系列計算得到當前時刻的單元狀態(tài)ct;在記憶塊中的另一條主線上,前一時刻的輸出結(jié)果ht-1和當前時刻的輸入值xt在經(jīng)過輸出門ot的運算后,與當前時刻的單元狀態(tài)ct共同確定了當前時刻LSTM的最終輸出結(jié)果ht。LSTM記憶塊結(jié)構(gòu)中具體的前向計算過程如式(3)~式(8)。

其中,W和b分別為對應的權(quán)重矩陣和偏置向量;[ht-1,xt]表示將兩個向量連接成一個更長的向量;σ和tanh分別為sigmoid和tanh激活函數(shù);?表示按元素相乘。

2.2 評價指標

為更好地評估本文模型在WiFi探針數(shù)據(jù)上的表現(xiàn)及預測能力,選用均方根誤差(RMSE)、平均絕對誤差(MAE)和決定系數(shù)R2作為模型預測精度評定指標,計算公式為:

其中,yi和分別為實測值和預測值;N為測試數(shù)據(jù)集中的樣本數(shù)量。

2.3 模型超參數(shù)的調(diào)整

神經(jīng)網(wǎng)絡中不同超參數(shù)的設置會對模型的性能造成不同影響,本文將TSI數(shù)據(jù)集按照4∶1的比例劃分成訓練集和測試集,并選取以下幾個對LSTM網(wǎng)絡有較大影響的超參數(shù)進行調(diào)整,包括時間步長、最大訓練輪數(shù)、批次大小、學習率、優(yōu)化算法和LSTM層神經(jīng)元節(jié)點數(shù)量。其中,時間步長決定了需要通過前幾個時刻的值來預測下一刻的值,未來交通擁堵狀況不僅與當前時刻的狀態(tài)有關(guān),還與前幾個時刻的狀態(tài)有關(guān),若時間步長過長則會增加模型訓練時長,因此需通過不斷調(diào)整時間步長使模型性能達到平衡。經(jīng)多次調(diào)整后,RMSE在時間步長為3時最小,故確定時間步長參數(shù)為3,如圖4所示。

圖4 時間步長參數(shù)的選取

在確定時間步長后,其余5個超參數(shù)采用網(wǎng)格搜索法進行優(yōu)化選取。網(wǎng)格搜索法是目前相對直觀的一種參數(shù)優(yōu)化方法,它可以通過枚舉搜索得到模型在限定網(wǎng)格內(nèi)的全局最優(yōu)解。本文中各超參數(shù)網(wǎng)設置如下:最大訓練輪數(shù)的取值范圍為[100,800],步長為100;批次大小的取值范圍為[10,60],步長為10;學習率的取值為[0.1,0.01,0.001,0.000 1];優(yōu)化算法的取值為[SGD,RMSprop,Adam];LSTM層神經(jīng)元節(jié)點數(shù)量的取值[16,32,64,128]。

表2列出了5種根據(jù)網(wǎng)格搜索法組合且具有較低RMSE的結(jié)果。當最大訓練輪數(shù)為800,批次大小為60,學習率為0.000 1,優(yōu)化算法為Adam,神經(jīng)元節(jié)點個數(shù)為64時超參數(shù)組合的RMSE最低,此超參數(shù)組合下模型的損失函數(shù)圖像如圖5所示,結(jié)合RMSE與損失函數(shù)二者變化情況來看即確定了整個網(wǎng)絡的各超參數(shù)。

表2 網(wǎng)格搜索調(diào)整結(jié)果

圖5 損失函數(shù)變化

通常LSTM神經(jīng)網(wǎng)絡中擁有的層數(shù)越多,其相應的學習能力也就越強,但過多的網(wǎng)絡層數(shù)設置也越易造成過擬合,所需訓練數(shù)據(jù)也越多,訓練難度加大。因此,本文采用2個LSTM層捕獲時間序列特征,并在其后加入1個Dropout層防止過擬合,Dropout的比例依經(jīng)驗設置為0.5其泛化能力最好,最后以1個Dense層對結(jié)果進行降維并輸出。整個網(wǎng)絡結(jié)構(gòu)的可視化結(jié)果如圖6所示。

圖6 多層LSTM神經(jīng)網(wǎng)絡結(jié)構(gòu)

3 試驗與分析

3.1 不同組合參數(shù)對短時交通狀態(tài)指數(shù)預測的影響

選取2019年11月1日—12月1日WiFi探針收集到的數(shù)據(jù)作為試驗數(shù)據(jù)集,并對該數(shù)據(jù)集以15 min為時間間隔進行處理,共得2 976條數(shù)據(jù),其中前24 d的數(shù)據(jù)用于模型訓練,余下7 d數(shù)據(jù)用于模型測試,每條數(shù)據(jù)均包含該路段的交通流量、平均速度和TSI。

1)考慮流量/速度組合的TSI預測。對于短時TSI預測而言,其未來時刻的值不僅與當前以及前幾個時刻的TSI有關(guān),還可能與流量、速度等交通信息相關(guān),因此通過構(gòu)建不同的組合方式作為模型的輸入可探究流量、速度對預測性能的影響。流量、速度及TSI這3個變量的不同組合形式如表3所列。

表3 流量、速度與TSI的不同組合

根據(jù)表3中的4種不同組合方式,分別對RU2、RU1、RP、RD1、RD25條路段用LSTM預測模型進行測試,其預測表現(xiàn)見圖7所示。從預測結(jié)果可以發(fā)現(xiàn),A3和A4這兩種組合的表現(xiàn)要略好于A1和A2,而A3和A4均考慮了交通流量信息,因此可以推測流量對于模型提升TSI的預測精度有一定的影響。

圖7 不同組合的指標比較

2)考慮上下游信息組合的TSI預測。城市交通路網(wǎng)中每條路段都不是孤立的,在進行交通預測時,通常都會考慮時間和空間相關(guān)性。對TSI的預測不僅可以使用目標路段自身的歷史TSI數(shù)據(jù),還可以使用其上下游路段的歷史TSI數(shù)據(jù)。在同時考慮歷史交通流量和TSI數(shù)據(jù)的基礎上,將目標路段RP與其上下游相鄰路段進行不同組合,并針對每一種組合使用LSTM模型進行預測,得到各個不同輸入變量組合的預測結(jié)果(表4)。由表4可知,組合4和組合9相較于其他幾種組合的預測精度要高,其中組合9使用全部5個路段的歷史交通流量數(shù)據(jù)和TSI數(shù)據(jù)作為預測模型的輸入,其預測精度最高。

表4 加入上下游信息的LSTM模型預測性能

表5列出了進行參數(shù)組合和不進行參數(shù)組合預測的對比結(jié)果,S1表示僅考慮目標路段的歷史TSI數(shù)據(jù),S2表示考慮目標路段歷史交通流量和TSI數(shù)據(jù),S3表示考慮目標路段及其上下游的歷史交通流量和TSI數(shù)據(jù)。可以看出,相比于不進行參數(shù)組合,即僅考慮歷史TSI數(shù)據(jù)的S1,進行了參數(shù)組合的S2與S3的各項評價指標均優(yōu)于S1,但S3綜合了時空因素的影響,因此其預測精度要進一步優(yōu)于S2,且相較于S1其RMSE降低了11.89%,MAE降低了12.22%,R2提升了3.6%。

表5 不同參數(shù)組合的預測結(jié)果對比

3.2 模型對比分析

本文選取支持向量機回歸(SVR)和梯度提升決策樹(Gradient Boosting Decision Tree,GBDT)兩種常用的機器學習方法與LSTM進行對比,以評估不同模型對TSI的預測表現(xiàn)。其中,SVR核函數(shù)采用徑向基函數(shù),懲罰系數(shù)取值為200;GBDT的最大樹深度為5,弱學習器的最大數(shù)量為750。同時為方便比較分析,LSTM、SVR和GBDT均采用相同的變量輸入,即均以流量、TSI結(jié)合上下游信息作為組合變量輸入。3種模型的預測值、實際值和殘差在2019年11月29日的96個測試樣本上的表現(xiàn)如圖8所示,可以看出,3種模型均能較好地預測TSI的變化趨勢。

圖8 3種模型在2019年11月29日上的預測結(jié)果

表6列出了3種模型對1 d及7 d后數(shù)據(jù)進行預測獲得的各項評價指標,從整體上看LSTM的RMSE、MAE和R2均優(yōu)于SVR和GBDT,即考慮時間傳播規(guī)律的深度學習模型對于原始數(shù)據(jù)的貼合性更好,證明了LSTM模型對短時交通擁堵預測的有效性。

表6 3種模型不同時長的預測結(jié)果

4 結(jié) 論

在數(shù)據(jù)驅(qū)動模式下的交通狀態(tài)建模中,存在數(shù)據(jù)采集設備成本較高、特定目標路段采樣量較少等問題,且以往關(guān)于WiFi等無線通信技術(shù)的研究多局限于室內(nèi)客流檢測,對開放環(huán)境下城市道路交通狀況的檢測關(guān)注較少。為此,本文以WiFi探針作為一種新式交通傳感器獲取數(shù)據(jù),并通過LSTM網(wǎng)絡建立城市道路短時交通狀態(tài)預測模型,基于東莞市東莞大道的TSI數(shù)據(jù)進行實證研究,得到以下結(jié)論:

1)用WiFi探針數(shù)據(jù)構(gòu)建的交通狀態(tài)指數(shù)在一定程度上刻畫了道路交通運行狀態(tài),其變化趨勢基本符合道路實際運行情況,表明WiFi探針數(shù)據(jù)在交通領(lǐng)域具有一定的應用潛力。

2)根據(jù)LSTM網(wǎng)絡結(jié)構(gòu)及各種交通參數(shù)的特點,探究不同參數(shù)的最佳組合方式,發(fā)現(xiàn)在考慮空間相關(guān)性的情況下,交通流量與交通狀態(tài)指數(shù)組合作為網(wǎng)絡的輸入獲得的預測效果最好,說明該網(wǎng)絡不僅利用了歷史數(shù)據(jù)的時間相關(guān)關(guān)系,還利用了上下游路段的空間相關(guān)關(guān)系。

本文雖研究了WiFi數(shù)據(jù)在短時交通擁堵預測方面的應用,但由于無線通信檢測技術(shù)應用于交通領(lǐng)域的相關(guān)研究較少,而開展大量實證性檢驗的成本又過高,因此WiFi探針數(shù)據(jù)的效用情況還需通過其他手段(如融合GPS、微波雷達等多源數(shù)據(jù))進一步驗證。同時限于當時所用探針數(shù)量,僅針對主干道路進行了研究,若日后進行大規(guī)模部署則可從更大尺度研究道路運行狀態(tài)。

猜你喜歡
交通流量步長探針
基于Armijo搜索步長的BFGS與DFP擬牛頓法的比較研究
基于XGBOOST算法的擁堵路段短時交通流量預測
基于GA-BP神經(jīng)網(wǎng)絡的衡大高速公路日交通流量預測
多通道Taqman-探針熒光定量PCR鑒定MRSA方法的建立
BOPIM-dma作為BSA Site Ⅰ特異性探針的研究及其應用
基于逐維改進的自適應步長布谷鳥搜索算法
透射電子顯微鏡中的掃描探針裝置
物理實驗(2015年9期)2015-02-28 17:36:47
基于復合卡和ETC的交通流量采集研究
MLFF系統(tǒng)在交通流量控制中的應用
一種新型光伏系統(tǒng)MPPT變步長滯環(huán)比較P&O法
電測與儀表(2014年2期)2014-04-04 09:04:00
祁连县| 理塘县| 临洮县| 扎赉特旗| 富川| 来凤县| 大石桥市| 延川县| 桦川县| 邹城市| 郁南县| 永昌县| 朝阳区| 黑山县| 鄂尔多斯市| 都匀市| 永善县| 大足县| 白水县| 广汉市| 上栗县| 栾城县| 兴义市| 禹州市| 门头沟区| 大悟县| 平遥县| 诸城市| 司法| 商丘市| 彭水| 无为县| 宜章县| 和静县| 绥宁县| 盈江县| 孝义市| 瓦房店市| 佳木斯市| 九台市| 方山县|