謝 煒
(中國石油大學勝利學院高等教育研究與評價中心,山東東營257061)
基于BP神經網絡的公交車到站時間預測
謝 煒
(中國石油大學勝利學院高等教育研究與評價中心,山東東營257061)
公交車到站時間預測是城市公共交通智能化發(fā)展的首要需求?;诠卉嚨臍v史數(shù)據(jù)和實時數(shù)據(jù),綜合考慮公交車運行所處時段、天氣狀況和工作日時段等全局性因素和交通密度、交通流量、車輛排隊長度等區(qū)域性因素的影響,增加了同路車的上下行到站信息參數(shù),對公交車到站時間進行預測,提出了基于BP神經網絡的預測模型。研究結果表明,BP神經網絡能夠較準確預測公交車到站時間。
GPS;BP神經網絡;公交車到站時間;預測
目前我國的城市化進程不斷加速,城市交通道路網絡不斷完善,但是道路的供給能力仍無法滿足交通需求量的快速增長。優(yōu)先發(fā)展城市公共交通,鼓勵市民公交出行是目前行之有效的解決辦法。市民如何能提前獲取公交車的到站時間,并根據(jù)個人情況優(yōu)先選擇不同的公交車出行,減少乘車時間,成為城市公共交通智能化發(fā)展的首要需求。先進的公共運輸系統(tǒng)(APTS)和先進的出行者信息系統(tǒng)(ATIS)為預測公交車輛運行時間提供了基礎,不僅提高了公交車資源使用效率、方便了市民公交出行,而且間接減少了城市交通的擁堵。然而城市公交車到站時間具有復雜的非線性特征,利用傳統(tǒng)的指數(shù)平滑法等無法做到準確預測,筆者利用計算機科學的神經網絡的非線性映射能力來實現(xiàn)其精確預測。
1.1 GPS
GPS數(shù)據(jù)采集技術是獲取實時交通信息最常用的方法之一,美國首先提出了利用配有GPS的目標車輛采集交通信息,實現(xiàn)車輛位置的精確定位;日本提出了動態(tài)路徑引導系統(tǒng),在系統(tǒng)中融合了GPS數(shù)據(jù)采集、地圖信息更新、交通實時信息的發(fā)布等技術,更方便了公交車GPS的實用性。孫棣華等以GPS定位數(shù)據(jù)為基礎,綜合考慮道路路段平均速度、車輛即時速度、到站距離等因素,實現(xiàn)了實時預測[1]。周雪梅等利用GPS數(shù)據(jù),并考慮了前車的平均瞬時速度作為近似反映道路交通動態(tài)變化的特點,提出了估算公交車在公交站點區(qū)域停留時間的預測模型[2]。雖然GPS克服了傳統(tǒng)方式采集的局限性,并實現(xiàn)了自動采集和自動信息交互,極大地提高了數(shù)據(jù)采集的有效性。然而,采用GPS獲取車輛位置的技術需要一定的硬件成本,對于大中城市的公交公司是可以承受的,但是對于三線城市的公交公司需要較大的前期投入。公交車GPS屬于民用GPS,精度低,數(shù)據(jù)通信容易受電磁干擾,這些都直接影響采集數(shù)據(jù)的準確性。另外,公交車在行駛過程中,GPS信號容易受到高樓、隧道、樹木和立交橋的影響,造成實時數(shù)據(jù)缺失;公交車在停車站、停車場、交叉路口等特殊區(qū)域運行速度緩慢或停止,造成大量的GPS數(shù)據(jù)為零的情況,形成“倒行”誤差。
1.2 歷史數(shù)據(jù)
涂利明采用基于前車與經驗數(shù)據(jù)的公交車站到站時間預測模型,區(qū)分了高峰期和非高峰期、紅燈等待時間和斑馬線的影響,較好地滿足預測所需要的準確性和實時性要求。這種方法對歷史數(shù)據(jù)的采集工作要求很高,當出現(xiàn)偏離歷史描述的突發(fā)事件時,預測效果不很理想[3]。
1.3 神經網絡
于濱等采用支持向量機(SVM)預測公交車的到站時間,采用了時間段、天氣、路段和當前路段的運行時間和下一路段的運行時間作為輸入變量,能較好應對運行過程的隨機延遲[4]。周敏等采用廣義神經網絡(GRNN)預測公交車運行時間,提高了系統(tǒng)的泛化能力,減小了預測誤差[5]。郭蘭平等采用徑向基函數(shù)(RBF)神經網絡預測蘭州103路公交車的車速,擬合進度和預測精度較高[6]。神經網絡是根據(jù)大腦的生理研究,采用特定的拓撲結構,通過輸入層、隱含層和輸出層之間順次連接,對輸入的數(shù)據(jù)進行加權求和,如果和超出某個閾值,輸出一個量。通過大量的數(shù)據(jù)訓練進行學習訓練,不斷調整各輸入端的權重,形成最符合要求的預測模型。但是,神經網絡需要的計算時間和計算空間較大,并容易陷入局部最優(yōu)。
2.1 區(qū)域性
區(qū)域性影響主要是指公交車在行駛過程中,由于所處城市不同的繁華地區(qū),行駛的速度和車乘人員的數(shù)量都不同程度的變化,這些導致了交通密度、交通流量、車輛排隊長度等因素的變化。其中,交通流量指單位時間內通過道路某一截面的實際車輛數(shù),是用來度量城市交通狀態(tài)的一個指標。交通密度是指單位長度的道路上某一時刻能夠容納的最多車輛數(shù)。交通密度和交通流量成反比,當發(fā)生交通擁堵導致觀測路段無法通行,全部車流處于停滯狀態(tài)時,交通密度最大,交通流量幾乎為零。車輛排隊長度是指為排隊等候在發(fā)生交通間斷點(道路交叉口或交通事故發(fā)生地點)的車輛數(shù)。排隊長度越長,道路的擁擠程度越厲害。
針對區(qū)域性影響因素,對于這個區(qū)域通過的公交車可以不去考慮,因為這帶有區(qū)域性特點,也就是越繁華的地方,區(qū)域性影響趨于一致。那么對于本區(qū)域的公交車的車速,載客量,交通高低峰的影響是一致的。如果局部區(qū)域出現(xiàn)交通事故,那么對這一區(qū)域的公交車的影響也是趨于一致的。涂利明選取杭州公交104路,其中經過醫(yī)院、商業(yè)區(qū)等比較復雜路況的路段時,交通密度和車輛排隊長度很大,而線路中其他路段的路況較暢通,候車乘客也比較少[3]。
2.2 全局性
全局性影響是指相關因素針對整個城市的公交系統(tǒng)都有統(tǒng)一的影響,車輛運行的高峰時段還是平峰時段,天氣狀況和工作日的時間都對整個城市公交系統(tǒng)的影響有一致的趨勢。其中,車輛運行時段是指公交車運行的時間,分為高峰時段、平峰時段。而天氣狀況會影響公交車的某些性能參數(shù),相對于夏季,冬天需要熱車時間。另外,降雨、大霧、降雪等惡劣天氣會導致路面濕滑和阻擋行車視線,影響公交車的行駛時間。對于工作日,高峰和平峰對所有公交車的影響是一致的。對于節(jié)假日,繁華地段、部分公園和樂園的公交影響往往大于工作日時段。那么這些影響因素對整個城市的公交系統(tǒng)的影響并不區(qū)分繁華地區(qū)還是城市近郊區(qū)地區(qū)。
BP(back-propagation)誤差反向傳播的神經網絡,主要思想是利用實際輸出與期望輸出之差對網絡的各層連接權重由后向前逐層進行校正,通過大量樣本數(shù)據(jù)的不斷訓練,使誤差平方和最小。如圖1所示,這是一個BP神經元模型,它具有n個輸入,每個輸入都通過一個恰當?shù)臋嘀祑和下一層相連,網絡輸出可表示為a=f(wx+b),其中f表示輸入/輸出關系的傳遞函數(shù)。
圖1 BP神經元模型
BP神經網絡由三個層次構成:輸入層、隱藏層和輸出層。輸入層的個數(shù)由樣本分類個數(shù)決定。隱藏層的層數(shù)和每層的神經元個數(shù)由用戶指定。每一層包含若干個神經元,每個神經元包含一個而閾值,用來改變神經元的活性。網絡中的連線表示前一層神經元和后一層神經元之間的權值。每個神經元都有輸入和輸出。輸入層的輸入和輸出都是訓練樣本的屬性值。BP神經網絡的優(yōu)點是只要有足夠的隱藏層和隱藏節(jié)點,就可以逼近任意的非線性映射。缺點是收斂速度較慢,目標函數(shù)陷入局部最小點的可能性較大。可以采用修正辦法,調節(jié)收斂速度增加動量項,或高階導數(shù)和共軛梯度法等數(shù)學方法修正函數(shù)。
在影響公交運行的因素中,考慮全局影響因素、區(qū)域影響因素和車載信息因素。全局影響因素選取時間段、天氣、是否是節(jié)假日作為模型的輸入變量。時間段變量X1分為高峰時段、平峰時段。對于天氣變量X2,考慮晴天和多云、降雨和多霧兩種情況。對于節(jié)假日變量X3,分為工作日和非工作日。公交車輛到站時間的歷史經驗數(shù)據(jù)可以作為線路到站時間預測模型的基準數(shù)。然而,同一線路在當天可能會有臨時交通狀況發(fā)生,從而造成公交車輛運行時間的變化,僅僅以歷史經驗數(shù)據(jù)進行預測可能與實際運行情況有一定的偏差。涂利明提到剛剛駛往下一個站點前車車輛的平均瞬時速度能夠近似地反映當前公交車輛駛入該區(qū)段時的道路交通狀況,該前車數(shù)據(jù)可以對經驗數(shù)據(jù)偏差進行修正[3]。針對區(qū)域因素,采用公交車和車站的信息交換設備,能夠提供公交車的上下行數(shù)據(jù)和不同路公交車的到站時間歷史記錄以及到上一個站點的時間。通過這些數(shù)據(jù)能映射區(qū)域性交通狀況,區(qū)域性影響主要是受到繁華地區(qū)和交通事故區(qū)域的交通密度、交通流量、車輛排隊長度等因素的影響,也就是單位時間內的區(qū)域性影響能夠通過這個時間段通過的不同路的公交車的上行和下行數(shù)據(jù)來表示,如果處于繁華地區(qū),公交車的相關數(shù)據(jù)反映了所處區(qū)域的情況——同樣班次的公交車到站時間間距變長,而處于城郊區(qū)域,單位時間內的公交車的運行時間基本一致。因此,采用公交車的上下行到站時間和同一路公交車的前一站的到站時間這些數(shù)據(jù),而這些數(shù)據(jù)是對車站周邊一公里半徑的交通狀況的一種反饋。公交車在線路上某站點i的到站時間預測是由i-1站點的上行到站時間變量X4、i站點t時刻最近的下行到站時間變量X5實現(xiàn)的。圖2為基于BP神經網絡構建的公交車到站時間的預測模型。
采用三層的BP神經網絡,輸入為表示5種影響因素,輸出為 表示t時刻公交車到達的時間,使用樣本數(shù)據(jù)對神經網絡進行訓練,調整相應的權重,這些訓練學習可以采用離線方式進行,對t時刻的預測過程,可以采用已經訓練好權重的神經網絡進行實時預測。
圖2 BP神經網絡結構
采用BP神經網絡較好地實現(xiàn)了對公交車到站時間這種非線性特征計算的預測,該模型選取了影響公交車運行狀態(tài)的全局性因素和反映區(qū)域性因素的多個變量,預測出當前時刻公交車的到站時間。但是BP神經網絡存在著學習時間長、計算量大,需要離線訓練等問題。下一步可以采用不需事先確定隱含層單元的徑向基函數(shù)神經網絡,而且學習時間短、計算量小,預測能力優(yōu)于BP神經網絡。針對輸入層,目前只考慮了同路公交車在i-1站點的上行到站時間和i站點t時刻最近的下行到站時間,以后的研究中,可以加入不同路公交車的i站點的上行和下行到站時間,以期提高預測的準確性。
[1] 孫棣華,賴云波,廖孝勇,等.公交浮動車輛到站時間實時預測模型[J].交通運輸工程學報,2011(2):84-89.
[2] 周雪梅,彭昌溆,宋興昊,等.基于前車數(shù)據(jù)的動態(tài)公交車輛到站時間預測模型研究[J].交通與運輸(學術版),2011(2): 52-56.
[3] 涂利明.基于前車與經驗數(shù)據(jù)的車輛到站時間預測模型[J].計算機時代,2015(1):1-3.
[4] 于濱,楊忠振,林劍藝.應用支持向量機預測公交車運行時間[J].系統(tǒng)工程理論與實踐,2007(4):160-164.
[5] 周敏,韓印,姚佼.基于廣義回歸神經網絡的公交車運行時間預測模型[J].交通與運輸(學術版),2013(2):75-78.
[6] 郭蘭平,俞建寧,張建剛,等.改進RBF神經網絡在城市公交車速時間序列預測中的應用[J].重慶理工大學學報(自然科學版),2010(12):60-66.
[責任編輯]董大偉
O141.4
A
1673-5935(2016)04-0038-03
10.3969/j.issn.1673-5935.2016.04.011
2016-11-10
山東省高等學??萍加媱濏椖?J11LG82)
謝 煒(1972—),男,上海虹橋人,中國石油大學勝利學院高等教育研究與評價中心講師,主要從事計算機應用研究和高教研究。