邊冰 鄭軍 趙斌
摘? 要: 傳統(tǒng)的公交車時(shí)間預(yù)測(cè)由于多方面因素影響導(dǎo)致很難建立數(shù)學(xué)模型,預(yù)測(cè)結(jié)果精度不理想很難讓市民滿意,這將很難提高公共交通的服務(wù)水平和服務(wù)質(zhì)量。由于RBF神經(jīng)網(wǎng)絡(luò)能夠迅速地逼近實(shí)際值,為此文中提出一種基于RBF神經(jīng)網(wǎng)絡(luò)的公交車到站時(shí)間預(yù)測(cè),以公交車到站時(shí)間為輸入,以兩站相差的時(shí)間為輸出建立模型。通過(guò)仿真和分析,并且和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)結(jié)果對(duì)比,實(shí)驗(yàn)結(jié)果表明,RBF神經(jīng)網(wǎng)絡(luò)在公交車到站時(shí)間預(yù)測(cè)結(jié)果與實(shí)際值更為接近,并且優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。
關(guān)鍵詞: 公交車; 時(shí)間預(yù)測(cè); RBF神經(jīng)網(wǎng)絡(luò); 數(shù)學(xué)建模; 網(wǎng)絡(luò)訓(xùn)練; 仿真分析
中圖分類號(hào): TN711?34; TP183? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼: A? ? ? ? ? ? ? ? ? ? ? ?文章編號(hào): 1004?373X(2020)14?0131?04
Bus arrival time prediction based on RBF algorithm
BIAN Bing1, ZHENG Jun1, ZHAO Bin2
(1. Department of Electrical Engineering, North China University of Science and Technology, Tangshan 063000, China;
2. School of Metallurgy and Energy, North China University of Science and Technology, Tangshan 063000, China)
Abstract: The traditional bus time prediction is hardly possible to establish a mathematical model because of the various factors, and the prediction accuracy is not ideal and it is very difficult to achieve public satisfaction, which will be hard to improve the service level and service quality of the public transportation. As the RBF neural network can approach the actual value quickly, a bus arrival time prediction based on RBF neural network is proposed, which takes the bus arrival time as the input and takes the time difference between two stations as the output to modelling. The simulation and analysis results show that, in comparison with the BP neural network, the predicted results of RBF neural network in the bus arrival time are closer to the actual values, and better than that of the BP neural network.
Keywords: bus; time prediction; RBF neural network; math modeling; network training; simulation analysis
0? 引? 言
近年來(lái),我國(guó)的中小城市發(fā)展十分迅速,為了提高生活質(zhì)量,鄉(xiāng)村居民涌入市里發(fā)展,由于私家車越來(lái)越多,城市可用的空間不足,人們出行很容易受到限制,公交車由此發(fā)展起來(lái),因?yàn)楣步煌ň哂懈采w面廣、行駛路線最多、廉價(jià)乘車等特點(diǎn)[1]。但是公交車在預(yù)測(cè)到站時(shí)間上無(wú)規(guī)律,無(wú)法搭建數(shù)學(xué)模型,所以在大中小城市中公交車的到站時(shí)間預(yù)測(cè)問(wèn)題上都處于模糊狀態(tài),雖然公共運(yùn)輸系統(tǒng)(APTS)可以為市民的出行提供幫助,但是公交車到站的時(shí)間預(yù)測(cè)容易受到多方面因素影響[2]。所以能夠在誤差盡量小的范圍內(nèi)準(zhǔn)確預(yù)測(cè)出公交車到站的時(shí)間,對(duì)公共交通行業(yè)具有重要意義[3]。
能夠推算出車輛到站的確定時(shí)間是關(guān)乎人們切身利益和時(shí)間效率的重要保障,引起了國(guó)內(nèi)外學(xué)者的高度重視,產(chǎn)生大量科研成果。
李少偉等通過(guò)采集不同車輛到站的軌跡并結(jié)合GPS數(shù)據(jù)和線路GIS數(shù)據(jù)對(duì)車輛到站時(shí)間進(jìn)行推算,GPS在公交車上的運(yùn)用前期投入資金比較大,并且在公交車行駛中容易受到立交橋、隧道、高樓等影響,造成數(shù)據(jù)缺失和GPS數(shù)據(jù)為零的狀況,很容易形成車還在走而定位定在了以前經(jīng)過(guò)的某個(gè)地點(diǎn)[4]。
范光鵬等先用LSTM算法預(yù)測(cè)出時(shí)間,再經(jīng)過(guò)卡爾曼對(duì)時(shí)間進(jìn)行加工來(lái)對(duì)公交車時(shí)間做出預(yù)測(cè)。雖然卡爾曼濾波能夠運(yùn)用遞推的算法來(lái)處理維數(shù)較高的問(wèn)題,但是多步預(yù)測(cè)的精度明顯下降導(dǎo)致數(shù)據(jù)準(zhǔn)確度不高[5]。
謝煒通過(guò)汽車行駛的歷史信息并且考慮了其他方面的影響,提出了運(yùn)用BP算法對(duì)車輛到站時(shí)間進(jìn)行預(yù)測(cè)[6],但BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過(guò)程較慢,逼近點(diǎn)不唯一,結(jié)果誤差比較大。
面對(duì)以上問(wèn)題,本文提出一種運(yùn)用RBF算法來(lái)對(duì)車輛的到站時(shí)間進(jìn)行預(yù)測(cè)。網(wǎng)絡(luò)的輸入為某個(gè)到達(dá)站點(diǎn)的時(shí)間、當(dāng)天的天氣和溫度,輸出為下一個(gè)站到達(dá)時(shí)間。通過(guò)RBF算法的訓(xùn)練學(xué)習(xí)從而對(duì)車輛到站時(shí)間做出預(yù)算,并且與BP神經(jīng)網(wǎng)絡(luò)算法數(shù)據(jù)進(jìn)行對(duì)比,結(jié)果顯示RBF算法的預(yù)測(cè)結(jié)果明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò)算法[7]。
1? 公交車到站時(shí)間影響因素分析
由于公交車容易受到外界多方面因素影響,很難建立數(shù)學(xué)模型,本文選擇了兩個(gè)對(duì)行程時(shí)間影響較大的主要因素,分別為天氣和溫度。
天氣對(duì)于乘客和汽車影響都比較大,在測(cè)量數(shù)據(jù)這一時(shí)間段內(nèi),主要包括晴朗、陰天和下雨,分別對(duì)應(yīng)表示為[z=0? 1? 2T]。
溫度統(tǒng)一定為低于20 ℃為低溫,20~25 ℃為常溫,25 ℃及以上為高溫,分別對(duì)應(yīng)表示為[r=0? 1? 2T]。
2? 基于RBF神經(jīng)網(wǎng)絡(luò)的公交車到站預(yù)測(cè)
2.1? RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)
輸入的樣本維數(shù)確定了輸入層的神經(jīng)元數(shù),首先樣本不是直接進(jìn)入第二層,而是經(jīng)過(guò)和權(quán)值相乘來(lái)作為第二層輸入;隱含層主要是徑向基函數(shù),它可以將輸入層的輸出經(jīng)過(guò)非線性的變化映射到一個(gè)新的區(qū)域,再和第二層到第三層的權(quán)值相乘;輸出層是線性變化,它可以把非線性變化的數(shù)據(jù)進(jìn)行求和。徑向基函數(shù)可以根據(jù)不同的輸入樣本自動(dòng)生成網(wǎng)絡(luò)結(jié)構(gòu),并且具有局部逼近能力,能夠高度逼近真實(shí)值,具有唯一性。在網(wǎng)絡(luò)樣本訓(xùn)練時(shí),只需要調(diào)整局部權(quán)值就可以很快地運(yùn)行網(wǎng)絡(luò)。
變換函數(shù)一般采用高斯函數(shù),激活函數(shù)可表示為:
[R(xi-ci)=exp-12σxk-ci2]? ?(1)
式中:[xk]為樣本輸入;[ci]為樣本高斯函數(shù)中心值;[σ]為數(shù)的方差;[xk-ci2]為歐氏范數(shù)。
由圖1可以得到RBF神經(jīng)網(wǎng)絡(luò)的輸出為:
[yi=i=1h?ijexp-12σxk-ci2] (2)
式中:[xk=(xk1,xk2,…,xkm)T]為第k個(gè)輸入樣本;k=1,2,[…],K,K為輸入樣本總數(shù);[?ij]為連接輸出層和隱含層的權(quán)值; i=1,2,[…],h,h為第二層節(jié)點(diǎn)的個(gè)數(shù);[yj]為第j個(gè)輸入經(jīng)過(guò)網(wǎng)絡(luò)得出的輸出值。
2.2? RBF神經(jīng)網(wǎng)絡(luò)的訓(xùn)練
在學(xué)習(xí)訓(xùn)練中有幾個(gè)重要的參數(shù),它們直接影響網(wǎng)絡(luò)結(jié)果。首先計(jì)算基函數(shù)的中心、方差,最后計(jì)算第二層到第三層的權(quán)值[8]。找到適中的權(quán)值有多種方法,本文運(yùn)用最小二乘法計(jì)算,其具體步驟如下:
1) 求取基函數(shù)中心[c]有很多種算法,本文運(yùn)用K均值聚類算法[9],建立h個(gè)聚類中心[ci],首次取值時(shí)其向量的值可以任意選擇大小,本文選取h個(gè)訓(xùn)練樣本作為初次的聚類中心。
① 計(jì)算出所有訓(xùn)練樣本到每個(gè)聚類中心的歐氏距離,按照距離最近的單獨(dú)分成一組。
② 對(duì)上面分成的組求取均值,得到新的聚類中心,公式如下:
[ci=1Nij=1Mxij]? ? ? ? ? ? ? (3)
式中:[Ni]為第i組樣本總量;M為第i組向量元素總量;[xij]為第i組第j個(gè)樣本
③ 當(dāng)計(jì)算得到的[ci]值保持不變時(shí),停止求取,否則返回步驟②。
2) 求取方差[σ],其公式如下:
[σi=cmax2h]? ? ? ? ? ? ? ? ? ?(4)
式中:[cmax]為求取的最大聚類中心;h為訓(xùn)練樣本總量。
3) 最后運(yùn)用最小二乘法來(lái)計(jì)算連接第二層到第三層的權(quán)值,公式如下:
[?=exp-hc2maxxk-ci2] (5)
通過(guò)式(3)~式(5)計(jì)算好這3個(gè)主要參數(shù),使得能夠得到最佳網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù),為后續(xù)的運(yùn)行工作提供了保障。
2.3? 樣本的訓(xùn)練
網(wǎng)絡(luò)輸入定為第一站婦產(chǎn)醫(yī)院的到站時(shí)間和當(dāng)天的天氣和溫度,輸出定為末站到站時(shí)間,每一組都需要測(cè)量?jī)烧镜秸緯r(shí)間并記錄天氣和溫度,一共采集60組樣本,隨機(jī)抽取50組樣本作為網(wǎng)絡(luò)的訓(xùn)練,剩下10組作為網(wǎng)絡(luò)的檢測(cè)。
令:
[x=x11x12x13x21x22x23x31x32x33???xk1xk2xk3,y=y1y2y3?yk] (6)
式中:[x]為首站到站時(shí)間、天氣和溫度的輸入矩陣;[y]為末站時(shí)間的輸出矩陣。將[x]矩陣和權(quán)值相乘作為第二層輸入,并且根據(jù)第2.2節(jié)修正好的3個(gè)主要參數(shù)計(jì)算出[yi],再計(jì)算離差,具體公式如下:
[ek=yk-yi]? ? ? ? ? ? ? ? ? ? ?(7)
將離差的加權(quán)平方和達(dá)到最小,滿足初始設(shè)置的范圍[10]。為了更好地接近真實(shí)值,本文設(shè)置為0.01。
本文還選用相對(duì)誤差和決定系數(shù)兩個(gè)評(píng)價(jià)指標(biāo)來(lái)對(duì)網(wǎng)絡(luò)預(yù)測(cè)的性能做出評(píng)判。當(dāng)相對(duì)誤差越小時(shí),網(wǎng)絡(luò)預(yù)測(cè)能力越好。決定系數(shù)的數(shù)值在[0,1]內(nèi),越逼近1,預(yù)測(cè)結(jié)果越好;反之越接近于0,性能越差。
3? 案例研究
本文考慮了公交車會(huì)受上車的人數(shù)和地理的環(huán)境影響,所以選擇唐山市2路汽車到站時(shí)間為例。2路汽車行駛的街道為唐山市的主街道新華道,從婦產(chǎn)醫(yī)院站到廣場(chǎng)站一共是9站,途徑學(xué)校、醫(yī)院、商業(yè)街等復(fù)雜道路,人口密度也很大,非常適合實(shí)例研究,使用跟車調(diào)查的方式對(duì)2路汽車進(jìn)行數(shù)據(jù)的采集。天氣和溫度會(huì)對(duì)采集的數(shù)據(jù)產(chǎn)生很大的影響。陰天下雨,天氣的冷暖可能導(dǎo)致乘客不愿意出行;天氣溫度適合會(huì)出現(xiàn)大部分乘客扎堆出行的狀況,采集的時(shí)間定為2018年8月1日—9月29日,每天7:00開(kāi)始采集公交車到兩站的時(shí)間并且記錄當(dāng)天的天氣和溫度情況,大部分人在7:00都會(huì)去乘坐公交車上班,每天等公交的人數(shù)也基本處于固定狀態(tài)。運(yùn)用RBF神經(jīng)網(wǎng)絡(luò)對(duì)樣本進(jìn)行訓(xùn)練和檢測(cè)的結(jié)果見(jiàn)表1。
如表1所示,表格第3、4列為不同算法預(yù)測(cè)出的數(shù)值,前者從第1個(gè)樣本到第10個(gè)樣本幾乎接近于實(shí)際值,而相比第3列,第4列的10個(gè)預(yù)測(cè)輸出值明顯和真實(shí)值相差很遠(yuǎn)。第5、6列為不同算法的絕對(duì)誤差,通過(guò)第5列和第6列誤差數(shù)據(jù)可以看出,第5列數(shù)據(jù)明顯小于第6列,經(jīng)過(guò)計(jì)算兩列數(shù)據(jù)的差值,樣本3的兩列數(shù)據(jù)相差能到44.05,說(shuō)明BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)效果不佳。
圖2顯示第3個(gè)樣本的數(shù)據(jù)相差比較大,圓圈線幾乎接近星線;而圖3中,三角線和星線的值差達(dá)到44.05,第2、5和8樣本三角線和星線值相差也很大。
而從第1個(gè)樣本到第10個(gè)樣本,圓圈線幾乎重疊于星線,表明RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)曲線與實(shí)際到站時(shí)間曲線更為貼切,即比BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)到站時(shí)間更接近真實(shí)值,曲線上方顯示決定系數(shù)分別為0.967 61和0.873 8。結(jié)果也顯示前者的預(yù)測(cè)性能更好。
圖4是兩種不同算法預(yù)測(cè)的相對(duì)誤差。從圖中可以看出,樣本2、3三角線和星線相差較大,將近3%,其他樣本星線幾乎都低于三角線,最低的誤差能達(dá)到4.9%,說(shuō)明RBF神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)公交車到站時(shí)間比BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)公交車站時(shí)間效果更好。
4? 結(jié)? 語(yǔ)
本文通過(guò)RBF神經(jīng)網(wǎng)絡(luò)對(duì)非線性的公交車到站時(shí)間做出預(yù)測(cè),通過(guò)Matlab學(xué)習(xí)與訓(xùn)練得到了相對(duì)誤差和決定系數(shù)兩個(gè)性能指標(biāo),經(jīng)過(guò)兩個(gè)指標(biāo)的對(duì)比得出RBF神經(jīng)網(wǎng)絡(luò)優(yōu)于BP神經(jīng)網(wǎng)絡(luò)。結(jié)果表明,本文算法在公交車到站時(shí)間預(yù)測(cè)問(wèn)題上具有較好的可靠性和準(zhǔn)確性。
但是在實(shí)際生活中,影響公交車到站時(shí)間因素有很多,RBF算法也會(huì)有一些缺點(diǎn),它需要大量的樣本數(shù)據(jù),數(shù)據(jù)太小預(yù)測(cè)效果不好,樣本的數(shù)據(jù)幾乎接近,預(yù)測(cè)出來(lái)的結(jié)果可能也不是很準(zhǔn)確。
在今后的學(xué)習(xí)中應(yīng)該考慮外在其他因素對(duì)結(jié)果的影響并且繼續(xù)尋找更優(yōu)的算法,通過(guò)算法建立模型來(lái)更好地服務(wù)于人們。
注:本文通訊作者為鄭軍。
參考文獻(xiàn)
[1] 向紅艷,彭學(xué)文.公交到站時(shí)間預(yù)測(cè)研究現(xiàn)狀與發(fā)展趨勢(shì)[J].交通信息與安全,2014,32(4):57?61.
[2] 謝芳,顧軍華,張素琪,等.基于MapReduce聚類和神經(jīng)網(wǎng)絡(luò)的公交車到站時(shí)間預(yù)測(cè)模型[J].計(jì)算機(jī)應(yīng)用,2017(z1):125?129.
[3] 左忠義,汪磊.公交到站時(shí)間實(shí)時(shí)預(yù)測(cè)信息發(fā)布技術(shù)研究[J].交通運(yùn)輸系統(tǒng)工程與信息,2013(1):67?72.
[4] 李少偉,曹成濤,楊驥.基于GPS軌跡數(shù)據(jù)的公交到站時(shí)間預(yù)測(cè)方法研究[J].軟件工程師,2017,20(4):15?17.
[5] 范光鵬,孫仁誠(chéng),邵峰晶.基于LSTM和Kalman濾波的公交車到站時(shí)間預(yù)測(cè)[J].計(jì)算機(jī)應(yīng)用與軟件,2018,35(4):97?102.
[6] 謝煒.一基于BP神經(jīng)網(wǎng)絡(luò)的公交車到站時(shí)間預(yù)測(cè)[J].中國(guó)石油大學(xué)勝利學(xué)院學(xué)報(bào),2016,30(4):38?40.
[7] 段光忠.基于公交車運(yùn)行軌跡的到站時(shí)間預(yù)測(cè)系統(tǒng)研究[J].科技資訊,2017(9):23.
[8] 鄧捷,陸百川,劉權(quán)富,等.基于RBF神經(jīng)網(wǎng)絡(luò)的交通生成預(yù)測(cè)模型[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2014(1):43?47.
[9] 黃波,丁浩,張孝芳,等.基于RBF神經(jīng)網(wǎng)絡(luò)的某復(fù)雜裝備故障預(yù)測(cè)方法[J].計(jì)算機(jī)仿真,2014,31(1):14?17.
[10] 肖汶謙,陸百川,郭桂林,等.RBF神經(jīng)網(wǎng)絡(luò)在公交行程時(shí)間預(yù)測(cè)中的應(yīng)用[J].交通科技與信息,2015(2):69?73.