康科
摘要:出租車的供需矛盾影響著整個城市的交通。通過挖掘出租車GPS軌跡中的信息,可以預測乘客的目的地位置,提高出租車調(diào)度中心的效率,幫助緩解城市的壓力,減少城市污染。同時預測乘客的目的地還可以用于商業(yè)廣告推廣,提高導航效率等。本文主要介紹出租車乘客目的地預測的原理和方法。
關(guān)鍵詞:出租車;GPS軌跡分析;目的地預測;乘客
0前言
出租車公司為每輛出租車都安裝了GPS儀器,方便出租車公司的監(jiān)控和調(diào)動,同時能夠保證出租車司機的安全。當前,城市的交通壓力空前巨大,交通擁堵和空氣污染問題嚴重。出租車是緩解城市壓力的一種重要的交通工具。但是,由于出租車的數(shù)量有限,在交通高峰期很多乘客很難找到一輛出租車。而出租車在某些時段需要形勢很長的距離才能找到乘客。因此,出租車調(diào)度中心需要提高調(diào)度效率,保證出租車的使用率,是一個亟待解決的問題。但是,由于出租車的流動性較強,在不知道乘客目的地的情況下很難對其進行調(diào)度。在出租車GPS軌跡信息中,蘊含了大量的乘客信息。從這些信息中,可以挖掘出乘客的流動模式,以及城市中不同乘客的乘車習慣。使用這些信息,可以幫助我們預測出租車的目的地,緩解城市的交通壓力。
1出租車GPS數(shù)據(jù)分析
為了保證數(shù)據(jù)能夠真實的反應(yīng)城市的交通規(guī)律以及乘客的乘車習慣,本文中使用了葡萄牙波爾圖市的出租車數(shù)據(jù)。在該數(shù)據(jù)中包含了442輛出租車的GPS數(shù)據(jù)。數(shù)據(jù)包含了9個特征,包括:每條軌跡的唯一編號,乘客是否使用電話呼叫出租車的方式,乘客的電話,上車的出租車站臺,出租車的編號,時間,是否為節(jié)假日,數(shù)據(jù)是否完整,出租車GPS軌跡點。數(shù)據(jù)的跨度從2013年的7月到2014年6月。出租車的軌跡數(shù)據(jù)幾乎遍布城市路網(wǎng)的各個角落。越往城市市中心,出租車的軌跡就越密集,乘客的搭載活動越多。在城市中間河流的北岸乘客活動最密集。
2乘客目的地聚類方法
由于乘客目的地遍布城市的各個角落,增加了城市目的地預測的難度。為了方便預測,在建立預測模型之前,將乘客的目的地進行聚類,方便可以降低預測模型的復雜性,提高預測效率。在常用的聚類方法當中使用DBSCAN方法和mean-shift聚類方法最多。本文中采用了mean-shift聚類方法。在聚類之前,本文選擇了出租車的軌跡的最后一個點作為乘客的下車地點,然后使用聚類算法對其聚類。聚類結(jié)果為3356個點,這些點幾乎涵蓋了城市的所有角落。圖1為對GPS軌跡中所有點的可視化??梢钥闯鰩缀踉诿總€地點都有乘客下車。同時可以看出和全部的數(shù)據(jù)可視化一樣,在市中心的下車遠遠高于其它地區(qū)。
3乘客目的地預測常用方法及應(yīng)用
在出租車預測的常用算法中,最常見的有兩類算法:基于概率論的目的地預測和基于神經(jīng)網(wǎng)絡(luò)的目的地預測。其中基于概率論的算法計算GPS軌跡數(shù)據(jù)中的先驗概率,通過計算不同位置之間的轉(zhuǎn)換概率,獲得最大概率的目的地作為乘客目的地。其優(yōu)點是計算簡單,算法復雜度低,同時能夠充分利用數(shù)據(jù)中的信息。但是對數(shù)據(jù)的噪聲并不能很好的處理。要求數(shù)據(jù)量足夠大。由于GPS軌跡自身具有稀疏性,在城市兩個不同地點之間很難具有足夠的GPS數(shù)據(jù),所以此類模型很難提供高精度的運算。
深度神經(jīng)網(wǎng)絡(luò)技術(shù)是當前最流行的算法之一。該算法在圖像識別、語音識別等領(lǐng)域獲得了巨大成功?;谏窠?jīng)網(wǎng)絡(luò)的模型使用該算法,將原始的GPS軌跡數(shù)據(jù)進行特征提取以后使用該模型進行預測。在當前的算法當中,該模型在出租車目的地預測當中保持了最高的準確度。
基于出租車GPS目的地的預測有很多應(yīng)用,其中如上文提到的是最重要的應(yīng)用之一。除此之外還有很多其它應(yīng)用。例如,每年商業(yè)公司都要花費巨額資金投入到廣告行業(yè)進行商業(yè)推廣。但是,精準的廣告投放需要具有豐富的工作經(jīng)驗。如果能夠分析出租車的目的地,分析目的地乘客的類型和消費習慣,就可以對乘客進行更加的精準的分析。這樣對其進行商業(yè)廣告的推廣就更加有效。此外,目的地預測還可以提高導航系統(tǒng)的功能,自動駕駛等方面有廣闊的前景。
4結(jié)語
出租車是緩解城市交通壓力的重要手段之一,只有充分利用才能最好的緩解乘客與出租車之間的供需矛盾。同時,能夠提高出租車司機的收入,也可以減少城市污染。通過分析出租車GPS軌跡信息中的乘客規(guī)律,可以幫助調(diào)度中心更好的預測出租車的形勢方向和區(qū)域。這樣就可以進一步提高出租車調(diào)度中心的調(diào)度效率。幫助出租車更快的響應(yīng)需要乘車的乘客。