国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于網約車GPS數據的用戶出行挖掘與推薦研究

2018-12-24 08:02:54賈步忠
微型電腦應用 2018年12期
關鍵詞:網約車網約路段

賈步忠

(陜西財經職業(yè)技術學院 會計二系, 咸陽 712000)

0 引言

在智能化和信息化背景下,智能交通城市當前我國城市發(fā)展的一個亮點,也是未來城市發(fā)展的趨勢。作為智能交通發(fā)展代表的滴滴、神州等網約車軟件,在運行的過程中積累了大量的車輛運行軌跡數據[1]。在這些軌跡數據中,記錄了大量的城市交通和人群移動的信息,為我國城市交通的進一步優(yōu)化提供了大量的信息。由此,如何加強對這些數據對挖掘應用,特別是結合部分專職滴滴、神州司機的GPS數據,對居民出行特征進行挖掘,對政府和部分網約車企業(yè)進一步投放網約車廣告,提升網約車服務等,具有非常重要的作用和價值。同時在利用GPS數據對用戶出行進行分析的研究中,很多學者都進行了研究,并取得豐碩的成果。如景維鵬(2016)則結合出租車的GPS運行軌跡,提出一種基于地圖匹配算法模型,以GPS采集的坐標作為基礎,在一定區(qū)域內采用空載概率推薦的方法完成對居民用戶出行的出租車推薦[2];王瑤(2018)為進一步挖掘居民出行的軌跡,提出一種基于高斯定律的出行軌跡挖掘方法,該研究的最大特點在于對GPS數據區(qū)域進行劃分,然后以每個單元作為統計點,對載客的終點和起點進行統計,最后根據公式計算在一定時間內的乘客凈流入量。但是這種方法通常計算量大;林基艷則提出將聚類分析算法引入到對用戶出行特征軌跡分析中,從而提取市民出行的時空特征[3,4]; Jing Yuan(2013)、Yu Zheng(2011)等則利用GPS軌跡對用戶的出行進行挖掘,從而得到出租車主要運行特征。本文則在以往研究的基礎上,結合居民出行具有典型的時空特性的特點,以陜西某城市的網約車GPS數據作為基礎來源,提出一種基于密度聚類的城市用戶出行分析方法,并在該基礎上,提出一種基于BP網絡的乘客推薦模型[5]。

1 數據來源

本文使用的網約車數據,主要以西安市某網約車公司平臺下注冊的1.1萬輛車輛在1個月內的運營數據作為基礎,在對以上的GPS數據經過預處理后,保留車牌號、當前位置、營運狀態(tài)、行駛速度、行駛方向和運營時刻等基本屬性[6]。部分網約車屬性如表1所示。

表1 部分網約車基礎數據統計表

在上述的數據中,網約車的營運狀態(tài)用0~3來表示,其中1表示車輛為空載狀態(tài)、1表示車輛為載客狀態(tài)、2表示車輛為駐車狀態(tài),3表示網約車司機下線停運。GPS方向取值為0~360°。

2 數據處理

2.1 數據預處理

在對網約車的GPS數據挖掘中,可能存在兩個比較突出的問題,一是軌跡點存在異常;二是軌跡點的經緯度越界[7]。為解決以上的問題,在對經緯度越界問題的處理中,首先劃分重點研究區(qū)域,清楚研究范圍以外的區(qū)域,以減少可能出現的越界問題。在本研究中,則以西安市三環(huán)以內作為研究區(qū)域,清除掉三環(huán)以外的所有坐標。其次,針對軌跡點可能出現的異常,如某網約車原本在西安的A處,5分鐘出現在西安B處,且距離相差10 km,這對于城市交通來講,這種數據明顯存在異常的問題[8-9]。因此,在對數據的篩選中,剔除這類GPS坐標異常的數據。在具體的執(zhí)行過程中,則采用Douglas - Peucker算法對曲線中密度節(jié)點較高的進行剔除。

3 基于時間序列的居民出行時空特征挖掘模型構建

3.1 相似度衡量方法

在對數據進行挖掘之前,必須要對選擇的路段進行區(qū)域劃分,以提高聚類挖掘的準確率。但是,在實際的聚類挖掘中,大部分的GPS數據為靜態(tài)數據,而就業(yè)時間序列的數據為動態(tài)數據。對此,本文首先結合程靜的研究成果,采用時間序列距離度量和相關性結合的方式將數據進行轉換[10]。由此,分別定義相關性函數和距離度量計算式(1),(2)。

(1)

(2)

由此通過以上的分類,我們可以把西安的某區(qū)域劃分的區(qū)域,如圖1所示。

圖1 區(qū)域劃分

3.2 K均值聚類算法

為進一步挖掘陜西西安居民在不同時間段、不同地點等方面的上車信息,從而更好的為網約車的分配等提供借鑒,在本文中,則采用K均值聚類的方法對居民出行進行挖掘[11]。K均值聚類的原理是隨機一個簇作為中心,然后通過距離公式公式對類進行劃分,如圖2所示。

圖2 K均值聚類

在圖2中可以看出,K均值聚類最為關鍵的是兩個部分:一是對K值的確定,即對初始聚類的劃分;二是對距離的計算[12]。在本文的研究中,則以周末周日和上車量、下車量作為基本的分類,設定K=4。

4 乘客模型構建

結合上述的居民出行時空特征,為更好的為市民提供網約車服務,在本文中,則提出一種基于空車概率推薦算法,以滿足在早高峰或者是晚高峰用戶出行的需求。而在進行推薦前,引入地圖匹配算法完成對推薦的基礎構建。

4.1 地圖匹配模型

結合網約車實際的GPS位置來講,其定位的精度往往會受到手機GPS信號的影響,導致部分西安網約車主的GPS數據存在誤差[13]。由此,我們就需要對這部分數據進行進一步的處理,以減少誤差帶來的干擾。而在實際的對這部分數據的處理中,通常采用地圖匹配的方法進行。但是在傳統的地圖匹配算法中,通常會在預約數量較多的地方為用戶增加候選路段,目的是讓出行的用戶能在目標路段選擇網約車,如圖3所示。

圖3 地圖匹配示意圖

假設用戶的目標路段為GJ,可通過候選域PQRS中的候選路段對其進行定義。若是采用固定候選域ABCD對目標路段GJ進行定義,則還需對其他候選路段進行驗證,比如EN路段、IK路段等,如此一來,將會花費大量的時間在驗證工作中,造成一種不必要的資源浪費。如果在數據稀疏區(qū)中,固定候選域內并不存在路段,那么該算法匹配不成功。

基于上述的問題,為了提高該算法的匹配成功率,對以上匹配方法進行改進[14]。利用用車輛運行速度方向以及候選路段的夾角對該結果進行重新驗證,也就是說,當車與候選路段的夾角a>ω時,則說明當前候選路段失去利用價值。

在匹配過程中,將人在地圖上的位置看作一個靜態(tài)點;將車的位置看作動態(tài)點。其中,靜態(tài)點可存在于地圖中的任何位置,包括地圖路段之外;動態(tài)點智能出現于地圖中的路段之上。因此,若是出現人與預選路段的夾角為鈍角時,此時,可將人與該路段之間的直線距離當作判斷依據;若是出現車與預選路段夾角為鈍角的情況時,則放棄該預選路段[15]。具體匹配過程,如圖4所示。

在圖4中,AB代表預選路段;M代表目標點;a代表待匹配點;β代表預選路段夾角;d代表a至AB的最短直線距離;b代表M至AB的歐式距離。

4.2 乘客推薦模型構建

在乘客的推薦中,乘客等待主要根據等待的時間,或者是網約車的距離。在本文中,當前網約車車主在開啟網約車APP后,在空載的情況下,以乘客等待的時間作為推薦的根本依據。具體則是每3分鐘統計一次在某個區(qū)域內的空車數量,然后采用最小二乘法對時間和在該區(qū)域內的空車數進行擬合,進而得到關系曲線f(t),最后計算乘客到達目標路段的時刻開始,至到達率函數的積分大于等于 1 的時間差即為預測到達第一輛空車的時間[16]。而預測的到達的時間一般是小于等于5min,可以為網約車的用戶所接受,為式(3)。

f(t)=a0+a1t+a2t2+a3t3+a4t4,0

(3)

5 試驗驗證

為驗證上述方案的可行性,以西安市的路網數據作為基礎,整個路段超過10萬條,路網節(jié)點有100多萬。軌跡數據由某網約車下注冊的網約車司機在180天內,由1.1萬輛網約車產生的2億條信息記錄,轉換為數據的話,大概在30G左右。同時本文輸入挖掘的歷史GPS軌跡參數,輸入聚類分析的K值,以及區(qū)域分析的半徑,從而可以得到的聚類分析結果,如圖4、圖5所示。

圖5 工作日聚類結果

通過上述的結果可得到一個非常明顯的特征,那就是在工作日和非工作日中,陜西西安部分居民的出行特點:在工作日下,熱點區(qū)域出行預約網約車的用戶較多,并且出行密度高[17];而非工作日出行用戶少,且相對分散。

同時選擇西安某地的GPS坐標,運用上述的模型呼叫網約車,在經過多次和多時刻抽樣測試后,可得到的用戶等待結果,如圖6所示。

圖7 用戶等待時間

通過圖6的結果對比看出,預測時間和用戶實際的等待時間相差不大,說明本文構建的網約車乘客推薦模型預測的推薦時間與實際的時間比較接近,在乘客推薦方面具有很大的可行性。

6 總結

通過以上的分析可以看出,本文通過分析,挖掘出居民在不同時刻的出行特征,在工作日的網約車出行要求明顯高于非工作日,同時通過本文構建的用戶推薦模型,客戶等待的時間與預測的時間非常接近。進而驗證了本模型構建的可行性。

猜你喜歡
網約車網約路段
網約車平臺責任條款的識別方法——基于解釋進路的正當規(guī)制
法律方法(2022年2期)2022-10-20 06:45:02
冬奧車道都有哪些相關路段如何正確通行
工會博覽(2022年5期)2022-06-30 05:30:18
部、省、路段監(jiān)測運維聯動協同探討
共享經濟稅收征管挑戰(zhàn)及對策——以網約車為例
A Survey of Evolutionary Algorithms for Multi-Objective Optimization Problems With Irregular Pareto Fronts
網約車侵權責任在司法實踐中的認定
山西青年(2020年3期)2020-12-08 04:58:57
對網約車地方立法若干法律問題的幾點探討
網約車問題研究及對策
活力(2019年19期)2020-01-06 07:36:02
網約車安全性提高研究
活力(2019年17期)2019-11-26 00:42:18
基于XGBOOST算法的擁堵路段短時交通流量預測
麻阳| 泊头市| 福贡县| 阳东县| 江油市| 中牟县| 平罗县| 博客| 固镇县| 天长市| 南充市| 阜新| 农安县| 定远县| 夏津县| 全南县| 奉新县| 长沙市| 湖南省| 蒙城县| 双鸭山市| 白山市| 德令哈市| 茌平县| 于田县| 淮安市| 称多县| 威海市| 渭源县| 永兴县| 哈尔滨市| 汽车| 寻甸| 沁水县| 防城港市| 康乐县| 麦盖提县| 五常市| 石楼县| 乳山市| 绥滨县|