李貞鎬,
(清華大學 電子工程系,北京 100084)
隨著大城市全球化進程的加快和地域時差的影響,需要深夜工作的人數(shù)持續(xù)增加。特別是對于世界經(jīng)濟同步增長的大城市來講,為保障夜間出行人群使用大眾交通工具的需求,開設深夜公交線路顯得尤為重要。當前,中國的大城市大都設有深夜公交路線,但普遍存在運營效率低、運輸成本高、涵蓋范圍不夠等諸多問題[1]。隨著大城市人口不斷增加,利用建設衛(wèi)星城疏導人群是一種趨勢。以上海為例,設有松江、嘉定、安亭、金山衛(wèi)和吳淞等衛(wèi)星城,但連接這些衛(wèi)星城的深夜公交線路卻非常缺乏。
近年來,計算機技術迅猛發(fā)展,特別是以智能終端和社交媒體為代表的各種信息渠道的出現(xiàn)和信息的生產(chǎn)、流通、保有量的持續(xù)增長,大數(shù)據(jù)的概念越來越受到人們的重視[2]。
因為大數(shù)據(jù)中存在大量的無效信息,所以從中篩選出有用的信息非常重要??梢暬鳛榇髷?shù)據(jù)分析中最重要環(huán)節(jié)之一,其目的就是大數(shù)據(jù)分析結果可以通過視覺上容易理解的方式表達和傳遞[3]。可視化作為大數(shù)據(jù)中提取有價值信息的核心技術,是大數(shù)據(jù)處理過程中必不可少的環(huán)節(jié)。而且,隨著大數(shù)據(jù)處理和分析技術的發(fā)展,對既有大眾交通線網(wǎng)進行有效的評價及優(yōu)化,促進城市交通智能化管理健康發(fā)展。
大多數(shù)公交線路評價方法選取重復度為評價指標,但該方法在計算過程中對評價區(qū)間距離的定義不明確,而且,根據(jù)被選為評價基準的線路不同,其評價結果之間具有巨大的差異[4]??紤]區(qū)域均衡性的公交線路評價模型,目的是為了達到整個公交系統(tǒng)的均衡分布,確保公交線網(wǎng)較高的覆蓋程度,適合以城市整體公交線網(wǎng)的評估[5]。
本文在上海市深夜公交線網(wǎng)優(yōu)化的基礎上,利用可視化分析軟件,結合區(qū)域間均衡性模型方法和Dijkstra模型,研究基于移動數(shù)據(jù)及出租車移動數(shù)據(jù)的城市深夜公交線網(wǎng)評價及優(yōu)化系統(tǒng),分析上海既有深夜公交線網(wǎng)的問題并提出改進方案,為設計更高效的深夜公共交通線路提供有效的依據(jù)。
公交線路的重復度是指在大眾交通工具的運營中更有效的管理公交線路,即乘客使用起來更為便利的角度指定的評價指標,表示公交線路在特定區(qū)域或區(qū)間內(nèi)的集中程度的指標。公交線路的過度重復會影響公交運營的效率,還會影響乘客選擇乘坐路線[6]。
大多數(shù)公交線路的重復度評價方法是依據(jù)特定線路的區(qū)間長度,選取該區(qū)間內(nèi)運營多少公交線路為判斷指標,但這種方法在計算過程中具有一定的問題[7]。
首先,對評價區(qū)間距離的定義不明確。有的是計算整個線路的重復度,有的則是分成n個小區(qū)間進行計算。這2種方法的結果存在一定的差異,區(qū)間距離越小,重復線路越多,重復度指標也隨即偏高。其次,根據(jù)被選為公交路線評價對比基準的線路不同,重復度評價結果也不同??偟貋碚f,考慮到該方法不能徹底解決公交線路重復度評價中的問題,因此,本文研究選取考慮區(qū)域均衡性的公交線路評價模型。
在本文研究中,使用的數(shù)據(jù)集為上海移動網(wǎng)絡供應商提供的2014年8月1日—31日的數(shù)據(jù)統(tǒng)計。數(shù)據(jù)集是針對全市設置的各個基站每10 min的數(shù)據(jù)量與對應的基站接收數(shù)據(jù)次數(shù)組成的三維矩陣?;镜臄?shù)據(jù)集總共包含20億條,總容量為8 GB,數(shù)據(jù)集容量雖然很龐大,但其信息的來源具有很高的可靠性。
深夜公交移動需求量分析中使用的數(shù)據(jù)信息主要包括3種:
1)上海市主要移動網(wǎng)絡供應商用戶的追蹤數(shù)據(jù)集,每一個數(shù)據(jù)項記錄用戶名,每一次手機業(yè)務的開始和結束的時間、連接的基站編號以及消耗的流量等,數(shù)據(jù)集有超過19.6億條記錄,覆蓋38萬個基站。
2)上海出租車運營公司提供的數(shù)據(jù)集,記錄了上海市1.3萬輛出租車的移動軌跡數(shù)據(jù),采用經(jīng)緯度標示,時間跨度為1個月(2014年8月1日—31日),時間精度為1 min。
3)上海市地圖,由百度地圖下載,處理數(shù)據(jù)中選用精度為200 m。
本文對既有深夜公交線路進行評價時,主要考慮了線路的重復性和覆蓋程度,選用深夜公交線路的區(qū)域分布均勻程度為評價指標。在評價時,通過每個區(qū)域人口對比該區(qū)域深夜公交線路數(shù)量比值的差異,分析了深夜公交線路的區(qū)域均衡程度。
為了更好地觀察移動需求量的變化,本文以移動數(shù)據(jù)的變化量代替移動數(shù)據(jù)量。并且根據(jù)實際測量,經(jīng)過某一地區(qū)的公交線路周圍移動數(shù)據(jù)變化量除以該地區(qū)移動人口數(shù)量的結果,作為公交線路均衡性的判定指標[8]。
A=∑Dt+1-Dt/S
U=A/B
(1)
其中,A為按時間測定的區(qū)域內(nèi)平均移動數(shù)據(jù)變化量,D為按時間測定的移動數(shù)據(jù)量,t為時間(每隔10 min),S為區(qū)域面積,U為某一地區(qū)的公交線路分布均勻程度,B為人口。
單個公交線路的重復度Ri=1.0表示該公交線路從起點到終點的整個路段只有這一條線路,線路重復次數(shù)越多,重復度Ri的數(shù)值也相應提升,該值還可以作為公交線路之間相互影響的指標[9]。
(2)
其中,ni,b為從區(qū)域i到區(qū)域b的公交線路數(shù)量,nb,i為從區(qū)域b到區(qū)域i的公交線路數(shù)量,Ntotal為城市所有公交數(shù)量。
假設乘客深夜利用公交出行時,一般離最近公交站的移動距離不會超過1 km。對應每個公交站的移動需求量是通過以該公交站的坐標為中心、半徑為1 km的范圍內(nèi),所有基站接收的數(shù)據(jù)量之和除于以該范圍內(nèi)的所有公交站數(shù)量(包括圓心處的公交站),具體指標為[10]:
(3)
其中,St=n為每個公交站的移動需求量,Dr=1為1 km范圍內(nèi)所有基站接收的數(shù)據(jù)量之和,Sn為1 km范圍內(nèi)所有公交站數(shù)量。
每個公交線路的移動需求量是通過上述方法獲取的公交站移動需求量選取該路線經(jīng)過的公交站進行整合后,除以該路線的公交站數(shù)量[11]。
(4)
其中,Lt=n為深夜公交線路的移動需求量,St=m為每個公交站的移動需求量,Sn為深夜公交線路上的公交站數(shù)量。
通過以上2個指標就可以綜合地判斷公交線路的合理性。St-n和Lt-n數(shù)據(jù)越大,說明該公交站和公交線的利用率很高,反過來,如果St-n和Lt-n數(shù)據(jù)很低,甚至達到0,則說明該公交站選址和公交路線的選線都存在問題,需要進行優(yōu)化。
公交線路一般要求運輸能力高,要注重提高效率。優(yōu)化算法中通??紤]路徑、通行量、換乘、道路、車輛、效益、政策等諸多因素[12]。由于本文研究的優(yōu)化對象為深夜運營的公交線網(wǎng),因此只考慮了線路通行量和路徑長度2個因素,算法采用了Dijkstra模型。
G=(V,E,R,WT,WL)
(5)
其中,G為有向賦權圖,V為網(wǎng)絡上所有節(jié)點即公交站點的集合,E為有向圖中所有邊的集合,R為有向圖中所有頂點的集合,WT為節(jié)點的非負權值集合,WL為節(jié)點的非負權值集合,表示在相應線路的線路長度權值。
在Dijkstra算法中,頂點集本文選取了地圖中所有的道路交叉點和線路方向變化的轉折點,以及根據(jù)前面分析模塊中得到的移動需求量大的296個新增公交站點。邊集則是根據(jù)百度地圖中顯示的實際路況而建立的拓撲關系。
目前,上海深夜可利用的交通工具是公交和出租車2種。上海有39條深夜公交線路。平均運營時間及配車時間范圍為11∶40—04∶10,經(jīng)過的車站數(shù)量為800多個。線路平均行駛距離為20 km左右,最長線路的長度約為25 km,其中,21%的線路把火車站或者機場設為起始站和終點站。還有大部分的線路的出發(fā)點也都在這2個地點的附近。所以,可以看出深夜公交主要是充當著運送來往上海和其他城市之間人群的功能。為了更好地體現(xiàn)分析結果,本文把深夜移動需求量和既有深夜公交線路進行了疊加,并通過將信息放在地圖上展現(xiàn)結果。
如圖1所示,離市中心較遠的A、B、D 3個區(qū)有非常大的深夜移動需求,但是卻沒有公交線路覆蓋。既有的公交線路僅覆蓋城市的核心地區(qū)。另外,C區(qū)雖然距離市中心只有10多公里,移動需求量也很大,但公交線路基本沒有覆蓋該地區(qū)。
圖1 上海深夜移動需求量和既有深夜公交線路
此外,本文研究還對深夜出租車的統(tǒng)計數(shù)據(jù)進行了分析,從圖2可以看出,出租車的分布與移動需求之間也存在很大差異,有大量出租車移動數(shù)據(jù)量的區(qū)域公交線路分布不夠。這從另一個方面也說明了優(yōu)化設計公交線路的重要性和緊迫性。
圖2 上海深夜出租車移動數(shù)據(jù)和既有深夜公交線路
為了能夠最大限度地進行均勻分配可用資源,本文研究將評價上海各區(qū)域內(nèi)線路的重復度。
目前,深夜運營的公交線路所經(jīng)過的行政區(qū)域數(shù)量共計12個(上海是分成17個行政區(qū)域),根據(jù)數(shù)據(jù)變化量,把該12個行政區(qū)域合并為7個研究區(qū)域,如圖3所示,并對每個研究區(qū)域內(nèi)的公交線路密度進行評價。
圖3 上海深夜公交線路區(qū)域分布
根據(jù)表1所示結果顯示,利用每個研究區(qū)域內(nèi)的有移動需求的總量對該區(qū)域面積做平均,可以看到,該平均值在3、4、5這3個區(qū)域明顯高于其他區(qū)域,這與現(xiàn)在的公交線路分布的密度是相互對應的。但是,從移動需求總量來看,區(qū)域6和區(qū)域1的移動需求量分別為43和50,很顯然具有更大的移動需求。這表明線路的密度與移動需求存在不匹配的地方,而且相關公交線路能夠連接的地區(qū)也不夠。
表1 研究區(qū)域公交線路密度評價結果
對各線路的車站周圍的數(shù)據(jù)量進行分析,求出各車站及路線周邊的數(shù)據(jù)變化量。對所有公交線路的公交站移動需求量進行了細致的分析。
以一個月的時間跨度,對全部39條公交的往返線路的每個公交站的移動需求量進行了統(tǒng)計,圖4為該數(shù)據(jù)的分布。結果顯示,799個公交站中大量的公交站的一個月的移動需求量并不大,其中,有42個站一個月內(nèi)的總移動需求是0。只有少數(shù)線路有較大的需求量,很顯然,說明公交站的設計總體上存在較大的問題。
圖4 各路線的公交站移動需求量
另外,還對39條公交的往返線路移動需求量進行了分析,如圖5所示,很容易發(fā)現(xiàn)整個39條線路的移動需求量分布不均勻,顯現(xiàn)出較大的非均衡性,甚至有些公交線路的移動需求量非常低。39條線路的移動需求量的均值為33 502,而方差達到了31 305,說明在公交線路的規(guī)劃上存有較大的優(yōu)化空間。
圖5 各路線周邊的公交站數(shù)據(jù)變化量
在優(yōu)化公交線網(wǎng)時,為了能夠最大限度地覆蓋所有上海市深夜移動需求量高的站點,從所有站點中選取移動需求量最高的2 000個公交站點,其中包括既有站點和新增站點。另外,還考慮了出租車數(shù)據(jù)量高的地區(qū),相應地調整了其中一部分公交站點。
考慮到公交線路需要覆蓋城市大部分區(qū)域,即使有些區(qū)域相互之間移動需求量很低,也要把這些區(qū)域連接起來[13]。優(yōu)化結果顯示,新的深夜公交線網(wǎng)(見圖6)基本覆蓋了所有的深夜移動需求量和出租車移動數(shù)據(jù)量高的地方,而且新的公交線路(見圖7)比起既有的深夜公交線路更能滿足上海市深夜出行的需求。
圖6 新的深夜公交線網(wǎng)
圖7 新的深夜公交線路
在Dijkstra模型中計算線路權重時,主要考慮了通行量和路徑長度。為了讓公交線路更多地覆蓋移動需求量高的節(jié)點,在計算過程中,2個節(jié)點之間的權重不僅和它們之間的距離有關,而且和路徑上的公交站移動需求量信息有關[14]。在利用Dijkstra模型時,不能直接處理節(jié)點帶有權值的有向圖的路徑搜索,而需要將2個節(jié)點的移動需求量的總和按一定的比值融合到兩點間的距離中,這樣就能將該模型簡化成最短路徑算法[15]。
本文建立的評價模型為考慮區(qū)域均衡性的深夜公交線路評價模型,目的是為了達到整個深夜公交系統(tǒng)的均衡分布,確保深夜公交線網(wǎng)的覆蓋程度。在評價過程中,選擇整個城市的深夜公交線網(wǎng)為研究對象,根據(jù)上海主要移動網(wǎng)絡供應商提供的移動數(shù)據(jù),將上海12個行政區(qū)域分成7個研究區(qū)域,分析深夜公交線路的重復率與覆蓋程度。該評價的重點主要放在深夜公交線路的分布上,具體路線選擇及換乘等因素沒有考慮。另外,在本次研究中引入了大數(shù)據(jù),利用上海市移動供應商和出租車公司提供的乘客移動信息,經(jīng)過篩選與整合之后,選用可視化工具對上海市深夜移動需求量分析結果進行了可視化顯示,結果發(fā)現(xiàn),與考慮區(qū)域均衡性的深夜公交線路評價結果有一些出入,說明了既有深夜公交線路的不合理性。
公交路線的分布狀況與該區(qū)域的乘客及道路環(huán)境也有密切的關系。本文利用Dijkstra模型對既有深夜公交線路優(yōu)化時,只考慮了2個公交站之間的移動需求量。因為公交屬于大眾交通工具,即使是人口稀少的區(qū)域也要實現(xiàn)與其他區(qū)域之間的交通連接。所以,要根據(jù)評價分析結果進行增加公交站點或延長公交路線時,需要進行相應的調整。本文研究評價及優(yōu)化方法與去除既有不合理公交線路方法相比,更適合于增加公交線路的方案。
[1] HAN J H.BTRNDP investigation of the bus route network[J].Journal of the Korean Traffic Society,2005,23(8):19-29.
[2] OH J H.Big data visualization and visualization process[D].[S.1]:Korean Journal of Multimedia Institute,2014.
[3] YOO J U.The visualization of big data[D].[S.1.]:South Korea Consulting Association,2011.
[4] CH I M.Study on the location of a bus station considering bus routes[D].Philadelphia,USA:University of Pennsylvania,2007.
[5] HONG Z X.Research on route design[D].Gwangju,Korean:University of Kwangju,2006.
[6] 袁長偉,吳群琪,袁華智,等.考慮軌道交通作用效應的城市公交線網(wǎng)優(yōu)化方法[J].公路交通科技,2014,31(8):119-125.
[7] 費 騰,張立毅,陳 雷.混合Levy變異與混沌變異的改進人工魚群算法[J].計算機工程,2016,42(7):146-152,158.
[8] 馮正勇.衰落信道數(shù)據(jù)包傳輸跨層優(yōu)化模型改進[J].計算機工程,2016,42(11):125-130.
[9] 蔡 彪,庹先國,桑 強,等.復雜網(wǎng)絡中基于三角環(huán)吸引子的社區(qū)檢測[J].計算機工程,2016,42(9):197-201.
[10] 沈記全,孔祥君.基于改進蟻群優(yōu)化算法的QoS區(qū)間數(shù)服務組合方法[J].計算機工程,2016,42(7):181-188,193.
[11] 程憲寶.基于改進簡化粒子群優(yōu)化的多目標跟蹤算法[J].計算機工程,2016,42(8):282-288.
[12] 楊興地.中小城市常規(guī)公交線網(wǎng)優(yōu)化方法研究[J].交通信息與安全,2013,31(5):55-61.
[13] 李淑慶.重慶市主城區(qū)公交線網(wǎng)優(yōu)化標準研究[J].交通信息與安全,2010(5):43-45.
[14] 史葦杭,林 楠.一種聯(lián)合的時序數(shù)據(jù)特征序列分類學習算法[J].計算機工程,2016,42(6):196-200,207.
[15] 郭羽含,楊曉翠.綠色供應鏈網(wǎng)絡構建的雙階段綜合優(yōu)化方法[J].計算機工程,2016,42(10):192-200.