付學(xué)梅,雋志才
(1.山東大學(xué)管理學(xué)院,濟(jì)南250100;2.上海交通大學(xué)安泰經(jīng)濟(jì)與管理學(xué)院,上海200030)
共享單車作為“互聯(lián)網(wǎng)+交通運(yùn)輸”的產(chǎn)物,用手機(jī)即可完成借車、繳費(fèi)、還車等全過程,其靈活便捷性能夠有效解決城市交通“最后一公里”問題.以共享單車行業(yè)標(biāo)桿——摩拜為例,2016年4月在上海投入運(yùn)營(yíng),一年多的時(shí)間內(nèi),摩拜單車在全球近百個(gè)城市投放了超過500萬(wàn)輛,日均騎行量超過2 000 萬(wàn)次.學(xué)者同時(shí)開展了相關(guān)研究:Fisherman等[1]提出通過規(guī)劃自行車道,提升自行車的通行優(yōu)先級(jí)和增加自行車網(wǎng)點(diǎn)等措施提高自行車相對(duì)于小汽車在出行時(shí)間及方便性方面的競(jìng)爭(zhēng)力.Martin等[2]研究表明共享單車對(duì)公交客流量的影響取決于所在城市或居住區(qū)的環(huán)境,替代效應(yīng)更可能發(fā)生在土地利用密集度高的區(qū)域;在土地利用比較松散的區(qū)域,共享單車可能成為前往/離開公交車站的工具,即兩種交通方式的集成使用.季彥婕等[3]研究了共享單車對(duì)小汽車出行的影響,發(fā)現(xiàn)共享單車更可能在短途出行中替代小汽車.袁朋偉等[4]采用Nested Logit模型研究了共享單車選擇行為的影響因素.
本文基于上海市摩拜單車一個(gè)星期的騎行數(shù)據(jù),深入挖掘共享單車騎行數(shù)據(jù)背后隱藏的行為模式,揭示城市居民騎行規(guī)律.主要包括:基于騎行開始時(shí)間和單次騎行時(shí)長(zhǎng)的時(shí)間模式研究,基于騎行特征的騎行者分類,基于赫希曼指數(shù)(Herfindahl-Hirschman Index, HHI)的騎行規(guī)律性評(píng)價(jià).
以上海市摩拜單車2016年8月22日(星期一)~28日(星期日)的騎行數(shù)據(jù)為基礎(chǔ)分析共享單車的使用模式.選擇這個(gè)時(shí)間段主要是因?yàn)椋孩偎x時(shí)間為摩拜單車在上海市投放的第5個(gè)月,上海市民已熟知并接受共享單車這一互聯(lián)網(wǎng)時(shí)代的新生事物;②大量現(xiàn)有研究表明一個(gè)星期是出行行為分析的理想時(shí)長(zhǎng),因?yàn)槿藗兺ǔC恐苤貜?fù)他們之前的活動(dòng)和出行;③經(jīng)查詢,該段時(shí)間內(nèi)以多云、微風(fēng)為主,并無(wú)惡劣天氣出現(xiàn),可相對(duì)排除極端天氣狀況對(duì)騎行行為的影響.雖然不同季節(jié)、時(shí)間段的騎行模式可能略有差別,但本文不作對(duì)比,著重挖掘共享單車騎行行為在時(shí)間維度上的特征.原始數(shù)據(jù)中出行時(shí)長(zhǎng)少于1 min,或超過90 min的記錄被刪除,約占數(shù)據(jù)記錄總數(shù)的0.9%,最終,301 811次摩拜騎行被用于分析.
將1 d中的24 h分為96個(gè)時(shí)間段,即從00:00-24:00,每15 min為一段,分別統(tǒng)計(jì)每個(gè)時(shí)間段內(nèi)摩拜單車開始騎行的數(shù)量,如圖1所示.
從圖1(a)可看出:共享單車騎行開始時(shí)間的日統(tǒng)計(jì)在星期一~星期五非常相似,反映了工作日的特征,早晚高峰的大致時(shí)間為07:45-09:00,17:45-18:45;晚高峰期間共享單車的使用數(shù)量更大,表明晚高峰交通量更為集中,這可能是因?yàn)槿藗兿掳嗪蟾敢馐褂霉蚕韱诬囃獬鲂蓍e;中午11:30-13:00期間有一個(gè)小波峰,對(duì)應(yīng)午休時(shí)間的出行;星期五大部分時(shí)段的騎行數(shù)量多于其他工作日的對(duì)應(yīng)時(shí)段,尤其17:15 之后,這是因?yàn)樾瞧谖迨敲恐芄ぷ魅盏淖詈笠惶?,人們傾向于下班后與朋友、同事、家人等外出小聚.
從圖1(b)可看出:共享單車的騎行統(tǒng)計(jì)在周末則完全不同,僅星期日17:15-19:30 期間出現(xiàn)了一個(gè)小波峰,而星期六整日各時(shí)段的騎行總量沒有明顯差別.這是因?yàn)橹苣┤藗兛梢宰杂砂才艜r(shí)間,非高峰時(shí)段的騎行量比工作日非高峰時(shí)段大.
分別計(jì)算每條記錄的騎行時(shí)長(zhǎng),統(tǒng)計(jì)不同時(shí)長(zhǎng)對(duì)應(yīng)共享單車的騎行總量,即(0,5]min,(5,10]min,(10,15]min 等,如圖2 所示.可知:一個(gè)星期內(nèi),每天的騎行時(shí)長(zhǎng)分布相差不多,(5,10]min的騎行數(shù)量較多;隨著騎行時(shí)間的增加,騎行數(shù)量逐漸減少;工作日和周末仍存在細(xì)微的差別.具體而言,工作日47.0%的騎行短于10 min,很可能是由于人們?cè)诠ぷ魅罩饕诩遗c公交站的往返間使用共享單車,即用于解決公共交通的“最后一公里”問題.周末大于20 min 的騎行(30.3%)多于工作日(24.2%),此時(shí)共享單車可能用于前往最終目的地或稍遠(yuǎn)距離的換乘.
簡(jiǎn)單總結(jié):周末人們騎行共享單車的平均時(shí)間(18 min)要比工作日(15 min)稍長(zhǎng);共享單車在一個(gè)星期內(nèi)不同時(shí)間扮演的角色不同,工作日可能更多用于短距離換乘,周末的時(shí)間安排相對(duì)自由,長(zhǎng)時(shí)間騎行(騎向終點(diǎn)或長(zhǎng)距離換乘)成為可能.
圖1 共享單車的騎行開始時(shí)間Fig.1 Biking start time on weekdays and weekends
以騎行者為研究對(duì)象,對(duì)每一騎行者在1 d內(nèi)的多次騎行進(jìn)行聯(lián)合分析.
對(duì)騎行者分類主要用于觀測(cè)部分騎行者的日騎行行為是否與其他騎行者之間存在顯著差異.將1 d 劃分為48 個(gè)時(shí)段,即每30 min 為一段.對(duì)于每一個(gè)騎行者,如果他在某一時(shí)段內(nèi)開始使用共享單車,則該時(shí)段的狀態(tài)為“1”,否則為“0”.也就是說,僅根據(jù)騎行的開始時(shí)間來標(biāo)定每個(gè)時(shí)段的狀態(tài),而非騎行的持續(xù)時(shí)間;狀態(tài)“1”表示在特定時(shí)段內(nèi),至少使用過1 次共享單車,而非使用共享單車的次數(shù).表1 為用于分類的騎行狀態(tài)示例,如編號(hào)為3的騎行者在8月22日上午06:30-07:00,07:30-08:00,08:30-09:00這3個(gè)時(shí)段內(nèi)均騎行共享單車.
圖2 共享單車的騎行時(shí)長(zhǎng)Fig.2 Biking duration on weekdays and weekends
表1 共享單車騎行狀態(tài)示例Table 1 Example of bike-sharing use for classification
采用K-均值聚類對(duì)騎行人群進(jìn)行分類,以“Cosine”距離標(biāo)定每對(duì)騎行記錄之間的距離,即
式中:cos(A,B)表示騎行者A和B之間的Cosine距離;TAi和TBi分別表示騎行者A和B的每一條騎行記錄;m為1 d中的48個(gè)時(shí)段,i為對(duì)應(yīng)時(shí)段索引.
“Cosine”距離將1 d中的48個(gè)狀態(tài)視為向量,計(jì)算向量與向量之間的總體距離,而非單獨(dú)計(jì)算每?jī)蓚€(gè)騎行者對(duì)應(yīng)時(shí)段狀態(tài)間的距離.Davies-Bouldin (DBI),Calinski-Harabasz,以及Silhouette系數(shù)被同時(shí)用來決定最佳組數(shù),3 個(gè)指標(biāo)值越大,表示聚類結(jié)果越優(yōu).3 個(gè)指標(biāo)值均顯示,工作日每天騎行人群的聚類數(shù)為2,周末每天騎行人群的聚類數(shù)為3.選取星期一和星期六的聚類結(jié)果進(jìn)行對(duì)比分析,且聚類結(jié)果根據(jù)每組組數(shù)進(jìn)行平衡,如圖3和圖4所示.
圖3 星期一兩個(gè)騎行群組的對(duì)比Fig.3 Comparison of biking behavior between two groups of Monday
盡管3 項(xiàng)指標(biāo)均表明星期一的騎行者能夠被聚類為兩個(gè)群組,但兩組騎行開始時(shí)間和騎行時(shí)長(zhǎng)并沒有像星期六的3 個(gè)群組間表現(xiàn)出特別顯著的差異,這是因?yàn)楣ぷ魅沾蟛糠烛T行者的時(shí)間安排比較固定,上下班時(shí)間趨近.群組2 對(duì)應(yīng)的兩個(gè)高峰時(shí)段要比群組1 的高峰時(shí)段早開始.盡管兩個(gè)群組之間騎行時(shí)長(zhǎng)分布并無(wú)顯著差別,但群組2使用共享單車的時(shí)長(zhǎng)更可能超過30 min,而群組1的騎行時(shí)間較短.這說明:群組1 使用共享單車的目的主要是用于短程接駁,比如前往公交車站;群組2 使用共享單車的目的主要是直接前往最終目的地,考慮到長(zhǎng)時(shí)間騎行,對(duì)應(yīng)的騎行開始時(shí)間也較早.
從圖4 可以看出,3 個(gè)騎行群組的騎行行為存在明顯差異.就騎行開始時(shí)間而言,群組1 傾向于在早晨使用共享單車,群組2更多地在下午和晚上使用共享單車,群組3很少在中午和下午使用共享單車.3 個(gè)群組中,群組2 使用共享單車的頻次更高,不論共享單車的騎行時(shí)長(zhǎng),還是騎行數(shù)量均高于其他兩個(gè)群組,故將群組2 定義為“星期六共享單車愛好者”.19:00-21:15 時(shí)段內(nèi),3 個(gè)群組顯示出非常明顯的差異,群組1 的騎行數(shù)量急劇下降,群組2和3的騎行數(shù)量則急劇增加,進(jìn)一步理解為星期六晚上的這個(gè)時(shí)段,共享單車對(duì)不同人群的作用存在很大區(qū)別.
分別根據(jù)周中的一天與騎行開始時(shí)間組合,以及周中的一天與騎行時(shí)長(zhǎng)組合,計(jì)算Herfindahl-Hirschman Index (HHI)以衡量個(gè)體共享單車騎行規(guī)律.以周中的一天與騎行開始時(shí)間組合為例,HHI 值越大,表示共享單車一個(gè)星期7 d 間騎行開始時(shí)間的規(guī)律性越高,即在每天的相同時(shí)間段內(nèi)開始使用共享單車,比如星期一~星期五的每天均在07:00-07:30 時(shí)段使用共享單車,具體計(jì)算過程請(qǐng)參考Susilo等[5].將1 d劃分為48個(gè)時(shí)間段,即每30 min 一段,根據(jù)每個(gè)時(shí)間段內(nèi)開始的騎行數(shù)量進(jìn)行狀態(tài)記錄,如表2所示.HHI計(jì)算結(jié)果如圖5和圖6所示.
圖4 星期六的3 個(gè)騎行群組對(duì)比Fig.4 Comparison of biking behavior between three groups of Saturday
表2 用于計(jì)算HHI 的騎行狀態(tài)示例Table 2 Example of bike-sharing use for classification
兩種組合對(duì)應(yīng)的HHI 值在一星期7 d 時(shí)間均無(wú)明顯不同,這可能是由于共享單車主要用于例行活動(dòng)或家/工作單位與公共交通站點(diǎn)間的接駁,騎行者形成了固定的騎行習(xí)慣.星期三和星期四的HHI值均比其他天要高,即對(duì)于個(gè)體而言,星期三和星期四為有代表性的工作日,大多數(shù)人在這兩天傾向于按照固定的日程安排進(jìn)行活動(dòng).對(duì)比兩種組合得到的HHI 值發(fā)現(xiàn),基于周中的一天與騎行開始時(shí)間組合得到的HHI 值比較低,標(biāo)準(zhǔn)差相對(duì)于均值較高,也就是說,共享單車騎行的開始時(shí)間在一個(gè)星期的每天時(shí)間發(fā)生變化,這主要是由于個(gè)體間異質(zhì)性.
圖5 基于周中的一天與騎行開始時(shí)間組合的HHI 值Fig.5 HHI values for day-of-week and start time of bike-sharing use
表3 為兩種組合得到HHI 值的統(tǒng)計(jì),其中,HHI0對(duì)應(yīng)原始的HHI,HHI1對(duì)應(yīng)基于騎行者實(shí)際騎行天數(shù)對(duì)HHI0進(jìn)行平衡后的HHI,HHI2對(duì)應(yīng)將僅有一次共享單車騎行的HHI1設(shè)為0之后的HHI.與圖6一致,基于周中的一天與騎行開始時(shí)間組合得到的HHI值比基于周中的一天與騎行時(shí)長(zhǎng)組合得到的HHI值低.因此,人們更愿意每天的每次騎行遵循相對(duì)固定的時(shí)長(zhǎng),每次騎行的開始時(shí)間則相對(duì)靈活變動(dòng).標(biāo)準(zhǔn)差顯示,HHI0,即基于周中的一天與騎行開始時(shí)間組合得到的HHI初始值在騎行者之間有很大差別.根據(jù)個(gè)體實(shí)際的騎行天數(shù)對(duì)HHI 進(jìn)行平衡后,基于周中的一天與騎行時(shí)長(zhǎng)組合得到的HHI 值顯示出更大的變動(dòng)程度.可能是因?yàn)橄啾扔谀切┲苤械囊惶炫c騎行開始時(shí)間組合得到較高HHI 值的騎行者,對(duì)應(yīng)周中的一天與騎行時(shí)長(zhǎng)組合得到較高HHI值的騎行者更愿意每天都使用共享單車.此外,HHI最大值為1.0主要是由于對(duì)應(yīng)的騎行者每天僅使用一次共享單車.
圖6 基于周中的一天與騎行時(shí)長(zhǎng)組合的HHI 值Fig.6 HHI values for day-of-week and duration of bike-sharing use
表3 HHI 值的統(tǒng)計(jì)描述Table 3 Statistical description of HHI
基于上海市摩拜單車一星期的騎行數(shù)據(jù),從時(shí)間角度進(jìn)行全面探究,旨在獲得無(wú)序騎行數(shù)據(jù)背后隱藏的騎行規(guī)律和行為模式.工作日和周末的共享單車騎行在時(shí)間分布上存在顯著差異,工作日呈現(xiàn)明顯的兩個(gè)高峰,且早高峰持續(xù)時(shí)間更長(zhǎng),晚高峰的騎行量更大,而共享單車在周末的使用分布比較均衡.大部分的騎行時(shí)長(zhǎng)在15 min 以內(nèi),這與共享單車解決“最后一公里問題”的定位相符.基于日使用記錄的聚類分析表明,每個(gè)工作日的騎行人群可以分為2組,周末的騎行人群可以分為3組,每一組有具備獨(dú)特的騎行開始時(shí)間和騎行時(shí)長(zhǎng);對(duì)于星期一的第2 組騎行者來說,共享單車可能是他們的主要交通方式,而非公共交通的接駁工具.基于周中的一天與騎行開始時(shí)間組合,以及周中的一天與騎行時(shí)長(zhǎng)組合獲得的HHI值表明,共享單車的使用有很強(qiáng)的時(shí)間規(guī)律性,且周中的一天與騎行開始時(shí)間組合的HHI值具有更大的標(biāo)準(zhǔn)差,這意味著一星期中每天的共享單車騎行開始時(shí)間會(huì)經(jīng)常性變動(dòng),證實(shí)了該交通方式在使用上的靈活性.
對(duì)共享單車騎行時(shí)間分布規(guī)律研究,可促進(jìn)該系統(tǒng)與城市公共交通系統(tǒng)的銜接和配合,更加高效地解決城市“最后一公里問題”,吸引更多出行者采用“自行車+公交”的交通方式,促進(jìn)城市交通系統(tǒng)的可持續(xù)發(fā)展.