吳 蔚
(廣州市城市規(guī)劃勘測設(shè)計(jì)研究院,廣東 廣州 510060)
每逢節(jié)假日,特別是春運(yùn)期間,綜合客運(yùn)樞紐區(qū)域具有人群聚集臨時(shí)性、突發(fā)性、人群類別復(fù)雜等特征。為保障對聚集人群的及時(shí)疏運(yùn),需要有技術(shù)手段實(shí)現(xiàn)綜合客運(yùn)樞紐區(qū)域人群聚集等特征的動(dòng)態(tài)獲取,并做出精確預(yù)測。溫慧英等[1]分析了公交站點(diǎn)間的相似性,提出一種基于模糊神經(jīng)網(wǎng)絡(luò)的預(yù)測方法,對公交客流進(jìn)行短時(shí)預(yù)測;Du和Ren[2]以工業(yè)經(jīng)濟(jì)指數(shù)和柯布—道格拉斯理論為基礎(chǔ),提出了一種列車客流流量預(yù)測模型,以幫助鐵路局對運(yùn)行策略進(jìn)行分析;李俊芳等[3]在BP神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上建立了車站客流預(yù)測模型,并以日本首都為例證明此模型能較好地反映圈層人口變量與客流之間的聯(lián)系;盧凱等[4]提出了一種基于KNN回歸算法的客運(yùn)樞紐聚集人數(shù)組合預(yù)測方法,在分析客運(yùn)樞紐客流聚集規(guī)律的基礎(chǔ)上,以數(shù)值相似和趨勢相似為原則運(yùn)用KNN回歸算法預(yù)測區(qū)域聚集人數(shù)。目前,大多數(shù)學(xué)者通過時(shí)間序列法[5-6]、機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行客流預(yù)測,卻忽視了與客流關(guān)系最為密切的列車趟次因素。
由于乘客能在線上購票系統(tǒng)、火車票代售點(diǎn)或火車票售票大廳進(jìn)行車票預(yù)訂,故列車趟次的安排、列車時(shí)刻表與運(yùn)行圖的制定需至少提前30天。若聚集人數(shù)與列車趟次存在某種關(guān)聯(lián)性,可利用列車趟次建立的聚集人數(shù)預(yù)測模型,為研究客運(yùn)樞紐聚集人數(shù)預(yù)測提供基礎(chǔ)。
根據(jù)2017年廣州鐵路全年數(shù)據(jù),繪制廣州火車站和廣州南站列車趟次折線圖,如圖1所示。
從圖1可以看出,廣州火車站和廣州南站的列車趟次變化趨勢一致。但相比較而言,廣州南站列車趟次波動(dòng)幅度較大,廣州火車站列車趟次波動(dòng)幅度小。廣州南站列車趟次在非節(jié)假日期間有明顯的周期性:七天一周期,周五、周六、周日趟次多,周一較多,周二到周四較少;而廣州火車站列車趟次較為穩(wěn)定,非節(jié)假日列車趟次幾乎不變。在節(jié)假日和春運(yùn)期間,列車趟次有明顯增加。
圖1 廣州火車站和廣州南站列車趟次折線圖
在當(dāng)前條件下,無法直接獲得日客運(yùn)樞紐聚集人數(shù)量。由于手機(jī)信令數(shù)據(jù)時(shí)間粒度為5 min,而鐵路數(shù)據(jù)為每日列車趟次,故在做客運(yùn)樞紐聚集人數(shù)與列車趟次關(guān)聯(lián)性分析時(shí)需要將每日288個(gè)客流數(shù)據(jù)相加求和,獲得日區(qū)域總客流總量。這個(gè)指標(biāo)不僅與日客運(yùn)樞紐聚集人數(shù)量有關(guān),還與平均等待時(shí)間有關(guān)。由于平均等待時(shí)間變化較小,此指標(biāo)一定程度上能反映客運(yùn)樞紐聚集人數(shù)情況。
分別對兩個(gè)火車站原始卡口數(shù)據(jù)表每五分鐘的客流量進(jìn)行預(yù)處理:缺失值用插值法補(bǔ)全,若連續(xù)缺失半個(gè)小時(shí)及以上數(shù)據(jù),則剔除該天數(shù)據(jù);將異常值當(dāng)成缺失值進(jìn)行處理,將手機(jī)信令數(shù)據(jù)按市場份額換算為聚集人數(shù)。
分別統(tǒng)計(jì)兩個(gè)火車站每天的客運(yùn)樞紐聚集人數(shù)總和。
根據(jù)圖1可以看出兩個(gè)車站的列車趟次在非節(jié)假日、節(jié)假日、春運(yùn)、暑期有各自的隨時(shí)間分布特性,由于暑期除數(shù)值增大外其變化趨勢與非節(jié)假日類似,這里將其看作特殊的非節(jié)假日。故分成節(jié)假日、非節(jié)假日兩類,在其中抽取樣本,進(jìn)行關(guān)聯(lián)性分析研究。
定距變量間的線性關(guān)系常用Pearson相關(guān)系數(shù)衡量。其絕對值越接近于1,說明兩個(gè)變量的線性相關(guān)性越強(qiáng),越接近于0,相關(guān)性越弱。
計(jì)算公式:
式中,X,Y——兩個(gè)變量的值向量。
上步利用Pearson相關(guān)系數(shù)對兩個(gè)變量之間的相關(guān)性進(jìn)行初步分析,相關(guān)性只描述線性相關(guān)程度,對于非線性的相關(guān)程度并不能很好地描述。故利用SPSS Statistics 22軟件繪制XY散點(diǎn)圖,擬合曲線,做回歸分析,計(jì)算復(fù)可決系數(shù),進(jìn)一步探究兩個(gè)變量之間的關(guān)聯(lián)性。
復(fù)可決系數(shù)的計(jì)算公式為:
式中,y——觀測值向量,——擬合值向量。
為研究聚集人數(shù)與列車趟次的關(guān)聯(lián)性,將樣本分成兩類,分別求取Pearson相關(guān)系數(shù),使用SPSS Statistics 22繪制散點(diǎn)圖,擬合曲線,獲得復(fù)可決系數(shù),分析關(guān)聯(lián)程度。
選取2017年非節(jié)假日的廣州火車站和廣州南站客運(yùn)樞紐聚集人數(shù)數(shù)據(jù)作為樣本,分別計(jì)算周一、周二、周三、……、周日廣州火車站和廣州南站聚集人數(shù)總量與列車趟次間的相關(guān)系數(shù),如表1所示。
表1 廣州火車站和廣州南站非節(jié)假日相關(guān)系數(shù)
從表1可以看出非節(jié)假日廣州火車站聚集人數(shù)總量與列車趟次之間的相關(guān)系數(shù)較為穩(wěn)定,大多在0.5上下波動(dòng),說明兩者間具有中等程度相關(guān)性;且整體的相關(guān)系數(shù)與各日相關(guān)系數(shù)差別不大,說明各日差別不大,平均等待時(shí)間較為一致。而廣州南站各日相關(guān)系數(shù)差別較大,整體相較之要小很多。說明各日間存在明顯差異,這一點(diǎn)從圖1中可以看出:廣州火車站非節(jié)假日列車趟次非常穩(wěn)定,而廣州南站列車趟次在非節(jié)假日存在周期性。廣州南站周二、周三、周四相關(guān)系數(shù)較小,周一、周五、周六、周日相關(guān)系數(shù)較大,而列車趟次在周二、周三、周四較少,周一、周五、周六、周日較多,猜測兩者間的相關(guān)性程度與列車的需求有關(guān)。
在周五、周六、周日、周一出行的人大多活動(dòng)時(shí)間僅為周末,時(shí)間較緊,多選擇速度快乘坐時(shí)間短的高鐵,廣州南站需求大;而周二、周三、周四出行的人并不趕時(shí)間,愿意選擇普通火車,廣州火車站需求大,致使廣州火車站和南站的聚集人數(shù)與列車趟次的關(guān)聯(lián)性在不同時(shí)間存在較大差異??梢姡熊囆枨笤酱缶奂藬?shù)與列車趟次的關(guān)聯(lián)程度越高。
選取2017年春運(yùn)期間的廣州火車站和廣州南站客運(yùn)樞紐聚集人數(shù)數(shù)據(jù)作為節(jié)假日樣本,計(jì)算廣州火車站和廣州南站聚集人數(shù)總量與列車趟次間的相關(guān)系數(shù),如表2所示。
表2 廣州火車站和廣州南站春運(yùn)相關(guān)系數(shù)
根據(jù)春運(yùn)數(shù)據(jù)繪制散點(diǎn)圖,擬合曲線,得到圖2??偟膩碚f,春運(yùn)期間,廣州火車站和廣州南站的聚集人數(shù)與列車趟次的關(guān)聯(lián)性程度較高。根據(jù)Pearson系數(shù),可以看出節(jié)前廣州火車站的聚集人數(shù)與列車趟次的關(guān)聯(lián)性大于廣州南站,而節(jié)后廣州南站大于廣州火車站。原因可能有供需關(guān)系有關(guān)。節(jié)前多為工人學(xué)生返鄉(xiāng),大多選擇廣州火車站,火車站需求多,滿載率高,致使廣州火車站的聚集人數(shù)與列車趟次間呈較高關(guān)聯(lián)性。同理,節(jié)后多為廣州出游,廣州南站需求大,聚集人數(shù)與列車趟次間關(guān)聯(lián)性高。
圖2 2017年春運(yùn)(40天)客運(yùn)樞紐聚集人數(shù)總量散點(diǎn)圖
聚集人數(shù)總和與聚集人數(shù)和等待時(shí)間有關(guān)。在分析聚集人數(shù)總和與列車趟次之間的關(guān)聯(lián)性時(shí),需要對聚集人數(shù)與列車趟次以及等待時(shí)間與列車趟次之間的關(guān)系進(jìn)行分析,如圖3、圖4所示。
圖3 平均等待時(shí)間隨列車趟次變化曲線圖
圖4 日客運(yùn)樞紐聚集人數(shù)隨列車趟次變化曲線圖
在列車趟次和聚集人數(shù)都較少,如非節(jié)假日情況下,此時(shí)乘客對于列車的需求遠(yuǎn)小于供給,隨著列車趟次的增加,聚集人數(shù)也增加,不過漲幅較小,且不會(huì)因擁擠排隊(duì)而引起乘客額外滯留,平均等待時(shí)間較為穩(wěn)定。當(dāng)列車趟次增加到一定程度,如節(jié)假日情況下,聚集人數(shù)大幅增加,此時(shí)乘客對于列車的需求漸漸接近供給,乘客需要更多的時(shí)間排隊(duì)安檢、驗(yàn)身份證、檢票等,平均等待時(shí)間增加。隨著列車趟次增加,區(qū)域內(nèi)人數(shù)逐漸接近飽和,此時(shí)工作人員需要采用一些管制措施進(jìn)行限流。
該文以廣州火車站和廣州南站為例,通過計(jì)算相關(guān)系數(shù)、繪制散點(diǎn)圖、曲線擬合進(jìn)行回歸分析,闡述了客運(yùn)樞紐聚集人數(shù)與列車趟次之間的關(guān)聯(lián)程度。提出了兩者的關(guān)聯(lián)程度與客運(yùn)需求有關(guān),需求越大,兩者的關(guān)聯(lián)性越強(qiáng)。最后,根據(jù)數(shù)據(jù)和實(shí)際情況分析,得到乘客平均等待時(shí)間以及聚集人數(shù)隨列車趟次的變化曲線圖。