国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于集成融合算法的客流預(yù)測模型

2021-12-09 22:44:38秦偉曾明
科技信息·學(xué)術(shù)版 2021年33期
關(guān)鍵詞:回歸模型深度學(xué)習(xí)

秦偉 曾明

摘要:本文利用鄭州地鐵的乘客OD數(shù)據(jù),對不同時間周期內(nèi)的站點進、出站客流進行預(yù)測。利用深度學(xué)習(xí)網(wǎng)絡(luò),將數(shù)個弱回歸模型集成融合成強回歸模型。同時,利用參數(shù)修正算法對該模型進行進一步地增強。最終,通過鄭州地鐵真實數(shù)據(jù)對該模型進行了評估,得到了滿意的效果。

關(guān)鍵詞:集成融合;深度學(xué)習(xí);回歸模型

1背景

地鐵是市民常用的交通工具之一,地鐵的進站和出站人數(shù)會隨著季節(jié)、節(jié)假日、工作日、周末、每天不同的時段等不同而發(fā)生變化,特別是在節(jié)假日、工作日的早晚高峰期,這對地鐵工作人員進行實時管控提出了很大的要求。如果沒有實時的掌握住每個時段的客流信息,那么將會對整個列車的調(diào)度造成很大的影響,也會給市民的出行造成很大的不方便。所以,對地鐵客流進行預(yù)測是非常重要的。

本文提出了一種基于集成融合算法的客流預(yù)測模型,可以靈活地融合地鐵OD數(shù)據(jù)、節(jié)假日、天氣、特殊事件等信息,利用深度學(xué)習(xí)、機器學(xué)習(xí)、集成融合等方法,通過數(shù)據(jù)預(yù)處理、特征工程、模型建立、訓(xùn)練和評估這一系列的過程,進行站點/線路不同時間周期內(nèi)進、出站客流量的預(yù)測。

本文后續(xù)章節(jié)安排如下:第2章,介紹客流預(yù)測模型的總體設(shè)計和重點算法;第3章,對客流預(yù)測模型進行測試評估,并且分析結(jié)果;第4章,進行總結(jié)和提出后續(xù)工作方向。

2總體設(shè)計方案

本次模型的總體設(shè)計方案如下圖所示:

將需要預(yù)測的日期根據(jù)實際的分析結(jié)果,進行分類:

1.第一類是待預(yù)測日期對應(yīng)的歷史客流數(shù)據(jù)變化穩(wěn)定在某一個非常小的固定范圍內(nèi)的數(shù)據(jù),這類數(shù)據(jù)使用統(tǒng)計規(guī)則算法進行預(yù)測,得到的效果非常好。

2.第二類是待預(yù)測日期對應(yīng)的歷史客流數(shù)據(jù)分布變化不穩(wěn)定、復(fù)雜的日期,這類數(shù)據(jù)使用DNN深度學(xué)習(xí)算法進行預(yù)測,得到的效果非常好,典型的就是周末、節(jié)假日。

3.結(jié)合統(tǒng)計規(guī)則算法和DNN深度學(xué)習(xí)算法的優(yōu)缺點,我們使用集成融合算法對這兩種算法進行集成、融合,達到更加好的擬合效果。

下面將對上述算法進行詳細介紹。

2.1統(tǒng)計規(guī)則算法

統(tǒng)計規(guī)則算法的流程如下:

1.對預(yù)測日期分類:將預(yù)測日期分詞工作日、周末、節(jié)假日3類。

2.對于節(jié)假日預(yù)測:

其中:N是指跟待預(yù)測日期類型(節(jié)假日)相同的歷史數(shù)據(jù),按照日期降序排序,取最近的N個日期。y表示的是跟待預(yù)測日期類型(節(jié)假日)相同的歷史數(shù)據(jù)真實客流量。

3.對于工作日/周末預(yù)測

其中,N是指跟待預(yù)測日期類型(工作日/周末)相同的歷史數(shù)據(jù),按照日期降序,取最近的N個日期。N是指跟待預(yù)測日期類型(相同的星期)相同的歷史數(shù)據(jù),按照日期降序,取最近的N的日期。y表示的是跟待預(yù)測日期類型(節(jié)假日/周末/相同的星期)相同的歷史數(shù)據(jù)真實客流量。

2.2DNN深度學(xué)習(xí)算法

DNN深度學(xué)習(xí)算法的核心步驟主要是特征工程

所謂特征工程的構(gòu)建,主要是通過數(shù)據(jù)分析、相關(guān)性分析、AutoML等方式構(gòu)建一些有價值的變量,作為模型的輸入,主要包括以下變量:

■待預(yù)測日前7天對應(yīng)客流數(shù)據(jù)

■前三周中與待預(yù)測日星期所在日相同的數(shù)據(jù)

■待預(yù)測日月份

■待預(yù)測日星期

■氣溫

2.3集成融合算法

集成融合算法同樣是構(gòu)建一個DNN深度學(xué)習(xí)網(wǎng)絡(luò),不同的是在進行構(gòu)建一個新的DNN深度學(xué)習(xí)網(wǎng)絡(luò)之前,會將上一個DNN深度學(xué)習(xí)算法的預(yù)測結(jié)果和統(tǒng)計規(guī)則算法預(yù)測結(jié)果作為本次DNN深度學(xué)習(xí)網(wǎng)絡(luò)的一個特征作為輸入,再次進行訓(xùn)練,達到集成融合的效果。

整個步驟最核心的就是特征的合并,也叫做張量連接,下面是張量連接的實現(xiàn)步驟:

■特征工程向量:

■深度學(xué)習(xí)算法預(yù)測結(jié)果:

■統(tǒng)計規(guī)則算法預(yù)測結(jié)果:

■張量連接:

3模型評估

3.1數(shù)據(jù)集

本次模型評估,根據(jù)星環(huán)公司提供的鄭州地鐵從2015年1月1日至2015年12月24日出入的客流量數(shù)據(jù),利用提出的客流預(yù)測模型對未來一個星期(2015-12-25~2015-12-31)的客流量進行預(yù)測,根據(jù)官方給出的評價指標,通過評價指標在所有參賽隊伍中的排名,驗證我們的地鐵客流預(yù)測模型的技術(shù)可行性。

3.2評價函數(shù)

本文使用模型平均絕對誤差人數(shù)MAE來評價模型的好壞,具體的計算如下:

i表示站點,范圍為[1,N],N表示站點的總個數(shù),本次比賽中公有20個站點。

d表示天數(shù),范圍為[1,7],表示未來7天的客流量

表示預(yù)測出來的客流量,表示真實的客流量

3.3評估結(jié)果

利用前面介紹的數(shù)據(jù)集和評價函數(shù),統(tǒng)計了參賽各隊的結(jié)果。從中可以看到,我們團隊的MAE值為1557.34,在所有參賽隊伍中是最小的。更進一步的,本文提出的墨西哥比排名第二的湖南預(yù)測如神工院隊模型的MAE值2734.67,足足小了1200多。這就足以說明本文提出的基于集成融合的客流預(yù)測模型,在所有參賽隊伍中是最好的,取得了最優(yōu)的擬合效果。

4結(jié)論和后續(xù)工作

4.1結(jié)論

本文利用鄭州地鐵的乘客OD數(shù)據(jù),對不同時間周期內(nèi)的站點進、出站客流進行預(yù)測。利用深度學(xué)習(xí)網(wǎng)絡(luò),將數(shù)個弱回歸模型集成融合成強回歸模型。同時,利用參數(shù)修正算法對該模型進行進一步地增強。最終,通過鄭州地鐵真實數(shù)據(jù)對該模型進行了評估,得到了滿意的效果。

4.2后續(xù)工作

4.2.1多時間粒度+進出站驗證

根據(jù)星環(huán)公司官方的要求,目前只是針對天時間粒度,對進出站的客流總數(shù)進行預(yù)測。但是天時間粒度相對來說會比較大,在實際的地鐵運營需求中,時間粒度應(yīng)該是小時、甚至是分鐘,而且乘客的進出站規(guī)律也是不一樣的,所以,后續(xù)需要對多時間粒度,特別是細時間粒度(比如1小時、半小時、15分鐘、5分鐘、1分鐘)和進出站分別預(yù)測。

4.2.2多數(shù)據(jù)集驗證

根據(jù)星環(huán)公司官方給到的數(shù)據(jù),是2015年的乘客刷卡記錄,我們知道隨著時間的推進,地鐵客流量會發(fā)生不斷的變化。用2015年的數(shù)據(jù)建立起來的模型,是否適用于其他數(shù)據(jù)集,比如2016年、2017年、2018年、2019年則有待驗證。所以在后續(xù)的工作當(dāng)中需要利用多數(shù)據(jù)集進行來驗證模型的穩(wěn)定性。

參考文獻

[1]賈銳軍、冉祥來、吳俊霖、戴晨斌等,基于XGBoost算法的機場旅客流量預(yù)測[J],民航學(xué)報,2018年06期

[2]蒙特卡羅模擬,百度百科,https://baike.baidu.com/item/%E8% 92%99%E7%89%B9%E5%8D%A1%E7%BD%97%E6%A8%A1%E6%8B%9F/5160083?fr=aladdin

[3]小白都能看懂的蒙特卡洛方法以及python實現(xiàn),CSDN博客,2018.

https://blog.csdn.net/bitcarmanlee/article/details/82716641

猜你喜歡
回歸模型深度學(xué)習(xí)
農(nóng)村秸稈處理方式的影響因素
東方教育(2016年9期)2017-01-17 00:43:44
有體驗的學(xué)習(xí)才是有意義的學(xué)習(xí)
國際旅游外匯收入影響因素分析
電子商務(wù)中基于深度學(xué)習(xí)的虛假交易識別研究
MOOC與翻轉(zhuǎn)課堂融合的深度學(xué)習(xí)場域建構(gòu)
大數(shù)據(jù)技術(shù)在反恐怖主義中的應(yīng)用展望
深度學(xué)習(xí)算法應(yīng)用于巖石圖像處理的可行性研究
城市空間用地擴展變化研究與規(guī)模預(yù)測
電子商務(wù)影響因素的計量分析
商(2016年28期)2016-10-27 20:23:05
基于深度卷積網(wǎng)絡(luò)的人臉年齡分析算法與實現(xiàn)
軟件工程(2016年8期)2016-10-25 15:47:34
乐安县| 龙江县| 隆子县| 黎城县| 贵州省| 海丰县| 左权县| 印江| 龙井市| 巴林左旗| 曲周县| 浦县| 五原县| 虎林市| 江永县| 蒲江县| 甘肃省| 长白| 赤峰市| 肥乡县| 侯马市| 涿州市| 怀柔区| 邮箱| 桂阳县| 桐庐县| 视频| 桑日县| 会泽县| 松江区| 锦屏县| 都安| 黄冈市| 曲沃县| 伊春市| 金门县| 方城县| 东兰县| 卢氏县| 东至县| 枣强县|