李春曉 李海鷹 蔣 熙 許心越 趙阿群
(1.北京交通大學(xué)軌道交通控制與安全國家重點(diǎn)實驗室 北京 100044;2.北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044;3.北京交通大學(xué)計算機(jī)與信息技術(shù)學(xué)院 北京 100044)
基于廣義動態(tài)模糊神經(jīng)網(wǎng)絡(luò)的短時車站進(jìn)站客流量預(yù)測
李春曉1,2李海鷹1蔣 熙1許心越1趙阿群3
(1.北京交通大學(xué)軌道交通控制與安全國家重點(diǎn)實驗室 北京 100044;2.北京交通大學(xué)交通運(yùn)輸學(xué)院 北京 100044;3.北京交通大學(xué)計算機(jī)與信息技術(shù)學(xué)院 北京 100044)
軌道交通;廣義動態(tài)模糊神經(jīng)網(wǎng)絡(luò);短時客流預(yù)測;進(jìn)站量
隨著城市軌道交通進(jìn)入網(wǎng)絡(luò)化運(yùn)營模式,線網(wǎng)規(guī)模和復(fù)雜性不斷增加,對城市軌道交通運(yùn)營管理提出了更高的要求,短時客流預(yù)測不僅是運(yùn)營管理與資源配置的基礎(chǔ)[1],還能為運(yùn)能分析及運(yùn)量匹配提供有效的數(shù)據(jù)支持。因此,實時準(zhǔn)確的短時客流預(yù)測是實現(xiàn)軌道交通系統(tǒng)高效、有序運(yùn)行的重要保障。
相比中長期客流,短時客流具有更強(qiáng)的隨機(jī)性、高度非線性等特點(diǎn),使得傳統(tǒng)的預(yù)測方法如時間序列、非參數(shù)回歸模型等不適用于短時客流預(yù)測。短時客流預(yù)測通常集中在BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等方法的研究上,但它們存在以下問題:BP神經(jīng)網(wǎng)絡(luò)對初始權(quán)值非常敏感,算法穩(wěn)定性差,收斂速度水平較低,網(wǎng)絡(luò)的泛化能力差[2];支持向量機(jī)則難以訓(xùn)練大規(guī)模的樣本數(shù)據(jù),存在多分類問題求解困難的弊端,而軌道交通的客流數(shù)據(jù)量龐大,會耗費(fèi)大量機(jī)器內(nèi)存與運(yùn)算時間,故這類方法有很大的局限性[3]。
城市軌道交通車站小時進(jìn)站客流隨城市生活的節(jié)奏變化在一天內(nèi)呈動態(tài)起伏狀分布,車站小時客流一般有5種分布類型[8]:單峰型、雙峰型、全峰型、突峰型和無峰型。由于軌道交通系統(tǒng)日常服務(wù)的通勤出行比例較高,工作日時遵從早出晚歸的規(guī)律,所以通常客流在一天內(nèi)呈雙峰型分布。
工作日與休息日的進(jìn)站客流分布有明顯區(qū)別:周一至周五的進(jìn)站量明顯高于休息日,并有明顯的早晚高峰現(xiàn)象,呈現(xiàn)很強(qiáng)的規(guī)律性,而休息日的進(jìn)站客流相對分散,分布比較均衡,如圖1所示。
圖1 北京地鐵2號線A站一周內(nèi)各日的分時進(jìn)站量
節(jié)假日也影響車站短時進(jìn)站客流分布,十一節(jié)假日期間的進(jìn)站量明顯小于前后兩周的進(jìn)站量。節(jié)假日期間部分市民選擇出去旅游,通勤客流也大大減少,如圖2所示。
圖2 北京地鐵13號線B站十一假期及前后兩周進(jìn)站量
同時,突發(fā)事件如舉辦大型活動、地鐵信號設(shè)備故障及天氣的驟然變化等也會對短時客流分布產(chǎn)生較大影響。如2013年12月北京地鐵13號線信號設(shè)備發(fā)生故障,當(dāng)日13號線全線客流較平日減少7.37%,約6.29萬人次;2013年9月北京地鐵4號線ATS(自動列車監(jiān)控系統(tǒng))工作站故障,當(dāng)日4號線客流較平日減少15.97%,約20萬人次。
因此,在時間方面,客流受到節(jié)假日、工作日、雙休日及時段影響;從突發(fā)事件的角度,客流受到重大活動、驟然天氣變化等不確定因素的影響。不確定因素會引起進(jìn)站客流的隨機(jī)波動,但總體上具有周期變化(如雙峰型)的規(guī)律。進(jìn)站客流曲線具有相似性的特點(diǎn)使得客流預(yù)測模型可以發(fā)現(xiàn)樣本數(shù)據(jù)規(guī)律,實現(xiàn)進(jìn)站量預(yù)測。
3.1 選擇模型輸入變量
選取影響客流分布的主要因素并將其量化后作為模型的輸入變量。變量維數(shù)過多會給網(wǎng)絡(luò)學(xué)習(xí)帶來不必要的麻煩,并可能造成預(yù)測精度的下降;變量維數(shù)過少,神經(jīng)網(wǎng)絡(luò)難以發(fā)現(xiàn)樣本的規(guī)律性。筆者采用5個影響因素作為系統(tǒng)的輸入變量,如表1所示。
表1 系統(tǒng)輸入變量及其標(biāo)定方法
圖3 GDFNN結(jié)構(gòu)
在輸入層,節(jié)點(diǎn)的個數(shù)為系統(tǒng)輸入變量的個數(shù),共有r個輸入變量,每個輸入變量xi(i= 1, 2,…,r)有u個隸屬函數(shù)uij(j= 1, 2,…,u)。在隸屬函數(shù)層,筆者采用高斯函數(shù)作為隸屬函數(shù),表示為:
(2)
輸出層的輸出是每一個輸入信號的疊加。輸出變量為
(3)
式中,ωj是結(jié)果參數(shù)或第j個規(guī)則的連接權(quán)。
1) 初始化系統(tǒng)預(yù)定義參數(shù)。
2) 輸入第1個樣本數(shù)據(jù)產(chǎn)生第1條模糊規(guī)則。
3) 輸入新的樣本數(shù)據(jù),計算當(dāng)前樣本與所有模糊規(guī)則的馬氏距離,找到最小值dmin,并計算實際輸出誤差ei。
4) 若滿足dmin>kd,則轉(zhuǎn)5);否則轉(zhuǎn)7)。其中,kd是與學(xué)習(xí)次數(shù)有關(guān)的設(shè)定值。
5) 若滿足ei>ke,則產(chǎn)生新規(guī)則,并計算出所有規(guī)則的重要性η;否則轉(zhuǎn)8)。其中,ke是與學(xué)習(xí)次數(shù)有關(guān)的設(shè)定值。
6) 若滿足η 7) 若滿足ei>ke,則調(diào)整高斯函數(shù)的寬度和結(jié)果參數(shù);否則轉(zhuǎn)8)。 8) 調(diào)整結(jié)果參數(shù)。 9) 觀測是否完成,若仍有數(shù)據(jù)則返回3),否則結(jié)束學(xué)習(xí)。 1) 根據(jù)影響客流分布的因素確定預(yù)測模型的輸入變量。 3) 對訓(xùn)練完成的網(wǎng)絡(luò),使用測試數(shù)據(jù)測試網(wǎng)絡(luò)的性能。 4) 使用預(yù)測數(shù)據(jù)進(jìn)行預(yù)測,驗證模型的有效性。 4.1 樣本數(shù)據(jù)選擇與預(yù)處理 樣本車站為:復(fù)興門站(兩線換乘站,進(jìn)出站客流有明顯潮汐特征)、西直門站(三線換乘站,交通樞紐)、回龍觀站(早高峰進(jìn)站客流大)。統(tǒng)計2013年9月20日至2013年12月27日每日各時段(以小時為單位)車站的進(jìn)站量,進(jìn)行實驗。 訓(xùn)練數(shù)據(jù):2013年9月20日到2013年12月19日分時段的進(jìn)站量,共1 547個數(shù)據(jù)。 測試數(shù)據(jù):2013年12月20日到2013年12月24日分時段的進(jìn)站量,共85個數(shù)據(jù)。 預(yù)測數(shù)據(jù):2013年12月25日到2013年12月26日分時段的進(jìn)站量,共34個數(shù)據(jù)。 實驗時,采用高斯函數(shù)作為隸屬函數(shù),其最佳使用范圍為[0,1]。為避免原始數(shù)據(jù)過大造成網(wǎng)絡(luò)麻痹,并提高網(wǎng)絡(luò)泛化能力,需要對原始數(shù)據(jù)進(jìn)行歸一化處理后作為網(wǎng)絡(luò)的輸入(式4),并對網(wǎng)絡(luò)輸出進(jìn)行反歸一化處理(式5),得到預(yù)測值 (4) Y(t)=y(t)(maxX(t)-minX(t))+minX(t) (5) 式中,X(t)為原始數(shù)據(jù),x(t)為網(wǎng)絡(luò)輸入,y(t)為網(wǎng)絡(luò)輸出,Y(t)為預(yù)測數(shù)據(jù)。 4.2 網(wǎng)絡(luò)測試與訓(xùn)練 筆者對3個樣本車站均進(jìn)行了實驗,以復(fù)興門站為代表,對網(wǎng)絡(luò)訓(xùn)練進(jìn)行說明。隨著樣本數(shù)據(jù)的增加,模糊規(guī)則在不斷變化,網(wǎng)絡(luò)結(jié)構(gòu)也隨之動態(tài)調(diào)整,訓(xùn)練結(jié)束后共產(chǎn)生18條模糊規(guī)則,如圖4所示。 圖4 模糊規(guī)則產(chǎn)生與動態(tài)變化過程 圖5為網(wǎng)絡(luò)訓(xùn)練過程中的實際輸出誤差,從圖中可以看出在訓(xùn)練初期網(wǎng)絡(luò)不穩(wěn)定,絕對誤差值和變化幅度都較大(最大為2 000人次),隨著訓(xùn)練的進(jìn)行,從第1 000組數(shù)據(jù)開始,誤差維持在0至200之間,網(wǎng)絡(luò)趨于穩(wěn)定。 圖5 網(wǎng)絡(luò)實際輸出誤差 網(wǎng)絡(luò)學(xué)習(xí)結(jié)束后,采用85個測試數(shù)據(jù)對網(wǎng)絡(luò)進(jìn)行穩(wěn)定性驗證。圖6為測試數(shù)據(jù)的預(yù)測值和期望值對比圖,從圖中情況來看,期望值與預(yù)測值曲線擬合程度高。圖7為相對誤差圖,最大相對誤差值為8.00%,預(yù)測效果良好。 圖6 測試數(shù)據(jù)結(jié)果對比 圖7 測試數(shù)據(jù)相對誤差 4.3 預(yù)測結(jié)果性能分析 預(yù)測結(jié)果如圖8所示,預(yù)測值與期望值擬合程度較好。復(fù)興門站預(yù)測值相對誤差的絕對值最大為7.96%,最小為0.45%;西直門站預(yù)測值相對誤差的絕對值最大為7.04%,最小為0.04%;回龍觀站預(yù)測值相對誤差的絕對值最大為7.25%,最小為0.36%。 圖8 3座車站預(yù)測結(jié)果 表2 3種預(yù)測方法指標(biāo)比較 目前,由于訓(xùn)練數(shù)據(jù)僅包含兩個月的日常進(jìn)站客流數(shù)據(jù)和一年的節(jié)假日(十一假期)數(shù)據(jù),數(shù)據(jù)樣本量有限,導(dǎo)致模型預(yù)測的最大誤差為8%,但隨著進(jìn)站客流數(shù)據(jù)的豐富,網(wǎng)絡(luò)泛化能力加強(qiáng),預(yù)測精度會進(jìn)一步提高。 [2] 周開利, 康耀紅.神經(jīng)網(wǎng)絡(luò)模型與其MATLAB仿真程序設(shè)計[M].北京:清華大學(xué)出版社,2005. [3] 董升偉.基于改進(jìn)BP神經(jīng)網(wǎng)絡(luò)的軌道交通 短 時 客 流 預(yù)測方法研究[D].北京:北京交通大學(xué),2013. (編輯:王艷菊) Li Chunxiao1,2Li Haiying1Jiang Xi1Xu Xinyue1Zhao Aqun3 (1.State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044;2.School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044;3.School of Computer and Science, Beijing Jiaotong University, Beijing 100044) Directing against the characteristics of unbalanced, highly nonlinear and dynamic short-term entrance passenger flow of rail transit, the paper presents a short-term entrance passenger flow forecast method based on generalized dynamic fuzzy neural networks(GD-FNN), which combines the logical reasoning ability of fuzzy technology with the self-learning ability of neural networks. The paper determines the main factors affecting the distribution of short-term passenger flow by analyzing the features of passenger flow with the data of Beijing metro stations; and then a forecast model has been established by using GD-FNN to predict the short-term entrance passenger flow; finally, several stations in Beijing rail transit are used as numerical examples to confirm that this model can precisely approximate to the practical data (maximum relative error is less than 8%) and has good stability compared with traditional neural networks. rail transit;generalized dynamic fuzzy neural networks;short-term passenger forecast;entrance passenger flow 李春曉,女,碩士研究生,從事城市軌道交通客流組織研究,14120844@bjtu.edu.cn 國家重點(diǎn)實驗室自主課題(RCS2015ZZ002) U293.6 A4 案例分析
5 結(jié)語