賈新茹,閆立斌,張 永,李 永,馮 焱
(1.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081;2.中國鐵路總公司 財務部,北京 100844)
鐵路運輸企業(yè)完成運輸任務,按照國家規(guī)定的收費標準向旅客收取的貨幣收入稱為運輸收入,是鐵路運輸企業(yè)的主營業(yè)收入[1]。各次旅客列車客票收入?yún)R總成運輸企業(yè)客運營業(yè)收入,列車客票收入指標是衡量一趟列車運營情況的重要指標。近年來,高速鐵路發(fā)展迅速,截止2016年底,每天開行動車組2330余對,高鐵列車客票收入是保障高鐵建設運營順利實施并持續(xù)發(fā)展的主要資金來源[2]。鐵路運輸企業(yè)收入主管部門在上一年運輸收入各項指標的基礎上制定當年的預算,收入預算作為收入完成情況的參考參與到收入管理工作[3]。預算是在列車未開行的情況下進行的,對未來工作有指導意義,做好列車收入預算也是管理部門一項重點工作。鐵路資金清算系統(tǒng)對已開行列車運營數(shù)據(jù)進行統(tǒng)計分析,不具備對新開車收入的測算功能[4]。目前,對未開行列車收入預算,是根據(jù)上一年的客票收入結(jié)合專家經(jīng)驗,同時再結(jié)合開行方案中的列車定員、票額數(shù)據(jù)進行一定比例的折算,這種手工測算不僅工作量大,精準度也不高,尤其是伴隨新的售票組織管理方法(席位復用、共用、智能席位預分等)的應用,極大地提高了席位的使用效率,更增加了對列車客票收入估算的難度。業(yè)務部門需要一種簡便、高效的旅客列車收入測算方法。從經(jīng)營的角度看,列車客票收入是衡量一趟列車運營情況的重要指標,運輸企業(yè)進行新開車效益估算時,也需要對列車客票收入進行估算[5]?;谝陨闲枨?,本文通過運用相關性理論對列車相關運輸指標研究的基礎上,提出了一種列車收入估算方法,方便業(yè)務部門實際操作使用。
旅客列車客票收入是該趟列車實際售出(除去退、廢)的所有電子客票票價總和,計算公式如式(1)。
其中:N表示售出客票張數(shù);P表示單價。從公式上可以看出,影響該趟車客票收入的因素為售出客票張數(shù)和客票單價,因此,影響客票收入主要因素為客票票價和總?cè)藬?shù)。
鐵路旅客列車的價格政策屬于集中管制、政府定價的形式。目前,普通旅客列車的基準票價率,仍執(zhí)行的是1995年確定的每人公里5.861分(人民幣);從2016年1月1日起放開高鐵動車票價,由鐵路運輸企業(yè)依據(jù)價格法律法規(guī)的同時,根據(jù)市場供求狀況依法自主制定;高鐵動車組列車票價隨線路開通時間和區(qū)域略有不同。既有普速車和高鐵動車的票價機制雖有所差別,但由價格計算規(guī)則可知影響票價的主要因素大致相同:列車等級、發(fā)到站間里程、票種、席別;等級高的票價高、里程長的票價高、席別等級高的票價高。
鐵路旅客列車主要的票種有:全票、學生票、孩票、殘軍票等;全票價是基礎,其他票種票價是在全票票價的基礎上按照相關規(guī)定進行折算;2016年售出電子客票中各類票種占比統(tǒng)計如表1所示,從表1中可以看出全票占比很高,因此,在進行客票收入測算時忽略其他票種票價影響,均按全票價格。
表1 票種占比統(tǒng)計表
通過對歷史客流數(shù)據(jù)的分析,對旅客列車的席別及占比情況進行了分類統(tǒng)計,如表2所示,其中,普速列車硬席客流占總客流96%,動車組列車二等座占89.2%;從表2中可以看出各類列車客流貢獻主要來自于其重點席別;本文所做的測算未對席別進行細分,反映的是各種席別的平均情況。
表2 旅客列車席別占比統(tǒng)計表
綜合上述分析,列車等級和里程為主要價格影響因素。對于具體的一類列車,票價是一組穩(wěn)定的、和里程有一定線性關系的常量,列車客票收入會隨著售出張數(shù)(即客流)的變化而變化。旅客列車客票收入與列車客流有一定的線性相關性。
1.2.1 指標
(1)客流指標
客座率= 實際旅客周轉(zhuǎn)量/圖定周轉(zhuǎn)量;是體現(xiàn)旅客列車運輸效率的指標,反映列車運力資源被利用的程度。
(2)客票收入指標
滿員收入=旅客列車單程全程滿員,并且均為始發(fā)至終到全票旅客狀況下的收入,記為滿員收入。
收入實現(xiàn)率= 實際收入/滿員收入;表示一趟列車實際收入占滿員收入的比例,在一定程度上反映了列車經(jīng)濟收益情況。
1.2.2 指標間關系
一些客運指標之間雖然不存在直接計算的相互關系,但卻以某種規(guī)律相互影響,稱為指標間的相關關系[6]。皮爾遜相關系數(shù)廣泛用于度量兩個變量之間的相關程度,其值介于[-1,1]之間,該系數(shù)反映兩個變量之間的線性關系和相關方向[7]。計算公式如式(2):
基于2016年全路旅客列車全年運營數(shù)據(jù),統(tǒng)計出各不同字頭(用N表示數(shù)值字頭)列車的實際客座率(對應公式中的X)和收入實現(xiàn)率(對應公式中的Y)指標數(shù)據(jù),計算得到兩個指標變量間的皮爾遜系數(shù),如表3所示。從表3可知,除了車次字頭為N的列車弱相關以外,其他字頭列車的客座率與收入實現(xiàn)率的相關程度均為“極強相關”。
表3 旅客列車客座率與收入實現(xiàn)率相關性系數(shù)表
跨兩個或兩個以上鐵路局管界運行的列車為直通旅客列車(簡稱:直通車),只在一個鐵路局管界內(nèi)運行的列車為局管旅客列車(簡稱:管內(nèi)車),直通、管內(nèi)稱為列車類型。直達列車(車次字頭為Z的列車)是指無中間停站的列車。圖1為直通直達列車客座率、收入實現(xiàn)率指標分析圖。
圖1 直通直達旅客列車客座率與收入實現(xiàn)率相關性分析
從圖1可以看出:
(1)大多數(shù)直通直達列車的客座率基本在[70%,100%]區(qū)間范圍內(nèi);
(2)直通直達旅客列車客座率與收入實現(xiàn)率變化趨勢一致,取值也基本保持一致。
選取2016年全路旅客列車旅客發(fā)送量匯總統(tǒng)計數(shù)據(jù)。
選取旅客列車客座率作為目標變量。客座率是連續(xù)性數(shù)據(jù),對其進行離散化處理[8]:對列車客座率按照等間距分隔,本文結(jié)合業(yè)務實踐選取寬度為0.1,共分為10組(10%、20%……100%),記為[y1,y2,…,y10],其中,y1表示[0,10%]的客座率區(qū)間,在每一類樣本數(shù)據(jù)中,每一個客座率分組對應多個單位里程收入。我們設定每個客座率分組所對應的多個單位里程收入中存在一個數(shù)值能使符合誤差范圍的列車樣本比例達到最大,即區(qū)間最優(yōu)值。
例如,第1組y1客座率對應的單位里程收入為 [p1,p2,…,pn],其中,pn表示客座率在[0,10%]區(qū)間時第n趟列車的單位里程收入(單位里程收入=客票總收入/旅客運行總里程),單位為元/km。設每個里程收入對應一個預測值xi,i∈[1,N],其中,i對應的是客座率的一個區(qū)間,N是該區(qū)間中第N趟車,該預測值滿足預測相對誤差,本文設定的預測誤差在[-5%, 5%]之間,記為[a,b]。則每個單位里程對應的里程收入預測值為xi∈[a·pi+pi,b·pi+pi],只需求這些預測值的取值范圍的交集,交集的中值就為最優(yōu)預測值。
(1)進行數(shù)據(jù)清洗。數(shù)據(jù)清洗包括對樣本數(shù)據(jù)集中缺失數(shù)據(jù)處理,格式或者取值錯誤數(shù)據(jù)處理,臨客列車數(shù)據(jù)剔除,開行天數(shù)不足40天的車次數(shù)據(jù)剔除等。數(shù)據(jù)清洗在數(shù)據(jù)源端進行,在客運營銷系統(tǒng)數(shù)據(jù)倉庫中完成。
(2)確定相關影響因素取值,包括列車類型:直通、管內(nèi);列車等級:高鐵列車G、動車組列車D、快速列車K、特快列車T、直達列車Z、其他列車即數(shù)字字頭列車。
(3)對客座率取值的離散化處理,旅客列車客座率是連續(xù)型數(shù)據(jù),按照間距0.1的標準進行劃分。使用Py thon語言編寫腳本,進行運算,分別對全路直通和局管列車單位里程收入進行統(tǒng)計、測算,具體測算結(jié)果參見表4和表5。
圖2與表4是直通旅客列車收入測算圖與表,從圖上可以看出,直通列車單位公里收入隨客座率整體呈現(xiàn)線性增長趨勢。從圖中也可以看出,高鐵票價率高于其他等級列車。
圖2 直通旅客列車收入測算折線圖
表4 直通旅客列車不同客座率下單位里程收入測算表單位:元/km
圖3與表5是管內(nèi)旅客列車收入測算圖與表,從圖上可以看出,管內(nèi)列車單位公里收入隨客座率呈現(xiàn)大致的線性增長趨勢。其中,管內(nèi)G字頭列車在客座率[60%,70%]和[90%,100%]兩個區(qū)間均出現(xiàn)了跳躍。高鐵列車的票價率高于其他等級列車。
圖3 管內(nèi)旅客列車收入測算折線圖
表5 鐵路局旅客列車不同客座率下單位里程收入測算表單位:元/km
基于測算表的旅客列車收入測算:假定一趟旅客列車,根據(jù)開行方案可確定里程為dkm,定員總數(shù)為F人,定員收入R滿元,根據(jù)客流預測系統(tǒng)得到列車預測客座率a;按照列車類型、列車字頭等級,查找里程收入測算表格中對應的里程收入k元/km,測算出該客運列車客票收入:R=d·k。
例如,假定要開行一趟北京南—上海虹橋之間的高鐵列車(車次字頭為G),其運營里程1 318 km,參考2016年京滬之間高鐵列車平均客座率情況,該車次預期客座率為75%。查詢“表4直通旅客列車收入測算表”,對應客座率70%和80%時對應單位里程收入分別是:178.9元/km,362.6元/km;該車預估客票收入在23.6萬元和47.8萬元之間,取均值后得到客座率75%的列車估算客票收入為35.7萬元。通過對北京南—上海虹橋之間實際開行高鐵列車運營數(shù)據(jù)的統(tǒng)計計算,客座率為75%時對應的日均收入為35.3萬元,與預估收入的誤差為1.1%。這種估算方式不僅操作簡便,準確率也比較高。
本文探尋了一種鐵路旅客列車客票收入估算的方法。首次提出并計算出列車收入測算表,為業(yè)務部門進行客運列車客票收入估算提供了一種宏觀估算方法。
伴隨高鐵線路的建設、開通,各類列車開行的數(shù)量、不同等級列車數(shù)量占比每年都有變化和調(diào)整。為及時體現(xiàn)這種變化,收入測算表需要定期進行重新采樣、重新測算。此外,為提高測算精度,可以擴大測算樣本數(shù)據(jù)集,再增加1~2年的樣本數(shù)據(jù);也可以按鐵路局集團公司為計算單位,為18個鐵路局集團公司分列車等級分別測算收入測算表。同時,為提高算法本身的精度,可以增加分析維度,例如增加席別維度,針對每種席別進行單獨測算。