何永明, 張磊, 曹劍
(東北林業(yè)大學(xué) 交通學(xué)院, 黑龍江 哈爾濱 150040)
2012年,國(guó)務(wù)院發(fā)布《國(guó)務(wù)院關(guān)于批轉(zhuǎn)交通運(yùn)輸部等部門(mén)重大節(jié)假日免收小型客車通行費(fèi)實(shí)施方案的通知》,規(guī)定在重要節(jié)假日期間(春節(jié)、清明節(jié)、“五一”國(guó)際勞動(dòng)節(jié)和國(guó)慶節(jié))對(duì)7座及以下小型車輛實(shí)行高速公路免費(fèi)通行政策。該政策推動(dòng)了更多出行者在重要節(jié)假日期間選擇高速公路出行[1],造成嚴(yán)重的高速公路交通擁堵,與方便節(jié)假日城際出行的初衷相悖[2]。節(jié)假日城際出行與工作日出行相差較大,具有明顯的集中出行和潮汐現(xiàn)象[3]。分析節(jié)假日期間出行特征,深入研究免費(fèi)政策對(duì)出行選擇的影響,對(duì)制定合理節(jié)假日免費(fèi)政策、減少集中出行現(xiàn)象具有重要意義。
城際出行特征主要包括出行時(shí)間、出行方式和出行距離等,且在節(jié)假日期間較容易受免費(fèi)政策的影響[4]。因此,不少學(xué)者針對(duì)節(jié)假日免費(fèi)政策和出行特征的關(guān)系展開(kāi)研究,通過(guò)動(dòng)態(tài)調(diào)整免費(fèi)政策使出行者分散出行。由于出行特征具有離散性和隨機(jī)性,現(xiàn)有研究多通過(guò)在離散選擇上表現(xiàn)良好的Logit模型來(lái)模擬出行選擇過(guò)程[5]。馬瑩瑩等在傳統(tǒng)Logit模型的基礎(chǔ)上關(guān)注不同出行特征之間的相關(guān)性,引入考慮出行者異質(zhì)性的分層Logit模型[6]?,F(xiàn)有研究主要對(duì)出行特征的離散性進(jìn)行分析,并在傳統(tǒng)Logit模型的基礎(chǔ)上構(gòu)建出行選擇模型,缺少對(duì)其他離散選擇模型的探索。決策樹(shù)算法在處理離散特征上具有良好的擬合度,且在出行方式選擇上具有更高的識(shí)別率[7]。鑒于此,本文參考文獻(xiàn)[8],在考慮性別、年齡、家庭人均收入和出行目的等固有出行者屬性的基礎(chǔ)上,引入免費(fèi)時(shí)段為擴(kuò)展屬性,利用決策樹(shù)算法建立出行時(shí)段選擇模型,并設(shè)計(jì)多種分時(shí)段免費(fèi)場(chǎng)景,考察各場(chǎng)景下出行比例的變化,選擇集中出行最少的場(chǎng)景作為節(jié)假日免費(fèi)政策優(yōu)化方案。
節(jié)假日出行數(shù)據(jù)可以分為交通流數(shù)據(jù)和出行選擇數(shù)據(jù)。其中交通流數(shù)據(jù)來(lái)源于各省高速公路聯(lián)網(wǎng)數(shù)據(jù)庫(kù),具有種類全面、數(shù)據(jù)量大等優(yōu)點(diǎn),方便從整體把握城際間高速公路交通流特征的變化趨勢(shì)。各省交通流數(shù)據(jù)統(tǒng)計(jì)標(biāo)準(zhǔn)不同,本文以2019年湖南省節(jié)假日期間交通流數(shù)據(jù)(見(jiàn)表1)為主要分析對(duì)象,其中包含機(jī)動(dòng)車當(dāng)量數(shù)、車型和車輛出入路徑等信息,分析免費(fèi)政策對(duì)交通量的影響。
同時(shí)通過(guò)問(wèn)卷調(diào)查采集湖南省2019年“五一”期間出行選擇數(shù)據(jù),分析出行者屬性和免費(fèi)政策對(duì)出行選擇的影響。問(wèn)卷中出行者屬性包括性別、年齡、家庭人均年可支配收入、是否擁有汽車、出行目的和出行方式,同時(shí)統(tǒng)計(jì)出發(fā)日期選擇、出發(fā)時(shí)段選擇、返程日期選擇和返程時(shí)段選擇[9]等出行選擇屬性。共收集有效調(diào)查問(wèn)卷635份作為數(shù)據(jù)樣本,出行者屬性見(jiàn)表2。本次調(diào)查中擁有汽車的受訪者高達(dá)73.43%,樣本反映了節(jié)假日期間受免費(fèi)政策影響的主要出行群體。
表1 交通流數(shù)據(jù)
表2 出行者屬性
2019年“五一”期間高速公路免費(fèi)日期為5月1日0:00—5月4日24:00,為全面分析節(jié)假日出行時(shí)段選擇特性,采集“五一”前后各3 d共6 d的出行選擇數(shù)據(jù),各日期出發(fā)和返程時(shí)段選擇見(jiàn)圖1、圖2,將出行時(shí)段選擇比例(該時(shí)段出行人數(shù)/總?cè)藬?shù))作為評(píng)估參數(shù),熱度由低到高通過(guò)不同顏色表示。
圖1 出發(fā)時(shí)段選擇熱力圖
圖2 返程時(shí)段選擇熱力圖
由圖1、圖2可知:“五一”出行具有明顯的集中現(xiàn)象,出發(fā)時(shí)段集中于6:00—12:00,返程時(shí)段集中于9:00—15:00。出行選擇受主觀因素影響較大,可結(jié)合交通流數(shù)據(jù)進(jìn)一步分析免費(fèi)政策對(duì)節(jié)假日出行影響的顯著性。
單因素方差分析法常用于討論被檢測(cè)樣本和參考樣本之間的差異性[10],具體參數(shù)見(jiàn)表3。利用單因素方差分析法探究免費(fèi)政策和出行時(shí)段選擇的關(guān)系,只改變高速公路免費(fèi)政策,其余因素在設(shè)計(jì)狀態(tài)下保持不變。通過(guò)對(duì)比F值和其在概率值α下的分位數(shù),判斷免費(fèi)政策的影響顯著性[11]。
表3 方差分析參數(shù)
總樣本共有r個(gè)水平,各出行者可抽象成相同分布的樣本xij。每一水平下樣本個(gè)數(shù)為n個(gè),對(duì)不同水平下樣本觀測(cè)值進(jìn)行計(jì)算,得總離差平方和SSST、組間平均離差平方和SSSA和組內(nèi)平均離差平方和SSSE如下[12]:
(1)
(2)
SSSE=SSST-SSSA
(3)
SMSA、SMSE表示各狀態(tài)下樣本的均方和,其值為:
SMSA=SSSA/(r-1)
(4)
SMSE=SSSE/(n-r)
(5)
F值按式(6)計(jì)算。如果觀測(cè)值滿足F≥F(1-α)(r-1,n-r),則免費(fèi)政策的影響顯著。
F=SMSA/SMSE
(6)
結(jié)合采集的交通流數(shù)據(jù),選擇春節(jié)、清明節(jié)、“五一”國(guó)際勞動(dòng)節(jié)和國(guó)慶節(jié)4個(gè)法定節(jié)假日中5個(gè)不同日期交通量作為觀測(cè)樣本,以正常收費(fèi)下工作日交通量作為參照樣本,則水平數(shù)r=5。各樣本中數(shù)據(jù)項(xiàng)數(shù)量ni為5,交通量分布見(jiàn)表4。
表4 樣本交通量分布 單位:萬(wàn)輛/d
將表4中各樣本交通量代入式(1)~(6),利用SPSS軟件對(duì)不同樣本下交通量進(jìn)行方差分析,結(jié)果見(jiàn)表5。
表5描述了各樣本交通量之間的差異性,其中組間平方和反映每組均值與總均值之間的離差,由免費(fèi)政策變化所引起;組內(nèi)平方和又稱誤差平方和,由隨機(jī)誤差所引起。查詢F檢驗(yàn)臨界值表,F=12.856時(shí)顯著性水平遠(yuǎn)小于0.05,表明免費(fèi)政策對(duì)節(jié)假日交通量分布具有顯著影響。因此,有必要在建立出行時(shí)段選擇模型時(shí)添加免費(fèi)政策作為特征參數(shù)。
表5 方差分析結(jié)果
決策樹(shù)算法是一種不斷逼近離散函數(shù)值的方法,在處理數(shù)據(jù)后歸納特征生成可見(jiàn)決策樹(shù),然后使用決策樹(shù)對(duì)新的測(cè)試樣本進(jìn)行分類[13]。選擇決策樹(shù)算法作為出行時(shí)段選擇模型的理論框架,對(duì)不同決策屬性賦予對(duì)應(yīng)權(quán)重,根據(jù)權(quán)重大小確定關(guān)鍵屬性,再對(duì)關(guān)鍵屬性的不同特征值下其他決策屬性的權(quán)重重新賦值。將上述決策過(guò)程通過(guò)樹(shù)狀圖表示,生成圖3所示決策樹(shù)結(jié)構(gòu)。
圖3 決策樹(shù)結(jié)構(gòu)圖
由圖3可知決策樹(shù)結(jié)構(gòu)具有以下特點(diǎn):1) 決策樹(shù)由節(jié)點(diǎn)和有向邊組成,節(jié)點(diǎn)為關(guān)鍵決策屬性,有向邊代表各屬性的特征;2) 節(jié)點(diǎn)有內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn)兩種形式,內(nèi)部節(jié)點(diǎn)為決策屬性,葉子節(jié)點(diǎn)為最終決策類別,即所選擇的出行時(shí)段;3) 各屬性在一條決策路徑中只出現(xiàn)一次;4) 每條決策路徑的屬性個(gè)數(shù)不確定,可為1~n中任一數(shù)值[14]。
根據(jù)決策樹(shù)結(jié)構(gòu),構(gòu)建出行時(shí)段選擇模型須解決3個(gè)關(guān)鍵問(wèn)題:1) 變量劃分,即確定決策屬性和特征值;2) 決策路徑生成,即確定關(guān)鍵屬性和路徑劃分函數(shù);3) 模型優(yōu)化,即對(duì)決策樹(shù)剪枝,提高模型的擬合優(yōu)度。
構(gòu)建模型所需的決策屬性包括免費(fèi)政策、出行者屬性和出行選擇屬性。其中:免費(fèi)政策作為擴(kuò)展屬性可多次改變;出行者屬性與表2中各屬性的數(shù)據(jù)描述一致,可作為觀測(cè)值反映決策路徑變化;出行選擇屬性為出行選擇時(shí)段,以3 h為時(shí)間間隔,時(shí)間分布與“五一”期間出行選擇數(shù)據(jù)一致。為避免模型將特征值較多的屬性識(shí)別為連續(xù)變量,對(duì)出行者屬性和免費(fèi)政策進(jìn)行啞變量處理,結(jié)果見(jiàn)表6。
決策路徑生成的主要任務(wù)是選擇各屬性的不同特征進(jìn)行分類,并確定下一層次屬性值。利用Python編程語(yǔ)言導(dǎo)入樣本數(shù)據(jù),并通過(guò)Sklearn模塊中DecisionTreeClassifier類構(gòu)建決策樹(shù),重要參數(shù)的默認(rèn)設(shè)置見(jiàn)表7。
基尼指數(shù)G是確定關(guān)鍵屬性和劃分路徑的重要指標(biāo),其原理見(jiàn)式(7)?;嶂笖?shù)越小,分類結(jié)果越好,指數(shù)值最小的特征可作為決策路徑,并用于確定下一層次關(guān)鍵屬性。
(7)
式中:n為出行者數(shù)量;pk為關(guān)鍵屬性k選擇某條決策路徑的概率。
最小不純度K是一種閾值,可限制決策樹(shù)的增長(zhǎng),若不純度高于最小不純度,則繼續(xù)劃分下一路徑,反之停止增長(zhǎng)。不純度可由信息熵表示,計(jì)算過(guò)程見(jiàn)式(8)。屬性k的不純度越低,信息熵越大。利用信息熵限定決策樹(shù)的增長(zhǎng),可以減少干擾路徑,使出行時(shí)段劃分更準(zhǔn)確。
(8)
式中:i表示關(guān)鍵屬性k的具體特征;I為包含該屬性的所有特征值。
將出行時(shí)段以3 h為間隔劃分成8組,對(duì)擁有多個(gè)屬性的出行者X,通過(guò)迭代計(jì)算基尼指數(shù)和最小不純度K確定路徑?jīng)Q策順序Q={q1,q2,q3,…,qm},生成一棵最大深度≤m的二叉樹(shù),流程見(jiàn)圖4。
決策樹(shù)中節(jié)點(diǎn)數(shù)量由基尼指數(shù)和最小不純度K共同決定,除葉子節(jié)點(diǎn)外,每層節(jié)點(diǎn)均對(duì)應(yīng)兩個(gè)不同的下級(jí)屬性。先利用基尼指數(shù)確定屬性名稱,再對(duì)比屬性值和最小不純度K的大小;若屬性值大于K,則計(jì)算該屬性權(quán)重,并繼續(xù)獲取下一個(gè)屬性;反之保持K值不變,重新選取基尼指數(shù)最小的屬性。決策樹(shù)中葉子節(jié)點(diǎn)為可選擇的出行時(shí)段J,J={j1,j2,j3,…,jn},每個(gè)出行者最終只選擇一個(gè)出行時(shí)段。
圖4 決策路徑生成流程
(9)
決策樹(shù)最大深度線性增加時(shí),R2的變化見(jiàn)圖5。由圖5可知:隨著決策樹(shù)最大深度的增加,擬合優(yōu)度R2呈上升趨勢(shì)。決策樹(shù)最大深度增加至14時(shí),決策樹(shù)的葉子節(jié)點(diǎn)為單一出行時(shí)段,不再繼續(xù)生成決策樹(shù),R2停止增長(zhǎng)。此時(shí)出發(fā)時(shí)段選擇擬合優(yōu)度為0.417,返程時(shí)段選擇擬合優(yōu)度為0.324,表明該模型對(duì)出行時(shí)段選擇具有較好的擬合效果。
圖5 R2-決策樹(shù)最大深度折線圖
針對(duì)上述出行時(shí)段選擇模型,通過(guò)對(duì)決策樹(shù)進(jìn)行剪枝避免出現(xiàn)過(guò)擬合現(xiàn)象。將樣本數(shù)據(jù)按7∶3的比例劃分為訓(xùn)練集和測(cè)試集,采用后剪枝方法,在建立決策樹(shù)后由下而上提高模型穩(wěn)健性。剪枝后評(píng)估標(biāo)準(zhǔn)包含精確度Mprecision、召回率Rrecall及F1分?jǐn)?shù)。假設(shè)測(cè)試集中出行時(shí)段可分為時(shí)段A和時(shí)段B,則出行時(shí)段分類評(píng)估參數(shù)見(jiàn)表8,其中:TS與TO代表算法預(yù)測(cè)時(shí)段與實(shí)際出行時(shí)段一致,分別為A類和B類;FO代表算法預(yù)測(cè)時(shí)段為B,實(shí)際出行時(shí)段為A;FS代表算法預(yù)測(cè)時(shí)段為A,實(shí)際出行時(shí)段為B。TS、FO、FS、TO共同決定剪枝后模型的評(píng)估標(biāo)準(zhǔn)。
表8 出行時(shí)刻分類評(píng)估參數(shù)
精確度反映預(yù)測(cè)結(jié)果中預(yù)測(cè)正確的比例,按式(10)計(jì)算。召回率反映原樣本數(shù)據(jù)中被正確預(yù)測(cè)的比例,按式(11)計(jì)算。F1分?jǐn)?shù)用于平衡精確度與召回率,按式(12)計(jì)算,F1越接近1,模型的穩(wěn)健性越強(qiáng)。
(10)
(11)
(12)
式中:QTS、QTO為算法預(yù)測(cè)時(shí)段與實(shí)際出行時(shí)段一致的樣本數(shù);QFO為算法預(yù)測(cè)時(shí)段為B,實(shí)際出行時(shí)段為A的樣本數(shù);QFS為算法預(yù)測(cè)時(shí)段為A,實(shí)際出行時(shí)段為B的樣本數(shù)。
利用剪枝后的決策樹(shù)模型重新訓(xùn)練測(cè)試集,得到表9所示出行時(shí)段選擇。由表9可知:剪枝后的決策樹(shù)模型擬合精確度和召回率的加權(quán)平均值均不小于0.70,且F1分?jǐn)?shù)分別為0.70、0.71,表明該模型可以平穩(wěn)預(yù)測(cè)出行時(shí)段選擇,且精確度較高。
調(diào)整高速公路免費(fèi)政策,將全天免費(fèi)改為分時(shí)段免費(fèi),收費(fèi)標(biāo)準(zhǔn)與既有政策一致。采用場(chǎng)景仿真法設(shè)計(jì)不同收費(fèi)組合并進(jìn)行仿真分析,對(duì)比不同場(chǎng)景下各時(shí)段出行比例的變化??紤]到出行的連續(xù)性和時(shí)段劃分的一致性,將每日以3 h為一時(shí)間段分成8組,并依據(jù)日升、日中、日落劃分6種免費(fèi)時(shí)段。免費(fèi)場(chǎng)景設(shè)計(jì)如下:場(chǎng)景1為在節(jié)假日期間對(duì)所有時(shí)段均收費(fèi);場(chǎng)景2、場(chǎng)景3分別表示在白天和夜間收費(fèi);場(chǎng)景4、場(chǎng)景5、場(chǎng)景6在場(chǎng)景2的基礎(chǔ)上對(duì)時(shí)段進(jìn)行進(jìn)一步劃分,分別在6:00—12:00、9:00—15:00、12:00—18:00 3個(gè)時(shí)段收費(fèi)(見(jiàn)圖6)。
表9 剪枝決策樹(shù)分類結(jié)果
圖6 免費(fèi)場(chǎng)景設(shè)計(jì)
根據(jù)模型優(yōu)化結(jié)果,選擇擬合優(yōu)度較高且最大深度為14的剪枝后決策樹(shù)模型,以既有節(jié)假日政策為參考場(chǎng)景,結(jié)合圖6中各免費(fèi)場(chǎng)景,改變模型屬性即免費(fèi)政策的特征值進(jìn)行仿真分析。根據(jù)仿真結(jié)果統(tǒng)計(jì)不同場(chǎng)景各時(shí)段出行比例,通過(guò)最大出行比例反映集中出行狀況,結(jié)果見(jiàn)表10。
最大比例可反映對(duì)應(yīng)場(chǎng)景的集中出行狀況。由表10可知:不同收費(fèi)時(shí)段的影響不同,單一的免費(fèi)政策無(wú)法確保減少最大出行比例。例如在場(chǎng)景6中對(duì)12:00—18:00時(shí)段(組合5、6)收費(fèi),更多的出行者選擇在其他時(shí)段出行,導(dǎo)致最大出行比例增加。綜合出發(fā)和返程場(chǎng)景下最大出行比例,場(chǎng)景2下集中出行現(xiàn)象最少。
表10 不同場(chǎng)景下最大出行比例
結(jié)合圖1、圖2,選擇集中出行人數(shù)最多的5月1日和5月3日對(duì)場(chǎng)景2各時(shí)段出行比例進(jìn)行統(tǒng)計(jì),結(jié)果見(jiàn)圖7。
圖7 場(chǎng)景2出行時(shí)段選擇比例
由圖7可知:出行選擇比例最大的時(shí)段為6:00—9:00。與參考場(chǎng)景相比,由于白天對(duì)高速公路車輛進(jìn)行收費(fèi),選擇夜間出行的人數(shù)增多,高峰小時(shí)出行比例下降。因此,節(jié)假日期間在6:00—18:00時(shí)段對(duì)高速公路進(jìn)行收費(fèi),并對(duì)夜間其余時(shí)段免費(fèi)通行,可有效緩解因集中出行導(dǎo)致的交通擁堵。
把握出行時(shí)段選擇特征是制定和評(píng)價(jià)節(jié)假日高速公路免費(fèi)通行政策的重要前提。本文通過(guò)構(gòu)建基于決策樹(shù)算法的出行時(shí)段選擇模型,利用場(chǎng)景仿真法討論不同免費(fèi)時(shí)段對(duì)集中出行的影響。結(jié)果表明,節(jié)假日高速公路免費(fèi)通行政策對(duì)出行選擇具有顯著影響,導(dǎo)致高速公路交通量增加和潮汐出行;基于決策樹(shù)的出行時(shí)段選擇模型可以綜合考慮免費(fèi)政策、出行者屬性和出行選擇屬性,較好地?cái)M合出行決策;不同收費(fèi)時(shí)段的影響差異較大,在6:00—18:00時(shí)段對(duì)高速公路進(jìn)行收費(fèi)可以有效減少集中出行。
該模型主要對(duì)免費(fèi)時(shí)段進(jìn)行討論,缺少對(duì)交通方式及出行距離的聯(lián)合分析??删C合考慮不同里程收費(fèi)對(duì)交通方式分擔(dān)率的影響,更全面地分析節(jié)假日高速公路免費(fèi)通行政策的優(yōu)化方向。