林 娜,王 純
(沈陽航空航天大學(xué) 計(jì)算機(jī)學(xué)院,遼寧 沈陽110136)
交通誘導(dǎo)系統(tǒng)作為智能交通的重要組成部分,其關(guān)鍵作用在于:當(dāng)路網(wǎng)中的交通流量分布不均、局部出現(xiàn)擁堵時(shí),根據(jù)實(shí)時(shí)交通信息制定有效的動(dòng)態(tài)路徑誘導(dǎo)策略,對(duì)交通流進(jìn)行合理的誘導(dǎo)與分配。在交通誘導(dǎo)系統(tǒng)中引入博弈論的思想,有利于分析和理解交通管理者與路網(wǎng)出行者之間利益沖突,從而對(duì)其行為做出準(zhǔn)確的判斷與預(yù)測(cè)、發(fā)布有效的實(shí)時(shí)交通誘導(dǎo)信息、合理地對(duì)交通流做出誘導(dǎo)與分配,緩解交通運(yùn)輸壓力,提高路網(wǎng)運(yùn)輸質(zhì)量。
出行者在使用路網(wǎng)的過程中,如果沒有獲取實(shí)時(shí)交通信息的渠道,則過往的出行路徑、行駛時(shí)間等歷史經(jīng)驗(yàn)和對(duì)周圍環(huán)境的感知會(huì)成為其選擇路徑的主要依據(jù)[1,2]。但在具備ATIS的交通管理系統(tǒng)中,出行者可以接收到系統(tǒng)提供的實(shí)時(shí)交通誘導(dǎo)信息,再結(jié)合歷史經(jīng)驗(yàn)對(duì)交通狀況做出更準(zhǔn)確的判斷[3]。Ben-Elia等人在實(shí)驗(yàn)中向參與者提供出行中的動(dòng)態(tài)路徑誘導(dǎo)信息,實(shí)驗(yàn)結(jié)果表明,接收到動(dòng)態(tài)信息的出行者在短期內(nèi)傾向于選擇更短但高風(fēng)險(xiǎn)的路徑[4]。Chorus等人應(yīng)用貝葉斯方法和數(shù)值仿真表明,出行者對(duì)誘導(dǎo)信息的服從程度與感知到的信息可信度和各備選路徑之間的旅行時(shí)間差有關(guān)[5]。Waller等人在動(dòng)態(tài)用戶最優(yōu)問題中引入了多項(xiàng)式組合優(yōu)化算法來研究動(dòng)態(tài)交通分配[6]。W.Y.Szeto提出了兩種合作博弈構(gòu)想來決定出行費(fèi)用可靠性:Stackelberg-Nash方程和部分合作納什方程,并指出經(jīng)典的博弈論方法可能高估了路網(wǎng)/O-D對(duì)的出行費(fèi)用可靠性[7]。周元峰等人提出了交通事件下變換信息供給策略的交通流誘導(dǎo)模型,引入博弈的思想來協(xié)調(diào)系統(tǒng)與用戶之間的利益沖突,并利用雙層規(guī)劃求解信息供給策略[8]。袁長偉等人建立了一種基于Stackelberg博弈的路網(wǎng)均衡交通分配方法,在系統(tǒng)中利用廣義乘子法求解了提高交通系統(tǒng)效率的誘導(dǎo)策略[9]。
本文提出的基于Stackekberg-Logit博弈的交通誘導(dǎo)模型中,應(yīng)用了出行時(shí)間、出行距離和出行經(jīng)濟(jì)費(fèi)用這3種評(píng)價(jià)指標(biāo)來求解出行費(fèi)用;引入了改進(jìn)的Logit模型來求解路徑選擇概率使得出行者的路徑選擇行為更符合實(shí)際;在求解最優(yōu)路徑時(shí)添加了繞行檢測(cè)機(jī)制以避免路網(wǎng)中產(chǎn)生“過度繞行”現(xiàn)象;在仿真實(shí)驗(yàn)中應(yīng)用了滾動(dòng)時(shí)域Rolling Horizon方法來保證交通狀況的時(shí)變性,引入了交通需求加載系數(shù)來實(shí)現(xiàn)不確定的交通需求;最后在中型路網(wǎng)Sioux-Falls network上驗(yàn)證了博弈模型的正確性與有效性。
博弈論假設(shè)博弈局中人都是 “理性的”,則作為博弈一方的路網(wǎng)出行者追求自身出行費(fèi)用最小,而作為博弈另一方的交通管理者追求路網(wǎng)總的出行費(fèi)用最小。雙方的利益沖突體現(xiàn)在:出行者選擇的路徑,并不一定能滿足交通管理者的誘導(dǎo)要求,而交通管理者發(fā)布的實(shí)時(shí)交通誘導(dǎo)信息,可能會(huì)使路網(wǎng)上一部分出行者過度繞行。由此可以構(gòu)造一個(gè)多階段Stackelberg博弈,交通管理者作為博弈的領(lǐng)導(dǎo)者,以系統(tǒng)最優(yōu) (system optimum,SO)為原則發(fā)布誘導(dǎo)信息,路網(wǎng)出行者作為跟從者,以用戶均衡 (user equilibrium,UE)為原則做出路徑選擇。系統(tǒng)最優(yōu)原則是指在考慮交通擁擠對(duì)出行費(fèi)用產(chǎn)生影響的網(wǎng)絡(luò)中,應(yīng)按照總出行費(fèi)用最小為依據(jù)來分配交通流;而用戶均衡是指,在分配交通流時(shí)遵循每個(gè)出行者自身出行費(fèi)用最小的原則,若出行者試圖改變路徑只會(huì)增大其出行費(fèi)用。在交通誘導(dǎo)研究中引入Stackelberg博弈,能在更接近真實(shí)路網(wǎng)交通狀態(tài)的條件下,以優(yōu)化路網(wǎng)交通質(zhì)量為目標(biāo),以求解系統(tǒng)最優(yōu)與用戶均衡之間的某種平衡狀態(tài)為方法,對(duì)城市路網(wǎng)交通問題進(jìn)行研究。
理論上,出行者選擇某條路徑的概率與該條路徑的期望出行費(fèi)用最小的概率相等。但這樣要求出行者對(duì)路網(wǎng)狀態(tài)有充分及時(shí)的掌握,并對(duì)路網(wǎng)數(shù)據(jù)進(jìn)行準(zhǔn)確的分析與計(jì)算,這種情況很難在實(shí)際中出現(xiàn)。因此,本文在Stackelberg博弈模型中引入了改進(jìn)Logit模型來求解路徑選擇概率,構(gòu)造了交通管理者與路網(wǎng)出行者之間的Stackekberg-Logit博弈模型,其數(shù)學(xué)表示如下
式 (1)從交通管理者的角度出發(fā),求解路網(wǎng)系統(tǒng)總出行費(fèi)用最小的交通流誘導(dǎo)策略,式 (2)保證了路網(wǎng)上的交通流分布守恒,式 (3)即為求解各路徑選擇概率的改進(jìn)Logit模型,式中參數(shù)k為路徑選擇策略對(duì)效用差異的敏感程度。博弈模型研究的是路網(wǎng)上的交通流狀況,因此需要建立基本的路網(wǎng)加載模型
式中,minZ(t)表示截止到時(shí)刻T路網(wǎng)系統(tǒng)最小的總出行費(fèi)用,(t)為t時(shí)刻從起點(diǎn)r到終點(diǎn)s間的路徑p上的車輛出發(fā)率;(t)為t時(shí)刻從起點(diǎn)r到終點(diǎn)s間的路徑p上的出行費(fèi)用;Drs(t)為t時(shí)刻O-D對(duì) (r,s)間的交通需求;(t)為t時(shí)刻從起點(diǎn)r到終點(diǎn)s間的路徑p被O-D對(duì) (r,s)間的出行者選中的概率;(t)為O-D對(duì) (r,s)間的路徑p上的出行時(shí)間;(t)為t時(shí)刻O-D對(duì) (r,s)間的路徑p上的路段a上的出行者總量;(t)為t時(shí)刻O-D對(duì)(r,s)間的路徑p上的路段a上的車輛流入率;(t)為t時(shí)刻O-D對(duì) (r,s)間的路徑p上的路段a上的車輛流出率;(t)為截止到時(shí)刻T,在O-D對(duì) (r,s)間的路徑p上進(jìn)入路段a的出行者總量(t)為截止到時(shí)刻T,在OD對(duì) (r,s)間的路徑p上離開路段a的出行者總量;A(r)為所有以節(jié)點(diǎn)r為起點(diǎn)的路段集合;vmax為路段飽和流出率。
博弈過程從交通管理者開始,作為博弈的領(lǐng)導(dǎo)者,交通管理者首先對(duì)路網(wǎng)上的實(shí)時(shí)交通狀況做出分析,預(yù)測(cè)路網(wǎng)出行者的可能出行路線,依照系統(tǒng)最優(yōu)的原則,根據(jù)式(1)求解路網(wǎng)最優(yōu)交通流分布和系統(tǒng)最優(yōu)原則下的誘導(dǎo)策略,并將誘導(dǎo)信息發(fā)布到整個(gè)路網(wǎng)。而作為博弈的跟從者,路網(wǎng)出行者接收到實(shí)時(shí)誘導(dǎo)信息之后,會(huì)根據(jù)自己的出行經(jīng)驗(yàn)、對(duì)周圍環(huán)境的感知結(jié)合誘導(dǎo)信息做出路徑?jīng)Q策,由式 (3)求解出行者服從誘導(dǎo)信息的概率,再由式 (2)量化全體出行者的路徑選擇,并加載到整個(gè)路網(wǎng)上,路網(wǎng)狀態(tài)信息隨之更新。博弈過程重復(fù)進(jìn)行,當(dāng)交通管理者的誘導(dǎo)策略與路網(wǎng)出行者的選擇策略趨于一致時(shí),路網(wǎng)交通狀況達(dá)到均衡狀態(tài),博弈過程也達(dá)到均衡。
現(xiàn)實(shí)中的交通需求和路網(wǎng)狀況的時(shí)變性很強(qiáng),因此,本文引入了交通需求加載系數(shù) (loading factor,LF),意為某一仿真周期中的交通需求與初始交通需求的比值。在仿真實(shí)驗(yàn)中交通需求以O(shè)-D矩陣的形式表示,LF則是它的系數(shù),因而隨著LF的增大,路網(wǎng)上出行者數(shù)量增加,交通狀況趨于擁擠。同時(shí),本文借鑒了由Mahmassani提出的Rolling Horizon方法[10],即假設(shè)交通管理者只能獲取未來一段時(shí)間 (稱為滾動(dòng)周期rolling period)內(nèi)的交通需求和路網(wǎng)狀況,且這些信息在此周期內(nèi)保持不變,當(dāng)一個(gè)滾動(dòng)周期結(jié)束后,才能繼續(xù)獲取下一滾動(dòng)周期的動(dòng)態(tài)交通信息。在每一滾動(dòng)周期內(nèi)根據(jù)該周期的交通需求和路網(wǎng)狀況等信息完成一次博弈模型的仿真實(shí)驗(yàn),則多個(gè)滾動(dòng)周期過后,整個(gè)路網(wǎng)模型的動(dòng)態(tài)性更強(qiáng),所得實(shí)驗(yàn)結(jié)果也更為準(zhǔn)確。算法具體步驟如下:
(1)數(shù)據(jù)初始化,設(shè)置迭代計(jì)數(shù)器n=0,迭代次數(shù)上限N,獲取初始條件下路網(wǎng)中的交通流分布情況和每一路段的出行時(shí)間τa(t);
(2)載入當(dāng)前滾動(dòng)周期的交通需求Drs(t),考慮預(yù)計(jì)出行時(shí)間τa(t)、出行距離、出行經(jīng)濟(jì)花費(fèi)計(jì)算各O-D對(duì)之間可行路徑的出行費(fèi)用Crsp(t);
(3)由式 (1)求得系統(tǒng)最優(yōu)誘導(dǎo)策略hrsp(t),即每一O-D對(duì)各可行路徑上的交通流分布,根據(jù)該誘導(dǎo)策略計(jì)算各路段相應(yīng)的出行者數(shù)量Xa(t)和各路段上的預(yù)計(jì)出行時(shí)間τa(t);
(4)τa(t)更新后重新計(jì)算 Crsp(t),再由式 (3)和式(2)求得每一O-D對(duì)的出行者的路徑選擇概率prsp(t)和路網(wǎng)上的實(shí)際流量分布h'rsp(t);
(5)按照h'rsp(t)將車流量分配到整個(gè)路網(wǎng)上,對(duì)路網(wǎng)數(shù)據(jù)進(jìn)行更新,得到實(shí)際的各路段上的出行者數(shù)量X′a(t)和各路段上的旅行時(shí)間τ′a(t);
本文在仿真實(shí)驗(yàn)中應(yīng)用的路網(wǎng)結(jié)構(gòu)是在交通誘導(dǎo)研究中廣泛應(yīng)用的Sioux-Falls網(wǎng)絡(luò),如圖1所示。它是一個(gè)由24個(gè)節(jié)點(diǎn)、76條邊和528個(gè)O-D對(duì)組成的中型路網(wǎng),應(yīng)用在該路網(wǎng)上的路段參數(shù) (路段長度、路段容量等)以及初始條件下的輸入數(shù)據(jù) (交通需求O-D矩陣、自由流旅行時(shí)間等)均引自文獻(xiàn) [11]。為了驗(yàn)證本文所提出模型的正確性與有效性,分別對(duì)3種不同的交通誘導(dǎo)原則建立數(shù)學(xué)模型并在微觀交通仿真軟件VISSIM接口VC6.0的仿真平臺(tái)下進(jìn)行實(shí)驗(yàn)。首先是遵循用戶均衡原則的交通誘導(dǎo)模型UE,其中出行者的路徑選擇行為不受交通管理者的影響,總是選擇當(dāng)前條件下的最優(yōu)路徑;其次是遵循系統(tǒng)最優(yōu)原則的交通誘導(dǎo)模型SO,其中出行者的路徑選擇行為完全服從交通管理者的誘導(dǎo)信息;最后是本文提出的基于Stackelberg-Logit博弈的交通誘導(dǎo)模型S-LGM,其中出行者與交通管理者之間通過進(jìn)行多階段Stackelberg博弈來求解一種雙贏局面。
在仿真實(shí)驗(yàn)中,通過調(diào)整LF的數(shù)值來實(shí)現(xiàn)路網(wǎng)交通狀況由暢通 (LF1.0)到飽和 (LF2.0)到擁堵 (LF3.0)的漸變過程,并對(duì)不同擁堵程度下3種交通誘導(dǎo)模型的求解結(jié)果做出分析與比較。實(shí)驗(yàn)中滾動(dòng)時(shí)域總時(shí)長100分鐘,每一滾動(dòng)周期時(shí)長5分鐘。式 (3)中改進(jìn)Logit模型的參數(shù)k取值3.5,即路徑選擇概率對(duì)路網(wǎng)交通狀況的敏感度適中。S-LGM中的繞行檢測(cè)參數(shù)取值2.0,即針對(duì)同一O-D對(duì)求解的新路徑與原路徑長度比值大于或等于2.0時(shí)認(rèn)為發(fā)生繞行,拒絕新路徑。迭代次數(shù)上限N=100。試驗(yàn)所用硬件環(huán)境:聯(lián)想系列電腦,處理器:Intel(R)Pentium(R)Dual CPU E2180@2.0GHz;內(nèi)存:2.0GB。
3種交通誘導(dǎo)模型,求解的結(jié)果如圖2~圖5所示。各圖中橫軸均為交通需求加載系數(shù)LF,縱軸分別為路網(wǎng)中所有出行車輛的總出行距離 (km)、總出行時(shí)間 (h)、總出行延遲 (h)和平均車速 (km/h)。
從實(shí)驗(yàn)結(jié)果圖中可以看出,初始條件下,路網(wǎng)上車流暢通,3種誘導(dǎo)策略所求得的結(jié)果趨于一致,隨著LF的增大,交通需求量增加,路網(wǎng)逐漸擁擠,各誘導(dǎo)策略的求解結(jié)果之間的差別也增大。當(dāng)LF<2.0時(shí),路網(wǎng)中各評(píng)價(jià)指標(biāo)的數(shù)值隨著LF的增大而明顯變化,當(dāng)LF>2.0時(shí),路網(wǎng)交通狀況逼近負(fù)載上限,因而各評(píng)價(jià)指標(biāo)的數(shù)值變化幅度減小,趨于穩(wěn)定。圖中,SO所求解的總出行時(shí)間最小、總出行延遲最小、平均車速最大,但系統(tǒng)中繞行現(xiàn)象較多,因此總出行距離較大,在交通狀況十分暢通時(shí),遵循系統(tǒng)最優(yōu)原則的誘導(dǎo)模型作用最大。相比之下,UE所求解的總出行時(shí)間最大、總出行延遲最大、平均車速最小,但因出行者總是 “自私地”選擇出行費(fèi)用最小的路徑,因而總出行距離較小,其求解結(jié)果并不理想,但是最接近實(shí)際情況下的城市交通流分布模式。而S-LGM的求解結(jié)果總是居于上述兩者之間,是出行者與交通管理者之間博弈的結(jié)果,所求的是SO與UE之間的某種平衡狀態(tài),它不僅克服了SO過于理想化的問題,具備現(xiàn)實(shí)的可行性,而且其求解的結(jié)果也明顯優(yōu)于UE、趨于理想狀態(tài)下的解,減少了路網(wǎng)中的車輛出行時(shí)間、提高了平均車速、降低了路網(wǎng)中的等待時(shí)延。
3種交通誘導(dǎo)模型的區(qū)別進(jìn)一步體現(xiàn)在迭代收斂過程中,表1所示數(shù)據(jù)為3種模型在不同的交通狀況條件下達(dá)到收斂時(shí)的迭代次數(shù)。
表1 3種交通誘導(dǎo)模型達(dá)到收斂時(shí)的迭代次數(shù)對(duì)比
由表1可得,不同交通狀況下SO與S-LGM都可以通過一定次數(shù)的迭代達(dá)到收斂,而UE隨著路網(wǎng)擁擠程度的增加求解效率大大降低,在LF=2.0時(shí)迭代次數(shù)達(dá)到上限,收斂失敗。數(shù)據(jù)顯示,S-LGM能有效求解誘導(dǎo)策略,保證交通誘導(dǎo)效率,穩(wěn)定路網(wǎng)交通狀態(tài),即使路網(wǎng)交通流擁擠,也能快速達(dá)到收斂,降低發(fā)生交通擁堵的可能。
本文在對(duì)系統(tǒng)最優(yōu)與用戶均衡2種交通分配原則做出分析與研究之后,針對(duì)系統(tǒng)最優(yōu)原則過于理想化、用戶均衡原則誘導(dǎo)效率低等缺點(diǎn),提出了基于Stackelberg-Logit博弈的交通誘導(dǎo)模型,并通過仿真實(shí)驗(yàn)來驗(yàn)證其正確性與有效性。通過在交通誘導(dǎo)模型中引入Stackelberg博弈,實(shí)現(xiàn)了系統(tǒng)最優(yōu)與用戶均衡之間的博弈協(xié)調(diào),求解了交通管理者與路網(wǎng)出行者雙贏的結(jié)果。其求解效率遠(yuǎn)高于基于用戶均衡原則的誘導(dǎo)模型,且出行者的路徑選擇行為比基于系統(tǒng)最優(yōu)原則的誘導(dǎo)更符合實(shí)際。實(shí)驗(yàn)結(jié)果表明,該交通誘導(dǎo)模型可以有效提高交通運(yùn)輸質(zhì)量、優(yōu)化路網(wǎng)交通系統(tǒng)性能、實(shí)現(xiàn)路網(wǎng)上的車流均衡。然而,文中的路網(wǎng)出行者被當(dāng)作一個(gè)集體參與博弈過程,忽視了出行者之間因競(jìng)爭(zhēng)相同路網(wǎng)資源而產(chǎn)生的利益沖突關(guān)系,如何進(jìn)一步體現(xiàn)出行者路徑選擇的多樣性將是本文下一步工作重點(diǎn)。
[1]Chorus CG,Arentze T,Timmermans,H.Traveler compliance with advice:A Bayesian utilitarian perspective [J].Transportation Research Part E:Logistics and Transportation Review,2009,45 (3):486-500.
[2]Parvaneh Z,Arentze T,Timmermans H.A simulation model assessing impacts of advanced information and communication technologies on activity-travel patterns [J].Procedia-Social and Behavioral Sciences,2011,20:236-243.
[3]Eran Ben-Elia,Roberta Di Pace,Gennaro N,et al.The impact of travel information’s accuracy on route-choice [J].Transportation Research Part C:Emerging Technologies,2013,26:146-159.
[4]Ben-Elia E,Erev I,Shiftan Y.The combined effect of information and experience on drivers route-choice behavior [J].Transportation,2008,35 (2):165-277.
[5]Chorus CG,Arentze TA,Timmermans HJP.Traveler compliance with advice:A Bayesian utilitarian perspective [J].Transportation Research Part E,2009,45 (3):486-500.
[6]Waller S Travis,Athanasios K Ziliaskopoulos.A combinatorial user optimal dynamic traffic assignment algorithm [J].Ann Oper Res,2006,144:249-261.
[7]Szeto WY.Cooperative game approaches to measuring network reliability considering paradoxes [J].Transportation Research Part C,2011,19 (2):229-241.
[8]ZHOU Yuanfeng,ZHANG Haozhi,ZHANG Kun,et al.Research on dynamic traffic information strategy model based on game-based coordination [J].China Journal of Highway and Transport,2009,22 (1):89-96 (in Chinese).[周元峰,張好智,張琨,等.動(dòng)態(tài)交通信息策略博弈協(xié)調(diào)模型研究 [J].中國公路學(xué)報(bào),2009,22 (1):89-96.]
[9]YUAN Changwei,YU Xinxin,LU Huapu,et al.Road network equilibrium traffic assignment method based on stackelberg game [J].China Journal of Highway and Transport,2009,22 (5):89-93 (in Chinese).[袁長偉,蔚欣欣,陸化普,等.基于斯塔克伯格博弈的路網(wǎng)均衡交通分配方法 [J].中國公路學(xué)報(bào),2009,22 (5):89-93.]
[10]Burger M,Van Den Berg M,Hegyi A,et al.Considerations for model-based traffic control [J].Transportation Research Part C,2013,35:1-19.
[11]Bi Yu Chen,William HK Lam,Agachai Sumalee,et al.Vulnerability analysis for large-scale and congested road networks with demand uncertainty [J].Transportation Research Part A,2012,46 (3):501-516.