曹 潔,孫兆軍,張 紅,2,陳作漢,2,侯 亮,2
(1.蘭州理工大學(xué) 計(jì)算機(jī)與通信學(xué)院,甘肅 蘭州 730050;2.甘肅省城市軌道交通智能運(yùn)營(yíng)工程研究中心,甘肅 蘭州 730050;3.甘肅省制造業(yè)信息化工程研究中心,甘肅 蘭州 730050)
在智能交通系統(tǒng)中,建立準(zhǔn)確穩(wěn)定的交通流參數(shù)模型是實(shí)現(xiàn)智能交通誘導(dǎo)與控制的關(guān)鍵[1]。交通流參數(shù)模型通常以描述交通流運(yùn)行特性的三個(gè)參數(shù)(速度、流量和密度)為基礎(chǔ),考慮到交通流數(shù)據(jù)統(tǒng)計(jì)時(shí)間尺度的不同,交通流序列因受到各種復(fù)雜因素的影響,表現(xiàn)出較強(qiáng)的非線性和時(shí)空特性。因此,分析交通流在不同時(shí)間尺度下的特性,揭示交通流特性參量間的相互關(guān)系和內(nèi)在時(shí)空演變規(guī)律,可為完善交通流理論、進(jìn)行交通狀態(tài)識(shí)別提供科學(xué)依據(jù)和理論支撐。
對(duì)于交通流時(shí)間序列的分析主要有:數(shù)理統(tǒng)計(jì)方法、機(jī)器學(xué)習(xí)方法、可視圖方法以及復(fù)雜網(wǎng)絡(luò)方法[2]。針對(duì)交通流參數(shù)模型的研究,國(guó)外起步較早,從格林希爾治提出的第一個(gè)速度—密度關(guān)系模型開始,學(xué)者基于此模型進(jìn)行了大量的探索研究。這些研究大體上可分為三類:1)研究基于“車輛跟馳模型”建立Aw-Rascle交通流模型,并對(duì)模型的關(guān)鍵參數(shù)進(jìn)行了估計(jì)[3,4];2)研究混合、異質(zhì)交通條件下的交通流模型[5~7];3)研究約束條件下的交通流參數(shù)模型[8,9]。這些研究發(fā)現(xiàn),已有的關(guān)系模型無(wú)法準(zhǔn)確表示所有的交通狀態(tài),例如交通流在自由流狀態(tài)和擁擠態(tài)下的運(yùn)行特性以及參數(shù)關(guān)系均存在較大差異。
本文采用Lempel-Ziv算法計(jì)算不同時(shí)間尺度下交通流時(shí)間序列的復(fù)雜度,利用相關(guān)性分析方法,探索了交通流在時(shí)間和空間上的相關(guān)性。并針對(duì)現(xiàn)有的單段函數(shù)模型無(wú)法準(zhǔn)確表征不同交通狀態(tài)下交通流參數(shù)關(guān)系的問題,提出了一種二階段交通流參數(shù)關(guān)系模型。
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于美國(guó)加州交通局運(yùn)行監(jiān)測(cè)系統(tǒng)(performance measurement system,PeMS),選取地點(diǎn)為美國(guó)加州洛杉磯市編號(hào)為US101-N的高速公路,選取檢測(cè)站編號(hào)為VDS769403,VDS 717484和VDS 769388,數(shù)據(jù)的時(shí)間跨度為2018年7月到10月,實(shí)時(shí)采集的時(shí)間間隔為30 s,經(jīng)過(guò)PeMS系統(tǒng)整合得到時(shí)間間隔為5,15,30,60的交通流數(shù)據(jù),每個(gè)檢測(cè)站記錄了該高速公路4個(gè)車道的交通流量、速度和占有率等數(shù)據(jù)。
本文將Lempel-Ziv算法[10]引入到交通流時(shí)間序列復(fù)雜度計(jì)算中,Lempel-Ziv算法的步驟如下:
Step1 給定一個(gè)包含n個(gè)元素的時(shí)間序列(y1,y2,…,yn),則可以按照以下規(guī)則重構(gòu)一個(gè)符號(hào)序列(s1s2…sn):如果yi>y(其中,y表示時(shí)間序列的平均值),si=1;否則,si=0,因此,序列{s1s2…sn}是一個(gè)0-1符號(hào)序列。
Step2 定義變量c(n)為符號(hào)序列(s1s2…sn)的復(fù)雜度,S和Q分別為兩個(gè)不同的符號(hào)序列,SQ表示S,Q兩個(gè)符號(hào)序列相加組成的總符號(hào)序列,SQπ表示刪去SQ中最后一個(gè)字符所得的符號(hào)序列,ν(SQπ)定義為SQπ的所有子序列集合。
Step3 初始化c(n)=1,{s1}=1,{s2}=1,S=1和Q=1,因此SQπ={s1}。假設(shè)S={s1s2…sr},Q={sr+1},若Q∈ν(SQπ),則符號(hào)序列Q是{s1s2…sr}的一個(gè)子序列,因此,復(fù)雜度值保持不變,只將Q更新為{sr+1sr+2},再判斷Q是否屬于ν(SQπ)(符號(hào)序列SQπ也被更新),重復(fù)上面的步驟,直到Q?ν(SQπ),然后,將c(n)值加1,讀取下一個(gè)字符并取Q={Sr+3}。
Step4 重復(fù)以上步驟,直到符號(hào)序列{s1s2…sr}中的所有元素都被計(jì)算到,則得到的c(n)是給定時(shí)間序列的復(fù)雜度。
Step5 根據(jù)Lempel-Ziv算法,定義歸一復(fù)雜測(cè)度為
CN(n)=c(n)/b(n)∈[0,1]
(1)
(2)
使用L-Z算法計(jì)算不同時(shí)間尺度下的交通流時(shí)間序列復(fù)雜度值。如圖1所示,5 min數(shù)據(jù)的樣本總?cè)萘繛? 640,其CN值在21天后大約在0.210;15 min數(shù)據(jù)的樣本總?cè)萘繛? 840,其CN值在36天后大約為0.195;30 min數(shù)據(jù)的樣本總?cè)萘繛? 496,其CN值在42天后大約為0.200;60 min數(shù)據(jù)的樣本總?cè)萘繛? 440,其CN值在55天后大約為0.190;可見,5 min時(shí)間尺度的交通流序列的復(fù)雜度高于其他時(shí)間尺度的復(fù)雜度,對(duì)于交通流時(shí)間序列,不同時(shí)間尺度的交通流數(shù)據(jù)具有不同的復(fù)雜度值。通過(guò)以上復(fù)雜度計(jì)算的分析表明,小時(shí)間尺度的數(shù)據(jù)表現(xiàn)出較為明顯地波動(dòng)性和隨機(jī)性,其復(fù)雜度較大;隨著時(shí)間尺度變大,數(shù)據(jù)逐漸平滑,其削弱了隨機(jī)性、降低了復(fù)雜度。
圖1 不同時(shí)間尺度下的交通流復(fù)雜度
交通系統(tǒng)是一個(gè)相對(duì)較封閉的復(fù)雜系統(tǒng),交通流數(shù)據(jù)是典型的時(shí)空大數(shù)據(jù),具有不同于其他時(shí)間序列的特征。表現(xiàn)在時(shí)間上,下一時(shí)刻的交通流可以看作是前一時(shí)刻數(shù)據(jù)在特定規(guī)律下的延續(xù);表現(xiàn)在空間上,交通流數(shù)據(jù)受上下游和相鄰車道交通狀態(tài)的影響而呈現(xiàn)出較強(qiáng)的相關(guān)性,如某一車道的交通流數(shù)據(jù)不僅與同一車道上、下游截面的數(shù)據(jù)有關(guān),還與同一截面不同車道的數(shù)據(jù)存在相關(guān)性。通常用相關(guān)性理論中的皮爾遜相關(guān)系數(shù)(下面簡(jiǎn)稱R系數(shù))來(lái)描述交通流的時(shí)空相關(guān)性,如式(3)所示
(3)
交通流時(shí)間序列包括橫向時(shí)間序列和縱向時(shí)間序列,縱向時(shí)間序列相關(guān)性反映了交通流數(shù)據(jù)的長(zhǎng)期趨勢(shì)性,通常特定區(qū)域內(nèi)具有較穩(wěn)定的活動(dòng)模式和規(guī)律性,導(dǎo)致不同周內(nèi)相同時(shí)間的交通流具有較強(qiáng)的相關(guān)性。
采用編號(hào)VDS 717484檢測(cè)站連續(xù)5個(gè)周一5∶00~17∶00的交通數(shù)據(jù),時(shí)間間隔為15 min,分析交通流的縱向時(shí)間相關(guān)性,交通流數(shù)據(jù)趨勢(shì)圖如圖2所示。
圖2 VDS717484檢測(cè)站連續(xù)5個(gè)周一交通數(shù)據(jù)趨勢(shì)
由圖可見,交通流縱向時(shí)間序列數(shù)據(jù)具有較強(qiáng)的相關(guān)性,同一時(shí)刻不同日期的交通流數(shù)據(jù)相差不大且時(shí)間序列的變化趨勢(shì)大致一致。為定量描述交通流縱向時(shí)間序列數(shù)據(jù)的相關(guān)性,表1給出了連續(xù)5個(gè)周一交通流數(shù)據(jù)的相關(guān)性矩陣,由表可見,時(shí)間序列之間的相關(guān)系數(shù)均在0.96以上,說(shuō)明兩者之間具有較強(qiáng)的相關(guān)性。
表1 連續(xù)5個(gè)周一交通流數(shù)據(jù)的相關(guān)性
交通流數(shù)據(jù)的空間相關(guān)性包括橫向空間相關(guān)性和縱向空間相關(guān)性。圖3分別給出了同一檢測(cè)截面不同車道的交通流數(shù)據(jù)趨勢(shì)圖和同一車道不同檢測(cè)截面的交通流量趨勢(shì)圖。
圖3 交通流空間趨勢(shì)
典型的交通流參數(shù)關(guān)系模型主要可分為兩類:?jiǎn)味文P秃投喽文P停瑔味文P褪侵甘褂脝我坏暮瘮?shù)來(lái)表示參數(shù)之間的關(guān)系;而多段模型主要是考慮在不同的交通運(yùn)行狀態(tài)下,交通流各參數(shù)關(guān)系之間表現(xiàn)出不同的函數(shù)形式。經(jīng)典的單段模型主要有:Greenshields模型、Underwood模型、Pipes模型和三參數(shù)邏輯(three-parameter logistic,3PL)模型等[11],其函數(shù)表達(dá)式如表2所示。
表2 單段函數(shù)模型關(guān)系式
單段函數(shù)模型結(jié)構(gòu)簡(jiǎn)單,且與實(shí)際的交通流狀態(tài)存在較大的差異,主要不足有兩個(gè)方面:1)僅用單一函數(shù)形式描述交通流參數(shù)之間的整體關(guān)系,當(dāng)交通狀態(tài)發(fā)生轉(zhuǎn)變時(shí),通常不能較準(zhǔn)確地表示各狀態(tài)下的交通流參數(shù)關(guān)系。2)對(duì)于大量交通數(shù)據(jù)表現(xiàn)出的時(shí)間序列趨勢(shì)特征,單段模型通常顯示出無(wú)限大的自由流速度和阻塞密度,這與實(shí)際的交通情況是不相符的?;诖?,本文基于3PL模型提出一種二階段交通流參數(shù)模型,模型的函數(shù)表達(dá)式如式(4)所示,運(yùn)用交通流基本參數(shù)關(guān)系式q=k·v可以推導(dǎo)出速度—密度和流量—速度關(guān)系式
(4)
式中vf為自由流速度,kj為阻塞密度,km為臨界密度,vm為臨界速度。
為了驗(yàn)證本文提出的二階段交通流模型的性能,選擇VDS769403、VDS 717484和VDS 769388三個(gè)檢測(cè)站采集到的數(shù)據(jù)進(jìn)行模型有效性測(cè)試。選取道路各車道流量最大時(shí)所對(duì)應(yīng)的密度作為臨界密度,則臨界密度km依次為30.18,27.80,34.28 veh/km,采用非線性最小二乘法分別對(duì)Greenshields模型(GS模型)、Underwood模型(UW模型)、Pipes模型、3PL模型和本文模型擬合流量—密度關(guān)系,擬合結(jié)果如圖4所示。
圖4 各檢測(cè)站流量—密度關(guān)系擬合結(jié)果
在模型性能評(píng)價(jià)時(shí),通常采用相關(guān)系數(shù)(R2)和標(biāo)準(zhǔn)誤差(RMSE)對(duì)模型的適用性進(jìn)行評(píng)價(jià),二者的計(jì)算公式為
(5)
(6)
分別使用5種模型對(duì)采集的交通流數(shù)據(jù)進(jìn)行測(cè)試,對(duì)于每一個(gè)檢測(cè)站采集的數(shù)據(jù),不同的模型產(chǎn)生不同的擬合結(jié)果。通過(guò)統(tǒng)計(jì)分析,圖5給出了5種參數(shù)模型的相關(guān)系數(shù)和標(biāo)準(zhǔn)誤差對(duì)比。模型的標(biāo)準(zhǔn)差越小,表明模型參數(shù)標(biāo)定魯棒性越高,模型的適用性也越好。由圖可見,本文的流量—密度關(guān)系模型擬合三個(gè)檢測(cè)站交通數(shù)據(jù)所對(duì)應(yīng)的R2均最大,分別為0.960,0.976和0.978,標(biāo)準(zhǔn)誤差相比3PL模型有所減小,表明本文模型的擬合性能優(yōu)于其他4種模型。
圖5 5種模型性能對(duì)比
1)采用動(dòng)力學(xué)中的Lempel-Ziv算法計(jì)算了不同時(shí)間尺度交通流序列的復(fù)雜度值,結(jié)果表明,小時(shí)間尺度的交通流時(shí)間序列具有較強(qiáng)的波動(dòng)性和隨機(jī)性;在一定的時(shí)間序列長(zhǎng)度內(nèi),其復(fù)雜度趨于一個(gè)穩(wěn)定的值。
2)將相關(guān)性理論引入到交通流時(shí)空特性分析中,采用皮爾遜相關(guān)系數(shù)計(jì)算方法,定量描述了交通流在時(shí)間相關(guān)性,揭示了交通流序列具有較強(qiáng)的時(shí)空相關(guān)特性。
3)基于3PL模型提出了一種二階段交通流參數(shù)關(guān)系模型。采用非線性最小二乘法,運(yùn)用5種交通流參數(shù)模型對(duì)流量—密度關(guān)系進(jìn)行擬合和標(biāo)定參數(shù),對(duì)比發(fā)現(xiàn),本文模型的擬合標(biāo)準(zhǔn)誤差最小,表明本文模型可實(shí)現(xiàn)對(duì)交通流參數(shù)關(guān)系的準(zhǔn)確擬合。
在后續(xù)的研究中,需考慮多區(qū)域路網(wǎng)的交通流數(shù)據(jù)進(jìn)行特性分析,驗(yàn)證模型在不同環(huán)境、不同數(shù)據(jù)集下的適用性和魯棒性,為交通運(yùn)行狀態(tài)分析和短時(shí)預(yù)測(cè)提供理論支撐。