錢坤 張建 婁歡 任勇 夏婷婷
摘要:目前,城市道路交通擁堵問(wèn)題是亟待解決的城市管理難題之一,而交通流擁堵的預(yù)測(cè)對(duì)城市的交通管理至關(guān)重要。交通流密度是交通流狀態(tài)的重要指標(biāo),交通流密度的預(yù)測(cè)對(duì)交通流狀態(tài)的預(yù)測(cè)具有重要的意義。本文采用模糊信息?;椭С窒蛄繖C(jī)的組合模型對(duì)交通流的擁堵情況進(jìn)行預(yù)測(cè),通過(guò)數(shù)據(jù)降噪、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)信息?;忍幚?,然后利用支持向量機(jī)(SVM)分類回歸預(yù)測(cè)模型對(duì)處理后的數(shù)據(jù)進(jìn)行回歸預(yù)測(cè),預(yù)測(cè)結(jié)果較為精確,可以很好地預(yù)測(cè)交通流飽和度的發(fā)展趨勢(shì)和區(qū)間范圍,對(duì)交通管理具有很高的參考價(jià)值。
關(guān)鍵字:模糊信息粒化;支持向量機(jī);小波變換;數(shù)據(jù)標(biāo)準(zhǔn)化;交通流擁堵預(yù)測(cè)
Abstract:At present, traffic congestion is one of the challenges in urban management, while, prediction of traffic congestion is essential to traffic management. Traffic density is an important indicator of the traffic flow, density prediction of traffic flow is of important significance. This article uses a combined model of fuzzy information granulation and support vector machine to predict the traffic congestion, we carry out denoising, data normalization, data information granulation before using support vector machine to accomplish classification and regression prediction, prediction results is accurate. The model does better in prediction of trend and range of traffic density and has high reference value for traffic management.
Keywords: Fuzzy Information Granulation; Support Vector Machine; Wavelet Transform; Data Normalization; Congestion Prediction.
1 引 言
城市道路擁堵問(wèn)題是大城市管理中主要的社會(huì)難題之一,嚴(yán)重影響城市居民的出行效率,特別是近些年來(lái),盡管完成了一大批城市道路基礎(chǔ)設(shè)施的建設(shè),但是交通基礎(chǔ)設(shè)施的建設(shè)很難滿足交通需求的發(fā)展速度,城市交通的供需矛盾依然嚴(yán)峻。然而,交通基礎(chǔ)設(shè)施的建設(shè)不僅嚴(yán)重浪費(fèi)社會(huì)資源,同時(shí)由于建設(shè)周期長(zhǎng),很難及時(shí)有效地緩解交通供需矛盾,因此,交通管理和決策勢(shì)必成為較為經(jīng)濟(jì)合理有效的路徑,進(jìn)而,有效的交通狀態(tài)預(yù)測(cè)為交通管理提供科學(xué)有效的支撐顯得尤為重要。
城市道路交通流狀態(tài)的預(yù)測(cè)是智能交通一項(xiàng)重要的研究?jī)?nèi)容,根據(jù)交通流的平均速度、流量、密度和道路飽和率等評(píng)價(jià)指標(biāo)將交通流劃分為不同的狀態(tài),例如Stutz C等利用多元型聚類(FCMP)方法以速度為指標(biāo)將交通流基本圖分為自由流、密集流、擁擠流、阻塞流4個(gè)區(qū)域;廖瑞輝等利用云—支持向量機(jī)模型在交通流量、車輛速度、交通密度指標(biāo)預(yù)測(cè)基礎(chǔ)上評(píng)定交通流的狀態(tài)并建立了交通擁堵預(yù)警機(jī)制; poriklif等直接在壓縮域提取擁擠特征,利用高斯混合隱馬爾可夫模型來(lái)檢測(cè)交通狀況。
城市道路交通流密度是交通流狀態(tài)評(píng)價(jià)的重要指標(biāo),為簡(jiǎn)單起見,本文僅對(duì)交通流密度進(jìn)行預(yù)測(cè)分析,而交通流量、車輛速度等指標(biāo)預(yù)測(cè)分析和交通流密度預(yù)測(cè)分析原理相同,在此不做過(guò)多分析。
2 交通流擁堵預(yù)測(cè)建模
本文把交通流擁堵預(yù)測(cè)模型分為數(shù)據(jù)降噪、數(shù)據(jù)標(biāo)準(zhǔn)化、模糊信息?;突貧w分析預(yù)測(cè)四個(gè)組成部分,以下針對(duì)每一部分進(jìn)行詳細(xì)闡述。
2.1 數(shù)據(jù)降噪處理
城市道路交通系統(tǒng)主要受交通出行、道路條件和交通管理等因素的影響,因此在一定的道路條件和交通管理情況下,城市道路交通隨著出行早晚高峰而呈現(xiàn)相對(duì)穩(wěn)定的變化規(guī)律;然而,交通系統(tǒng)是人車路環(huán)境綜合作用的復(fù)雜系統(tǒng),因此城市道路交通因人車路環(huán)境隨機(jī)因素的影響呈現(xiàn)隨機(jī)性波動(dòng)。對(duì)道路交通流的狀態(tài)基本規(guī)律預(yù)測(cè)需要減弱隨機(jī)性波動(dòng)的影響,因此需要對(duì)數(shù)據(jù)進(jìn)行降噪處理。
數(shù)據(jù)降噪方法主要包括基于時(shí)域或空間域的方法和基于頻率域的方法,基于時(shí)域或空間域的方法常用的有: N點(diǎn)平均濾波、中值濾波、標(biāo)準(zhǔn)高斯濾波及自適應(yīng)濾波;基于頻率域的方法常用的有:傅立葉變換和小波變換。
傅立葉變換是在整體上將信號(hào)分解為不同頻率分量 ,只能在頻率域范圍內(nèi)表述,而缺乏局域性信息,小波變換對(duì)信號(hào)進(jìn)行多層次分解,在各個(gè)層次選擇閾值,對(duì)噪聲成分進(jìn)行抑制,更加靈活。本文采用數(shù)據(jù)小波變換處理來(lái)降低隨機(jī)性造成的數(shù)據(jù)噪聲。
小波變換分析能夠針對(duì)某時(shí)間段內(nèi)的信號(hào)的頻率信息,即對(duì)時(shí)間序列信號(hào)采取多層分解策略,每一步分解得到分解信號(hào)的低頻部分和高頻部分,逐步分解N層就會(huì)得到最終的低頻信息和每層產(chǎn)生的N層高頻信息。
該方法能夠很好地解決Z-Score標(biāo)準(zhǔn)化方法存在的變異程度上的差異相同的不足。標(biāo)準(zhǔn)化的數(shù)據(jù)通過(guò)分析運(yùn)算后,將分析運(yùn)算得到的結(jié)果進(jìn)行逆向標(biāo)準(zhǔn)化處理即可把結(jié)果恢復(fù)到標(biāo)準(zhǔn)化之前的量綱。
綜上所述,本文不存在數(shù)據(jù)變量間變異程度上差異的比較,選擇Z-Score標(biāo)準(zhǔn)化方法對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。
2.3 模糊信息?;?/p>
信息粒是一些相似度、功能性、接近性、一致性以及可識(shí)別性元素的集合,信息?;菍⒀芯繑?shù)據(jù)整體分解為離散的信息粒的過(guò)程,信息?;饕P陀谢诖植诩碚摰哪P汀⒒谀:碚摰哪P秃突谏炭臻g理論模型,這三種模型具備不同的特點(diǎn)又在功能上相互補(bǔ)充。
交通流擁堵狀態(tài)的界定存在一定的模糊性,同時(shí)由于城市交通系統(tǒng)受出行、道路條件以及交通管理等因素影響,交通流是人車路和環(huán)境的綜合影響,呈現(xiàn)不確定性,然而,相鄰較短時(shí)間段內(nèi)交通流的狀態(tài)又呈現(xiàn)相對(duì)的穩(wěn)定性,因此我們對(duì)數(shù)據(jù)進(jìn)行模糊信息粒化處理,每個(gè)信息粒代表某個(gè)時(shí)間段的模糊性和不確定性。
模糊信息?;譃闀r(shí)間窗口劃分和時(shí)間窗口模糊化兩個(gè)步驟,對(duì)交通流密度數(shù)據(jù)進(jìn)行時(shí)間窗口劃分時(shí),假定交通流的在5min時(shí)間段內(nèi)保持相對(duì)穩(wěn)定,其時(shí)間窗口 ;針對(duì)粒化后的時(shí)間窗口模糊化常用的基本形式包括高斯型、拋物線型、三角形和梯形,在此采用較為簡(jiǎn)單的三角形模糊粒子,其隸屬函數(shù)形式如式(7):
(7)
數(shù)據(jù)經(jīng)過(guò)模糊信息?;罂梢杂梢幌盗械男畔⒘?代表,其中,a表示相應(yīng)時(shí)間窗口原始數(shù)據(jù)的最小值,m代表相應(yīng)時(shí)間窗口原始數(shù)據(jù)的平均水平,b表示相應(yīng)時(shí)間窗口原始數(shù)據(jù)的最大值。
2.4 數(shù)據(jù)回歸預(yù)測(cè)
數(shù)據(jù)回歸分析模型除了傳統(tǒng)的線性和非線性回歸分析等方法之外,應(yīng)用較為廣泛的還有人工神經(jīng)網(wǎng)絡(luò)模型、決策樹模型、貝葉斯分類器和支持向量機(jī)模型。
支持向量機(jī)(SVM)用于模式分類和非線性回歸分析,對(duì)原始數(shù)據(jù)通過(guò)特定的核函數(shù)映射的高維空間,使得在高維空間達(dá)到線性可分的目的,其主要思想是建立一個(gè)分類超平面作為決策曲面,使得正例和反例之間的隔離邊緣最大化,是結(jié)構(gòu)風(fēng)險(xiǎn)最小化的近似體現(xiàn),在分類和回歸預(yù)測(cè)問(wèn)題上支持向量機(jī)能夠提供好的泛化性能,然后,將分類問(wèn)題轉(zhuǎn)化為二次規(guī)劃問(wèn)題,因此能夠得出全局最優(yōu)解,進(jìn)而避免了存在局部極值的弊端。
基于上述支持向量機(jī)的優(yōu)勢(shì),本文采用支持向量機(jī)進(jìn)行回歸分析建模,該回歸分析模型分為兩步,第一步利用歷史數(shù)據(jù)對(duì)模型進(jìn)行學(xué)習(xí)訓(xùn)練,第二步利用第一步訓(xùn)練好的模型對(duì)未來(lái)數(shù)據(jù)進(jìn)行回歸預(yù)測(cè)分析。
3 仿真分析
我們基于上述模型在Matlab8.0和LibSVM-3.11工具包環(huán)境中進(jìn)行編程實(shí)現(xiàn),并針對(duì)交通流一天內(nèi)每分鐘密度數(shù)據(jù)進(jìn)行仿真分析,我們把一天1 440個(gè)交通流密度數(shù)據(jù)?;癁?88個(gè)信息粒數(shù)據(jù),利用前287個(gè)數(shù)據(jù)對(duì)回歸預(yù)測(cè)模型進(jìn)行訓(xùn)練學(xué)習(xí),利用訓(xùn)練好的模型對(duì)最后一個(gè)信息粒進(jìn)行預(yù)測(cè)分析。
圖1表示的是對(duì)交通流密度原始數(shù)據(jù)進(jìn)行小波變換降噪處理前后的對(duì)比圖,灰色線圖表示未經(jīng)降噪處理的交通流密度的曲線圖,藍(lán)色線圖表示交通流密度經(jīng)過(guò)小波變換降噪后的曲線圖,對(duì)比發(fā)現(xiàn),小波變換能夠?qū)煌髅芏葦?shù)據(jù)很好地降噪處理。
對(duì)降噪處理的數(shù)據(jù)進(jìn)行數(shù)據(jù)標(biāo)準(zhǔn)化處理以消除量綱的影響,接下來(lái)對(duì)標(biāo)準(zhǔn)化的數(shù)據(jù)進(jìn)行模糊信息?;?,模糊信息?;玫降男畔⒘0總€(gè)時(shí)間窗口的最大最小值和均值,由此對(duì)信息粒的最大最小值以及均值分別做回歸預(yù)測(cè)分析,核函數(shù)采取徑向基核函數(shù),支持向量機(jī)的懲罰函數(shù)參數(shù)和核函數(shù)參數(shù)的尋優(yōu)采取網(wǎng)格搜索的算法。
圖2表示回歸預(yù)測(cè)模型的訓(xùn)練效果圖和最大最小值和均值預(yù)測(cè)值的點(diǎn)線圖,橫縱標(biāo)表示一天24小時(shí)的時(shí)間序列,縱坐標(biāo)是交通流密度的取值。(a)展示的是支持向量機(jī)回歸預(yù)測(cè)模型的訓(xùn)練效果圖,從圖中可以看出,回歸預(yù)測(cè)模型訓(xùn)練后的預(yù)測(cè)結(jié)果能夠跟訓(xùn)練數(shù)據(jù)貼合得很緊密,由此可以看出支持向量機(jī)回歸預(yù)測(cè)模型能夠?qū)煌髅芏茸龊芎玫幕貧w預(yù)測(cè);(b)表示交通流密度預(yù)測(cè)的最大最小值以及均值,發(fā)現(xiàn)預(yù)測(cè)的均值全部包含在最大最小值組成的取值區(qū)間內(nèi),最大最小值和均值的預(yù)測(cè)值能夠很好地展示原始數(shù)據(jù)的發(fā)展趨勢(shì)。
圖3表示交通流密度預(yù)測(cè)的最大最小值之差,橫坐標(biāo)表示一天時(shí)間序列,縱坐標(biāo)range是最大最小值之差構(gòu)成的交通流密度取值區(qū)間的范圍,即 , 分別表示交通流密度預(yù)測(cè)的最大最小值,其中,誤差 的占80.6%,由此可見模型能夠準(zhǔn)確地預(yù)測(cè)交通流密度的取值區(qū)間。
表1是基于模糊信息?;椭С窒蛄繖C(jī)組合模型對(duì)未來(lái)1個(gè)時(shí)間段內(nèi)交通流密度的預(yù)測(cè)值和實(shí)際值以及預(yù)測(cè)相對(duì)誤差的信息表,對(duì)比最大值最小值以及均值的實(shí)際值和預(yù)測(cè)值可以得出,相對(duì)誤差在10%左右,模型的預(yù)測(cè)結(jié)果較為精確,能夠很好地預(yù)測(cè)交通流密度的發(fā)展趨勢(shì)和取值區(qū)間。
4 結(jié) 語(yǔ)
本文對(duì)城市道路交通流密度的歷史數(shù)據(jù)進(jìn)行建模分析,從數(shù)據(jù)去噪聲處理到數(shù)據(jù)標(biāo)準(zhǔn)化處理,然后模糊信息?;玫叫畔⒘?,最后利用支持向量機(jī)對(duì)信息粒進(jìn)行回歸預(yù)測(cè),由仿真分析可知,基于模糊信息?;闹С窒蛄繖C(jī)模型在交通流密度預(yù)測(cè)中的效果較佳,實(shí)際值和預(yù)測(cè)值的誤差基本可以控制在10%左右,從而能夠獲得城市道路交通流密度的發(fā)展趨勢(shì),此外,該模型能夠獲得城市道路交通流密度的變化區(qū)間,對(duì)交通管理的決策具有很大的參考意義。
主要參考文獻(xiàn)
[1]Stutz C, Runkler T A. Classification and Prediction of Road Traffic Using Application-Specific Fuzzy Clustering[J]. IEEE Transactions on Fuzzy Systems,2002, 10(3):297 - 308.
[2] Porikli, Li F X. Traffic Congestion Estimation Using Hmm Models Without Vehicle Tracking[J].Intelligent Vehicles Symposium,2004IEEE:188 - 193.
[3]廖瑞輝,周晶.基于云-支持向量機(jī)的道路交通擁擠預(yù)警模型[J].系統(tǒng)工程,2015, 33(4):149-153.
[4]潘洋宇,李東波,童一飛.基于小波技術(shù)的數(shù)據(jù)降噪[J].機(jī)械設(shè)計(jì), 2006,23(1):31-33.
[5]何韜,梁棟,李瑤.小波變換在電力諧波分析中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2007, 17(1):229-232.
[6]張鈸,張鈴.問(wèn)題求解理論及應(yīng)用[M].北京:清華大學(xué)出版社,1990.
[7]Zadeh L A.Towards a Theory of Fuzzy Information Granulation and its Centrality in Human Reasoning and Fuzzy Logic[J].Fuzzy Sets and Systems,1997,19(1):111-117.
[8]史峰,王小川,郁磊,李洋.Matlab神經(jīng)網(wǎng)絡(luò)30個(gè)案例分析[M].北京:北京航空航天大學(xué)出版社,2009.