康海貴 莫仁杰 李明偉
(大連理工大學(xué)港口、海岸及近海工程國家重點(diǎn)實(shí)驗(yàn)室 大連 116024)
交通堵塞、交通擁擠及交通事故等問題使得城市的交通系統(tǒng)不堪重負(fù).短時(shí)交通量預(yù)測是城市動(dòng)態(tài)交通分配和交通誘導(dǎo)系統(tǒng)的關(guān)鍵技術(shù),對解決城市交通問題具有重要意義,是智能交通領(lǐng)域的研究熱點(diǎn).商蕾[1]在構(gòu)建城市道路微觀交通仿真模型框架的基礎(chǔ)上,運(yùn)用面向?qū)ο笏枷牒图夹g(shù)、動(dòng)態(tài)內(nèi)存管理和實(shí)時(shí)視景仿真技術(shù)開發(fā)了城市道路微觀交通流仿真原型系統(tǒng).孫立光等[2]提出了包含傅里葉歷史估計(jì)、自回歸和鄰域回歸3個(gè)子模型的應(yīng)用于流量和速度預(yù)測的組合預(yù)測模型.張杰等[3]應(yīng)用交通流一維元胞自動(dòng)機(jī)模型進(jìn)行仿真試驗(yàn),研究理論交通流的混沌現(xiàn)象.張敬磊等[4]針對智能交通系統(tǒng)的開發(fā)和交通流特性,應(yīng)用小波Mallet分解算法建立交通流狀態(tài)辨識(shí)方法.支持向量回歸機(jī)模型(support vector regression,SVR)采用結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則替代經(jīng)驗(yàn)風(fēng)險(xiǎn)最小化原則,能在模型的復(fù)雜性和學(xué)習(xí)能力之間尋求最佳折中[5].由于其出色的學(xué)習(xí)能力和泛化性能,在短時(shí)交通流量預(yù)測方面得到了廣泛的應(yīng)用[6].而SVR 模型本身并未給出模型最優(yōu)參數(shù)組合的選擇方法,常用的經(jīng)驗(yàn)選取法和交叉試算法存在一定缺陷[7].遺傳算法[8](genetic algo-rithms,GA)具有全局尋優(yōu)、魯棒性和自適應(yīng)性強(qiáng)等優(yōu)點(diǎn)[9],可應(yīng)用于模型參數(shù)的優(yōu)選.本文基于混沌logistic映射的遍歷性、初值敏感性、不容易陷入小循環(huán)和不動(dòng)點(diǎn)的優(yōu)勢,同時(shí)借以云模型云滴的隨機(jī)性和穩(wěn)定傾向性特點(diǎn),對標(biāo)準(zhǔn)遺傳算法進(jìn)行改進(jìn),建立了基于混沌云遺傳算法(chaos cloud genetic algorithm,CCLGA)進(jìn)行參數(shù)優(yōu)選的CCLGA-SVR 短時(shí)交通流量預(yù)測的新方法.通過數(shù)值模擬,證明了該方法的有效性,可為短時(shí)交通管理提高依據(jù).
設(shè)變 量y 與x 遵循某一未知聯(lián)合概率F(x,y),SVR回歸就是尋求實(shí)值函數(shù)f(x)=w·φ(xi)+b來擬合以觀測樣本集S ={(x1,y1),(x2,y2),…,(xl,yl)},使得風(fēng)險(xiǎn)R[f]=∫C(x,y,f)dρ(x,y)最小.式中:C 為損失函數(shù).回歸時(shí)觀測值與預(yù)測值之間的誤差用ε不敏感函數(shù)|yi-f(xi)|ε=max{0,|yi-f(xi)|-ε}來度量,當(dāng)x點(diǎn)的觀察值y與預(yù)測值f(x)之間的誤差不超過小正數(shù)ε時(shí)認(rèn)為函數(shù)對這些樣本點(diǎn)的擬合是無差錯(cuò)的.基于ε損失函數(shù)SVR 問題可表示為
SVR 回歸模型中有需要給定C,v 及核函數(shù)K 中的參數(shù),這些參數(shù)的選取對模型結(jié)果精度、穩(wěn)定性和泛化性有重要影響.參數(shù)的選取直接決定著模型的使用性能,實(shí)際應(yīng)用中往往是憑經(jīng)驗(yàn)選取或用交叉驗(yàn)證法選取,2種方法中前者經(jīng)驗(yàn)性太而且在模型精度上仍有待提高,后者模型參數(shù)尋優(yōu)方向不明顯、計(jì)算量大,當(dāng)個(gè)體的數(shù)量增加時(shí)計(jì)算量則是指數(shù)性增長、計(jì)算耗時(shí).
混沌優(yōu)化方法是利用混沌遍歷及初值敏感等性質(zhì)作為全局優(yōu)化機(jī)制.混沌優(yōu)化方法中常用Logistic混沌映射,Logistic映射產(chǎn)生的混沌序列的概率密度服從兩頭多中間少的切比雪夫分布,其遍歷性解釋見文獻(xiàn)[10].一維Logistic映射方程為xn+1=u·xn·(1-xn).式中:xn∈[0,1],u∈[0,4],n=0,1,2,….xn是混沌變量x 在第n次的迭代值,u是控制參量.為保證混沌變量對初值的遍歷性及敏感性n 值一般?。?00~1000];x0?。?,1]區(qū)間內(nèi)除0.25,0.5,0.75 以外的初值.實(shí)驗(yàn)證明,當(dāng)u=4 時(shí)系統(tǒng)完全處于混沌狀態(tài)[11],此時(shí)按映射方程得出的混沌變量可以遍歷到整個(gè)搜索區(qū)域.圖1為n=50000,u=4,x(0)=0.45時(shí)混沌變量分布,圖2給出變量500次迭代分布情況.從圖1和圖2可以看出,Logistic混沌映射軌道點(diǎn)能夠布滿整個(gè)區(qū)域的內(nèi)部和邊界,并且區(qū)域邊界軌道點(diǎn)數(shù)量較多內(nèi)部點(diǎn)數(shù)量較少但整體分布較均勻的特點(diǎn).
圖1 Logistic映射混沌變量圖
圖2 變量迭代分布圖
設(shè)T 為論域u 上的語言值,映射CT(x):u→[0,1],x∈u,x→CT(x),則CT(x)在u上的分布稱為T 的隸屬云,簡稱云[12],當(dāng)CT(x)服從正態(tài)分布時(shí),稱為正態(tài)云模型.云理論模型[13]是語言值表示不確定性的轉(zhuǎn)換模型,具有隨機(jī)、模糊及穩(wěn)定等特性.云模型[14]的整體特性可以用期望E、熵S、超熵H 這3個(gè)數(shù)字特征來表示.基本正態(tài)云如圖3所示,圖中E 是云滴在論域空間分布的期望;S 代表定性概念的可度量粒度;H 是熵的不確定性度量即熵的熵.云模型在知識(shí)表達(dá)時(shí)的不確定中帶穩(wěn)定性特點(diǎn),其期望E 可以代表父代個(gè)體遺傳的優(yōu)良特征,是子代對父代的繼承,熵S和超熵H 表示了繼承過程的不確定性和模糊性,表現(xiàn)了物種進(jìn)化過程中的變異特征,算法進(jìn)化的隨機(jī)性可以避免搜索陷入局部極值,而穩(wěn)定傾向性又可以很好地定位全局最優(yōu)值.
圖3 正態(tài)云模型示意圖
CCLGA 算法是基于“保護(hù)”較優(yōu)個(gè)體,快速進(jìn)化較差個(gè)體的思想,基本思路是運(yùn)用混沌Logistic映射產(chǎn)生初始種群,利用云模型指導(dǎo)算法進(jìn)行交叉和變異操作,進(jìn)化到一定程度時(shí),做微小的混沌擾動(dòng)生成新的種群,重新進(jìn)行優(yōu)選迭代,直到滿足終止條件為止.CCLGA 算法設(shè)計(jì)步驟如下.
步驟1 混沌Logistic映射生成m 個(gè)體的初始種群.
步驟2 計(jì)算每個(gè)體的適應(yīng)度值,記錄最大個(gè)體染色體及其適應(yīng)度值.
步驟6 將經(jīng)過交叉生成的新個(gè)體和經(jīng)過變異生成的新個(gè)體組合得到新的種群,轉(zhuǎn)入步驟2)進(jìn)行下一輪的迭代計(jì)算,直到滿足停止條件,其中c1-c4為控制參數(shù),本文取c1=c3=2.5p(p 為種群的大?。?,c2=c4=15.
本文模型預(yù)測以某市交通頻繁堵塞路段高峰期(17:00~20:00)為例,區(qū)域路網(wǎng)簡化如圖4所示.根據(jù)路段長度及平均行車速度取交通量數(shù)據(jù)采樣周期為10 min(時(shí)段長度確定為10 min),7d共采集數(shù)據(jù)126組.
圖4 區(qū)域道路簡化圖
圖4中,以D 斷面交通流量為預(yù)測目標(biāo)集,其交通流量受到上游斷面A,B,C,及下游E 斷面流量的直接影響.X1(t),X2(t),X3(t),X4(t)分別為斷面A,B,C,E 處t 時(shí)段的交通流量,Y(t-1),Y(t)分別為預(yù)測斷面D 處的t-1和t 2個(gè)時(shí)段交通流量,Y(t+1)為該斷面t+1時(shí)段的流量.天氣因素設(shè)為第六個(gè)影響因素X5(t),其量化方法為大雪或大雨雪為1,小雪或小雨雪為0.75,大雨為0.5,小雨為0.25,晴或多云為0.因此,得影響斷面D 處給定方向t+1時(shí)段交通流量Y(t+1)的7 個(gè)影響因素X={X1(t),…,Y(t-1),Y(t)},將其作為模型的輸入向量,模型的輸出量值為Y={Y(t+1)}.由于周末高峰期車流量集中現(xiàn)象與工作日高峰期的特征有所差別,本文只選周一至周五為研究對象,將前4d晚高峰時(shí)段數(shù)據(jù)作為模型的訓(xùn)練樣本,將第5d晚高峰時(shí)段后16組數(shù)據(jù)作為檢驗(yàn)樣本進(jìn)行仿真預(yù)測.
為分析模型全局尋優(yōu)性能和預(yù)測精度,以控制尋優(yōu)時(shí)間的方式對模型進(jìn)行仿真.CCLGASVR 模型,經(jīng)過迭代優(yōu)選得到全局參數(shù)最優(yōu)組合為C=584.5,ν=0.8763和δ=0.2197;運(yùn)用不同對比模型進(jìn)行仿真計(jì)算,得不同模型預(yù)測結(jié)果對比見表1,預(yù)測相對誤差曲線見圖5.
表1 不同預(yù)測模型仿真結(jié)果對比 /輛
表2 不同算法尋優(yōu)過程適應(yīng)度對比
圖6 算法適應(yīng)度變化對比
不同參數(shù)優(yōu)選模型在限定時(shí)間內(nèi)尋優(yōu)性能對比如表2所列;模型搜索的適應(yīng)度函數(shù)值隨時(shí)間的變化曲線如圖6所示.方面優(yōu) 于NF-SVR 模型,SGA-SVR 模型 優(yōu) 于 基本的GA-SVR 模型,CCLGA-SVR 模型在限定時(shí)間內(nèi)尋優(yōu)速度及模型精度優(yōu)于SGA-SVR 模型.在一定的運(yùn)行時(shí)間(2000s)內(nèi),SGA 算法搜索到的個(gè)體的適應(yīng)度普遍大于GA 算法;CCLGA 算法搜索到個(gè)體的適應(yīng)度普遍大于GA 算法和SGA 算法.
由模型尋優(yōu)搜索過程、尋優(yōu)效率曲線以及預(yù)測輸出結(jié)果可看出:(1)在逼近原始流量序列方面,SVR 的預(yù)測方法明顯優(yōu)于PSO-BP神經(jīng)網(wǎng)絡(luò)模型;(2)基本的GA-SVR 模型在參數(shù)尋優(yōu)性能
本文提出了模型參數(shù)選取的新方法(CCLGA算法),與NF 交叉驗(yàn)算法、基本GA 算法以及傳統(tǒng)SGA 算法相比,CCLGA 算法在規(guī)定的時(shí)間內(nèi)搜索效率更高,更適合系統(tǒng)利用新的數(shù)據(jù)進(jìn)行模型參數(shù)的自動(dòng)更新,有效降低陷入局部最小化風(fēng)險(xiǎn),取得精度較高的模型輸出.
綜合考慮了城市短時(shí)交通流的時(shí)空分布特性及天氣影響因素,共7 個(gè)影響因子,將CCLGASVR 模型應(yīng)用于城市短時(shí)交通流量預(yù)測,可以減少短時(shí)交通流預(yù)測的用時(shí)并提高預(yù)測精度和可靠度,為城市復(fù)雜交通環(huán)境下交通管理提供可靠的技術(shù)服務(wù).實(shí)際應(yīng)用中,可以根據(jù)實(shí)時(shí)預(yù)測結(jié)果,動(dòng)態(tài)修改和實(shí)時(shí)發(fā)布未來幾個(gè)時(shí)段內(nèi)的交通預(yù)測信息,通過調(diào)節(jié)交通指示等手段,可有效緩解整個(gè)交通網(wǎng)絡(luò)的擁堵狀況.
[1]商 蕾.城市道路交通流仿真系統(tǒng)研究[J].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2010,34(3):587-590.
[2]孫立光,李瑞敏,董 屾,等.短時(shí)交通流組合預(yù)測模型研究[J].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2010,34(5):874-876.
[3]張 杰,賀國光.基于一維元胞自動(dòng)機(jī)模型的交通流混沌研究[J].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2009,33(1):34-36.
[4]張敬磊,王曉原.交通流狀態(tài)辨識(shí)小波算法研究[J].武漢理工大學(xué)學(xué)報(bào):交通科學(xué)與工程版,2006,30(5):820-823.
[5]VAPNIK V.The nature of statistical learning theory[M].New York:Springer,1995.
[6]劉艷忠,邵小健,李旭宏.基于Lagrange支持向量回歸機(jī)的短時(shí)交通流量預(yù)測模型的研究[J].交通與計(jì)算機(jī),2007,5(25):47-50.
[7]YAN H S,XU D.An approach to estimating product design time based on fuzzy-support vector machine[J].IEEE Transactions on Neural Networks,2007,18(3):721-731.
[8]孫月峰,張勝紅,王曉玲,等.基于混合遺傳算法的區(qū)域大系統(tǒng)多目標(biāo)水資源優(yōu)化配置模型[J].系統(tǒng)工程理論與實(shí)踐,2009,29(1):139-142.
[9]MIN S H,LEE J,HAN I.Hybrid genetic algorithms and support vector machines for bankruptcy prediction.Expert Systems with Applications,2006,31(3):652-660.
[10]李祥飛.混沌優(yōu)化理論在控制系統(tǒng)設(shè)計(jì)中的研究[D].長沙:中南大學(xué),2003.
[11]LU Q Z,SHEN G L,YU R Q.A chaotic approach to maintain the population diversity of genetic algorithm in network training[J].Computational Biology and Chemistry,2003,27(3):363-372.
[12]劉常昱,李德毅,杜 鹢,等.正態(tài)云模型的統(tǒng)計(jì)分析[J].信息與控制,2005.3,34(2):236-239.
[13]李興生.基于云模型和數(shù)據(jù)場的分類和聚類挖掘研究[D].南京:中國人民解放軍理工大學(xué),2003.
[14]WANG Shuliang,LI Deren,SHI Wenzhong.Cloud model-based spatial data mining[J].Geographical Information Science,2003,9(2):77-78.