張喜強(qiáng) 趙靜
摘要:文章以近幾年全國(guó)道路交通安全相關(guān)數(shù)據(jù)為樣本數(shù)據(jù),分析了數(shù)據(jù)間的特性。為此,分別利用標(biāo)準(zhǔn)灰色預(yù)測(cè)模型和支持向量機(jī)(SVM)模型建立道路交通安全預(yù)測(cè)模型,利用MATLAB R2012b對(duì)兩種預(yù)測(cè)模型算法進(jìn)行建模并應(yīng)用數(shù)據(jù)進(jìn)行仿真測(cè)試,得出相關(guān)的參數(shù)值和誤差值,最后將預(yù)測(cè)結(jié)果數(shù)據(jù)與實(shí)際值進(jìn)行對(duì)比分析。
關(guān)鍵詞:交通安全;數(shù)據(jù)分析;預(yù)測(cè)結(jié)果
在過(guò)去的幾十年里,我國(guó)經(jīng)濟(jì)迅速發(fā)展,機(jī)動(dòng)車制造工業(yè)有著驚人的進(jìn)步,道路基礎(chǔ)設(shè)施也進(jìn)入了發(fā)展的高潮。這些都推動(dòng)了我國(guó)交通運(yùn)輸行業(yè)的發(fā)展,具體表現(xiàn)為公路里程數(shù)、機(jī)動(dòng)車保有量、客貨周轉(zhuǎn)量等都以驚人的速度增長(zhǎng)。截至2016年底,全國(guó)公路總里程超過(guò)450萬(wàn)公里,其中高速公路總里程達(dá)到10.8萬(wàn)公里,居世界第一;機(jī)動(dòng)車保有量達(dá)到2. 79億輛,機(jī)動(dòng)車駕駛?cè)诉_(dá)3. 27億人,已超越美國(guó)成為世界汽車消費(fèi)第一大國(guó)。在經(jīng)濟(jì)發(fā)展繁榮、基礎(chǔ)建設(shè)興起的同時(shí),機(jī)動(dòng)車過(guò)多、道路交通事故率居高不下已成為一個(gè)嚴(yán)峻的社會(huì)難題。
一、模型算法
(一)灰色預(yù)測(cè)模型
灰色預(yù)測(cè)模型的研究對(duì)象是數(shù)據(jù)不夠完備的不確定性系統(tǒng)。對(duì)于少樣本的系統(tǒng),可以通過(guò)部分?jǐn)?shù)據(jù)的規(guī)律提取,并演化成有規(guī)律的有效信息,開發(fā)部分?jǐn)?shù)據(jù)的運(yùn)動(dòng)行為,將動(dòng)態(tài)數(shù)據(jù)進(jìn)行正確和有效的描述。文章以道路交通安全預(yù)測(cè)系統(tǒng)為例。道路交通系統(tǒng)是一個(gè)動(dòng)態(tài)系統(tǒng),其發(fā)展變化受到很多因素的影響,于是它又是一個(gè)動(dòng)態(tài)的灰色系統(tǒng)。因此,可以運(yùn)用灰色系統(tǒng)的理論和方法來(lái)研究道路交通安全系統(tǒng)。
(二)支持向量機(jī)(SVM)模型
由Vapnik首先提出的支持向量機(jī)(SVM)通??捎糜谀P头诸惡途€性回歸。支持向量機(jī)描述了如何在多層感知器網(wǎng)絡(luò)或徑向基函數(shù)網(wǎng)絡(luò)中構(gòu)建一個(gè)分類超平面,并將它作為決策面,使得正例和反例之間的隔離邊緣最大化。相對(duì)于神經(jīng)網(wǎng)絡(luò),支持向量機(jī)是結(jié)構(gòu)風(fēng)險(xiǎn)最小化的一種近似實(shí)現(xiàn)。
支持向量機(jī)是解決非線性、復(fù)雜性、多維問(wèn)題的一種方法,其實(shí)質(zhì)是建立非線性回歸方程,通過(guò)非線性函數(shù)φ(g)把數(shù)據(jù)映射到高維特征空間,然后在此空間建立線性回歸函數(shù)。具體函數(shù)為:
二、道路交通安全預(yù)測(cè)建模
(一)灰色預(yù)測(cè)建模的應(yīng)用
根據(jù)樣本數(shù)據(jù)的回歸性進(jìn)行選取后,計(jì)算得出發(fā)展灰數(shù)
在MATLAB中運(yùn)行模型程序得到預(yù)測(cè)計(jì)算標(biāo)準(zhǔn)差比C=0.0883,估計(jì)小誤差概率P=1 。
由表1不難發(fā)現(xiàn),在2012年以前實(shí)際值和預(yù)測(cè)值相差不大,誤差較小;從2012年起,預(yù)測(cè)值比實(shí)際值明顯誤差增大。如果預(yù)測(cè)越長(zhǎng),精度勢(shì)必越低。
(二)支持向量機(jī)預(yù)測(cè)建模
根據(jù)道路交通安全預(yù)測(cè)值中樣本數(shù)值的特性,文章選擇高斯核函數(shù),根據(jù)上述SVM公式綜合得出基于SVM的道路交通安全預(yù)測(cè)模型,偏置b的表達(dá)式如下:
選取評(píng)價(jià)體系中全國(guó)死亡人數(shù)、受傷人數(shù)、事故次數(shù)、直接經(jīng)濟(jì)損失這4重指標(biāo)集合。影響因子集合為近20年全國(guó)公路運(yùn)輸距離、機(jī)動(dòng)車保有量、貨運(yùn)量、旅客周轉(zhuǎn)量、貨物周轉(zhuǎn)量作為影響因子的集合。根據(jù)構(gòu)建的交通安全預(yù)測(cè)模型公式2.2,在MATLAB R2012b中編程運(yùn)行,并需要確定三個(gè)參數(shù)值,即正規(guī)化參數(shù)C和高斯核函數(shù)參數(shù)σ2,以及誤差 e。文章選擇用交叉驗(yàn)證來(lái)確定三個(gè)參數(shù)值。在有限的學(xué)習(xí)數(shù)據(jù)中獲取盡可能多的有效值,從而獲得更合適的權(quán)值是交叉驗(yàn)證的優(yōu)點(diǎn)。
三、仿真結(jié)果
本模型實(shí)驗(yàn)是在標(biāo)準(zhǔn)支持向量機(jī)在MATLAB中搭載C語(yǔ)言環(huán)境下調(diào)用libsvm3.17的環(huán)境下進(jìn)行的。抽取樣本數(shù)據(jù)中隨機(jī)6個(gè)年份的道路交通事故次數(shù)指標(biāo)作為訓(xùn)練集,其余為測(cè)試集,分別進(jìn)行測(cè)試和訓(xùn)練。文章把樣本集合分為5份,做5折交叉驗(yàn)證,輪流選擇其中4份訓(xùn)練,剩余的1份做驗(yàn)證。根據(jù)模型在驗(yàn)證集合上的性能,進(jìn)行兩次尋優(yōu)求得,第一次確定粗略的參數(shù),即C=1,σ2=9.1896,e=0.01353%,第二次確定精細(xì)的參數(shù),即C=0.70711,σ2=11.3137,e=0.01323%。通過(guò)對(duì)比可以發(fā)現(xiàn),將灰色預(yù)測(cè)理論應(yīng)用于長(zhǎng)期預(yù)測(cè)數(shù)據(jù)時(shí),會(huì)產(chǎn)生誤差增高的現(xiàn)象,而應(yīng)用支持向量機(jī)模型構(gòu)建的模型,誤差均在0.20以下,在精度上有顯著的提升。
參考文獻(xiàn)
[1]孫科達(dá).基于GA的BP神經(jīng)網(wǎng)絡(luò)道路交通事故預(yù)測(cè)模型研究[D].浙江工業(yè)大學(xué),2012.
[2]安杰,董龍洋.基于BP神經(jīng)網(wǎng)絡(luò)的道路交通安全預(yù)測(cè)模型研究[J].公路與汽運(yùn),2014(3):63-67.
[3]房靖,高尚.基于支持向量機(jī)的交通事故組合預(yù)測(cè)方法研究[J].交通與計(jì)算機(jī),2007(2):103-105,11.
[4]張文峰,成衛(wèi),董玉佩.道路交通事故神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)研究[J].昆明理工大學(xué)學(xué)報(bào)(理工版),2015(5):5.
[5]孫浩.基于支持向量機(jī)的交通安全預(yù)測(cè)模型研究[D].合肥工業(yè)大學(xué),2009.