曹 潔, 張 敏, 張 紅,2, 陳作漢,2, 侯 亮,2,3
(1. 蘭州理工大學 計算機與通信學院, 甘肅 蘭州 730050; 2. 甘肅省城市軌道交通智能運營工程研究中心, 甘肅 蘭州 730050; 3. 甘肅省制造業(yè)信息化工程研究中心, 甘肅 蘭州 730050)
精準的短時交通流預測是交通管控和誘導的基礎(chǔ),是智能交通系統(tǒng)(intelligent transportation system,ITS)的關(guān)鍵技術(shù)之一.隨著觀測時間尺度的減小,交通流非線性、時變性、不確定性逐漸增強[1-2],預測困難增大,怎樣提高短時交通流預測的準確性成為一個研究熱點.為此,學者們在短時交通流預測問題上進行了大量研究以提高預測準確性[3-4],主要的模型方法可分為兩大類[5-10],分別是基于數(shù)理統(tǒng)計的傳統(tǒng)模型和基于非線性理論的智能模型.數(shù)理統(tǒng)計模型對平穩(wěn)數(shù)據(jù)的預測效果較好,但并不適用于短時交通流數(shù)據(jù),所以處理具有高度隨機性的交通流數(shù)據(jù)主要應(yīng)用非線性智能模型,主要包括BP神經(jīng)網(wǎng)絡(luò)(back propagation neuron network)預測模型、小波神經(jīng)網(wǎng)絡(luò)預測模型以及徑向基(radial basis function,RBF)神經(jīng)網(wǎng)絡(luò)預測模型等.其中,RBF神經(jīng)網(wǎng)絡(luò)憑借其較快的學習速度和強大的數(shù)據(jù)擬合性能,在處理短時交通流問題上有明顯優(yōu)勢.
RBF神經(jīng)網(wǎng)絡(luò)雖在交通流預測方面具有巨大優(yōu)勢,但同時由于模型超參數(shù)選取不當會致其無法收斂于全局極值點.因此,許多學者就如何優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)模型參數(shù)的問題進行了研究.Chen[11]使用改進的人工蜂群算法(artificial bee colony algorithm,ABC)優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)參數(shù),提高了RBF神經(jīng)網(wǎng)絡(luò)的預測精度;Wei[12]將改進的引力搜索算法和RBF神經(jīng)網(wǎng)絡(luò)相融合,對交通流量進行了預測; Wang等[13]利用LSSVM和RBF神經(jīng)網(wǎng)絡(luò)對北京地鐵的客流量進行了預測;陳明猜等[14]使用果蠅優(yōu)化算法(fruit fly optimization algorithm,FOA)優(yōu)化了RBF神經(jīng)網(wǎng)絡(luò)的超參數(shù),提高了短時交通流量預測的精度.近幾年憑借收斂速度快、搜索精度高而聞名的各種元啟發(fā)算法在神經(jīng)網(wǎng)絡(luò)優(yōu)化方面得到了廣泛應(yīng)用.目前,研究學者已在著名的多個優(yōu)化問題上進行了測驗,結(jié)論表明與其他的群生物智能優(yōu)化算法相比螢火蟲算法性能更加優(yōu)越[15],具有良好的全局尋優(yōu)收斂能力.螢火蟲算法[16](firefly algorithm,F(xiàn)A)具有結(jié)構(gòu)簡易、調(diào)整參量少、易于實施的優(yōu)點.各領(lǐng)域?qū)W者就螢火蟲算法的改進做了許多研究,并將其應(yīng)用在生產(chǎn)生活的各個方面.宋志強等[17]對基本螢火蟲算法進行改進以提高搜尋BP神經(jīng)網(wǎng)絡(luò)的權(quán)閾值的精度.柳長源等[18]針對基本螢火蟲算法中存在的問題對其進行改進,將其用于交通信號配時優(yōu)化上.本文通過引入線性遞減慣性權(quán)重和混沌機制來改進基本螢火蟲算法,達到提高算法種群多樣性和收斂速度的目的,結(jié)合RBF神經(jīng)網(wǎng)絡(luò)在處理具有高度隨機性、非線性時間序列問題上的優(yōu)勢和螢火蟲算法優(yōu)良的全局搜索能力來預測短時交通流量.
綜上所述,本文提出一種改進螢火蟲算法(improved firefly algorithm,IFA)優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)(IFA-RBF)的短時交通流預測模型.對標準螢火蟲算法的位置更新公式中引入線性遞減慣性權(quán)重和搜索機制中增加混沌搜索,以改進FA后期存在的易陷入局部極值和種群多樣性匱乏的問題,IFA被用于優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和基函數(shù)寬度,以提高RBF神經(jīng)網(wǎng)絡(luò)短時交通流預測精度.
螢火蟲通過熒光亮度在整個搜索空間內(nèi)互相吸引和移動,最終搜尋到最優(yōu)解,算法結(jié)束.螢火蟲之間相互移動吸引的數(shù)學描述如下:
xi(t+1)=xi(t)+β(xj(t)-xi(t))+αεi
(1)
其中:xi(t+1)是螢火蟲xi第t+1次移動后的位置;α是步長因子,為[0,1]的常數(shù);εi為服從正態(tài)分布的隨機數(shù);β是螢火蟲xj對xi的吸引度,其表達式為
β=β0e-γrm
(2)
β0是初始位置吸引度;γ為光強吸收系數(shù);m為常數(shù),通常為2.
標準FA通過相互吸引和移動在整個搜索空間中搜尋最優(yōu)解,但其在迭代后期容易在極值點周圍反復振蕩而無法收斂于極值點.另外,螢火蟲種群多樣性在迭代過程中會隨著迭代次數(shù)的增加反而下降,增加了算法陷入局部極值的概率.針對上述缺陷,本文對標準螢火蟲算法進行如下改進,避免其陷入“早熟”,提高其搜索精度.
1) 基于慣性權(quán)重的改進
由式(2)可知,螢火蟲個體之間的吸引度會伴隨著距離的減小而增大,導致在移動的過程中由于移動距離過大而造成尋優(yōu)結(jié)果無法收斂在最優(yōu)位置的問題.因此,在基本螢火蟲算法的位置更新公式(1)中加入如下式所示的慣性遞減權(quán)重,以提高算法后期收斂速度和尋優(yōu)精度:
w=wmax-(wmax-wmin)t/MaxGeneration
(3)
其中:wmax、wmin分別為最大、最小權(quán)重;t為當前迭代次數(shù);MaxGeneration為算法最大迭代次數(shù).改進后的位置更新公式如下:
xi(t+1)=wxi(t)+β(xj(t)-xi(t))+αεi
(4)
通過上述改進,可使算法在迭代初期具有較大的權(quán)值,算法的全局尋優(yōu)能力較強,避免陷入局部極值;算法迭代后期,權(quán)值逐漸減小,算法局部尋優(yōu)能力增強,可有效避免因移動距離過大而反復振蕩無法收斂于最優(yōu)位置的問題.
2) 引入混沌優(yōu)化機制
本文在上一步算法改進的基礎(chǔ)上,引入混沌機制,運用混沌機制的隨機性和遍歷性特點,進一步提高算法尋優(yōu)的精確度,豐富算法種群多樣性和提高算法尋找最優(yōu)解的遍歷性,避免算法陷入局部最優(yōu)解.
混沌優(yōu)化[19]是將變量利用映射規(guī)則轉(zhuǎn)換到混沌空間,運用混沌變量本身所具有的遍歷和隨機性特點進行尋優(yōu)操作,進而將產(chǎn)生的解利用轉(zhuǎn)換公式轉(zhuǎn)化到優(yōu)化空間.本文采用的映射規(guī)則是目前應(yīng)用最為廣泛的Logistic映射,表示為
(5)
(6)
其中:xd,max、xd,min分別表示第d維變量的上、下限.
螢火蟲的混沌優(yōu)化過程為:在每一輪迭代中,選取適應(yīng)度函數(shù)最高的N個個體作為精英個體進行混沌優(yōu)化操作,依照式(5)得到完全混沌化的序列,然后利用式(6)將式(5)所得混沌序列變換回螢火蟲搜索空間,最終對精英個體進行混沌搜索,若搜索到更優(yōu)解則予以替換.
本文針對RBF神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元基函數(shù)寬度δj及隱含層和輸出層之間的連接權(quán)值ωjp選取不當會降低短時交通流預測精度的問題,提出利用螢火蟲算法優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的基函數(shù)寬度和連接權(quán)值;另外,基本螢火蟲算法在迭代過程中會出現(xiàn)易陷入局部極值和種群多樣性匱乏的問題,故本文采用慣性遞減權(quán)重和混沌搜索機制來解決基本FA存在的上述問題.本文構(gòu)建的IFA-RBF神經(jīng)網(wǎng)絡(luò)短時交通流預測模型結(jié)構(gòu)如圖1所示.
圖1 預測模型結(jié)構(gòu)圖Fig.1 Forecast model structure diagram
IFA-RBF模型交通流預測步驟具體如下:
Step1:交通流數(shù)據(jù)預處理.
Step2:設(shè)置FA算法中的光強吸收系數(shù)γ,光源處最大亮度β0,隨機步長因子α,種群大小,最大運行次數(shù).
Step3:利用每只螢火蟲對RBF神經(jīng)網(wǎng)絡(luò)的基函數(shù)寬度δj和連接權(quán)值ωjp共同編碼,這里采用實數(shù)編碼.將訓練誤差倒數(shù)作為適應(yīng)度函數(shù),適應(yīng)度越大熒光亮度越高.
Step4:利用式(3)計算慣性權(quán)重,根據(jù)式(4)更新螢火蟲的位置,螢火蟲個體隨機移動.
Step5:更新螢火蟲熒光亮度,將新的螢火蟲位置向量代入神經(jīng)網(wǎng)絡(luò)適應(yīng)度函數(shù)繼續(xù)計算熒光亮度.
Step6:取螢火蟲種群中前N個精英個體進行式(5)和式(6)的混沌操作并進行遍歷搜索,若搜索到更優(yōu)位置,則更新精英個體,否則直接轉(zhuǎn)入下一步.
Step7:判斷是否滿足終止條件,滿足跳出循環(huán)輸出全局最優(yōu)個體,如不滿足返回Step3繼續(xù)迭代.
Step8:輸出最優(yōu)解并解碼,解碼得到神經(jīng)網(wǎng)絡(luò)的最優(yōu)參數(shù)并訓練網(wǎng)絡(luò).
Step9:將測試樣本放入訓練好的神經(jīng)網(wǎng)絡(luò)模型進行測試,算法結(jié)束.
IFA-RBF短時交通流預測模型的流程如圖2所示.
圖2 IFA-RBF的算法流程圖
為驗證本文提出模型的有效性,采用來自美國加州運輸局運行監(jiān)測系統(tǒng)提供的2016年5月1日至14日連續(xù)10個正常工作日的交通流量數(shù)據(jù)進行實驗結(jié)果分析,每隔5 min進行一次數(shù)據(jù)采集,即每天可獲取288組流量數(shù)據(jù),實驗數(shù)據(jù)總計2 880組.
本文采用sym8小波基函數(shù)對信號進行4層分解、降噪和重構(gòu),濾除原始交通流數(shù)據(jù)中包含的噪聲成分,為預測模型提供高質(zhì)量數(shù)據(jù).經(jīng)過降噪后的數(shù)據(jù)充分體現(xiàn)了交通系統(tǒng)的復雜性、非線性及不確定性,數(shù)據(jù)降噪前后的實驗效果對比如圖3和圖4所示.
圖3 降噪前交通流量Fig.3 Traffic flow before noise reduction
圖4 降噪后交通流量Fig.4 Traffic flow after noise reduction
為確定RBF神經(jīng)網(wǎng)絡(luò)輸入樣本數(shù),將采集到的一維交通流時間序列經(jīng)過降噪處理后,利用C-C法獲得的嵌入維數(shù)當作神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點數(shù),經(jīng)過重構(gòu)后的多維時間序列為
X=[xi,xi+τ,…,xi+(m-1)τ]T(i=1,2,…,M)
(7)
式中:m為嵌入維數(shù);τ為延遲時間;M為相點個數(shù).實驗結(jié)果得到τ=31,τw=178,最終計算得m≈7.實驗表明,當神經(jīng)網(wǎng)絡(luò)輸入層節(jié)點數(shù)等于嵌入維數(shù)m時,預測混沌時間序列的效果最好,故輸入層節(jié)點數(shù)目定為7.隱含層節(jié)點數(shù)會對預測結(jié)果造成不同程度的影響,目前各領(lǐng)域?qū)W者對隱含層節(jié)點數(shù)的選定都是針對具體問題視情況而定,本文通過多次反復實驗,最終將隱含層節(jié)點數(shù)定為11;另外,將網(wǎng)絡(luò)輸出層節(jié)點數(shù)定為1.因此,最終確定的RBF神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是7-11-1.其訓練過程是在無需改變網(wǎng)絡(luò)結(jié)構(gòu)的前提下,通過隨機設(shè)定結(jié)構(gòu)內(nèi)部參數(shù)來完成網(wǎng)絡(luò)訓練.為了提升預測精度,本文采用改進的螢火蟲算法來優(yōu)化RBF神經(jīng)網(wǎng)絡(luò)的參數(shù),使神經(jīng)網(wǎng)絡(luò)的參數(shù)不再是隨機生成而是通過算法選優(yōu)來達到最佳設(shè)置.
本文將采集到的交通流時間序列經(jīng)過小波降噪和相空間重構(gòu)后劃分成訓練集和測試集兩部分進行實驗,實驗中,選取5月1日到5月14日之間前九天工作日數(shù)據(jù)對IFA-RBF網(wǎng)絡(luò)進行訓練,將第十天數(shù)據(jù)用作測試,檢驗?zāi)P偷挠行?通過實驗,最終螢火蟲算法的光強吸收系數(shù)γ取為1,種群規(guī)模為30,最大進化代數(shù)設(shè)為100,步長因子α為0.25,螢火蟲之間的吸引度β為0.2,取種群中適應(yīng)度函數(shù)最好的前10%作為精英個體,權(quán)重wmax和wmin分別為1.1和0.7,RBF網(wǎng)絡(luò)學習速率為0.01.為了檢驗本文所提預測模型的效果,在同一數(shù)據(jù)集上利用5種模型進行預測,其中:模型1為Elman神經(jīng)網(wǎng)絡(luò)[20](Elman neuron network)模型,模型2為BP神經(jīng)網(wǎng)絡(luò)模型,模型3為RBF神經(jīng)網(wǎng)絡(luò)模型,模型4為基本螢火蟲算法FA優(yōu)化的RBF神經(jīng)網(wǎng)絡(luò)模型(FA-RBF),模型5為IFA-RBF神經(jīng)網(wǎng)絡(luò)模型.以上五種模型的預測結(jié)果如圖5和圖6所示.
圖5 五種模型的實驗結(jié)果對比圖Fig.5 Comparison chart of experimental results of five models
圖6 五種模型的實驗結(jié)果局部圖Fig.6 Partial graph of experimental results of five models
從圖5和圖6五種模型的預測效果對比可以看出,幾種模型均能對交通流進行預測,但是預測效果相差很大.通過實驗對比發(fā)現(xiàn),Elman神經(jīng)網(wǎng)絡(luò)的預測曲線與實際交通流曲線差別很大,預測效果是五種模型中最差的;而RBF神經(jīng)網(wǎng)絡(luò)模型的預測結(jié)果相比Elman和BP神經(jīng)網(wǎng)絡(luò)模型而言,和實際曲線的擬合程度相對較高,即預測更加準確.FA-RBF和IFA-RBF模型相比其他三種模型來說,預測曲線和實際交通流曲線的擬合程度明顯提升,預測精度提高,說明利用螢火蟲算法改進RBF神經(jīng)網(wǎng)絡(luò)的參數(shù)可以有效提高短時交通流的預測精度.還可以得出,IFA-RBF的預測輸出曲線和實際交通流曲線的擬合程度明顯最高,說明其預測準確度相對其他四種模型來說達到最高.因此,可以得出IFA-RBF短時交通流預測模型能夠很好地預測混沌時間序列.
通過圖5和圖6的預測輸出曲線不能客觀公正地分析預測模型的預測效果好壞.為了更進一步直觀地表達五種模型的預測結(jié)果,用均方根誤差(root mean square error,RMSE)、平均相對誤差(mean absolute percentage error,MAPE)和平均絕對誤差(mean absolute error,MAE)量化評價各模型的預測結(jié)果(見表1).另外,這里將隱含層節(jié)點數(shù)也作為各種模型預測結(jié)果的影響因素進行了實驗對比分析,表2和表3表示在其他參數(shù)不作改變的情況下當隱含層節(jié)點數(shù)目分別為9和13時的各模型預測結(jié)果對比.三種評價指標定義如下:
(8)
(9)
(10)
其中:yi為真實的交通流量;y′i為模型預測流量值;n為樣本數(shù)量.
從表1~3對比可得出,神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點數(shù)目的確能對預測精度產(chǎn)生一定程度的影響.表2表明,當神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點數(shù)目少于最佳節(jié)點數(shù)時,各類模型預測誤差明顯增大,說明神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點過少會導致網(wǎng)絡(luò)出現(xiàn)“欠擬合”現(xiàn)象,網(wǎng)絡(luò)訓練不夠充分,導致預測精度降低;另外,從表3可以得出,當神經(jīng)網(wǎng)絡(luò)隱含層節(jié)點數(shù)目多于最佳節(jié)點數(shù)時,各模型預測誤差均有所降低,但是降低的效果并不明顯,反而會造成由于隱含層節(jié)點數(shù)目變多導致的網(wǎng)絡(luò)整體結(jié)構(gòu)變復雜的問題;說明在利用神經(jīng)網(wǎng)絡(luò)模型預測短時交通流時,隱含層節(jié)點數(shù)目的選取對預測精度有一定程度的影響.通過表1可以看出,當各類預測模型隱含層節(jié)點數(shù)目為11時,本文所構(gòu)建的IFA-RBF神經(jīng)網(wǎng)絡(luò)模型的預測精度相比較其他傳統(tǒng)預測模型精度有了明顯提升,其三個誤差指標均達到最低,其RMSE是8.703 0,MAPE是10.722 9,MAE為6.962 5,F(xiàn)A-RBF模型預測效果次之;IFA-RBF預測模型的RMSE值相比Elman、BP、RBF、FA-RBF模型分別降低了4.029 4、3.365 3、2.829 3、0.724 3,說明本文提出的IFA-RBF預測模型可以很好地預測分析短時交通流量.
本文提出一種基于IFA-RBF神經(jīng)網(wǎng)絡(luò)的短時交通流預測模型.該模型通過引入線性遞減慣性權(quán)重和混沌搜索機制改進的螢火蟲算法優(yōu)化了基礎(chǔ)RBF神經(jīng)網(wǎng)絡(luò).通過改進方法使得螢火蟲算法的全局和局部搜尋能力得到平衡,避免算法陷入“早熟”.該模型充分利用了螢火蟲算法優(yōu)秀的全局尋優(yōu)能力和RBF神經(jīng)網(wǎng)絡(luò)強大的非線性擬合性能來提高短時交通流量的預測精度.通過實驗對比表明,本文提出的模型相比傳統(tǒng)RBF神經(jīng)網(wǎng)絡(luò)預測模型精度大為提高,說明通過FA對RBF神經(jīng)網(wǎng)絡(luò)的基函數(shù)寬度和連接權(quán)值進行選優(yōu),可以使RBF神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)參數(shù)設(shè)置達到最優(yōu),從而更好地預測短時交通流;另外,通過對基本FA的位置更新公式和搜索機制進行改進,可以進一步提高短時交通流預測精度,為智能交通系統(tǒng)的交通控制和誘導提供決策依據(jù).