任柏寒 丁雪梅
吉林建筑科技學院,吉林 長春 130000
智能交通是解決現(xiàn)代社會各種交通問題的新途徑。在數(shù)據(jù)采集過程中,環(huán)境變化和使用壽命往往會損壞數(shù)據(jù)采集器,使采集到的數(shù)據(jù)異常或完全丟失。因此,在數(shù)據(jù)分析之前,應清理收集的數(shù)據(jù),修復數(shù)據(jù)中的異常值,并對缺失點和缺失段進行插值,以提高樣本的準確性。利用該算法對數(shù)據(jù)進行有效的修復,可以促進智能交通更好更快的發(fā)展。
首先,通過交通部門獲得交通流數(shù)據(jù)并進行處理,為了方便觀察,以矩陣形式進行排列表示,矩陣內(nèi)容包括每天通過該監(jiān)測點的交通流和外部因素,其中外部因素以獨立編號的形式記錄以方便控制變量,交通流數(shù)據(jù)以垂直編號記錄。數(shù)據(jù)簡單處理后就可以進行交通流參數(shù)預測,以提高城市道路資源的利用率。在預測時,交通流數(shù)據(jù)的垂直編號用于預測未來交叉口的交通流量。因此,時間間隔設置為24小時(N),每日交通流矩陣為X∈RN。其中矩陣中的元素為Xi,y,i是交叉點的5分鐘存儲單元號,j是交叉點的特征。該方法不僅可以預測交叉口的日流量,還可以每5分鐘實現(xiàn)流量預測,從而可以得到更細粒度的結(jié)果,有利于交通管理和調(diào)度。時間存儲單元的Gru-RNN模型[1]包括三個不同的存儲單元,第一個存儲單元對應短期記憶,用于臨時存儲,第二個存儲單元對應周期記憶,用于預測數(shù)據(jù)流,第三個存儲單元對應長期記憶,用于存儲驗證后的預測數(shù)據(jù)。捕獲數(shù)據(jù)中的交通流特征并分別擬合,根據(jù)不同的比重對子存儲單元的數(shù)據(jù)進行加權(quán)融合,通過訓練得到最終結(jié)果。
Gru-RNN模型參數(shù)在實際使用過程中可以自動化調(diào)整,即在使用過程中,根據(jù)輸入數(shù)據(jù)確定后續(xù)數(shù)據(jù)并通過預設的比重進行調(diào)整。在確定模型的單位運行長度時,模型將根據(jù)數(shù)據(jù)計算實際誤差,并通過誤差來反復調(diào)整預設比重。在計算實際誤差過程中,實時對誤差進行監(jiān)控,當誤差最小時,此時模型對應的數(shù)據(jù)參數(shù)將作為模型的最優(yōu)數(shù)據(jù)參數(shù)進行記錄。同時模型的部分參數(shù)還可以人為預置,可以認為預設的參數(shù)包括節(jié)點參數(shù)、模型層級參數(shù)、對象優(yōu)化函數(shù)、目標損失函數(shù)、加權(quán)激活函數(shù)等,這些參數(shù)的設置一般都是通過反復試驗來獲得最佳參數(shù)。通常,試驗過程中使用測試方法來確定這些參數(shù)。在預測時可以使用tanh函數(shù)作為加權(quán)激活函數(shù)。tanh函數(shù)是深度神經(jīng)網(wǎng)絡模型中一種常用的激活函數(shù),這種函數(shù)圖像中心對稱,具有極為快速的計算速度。同時使用RMSE作為目標損失函數(shù)來對模型預測結(jié)果進行驗算。采用Adam函數(shù)作為對象優(yōu)化函數(shù),對象優(yōu)化過程中對計算機性能具有較高要求,因為在計算時數(shù)據(jù)量較大,需要同時批處理次數(shù)至少為30次。確定上述手動預設參數(shù)后,需要確定模型的模型層級參數(shù),模型層級參數(shù)的節(jié)點參數(shù)數(shù)必須小于n-1(n為樣本數(shù))。如果超過樣本數(shù),則模型的系統(tǒng)誤差與訓練樣本無關(guān)。構(gòu)建的模型就無法基于這些參數(shù)產(chǎn)生合理的預測,且模型層級參數(shù)不能由固定的公式確定,因此只能通過實驗或者查閱文獻來確定最佳值。將最初的模型層級參數(shù)設置為2,節(jié)點參數(shù)設置為1。在訓練期間添加dropout算法以避免過度擬合,為了提升提高網(wǎng)絡性能需要防止特征檢測器的聯(lián)合。
對于缺失數(shù)據(jù)的處理,方法如下:
①對于較小的數(shù)據(jù)源[2],如僅一周的交通流信息,可以丟棄,丟棄的數(shù)據(jù),不再使用相同的方法獲得,而是通過數(shù)據(jù)多層篩分,并對篩分后的數(shù)據(jù)進行描點繪圖,再通過圖像觀察發(fā)現(xiàn)缺失數(shù)據(jù),將丟棄的數(shù)據(jù)進行補足或者徹底丟棄,徹底丟棄后僅使用其他的交通流量平均值來填充缺失數(shù)據(jù)。
②對于數(shù)據(jù)量較大的數(shù)據(jù)源,先根據(jù)數(shù)據(jù)建立活動模型再根據(jù)活動模型來預測部分缺失數(shù)據(jù),從而獲得更完整的交通流信息。
③交通流數(shù)據(jù)在分時段處理后具有時段性,同時在交通岔路口采集信息具有空間性,此時可以采用均方法、期望值法或者增量法對缺失數(shù)據(jù)進行數(shù)值補足。
對于冗余數(shù)據(jù)的處理,方法如下:
①對應完全重復的數(shù)據(jù),先保留一條數(shù)據(jù)然后刪除其余數(shù)據(jù)。
②對應多條相似的數(shù)據(jù),取平均值或者中值,最后留下簡短記錄。
編程環(huán)境采用Matlab7.1,利用改進的NSGA[3]對編號序列過程進行了仿真。計算步驟如下:
第一步:輸入收集數(shù)據(jù)和對變量進行初始化。輸入交叉口具體結(jié)構(gòu)、流量變化數(shù)據(jù)、相位移動數(shù)據(jù)和相序排列數(shù)據(jù);考慮4個約束條件,在可行區(qū)域內(nèi)生成多個個體并成種群,形成初始種群,同時設置遺傳代數(shù);對初始參數(shù)進行設置,其中種群數(shù)據(jù)范圍為50,汽車運動交叉概率為0.95。直行數(shù)據(jù)平行交叉,變異概率為0.08,變異來源為不遵守交通規(guī)則的車輛和行人。終止計數(shù)迭代最大值為80,連續(xù)計算至少80次以獲得最佳參數(shù)。
第二步:推算單個車輛行駛過程中直行、左轉(zhuǎn)和右轉(zhuǎn)的概率。
第三步:選擇多個車輛的數(shù)據(jù)進行擬合。
第四步:將多個車輛的數(shù)據(jù)交叉處理,以適應復雜的交通環(huán)境。
第五步:將變異概率計入計算,以適應變化。
第六步:如果迭代數(shù)值達到80,停止迭代操作,對迭代過程中的數(shù)據(jù)進行統(tǒng)計,尋找誤差最小的迭代輪次產(chǎn)生的數(shù)據(jù)作為最佳數(shù)據(jù)參數(shù);否則,進入第一步。
仿真時的管控時段劃分步驟如下:
第一步:計算交叉口流量比。四階段交叉以交叉口的東西入口為例,計算交叉口的流量比:對于大多數(shù)交叉口,右轉(zhuǎn)沒有專用信號燈,只需計算交叉口左轉(zhuǎn)和直行車道的交通流,每個入口通道的左側(cè)應考慮轉(zhuǎn)彎和直行車道的數(shù)量。
第二步:比較各相位大小下緩解車道的交通流量比,以流量比最大的車道為關(guān)鍵車道,流量比作為交叉口信號周期的計算參數(shù)。由于第一步采用東西入口為例,車輛方向固定沿東西方向,即只需比較向東或者向西的直接流量比。
仿真得到的數(shù)據(jù)目標不會朝著同一個方向完全改變,隨著仿真次數(shù)的增加,通過降低平均車速,而提高整個交通容量,同時不可避免地增加平均延誤。
在對數(shù)據(jù)仿真處理后,得到了多個理想模型下的交叉口車流模型,即通過大數(shù)據(jù)對未來的交叉口的路況進行預測,仿真采用基于parcto解的多目標遺傳算法,它將傳統(tǒng)的多目標處理方法轉(zhuǎn)化為單目標問題,在多次仿真演算的過程中更貼合交叉口的實際數(shù)據(jù),得到的最終模型也更能代表交叉口的實際路況。
在交通流不飽和的情況下,以不同時段的信號周利潤韋伯斯特最優(yōu)周期作為計算時間段的精確劃分控制依據(jù)。當車隊即將延伸到上游路口時,知道堵車情況后趕來的司機,結(jié)合一定的交通誘導和交通組織等手段進行交通分流,使交叉口處于非飽和交通流狀態(tài),周期計算仍采用韋伯斯特法。僅使用交通量作為時間劃分的基礎(chǔ),不能使用交通量,它反映了每個進口通道不同流向的特性。由于交叉口的現(xiàn)狀,大多數(shù)交叉口都存在流向不一致的問題,且流量僅來自交叉口,大小被劃分為時間段,沒有考慮流向之間的差異,導致劃分依據(jù)不足?;谏鲜隹紤],本文根據(jù)韋伯斯特最優(yōu)周期計算各流向的流量比,周期的計算值取閾值范圍內(nèi)各周期信號周期之間的絕對差值,作為同一控制周期外信號周期的絕對差值該范圍用作另一個管控制周期。
時段劃分步驟如下:
第一步:計算交叉口流量比。對于四階段交叉以交叉口的東西入口為例,計算交叉口的流量比,其中對于大多數(shù)交叉口,右轉(zhuǎn)沒有專用相位,只需計算交叉口左轉(zhuǎn)和直行車道的交通流量。交通量較大,每個入口通道的左側(cè)應考慮轉(zhuǎn)彎和直行車道的數(shù)量。
第二步:比較各相位大小下緩解車道的車流比,以車流比最大的車道為關(guān)鍵車道,以車流比作為交叉口信號周期的計算參數(shù),由于以東西入口為例,車輛均從東向西直行,即只需比較東向流向直接流量比、西入口直接流量減去流量比的大小和較大的流量比用作第一階段的臨界流量比。同樣,其他階段的臨界流量比也可通過該方法獲得。
第三步:求每個階段的關(guān)鍵流量比之和,即交叉口流量比。
時段劃分之后進行配時選擇,解決不同時段交叉口信號燈的配時問題,采用改進的SGA.II算法,具體方法步驟如下:
第一步:編號。編號是使用染色單位來表示算法問題的解決方案的過程。在單交叉口信號配時設計中,每個交叉口車道只有等待通行和超車兩種狀態(tài),對不同狀態(tài)下的路口設置不同的顏色。因此,車道狀態(tài)可以用紅-綠雙色進行編號:當顏色為綠色時,表示對應入口車道上的車輛可以通行;相反為紅色時,則表示入口車道上的相位車輛應進行等待。
第二步:計算。首先對染色單位進行譯碼,然后根據(jù)分段時區(qū)產(chǎn)生的流量模型來計算每個個體對應的目標函數(shù),再根據(jù)目標函數(shù)的值計算每個個體的虛擬適應度。
第三步:選擇運算。選擇運算的具體方法為:隨機抽取2名個體。如果個體級別不同且不小于2,則取高級別(即小級別)的個體;如果兩個個體處于同一水平,則選擇相對密度較小區(qū)域中的個體,根據(jù)熵增定律多個個體在無干擾環(huán)境下會無序運動,而最優(yōu)解在無干擾環(huán)境下運動范圍小,此時密度較小的區(qū)域具有較大概率活動最優(yōu)解。
第四步:保留策略。SGA.II算法采用了一種新的后代選擇方法對后代進行保留,保留父代中的優(yōu)秀個體,保證了后代種群的良好優(yōu)化。
在實際劃分中,需要考慮交通效率:一般考慮交叉口相位,采用對稱法,理想模型下,直行車道飽和流量為1600 veh/h;左轉(zhuǎn)車道飽和流量一般為1500輛/h;轉(zhuǎn)換為車頭時距,直線行駛2.25 s,左轉(zhuǎn)2.4 s。如果循環(huán)增加5 s,這種情況下所有時間都增加到同一階段,即一個階段的時間增加5 s,這意味著該階段在每個循環(huán)中通過2輛以上的車輛。因此,校準標準定義為每循環(huán)至少通過2輛車;同時,應考慮排空時間。車輛直線行駛比左轉(zhuǎn)快,行駛距離短,最基本的安全保證至少是直線行駛。車輛的排空時間應根據(jù)車輛在城市道路上的平均行駛速度計算為36 km/h。對于距離道路50 m處交叉口的東西入口或南北入口,在綠燈結(jié)束時進入交叉口,直行車輛通過交叉口至少需要5 s。因此,在城市主交叉口或主、次交叉口的交叉口反方向行駛時,出入口距離基本大于50 m,保證在此期間至少增加5 s。
本文通過流量大數(shù)據(jù)來預測交叉口某個時間段的理想狀態(tài)下的流量,得到一個最優(yōu)解使交叉口的車輛得以快速通過。首先是采集數(shù)據(jù);然后對數(shù)據(jù)的缺失、冗余部分進行處理;再將處理后的數(shù)據(jù)代入Matlab7.1編程環(huán)境下,利用改進的NSGA對編號序列過程進行了仿真,得到了多個無外界干擾下的理想模型;最后對理想模型下的路口進行時段劃分,并結(jié)合實際情況對東西走向的交叉口的信號燈做出實際時段劃分。