姚磊,劉淵
1.江南大學物聯網工程學院,江蘇無錫 214122
2.江南大學數字媒體學院,江蘇無錫 214122
基于改進模糊聚類與ANFIS的高速公路事件檢測
姚磊1,劉淵2
1.江南大學物聯網工程學院,江蘇無錫 214122
2.江南大學數字媒體學院,江蘇無錫 214122
交通事件[1]是指導致道路通行能力下降或交通需求不正常升高的非周期性發(fā)生的情況,事件一般可分為可預測的和不可預測的兩類??深A測類交通事件包括大型活動、道路修筑、路面養(yǎng)護等。不可預測類交通事件主要包括交通事故、車輛拋錨、貨物散落等。
對于不可預測類交通事件,其發(fā)生的時間和地點無法事先獲知,駕駛員無法采取躲避措施,尤其高速公路具有車流量大和行車速度高的特點,一旦發(fā)生交通事故則往往非常嚴重,不僅一次事故影響的車輛多、傷亡率高,會造成嚴重的交通阻塞和行車延誤,還會引起二次事故的發(fā)生,嚴重影響高速公路的整體通行能力和運營效率。因此,本文主要研究對象為高速公路的不可預測類交通事件。
目前國內外對交通事件檢測算法的研究主要集中在新理論和新技術的應用方面,包括神經網絡、模糊理論、小波分析以及支持向量機等,例如張良春等[2]采用一種改進的模糊C均值聚類對訓練樣本進行預處理,提取有可能成為支持向量的訓練樣本,通過分析事件產生對交通流的影響,選擇了支持向量機的輸人參數,并進行了算法仿真;?ingliar和Hauskrecht[3]運用動態(tài)樸素貝葉斯和EM算法對實測數據進行標簽重排,然后利用SVM算法進行分類,取得了較好的結果;彭宇[4]利用突變理論分析了事件發(fā)生對高速公路交通流特性的影響,建立了突變交通流模型,并利用小波理論的事件檢測算法進行了離線檢驗。
本文將自適應模糊神經推理系統(tǒng)應用于高速公路事件檢測中,提出了用減法聚類對模糊C均值算法進行改進,生成初始模糊推理系統(tǒng),使模型自適應地確定模糊系統(tǒng)的初始結構和參數,避免了盲目性和隨機性;利用ANFIS建立交通事件檢測模型,采用最小二乘算法和反向傳播算法對模糊規(guī)則的參數進行訓練獲得最終的模型,并進行了仿真驗證。
自適應模糊神經推理系統(tǒng)[5](ANFIS),屬于神經模糊網絡的一種。ANFIS融合了人工神經網絡的自適應學習功能與模糊系統(tǒng)的語言推理功能,并彌補了各自的不足。ANFIS可自動地從輸入輸出數據中提取規(guī)則,并依據神經網絡的自學習性,調整優(yōu)化前件參數和結論參數,提高模糊系統(tǒng)的推理性能。
其對應的結構圖如圖1所示。
圖1 ANFIS結構圖
第一層的功能是輸入變量模糊化,輸出為各輸入變量所對應的模糊隸屬度函數。
第二層的功能是計算每條規(guī)則的適應度,在圖中用Π表示,它的輸出是所有輸入信號的積,表示規(guī)則的激勵強度,其乘積輸出為:
第三層的功能是將所有規(guī)則的激勵強度歸一化,在圖中用N表示,它計算第i條規(guī)則的激勵強度與所有規(guī)則的激勵強度之和的比值:
第四層的功能是計算每條模糊規(guī)則的輸出,這一層的每個節(jié)點i都為一個有節(jié)點函數的自適應節(jié)點:
第五層的功能是計算模糊系統(tǒng)的輸出,這一層的單節(jié)點是一個標以∑的固定節(jié)點,它計算所有輸入信號之和作為總輸出:
從ANFIS的結構可以看出,ANFIS屬于一種典型的自適應網絡,其目的是對前件參數與結論參數進行調整優(yōu)化,當前件參數固定時,系統(tǒng)的總輸出可以表示為后件參數的線性組合,用符號表示即:
其中,θ={pi1,pi2,pi3,pi4,pi5,pi6}為后件參數集。固定前件參數不變,則式(1)是標準的線性最小二乘問題,使用最小二乘估計算法調整后件參數θ,接下來,固定上一步計算得到的后件參數,對前件參數采用前饋神經網絡的BP算法,將誤差由輸出端反傳到輸入端,由梯度下降法更新前件參數,從而改變隸屬函數的形狀,完成前件參數的識別。
3.1 減法聚類算法原理
減法聚類[6-7]是一種快速尋找數據集的聚類數和聚類中心的算法,該算法選取數據集中所有數據點為候選聚類中心。令(x1,x2,…,xn)是M維空間中的n個數據點,按照減法聚類選擇每一個數據點作為候選聚類中心,使用式(2)計算數據點xi處的密度值:
其中,參數rα是密度的作用半徑,rα越小則所得到的聚類數目就越多。在計算完每個數據點密度指標后,選擇密度值最高的數據點Xc1作為第一個聚類中心,按照式(3)修正該點的密度指標:
其中,Xc1為選中的聚類中心,Dc1為該聚類中心的密度值,參數rβ定義了密度指標顯著減小的鄰域,通常rβ=1.5rα,以避免出現距離很近的聚類中心。
在修正第一個數據點的密度指標后,重新選擇當前密度值最高的數據點作為下一個聚類中心,利用式(3)對所有數據點進行密度值調整。重復以上步驟,當剩余數據點作為聚類中心的可能性低于某一閾值時,停止聚類中心搜索。
3.2 FCM聚類算法原理
模糊C均值聚類[8-10](FCM),即模糊ISODATA,是用隸屬度確定每個數據點屬于某個聚類程度的一種聚類算法。其基本思想是通過反復修改聚類中心V和分類矩陣U來實現動態(tài)的迭代聚類,使得被劃分到同一簇的對象之間相似度最大,而不同簇之間相似度最小。
給定觀察空間的一樣本集xi(i=1,2,…,n),c為預定的類別數目,mj為每個聚類的中心,μj(xi)是第i個樣本對于第j類的隸屬度函數。用隸屬度函數定義的聚類損失函數可以寫為:
其中,b∈[1,∞)是一個加權指數,可以控制聚類結果的模糊程度的常數,通常取2。標準模糊C均值方法要求一個樣本對于各個聚類的隸屬度之和為1,即:
令Jf對mj和μj(xi)求導,使得式(4)達到最小的必要條件為:
用迭代方法求解式(6)和式(7),算法步驟如下:
步驟1給定聚類數目c,加權指數b,容許誤差ε的值。
步驟2隨機初始化聚類中心mj(1)(j=1,2,…,c)。
步驟3用當前聚類中心根據式(7)計算隸屬度函數。
步驟4根據式(6)修正聚類中心mj(k+1)(j=1,2,…,c)。
3.3 改進聚類算法
FCM聚類算法必須預先指定聚類中心數,無法充分利用數據信息的特征。而減法聚類無需規(guī)定聚類數,根據樣本數據即可快速決定聚類中心,既充分利用了數據本身提供的信息,又加快了收斂速度。本文將減法聚類后得到的聚類中心全部用于初始FCM的聚類中心,加快了FCM的收斂速度,減少了由用戶確定聚類中心個數的盲目性。
3.4 交通事件檢測算法建模
本文采用SFCM-ANFIS算法模型流程圖如圖2所示,其具體步驟如下:
步驟1 I-880數據庫包括上下游速度,流量和占有率的測量值6個參數,首先對該數據進行預處理,利用Matlab的Mapminmax函數將樣本數據映射到[0,1]區(qū)間進行歸一化。
步驟2為減少人工因素干擾,本文利用減法聚類求得處理后樣本數據的聚類中心,然后將該聚類中心賦給FCM初始聚類中心,進行FCM聚類得到聚類數和聚類中心,若求得聚類個數為C,則隸屬度函數的個數為C×6,從而建立一個6輸入1輸出的ANFIS結構。
步驟3輸入得到的訓練樣本數據,采用反向傳播算法與最小二乘法的混合算法訓練ANFIS,若滿足訓練終止條件,即得到最終模糊推理系統(tǒng)。
步驟4利用驗證樣本數據對得到的FIS模型進行推理判斷,與樣本數據中類別標簽比較得到檢測率和誤報率兩個評價指標,并由此進行對比分析。
圖2 交通事件檢測模型流程圖
交通事件檢測算法常用評價指標有檢測率(Detection Rate,DR)、誤報率(False Alarm,FAR)和平均檢測時間(Mean Time to Detection,MTTD)。
本文不僅采用常用評價指標,還采用了接收者操作特性曲線[9](Receiver Operation Characteristic Curve,ROC)和曲線下面積(Area Under the Curve,AUC)來評價AID算法。
ROC曲線是以誤報率(False Positive Rate,FPR)為橫軸,檢測率(True Positive Rate,TPR)為縱軸,橫軸與長度相等,為單位l,形成一個正方形的二維空間,在此二維空間中將各個(FPR,TPR)點標出,用直線連接各相鄰兩點構建而成的一條曲線。
ROC曲線是分類器識別算法性能的二維直觀描述。為便于比較不同的識別算法,常計算ROC曲線下面積AUC。AUC的理論取值范圍在0.5~1.0之間,0.5對應幾率線(對角線)下的面積,1.0對應整個ROC平面的面積。ROC越快速逼近左上角,AUC越大,識別算法的性能就越好。
5.1 數據來源
本文采用美國加州I-880數據庫進行實驗仿真,它已經被廣泛應用在相似的事件檢測算法研究上。該數據庫前期采集時間為1993年2月16日—3月19日,后期采集時間為1993年9月27日—10月29日。I-880數據庫保存了交通流量、占有率、速度以及交通事件(包括貨物散落、車輛故障和交通事故等)的原始數據,是目前最大、最完整的高速公路交通數據庫;I-880交通數據總共記錄了4 136組交通事故數據樣本,共45起交通事件,本文隨機選取了其中22起交通事件,共2 100組樣本數據,與隨機選取的4 343組非事件樣本數據,共6 443組數據組成輸入樣本數據集。本文從樣本特征集中隨機選取60%的數據作為訓練樣本,20%的數據作為驗證樣本,剩下20%的數據作為測試樣本;選取上下游檢測器檢測到的速度、流量和占有率的測量值6個參數組成模型最初的特征輸入集,數據樣本有7列,最后一列為樣本數據的類別標簽,+1表示該樣本為有事件樣本,-1表示該樣本為無事件樣本。
5.2 實驗及結果分析
交通事件檢測算法常用評價指標有檢測率、誤報率和平均檢測時間。然而,在選擇算法時,通常要在這些評價指標中進行權衡,通常來說,為得到較高檢測率,必然有高誤報率,而為減少平均檢測時間,也會相應的降低檢測率。因此,本文除了采用均衡的常用評價指標外,還采用了ROC曲線及AUC值來對各種算法進行評價。
本文利用Matlab對算法進行仿真驗證[10,-1],并與其他算法進行比較。仿真實驗參數:SVM算法中懲罰參數c=300,核函數參數g=0.04,減法聚類中密度作用半徑rα=0.3。每種算法分別進行10次實驗,訓練的迭代次數均為200次,比較結果如表1所示。
表1 算法檢測性能比較
從對比實驗看出,無聚類算法的ANFIS平均檢測時間最高,無法達到交通事件檢測系統(tǒng)實時性的要求;SVM算法雖然得到了較好的平均檢測時間,但其誤報率較高且AUC值最小;減法聚類與本文所采用的基于改進FCM和ANFIS的算法的檢測時間大致相同,但本文所用方法具有較高的檢測率和較低的誤報率,并且它的AUC值均高于其他算法。
圖3 交通事件檢測ROC曲線對比圖
ROC曲線中的橫坐標表示誤報率,縱坐標表示檢測率,上述4種算法的ROC曲線如圖3所示。從圖中可以看出,SVM算法曲線在最下方,具有最低AUC值,并且當誤報率在0.4左右時,檢測率才能達到1.0;無聚類算法的ANFIS與基于減法聚類的ANFIS從曲線上看大致相同,但從表1可知,無聚類算法的ANFIS需要較高檢測時間,不滿足實時性要求,而且,兩種算法誤報率在0.2~0.3之間時,檢測率才能達到1;SFCM-ANFIS算法誤報率在0.1~0.2之間時,檢測率就可接近1,并且SFCM-ANFIS算法的曲線基本位于其他算法上方,具有最高AUC值,說明其整體性能較優(yōu)。
本文提出了基于改進FCM和ANFIS算法的高速公路交通事件檢測的新模型,使用減法聚類得到聚類中心初始化FCM算法,通過FCM聚類算法得到前件參數,建立初始模糊神經系統(tǒng),然后利用混合學習算法對該系統(tǒng)進行訓練,得到最終模糊神經系統(tǒng),最后用檢測數據對該系統(tǒng)進行模糊推理,判斷是否為高速公路事件。實驗結果表明,本文所采用的交通事件自動檢測模型是有效的,且總體性能優(yōu)于一般的事件自動檢測方法。同時,結合減法聚類和標準FCM對聚類算法進行改進,不僅充分利用了樣本數據信息,而且減少了由用戶確定聚類中心個數的盲目性,將改進后的算法應用于模糊系統(tǒng),從而提高模糊系統(tǒng)的應用效率。為了降低檢測時間,滿足實時性要求,今后將對交通流數據進一步進行處理,為得到更好的檢測結果,將進一步對ANFIS進行優(yōu)化處理,以提高其在交通事件檢測方面的性能。
[1]王曉原,張敬磊,楊新月.交通流數據清洗與狀態(tài)辨識及優(yōu)化控制關鍵理論方法[M].北京:科學出版社,2011.
[2]張良春,夏利民,石華瑋.基于模糊聚類支持向量機的高速公路事件檢測[J].計算機工程與應用,2007,43(17):206-208.
[3]?ingliar T,Hauskrecht M.Learning to detect incidents from noisily labeled data[J].Machine Learning,2010,79:335-354.
[4]彭宇.基于小波分析的高速公路事件檢測算法[J].湖南交通科技,2011,37(3):123-126.
[5]張智星,孫春在,水谷英二.神經-模糊和軟計算[M].西安:西安交通大學出版社,2000.
[6]曲強,陳雪波.基于ANFIS的鐵水脫硫系統(tǒng)的建模[J].模式識別與人工智能,2004,17(2):218-221.
[7]蔣靜芝,孟相如,李歡,等.減法聚類——ANFIS在網絡故障診斷的應用研究[J].計算機工程與應用,2011,47(8):76-78.
[8]邊肇祺,張學工.模式識別[M].2版.北京:清華大學出版社,2000.
[9]薛勝君,聶靖.基于混合優(yōu)化模糊C均值算法的網格資源聚類[J].計算機應用研究,2010,27(6):2153-2155.
[10]朱喜林,武星星,李曉梅.基于改進型模糊聚類的模糊系統(tǒng)建模方法[J].控制與決策,2007,22(1):73-77.
[11]張國良,王海娟,柯熙政,等.模糊控制及其MATLAB應用[M].西安:西安交通大學出版社,2002.
YAO Lei1,LIU Yuan2
1.School of Internet of Things,Jiangnan University,Wuxi,Jiangsu 214122,China
2.School of Digital Media,Jiangnan University,Wuxi,Jiangsu 214122,China
In order to accurately and timely detect highway traffic accident,reduce traffic delay and improve highway safety, this paper combines subtractive clustering and FuzzyC-Means(FCM)clustering method to cluster the input sample data to build the initial fuzzy inference system,then the hybrid algorithm is used to train the parameters of the fuzzy system,determine the fuzzy reasoning rules,and establish a final training fuzzy model.Compared with the simulation experimental results,the method obtains excellent performance on ROC(Receiver Operation Characteristic)curve,shows the validity of the modeling method based on the improved fuzzy clustering and Adaptive Neural Fuzzy Inference System(ANFIS).
freeway incident detection;FuzzyC-Means(FCM)clustering;subtractive clustering;Adaptive Neural Fuzzy Inference;ROC curve
為了準確并及時地發(fā)現高速公路上的交通事故隱患,減少事故引發(fā)的交通延遲,提高高速公路運行安全性,結合減法聚類與模糊C均值(FCM)聚類算法對輸入樣本數據進行聚類,建成初始模糊推理系統(tǒng),然后通過神經網絡的自學習機制,訓練模糊系統(tǒng)參數,確定模糊推理規(guī)則,建立最終模糊模型。通過仿真實驗結果對比,驗證了基于改進模糊聚類與自適應神經模糊推理系統(tǒng)(ANFIS)建模方法的有效性。
交通事件檢測;模糊C均值聚類;減法聚類;自適應神經模糊推理;ROC曲線
A
TP39
10.3778/j.issn.1002-8331.1112-0613
YAO Lei,LIU Yuan.Freeway incident detection based on improved fuzzy clustering arithmetic and ANFIS.Computer Engineering and Applications,2013,49(19):242-245.
國家自然科學基金(No.61103223);江蘇省自然科學基金重點研究專項(No.BK2011003)。
姚磊(1986—),女,碩士,主要研究領域為模式識別,事件檢測;劉淵(1967—),男,教授,主要研究領域為軟件工程,網絡應用。E-mail:yjs_latte@163.com
2012-01-04
2012-04-18
1002-8331(2013)19-0242-04
CNKI出版日期:2012-05-22http://www.cnki.net/kcms/detail/11.2127.TP.20120522.1108.008.html