徐紅飛 李婧
摘? 要:交通流異常檢測(cè)通常要考慮時(shí)間信息、空間信息等信息,這讓交通流異常檢測(cè)變得具有挑戰(zhàn)性。文章重點(diǎn)研究由交通事故、或短暫事件引起的非經(jīng)常性交通異常檢查。新提出的算法(GL-GCN)利用交通的時(shí)空數(shù)據(jù),空間信息采用圖卷積網(wǎng)絡(luò)捕獲,時(shí)間依賴性采用深度神經(jīng)網(wǎng)絡(luò)DeepGLO的方法建模。同時(shí)捕捉時(shí)空特性并建立預(yù)測(cè)交通流模型,利用異常分?jǐn)?shù)來判斷交通流異常。利用真實(shí)的交通流數(shù)據(jù),證實(shí)了提出的模型具有有效性和優(yōu)越性。
關(guān)鍵詞:交通流;異常檢測(cè);深度神經(jīng)網(wǎng)絡(luò);圖卷積網(wǎng)絡(luò);時(shí)空特征
中圖分類號(hào):TP39? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):2096-4706(2021)02-0070-06
Abstract:Traffic flow anomaly detection usually considers time information,spatial information and others,which makes traffic flow anomaly detection challenging. This paper focuses on the non-recurrent traffic anomaly inspection caused by traffic accidents or short-term events. The new algorithm(GL-GCN)uses the spatiotemporal data of traffic,the spatial information is captured by graph convolution network,and the time dependence is modeled by DeepGLO neural network. This algorithm captures spatiotemporal characteristics at the same time and establishes the traffic flow prediction model,and the traffic flow anomaly is judged by the anomaly score. The model is proved to be effective and superior by using the real traffic flow data.
Keywords:traffic flow;anomaly detection;deep neural network;graph convolutional network;spatiotemporal characteristics
0? 引? 言
異常檢測(cè)是數(shù)據(jù)挖掘的一個(gè)重要分支,是發(fā)現(xiàn)數(shù)據(jù)集中異常的現(xiàn)象,在金融、安全、醫(yī)療、執(zhí)法等領(lǐng)域有著廣泛的應(yīng)用。在交通工程領(lǐng)域,幾十年來,在道路系統(tǒng)上安裝了大量的交通監(jiān)控設(shè)備,但是在這些交通狀況數(shù)據(jù)的中,異常值是不可避免的[1]。通常異常值出現(xiàn)的原因包括兩種,一種是由于設(shè)備故障等原因產(chǎn)生的錯(cuò)誤數(shù)據(jù)或有效數(shù)據(jù),另外一種導(dǎo)致異常值出現(xiàn)的原因可能代表特殊事件的發(fā)生,如交通事故或惡劣的天氣條件。
交通流異常點(diǎn)或者異常序列在一定時(shí)間周期內(nèi),交通流數(shù)據(jù)與長(zhǎng)期交通流數(shù)據(jù)偏離較大[2]。為了提高異常檢測(cè)精度,一些研究應(yīng)用了傳統(tǒng)的機(jī)器學(xué)習(xí)來建立交通流異常檢測(cè)模型,例如聚類、k-means、EM(Expectation-Maximization)[3]
等無監(jiān)督模型和決策樹,貝葉斯、支持向量機(jī)(support vector machine,SVM)[4]等有監(jiān)督模型。還有一些學(xué)者利用LSTM(Long Short Term Memory networks)[5]、自動(dòng)編碼器[6]等深度神經(jīng)網(wǎng)絡(luò)提取交通流時(shí)間特征來檢測(cè)交通流異常。傳統(tǒng)的機(jī)器學(xué)習(xí)方法建模時(shí),模型的準(zhǔn)確率和有效性取決于數(shù)據(jù)的分布和大小,面對(duì)不同的數(shù)據(jù)時(shí),適用性并不高。
Philip等人[7]提出了一種核平滑樸素貝葉斯(Kernel Smooth Naive Bayes,KSNB)方法,用于自動(dòng)確定來自香港的交通數(shù)據(jù)中的錯(cuò)誤數(shù)據(jù)和異常交通流。作者假定交通流數(shù)據(jù)遵循核平滑分布,KSNB模型自動(dòng)確定數(shù)據(jù)由核分布形成的區(qū)域,這些區(qū)域以外的數(shù)據(jù)認(rèn)為是異常數(shù)據(jù)。Turochy和Smith[8]提出了一種多變量統(tǒng)計(jì)質(zhì)量控制(Multivariable Statistical Quality Control,MSQC)方法。此方法采用了其他交通流量變量(如平均速度和占用率),而不是使用一個(gè)單一的變量表示的流量值,這些變量導(dǎo)致了交通擁堵的情況。Dang等人[9]提出了一種基于KNN的交通異常值檢測(cè)方法,命名為KNN-F。Ngan等人[10]提出了基于密度的有界LOF(BLOF),這是LOF算法[11]的一個(gè)修改版本。Munoz-Organero等人[12]提出了一種基于距離的滑動(dòng)窗口中心(Sliding Window Center,SWC)算法,以檢測(cè)由諸如交通信號(hào)燈、街道交叉口或環(huán)形交叉口的特定交通條件引起的異常駕駛位置。Shi等人[13]提出了一種稱為動(dòng)態(tài)空間和時(shí)間流(DSTF)的動(dòng)態(tài)時(shí)空方法來檢測(cè)時(shí)空流數(shù)據(jù)中的局部異常?;诜植嫉母倪M(jìn)算法在不同場(chǎng)景的交通流異常檢測(cè)也有很大的局限性,例如在高速公路和大城市兩個(gè)場(chǎng)景中,城市道路的節(jié)點(diǎn)數(shù)量比較龐大,相對(duì)速度流比較小。高速公路的干路節(jié)點(diǎn)比較少,平均速度比較穩(wěn)定且比較高。這兩種的交通流異常判斷需要依靠歷史時(shí)間的交通流來分析,這就急需考慮時(shí)間特征。同時(shí),不同道路的相互影響也是必須要考慮的因素。
隨著神經(jīng)網(wǎng)絡(luò)的快速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的特征捕捉能力,更多學(xué)者開始使用深度學(xué)習(xí)來進(jìn)行交通流異常檢測(cè)。Wen等人[14]使用LVQ(Learning Vector Quantization)神經(jīng)網(wǎng)絡(luò)來檢測(cè)城市主干路中的異常。利用LVQ神經(jīng)網(wǎng)絡(luò)聚合上下游的占有率、平均速度等等來檢測(cè)異常。Hsu[15]提出了VRNN模型(Variational Recurrent Neural Network)來估計(jì)交通流時(shí)間序列的擁堵檢測(cè)方法,同時(shí)利用了圖卷積神經(jīng)網(wǎng)絡(luò)[16](Graph Convolutional Network,GCN)模型來提取空間上的特征,兩者結(jié)合來檢測(cè)異常。
在傳統(tǒng)的交通流異常檢測(cè)模型當(dāng)中,通常是提取時(shí)間、速度、車輛占有率等一些特征。這些特征并不能反映空間上交通的拓?fù)浣Y(jié)構(gòu),這樣可能對(duì)交通流的數(shù)據(jù)分析不準(zhǔn)確,并且導(dǎo)致下游的任務(wù)產(chǎn)生比較大的誤差。近幾年,隨著圖卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,該技術(shù)在知識(shí)圖譜分析、交通流預(yù)測(cè)中的運(yùn)用越來越廣。越來越多的時(shí)空卷積模型在交通流預(yù)測(cè)和交通流異常檢測(cè)中被提出。在交通流預(yù)測(cè)模型中,大多數(shù)的預(yù)測(cè)結(jié)果穩(wěn)定性并不高,一方面由于數(shù)據(jù)的不穩(wěn)定性,另一方是由于面在時(shí)間特征捕捉時(shí)通常使用RNN和GRU等常用的模型,而這些算法在數(shù)據(jù)節(jié)點(diǎn)比較少時(shí)有比較好的結(jié)果,反之,在交通流比較長(zhǎng)時(shí)表現(xiàn)的比較差。交通流異常檢測(cè)模型中,如VRNN模型中,預(yù)測(cè)和異常檢測(cè)的任務(wù)相對(duì)獨(dú)立,并不能有效地完成端到端的學(xué)習(xí)任務(wù),異常檢測(cè)的準(zhǔn)確度需要上游預(yù)測(cè)的有效性,不能完全適用于其他交通流數(shù)據(jù)集中。
在本文中,我們提出了一種基于深度學(xué)習(xí)的交通流異常檢測(cè)的模型,采用端到端的方法聯(lián)合捕捉交通流的時(shí)空特征來構(gòu)造異常檢測(cè)方法。其中,一方面利用圖卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)交通道路之間的拓?fù)浣Y(jié)構(gòu)(空間),另一方面,利用深度神經(jīng)網(wǎng)絡(luò)DeepGLO[17]學(xué)習(xí)交通流的時(shí)間序列特征。使用兩者共同建立交通流預(yù)測(cè)模型,然后根據(jù)預(yù)測(cè)值和真實(shí)值偏差設(shè)置異常分?jǐn)?shù),端到端地構(gòu)建最終交通流異常檢測(cè)模型。
1? 交通流異常檢測(cè)
1.1? GCN
GCN[16]可以有效地捕捉數(shù)據(jù)的空間特征,通過聚合數(shù)據(jù)節(jié)點(diǎn)特征來進(jìn)行分類預(yù)測(cè)等任務(wù)。GCN算法首先給定一張有向圖G=(V,E,W),其中V為有限集合,|V|=n個(gè)節(jié)點(diǎn),E為所有邊的集合,W∈?n×n為圖G的權(quán)重矩陣。向量x∈?n為圖節(jié)點(diǎn)上的輸入信息,xi為第i節(jié)點(diǎn)信息。我們可以得到拉普拉斯矩陣L=D-W,其對(duì)應(yīng)的分解為L(zhǎng)=UΛUT,其中D為度矩陣(對(duì)角矩陣),對(duì)角線上元素依次為各個(gè)頂點(diǎn)的度且Dii= 。輸入信號(hào)x的傅立葉變換為,逆變換為。因此,信號(hào)x經(jīng)gθ濾波為:
其中,gθ(Λ)=diag(θ1λ1,…,θnλn),λ為拉普拉斯矩陣的特征值,θ∈?n為傅立葉系數(shù)的向量。為了使濾波器在空間中局部化和降低其計(jì)算復(fù)雜度,并利用切比雪夫多項(xiàng)式展開得到:
其中,gw(L)為基于w∈?K參數(shù)化的拉普拉斯矩陣的學(xué)習(xí)濾波器。,為k階切比雪夫多項(xiàng)式。
1.2? 問題定義
問題的描述和定義:
我們將道路網(wǎng)定義為G=(V,E,W),其中V為一個(gè)頂點(diǎn)集合,每個(gè)頂點(diǎn)對(duì)應(yīng)于一個(gè)路段,E為一組邊緣,每條邊連接在網(wǎng)絡(luò)中的兩個(gè)路段之間,W為G的鄰接矩陣,W矩陣中只包含0,1。如果兩段道路之間有直接連接,那么Wi,j=1,否則Wi,j=0。在時(shí)間間隔t中,路段i的平均交通速度用vi(t)∈?n×T表示。
1.3? 預(yù)測(cè)任務(wù)
通過GCN算法的模型預(yù)測(cè)交通流速度:
其中,n為歷史交通數(shù)據(jù)的長(zhǎng)度,l為預(yù)測(cè)數(shù)據(jù)長(zhǎng)度。
交通流預(yù)測(cè)的好壞通常使用一個(gè)度量來衡量,這個(gè)度量在預(yù)測(cè)值和實(shí)際值之間進(jìn)行計(jì)算。其中一個(gè)流行的度量是歸一化絕對(duì)偏差度量:
其中 ∈?n×τ和vi(t)分別為第i條道路t時(shí)刻的預(yù)測(cè)值和真實(shí)值,n為道路的條數(shù),τ為預(yù)測(cè)窗口的大小。式(4)中這個(gè)度量有時(shí)被稱為WAPE(Weighted Absolute Percent Error)。式(5)度量被稱為均方誤差(Mean Square Error,MSE)MSE和WAPE都是預(yù)測(cè)好壞評(píng)價(jià)標(biāo)準(zhǔn)。預(yù)測(cè)速度的目標(biāo)是最小化Loss(,vi(t))。
1.4? 異常檢測(cè)任務(wù)
通過將某條道路的當(dāng)前交通流與歷史交通流,臨近時(shí)間交通流進(jìn)行比較,得出該道路的車流異常值。時(shí)間序列的異常檢測(cè)方法有很多,常見方法有基于密度的模型(Extreme Low Density Model)、深度神經(jīng)網(wǎng)絡(luò)自編碼器[6](Auto Encoder)、K-sigma模型、特定異常分?jǐn)?shù)等等。
2? GL-GCN
在本部分將介紹我們提出的異常檢測(cè)方法,本文中,交通流異常檢測(cè)可分為兩部分,第一部分(時(shí)空模塊)基于歷史交通流數(shù)據(jù)預(yù)測(cè)未來某段時(shí)間內(nèi)的交通數(shù)據(jù),第二部分是利用預(yù)測(cè)的交通數(shù)據(jù)信息與真實(shí)交通數(shù)據(jù)信息的偏差設(shè)置異常分?jǐn)?shù),最后通過對(duì)異常分?jǐn)?shù)分布建模,使用高斯尾部概率來確定某條道路和某段時(shí)間的交通流異常。我們將交通流屬性中的交通速度作為本次異常檢測(cè)的對(duì)象。步驟分為兩步:
第一步:先利用歷史交通流數(shù)據(jù)導(dǎo)入時(shí)空卷積模塊預(yù)測(cè)后面一段時(shí)間的交通流,得到預(yù)測(cè)值
第二步:異常分?jǐn)?shù)設(shè)定,通過異常分?jǐn)?shù)判斷交通流是否異常。
如圖1所示,我們的異常檢測(cè)框架由兩個(gè)模塊組成:一個(gè)如圖2所示的時(shí)空卷積塊和一個(gè)異常檢測(cè)模塊。時(shí)空模塊由GCN模塊和時(shí)間卷積模塊組成。其中,A為鄰接矩形,X為交通流的速度值。我們可以充分利用交通數(shù)據(jù)中隱藏的空間相關(guān)性和時(shí)間相關(guān)性來完成我們的預(yù)測(cè)并異常檢測(cè)任務(wù)。
2.1? 預(yù)測(cè)模塊
在預(yù)測(cè)模型中,常見的方法是采用基于RNN的模型,該模型在每個(gè)時(shí)刻上進(jìn)行一次迭代,可以很好地捕捉時(shí)間依賴性性,建立時(shí)序模型,被廣泛應(yīng)用于深度神經(jīng)網(wǎng)絡(luò)中。但由于其卷積核大小的限制,不能很好地抓取長(zhǎng)時(shí)的依賴信息,容易出現(xiàn)梯度爆炸等問題。因此,我們?cè)跁r(shí)間卷積模塊中添加時(shí)間卷積網(wǎng)絡(luò)[18](Temporal Convolutional Network,TCN)的改進(jìn)版本DeepGLO來捕捉交通流的動(dòng)態(tài)時(shí)間特征。TCN具有穩(wěn)定的梯度、靈活的感受視野和內(nèi)存需求小的優(yōu)點(diǎn),常用于語音識(shí)別,文本翻譯等工作。DeepGLO可以捕捉局部和全局的時(shí)間特征,具有很強(qiáng)的靈活性。在本文任務(wù)中,我們對(duì)于DeepGLO的模型進(jìn)行了改進(jìn)。其中,將原始的DeepGLO中TCN的層數(shù)修改為雙層,這樣可以同時(shí)考慮長(zhǎng)時(shí)和短時(shí)的依賴信息,同時(shí),在增加層數(shù)和神經(jīng)元的同時(shí),為了更好地迭代和模型的穩(wěn)定性,在模型中增加了殘差網(wǎng)絡(luò)。
在預(yù)測(cè)模塊中,我們分別定義圖卷積神經(jīng)網(wǎng)絡(luò)GCN和DeepGLO為G(·|Θg)和D(·|Θd),Θg為GCN網(wǎng)絡(luò)神經(jīng)元權(quán)重參數(shù),Θd為DeepGLO網(wǎng)絡(luò)神經(jīng)元權(quán)重參數(shù)。那么整個(gè)預(yù)測(cè)任務(wù)輸出為:
其中l(wèi)為預(yù)測(cè)窗口大小,即預(yù)測(cè)速度窗口的大小。是一個(gè)超參數(shù),在實(shí)驗(yàn)中可以設(shè)置。
那么整個(gè)預(yù)測(cè)任務(wù)的損失函數(shù)可以選擇式(4)。
2.2? 異常檢測(cè)模塊
在異常檢測(cè)模塊中,異常分?jǐn)?shù)的設(shè)置為:
(1)先計(jì)算原始異常分?jǐn)?shù),在t時(shí)刻的異常分?jǐn)?shù)為:
其中,π(v(t-1))為基于歷史交通流數(shù)據(jù)預(yù)測(cè)值稀疏二進(jìn)制編碼,a(v(t))為真實(shí)數(shù)據(jù)的稀疏二進(jìn)制編碼。
(2)計(jì)算異??赡苄裕?/p>
3? 實(shí)驗(yàn)
3.1? 實(shí)驗(yàn)數(shù)據(jù)
為了評(píng)估我們提出的交通流異常檢測(cè)模型:我們?cè)贛ETR-LA和PEMS-BAY兩個(gè)數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn),實(shí)驗(yàn)數(shù)據(jù)的信息如表1所示。METR-LA在洛杉磯縣高速公路上的207個(gè)傳感器上記錄了四個(gè)月的統(tǒng)計(jì)數(shù)據(jù)。PEMS-BAY包含舊金山六個(gè)月內(nèi)有關(guān)325傳感器的傳輸速度信息。在數(shù)據(jù)預(yù)處理當(dāng)中,我們采用了與DCRNN[19](Diffusion Convolutional Recurrent Neural Network)模型相同的數(shù)據(jù)預(yù)處理過程。傳感器的讀數(shù)被匯總到5分鐘的窗口中。道路的拓?fù)浣Y(jié)構(gòu)即節(jié)點(diǎn)的鄰接矩陣由道路網(wǎng)絡(luò)距離和帶閾值的高斯核構(gòu)造。Z-Score標(biāo)準(zhǔn)化后應(yīng)用于輸入。
3.2? 基準(zhǔn)模型
為了體現(xiàn)該模型預(yù)測(cè)的優(yōu)越性,我們?cè)趯?shí)驗(yàn)中和幾種常見的基準(zhǔn)模型做了對(duì)比:
(1)ARIMA[20](Autoregressive Integrated Moving Average):卡爾曼濾波的自回歸積分滑動(dòng)平均模型;
(2)SVR[21](support vector regression):是SVM對(duì)回歸問題的一種運(yùn)用模型;
(3)WaveNet[22]:處理時(shí)間序列的卷積神經(jīng)網(wǎng)絡(luò)模型;
(4)DCRNN[19]:擴(kuò)散卷積遞歸神經(jīng)網(wǎng)絡(luò)模型;
(5)STGCN[23](Spatio-Temporal Graph Convolutional Networks):時(shí)空?qǐng)D卷積網(wǎng)絡(luò),將圖卷積與一維卷積相結(jié)合的模型。
為了更好地衡量交通流異常檢測(cè)的優(yōu)越性,和傳統(tǒng)的幾種異常檢測(cè)方法在該數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比:
(1)孤立森林算法[24](Isolation Forest):一種可以根據(jù)數(shù)據(jù)密度分布的無監(jiān)督學(xué)習(xí)模型。
(2)高斯混合模型[25](Gaussian Mixed Model,GMM)算法:一種與K均值類似的無監(jiān)督聚類模型。
(3)自編碼神經(jīng)網(wǎng)絡(luò):利用編碼解碼之間的重構(gòu)的誤差來確定異常的神經(jīng)網(wǎng)絡(luò)模型。
3.3? 實(shí)驗(yàn)結(jié)果
如表2和表3所示,通過實(shí)驗(yàn)比較了兩個(gè)數(shù)據(jù)集使用提出的新算法GL-GCN和其他基準(zhǔn)算法的表現(xiàn),分別記錄了預(yù)測(cè)15 min,30 min和60 min的交通速度時(shí)衡量誤差的MAE、均方根誤差(Root Mean Square Error,RMSE)。
從實(shí)驗(yàn)結(jié)果可以看出,我們提出的新模型在METR-LA的表現(xiàn)比基準(zhǔn)模型ARIMA,SVR和WaveNet要出色,對(duì)應(yīng)的MAE和MAPE在三個(gè)時(shí)間段預(yù)測(cè)的損失都明顯較小。相對(duì)于其他的時(shí)空網(wǎng)絡(luò)模型,我們提出的GL-GCN在預(yù)測(cè)15 min和30 min的表現(xiàn)都比較相互接近,但是在預(yù)測(cè)后面60 min交通流速度的MAE和MAPE分別為3.51和7.52,比其他兩個(gè)基準(zhǔn)模型更有優(yōu)勢(shì),預(yù)測(cè)損失平均降低了2.87%。在數(shù)據(jù)集PEMS-BAY兩個(gè)誤差相對(duì)比較小,比前面常規(guī)的基準(zhǔn)模型更加優(yōu)異,在預(yù)測(cè)60 min交通速度,STGCN的誤差值比較大,而本文提出的模型的MAE和RMSE的誤差都最小,分別為3.51和7.32,預(yù)測(cè)損失平均降低了3.56%。為了更直接地比較GL-GCN在交通流上預(yù)測(cè)的優(yōu)越性,圖3所示為GL-GCN和STGCN兩個(gè)模型在PEMS-BAY數(shù)據(jù)集上的預(yù)測(cè)結(jié)果,可以從圖上看出,GL-GCN比STGCN預(yù)測(cè)的結(jié)果更加符合交通流隨時(shí)間的變化趨勢(shì),表現(xiàn)更加穩(wěn)定。我們認(rèn)為造成這種情況的原因是,我們的模型比其他模型的網(wǎng)絡(luò)結(jié)構(gòu)更有魯棒性,有效更好地結(jié)合交通流周期規(guī)律和道路之間拓?fù)浣Y(jié)構(gòu)來預(yù)測(cè)交通速度。
由于此公共交通流數(shù)據(jù)集沒有異常標(biāo)簽,人工標(biāo)注需要大量的人力物力,此次實(shí)驗(yàn)與幾個(gè)在無監(jiān)督異常算法來對(duì)比如圖4,圖5,圖6,圖7。通過實(shí)驗(yàn)對(duì)比發(fā)現(xiàn),孤立森林和GMM算法的異常值檢測(cè)結(jié)果比較相似,對(duì)最大值和最小值都比較敏感,但是有些在200時(shí)刻的有些速度也列入異常值范圍,同時(shí),在交通流數(shù)據(jù)上,速度接近70 km/h時(shí)也不能列入異常值范圍。自編碼神經(jīng)網(wǎng)絡(luò)在該數(shù)據(jù)上表現(xiàn)比前面兩個(gè)基準(zhǔn)模型更好,但是200時(shí)刻和500時(shí)刻附件的大部分速度也標(biāo)記為異常值。GL-GCN模型結(jié)合時(shí)空卷積在該數(shù)據(jù)集上表現(xiàn)具有很強(qiáng)的優(yōu)勢(shì)和良好的性能,對(duì)一些突變點(diǎn)更加敏感。
4? 結(jié)? 論
針對(duì)交通流數(shù)據(jù)異常檢測(cè)問題,本文提出了一個(gè)全新的基于時(shí)空卷積神經(jīng)網(wǎng)絡(luò)GL-GCN模型。該方法可以同時(shí)有效提取交通流的時(shí)間和空間特征,在兩個(gè)公開數(shù)據(jù)集上與其他幾個(gè)基準(zhǔn)模型相比,確定了模型的優(yōu)越性。在預(yù)測(cè)和異常檢測(cè)兩個(gè)實(shí)驗(yàn)對(duì)比上,GL-GCN相較于其他模型具有更好的穩(wěn)定性和準(zhǔn)確性。本文提出的GL-GCN具有以下幾個(gè)貢獻(xiàn):
(1)將整個(gè)交通流異常檢測(cè)任務(wù)分為預(yù)測(cè)和無監(jiān)督異常檢測(cè)兩個(gè)模塊,并實(shí)現(xiàn)了端到端的學(xué)習(xí);
(2)本文的GL-GCN相對(duì)于其他模型更好地耦合時(shí)間和空間信息,讓模型表現(xiàn)得更加穩(wěn)定和有效;
(3)該模型可以捕捉交通流長(zhǎng)時(shí)數(shù)據(jù)的依賴性,有效捕捉時(shí)間特征。
在未來工作中,如何將時(shí)空數(shù)據(jù)和在線學(xué)習(xí)結(jié)合起來,可以實(shí)時(shí)有效地檢測(cè)交通流異常。
參考文獻(xiàn):
[1] 陳珂,鄒權(quán).融入時(shí)間關(guān)聯(lián)因子曲線擬合的交通流異常挖掘方法 [J].計(jì)算機(jī)工程與設(shè)計(jì),2013,34(7):2561-2565.
[2] 黎維,陶蔚,周星宇,等.時(shí)空序列預(yù)測(cè)方法綜述 [J].計(jì)算機(jī)應(yīng)用研究,2020,37(10):2881-2888.
[3] WU X D,KUMAR V,QUINLAN J R. Top 10 algorithms in data mining [J].Knowledge and Information Systems,2018,14:1-37.
[4] GIANNAKERIS P,KALTSA V,AVGERINAKIS K. Speed Estimation and Abnormality Detection from Surveillance Cameras [C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition Workshops (CVPRW).Salt Lake City:IEEE,2018:93-936.
[5] HOCHREITER S,SCHMIDHUBER J. Long Short-Term Memory [J].Neural Computation,1997,9(8):1735-1780.
[6] KING D P,WELLING M. Auto-Encoding Variational Bayes [J/OL].arXiv:1312.6114v10 [stat.ML].(2014-05-01).https://arxiv.org/abs/1312.6114v10.
[7] PHILIP L,WANG L L,NGAN H Y T. Outlier Detection In Large-scale Traffic Data By Naitve Bayes Method and Gaussian Mixture Model Method [C]//Electronic Imaging,Intelligent Robotics and Industrial Applications using Computer Vision 2017.Society for Imaging Science and Technology,2017:73-78.
[8] TUROCHY R E,SMITH B L. Applying quality control to traffic condition monitoring [C]//ITSC2000. 2000 IEEE Intelligent Transportation Systems. Proceedings(Cat.No.00TH8493).Dearborn,IEEE,2000:15-20.
[9] DANG T T,NGAN H Y T,LIU W. Distance-based k-nearest neighbors outlier detection method in large-scale traffic data [C]//2015 IEEE International Conference on Digital Signal Processing(DSP).Singapore :IEEE,2015:507-510.
[10] MA M X,NGAN H Y T,LIU W. Density-based Outlier Detection by Local Outlier Factor on Largescale Traffic Data [C]//Electronic Imaging,Image Processing:Machine Vision Applications IX.San Francisco:Society for Imaging Science and Technology:2016:1-4.
[11] MARKUS M,BREUNIG M M,KRIEGEL H P,et al. LOF:Identifying Density-Based Local Outliers [C]//Proceedings of the 2000 ACM SIGMOD international conference on management of data.Dallas:Association for Computing Machinery,2000:93-97.
[12] MUNOZ-ORGANERO M,RUIZ-BLAQUEZ R,S?NCHEZ-FERN?NDEZ L. Automatic detection of traffic lights,street crossings and urban roundabouts combining outlier detection and deep learning classification techniques based on GPS traces while driving [J].Computers,Environment and Urban Systems,2018,68:1-8.
[13] SHI Y,DENG M,YANG X X,et al. Detecting anomalies in spatio-temporal flow data by constructing dynamic neighbourhoods [J].Computers,Environment and Urban Systems,2018,67:80-96.
[14] WEN H Y,LUO J. Traffic Incident Detection for Urban Arterial Road Based on Data Fusion and Learning Vector Quantization [C]//First International Conference on Transportation Information and Safety(ICTIS).Wuhan:American Society of Civil Engineers,2011.
[15] HSU D. Anomaly Detection on Graph Time Series [J/OL].arXiv:1708.02975v2 [cs.LG].(2017-11-01).https://arxiv.org/abs/1708.02975v2.
[16] DEFFERRARD M,BRESSON X,VANDERGHEYNST P.Convolutional neural networks on graphs with fast localized spectral filtering [C]//NIPS16:Proceedings of the 30th International Conference on Neural Information Processing Systems.Red Hook:Curran Associates Inc.,2016:3844-3852.
[17] SEN R,YU H F,DHILLON I.Think Globally,Act Locally:A Deep Neural Network Approach to High-Dimensional Time Series Forecasting [J/OL].arXiv:1905.03806v2 [stat.ML].(2019-10-27).https://arxiv.org/abs/1905.03806v2.
[18] BAI S J,KOLTER Z,KOLTUN V. An Empirical Evaluation of Generic Convolutional and Recurrent Networks for Sequence Modeling [J/OL].arXiv:1803.01271v2 [cs.LG].(2018-04-19).https://arxiv.org/abs/1803.01271v2.
[19] LI Y G,YU R,SHAHABI C,et al. Diffusion Convolutional Recurrent Neural Network:Data-Driven Traffic Forecasting [J/OL].arXiv:1707.01926v3 [cs.LG].(2018-01-22)https://arxiv.org/abs/1707.01926v3.
[20] AHMED M S,COOK A R. Analysis of freeway traffic time series data by using Box-Jenkins techniques [J].Transportation Research Record Journal of the Transportation Research Board,1979,773(722):1-9.
[21] SMOLA A J,SCH?LKOPF B. A tutorial on support vector regression [J].Statistics and Computing,2004,14:199-222.
[22] OORD A V D,DIELEMAN S,ZEN H,et al. WaveNet:A Generative Model for Raw Audio [J/OL].arXiv:1609.03499v2 [cs.SD].(2016-08-19).https://arxiv.org/abs/1609.03499v2.
[23] YU B,YIN H T,ZHU Z X.Spatio-Temporal Graph Convolutional Networks:A Deep Learning Framework for Traffic Forecasting [J/OL].arXiv:1709.04875v4 [cs.LG].(2018-07-12).https://arxiv.org/abs/1709.04875v4.
[24] LIU F T,TING K M,ZHOU Z H. Isolation Forest [C]//2008 Eighth IEEE International Conference on Data Mining.Pisa:IEEE,2008:413-422.
[25] KHANSARI-ZADEH S M,BILLARD A. Learning Stable Nonlinear Dynamical Systems With Gaussian Mixture Models [J].IEEE,2011,27(5):943-957.
作者簡(jiǎn)介:徐紅飛(1995—),男,漢族,江蘇宿遷人,碩士研究生在讀,主要研究方向:大數(shù)據(jù)挖掘,智能運(yùn)維等;李婧(1980—),女,漢族,上海,副教授,碩士研究生導(dǎo)師,博士研究生,主要研究方向:計(jì)算機(jī)網(wǎng)絡(luò)通信算法、智能電網(wǎng)、無線傳感器網(wǎng)絡(luò)等。