国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于LOF算法的規(guī)律異常車輛檢測(cè)

2018-07-16 03:48:10高澤雄福建省晉江市公安局
警察技術(shù) 2018年4期
關(guān)鍵詞:離群卡口軌跡

高澤雄  福建省晉江市公安局

一、通過LOF算法進(jìn)行規(guī)律異常車輛檢測(cè)應(yīng)用思路

不同用途的車輛,其出行規(guī)律是不一樣的。如朝九晚五的上班族的出行峰值可能集中在早上八點(diǎn)之后及晚上六點(diǎn)之后;蔬果運(yùn)輸車輛峰值可能在早上四、五點(diǎn);一些私人運(yùn)營車輛、個(gè)體公司送貨車輛看似軌跡比較零亂,頻率難以歸納,但就其所在村居的卡口數(shù)據(jù)來看,也存在一個(gè)相對(duì)固定的每天出發(fā)時(shí)間及歸來時(shí)間。本文梳理出每個(gè)卡口每輛車的出行規(guī)律特征,并通過LOF算法將規(guī)律特征相近的車輛進(jìn)行聚合,而最為離散的幾輛車即為該卡口的規(guī)律異常車輛。最后對(duì)每個(gè)卡口的規(guī)律異常車輛進(jìn)行統(tǒng)籌分析,只要一輛車在任一卡口被認(rèn)定為規(guī)律正常車輛,即認(rèn)定為規(guī)律正常車輛,其余即為規(guī)律異常車輛。在任一卡口的軌跡數(shù)不滿100的車輛不參與該卡口的規(guī)律異常統(tǒng)計(jì)。

(一)數(shù)據(jù)介紹

本文研究數(shù)據(jù)來自晉江市公安局社會(huì)治理視頻監(jiān)控系統(tǒng)的436個(gè)慢速卡口所獲取的過車數(shù)據(jù)。這些卡口主要部署在全市各個(gè)村居的主要出入口,基本可以實(shí)現(xiàn)對(duì)各個(gè)村居出入情況的全覆蓋。數(shù)據(jù)時(shí)間跨度從2014年8月至2017年10月,總量計(jì)8.7千萬條。每條數(shù)據(jù)包括卡口ID、過車時(shí)間、過車速度、車道及車輛的型號(hào)、車標(biāo)、顏色、遮陽板等特征,以及車牌的顏色、類型、號(hào)碼等特征。

本次應(yīng)用是對(duì)規(guī)律異常車輛的檢測(cè),因此僅需提取卡口ID、過車時(shí)間、車牌號(hào)碼三列數(shù)據(jù)進(jìn)行分析。為簡化分析模型,假設(shè)車牌號(hào)碼即可唯一確定一輛車,暫不考慮套牌車、車牌識(shí)別錯(cuò)誤等問題。

(二)特征提取

我們需要把上述軌跡數(shù)據(jù)轉(zhuǎn)化為可供機(jī)器學(xué)習(xí)模型直接分析的特征向量。因本應(yīng)用研究的是車輛出行規(guī)律,因此需要把軌跡數(shù)據(jù)轉(zhuǎn)化為車輛的出行規(guī)律特征。根據(jù)不同的時(shí)間維度,可分為特定車輛的每日出行規(guī)律、每周出行規(guī)律、每月出行規(guī)律等。

本文采用的是每日出行規(guī)律,即根據(jù)特定車輛在特定卡口的歷史出行數(shù)據(jù),統(tǒng)計(jì)各小時(shí)段的通過次數(shù),除以總次數(shù),得出每小時(shí)的出行概率。

對(duì)卡口i的所有軌跡數(shù)據(jù)進(jìn)行計(jì)算,計(jì)算結(jié)果以px,t表示第x輛車t時(shí)的出行概率,得到某卡口i的所有過車頻率特征矩陣Camerai,矩陣中的每一行就是描述第x輛車出行規(guī)律的特征向量。

(三)模型分析

LOF算法[1](Local Outlier Factor,局部離群因子檢測(cè)方法)是基于密度的離群點(diǎn)檢測(cè)方法中一個(gè)比較有代表性的算法。該算法會(huì)給數(shù)據(jù)集中的每個(gè)點(diǎn)計(jì)算一個(gè)離群因子LOF,通過判斷LOF是否接近于1來判定是否是離群因子。若LOF遠(yuǎn)大于1,則認(rèn)為是離群因子,接近于1,則是正常點(diǎn)。

在Camerai矩陣中,每行數(shù)據(jù)就是一個(gè)特征向量,也就是算法中的一個(gè)點(diǎn)。Python的sklearn.neighbors庫中有封裝好的LocalOutlierFactor類[2],只要調(diào)用該類對(duì)上述特征矩陣進(jìn)行分析預(yù)測(cè),即可得到一個(gè)一維數(shù)組,每一個(gè)值對(duì)應(yīng)矩陣中的一行,標(biāo)識(shí)該車輛規(guī)律特征是否為離散點(diǎn)(-1/1)。

(四)綜合分析

通過對(duì)各個(gè)卡口的數(shù)據(jù)逐一進(jìn)行分析,可得所有車輛在各個(gè)卡口的檢測(cè)結(jié)果。特定車輛只需在任意一個(gè)卡口中被判斷為規(guī)律正常,即可定為規(guī)律正常點(diǎn)。若在所有卡口分析結(jié)果中均為異常點(diǎn),則該輛車即為本應(yīng)用所探尋的規(guī)律異常車輛。

二、技術(shù)實(shí)現(xiàn)

(一)數(shù)據(jù)導(dǎo)入

先以376號(hào)卡口的數(shù)據(jù)演示獲取單一卡口規(guī)律異常車輛的過程,然后再封裝整個(gè)過程,供其它卡口循環(huán)調(diào)用。

通過數(shù)據(jù)庫連接先獲取376號(hào)卡口的所有過車數(shù)據(jù)。主要取記錄ID(VEHICLE_ID)、過車時(shí)間(PASS_TIME)和車牌號(hào)碼(PLATE_INFO)三個(gè)字段,寫入pandas庫的dataframe。數(shù)據(jù)預(yù)覽如圖1所示。

(二)特征提取

調(diào)用pivot_table方法生成數(shù)據(jù)透視表dfPass。行索引是每輛車的車牌,列索引是過車時(shí)間的小時(shí)數(shù),統(tǒng)計(jì)的數(shù)字則是該車輛在該小時(shí)內(nèi)的過車次數(shù)。

此后,將每小時(shí)的過車次數(shù)除以總次數(shù),就得到了該車輛按小時(shí)統(tǒng)計(jì)的出行規(guī)律特征向量。同時(shí),排除掉軌跡條數(shù)小于100的車輛,因?yàn)?年多的時(shí)間內(nèi)累計(jì)過車次數(shù)少于100,證明該車輛通過該卡口的頻率并不高,難以生成有意義的規(guī)律統(tǒng)計(jì)。通過計(jì)算,我們得到了存有該卡口所有車輛的規(guī)律特征向量集,存入dfPassE。此時(shí)dfPassE的車輛記錄數(shù)為2692條。

圖4為隨機(jī)抽取的幾張車輛出行規(guī)律分布圖。

(三)模型分析

調(diào)用LocalOutlierFactor模型對(duì)dfPassE中的數(shù)據(jù)進(jìn)行訓(xùn)練及預(yù)測(cè)。

模型參數(shù)n_neighbors為20,表示取與一個(gè)點(diǎn)最臨近的20個(gè)點(diǎn)(即它的20個(gè)相鄰點(diǎn))來計(jì)算離群因子。contamination為0.01,表示取1%的點(diǎn)作為離群點(diǎn)。生成結(jié)果y即是模型預(yù)測(cè)結(jié)果,是一個(gè)一維數(shù)組,用-1/1表示對(duì)應(yīng)點(diǎn)是否離群點(diǎn)。

我們可以用kneighbors函數(shù)[3]來獲取某個(gè)點(diǎn)的20個(gè)相鄰點(diǎn)距離及編號(hào)。

例如取一規(guī)律正常點(diǎn)68進(jìn)行計(jì)算,可知其相鄰點(diǎn)從遠(yuǎn)到近依次為2153、2126、4270、19888等。畫出這幾個(gè)點(diǎn)的出行規(guī)律圖,可見他們的規(guī)律是幾乎一致的。

再取一個(gè)檢測(cè)結(jié)果為異常(-1)的點(diǎn)203,查看與其最接近的幾個(gè)點(diǎn)的出行規(guī)律圖,可以發(fā)現(xiàn)其規(guī)律相差較大。

(四)綜合分析

將上述過程封裝成函數(shù)countOutlier(crossing_id),傳入卡口id,即可返回該卡口的規(guī)律異常過車檢測(cè)情況。將所有卡口的檢測(cè)情況匯入總表dfAll,即可得到一張檢測(cè)總表。

在圖9中,行索引是車牌,列索引是卡口ID,若該車輛在該卡口規(guī)律正常為1,異常為-1,無記錄則為NaN。該表記錄累計(jì)97448行。

根據(jù)上述思路統(tǒng)計(jì)卡口規(guī)律存入result列,如果某車輛有任一卡口規(guī)律正常,則result為0,否則統(tǒng)計(jì)在所有卡口出現(xiàn)的異常次數(shù)。

查詢r(jià)esult大于等于1的車輛,總數(shù)為930條。進(jìn)一步查詢r(jià)esult大于等于2的車輛,僅42條。

取其中一輛規(guī)律異常次數(shù)為4的車輛繪出其在4個(gè)卡口的規(guī)律分布圖如圖11所示。

這部分車輛有何特征或有何價(jià)值,將移交負(fù)責(zé)研判的部門進(jìn)行進(jìn)一步分析。

三、結(jié)語

本文探討的僅是異常檢測(cè)在車輛軌跡上的一個(gè)應(yīng)用思路,同樣的算法配合不同的應(yīng)用思路可以產(chǎn)生更多有價(jià)值的研究。例如分析特定車輛每周的行動(dòng)規(guī)律特征(幾點(diǎn)經(jīng)過哪個(gè)卡口),并以歷史特征作為異常檢測(cè)模型的訓(xùn)練數(shù)據(jù),來自動(dòng)識(shí)別該車輛在某時(shí)刻是否出現(xiàn)異常行為;或者以特定卡口的每日過車數(shù)作為特征,即可以異常檢測(cè)模型發(fā)現(xiàn)其何時(shí)發(fā)生車流異常,進(jìn)而判斷當(dāng)日是否有特殊事件發(fā)生。

如何更好地挖掘車輛軌跡、人員軌跡是視頻大數(shù)據(jù)深度應(yīng)用的方向。在更高層面來說,如何更好地利用大數(shù)據(jù)挖掘不同數(shù)據(jù)集之間的潛在關(guān)聯(lián)關(guān)系為公安工作服務(wù),也是公安大數(shù)據(jù)未來發(fā)展的方向。機(jī)器學(xué)習(xí)的分類、回歸、聚類、降維等多種不同算法一旦落地公安已有大數(shù)據(jù),必將迸發(fā)出無窮的可能性。

猜你喜歡
離群卡口軌跡
軌跡
軌跡
L卡口“馬拉松”聯(lián)盟的前世今生
攝影之友(2018年12期)2018-12-26 08:53:42
軌跡
進(jìn)化的軌跡(一)——進(jìn)化,無盡的適應(yīng)
中國三峽(2017年2期)2017-06-09 08:15:29
離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應(yīng)用
高速公路車道高清卡口系統(tǒng)實(shí)施方案
基于高清卡口識(shí)別的高速公路長隧道安全比對(duì)系統(tǒng)
離群的小雞
專利名稱:一種禽舍加溫水槽
甘洛县| 南投市| 宁化县| 长沙县| 抚顺县| 鸡西市| 神农架林区| 西宁市| 兰考县| 田阳县| 元朗区| 高唐县| 白玉县| 莱西市| 噶尔县| 曲麻莱县| 黄骅市| 东丰县| 红桥区| 双鸭山市| 台州市| 宁国市| 新营市| 贵港市| 乡宁县| 西宁市| 浠水县| 苏尼特左旗| 游戏| 屏山县| 福建省| 永德县| 四平市| 珠海市| 宁夏| 通州市| 兰西县| 即墨市| 会昌县| 广饶县| 安庆市|