国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于異常檢測的失竊物品網(wǎng)絡(luò)預(yù)警技術(shù)的研究

2016-02-06 09:33董翰博曹魯喆段詠程王丁一楊煜煒
關(guān)鍵詞:銷贓離群物品

◆董翰博 季 鐸 曹魯喆 段詠程 王丁一 楊煜煒

(中國刑事警察學(xué)院網(wǎng)絡(luò)犯罪偵查系 遼寧 110035)

基于異常檢測的失竊物品網(wǎng)絡(luò)預(yù)警技術(shù)的研究

◆董翰博 季 鐸 曹魯喆 段詠程 王丁一 楊煜煒

(中國刑事警察學(xué)院網(wǎng)絡(luò)犯罪偵查系 遼寧 110035)

近年來,隨著互聯(lián)網(wǎng)線上交易的迅速發(fā)展,眾多二手物品交易網(wǎng)站悄然興起,并逐漸成為犯罪人員銷贓的重要途徑。因此建立針對失竊物品的網(wǎng)絡(luò)預(yù)警平臺,將為有效打擊犯罪,控制犯罪分子網(wǎng)上銷贓途徑具有重要價(jià)值。本文針對上述問題,利用文本挖掘方法對交易產(chǎn)品的商品屬性和地域?qū)傩赃M(jìn)行了自動(dòng)的識別和標(biāo)注,實(shí)現(xiàn)了對網(wǎng)上二手交易商品的地理信息可視化,提高了涉案物品定位及案件線索發(fā)現(xiàn)的工作效率。同時(shí)創(chuàng)新性地引入了異常點(diǎn)檢測分析算法,以達(dá)到對二手交易網(wǎng)站商品價(jià)格偏離正常時(shí)進(jìn)行報(bào)警,對提高失竊案件的偵辦效率提供了重要手段。

網(wǎng)絡(luò)預(yù)警;異常點(diǎn)監(jiān)測;二手交易平臺;失竊物品

0 引言

隨著計(jì)算機(jī)網(wǎng)絡(luò)的發(fā)展,網(wǎng)絡(luò)銷贓作為一種新型的犯罪銷贓方式而出現(xiàn)。網(wǎng)上銷贓是指通過eBay或淘寶等網(wǎng)店銷售盜竊物品的行為。近年來,這種犯罪層出不窮,但又極其隱蔽,不易被發(fā)現(xiàn)。2014年1月,重慶警方經(jīng)舉報(bào)抓獲一名在58同城中售賣偷來的摩托車的嫌疑人,據(jù)交待,在這之前已經(jīng)成功做了多起案件。2016年2月,渭南市公安局臨渭分局將涉案的石某、唐某和劉某抓獲,追回被盜輪胎20多個(gè),3人將輪胎偷走后,也是通過網(wǎng)絡(luò)進(jìn)行銷贓。犯罪嫌疑人利用網(wǎng)絡(luò)銷贓的問題日益突出,給人們財(cái)產(chǎn)安全造成威脅,并給偵查破案工作帶來了巨大的困難。

網(wǎng)絡(luò)銷贓具有輻射面廣、不確定性以及交易的便利性等特點(diǎn),其有三點(diǎn)具體原因,(1)網(wǎng)絡(luò)交易流量巨大,銷贓對象遍及全國。網(wǎng)絡(luò)交易流量巨大,銷贓對象遍及全國。通過互聯(lián)網(wǎng)銷售的贓物往往遍布全國各地,查封扣押、調(diào)查取證等工作點(diǎn)多線長、面廣量大,消耗了大量警務(wù)資源,給偵破案件、認(rèn)定犯罪帶來了很大難度。(2)網(wǎng)上開店手續(xù)簡單,身份虛擬無人把關(guān)。商家上傳個(gè)人有效身份證掃描件及銀行卡號(兩者資料需一致),網(wǎng)站僅對上傳身份證信息與全國人口信息核對一致后,商家即能以虛擬身份在網(wǎng)上開設(shè)店鋪。(3)信息發(fā)布管理缺位,商品來源無法核查。商家的廣告真實(shí)性無法逐一審核,也無法認(rèn)定銷售物品來源的合法性。(4)物流快遞監(jiān)管失范,贓物得以順利轉(zhuǎn)手。銷贓犯利用現(xiàn)代物流企業(yè)懶于進(jìn)行核查這一漏洞,通過物流、快遞公司快速運(yùn)送贓物。

網(wǎng)絡(luò)交易市場、二手買賣網(wǎng)站以及第三方平臺的出現(xiàn)和發(fā)展,為犯罪行為人提供了非常方便、快捷、可靠的銷贓途徑。網(wǎng)絡(luò)銷贓的出現(xiàn),使其犯罪活動(dòng)的隱蔽性和狡詐性更加突出,加大了公安機(jī)關(guān)偵破案件難度。研究二手失竊物品的檢測和預(yù)警可以了解犯罪嫌疑人通過什么途徑銷贓,甚至可以通過網(wǎng)絡(luò)上進(jìn)行交易的可疑人員和可疑物品實(shí)現(xiàn)從人到案、從物到案的破案方式。既能發(fā)現(xiàn)線索,又能查獲證據(jù),還可以及時(shí)追回贓物,挽回人民群眾的損失,對于偵查破案有著重大意義。

1 離群點(diǎn)檢測的相關(guān)研究

離群點(diǎn)檢測的任務(wù)是識別特征顯著不同于其他數(shù)據(jù)的觀測值,這樣的點(diǎn)成為異常點(diǎn)、離群點(diǎn)或孤立點(diǎn)。離群點(diǎn)檢測算法的目標(biāo)是發(fā)現(xiàn)真正的離群點(diǎn),同時(shí)避免將正確的對象標(biāo)注為離群點(diǎn)。

離群點(diǎn)檢測的基本概念是:在不同的領(lǐng)域,離群點(diǎn)有不同的定義,通常情況下描述離群點(diǎn)檢測可以定義為:給定一個(gè)有n個(gè)數(shù)據(jù)點(diǎn)或?qū)ο蟮臄?shù)據(jù)集和期望的離群點(diǎn)數(shù)目k,找出與數(shù)據(jù)集中其余數(shù)據(jù)顯著不同的、異常的或不一致的前k個(gè)對象。其中導(dǎo)致離群的主要原因包括:(1)數(shù)據(jù)來源于異類,如欺詐、入侵、疾病爆發(fā)、不尋常的實(shí)驗(yàn)結(jié)果等。(2)由數(shù)據(jù)變量固有變化引起,是自然發(fā)生的,反映了數(shù)據(jù)集的數(shù)據(jù)分布特點(diǎn),如氣候變化、顧客新的購買模式、基因突變等等。(3)數(shù)據(jù)測量和收集誤差,主要是由于人為錯(cuò)誤、測量設(shè)備故障或存在噪音。下面介紹兩種不同的離群點(diǎn)檢測方法:

1.1 基于統(tǒng)計(jì)的離群點(diǎn)檢測

統(tǒng)計(jì)方法首先對一直給定的數(shù)據(jù)樣本集假設(shè)一個(gè)分部或者概率模型(比如正態(tài)分布或者泊松分布),然后采用不一致性檢驗(yàn),結(jié)合假設(shè)模型,從而確定離群點(diǎn)。這種檢測需要事先了解數(shù)據(jù)集的有關(guān)參數(shù)(如數(shù)據(jù)分布情況)、分布的參數(shù)(如均值和方差)以及期望離的離群點(diǎn)數(shù)目。

1.2 基于距離的離群點(diǎn)檢測

基于距離的離群點(diǎn)檢測方法是針對運(yùn)用統(tǒng)計(jì)方法進(jìn)行不一致數(shù)據(jù)的檢測所存在的不足提出來的。對象o是一個(gè)基于距離的孤立點(diǎn),通常用DB(p,d)表示,其中p和d為對象o的參數(shù),它代表的意義是數(shù)據(jù)集合S中至少存在p部分對象與對象o的距離大于d。也就是說,獨(dú)立于統(tǒng)計(jì)檢驗(yàn),將那些與給定對象的距離較大的對象看作是基于距離的孤立點(diǎn)。與運(yùn)用統(tǒng)計(jì)的方法進(jìn)行檢測相比較,基于距離的不一致數(shù)據(jù)檢測綜合歸納了基于標(biāo)準(zhǔn)分布模型的不一致性檢驗(yàn)?;诰嚯x的不一致性數(shù)據(jù)檢驗(yàn)在一定程度上降低了計(jì)算量,這些計(jì)算通常是因?yàn)闄z測方法的選擇和標(biāo)準(zhǔn)分布的擬合等操作產(chǎn)生的。

2 實(shí)驗(yàn)驗(yàn)證

2.1 數(shù)據(jù)來源

本文利用網(wǎng)絡(luò)爬蟲在58同城和趕集網(wǎng)兩個(gè)網(wǎng)站中進(jìn)行數(shù)據(jù)的獲取,數(shù)據(jù)總計(jì)8720條,并主要來自交易量較大的7個(gè)類別,具體的數(shù)據(jù)量如表1所示。

表1 系統(tǒng)數(shù)據(jù)分類及數(shù)量

交易數(shù)據(jù)主要來源于網(wǎng)站認(rèn)證的商家以及個(gè)人賣家,針對本文研究內(nèi)容,我們?nèi)コ松碳野l(fā)布的產(chǎn)品信息,同時(shí)我們還去除了數(shù)據(jù)中無詳細(xì)描述或無法獲得產(chǎn)品價(jià)格的交易信息。

2.2 數(shù)據(jù)處理結(jié)果

表2 產(chǎn)品信息標(biāo)注結(jié)果

數(shù)據(jù)獲取后,我們利用分詞和命名實(shí)體識別工具對數(shù)據(jù)進(jìn)行了商品品牌名稱和型號的識別。重點(diǎn)標(biāo)注了產(chǎn)品的品牌和型號,除此以外還包括商品的出賣地和相關(guān)的聯(lián)系方式。具體內(nèi)容如表2所示。

在數(shù)據(jù)標(biāo)注過程中相關(guān)標(biāo)注工具對品牌的識別準(zhǔn)確率較低,因此在原有系統(tǒng)上,我們又利用品牌詞表進(jìn)行了二次的規(guī)則處理。識別產(chǎn)品的品牌名稱后,本文又依據(jù)建立的商品名稱的同義詞表進(jìn)行了品牌名稱的統(tǒng)一標(biāo)注,方便系統(tǒng)后期在異常點(diǎn)檢測的處理。

3 總結(jié)

隨著中國經(jīng)濟(jì)和虛擬網(wǎng)絡(luò)的高速發(fā)展,各種社會(huì)問題和矛盾突出。而由于我國針對虛擬網(wǎng)絡(luò)上的交易的管理體制還不夠完善,因此網(wǎng)絡(luò)銷贓就有了一定的市場。針對這種情況,失竊物品網(wǎng)絡(luò)預(yù)警技術(shù)可以幫助民警在追查贓物時(shí),更加快捷高效準(zhǔn)確,對公安工作具有重要意義。

簡化監(jiān)視手段,完善控制機(jī)制。傳統(tǒng)的調(diào)查途徑僅僅局限于對實(shí)體店的調(diào)查走訪,而該項(xiàng)目的應(yīng)用可以通過異常價(jià)格監(jiān)測,對網(wǎng)上銷售的物品進(jìn)行價(jià)格監(jiān)測,對于出現(xiàn)異常價(jià)格的物品,及時(shí)進(jìn)行關(guān)注并在網(wǎng)上進(jìn)行調(diào)查。這樣彌補(bǔ)了傳統(tǒng)的調(diào)查的不足??梢詫W(wǎng)上銷售的物品進(jìn)行實(shí)時(shí)的監(jiān)控和監(jiān)管,對于出現(xiàn)異常的銷售價(jià)格的商家,可以很容易地檢測出,從而及時(shí)的發(fā)現(xiàn)一些失竊物品的線索,通過對異常價(jià)格的監(jiān)測,從而加強(qiáng)了對網(wǎng)上商家的監(jiān)測,完善了網(wǎng)上銷售的環(huán)境和公安監(jiān)管機(jī)制。

[1]李林濤,徐笳.網(wǎng)絡(luò)專題地圖服務(wù)平臺的設(shè)計(jì)與實(shí)現(xiàn)[J].測繪(第33卷第4期),2010.

[2]國家地理信息公共服務(wù)平臺總體技術(shù)組.電子地圖數(shù)據(jù)規(guī)范(試行稿),2010.

[3]王淑清,鄔應(yīng)忠.電子地圖專題制作數(shù)據(jù)要求與處理技巧.測繪與空間電力信息,2010.

[4]楊永銘,王喆.異常點(diǎn)檢測算法在入侵檢測中的應(yīng)用研究.現(xiàn)代計(jì)算機(jī)(第275期).

[5]中科院深圳先進(jìn)技術(shù)研究院—國泰安金融大數(shù)據(jù)研究中心大數(shù)據(jù)導(dǎo)論,2015.

猜你喜歡
銷贓離群物品
一種基于鄰域粒度熵的離群點(diǎn)檢測算法
稱物品
“雙十一”,你搶到了想要的物品嗎?
誰動(dòng)了凡·高的物品
一種相似度剪枝的離群點(diǎn)檢測算法
自行車失而復(fù)得太鮮艷不好銷贓?
離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應(yīng)用
找物品
應(yīng)用相似度測量的圖離群點(diǎn)檢測方法
拾荒少年