国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Python的鐵路旅財(cái)數(shù)據(jù)挖掘與分析

2020-08-04 09:50:33鄭涵之葉燊王曉凱
關(guān)鍵詞:鐵路

鄭涵之 葉燊 王曉凱

摘要:鐵路旅財(cái)案件的現(xiàn)場(chǎng)痕跡易被破壞,嫌疑人作案時(shí)空具有一定選擇性,通過(guò)分析旅客乘車(chē)數(shù)據(jù),可以從大量乘客中找出有作案嫌疑的乘客。運(yùn)用Python語(yǔ)言編寫(xiě)算法,服務(wù)于一線(xiàn)鐵路民警,減少重復(fù)性人工操作,節(jié)約警力。

關(guān)鍵詞:鐵路;旅財(cái)案件;Python

中圖分類(lèi)號(hào):TP311.13 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2020)05-0033-02

0引言

旅客運(yùn)輸是鐵路運(yùn)輸生產(chǎn)的重要方面,鐵路車(chē)站是一個(gè)將自四面八方的旅客高度聚集的、流動(dòng)的公共場(chǎng)所。旅財(cái)案件,即旅客財(cái)物被盜案件,也是鐵路區(qū)域內(nèi)的多發(fā)性案件。所謂的鐵路旅財(cái)案件就是指在鐵路上實(shí)施的侵犯旅客財(cái)產(chǎn)的犯罪行為,即列車(chē)上行竊即可稱(chēng)為旅財(cái)案件。犯罪主體具有多樣性,犯罪分子作案一般都有個(gè)對(duì)作案環(huán)境和目標(biāo)的熟悉情況有所了解。這不僅是犯罪分子作案的預(yù)備、對(duì)作案目標(biāo)的選擇問(wèn)題,也是其犯罪心理安全的需要。所以,犯罪分子的作案活動(dòng)要么選擇自己熟悉的環(huán)境,要么事先進(jìn)行踩點(diǎn)、預(yù)謀。鐵路站車(chē)是一個(gè)特殊的地域和社會(huì)環(huán)境,這里面的環(huán)境格局、設(shè)施設(shè)備、人員崗位、生產(chǎn)作業(yè)流程、旅客旅行過(guò)程以及警察的勤務(wù)活動(dòng)等都有一定的規(guī)范性和特殊性。

雖然火車(chē)票實(shí)名制的實(shí)施為破獲侵財(cái)案件提供了一些便利,公安機(jī)關(guān)可以根據(jù)購(gòu)票人信息順藤摸瓜,查找作案人,但一些車(chē)站并未嚴(yán)格實(shí)行實(shí)名制檢票,從而為不法分子提供了可乘之機(jī),他們或用虛假身份證購(gòu)票,或用他人身份證購(gòu)票,為案件偵破帶來(lái)了重重障礙。

Python是一種跨平臺(tái)的計(jì)算機(jī)程序設(shè)計(jì)語(yǔ)言,是一種面向?qū)ο蟮膭?dòng)態(tài)類(lèi)型語(yǔ)言,提供了多個(gè)數(shù)據(jù)分析的模塊,如pandas庫(kù)numpy庫(kù)和openpyxl等,以及可以連接ftp的功能模塊如ftplib庫(kù)等,可以高效地實(shí)現(xiàn)對(duì)旅財(cái)案件嫌疑人乘車(chē)軌跡的數(shù)據(jù)進(jìn)行分析的任務(wù)。

1嫌疑人作案規(guī)律研究

鐵路旅財(cái)案件的作案人無(wú)論是慣犯、流竄犯,還是臨時(shí)起意的人員,大多都熟知客運(yùn)規(guī)律和站車(chē)地形。不法分子會(huì)選擇自己熟悉的地方作案,這樣既容易得手,又便于及時(shí)銷(xiāo)贓和逃逸。鐵路客運(yùn)規(guī)律和站車(chē)地形都有其特殊性,如列車(chē)的運(yùn)行和站停有一定規(guī)律、人財(cái)物高度集中又流動(dòng)性大、旅客之間多互不認(rèn)識(shí)、車(chē)站出口較多等,對(duì)此不熟悉的人會(huì)感到茫然而拘謹(jǐn),而熟悉站車(chē)地形和客運(yùn)規(guī)律的人作起案來(lái)則是輕車(chē)熟路。

在公安機(jī)關(guān)的打擊和宣傳下,旅客對(duì)侵財(cái)案件的傳統(tǒng)作案手法已經(jīng)有所警惕,作案人不得不采取更加多樣化、智能化的作案手段。如作案人事先踩點(diǎn)、預(yù)謀,趁旅客在售票廳購(gòu)票時(shí)暗中觀察旅客的錢(qián)財(cái)數(shù)量和放置位置等情況信息,或趁旅客不注意時(shí)盜走其財(cái)物,或趁上車(chē)人多擁擠時(shí)下手,或跟隨目標(biāo)上車(chē)后伺機(jī)作案。失主往往短時(shí)間內(nèi)難以發(fā)現(xiàn)財(cái)物被盜。

經(jīng)總結(jié)旅財(cái)案件嫌疑人存在以下作案規(guī)律:(1)為作案得手后及時(shí)逃脫,且不引起其他乘客注意力,—般不攜帶兒童。(部分以?xún)和癁檠谧o(hù)實(shí)施盜竊的作案人例外)(2)作案人以男性為主,且年齡主要在16到50歲之間,年齡跨度較大。不能夠僅僅憑借年齡作為篩選的主要條件。(3)作案人購(gòu)買(mǎi)的車(chē)票票價(jià)一般較低,且以普通座次為主,票價(jià)多在300元以下。以此來(lái)降低自己的作案成本,提高作案所得。(4)作案人的乘車(chē)軌跡較為復(fù)雜、繁瑣,存在短期內(nèi)的多次乘車(chē),購(gòu)買(mǎi)了與之前購(gòu)票規(guī)律不符的車(chē)票(存在盜用身份證的嫌疑),乘車(chē)軌跡出現(xiàn)大量“斷點(diǎn)”(不連續(xù))等,且存在較高的“斷點(diǎn)比率”,根據(jù)之前的案件數(shù)據(jù)分析得出斷點(diǎn)比率在75%以上的乘客乘車(chē)數(shù)據(jù),大多存在一定的異?,F(xiàn)象。

在旅財(cái)案件中,嫌疑人的旅客乘車(chē)數(shù)據(jù)中最為明顯就是“斷點(diǎn)”,所謂的“斷點(diǎn)”就是在一段時(shí)間內(nèi),一個(gè)人的乘車(chē)軌跡不連續(xù),如從一開(kāi)始的乘車(chē)軌跡為南京到上海而下一次的乘車(chē)軌跡卻是從常州到無(wú)錫,這就是所謂的“斷點(diǎn)”。因?yàn)椋蠖鄶?shù)嫌疑人會(huì)在得手之后直接在就近的車(chē)站提前下車(chē),然后通過(guò)車(chē)票提前出站,而下一次再購(gòu)票乘車(chē)的出發(fā)站就與之前軌跡的到達(dá)站不一致,這就導(dǎo)致了乘車(chē)軌跡的不連續(xù)。所以,如果一個(gè)人在一段時(shí)間內(nèi)的乘車(chē)軌跡存在大量的“斷點(diǎn)”,這個(gè)人的乘車(chē)軌跡就存在問(wèn)題,從一定角度上說(shuō)就存在作案的嫌疑。

2基于Python的鐵路旅財(cái)數(shù)據(jù)分析軟件設(shè)計(jì)

處理數(shù)據(jù)的流程即先從發(fā)生盜竊的列車(chē)上的旅客數(shù)據(jù)進(jìn)行分析處理,從中去除一些作案嫌疑較小的乘客,如女性乘客(鐵路旅財(cái)案件的嫌疑人以男性為主);攜帶兒童的乘客;乘車(chē)距離較長(zhǎng)票價(jià)較貴的乘客;年齡大于6噦的老人(根據(jù)大量案例的數(shù)據(jù)分析以及民警的辦案經(jīng)驗(yàn),鐵路旅財(cái)案件的作案人員年齡分布較廣,作案人年齡可跨越16歲到60歲不等)等。并且從中尋找是否有前科人員乘坐該次列車(chē),若有則將其作為重點(diǎn)分析對(duì)象,單獨(dú)進(jìn)行分析;如果無(wú),則考慮是否存在冒用身份等情況。通過(guò)種種條件來(lái)對(duì)于龐大的乘客個(gè)人信息數(shù)據(jù)進(jìn)行篩選,縮小偵查范圍。并且設(shè)置“斷點(diǎn)比率”,以75%為閾值,高于這個(gè)值的人員將被歸為重點(diǎn)嫌疑人員。

本軟件用Python語(yǔ)言進(jìn)行編寫(xiě),以針對(duì)旅財(cái)案件的“斷點(diǎn)”模型自動(dòng)化分析為主要功能,其中“斷點(diǎn)”模型以“斷點(diǎn)”和“斷點(diǎn)”比率為主要特征作為篩選條件,輔以年齡、性別、網(wǎng)絡(luò)購(gòu)票等特征進(jìn)一步篩選,實(shí)現(xiàn)了整套流程的自動(dòng)化分析以及信息推送。其它功能還包括:碰撞法尋找旅財(cái)人員和逃票人員的軌跡“斷點(diǎn)”、鐵路旅財(cái)案件自動(dòng)篩選管轄前科人員、前科人員以及案情信息查詢(xún)、15位身份證轉(zhuǎn)換為18位身份證、提供豐富快捷的信息查詢(xún)篩選功能、從指定ftp下載數(shù)據(jù)、上傳數(shù)據(jù)至指定ftp等功能(軟件的每個(gè)數(shù)據(jù)處理模塊都默認(rèn)先將所有數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、去重以及按照身份證號(hào)排序)。

2.1鐵路旅財(cái)案件“斷點(diǎn)”模型自動(dòng)化分析

軟件初始頁(yè)面有六個(gè)功能模塊可供選擇,輸入數(shù)字“1”選擇功能一,將需要分析的excel文件放入指定路徑下,軟件自動(dòng)分析完畢后會(huì)利用pandas.DataFrame方法和pandas.setoption方法提供預(yù)覽,預(yù)覽結(jié)果中會(huì)運(yùn)用sorted方法和operator.itemgetter方法將所有人根據(jù)出現(xiàn)“斷點(diǎn)”次數(shù)降序進(jìn)行排序和匯總。

預(yù)覽“斷點(diǎn)”分析結(jié)果,可以看到軟件會(huì)將乘客每條軌跡數(shù)據(jù)標(biāo)記上是否為斷點(diǎn),并將每個(gè)乘客按照斷點(diǎn)次數(shù)降序排列。軟件在指定路徑中自動(dòng)生成名為“斷點(diǎn)結(jié)果”的文件夾,即可將多+excel~格中的所有乘車(chē)數(shù)據(jù)匯總結(jié)果到結(jié)果中,并且以時(shí)間來(lái)命名,解決了同一人的乘車(chē)數(shù)據(jù)出現(xiàn)在多個(gè)excel文件中的問(wèn)題。

處理后的數(shù)據(jù)格式新增了“性別”“年齡”“是否網(wǎng)絡(luò)購(gòu)票”“車(chē)站是否有人臉識(shí)別”“此條軌跡是否為斷點(diǎn)”這,個(gè)新的字段。每個(gè)人的最后一條乘車(chē)數(shù)據(jù)示為“無(wú)效值”,因?yàn)樵谠O(shè)計(jì)“斷點(diǎn)”算法時(shí)將每一個(gè)人的軌跡以時(shí)間先后順序從前向后進(jìn)行“斷點(diǎn)”比較計(jì)算的,最后一條軌跡數(shù)據(jù)沒(méi)有向后的比較值,所以作為“無(wú)效值”,不影響“斷點(diǎn)”比率的計(jì)算;若某個(gè)人只有一條軌跡數(shù)據(jù),則標(biāo)記為“無(wú)效值”。

前期經(jīng)過(guò)數(shù)據(jù)清洗、去重以及按照身份證和時(shí)間排序后,先通過(guò)xlrd模塊和openpyxlN塊讀取整+exce墳件并記錄其所有數(shù)據(jù)條數(shù),再通過(guò)while循環(huán)將循環(huán)次數(shù)限制在與數(shù)據(jù)條數(shù)相同,并對(duì)比某一條數(shù)據(jù)的身份證列與下一條數(shù)據(jù)是否相同,若相同,則說(shuō)明這兩條數(shù)據(jù)是同一個(gè)人,就可以將本條數(shù)據(jù)的到站與下一條數(shù)據(jù)的發(fā)站進(jìn)行比較,來(lái)得出本條數(shù)據(jù)是否為“斷點(diǎn)”;若本條數(shù)據(jù)的身份證列與下一條數(shù)據(jù)不相同,則說(shuō)明該條數(shù)據(jù)是該人的軌跡中最后一條數(shù)據(jù),因而無(wú)法與下一條數(shù)據(jù)比較,即標(biāo)識(shí)“無(wú)效值”。

在給每一條軌跡數(shù)據(jù)標(biāo)記了是否為“斷點(diǎn)”之后,再運(yùn)用collections.counter方法計(jì)算每個(gè)人的軌跡數(shù)據(jù)總數(shù),再計(jì)算每個(gè)人的“斷點(diǎn)”軌跡數(shù)占個(gè)人軌跡數(shù)據(jù)總數(shù)的比重,即為“斷點(diǎn)”比率。

2.2前科人員信息查詢(xún)

本模塊主要利用python中的xlrd和xlwt模塊讀取excel文件中內(nèi)容進(jìn)行索引查找和數(shù)據(jù)的挖掘。根據(jù)命令提示在指定路徑下放入原始的案情表和人員信息表。軟件會(huì)通過(guò)0s.1istdir方法判斷指定路徑下是否放入文件,若沒(méi)有放入文件則會(huì)提示先放人文件在執(zhí)行關(guān)鍵詞查詢(xún)。放人文件后先輸入需要查找的關(guān)鍵字1,再輸入其它需要查找的關(guān)鍵字2,3,4……,若需要所有上述關(guān)鍵字搜索的結(jié)果,則輸入“并集”;若需要同時(shí)滿(mǎn)足上述所有關(guān)鍵字的搜索結(jié)果,則輸入“交集”。

完成搜索的同時(shí),軟件也會(huì)自動(dòng)將部分舊版的15位身份證轉(zhuǎn)換為新版的18位身份證。對(duì)于在數(shù)據(jù)源中有港澳通行證的乘客,軟件也會(huì)將港澳通行證號(hào)放在身份證后面提供預(yù)覽。

2.3自動(dòng)定時(shí)爬取數(shù)據(jù)進(jìn)行分析并推送

python~時(shí)任務(wù)框架Apscheduler提供了非常豐富而且方便易用的定時(shí)任務(wù)接口,主要運(yùn)用其中用BlockingScheduler調(diào)度器和interval方法設(shè)置觸發(fā)器和定時(shí)自動(dòng)觸發(fā)的時(shí)間間隔,實(shí)現(xiàn)了精細(xì)化的控制。在此大框架下編寫(xiě)具體要執(zhí)行的定時(shí)任務(wù):利用ftplib.FTP方法登錄ftp取數(shù)據(jù),通過(guò)模擬菜單界面使用戶(hù)查看當(dāng)前路徑下的文件,確定需要選擇的文件,軟件會(huì)運(yùn)用csv.reader方法預(yù)覽原文件,針對(duì)有最新乘車(chē)記錄的前科人員,確定其管轄范圍屬于管內(nèi)車(chē)站還是管內(nèi)車(chē)次,處理結(jié)果用open方法和write方法分別寫(xiě)入所屬轄區(qū)各所以及乘警隊(duì)的txt文件中,將數(shù)據(jù)存儲(chǔ)在本地并且分析完畢后在自動(dòng)定時(shí)上傳到指定ftp上完成推送,實(shí)現(xiàn)了動(dòng)態(tài)防控。

2.4碰撞法找“斷點(diǎn)”

除了上文提到的分析“斷點(diǎn)”的方法,還有一種方法即碰撞法。這種尋找“斷點(diǎn)”的方法適用于從普通乘客中分離出鐵路逃票嫌疑人。

例如一條鐵路沿線(xiàn)分別有A、B、c三站,將同一天(或若干天)內(nèi)從A到B和從C到B的乘客數(shù)據(jù)進(jìn)行碰撞,碰撞結(jié)果即為出現(xiàn)軌跡“斷點(diǎn)”的人員。這種方法更適合在已知固定乘車(chē)區(qū)間內(nèi)尋找經(jīng)常逃票的人員。

將乘車(chē)區(qū)間互為反向的兩種乘車(chē)數(shù)據(jù)放人指定文件夾下的“正向”和“反向”目錄下(“正向”“反向”為相對(duì)的,自行定義某一方向?yàn)檎蚣纯?,另一方向就為反向)即可自?dòng)分析,分析結(jié)果文件以時(shí)間作為命名格式。

3結(jié)語(yǔ)

該分析過(guò)程可總結(jié)為通過(guò)一系列對(duì)于乘車(chē)軌跡特點(diǎn)的篩選得出一部分存在嫌疑的人員名單,再由民警通過(guò)所得的人員名單與前科人員數(shù)據(jù)庫(kù)進(jìn)行對(duì)比,分析其近期是否存在異常的消費(fèi)記錄、住宿信息以及通話(huà)信息等等。通過(guò)對(duì)于這一系列的數(shù)據(jù)分析,從而縮小偵查范圍,排查出有嫌疑的人員。根據(jù)所得的嫌疑人名單進(jìn)行進(jìn)一步的偵查工作,以由“由人到案”為基本思想進(jìn)行鐵路旅財(cái)案件的偵破工作。綜上所述,根據(jù)旅客乘車(chē)數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘能夠真正挖掘出數(shù)據(jù)的潛在價(jià)值,為旅客侵財(cái)型案件的偵破提供指導(dǎo)方向。但是僅依靠鐵路旅客乘車(chē)數(shù)據(jù)的挖掘遠(yuǎn)遠(yuǎn)不夠用于應(yīng)對(duì)實(shí)際作戰(zhàn)中遇到的種種現(xiàn)象,還需要結(jié)合各項(xiàng)其他數(shù)據(jù)進(jìn)行綜合的分析,以此才能夠得出較為準(zhǔn)確的分析結(jié)論。

在大數(shù)據(jù)、Python數(shù)據(jù)分析等技術(shù)支持手段的支持之下,重視鐵路公路大數(shù)據(jù)系統(tǒng)建設(shè),基于科學(xué)理念為支持,強(qiáng)化信息建設(shè)與完善,重視信息數(shù)據(jù)采集,提根本上提升鐵路信息化管理能力,為智慧鐵路公安系統(tǒng)建設(shè)奠定了基礎(chǔ)。以“智慧鐵路”為思想指導(dǎo),更加有效的利用收集到的鐵路數(shù)據(jù),改變以往傳統(tǒng)的辦案方式,從傳統(tǒng)的“由案到人”變?yōu)椤坝扇说桨浮?,被?dòng)變?yōu)橹鲃?dòng),主動(dòng)分析乘客的乘車(chē)數(shù)據(jù),找到有嫌疑的乘客數(shù)據(jù),并將數(shù)據(jù)及時(shí)反饋給一線(xiàn)鐵路民警,提高防范意識(shí),預(yù)防制止違法犯罪。在信息數(shù)據(jù)的支持之下的凸顯鐵路公安信息系統(tǒng)的預(yù)警、分析作用,提前做好預(yù)警準(zhǔn)備,可以真正的做到精確打擊鐵路扒竊的違法犯罪行為。

猜你喜歡
鐵路
沿著中老鐵路一路向南
鐵路通信線(xiàn)路維護(hù)體制改革探索與實(shí)踐
無(wú)人機(jī)在鐵路工程建設(shè)中的應(yīng)用與思考
GSM-R在鐵路通信中的應(yīng)用
夢(mèng)想在鐵路人心中流淌
丁羽心:成敗鐵路
法人(2014年2期)2014-02-27 10:42:20
新源县| 巩义市| 宜兴市| 邢台市| 犍为县| 迭部县| 淮南市| 赤城县| 浦县| 克什克腾旗| 北安市| 广东省| 灵台县| 深州市| 磴口县| 望奎县| 哈尔滨市| 勃利县| 静安区| 浦江县| 松江区| 平阳县| 青冈县| 斗六市| 伊宁市| 金塔县| 余姚市| 九龙县| 二连浩特市| 土默特左旗| 呼图壁县| 隆回县| 鄂尔多斯市| 常德市| 盐池县| 荥阳市| 米脂县| 涿州市| 滦南县| 梅河口市| 弋阳县|