国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

偵查模式從信息孤島向結(jié)構(gòu)化數(shù)據(jù)庫的邏輯演進(jìn)

2016-03-15 00:20:37印大雙
關(guān)鍵詞:數(shù)據(jù)挖掘犯罪數(shù)據(jù)庫

印大雙

(南京森林警察學(xué)院,江蘇南京210023)

偵查模式從信息孤島向結(jié)構(gòu)化數(shù)據(jù)庫的邏輯演進(jìn)

印大雙

(南京森林警察學(xué)院,江蘇南京210023)

互聯(lián)網(wǎng)、物聯(lián)網(wǎng)與云計(jì)算技術(shù)不斷發(fā)展,意味著大數(shù)據(jù)時(shí)代的到來,給偵破案件帶來前所未有的挑戰(zhàn)。偵查實(shí)踐中需要不斷更新各種技術(shù)手段與措施,使傳統(tǒng)與現(xiàn)代相結(jié)合。微信、微博等交互方式產(chǎn)生的海量數(shù)據(jù)使現(xiàn)代社會(huì)面臨越來越復(fù)雜的情形,大數(shù)據(jù)與小概率事件導(dǎo)致偵查方式發(fā)生顛覆性的變革,偵查中需要運(yùn)用大數(shù)據(jù)思維方式,以人、物為中心的傳統(tǒng)偵查方式轉(zhuǎn)向以數(shù)據(jù)為中心的升級(jí)版的偵查思維模式。大數(shù)據(jù)視野下,偵查模式依托網(wǎng)絡(luò)數(shù)據(jù)存儲(chǔ)和查詢系統(tǒng)、大規(guī)模結(jié)構(gòu)化數(shù)據(jù)分析系統(tǒng)、大數(shù)據(jù)挖掘系統(tǒng),以特定時(shí)間、特定空間、特定數(shù)據(jù)為基準(zhǔn),形成犯罪控制、犯罪偵破與犯罪預(yù)測(cè)的新偵查模式,使辦案效率有效提升。

偵查模式;大數(shù)據(jù);結(jié)構(gòu)化數(shù)據(jù)庫;數(shù)據(jù)挖掘;關(guān)聯(lián)規(guī)則

在全球信息化進(jìn)程中,信息數(shù)據(jù)已經(jīng)成為社會(huì)發(fā)展的重要戰(zhàn)略資源,涉及計(jì)算機(jī)科學(xué)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)、密碼技術(shù)、信息處理技術(shù)、應(yīng)用數(shù)學(xué)等學(xué)科知識(shí)。大數(shù)據(jù)挖掘通過情報(bào)檢索、貝葉斯定律、程序碰撞、在線分析處理等諸多方法搜索隱藏于海量信息中的有效數(shù)據(jù),最大限度地將原本分散于個(gè)案的犯罪痕跡和物證等信息集中起來,實(shí)現(xiàn)偵查資源的有效整合與偵查信息的動(dòng)態(tài)勾連,使現(xiàn)有證據(jù)之間相互補(bǔ)充、相互印證、相互支撐,在宏觀上拓寬思路,微觀上捕捉特征,使因果性、假說、實(shí)驗(yàn)觀察與推理方法得到清晰的展示,形成理性上的審慎和技術(shù)上的嚴(yán)格,有利于查明案件真相,提高偵查效率,有效打擊與遏制犯罪。

一、偵查實(shí)踐中數(shù)據(jù)庫建構(gòu)策略

在偵查實(shí)踐中,數(shù)據(jù)庫建構(gòu)由粗放型向集約化轉(zhuǎn)向,有助于情報(bào)信息分析、研判、推斷、預(yù)測(cè)、實(shí)戰(zhàn)指導(dǎo)。數(shù)據(jù)庫建構(gòu)重點(diǎn)涉及時(shí)間、空間、人物、事物、行為等相關(guān)信息,關(guān)聯(lián)犯罪現(xiàn)場(chǎng)形態(tài)分析與研判,對(duì)物證與相關(guān)環(huán)境進(jìn)行甄別與技術(shù)檢測(cè),形成對(duì)案件整體的合邏輯性表述與相關(guān)信息的系統(tǒng)性研究。在偵查實(shí)踐中,現(xiàn)場(chǎng)分析、物證獲取、犯罪嫌疑人鎖定均有賴于數(shù)據(jù)庫,從宏觀上獲取整體性、全面性的犯罪活動(dòng)新情況、新動(dòng)向,一定時(shí)期或區(qū)域的某類突出犯罪案件的發(fā)展趨勢(shì)等,從微觀上獲取具體犯罪線索、個(gè)案犯罪情況信息。

(一)大數(shù)據(jù)庫建構(gòu)基本架構(gòu)

1.系統(tǒng)框架

數(shù)據(jù)庫系統(tǒng)框架通過數(shù)據(jù)通道輸送到數(shù)據(jù)處理中心,然后最終的處理結(jié)果會(huì)通過顯示終端進(jìn)行顯示。整個(gè)過程主要通過三個(gè)部分實(shí)現(xiàn),元數(shù)據(jù)、數(shù)據(jù)倉庫、終端顯示。元數(shù)據(jù)通過通道運(yùn)輸后在數(shù)據(jù)處理中心進(jìn)行挖掘處理,將原有的所有數(shù)據(jù)進(jìn)行篩選,將有效數(shù)據(jù)篩選出來,然后將潛在的有效數(shù)據(jù)挖掘出來,進(jìn)行整理分析,最終呈現(xiàn)在終端上。

基于全國公安局域網(wǎng),形成自上而下的五級(jí)偵查信息網(wǎng)絡(luò)體系。金盾工程發(fā)揮的作用巨大,可以追蹤逃犯資料、被盜搶車輛、指紋、DNA等信息。銜接刑偵、經(jīng)偵、緝毒等業(yè)務(wù)部門,橫向覆蓋派出所、交巡警、車管所、拘留所、戒毒所、治安管理服務(wù)站,拓寬信息渠道,實(shí)現(xiàn)不同部門、不同警種的協(xié)同,充分利用社會(huì)公共網(wǎng)絡(luò)資源,立體使用綜合網(wǎng)絡(luò)。

2.數(shù)據(jù)倉庫

注重案件資料(包括已破與未破案件的資料)、現(xiàn)場(chǎng)痕跡物品檔案、犯罪嫌疑人資料、犯罪手法資料、涉案財(cái)物檔案、指紋信息、足跡信息、DNA資料等刑事犯罪情報(bào)資的建設(shè);對(duì)刑事犯罪高危人群、作案目標(biāo)、作案手段方法等規(guī)律、特點(diǎn),進(jìn)行分層與分類的數(shù)據(jù)庫建設(shè);同時(shí),將常住人口、暫住人口、旅店住宿人員資料、出租房信息、金銀加工、典當(dāng)、二手車、二手手機(jī)等資料納入系統(tǒng)數(shù)據(jù)庫;另外,將電信部門的通信資料(機(jī)主信息與通話資料)、金融部門的資金資料、影像資料(包括金融、賓館、公路入口、界面以及公共復(fù)雜場(chǎng)所的監(jiān)控)、社會(huì)保障資料、保險(xiǎn)資料、用工招聘資料等重要資訊歸入數(shù)據(jù)庫。

對(duì)大數(shù)據(jù)的態(tài)勢(shì)感知、質(zhì)量評(píng)估及融合表示均面臨新的挑戰(zhàn),數(shù)據(jù)庫的建設(shè)基本由ODS(操作數(shù)據(jù)存儲(chǔ))和DW/DM(密集型光波復(fù)用)構(gòu)成,其中ODS需要以業(yè)務(wù)邏輯為基礎(chǔ),而其具體的操作過程是通過E-R模型反應(yīng)出來的,由事物數(shù)據(jù)(交易數(shù)據(jù))和主數(shù)據(jù)兩部分組成。原系統(tǒng)的結(jié)構(gòu)要與ODS層的結(jié)構(gòu)相一致,如果需要對(duì)二者的數(shù)據(jù)進(jìn)行進(jìn)一步的合并,則需要設(shè)計(jì)合理的一種表格[1]。DW/DM是一種多維度的數(shù)據(jù)庫的結(jié)構(gòu),根據(jù)對(duì)數(shù)據(jù)的不同要求,這種多維度可以不同的方式呈現(xiàn),所以DW/DM有多種構(gòu)型,這些維度都是根據(jù)數(shù)據(jù)間的包含關(guān)系進(jìn)行設(shè)計(jì)的,方便檢索與應(yīng)用。

3.關(guān)聯(lián)規(guī)則

算法的選擇與設(shè)計(jì)直接影響著數(shù)據(jù)挖掘的實(shí)現(xiàn),整個(gè)數(shù)據(jù)挖掘過程可分為兩個(gè)步驟,R.Agrawal提出了Apriori關(guān)于CD、DD和CAD三種并行算法①在CD、DD和CAD三種算法中,CD算法將候選集發(fā)送到每個(gè)計(jì)算節(jié)點(diǎn),每個(gè)節(jié)點(diǎn)掃描局部數(shù)據(jù)集得到局部計(jì)數(shù)后,通過同步得到全局支持度計(jì)數(shù)。DD算法將候選集進(jìn)行劃分后傳輸?shù)礁鱾€(gè)節(jié)點(diǎn)上,每個(gè)節(jié)點(diǎn)掃描全局?jǐn)?shù)據(jù)庫而得到本地候選集的支持度計(jì)數(shù),然后通信得到全局所有候選集的支持度計(jì)數(shù)。CAD算法則嘗試將打破每次迭代后需要同步的約束,綜合了CD算法和DD算法。參見:陳立基?;贖adoop的關(guān)聯(lián)規(guī)則并行算法研究[D]。江蘇:南京大學(xué),2012.05:1.,首先是從數(shù)據(jù)源到ODS層,然后是ODS層到DW/DM,這兩步都是通過ETL工具實(shí)現(xiàn)。系統(tǒng)地看,這兩個(gè)步驟是以數(shù)據(jù)源、數(shù)據(jù)目標(biāo)以及映射關(guān)系這三個(gè)基本要素來實(shí)現(xiàn)的。數(shù)據(jù)目標(biāo)最終計(jì)劃實(shí)現(xiàn)的分析處理后得到的數(shù)據(jù)表,可以對(duì)處理后的數(shù)據(jù)有規(guī)律的陳列,映射關(guān)系意味著具體的實(shí)現(xiàn)過程,包括實(shí)現(xiàn)的算法等[2]。

(二)數(shù)據(jù)庫模式

數(shù)據(jù)庫系統(tǒng)呈現(xiàn)三級(jí)模式結(jié)構(gòu),同一意義下的數(shù)據(jù)存在著許多抽象和轉(zhuǎn)換,DBMS(數(shù)據(jù)庫管理系統(tǒng))把數(shù)據(jù)庫從邏輯分為外模式、概念模式和內(nèi)模式三種,分別反映了數(shù)據(jù)庫的三個(gè)不同視角。

1.數(shù)據(jù)庫外模式

外部作為數(shù)據(jù)庫的用戶視圖,數(shù)據(jù)庫管理系統(tǒng)(DBMS)是數(shù)據(jù)庫的最高層。

2.數(shù)據(jù)庫概念模式

概念模式處于數(shù)據(jù)庫抽象層面,包含所有的數(shù)據(jù)庫實(shí)體和聯(lián)系,提供數(shù)據(jù)庫的總體視圖,描述數(shù)據(jù)庫中數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系。

3.數(shù)據(jù)庫內(nèi)模式

內(nèi)模式作為數(shù)據(jù)庫的最低抽象層,與存儲(chǔ)數(shù)據(jù)方式最貼近,表述數(shù)據(jù)庫內(nèi)部存儲(chǔ)結(jié)構(gòu),對(duì)數(shù)據(jù)庫進(jìn)

行描述[3]。

數(shù)據(jù)庫涉及邏輯建模,對(duì)于邏輯模型,需要展開每個(gè)屬性的定義,側(cè)重關(guān)注諸如數(shù)據(jù)類型與長(zhǎng)度、是否可以為空與可否進(jìn)行索引。對(duì)于每個(gè)關(guān)系,需要精確地定義在主鍵值發(fā)生變化時(shí)約束數(shù)據(jù)行為的規(guī)則。數(shù)據(jù)庫邏輯模型涉及:

(1)文本類型(包括固定長(zhǎng)度和可變長(zhǎng)度)

(2)數(shù)字類型(帶符號(hào)整數(shù)、無符號(hào)整數(shù)、自動(dòng)編號(hào)、浮點(diǎn)數(shù)、十進(jìn)制數(shù)等)

(3)原始數(shù)據(jù)類型(固定的、可變的、圖片和OLE對(duì)象)

(4)臨時(shí)類型(時(shí)間戳、日期、時(shí)間和日期時(shí)間)

(5)邏輯類型(真或假)

(6)其他類型(行ID或?qū)ο驣D)

(三)偵查實(shí)踐中的大數(shù)據(jù)庫建構(gòu)策略

數(shù)據(jù)挖掘中關(guān)注提取隱藏在數(shù)據(jù)后的有用信息,提出優(yōu)化算法,通過這些分析用于決策,實(shí)踐過程中重點(diǎn)考量以下兩個(gè)問題,第一,序列模式:試圖在時(shí)間序列事務(wù)集合中,尋找會(huì)話集合之間有關(guān)時(shí)間序列關(guān)系的模式。第二,異類分析:側(cè)重于對(duì)不規(guī)則點(diǎn)進(jìn)行研究,對(duì)明顯偏離常規(guī)數(shù)據(jù)的現(xiàn)象關(guān)注逃逸行為模式的背景,異類分析可發(fā)現(xiàn)比一般數(shù)據(jù)所包含的信息更有價(jià)值的數(shù)據(jù)。

偵查實(shí)踐中的大數(shù)據(jù)庫建構(gòu)重心應(yīng)關(guān)注對(duì)現(xiàn)場(chǎng)勘查中獲得的各種數(shù)據(jù)與資料,并進(jìn)行分層與分類。現(xiàn)場(chǎng)勘查是一項(xiàng)策略性和技術(shù)性很強(qiáng)的偵查措施,必須制定妥當(dāng)?shù)牟呗院瓦\(yùn)用一定的技術(shù)。根據(jù)不同人員及其心理狀態(tài),有針對(duì)性地運(yùn)用訪問策略和方法,包括現(xiàn)場(chǎng)搜查、采取緊急措施的策略方法;技術(shù)包括尋找、發(fā)現(xiàn)、顯現(xiàn)、提取、保管、檢驗(yàn)與犯罪有關(guān)的痕跡、物證所使用的各種物理方法、化學(xué)方法;對(duì)尸體外表檢驗(yàn)以及對(duì)被害人、犯罪嫌疑人進(jìn)行人身檢查所使用的法醫(yī)技術(shù);記錄固定與犯罪有關(guān)的場(chǎng)所、物品、尸體的位置、狀態(tài)、特征、所使用的錄像、照相、繪圖等拍攝技術(shù)和圖像處理技術(shù);警犬技術(shù)、排爆技術(shù)、消防技術(shù)和其他一些用于解決復(fù)雜疑難問題的專門技術(shù)等,主要體現(xiàn)在以下兩個(gè)方面:

第一,痕跡勘驗(yàn),此過程針對(duì)犯罪嫌疑人實(shí)施犯罪活動(dòng)遺留在現(xiàn)場(chǎng)上的形象痕跡,主要包括:

(1)身體特征痕跡:手印、腳印、牙痕、唇印等;

(2)衣物痕跡:鞋印、襪印、手套印、坐痕、衣物痕跡等;

(3)工具痕跡:犯罪所使用的各種兇器和破壞工具痕跡;

(4)交通運(yùn)輸工具:車輪痕、車身撞擊、碰痕、車支架痕;

(5)反抗、搏斗痕跡。

第二,通過對(duì)犯罪可疑痕跡勘驗(yàn)可以構(gòu)建數(shù)據(jù)平臺(tái),主要包括:

(1)判定痕跡是否與犯罪有關(guān);

(2)確認(rèn)犯罪案件性質(zhì);

(3)研判案件要素:犯罪目的、犯罪行為、過程、手段、動(dòng)機(jī)、時(shí)間、人數(shù)等;

(4)判定犯罪嫌疑人的個(gè)人特質(zhì):性別、身高、年齡、體態(tài)、職業(yè)等;

(5)研判犯罪嫌疑人的精神狀態(tài)、心理狀態(tài)、犯罪手法的熟練程度等。

偵查實(shí)踐中數(shù)據(jù)庫建構(gòu)關(guān)乎從法律層面與技術(shù)層面的雙重考量,既要在法律框架內(nèi)從事偵查活動(dòng),又要從不斷發(fā)展的科技層面獲取線索。隨著數(shù)據(jù)庫應(yīng)用要求的提升,空間數(shù)據(jù)庫和時(shí)態(tài)數(shù)據(jù)庫已經(jīng)成為現(xiàn)代數(shù)據(jù)庫的兩個(gè)重要分支。單獨(dú)的空間數(shù)據(jù)庫和時(shí)態(tài)數(shù)據(jù)庫已經(jīng)無法滿足需求,必然產(chǎn)生時(shí)空數(shù)據(jù)庫。時(shí)空數(shù)據(jù)庫提供包括時(shí)間和空間要素在內(nèi)的數(shù)據(jù)庫系統(tǒng),其時(shí)空模型是一種有效組織和管理時(shí)態(tài)數(shù)據(jù)、屬性、空間和時(shí)間語義更加完整的數(shù)據(jù)模型。在偵查實(shí)踐中,數(shù)據(jù)庫建構(gòu)所涉及的內(nèi)容越來越繁雜,牽涉各種技術(shù),包括痕跡檢驗(yàn)技術(shù)、文件鑒定技術(shù)、微量物證分析、DNA技術(shù)、公安圖像技術(shù)、視頻跟蹤技術(shù)、GPS軌跡定位等,這些技術(shù)需要與無線電技術(shù)、航空偵查技術(shù)、衛(wèi)星偵查技術(shù)等專門技術(shù)手段相結(jié)合,通過對(duì)這些技術(shù)進(jìn)行分析、提出優(yōu)化算法,在此基礎(chǔ)上進(jìn)行決策。

二、偵查實(shí)踐中的數(shù)據(jù)挖掘

隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘分類問題和算法研究成為熱點(diǎn),對(duì)數(shù)據(jù)挖掘中存在的實(shí)際問題,主要通過分類(Classification)、估計(jì)(Estimation)、預(yù)測(cè)(Prediction)、關(guān)聯(lián)規(guī)則(Association rules)、聚類(Clustering)、復(fù)雜數(shù)據(jù)類型(Text、Web、Graphic images、Video、Audio)等,提出從屬性選擇、連續(xù)屬性離散化、抽樣方法,提高數(shù)據(jù)挖掘的效率和性能①數(shù)據(jù)挖掘利用一些分析工具從大量的、不完全的、模糊的、有噪音的、隨機(jī)的數(shù)據(jù)中,提取出隱藏在其中的、實(shí)現(xiàn)未知并具有價(jià)值信息的過程。數(shù)據(jù)挖掘需要實(shí)現(xiàn)建立數(shù)據(jù)關(guān)系模型,對(duì)數(shù)據(jù)進(jìn)行分析預(yù)測(cè),在實(shí)現(xiàn)自動(dòng)的有效數(shù)據(jù)的篩選在數(shù)據(jù)庫的基礎(chǔ)上,將有效的信息篩選出來,利用該技術(shù)來挖掘一些隱藏的有價(jià)值的數(shù)據(jù)。。

數(shù)據(jù)挖掘并不是自動(dòng)化完成的,需要建立人工識(shí)別模式與處理系統(tǒng),涵蓋數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)切換、數(shù)據(jù)研判、評(píng)價(jià)體系等步驟,常用模糊數(shù)學(xué)、運(yùn)籌學(xué)、圖論等數(shù)學(xué)方法。大數(shù)據(jù)挖掘技術(shù)促進(jìn)了偵查方式與方法的可靠性與有效性,結(jié)合DNA技術(shù)、微量物證的發(fā)現(xiàn)提取與檢驗(yàn)鑒定技術(shù)、痕跡物證網(wǎng)上自動(dòng)化比對(duì)技術(shù)等有效提升了偵查效率。

(一)數(shù)據(jù)挖掘基本方法

1.分類法

根據(jù)應(yīng)用需要確定分類的種類,通過對(duì)訓(xùn)練數(shù)據(jù)的分類學(xué)習(xí)歸納出分類規(guī)則,利用測(cè)試數(shù)據(jù)對(duì)模型的準(zhǔn)確率進(jìn)行測(cè)試,再對(duì)數(shù)據(jù)進(jìn)行分類操作。

典型算法包括決策樹、K最近鄰法(K-Nearest Neighbor)、K平均法(K-Mean)、支持向量機(jī)(Support Vector Machine)、向量空間模型(Vector Space Model)、貝葉斯網(wǎng)絡(luò)算法(Bayesian Network)、神經(jīng)網(wǎng)絡(luò)算法(Neural Network)等。

2.聚類法

聚類法對(duì)數(shù)據(jù)進(jìn)行分析并分類,將數(shù)據(jù)集劃分為由相似數(shù)據(jù)組成的多個(gè)類的過程,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)彼此相異。

聚類的典型算法包括BIRCH算法、CURE算法、DBSCAN算法、K-pototypes算法、CLARANS算法、CLIQUE算法等。

3.關(guān)聯(lián)分析

關(guān)聯(lián)分析是發(fā)現(xiàn)數(shù)據(jù)集中數(shù)據(jù)之間聯(lián)系的一種方法,典型算法包括Apriori算法、FP-Tree算法、多層關(guān)聯(lián)規(guī)則挖掘算法、多維關(guān)聯(lián)規(guī)則挖掘算法等。

4.時(shí)間序列

時(shí)間序列挖掘關(guān)注不同交易之間的數(shù)據(jù)關(guān)聯(lián)。數(shù)據(jù)之間的聯(lián)系,可以表現(xiàn)為兩種形式,一種是同一交易內(nèi)的數(shù)據(jù)之間的聯(lián)系,另一種是不同交易間的數(shù)據(jù)的聯(lián)系,關(guān)聯(lián)分析主要針對(duì)前者,而序列模式分析則針對(duì)后者。

典型算法包括ApioriAll算法、ApioriSome算法、SPADE算法、PrefixSpan算法、SPAM算法等。

(二)通過數(shù)據(jù)庫實(shí)施TIA(全面信息感知)計(jì)劃

偵查破案的過程就是一個(gè)搜集、分析、整合、傳遞、利用犯罪信息進(jìn)行研判的過程,掌握的犯罪信息量越大、越及時(shí),其有效性就越高。

第一,排查空間。依托數(shù)字化偵查工作平臺(tái),基于公安網(wǎng)信息系統(tǒng)與社會(huì)相關(guān)業(yè)務(wù)系統(tǒng),超越時(shí)空,對(duì)常駐人員資料、暫住人員資料、旅店登記資料、銀行卡、手機(jī)、座機(jī)、QQ、微信、陌陌、服務(wù)器IP等信息納入基礎(chǔ)系統(tǒng),可以有效打擊流竄犯罪、外來人員犯罪、跨區(qū)域犯罪甚至跨國犯罪。

第二,排查手段。借助計(jì)算機(jī)技術(shù)與網(wǎng)絡(luò)技術(shù),應(yīng)用各種信息系統(tǒng)的查詢、跟蹤功能,將檢索要求與檢索條件進(jìn)行設(shè)置,選擇檢索通道,即可完成海量信息碰撞比對(duì)。

第三,排查模式。利用大數(shù)據(jù)挖掘技術(shù),充分依托現(xiàn)有資料,形成以物找人、以人找案、以案找案的多種排查模式,重點(diǎn)查詢已經(jīng)發(fā)生案件的有關(guān)人、事、物。

通過模擬、比對(duì)等手段,有效整合分散的信息,綜合研判隱性的關(guān)聯(lián)性信息尤為重要。采用TIA計(jì)劃,聯(lián)合相關(guān)技術(shù)部門,通過改進(jìn)技術(shù)手段與方法,提升挖掘數(shù)據(jù)能力。

一是自動(dòng)快速的語言翻譯技術(shù)。能夠快速分析外語,包括口語和書面語,幫助分析員以更快的速度進(jìn)行搜索、監(jiān)控各種語言文件和文件的傳輸。

二是數(shù)據(jù)搜索、模式識(shí)別技術(shù)。偵查員能夠從大量數(shù)據(jù)集中搜索行為模式,重點(diǎn)偵測(cè)包括汽車租金、駕駛執(zhí)照、犯罪記錄等交易數(shù)據(jù),這種搜索和模式識(shí)別技術(shù)支持對(duì)交易數(shù)據(jù)進(jìn)行更廣泛更徹底地挖掘。

三是輔助推理決策支持技術(shù)。能夠協(xié)調(diào)來自不同機(jī)構(gòu)和部門的各級(jí)各類分析員共享數(shù)據(jù)庫,采用相關(guān)的推理方法,從相同的數(shù)據(jù)中發(fā)現(xiàn)不同的情況,并采取適當(dāng)?shù)拇胧4]。

(三)數(shù)據(jù)挖掘可靠性評(píng)價(jià)方案

隨著經(jīng)濟(jì)全球化,信息普及化,人們的活動(dòng)半徑不斷加大,跨國的政治、經(jīng)濟(jì)、文化活動(dòng)等各種交往活動(dòng)日趨頻繁?,F(xiàn)實(shí)世界與虛擬空間如影隨形,昭示著犯罪時(shí)空的復(fù)雜性與多樣性,時(shí)常產(chǎn)生偵查實(shí)踐中遇到的時(shí)空斷裂現(xiàn)象。面對(duì)數(shù)目眾多的大數(shù)據(jù)狀態(tài),制定相應(yīng)的處理機(jī)制,從復(fù)雜技術(shù)中進(jìn)行有效篩選,實(shí)施數(shù)據(jù)挖掘可靠性評(píng)價(jià)方案①在數(shù)據(jù)挖掘可靠性評(píng)價(jià)方案中,需要關(guān)注犯罪嫌疑人的通信工具;犯罪嫌疑人的真實(shí)身份;犯罪嫌疑人的同案人;犯罪嫌疑人的行蹤與落腳點(diǎn)。。

第一,方法的有效性。根據(jù)不同的應(yīng)用需要達(dá)到的準(zhǔn)確率不同,在預(yù)處理或數(shù)據(jù)清洗階段,域的值被轉(zhuǎn)換為統(tǒng)一單位,通過合并現(xiàn)有的域產(chǎn)生新的域,數(shù)據(jù)被引入挖掘關(guān)系模式中。

第二,方法的時(shí)間復(fù)雜度。算法的時(shí)間復(fù)雜度關(guān)注算法需要消耗的時(shí)間資源,算法是問題規(guī)模n的

函數(shù)f(n),算法的時(shí)間復(fù)雜度為O(f(n)),若在數(shù)據(jù)量和挖掘維數(shù)增加的情況下,挖掘的時(shí)間呈線性增長(zhǎng),那么可以認(rèn)為該挖掘方法的伸縮性較好。

第三,方法空間的復(fù)雜度。算法的空間復(fù)雜度涉及算法需要消耗的空間資源,其計(jì)算方法與時(shí)間復(fù)雜度類似,一般用復(fù)雜度的漸近線表達(dá),跟時(shí)間復(fù)雜度相比,空間復(fù)雜度的分析相對(duì)簡(jiǎn)單。

基于已經(jīng)掌握的事實(shí),對(duì)某些犯罪瞬間狀態(tài)、犯罪情節(jié)枝節(jié)、犯罪情節(jié)整體發(fā)生過程與方式等情形作出初步的推測(cè)性解釋,依據(jù)重構(gòu)內(nèi)容的范疇,從邏輯機(jī)制上需要盡可能考慮到各種可能性,并逐步落實(shí)到每個(gè)環(huán)節(jié),避免導(dǎo)致偵查方向失誤,確保偵查方案不至于偏頗。首先,若原系統(tǒng)適用于現(xiàn)實(shí)系統(tǒng)的部分要求,那么,可以對(duì)原系統(tǒng)進(jìn)行升級(jí)。其次,在大數(shù)據(jù)規(guī)范框架內(nèi),若原系統(tǒng)不適應(yīng)現(xiàn)實(shí)系統(tǒng),則需要構(gòu)造一個(gè)新系統(tǒng)進(jìn)行儲(chǔ)存于運(yùn)算[5]。

三、大數(shù)據(jù)驅(qū)動(dòng)下的偵查模式

大數(shù)據(jù)時(shí)代不僅有海量信息儲(chǔ)存①信息分析與研判有賴于偵查人員的經(jīng)驗(yàn),借助電子化記錄臺(tái)賬、公安信息網(wǎng)所累積的結(jié)構(gòu)化數(shù)據(jù)庫進(jìn)行研判,此間,需要特別關(guān)注信息冗余與信息孤島現(xiàn)象,這已經(jīng)成為信息存在的基本形態(tài)。,更重要的是對(duì)數(shù)據(jù)進(jìn)行有效的專業(yè)處理,此種情形下,偵查模式調(diào)整為案件受理、案件數(shù)據(jù)收集、現(xiàn)場(chǎng)勘驗(yàn)確證、鎖定犯罪嫌疑人、結(jié)案等環(huán)節(jié)。確立由數(shù)據(jù)庫主導(dǎo)的模式,形成文字、圖像、音頻、視頻等不同形式的信息載體,突出數(shù)據(jù)的完整性與客觀性,使數(shù)據(jù)更加接近真相,籍此鎖定犯罪嫌疑人,確認(rèn)犯罪證據(jù)。偵查活動(dòng)需要從本體論、價(jià)值論、認(rèn)識(shí)論、方法論與實(shí)踐論五個(gè)維度進(jìn)行認(rèn)知,從本體論視角看,偵查應(yīng)著力于偵查原理、偵查方法、偵查制度等內(nèi)容;從價(jià)值論角度看,不僅為偵查實(shí)務(wù)提出一般性原則與專業(yè)技能,同時(shí)致力于為法治運(yùn)行提供理論思考方案與制度設(shè)計(jì)原則;從認(rèn)識(shí)論角度看,應(yīng)當(dāng)建立綜合性的偵查學(xué)原理框架;從方法論角度看,應(yīng)當(dāng)借鑒歷史經(jīng)驗(yàn),不應(yīng)過度依賴高科技偵查,要注意高科技偵查的負(fù)面作用;從實(shí)踐論角度看,需要調(diào)整體制安排以及建設(shè)偵查學(xué)共同體等方面實(shí)現(xiàn)理論界與實(shí)務(wù)界的有效溝通[6]。

偵查模式的變革與推進(jìn)必須借助于刑事技術(shù)發(fā)展與大數(shù)據(jù)挖掘的雙輪驅(qū)動(dòng),有效應(yīng)對(duì)社會(huì)現(xiàn)實(shí)狀態(tài)下日益復(fù)雜的犯罪態(tài)勢(shì),建構(gòu)大數(shù)據(jù)驅(qū)動(dòng)下的偵查模式。大數(shù)據(jù)驅(qū)動(dòng)模式表現(xiàn)為對(duì)犯罪數(shù)據(jù)進(jìn)行在線更新、從海量數(shù)據(jù)中對(duì)犯罪相關(guān)信息進(jìn)行提取、分析、研判與預(yù)測(cè)。

(一)線上與線下相結(jié)合的偵查模式演進(jìn)方案

1.在線、開放理念

依托公安網(wǎng)絡(luò)數(shù)據(jù)的全面性與準(zhǔn)確性,獲取即時(shí)性信息,爾后從海量數(shù)據(jù)中提取有價(jià)值的線索。

2.數(shù)據(jù)主導(dǎo)偵查理念

以數(shù)據(jù)儲(chǔ)存、數(shù)據(jù)獲取與數(shù)據(jù)分析為主導(dǎo),實(shí)施大數(shù)據(jù)視野驅(qū)動(dòng)下的偵查理念,以大數(shù)據(jù)庫作為偵查的基礎(chǔ)資源平臺(tái),讓數(shù)據(jù)處于核心地位,支配偵查運(yùn)行。

3.關(guān)聯(lián)性理念

使偵查人員全方位、多視角分析案情,確立數(shù)據(jù)結(jié)構(gòu)標(biāo)準(zhǔn),理清犯罪原因,控制犯罪。

4.在線偵查與線下確證相結(jié)合理念

開展在線偵查與線下確認(rèn)相結(jié)合的工作,使傳統(tǒng)偵查手段與大數(shù)據(jù)思維方式聯(lián)動(dòng),獲得真實(shí)案情,為訴訟提供有效、合法證據(jù)。

(二)大數(shù)據(jù)視野下的時(shí)空一體化偵查模式

1.時(shí)空一體化偵查

以數(shù)據(jù)共享為機(jī)制,形成不同層級(jí)決策、指揮系統(tǒng),搭建多維度、跨區(qū)域的協(xié)同主體。數(shù)據(jù)庫的建立為偵查人員尋找到適宜的切入點(diǎn),以特定時(shí)間、特定空間的系列數(shù)據(jù)為基準(zhǔn),整合數(shù)據(jù),認(rèn)定犯罪嫌疑人。

2.由點(diǎn)到面的立體式偵查

確立從點(diǎn)到面的全景式偵查思維方式,對(duì)數(shù)據(jù)采集、分析、研判與預(yù)測(cè)進(jìn)行關(guān)聯(lián)性分析。大數(shù)據(jù)視野下,可以整體上對(duì)案情的性質(zhì)進(jìn)行把控,形成客觀、科學(xué)、有效的偵查認(rèn)知模式,促成邏輯上的嚴(yán)謹(jǐn)、技術(shù)上的審慎。

3.預(yù)測(cè)型偵查方案

偵查行為從回溯型偵查轉(zhuǎn)向主動(dòng)型偵查,實(shí)時(shí)感知犯罪,即時(shí)采取行動(dòng)。大數(shù)據(jù)視野下,案件偵破需要對(duì)數(shù)據(jù)進(jìn)行不斷跟蹤追查,掌握犯罪嫌疑人新動(dòng)向,有效預(yù)防犯罪升級(jí)。

4.基于大數(shù)據(jù)分析的偵查方案

依托物聯(lián)網(wǎng)、云計(jì)算技術(shù),綜合諸學(xué)科最新成果,建立關(guān)聯(lián)規(guī)則,確立運(yùn)算法則,獲取犯罪信息,找尋犯罪嫌疑人。大數(shù)據(jù)時(shí)代資源特別豐富,即使在這樣的情況下,仍然需要建立公安專業(yè)網(wǎng)絡(luò)平臺(tái),形成專業(yè)、專門、快速通道,為案件偵破提供最佳平臺(tái)。

(三)立體布控與跟蹤方案

1.信息比對(duì)查控

建立偵查例會(huì)制度定期交流案件情況,利用案

件情報(bào)資料的定期整理制度發(fā)現(xiàn)并案線索。偵查部門應(yīng)充分利用計(jì)算機(jī)技術(shù),對(duì)案件資料進(jìn)行分析,發(fā)現(xiàn)并案線索,將偵查人員的主觀能動(dòng)性與信息處理技術(shù)結(jié)合。通過警務(wù)綜合平臺(tái)、治安卡口查報(bào)系統(tǒng)、網(wǎng)吧實(shí)名登記系統(tǒng)進(jìn)行研判,對(duì)旅館、網(wǎng)吧、二手市場(chǎng)、廢品收購行業(yè)實(shí)行不間斷控制,發(fā)現(xiàn)違法犯罪線索,抓獲犯罪嫌疑人。

2.關(guān)聯(lián)人員軌跡查控

通過并案?jìng)刹槭侄螌⑴袛酁橥环缸镏黧w的系列案件聯(lián)系起來,通過對(duì)犯罪嫌疑人關(guān)聯(lián)人員進(jìn)行管控,關(guān)注其親屬、情人、朋友的活動(dòng)軌跡。

3.互聯(lián)網(wǎng)跟蹤

跟蹤犯罪嫌疑人的IP地址,鎖定犯罪嫌疑人上網(wǎng)的時(shí)空軌跡。

4.虛假信息查控

根據(jù)逃犯冒用身份進(jìn)行登記的規(guī)律,鎖定犯罪嫌疑人。重點(diǎn)關(guān)注冒用兄弟姐妹、同鄉(xiāng)同齡人、長(zhǎng)相相似者,比對(duì)登記時(shí)間、職業(yè)習(xí)慣、口音、行為方式等。

5.社會(huì)信息跟蹤

公安機(jī)關(guān)的各個(gè)部門通過網(wǎng)絡(luò)檢索發(fā)現(xiàn)并案信息,廣泛收集社會(huì)人員信息,重點(diǎn)對(duì)駕駛證與行駛證信息、房產(chǎn)信息、銀行賬戶、證券賬戶、社保信息等進(jìn)行比對(duì)。

(四)大數(shù)據(jù)驅(qū)動(dòng)下偵查模式運(yùn)行機(jī)制

1.犯罪監(jiān)控機(jī)制

實(shí)現(xiàn)時(shí)間、空間、行為的全景式監(jiān)視與監(jiān)控,第一,建立數(shù)據(jù)記錄、存儲(chǔ)、提取、分析機(jī)制;第二,建立問題識(shí)別、定義、模型系統(tǒng)下的實(shí)時(shí)報(bào)警機(jī)制。

2.犯罪偵破機(jī)制

犯罪偵破機(jī)制主要由以下幾個(gè)方面構(gòu)成,第一,數(shù)據(jù)采集、清理、轉(zhuǎn)換與數(shù)據(jù)集成;第二,根據(jù)現(xiàn)有數(shù)據(jù),明確偵查要求,確立具體偵查方案;第三,依據(jù)問題導(dǎo)向,確立數(shù)據(jù)挖掘方案;第四,依據(jù)前期工作方案,縮小偵查范圍,鎖定犯罪目標(biāo)。

3.犯罪預(yù)測(cè)機(jī)制

犯罪預(yù)測(cè)機(jī)制主要由以下兩個(gè)方面構(gòu)成,第一,梳理犯罪歷史檔案,建構(gòu)相關(guān)模型,在此基礎(chǔ)上結(jié)合現(xiàn)實(shí)場(chǎng)景實(shí)施優(yōu)化方案。第二,利用已有模型,將相關(guān)數(shù)據(jù)輸入系統(tǒng)進(jìn)行比對(duì)與碰撞。第三,用貝葉斯網(wǎng)絡(luò)工具預(yù)測(cè)未來[7]。

隨著互聯(lián)網(wǎng)技術(shù)的普及應(yīng)用,信息化進(jìn)入了新的發(fā)展階段,任何刑事案件都離不開特定時(shí)間和空間,并留下犯罪痕跡和證據(jù),以此為基準(zhǔn)進(jìn)行分類與篩選,從特有區(qū)域與眾多結(jié)合點(diǎn)處挖掘案情真相①數(shù)據(jù)挖掘通過對(duì)海量的數(shù)據(jù)信息進(jìn)行有目的性的提取、分揀、歸類,挖掘隱含的有用信息,借助于多種數(shù)據(jù)分析工具在海量的數(shù)據(jù)信息中挖掘數(shù)據(jù)信息和模型之間關(guān)系。。根據(jù)不同的檢索形式設(shè)置不同的程序算法,根據(jù)數(shù)據(jù)挖掘的功能和目的來設(shè)置過濾的數(shù)據(jù)條件,對(duì)數(shù)據(jù)進(jìn)行篩選。除了這些基礎(chǔ)的設(shè)置,還要采取一定的系統(tǒng)支持,主要采用ETL(數(shù)據(jù)倉庫技術(shù))系統(tǒng)支持,最終選用合適的展現(xiàn)的終端,終端可以根據(jù)對(duì)精度和可靠性的要求來自行選擇,整個(gè)系統(tǒng)就可以進(jìn)行自動(dòng)的運(yùn)算與執(zhí)行②隨著信息技術(shù)的飛速發(fā)展,“金盾工程”建設(shè)規(guī)模不斷擴(kuò)大,相互關(guān)聯(lián)度進(jìn)一步加強(qiáng),融合了各級(jí)各類信息平臺(tái)。刑事技術(shù)手段的不斷升級(jí)促進(jìn)偵查方式的升級(jí),減少了情報(bào)信息資源上的條塊分割,在情報(bào)互通、共享上建章立制,明確范圍、責(zé)任、權(quán)利,打破信息資源共享壁壘,有效整合各地區(qū)、各部門、各警種間的情報(bào)資源,注重吸收大量的社會(huì)資源,避免重復(fù)建設(shè),使得資源實(shí)現(xiàn)最大的利用與共享。。

[1]王曉東,趙煒,郝軍.以云技術(shù)為核心的智慧環(huán)保信息化系統(tǒng)在內(nèi)蒙環(huán)境管理中的應(yīng)用[J].環(huán)境與發(fā)展,2015(1):97-100.

[2]任爭(zhēng),董莉麗,史澤,張海容,鄭敏.數(shù)據(jù)挖掘技術(shù)及其在過程監(jiān)控中的應(yīng)用[J].黑龍江科技信息,2016(3):176.

[3]劉軍,張景安,趙慧勤,付文博.數(shù)據(jù)庫應(yīng)用系統(tǒng)開發(fā)技術(shù)[M].北京:機(jī)械工業(yè)出版社,2003:3.

[4]劉暉,彭志勇.數(shù)據(jù)庫安全[M].武漢:武漢大學(xué)出版社,2007:277-279.

[5]李貞強(qiáng),陳康,武永衛(wèi),鄭緯民.大數(shù)據(jù)處理模式——系統(tǒng)結(jié)構(gòu),方法以及發(fā)展趨勢(shì)[J].小型微型計(jì)算機(jī)系統(tǒng),2015(4):646.

[6]江涌.偵查學(xué)研究的哲理性反思[J].中國人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2013(6):83.

[7]何軍.大數(shù)據(jù)與偵查模式變革研究[J].中國人民公安大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2015(1):75-78.

【責(zé)任編校:曹曉寶】

Logical Evolution of the Investigation Model from the Information Island to the Structured Database

Yin Dashuang
(Nanjing Forest Police College,Nanjing 210023,China)

Thedevelopmentof internet,internetof thingsand cloud computing technology meansthatthebigdata times had arrived.Detection of cases faceunprecedented challenges.In the practiceof investigation,we need to constantly update a variety of technical means and measures of investigation practice,to combinate traditional and modern.Mass data generated by weChat,m icro-blog and other interactive means make the modern society more and more complex.Big data and small probability events lead to the investigation way of disruptive change.The way of thinking of big data should be used in investigation,and change the thinking model from the people and things as the center of the traditional mode of investigation to the data as the center of the upgraded version of the thinking mode of investigation.From the perspective of big data,investigation mode should rely on the network data storage and query system,large-scale structured data analysis system,datam ining system,in aspecific time,specific spaceand specific dataasabenchmark,and form the formationof crime control,crime detection and crime prediction of the new investigation model,to improve the efficiency of handling cases effectively.

Investigation Pattern;Big Data;Structured Database;Data M ining;Association Rule

D918.2

A

1673―2391(2016)06―0003―06

2016-09-28

印大雙(1963—),男,江蘇丹陽人,南京森林警察學(xué)院教授,研究方向?yàn)榉ㄕ軐W(xué)。

猜你喜歡
數(shù)據(jù)挖掘犯罪數(shù)據(jù)庫
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
Televisions
基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
電力與能源(2017年6期)2017-05-14 06:19:37
數(shù)據(jù)庫
數(shù)據(jù)庫
什么是犯罪?
數(shù)據(jù)庫
數(shù)據(jù)庫
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
重新檢視犯罪中止
连云港市| 台中县| 乐都县| 鄂托克前旗| 翼城县| 井陉县| 罗山县| 洛宁县| 龙井市| 健康| 砀山县| 全州县| 桓仁| 泰来县| 通江县| 宁远县| 镇巴县| 勐海县| 徐闻县| 通州市| 泗水县| 老河口市| 民县| 乳源| 秭归县| 闻喜县| 德格县| 南漳县| 库尔勒市| 山丹县| 孟州市| 平塘县| 深泽县| 江山市| 新竹县| 方山县| 东宁县| 仪征市| 金华市| 崇明县| 饶阳县|