苗林林
(南京森林警察學(xué)院 偵查系,江蘇 南京 210023)
刑事案件構(gòu)成要素相關(guān)性分析應(yīng)用研究
苗林林
(南京森林警察學(xué)院 偵查系,江蘇 南京 210023)
我國公安機(jī)關(guān)信息化已經(jīng)進(jìn)入建設(shè)的第三階段,其主要任務(wù)是圍繞信息深度挖掘和深化開展公安行業(yè)云計算、大數(shù)據(jù)、移動警務(wù)等項目的建設(shè)。但從實(shí)踐來看,目前公安機(jī)關(guān)信息化技術(shù)應(yīng)用仍停留在“只進(jìn)不出”的水平,信息研判能力薄弱。此時應(yīng)認(rèn)識到“大數(shù)據(jù)”的意義不僅限于數(shù)據(jù)本身的大體量與多類型,更在于作為一項分析技術(shù)能夠?qū)崿F(xiàn)對海量數(shù)據(jù)的高速處理和有效分析。從數(shù)據(jù)利用的角度出發(fā),研究基于刑事案件構(gòu)成要素之間的關(guān)聯(lián)構(gòu)建相關(guān)性分析方法,實(shí)現(xiàn)對要素之間相關(guān)程度的估量,再利用要素及其相關(guān)程度進(jìn)行模型分析,提高公安工作預(yù)測與決策的準(zhǔn)確性。
刑事案件構(gòu)成要素;關(guān)聯(lián);相關(guān)性分析;并案偵查;犯罪預(yù)測
近年來,隨著我國公安信息化改革與建設(shè)的不斷深入,大數(shù)據(jù)、云計算、人工智能等概念與技術(shù)已被納為未來警務(wù)建設(shè)的重點(diǎn)內(nèi)容與發(fā)展方向。孟建柱同志在2016年全國社會治安綜合治理創(chuàng)新工作會議講話中指出:“大數(shù)據(jù)已成為促進(jìn)國家治理變革的基礎(chǔ)性力量,要把大數(shù)據(jù)等現(xiàn)代科技手段與社會治理深度融合起來,為社會治理插上騰飛的翅膀?!蓖辏曠块L在全國公安機(jī)關(guān)社會治安防控體系建設(shè)推進(jìn)會議上強(qiáng)調(diào):“在社會動態(tài)化、信息化條件下,信息資源已成為第一資源。要大力加強(qiáng)大數(shù)據(jù)時代公安基礎(chǔ)信息化工作,不斷提高維護(hù)公共安全和服務(wù)人民群眾的能力水平?!被乜次覈残畔⒒ㄔO(shè)進(jìn)程大致經(jīng)歷了三個階段,2003年至2008年期間為第一階段,主要進(jìn)行基礎(chǔ)設(shè)施建設(shè),建成23類業(yè)務(wù)應(yīng)用系統(tǒng)、8大資源庫以及公安通信網(wǎng)絡(luò)基礎(chǔ)設(shè)施;2009年至2011年為第二階段,完成優(yōu)化完善網(wǎng)絡(luò)、安全技術(shù)、信息中心三類基礎(chǔ)設(shè)施,開發(fā)推廣公安情報信息綜合應(yīng)用平臺、警用地理信息基礎(chǔ)應(yīng)用平臺、部門間信息共享與服務(wù)平臺,建設(shè)擴(kuò)展基礎(chǔ)性、國家安全和維穩(wěn)、少量急需業(yè)務(wù)、地方自建等四類應(yīng)用系統(tǒng)。2012年至今為第三階段,主要圍繞信息深度挖掘和深化應(yīng)用積極探索實(shí)踐開展公安行業(yè)云計算、大數(shù)據(jù)、移動警務(wù)等建設(shè)。在此基礎(chǔ)上,公安部又提出于“十三五”期間,通過全力打造公安信息化的升級版,努力形成建設(shè)集約化、應(yīng)用平臺化、數(shù)據(jù)集群化和服務(wù)整體化的信息化新格局,提升動態(tài)化條件下的基礎(chǔ)信息化水平,促進(jìn)公安信息化與公安工作的深度融合,不斷推進(jìn)傳統(tǒng)警務(wù)向現(xiàn)代警務(wù)的轉(zhuǎn)變,全面提升公安機(jī)關(guān)維護(hù)社會和諧穩(wěn)定的能力和水平。
建設(shè)的同時也應(yīng)明確,發(fā)展“大數(shù)據(jù)”技術(shù)不能僅停留在廣泛收集、存儲數(shù)據(jù)的水平,更要能夠讓規(guī)模數(shù)據(jù)的內(nèi)容、價值服務(wù)于公安工作。2090年代以來,歐美諸國已經(jīng)開始利用COMPSTAT、COPLINK等數(shù)據(jù)庫軟件,整合系統(tǒng)分析技術(shù),利用已存儲的信息對犯罪行為模式、犯罪熱點(diǎn)進(jìn)行分析與預(yù)測。美國建立的PREDPOL犯罪預(yù)測系統(tǒng)、實(shí)時打擊犯罪中心以及新加坡研發(fā)RAHS系統(tǒng),都對犯罪預(yù)防起到極大的推動作用。臺灣警方亦能夠使用路口監(jiān)視系統(tǒng)、車牌辨識系統(tǒng)以及關(guān)系型分析平臺實(shí)現(xiàn)大數(shù)據(jù)操作。縱觀我國,在短短幾年時間,由各省公安機(jī)關(guān)與科技公司合力研發(fā)的各類與公安機(jī)關(guān)業(yè)務(wù)相關(guān)的信息系統(tǒng)在已經(jīng)大規(guī)模投入使用,這些平臺和系統(tǒng)主要負(fù)責(zé)對時間、地點(diǎn)、痕跡物證、財產(chǎn)損失情況、犯罪嫌疑人以及相關(guān)車輛情況等案件信息進(jìn)行實(shí)時采集并錄入系統(tǒng),在實(shí)現(xiàn)對案件信息有效查詢與共享的同時,系統(tǒng)中累計的大規(guī)模數(shù)據(jù)亦能夠為情報研判提供支撐。但是,實(shí)踐工作中仍舊存在大量問題:其一,數(shù)據(jù)采集不夠完整,缺乏對數(shù)據(jù)統(tǒng)一、規(guī)范的監(jiān)管;其二,各警種、各地方對同一數(shù)據(jù)存在不同利用標(biāo)準(zhǔn),數(shù)據(jù)結(jié)構(gòu)、類型各異。其三,辦案人員慣用經(jīng)驗分析、因果分析思維處理數(shù)據(jù),開展“整體數(shù)據(jù)”、“關(guān)聯(lián)分析”的意識、能力不足。其中最為突出的問題在于,目前應(yīng)用的信息處理技術(shù)僅能夠完成增、刪、改、查詢與統(tǒng)計任務(wù),信息關(guān)聯(lián)查詢與綜合利用能力較低。偵查人員多沿用傳統(tǒng)的數(shù)據(jù)分析工具和方法,對數(shù)據(jù)進(jìn)行處理時多使用簡單的累加、比對、百分比計算等方法,缺乏模型構(gòu)建和算法應(yīng)用方面的創(chuàng)新。以云計算技術(shù)為例,目前,只是初步實(shí)現(xiàn)“云平臺”硬件資源的動態(tài)分配,而大規(guī)模分布式計算及負(fù)載均衡能力尚待進(jìn)一步加強(qiáng)。各類信息資源未能得到充分挖掘與有效利用,未能實(shí)現(xiàn)智能分析的目標(biāo)。因此,選取刑事案件構(gòu)成要素為研究對象,從數(shù)據(jù)挖掘與分析的角度,提出相關(guān)性方法對刑事案件構(gòu)成要素進(jìn)行關(guān)聯(lián)分析,希望能夠利用分析結(jié)果準(zhǔn)確預(yù)測犯罪,提高偵查工作效率。
(一)關(guān)聯(lián)分析的含義
“關(guān)聯(lián)”一詞可以理解為個體及內(nèi)部各個部分相互之間發(fā)生的牽連和影響?!瓣P(guān)聯(lián)分析”則既可理解為對個體及其部分間的牽連和影響的分析,也可以認(rèn)為是一種利用個體及其部分間的牽連和影響來分析個體及其內(nèi)在組成部分的分析方法,這層意思也是此次研究相關(guān)性分析的出發(fā)點(diǎn)。數(shù)理統(tǒng)計學(xué)也認(rèn)為社會經(jīng)濟(jì)現(xiàn)象間存在著大量的相互聯(lián)系、相互依賴、相互制約的數(shù)量關(guān)系,這種關(guān)系可分為兩種類型:一類是函數(shù)關(guān)系,它反映現(xiàn)象之間嚴(yán)格的依存關(guān)系。在這種關(guān)系中,對于變量的每一個數(shù)值,都有一個或幾個確定的值與之對應(yīng),最為典型的函數(shù)關(guān)系是因果關(guān)系。另一類為相關(guān)關(guān)系,在這種關(guān)系中,變量之間存在著不確定、不嚴(yán)格的依存關(guān)系,對于變量的某個數(shù)值,可以有另一變量的若干數(shù)值與之相對應(yīng),這若干個數(shù)值圍繞著它們的平均數(shù)呈現(xiàn)出有規(guī)律的波動。即“現(xiàn)象間客觀存在的,但數(shù)值不嚴(yán)格的,不容易確定的依存關(guān)系即為相關(guān)?!保?]
在面對少量現(xiàn)象或數(shù)據(jù)時,人們能夠通過假設(shè)和檢驗來揭示他們內(nèi)部之間的必然性規(guī)律來建立函數(shù)關(guān)系,其結(jié)果雖然明確但能夠處理的樣本容量有限。但隨著“大數(shù)據(jù)”時代的來臨,面對源源不斷的信息流,人們難以在大量關(guān)聯(lián)關(guān)系中選擇出確定性的理論假設(shè),更無法逐對研究數(shù)據(jù)之間存在的必然性函數(shù) (因果)關(guān)系,于是將方向調(diào)整為研究現(xiàn)象或數(shù)據(jù)間表層的、非確定性的依存關(guān)系,期望獲得更為廣泛的情報、線索,減少有效價值的流失。正如維克托·邁爾·舍恩伯格提出的大數(shù)據(jù)時代思維變革三大特征所言:第一,思維所據(jù)以進(jìn)行的不再是隨機(jī)樣本,而是全體數(shù)據(jù);第二,不再追求精確性,允許混雜性;第三,思維依據(jù)的規(guī)則不再是因果關(guān)系,而是相關(guān)關(guān)系。[2]89因此,依據(jù)大數(shù)據(jù)尋找現(xiàn)象間確定性因果關(guān)系之外,更要注意把握現(xiàn)象之間非確定性的相關(guān)關(guān)系。即大數(shù)據(jù)時代思維根本變革之一是從依靠因果性分析擴(kuò)展為重視相關(guān)性分析的發(fā)展趨勢。
(二)關(guān)聯(lián)分析的方法
依據(jù)關(guān)聯(lián)分析的第二層意思,可以推定出關(guān)聯(lián)分析方法的含義。關(guān)聯(lián)分析法是指如果兩個或多個事物、現(xiàn)象之間存在一定的聯(lián)系,那么其中一個事物或現(xiàn)象就能通過其他事物、現(xiàn)象進(jìn)行預(yù)測。關(guān)聯(lián)分析法雖然在社會科學(xué)中尚沒有得到一個普遍認(rèn)可的定義,但在自然科學(xué)中被闡釋為“根據(jù)因素間發(fā)展態(tài)勢的相似或差異程度,來衡量因素間的關(guān)聯(lián)程度,尋找系統(tǒng)中各因素間影響結(jié)果值的重要因素,從而掌握事物的主要特征?!保?]主要包括系統(tǒng)分析法、決策樹法、相關(guān)性分析法、遺傳算法等等多種方法,研究選取相關(guān)性分析作為刑事案件構(gòu)成要素關(guān)聯(lián)分析的方法。
構(gòu)成要素,是指構(gòu)成一事物必不可少的,能使此事物區(qū)別于彼事物,具有層次性、系統(tǒng)性的重要組成單元?!靶淌掳讣?gòu)成要素,是指刑事案件的內(nèi)在組成部分及各部分之間的相互關(guān)系和排列狀況”。[4]14“對一個事物的把握,其實(shí),就是對其要素的把握。刑事案件的案情分析,實(shí)質(zhì)就是對刑事案件構(gòu)成要素的分析。刑事案件的偵查終結(jié),實(shí)質(zhì)就是查清了刑事案件的全部要素”。[5]“認(rèn)識刑事案件的關(guān)鍵路徑就是將這個復(fù)雜系統(tǒng)分解和還原為它的組成部分,通過對它的構(gòu)成要素的揭示和分析達(dá)到更好地認(rèn)識刑事案件的目的?!币虼?,使用相關(guān)性分析方法對刑事案件構(gòu)成要素進(jìn)行分析能夠從根本上把握刑事案件發(fā)生、發(fā)展的趨勢和規(guī)律。刑事案件究竟由哪些要素構(gòu)成呢?理論界有以下兩大類觀點(diǎn):縱向動態(tài)構(gòu)成理論和橫向靜態(tài)構(gòu)成理論。動態(tài)構(gòu)成理論認(rèn)為縱向動態(tài)構(gòu)成要素具體包括:犯罪思想基礎(chǔ)及誘因的驅(qū)使、犯罪動機(jī)的形成、犯罪預(yù)備活動、犯罪實(shí)施、實(shí)施犯罪之后的相關(guān)活動。而靜態(tài)構(gòu)成理論又有“五要素”論、“七要素”論之說,“五要素”論者認(rèn)為刑事案件是由人、事、物、時、空五大要素組成;“七要素”論者認(rèn)為何事、何時、何地、何物、何情、何故、何人構(gòu)成了刑事案件?!拔逡亍迸c“七要素”說差別不大,其理論內(nèi)容相對一致。此外,還有理論提出信息化要素等觀點(diǎn)。文章選擇以靜態(tài)構(gòu)成要素作為研究的基礎(chǔ),并在應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行要素分類時對七要素理論進(jìn)行不同程度的細(xì)化。究其原因,除了由中國人民公安大學(xué)偵查系孟憲文教授在其主編的全國公安系統(tǒng)發(fā)行本科教材《刑事偵查學(xué)》中使用這一理論的之外,還存在如下兩方面的原因:一方面,相關(guān)性分析是利用歷史數(shù)據(jù)發(fā)現(xiàn)要素間相關(guān)關(guān)系,無需體現(xiàn)刑事案件發(fā)生、發(fā)展的動態(tài)過程;另一方面,要素分類愈詳盡,愈能全面呈現(xiàn)影響分析目標(biāo)的要素種類,有利于計算影響因素與目標(biāo)之間的相關(guān)程度,進(jìn)而準(zhǔn)確判斷分析目標(biāo)態(tài)勢。
相關(guān)性分析是一種利用統(tǒng)計學(xué)原理衡量社會經(jīng)濟(jì)現(xiàn)象中數(shù)量依存關(guān)系的方法。計算數(shù)據(jù)間相關(guān)程度并進(jìn)行置信度檢驗和利用這種相關(guān)程度構(gòu)建分析模型,進(jìn)行變量判斷和預(yù)測是該方法的主要操作步驟。統(tǒng)計學(xué)對數(shù)據(jù)間相關(guān)程度進(jìn)行測定的工具有很多,根據(jù)數(shù)據(jù)類型的不同,測定對象的不同可分為卡方統(tǒng)計量分析、方差分析、回歸分析等多種方法。方法之間運(yùn)用的數(shù)學(xué)原理不同,所測得的相關(guān)程度與置信度也各有差異,偵查人員可根據(jù)實(shí)際情況選擇測量工具及模型。因此,應(yīng)在此處進(jìn)行說明,利用相關(guān)性方法對刑事案件構(gòu)成要素進(jìn)行分析,其目的并非通過此法得出必然性的、排他性的如犯罪嫌疑人身份、所在位置、犯罪行為時間、空間、工具等確定結(jié)論,而是先要分析和發(fā)現(xiàn)各個要素之間,要素與案件整體之間的相關(guān)關(guān)系,再利用這種相關(guān)規(guī)律協(xié)助偵查或進(jìn)行犯罪預(yù)測。
最后需要強(qiáng)調(diào)的問題是,以上關(guān)于刑事案件構(gòu)成要素相關(guān)性分析的觀點(diǎn)以及相關(guān)性分析方法的操作,都只是從論理角度進(jìn)行的描述。如果僅僅憑借人工計算只能實(shí)現(xiàn)對少量數(shù)據(jù)的整理、運(yùn)算,不但耗時量大,分析效率不高,而且樣本容量較少,計算出的相關(guān)程度可信度極低,可能影響命題的成立。因此,在犯罪信息呈“大數(shù)據(jù)”狀態(tài)的背景下,必須利用計算機(jī)技術(shù)完成“海量”數(shù)據(jù)的收集、存儲、共享、挖掘與分類,才能準(zhǔn)確選擇算法,挖掘多維關(guān)聯(lián)原則,最終實(shí)現(xiàn)偵查工作的深度信息化。
首先,在刑事案件構(gòu)成要素相關(guān)性分析中需要利用數(shù)據(jù)倉庫、數(shù)據(jù)挖掘和聚類分析等技術(shù)對反映案件材料的數(shù)據(jù)進(jìn)行挖掘整理。與數(shù)據(jù)庫簡單記錄、保存、變更數(shù)據(jù)的功能不同,數(shù)據(jù)倉庫是對數(shù)據(jù)庫中已經(jīng)保存下來的數(shù)據(jù)進(jìn)行整理分類。數(shù)據(jù)倉庫由以下幾個部分組成:數(shù)據(jù)倉庫最基本的元素即數(shù)據(jù)元;各類應(yīng)用系統(tǒng)所保存的數(shù)據(jù)庫即源數(shù)據(jù);源數(shù)據(jù)進(jìn)入數(shù)據(jù)倉庫所經(jīng)過的數(shù)據(jù)抽取、提煉、修正的過程,即數(shù)據(jù)清洗的過程;數(shù)據(jù)倉庫技術(shù)核心,即依據(jù)不同數(shù)據(jù)屬性、維度等對數(shù)據(jù)進(jìn)行顯示的技術(shù);數(shù)據(jù)挖掘工具。自偵查信息化探索付諸實(shí)踐以來,通過各個系統(tǒng)、平臺收集到的信息已能覆蓋社會基本面的各個角落,但是大量信息被積聚下來的同時卻往往被束于高閣,大量重復(fù)、碎片化的數(shù)據(jù)存在,缺乏系統(tǒng)的挖掘和分析。數(shù)據(jù)挖掘是指在現(xiàn)有的大量數(shù)據(jù)中,通過決策樹、聚類分析、神經(jīng)網(wǎng)絡(luò)等算法發(fā)現(xiàn)數(shù)據(jù)間隱性的相關(guān)關(guān)系及其特征。一般說來,利用數(shù)據(jù)挖掘技術(shù)可實(shí)現(xiàn)如下幾種目的:分類、估計、關(guān)聯(lián)分組、聚類、描述和可視化,其中如需得出某種特定結(jié)果或條件時,一般采用決策樹,如需進(jìn)行數(shù)據(jù)分類以便于進(jìn)一步研究時,往往選擇聚類分析和神經(jīng)網(wǎng)絡(luò)等算法。利用相關(guān)性方法對刑事案件構(gòu)成要素進(jìn)行分析主要涉及到估計、關(guān)聯(lián)分組、聚類、描述等算法的使用。近年來,數(shù)據(jù)倉庫技術(shù)已經(jīng)得到重視并被應(yīng)用到治安、交管、偵查等多個公安機(jī)關(guān)業(yè)務(wù)部門,但在刑事案件偵查工作中的應(yīng)用還只停留在尋找刑事案件的時空規(guī)律,發(fā)現(xiàn)特定人群身份背景等層面,如何利用數(shù)據(jù)挖掘技術(shù)發(fā)現(xiàn)刑事案件構(gòu)成要素之間的深層聯(lián)系,拓展信息數(shù)據(jù)利用渠道,并在此基礎(chǔ)上提高刑事案件偵查工作信息化整體程度是本次研究的主要方向之一。在此,對該技術(shù)在構(gòu)成要素相關(guān)性分析中應(yīng)用的原理進(jìn)行簡要闡述:第一,將刑事案件構(gòu)成要素根據(jù)實(shí)際情況細(xì)劃為發(fā)案時間、地點(diǎn)、天氣、性質(zhì)類別、作案手段、被害人基本情況、損失財物價值等若干字段。第二,根據(jù)案件分析的需要對不同字段進(jìn)行層次結(jié)構(gòu)劃分,即完成數(shù)據(jù)倉庫設(shè)計。第三,選擇平臺錄入設(shè)計好的數(shù)據(jù)倉庫結(jié)構(gòu),并確定不同字段的維度和屬性,將有關(guān)聯(lián)的維度聯(lián)系起來形成數(shù)據(jù)結(jié)構(gòu)圖。第四,利用工具將元數(shù)據(jù)填充至數(shù)據(jù)倉庫之中并生成多維數(shù)據(jù)集,為瀏覽和分析數(shù)據(jù)打好基礎(chǔ)。第五,對數(shù)據(jù)集中的數(shù)據(jù)根據(jù)需求進(jìn)行聚類,形成不同數(shù)據(jù)“簇”,不同數(shù)據(jù)“簇”之間具有顯著差異,“簇”內(nèi)變量則趨于同質(zhì)化。因此,聚類也可以作為獨(dú)立的相關(guān)工具獲取數(shù)據(jù)分布情況,聚類分析即是通過觀察每一簇數(shù)據(jù)的特征,對“簇”內(nèi)數(shù)據(jù)進(jìn)行分析。
其次,根據(jù)數(shù)據(jù)“簇”的不同屬性,選擇不同算法進(jìn)行關(guān)聯(lián)規(guī)則挖掘或相關(guān)系數(shù)測定,給出支持度或置信度,并在此基礎(chǔ)上建立預(yù)測模型。主要涉及到三種不同統(tǒng)計學(xué)方法的使用,其操作原理會在應(yīng)用部分進(jìn)行詳細(xì)解釋。
(一)利用要素相關(guān)性分析實(shí)施并案偵查
“并案偵查,是指偵查部門對判明為同一個或同一伙犯罪嫌疑人所做的多起案件合并起來,實(shí)行統(tǒng)一組織、指揮和行動的偵查措施?!保?]219而由同一個或同一伙犯罪嫌疑人實(shí)施的案件被稱為系列性案件。并案偵查是打擊團(tuán)伙、系列性犯罪以及高發(fā)、多發(fā)犯罪的有力措施。該措施在應(yīng)用過程中存在兩個難以把握的重要環(huán)節(jié):其一,在一定范圍之內(nèi),偵查人員難以判定已經(jīng)發(fā)現(xiàn)的刑事案件是否屬于同一人或同一犯罪團(tuán)伙所為。特別是在同一性質(zhì)的案件發(fā)案數(shù)量較大,作案團(tuán)伙較多的情況下,難以將不同團(tuán)伙與其實(shí)施的刑事案件聯(lián)系起來。計算機(jī)網(wǎng)絡(luò)技術(shù)在協(xié)助偵查的同時,亦能夠幫助犯罪人突破時空局限,隱匿身份。對于串并案件來說,時空范圍越大,案件數(shù)量越多,串并的準(zhǔn)確程度就越低。從串并案件的結(jié)果來看,若所串案件非同一犯罪人或犯罪團(tuán)伙所為,則不但不能匯總、集中發(fā)現(xiàn)犯罪嫌疑人特點(diǎn),確認(rèn)犯罪嫌疑人,還會使單個案件的偵查陷入僵局。若所串案件雖為同一犯罪人或犯罪團(tuán)伙所為,但串并的范圍過小,許多案件不能被納入偵查范圍,則第一不能發(fā)現(xiàn)犯罪嫌疑人特點(diǎn),第二弱化并案偵查“一舉多得”的效用,團(tuán)伙所實(shí)施的其他案件不能被發(fā)現(xiàn)。其二,串并之后難以發(fā)現(xiàn)并抓獲犯罪嫌疑人。偵查人員在決定對某些案件進(jìn)行并案之后,需要根據(jù)系列性案件材料中反映出來的案件或犯罪嫌疑人特點(diǎn)總結(jié)發(fā)案規(guī)律,刻畫犯罪嫌疑人。但在案件基數(shù)龐大且仍處于增長中的我國,即使經(jīng)過串并,面對系列性案件中隱含的海量信息內(nèi)容,偵查人員仍舊難以憑借簡單的主觀判斷在分散化的,特征各異的刑事案件構(gòu)成要素中提煉出指向犯罪嫌疑人的線索。因此,文章主張在并案偵查實(shí)施過程中應(yīng)用相關(guān)性分析方法。一方面提高串并案件的準(zhǔn)確性,另一方面幫助快速認(rèn)定、抓獲犯罪嫌疑人。
偵查人員據(jù)以判斷是否進(jìn)行并案的前提條件是已經(jīng)掌握的不同案件材料中反映出來的,相同或相近的如時間、空間、工具痕跡、血跡、犯罪嫌疑人人身特征等要素,但這些要素在提示和判斷諸多案件的犯罪嫌疑人是否同一問題上所起的作用卻有所差異。如憑借指紋、足印、生物檢材等要素,偵查人員能夠較為準(zhǔn)確的判斷是否串并案件,因此這些要素 (條件)一般被稱為串并“硬件”,其他如時間、地點(diǎn)、工具痕跡等不能完全據(jù)以判定是否串并案件的,稱為串并“軟件”,同時也應(yīng)看到,各類“軟件”的“提示”作用也有所差異。特別是在案件數(shù)量較多,案件材料暴露不充分的情況下,偵查人員很難對“軟、硬件”的提示程度進(jìn)行準(zhǔn)確把握。根據(jù)關(guān)聯(lián)分析的原理,可以把這種“提示”程度理解為在不同刑事案件中,構(gòu)成要素的相同或相近與犯罪主體同一的關(guān)聯(lián)程度。因此,相關(guān)性分析的第一步就是對刑事案件各個構(gòu)成要素與“串并案件”的決定是否有關(guān),關(guān)系程度如何進(jìn)行估量。操作層面上我們可以簡單使用概率統(tǒng)計方法進(jìn)行相關(guān)性測算,即通過計算一定數(shù)量的系列案件中,單個案件反映出的一致或相似要素出現(xiàn)的次數(shù),以次數(shù)多少衡量相關(guān)程度的大小,但是這種統(tǒng)計方法難以排除由抽樣隨機(jī)性所帶來的誤差,因此借鑒回歸分析統(tǒng)計方法將各類“串并條件”對并案偵查的支持程度轉(zhuǎn)化為數(shù)值型變量進(jìn)行測算。回歸分析利用兩個變量,因變量Y與自變量X建立模型,目的在于了解兩個或多個變量間是否相關(guān)、相關(guān)方向與強(qiáng)度如何,并利用此數(shù)學(xué)模型通過觀察特定變量來預(yù)測研究者感興趣的變量。如果回歸分析中只包括一個自變量和一個因變量,且二者的關(guān)系可用一條直線近似表示,這種回歸分析稱為一元線性回歸分析。如果回歸分析中包括兩個或兩個以上的自變量,且因變量和自變量之間是線性關(guān)系,則稱為多元線性回歸分析?,F(xiàn)將利用回歸分析研究一致性或相似性刑事案件構(gòu)成要素與并案偵查是否相關(guān),相關(guān)程度如何的原理簡略表述如下:首先,根據(jù)已成功串并的系列性案件歷史數(shù)據(jù)計算相關(guān)系數(shù),構(gòu)建數(shù)學(xué)關(guān)系式,用以說明一個或一組變量變動時,另一變量或一組變量平均變動的情況。將系列性案件中單個案件總量作為因變量Y進(jìn)行取值,將單個案件中出現(xiàn)的不同種類一致性要素次數(shù)作為自變量X進(jìn)行取值。從一組數(shù)據(jù)出發(fā),計算相關(guān)系數(shù)r,確定變量之間的數(shù)學(xué)關(guān)系式。r的取值范圍是 [-1,1],r值為正數(shù)時,表示自變量與因變量之間存在正向相關(guān)關(guān)系,為負(fù)值時表示二者存在負(fù)向相關(guān)關(guān)系;為0時二者無線性相關(guān)關(guān)系,為-1或1時二者完全相關(guān),且為函數(shù)關(guān)系,說明當(dāng)案件中出現(xiàn)這一類型的一致性要素或串并條件時可以即刻決定串并。此處仍需說明的是,r值僅僅作為自變量與因變量之間線性關(guān)系的度量,不能用于非線性關(guān)系描述。研究串并條件的“可信度”問題,只需回答是否具有相關(guān)關(guān)系以及相關(guān)程度大小,無需考慮以怎樣的方式進(jìn)行相關(guān),因此利用線性關(guān)系進(jìn)行描述更為直接明了。其次,對關(guān)系式的可信程度即r值的顯著性進(jìn)行檢驗,說明哪一類要素對決定串并案件的影響是顯著的。最后,建立回歸模型,根據(jù)目標(biāo)案件中出現(xiàn)的不同要素的類型、數(shù)量、頻次等情況判斷是否可以進(jìn)行并案偵查。并案只是偵查的前提,其目的是為了縮小偵查范圍,突出案件規(guī)律和犯罪嫌疑人特點(diǎn),建立起系列性案件與犯罪主體之間的關(guān)系。因此相關(guān)性分析第二步的應(yīng)用是考慮利用回歸模型發(fā)現(xiàn)案件規(guī)律與犯罪嫌疑人,一方面,偵查人員可以重點(diǎn)分析對決定串并案件具有顯著影響的要素內(nèi)容,進(jìn)一步探究案情,發(fā)現(xiàn)嫌疑人的線索,可以保證線索的來源與內(nèi)容都具有一定可信性。另一方面,可利用回歸模型進(jìn)行犯罪預(yù)測,模型中反映出來的如穩(wěn)定的時空規(guī)律,相同案件性質(zhì),一致的工具痕跡,微量物證等內(nèi)容可以提示未來發(fā)生同系列案件的要素內(nèi)容與特點(diǎn),偵查人員可據(jù)此進(jìn)行犯罪預(yù)測,及時采取措施,抓獲現(xiàn)行。
(二)利用要素相關(guān)性分析發(fā)現(xiàn)、收集刑事案件證據(jù)
首先,應(yīng)說明刑事案件偵查發(fā)現(xiàn)、收集證據(jù)的過程,就是偵查人員通過收集證據(jù),查明案件事實(shí)的過程。認(rèn)識案件事實(shí)就是不斷完善刑事案件構(gòu)成要素的過程。所以發(fā)現(xiàn)、收集案件證據(jù)的實(shí)質(zhì)是通過證據(jù)完成對刑事案件構(gòu)成要素的發(fā)掘、完善和表達(dá)。其次,需承認(rèn)刑事案件構(gòu)成要素之間具有關(guān)聯(lián)性,同時要素間的關(guān)聯(lián)性是刑事案件構(gòu)成中必不可少的組成部分。第一,馬克思主義唯物辯證法認(rèn)為整個自然界和人類社會就是各種事物相互聯(lián)系的總體,刑事案件與偵查活動自然不能例外。第二,作為偵查學(xué)基本原理之一的“洛卡德物質(zhì)交換原理”認(rèn)為犯罪過程的實(shí)質(zhì)即是物質(zhì)交換的過程,是犯罪人作為一個物質(zhì)實(shí)體在實(shí)施犯罪的過程中與其他物質(zhì)實(shí)體發(fā)生接觸和互換關(guān)系的過程??梢园研淌掳讣?gòu)成各個要素的發(fā)生、發(fā)展過程看作是物質(zhì)交換的結(jié)果。因此,構(gòu)成要素之間存在必然關(guān)聯(lián),偵查人員亦可以利用要素間的關(guān)聯(lián)認(rèn)識刑事案件構(gòu)成要素發(fā)生、發(fā)展的過程。一方面可以鑒別已收集到的案件構(gòu)成要素的真假,另一方面可以由已知要素出發(fā),利用要素之間的關(guān)聯(lián)發(fā)現(xiàn)更多隱藏證據(jù),織就案件事實(shí)網(wǎng)絡(luò),最終形成證據(jù)鏈條。如在殺人碎尸、拋尸案件中偵查人員一般會根據(jù)拋尸現(xiàn)場數(shù)量、位置、痕跡物證、作案工具來源地等信息推測殺人現(xiàn)場位置、交通工具、犯罪嫌疑人活動范圍,并結(jié)合被害人經(jīng)常性活動場所的位置推測出嫌疑人犯罪行為、軌跡等線索,再根據(jù)這些線索尋找視頻資料、手印足跡、微量物證、通話記錄等重要證據(jù),逐步完善證據(jù)鏈。
案情分析工作即是偵查人員根據(jù)已知案件材料,研究材料 (要素)之間的關(guān)聯(lián),發(fā)現(xiàn)案件線索的過程。但是,這種關(guān)聯(lián)分析往往是建立在偵查人員經(jīng)驗性、直覺性的主觀判斷之上,判斷結(jié)果具有偶然性與不確定性。尤其是在我國目前激增的案件數(shù)量面前,有限的警力資源無法進(jìn)行大規(guī)模材料信息的處理與分析。此時,可引用相關(guān)性分析方法,從數(shù)理統(tǒng)計的角度為要素間關(guān)聯(lián)分析提供更為客觀、全面的數(shù)據(jù)支持,同時借助計算機(jī)技術(shù),實(shí)現(xiàn)便捷、高效的數(shù)據(jù)處理。借用統(tǒng)計學(xué)卡方統(tǒng)計與列聯(lián)分析的方法研究分類數(shù)據(jù)之間的相關(guān)關(guān)系。首先,需要偵查人員根據(jù)經(jīng)驗和刑事案件發(fā)生的顯著規(guī)律對刑事案件構(gòu)成要素內(nèi)容進(jìn)行細(xì)化,并建立某對構(gòu)成要素之間關(guān)聯(lián)的假設(shè)。僅以發(fā)案時間與案件性質(zhì)兩個要素為例,將案件性質(zhì)細(xì)化為搶劫、殺人、盜竊、強(qiáng)奸等類型,可以發(fā)現(xiàn)不同類型對應(yīng)的發(fā)案時間在年內(nèi)有顯著差異。一般來說,強(qiáng)奸案件在第二季度發(fā)案量較高,搶劫、盜竊于第四季度發(fā)案量巨大,殺人案件則在四個季度內(nèi)呈平均分布態(tài)勢,但春節(jié)前夕會有明顯增加。還可以對某一類案件性質(zhì)進(jìn)行詳細(xì)分類與關(guān)聯(lián),如盜竊案件又可分為入室盜竊案件,集中發(fā)案于凌晨一點(diǎn)至三點(diǎn)之間;街面發(fā)生的扒竊案件,集中發(fā)案于上、下午室外人流量高峰時段。其次,為了驗證以上規(guī)律或假設(shè)的真實(shí)性,我們依據(jù)某一范圍內(nèi)案件的歷史數(shù)據(jù)進(jìn)行卡方檢驗。假設(shè)某省全年的盜竊案件中,不同方式(性質(zhì))盜竊案件發(fā)案數(shù)與時間有關(guān),為驗證假設(shè)是否成立,卡方檢驗需要將發(fā)案時間范圍進(jìn)行若干具體分類,根據(jù)全年入室盜竊發(fā)案總數(shù),計算某一時段內(nèi)發(fā)案數(shù)的觀察值 (實(shí)際發(fā)生案件數(shù))和期望值 (按照案件性質(zhì)比率估算的案件數(shù)),并比較二者是否具有顯著差異。當(dāng)卡方的計算值遠(yuǎn)大于時段分類數(shù)自由度下卡方值時,案件性質(zhì)與時間要素有顯著相關(guān)性。最后,在二者相關(guān)的前提下,利用列聯(lián)分析¢相關(guān)系數(shù),V相關(guān)系數(shù)等相關(guān)程度測量方法說明要素之間的相關(guān)程度。在掌握這些相關(guān)規(guī)律與相關(guān)的密切程度之上,我們可以根據(jù)不同案件的發(fā)案時間特征推測案件性質(zhì),也能夠依據(jù)案件性質(zhì)估算這一類型案件發(fā)案時間規(guī)律。此外,需要說明的是,案件構(gòu)成要素之間的相關(guān)規(guī)律復(fù)雜繁多,目前無法完全實(shí)現(xiàn)依靠技術(shù)自動發(fā)現(xiàn)全部要素內(nèi)容之間的相關(guān)關(guān)系,仍舊需要偵查人員根據(jù)辦案經(jīng)驗人工選擇相關(guān)要素進(jìn)行驗證。
(三)利用要素相關(guān)性分析實(shí)現(xiàn)犯罪預(yù)測
犯罪預(yù)測作為犯罪學(xué)的研究方向之一,是實(shí)現(xiàn)精準(zhǔn)打擊和犯罪預(yù)防的前提。在我國,由于受到犯罪學(xué)理論基礎(chǔ)與研究環(huán)境的制約,犯罪預(yù)測理論與方法的研究一直未能取得突破性進(jìn)展。根據(jù)2011-2015年國家統(tǒng)計局公布的各類刑事案件數(shù)據(jù),盜竊、詐騙、搶劫三類財產(chǎn)型案件的立案數(shù)占每年刑事案件立案總數(shù)的三分之二,而且數(shù)量仍在持續(xù)增長。至2015年,全國共立“盜、搶、騙”案件602萬起,突破全部刑事案件總數(shù)三分之二而達(dá)到的84%。其中盜竊案件發(fā)案數(shù)量最大,詐騙案件次之,且較前一年增幅明顯。相比于發(fā)案趨勢,案件偵辦情況卻不容樂觀,2012-2105年盜竊案件年偵破數(shù)量僅為立案數(shù)量的三分之一。經(jīng)過08年以來公安部聯(lián)合多個部門的重力打擊,2015詐騙案件偵破數(shù)量雖較2008年有所上升,但仍只占到當(dāng)年立案數(shù)的二分之一。針對以上情況,全國公安機(jī)關(guān)將開展為期3年的打擊“盜、搶、騙”專項行動,堅決打擊盜竊、搶奪、詐騙、銷贓等多發(fā)性侵財犯罪活動。但針對上述案件,僅僅依靠事后打擊,通過偵查工作發(fā)現(xiàn)、抓獲犯罪嫌疑人不但所起作用有限,而且虛耗警力資源,影響犯罪打擊的整體效率。可以將突破的重點(diǎn)擴(kuò)展到事前預(yù)測上來,利用“數(shù)據(jù)”分析技術(shù)實(shí)現(xiàn)高發(fā)、多發(fā)案件的精準(zhǔn)打擊。
目前,很多學(xué)者都在著手開展大數(shù)據(jù)背景下犯罪預(yù)測的研究,進(jìn)行了多種方法、模型的嘗試和開發(fā),有學(xué)者提出構(gòu)建時空定位信息管理系統(tǒng)進(jìn)行犯罪預(yù)測,有學(xué)者建議搭建犯罪時空網(wǎng)絡(luò),利用歷史數(shù)據(jù)描述刑事案件在時空范圍內(nèi)的分布,預(yù)測未來某一類型案件發(fā)生的時空點(diǎn)位和積聚程度。還有學(xué)者認(rèn)為應(yīng)利用決策樹等方法在給定條件范圍內(nèi)進(jìn)行數(shù)據(jù)運(yùn)算,得出預(yù)測結(jié)果。以上觀點(diǎn)無論是研究的切入點(diǎn)還是核心理論都具有某種程度的一致性:首先,都是利用歷史數(shù)據(jù)計算未來結(jié)果預(yù)測犯罪。其次,都選擇從刑事案件構(gòu)成中時間、空間兩個要素入手進(jìn)行預(yù)測。最后,都是利用構(gòu)成要素間的相關(guān)關(guān)系構(gòu)建模型,測算刑事案件在未來某一時空范圍內(nèi)發(fā)生的概率及分布狀態(tài)。有所不同的是,有的理論、方法是單獨(dú)研究時間或空間某一個要素,有的是將時空要素作為整體設(shè)計數(shù)據(jù)分析模型。文章在以上觀點(diǎn)的基礎(chǔ)上提出利用刑事案件構(gòu)成要素相關(guān)性方法進(jìn)行犯罪預(yù)測,其核心理論仍然是利用要素之間的相關(guān)關(guān)系分析未來某一時空范圍內(nèi)刑事案件發(fā)生情況。但有所不同的是,第一,刑事案件構(gòu)成要素相關(guān)性方法在考慮時空要素之外還加入了對案件性質(zhì)、現(xiàn)場痕跡、損失價值等多個要素的考慮,能夠使預(yù)測結(jié)果更加詳盡、準(zhǔn)確。第二,除了簡單測量單個或多個要素發(fā)生的概率 (可能性系數(shù))之外,還要利用計算機(jī)技術(shù)對要素進(jìn)行聚類及多維度相關(guān)性計算,發(fā)現(xiàn)其深度關(guān)聯(lián)規(guī)則,實(shí)現(xiàn)多類型、大容量數(shù)據(jù)分析,為偵查機(jī)關(guān)提供更為全面的預(yù)測結(jié)果。
除了利用概率統(tǒng)計與回歸分析等方法進(jìn)行犯罪預(yù)測之外,再嘗試方差分析的方法,利用研究分類型自變量對數(shù)值型因變量是否具有顯著影響的思路,判斷某類型構(gòu)成要素內(nèi)容能否對預(yù)測結(jié)果構(gòu)成影響并估量影響的大小,為預(yù)測結(jié)果提供解釋。首先,在歷史數(shù)據(jù)中選取案件樣本,此處的案件可以是系列性案件,也可以是在某些構(gòu)成要素方面具有高度一致性或相似性的案件。將案件性質(zhì)、時間、空間、工具痕跡等要素作為分類型自變量,而各個內(nèi)容一致或相似的要素內(nèi)容在樣本案件中出現(xiàn)的次數(shù)即為數(shù)值型因變量。其次,計算全部數(shù)據(jù)誤差平方和 (SST),不同類型內(nèi)部(組內(nèi))數(shù)據(jù)誤差平方和 (SSE)與不同類型之間(組間)數(shù)據(jù)誤差平方和 (SSA),其中 SST=SSE+SSA。如果要素類型對預(yù)測結(jié)果沒有影響,則組間誤差中只包含隨機(jī)誤差而沒有系統(tǒng)誤差,類型間誤差與類型內(nèi)部誤差應(yīng)該很接近;反之,類型間誤差除了隨機(jī)誤差還會包含系統(tǒng)誤差,此時認(rèn)為要素類型對預(yù)測結(jié)果有顯著影響。最后,用組間誤差平方和占總誤差平方和的比例反映要素類型與預(yù)測結(jié)果關(guān)系強(qiáng)度。當(dāng)然,考慮到實(shí)際情況下不同類型要素之間存在交互作用,可選擇雙因素方差分析方法,其基本原理如上。隨后,可利用測得的關(guān)系強(qiáng)度,根據(jù)偵查實(shí)際需求進(jìn)一步構(gòu)建預(yù)測模型,對一定時空范圍內(nèi)的刑事案件構(gòu)成特征進(jìn)行預(yù)測。
以上論述是刑事案件構(gòu)成要素相關(guān)性分析應(yīng)用研究第一階段的成果,僅僅是圍繞刑事案件構(gòu)成要素相關(guān)性分析在刑事案件偵查工作中的應(yīng)用范圍及方法所進(jìn)行的理論闡述,將會在后續(xù)工作中嘗試研究相關(guān)性模型的建立與應(yīng)用,為偵查“大數(shù)據(jù)”的處理與分析提供思路和理論依據(jù)。
[1]謝景文,吳小平.統(tǒng)計學(xué)原理 [M].北京:北京理工大學(xué)出版社,2010.
[2]維克托 · 邁爾·舍恩伯格.大數(shù)據(jù)時代:生活、工作與思維的大變革 [M].周濤.譯.杭州:浙江人民出版社,2012.
[3]吳澤仁.用關(guān)聯(lián)分析法標(biāo)定新層 [J].?dāng)鄩K油氣田,1997,(09):27-30.
[4]郝宏奎,陳剛.偵查學(xué)[M].北京:中國公安大學(xué)出版社,2014.
[5]馬忠紅.論刑事案件的構(gòu)成要素 [J].中國人民公安大學(xué)學(xué)報 (社會科學(xué)版),2012,(05):91-99.
An Application Study on the Relativity of the Constituents of Criminal Cases
Miao Lin-lin
(Dept.of Investigation,Nanjing Forest Police College,Nanjing 210023,China)
The information age of public security organs has entered the third generation and the main task is surrounding the deep excavation of information and the projects construction of cloud computing of public security industry,big data and mobile policing.However,in practice,the application of information technology in public security organs is till in the phase of"Only-In-No-Out"and the capacity of information study is relatively weak.Therefore,we shall realize that the significance of big data lies not only in the large volume and diversity of big data,but also as an analyzing technique in the speedy treatment and efficient analysis of mass data.This paper studies the relativity of the constituents of criminal cases from the perspective of data application and conduct a model analysis to improve the accuracy of the forecast and decision of public security work.
constituents of criminal cases;connection;relativity analysis;mixed cases investigation;crime forecast
DF61
A
1009-3745(2017)05-0037-08
2017-08-30
國家社會科學(xué)基金項目“大數(shù)據(jù)背景下公安情報分析與關(guān)聯(lián)模式研究”(16BFX091)
苗林林 (1988-),女,遼寧鐵嶺人,南京森林警察學(xué)院偵查系講師,從事偵查學(xué)研究。
責(zé)任編輯:林 衍