◆周逸璇 李晶晶 徐津霞 劉紅杏
(1.云南司法警官職業(yè)學(xué)院“科學(xué)研究基金項(xiàng)目”課題組 云南 650211;2.云南中醫(yī)藥大學(xué) 云南 650211)
社區(qū)矯正最初起源于西方國(guó)家,我國(guó)從2003 年開(kāi)始在北京等6 個(gè)省、市開(kāi)始社區(qū)矯正試點(diǎn)工作,2007 年推廣至全國(guó)實(shí)行[1]。十多年來(lái),經(jīng)過(guò)各地社區(qū)矯正機(jī)構(gòu)的共同努力下,成功地將一大批社區(qū)矯正對(duì)象教育矯正為守法公民,在社會(huì)治理和法治中國(guó)建設(shè)中發(fā)揮了重要的作用,節(jié)約了國(guó)家的刑罰執(zhí)行成本,維護(hù)了社會(huì)的和諧與穩(wěn)定,有效促進(jìn)了司法文明的進(jìn)步與發(fā)展[2]。2020 年7 月1 日起開(kāi)始施行的《中華人民共和國(guó)社區(qū)矯正法》,將國(guó)家支持社區(qū)矯正機(jī)構(gòu)提高信息化水平寫入了總則,第一次以立法的形式確立了運(yùn)用現(xiàn)代科學(xué)技術(shù)對(duì)社區(qū)矯正對(duì)象進(jìn)行監(jiān)管和教育幫扶的法律地位,為社區(qū)矯正信息化發(fā)展提供了有力的法律依據(jù)[3]。
在現(xiàn)階段,利用數(shù)據(jù)挖掘、模式識(shí)別和機(jī)器學(xué)習(xí)等大數(shù)據(jù)技術(shù)對(duì)社區(qū)矯正對(duì)象從入矯、施矯到解矯全過(guò)程產(chǎn)生的數(shù)據(jù)整合成數(shù)據(jù)集,然后進(jìn)行聚類、關(guān)聯(lián)、分類和深度分析,提煉信息規(guī)律,獲取知識(shí),基于數(shù)據(jù)分析對(duì)社區(qū)矯正對(duì)象再次犯罪的相關(guān)因素進(jìn)行研究,進(jìn)而對(duì)社區(qū)矯正對(duì)象再犯罪的危險(xiǎn)性進(jìn)行預(yù)測(cè)預(yù)警,可以有效預(yù)防和減少犯罪,提升教育矯正質(zhì)量,達(dá)到維護(hù)社會(huì)安全穩(wěn)定的目的[4]。
社區(qū)矯正是立足我國(guó)基本國(guó)情發(fā)展起來(lái)的具有中國(guó)特色的刑事執(zhí)行制度,是與監(jiān)禁矯正相對(duì)的非監(jiān)禁刑罰執(zhí)行制度,是指將管制、緩刑、暫予監(jiān)外執(zhí)行、假釋的符合法定條件的罪犯置于社區(qū)內(nèi),由專門的司法行政機(jī)關(guān)、社區(qū)矯正機(jī)構(gòu)和司法所在相關(guān)社會(huì)團(tuán)體和社會(huì)志愿者的協(xié)助下,在判決、裁定或決定確定的期限內(nèi),矯正其犯罪的行為惡習(xí)和心理,促進(jìn)其改造為遵紀(jì)守法的合格公民,促進(jìn)其順利回歸社會(huì)的非監(jiān)禁刑罰執(zhí)行活動(dòng)[5]。
被判處管制、宣告緩刑、假釋或者暫予監(jiān)外執(zhí)行的罪犯[6]。
關(guān)于大數(shù)據(jù)的定義,在不同領(lǐng)域有著不同的概念。麥肯錫的報(bào)告提出,“大數(shù)據(jù)”是一種數(shù)據(jù)集,該數(shù)據(jù)集超出了一般普通數(shù)據(jù)庫(kù)軟件的采集、存儲(chǔ)、管理和分析能力[7]。大數(shù)據(jù)并不是描述數(shù)據(jù)量的大小,而是在種類繁多,數(shù)量龐大的多樣數(shù)據(jù)中快速地獲取有用的信息[8]。關(guān)于大數(shù)據(jù)的特點(diǎn),普遍認(rèn)為有四個(gè):大量化、多樣化、快速化和價(jià)值化。通俗地講,就是從海量的數(shù)據(jù)中挖掘出有價(jià)值的信息[9]。
社區(qū)矯正對(duì)象再犯罪,是指社區(qū)矯正對(duì)象在社區(qū)矯正期間再一次實(shí)施犯罪[10]。
截至目前,全國(guó)司法行政機(jī)關(guān)和社區(qū)矯正機(jī)構(gòu)累計(jì)接收社區(qū)矯正對(duì)象478 萬(wàn)人,累計(jì)解除矯正對(duì)象411 萬(wàn)人。2019 年全國(guó)新接收社區(qū)矯正對(duì)象57 萬(wàn)人,解除矯正59 萬(wàn)人,全年列管126 萬(wàn)人[10]。目前,全國(guó)社區(qū)矯正對(duì)象的再犯罪率為0.2%,但是部分省份的部分地區(qū)遠(yuǎn)遠(yuǎn)高出了這個(gè)數(shù)值,因此研究如何利用大數(shù)據(jù)分析對(duì)社區(qū)矯正對(duì)象的再犯罪情況進(jìn)行預(yù)警,具有非常重要的現(xiàn)實(shí)意義。
目前,全國(guó)各省、市均已建立了社區(qū)矯正管理信息系統(tǒng),系統(tǒng)中均包含社區(qū)矯正工作產(chǎn)生的結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對(duì)象基本信息和刑罰執(zhí)行信息等)、半結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對(duì)象電子定位數(shù)據(jù)和教育學(xué)習(xí)數(shù)據(jù)等)和非結(jié)構(gòu)化數(shù)據(jù)(例如社區(qū)矯正對(duì)象的電話記錄、視頻監(jiān)控)等海量數(shù)據(jù)。
通過(guò)大數(shù)據(jù)分析對(duì)社區(qū)矯正對(duì)象進(jìn)行再犯罪預(yù)警的目標(biāo)是在采集相關(guān)數(shù)據(jù)的基礎(chǔ)上,通過(guò)特定算法,分析出哪些社區(qū)矯正對(duì)象具有較大的再犯罪風(fēng)險(xiǎn),做出預(yù)警判斷,可以對(duì)預(yù)警風(fēng)險(xiǎn)系數(shù)較高的社區(qū)矯正對(duì)象進(jìn)行有針對(duì)性的監(jiān)督管理和教育幫扶,消除其可能重新犯罪的因素,具體研究?jī)?nèi)容如下。
表1 為初始考慮的相關(guān)指標(biāo),它們當(dāng)中存在著不盡相同的關(guān)聯(lián)關(guān)系,并且會(huì)預(yù)警結(jié)果產(chǎn)生不同的的影響,一些指標(biāo)可能是噪聲指標(biāo),因此通過(guò)相關(guān)性分析選擇出核心指標(biāo)非常關(guān)鍵。
表1 初始考慮的指標(biāo)
本研究通過(guò)Spearman 相關(guān)系數(shù)來(lái)計(jì)算不同指標(biāo)之間的線性相關(guān)性,具體的計(jì)算方法為:第一步是變量轉(zhuǎn)換,將指標(biāo)的變量值轉(zhuǎn)換為排列順序,第二步是計(jì)算轉(zhuǎn)換后的排列順序數(shù)值的相關(guān)系數(shù),具體計(jì)算公式如下:
其中Rxi和Ryi分別表示第i個(gè)X變量和Y變量重新排序后的次序,x和表示Rxi和Ryi的均值;
根據(jù)判斷|r|值的不同,則代表的線性相關(guān)關(guān)系程度如下:
表2 是在對(duì)表1 中各類指標(biāo)與目標(biāo)變量之間的相關(guān)性分析和對(duì)目標(biāo)變量結(jié)果的影響程度進(jìn)行分析之后,得出的關(guān)鍵指標(biāo)分析結(jié)果。
表2 關(guān)鍵性指標(biāo)分析結(jié)果
12 緯度 不顯著 重點(diǎn)關(guān)注 27 完成社區(qū)服務(wù)情況 非常顯著 重點(diǎn)關(guān)注 13 定位地點(diǎn)位置名稱 不顯著 重點(diǎn)關(guān)注 28 思想?yún)R報(bào)及溝通 非常顯著 重點(diǎn)關(guān)注 14 定位狀態(tài) 非常顯著 重點(diǎn)關(guān)注 29 認(rèn)罪服法態(tài)度 非常顯著 重點(diǎn)關(guān)注 15 定位時(shí)間 不顯著 重點(diǎn)關(guān)注 30 對(duì)社會(huì)的心態(tài) 非常顯著 重點(diǎn)關(guān)注
目前,主流的預(yù)警算法有決策樹(shù)、神經(jīng)網(wǎng)絡(luò)、邏輯回歸等。通過(guò)對(duì)比分析,決策樹(shù)具有預(yù)測(cè)準(zhǔn)確率好、速度很快、魯棒性強(qiáng)、可擴(kuò)展性很優(yōu)秀、容易理解等優(yōu)勢(shì),因此本研究選擇決策樹(shù)作為預(yù)警算法。
決策樹(shù)是一個(gè)類似于流程圖的樹(shù)形結(jié)構(gòu),其中每個(gè)內(nèi)部節(jié)點(diǎn)標(biāo)識(shí)一個(gè)屬性測(cè)試,每個(gè)輸出表示一個(gè)測(cè)試輸出,每個(gè)葉節(jié)點(diǎn)代表類或類分布。也就是說(shuō),決策樹(shù)根據(jù)不同的特性,以樹(shù)型結(jié)構(gòu)表示分類或決策集合,產(chǎn)生規(guī)則和發(fā)現(xiàn)規(guī)律[11]。
綜合考慮選取文化程度、是否有前科、是否累犯、對(duì)社會(huì)的心態(tài)、犯罪類型、自控能力、婚姻家庭關(guān)系、自控能力、對(duì)社區(qū)矯正的認(rèn)識(shí)和接受程度、捕前職業(yè)、性別、矯正類別、居住條件、認(rèn)罪服法態(tài)度、社會(huì)鄰里關(guān)系為指標(biāo),使用決策樹(shù)對(duì)2019 年云南省某縣在冊(cè)120 名社區(qū)矯正對(duì)象再犯罪進(jìn)行預(yù)測(cè)和探索結(jié)果,具體分析情況如表3。
表3 決策樹(shù)分析結(jié)果
利用Clementine 建立模型過(guò)程包括數(shù)據(jù)源的建立->類型選擇->字段過(guò)濾->特征指標(biāo)的選擇->決策樹(shù)模型->結(jié)果分析,具體操作如圖1 所示。
圖1 模型建立
表4 內(nèi)容是對(duì)云南省4 個(gè)州(市)在冊(cè)社區(qū)矯正對(duì)象全年監(jiān)管情況的再犯罪情況的預(yù)測(cè)及驗(yàn)證結(jié)果。
表4 決策樹(shù)分析結(jié)果
本文在對(duì)社區(qū)矯正對(duì)象監(jiān)管情況產(chǎn)生的大數(shù)據(jù)進(jìn)行指標(biāo)篩選和相關(guān)性分析,得出關(guān)鍵性指標(biāo)參數(shù),然后通過(guò)對(duì)比主流的預(yù)警算法,選擇了決策樹(shù)作為本預(yù)警研究的算法,最后使用Clementine 建立模型,選取云南省4 個(gè)州市2019 年列管的社區(qū)矯正對(duì)象進(jìn)行預(yù)測(cè),并對(duì)預(yù)測(cè)結(jié)果進(jìn)行了驗(yàn)證。
下一步的主要工作是利用計(jì)算系統(tǒng)對(duì)社區(qū)矯正對(duì)象的社會(huì)關(guān)系、同案犯關(guān)系等網(wǎng)絡(luò)進(jìn)行分析,研究不同社會(huì)關(guān)系、教育學(xué)習(xí)和社區(qū)服務(wù)情況、個(gè)人文化程度、心理特征等不同因素對(duì)影響服刑人員再次犯罪的顯著性并加以分析,為有效預(yù)警社區(qū)矯正對(duì)象再次犯罪提供科學(xué)依據(jù)。