摘要:隨著社會的發(fā)展,信息技術的進步,與大數(shù)據技術的廣泛應用,公安系統(tǒng)的信息化建設也得到了長足的發(fā)展,從各類案件卷宗信息、身份證信息、戶口信息、交通信息、住宿信息、通信信息、天網數(shù)據監(jiān)控數(shù)據等各類信息的電子化,為我們從這些海量數(shù)據中分析出某類案件產生的各種背景因素、各類因素之間的關聯(lián)關系,提供了數(shù)據基礎。而通過分析這些關聯(lián)關系,能夠為特定案件的偵破,提供方向指導的數(shù)據支持。
關鍵詞:JavaEE;apriori
中圖分類號:TP311 文獻標識碼:A
文章編號:1009-3044(2020)27-0097-03
開放科學(資源服務)標識碼(OSID):
1 背景
利用大數(shù)據技術,開展公安情報分析,如今已經成為公安系統(tǒng)信息化建設的核心。根據統(tǒng)計年鑒分享平臺的數(shù)據分析,從2016年到2017年公安機關刑事案件立案數(shù)據如下:2016年,公安機關刑事立案總數(shù)為642.75萬起,其中盜竊案430.43萬起,占比66.97%;2017年公安機關刑事案件立案總數(shù)548.26萬起,其中盜竊案345.97萬起,占比63.1%。2016年盜竊案中人室盜竊立案1184052起,占比18.42%;盜竊機動車立案435221起,占比6.77%。如此之多的盜竊案,其中大部分都不能破案,因此,本系統(tǒng)試著通過運用APRIORI算法,來分析盜竊案中各類字段之間的關聯(lián)性,為案件的偵破提供數(shù)據支持。
2 技術介紹
2.1 關聯(lián)規(guī)則
關聯(lián)規(guī)則是形如X—Y的蘊涵表達式,在數(shù)據庫表中,可以將X與Y看成表中的字段,通過迭代算法,分析出各個字段出現(xiàn)的次數(shù),然后根據貝葉斯算法,計算字段值出現(xiàn)的關聯(lián)性概率,關聯(lián)規(guī)則的強度可以用它的支持度(support)和置信度(con-fidence)來度量,Support(支持度):表示同時包含A和B的事務占所有事務的比例。如果用P(A)表示使用A事務的比例,那么Support=P(A&B)。Confidence(可信度):表示使用包含A的事務中同時包含B事務的比例,即同時包含A和B的事務占包含A事務的比例。公式表達:Confidence=P(A&B)/P(A),通過合理設置置信度,能為公安破案提供偵破方向的數(shù)據支持。
2.2 JavaEE技術
為便于民警進行數(shù)據的實時查詢,本系統(tǒng)通過B/S架構的JavaEE技術來實現(xiàn),JavaEE是一個開發(fā)分布式企業(yè)級應用的規(guī)范和標準。通過JDBC技術實現(xiàn)平臺無關的與各類數(shù)據庫的連接,通過STRUTS技術實現(xiàn)前端頁面與后臺技術的分離。
3 數(shù)據字段設計
根據盜竊案結案錄入的內容,審訊內容,破案經過,本系統(tǒng)著重分析盜竊案的如下字段數(shù)據,盜竊物品:分類為A1現(xiàn)金,A2手機,A3貴重物品,A4家電,A5古董字畫,A6含重大價值的文件(科技類,遺囑)。同理方式處理作案手段(Bl撬鎖,B2翻窗,B3冒充戶主開鎖,B4未關門,B5自己家),地點(C1小區(qū),C2普通民房,C3出租屋,C4店鋪),對象(D1獨居老人,D2單身女性,D3單身職員,D4家人外出的空屋),動機(El購買毒品,E2賭博,E3補貼家用,E4獲取重大遺產,E5售賣獲利,E6還債,E7其他),團伙人數(shù)(2人團伙,3人團伙,4人團伙,其他),聯(lián)系方式(G1手機聯(lián)系,G2 QQ聯(lián)系,G3微信聯(lián)系,G4其他),案發(fā)前后去向(H1回住所,H2網吧,H3賓館,H4麻將館,H5 KTV),是否前科(I1是,12不是),時間(J1受害人上班,J2受害人睡著,J3受害者外出)學歷(KI小學,K2初中,K3高中,K4中專,K5大專,K6本科,K7碩士,K8博士),作案者年齡(11 15-20.L221-25,L326-35.L4 36-45 L5 46-50)踩點時間(M1案發(fā)前一周內,M2,案發(fā)前一個月,M3案發(fā)前很久)。作案者職業(yè)(N1學生,N2無業(yè)人員,N3臨時工,N4薪水<3000,N5薪水<5000,N6個體戶)
具體數(shù)據如表1:
4 主要功能模塊
案件統(tǒng)計分析:通過當前報案信息,選擇某個報案進行數(shù)據分析。
關聯(lián)字段的篩選:根據案件已有的線索,選擇數(shù)據分析的字段內容。
可信度與置信度的設置:根據同類案件的數(shù)量,設置可信度與置信度。
關聯(lián)規(guī)則顯示:顯示關聯(lián)分析結果數(shù)據。
5 案件統(tǒng)計分析
進入情報分析系統(tǒng),首先根據不同查詢條件查詢報案案件類別,效果如下:
通過struts配置文件:
if (session.getAttribute(" daoqielist")!="nully*將統(tǒng)計查詢數(shù)據,放到session中的daoqieList中,如果有刪除舊的。*/
session. removeAttribute("daoqieList"); session. setAttribute(”daoqieList",tj DAO.query2(tj Form》;
public List query2( tongjiForm tjForm)(
List daoqieList= new ArrayList0;
String sql= "select 8from tongji where”;
if(! tj Form.getAO.equals(”0"》
sql =sql+ "and A=”+”¨+tj Form.getAO+”¨;
if(! tj Form.getB O.equals(" 0"》
sql=sql+”and B=”+”¨+tj Form.getB0+”¨;
……….‘
ResultSet rs= conn.executeQuery(sql2);
try{
while (rs.next0){
tjForm= new tongjiForm0;
tjForm.setIDcard (rs.getString(l》;
tjForm.setA(rs.getString(2》;
tj Form.setB (rs.getString(3》;
……..
daoqieList.add(tjForm);
)
…...
return daoqieList;
7 可信度與置信度的設置
通過點擊統(tǒng)計分析:進行字段篩選與置信度,支持度的選擇。
List tjlist = (List) session.getAttribute("daoqieList");
ArrayLisKString> dataList = new ArrayList ();
for (int i = 0; i < tjlist.size(); i++) {
tjForm = (tongjiForm) tjlist.get(i);
for(int j=O;j
if (str_cond[j].equals("A "》
condition = tjForm.getAO + ";";
if (str_cond[jl.equals("B "》
condition = condition + tjForm.getBO + ";";
dataList.add(condition);
//關聯(lián)分析代碼
Map relationRulesMap = apriori2.getRela-tionRules(frequentSetMap);
SeKString> rrKeySet = relationRulesMap.keySet0;
for (String rrKey : rrKeySet) {
String s = rrKey;
System.out.println(s.replaceAII(";", " ") + " : '1 +“概率為 :"+ relationRulesMap.get(rrKey》;
}
9 結束語
本系統(tǒng)通過分析盜竊案的各類字段之間的關聯(lián)關系,在收到的報案信息中,根據已有的線索信息,可以設置字段篩選內容,從而分析出個字段之間的出現(xiàn)概率,為案件的偵破提供方向指導。
參考文獻:
[1]陳鵬,瞿珂,胡嘯峰.犯罪情報分析中的數(shù)據挖掘應用[J].計算機系統(tǒng)應用,2017,26(2): 249-253.
[2]李樂亮,李桂峰.論盜竊案件的特點及偵查方法[J].市場周刊(理論研究),2008(12): 92,115-116.
[3]劉智明,廖藝.入室盜竊案外圍現(xiàn)場勘查的幾點啟示[J].法制博覽,2017(5): 152.
[4]梁凡,趙麗.基于中智模糊關聯(lián)規(guī)則生成的大數(shù)據挖掘分析算法[J].計算機應用與軟件,2019,36(10): 285-292,298.
[5]雷宇.面向大數(shù)據的高維數(shù)據挖掘技術研究[J].企業(yè)科技與發(fā)展,2019(7): 166-167.
[6]羅樂,葛啟東,周永學.基于Apriori算法的裝備數(shù)據關聯(lián)規(guī)則挖掘[J].指揮控制與仿真,2020,4(10):2.
[7]王彬.盜竊案件偵查的數(shù)據碰撞問題研究[J].遼寧警察學院學報,2019,21(5): 34-40.
【通聯(lián)編輯:謝媛媛】
作者簡介:徐雪飛(1977-),男,江西南昌人,講師,碩士,主要研究方向為軟件工程。