国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

粗糙集在犯罪信息中的應(yīng)用

2016-11-19 06:10:36張盼盼
關(guān)鍵詞:粗糙集數(shù)字化

張盼盼

摘要:在信息爆炸的時(shí)代,隨著數(shù)據(jù)信息的不管累積,如何從大量的數(shù)據(jù)信息中找到有用的信息變得越來越關(guān)鍵。從犯罪數(shù)據(jù)的特點(diǎn)出發(fā),將大規(guī)模人群的行為屬性數(shù)字化。在此基礎(chǔ)上,基于粗糙集來建立屬性約減模型。通過刪除冗余特征屬性得到關(guān)鍵屬性,從而有效地幫助警察處理案件。

關(guān)鍵詞:數(shù)字化;粗糙集;屬性約減

中圖分類號(hào):TP391 文獻(xiàn)標(biāo)識(shí)碼:A

0 引言

時(shí)下,人們的物質(zhì)生活獲得了極大提高與改善,社會(huì)也在逐步和諧有序地朝前發(fā)展。但同時(shí)也要看到,由于我國人口基數(shù)較大以及人口流動(dòng)相對(duì)頻繁,各種違法犯罪行為仍時(shí)有發(fā)生。而且,目前的警力配備仍屬有限,尤其對(duì)于小型的案件就難以投入足夠的警力去偵測(cè)排查。那么,如何利用已有的犯罪信息來幫助警察處理案件,即已成為公安部門的焦點(diǎn)課題之一。近年來,數(shù)據(jù)挖掘[1]這一技術(shù)已經(jīng)廣泛地應(yīng)用在信息處理領(lǐng)域中,如數(shù)據(jù)庫營銷、客戶關(guān)系管理、顧客行為預(yù)測(cè)及市場(chǎng)趨勢(shì)預(yù)測(cè)等[2]。

在現(xiàn)有的一些案件處理相關(guān)文獻(xiàn)中,數(shù)據(jù)挖掘技術(shù)也已進(jìn)入普及應(yīng)用。文獻(xiàn)[3]是依據(jù)不同案件的特點(diǎn),構(gòu)建了自組織特征的神經(jīng)網(wǎng)絡(luò),對(duì)相同或類似的案件進(jìn)行分類,提高案件執(zhí)行效率。夏穎等人[2]利用犯罪信息的特點(diǎn),使用聚類分析提取具有相似犯罪特征的案件或者涉案人員單獨(dú)成類,再分析每類中的共性特征,依據(jù)這些特征去處理相似的其他案件,為按鍵偵破提高效率。

本文采用基于粗糙集的屬性約簡算法建立模型,刪除決策表中的冗余對(duì)象信息,在得到的初步精簡的決策表上,設(shè)計(jì)啟用屬性約簡算法,對(duì)決策表中的各個(gè)行為屬性進(jìn)行篩選,刪除冗余屬性,最終求得關(guān)鍵屬性,來提升案件偵測(cè)過程的處理效率。

1 粗糙集理論概述

粗糙集是1982年波蘭數(shù)學(xué)家Z. Pawlak提出的一種數(shù)據(jù)特征分析識(shí)別理論,廣泛用于不完整數(shù)據(jù)和不精確知識(shí)的表達(dá)、學(xué)習(xí)與歸納的研究開展[4-5]。在粗糙集理論中,通常用信息系統(tǒng)表示知識(shí),而信息系統(tǒng)可視為是一張二維數(shù)據(jù)表。其中,行對(duì)應(yīng)于研究對(duì)象本身,稱為元組,列對(duì)應(yīng)于對(duì)象的屬性,屬性又可以分為條件屬性和決策屬性。

假設(shè)用 表示一個(gè)信息系統(tǒng),如式(1)所示:

(1)

式中, 是對(duì)象的集合, 即論域; 是屬性的集合; 是總函數(shù),使得 ,并且, 是集合 中的對(duì)象元素。屬性集劃分為條件屬性集 和決策屬性集 ,即 ,把這樣的信息系統(tǒng)稱為決策信息系統(tǒng)或者決策表,而決策屬性集 一般只包含一個(gè)屬性。這里,用 表示條件屬性集合 中的第 個(gè)屬性, 的取值為1,2,3,…, 。

2 屬性約簡模型實(shí)例

2.1 建立決策表

本文選取性別、年齡、婚姻狀況、人口來源、文化程度、收入狀況、有無穩(wěn)定工作、有無犯罪前科、有無犯罪動(dòng)機(jī)、是否精神正常等10個(gè)行為屬性[6]構(gòu)成屬性決策表,并且在屬性決策表中,不存在重復(fù)的屬性列。將人群的行為屬性數(shù)字化,如表1所示。根據(jù)表1,構(gòu)建原始決策表,具體如表2。所示。

2.2 屬性約簡算法

文獻(xiàn)[7]的研究提出,在描述同一現(xiàn)象的各種信息中,有些是相近的,有些是重復(fù)的。針對(duì)這些信息進(jìn)行約簡處理,找到描述現(xiàn)象的關(guān)鍵屬性,從而盡可能真實(shí)揭示現(xiàn)象本質(zhì)。在決策表中,如果某條件屬性去掉之后,決策表仍能夠保持相容,不影響決策結(jié)果,則該屬性是冗余的,可以約簡。因此,關(guān)于信息決策表中屬性約簡的實(shí)現(xiàn)步驟如下:

1)在決策信息表中,一行為一個(gè)對(duì)象。對(duì)條件屬性和決策屬性都相同的多個(gè)對(duì)象,只保留其中一個(gè),其余刪除,得到精簡后的信息表;

2)將每個(gè)對(duì)象的屬性進(jìn)行冗余分析,去除非關(guān)鍵行為屬性。冗余分析過程可做如下描述:

輸入:

輸出:約簡后的

主要步驟:對(duì)于屬性集合 ,其中 ,如果不存在 ,且 , ,則去掉冗余屬性 。

3)在1)和2)的基礎(chǔ)上,求出最小約簡的信息表,得到警方需要的關(guān)鍵屬性。

2.3 求解過程

首先,對(duì)表2中的20個(gè)案例對(duì)象進(jìn)行篩選。因?yàn)檫@些案例是隨機(jī)選取而得,沒有一定的規(guī)律,就需要對(duì)冗余信息實(shí)現(xiàn)篩選,排除重復(fù)出現(xiàn)的案例對(duì)象。通過比較不同對(duì)象間的各個(gè)行為屬性值,包括決策屬性,如果對(duì)象的各個(gè)行為屬性完全相同,則需要?jiǎng)h除一個(gè)對(duì)象信息,得到一個(gè)精簡的案例對(duì)象信息表,如表3所示。

然后,再對(duì)各個(gè)行為屬性進(jìn)行篩選。通過考慮不同行為屬性對(duì)決策的影響程度,刪除對(duì)決策作用很小的行為屬性。例如,在分析行為屬性性別時(shí),先把行為屬性刪除,在保證決策屬性不同的情況下,通過比較不同對(duì)象之間的其他行為屬性是否相同。如果不同對(duì)象之間的各個(gè)行為屬性值完全相同,則說明行為屬性為冗余行為屬性,可以刪除;否則,行為屬性為關(guān)鍵行為屬性,必須保留。依次循環(huán)考慮10個(gè)行為屬性,篩選出關(guān)鍵行為屬性為:婚姻狀況、收入、有無穩(wěn)定工作、有無犯罪前科和有無犯罪動(dòng)機(jī)。如表4所示。

2.4 結(jié)果分析

1)在原始決策表中,選取的20個(gè)對(duì)象各不相同,因此,通過冗余分析,在刪除冗余行之后的決策表3和原始決策表2相比較,并沒有出現(xiàn)實(shí)質(zhì)性的變化。

2)當(dāng)刪除冗余行之后,對(duì)每個(gè)屬性進(jìn)行冗余分析。研究發(fā)現(xiàn),在刪除冗余屬性之后的決策表中,明顯減少了無效屬性。這對(duì)案件的處理發(fā)揮了良好的推動(dòng)作用。

3 結(jié)束語

本文利用基于粗糙集的約簡模型,對(duì)信息進(jìn)行了篩選處理,大量減少了無效屬性。通過數(shù)據(jù)挖掘,可以從海量已有信息中歸類出有用的知識(shí),對(duì)未知事件的研究發(fā)揮了積極作用,可以為案件的處理提供有效指導(dǎo)。但是在實(shí)際運(yùn)用過程中,依然存在一定不足,如對(duì)這種大規(guī)模人群的行為屬性進(jìn)行統(tǒng)計(jì),需要的工作量也跡近龐大,那么在人口流動(dòng)性較強(qiáng)的地區(qū),如何隨時(shí)關(guān)注人群的關(guān)鍵屬性等,也仍是一個(gè)值得進(jìn)一步探討的重要問題。

參考文獻(xiàn)

[1] HAN J W , KAMBER M. 數(shù)據(jù)挖掘:概念與技術(shù)[M]. 范明,孟小峰,譯. 北京:機(jī)械工業(yè)出版社,2008.

[2] 夏穎,王哲,程琳. 聚類分析在犯罪數(shù)據(jù)分析中的應(yīng)用[J].合肥工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,32(12): 1924-1927.

[3] 程琳. SOM網(wǎng)絡(luò)模型在刑事案件并案?jìng)刹橹械膽?yīng)用[J].計(jì)算機(jī)數(shù)字與工程,2009,37(11):95-99,151.

[4] ZDZISLAW P. Rough Set theory and its application to data analysis [J]. Cybernetics and Systems, 1998, 29(7):661-688.

[5] 張文修, 吳偉志,梁吉業(yè),等. 粗糙集理論與方法[M ] . 北京: 科學(xué)出版社, 2001.

[6] 中國年鑒信息網(wǎng).刑事法治發(fā)展研究報(bào)告[EB/OL].[2013-05-19].http://www.chinayearbook.com/yearbook/.

[7] 王智君.粗糙集規(guī)則簡約的方法在模式識(shí)別中的應(yīng)用[J]. 微計(jì)算機(jī)應(yīng)用,2009,30(5): 1-4.

猜你喜歡
粗糙集數(shù)字化
數(shù)字化:讓夢(mèng)想成為未來
家紡業(yè)亟待數(shù)字化賦能
基于Pawlak粗糙集模型的集合運(yùn)算關(guān)系
論經(jīng)濟(jì)學(xué)數(shù)字化的必要性
英語文摘(2019年9期)2019-11-26 00:56:32
高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
基于二進(jìn)制鏈表的粗糙集屬性約簡
高中數(shù)學(xué)“一對(duì)一”數(shù)字化學(xué)習(xí)實(shí)踐探索
優(yōu)勢(shì)直覺模糊粗糙集決策方法及其應(yīng)用
數(shù)字化制勝
多?;植诩再|(zhì)的幾個(gè)充分條件
荔浦县| 蓬溪县| 吉首市| 原平市| 宁陕县| 金堂县| 东台市| 水城县| 正阳县| 时尚| 电白县| 沁水县| 桂阳县| 昭通市| 昌图县| 沧州市| 嘉兴市| 兴仁县| 久治县| 潞西市| 金平| 白河县| 宜城市| 祁阳县| 宝应县| 黎平县| 淮滨县| 定州市| 平凉市| 吐鲁番市| 江孜县| 灵石县| 洛宁县| 剑河县| 治多县| 泾源县| 和政县| 崇义县| 芜湖县| 新建县| 双城市|