国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘技術(shù)的分析與應(yīng)用探析

2021-12-02 13:32楊歡
電子元器件與信息技術(shù) 2021年6期
關(guān)鍵詞:決策樹公安數(shù)據(jù)挖掘

楊歡

(甘肅警察職業(yè)學(xué)院,甘肅 蘭州 730046)

0 引言

伴隨科學(xué)技術(shù)的飛速發(fā)展以及人口的持續(xù)擴增,犯罪行為也不斷增加。而公安部門在分析犯罪行為的時候一直處在被動狀態(tài)[1]。而近些年,為了有效處理這種現(xiàn)狀,國內(nèi)外的專家、學(xué)者開始對數(shù)據(jù)挖掘技術(shù)進行深入分析。只不過在公安情報分析中采取數(shù)據(jù)挖掘技術(shù)還處在早期階段,公安的數(shù)據(jù)挖掘是在各種各樣的信息案件中,將有用的信息進一步提取出來,然后在公安情報分析中合理使用數(shù)據(jù)挖掘技術(shù)。

1 數(shù)據(jù)挖掘的定義

1.1 決策樹算法

決策樹算法的含義是借助于樹形結(jié)構(gòu)來充分表示決策集合,這些決策集合經(jīng)過對數(shù)據(jù)集的有效分類進一步形成規(guī)則[2]。樹的各個分枝表示一個測試輸出,各個內(nèi)部節(jié)點表示在一個屬性方面的測試,而各個樹葉節(jié)點進一步代表類或者類分布。在樹構(gòu)造(歸納)的時候,需要通過剪枝來有效檢測以及剪去訓(xùn)練數(shù)據(jù)里面的噪聲以及孤立點,進而提升對未知數(shù)據(jù)實施分類的精準性。

1.2 關(guān)聯(lián)規(guī)則算法

其主要是指數(shù)據(jù)庫里面兩個或者若干個變量的取值之間蘊藏的某種規(guī)律性。支持度與置信度分別是對關(guān)聯(lián)規(guī)則重要性、準確度的有效衡量。挖掘過程通常都涵蓋兩個階段,首先,一定要從資料集合里面找出全部的高頻項目組,就是找到那些項目組,相較于全部記錄來說,它們產(chǎn)生的頻率超過所設(shè)定的最小支持度。其次,再由這些高頻項目組里面進一步產(chǎn)生關(guān)聯(lián)規(guī)則,確保使用這個規(guī)則所獲取的結(jié)果能夠達到最小的置信度。

2 在公安情報分析中數(shù)據(jù)挖掘算法的運用

數(shù)據(jù)挖掘包含了多樣化的算法,每種算法都會進一步適應(yīng)某種數(shù)據(jù)類型,可還沒有能夠適應(yīng)全部數(shù)據(jù)類型的算法。在現(xiàn)實運用中,因為數(shù)據(jù)類型很豐富,需要我們按照詳細情況開展全面考慮,借助于若干種算法來挖掘數(shù)據(jù)[3]。算法是數(shù)據(jù)挖掘的靈魂,唯有適合的算法才可以使挖掘效果達到最好,為了追求挖掘目標的可靠性以及正確性,我們能夠優(yōu)化現(xiàn)有算法,乃至創(chuàng)造新型的算法。一般情況下,如今在公安情報中一般使用決策樹算法以及關(guān)聯(lián)規(guī)則算法。

2.1 在公安情報分析中使用決策樹算法

在公安情報分析中使用決策樹算法可以有效研究群體性事件。借助于決策樹算法對群體性事件進一步實施分類以及預(yù)測,我們能夠分為三個環(huán)節(jié)開展:決策樹分析、構(gòu)造決策樹以及數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理就是數(shù)據(jù)挖掘前的相關(guān)準備工作,在此詳細是指從公安信息系統(tǒng)中取得有關(guān)數(shù)據(jù),并且選擇記錄中的敏感屬性,進一步產(chǎn)生數(shù)據(jù)源[4]。數(shù)據(jù)能夠只涵蓋用來對群體性事件進行描述的一些項目內(nèi)容,如此構(gòu)造出來的決策樹很直觀以及簡單。

給定0<a<1,a的詳細取值由相關(guān)專家按照工作經(jīng)驗的持續(xù)總結(jié)來明確。a的詳細值還不明確,它僅僅是在相關(guān)工作中由經(jīng)驗豐富的人在具體實踐里面總結(jié)的先驗知識,涵蓋專家建議以及領(lǐng)域知識,在學(xué)習(xí)決策樹的時候能夠進一步理解成在決策樹訓(xùn)練時除了用來產(chǎn)生以及修改決策樹的實例集以外的全部影響決策樹規(guī)則產(chǎn)生以及選擇的因素,比如規(guī)則與實例的表示,還有轉(zhuǎn)換語言、規(guī)則產(chǎn)生以及修改所采取的噪音處理、數(shù)據(jù)冗余與方法等。假如實例集空間非常大,那么采取系數(shù)a能夠有效縮小搜索空間,使學(xué)習(xí)效率獲得充分提升。

2.2 在公安情報分析中使用關(guān)聯(lián)規(guī)則算法

在公安情報分析中使用關(guān)聯(lián)規(guī)則可以充分挖掘犯罪行為的規(guī)律性[5]。挖掘過程能夠?qū)⑷珖`法犯罪信息數(shù)據(jù)庫以及偵查情報資料數(shù)據(jù)庫當作挖掘?qū)ο?,把挖掘任?wù)充分結(jié)合起來,對挖掘算法進行不斷優(yōu)化,極有可能進一步發(fā)現(xiàn)犯罪活動中受害對象、地點、時間以及作案手法等方面的關(guān)聯(lián)規(guī)律性,進而將犯罪活動的相關(guān)規(guī)律揭示出來,為未來制定有效的偵查措施以及防范犯罪活動進一步提供重要指導(dǎo)。

關(guān)聯(lián)規(guī)則還能夠普遍運用于預(yù)警機制中,特別是預(yù)測新型犯罪的核心發(fā)展趨勢。伴隨社會的飛速發(fā)展,各類新型犯罪持續(xù)產(chǎn)生,盡管新型犯罪不用于傳統(tǒng)犯罪,可犯罪手法和犯罪領(lǐng)域不一樣,兩者在案發(fā)趨勢方面依舊存在一定的類似性。我們能夠把傳統(tǒng)的犯罪趨勢當作研究對象,借助于數(shù)據(jù)挖掘技術(shù),有效發(fā)現(xiàn)其內(nèi)在的相關(guān)規(guī)律,事先遏制或制定對應(yīng)的防控體制,對新型犯罪的增長進行有效抑制。

經(jīng)過充分挖掘以及研究最新的犯罪行為,能夠從動態(tài)信息入手,第一時間發(fā)現(xiàn)苗頭,進而明確打防重點。任何犯罪趨勢以及社會治安問題的產(chǎn)生都有先期的苗頭,經(jīng)過Apriori優(yōu)化算法的關(guān)聯(lián)挖掘,能夠第一時間反映出犯罪的核心發(fā)展趨勢,可以幫助公安機關(guān)借助于情報分析有效把握先機。同時針對目前犯罪速度變化很快的形勢,能夠加快改革犯罪控制的應(yīng)對策略。

2.2.1 頻繁項集算法的明確提出

頻繁項集算法的明確提出,充分考慮了公安情報分析中數(shù)據(jù)挖掘效率提升以及新項目敏感性的需求。數(shù)據(jù)挖掘技術(shù)的使用,比如在線服務(wù)以及Web應(yīng)用都應(yīng)該從日新月異的數(shù)據(jù)中進一步獲取準確的信息,在這種形勢下,偶爾或頻繁的數(shù)據(jù)更新都會使得原來發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則出現(xiàn)變化。在挖掘關(guān)聯(lián)規(guī)則的時候,需要搜集越來越多的信息,使用戶可以獲取關(guān)鍵的以及完整的信息。數(shù)據(jù)挖掘經(jīng)常訪問數(shù)據(jù)庫不利于數(shù)據(jù)挖掘效率的提升,關(guān)聯(lián)規(guī)則挖掘的情況也是這樣。每次數(shù)據(jù)庫里面擴增全新的數(shù)據(jù),數(shù)據(jù)庫的規(guī)模會逐漸擴大,假如每次都對整個數(shù)據(jù)庫進行挖掘算法,那么會不斷降低挖掘的綜合效率。在擴增全新的數(shù)據(jù)后,假如可以充分、有效使用從前挖掘的知識,則就會有效提升挖掘的綜合效率。在此我們提出一個新型的關(guān)聯(lián)規(guī)則算法,這個算法重點是對頻繁項目集進行優(yōu)化的發(fā)現(xiàn)過程,它是按照從前發(fā)現(xiàn)的頻繁項目集以及數(shù)據(jù)庫里面新增的數(shù)據(jù)對原來的頻繁項目集進行動態(tài)更新。數(shù)據(jù)庫一直是按照時間先后順序持續(xù)地累積,在新型的算法中將數(shù)據(jù)按照時間先后順序?qū)嵤﹦澐?,新型的關(guān)聯(lián)規(guī)則算法是借助于如今擴增的數(shù)據(jù)集以及以前發(fā)現(xiàn)的頻繁項目集來獲得的,而無需考慮在這之前的全部數(shù)據(jù)集,提升了對新項目的挖掘效率以及敏感性。

2.2.2 頻繁項目集算法的優(yōu)化

導(dǎo)入?yún)?shù)c(1≤c≤∞),在以前的數(shù)據(jù)集中進一步發(fā)現(xiàn)頻繁項集的整個過程中,將那些支持度等于或者大于(最小支持度/c)的頻繁項目集保留下來,每次數(shù)據(jù)庫中擴增全新的數(shù)據(jù)集的時候,僅考慮如今擴增的數(shù)據(jù)集以及從前產(chǎn)生的支持度等于或者大于最小支持度/c的頻繁項集,因為數(shù)據(jù)庫規(guī)模的持續(xù)擴大,而項目卻在相對比較穩(wěn)定地增加,掃描支持度等于或者大于(最小支持度/c)的頻繁項目集的時間要進一步短于掃描整個舊數(shù)據(jù)集的時間,如此可以更及時、有效地發(fā)現(xiàn)頻繁項目集。

3 公安情報分析系統(tǒng)的創(chuàng)建

為了以后在公安情報分析工作中大力推廣這些數(shù)據(jù)挖掘的相關(guān)方法,一定要創(chuàng)建一個“公安情報分析數(shù)據(jù)挖掘系統(tǒng)”,借助于這個系統(tǒng)選取適合充分挖掘數(shù)據(jù)類型的有關(guān)算法,直接開展數(shù)據(jù)分析。然后人工優(yōu)化以及補充數(shù)據(jù),深入優(yōu)化算法,就可以確保整個系統(tǒng)的有效性以及平穩(wěn)性,可以借助于數(shù)據(jù)挖掘技術(shù)來不斷挖掘犯罪信息,可以對我們的情報分析進行持續(xù)優(yōu)化,使偵破案件的綜合速度以及效率獲得提升,有效降低人力資源的耗損。

4 結(jié)束語

總而言之,社會經(jīng)濟正在飛速發(fā)展,信息化時代全面來臨。公安機關(guān)作為政府部門的核心管理單位,進一步影響以及制約了社會的每個層面。公安工作要跟上時代發(fā)展的步伐,創(chuàng)建以及完善情報分析信息機構(gòu),借助于數(shù)據(jù)挖掘技術(shù),使公安的信息化水平獲得充分提高,承擔起公安機關(guān)在社會主義建設(shè)中的核心責(zé)任。

猜你喜歡
決策樹公安數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
“老公安”的斂財“利器”
Frequent attacks on health workers in China: social changes or historical origins?
一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機森林方法在管理決策中的應(yīng)用
“10歲當公安”為何能暢通無阻
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
公安報道要有度
基于決策樹的出租車乘客出行目的識別
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用