国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

公安數(shù)據(jù)挖掘分析實(shí)戰(zhàn)與教學(xué)實(shí)踐探析

2020-04-27 02:55徐建峰
關(guān)鍵詞:公安數(shù)據(jù)挖掘算法

楊 杰 徐建峰 李 睿

一、背景

數(shù)據(jù)挖掘分析一般是指從大量的數(shù)據(jù)中搜索信息、提煉知識(shí)的過程,其常用的方法包括信息檢索、統(tǒng)計(jì)分析、機(jī)器學(xué)習(xí)等。隨著公安信息化的發(fā)展,公安機(jī)關(guān)利用大數(shù)據(jù)進(jìn)行挖掘分析,實(shí)現(xiàn)尋線追蹤、打擊處置、預(yù)測預(yù)警已成為趨勢。公安警種部門多個(gè)業(yè)務(wù)崗位的工作都與數(shù)據(jù)挖掘分析密切相關(guān)①趙曉凡:《公安高等院校數(shù)據(jù)挖掘課程教改研究》,《計(jì)算機(jī)教育》2018第1期。,培養(yǎng)熟練掌握數(shù)據(jù)挖掘分析技能的警務(wù)人才、在公安院校中建設(shè)好相關(guān)學(xué)科體系,已成為新時(shí)代公安工作創(chuàng)新發(fā)展的迫切需要。目前,針對(duì)數(shù)據(jù)挖掘分析課程教學(xué)改革的探討有:邱明月等通過分析培養(yǎng)公安創(chuàng)新人才的課程教學(xué)、實(shí)訓(xùn)及能力訓(xùn)練,設(shè)計(jì)了符合網(wǎng)絡(luò)信息資源要求的公安數(shù)據(jù)挖掘能力培養(yǎng)方案②邱明月、唐松澤:《基于互聯(lián)網(wǎng)資源的公安數(shù)據(jù)挖掘能力培養(yǎng)研究》,《信息與電腦》2018第19期。;張?jiān)拼旱纫哉n堂教學(xué)和項(xiàng)目實(shí)踐相結(jié)合的方式推進(jìn)數(shù)據(jù)挖掘課程在大數(shù)據(jù)環(huán)境下的教學(xué)和實(shí)踐③張?jiān)拼旱龋骸痘贛OOC嵌入式教學(xué)的數(shù)據(jù)挖掘教學(xué)改革初探》,《計(jì)算機(jī)教育》2015年第13期。;張艷等針對(duì)大數(shù)據(jù)的特點(diǎn),以構(gòu)建課程核心知識(shí)體系為主題,采用案例教學(xué)法改革傳統(tǒng)的教學(xué)評(píng)價(jià)方式④張艷:《大數(shù)據(jù)背景下的數(shù)據(jù)挖掘課程教學(xué)新思考》,《計(jì)算機(jī)時(shí)代》2014年第4期。;李海林等從培養(yǎng)數(shù)據(jù)意識(shí)、加強(qiáng)理論體系、創(chuàng)新教學(xué)方法和深入科學(xué)研究等四個(gè)方面探索設(shè)計(jì)高校數(shù)據(jù)挖掘課程,以解決大數(shù)據(jù)挖掘課程因過于抽象而產(chǎn)生的問題⑤李海林:《大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘課程教學(xué)探索》,《計(jì)算機(jī)時(shí)代》2014年第2期。。本文結(jié)合公安實(shí)戰(zhàn)應(yīng)用需求及相關(guān)技術(shù)要求,從典型的大數(shù)據(jù)挖掘分析方法出發(fā),探討與公安院校數(shù)據(jù)挖掘分析教學(xué)實(shí)踐密切相關(guān)的一些問題。

二、主要的數(shù)據(jù)挖掘分析方法

數(shù)據(jù)挖掘分析是為了提取有用信息并形成結(jié)論而對(duì)數(shù)據(jù)進(jìn)行詳細(xì)研究和概括總結(jié)的過程。在警務(wù)工作中,數(shù)據(jù)挖掘分析主要包括根據(jù)線索特征找到嫌疑對(duì)象,通過數(shù)據(jù)統(tǒng)計(jì)總結(jié)出目標(biāo)對(duì)象的行為規(guī)律、群體分布特性,以及通過機(jī)器學(xué)習(xí)方法預(yù)測警情、案事件的發(fā)生概率及趨勢等,并通過預(yù)警指令、專題報(bào)告等形式,賦能民警精準(zhǔn)打擊,輔助領(lǐng)導(dǎo)決策指揮。根據(jù)應(yīng)用場景和技術(shù)實(shí)現(xiàn)的難易程度,結(jié)合筆者多年的工作經(jīng)驗(yàn),我們將公安機(jī)關(guān)數(shù)據(jù)挖掘分析方法總結(jié)為查詢比對(duì)、規(guī)則判別、算術(shù)統(tǒng)計(jì)、和預(yù)測預(yù)警等四個(gè)類別,具體如表1所示。

表1 公安機(jī)關(guān)數(shù)據(jù)挖掘分析方法主要分類

目前公安工作中進(jìn)行數(shù)據(jù)挖掘分析的主要“工具”包括SQL、機(jī)器學(xué)習(xí)算法和關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)組件等。上述方法中,前三個(gè)類別主要是基于關(guān)系型數(shù)據(jù)庫、大數(shù)據(jù)組件等,通過SQL開發(fā)進(jìn)行數(shù)據(jù)分析應(yīng)用,最后一類主要是基于機(jī)器學(xué)習(xí)算法和大數(shù)據(jù)組件通過深度開發(fā)分析模型開展應(yīng)用。

(一)查詢比對(duì)

在數(shù)據(jù)挖掘分析中,查詢檢索、比對(duì)布控類應(yīng)用,主要基于給定的 ID或確定的關(guān)鍵詞等線索數(shù)據(jù),與各類動(dòng)態(tài)數(shù)據(jù)特別是軌跡類數(shù)據(jù)進(jìn)行值比較,并按要求將匹配比中的數(shù)據(jù)返回給用戶。

實(shí)現(xiàn)方法主要是基于SQL的結(jié)構(gòu)化等值比較,將比對(duì)條件放在WHERE子句中,并結(jié)合布爾運(yùn)算,通過內(nèi)連接、外連接、交叉連接等運(yùn)算機(jī)制,構(gòu)成有復(fù)合搜索條件的SELECT語句,此類方法常用于一鍵搜索、在逃人員比對(duì)布控等業(yè)務(wù)應(yīng)用場景。

(二)規(guī)則判別

相較于查詢比對(duì),規(guī)則判別類數(shù)據(jù)挖掘分析是更為復(fù)雜的數(shù)據(jù)比較,主要基于給定的業(yè)務(wù)規(guī)則進(jìn)行條件符合性篩查。通常是由多個(gè)判別條件組合嵌套形成SQL語句中的復(fù)合搜索條件。其分析過程多用以下運(yùn)算符:

1.等值之外的值比較運(yùn)算符,如!=,>=,in,between等;

2.模糊查詢like,結(jié)合通配符%,_,[]等;

3.條件組合運(yùn)算符,如AND、OR、NOT等。

此類數(shù)據(jù)挖掘分析主要是根據(jù)業(yè)務(wù)規(guī)則篩選出符合條件的目標(biāo)對(duì)象集合,如盜竊案件潛在嫌疑人、通訊網(wǎng)絡(luò)詐騙易受害人群等。具體實(shí)現(xiàn)過程中,主要是將嫌疑人或受害人的自然屬性、嫌疑特征或受害特征等屬性條件逐條轉(zhuǎn)換為對(duì)應(yīng)業(yè)務(wù)規(guī)則,然后基于上述規(guī)則組合,對(duì)相關(guān)數(shù)據(jù)表進(jìn)行關(guān)聯(lián)查詢和條件比較,符合規(guī)則數(shù)越多則嫌疑度或易被侵害度越高。最終輸出的結(jié)果將提供給研判人員進(jìn)行二次甄別篩選,并確定是否采取進(jìn)一步的行動(dòng)措施。

(三)算術(shù)統(tǒng)計(jì)

算術(shù)統(tǒng)計(jì)類數(shù)據(jù)挖掘分析主要是基于給定條件對(duì)數(shù)據(jù)進(jìn)行規(guī)模量計(jì)數(shù)統(tǒng)計(jì),或是基礎(chǔ)性計(jì)算統(tǒng)計(jì),運(yùn)算過程中通常要用到SQL的分組函數(shù)和聚合函數(shù),實(shí)現(xiàn)對(duì)數(shù)據(jù)表中數(shù)據(jù)的加、減、乘、除和計(jì)數(shù)、極值、均值等簡單計(jì)算。常見的聚合函數(shù)有AVG、COUNT、MAX、MIN、SUM等,可以組合起來使用。分組由GROUP BY子句實(shí)現(xiàn),通過歸納信息類型實(shí)現(xiàn)相關(guān)數(shù)據(jù)匯總。條件控制由HAVING子句實(shí)現(xiàn),通過條件符合性比較篩選出相應(yīng)結(jié)果。以同行人員分析為例,通常同出行一定次數(shù)以上的人員聯(lián)系較為緊密,具體實(shí)現(xiàn)過程如下:

步驟一:從多種來源的軌跡類數(shù)據(jù)中提取相應(yīng)的數(shù)據(jù)記錄;

步驟二:按照給定條件,對(duì)數(shù)據(jù)記錄中人員同行次數(shù)進(jìn)行計(jì)數(shù)統(tǒng)計(jì);

步驟三:根據(jù)步驟二的計(jì)數(shù)統(tǒng)計(jì)結(jié)果,按照給定的閾值篩選出高密度同行人員。

算術(shù)統(tǒng)計(jì)類的數(shù)據(jù)挖掘分析主要應(yīng)用于對(duì)象群體的時(shí)空規(guī)律分析,如同伙軌跡伴隨、類案時(shí)空分布等。

(四)預(yù)測預(yù)警

預(yù)測預(yù)警類數(shù)據(jù)挖掘分析是實(shí)踐中難度最高的一類,通常是基于機(jī)器學(xué)習(xí)算法實(shí)現(xiàn),主要有聚類、分類、回歸、關(guān)聯(lián)規(guī)則等。不同類型的算法具有不同的特性,適用于不同的業(yè)務(wù)場景。以聚類算法為例,其主要運(yùn)算過程是按內(nèi)在相似性將數(shù)據(jù)集劃分為多個(gè)類別,使類別內(nèi)的數(shù)據(jù)相似度較大而類別間的數(shù)據(jù)相似度較小,本質(zhì)上是通過對(duì)無標(biāo)記數(shù)據(jù)的學(xué)習(xí)來揭示數(shù)據(jù)的內(nèi)在性質(zhì)及規(guī)律。最為常見的是K均值(K-means)聚類算法,其通過“距離”衡量數(shù)據(jù)間的相似度,應(yīng)用時(shí)需預(yù)設(shè)聚類結(jié)果類別的個(gè)數(shù)。算法的基本步驟為:

步驟三:將每個(gè)類別中心更新為隸屬該類別的所有樣本的均值

步驟四:判斷是否滿足終止條件。常用的終止條件有迭代次數(shù)、簇中心變化率、最小平方誤差等。

步驟五:若滿足終止條件,聚類結(jié)束;否則,跳轉(zhuǎn)到步驟二,重復(fù)執(zhí)行,直到滿足終止條件。

基于機(jī)器學(xué)習(xí)算法的數(shù)據(jù)挖掘分析主要用于警情預(yù)測、軌跡預(yù)測、風(fēng)險(xiǎn)預(yù)測等應(yīng)用場景。以盜竊慣犯的預(yù)測分析為例,可將最近一次無違法行為天數(shù)(即從最近一次接受處罰期滿釋放以來未出現(xiàn)新案件的時(shí)長)、年均盜竊次數(shù)、年均盜竊金額等特征屬性作為輸入維度,利用 K-means算法進(jìn)行聚類分析,得出與已知慣犯處于同一類的盜竊嫌疑人員。具體實(shí)踐過程中,在得到聚類結(jié)果的基礎(chǔ)上,還需對(duì)聚類結(jié)果進(jìn)行二次研判,以進(jìn)一步確定盜竊嫌疑人員的作案可能性。

三、數(shù)據(jù)挖掘分析的教學(xué)實(shí)踐

(一)數(shù)據(jù)挖掘分析教學(xué)中的主要問題

隨著數(shù)據(jù)挖掘分析對(duì)公安信息化應(yīng)用工作的重要性越來越大,要培養(yǎng)符合公安實(shí)戰(zhàn)要求的數(shù)據(jù)挖掘分析人才,公安院校必須在數(shù)據(jù)挖掘分析的課程設(shè)置、教學(xué)方式、實(shí)踐設(shè)計(jì)、教學(xué)管理等方面不斷進(jìn)行改進(jìn)和創(chuàng)新。鑒于數(shù)據(jù)挖掘分析是一個(gè)多學(xué)科交叉的綜合業(yè)務(wù)領(lǐng)域,特別是在公安機(jī)關(guān)應(yīng)用的時(shí)間不長,且領(lǐng)域內(nèi)新的技術(shù)理論發(fā)展迅猛,理解和掌握數(shù)據(jù)挖掘分析并不是一件容易的事。據(jù)初步調(diào)研,公安院校相關(guān)課程教學(xué)普遍存在以下難點(diǎn)和問題:

一是起點(diǎn)高、難度大。數(shù)據(jù)挖掘分析課程內(nèi)容涉及領(lǐng)域廣泛,包括統(tǒng)計(jì)學(xué)、數(shù)據(jù)庫、機(jī)器學(xué)習(xí)、模式識(shí)別等內(nèi)容,且所涉及的算法繁多。公安院校主要為本科層次教育,一般很少專門開設(shè)數(shù)據(jù)挖掘的課程,所以理論基礎(chǔ)相對(duì)薄弱,學(xué)習(xí)難度較大。

二是重算法、輕實(shí)踐。數(shù)據(jù)挖掘分析是數(shù)據(jù)獲取、數(shù)據(jù)整理、預(yù)處理、挖掘分析、結(jié)果分析等一系列流程的綜合,相關(guān)教學(xué)通常以高等數(shù)學(xué)算法為課程主體內(nèi)容。在具體實(shí)踐中,一方面,計(jì)數(shù)、求和、差值、極值、均值等簡單算術(shù)運(yùn)算覆蓋了當(dāng)前業(yè)務(wù)應(yīng)用的大部分?jǐn)?shù)據(jù)分析場景及具體分析模型;另一方面,數(shù)據(jù)預(yù)處理的時(shí)間往往占到工作量的 70%以上,且預(yù)處理的質(zhì)量很大程度上影響后續(xù)挖掘分析的結(jié)果。

三是缺實(shí)景、少案例。承擔(dān)數(shù)據(jù)分析教學(xué)的教師很少有機(jī)會(huì)直接參加公安機(jī)關(guān)實(shí)際應(yīng)用的數(shù)據(jù)分析模型的設(shè)計(jì)和開發(fā),實(shí)戰(zhàn)經(jīng)驗(yàn)不足;課堂教學(xué)中所用的案例大多數(shù)來自參考書籍,跟警務(wù)工作實(shí)際相關(guān)的少之又少。

(二)數(shù)據(jù)挖掘分析教學(xué)工作的完善

針對(duì)上述問題,筆者結(jié)合公安機(jī)關(guān)開展數(shù)據(jù)挖掘分析應(yīng)用常用的四類典型方法,嘗試探討公安院校做好數(shù)據(jù)挖掘分析教學(xué)的關(guān)鍵突破口。

一是有的放矢,完善課程體系。公安機(jī)關(guān)開展數(shù)據(jù)挖掘分析通常要解決的問題包括:主體身份的確定、時(shí)間和空間的確定、行為方式和習(xí)慣以及參與人員等內(nèi)容的確定。就上述四類典型應(yīng)用方法而言,前三類在實(shí)際應(yīng)用中占據(jù)了當(dāng)前公安機(jī)關(guān)數(shù)據(jù)挖掘分析需求的絕大部分。因此,具體的教學(xué)活動(dòng)要強(qiáng)化關(guān)系代數(shù)、組合數(shù)學(xué)等課程的設(shè)置和教學(xué),讓學(xué)生熟練掌握關(guān)系代數(shù)和組合數(shù)學(xué)的基本運(yùn)算操作,理解其數(shù)學(xué)含義;要強(qiáng)化SQL語言開發(fā)課程的教學(xué),讓學(xué)生熟練掌握SQL語法和常用的比較操作、統(tǒng)計(jì)函數(shù)等;要加大機(jī)器學(xué)習(xí)算法課程開設(shè)力度,強(qiáng)化數(shù)學(xué)基礎(chǔ)學(xué)習(xí)和案例分析,為開展數(shù)據(jù)深度分析儲(chǔ)備知識(shí)、積累經(jīng)驗(yàn)。

二是注重實(shí)踐,錘煉數(shù)據(jù)能力。在開展上述課程教學(xué)的同時(shí),要注重案例分析實(shí)踐,培養(yǎng)鍛煉學(xué)生根據(jù)不同場景條件選用合適分析方法的能力。當(dāng)目標(biāo)對(duì)象明確時(shí),可以基于等值比較查詢檢索相關(guān)信息;當(dāng)給定條件模糊時(shí),則可選用規(guī)則判別方法進(jìn)行分析;當(dāng)需要研判與特定對(duì)象有時(shí)空伴隨現(xiàn)象的未知對(duì)象時(shí),則需要應(yīng)用算術(shù)統(tǒng)計(jì)的分析方法;當(dāng)需要預(yù)判某地將來一段時(shí)間的警情發(fā)生情況時(shí),可采用機(jī)器學(xué)習(xí)中的回歸分析等方法進(jìn)行分析。此外,要做好數(shù)據(jù)挖掘分析教學(xué),還需要提高數(shù)據(jù)挖掘分析實(shí)踐課程的比例,提升學(xué)生數(shù)據(jù)處理和數(shù)據(jù)準(zhǔn)備的能力。熟悉數(shù)據(jù)內(nèi)容、熟練掌握方法、選擇適用方法,這些都是較好地完成數(shù)據(jù)挖掘分析工作任務(wù)的必備要素。針對(duì)機(jī)器學(xué)習(xí)算法知識(shí)難度大的問題,可以選擇合適的分析工具,依托可視化建模拖拽、參數(shù)設(shè)置等功能組件,實(shí)現(xiàn)算法的自定義配置應(yīng)用,從而降低學(xué)習(xí)門檻。

三是任務(wù)驅(qū)動(dòng),興趣引領(lǐng)教學(xué)。建立由任務(wù)驅(qū)動(dòng)的數(shù)據(jù)挖掘分析教學(xué)實(shí)踐流程①黃劍:《任務(wù)驅(qū)動(dòng)探究式教學(xué)模式在數(shù)據(jù)挖掘課程中的應(yīng)用研究》,《電腦知識(shí)與技術(shù)》2014年第6期。,探索形成以學(xué)生為主體、教師為主導(dǎo)的交互式、嵌入式教學(xué)方式。具體實(shí)踐中,可以結(jié)合公安實(shí)戰(zhàn)任務(wù),突出實(shí)踐和討論交流,將數(shù)據(jù)挖掘分析工作流程,分解成若干子任務(wù),設(shè)定階段性任務(wù)目標(biāo),由老師輔導(dǎo)、學(xué)生自主執(zhí)行,激發(fā)學(xué)生學(xué)習(xí)興趣,提升學(xué)習(xí)動(dòng)力,培養(yǎng)分析和解決問題的能力,改變以往純理論單向灌輸?shù)慕虒W(xué)方式,將理論知識(shí)講解和實(shí)踐任務(wù)有機(jī)結(jié)合起來。考慮到數(shù)據(jù)挖掘分析的連貫性以及整體課程的工程龐大性,可以以項(xiàng)目化的方式加以推進(jìn),并將整個(gè)項(xiàng)目分解成數(shù)據(jù)收集、數(shù)據(jù)處理、探索性分析、挖掘分析、結(jié)果分析、報(bào)告撰寫等一系列小任務(wù),安排好階段目標(biāo),有序推進(jìn),逐步建立學(xué)生完成小任務(wù)的信心并最終高效完成項(xiàng)目,掌握數(shù)據(jù)挖掘分析實(shí)戰(zhàn)應(yīng)用技能。老師要及時(shí)跟進(jìn)了解學(xué)生階段性任務(wù)完成情況,全流程做好任務(wù)進(jìn)度控制,對(duì)學(xué)生遇到的困難及時(shí)給出意見建議,對(duì)難點(diǎn)給予技術(shù)支持,引導(dǎo)學(xué)生自主完成教學(xué)項(xiàng)目。

四、結(jié)束語

近年來,隨著公安信息化建設(shè)應(yīng)用的升級(jí)提速,公安機(jī)關(guān)已經(jīng)建立了較為完整的大數(shù)據(jù)資源體系。不斷從這些大數(shù)據(jù)中快速挖掘分析出高價(jià)值情報(bào)線索以有效、精準(zhǔn)服務(wù)公安工作現(xiàn)實(shí)需要,已成為公安機(jī)關(guān)技術(shù)能力建設(shè)的迫切需求。數(shù)據(jù)挖掘分析所涉學(xué)科眾多,作為公安人才隊(duì)伍培養(yǎng)的主陣地,公安院校的相關(guān)課程建設(shè)完善迫在眉睫。我們認(rèn)為,公安院校數(shù)據(jù)挖掘分析教學(xué)設(shè)計(jì)應(yīng)該重點(diǎn)突出實(shí)踐環(huán)節(jié),合理規(guī)劃數(shù)學(xué)理論和實(shí)踐部分的比例,突出數(shù)據(jù)挖掘分析的大數(shù)據(jù)環(huán)境,強(qiáng)化數(shù)據(jù)挖掘技術(shù)在警務(wù)工作中的應(yīng)用,為不斷提升公安機(jī)關(guān)的情報(bào)洞察能力、分析決策能力、指揮管理能力、偵查破案能力和服務(wù)社會(huì)能力提供可持續(xù)的智力支持。

猜你喜歡
公安數(shù)據(jù)挖掘算法
博物館:上海公安史圖片展
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
Frequent attacks on health workers in China: social changes or historical origins?
基于MapReduce的改進(jìn)Eclat算法
Travellng thg World Full—time for Rree
進(jìn)位加法的兩種算法
“10歲當(dāng)公安”為何能暢通無阻
一種改進(jìn)的整周模糊度去相關(guān)算法
一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
亚东县| 镇赉县| 九龙县| 博野县| 斗六市| 高要市| 保定市| 虞城县| 洛南县| 桦甸市| 汨罗市| 墨江| 全椒县| 揭阳市| 蓬溪县| 黎平县| 深泽县| 怀来县| 察哈| 乌苏市| 巩留县| 呈贡县| 剑阁县| 阳山县| 长宁区| 离岛区| 威宁| 巴东县| 满城县| 冕宁县| 拜泉县| 开远市| 江阴市| 大荔县| 闻喜县| 万宁市| 新平| 前郭尔| 绥化市| 平阳县| 新民市|