陳 鵬
中國人民公安大學(xué) 警務(wù)信息工程與網(wǎng)絡(luò)安全學(xué)院,北京 100038
物聯(lián)網(wǎng)、云計算、大數(shù)據(jù)等技術(shù)的快速發(fā)展使人們由信息時代進(jìn)入了數(shù)據(jù)時代。當(dāng)下,數(shù)據(jù)無處不在,萬事萬物皆可被感知,產(chǎn)生了難以計數(shù)的海量信息,而這些海量信息又進(jìn)一步為人們理解社會運行從而更好地管理社會提供了難得的機(jī)遇,由此催生了數(shù)據(jù)科學(xué)的誕生。數(shù)據(jù)科學(xué)是一門新興的學(xué)科,也是一個交叉的領(lǐng)域,其研究的是具體的方法、過程和系統(tǒng),從不同形式的數(shù)據(jù)(包括結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù))中抽取知識,以獲得對客觀事物的理解和洞察[1]。近年來,隨著各行各業(yè)對數(shù)據(jù)分析依賴性的增強(qiáng),對數(shù)據(jù)分析人才的需求也出現(xiàn)井噴之勢。2016年,教育部發(fā)布的《2015年普通高等學(xué)校本科專業(yè)備案和審批結(jié)構(gòu)》中首次增設(shè)了數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè),北京大學(xué)、對外經(jīng)濟(jì)貿(mào)易大學(xué)等高校率先設(shè)立了數(shù)據(jù)科學(xué)專業(yè)。2017年,設(shè)置數(shù)據(jù)科學(xué)專業(yè)的高校增加至32所,截至2018年,獲批設(shè)立數(shù)據(jù)科學(xué)與大數(shù)據(jù)專業(yè)的高校已達(dá)到283所[2]。數(shù)據(jù)科學(xué)已成為當(dāng)前最受歡迎的專業(yè)之一。
公安行業(yè)是一個數(shù)據(jù)密集型行業(yè),經(jīng)過十余年來“金盾工程”“平安城市”“雪亮工程”的建設(shè),公安行業(yè)已初步形成了覆蓋社會面的安全態(tài)勢感知體系和數(shù)據(jù)管理與應(yīng)用體系,并在治安防控、偵查辦案、社會管理、服務(wù)民生、隊伍管理等方面發(fā)揮了巨大的作用[3]。但是,由于公安工作自身特有的行業(yè)特殊性,使得公安工作的數(shù)據(jù)分析有著與其他行業(yè)不同的特點。公安工作任務(wù)包括維護(hù)社會穩(wěn)定、防控和打擊各類違法犯罪活動、服務(wù)社會等多個方面,因此,公安工作的數(shù)據(jù)分析就是要為指揮、情報、偵查等相關(guān)業(yè)務(wù)方向提供包括時空態(tài)勢分析、異常行為識別、非結(jié)構(gòu)化數(shù)據(jù)快速檢索等多個方面的服務(wù)。然而,從現(xiàn)有的國內(nèi)外高校的數(shù)據(jù)科學(xué)專業(yè)課程設(shè)置及其人才培養(yǎng)的目標(biāo)來看,其大多數(shù)服務(wù)于各類工業(yè)和商業(yè)領(lǐng)域的數(shù)據(jù)分析與應(yīng)用,缺少適應(yīng)和滿足公安工作的數(shù)據(jù)科學(xué)專業(yè)設(shè)計與建設(shè)。
為此,本文通過調(diào)查和總結(jié)國內(nèi)外高等院校的數(shù)據(jù)科學(xué)專業(yè)課程體系與人才培養(yǎng)模式,梳理數(shù)據(jù)分析人才培養(yǎng)的一般規(guī)律,并針對公安工作數(shù)據(jù)分析人才的需求,分析并探討公安院校的數(shù)據(jù)科學(xué)專業(yè)課程體系構(gòu)成。
目前,在已設(shè)置數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)專業(yè)的國內(nèi)外高校中,對人才培養(yǎng)的目標(biāo)與方向大致可分為數(shù)據(jù)科學(xué)家、數(shù)據(jù)工程師和數(shù)據(jù)分析師三個類型[4]。其中,數(shù)據(jù)科學(xué)家要能夠?qū)Υ髷?shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)新問題,并且能在現(xiàn)有算法和模型的基礎(chǔ)上構(gòu)建新的算法和模型來解決新的問題;數(shù)據(jù)工程師要能夠?qū)?shù)據(jù)進(jìn)行清洗、整合、管理,為數(shù)據(jù)科學(xué)家或數(shù)據(jù)分析師的工作提供所要分析的數(shù)據(jù);數(shù)據(jù)分析師要能夠利用已有的算法、模型、計算框架、軟件工具等圍繞著特定的任務(wù)目標(biāo)開展數(shù)據(jù)分析,但不要求對數(shù)據(jù)算法或模型進(jìn)行改進(jìn)[4]?,F(xiàn)有的數(shù)據(jù)科學(xué)專業(yè)根據(jù)上述三類人才培養(yǎng)目標(biāo),已形成層次分明、目標(biāo)明確的人才培養(yǎng)體系。其中,數(shù)據(jù)科學(xué)家要求具有較高的創(chuàng)新能力,是數(shù)據(jù)分析的基礎(chǔ)理論、算法模型等領(lǐng)域的創(chuàng)新性人才,致力于解決數(shù)據(jù)分析中未知的基礎(chǔ)性問題。數(shù)據(jù)工程師要求有著很強(qiáng)的工程實踐能力,其定位為解決實際應(yīng)用中的數(shù)據(jù)采集、存儲、運維、管理、治理等工程性問題,致力于為大型數(shù)據(jù)分析項目提供框架性的解決方案。數(shù)據(jù)分析師則要求具有行業(yè)應(yīng)用能力,其定位為利用數(shù)據(jù)分析算法和模型解決具體場景下的應(yīng)用問題,致力于為行業(yè)決策提供數(shù)據(jù)分析基礎(chǔ)支撐[4]。
在具體數(shù)據(jù)科學(xué)人才培養(yǎng)模式上,國內(nèi)外相關(guān)高等院校均十分重視與某些專業(yè)領(lǐng)域的緊密結(jié)合。如美國哥倫比亞大學(xué)的數(shù)據(jù)科學(xué)專業(yè)目標(biāo)定位為培養(yǎng)數(shù)據(jù)科學(xué)家,但在具體的培養(yǎng)方案上除了要求學(xué)生掌握計算機(jī)科學(xué)、統(tǒng)計學(xué)等基礎(chǔ)知識外,還要在線學(xué)習(xí)金融、醫(yī)療、市場營銷等領(lǐng)域的數(shù)據(jù)分析工具的應(yīng)用[5-6]。復(fù)旦大學(xué)在其數(shù)據(jù)科學(xué)家培養(yǎng)項目中不僅要求學(xué)生掌握面向大數(shù)據(jù)應(yīng)用的數(shù)學(xué)、統(tǒng)計學(xué)、計算機(jī)科學(xué)等基礎(chǔ)理論,還要能夠勝任商務(wù)、金融、生物、醫(yī)藥等領(lǐng)域的大數(shù)據(jù)分析挖掘工作[3]。北京理工大學(xué)明確提出要培養(yǎng)具有國際視野的大數(shù)據(jù)系統(tǒng)架構(gòu)師、算法設(shè)計師和分析師三類人才,但在具體的培養(yǎng)環(huán)節(jié)上也設(shè)置了面向其他專業(yè)領(lǐng)域的應(yīng)用分析環(huán)節(jié),解決包括智慧城市、醫(yī)療和空間大數(shù)據(jù)等領(lǐng)域中的應(yīng)用問題[1]。
在課程設(shè)置上,通過對國內(nèi)外設(shè)置數(shù)據(jù)科學(xué)專業(yè)院校的課程體系進(jìn)行歸納,其課程設(shè)置大體可分為基礎(chǔ)理論、數(shù)據(jù)計算、數(shù)據(jù)分析、領(lǐng)域應(yīng)用和擴(kuò)展等幾大類[5]。
1.基礎(chǔ)理論類課程。這類課程主要介紹正式學(xué)習(xí)數(shù)據(jù)科學(xué)前的預(yù)備知識,是數(shù)據(jù)科學(xué)專業(yè)的先修環(huán)節(jié),為后面的數(shù)據(jù)科學(xué)知識學(xué)習(xí)奠定基礎(chǔ),一般由“數(shù)據(jù)科學(xué)概論”等先導(dǎo)課以及數(shù)學(xué)和計算機(jī)類基礎(chǔ)課組成[5],如“概率論與統(tǒng)計學(xué)”“線性代數(shù)”“隨機(jī)過程”“計算機(jī)原理”“數(shù)據(jù)結(jié)構(gòu)”“程序設(shè)計”等課程。
2.數(shù)據(jù)計算類課程。這類課程主要介紹大數(shù)據(jù)環(huán)境下計算技術(shù)、環(huán)境、工具與平臺,使學(xué)生能夠掌握Hadoop、Mapreduce、Spark、Storm等基本的大數(shù)據(jù)處理框架和技術(shù),培養(yǎng)其大數(shù)據(jù)工程化能力[4-5],如“物聯(lián)網(wǎng)技術(shù)”“云計算技術(shù)”“數(shù)據(jù)管理”“數(shù)據(jù)存儲與檢索”“計算機(jī)網(wǎng)絡(luò)”等課程。
3.數(shù)據(jù)分析類課程。這類課程主要介紹數(shù)據(jù)分析的基本技術(shù)與方法,特別是大數(shù)據(jù)分析技術(shù),旨在培養(yǎng)學(xué)生的數(shù)據(jù)分析能力和對數(shù)據(jù)的洞察能力[5],如“數(shù)據(jù)挖掘”“機(jī)器學(xué)習(xí)”“高級機(jī)器學(xué)習(xí)”“神經(jīng)網(wǎng)絡(luò)與深度學(xué)習(xí)”等課程。
4.領(lǐng)域應(yīng)用類課程。這類課程主要介紹數(shù)據(jù)分析技術(shù)在行業(yè)的實踐應(yīng)用,如“數(shù)據(jù)驅(qū)動醫(yī)學(xué)”“基于大數(shù)據(jù)的商務(wù)智能”“社會管理與分析”“金融與經(jīng)濟(jì)數(shù)據(jù)分析”“輿情大數(shù)據(jù)分析”等課程。
5.擴(kuò)展類課程。這類課程主要講解數(shù)據(jù)科學(xué)中涉及的一些人文和社會類知識,包括與數(shù)據(jù)應(yīng)用和數(shù)據(jù)分析有關(guān)的道德、隱私、法律、社會影響等方面的課程[5]。
公安高等院校作為公安行業(yè)的高等教育機(jī)構(gòu),其主要職能是為公安行業(yè)培養(yǎng)能夠適應(yīng)公安工作要求、能夠遂行公安工作任務(wù)的高水平專業(yè)人才。近20年來,隨著以“金盾工程”為代表的一系列公安信息化項目建設(shè)的不斷實施和推進(jìn),公安機(jī)關(guān)從傳統(tǒng)的汗水警務(wù)向情報警務(wù)乃至數(shù)據(jù)警務(wù)迅速轉(zhuǎn)變,無論是偵查辦案、治安防控、社會管理還是服務(wù)民生等業(yè)務(wù)方向都形成了較為完整的數(shù)據(jù)環(huán)境和數(shù)據(jù)體系,帶動了公安工作效率和戰(zhàn)斗力的極大提升。然而與此同時,隨著公安工作的數(shù)據(jù)采集、管理和應(yīng)用的不斷發(fā)展,對專業(yè)人才的需求也與日俱增。從目前來看,公安機(jī)關(guān)對數(shù)據(jù)人才的需求主要集中在兩個層面:一是面向業(yè)務(wù)基礎(chǔ)數(shù)據(jù),包括感知端、移動端和平臺端的數(shù)據(jù)采集、傳輸、存儲和管理;二是面向各個具體業(yè)務(wù)方向包括刑偵、經(jīng)偵、反恐、禁毒、國保、內(nèi)保、治安、交管、指揮、情報等專業(yè)部門的業(yè)務(wù)數(shù)據(jù)分析。從這兩個層面的人才需求類型來看,前者對人才的需求更側(cè)重于數(shù)據(jù)工程師,其能力要求為熟悉不同類型的數(shù)據(jù)采集和傳輸技術(shù)、海量數(shù)據(jù)管理和檢索技術(shù),能夠根據(jù)業(yè)務(wù)需求設(shè)計相應(yīng)的數(shù)據(jù)采集、存儲和管理解決方案并組織實現(xiàn);后者更側(cè)重于數(shù)據(jù)分析師,其能力要求為熟悉具體的業(yè)務(wù)流程和業(yè)務(wù)數(shù)據(jù)庫系統(tǒng),能夠運用各類算法、模型和軟件工具開展業(yè)務(wù)數(shù)據(jù)的分析,為業(yè)務(wù)工作提供情報支撐。因此,從公安高等院校設(shè)置數(shù)據(jù)科學(xué)專業(yè)、培養(yǎng)數(shù)據(jù)科學(xué)人才的必要性和行業(yè)需求來看,其人才培養(yǎng)的目標(biāo)應(yīng)同時覆蓋數(shù)據(jù)工程師和數(shù)據(jù)分析師兩個方向。
根據(jù)公安高等院校數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)的目標(biāo)類型分析,將公安高等院校數(shù)據(jù)科學(xué)專業(yè)劃分為數(shù)據(jù)計算與數(shù)據(jù)分析兩個專業(yè)方向,并基于“教、學(xué)、練、戰(zhàn)一體化”的公安高等院校的人才培養(yǎng)模式和公安一線機(jī)關(guān)對警務(wù)專業(yè)類人才“一專多能”的需求,提出并設(shè)計兩個方向下的公安數(shù)據(jù)科學(xué)專業(yè)課程結(jié)構(gòu)體系如圖1所示。
圖1 公安高等院校數(shù)據(jù)科學(xué)專業(yè)課程體系結(jié)構(gòu)
1.專業(yè)基礎(chǔ)課程。專業(yè)基礎(chǔ)課程方面,應(yīng)以打好學(xué)生的數(shù)據(jù)科學(xué)基礎(chǔ)理論為目標(biāo),夯實學(xué)生從事數(shù)據(jù)科學(xué)的計算能力和分析能力[7]。數(shù)據(jù)計算專業(yè)方向應(yīng)重點設(shè)置計算機(jī)基礎(chǔ)方面的課程,數(shù)據(jù)分析專業(yè)方向應(yīng)重點設(shè)置數(shù)學(xué)原理方面的課程,如“數(shù)理統(tǒng)計”“隨機(jī)過程”“時間序列分析”“空間統(tǒng)計”“圖論”“模式識別”“程序設(shè)計”等課程。
2.專業(yè)必修課程。專業(yè)必修課程方面,應(yīng)以數(shù)據(jù)科學(xué)的專業(yè)技術(shù),包括計算框架、算法模型、分析方法為主,著重提升學(xué)生的應(yīng)用能力。其中數(shù)據(jù)計算專業(yè)方向應(yīng)重點設(shè)置包括“云計算原理”“物聯(lián)網(wǎng)技術(shù)”“數(shù)據(jù)管理”“計算機(jī)網(wǎng)絡(luò)”“NoSQL數(shù)據(jù)庫”“Hadoop技術(shù)架構(gòu)”等在內(nèi)的技術(shù)架構(gòu)類課程群[7];數(shù)據(jù)分析專業(yè)方向應(yīng)設(shè)置包括“數(shù)據(jù)倉庫原理”“數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)”“自然語言處理”“地理信息系統(tǒng)”“社會網(wǎng)絡(luò)分析”“數(shù)據(jù)可視化”“計算機(jī)視覺”等在內(nèi)的分析類課程群。
3.專業(yè)選修課程。專業(yè)選修課程應(yīng)以拓展學(xué)生的專業(yè)知識、提升學(xué)生的公安業(yè)務(wù)能力和數(shù)據(jù)的安全應(yīng)用與保護(hù)水平為主要目標(biāo)。數(shù)據(jù)計算和數(shù)據(jù)分析兩個專業(yè)方向均應(yīng)包括三類課程:一是公安業(yè)務(wù)通識課,主要為使學(xué)生掌握公安業(yè)務(wù)工作的基本知識,建立初步的業(yè)務(wù)概念體系,使學(xué)生充分了解當(dāng)前公安各業(yè)務(wù)方向的具體工作內(nèi)容,為開展公安數(shù)據(jù)應(yīng)用和分析實踐打下基礎(chǔ)。二是學(xué)科前沿課程,使學(xué)生更好地把握和了解數(shù)據(jù)科學(xué)的發(fā)展動態(tài),掌握前沿技術(shù)。要圍繞大數(shù)據(jù)計算框架技術(shù)、流數(shù)據(jù)處理技術(shù)等數(shù)據(jù)科學(xué)的前沿?zé)狳c理論及技術(shù)發(fā)展趨勢設(shè)置相應(yīng)的學(xué)科前沿課程。三是專業(yè)拓展課程,主要圍繞著數(shù)據(jù)安全性要求開設(shè)相應(yīng)的數(shù)據(jù)安全與法律類課程,如“數(shù)據(jù)保護(hù)技術(shù)”“公民隱私保護(hù)法律規(guī)范”等課程。
4.實踐拓展環(huán)節(jié)。在實踐課程設(shè)計上,可根據(jù)公安具體的業(yè)務(wù)場景設(shè)計相應(yīng)的實踐問題,著重鍛煉和培養(yǎng)學(xué)生運用知識解決實際問題的能力。數(shù)據(jù)計算專業(yè)方向可要求學(xué)生根據(jù)市縣級公安機(jī)關(guān)具體的業(yè)務(wù)工作需求,提出并設(shè)計相應(yīng)的數(shù)據(jù)采集、傳輸、存儲與計算解決方案等。數(shù)據(jù)分析專業(yè)方向可要求學(xué)生根據(jù)不同層級公安機(jī)關(guān)業(yè)務(wù)部門的情報工作需求,運用學(xué)習(xí)和掌握的數(shù)據(jù)分析方法,對具體業(yè)務(wù)部門的業(yè)務(wù)數(shù)據(jù)開展分析、研判和建模等實踐活動。
目前,在公安高等院校的專業(yè)體系中,已初步形成了數(shù)據(jù)科學(xué)專業(yè)建設(shè)的基礎(chǔ)。例如,中國人民公安大學(xué)在安全防范工程本科專業(yè)下設(shè)立了警務(wù)信息技術(shù)方向,重點教授公安工作中與數(shù)據(jù)應(yīng)用密切相關(guān)的知識和技能,包括警務(wù)指揮、數(shù)據(jù)分析研判、應(yīng)急通信保障、信息安全保障、信息對抗等[8]。但是,從現(xiàn)有的專業(yè)師資來看,尚無法滿足數(shù)據(jù)科學(xué)專業(yè)建設(shè)的需求。對此,可采取公安高等院校、大數(shù)據(jù)企業(yè)、公安機(jī)關(guān)三方聯(lián)合的方式整合與組建教學(xué)力量。一是公安高等院??赏ㄟ^校外人才引進(jìn)、校內(nèi)教學(xué)培訓(xùn)等方式,完善和提升校內(nèi)教學(xué)團(tuán)隊水平,并承擔(dān)公安數(shù)據(jù)科學(xué)專業(yè)中的專業(yè)基礎(chǔ)課、專業(yè)必修課和專業(yè)選修課中拓展課程方向的教學(xué)任務(wù)。二是通過高校聯(lián)盟、校企合作等渠道外聘其他高?;蚱髽I(yè)數(shù)據(jù)科學(xué)領(lǐng)域?qū)<页袚?dān)專業(yè)選修課中的學(xué)科前沿課程的教學(xué)任務(wù)。三是可通過校局合作關(guān)系聘請公安實戰(zhàn)單位各業(yè)務(wù)部門從事數(shù)據(jù)應(yīng)用工作的技術(shù)骨干民警為駐校教官,承擔(dān)專業(yè)選修課中的公安業(yè)務(wù)通識課的教學(xué)任務(wù)。
實驗教學(xué)是數(shù)據(jù)科學(xué)專業(yè)人才培養(yǎng)不可缺少的環(huán)節(jié),對于公安高等院校的數(shù)據(jù)科學(xué)專業(yè)建設(shè)而言,建立面向公安實戰(zhàn)的實驗教學(xué)環(huán)境是提升人才培養(yǎng)質(zhì)量的重要方式[9]。然而,由于公安實戰(zhàn)數(shù)據(jù)應(yīng)用場景較多,覆蓋了多達(dá)數(shù)十個業(yè)務(wù)方向,構(gòu)建一個完全模仿實戰(zhàn)的公安數(shù)據(jù)科學(xué)實驗教學(xué)環(huán)境將面臨著極大的硬件、軟件和數(shù)據(jù)的成本壓力。對此,可采取因地制宜的方式,根據(jù)不同類型公安業(yè)務(wù)的運行模式和數(shù)據(jù)應(yīng)用模式設(shè)計和構(gòu)建合理的實驗教學(xué)環(huán)境。例如,對于交通、指揮、視偵、網(wǎng)安等對實時數(shù)據(jù)處理具有較強(qiáng)依賴性的業(yè)務(wù)方向,可依托公安高等院校的模擬城市街區(qū)、模擬指揮中心、校園安防系統(tǒng)等已有的物聯(lián)感知體系構(gòu)建相應(yīng)的實驗教學(xué)環(huán)境,使學(xué)生在真實的物理環(huán)境下開展相應(yīng)的數(shù)據(jù)計算和數(shù)據(jù)分析教學(xué)實驗;而對于情報、治安、刑偵、經(jīng)偵、禁毒、反恐等對數(shù)據(jù)時效性要求不強(qiáng)的業(yè)務(wù)方向,可基于一般性的計算機(jī)實驗教學(xué)環(huán)境設(shè)計相應(yīng)的數(shù)據(jù)分析教學(xué)實驗。
隨著公安業(yè)務(wù)信息化的深入推進(jìn)和快速發(fā)展,建設(shè)公安數(shù)據(jù)科學(xué)專業(yè)、培養(yǎng)高水平數(shù)據(jù)專業(yè)人才已經(jīng)成為公安高等院校面臨的重要任務(wù)。本文總結(jié)國內(nèi)外高校數(shù)據(jù)科學(xué)專業(yè)的人才培養(yǎng)目標(biāo)和課程體系設(shè)置情況,結(jié)合我國公安工作對數(shù)據(jù)科學(xué)人才的需求,認(rèn)為公安高等院校應(yīng)著力于培養(yǎng)數(shù)據(jù)工程師和數(shù)據(jù)分析師。在具體的專業(yè)方向上應(yīng)圍繞這兩類人才培養(yǎng)目標(biāo)設(shè)置合理的課程體系,其中數(shù)據(jù)工程師應(yīng)以數(shù)據(jù)計算為核心構(gòu)建專業(yè)課程體系,而數(shù)據(jù)分析師應(yīng)以數(shù)據(jù)分析為核心構(gòu)建專業(yè)課程體系。在課程體系的層次上,除專業(yè)基礎(chǔ)、專業(yè)必修課程外,還應(yīng)在專業(yè)選修課程中著力加強(qiáng)對學(xué)生公安業(yè)務(wù)知識、數(shù)據(jù)前沿技術(shù)、數(shù)據(jù)安全意識和能力的培養(yǎng)。此外,建設(shè)高水平的教學(xué)團(tuán)隊和貼近實戰(zhàn)的實驗教學(xué)環(huán)境對公安高等院校數(shù)據(jù)科學(xué)專業(yè)的構(gòu)建和相應(yīng)人才的培養(yǎng)也十分重要。