韓 旭 熊 鑫
?
大數(shù)據(jù)背景下的犯罪情報研判——以PGIS平臺為中心的情報體系構(gòu)建
韓 旭 熊 鑫*
大數(shù)據(jù)時代背景下,原本依靠人工計(jì)算和推演的犯罪情報研判體系一步步更新升級。借助可視化技術(shù),犯罪活動實(shí)時分布態(tài)勢、趨勢預(yù)測的工作也從單調(diào)冗長的文本數(shù)據(jù)逐漸變成了清晰分明的曲線和地理犯罪圖譜。我國警務(wù)工作借助PGIS平臺,初步完成了數(shù)據(jù)可視化的基礎(chǔ)建設(shè),并已經(jīng)能夠初步進(jìn)行二維平面的犯罪時空軌跡、犯罪熱點(diǎn)分析。但在提高工作效率的同時也暴露出了理論和實(shí)踐結(jié)合不甚嚴(yán)密、各平臺口徑不一和協(xié)作不足、數(shù)據(jù)甄別挖掘和轉(zhuǎn)化能力不足等相關(guān)問題。對此,可以以PGIS平臺的完善為突破口,多端口寬口徑的接入數(shù)據(jù)后,嵌入對數(shù)據(jù)的匯總篩選分級,構(gòu)建起警員、犯罪嫌疑人、受害人等不同主體的行為模型,并借助Moran’sI指數(shù)及公式為代表的空間自相關(guān)性分析方法檢驗(yàn)其輸出結(jié)果的合理性,最后運(yùn)用回歸聚類模型和可視化工具分析出犯罪風(fēng)險地域和時空軌跡,初步推導(dǎo)出犯罪類型及犯罪熱點(diǎn)的安全區(qū)與多發(fā)高發(fā)區(qū)域,對比分析后推導(dǎo)犯罪誘因并制定針對性的解決方法,為現(xiàn)實(shí)的警力分配、犯罪控制提供數(shù)據(jù)支撐,也為未來以PGIS平臺為突破口的現(xiàn)代犯罪情報研判體系構(gòu)建提供發(fā)展方向。
大數(shù)據(jù);數(shù)據(jù)挖掘;可視化;情報建模
大數(shù)據(jù),顧名思義,實(shí)踐概括出的類型多樣(Variety)、數(shù)據(jù)量大(Volume)、增長速度快(Velocity)是大數(shù)據(jù)的突出特點(diǎn),幾經(jīng)發(fā)展后來者又加入了真實(shí)(Veracity)、可視化(Visualization)和正當(dāng)性(Validity)等要素,從3V理論到6V說,名稱雖不停在變,但由于數(shù)據(jù)時代下個人行為信息痕跡愈發(fā)明顯,大數(shù)據(jù)內(nèi)涵在聯(lián)系犯罪情報研判應(yīng)用中聯(lián)系也愈發(fā)緊密,尤其是之后新增的可視化、正當(dāng)性等要素。
大數(shù)據(jù),核心價值在于數(shù)據(jù)信息的運(yùn)用。在大數(shù)據(jù)的具體運(yùn)用里,不同于早期粗糙的地理環(huán)境學(xué)派,現(xiàn)代情報研判要面對前所未有的數(shù)據(jù)洪流。因此如何在日常預(yù)防打擊犯罪中,在數(shù)據(jù)海洋中及時的搜集篩選出真實(shí)有效的情報信息并將其分類、建模、可視化幫助偵查人員推進(jìn)執(zhí)法進(jìn)程便成了相關(guān)研究的重難點(diǎn)?,F(xiàn)實(shí)中包括PGIS警用地理信息系統(tǒng)平臺(英文全稱為Police Geographic Information System Platform,下文簡稱為PGIS)等在內(nèi)的現(xiàn)代犯罪情報研判體系也已經(jīng)逐漸開始適應(yīng)——從依靠原始人力智力和單人手工到越來越依靠以SPSS和Ucinet[1]等為代表的集群大數(shù)據(jù)分析及可視化工具來開展工作,包括情報數(shù)據(jù)的搜集、篩選、分析、挖掘、制圖、實(shí)時支援等步驟,最終在上述數(shù)據(jù)綜合平臺上展示分析的結(jié)果,包含行為模式預(yù)測、犯罪熱點(diǎn)分析、犯罪時空規(guī)律研判等多重?zé)衢T難點(diǎn),而且隨著建模技術(shù)和數(shù)據(jù)的運(yùn)用度提高,工作中也可以依據(jù)合理數(shù)據(jù)針對警員、犯罪人、受害人不同主體構(gòu)建出不同模型以供參考,反過來再針對PGIS平臺數(shù)據(jù)搜集到最終呈現(xiàn)等環(huán)節(jié)中的不足并加以改進(jìn)。
在對犯罪情報數(shù)據(jù)的運(yùn)用上,早在18世紀(jì)便已經(jīng)有了犯罪地理學(xué)的早期研究,但真正意義上的大數(shù)據(jù)背景下的犯罪情報研究卻是出現(xiàn)在GIS技術(shù)(地理信息系統(tǒng))、MIS(警用電子信息系統(tǒng))和Ucinet等成熟之后,隨著電子技術(shù)的發(fā)展,基于犯罪時空軌跡分析和數(shù)據(jù)可視化的新型情報研判已成大勢。
國外從早期的地理環(huán)境決定論、芝加哥犯罪學(xué)派到犯罪行為學(xué)派一路走過來,引入了實(shí)證主義、科際整合理論等學(xué)說,并衍生出來社會解組理論、日?;顒永碚?、犯罪可防范空間理論、理性選擇理論、回歸理論等理論,從不同角度的犯罪誘發(fā)因子分類歸納,在宏觀的層面上探討了犯罪現(xiàn)象在同種族隔離、收入差距、居住流動性、土地利用情況等多種因子影響下的關(guān)聯(lián)關(guān)系,從而為犯罪情報研判體系構(gòu)建提供了基本坐標(biāo)和較大的借鑒意義。
20世紀(jì)80年代,由于大數(shù)據(jù)的到來使得情報信息需要更加細(xì)致的篩選和分析,加上犯罪率居高不下,情報研判也從事后被動的案發(fā)型情報搜集到事前型搜集分析情報,理論研究則開始轉(zhuǎn)入微觀層面,學(xué)者們更多的轉(zhuǎn)向研究情報預(yù)測研判,結(jié)合專業(yè)人員設(shè)備,開啟新的思維方式和運(yùn)作模型。比較具有代表性的有如艾克勒姆提出的五步分解法,用來來收集情報(information gathering)、分析解讀(analysis and interpretation)、戰(zhàn)略設(shè)計(jì)(devising strategies)、戰(zhàn)略實(shí)施(implementation)科學(xué)評估(evaluation),和DIKI鏈的思維模式——即數(shù)據(jù)(Digital)、信息(Information)、知識(Knowledge)、情報(Intelligence)模式。
具體實(shí)踐中由于20世紀(jì)90年代情報導(dǎo)向警務(wù)戰(zhàn)略(Intelligence-Led Policing strategy,簡稱ILP)的提出,西方各國均以減少和預(yù)防犯罪為目標(biāo),并依托現(xiàn)代計(jì)算機(jī)信息技術(shù)及其他先進(jìn)科技發(fā)展,如英國國家情報模式下的情報核心分析系統(tǒng)(ICAS)、美國的計(jì)算機(jī)統(tǒng)計(jì)模式下的比較數(shù)據(jù)系統(tǒng)(COMPSTAT)、澳大利亞的執(zhí)法情報網(wǎng)絡(luò)(ALEIN)、加拿大的自動化犯罪情報信息系統(tǒng)(AlClS)等都是如此,以美國為代表的西方發(fā)達(dá)國家更是總結(jié)出了一套“數(shù)據(jù)統(tǒng)計(jì)+數(shù)據(jù)挖掘+犯罪制圖”的技術(shù)分析路線,更衍生出了犯罪分析師等專門性職業(yè),并取得了不錯的成績。有數(shù)據(jù)表明,美國洛杉磯警局目前已經(jīng)能利用大數(shù)據(jù)分析軟件,將轄區(qū)里的盜竊類犯罪降低了33%,暴力類犯罪降低了21%,財(cái)產(chǎn)類犯罪降低12%[2]。
但同時情報研判體系的實(shí)踐探索仍是在社會學(xué)領(lǐng)域的日?;顒永碚摵蜕鐣饨M理論[3]指導(dǎo)下進(jìn)行的,理論的相對滯后使得工作停留于通過制定犯罪因子來探索犯罪發(fā)生規(guī)律的固定模式,一方面沒有真正打破科際邊界,對犯罪因子的“執(zhí)著”導(dǎo)致不能跳出區(qū)域?qū)哟沃笜?biāo)的限制,從而引入統(tǒng)計(jì)學(xué)和情報學(xué)的知識體系來迎接大數(shù)據(jù)時代帶來的挑戰(zhàn)。在PGIS等定位制圖工具日益更新的同時,還停留在原本的某地域犯罪因子之間影響及平面規(guī)律的探尋,雖然較好的結(jié)合了現(xiàn)有技術(shù),在實(shí)踐上構(gòu)建出了一套犯罪情報研判體系,但仍無法就犯罪預(yù)測和防控的策略給予精準(zhǔn)有效的探索指導(dǎo)。
另一方面這仍是“被動型”的偵查,對犯罪的預(yù)判預(yù)防顯得不足,只能在犯罪發(fā)生后依靠更多的人力物力抓獲罪犯,在“犯罪黑數(shù)”增長的同時,未能將宏觀層面的地理、亞文化、政策和微觀個人的心理生理、行為模式、人身特征等多方因素結(jié)合,甚至跳出社會學(xué)領(lǐng)域的限制使用統(tǒng)計(jì)學(xué)知識和網(wǎng)絡(luò)云計(jì)算能力構(gòu)建出一整套全局型、通用型的犯罪研判模型,達(dá)到預(yù)測預(yù)防犯罪的目的。
1.國內(nèi)理論探索
與西方國家不同是,我們國家原本由于歷史原因在這方面起步就較晚,近代最早的相關(guān)研究也是從改革開放伊始。深入程度也參差不齊,受國外行為學(xué)派、犯罪生態(tài)學(xué)派的影響,有最早的如祝曉光、王發(fā)曾等先驅(qū)們對的宏觀犯罪因子和犯罪空間等的相關(guān)研究,開始嘗試運(yùn)用統(tǒng)計(jì)學(xué)方法研究城市犯罪的動態(tài)變化規(guī)律,并通過對國內(nèi)外關(guān)于城市犯罪空間模式研究的講解評價,對城市犯罪發(fā)展趨勢預(yù)判的方法(相關(guān)因素法、時間序列法)進(jìn)行了簡要的介紹,但這些多集中于介紹國外學(xué)術(shù)理論,少有中國模式,但正因如此我們也可以在國外的有益經(jīng)驗(yàn)上加以借鑒。
改革開放后期研究逐漸從宏觀轉(zhuǎn)向微觀層面研究影響因子,加上大數(shù)據(jù)理念的提出,開始結(jié)合統(tǒng)計(jì)學(xué)模型和GIS技術(shù)探索適合我國的模式。耿莎莎等利用GIS軟件,通過分析中原地區(qū)某縣城10年的城區(qū)犯罪案例數(shù)據(jù),結(jié)合城區(qū)土地利用現(xiàn)狀圖、道路圖、社區(qū)人口統(tǒng)計(jì)資料,對該縣城區(qū)不同犯罪類型和不同年份的犯罪數(shù)據(jù)進(jìn)行了空間分析。杜德斌和湯建中教授通過純粹的數(shù)學(xué)建模,推導(dǎo)并得出犯罪期望效用和成功概率共同決定犯罪行為空間區(qū)位選擇的結(jié)論,建立了犯罪區(qū)位選擇的微觀模型;毛媛媛、戴慎志等以公安年鑒和晚報報道的犯罪數(shù)據(jù)為研究基礎(chǔ),通過統(tǒng)計(jì)和回歸分析,得出了上海市一定時期內(nèi)犯罪案件間分布特征,并嘗試著從城市規(guī)劃和建筑設(shè)計(jì)等角度為犯罪防控做了一些探索和建議;而陳屹立博士也在其論文中,嘗試用泰爾指數(shù)分析了我國犯罪的省際差異[4]。
因?yàn)閷?shí)際學(xué)者所接觸的數(shù)據(jù)有限以及沿用理論的相對一致(多為社會解組和日常活動理論),我國如今研究犯罪問題的方向角度較多且偏向于實(shí)用性,并能突破科際結(jié)合建筑學(xué)、規(guī)劃學(xué)等相關(guān)學(xué)科的知識,系統(tǒng)的發(fā)展了犯罪空間防控等理論,但由于信息限制等多方因素在犯罪行為空間選擇、社區(qū)犯罪等熱點(diǎn)問題上深度廣度不夠。而且在“具備”上文描述的發(fā)達(dá)國家類似弊病之外,大多只是考慮到了大數(shù)據(jù)的影響,在對關(guān)于大數(shù)據(jù)背景如何具體運(yùn)用現(xiàn)有數(shù)據(jù)使其用于犯罪預(yù)判的研究則相對較少,課題研究仍在探索階段。
2.國內(nèi)情報研判體系構(gòu)建現(xiàn)狀
在中外合作方面,我國堅(jiān)持注重和國際接軌的同時加強(qiáng)了自主研發(fā)。上海市公安局也單獨(dú)研發(fā)了案件時空分析系統(tǒng),該系統(tǒng)在各種原有公開和警用信息資料基礎(chǔ)上,加以技術(shù)、人力信息、財(cái)務(wù)信息、車輛信息等的有機(jī)整合,逐步建立了有關(guān)違法犯罪人員原籍統(tǒng)計(jì)分析制度、有關(guān)毒品地下交易價格監(jiān)測制度、有關(guān)違法犯罪案件時空走勢分析制度等。我國公安部門與美國有名的GIS軟件公司Esih進(jìn)行的全面警用地理信息系統(tǒng)方面開發(fā)的項(xiàng)目合作,也于2010年公安部正式發(fā)布了1.0版警用地理信息系統(tǒng)平臺軟件——即PGIS,一定程度上講,這套不斷完善的系統(tǒng)完成了犯罪情報研判體系的初次構(gòu)建。
隨著“十二五”工程國家科技支撐計(jì)劃“新一代警用GIS關(guān)鍵技術(shù)及其應(yīng)用”的開展,驗(yàn)收竣工了“金盾”一期工程。而作為“金盾工程”二期建設(shè)的龍頭項(xiàng)目的公安“大情報”系統(tǒng)應(yīng)運(yùn)而出,我國的PGIS平臺也進(jìn)一步發(fā)展。但從實(shí)踐上總體說來,國內(nèi)這方面還是有很大的空白區(qū)未深入,尤其是在警務(wù)情報方面。而這其中犯罪情報分析預(yù)測技術(shù)的關(guān)鍵步驟——各平臺的數(shù)據(jù)整合及共享的欠缺則是制約大數(shù)據(jù)情報研判的瓶頸。導(dǎo)致大部分有用的情報無法及時轉(zhuǎn)化成數(shù)據(jù)以致錯失冗積,在爆炸浪潮一般的數(shù)據(jù)不能去偽存真,經(jīng)過艱辛錄入的數(shù)據(jù)更不能及時規(guī)范的轉(zhuǎn)化成圖表圖譜,各單位之間數(shù)據(jù)由于整合標(biāo)準(zhǔn)、計(jì)算公式的不一,口徑參差不齊以致情報數(shù)據(jù)資源被浪費(fèi)空置而不能轉(zhuǎn)化成三維甚至是二維的可視化情報,因此對于這些問題問題,在仔細(xì)研究后,本文針對薄弱環(huán)節(jié)做一系列的PGIS的完善構(gòu)想。
犯罪情報研判體系建設(shè)完善作為一個動態(tài)的發(fā)展過程,在大數(shù)據(jù)時代也升級換代,體現(xiàn)出了如數(shù)據(jù)化、多維可視化、智能化等多種特性和趨勢,最終在PGIS平臺的發(fā)展基礎(chǔ)之上,構(gòu)建成一個包含犯罪時空軌跡、犯罪熱點(diǎn)、實(shí)時犯罪現(xiàn)場等多種類信息的犯罪情報研判體系。
1.數(shù)據(jù)化
大數(shù)據(jù)時代的來到,光靠紙筆人力的運(yùn)算和分析已經(jīng)捉襟見肘。人力有窮時,更多時候通過諸如PGIS平臺等數(shù)據(jù)處理終端,憑借犯罪分子在犯罪預(yù)備時的交易、出行、通話以及金融數(shù)據(jù)快速勾勒出其犯罪動向和時空軌跡,而這些是人力短時間所辦不到的。在這其中,數(shù)據(jù)的收集和分析是整個體系的發(fā)展方向,也是建模預(yù)測分析的基礎(chǔ)。當(dāng)然對于相關(guān)數(shù)據(jù)的保護(hù)和運(yùn)用缺陷也必須要引起我們的重視和完善。
2.多維可視化
數(shù)據(jù)種類的增多、可視化技術(shù)的提高直接促進(jìn)了犯罪信息多維化、可視化程度的提高。前期已經(jīng)能夠?qū)⑽淖趾蛿?shù)據(jù)轉(zhuǎn)化為電子平面表格、趨勢圖,現(xiàn)在則能再進(jìn)一步,將電子信息地圖、個人信息、GIS實(shí)時定位、天眼監(jiān)控、電子投影等的功能整合,展現(xiàn)出包含3D犯罪現(xiàn)場、實(shí)時電子時空軌跡等二維、三維的可視場景,以供偵查部門工作參考。
3.智能化
由于數(shù)據(jù)的多樣和具體案件參考因素的不一,數(shù)據(jù)的整合現(xiàn)階段還停留在人工錄入、人工編程分析的階段,將數(shù)據(jù)錄入后再依據(jù)具體案件從數(shù)據(jù)庫中找尋自己需要的數(shù)據(jù),各數(shù)據(jù)庫信息平時不相連也不會發(fā)生碰撞,而數(shù)據(jù)信息代表的深層聯(lián)系也全憑偵查辦案人員的“頭腦風(fēng)暴”,這在無形中喪失了很多辦案線索,加大了偵破難度。在未來的發(fā)展趨勢中,高危人員、犯罪分子的數(shù)據(jù)智能整合分析無疑是一大方向,還能直接預(yù)測犯罪的同時減少警力的浪費(fèi)、有效打擊犯罪。同時人機(jī)交互體驗(yàn)的程度較低也是制約智能化的一大難題,加強(qiáng)系統(tǒng)的智能反饋,提高人機(jī)交互程度也是實(shí)踐和研究的一大方向。
體系作用總體歸納后,可以分為戰(zhàn)略目標(biāo)和戰(zhàn)術(shù)目標(biāo)兩個層次,有歷史穩(wěn)定的靜態(tài)分析、實(shí)時動態(tài)的情報支援,未來犯罪熱點(diǎn)和趨勢預(yù)測三大工作任務(wù)。
1. 應(yīng)用目標(biāo)
具體而言,戰(zhàn)略層面的應(yīng)用包括犯罪發(fā)生地環(huán)境分析、犯罪熱點(diǎn)分析、犯罪趨時空勢分析與預(yù)測、多類犯罪信息圖層疊加分析等;戰(zhàn)術(shù)層面的應(yīng)用包括串并案件時空軌跡分析、定位與管轄匹配分析、路線與指揮調(diào)度分析、數(shù)據(jù)碰撞分析、連線分析等針對具體案件實(shí)時動態(tài)的情報支援等。
2. 應(yīng)用實(shí)況
在實(shí)際的運(yùn)用中(以美國為例),整個體系運(yùn)作從數(shù)據(jù)庫的搜集入手,從早期的依靠文本卷宗和人腦記憶口口相傳到手機(jī)、PC端、網(wǎng)絡(luò)數(shù)據(jù)、車載電子數(shù)據(jù)、行業(yè)及交易數(shù)據(jù)等多方面錄入,并包括視頻、圖像、語音、文字符號等多種形式,情報的甄別分類也更多的由電腦預(yù)定程序輸入分級,通過關(guān)鍵字索引和文本語義分析,將數(shù)據(jù)海洋匯總分流,最后借助統(tǒng)計(jì)學(xué)上的鄰近重復(fù)建模,通過回歸聚類模型和可視化工具分析出犯罪風(fēng)險地域和時空軌跡(例如由Twitter開發(fā)的開源實(shí)時分析計(jì)算工具Storm),并以Moran’sI指數(shù)[5](從社會學(xué)領(lǐng)域衍生而來計(jì)算某種社會現(xiàn)象空間自相關(guān)的理論)及公式檢驗(yàn)其合理性,最終構(gòu)建出一整套由一區(qū)一地上升到國家層面的犯罪情報研判體系。
而我國而為了適應(yīng)信息化和大數(shù)據(jù)時代的需求,于2006年8月正式推出的“金盾工程”二期建設(shè)初步方案,其中警用地理信息系統(tǒng)平臺便是國家“金盾工程”二期[6]提出的重點(diǎn)建設(shè)的三大高端應(yīng)用平臺之一,是公安將情報信息數(shù)據(jù)整合和深層次應(yīng)用的技術(shù)平臺。它在公安信息網(wǎng)絡(luò)的基礎(chǔ)上,借助警用電子地圖和數(shù)據(jù)分析平臺,以服務(wù)于公安業(yè)務(wù)管理、情報信息共享和決策支持的可視化為目標(biāo),是“大情報”工程中信息化基礎(chǔ)設(shè)施的重要建設(shè)方向之一。針對不同環(huán)節(jié)的薄弱和不足,與其相對應(yīng)的完善建設(shè)步驟可以基本分為情報數(shù)據(jù)的搜集、篩選、挖掘、顯現(xiàn)四大部分,如下頁圖1所示。
圖1
1.必要性
(1)作為一種現(xiàn)實(shí)的剛性需求,大數(shù)據(jù)興起以來,現(xiàn)實(shí)犯罪類型和手法多樣化、犯罪水平和技術(shù)更加高超和隱蔽,同時利用數(shù)據(jù)的能力也越來越高,如果不想現(xiàn)實(shí)中上演“道高一尺魔高一丈”,讓處于灰色地帶的“數(shù)據(jù)勢力”掌握數(shù)據(jù)信息的強(qiáng)大力量,這種潛在的威脅時刻提醒著我們要加強(qiáng)數(shù)據(jù)挖掘運(yùn)用,加上響應(yīng)國家“十二五”建設(shè)國策的號召,因此最經(jīng)濟(jì)有效地構(gòu)建現(xiàn)代意義上的犯罪情報研判體系的方式便是對現(xiàn)階段推出的PGIS進(jìn)行完善。
(2)其次合理運(yùn)用PGIS平臺進(jìn)行數(shù)據(jù)建模,同時也是優(yōu)化現(xiàn)實(shí)警力配置的必經(jīng)之路。我國的警力相比于歐美國家本就稍顯不足,在2002年時我國的警力配置平均分別為10.86人/萬人和10.4人/100平方公里,所以在搭配PGIS平臺的運(yùn)用后,既能緩解警力的數(shù)量不足,又可以幫助提升警務(wù)水平形成新一代“情報+警力+數(shù)據(jù)點(diǎn)”的模式,進(jìn)一步打擊犯罪。
(3)再次,以PGIS平臺為中心的現(xiàn)代犯罪情報研判體系興起發(fā)展不過短短數(shù)年,雖然具有強(qiáng)大的政策支援和發(fā)展?jié)摿?,但是也逐漸暴露除了平臺系統(tǒng)數(shù)據(jù)搜集、運(yùn)用、分析等方面存在的各方面缺陷,作為犯罪情報研判系統(tǒng)本身的不足,同樣也是現(xiàn)階段可以優(yōu)化升級的關(guān)鍵部分。
④最后,理論的發(fā)展促使著實(shí)踐的進(jìn)步,越來越多的學(xué)者看到主動型偵查的必要性和優(yōu)勢。隨著現(xiàn)代警務(wù)理論和技術(shù)的提高,同時發(fā)揮已有PGIS平臺的功用不致早期投入的資源、錄入的大量數(shù)據(jù)信息閑置浪費(fèi),在整合犯罪信息收集整理、犯罪熱點(diǎn)和時空規(guī)律分析等功能后,在現(xiàn)有的PGIS平臺基礎(chǔ)上構(gòu)建出具備大數(shù)據(jù)分析能力的犯罪情報研判體系勢在必行。
2.重要性
一方面出于對國家安全保障、社會穩(wěn)定秩序維護(hù)得考慮,必須進(jìn)一步提升警務(wù)水平保證面對新型犯罪不至于束手無策,而PGIS已經(jīng)成為我國警務(wù)系統(tǒng)不可或缺的一部分,所以我們不妨以此為突破口加以完善。
另一方面來講,大數(shù)據(jù)的運(yùn)用不止于如此,而PGIS為中心犯罪情報研判體系的建設(shè)最后所發(fā)揮的實(shí)際作用也不止于此。真正的大數(shù)據(jù),這些來自不同維度、不同途徑的數(shù)據(jù),并不限于文字圖片、聲音視頻、時空位置等,而將這些不同維度的數(shù)據(jù)放在一起判斷,得出來的趨勢才能更真實(shí)。當(dāng)數(shù)據(jù)庫的數(shù)據(jù)成體量成模式后,不限于日常犯罪預(yù)測,更可延展至社會、教育、反恐、金融等多個領(lǐng)域,預(yù)測風(fēng)險、規(guī)避雷區(qū),幫助國家做出合理決策,促進(jìn)和諧發(fā)展。
1.信息數(shù)據(jù)的來源和搜集
數(shù)據(jù)來源于信息,信息是情報之始。大數(shù)據(jù)下的情報收集一般說來可以分成傳統(tǒng)企業(yè)數(shù)據(jù)(產(chǎn)品消費(fèi)明細(xì)、公司財(cái)務(wù)數(shù)據(jù)等),機(jī)器和傳感器數(shù)據(jù)(包括呼叫記錄、智能儀表和工業(yè)設(shè)備傳感器數(shù)據(jù),交易數(shù)據(jù),包括手機(jī)端和PC端在內(nèi)的設(shè)備日志),社交數(shù)據(jù)(包括如Twitter、Facebook、QQ、微信等社交平臺上的用戶行為記錄,反饋數(shù)據(jù)等)三類。而打擊犯罪屬于國家職能,必要情況還可以依據(jù)法律動用公權(quán)力建立的人口、財(cái)務(wù)、車輛、手機(jī)定位等特殊數(shù)據(jù),結(jié)合原有錄入公安刑事行政等案件資料庫的卷宗資料,從而奠定了先天的資源優(yōu)勢(如圖2所示[7],大部分黑色陰影所代表的信息資源都具有教大的潛力和易用性,政府信息稍有例外,下文有解釋),可以以此建立關(guān)于跨地域多主體(犯罪人、犯罪客體)的情報研判體系,幫助有效的預(yù)測并打擊犯罪。
圖2
2.信息數(shù)據(jù)的篩選
情報數(shù)據(jù)的洪量一方面帶來了更多的線索和路徑,同時在頭羊效應(yīng)和蝴蝶效應(yīng)影響下,也容易讓情報分析人員和智能系統(tǒng)陷入數(shù)據(jù)陷阱,在滿目繁多亦真亦假的數(shù)據(jù)里迷失。所以情報研判的必經(jīng)一步便是篩選,并分為辨別真假、分類分級兩步。即首先在信息的錄入之初便進(jìn)行虛假資料甄別,并在數(shù)據(jù)碰撞分析環(huán)節(jié)進(jìn)行不合理數(shù)據(jù)單列的方式盡可能提高情報可信度。同時將所得來的數(shù)據(jù)信息按照區(qū)域、罪名類別、作案人員人身社會特征、作案手段、作案時間、作案對象等多個方面劃分危險和類似性級別,以備數(shù)據(jù)分析挖掘之用。
3.數(shù)據(jù)的挖掘分析
經(jīng)過了“睜大眼睛”的數(shù)據(jù)錄入、“擦亮眼睛”的情報篩選,便到了“火眼金睛”剝繭抽絲的分析環(huán)節(jié),作為可視化前的最后一躍,數(shù)據(jù)的碰撞聚類分析是最復(fù)雜也是最關(guān)鍵的一步。因?yàn)?,由?shù)據(jù)轉(zhuǎn)化為情報,既包含了去粗取精去偽存真的剝離,更需要結(jié)合案件發(fā)生的狀況,借助統(tǒng)計(jì)學(xué)和社會學(xué)的模型對顯著犯罪因子進(jìn)行回歸、聚類的建模分析,并通過如Moran’sI指數(shù)和HHI指數(shù)[8]來進(jìn)行顯著性測試檢驗(yàn)分析結(jié)果的合理性,最后得出可信的數(shù)據(jù)結(jié)論。
4.情報可視化
在借助如新型的可視化技術(shù)(Wordle圖[9]、故事線圖、平行坐標(biāo)圖、散點(diǎn)圖矩陣[10])轉(zhuǎn)化后,數(shù)據(jù)在最后一步中將以二維圖表圖像展示出來,甚至在借助新的LIDAR系統(tǒng)、[11]ArcEngine可視化平臺[12]以及相關(guān)統(tǒng)計(jì)通用軟件(如SPSS/SAS/SPLUS、EXCEL、ACESS、CADmine等)和專用軟件I2系列軟件[13]后,可以實(shí)現(xiàn)全新的三維電子模擬場景的方式展示。同時現(xiàn)在不斷發(fā)展的VR技術(shù),也可能用于展示犯罪情報、現(xiàn)場犯罪勘察等方面,幫助犯罪情報的研判。
大數(shù)據(jù)背景下以PGIS為中心這套情報研判體系都是構(gòu)建在數(shù)據(jù)的運(yùn)用基礎(chǔ)之上,所以主要的薄弱環(huán)節(jié)也在數(shù)據(jù)的搜集、分析環(huán)節(jié),主要問題則有以下幾點(diǎn)。
1.可用電子數(shù)據(jù)少而雜
在以往的公安工作中,PGIS中犯罪情報來源較窄、類型單一且時空線索雜亂,無法直接用于流水線方式的數(shù)據(jù)情報轉(zhuǎn)化,因?yàn)榇蠖嗲閳髞碜杂诠ぷ髦腥斯そ泳鼍笾谱鞯姆缸锶俗C人口供筆錄、案底卷宗、現(xiàn)場痕跡物證以及調(diào)查走訪中獲得的環(huán)境人情信息,多以文本甚至警員人腦記憶存在,這就直接導(dǎo)致數(shù)據(jù)庫里面的有效數(shù)據(jù)較少。除此之外,大多數(shù)錄入電子數(shù)據(jù)庫的人口車輛資料只是作為佐證在訊問和法庭審判中使用,也沒有專門歸類建模發(fā)揮其專業(yè)性,沒有完全發(fā)揮出應(yīng)有的全部效力用于云計(jì)算的犯罪時空分析。
2.數(shù)據(jù)庫協(xié)同度低
2016年3月5日,據(jù)李克強(qiáng)總理在全國推進(jìn)簡政放權(quán)放管結(jié)合優(yōu)化服務(wù)改革電視電話會議上談話內(nèi)容,目前我國信息數(shù)據(jù)資源80%以上掌握在各級政府部門手里,這樣的“深藏閨中”是一種極大浪費(fèi)。如文中圖2所示,政府、公司、科研機(jī)構(gòu)都各自掌握著大量數(shù)據(jù),尤其是政府信息和金融貿(mào)易類,對國民生活影響巨大。但同時政府?dāng)?shù)據(jù)的易用性極低,代表著大量的數(shù)據(jù)情報沒有專門分類管理,數(shù)據(jù)冗積雜糅彼此之間相互不聯(lián)通,體制化管理下其他信息主體有心使用數(shù)據(jù)也無處接觸,從而數(shù)據(jù)關(guān)聯(lián)不強(qiáng),數(shù)據(jù)無法形成一個暢通的數(shù)據(jù)鏈進(jìn)行數(shù)據(jù)交流和碰撞。
除此之外,考慮到國家行業(yè)安全和政治穩(wěn)定,PGIS平臺對于大數(shù)據(jù)的利用也只是限于部分行業(yè)。但是在保證穩(wěn)定安全的前提下,嘗試行業(yè)部門間的有用數(shù)據(jù)共享交流是個很好的選擇。
3.建模分析方法繁瑣不一
(1)我國現(xiàn)代嘗試研究犯罪因子的統(tǒng)計(jì)學(xué)方法多樣,各有優(yōu)缺,有如杜德斌、湯建中基于犯罪期望理論對城市犯罪區(qū)位選擇的數(shù)學(xué)模擬研究,有如學(xué)者佟瑞鵬基于基尼系數(shù)法的全國安全社區(qū)數(shù)量分布規(guī)劃研究,但由于實(shí)際工作操作性的限制,當(dāng)前PGIS的云計(jì)算中終究沒有一套較為便捷可行的犯罪系數(shù)計(jì)算公式來確定國家和區(qū)域?qū)用娴姆缸飯D譜,無法形成一套完整的研判體系。
(2)各地方開發(fā)的犯罪電子研判系統(tǒng)對犯罪影響因子和采用計(jì)算方法的不一,也導(dǎo)致各自的口徑大小不同,難以實(shí)現(xiàn)完全的對接共享,對于區(qū)域協(xié)同帶來了不便。
(3)建模分析采用的絕大多數(shù)方法局限于統(tǒng)計(jì)學(xué)、社會學(xué)的理論運(yùn)算,而對犯罪行為涉及的心理學(xué)、人類行為學(xué)等現(xiàn)實(shí)因素考慮不深,使得建模在用于實(shí)踐中稍顯不足。
4.三維化程度低
我國當(dāng)前的PGIS基本能做到在電子地圖上疊加部分犯罪數(shù)據(jù),形成簡單的二維犯罪電子地圖,能夠應(yīng)對宏觀和簡單犯罪因子的情報研判。但是面對局部微觀層面的犯罪現(xiàn)場觀測、多因子犯罪預(yù)測和實(shí)時情報支援時,則需要虛擬三維化(即在3D視角下可通過電子模擬出可多角度多維度查看犯罪信息的犯罪現(xiàn)場)的電子情報支援,而這方面我國尚在摸索。
5.法律空白多
在目前,出于對隱私權(quán)權(quán)方面和實(shí)際警務(wù)情報工作進(jìn)展的考慮,對犯罪情報收集尚有諸多法律的限制和空白,諸如國家公權(quán)力在管理參考公民個人信息的程序規(guī)范問題、企業(yè)在搜集手機(jī)端用戶偏好及個人身份財(cái)務(wù)信息的侵權(quán)問題、公民日常財(cái)務(wù)數(shù)據(jù)的保管和保護(hù)問題等仍待解決。
1.擴(kuò)大數(shù)據(jù)錄入面
在試驗(yàn)不變的條件下重復(fù)試驗(yàn)多次,隨機(jī)事件的頻率近似于它實(shí)際發(fā)生的幾率。而隨著計(jì)算機(jī)的處理能力的日益強(qiáng)大,能獲得的數(shù)據(jù)量越大,所能挖掘到的價值就越多,同時對事件發(fā)生的預(yù)判也越準(zhǔn)確。區(qū)別于傳統(tǒng)情報工作,在大數(shù)據(jù)的海洋里“捕魚”,可供犯罪預(yù)測的情報數(shù)據(jù)也遠(yuǎn)不止前文如此,所以可視化情報數(shù)據(jù)的多渠道搜集才是基礎(chǔ)。
(1)增錄手機(jī)端數(shù)據(jù)。PGIS的數(shù)據(jù)庫在原本手機(jī)信號基站定位的使用基礎(chǔ)上,增加錄入經(jīng)用戶授權(quán)后報警APP數(shù)據(jù)及其他網(wǎng)絡(luò)數(shù)據(jù)。例如,于2016年研制并嘗試推廣的兩款情報終端APP——FAFA(Fighting Against Fraud Applicant,中文名發(fā)發(fā))與智慧110,用戶已經(jīng)能夠在手機(jī)上錄入犯罪情況、罪犯特征并上傳視頻聲像資料,真正的“隨手轉(zhuǎn)發(fā)正能量”,同時后臺能夠通過云計(jì)算將某一區(qū)域或某一類型的犯罪率通過顏色的深淺和標(biāo)識表現(xiàn)在地圖上,類似國外的Crime Reports電子地圖(如圖4)。
圖4
(2)各行業(yè)數(shù)據(jù)庫數(shù)據(jù)共享。自2013年3月公布“大數(shù)據(jù)研發(fā)計(jì)劃”后,中央情報局將與亞馬遜網(wǎng)頁服務(wù)公司合作,美國便開啟了私營領(lǐng)域與公共事業(yè)部門在包括地理情報在內(nèi)的的跨界合作。我國可以加以借鑒,在原本的犯罪數(shù)據(jù)上整合特種行業(yè)的數(shù)據(jù)庫(包括常駐暫住人口資料、機(jī)動車輛數(shù)據(jù)、工商登記注冊數(shù)據(jù)、戶籍身份數(shù)據(jù)、高危及重點(diǎn)人員資料、指紋及DNA數(shù)據(jù)、民航數(shù)據(jù)、住宿數(shù)據(jù)、執(zhí)法記錄、通信記錄、公交IC卡數(shù)據(jù)、銀行存取數(shù)據(jù)、車輛卡口及其GPS數(shù)據(jù)、網(wǎng)絡(luò)服務(wù)記錄、水電交易數(shù)據(jù)等),打造一張覆蓋全國的數(shù)據(jù)網(wǎng),從而在技術(shù)角度更好的摸清犯罪形勢軌跡,同時為后面的數(shù)據(jù)分析挖掘提供更多的方向和影響因子,提高預(yù)測的準(zhǔn)度。
2.強(qiáng)化數(shù)據(jù)篩選
(1)工作專門化
一方面加強(qiáng)對情報人員的數(shù)據(jù)串連篩選能力培訓(xùn),能夠熟練的掌握基本的數(shù)據(jù)統(tǒng)計(jì)分析和犯罪制圖技術(shù),能夠編程設(shè)計(jì)和靈活使用如類似爬蟲軟件的信息篩選抓取程序;另一方面借鑒國外的做法采用經(jīng)過專業(yè)準(zhǔn)入門檻考核的數(shù)據(jù)分析師去專門管理數(shù)據(jù)。
(2)分級分區(qū)
理清類別級別之間的標(biāo)準(zhǔn),并單劃出不拘泥于行政區(qū)劃的犯罪預(yù)測區(qū)?;诙嗥鸢讣陌l(fā)案地圍繞其平均中心正態(tài)分布的理論[14],以劃定犯罪預(yù)測區(qū)的基本分析模型對系列案件發(fā)生地的預(yù)測,在數(shù)據(jù)錄入之初便進(jìn)行數(shù)據(jù)的歸類標(biāo)準(zhǔn)包括危險程度、犯罪風(fēng)格、犯罪人同一性、是否為前科或團(tuán)伙犯罪等方面劃定,這些都能為后面的工作開展提供極大便利,目前有香港模式四級模式[15]、珠海四級模式、歐美“4×4體系”。這擺脫了行政區(qū)劃的思維桎梏,同時也有利于警方跨區(qū)域的協(xié)同觀測辦案。
(3)提高有效關(guān)鍵詞抓取
關(guān)鍵詞抓取是在語義處理、文本數(shù)據(jù)檢索中常用的方法,但關(guān)鍵詞的選取和組合必須要提高效度。例如美國居民在用Google搜索‘高壓鍋’+‘背包’后被反恐部隊(duì)遭搜查住宅的事件在2013年盛傳,雖事后證明事情有夸大曲折之處,但是也應(yīng)引起我們的警惕。
(4)排除數(shù)據(jù)間的虛假關(guān)聯(lián)
①在法律許可的情況下堅(jiān)決貫徹實(shí)名制注冊,杜絕源頭的虛假用戶資料。
②由于亞文化的普遍存在,文化差異導(dǎo)致的語義分別也會反映在數(shù)字世界中,要依目標(biāo)所處情境對“異?!边M(jìn)行有效界定,確保獲取的“異?!贝_屬異常。
③及時辟謠,防止虛假信息的蝴蝶效應(yīng),在冤假錯案后也及時“沉冤昭雪”更新數(shù)據(jù)庫內(nèi)容,保持權(quán)威數(shù)據(jù)的真實(shí)性。
④同時定時清理冗積在資料庫中的無用的、重復(fù)的、帶陷阱病毒的垃圾數(shù)據(jù),這樣避免了冗余值的意外溢出導(dǎo)致程序出現(xiàn)紕漏,統(tǒng)計(jì)結(jié)果而受到影響,促進(jìn)數(shù)據(jù)能迅速的轉(zhuǎn)化為情報。
3.數(shù)據(jù)分析與挖掘
(1)數(shù)據(jù)建模
簡單的依靠人力眼力分析犯罪熱點(diǎn)和時空規(guī)律只能在小范圍個別案件比較實(shí)用,面對案件數(shù)量和地域的擴(kuò)寬,要提高工作的效率和質(zhì)量,就必須依靠平臺的數(shù)據(jù)建模功能進(jìn)行智能的批量分析。由于PGIS的數(shù)據(jù)庫建立的根基在于GIS系統(tǒng),所以數(shù)據(jù)建模更適合用空間自相關(guān)方法來進(jìn)行聚類和回歸分析,通俗的講就是看菜吃飯,通過觀察地區(qū)犯罪的相似度和關(guān)聯(lián)性分析出某一類犯罪事件或者犯罪主客體的獨(dú)立集聚效果、犯罪熱點(diǎn)地帶,從而為犯罪劃區(qū)監(jiān)測研判提供導(dǎo)向。這就跳出了前期犯罪因子選擇的限制,可以口徑一致的用于全國范圍。
建模的方法必須依靠統(tǒng)計(jì)學(xué),而討論空間自相關(guān)[16]時多用Moran’s I指數(shù)(分為全局型、局地型[17]兩種)和G系數(shù)[18]。G系數(shù)探測聚集現(xiàn)象的能力受規(guī)模的影響穩(wěn)定性較差;全局型Moran’s I指數(shù)偏向概括側(cè)重整體趨勢分布,探測出空間聚集范圍的擴(kuò)展,但無法具體到熱點(diǎn)關(guān)聯(lián)分布;而局地型則剛好彌補(bǔ)了這種缺陷,能夠判斷空間數(shù)據(jù)是高值聚集還是低值聚集,因此需要結(jié)合兩種運(yùn)算方法來建模。權(quán)衡之下故本文選擇了Moran’sI指數(shù)。
Moran’s I考察的是相鄰的區(qū)域是否存在相似或相異的指標(biāo)值,I取值范圍為-1到+1,若Moran’s I接近1,說明相似的值在空間上存在明顯的集聚(同高或同低,正相關(guān))。若Moran’s I接近-1,則說明迥異的值存在集聚現(xiàn)象(此高彼低,負(fù)相關(guān))。若Moran’s I接近于0,則說明該空間現(xiàn)象傾向于隨機(jī)分布,不存在空間自相關(guān)現(xiàn)象。
(2)公式檢驗(yàn)
針對Moran’s I指數(shù)的合理性,正態(tài)Z(I)進(jìn)行顯著性檢驗(yàn)[19],當(dāng)Z(I)值大于1.96,即為顯著性高于95%,則為通過顯著性檢驗(yàn),結(jié)論證明熱點(diǎn)集聚。而Z值絕對值愈大,則表明空間集聚或自相關(guān)現(xiàn)象愈明顯。最后滿足局部地域型Moran’sI指數(shù)絕對值接近1且Z(I)值大于1.96等條件既可以完成犯罪熱點(diǎn)的判定。
(3)數(shù)據(jù)挖掘
當(dāng)然,數(shù)據(jù)的運(yùn)用遠(yuǎn)遠(yuǎn)不止在頻率統(tǒng)計(jì)、共詞計(jì)算層次上,單串?dāng)?shù)據(jù)承載的信息是破碎的、單線索式的,因此如果需要結(jié)合信息集成分析和數(shù)據(jù)對比串連來深入挖掘背后的隱藏線索,從而使能達(dá)到以下目標(biāo)。
①通過大數(shù)據(jù)可以鎖定犯罪分子人身信息及位置,在信息集成分析理論的指導(dǎo)下,完善以PGIS為代表的犯罪信息系統(tǒng)中的精確檢索、自動交叉比對和模糊查詢等功能,以案件已有信息為先導(dǎo),進(jìn)行網(wǎng)上查證摸排后串并案件,鎖定破案方向,從而真正落實(shí)了情報信息主導(dǎo)警務(wù)戰(zhàn)略。
②還原重現(xiàn)犯罪過程和犯罪活動的時空軌跡模式,是根據(jù)作案人員、工具、痕跡、物品、動機(jī)、手段和時機(jī)選擇等方面不同的信息數(shù)據(jù)集合的相似以及在時空上的關(guān)聯(lián)(如空間上的首尾相接、時間線上的前后相連、作案手法的繼承等),運(yùn)用數(shù)據(jù)挖掘技術(shù)從更廣泛的角度進(jìn)行案件的串并[20]。
③進(jìn)行犯罪專題研究,發(fā)現(xiàn)犯罪規(guī)律與特點(diǎn)。如高危群體分析、節(jié)假日刑事案件分析、“兩搶一偷”案件與交通的關(guān)系等,進(jìn)行情報的內(nèi)在關(guān)聯(lián)分析,再結(jié)合嫌疑人行為軌跡特點(diǎn)篩選重點(diǎn)嫌疑對象,從而使情報的檢測研判有的放矢。
④通過多套數(shù)據(jù)庫對比,對同類型罪犯、案件、環(huán)境進(jìn)行犯罪行為模式建模,為犯罪事件的預(yù)測做好數(shù)據(jù)準(zhǔn)備。
4.情報多維可視化
經(jīng)過基礎(chǔ)的綜合各城市地塊人口分布、案件性質(zhì)、道路交通格局各個與犯罪緊密相關(guān)的數(shù)據(jù)錄入后,公式計(jì)算、顯著性檢驗(yàn)及最后經(jīng)過圖層疊加分析的地圖輸出都可以通過ArcGIS10軟件來實(shí)現(xiàn),最后利用ArcGIS10[21]技術(shù),制作核心密度估計(jì)圖(即犯罪熱點(diǎn)地圖)來實(shí)現(xiàn)犯罪分布模式和犯罪趨勢面的可視化。
現(xiàn)在PGIS平臺經(jīng)過圖層疊加和電子地圖的結(jié)合,也基本能在較宏觀的層面根據(jù)坐標(biāo)指數(shù)實(shí)現(xiàn)情報的二維平面展示,能夠進(jìn)行基本的定位和分析,制作刑事案件斑點(diǎn)圖,如圖5。
圖5
但是隨著犯罪情報的需要,更趨向微觀和實(shí)時顯示的多維化也越來越需要關(guān)注,主要體現(xiàn)在全息位置地圖、多維動態(tài)場景模擬兩大方面。
全息位置地圖是以空間位置為基礎(chǔ),全面反映位置本身地理人文信息及其與位置相關(guān)的各種特征、事件或物體的數(shù)字地圖,相比二維地圖能夠承載更多的信息細(xì)節(jié),如作為基礎(chǔ)圖層的圖6[22],圖7[23]。
圖6
圖7
多維動態(tài)場景模擬則包括搭建室內(nèi)室外三維模型(如憑建筑數(shù)據(jù)做出的3D動態(tài)模擬場景)、多信息多圖層疊加下的全景地圖、現(xiàn)場重建動態(tài)模擬、影像地圖一體化整合等多重內(nèi)容,可以實(shí)現(xiàn)室外案件中包括涉案建筑場所、交通路線、重點(diǎn)涉案人員等的軌跡疊加分析,指揮部門可動態(tài)模擬某犯罪嫌疑人或所駕車輛的逃離路線和速度,也可模擬人員的流動軌跡,形象直觀地輔助公安人員科學(xué)決策,如人機(jī)交互式可視化。除了必要的室外追逃,人類約80%~90%的時間處于室內(nèi),室內(nèi)環(huán)境的多維動態(tài)場景建模也顯得十分迫切和重要。
5.合法化
因?yàn)橛脩綦[私信息、商業(yè)秘密等都屬于私權(quán)范圍,業(yè)內(nèi)常遵循“誰擁有誰控制”原則,又當(dāng)裁判又當(dāng)運(yùn)動員的情況下缺乏中立的獨(dú)立主體有效監(jiān)督。而情報數(shù)據(jù)過程中,搜集階段常常通過技偵手段秘密進(jìn)行以及數(shù)據(jù)的授權(quán)性使用,又極易侵犯公民的隱私權(quán)和自由權(quán),因而招致很多議。同時由記者斯諾登曝光的美國“棱鏡計(jì)劃”事件以及原重慶公安局長王立軍濫用技偵手段秘密搜集情報等新聞頻發(fā),也引發(fā)了公眾對此的排斥。
因此我們一方面要加強(qiáng)對PGIS數(shù)據(jù)收集的規(guī)范性,提升執(zhí)法人員的法律素養(yǎng),嚴(yán)格保護(hù)公民的合法權(quán)益以及隱私;同時借鑒西方比如美國的陽光法、科學(xué)數(shù)據(jù)共享法令、合同協(xié)議機(jī)制立法等,加強(qiáng)相關(guān)信息使用的法律立法,對大數(shù)據(jù)的合理使用正規(guī)化、合法化。
在本項(xiàng)研究中,由于實(shí)證數(shù)據(jù)的缺乏,同大部分理論一樣,措施構(gòu)想仍停留在紙面理論而未能置于實(shí)踐中論證其合理可行性。對于數(shù)據(jù)多維可視化的發(fā)展方向部分靈感來自影視作品的理論構(gòu)想,PGIS平臺技術(shù)的發(fā)展是否能現(xiàn)實(shí)實(shí)現(xiàn)還有待實(shí)證。
同時,在文中所用于數(shù)據(jù)分析的公式,一方面,跳出了實(shí)際犯罪因子數(shù)據(jù)指標(biāo)的限制,可以統(tǒng)一各地口徑用于全國層面的大數(shù)據(jù)建設(shè),但是另一方面也一定程度的脫離區(qū)域?qū)嶋H,可能導(dǎo)致后期數(shù)據(jù)搜集的偏離,從而影響全局的數(shù)據(jù)分析挖掘。同時在檢驗(yàn)其顯著性時,公式本身也有一些如未能采用標(biāo)準(zhǔn)差,采用方差等生硬的缺點(diǎn),在數(shù)據(jù)計(jì)算分析上可能會有偏差。對于犯罪情報數(shù)據(jù)的研判理論部分,沿用社會解組理論和日?;顒永碚摚睦韺W(xué)、社會學(xué)、統(tǒng)計(jì)學(xué)仍然停留在比較初級的綜合運(yùn)用水平上,沒有很好的綜合三大學(xué)科來解釋犯罪集群效應(yīng)的變化發(fā)展,對于眾多的犯罪事件也能是取一瓢飲,管窺蠡測之下不免有缺陷和疏漏,所以仍待進(jìn)一步的改進(jìn)。
[1] Ucinet,由加州大學(xué)歐文(Irvine)分校的一群網(wǎng)絡(luò)分析者編寫的網(wǎng)絡(luò)分析集成軟件,包含子群分析、統(tǒng)計(jì)分析、矩陣分析、可視化分析等模塊,是目前最流行的,也是最容易上手的社會網(wǎng)絡(luò)分析軟件。
[2]王萌:《警務(wù)大數(shù)據(jù)案例:大數(shù)據(jù)預(yù)測分析與犯罪預(yù)防》,來源http://www.ctocio.com/ccnews/15551.html,最后訪問日期2019年5月7日。
[3]美國學(xué)者Sampson和Groves在1989年提出了社會解組理論(研究鄰里社區(qū)環(huán)境中經(jīng)濟(jì)社會地位、種族多樣性和人口流動性因素對犯罪發(fā)生的影響),學(xué)者Cohn和Felson提出了日常活動理論——主要研究有動機(jī)的犯罪(motivated offenders)、合適的目標(biāo)(suitable targets)和犯罪防范的缺失(absence of capable guardians against crime)三大因素對犯罪發(fā)生的影響。這兩大理論在社會學(xué)領(lǐng)域內(nèi)分別探討了不同犯罪因子對犯罪發(fā)生的催化作用,是犯罪地理學(xué)、犯罪生態(tài)學(xué)的核心理論之一。
[4]劉大千:《長春市犯罪空間分析及規(guī)劃管理防控》,東北師范大學(xué)2012年博士學(xué)位論文,第25-26頁。
[6] “金盾”工程,實(shí)質(zhì)上就是公安通信網(wǎng)絡(luò)與計(jì)算機(jī)信息系統(tǒng)建設(shè)工程,1999年開始啟動準(zhǔn)備,工程包括全國公安綜合業(yè)務(wù)通信網(wǎng)、全國違法犯罪信息中心(CCIC)、全國公安指揮調(diào)度系統(tǒng)工程、全國公共網(wǎng)絡(luò)安全監(jiān)控中心等系統(tǒng)建設(shè),現(xiàn)已經(jīng)實(shí)施到第二期。“金盾工程”二期三大應(yīng)用平臺分別是指是指“公安情報信息綜合平臺”、“警用地理信息基礎(chǔ)應(yīng)用平臺”和“部門間信息共享與服務(wù)平臺”。
[7]圖例中初始數(shù)據(jù)統(tǒng)計(jì)來源于美國勞動統(tǒng)計(jì)局,基礎(chǔ)圖層出自麥肯錫公司會議報告上.Bigdata:The next frontier for innovation,competition,and productivity,2011
[8] 赫芬達(dá)爾—赫希曼指數(shù)(Herfindahl-HirschmanIndex),簡稱HHI,來自于經(jīng)濟(jì)學(xué)中研究大企業(yè)對市場的影響程度——數(shù)值越接近1,壟斷集中度越高,現(xiàn)多用于檢測自相關(guān)性和聚集效應(yīng)的分析。
[9] Wordle圖,即采用用色相區(qū)分不同的關(guān)鍵詞類型的著色可視化方法。
[10]散點(diǎn)圖矩陣是散點(diǎn)圖的高維擴(kuò)展,可以添加其他圖形元素,以增強(qiáng)表達(dá)力,最常見的添加劑有坐軸須、直方圖、箱線圖、平滑曲線、擬合曲線等。它從一定程度上克服了在平面上展示高維數(shù)據(jù)的困難,在展示多維數(shù)據(jù)的兩兩關(guān)系時有著不可替代的作用。
[11]一種軟件系統(tǒng),能獲取高精度、高密度的三維坐標(biāo)點(diǎn)云數(shù)據(jù)和空間對象的深度信息,構(gòu)建具有準(zhǔn)確幾何信息的三維立體模型。
[12]一個用于構(gòu)建定制應(yīng)用的完整的嵌入式的GIS組件庫,可以用于數(shù)據(jù)可視化。
[13] I2軟件是IBM公司的一款面向警務(wù)、情報、調(diào)查及商業(yè)組織提供領(lǐng)先全球的可視化情報分析調(diào)查的軟件產(chǎn)品。
[14] 根據(jù)這一理論,犯罪發(fā)生在距離平均中心一個標(biāo)準(zhǔn)差距離內(nèi)的概率為68%,發(fā)生在距離平均中心兩個標(biāo)準(zhǔn)差距離內(nèi)的概率為95%。也就是說,在這一分析模型中,下一起案件只有5%的概率會發(fā)生在兩個標(biāo)準(zhǔn)差距離的劃定范圍之外。
[15]一種情報分級制度,按照情報提供人參與程度將情報來源渠道分為“親自參與、親眼目睹、直接耳聞、間接耳聞”四級。
[16]空間自相關(guān)是指同一個變量在不同空間位置上的相關(guān)性,通俗的講便是測量同一類事物之間互相影響從而出現(xiàn)的特殊分布規(guī)律。
[17]這里是基于全局型Moran’s I指數(shù)的缺點(diǎn),Anselin在1995年提出的LISA(local indicators of spatial association,空間關(guān)聯(lián)局域指標(biāo)),與全局空間自相關(guān)成比例,能夠比較契合的找到了相關(guān)具體犯罪熱點(diǎn)。
[18]全局G系數(shù),Getis和Ord于1992年提出用于測量空間自相關(guān)性的公式。
[19]針對Moran’s I指數(shù)的合理性檢驗(yàn),有標(biāo)準(zhǔn)近似值(normal approximation)的正態(tài)Z(I)和隨機(jī)化試驗(yàn)化進(jìn)行兩種方式進(jìn)行顯著性檢驗(yàn),因?yàn)榍罢吒啽?,故采用前者?/p>
[20]張春敏、郭云嫣、劉全海著:《室內(nèi)外多維時空數(shù)據(jù)融合及其在PGIS中的應(yīng)用》,載《測繪通報》2016年第12期。
[21] 2010年,Esri公司推出ArcGIS10,作為全球首款支持云架構(gòu)的GIS平臺,實(shí)現(xiàn)了GIS由共享向協(xié)同的飛躍;同時ArcGIS10具備了真正的3D建模、編輯和分析能力,并實(shí)現(xiàn)了由三維空間向四維時空的飛躍,逐步做到了真正的RS(遙感)與GIS一體化。
[22]圖6為通過三維建模后結(jié)合電子信息地圖搭建的實(shí)地模型,可以查閱包括海拔高度、地形分布、經(jīng)緯位置、水文分布等多重信息。
[23]圖7是SkylineGlobe公司推出的軟件做出的3D視域分析,可以幫助快速找到各類信息的分布及狀況程度,還可以在此基礎(chǔ)上再借助該過程僅依靠簡單連續(xù)的標(biāo)準(zhǔn)二維圖像(如傾斜攝影測量影像),創(chuàng)建一組高分辨率的三維網(wǎng)格模型,無需人工干預(yù),快速構(gòu)建城市級3D模型。
本文系國家社會科學(xué)基金重大項(xiàng)目(項(xiàng)目批準(zhǔn)號:17VHL004)的階段性成果。
*韓旭,男,四川大學(xué)法學(xué)院教授、博士生導(dǎo)師,中國法學(xué)會犯罪學(xué)研究會常務(wù)理事。
熊鑫,男,四川大學(xué)法學(xué)院,訴訟法學(xué)碩士生,研究方向偵查學(xué)、訴訟法學(xué)。
(責(zé)任編輯:廖根為)