胡嘯峰, 鄭云勇
(1.中國人民公安大學信息技術與網(wǎng)絡安全學院, 北京 100038; 2.北京市公安局朝陽分局, 北京 100028)
近年來,犯罪時空熱點分布作為一種重要的情報信息,對安全防范、犯罪偵查與打擊等多方面的公安業(yè)務起到了支持作用。面向具體業(yè)務支持的犯罪時空熱點分析研究方法也得到了較好的發(fā)展[1-2]。如陳鵬等[3]利用實際案例數(shù)據(jù)對層次聚類算法與核密度估計算法的熱點分析結果進行了比較,并對基于層次聚類算法的犯罪熱點分析在情報分析和警務決策方面的應用進行了討論。徐沖等[4]利用街頭搶劫犯罪數(shù)據(jù),計算了無時空臨近相似性、時間臨近相似性、空間臨近相似性和時空臨近相似性4 種不同算法所得到的犯罪熱點圖,并以之預測未來的街頭搶劫案件。陸娟等[5]提出了一種以多尺度空間聚集為基礎的犯罪熱點探測方法,實現(xiàn)了基于特定基準變量的熱點探測風險調整,并可滿足對犯罪高發(fā)地區(qū)和高危地區(qū)的熱點探測需求;陳鵬等[6]利用日?;顒永碚摵虯gent犯罪模擬,提出了一種具有信息反饋機制的時空犯罪熱點預測模型,能夠預測時空犯罪熱點的變化;柳林等[7]以犯罪地理學視角,綜合運用平均最近鄰、核密度以及負二項回歸等研究方法,對某市5 類詐騙警情的時空分布特征和面向建成環(huán)境與社會環(huán)境兩個角度的影響因素進行了探討,證實了各類詐騙犯罪符合日?;顒永碚摰睦碚摷僭O;徐沖等[8]選取某市中心城區(qū)作為研究區(qū)域,依據(jù)其建立的“熱點時空類型矩陣”的時間分布和空間分布模式,對每類模式下的街頭搶劫犯罪提出了有針對性的防控對策。
然而,在當前的犯罪時空熱點研究中,也存在一個重要問題有待解決:犯罪空間熱點往往是根據(jù)大量的不考慮時間分布特點的數(shù)據(jù)而分析得到的空間事件聚集熱點,而分散于不同時間區(qū)間的數(shù)據(jù)則可能并不能形成熱點區(qū)域;而犯罪時間熱點往往是根據(jù)大量的不考慮空間分布特點的數(shù)據(jù)而分析得到的時間聚集熱點,而分散于不同空間位置的數(shù)據(jù)則可能并不能形成熱點時段。因此,傳統(tǒng)方法在為派出所巡邏、犯罪打擊、視頻巡控等具體工作提供指導意見時則極有可能造成分析結果與一線民警實際經(jīng)驗不吻合的情況,或者時空熱點所覆蓋的時空范圍過大,不利于從中抽取工作重點。
本文依據(jù)犯罪空間熱點分析和時間熱點分析的基礎理論和方法,提出了一種基于特定樣本抽取的時空熱點探索方法,使得到的時間-空間熱點具有時空吻合性,有利于對實際工作的指導。在此基礎上,利用實際數(shù)據(jù),以入室盜竊和扒竊兩類數(shù)據(jù)量大、規(guī)律性強的盜竊類犯罪為例,展開了案例分析,驗證了該方法的有效性。
本文提出的盜竊類犯罪時空熱點分析方法如圖1所示。
圖1 盜竊類犯罪時空熱點分析方法
盜竊類犯罪時空熱點的探索分為 5個步驟:
(1)全樣本時間熱點分析
在研究關注的完整時空邊界內,以多種時間刻度(月、周、日、時等)為維度,統(tǒng)計全部樣本在不同時間維度上的犯罪數(shù)量,并通過插值方法增強數(shù)據(jù)的可視效果,形成邊界平滑的時間熱點分布。
(2)全樣本空間熱點分析
在研究關注的完整時空邊界內,運用空間熱點分析方法,計算基于全部樣本的空間熱點分布。
(3)特定樣本空間熱點分析
以(1)中分析得到的時間熱點對應的數(shù)據(jù)作為分析樣本,運用空間熱點分析方法,計算基于該樣本的空間熱點分布。
(4)特定樣本的時間熱點分析
以(2)中分析得到的空間熱點對應的數(shù)據(jù)作為分析樣本,運用與(1)中相同的時間熱點分析方法,計算基于該樣本的時間熱點分布。
(5)決策支持
以(3)和(4)的分析結果作為優(yōu)先用于決策支持的時空熱點,為視頻巡控、巡邏等相關警務工作直接提供建議。
在時間熱點的計算過程中,為了增強其可視化效果,應用了MATLAB 4格點樣條函數(shù)內插方法[9],可以獲得二維平面的平滑分布效果,從而可以實現(xiàn)對月- 周、周- 時等維度的時間熱點探索。
在空間熱點的計算中,采用了核密度估計法[10-12]。核密度估計是空間分析領域中的一種典型的空間熱點分析技術。本文利用地理信息系統(tǒng)(Geographic Information System,簡稱GIS)中的核密度估計功能來實現(xiàn)扒竊與入室盜竊的空間熱點探索。核密度估計的原理為:在每一個盜竊事件(扒竊或入室盜竊)發(fā)生的空間位置上設置一個核密度函數(shù),用所有盜竊事件的密度函數(shù)來表示盜竊事件在空間范圍內的分布[13]。對于某個區(qū)域內的盜竊事件,其密度分布表示為所有盜竊事件鄰域內的核密度函數(shù)的貢獻之和。因此,對于空間上分布的盜竊事件x1,x2,…,xn中的任意一點x,鄰域內的其他點xi對其貢獻率由x到xi的距離決定。根據(jù)盜竊事件發(fā)生的實際地點,利用Xgeocoding進行地理解碼,得到盜竊事件發(fā)生地點的經(jīng)緯度,而盜竊事件發(fā)生地點之間的距離則由ArcGIS依據(jù)經(jīng)緯度直接換算為以米為單位的兩點間直線距離。x處的概率密度可以表示為[14-15]:
(1)
其中τ為核函數(shù)的帶寬,k(·) 為用高斯正態(tài)分布表示的核函數(shù),x-xi為兩個事件之間的距離。在將研究區(qū)域內所有事件點的核函數(shù)求和后,即得到盜竊空間熱點的分布結果。
本文利用某直轄市某派出所轄區(qū)(TYG)2012~2014年的全部扒竊和入室盜竊數(shù)據(jù)(扒竊數(shù)據(jù)共1 153條,入室盜竊數(shù)據(jù)共1 272條),按照圖1所示的5個步驟,進行了案例分析。考慮到空間邊界效應,在特定樣本空間熱點分析中將不考慮邊界位置的高密度區(qū)域。
圖2所示為2012~2014年TYG區(qū)域扒竊與入室盜竊案件數(shù)量的時間分布。從總體趨勢來看,扒竊案件的數(shù)量呈波動上升趨勢,于2014年7~12月呈現(xiàn)出了較快的升高態(tài)勢,并于2014年12月達到峰值49起/月。入室盜竊案件數(shù)量總體上未呈現(xiàn)明顯的升高與降低趨勢,但呈現(xiàn)出了一定的季節(jié)性,春秋季節(jié)發(fā)案率較高而冬夏季節(jié)則相對較低。
圖2 2012~2014年TYG區(qū)域扒竊與入室盜竊案件數(shù)量的時間分布
圖3 全樣本扒竊與入室盜竊案件的時間熱點分析
為進一步分析兩類案件的時間分布情況,首先對全樣本進行了時間熱點分析,如圖3所示。從案件的“月/周”二維時間熱點的分布情況來看,高發(fā)案時間主要集中于11~12月期間,11月的扒竊案件多發(fā)生于周三~周四,而12月的發(fā)案熱點則多為周二、六、日。入室盜竊案件的時間熱點則與扒竊案件差別很大,多集中于6月的周四、周五。從“周/時”二維分布情況來看,扒竊案件多集中于周中(周一~周五)的上午6~9時,16~20時,以及周末的12~18時。入室盜竊案件則主要集中于周中的6~9時,以及周末的22~23時。由于在全樣本的時間熱點分析中,未考慮數(shù)據(jù)的空間異質性,很難對時間分布的具體原因展開討論,需要依賴由空間熱點中提取的數(shù)據(jù)展開進一步分析。
圖4所示為基于全數(shù)據(jù)樣本的扒竊與入室盜竊案件的空間熱點分布。由核密度估計的結果可以看出,入室盜竊案件的熱點區(qū)域主要為C、D兩個區(qū)域,而在圖中左上住宅區(qū),也存在面積略小、等級略低的熱點。C、D兩個住宅區(qū)為TYG區(qū)域內的回遷房集中區(qū)域,人員流動性大、安防措施較為落后,且多數(shù)房屋處于租賃狀態(tài)(多為合租),為入室盜竊的實施提供了較為方便的環(huán)境。扒竊案件的熱點區(qū)域主要為A、B兩個區(qū)域,A、B兩個區(qū)域為TYG地區(qū)最大的商業(yè)中心,說明該地區(qū)的扒竊案件主要為商場扒竊。為進一步研究以上熱點區(qū)域在熱點時段是否穩(wěn)定存在,利用由時間熱點中抽取的數(shù)據(jù)展開了進一步的研究。
圖4 全樣本扒竊與入室盜竊案件的空間熱點分析
在基于特定樣本的時間熱點分布中,首先根據(jù)全樣本空間熱點分布情況,確定A、B、C、D 4個熱點區(qū)域位置,利用ArcGIS,在4個熱點區(qū)域的邊界范圍內,分別提取全部的扒竊或入室盜竊數(shù)據(jù),共得到A區(qū)64條數(shù)據(jù),B區(qū)90條數(shù)據(jù),C區(qū)57條數(shù)據(jù),D區(qū)52條數(shù)據(jù),利用提取后的數(shù)據(jù),進行時間熱點分析。
圖5所示為基于A、B、C、D 4個空間熱點區(qū)域的數(shù)據(jù)得到的時間熱點分布情況,可以看出A、B兩個商場的扒竊案件的時間熱點主要為周末(周六、日)的12~18時,且在這一時段呈現(xiàn)出了“兩頭重、中間輕”的熱點分布形態(tài)。此分布形態(tài)與商場客流情況密切相關,因為中午12時和下午18時左右為主要的餐飲和購物時間,人流量大,扒竊機會較多,且周末人們在逛街購物時通常心情放松,疏于戒備,從而為犯罪分子提供了可乘之機。而除此之外,周一~周三的下午18時左右,即晚餐時段,A、B兩個商場也同時出現(xiàn)了等級略低的扒竊熱點,兩個區(qū)域的一致性也反映了TYG地區(qū)扒竊犯罪的重要規(guī)律,可以為民警開展犯罪預防、打擊工作提供決策支持。
C、D兩個住宅區(qū)的時間熱點分布則與圖2中所示的時間熱點分布有相似之處,即周中的上午6~9時為C、D兩區(qū)共同的時間熱點區(qū)域,說明入室盜竊案件的時間熱點分布特點均有較好的一致性。但具體來說,C區(qū)相對于D區(qū)而言,犯罪數(shù)量更多,熱點面積更大。
在基于特定樣本的空間熱點分布中,首先根據(jù)全樣本時間熱點分布情況,確定不同時間熱點范圍內的犯罪數(shù)據(jù),共得到周中6~9時的入室盜竊數(shù)據(jù)92條,周末22~23時的入室盜竊數(shù)據(jù)14條,周末12~18時的扒竊數(shù)據(jù)70條,以及周一~周三的16~20時的扒竊數(shù)據(jù)75條,利用提取后的數(shù)據(jù),進行空間熱點分析。
圖5 特定區(qū)域扒竊與入室盜竊案件的時間熱點分析
如前所述,入室盜竊犯罪的時間熱點具有較強的穩(wěn)定性,因此,首先提取了周中的6~9時的數(shù)據(jù)進行了空間核密度估計,結果與圖4所示的C、D兩個熱點幾乎完全一致。
利用圖2中所示的另一個入室盜竊時間熱點(周末的22~23時)對應的數(shù)據(jù)進行了空間熱點分析,結果如圖6所示??梢娫摃r間熱點所對應的空間熱點區(qū)域與圖4所示的空間熱點分布具有不同。D區(qū)在該時段形成入室盜竊的空間熱點,而在TYG中間的頸部區(qū)域則形成了另一個空間熱點,而該區(qū)域并不是回遷房集中區(qū)域,可見,周末22、23時的時間熱點與周中6~9時的熱點成因和熱點性質具有一定的區(qū)別。
對于扒竊案件,驗證了周末的12~18時,以及周一~周三的16~20時對應的空間熱點分布,所得結果與圖4所示的空間熱點分布情況完全一致,圖6所示為周一~周三的16~20時對應的空間熱點分布情況。可見,TYG區(qū)域的扒竊空間熱點主要存在于A和B兩個商場區(qū)域,說明扒竊犯罪案件在時空分布上具有較強的穩(wěn)定性。
通過以上分析可以看,A、B兩個商業(yè)區(qū)域在周一~周三的16~20時以及周末的12~18時為扒竊案件的時空熱點,C區(qū)周中的6~9時、周末22~23時,以及D區(qū)周中的6~9時為入室盜竊的時空熱點。以上時空熱點可以作為犯罪打擊、安全防范、視頻巡控等工作的重點關注時間與區(qū)域。
基于全樣本的空間熱點,有可能是分布于不同時段的事件累積而成,同樣,基于全樣本的時間熱點,則可能是分布于不同區(qū)域的事件累積而成。與全樣本的時間熱點分析和空間熱點分析相比,基于特定樣本的時空熱點分析具有時空一致性特點,即可以保證在熱點時段的熱點區(qū)域,開展巡邏、排查工作的可信度,對警務實戰(zhàn)決策具有直接指導意義。
本文提出了一種基于特定樣本數(shù)據(jù)抽取的犯罪時空熱點探索方法,即首先使用全樣本數(shù)據(jù)進行時間熱點和空間熱點識別,進而在時間熱點對應的數(shù)據(jù)集中進行空間熱點分析,在空間熱點對應的數(shù)據(jù)集中進行時間熱點分析,綜合兩方面的分析結果得出面向實際警務工作的決策支持結論。
圖6 特定時段扒竊與入室盜竊案件的空間熱點分析
利用某市TYG區(qū)域的實際犯罪數(shù)據(jù),以入室盜竊和扒竊兩類數(shù)據(jù)量大、規(guī)律性強的盜竊類犯罪為例,展開了案例分析,結果表明,兩種不同類型的盜竊犯罪,其時空熱點分布差別較大。TYG區(qū)域內的兩大商業(yè)區(qū)在周一~周三的16~20時以及周末的12~18時為扒竊案件的時空熱點,周中的6~9時的回遷房聚集度高的住宅區(qū)是入室盜竊犯罪的時空熱點,而周末的22~23時的時間熱點則不一定出現(xiàn)于全部回遷房高聚集住宅區(qū)。
在派出所控制盜竊案件發(fā)案率的工作中,由于警力有限,通常只能以少數(shù)巡警、治安民警、社區(qū)民警和輔警在重點區(qū)域和時段展開巡邏、排查等工作。熱點區(qū)域的熱點時段則可以作為民警開展工作的首選時空節(jié)點。因此,本文的研究結果可以為犯罪打擊、安全防范、視頻巡控等工作提供宏觀決策支持。