朱 琳, 黃一洲
(中國人民武裝警察部隊學院, 河北廊坊 065000)
Lorenz曲線在毒品情報分析中的應用研究
朱 琳, 黃一洲
(中國人民武裝警察部隊學院, 河北廊坊 065000)
Lorenz曲線可以用來對毒品犯罪案件的時間、空間、模式分布狀況進行分析,通過分布分析可以發(fā)現(xiàn)毒品犯罪案件的分布規(guī)律并預測未來發(fā)展趨勢,為禁毒部門提供決策支持?;贚orenz曲線構建分析模型,并通過模擬數(shù)據(jù)進行計算說明。該方法簡單實用,在毒品情報分析領域中具有廣闊的應用前景。
Lorenz曲線; 毒品情報; 分布分析; 聚集性分布; 毒品犯罪
Lorenz曲線可以用來對分布狀況進行分析,這種方法廣泛應用于公安情報分析領域,是一種定量研究方法[1]。本文將Lorenz曲線引入毒品情報分析中來,用該曲線對毒品犯罪案件各要素的分布狀況進行分析,不僅可以有效分析毒品犯罪的活動規(guī)律與作案手段,還能預測未來發(fā)展趨勢,為開展有針對性的預防與偵查措施、制定禁毒策略等提供借鑒和參考。在大數(shù)據(jù)時代以及情報主導警務的戰(zhàn)略背景下,Lorenz曲線在毒品情報分析中具有廣闊的應用前景。
Lorenz曲線(Lorenz curve)是美國統(tǒng)計學家洛倫茲提出的用來描述社會收入分配狀況的一種曲線,它由所觀察的人口數(shù)占總人口中的百分比與這部分人口所獲得的收入占總收入中的百分比狀況來表示。通過Lorenz曲線,可以直觀地看到一個國家收入分配均衡狀況[2]?;嵯禂?shù)就是根據(jù)Lorenz曲線進行數(shù)學計算而得出的。除了收入分配研究領域外,其在人力、衛(wèi)生、能源資源配置,以及經(jīng)濟領域的風險投資、信貸、就業(yè)、產業(yè)結構等方面的配置與優(yōu)化中均有廣泛應用。值得一提的是,Lorenz曲線已被應用于對全球恐怖襲擊的時空分布進行聚集性分析[3]。
信息、知識和情報是以離散形式分布的,并在離散分布基礎上趨向于集中[4]。離散分布現(xiàn)象不僅僅存在于文獻情報領域,在毒品情報中也普遍存在。在實際工作中往往發(fā)現(xiàn),毒品犯罪案件通常集中于特定的時間、人群、地點,采用特定的手段,也就是說,一定時期內某一類少數(shù)人群實施的某一類型毒品犯罪案件占到全部同類型案件的較大比重。毒品犯罪的不均衡性,要求警方必須有針對性地合理配置、調度警力資源,做到有效預防和控制犯罪。而這一切的基礎,就在于對這種不均衡分布規(guī)律的分析、發(fā)現(xiàn)和把握。Lorenz曲線能對分布狀況進行分析,判斷是否呈聚集性分布,并能在聚集性分布的情況下得出有價值的信息,以滿足毒品情報分析的需要。
綜上所述,從Lorenz曲線的定義與特點出發(fā),可以清楚地看到,應用Lorenz曲線進行分布分析的方法在毒品情報分析中是可行的,分析結果對打擊毒品犯罪具有一定參考價值。
毒品情報的Lorenz曲線分析模型可以用來對毒品犯罪案件的分布狀況進行分析。在毒品犯罪案件分布狀況的分析中,每一種分布模式都由事件與因素兩個要素組成,是事件在因素中的數(shù)量分布。例如,在事件“在20%的小區(qū)中實施了80%以上的毒品犯罪案件”中,“小區(qū)”(小區(qū)以個為單位,每個小區(qū)都是可比、對等的),就是毒品犯罪案件分布的因素。構建Lorenz曲線分析模型,首先應把所分析事件的各個不同因素對應的頻率按從低到高順序進行排序,再計算各因素對應事件的累計百分比,然后以累計百分比作為y軸,每個因素占所有因素個數(shù)累計百分比作為x軸作圖,即得到Lorenz曲線,如圖1所示。
圖1 Lorenz曲線分析模型
如果毒品犯罪案件在不同因素上呈現(xiàn)均勻分布,則Lorenz曲線在圖1中表現(xiàn)為與對角線y=x重合,說明毒品犯罪案件在該分析對象上不存在聚集性與熱點。如果毒品犯罪案件存在特殊的熱點,則Lorenz曲線的表現(xiàn)特征為:毒品犯罪案件的對應事件累計百分比在初始階段非常緩慢地增長,然后到最后幾個因素時快速增長并很快達到坐標點(1,1)。如圖1所示,如果把Lorenz曲線和對角線y=x之間的面積設定為A,Lorenz曲線與x軸間的面積設定為B,則A/(A+B)這一比值即可以用來判斷該曲線是否呈聚集性分布,在收入分配領域,A/(A+B)這一比值即為基尼系數(shù),本文中稱其為毒品犯罪案件的聚集性系數(shù)G。而從數(shù)學角度來看,計算聚集性系數(shù)G往往采用積分公式進行計算(式中L為Lorenz曲線的函數(shù)表達式):
一般而言,聚集性系數(shù)G越大說明分布狀況越不均衡,即聚集性越明顯,綜合Lorenz曲線已有的應用經(jīng)驗來看,如果聚集性系數(shù)G大于0.4,可以認為該Lorenz曲線呈現(xiàn)聚集性分布,如果大于0.5,則屬于分布狀況極端不均衡,即毒品犯罪案件在特定因素中存在嚴重的分布不均現(xiàn)象,即具有極強的聚集性,這一結果也表明毒品犯罪案件在特定因素中可能存在熱點。
在可能存在熱點的情況下,為確定不同因素對應的毒品犯罪案件熱點,引入ABC分類管理法。該方法可辨識多個樣本中的主要事物和次要事物,即把累計頻率曲線分為3個區(qū)間(如圖1所示):20%~100%所對應的部分為Ⅰ類區(qū)間,對應的研究對象稱之為主要事物;10%~20%為Ⅱ類區(qū)間,對應的研究對象稱之為次要事物;而0~10%為Ⅲ類區(qū)間,對應的對象稱為更次要事物[6]。在本文的研究中,Ⅰ類區(qū)間對應的研究對象即為毒品犯罪案件的熱點因素。
Lorenz曲線廣泛應用于毒品情報分析中,如上文所述,只要將分析對象劃分為若干類,每一類可通過某種計量標準統(tǒng)計得出一個具體的數(shù)量,那么都可以對分布狀況進行分析并得出具體熱點。毒品犯罪情報分析主要包括以下幾方面。
3.1 時間分布分析
如果毒品犯罪案件在作案時間上呈現(xiàn)聚集性分布,那么就可以得出高危時段在什么時候。也就是說,從全年來看,可以知道是哪幾個月毒品犯罪案件數(shù)量高發(fā),從某個月來看,可以知道是上旬、中旬還是下旬毒品犯罪案件數(shù)量高發(fā),從一天的時間段來看,如果以1小時或2小時這樣的時間段為單位劃分成若干個時間段,就可以知道是哪幾個時間段毒品犯罪案件高發(fā)。只要掌握的毒品情報信息足夠多,達到海量的程度,則分析結果就越精確,這就可以為公安機關制定有針對性的防控、打擊戰(zhàn)略提供參考,在防范、打擊活動的時間規(guī)劃上更加科學,從而更加合理地調度警力資源,達到理想的效果。
表1所示為某地區(qū)過去一年里所統(tǒng)計的每月毒品犯罪案件數(shù)量情況(文中的數(shù)據(jù)均為虛擬數(shù)據(jù),用于舉例說明),根據(jù)上文所構建分析模型,如表2所示,首先將每月案件數(shù)量進行升序排列,并將由低到高排列的月份從1~12進行編號,將每個月份對應的編號除以總的編號12,由此可得出編號累計占比,所得各結果依次為Lorenz曲線圖的x軸上的坐標點。將每月案件數(shù)量除以一年總的案件數(shù)量,就可得出每月案件數(shù)量占全年案件數(shù)量的所占比例,再將這一占比根據(jù)升序排列的月份次序依次進行累加,得到數(shù)量累計占比,所得各結果依次即為Lorenz曲線圖的y軸上的坐標點。根據(jù)編號累計占比(x軸)及數(shù)量累計占比(y軸)作出對應Lorenz曲線圖,如圖2所示。
表1 每月毒品犯罪案件數(shù)量
表2 Lorenz曲線分析模型構建
圖2 毒品犯罪案件每月數(shù)量Lorenz圖
據(jù)此可算出聚集性系數(shù)G為0.506,超出0.5這一極端值,因此可認為該地區(qū)毒品犯罪案件數(shù)量在全年的分布狀況呈現(xiàn)強聚集性,其中10、11、6、5、4、12月份位于Ⅰ區(qū)間,即熱點,也就是高危時段所在,其中12、4月份案件數(shù)量聚集性更加明顯,由于Ⅰ區(qū)間這6個月份集中在一年中的第二季度、第四季度,以這一結果作為參考,公安機關可以在這兩個季度加大防控與打擊力度,或者可以開展專項行動等。而在這兩個季度中,可分別以4月和12月作為重點月份開展工作。分別統(tǒng)計這兩個月毒品犯罪案件數(shù)量分布情況,還可以得出應該在上旬、中旬還是下旬開展專項行動。
3.2 空間分布分析
此處的空間指的是地理位置。從每一起毒品犯罪案件中,公安機關收集到關于地理位置的信息,經(jīng)過整理可以得出有價值的毒品情報,用來進行毒品犯罪案件空間分布分析。例如,公安機關可以將轄區(qū)劃為若干地段,統(tǒng)計某個時間段內每個地段的毒品犯罪案件數(shù)量,然后進行空間分布分析,如果呈現(xiàn)空間上的聚集性分布,就可以發(fā)現(xiàn)哪里是高危區(qū)域,從而有針對性地部署防控與打擊行動。表3所示為過去某段時間內將某地劃分為若干轄區(qū)后統(tǒng)計的查獲毒品犯罪案件數(shù)量,以此得出Lorenz曲線分析結果,如圖3所示。圖中Lorenz曲線的聚集性系數(shù)為0.722,屬于強聚集性分布,結果顯示圖3中①~④號(分別對應表3中15、9、5、14號轄區(qū))是查獲的毒品犯罪案件的熱點區(qū)域,應當加大在這4個區(qū)域的公開查緝力度或者有針對性地開展專項行動以打擊毒品犯罪。
表3 各轄區(qū)查獲的毒品犯罪案件數(shù)量
圖3 各轄區(qū)查獲的毒品犯罪案件數(shù)量Lorenz曲線圖
不僅僅是毒品犯罪案件中可以獲得有關空間信息的毒品情報,對吸食毒品的人員進行登記、管理,從中也可以獲得有關空間信息的毒品情報,例如,可以統(tǒng)計經(jīng)常吸食毒品的地點,或經(jīng)常進行毒品交易、獲取毒品的地點,以進行空間分布分析。
3.3 模式分布分析
模式的類型有很多,如身份模式、行為模式、吸食毒品類型模式等,對毒品犯罪案件的模式分布進行分析,其目的在于找出特征模式,以指導防控與打擊工作。例如,無論是販毒人員還是吸毒人員,其個人信息,如職業(yè)、年齡、收入、文化程度、籍貫等,都可以直接或按一定標準的區(qū)間劃分為若干類,對每一類進行數(shù)量統(tǒng)計,就可以進行分布分析,從而可以用來指導判斷哪些類型的人員屬于高危人員,為偵查、訊問工作提供參考。當前,販毒分子不斷變換藏毒方式、販運手法、路線,使販毒手段更加隱蔽化、智能化,可以說販毒手法層出不窮,以藏毒方式來說,可以分為箱體藏毒、人體外藏毒、車體藏毒、食品藏毒、工具藏毒、生活用品藏毒、人體內藏毒等,統(tǒng)計每種藏毒方式對應的案件數(shù)量,并進行分布分析,就有可能發(fā)現(xiàn)一段時期內販毒人員的熱點藏毒方式,這對開展公開查緝、邊防檢查有指導意義。統(tǒng)計每一件毒品犯罪案件涉及的毒品種類、重量等信息,對此開展分布分析,可以從宏觀層面了解毒品犯罪趨勢,對于禁毒工作的開展與毒品檢驗工作都具有指導意義。
在當前情報信息主導警務的戰(zhàn)略背景下,不僅是公安機關,包括各有關戒毒機構、銀行等,都掌握有海量的有關毒品犯罪案件的信息,將這些海量信息進行處理,形成毒品情報,深入挖掘其背后隱藏的價值,進行毒品情報分析以指導毒品犯罪案件的防控與打擊工作[6]。本文將Lorenz曲線的方法引入毒品情報分析領域,進行時間、空間、模式的分布分析,并通過ABC分類管理法找出相應熱點。在實際應用與下一步工作中還需要注意、做好以下兩點:
(1)雖然Lorenz曲線的理論與實踐研究都比較成熟,并且從已有研究成果看,無論是在收入分配領域,還是在廣泛的其他應用領域中,均以基尼系數(shù)(即本文的聚集性系數(shù)G)數(shù)值大于0.4作為判斷分布狀況是否具有聚集性的標準,有的研究當中還把此系數(shù)數(shù)值大于0.5作為具有較強聚集性的標準,但是在毒品情報分析領域,0.4作為判斷聚集性的警戒值是否合理,還有待進一步地分析研究與實例驗證。
(2)為了得出呈聚集性分布的具體熱點,本文選用ABC分類管理法將累計頻率占比分為3個區(qū)間(Ⅰ、Ⅱ、Ⅲ區(qū)間),其中20%~100%的Ⅰ區(qū)間為熱點所在區(qū)間,該區(qū)間已被用于判斷恐怖襲擊的時空分布熱點[4],而在毒品犯罪案件中,這一區(qū)間是否最合理,也有待更多的實例分析加以界定。0~10%、10%~20%這兩個區(qū)間雖然不是熱點分布所在,但也不能忽略不計,因為在這兩個區(qū)間內的要素一旦產生作用,其影響程度很有可能比熱點區(qū)間的影響更大。此外,毒品犯罪案件與Lorenz曲線在上文提及的其他應用領域相比,有其特殊性,其熱點分布是不斷變化的,例如,公安機關在高危時段、高危地段,或者對某類販毒方式開展有針對性的打擊行動之后,毒品犯罪分子往往會轉變其作案時段、地段、方式,這樣,雖然仍然呈聚集性分布,但熱點分布會發(fā)生動態(tài)變化,因此要進行動態(tài)分析。
[1] 謝曉專,周西平. 基于層次結構的公安情報分析方法研究進展[J]. 圖書情報工作,2012(10):103-109.
[2] 杜榮川. 洛倫茲曲線的模擬與基尼系數(shù)的測定[J]. 云南經(jīng)濟管理干部學院學報,2000(2):51-53.
[3] 李國輝. 全球恐怖襲擊時空演變及風險分析研究[D].合肥:中國科學技術大學,2014.
[4] 靖繼鵬,馬費成,張向先. 情報科學理論[M]. 北京:科學出版社, 2009:32-35.
[5] 楊曉樓. ABC分類管理法在物流領域的應用[J]. 物流技術,2013(21):67-69.
[6] 郭冠男. 大數(shù)據(jù)視野下禁毒情報工作存在的問題及對策[J]. 河南司法警官職業(yè)學院學報,2016(3):116-119.
(責任編輯 于瑞華)
2016年河北省高等學校人文社會科學項目“面向邊境安全風險防控的情報分析預警體系研究”(SQ162023)。
朱 琳(1972—),女,黑龍江哈爾濱人,副教授。研究方向為公安情報學。
D918.2