謝振東 文帆 周子雅 歐輝
摘 要 恐怖襲擊威脅人類社會安全.選取全球恐怖主義數(shù)據(jù)庫(Global Terrorism Database,GTD)中2015-2017年世界上發(fā)生的恐怖襲擊事件的記錄,根據(jù)相關(guān)性對2015-2016年未知作案組織或個人對應(yīng)的事件數(shù)據(jù)進(jìn)行整合簡化,使用二階聚類得到最大分類數(shù),根據(jù)危害性從大到小選出前5個犯罪嫌疑人,利用判別分析對2017年未知作案組織或個人對應(yīng)的事件進(jìn)行概率預(yù)測,得出嫌疑人的嫌疑程度.選取影響恐怖襲擊的重要指標(biāo),應(yīng)用因子分析研究2015-2017年恐怖襲擊事件發(fā)生規(guī)律,得到恐怖事件地域發(fā)展趨勢.
關(guān)鍵詞社會統(tǒng)計學(xué);趨勢預(yù)測;多元分析;恐怖襲擊
中圖分類號 C812文獻(xiàn)標(biāo)識碼 A
Abstract Terrorist attacks threaten the security of human society and cause social unrest to a certain extent. Selection of Global Terrorism Database (Global Terrorism Database, GTD) in 2015~2017 terrorist attacks in the world record of events, from 2015 to 2016 unknown crime organization or individual corresponding event data integration based on association simplified second order clustering are used to get the maximum number of classification, and according to the harm from big to small chosen five suspects, using discriminate analysis for 2017 unknown crime organization or individual corresponding event probability prediction, it is concluded that the suspect's degree of suspicion; After that, important indicators affecting terrorist attacks were selected to apply factor analysis to study the occurrence law of terrorist attacks in 2015~2017, and the regional development trend of terrorist incidents was obtained.
Key words Social statistics; Trend prediction; Multivariate analysis; Terrorist attacks
1 引 言
恐怖主義是人類的共同威脅,對恐怖襲擊事件相關(guān)數(shù)據(jù)的深入分析有助于加深人們對恐怖主義的認(rèn)識,為反恐防恐提供有價值的信息支持.Sofia(2016)[1]探索了40多年來全球恐怖主義在地理和時間上的集中性與持續(xù)性,說明恐怖襲擊事件非隨機(jī),具有可研究性.Thomas(2016)[2]提出了對歐洲圣戰(zhàn)主義十年的預(yù)測,未來10年,圣戰(zhàn)分子在歐洲發(fā)動襲擊的頻率可能會呈現(xiàn)波動曲線,峰值將逐漸升高.李益斌(2018)[3]利用聚類分析法,以GTD中恐怖襲擊的頻率和烈度為依據(jù),對2001-2010年和2011-2016年兩階段的歐洲恐怖襲擊按國家進(jìn)行分類,根據(jù)實驗結(jié)果中的異同來分析當(dāng)前歐洲恐怖襲擊的新態(tài)勢.楊振柳等(2019) [4]對GTD進(jìn)行數(shù)據(jù)挖掘,利用主成分分析方法建立了Kmeans算法的聚類模型.通過該聚類模型,將相似特征的事件進(jìn)行歸納處理,為偵破恐怖襲擊事件提供信息支撐.華雅倫和王奇(2018) [5]通過使用GTD數(shù)據(jù)對2001-2015年間歐洲恐怖主義活動進(jìn)行統(tǒng)計分析,發(fā)現(xiàn)呈現(xiàn)出以熱點地區(qū)為中心的擴(kuò)散輻射圈,恐怖分子襲擊日趨專業(yè)化和技術(shù)化的特點,總結(jié)了歐洲國家的反恐經(jīng)驗.彭如香等(2019) [6]以2001-2016年的GTD數(shù)據(jù),對全球恐怖主義活動進(jìn)行定量分析與可視化分析,得出近些年全球恐怖主義活動的發(fā)展態(tài)勢.結(jié)合近幾年全球恐怖事件的特點,總結(jié)出全球恐怖主義活動的特征和發(fā)展趨勢是有價值的.
數(shù)據(jù)均來自于GTD或公開發(fā)表及出版的文獻(xiàn),其中的缺失部分采用期望值最大化方法即EM算法估計所得.采用二階聚類的方法,可對含有類別變量和連續(xù)變量的大型數(shù)據(jù)集進(jìn)行分析,并自動確定最終的分類個數(shù).采用的貝葉斯判別法不僅能夠考慮到各個總體出現(xiàn)的先驗概率,又能考慮到錯判造成的損失,且其判別效果相比于其他幾種判別方法更加理想.
2 分析方法
2.1 統(tǒng)計分析步驟
1.對2015-2016年發(fā)生的、尚未有組織或個人宣稱負(fù)責(zé)的恐怖襲擊事件進(jìn)行分析,找出主導(dǎo)某恐怖襲擊事件最有可能的嫌疑人.第一步將相關(guān)聯(lián)的事件根據(jù)相關(guān)性進(jìn)行整合.第二步利用二階聚類模型對2015-2016年處理過的數(shù)據(jù)進(jìn)行二階聚類分析,將數(shù)據(jù)進(jìn)行分類并按照危害性從大到小選出前五個犯罪嫌疑人.第三步依據(jù)判別分析法中的貝葉斯方法對數(shù)據(jù)進(jìn)行建模與分析,得出嫌疑人的嫌疑程度.
2.研究近三年來恐怖襲擊事件發(fā)生規(guī)律.選取恐怖襲擊發(fā)生在城市中心的次數(shù)、疑似恐怖襲擊的次數(shù)、恐怖襲擊成功的次數(shù)、恐怖襲擊造成的死亡總?cè)藬?shù)、亡人事件百分比、平均每起事件死亡人數(shù)、恐怖襲擊造成的受傷總?cè)藬?shù)、人質(zhì)遭受綁架的次數(shù)等8個指標(biāo)以區(qū)域為分類變量進(jìn)行分析,研究下一年全球或某些重點地區(qū)的恐怖襲擊態(tài)勢.
恐怖主義指數(shù)受許多因素的影響.依據(jù)世界經(jīng)濟(jì)與和平研究所發(fā)布的156個國家的恐怖主義風(fēng)險指數(shù)報告,選取了其中的總起數(shù)、總亡數(shù)、總受傷人數(shù)和財產(chǎn)損失等四個指標(biāo),通過計算四個指標(biāo)分值再合并得到綜合分值.考慮到目前財產(chǎn)損失的價格數(shù)值估計并不十分準(zhǔn)確且獲取較為困難,而中心城市是一個國家的經(jīng)濟(jì)政治中心,尤為重要,所以加入“恐怖襲擊發(fā)生在城市中心的次數(shù)”這個指標(biāo).人質(zhì)的綁架會給人們帶來巨大的心理壓力,造成社會一定程度的動蕩不安.對于國家面對恐怖襲擊的風(fēng)險既要考慮直接恐怖襲擊風(fēng)險,還要考慮國家面對恐怖襲擊的脆弱性,脆弱性低意味著同類別的恐怖襲擊可能會造成更大的人員傷亡和財產(chǎn)損失,所以加入“亡人事件百分比、平均每起事件死亡人數(shù)這兩個指標(biāo)”.
2.2 統(tǒng)計模型
1.二階聚類模型
第一步為準(zhǔn)聚類過程(Precluster Step),采用專門應(yīng)用于巨型數(shù)據(jù)的BIRCH(Balanced Iterative Reducing and Clustering using Hierarchies)聚類算法.建構(gòu)一個多水平結(jié)構(gòu)的聚類特征樹(Cluster Feature Tree,CFtree),其特點在于它是一種高度平衡的樹(heightbalanced tree).—般用CFVectors建立CFtree.
3 依據(jù)事件特征發(fā)現(xiàn)恐怖襲擊事件制造者
對2015-2016年發(fā)生的、尚未有組織或個人宣稱負(fù)責(zé)的恐怖襲擊事件,運(yùn)用二階聚類的方法將可能是同一個恐怖組織或個人在不同時間、不同地點多次作案的若干案件歸為一類,并選出前五個犯罪嫌疑人,依據(jù)貝葉斯判別分析的方法對2017年所發(fā)生事件的犯罪嫌疑人可能性大小進(jìn)行歸類,判別2017年中主導(dǎo)某恐怖襲擊事件最有可能的嫌疑人.
由于數(shù)據(jù)的復(fù)雜性以及海量性,先將相關(guān)聯(lián)的事件進(jìn)行整合,整合規(guī)則由下列指標(biāo)決定:eventid、extended、region、vicinity、doubtterr、success、suicide、attacktype1、targ type1、weaptype1、nkill、nwound、property、ishostkid、INT_ANY.接著利用二階聚類模型對2015-2016年處理過的數(shù)據(jù)進(jìn)行二階聚類分析,結(jié)果如圖1所示,考慮到恐怖組織與個人的種類復(fù)雜性與多樣性,在滿足分類數(shù)據(jù)差異性的前提下,將2015-2016年處理過的數(shù)據(jù)分為250類.
基于貝葉斯判別分析模型來進(jìn)行判斷組織或個人嫌疑程度的大小,根據(jù)14個指標(biāo)變量提取4個特征變量,以某組織或個人對做了該恐怖襲擊事件的概率大小作為衡量標(biāo)準(zhǔn),列出分類函數(shù)系數(shù)如表1所示.
圖2可清晰看出危險度排序的前五位以及其組質(zhì)心,可以通過概率大小判別2017年各個事件是這五個危險度最高的個人或組織所為的可能性大小.
例如:選取201701090031、201702210037.
表2即事件201701090031為一號嫌疑人所為的概率是0.79001,四號嫌疑人所為的概率是0.20999.201702210037為一號嫌疑人所為的概率是0.00002,二號嫌疑人所為的概率是0.99997,四號嫌疑人所為的概率是0.00001.
4 對未來恐怖襲擊態(tài)勢的分析
對近三年即2015-2017年的恐怖襲擊事件分別分析并進(jìn)行橫向和縱向的對比找出規(guī)律,研究下一年全球或某些重點地區(qū)的恐怖襲擊態(tài)勢.
經(jīng)過KMO和巴特利檢驗(表3)顯示KMO取樣適切性量數(shù)為0.632大于0.5,所以該數(shù)據(jù)適合做因子分析.根據(jù)表4采用主成分分析集中了8個原始變量信息的96.176%.
以各因子的方差貢獻(xiàn)率占兩個因子總方差貢獻(xiàn)率的比重作為權(quán)重進(jìn)行加權(quán)且匯總,基于因子分析模型得出各城市的綜合得分,其表達(dá)式為:
F=(67.615×F1+28.561×F2)÷96.176(10)
由表4可知,公共因子1在“襲擊城市中心的次數(shù)”、“疑似恐怖襲擊的次數(shù)”、“襲擊成功的次數(shù)”、“死亡總?cè)藬?shù)”、“受傷總?cè)藬?shù)”、“人質(zhì)遭受綁架的次數(shù)”上的載荷值都很大,主要反映整體遭受恐怖襲擊的風(fēng)險,命名為基本風(fēng)險因子.而公共因子2在“亡人事件百分比”、“平均每起事件死亡人數(shù)”的載荷值較高,主要反映應(yīng)對恐怖襲擊的能力,命名為脆弱性因子.
得出2015-2017年的F1(基本風(fēng)險因子)、F2(脆弱性因子)兩個主要因子,對比如表5和表6所示.
基本風(fēng)險因子得分反映該地區(qū)遭受恐怖襲擊的風(fēng)險程度.經(jīng)過縱向?qū)Ρ瓤芍?,區(qū)域10(中東和北非)近三年的基本風(fēng)險因子得分均最高,是最需要加強(qiáng)防范恐怖襲擊事件的地區(qū).區(qū)域4(東亞)風(fēng)險性最低,安全性最高.橫向比較可知,區(qū)域10(中東和北非)盡管三年期間的風(fēng)險性有所下降,但依然位于12個地區(qū)的首位,所以仍是反恐的重點地區(qū).區(qū)域6(南亞)風(fēng)險性還在提高,所以該地區(qū)下一年為反恐的重點地區(qū).
脆弱性因子得分反映該地區(qū)應(yīng)對恐怖襲擊事件的能力.經(jīng)過縱向?qū)Ρ瓤芍?,區(qū)域11(撒哈拉以南的非洲)近三年的脆弱性因子得分均最高,是最需要提高其應(yīng)對能力的地區(qū).相對來說區(qū)域12(澳大利亞和大洋洲)的應(yīng)對能力最強(qiáng).橫向比較可知區(qū)域11(撒哈拉以南的非洲)三年間應(yīng)對處理恐怖襲擊的能力還在下降,值得一提的是,區(qū)域4(東亞)的應(yīng)對能力在不斷提高.
結(jié)合基本風(fēng)險因子和脆弱性因子得到綜合得分,由圖3可知區(qū)域10(中東和北非)及區(qū)域6(南亞)恐怖襲擊事態(tài)較為嚴(yán)重,不僅遭受恐怖襲擊的風(fēng)險性高,而且其應(yīng)對處理恐怖襲擊的能力也較低.另外區(qū)域5(東南亞)的綜合得分不斷提高,可知恐怖襲擊事件有向東南亞區(qū)域轉(zhuǎn)移的趨勢.
5 結(jié) 論
通過靈活應(yīng)用二階聚類、判別分析、因子分析來對恐怖襲擊事件記錄數(shù)據(jù)進(jìn)行量化分析.考慮到事件的相關(guān)性,對2015-2016年的未知作案組織或個人對應(yīng)的事件數(shù)據(jù)進(jìn)行整合簡化.應(yīng)用二階聚類,充分利用數(shù)據(jù)差異性,選取最大分類數(shù)為250類.因為恐怖組織與個人的種類繁多且具有多樣性,在這250類中每類所包含的事件數(shù)的多少來從大到小選出其中的前5個.對于恐怖事件的嫌疑程度,基于貝葉斯判別分析模型來進(jìn)行判斷組織或個人嫌疑程度的大小,根據(jù)14個指標(biāo)變量提取4個主要特征,計算出某組織或個人實施該恐怖襲擊事件的概率,根據(jù)其大小作為衡量標(biāo)準(zhǔn).
根據(jù)主要原因、時空特性、蔓延特性、級別分布等規(guī)律,進(jìn)而分析總結(jié)近三年來恐怖襲擊事件發(fā)生規(guī)律和并預(yù)測下一年全球某些重點地區(qū)的恐怖襲擊態(tài)勢.選取了8個指標(biāo)以區(qū)域為分類變量進(jìn)行因子分析,最后得到2015-2017年關(guān)于12個地區(qū)在兩個公共因子上的得分和總得分,經(jīng)過橫向和縱向的對比,可知區(qū)域10(中東和北非)恐怖襲擊事態(tài)較為嚴(yán)重,不僅體現(xiàn)在遭受恐怖襲擊的風(fēng)險性高,而且其應(yīng)對處理恐怖襲擊的能力也較低,為下一年反恐的重點地區(qū).同時區(qū)域10(中東和北非)與區(qū)域11(撒哈拉以南的非洲)也是需要加強(qiáng)反恐的地區(qū).另外根據(jù)區(qū)域5(東南亞)的綜合得分不斷提高,可知恐怖襲擊事件有向東南亞區(qū)域轉(zhuǎn)移的趨勢,總體來說,近三年的恐怖事件發(fā)生的區(qū)域及其風(fēng)險性較為穩(wěn)定.
參考文獻(xiàn)
[1]
SOFIA P K. The nonrandom nature of terrorism: An exploration of where and how global trends of terrorism have developed over 40 years[J].Studies in Conflict Terrorism,2016,39(12):1031-1049.
[2] THOMAS H. The future of jihadism in Europe: A pessimistic view [J] .Perspectives on Terrorism,2016,10(6):156-170.
[3] 李益斌.歐洲恐怖主義的新態(tài)勢及原因分析——基于聚類分析法[J].情報雜志,2018,37(3):55-63.
[4] 楊振柳,李穎,鐘子森.基于數(shù)據(jù)挖掘的恐怖襲擊嫌疑對象判斷研究[J].情報探索,2019(4):35-40.
[5] 華雅倫,王奇.基于GTD數(shù)據(jù)庫的歐洲反恐形勢分析及對我國的啟示[J].犯罪研究,2018(5):91-105.
[6] 彭如香,張奧博,楊濤,孔華鋒.基于GTD的全球恐怖主義活動現(xiàn)狀與發(fā)展趨勢研究[J].計算機(jī)應(yīng)用與軟件,2019,36(1):1-5+21.