韓一士++范英盛++李國軍++鄭滋椀
摘 要:近年來,隨著網(wǎng)絡(luò)通信技術(shù)的不斷發(fā)展,通訊網(wǎng)絡(luò)詐騙犯罪已經(jīng)成為嚴(yán)重危害群眾財(cái)產(chǎn)安全的侵財(cái)犯罪之一,也是困擾公安機(jī)關(guān)偵查破案的一大難點(diǎn)問題?;贏RIMA模型,通過對2012年7月至2015年6月期間浙江省衢州市通訊網(wǎng)絡(luò)詐騙案件的發(fā)案量的研究,給出了浙江省衢州市通訊網(wǎng)絡(luò)詐騙犯罪的發(fā)案模型。經(jīng)過檢驗(yàn),模型與之后時(shí)間內(nèi)通訊網(wǎng)絡(luò)詐騙犯罪發(fā)案量吻合良好,為當(dāng)?shù)鼐筋A(yù)防犯罪提供了指導(dǎo),從而達(dá)到提高警務(wù)活動效率的目的。
關(guān)鍵詞:通訊網(wǎng)絡(luò)詐騙;時(shí)間序列分析;ARIMA模型;情報(bào)分析;警務(wù)活動
中圖分類號:D92 文獻(xiàn)標(biāo)識碼:A 文章編號:1009 — 2234(2017)05 — 0101 — 03
0引言
通訊網(wǎng)絡(luò)詐騙作為近年來興起的一種新型犯罪,在我國迅速產(chǎn)生和蔓延,由于通訊網(wǎng)絡(luò)詐騙具有明顯的地域不確定性,發(fā)案地和犯罪嫌疑人所在地往往不在同一區(qū)域。傳統(tǒng)的通過對犯罪熱點(diǎn)進(jìn)行分析來調(diào)整警務(wù)資源分配的方式面對這種新型的犯罪方式難以奏效。因此,必須從時(shí)間序列方面來探究通訊網(wǎng)絡(luò)詐騙犯罪的特點(diǎn)。本文針對浙江省衢州市2012年7月至2015年6月通訊網(wǎng)絡(luò)詐騙發(fā)案量建立ARIMA模型,并使用該模型對衢州市之后一段時(shí)間內(nèi)的犯罪量進(jìn)行預(yù)測。
本文采用的數(shù)據(jù)來自“基于大數(shù)據(jù)架構(gòu)的公安信息化應(yīng)用”公安部重點(diǎn)實(shí)驗(yàn)室,使用的分析軟件為Eviews6.0。
1浙江省衢州市通訊網(wǎng)絡(luò)詐騙犯罪量ARIMA模型的建立
1.1ARIMA模型概述
ARIMA模型是求和自回歸移動平均模型(auto-regressive integrated moving average)的簡寫,主要用于將非平穩(wěn)時(shí)間序列差分平穩(wěn)后進(jìn)行分析,其表達(dá)式為:
其中實(shí)參數(shù)p稱為自回歸系數(shù),?茲1,?茲2,…?茲q稱為移動平均系數(shù),自回歸系數(shù)和移動平均系數(shù)均為模型的待估參數(shù)。?著t為相互獨(dú)立的白噪聲序列,且服從均值為0,方差為?滓2的正態(tài)分布。ARIMA模型又可以表示為ARIMA(p,d,q),其中p為自回歸階數(shù),q為移動平均項(xiàng)數(shù),d為使時(shí)間序列平穩(wěn)所作的差分次數(shù)。確定p,d,q三者的階數(shù)是ARIMA模型建立過程中所要面對的一個(gè)重要問題。
1.2浙江省衢州市通訊網(wǎng)絡(luò)詐騙犯罪量時(shí)間序列的平穩(wěn)性檢驗(yàn)及處理
在進(jìn)行時(shí)間序列分析時(shí),我們希望該時(shí)間序列是平穩(wěn)的,否則往往會出現(xiàn)大量隨機(jī)變量,且一些實(shí)際上不相關(guān)的隨機(jī)變量之間會表現(xiàn)出很大的相關(guān)性。為避免這種情況出現(xiàn),下面首先進(jìn)行平穩(wěn)性檢驗(yàn)。
平穩(wěn)性檢驗(yàn)主要有單位根(ADF)檢驗(yàn)和PP檢驗(yàn)兩種方法,將浙江省衢州市2012年7月至2015年6月的通訊網(wǎng)絡(luò)詐騙犯罪量序列記為{Xt}。通過對{Xt}進(jìn)行ADF檢驗(yàn)及PP檢驗(yàn)(圖略),結(jié)果顯示{Xt}序列是非平穩(wěn)的,這說明通訊網(wǎng)絡(luò)詐騙犯罪量序列{Xt}受到多種因素制約為非平穩(wěn)序列,需要對其進(jìn)行處理使其變得平穩(wěn)。常見的處理方法有取對數(shù)法及差分法,在這里我們將兩種方法綜合運(yùn)用。
考慮到{Xt}存在異方差,我們先對{Xt}進(jìn)行對數(shù)處理得到新的序列{Yt},其中Yt=1n(Xt)。下面對{Yt}進(jìn)行一階差分以提取其中所含有的確定性信息,得到新的序列{Zt}。此時(shí){Zt}即為我們想要得到的平穩(wěn)序列,為確定其平穩(wěn)性,再對{Zt}進(jìn)行ADF檢驗(yàn)和PP檢驗(yàn)。
經(jīng)檢驗(yàn)得,在1%的置信區(qū)間下,ADF檢驗(yàn)中的檢驗(yàn)值為-2.639210,大于ADF檢驗(yàn)值-6.263234。PP檢驗(yàn)中的檢驗(yàn)值為-2.634731,大于PP檢驗(yàn)值-13.34858,因此拒絕序列非平穩(wěn)的統(tǒng)計(jì)假設(shè),序列{Zt}是平穩(wěn)的,且存在一定的趨勢性,可以進(jìn)行時(shí)間序列分析。
1.3浙江省衢州市通訊網(wǎng)絡(luò)詐騙犯罪量時(shí)間序列ARIMA模型階數(shù)的分析
為了確定ARIMA模型的階數(shù),需要先求出序列{Zt}的樣本自相關(guān)系數(shù)(ACF)和樣本偏自相關(guān)系數(shù)(PACF)的值。
下面通過觀察表一來確定模型的階數(shù),注意到自相關(guān)系數(shù)(ACF)和樣本偏自相關(guān)系數(shù)(PACF)都是拖尾的,1、3、4階自相關(guān)系數(shù)及1、3階偏自相關(guān)系數(shù)超過正負(fù)兩倍標(biāo)準(zhǔn)差,顯著不為0,因此估計(jì)p=3,q=4。考慮到之前進(jìn)行的序列平穩(wěn)性檢驗(yàn),我們進(jìn)行了一次差分便得到了平穩(wěn)的時(shí)間序列,因此確定ARIMA模型的步長為1。所以初步估計(jì)使用ARIMA(3,1,4)模型對衢州市通信網(wǎng)絡(luò)詐騙犯罪發(fā)案量的時(shí)間序列進(jìn)行模擬和預(yù)測。
1.4衢州市通信網(wǎng)絡(luò)詐騙犯罪量ARIMA模型參數(shù)估計(jì)
由于ARIMA模型的階數(shù)決定存在著一定的主觀性,因此我們在ARIMA(3,1,4)的基礎(chǔ)上對階數(shù)進(jìn)行小幅變動并反復(fù)擬合。通過比較R^2、AIC、SC這三個(gè)統(tǒng)計(jì)量的取值,我們發(fā)現(xiàn)疏系數(shù)模型ARIMA(4,1,(1,3,4))模型的R^2統(tǒng)計(jì)量約為0.74,在所有可取模型中最大。AIC和SC統(tǒng)計(jì)量分別約為0.35和0.72,在所有可取模型中最小。根據(jù)R^2、AIC和SC準(zhǔn)則確定ARIMA(4,1,(1,3,4))模型為最佳模型,其表達(dá)式為
Zt=-0.763118Zt-1-0.759613Zt-2-0.737856Zt-3+0.051669Zt-4+0.106490?著t-1-0.137473?著t-3-0.95828l?著t-4
下圖為模型的擬合結(jié)果圖像
從圖中可以觀察到擬合結(jié)果良好,因此初步確定ARIMA(4,1,(1,3,4))模型為最佳模型。但是肉眼的觀察往往不具有說服力,為了提高可信度,下面對擬合結(jié)果中的參數(shù)進(jìn)行檢驗(yàn)。
2衢州市通信網(wǎng)絡(luò)詐騙犯罪量的預(yù)測
由之前估計(jì)得到的結(jié)果,衢州市通信網(wǎng)絡(luò)詐騙發(fā)案量的最優(yōu)模型ARIMA(4,1,(1,3,4))模型的表達(dá)式為:
Zt=-0.763118Zt-1-0.759613Zt-2-0.737856Zt-3+0.051669Zt-4+0.106490?著t-1-0.137473?著t-3-0.95828l?著t-4
經(jīng)過反向推導(dǎo),得到原時(shí)間序列{Xt}的表達(dá)式為:
Xt=eYt-1-0.763118Zt-1-0.759613Zt-2-0.737856Zt-3+0.051669Zt-4+0.106490?著t-1-0.137473?著t-3-0.95828l?著t-4
下面使用得到的ARIMA(4,1,(1,3,4))模型對衢州市2015年7月至2015年12月通訊網(wǎng)絡(luò)犯罪發(fā)案量進(jìn)行預(yù)測。在此之前,本文將先使用得到的ARIMA(4,1,(1,3,4))模型對2015年1月到2015年6月的數(shù)據(jù)進(jìn)行檢驗(yàn),如果擬合的結(jié)果較好,則說明模型較為成功,我們可以用其對未來一段時(shí)間內(nèi)的衢州市通信網(wǎng)絡(luò)詐騙犯罪發(fā)案量進(jìn)行預(yù)測。如果模型擬合的結(jié)果不理想,則需要根據(jù)實(shí)際情況對模型進(jìn)行修改。以下是我們對2015年1月至2015年6月衢州市通訊網(wǎng)絡(luò)詐騙犯罪發(fā)案量估計(jì)結(jié)果。
通過觀察表6我們發(fā)現(xiàn),2015年1,3,4,5,6月的相對差值都小于15%,取絕對值后平均誤差約為9.2%,預(yù)測結(jié)果較好。但是2015年2月預(yù)測結(jié)果相對誤差高達(dá)71.4%,我們通過觀察發(fā)現(xiàn)該月的實(shí)際犯罪量發(fā)生了巨大變化,低于2015年上半年平均水平的一半??紤]到實(shí)際情況,出現(xiàn)這種情況的原因很有可能是當(dāng)?shù)毓矙C(jī)關(guān)對通信網(wǎng)絡(luò)詐騙采取了專項(xiàng)打擊,導(dǎo)致了發(fā)案率大大下降。因此,在統(tǒng)計(jì)學(xué)上可以認(rèn)為2015年2月的數(shù)據(jù)為壞點(diǎn),不影響預(yù)測結(jié)果。
綜上所述,ARIMA(4,1,(1,3,4))模型在短期內(nèi)較好地反映了衢州市通信網(wǎng)絡(luò)詐騙發(fā)案數(shù)量。下面是本文使用該模型對2015年下半年衢州市通訊網(wǎng)絡(luò)詐騙案犯罪發(fā)案量的預(yù)測。
3結(jié)果分析與建議
本文采用ARIMA建模法進(jìn)行分析,并對2015年7月至2015年12月的發(fā)案量進(jìn)行了預(yù)測。建模結(jié)果R^2較大,對犯罪量變化的解釋率為73.87%,預(yù)測結(jié)果較為理想。結(jié)果顯示,2012年7月至2015年6月通訊網(wǎng)絡(luò)詐騙發(fā)案數(shù)量總體將呈上升趨勢。在2015年6月以后的每一個(gè)月中,通過得到的ARIMA模型,警方可以較為精確地得知將會發(fā)生的通訊網(wǎng)絡(luò)詐騙案件數(shù)量,這對警方調(diào)配警力提供了重要的參考依據(jù)〔6〕。
傳統(tǒng)意義上的犯罪預(yù)防,往往建立在經(jīng)驗(yàn)的基礎(chǔ)上,存在著大量主觀判斷,往往結(jié)果不盡如人意。而隨著統(tǒng)計(jì)學(xué)的發(fā)展,引入計(jì)算機(jī)工具來進(jìn)行犯罪預(yù)測必將是未來的趨勢。通過研究發(fā)現(xiàn),犯罪數(shù)據(jù)的變化并不是混沌不明的,而是存在著特定的規(guī)律,是可以預(yù)測的〔7〕。一些學(xué)者如陳鵬等運(yùn)用聚類分析法對犯罪進(jìn)行短期預(yù)測,取得了較好的效果〔8〕。希望犯罪學(xué)界對加大對統(tǒng)計(jì)學(xué)的關(guān)注力度,將統(tǒng)計(jì)學(xué)的方法引入犯罪時(shí)空預(yù)測,共同推動犯罪學(xué)的發(fā)展。
〔參 考 文 獻(xiàn)〕
〔1〕禹文豪.路徑單元剖分法支持下的網(wǎng)絡(luò)空間分析〔D〕.武漢大學(xué),2015.
〔2〕黃超,李繼紅.犯罪預(yù)測的方法〔J〕.江蘇警官學(xué)院學(xué)報(bào),2011,01:107-110.
〔3〕陳鵬,馬偉.層次聚類法在空間犯罪熱點(diǎn)分析中的應(yīng)用〔J〕.中國人民公安大學(xué)學(xué)報(bào):自然科學(xué)版,2013,01:64-67.〔責(zé)任編輯:陳玉榮〕