付艷茹, 馬 強
(浙江警官職業(yè)學(xué)院,浙江杭州 310018)
犯罪率是比較不同時空條件下犯罪嚴重程度的常用指標,即犯罪密度。雖然犯罪行為的界定是一致的,但研究與比較犯罪密度往往受到一定條件的限制,其統(tǒng)計分析多以SPSS、SAS軟件固有的模型為主,它過多地依賴于現(xiàn)存數(shù)據(jù)而缺失動態(tài)建模及預(yù)測的功能,未能有效涵蓋影響犯罪率的多項相關(guān)變量以及量化相互間的權(quán)重關(guān)系。國內(nèi)已有一些文獻針對犯罪率問題采用了定量分析,但準確度與適應(yīng)性仍不及MATLAB的動態(tài)建模。
本文基于浙江省犯罪率的角度來探析影響犯罪率的相關(guān)變量,通過采用MATLAB平臺下的動態(tài)建模與仿真實測,對影響犯罪率的多項相關(guān)變量進行結(jié)構(gòu)性測定及權(quán)重分布進行分析,尋求涵蓋權(quán)重不同及影響犯罪率多變量(包括城市化率、失業(yè)率、客運量、人均GDP、城市基尼系數(shù)、農(nóng)村基尼系數(shù)、失業(yè)率等主成分)的較高精度犯罪率算法模型。
以MATLAB仿真平臺對犯罪率動態(tài)建模涉及了影響犯罪率的多項相關(guān)變量,國內(nèi)一般實證研究犯罪率的文獻所涉及的相關(guān)變量是眾多的,如收入分配、勞動力市場環(huán)境、社會環(huán)境、教育影響、城市化率、失業(yè)率、貧困率、人口結(jié)構(gòu)、經(jīng)濟增長、工資水平、通貨膨脹、司法質(zhì)量等[1-3],國外則包括了更為廣泛的、與經(jīng)濟周期相聯(lián)系的犯罪率變量定義,如合法就業(yè)機會、犯罪機會、毒品與酒類物品消費、司法體系運作等[4]。然而,如果在算法模型的實測中,引入以上與犯罪率全部相關(guān)的變量,則將會因重疊的信息量大而導(dǎo)致冗余,發(fā)生嚴重的多重共線性問題,其結(jié)果是極大地限制了犯罪率模型的實際應(yīng)用。
考慮到犯罪率與經(jīng)濟相關(guān)的變量表現(xiàn)的顯著性,將經(jīng)濟增長水平、城鄉(xiāng)收入差距、城市化水平、失業(yè)率高低等設(shè)定為研究犯罪率的相關(guān)變量。以浙江省為例,城市化率、人均GDP、恩格爾系數(shù)、客運量等經(jīng)濟指標在改革開放的三十年間持續(xù)呈現(xiàn)了增長勢頭,高速推動了“三化”(工業(yè)化、城市化、市場化)的進程,繁榮了區(qū)域經(jīng)濟,吸引了省外高達1182萬人的勞動力流入,外來人口占浙江省現(xiàn)有常住人口5442.69萬人的21.7%,城市犯罪問題的滋生與蔓延面臨著更為錯綜復(fù)雜的局面,犯罪率持續(xù)攀升,至2008年年底,浙江省在押罪犯數(shù)量已經(jīng)上升為國內(nèi)第2位。受篇幅所限,表1列出了1988~2007年的犯罪率樣本數(shù)據(jù)及部分相關(guān)變量指標[5]。
依據(jù)表1所列犯罪率樣本數(shù)據(jù)及相關(guān)變量指標,基本能概括相應(yīng)的犯罪率趨勢,并可發(fā)現(xiàn)浙江省于1988~2007年二十年間的犯罪率、城市化率、失業(yè)率、客運量、人均GDP及全國犯罪率的指標值居于總體上升的性態(tài)??紤]到影響犯罪率的關(guān)聯(lián)因素是眾多的,不同權(quán)重的變量指標對犯罪率的影響是不同的,如犯罪率數(shù)據(jù)樣本臨近點的閾值及犯罪率相關(guān)變量的權(quán)重分布等,在不同的經(jīng)濟條件地區(qū)將存在一定的差異,而由于犯罪形成的過程是一個未知且動態(tài)變化的開放域,若采用經(jīng)驗值來單純替代,將使得具體的定量受限。因而,可進一步在MATLAB平臺下編程實測進行仿真,并基于較大的犯罪率樣本數(shù)據(jù)而獲取多個相關(guān)變量指標間的聯(lián)系及量化值。圖1是在MATLAB平臺下編程實測得到的浙江省城市化率、失業(yè)率、客運量、人均GDP、城市基尼系數(shù)、農(nóng)村基尼系數(shù)、城鄉(xiāng)收入比值、犯罪率共8個相關(guān)變量指標的仿真曲線圖。研究發(fā)現(xiàn),諸多相關(guān)變量指標除個別年份偶有波動外,總體上均處于上升的趨勢,呈現(xiàn)出與犯罪率之間的正相關(guān)性態(tài)。
表1 1988~2007年浙江省犯罪率及相關(guān)變量表
影響犯罪率的各相關(guān)變量在犯罪形成過程中的作用各有強弱,且可能內(nèi)含的信息量彼此重疊,一定程度上制約了犯罪率模型的準確程度。當(dāng)定量分析較大的犯罪率樣本數(shù)據(jù)及關(guān)聯(lián)度時,可用實測的手段獲取犯罪率相關(guān)變量指標內(nèi)在的聯(lián)系及量化值,通過仿真圖觀察各相關(guān)變量對犯罪率的影響趨勢。在數(shù)學(xué)意義上,關(guān)聯(lián)度可以考察2個變量數(shù)列的相近程度,其值的大小與2個變量數(shù)列相互影響程度的大小成正比,關(guān)聯(lián)度越大,說明2個變量數(shù)列相互影響的程度越大。在MATLAB仿真平臺下,可以編程實測犯罪率各相關(guān)變量的關(guān)聯(lián)度,其算法步驟為:
第1步,對犯罪率各相關(guān)變量進行初始化處理。即對不同時刻的犯罪樣本統(tǒng)計數(shù)據(jù)構(gòu)成參考序列:
擇其對應(yīng)的比較序列為:
第2步,按指定的分辨系數(shù)P,計算犯罪率各相關(guān)變量的關(guān)聯(lián)系數(shù)
圖11988~2007年浙江省犯罪率及相關(guān)變量曲線圖
第3步,計算犯罪率各相關(guān)變量的關(guān)聯(lián)度
針對以上所設(shè)計的算法,可在MATLAB仿真平臺下編程實測,其主要的示意代碼如下:
在以上MATLAB源代碼中,p為所選擇的分辨系數(shù),delta_min為數(shù)據(jù)初值,incidence_coefficient為關(guān)聯(lián)系數(shù),r為關(guān)聯(lián)度。仿真實測后,獲得了各相關(guān)變量與犯罪率的相關(guān)度,其從大到小的排序依次為人均GDP(0.7415)、失業(yè)率(0.6755)、客運量(0.6509)、城市基尼系數(shù)(0.6322)、城市化率(0.6202)、城鄉(xiāng)收入比(0.6196)、農(nóng)村基尼系數(shù)(0.6130)。可見,與犯罪率相關(guān)度最高的相關(guān)變量是人均GDP,其次依次為失業(yè)率、客運量、城市基尼系數(shù),而城市化率、城鄉(xiāng)收入比及農(nóng)村基尼系數(shù)列后三位。單純觀察相關(guān)度的權(quán)值分布可以發(fā)現(xiàn),多數(shù)變量與犯罪率的相關(guān)度差異是不大的,對犯罪率的影響權(quán)重大體相當(dāng)。
為比較犯罪率各相關(guān)變量間彼此重疊的信息量,可由MATLAB編程仿真實測出犯罪率各相關(guān)變量城市化率、失業(yè)率、客運量、人均GDP、城市基尼系數(shù)、農(nóng)村基尼系數(shù)、城鄉(xiāng)收入比值間的相關(guān)系數(shù),其值大小表示了內(nèi)在的聯(lián)系程度,見表2。
結(jié)合1988~2007年的犯罪率樣本數(shù)據(jù)(表1),考察犯罪率各相關(guān)變量間的相關(guān)系數(shù)(表2),可以發(fā)現(xiàn),各變量間的相互關(guān)系均較密切,任意2個變量間的相關(guān)系數(shù)均較高。僅以城市化率與人均GDP為例,二者間相關(guān)系數(shù)高達0.9869(其實1979年以后城市化進程與犯罪率就表現(xiàn)為極高的相關(guān)性[6]),即使在關(guān)系最弱的人均GDP與農(nóng)村基尼系數(shù)之間,其相關(guān)系數(shù)亦達到了0.7421,可見犯罪率與其相關(guān)變量之間呈現(xiàn)顯著相關(guān)的性態(tài),它表明若將影響犯罪率的相關(guān)變量直接對犯罪率進行多元回歸,非互斥的變量間的高度相關(guān)性將導(dǎo)致大量的信息重疊,對犯罪率的影響權(quán)重差異也可能很大,致使所得犯罪率回歸模型精度大為降低,不宜實際應(yīng)用,故需要施加必要的算法改進。
表2 犯罪率各相關(guān)變量間的相關(guān)系數(shù)
為避免多信息量相互重疊導(dǎo)致各因素間的高度共線性,準確把握各因素對犯罪率影響的權(quán)重,客觀地反映各因素對犯罪率的影響程度,可采取主成分分析算法,并在MATLAB平臺下編程實測,以便對影響犯罪率的多項相關(guān)變量進行結(jié)構(gòu)性測定,通過權(quán)重分析來獲取客觀反映各變量影響犯罪率的量化結(jié)論。
有關(guān)MATLAB仿真實測犯罪率各相關(guān)變量主成分分析的示意代碼如下:
在以上MATLAB源代碼中,仿真功能的實現(xiàn)借助了矩陣的標準化變換與主成分分析程序的調(diào)用,其中stdr表示各變量的標準差,p3是前3個主成分系數(shù),score是前3個主成分得分,egenvalue是特征值,per是各個主成分的貢獻率。程序運行后,可獲得涵蓋總信息量97%以上的3個主成分如下:
在此基礎(chǔ)上,實測出的主成分特征向量為:
進而得到相應(yīng)的犯罪率模型為:
分析仿真實測結(jié)果可以發(fā)現(xiàn),第一主成分的特征值為遠大于1的6.3020,其貢獻率高達90.03%;第二主成分的貢獻率為5.63%;第三主成分的貢獻率為2.20%。前3個主成分的累計貢獻率達到了97.86%。
其中,以第一主成分最為重要,它基本涵蓋了7個變量的所有信息,對犯罪率的變化影響是最大的,它內(nèi)含了影響犯罪率90%以上的信息量,而影響犯罪率的另外7個變量,如城市化率、失業(yè)率、客運量、人均GDP、城市基尼系數(shù)、農(nóng)村基尼系數(shù)、城鄉(xiāng)收入比值等,其權(quán)重分別為0.3885、0.3606、0.3890、0.3776、0.3941、0.3510、0.3827,相對而言,各變量的權(quán)重差距不顯著,說明對犯罪率的影響程度彼此相差不大,而權(quán)重稍大些的城市基尼系數(shù)0.3941、客運量0.3890、城市化率0.3885、城鄉(xiāng)收入比值0.3827,與犯罪率關(guān)系均較為密切;第二個主成分的貢獻率是5.63%,其中較大權(quán)重的是農(nóng)村基尼系數(shù)0.6260、失業(yè)率0.4943,人均 GDP0.4710等3個變量;第三個主成分的貢獻率為2.20%,其中權(quán)重最大的是失業(yè)率為0.7280,其次為農(nóng)村基尼系數(shù)0.6293,這2個變量足以體現(xiàn)第三個主成分。從總體上而言,犯罪率與各因素的相關(guān)度分布及各因素對犯罪率的權(quán)重分布皆較均衡,并無明顯差異。如果根據(jù)3個主成分z1、z2、z3的得分,并用其貢獻率進行加權(quán),則可計算出犯罪率的總得分如下:
同時,可在對應(yīng)1988~2007年犯罪率樣本數(shù)據(jù)(表1)的基礎(chǔ)上,以排序方式獲得相應(yīng)的總得分水平(表3),由該表可印證1988~2007年二十年間的犯罪率總體上升的結(jié)論。
表31988~2007年浙江省犯罪率得分及排序
在此基礎(chǔ)上,進一步利用MATLAB對量化的準確性進行驗證,即根據(jù)3個主成分所建立的犯罪率模型對1988~2007年二十年間的浙江省犯罪率進行仿真實測,以得到相應(yīng)的犯罪率測試值Crime_yc及對應(yīng)的相對誤差Crime_ycwc:
分析相應(yīng)的數(shù)據(jù)可知,采用3個主成分進行測試后,其結(jié)果均已很好趨近于實際值。以表1中的2007年犯罪率為例,犯罪率的實際值為1044.6起/10萬人,而算法模型的測試值為1124.3起/10萬人,二者已經(jīng)極大地趨近,基本符合實用要求。觀察測試的相對誤差,只有3個采樣點的相對誤差較大,分別為0.43301、0.36835、0.45933,而60%以上的點的相對誤差均在0.1以下,可見經(jīng)主成分分析后的回歸效果較好。在實際操作中,基于第一個主成分的貢獻率高達90.03%,說明完全可以略去后兩個主成分,此時,犯罪率模型的算法精度可以得到足夠的保證。
將MATLAB仿真建模與相關(guān)度計算、多變量時序數(shù)列主成分分析相結(jié)合,可用實測的方式解析影響犯罪率的多個相關(guān)變量的權(quán)重分布,有效解決犯罪率各相關(guān)變量內(nèi)含信息量相互重疊問題,且所得主成分變量基本涵蓋了權(quán)重不同的影響犯罪率的各相關(guān)變量,所建立的犯罪率模型準確性良好,改進了犯罪率分析與預(yù)測的精度。
[1]王安,魏建.犯罪門檻和防御效應(yīng)下收入分配差距對犯罪率的影響[J].廣東商學(xué)院學(xué)報,2009,24(3):37-45.
[2]陳屹立.中國犯罪率的實證研究:基于1978~2005年的計量分析[D].濟南:山東大學(xué),2007.
[3]梁亞民,楊曉偉.中國城市化進程與犯罪率之間關(guān)系的實證研究[J].犯罪研究,2010(4):16-25.
[4]Philip JC,Gary AZ.Crime and the business cycle[J].Journal of Kgal Studies,1985,14(1):115-128.
[5]嚴浩仁,陳鵬忠,孔一.中國農(nóng)村低收入人群和貧困群體犯罪問題研究[M].杭州:浙江工商大學(xué)出版社,2009.
[6]李春雷,姚?。鞘谢M程中我國城市住區(qū)犯罪空間防控探索[J].中國人民公安大學(xué)學(xué)報:社會科學(xué)版,2011,27(4):93-105.
中國人民公安大學(xué)學(xué)報(自然科學(xué)版)2012年3期