許卉瑩 瞿偉斌 公安部交通管理科學(xué)研究所
世界衛(wèi)生組織的調(diào)查顯示:酒后駕駛是車禍致人死亡的一個主要原因。在多數(shù)國家,酒駕是導(dǎo)致交通事故的首要原因,例如美國、南非等。在我國目前仍處于酒駕事故的高發(fā)期,起數(shù)、死亡人數(shù)總量比較大,造成了巨大的生命財(cái)產(chǎn)損失。據(jù)統(tǒng)計(jì),每年酒駕肇事事故超過萬起,占到事故總數(shù)的6%。近年來,隨著查處執(zhí)法力度的進(jìn)一步加大,酒駕違法行為大幅減少,酒駕事故也在相應(yīng)減少。2020年因受疫情影響,酒駕行為的查處稍有減弱,與此相對的,酒駕醉駕事故有所抬頭。從近年酒駕違法和事故數(shù)據(jù)可以看出,酒駕查處力度對于酒駕事故的發(fā)生有比較明顯的影響,可以通過分析兩者之間的關(guān)聯(lián)關(guān)系,更加客觀的了解交通事故的發(fā)生機(jī)理,從而為交管部門的管理決策提供數(shù)據(jù)依據(jù)和技術(shù)支撐。
在酒駕的情況下,駕駛?cè)藢ν饨绲姆磻?yīng)能力及控制能力下降,導(dǎo)致運(yùn)動反射神經(jīng)遲鈍、易疲勞等,容易發(fā)生事故。而交警查處酒駕,一方面使得飲酒的駕駛?cè)藷o法繼續(xù)駕駛,避免事故發(fā)生;另一方面會對駕駛?cè)司岂{起到震懾作用,從而達(dá)到預(yù)防酒駕事故的效果??梢哉J(rèn)為,酒駕查處力度和酒駕事故發(fā)生之間存在一定的相關(guān)關(guān)系。
本文以江蘇省某城市2018年5月至2020年4月間酒駕違法查處數(shù)據(jù)與酒駕交通事故數(shù)據(jù)為例,具體分析其相關(guān)性。
從酒駕違法查處情況看,大致分為四個階段:2018年5月至2019年5月,較為平穩(wěn)的階段;2019年6月至12月,因受查處酒駕專項(xiàng)行動影響,酒駕查處數(shù)逐月遞增,至9月達(dá)到峰值,然后稍有回落;2020年1月至2月,因受疫情影響,酒駕違法查處數(shù)處于歷年最低水平;2020年3月至5月,酒駕違法查處數(shù)快速回升,恢復(fù)至2019年平均水平。而相對應(yīng)的,事故數(shù)據(jù)也分為4個階段,基本與違法查處時段吻合:2018年5月至2019年5月是上升階段;2019年6月至2019年9月是下降階段;2019年10月至2020年1月,酒駕事故數(shù)有所回升;2020年1月至2020年5月,該階段酒駕事故數(shù)先大幅下降后快速上升,如圖1所示。
相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量,以兩變量與各自平均值的離差為基礎(chǔ),通過兩個離差相乘來反映兩變量之間相關(guān)程度。本文采用皮爾遜相關(guān)系數(shù)法,公式如下:
其中,X是酒駕違法查處數(shù),Y事故數(shù)。為方便分析,以一周作為時間間隔,將酒駕事故與違法查處數(shù)分段計(jì)數(shù)。以自2018年5月以來每周的酒駕違法查處與酒駕事故數(shù)據(jù),計(jì)算其相關(guān)系數(shù),結(jié)果為-0.38,說明兩者呈較明顯的負(fù)相關(guān)性。
時間序列模型可以用于尋找序列值之間相關(guān)關(guān)系的統(tǒng)計(jì)規(guī)律,并構(gòu)建適當(dāng)?shù)臄?shù)學(xué)模型來描述這種規(guī)律,進(jìn)而利用這個擬合模型來預(yù)測序列未來的走勢。酒駕事故數(shù)據(jù)存在明顯趨勢,符合某種統(tǒng)計(jì)規(guī)律,可以用時間序列模型來進(jìn)行預(yù)測。而時間序列經(jīng)常會受到特殊事件及態(tài)勢的影響,一般稱這類外部事件為干預(yù)。從上文的相關(guān)系數(shù)結(jié)果來看,酒駕違法查處力度與酒駕事故發(fā)生趨勢之間具有相關(guān)性。提升酒駕違法查處力度,對于酒駕事故的發(fā)生來說可以認(rèn)為是一種特殊干預(yù),可以建立干預(yù)分析模型,從定量分析的角度來評估酒駕違法查處力度對酒駕事故的具體影響。具體思路:
(1)利用受干預(yù)影響之前的事故數(shù)據(jù),建立一個時間序列模型,并利用此模型進(jìn)行外推預(yù)測,得到假設(shè)不受干預(yù)影響情況下的預(yù)測值;
(2)分析預(yù)測值與受干預(yù)影響的實(shí)際值,識別干預(yù)效應(yīng)的形式,確定干預(yù)效應(yīng)函數(shù)的參數(shù),構(gòu)建干預(yù)分析時間序列模型;
(3)通過干預(yù)分析模型進(jìn)行事故趨勢預(yù)測。
利用受干預(yù)影響之前的酒駕事故數(shù)據(jù),建立時間序列模型,預(yù)測酒駕事故的發(fā)生情況。具體思路:首先識別酒駕事故是否為平穩(wěn)時間序列,若不為平穩(wěn)時間序列,則需要對原始序列做平穩(wěn)化處理;然后再建立差分自回歸滑動平均(ARIMA)模型。
1. 數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理,就是在建模之前先對原始數(shù)據(jù)做平穩(wěn)化處理、白噪聲檢驗(yàn)和離群值檢驗(yàn),使得處理后的數(shù)據(jù)滿足ARMA模型的假設(shè),為建模做好準(zhǔn)備工作。
首先檢驗(yàn)序列{Xt}的平穩(wěn)性。對原始序列做adf檢驗(yàn),當(dāng)滯后階數(shù)為2時,P值就大于0.1,所以有理由相信序列{Xt} 不為平穩(wěn)序列,屬于非平穩(wěn)時間序列。然后對序列進(jìn)行平穩(wěn)化。使用一階差分運(yùn)算后得到一個新序列{Yt} ,Yt=Xt-Xt-1,序列代表每周的環(huán)比變化量。在建模之前,還需檢驗(yàn)序列是否為白噪聲序列。再采用常用的Ljung-Box檢驗(yàn)法對新序列{Yt}做隨機(jī)性檢驗(yàn),檢驗(yàn)的結(jié)果詳見表1。
?
這說明,在0.01的顯著水平下,序列{Yt}不為純隨機(jī)性序列,即每月的環(huán)比變化序列{Yt}是有規(guī)律可循的,可以對其建立ARMA模型。
2. 模型識別
模型識別,就是對于給定的時間序列,選取適當(dāng)?shù)哪P碗A數(shù)p,d,q。在前面預(yù)處理過程中,通過一階差分,將非平穩(wěn)序列{Xt} 轉(zhuǎn)換為平穩(wěn)序列{Yt}。因此選定差分階數(shù)d=1。對于平穩(wěn)序列,識別p,q的主要根據(jù)是序列的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù)(PACF)的特征。若序列的偏自相關(guān)函數(shù)在滯后階以后截尾,而且它的自相關(guān)函數(shù)拖尾,則可判斷此序列是ARMA(p,0)序列。若序列的自相關(guān)函數(shù)在滯后q階以后截尾,而且它的偏自相關(guān)函數(shù)拖尾,則可判斷此序列是ARMA(0,q)序列。若序列的自相關(guān)函數(shù)、偏相關(guān)函數(shù)都呈拖尾形態(tài),則此序列是ARMA序列。根據(jù)序列{Yt}的樣本自相關(guān)函數(shù)和偏相關(guān)函數(shù),初步選定模型的階數(shù)為p=1,q=1。
3. 參數(shù)估計(jì)
在選定模型階數(shù)之后,對已識別模型中的若干參數(shù)進(jìn)行估計(jì)計(jì)算。為更準(zhǔn)確的選擇模型,采用模型的AIC信息檢驗(yàn)值進(jìn)行篩選,根據(jù)最小信息量準(zhǔn)則選取最優(yōu)模型,詳見表2。
?
將模型修正為ARMA(0,1),得到序列{Yt}的ARMA (2.0)模型,該模型的所有系數(shù)估計(jì)值都比較顯著。
4. 模型診斷
模型的顯著性檢驗(yàn)即檢驗(yàn)殘差序列是否為白噪聲序列。一個好的擬合模型應(yīng)該能夠提取觀察值序列中幾乎所有的樣本相關(guān)信息,即殘差序列應(yīng)該為白噪聲序列。反之,如果殘差序列為非白噪聲序列,那就意味著殘差序列中還殘留著相關(guān)信息未被提取,這就說明擬合模型不夠有效。令Xt代表模型對觀測值Xt的 估計(jì)值(擬合值),定義et=Xt-Xt為擬合殘差。采用Ljung-Box檢驗(yàn)法對殘差序列在自由度分別為6、12、18的情況下做三次白噪聲檢驗(yàn),檢驗(yàn)結(jié)果均顯著,可以認(rèn)為序列{et}為白噪聲序列,模型通過模型顯著性檢驗(yàn),詳見表3。
?
1. 模型說明
時間序列干預(yù)分析模型可以表示為:
其中,mt代 表干預(yù)效應(yīng)項(xiàng),它是干預(yù)變量的函數(shù),Nt為 ARIMA模型,代表著未受干預(yù)影響的基礎(chǔ)時間序列。干預(yù)變量有多種形式:第一種是持續(xù)性的干預(yù)變量,可以用階躍函數(shù)式(3)表示;第二種是短暫性的干預(yù)變量,用單位脈沖函數(shù)式(4)表示。
其中,T為干預(yù)時間。干預(yù)效應(yīng)對于模型的影響體現(xiàn)在mt的變化上。當(dāng)發(fā)生持續(xù)性干預(yù)時,干預(yù)效應(yīng)項(xiàng)可記為m=ωS T,其表示在T時刻發(fā)生的干預(yù)在經(jīng)過d個時間單位延遲后干預(yù)作用顯現(xiàn);同理當(dāng)短暫性干預(yù)發(fā)生時,干預(yù)效應(yīng)項(xiàng)可記為表示T時刻發(fā)生的干預(yù)在該時刻瞬間對模型產(chǎn)生了ω的影響。
干預(yù)效應(yīng)除了有一定的延遲,同時還可能與自身有一定的相關(guān)性,或者干預(yù)的強(qiáng)弱也有可能隨時間而變化,所以在實(shí)際問題中需要將以上基本形式結(jié)合起來,對干預(yù)效應(yīng)建模。
2. 建模過程描述
酒駕違法查處行動是非連續(xù)且有梯度的干擾,不像簡單持續(xù)性干擾一樣一次行動便始終維持,也不像短暫性干擾只對序列作用一次。在假定酒駕人群比例在短時間內(nèi)不會改變的前提下,酒駕查處力度與酒駕違法查處數(shù)呈正相關(guān)。酒駕違法查處數(shù)越多,象征著酒駕查處力度越大。一段時間內(nèi)酒駕查處力度的直接體現(xiàn)就是酒駕違法的查處數(shù)量。將TT時間的酒駕查處力度記為ωT, 干預(yù)模型如下:
其中,xt為 時間序列的干預(yù)項(xiàng),ηt為去除干預(yù)項(xiàng)的ARIMA時間序列模型。
3. 模型診斷
為診斷模型的有效性,需要對模型殘差進(jìn)行檢驗(yàn),通過分析其是否服從正態(tài)分布以及是否為白噪聲來判斷模型是否顯著。如圖2所示,其殘差服從正態(tài)分布。采用LjungBox 檢驗(yàn)法對上述模型的殘差序列{et}做模型顯著性檢驗(yàn),檢驗(yàn)的結(jié)果詳見表4,殘差序列為白噪聲序列的可能性大于99%,模型通過顯著性檢驗(yàn)。
?
從前文數(shù)據(jù)集的時間特征可知,2019年6月至12月是查處酒駕專項(xiàng)行動影響時段。因此筆者采用2018年5月-2019年5月間酒駕違法查處數(shù)據(jù)與酒駕交通事故數(shù)據(jù),建立受干預(yù)影響之前的時間序列模型,并預(yù)測2019年6月至2019年9月的酒駕事故數(shù)據(jù)。預(yù)測結(jié)果如圖3所示,其中實(shí)線為實(shí)際每周發(fā)生的酒駕事故數(shù),虛線為模型預(yù)測的酒駕事故數(shù),灰色區(qū)域?yàn)?5%置信區(qū)間。根據(jù)模型結(jié)果來看,在未受干預(yù)影響的情況下,序列呈現(xiàn)一個平穩(wěn)波動的趨勢,當(dāng)前一周的數(shù)據(jù)與前一周相關(guān),與更早的歷史數(shù)據(jù)關(guān)系不大。模型預(yù)測2019年6月至9月每周的酒駕事故數(shù)應(yīng)在35附近波動,其95%的置信區(qū)間為[21,48]。
將受干預(yù)影響前的時間序列模型的預(yù)測結(jié)果與實(shí)際數(shù)據(jù)進(jìn)行對比發(fā)現(xiàn),酒駕事故數(shù)量自2019年6月以來呈現(xiàn)下降趨勢,并且持續(xù)位于預(yù)測值置信區(qū)間以外??梢哉J(rèn)為因2019年6月查處酒駕專項(xiàng)行動,酒駕查處力度加大,對酒駕事故數(shù)產(chǎn)生了干預(yù)影響。接下來將通過干預(yù)分析模型來分析具體干預(yù)影響的程度。
首先利用kmeans方法將某城市酒駕違法查處數(shù)量進(jìn)行劃分,酒駕違法查處數(shù)量最高時段的查處力度標(biāo)記為3,次高的時段標(biāo)記為2,以此類推,最少的時段的查處力度標(biāo)記為0。具體劃分結(jié)果詳見表5。
?
然后,基于現(xiàn)有數(shù)據(jù)集進(jìn)行參數(shù)估計(jì),模型的數(shù)學(xué)表達(dá)式如下:
模型的擬合結(jié)果如圖4所示。其中紅色實(shí)線為模型的擬合結(jié)果,兩條藍(lán)色虛線間的范圍為模型置信區(qū)間??梢钥吹?,在置信區(qū)間下,對于數(shù)據(jù)的擬合較為符合。
圖4 干預(yù)模型擬合
通過模型對2020年6月以后的三個月數(shù)據(jù)進(jìn)行預(yù)測,結(jié)果如圖5所示,當(dāng)保持違法查處力度為0時,酒駕事故將維持原有水平;當(dāng)查處力度為1時,酒駕事故相比原有水平下降8.57%;當(dāng)違法查處力度為2時,酒駕事故相比原有水平下降17.14%;當(dāng)違法查處力度為3時,酒駕事故相比原有水平下降28.57%。以上分析說明酒駕查處力度對酒駕事故發(fā)生有干預(yù)影響。在酒駕查處力度加大時,酒駕事故有下降的趨勢。
通過建立干預(yù)分析模型發(fā)現(xiàn),酒駕違法查處力度對于事故發(fā)生的干預(yù)效用明顯。干預(yù)模型能夠用來定量分析交通違法行為查處力度對交通事故的干預(yù)影響,明確優(yōu)化執(zhí)勤執(zhí)法排班、調(diào)整執(zhí)法力度對事故的干預(yù)影響程度,進(jìn)而可以應(yīng)用于交通事故預(yù)防效果評估、事故趨勢預(yù)測,為有效預(yù)防酒駕事故提供技術(shù)支撐。
研究重點(diǎn)在干預(yù)模型的建立與分析,而在酒駕違法與酒駕事故數(shù)據(jù)相關(guān)性方面,僅進(jìn)行了初步探討,在未來需要進(jìn)行深入研究。