陳彬 于鵬程 張奇
摘 要:道路交通事故總量居高不下,嚴(yán)重威脅百姓的生命財(cái)產(chǎn)安全。本文通過Apriori算法對(duì)高速公路和城市道路兩種典型交通環(huán)境下的交通事故致因進(jìn)行關(guān)聯(lián)規(guī)則挖掘,用以發(fā)現(xiàn)事故致因間的關(guān)聯(lián)關(guān)系,從而可對(duì)道路交通事故防控起到一定的指導(dǎo)作用。
關(guān)鍵詞:事故致因;關(guān)聯(lián)規(guī)則;Apriori算法
中央級(jí)公益性科研院所基本科研業(yè)務(wù)費(fèi)專項(xiàng)資金資助項(xiàng)目:基于道路交通事故再現(xiàn)的風(fēng)險(xiǎn)意識(shí)評(píng)估與提升技術(shù)研究(111041000000180001201101)
根據(jù)公安部交通管理局發(fā)布數(shù)據(jù)顯示,自2018年全國(guó)接報(bào)道路交通事故起數(shù)同比上升21.8%后,基本維持穩(wěn)態(tài)波動(dòng)。道路交通事故的發(fā)生是由涉及到人員因素、車輛因素和交通環(huán)境因素等多方面客觀和主觀因素導(dǎo)致,傳統(tǒng)的道路交通事故分析已不能滿足事故防控需求。因此,為了切實(shí)找到事故發(fā)生的客觀規(guī)律,需要通過關(guān)聯(lián)規(guī)則分析對(duì)事故發(fā)生的影響因素進(jìn)行耦合分析[1],尋找其潛在的關(guān)聯(lián)規(guī)則,探尋事故發(fā)生的內(nèi)在規(guī)律,從而對(duì)實(shí)現(xiàn)事故“減量控大”[2],指導(dǎo)各地制定有針對(duì)性措施提供有益借鑒。
1關(guān)聯(lián)規(guī)則
挖掘關(guān)聯(lián)規(guī)則[3]就是尋找多要素間的頻繁項(xiàng)集合。為了量化表現(xiàn)項(xiàng)集間的關(guān)系,需要使用到兩個(gè)度量值:支持度(support)和可信度(confidence)。
其中,Support(X)表示X項(xiàng)目的支持度,number(X)表示X項(xiàng)集的頻數(shù),number(N)表示數(shù)據(jù)集總項(xiàng)集的頻數(shù)。公式表示為該項(xiàng)集記錄占數(shù)據(jù)集總記錄的比例。而“最小支持度”則是根據(jù)經(jīng)驗(yàn)預(yù)設(shè)定的一個(gè)閾值。
此外,針對(duì)具體問題具體分析,有學(xué)者在選取最小支持度和最小可信度時(shí),不采用設(shè)置閾值做對(duì)比的方法,而是直接將計(jì)算結(jié)果的前百分之N(N一般選用20)作為選取結(jié)果。尋找頻繁項(xiàng)集,就是篩選出達(dá)到已設(shè)定的最小支持度的項(xiàng)集。找出頻繁項(xiàng)集,是挖掘關(guān)聯(lián)規(guī)則的第一步,也是最重要的一步,然后再?gòu)念l繁項(xiàng)集中,計(jì)算項(xiàng)集之間的可信度。只有支持度和可信度都得到之后,才能夠挖掘出強(qiáng)關(guān)聯(lián)規(guī)則,即支持度與可信度同時(shí)滿足最小支持度與最小可信度的閾值設(shè)定,該關(guān)聯(lián)規(guī)則就是強(qiáng)關(guān)聯(lián)規(guī)則。
2 Apriori算法
Apriori算法[4]是通過遍歷輸入數(shù)據(jù)集,從單元素開始計(jì)算支持度,篩選出滿足最小支持度的頻繁一項(xiàng)集,再?gòu)倪@些頻繁一項(xiàng)集中連接各個(gè)元素生成兩個(gè)元素的候選二項(xiàng)集,計(jì)算支持度,篩選出頻繁二項(xiàng)集,以此類推,直到不能生成新的頻繁項(xiàng)集為止。自此,得到所有頻繁項(xiàng)集,從頻繁二項(xiàng)集開始計(jì)算可信度,每個(gè)頻繁項(xiàng)集間的所有元素都可互相計(jì)算可信度數(shù)值。由于所有頻繁項(xiàng)集都是滿足最小支持度閾值的,所以此時(shí)僅考慮并篩選出滿足最小可信度閾值的關(guān)聯(lián)關(guān)系,即為強(qiáng)關(guān)聯(lián)規(guī)則。
3實(shí)驗(yàn)分析
3.1 實(shí)驗(yàn)數(shù)據(jù)和關(guān)聯(lián)屬性
實(shí)驗(yàn)分析使用道路交通事故抽樣數(shù)據(jù),經(jīng)數(shù)據(jù)處理后,發(fā)現(xiàn)有16項(xiàng)事故影響屬性可能與事故發(fā)生存在強(qiáng)關(guān)聯(lián)關(guān)系,如表1所示。
3.2 實(shí)驗(yàn)條件和實(shí)驗(yàn)結(jié)果
本文選取了高速公路和城市道路[5]兩種交通場(chǎng)景進(jìn)行關(guān)聯(lián)性分析,為了保證實(shí)驗(yàn)結(jié)果不遺漏有效信息,實(shí)驗(yàn)設(shè)置上相對(duì)選取了較小的最小支持度(min_Sup)閾值和最小可信度(min_ Conf)閾值,且因?yàn)椴煌瑘?chǎng)景的數(shù)據(jù)采樣量不同,所以參數(shù)設(shè)置上也有所差異。
3.2.1 高速公路場(chǎng)景
高速公路場(chǎng)景下,取最小支持度min_Sup= 90/N(高速公路),其中N(高速公路)為高速公路場(chǎng)景下數(shù)據(jù)采樣量總量。取最小可信度min_Conf = 0.05。通過python編程,經(jīng)Apriori算法計(jì)算,結(jié)果按照可信度由高到底,取前10條違法行為和事故形態(tài)間的強(qiáng)關(guān)聯(lián)規(guī)則,如表2所示。
3.2.2 城市道路場(chǎng)景
城市道路場(chǎng)景下,取最小支持度min_Sup = 100/N(城市道路)、最小可信度min_Conf = 0.05。通過python編程,經(jīng)Apriori算法計(jì)算,結(jié)果按照可信度由高到底,取前10條違法行為和事故形態(tài)間的強(qiáng)關(guān)聯(lián)規(guī)則,如表3所示。
3.3 實(shí)驗(yàn)分析和總結(jié)
拋開數(shù)據(jù)樣本本身的局限性來說,由兩組實(shí)驗(yàn)的結(jié)果可見,高速公路和城市道路場(chǎng)景下的強(qiáng)關(guān)聯(lián)規(guī)則既有相同性,也有差異性。
相同性在于在發(fā)生事故的前提下,發(fā)生“碰撞運(yùn)動(dòng)車輛”的事故形態(tài)的強(qiáng)度都很高,最高由“違法變更車道”的行為發(fā)生時(shí),會(huì)有約90%的概率導(dǎo)致“碰撞運(yùn)動(dòng)車輛”的事故結(jié)果;最低由“違法上道路行駛”的行為發(fā)生,會(huì)有約11%的概率導(dǎo)致“碰撞運(yùn)動(dòng)車輛”的事故結(jié)果,可見在這兩種場(chǎng)景下,違法行為都很容易導(dǎo)致車輛間的碰撞事故。
差異性主要體現(xiàn)在以下幾個(gè)方面:
(1)高速公路場(chǎng)景下的強(qiáng)關(guān)聯(lián)規(guī)則在強(qiáng)度上明顯弱于城市道路場(chǎng)景。在城市道路場(chǎng)景中,前10項(xiàng)關(guān)聯(lián)規(guī)則中最高關(guān)聯(lián)強(qiáng)度可達(dá)約90%,最低也在57%左右,而在高速公路場(chǎng)景,最高約60%,最低則只有11%左右;
(2)不同場(chǎng)景下的強(qiáng)關(guān)聯(lián)規(guī)則不同。在高速公路場(chǎng)景下,強(qiáng)關(guān)聯(lián)規(guī)則的違法行為主要集中在“疲勞駕駛”“違法上道路行駛”和“超速行駛”上,而在城市道路場(chǎng)景,強(qiáng)關(guān)聯(lián)規(guī)則的違法行為分布均勻;在城市道路場(chǎng)景下,強(qiáng)關(guān)聯(lián)規(guī)則的事故形態(tài)主要集中在“碰撞運(yùn)動(dòng)車輛”,而在高速公路場(chǎng)景,主要集中在“追尾碰撞”和“碰撞運(yùn)動(dòng)車輛”。
(3)不同場(chǎng)景下相同違法行為導(dǎo)致相同事故形態(tài)的關(guān)聯(lián)度差別大?!斑`法上道路行駛→碰撞運(yùn)動(dòng)車輛”的關(guān)聯(lián),在高速公路場(chǎng)景的關(guān)聯(lián)度只有11%左右,而在城市道路場(chǎng)景約58%。
(4)不同場(chǎng)景下相同違法行為導(dǎo)致不同事故形態(tài)比例差別也很大。在城市道路場(chǎng)景中,“違法上道路行駛”只與“碰撞運(yùn)動(dòng)車輛”具有強(qiáng)關(guān)聯(lián),而在高速公路場(chǎng)景中,其強(qiáng)關(guān)聯(lián)要素還包括“刮撞行人”和“追尾碰撞”。
4結(jié)束語
使用Apriori算法對(duì)事故數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則挖掘分析,可以準(zhǔn)確找到各屬性間的關(guān)聯(lián)關(guān)系,對(duì)事故防控可以一定的指導(dǎo)作用。下步除了將關(guān)聯(lián)規(guī)則分析由違法行為和事故形態(tài)向多維度挖掘外,還將進(jìn)一步拓展交通場(chǎng)景,最終形成事故致因的關(guān)聯(lián)規(guī)則庫(kù),為道路交通事故“減量控大”提供支撐。
參考文獻(xiàn)
[1]馬庚華,鄭長(zhǎng)江,鄧評(píng)心,李銳.關(guān)聯(lián)規(guī)則挖掘在道路交通事故分析中的應(yīng)用[J].西華大學(xué)學(xué)報(bào)(自然科學(xué)版),2019,38(03):93-97+112.
[2]交宣.公安部交管局:深入推進(jìn)道路交通事故預(yù)防“減量控大”工作 全力確保道路交通安全形勢(shì)穩(wěn)定[J].汽車與安全,2020(10):9-11.
[3]王冬秀,賴先濤,李輝,蘇宇.道路交通事故中關(guān)聯(lián)規(guī)則挖掘研究[J].計(jì)算機(jī)與現(xiàn)代化,2012(08):206-208+217.
[4]李英,湯庸.基于關(guān)聯(lián)規(guī)則與相似度的數(shù)據(jù)挖掘算法研究[J].華南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2021,53(05):121-127.
[5]城市道路交通事故特點(diǎn)分析[J].汽車與安全,2019(07):13-14+2.