国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別與量化研究

2022-08-30 02:40覃文文鄢祺陽(yáng)谷金晶李武戢曉峰
關(guān)鍵詞:載貨車(chē)軌跡聚類(lèi)

覃文文,鄢祺陽(yáng),谷金晶,李武,戢曉峰*

(1.昆明理工大學(xué),交通工程學(xué)院,昆明 650504;2.云南省現(xiàn)代物流工程研究中心,昆明 650504;3.同濟(jì)大學(xué),電子與信息工程學(xué)院,上海 201804;4.大連理工大學(xué),建設(shè)工程學(xué)部,遼寧大連 116024)

0 引言

駕駛風(fēng)格是對(duì)駕駛?cè)肆?xí)慣性駕駛方式的泛化概括,綜合反映了駕駛?cè)斯逃械鸟{駛行為模式[1]。一般來(lái)說(shuō),駕駛風(fēng)格的激進(jìn)程度與事故數(shù)量呈現(xiàn)正相關(guān)關(guān)系,具體地,駕駛?cè)税l(fā)生超速、急加減速等不良駕駛行為的頻次越高,誘發(fā)交通事故的可能性越大[2]。與小汽車(chē)駕駛?cè)讼啾?,由于貨源的不確定性及其與目的地距離偏長(zhǎng)等因素,重載貨車(chē)駕駛?cè)似毡榇嬖谛熊?chē)速度快、駕駛時(shí)間長(zhǎng)等特點(diǎn),更容易表現(xiàn)出不良駕駛行為,進(jìn)而形成激進(jìn)的駕駛風(fēng)格[3-4]。2017年,《道路交通運(yùn)輸安全發(fā)展報(bào)告(2017)》特別指出,重載貨車(chē)駕駛?cè)思みM(jìn)駕駛風(fēng)格導(dǎo)致的事故數(shù)、死亡人數(shù)和直接經(jīng)濟(jì)損失分別占相應(yīng)總數(shù)的47.08%、56.18%和59.65%[5]。統(tǒng)計(jì)數(shù)據(jù)表明,重載貨車(chē)駕駛?cè)说募みM(jìn)駕駛風(fēng)格具有強(qiáng)烈的習(xí)慣性特征和風(fēng)險(xiǎn)性特征,一旦養(yǎng)成很難矯正,目前已成為交通事故最主要的致因之一。因此,研究重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格特性及其風(fēng)險(xiǎn)性,對(duì)于開(kāi)展重載貨車(chē)駕駛?cè)笋{駛行為安全教育,降低重載貨車(chē)交通事故發(fā)生率具有指導(dǎo)借鑒意義。

近年來(lái),駕駛風(fēng)格研究吸引了眾多國(guó)內(nèi)外學(xué)者的關(guān)注?,F(xiàn)有成果主要集中于數(shù)據(jù)獲取相對(duì)容易的小汽車(chē)駕駛?cè)笋{駛風(fēng)格辨識(shí),涉及重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的研究尚不多見(jiàn)。采用的研究數(shù)據(jù)主要包括:?jiǎn)柧碚{(diào)查[6]、駕駛模擬實(shí)驗(yàn)[7]、道路實(shí)車(chē)駕駛實(shí)驗(yàn)[8-10]和交通運(yùn)輸企業(yè)運(yùn)營(yíng)數(shù)據(jù)等[11-13]。其中,問(wèn)卷調(diào)查數(shù)據(jù)主觀(guān)性較強(qiáng),導(dǎo)致數(shù)據(jù)難以反映真實(shí)駕駛情況;在駕駛模擬實(shí)驗(yàn)中,模擬環(huán)境的逼真度極大地影響了所獲取數(shù)據(jù)的可靠性;道路實(shí)車(chē)駕駛實(shí)驗(yàn)通常行程較短,受實(shí)驗(yàn)人數(shù)限制,得到的研究樣本較少。此外,受試者可能會(huì)刻意避免不良駕駛行為,難以獲取到駕駛?cè)说恼鎸?shí)駕駛行為特征。而通過(guò)交通運(yùn)輸企業(yè)獲取的運(yùn)營(yíng)數(shù)據(jù)具有數(shù)據(jù)規(guī)模大、真實(shí)性好、可靠性強(qiáng)的優(yōu)點(diǎn),能夠有效反映駕駛?cè)说鸟{駛行為。然而,道路實(shí)車(chē)駕駛實(shí)驗(yàn)數(shù)據(jù)和交通運(yùn)輸企業(yè)運(yùn)營(yíng)數(shù)據(jù)以采集頻率不低于1 Hz 的高頻軌跡數(shù)據(jù)為主,低頻軌跡數(shù)據(jù)較為鮮見(jiàn)。高頻軌跡數(shù)據(jù)雖然精度較高,但數(shù)據(jù)采集、存儲(chǔ)、處理成本高昂,導(dǎo)致大規(guī)模應(yīng)用成本較高。而低頻軌跡數(shù)據(jù)的優(yōu)勢(shì)在于獲取相對(duì)容易、成本低,在實(shí)際應(yīng)用中,60%以上的GPS 軌跡數(shù)據(jù)均為低頻采樣[14]。根據(jù)《道路運(yùn)輸車(chē)輛動(dòng)態(tài)監(jiān)督管理辦法》的規(guī)定,我國(guó)重載貨車(chē)已全部安裝衛(wèi)星定位裝置,獲取的低頻軌跡數(shù)據(jù)已接入道路貨運(yùn)車(chē)輛公共管理平臺(tái)[15],這為基于低頻軌跡數(shù)據(jù)開(kāi)展廣域尺度的重載貨車(chē)駕駛?cè)笋{駛風(fēng)格研究提供了基礎(chǔ)。

盡管如此,大部分學(xué)者偏向于研究小汽車(chē)駕駛?cè)说鸟{駛風(fēng)格聚類(lèi)分析與駕駛風(fēng)格識(shí)別。在駕駛風(fēng)格聚類(lèi)方法層面,現(xiàn)有研究主要采用無(wú)監(jiān)督學(xué)習(xí)方法進(jìn)行風(fēng)格劃分,如K-均值(K-means)聚類(lèi)[6-9,12-13,16]、高斯混合模型[10]和層次聚類(lèi)[11]等。其中,K-means 在運(yùn)算效率和精度上均表現(xiàn)較好[7,17],被廣泛應(yīng)用于駕駛風(fēng)格聚類(lèi)分析中。對(duì)于風(fēng)格數(shù)量的界定,既有研究多以輪廓系數(shù)等指標(biāo)作為依據(jù),將駕駛風(fēng)格劃分為2 類(lèi)[9](正常、激進(jìn))、3類(lèi)[6,8,10,12,13,16-17](激進(jìn)、保守、溫和)或者4類(lèi)[7](安全、一般-安全、一般-危險(xiǎn)、危險(xiǎn)),在此基礎(chǔ)上,定性評(píng)估不同風(fēng)格間的特性。然而,僅有少數(shù)文獻(xiàn)報(bào)道了貨車(chē)駕駛?cè)说鸟{駛風(fēng)格聚類(lèi)研究。Figueredo 等[11]以油門(mén)持續(xù)時(shí)間、行車(chē)距離、行車(chē)時(shí)間、制動(dòng)等特征為表征指標(biāo),聚類(lèi)得到英國(guó)貨車(chē)駕駛?cè)说?種行為模式。孫川等[12]基于貨車(chē)速度特征,結(jié)合因子分析與K-means聚類(lèi)算法,圍繞超速、變速、減速和加速分別進(jìn)行分析,提出變速駕駛行為程度較重的駕駛?cè)笋{駛風(fēng)險(xiǎn)較高。王海星等[13]基于貨車(chē)速度與加速度特征,采用因子分析方法提取超速、急加減速和變速因子,利用模糊C均值方法將駕駛操作評(píng)價(jià)結(jié)果劃分為劇烈、較大、一般和較好,并挖掘出具有危險(xiǎn)傾向的駕駛?cè)恕?/p>

在駕駛風(fēng)格識(shí)別方法層面,駕駛風(fēng)格識(shí)別主要以聚類(lèi)結(jié)果[8-9]為數(shù)據(jù)標(biāo)簽,采用監(jiān)督學(xué)習(xí)方法進(jìn)行風(fēng)格識(shí)別。常用方法包括:支持向量機(jī)(Support Vector Machine,SVM)[8]、AdaBoost 算法[9]和隨機(jī)森林(Random Forest,RF)[17]等。其中,SVM 具有較高的識(shí)別精度和較好的魯棒性,能很好地識(shí)別出不同類(lèi)型的駕駛風(fēng)格[8]。類(lèi)似地,現(xiàn)有針對(duì)貨車(chē)駕駛?cè)说鸟{駛風(fēng)格識(shí)別研究,均參考小汽車(chē)駕駛?cè)说鸟{駛風(fēng)格識(shí)別分析模式,即采用車(chē)輛運(yùn)動(dòng)數(shù)據(jù),提煉出特征參數(shù)(如車(chē)速平均值、加速度、角速度等)來(lái)刻畫(huà)貨車(chē)駕駛?cè)说鸟{駛風(fēng)格。徐婷等[9]對(duì)貨車(chē)的加速度、發(fā)動(dòng)機(jī)轉(zhuǎn)速等指標(biāo)進(jìn)行聚類(lèi),以聚類(lèi)結(jié)果作為數(shù)據(jù)標(biāo)簽,訓(xùn)練基于A(yíng)daBoost方法的識(shí)別模型,識(shí)別準(zhǔn)確率達(dá)到98.74%。Wang 等[17]以角速度、油門(mén)開(kāi)合等特征為指標(biāo),從聚類(lèi)中獲得樣本數(shù)據(jù)標(biāo)簽,建立基于RF 的礦用卡車(chē)駕駛風(fēng)格識(shí)別模型,在重載和空載工況下,識(shí)別準(zhǔn)確率分別達(dá)到95.39%和90.74%。

上述研究可為重載貨車(chē)駕駛?cè)孙L(fēng)格辨識(shí)提供有益參考,但還存在以下不足:(1)現(xiàn)有駕駛風(fēng)格研究對(duì)象多聚焦于小汽車(chē)駕駛?cè)?,所采用?shù)據(jù)各異,缺少基于低頻軌跡數(shù)據(jù)分析廣域尺度的重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的研究范式和框架;(2)現(xiàn)有貨車(chē)駕駛?cè)笋{駛風(fēng)格研究成果的特征構(gòu)建主要移植于小汽車(chē)駕駛?cè)笋{駛風(fēng)格特征體系,對(duì)重載貨車(chē)駕駛?cè)说男熊?chē)特點(diǎn)考慮不足,特別是疲勞駕駛;(3)現(xiàn)有成果多側(cè)重于貨車(chē)駕駛?cè)说鸟{駛風(fēng)格分析和識(shí)別,鮮有研究在風(fēng)格識(shí)別的基礎(chǔ)上進(jìn)一步對(duì)單個(gè)貨車(chē)駕駛?cè)说鸟{駛風(fēng)格表現(xiàn)及其風(fēng)險(xiǎn)性進(jìn)行量化評(píng)估。

因此,本文首先構(gòu)建超速駕駛特征集和疲勞駕駛特征集,綜合表征重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格。然后,通過(guò)因子分析對(duì)特征集進(jìn)行特征約簡(jiǎn),以Kmeans 聚類(lèi)方法獲得的風(fēng)格類(lèi)別作為識(shí)別模型的數(shù)據(jù)標(biāo)簽,訓(xùn)練基于SVM的駕駛風(fēng)格識(shí)別模型,并對(duì)比梯度提升決策樹(shù)(Gradient Boosting Decision Tree,GBDT)的識(shí)別性能。最后,建立基于CRITIC賦權(quán)法的駕駛風(fēng)格量化評(píng)估模型,實(shí)現(xiàn)對(duì)重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的類(lèi)別標(biāo)定、快速識(shí)別和定量評(píng)估。

1 數(shù)據(jù)描述

本文所用的重載貨車(chē)軌跡數(shù)據(jù)獲取于某全國(guó)貨運(yùn)監(jiān)管平臺(tái),主要分布于云南省域,圖1 清晰地對(duì)部分?jǐn)?shù)據(jù)進(jìn)行了空間呈現(xiàn),可見(jiàn),軌跡點(diǎn)在各種等級(jí)道路上均有分布。該數(shù)據(jù)集采集于2019年3月1~7日,采樣間隔為30 s,總計(jì)約6 億個(gè)軌跡點(diǎn)。每個(gè)軌跡點(diǎn)包含6個(gè)字段,分別為車(chē)輛編號(hào)、經(jīng)度、緯度、時(shí)間戳、瞬時(shí)速度和方向角。其中,車(chē)輛編號(hào)作為唯一標(biāo)識(shí),對(duì)應(yīng)了單個(gè)重載貨車(chē)駕駛?cè)耍粫r(shí)間戳和瞬時(shí)速度在一定程度上反映了重載貨車(chē)駕駛?cè)说鸟{駛行為特征。本文將在研究方法部分詳細(xì)介紹如何從低頻軌跡數(shù)據(jù)中提煉出特征參數(shù)集。

圖1 部分軌跡數(shù)據(jù)的可視化Fig.1 Visualization of partial trajectory data

2 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格研究方法

在方法部分,本文提出用于快速識(shí)別與量化評(píng)估重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的研究框架,如圖2所示。該框架主要由5 個(gè)步驟組成,分別為數(shù)據(jù)準(zhǔn)備、特征約簡(jiǎn)、風(fēng)格聚類(lèi)、風(fēng)格識(shí)別與風(fēng)格量化。第1 部分為數(shù)據(jù)準(zhǔn)備階段,主要包括數(shù)據(jù)預(yù)處理和特征參數(shù)集的構(gòu)建;第2 部分為特征約簡(jiǎn),采用因子分析方法,對(duì)兩類(lèi)特征集進(jìn)行降維;第3 部分為風(fēng)格聚類(lèi),基于降維后的結(jié)果,實(shí)現(xiàn)基于K-means 方法的重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格聚類(lèi);第4部分在風(fēng)格聚類(lèi)的基礎(chǔ)上,構(gòu)建重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格識(shí)別模型,目的是在方法應(yīng)用層面,隨著新駕駛?cè)藛T加入,能夠快速識(shí)別出任意一個(gè)重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格;第5部分在識(shí)別出單個(gè)重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的基礎(chǔ)上,對(duì)其駕駛風(fēng)格的風(fēng)險(xiǎn)性進(jìn)行定量打分。

圖2 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別與量化研究框架Fig.2 Basic frame work of proposed methodology for driving styles of heavy-duty truck drivers

2.1 數(shù)據(jù)準(zhǔn)備

2.1.1 軌跡提取

與其他等級(jí)道路工況相比,高速公路的工況受外界干擾較小,能夠清晰地反映駕駛?cè)说鸟{駛習(xí)慣。此外,觀(guān)察圖1呈現(xiàn)的重載貨車(chē)在云南省內(nèi)的行駛軌跡可以發(fā)現(xiàn),大部分軌跡點(diǎn)分布在云南省高速公路上。因此,本文選取云南省高速公路網(wǎng)作為研究區(qū)域,將方向角不在0~360°區(qū)間內(nèi),定位不在云南省范圍內(nèi)或者瞬時(shí)速度高于120 km·h-1的軌跡點(diǎn)剔除,重復(fù)記錄只保留1條。根據(jù)貨車(chē)在高速公路上最低車(chē)速不得低于60 km·h-1的規(guī)定[18],再鑒于重載貨車(chē)在高速公路上的行駛時(shí)間較長(zhǎng),本文只研究持續(xù)駕駛時(shí)間大于20 min 且瞬時(shí)速度均大于60 km·h-1的軌跡,提取在云南省主要高速公路上行駛的1567輛重載貨車(chē)的GPS軌跡數(shù)據(jù)。

2.1.2 特征構(gòu)建

現(xiàn)有研究廣泛采用角速度、加速度等微觀(guān)駕駛行為特征,用于表征駕駛?cè)说鸟{駛風(fēng)格。然而,此類(lèi)特征參數(shù)對(duì)低頻軌跡數(shù)據(jù)不適用[16]。因此,本文結(jié)合重載貨車(chē)駕駛?cè)诵熊?chē)速度快和駕駛時(shí)間長(zhǎng)的特點(diǎn),基于低頻軌跡數(shù)據(jù)構(gòu)建了疲勞駕駛特征集和超速駕駛特征集,如表1所示。重載貨車(chē)駕駛?cè)顺掷m(xù)駕駛時(shí)間越長(zhǎng),越容易出現(xiàn)疲勞駕駛行為[18]。故本文采用最大持續(xù)駕駛時(shí)間、超時(shí)駕駛時(shí)間、疲勞駕駛時(shí)間比例綜合反映重載貨車(chē)駕駛?cè)说钠隈{駛行為。此外,平均速度[13]、最大速度[9]、平均最大速度能在一定程度反映重載貨車(chē)駕駛?cè)说某亳{駛傾向。故本文選取超速駕駛頻次、超速駕駛時(shí)間比例[11]、平均速度、最大速度、平均最大速度作為表征重載貨車(chē)駕駛?cè)顺亳{駛的重要特征。

表1 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格特征集Table 1 Driving style features of heavy-duty truck drivers

根據(jù)《中華人民共和國(guó)道路交通安全法實(shí)施條例》規(guī)定,駕駛機(jī)動(dòng)車(chē)不得出現(xiàn)持續(xù)駕駛4 h未停車(chē)休息或休息不足20 min的行為;貨運(yùn)汽車(chē)在高速公路上最高時(shí)速不得高于100 km·h-1[19]。因此,本文將持續(xù)駕駛時(shí)間超過(guò)4 h的部分定義為超時(shí)駕駛時(shí)間,但鑒于云南高速公路橋隧占比高、路線(xiàn)起伏大、急彎陡坡多,故本文將瞬時(shí)速度大于90 km·h-1的軌跡點(diǎn)判別為超速。如果超速軌跡點(diǎn)是孤立的點(diǎn),那么認(rèn)為發(fā)生了1次超速駕駛行為,下一軌跡點(diǎn)的時(shí)間戳與該點(diǎn)時(shí)間戳的差值記錄為超速駕駛持續(xù)時(shí)間;如果多個(gè)超速軌跡點(diǎn)相鄰,則合并這些軌跡點(diǎn),只記為1 次超速駕駛,以超速軌跡終點(diǎn)時(shí)間戳與起點(diǎn)時(shí)間戳的差值作為超速駕駛持續(xù)時(shí)間。

2.2 因子分析

既有研究多采用較高維度的特征表征駕駛風(fēng)格,且通常利用主成分分析方法進(jìn)行維度約簡(jiǎn)[6,8],但該方法難以對(duì)提取出的主成分所代表的含義進(jìn)行清晰解釋。因子分析作為主成分分析的推廣,能夠很好地克服主成分分析方法固有的不足。本文選取的表征重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的特征參數(shù)較多,有必要利用因子分析方法對(duì)特征進(jìn)行降維。在此基礎(chǔ)上,本文將基于約簡(jiǎn)得到的主因子,利用聚類(lèi)方法獲得不同類(lèi)型的重載貨車(chē)駕駛?cè)笋{駛風(fēng)格。

2.3 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格聚類(lèi)

為從重載貨車(chē)行駛軌跡中提煉出駕駛?cè)说鸟{駛風(fēng)格,以因子分析提取的主因子作為變量進(jìn)行聚類(lèi),將K-means算法的聚類(lèi)結(jié)果作為下一步風(fēng)格識(shí)別的數(shù)據(jù)標(biāo)簽。為確定重載貨車(chē)駕駛?cè)笋{駛風(fēng)格最佳的聚類(lèi)個(gè)數(shù),本文利用戴維森堡丁指數(shù)(Davies-Bouldin Index, DBI)衡量聚類(lèi)效果。計(jì)算公式為

式中:l為聚類(lèi)個(gè)數(shù);為第u類(lèi)樣本間的平均距離;為第v類(lèi)樣本間的平均距離;duv為第u類(lèi)與第v類(lèi)質(zhì)心間的距離。DBI(k)越小,說(shuō)明聚類(lèi)效果越好。

2.4 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別

為實(shí)現(xiàn)對(duì)未知單個(gè)重載貨車(chē)駕駛?cè)笋{駛風(fēng)格的識(shí)別,本文基于SVM 訓(xùn)練風(fēng)格識(shí)別模型。SVM是一種學(xué)習(xí)能力強(qiáng)、準(zhǔn)確率高、泛化能力較強(qiáng)的機(jī)器學(xué)習(xí)算法,核心思想是尋找一個(gè)使兩個(gè)類(lèi)別之間間隔最大的超平面,適合處理非線(xiàn)性和高維的分類(lèi)問(wèn)題。通過(guò)構(gòu)造最優(yōu)化問(wèn)題,并計(jì)算最優(yōu)解λ*=(λ*1;λ*2;…;λ*m)和偏移量最優(yōu)解b*,即

式中:xα、xβ為表1 中駕駛風(fēng)格特征;yα為駕駛風(fēng)格類(lèi)別;α、β=1,2,…,m,m為駕駛?cè)藰颖緮?shù);λ*α為拉格朗日乘子;K為核函數(shù);sgn 為符號(hào)函數(shù)。根據(jù)式(2)分類(lèi)決策函數(shù)識(shí)別駕駛風(fēng)格。為驗(yàn)證SVM 模型的識(shí)別性能,用與SVM 一樣具有較強(qiáng)泛化能力的GBDT模型作駕駛風(fēng)格識(shí)別對(duì)照試驗(yàn)。

2.5 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格評(píng)估

2.5.1 駕駛風(fēng)格量化

在利用風(fēng)格識(shí)別模型確定單個(gè)重載貨車(chē)駕駛?cè)笋{駛風(fēng)格之后,為進(jìn)一步確定該駕駛?cè)说鸟{駛表現(xiàn)及其潛在的行車(chē)風(fēng)險(xiǎn)性,有必要對(duì)其駕駛風(fēng)格進(jìn)行量化評(píng)估。本文以超速駕駛特征值和疲勞駕駛特征值刻畫(huà)不同駕駛風(fēng)格的駕駛風(fēng)險(xiǎn),假設(shè)重載貨車(chē)駕駛?cè)似隈{駛與超速駕駛特征值越大,則駕駛表現(xiàn)越差,駕駛風(fēng)險(xiǎn)越高,評(píng)分越低。基于此,結(jié)合每一個(gè)超速駕駛特征和疲勞駕駛特征的累積分布函數(shù)確定評(píng)估值,并考慮不同特征的權(quán)重差異,建立風(fēng)格量化評(píng)估模型為

式中:S(x)為駕駛?cè)藊的駕駛風(fēng)格量化得分,范圍為0~100 分,得分越高表明該駕駛?cè)笋{駛表現(xiàn)越好,駕駛風(fēng)險(xiǎn)越低;ωj為第j個(gè)特征參數(shù)的權(quán)重,j∈n;n為特征總數(shù);Fj(xj)為第j個(gè)特征參數(shù)的累積分布函數(shù)。

2.5.2 CRITIC賦權(quán)法

為確定式(3)中權(quán)重,本文引入CRITIC 賦權(quán)法確定不同特征參數(shù)的權(quán)重。CRITIC賦權(quán)法是基于評(píng)價(jià)特征對(duì)比強(qiáng)度與特征間沖突性,綜合衡量特征權(quán)重的一種客觀(guān)賦權(quán)方法。既考慮了特征內(nèi)數(shù)據(jù)的變異性,又兼顧了特征之間數(shù)據(jù)的相關(guān)性。權(quán)重計(jì)算時(shí),先確定信息量,再對(duì)其進(jìn)行歸一化處理,即得到各個(gè)特征的權(quán)重。計(jì)算公式為

式中:Cj為第j個(gè)特征的信息量,公式為

式中:δj為第j個(gè)特征的標(biāo)準(zhǔn)差,即特征的對(duì)比強(qiáng)度;Rj為第j個(gè)特征與其他特征間的沖突性;rjk為特征j與特征k之間的相關(guān)系數(shù)。

3 結(jié)果分析

3.1 因子分析結(jié)果

本文利用SPSS26 進(jìn)行因子分析,首先驗(yàn)證因子分析可行性,得出KMO 值(Kaiser-Meyer-Olkin)為0.739(>0.5),變量間相關(guān)性較好;巴特利特球形度檢驗(yàn)顯著性水平為0.000(<0.05),拒絕原假設(shè),因子分析有效。其次,采用主成分分析法提取因子并計(jì)算各因子方差貢獻(xiàn)率,如表2所示,可知,前兩個(gè)主因子特征值大于1,累計(jì)方差貢獻(xiàn)率為80.838%(>60%),因子提取效果較好。因此,選取兩個(gè)主因子進(jìn)行分析。

表2 各因子方差貢獻(xiàn)率Table 2 Accumulative contribution for different factor

再利用凱撒正態(tài)化最大方差法對(duì)因子進(jìn)行旋轉(zhuǎn),如表3 所示??芍褐饕蜃? 在平均速度、最大速度、平均最大速度、超速駕駛頻次、超速駕駛時(shí)間比例上載荷較大,故將其命名為超速因子;主因子2在最大持續(xù)駕駛時(shí)間、超時(shí)駕駛時(shí)間、疲勞駕駛時(shí)間比例上載荷較大,故將其命名為疲勞因子。

表3 旋轉(zhuǎn)后的因子載荷矩陣Table 3 Factor loading matrix after rotation

3.2 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格聚類(lèi)結(jié)果分析

現(xiàn)有研究中,駕駛風(fēng)格主要被劃分為2~4類(lèi)[6-10],并以3 類(lèi)居多。因此,本文計(jì)算聚類(lèi)結(jié)果分別為2~5 類(lèi)時(shí)的DBI 值,分別為0.9104、0.7706、0.8178、0.8747。其中,樣本劃分為3 類(lèi)時(shí),DBI 最小。然而,此時(shí)不同類(lèi)別的駕駛風(fēng)格特性難以被清晰解釋。樣本劃分為4類(lèi)時(shí),不同類(lèi)別的疲勞駕駛特征和超速駕駛特征最明顯,且更符合人類(lèi)的認(rèn)知規(guī)律,故將貨車(chē)駕駛?cè)笋{駛風(fēng)格劃分為4類(lèi),圖3直觀(guān)地對(duì)聚類(lèi)結(jié)果進(jìn)行了展示。

圖3 聚類(lèi)結(jié)果Fig.3 Clustering results

結(jié)合圖3 和表4 可知,類(lèi)1 聚類(lèi)中心的超速因子與疲勞因子都最小,故將其代表的駕駛風(fēng)格命名為穩(wěn)健型,包含981個(gè)樣本,占比62.60%,此類(lèi)駕駛?cè)诵熊?chē)較謹(jǐn)慎;類(lèi)2 聚類(lèi)中心的超速因子最大,故將其代表的駕駛風(fēng)格命名為超速型,包含392個(gè)樣本,占比25.02%,駕駛風(fēng)格特點(diǎn)主要表現(xiàn)為超速駕駛;類(lèi)3 聚類(lèi)中心的疲勞因子較大,故將其代表的駕駛風(fēng)格命名為疲勞型,駕駛風(fēng)格特點(diǎn)主要表現(xiàn)為疲勞駕駛,包含116個(gè)樣本,占比7.40%;類(lèi)4聚類(lèi)中心的疲勞因子最大,且超速因子僅小于類(lèi)2,故將其代表的駕駛風(fēng)格命名為危險(xiǎn)型,包含78個(gè)樣本,占比4.98%,此類(lèi)駕駛?cè)舜嬖谳^嚴(yán)重的疲勞駕駛與超速駕駛行為。其中,超速型、危險(xiǎn)型和疲勞型的樣本之和在總體中占比37.40%。顯而易見(jiàn)的,重載貨車(chē)駕駛?cè)说牟话踩{駛風(fēng)格仍普遍存在,對(duì)于重載貨車(chē)駕駛?cè)说倪x拔培訓(xùn)和安全教育有待于進(jìn)一步規(guī)范和加強(qiáng)。

表4 聚類(lèi)中心及結(jié)果Table 4 Clustering centers and results

3.3 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別結(jié)果及分析

利用scikit-learn 機(jī)器學(xué)習(xí)開(kāi)源框架,以構(gòu)建的特征集作為數(shù)據(jù)特征,以3.2 節(jié)聚類(lèi)得到的4 類(lèi)駕駛風(fēng)格作為數(shù)據(jù)標(biāo)簽,按7∶3將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,再采用SMOTE(Synthetic Minority Oversampling Technique)方法對(duì)訓(xùn)練集進(jìn)行過(guò)采樣處理,解決不同類(lèi)別間樣本的不平衡問(wèn)題,構(gòu)建基于SVM 的駕駛風(fēng)格識(shí)別模型,并在相同數(shù)據(jù)集上對(duì)比GBDT 的識(shí)別效果。兩個(gè)模型都通過(guò)網(wǎng)格搜索和5折交叉驗(yàn)證確定最佳參數(shù)組合,相關(guān)參數(shù)如表5所示。

表5 模型相關(guān)參數(shù)Table 5 Related parameters of classification models

根據(jù)識(shí)別結(jié)果分別繪制兩種識(shí)別模型在測(cè)試集上的混淆矩陣圖,如圖4所示。

圖4 駕駛風(fēng)格識(shí)別模型混淆矩陣Fig.4 Confusion matrix for driving style recognition model

圖4 中混淆矩陣對(duì)角線(xiàn)上數(shù)值代表每個(gè)類(lèi)別分類(lèi)正確的數(shù)量,值越大越好。明顯地,SVM在穩(wěn)健型、疲勞型和危險(xiǎn)型上分類(lèi)正確的數(shù)量更多,對(duì)4種風(fēng)格的識(shí)別準(zhǔn)確率均大于97%。進(jìn)一步計(jì)算各識(shí)別模型的精確率、召回率、F1-score,表6 為兩種模型在不同駕駛風(fēng)格上的表現(xiàn)??梢?jiàn),SVM 識(shí)別不同駕駛風(fēng)格的精確率、召回率、F1值均大于等于GBDT 相應(yīng)的評(píng)估指標(biāo),表明SVM 的識(shí)別性能整體最好。因此,本文采用SVM 識(shí)別重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格。

表6 模型識(shí)別效果Table 6 Results of recognition model

3.4 重載貨車(chē)駕駛?cè)笋{駛風(fēng)格評(píng)估結(jié)果及分析

圖5 為所有樣本超速駕駛特征和疲勞駕駛特征的頻次直方圖。明顯地,平均速度、平均最大速度、最大速度、最大持續(xù)駕駛時(shí)間呈對(duì)數(shù)正態(tài)分布,超時(shí)行駛時(shí)間、疲勞駕駛時(shí)間比例、超速駕駛頻次、超速駕駛時(shí)間比例呈指數(shù)分布。

圖5 駕駛風(fēng)格特征頻次分布圖Fig.5 Frequency distribution of driving style features

根據(jù)上述各個(gè)特征的頻次分布,應(yīng)用Python的Scipy 庫(kù)擬合出每個(gè)特征頻次分布的概率密度函數(shù),進(jìn)而求出累積分布函數(shù)。再利用CRITIC 賦權(quán)法確定每一個(gè)超速駕駛特征和疲勞駕駛特征的權(quán)重,計(jì)算結(jié)果如表7所示。

表7 CRITIC賦權(quán)法計(jì)算結(jié)果Table 7 Results of CRITIC weighting method

最后,應(yīng)用式(3)得出重載貨車(chē)駕駛?cè)笋{駛風(fēng)格量化評(píng)估結(jié)果,4 類(lèi)駕駛風(fēng)格的評(píng)分結(jié)果如圖6所示。

圖6 各風(fēng)格駕駛?cè)肆炕u(píng)估箱型圖Fig.6 Quantitative assessment boxplots for different diving styles

從聚類(lèi)結(jié)果中,選取5名具有不同駕駛風(fēng)格特點(diǎn)的重載貨車(chē)駕駛?cè)耍謩e命名為driver1#、driver2#、driver3#、driver4#、driver5#。圖7為5名重載貨車(chē)駕駛?cè)嗽诟咚俟飞? d 的行車(chē)軌跡,分別用三角形、菱形、圓點(diǎn)代表重載貨車(chē)駕駛?cè)说某亳{駛狀態(tài)、疲勞駕駛狀態(tài)和正常駕駛狀態(tài)。

圖7 不同風(fēng)格駕駛?cè)笋{駛行為的空間分布Fig.7 Spatial distributions of driving behaviors with different driving styles

表8 給出駕駛?cè)嗽诔亳{駛特征和疲勞駕駛特征上的評(píng)分,分別相加即為評(píng)估總分。每一個(gè)特征評(píng)分的取值范圍下限為0分,上限為特征權(quán)重與100 的乘積,分值由低到高,代表駕駛表現(xiàn)由低到高、駕駛風(fēng)險(xiǎn)由高到低的變化。

表8 各風(fēng)格駕駛?cè)笋{駛風(fēng)格量化評(píng)估結(jié)果對(duì)比Table 8 Comparison of quantitative assessment results by different diving styles

由圖6 可知,危險(xiǎn)型評(píng)估總分最低,其75%以上的樣本評(píng)估總分低于20分,駕駛風(fēng)險(xiǎn)最高;穩(wěn)健型評(píng)估總分最高,其評(píng)估總分在60 分以上的樣本占比大于75%,駕駛風(fēng)險(xiǎn)最低。以穩(wěn)健型driver1#和危險(xiǎn)型driver2#為例,由圖7 和表8 可知,driver1#存在偶發(fā)的超速駕駛行為,評(píng)估總分為78.72 分;driver2#存在嚴(yán)重的疲勞駕駛與超速駕駛行為,評(píng)估總分為15.06分。

由于量化評(píng)估模型綜合考慮了疲勞駕駛與超速駕駛兩類(lèi)特征,部分不同風(fēng)格駕駛?cè)嗽u(píng)估結(jié)果近似,但在風(fēng)險(xiǎn)的表現(xiàn)上存在一定差異。以疲勞型driver3#和超速型driver4#為例,由圖7 和表8 可知,評(píng)估結(jié)果分別為44.97分和45.09分。其中,driver3#存在嚴(yán)重的疲勞駕駛行為,超速駕駛評(píng)估結(jié)果為42.97分,主要表現(xiàn)為疲勞駕駛風(fēng)險(xiǎn);driver4#存在嚴(yán)重的超速駕駛行為,疲勞駕駛評(píng)估結(jié)果為30.69分,主要表現(xiàn)為超速駕駛風(fēng)險(xiǎn)。類(lèi)似的,部分穩(wěn)健型駕駛風(fēng)格駕駛?cè)俗罱K評(píng)估總分低于疲勞型駕駛?cè)?,原因在于其疲勞駕駛評(píng)估結(jié)果優(yōu)于疲勞型駕駛?cè)?,而在超速駕駛上的評(píng)估結(jié)果較差。同樣地,在穩(wěn)健型與超速型駕駛?cè)酥g也存在類(lèi)似的情況。以穩(wěn)健型driver5#、疲勞型driver3#和超速型driver4#為例,由圖7 和表8 可知,driver5#疲勞駕駛評(píng)估結(jié)果優(yōu)于driver3#,超速駕駛評(píng)估結(jié)果優(yōu)于driver4#,但最終評(píng)估總分為42.72分,低于driver3#和driver4#。

此外,由圖6 還能發(fā)現(xiàn),穩(wěn)健型評(píng)估總分第30分位數(shù)以下的值與部分疲勞型、超速型評(píng)估總分相近。因此,將穩(wěn)健型評(píng)估總分第30 分位數(shù)以下的樣本命名為低穩(wěn)健型,反之則命名為高穩(wěn)健型,得到如圖8 所示的不同風(fēng)格駕駛?cè)笋{駛風(fēng)格量化評(píng)估散點(diǎn)圖。

圖8 4類(lèi)風(fēng)格駕駛?cè)说牧炕u(píng)估散點(diǎn)圖Fig.8 Scatter plots for quantitative assessment of four types of style drivers

圖8 中橫坐標(biāo)超速駕駛評(píng)分與縱坐標(biāo)疲勞駕駛評(píng)分之和,即為駕駛風(fēng)格量化評(píng)估總分。從整體上看,駕駛風(fēng)格風(fēng)險(xiǎn)評(píng)估情況與上述舉例大體一致,即評(píng)估總分相近但風(fēng)險(xiǎn)表現(xiàn)不同。評(píng)分結(jié)果可應(yīng)用于物流企業(yè)的車(chē)輛風(fēng)險(xiǎn)識(shí)別和績(jī)效管理,以及保險(xiǎn)公司保費(fèi)的定制和調(diào)整。

4 結(jié)論

本文利用某全國(guó)貨運(yùn)監(jiān)管平臺(tái)獲取的云南省重載貨車(chē)低頻軌跡數(shù)據(jù),提出一套簡(jiǎn)單實(shí)用的集重載貨車(chē)駕駛?cè)笋{駛風(fēng)格聚類(lèi)、快速識(shí)別與風(fēng)格量化評(píng)估于一體的研究框架。該方法能定性識(shí)別單個(gè)重載貨車(chē)駕駛?cè)说鸟{駛風(fēng)格,并可對(duì)所識(shí)別出的不同風(fēng)格駕駛?cè)说鸟{駛風(fēng)險(xiǎn)進(jìn)行定量評(píng)估。本文結(jié)論如下:

(1)在重載貨車(chē)駕駛?cè)笋{駛風(fēng)格研究的特征構(gòu)建方面,考慮與小汽車(chē)駕駛?cè)笋{駛風(fēng)格特征具有共性的超速駕駛行為特征,也兼顧了重載貨車(chē)駕駛?cè)诵熊?chē)時(shí)間長(zhǎng)和疲勞駕駛行為相對(duì)多發(fā)的特點(diǎn),構(gòu)建了表征其駕駛風(fēng)格的超速駕駛與疲勞駕駛特征集。在重載貨車(chē)駕駛?cè)笋{駛風(fēng)格聚類(lèi)方面,本文利用因子分析降低特征維度,提取超速因子與疲勞因子作為K-means聚類(lèi)方法的數(shù)據(jù)輸入,將重載貨車(chē)駕駛?cè)笋{駛風(fēng)格劃分為穩(wěn)健型、超速型、疲勞型、危險(xiǎn)型,并對(duì)不同風(fēng)格特性進(jìn)行定性評(píng)價(jià)。其中,超速型駕駛?cè)笋{駛風(fēng)險(xiǎn)主要表現(xiàn)為超速駕駛,疲勞型駕駛?cè)笋{駛風(fēng)險(xiǎn)主要表現(xiàn)為疲勞駕駛,危險(xiǎn)型駕駛?cè)送瑫r(shí)存在嚴(yán)重的超速駕駛與疲勞駕駛行為。這3類(lèi)駕駛風(fēng)格的樣本之和占總體的37.40%,重載貨車(chē)駕駛?cè)说牟话踩{駛風(fēng)格問(wèn)題突出仍是困擾我國(guó)道路運(yùn)輸業(yè)科學(xué)可持續(xù)發(fā)展的重大挑戰(zhàn)之一。

(2)在重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別方面,以K-means聚類(lèi)結(jié)果作為識(shí)別模型的數(shù)據(jù)標(biāo)簽,訓(xùn)練基于SVM 的重載貨車(chē)駕駛?cè)笋{駛風(fēng)格識(shí)別模型,對(duì)不同風(fēng)格的識(shí)別準(zhǔn)確率均大于97%。識(shí)別效果較好。對(duì)識(shí)別出的不安全駕駛風(fēng)格駕駛?cè)?,可以采取相?yīng)的控制策略矯正不良駕駛行為,有利于減少重載貨車(chē)所帶來(lái)的交通安全隱患問(wèn)題。

(3)在重載貨車(chē)駕駛?cè)笋{駛風(fēng)格量化方面,利用基于CRITIC 賦權(quán)法的評(píng)估方法,實(shí)現(xiàn)對(duì)任意一個(gè)駕駛?cè)笋{駛風(fēng)格的量化評(píng)估。其中,穩(wěn)健型駕駛表現(xiàn)最好,危險(xiǎn)型駕駛風(fēng)險(xiǎn)最高。由于量化評(píng)估模型綜合考慮了疲勞駕駛與超速駕駛兩類(lèi)特征,部分駕駛?cè)说鸟{駛風(fēng)險(xiǎn)雖然表現(xiàn)不同,但評(píng)估結(jié)果近似。

猜你喜歡
載貨車(chē)軌跡聚類(lèi)
解析幾何中的軌跡方程的常用求法
軌跡
軌跡
基于高斯混合聚類(lèi)的陣列干涉SAR三維成像
基于在線(xiàn)軌跡迭代的自適應(yīng)再入制導(dǎo)
基于Spark平臺(tái)的K-means聚類(lèi)算法改進(jìn)及并行化實(shí)現(xiàn)
基于加權(quán)模糊聚類(lèi)的不平衡數(shù)據(jù)分類(lèi)方法
自動(dòng)擋載貨車(chē)制動(dòng)系統(tǒng)的安全性測(cè)試
雷達(dá)點(diǎn)元聚類(lèi)算法性能的比較與分析
國(guó)產(chǎn)系列汽車(chē)模型賞評(píng) 東風(fēng)EQF140-1載貨車(chē)模型