王 瀟
(國(guó)際關(guān)系學(xué)院 信息科技學(xué)院,北京 100091)
基于車(chē)聯(lián)網(wǎng)數(shù)據(jù)挖掘的貨運(yùn)車(chē)輛駕駛行為聚類研究
王 瀟
(國(guó)際關(guān)系學(xué)院 信息科技學(xué)院,北京 100091)
車(chē)聯(lián)網(wǎng)環(huán)境下的海量信息,就挖掘分析貨運(yùn)車(chē)輛的駕駛特征來(lái)說(shuō)有著特殊的意義與價(jià)值。通過(guò)挖掘車(chē)輛速度、加速度等行駛數(shù)據(jù)有助于研究車(chē)輛駕駛?cè)藛T的駕駛行為,有利于規(guī)范駕駛?cè)藛T的駕駛行為,同時(shí)實(shí)現(xiàn)對(duì)車(chē)輛的智能化管理。文章以車(chē)聯(lián)網(wǎng)數(shù)據(jù)為基礎(chǔ),將河北省范圍內(nèi)運(yùn)營(yíng)的部分貨運(yùn)車(chē)輛作為研究對(duì)象,獲取這些車(chē)輛駕駛?cè)藛T的駕駛行為的特征參數(shù),利用基于因子分析的數(shù)據(jù)挖掘方法對(duì)參數(shù)進(jìn)行轉(zhuǎn)化,以此作為指標(biāo)并采用K-Means聚類方法對(duì)駕駛行為進(jìn)行挖掘分析。
車(chē)聯(lián)網(wǎng);數(shù)據(jù)挖掘;因子分析;聚類分析;K-Means聚類
車(chē)聯(lián)網(wǎng)是指由車(chē)輛位置、速度、路線等車(chē)輛信息組成的龐大的交互網(wǎng)絡(luò)[1]。該網(wǎng)絡(luò)的實(shí)現(xiàn),以車(chē)輛安裝的電子標(biāo)識(shí)為基礎(chǔ),利用無(wú)線射頻等電子技術(shù),實(shí)現(xiàn)在信息網(wǎng)絡(luò)平臺(tái)上顯示所有車(chē)輛的屬性信息和靜態(tài)、動(dòng)態(tài)信息。對(duì)這些信息進(jìn)行提取并有效利用,根據(jù)不同的功能需求可以對(duì)所有車(chē)輛的運(yùn)行狀態(tài)進(jìn)行有效的監(jiān)管,提供綜合服務(wù)。本文主要從數(shù)據(jù)挖掘的角度出發(fā),分析司機(jī)人員的駕駛行為與道路安全之間的關(guān)系。
數(shù)據(jù)挖掘技術(shù),顧名思義,是指在海量的、混雜的、隨機(jī)的數(shù)據(jù)中,根據(jù)需要提取出隱藏在其中的、具有應(yīng)用價(jià)值的數(shù)據(jù)的過(guò)程[2]。應(yīng)用數(shù)據(jù)挖掘技術(shù),使得大量冗雜的數(shù)據(jù)重新具有了應(yīng)用的價(jià)值。在數(shù)據(jù)量呈爆炸式增長(zhǎng)的今天具有重要意義。
本文使用的數(shù)據(jù)是車(chē)載終端收集的車(chē)輛運(yùn)營(yíng)數(shù)據(jù),主要是利用車(chē)聯(lián)網(wǎng)技術(shù)實(shí)現(xiàn)貨運(yùn)車(chē)輛的智能化管理。數(shù)據(jù)精度符合數(shù)據(jù)分析的要求。這些數(shù)據(jù)主要包括車(chē)輛的定位信息、行駛道路信息以及車(chē)輛速度信息等內(nèi)容。
4.1 數(shù)據(jù)處理
本文使用的數(shù)據(jù)是車(chē)聯(lián)網(wǎng)數(shù)據(jù),該車(chē)聯(lián)網(wǎng)數(shù)據(jù)采集的是2016年10月10—19日這20天當(dāng)中,在河北省某國(guó)道上行駛的16輛貨運(yùn)車(chē)輛的車(chē)載終端的數(shù)據(jù)。該數(shù)據(jù)一共為2 000萬(wàn)條原始數(shù)據(jù)。從實(shí)際的角度出發(fā),文章在數(shù)據(jù)處理過(guò)程中舍棄了速度持續(xù)為0的數(shù)據(jù)。表1顯示的是數(shù)據(jù)處理的結(jié)果。
表1 數(shù)據(jù)處理結(jié)果
4.2 數(shù)據(jù)分析
4.2.1 駕駛行為特征參數(shù)因子分析
本文對(duì)駕駛行為特征參數(shù)進(jìn)行數(shù)據(jù)分析使用的工具是SPSS19.0統(tǒng)計(jì)軟件,因子的提取采用的是主成分分析方法、因子旋轉(zhuǎn)采用的是最大方差法。通過(guò)對(duì)駕駛行為特征參數(shù)進(jìn)行因子分析,得出變量間的KMO度量為0.61,該數(shù)值表明各個(gè)表兩件具有一定的相關(guān)性。同時(shí),數(shù)據(jù)的球形假設(shè)檢驗(yàn)得出的結(jié)果是0.000,即顯著水平是0.000,拒絕零假設(shè),說(shuō)明實(shí)驗(yàn)采用的數(shù)據(jù)樣本量充足。駕駛行為特征參數(shù)的因子分析結(jié)果如表4所示。
從表2可以看出,累計(jì)方差達(dá)到了79.899%的情況下,對(duì)駕駛特征參數(shù)的分析獲得了2個(gè)主因子,并且這兩個(gè)主因子包含了原始數(shù)據(jù)的79.899%的信息,滿足了進(jìn)行因子分析的要求,并且旋轉(zhuǎn)前與旋轉(zhuǎn)后的累積貢獻(xiàn)率也沒(méi)有發(fā)生變化。
表2 解釋的總方差
從表3可以看出,因子1與加速度有關(guān)的特征參數(shù)(平均加速度、加速度標(biāo)準(zhǔn)差、正向平均加速度、反向平均加速度)的載荷分別是0.987,0.942,0.932,0.889,明顯大于在其他變量上的載荷。通過(guò)表4能夠發(fā)現(xiàn),對(duì)主因子1和主因子2進(jìn)行旋轉(zhuǎn)后,旋轉(zhuǎn)因子1與加速度相關(guān)的量(平均加速度、加速度標(biāo)準(zhǔn)差、正向平均加速度、反向平均加速度)的關(guān)聯(lián)度分別是0.992,0.923,0.913,0.910。
表3 成分矩陣
表4 旋轉(zhuǎn)成份矩陣
4.2.2 基于K-Means聚類的分析
通過(guò)對(duì)主因子、旋轉(zhuǎn)因子以及駕駛行為特征變量之間的相關(guān)性可以看出:主因子1與加速度相關(guān)的變量之間有著較強(qiáng)的關(guān)聯(lián)性。因此,可以將主因子1作為K-Means聚類得標(biāo)準(zhǔn)。與此同時(shí),可以將主因子2作為速度相關(guān)駕駛行為的聚類標(biāo)準(zhǔn)進(jìn)行聚類。
將主因子1作為K-Means聚類的標(biāo)準(zhǔn)得出的聚類結(jié)果如表5所示。
表5 聚類結(jié)果
通過(guò)表5可以看出,貨運(yùn)車(chē)輛的駕駛行為的特征參數(shù)根據(jù)主因子1的特征進(jìn)行聚類,聚類為2類是比較合適的。貨運(yùn)車(chē)輛駕駛?cè)藛T在貨車(chē)運(yùn)行過(guò)程中的變速行為均有著不同的程度,但是劇烈變化的數(shù)量比較少[4]。將主因子2作為K-Means聚類的標(biāo)準(zhǔn)得出的聚類結(jié)果如表6所示。
表6 聚類結(jié)果
由表6可以看出,對(duì)貨運(yùn)車(chē)輛駕駛行為的特征參數(shù)以主因子2作為標(biāo)準(zhǔn)進(jìn)行聚類,聚類為4類比較合適。貨運(yùn)車(chē)輛駕駛?cè)藛T在駕駛貨運(yùn)車(chē)輛過(guò)程中,絕大部分沒(méi)有出現(xiàn)超速行為,只有極少數(shù)的車(chē)輛在行駛過(guò)程中出現(xiàn)了不同程度的超速行為。
本文以貨運(yùn)車(chē)輛上安裝的車(chē)機(jī)終端收集的貨運(yùn)車(chē)輛車(chē)聯(lián)網(wǎng)數(shù)據(jù)作為研究對(duì)象,提取并且進(jìn)一步細(xì)化了有關(guān)貨運(yùn)車(chē)輛駕駛行為的特征參數(shù),將獲取的河北省范圍內(nèi)運(yùn)營(yíng)的貨運(yùn)車(chē)輛產(chǎn)生的海量車(chē)聯(lián)網(wǎng)數(shù)據(jù)進(jìn)行處理,使其能夠更加清晰、明確地體現(xiàn)貨運(yùn)車(chē)輛在行駛過(guò)程中的駕駛行為特征。在分析的過(guò)程中,采用了因子分析與聚類分析相結(jié)合的方法,對(duì)貨運(yùn)車(chē)輛的駕駛行為特征參數(shù)進(jìn)行因子分析以及聚類分析,較好地體現(xiàn)出了各個(gè)特征參數(shù)之間的相關(guān)性,明確地反映出了貨運(yùn)車(chē)輛在行駛過(guò)程中特征行為的分布。
[1]高永強(qiáng).網(wǎng)絡(luò)安全技術(shù)與應(yīng)用[J].技術(shù)研究,2013(9):42-43.
[2]張兆鋒.基于科技文獻(xiàn)的科技監(jiān)測(cè)信息可視化方法研究[D].北京:中國(guó)科學(xué)技術(shù)信息研究所,2007.
[3]龐明寶.基于動(dòng)態(tài)環(huán)境的車(chē)輛調(diào)度問(wèn)題研究[D].天津:河北工業(yè)大學(xué),2009.
[4]任浩明.車(chē)輛主動(dòng)安全中碰撞臨界安全車(chē)距算法研究[D].長(zhǎng)沙:湖南大學(xué),2011.
Research on clustering of freight vehicle driving behavior based on vehicle networking data mining
Wang Xiao
(Information Science and Technology School of University of International Relations, Beijing 100091, China)
The massive information under the background of Internet of car is of special signi fi cance and value. By digging vehicle speed, acceleration To analyze the characteristic of the freight vehicle driving. Through mining driving data of vehicle speed, accelerated speed and other data is helpful to standardize the driving behavior of vehicle drivers and realize the intelligent management of the vehicle. In this paper, the part of freight vehicles operating within the bounds of Hebei province as the research object to obtain the characteristic parameters of vehicle driver’s driving behavior based on vehicle networking data, and using data mining method based on factor analysis to convert the parameters as indicators, and the K-Means clustering method is applied to analyze driving behavior .
Internet of car; data mining; factor analysis; cluster analysis; K-Means clustering
王瀟(1990— ),男,河北秦皇島。