王保林,田瑛,袁俊凱,王黎明,周英超
(山東理工大學(xué) 交通與車輛工程學(xué)院,山東 淄博 255049)
行駛工況描述特定交通環(huán)境下車輛行駛特征,用于確定車輛燃油消耗量和污染物排放量,對于新車型的技術(shù)開發(fā)和評估具有重要意義[1-3]。目前,商用車行駛工況主要分為兩大類:一類是立法工況,由政府制定,以實(shí)施油耗與排放認(rèn)證,典型的有美國的NYCC、日本的JC08、世界重型商用車瞬態(tài)循環(huán)WTVC以及國內(nèi)的C-WTVC[4]和CHTC行駛工況[5]等;另一類通過收集道路行車數(shù)據(jù),結(jié)合加速、勻速、減速及怠速行駛狀態(tài),構(gòu)建典型的城市或區(qū)域行駛工況。目前我國半掛牽引車主要采用CHTC-TT工況,但因不同地區(qū)之間環(huán)境氣候、交通狀況、道路條件的差異,CHTC-TT工況并不適用于所有城市或區(qū)域,因此有必要根據(jù)當(dāng)?shù)貙?shí)際道路的車輛行駛數(shù)據(jù),構(gòu)建具有代表性的典型行駛工況。
近年來,國內(nèi)外對行駛工況構(gòu)建方法的研究主要有短行程法、聚類法及馬爾可夫法。短行程法將車輛行駛數(shù)據(jù)劃分為若干個(gè)運(yùn)動(dòng)學(xué)片段,提取出具有代表性的運(yùn)動(dòng)學(xué)片段進(jìn)行工況構(gòu)建。王國林等[6]通過短行程法分別構(gòu)建了鎮(zhèn)江市出租車和私家車行駛工況,其缺點(diǎn)在于受限于單個(gè)片段的長度,難以精確控制典型工況的時(shí)長。聚類方法基于主成分分析對選取的能反映車輛運(yùn)行特征的部分參數(shù)進(jìn)行分析,解析這些特征參數(shù)的主成分,再通過聚類分析,構(gòu)建不同類型的行駛工況。胡宸等[7]利用主成分分析和K-均值聚類算法構(gòu)建了哈爾濱城市公交工況,但聚類過程中最優(yōu)聚類數(shù)K值事先確定,同時(shí)初始聚類中心隨機(jī)選擇,選擇不好易收斂到局部最小值。馬爾可夫法的核心思想是把汽車行駛過程中加速、減速、勻速和怠速4種狀態(tài)看作4種模型,將一個(gè)完整的工況看作一個(gè)馬爾可夫過程。Jiang等[8]利用馬爾可夫法構(gòu)建了城市車輛的駕駛周期,張昕等[9]利用一維馬爾可夫鏈預(yù)測構(gòu)建了混合動(dòng)力汽車行駛工況。馬爾可夫法擁有較高精度,但只能對整體數(shù)據(jù)進(jìn)行分析,無法針對不同道路類型的行駛工況分別進(jìn)行構(gòu)建。綜上所述,本文擬采用聚類法構(gòu)建行駛工況,針對傳統(tǒng)的K-均值聚類易陷入局部最優(yōu)且最優(yōu)聚類數(shù)K值難以確定的問題,提出一種基于主成分分析的高斯混合模型聚類方法避免局部最優(yōu)的情況,并通過貝葉斯信息準(zhǔn)則保證聚類數(shù)K值最優(yōu)。本文以半掛牽引車為試驗(yàn)車輛,基于車載無線終端采集的行車數(shù)據(jù),預(yù)處理后以速度為運(yùn)動(dòng)學(xué)片段劃分標(biāo)準(zhǔn),通過主成分分析和聚類分析對試驗(yàn)數(shù)據(jù)進(jìn)行降維分類處理,構(gòu)建具有代表性的半掛牽引車行駛工況。
為使采集的數(shù)據(jù)能真實(shí)有效地反映丘陵地區(qū)道路行駛工況,根據(jù)丘陵地區(qū)道路多坡道的特點(diǎn),選取淄博市博山-沂源S231路段作為測試道路,全長56 km,車輛行駛路線如圖1所示。常用的數(shù)據(jù)采集方式有循環(huán)路線法、自主駕駛法、車輛跟蹤法。由于本文已經(jīng)規(guī)劃好試驗(yàn)區(qū)域和試驗(yàn)線路,因此選取循環(huán)路線法,采集路線為博山-沂源S231路段,數(shù)據(jù)采集周期為30 d,連續(xù)不間斷,具體時(shí)間段選定為每天7:00-11:30,14:00-18:30,19:00-23:30,包括早晚高峰期和交通空閑期。
圖1 試驗(yàn)車輛行駛路線
試驗(yàn)車輛為青島解放JH6重卡560馬力6×4 AMT自動(dòng)擋牽引車(國六),數(shù)據(jù)采集設(shè)備采用車載CAN-BUS無線終端,該設(shè)備從CAN總線上不斷采集試驗(yàn)車輛行駛過程中的數(shù)據(jù),例如車速、發(fā)動(dòng)機(jī)轉(zhuǎn)速、海拔高度等,同時(shí)接收GPS定位,將設(shè)備的經(jīng)緯度位置信息實(shí)時(shí)記錄下來,通過上位機(jī)軟件讀取試驗(yàn)數(shù)據(jù)。設(shè)備共4個(gè)接口,分別與車內(nèi)CAN總線和電源線連接,并安裝在試驗(yàn)車輛的儀表盤上,如圖2所示。采樣頻率選擇1 Hz,即數(shù)據(jù)采集間隔為1 s,每秒采集一組數(shù)據(jù),如果選取的采樣頻率小,采樣間隔大,單位時(shí)間內(nèi)采集數(shù)據(jù)少,無法真實(shí)反映出汽車行駛過程中速度的實(shí)際變化情況。
圖2 實(shí)車安裝圖
由于數(shù)據(jù)采集的密集程度、汽車振動(dòng)等原因會(huì)使得試驗(yàn)數(shù)據(jù)出現(xiàn)信號(hào)波動(dòng)、噪聲明顯等情況,所以在數(shù)據(jù)正式處理之前需要對數(shù)據(jù)進(jìn)行降噪處理,剔除一些波動(dòng)幅度較大和干擾性強(qiáng)的數(shù)據(jù)[10]。目前常用的降噪方法有中值濾波、滑動(dòng)平均值濾波、限幅濾波和一階慣性濾波等。本文采用一階慣性濾波方法,將本次采樣數(shù)值與上一次經(jīng)濾波后的輸出值相加權(quán),得到有效的濾波值,對周期性干擾和波動(dòng)頻率較高的數(shù)據(jù)具有較好的抑制和平滑作用。
圖3和圖4為某段原始數(shù)據(jù)濾波前后效果。從圖3中可以看出,濾波前原始速度數(shù)據(jù)曲線中存在許多“尖峰”數(shù)據(jù),在濾波后,速度曲線變得更加平滑。圖4中濾波加速度和原始數(shù)據(jù)在保持跟隨趨勢的同時(shí),也能有效覆蓋原始加速度數(shù)據(jù)的峰值,說明濾波效果較為理想。
圖3 濾波前后速度-時(shí)間曲線
圖4 濾波前后加速度-時(shí)間曲線
在構(gòu)建行駛工況過程中,選取速度作為運(yùn)動(dòng)學(xué)片段劃分標(biāo)準(zhǔn),將1個(gè)怠速開始到下1個(gè)怠速開始定義為1個(gè)運(yùn)動(dòng)學(xué)片段[11],運(yùn)動(dòng)學(xué)片段示意如圖5所示。
圖5 運(yùn)動(dòng)學(xué)片段示意
汽車行駛過程可以看作多個(gè)加速、減速、勻速和怠速片段的組合。為詳細(xì)反映運(yùn)動(dòng)學(xué)片段瞬時(shí)特征,按照速度v和加速度a將運(yùn)動(dòng)學(xué)片段狀態(tài)劃分為:加速狀態(tài)(v>1 km/h且a>0.1 m/s2)、減速狀態(tài)(v>1 km/h且a<-0.1 m/s2)、勻速狀態(tài)(v>1 km/h且|a|≤0.1 m/s2)及怠速狀態(tài)(v≤1 km/h且|a|≤0.1 m/s2)。
通過運(yùn)動(dòng)學(xué)分析,篩選出22個(gè)特征參數(shù),主要參數(shù)見表1,其余分別為:加速工況時(shí)間比例Pj、減速工況時(shí)間比例Pd及勻速工況時(shí)間比例Py、怠速工況時(shí)間比例Pi、各速度區(qū)間所占時(shí)間比例P0-10、P10-20、P20-30、P30-40、P40-50、P50-60、P60-70、P≥70。
表1 主要特征參數(shù)及其含義
針對收集的歷史行車數(shù)據(jù),選取一個(gè)怠速開始到下一個(gè)怠速開始的運(yùn)動(dòng)學(xué)片段劃分方法對行車數(shù)據(jù)進(jìn)行劃分,同時(shí)運(yùn)動(dòng)學(xué)片段篩選還需符合以下條件:運(yùn)動(dòng)學(xué)片段的持續(xù)時(shí)間不少于20 s;車輛加速度在0.1 m/s2≤a≤4 m/s2范圍內(nèi),減速度在-4 m/s2≤a≤-0.1 m/s2范圍內(nèi);一個(gè)運(yùn)動(dòng)學(xué)片段中必須包括加速過程與減速過程。
通過MATLAB軟件對運(yùn)動(dòng)學(xué)片段劃分,最終篩選了291個(gè)運(yùn)動(dòng)學(xué)片段,并計(jì)算其主要的10個(gè)特征參數(shù),部分結(jié)果見表2。
表2 運(yùn)動(dòng)學(xué)片段主要特征參數(shù)值
主成分分析是數(shù)據(jù)降維的一種常用方法,其特點(diǎn)是通過變量變換把注意力集中在具有較大變差的那些主成分上,舍棄那些變差小的主成分,將具有一定相關(guān)性的眾多指標(biāo)重新組合成幾個(gè)少量互相無關(guān)的綜合指標(biāo),同時(shí)最大程度地保持原有數(shù)據(jù)的信息。
表3 主成分貢獻(xiàn)率
表4是部分運(yùn)動(dòng)學(xué)片段的主成分得分,經(jīng)過主成分分析后,將原有十維運(yùn)動(dòng)學(xué)片段特征參數(shù)矩陣簡化為三維的主成分得分矩陣,在聚類分析中將對所有數(shù)據(jù)片段的主成分得分進(jìn)行分類。
表4 特征值主成分得分
常見的聚類分析有K-均值聚類、層次聚類、模糊聚類和高斯混合模型聚類等[13]。K-均值聚類的初始聚類中心隨機(jī)選取,且最優(yōu)聚類數(shù)K值難確定,而高斯混合模型聚類依據(jù)概率分配聚類成員,具有靈活的類簇形狀,同時(shí)可以通過貝葉斯信息準(zhǔn)則確定最佳聚類數(shù)K值。本文選取高斯混合模型聚類對主成分得分進(jìn)行分類處理,高斯混合模型是多個(gè)基于高斯概率密度函數(shù)的混合模型,其原理為通過擬合輸入數(shù)據(jù)集構(gòu)建最合適的混合多維高斯分布模型。
2.3.1 高斯混合模型
假設(shè)n維隨機(jī)變量x=(x1,x2,···,xd)T,包含k個(gè)子模型的高斯混合模型為
(1)
M(x|μk,∑k)=
(2)
(3)
式中:M(x|μk,∑k)為高斯概率密度函數(shù);wk、μk、∑k分別為混合模型中第k個(gè)子模型的權(quán)重、均值、協(xié)方差矩陣;p(x)為高斯混合模型的概率密度函數(shù)。
2.3.2 似然函數(shù)
求出高斯混合模型生成的似然函數(shù),因計(jì)算復(fù)雜往往對似然函數(shù)取對數(shù),具體為
(4)
2.3.3 EM算法
對于高斯混合模型中的參數(shù)(wk、μk、∑k),采用期望最大化算法(EM)進(jìn)行求解。EM算法的基本思想是通過引入隱含變量,求解模型分布參數(shù)的極大似然估計(jì),然后對隱含變量期望公式和模型分布參數(shù)重估公式進(jìn)行反復(fù)迭代,直至似然函數(shù)值收斂[14],其計(jì)算步驟分為E-step和M-step。
E-step:得到數(shù)據(jù)xi來自第k個(gè)子模型的概率
(5)
M-step:計(jì)算新一輪迭代的模型參數(shù)
(6)
重復(fù)計(jì)算E-step和M-step直至收斂。
2.3.4 最佳聚類數(shù)確定
本文選用貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC),即具有最低BIC值的模型對應(yīng)的K值為高斯混合模型聚類的最佳聚類數(shù),計(jì)算公式為
BIC=kln(n)-2ln(L),
(7)
式中:k為模型參數(shù)個(gè)數(shù);n為樣本數(shù)量;L為似然函數(shù)。
計(jì)算不同聚類數(shù)值下的BIC值,結(jié)果如圖6所示,當(dāng)聚為3類時(shí),BIC值最小,因此最佳聚類數(shù)為3。相較傳統(tǒng)的K-均值聚類算法最佳聚類數(shù)難以確定的問題,本文采用貝葉斯信息準(zhǔn)則確定最優(yōu)聚類數(shù),提高了行駛工況構(gòu)建的精度。
圖6 不同聚類個(gè)數(shù)下的BIC值
運(yùn)用MATLAB軟件對主成分得分進(jìn)行高斯混合模型聚類,其聚類效果如圖7所示,不同聚類的樣本采用不同顏色表示。
圖7 運(yùn)動(dòng)片段聚類效果圖
對分為3類時(shí)各片段類型速度段和行駛狀態(tài)所占的時(shí)間比例進(jìn)行統(tǒng)計(jì),結(jié)果如圖8所示。從圖8可以看出,聚類結(jié)果第1類為低速類,0~10 km/h速度占比為80.52%,怠速比例達(dá)到44.85%;第2類為中速類,速度區(qū)間主要集中在20~50 km/h,勻速比例達(dá)到27.73%;第3段為高速段,60~70 km/h速度占比為47.82%,加速和減速所占比例較高,加減速情況較頻繁。
(a)速度段占比
根據(jù)聚類分析結(jié)果,得出各分類中所包含的運(yùn)動(dòng)學(xué)片段與其聚類中心的距離dij大小,當(dāng)距離越小時(shí),運(yùn)動(dòng)學(xué)片段的相關(guān)系數(shù)rij越大,說明該運(yùn)動(dòng)學(xué)片段越能反映該類中的行駛特點(diǎn)。因此,本文通過聚類分析時(shí)運(yùn)動(dòng)學(xué)片段與其聚類中心的距離dij,從中選取3個(gè)各類型中dij最小的片段,即相關(guān)系數(shù)rij最大的3個(gè)運(yùn)動(dòng)學(xué)片段,按照低速-中速-低速-高速的順序隨機(jī)排列組合,合成≥1 200 s的丘陵山區(qū)半掛牽引車候選行駛工況。
對于速度行駛工況,本文將平均速度、速度標(biāo)準(zhǔn)差、加速度標(biāo)準(zhǔn)差、加速工況時(shí)間占比、減速工況時(shí)間占比、勻速工況時(shí)間占比、怠速工況時(shí)間占比7項(xiàng)作為主要篩選參數(shù)。
為了選擇最具代表性的行駛工況,把相對誤差(RE)、性能值(PV)和速度-加速度概率分布(SAPD)作為決策標(biāo)準(zhǔn)[15]。首先,計(jì)算候選行駛工況的評估參數(shù)與真實(shí)試驗(yàn)數(shù)據(jù)之間的RE。如果每個(gè)評估參數(shù)的RE都小于10%,則可以接受候選的行駛工況。然后計(jì)算PV,選擇PV最小的候選行駛工況。
(8)
式中:θc為候選駕駛周期的評估參數(shù)值;θt為原始試驗(yàn)數(shù)據(jù)的評估參數(shù)值。
(9)
式中:REi為第i個(gè)評估參數(shù)的RE;n為評價(jià)參數(shù)的數(shù)量。
根據(jù)上述工況合成方法和篩選標(biāo)準(zhǔn),通過MATLAB軟件合成如圖9所示的具有代表性的丘陵山區(qū)半掛牽引車行駛工況,共計(jì)1 210 s,所構(gòu)工況和實(shí)際工況的SAPD如圖10和圖11所示。
圖9 半掛牽引車行駛工況的速度-時(shí)間曲線
圖10 所構(gòu)行駛工況的SAPD分布圖
圖11 實(shí)際工況的SAPD分布圖
將基于傳統(tǒng)K-均值、高斯混合模型構(gòu)建的車輛行駛工況同實(shí)際工況進(jìn)行對比,各工況的特征參數(shù)見表5。由表5可知,基于高斯混合模型構(gòu)建的車輛行駛工況與實(shí)際工況主要特征參數(shù)的相對誤差都保持在5%以內(nèi),性能值為2.05%;而基于傳統(tǒng)K-均值構(gòu)建的車輛行駛工況與實(shí)際工況的勻速時(shí)間比例相對誤差為9.09%,性能值為4.50%,明顯高于基于高斯混合模型構(gòu)建的車輛行駛工況同實(shí)際工況的相對誤差。以上分析表明,傳統(tǒng)K-均值聚類構(gòu)建的工況由于初始聚類中心隨機(jī)選取,導(dǎo)致構(gòu)建工況陷入局部最優(yōu),與實(shí)際工況誤差較大;而基于高斯混合模型聚類構(gòu)建的丘陵山區(qū)半掛牽引車行駛工況特征參數(shù)與實(shí)際工況相比誤差更小,且車速變化更符合實(shí)際情況,更能反映丘陵山區(qū)道路線形復(fù)雜的特點(diǎn)。
表5 各工況下的評價(jià)參數(shù)
將本文構(gòu)建的丘陵山區(qū)半掛牽引車行駛工況同中國重型半掛牽引車行駛工況(CHTC-TT)進(jìn)行比較,結(jié)果見表6。與CHTC-TT工況相比,構(gòu)建的半掛牽引車工況由于丘陵山區(qū)道路線形復(fù)雜的特點(diǎn),車輛行駛過程中平均速度、勻速比例分別降低了11.91%、72.20%,加速段平均加速度、減速面平均減速度、加速比例及減速比例分別提高了171.43%、91.67%、96.79%,怠速比例同CHTC-TT工況接近。由此可見,CHTC-TT工況不適用于丘陵山區(qū)半掛牽引車行駛特征,表明開發(fā)反映丘陵山區(qū)行駛特征的半掛牽引車實(shí)際行駛工況具有重要意義。
表6 丘陵山區(qū)半掛牽引車行駛工況與其他半掛牽引車典型工況對比
1)以半掛牽引車為研究對象,劃分運(yùn)動(dòng)學(xué)片段,采用主成分分析和高斯混合模型聚類算法對原始數(shù)據(jù)進(jìn)行降維分類處理,構(gòu)建出了符合丘陵山區(qū)半掛牽引車實(shí)際行駛特征、時(shí)長1 210 s的丘陵山區(qū)半掛牽引車行駛工況。
2)與傳統(tǒng)的K-均值聚類算法相比,基于高斯混合模型構(gòu)建的車輛行駛工況的性能值僅為2.05%,精度更高。構(gòu)建的丘陵山區(qū)半掛牽引車行駛工況同CHTC-TT工況進(jìn)行比較發(fā)現(xiàn),由于丘陵山區(qū)道路線形復(fù)雜的特點(diǎn),特征參數(shù)存在較大差異,平均速度、勻速比例分別降低了11.91%、72.20%,加速段平均加速度、減速度平均減速度、加速比例及減速比例分別提高了171.43%、91.67%、96.79%,怠速比例同CHTC-TT工況接近。因此,采用CHTC-TT工況進(jìn)行燃油排放標(biāo)準(zhǔn)并不能真實(shí)反映丘陵山區(qū)的交通狀況,表明開發(fā)反映丘陵山區(qū)行駛特征的半掛牽引車實(shí)際行駛工況具有重要意義。
3)基于實(shí)車行駛數(shù)據(jù)合成的丘陵山區(qū)半掛牽引車行駛工況,總結(jié)丘陵地區(qū)半掛牽引車輛運(yùn)行特征,可以有效模擬對應(yīng)車輛歷史行駛工況的統(tǒng)計(jì)學(xué)特性和概率分布特性,為半掛牽引車動(dòng)力系統(tǒng)匹配及控制策略優(yōu)化提供一定依據(jù)。