毛星宇,蒙艷玫,許恩永,趙德平,陳遠(yuǎn)玲,劉鑫
摘要: 混合動(dòng)力汽車(hybrid electrical vehicle,HEV)的能量管理策略直接決定了車輛的燃油經(jīng)濟(jì)性、駕駛性能和壽命,為解決HEV能量管理策略的最優(yōu)性與實(shí)時(shí)行駛工況不確定性之間的矛盾,以混聯(lián)式HEV為研究對(duì)象,提出一種基于模型預(yù)測(cè)控制(model predictive control,MPC)與蜣螂優(yōu)化算法(dung beetle optimizer,DBO)的HEV能量管理策略。首先,該策略采用基于堆疊式長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(stacked long-short term memory neural network,Stacked LSTM-NN)的車速預(yù)測(cè)模型預(yù)測(cè)未來行駛車速。其次,根據(jù)預(yù)測(cè)車速將混合動(dòng)力汽車的功率分配問題描述為MPC預(yù)測(cè)范圍內(nèi)的滾動(dòng)優(yōu)化問題,提出考慮燃料消耗和電池保護(hù)的成本函數(shù),利用DBO算法對(duì)預(yù)測(cè)時(shí)域內(nèi)發(fā)動(dòng)機(jī)功率進(jìn)行優(yōu)化求解。最后,在城市道路循環(huán)(urban dynamometer driving schedule,UDDS)工況下分別對(duì)所提策略的車速預(yù)測(cè)精度和經(jīng)濟(jì)性與其他策略進(jìn)行仿真對(duì)比驗(yàn)證。結(jié)果表明:與傳統(tǒng)LSTM速度預(yù)測(cè)模型相比,Stacked LSTM速度預(yù)測(cè)模型的RMSE降低了13.9%,每步平均預(yù)測(cè)時(shí)間減少1 ms;與基于規(guī)則的策略相比,基于DBO-MPC的策略模型節(jié)油率達(dá)到25.3%,同時(shí)SOC狀態(tài)波動(dòng)更為平穩(wěn),對(duì)電池的保護(hù)效果更好。
關(guān)鍵詞: 混合動(dòng)力汽車;能量管理;控制策略;車速預(yù)測(cè)
DOI: 10.3969/j.issn.1001-2222.2024.03.009
中圖分類號(hào):U469.7文獻(xiàn)標(biāo)志碼: B文章編號(hào): 1001-2222(2024)03-0050-08
隨著全球汽車數(shù)量迅猛增長,環(huán)境污染和能源消耗問題變得日趨嚴(yán)重,各國對(duì)可持續(xù)發(fā)展和碳中和的重視程度也越來越高,對(duì)汽車進(jìn)行結(jié)構(gòu)性改革迫在眉睫[1]。在過去的幾十年里,人們對(duì)新能源汽車,尤其是混合動(dòng)力汽車(HEV)進(jìn)行了廣泛研究?;旌蟿?dòng)力汽車作為傳統(tǒng)燃油汽車向電動(dòng)汽車(EV)轉(zhuǎn)變的過渡產(chǎn)物,其對(duì)二者的優(yōu)勢(shì)進(jìn)行了融合,既可以純電動(dòng)行駛,減少排放,又能有效解決純電動(dòng)帶來的續(xù)航里程焦慮問題。然而,混合動(dòng)力汽車的多源動(dòng)力系統(tǒng)引發(fā)了與能量管理相關(guān)的問題,這也成為了過去十年研究的焦點(diǎn)之一[2-6]。
目前,針對(duì)HEV能量管理策略(EMS)的研究主要分為基于規(guī)則的EMS和基于優(yōu)化的EMS兩類?;谝?guī)則的EMS因其控制簡(jiǎn)單且穩(wěn)定,被引入插電式混合動(dòng)力汽車以提高發(fā)動(dòng)機(jī)效率[7]。但其對(duì)駕駛循環(huán)的適應(yīng)性較差,并且由于設(shè)定目標(biāo)單一,系統(tǒng)參數(shù)固定,難以達(dá)到最佳的整體性能?;趦?yōu)化的EMS則以動(dòng)態(tài)規(guī)劃算法(DP)[8]和龐特里亞金極小值原理(PMP)[9]為代表?;旌蟿?dòng)力系統(tǒng)的最佳能量管理問題實(shí)際上是一個(gè)多階段控制問題。相對(duì)于其他優(yōu)化算法,DP算法更適合解決多階段決策的最優(yōu)化問題[10]。在實(shí)際行駛過程中,基于全局優(yōu)化的EMS雖然可以實(shí)現(xiàn)最優(yōu)的整體性能,但其計(jì)算成本高,且需預(yù)知整個(gè)工況信息,導(dǎo)致其難以在線應(yīng)用。而模型預(yù)測(cè)控制(MPC)通過在線預(yù)測(cè)車輛未來短期車速,將全局最優(yōu)控制轉(zhuǎn)變?yōu)榛陬A(yù)測(cè)時(shí)域的局部最優(yōu)控制,可以采用不同種類的優(yōu)化算法以實(shí)現(xiàn)對(duì)預(yù)測(cè)時(shí)間窗口內(nèi)的最優(yōu)化問題的連續(xù)迭代求解,從而使MPC成為EMS的一種有效應(yīng)用[11]。魏麗青等[12]提出了一種基于組合預(yù)測(cè)模型的速度預(yù)測(cè)模型,并以燃油經(jīng)濟(jì)性最優(yōu)為目標(biāo),建立基于MPC的控制策略,該策略顯著提高了車速預(yù)測(cè)精度與燃油經(jīng)濟(jì)性。He等[13]提出了分層MPC-EMS與深度確定性策略梯度算法相結(jié)合的插電式混合動(dòng)力公交車能量管理策略,通過上層控制器和下層MPC生成的SOC軌跡,再根據(jù)深度神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)信息快速求解目標(biāo)方程,有效降低了公交車的油耗。
為提高在線預(yù)測(cè)的精確性并減小HEV的燃料消耗,本研究結(jié)合模型預(yù)測(cè)控制和蜣螂優(yōu)化算法(DBO),提出一種基于DBO-MPC的混合動(dòng)力汽車能量管理策略。首先,采用基于Stacked LSTM的速度預(yù)測(cè)模型預(yù)測(cè)未來行駛車速;其次,根據(jù)預(yù)測(cè)車速將混合動(dòng)力汽車的功率分配問題描述為MPC預(yù)測(cè)范圍內(nèi)的滾動(dòng)優(yōu)化問題,提出考慮燃料消耗和電池保護(hù)的成本函數(shù),利用DBO算法對(duì)預(yù)測(cè)時(shí)域內(nèi)發(fā)動(dòng)機(jī)功率進(jìn)行優(yōu)化求解,并使用UDDS工況數(shù)據(jù)對(duì)此策略進(jìn)行仿真驗(yàn)證。
1HEV動(dòng)力模型建模
研究對(duì)象為混聯(lián)式HEV,其結(jié)構(gòu)簡(jiǎn)圖見圖1,由發(fā)動(dòng)機(jī)、離合器、電池、電機(jī)、耦合機(jī)構(gòu)、變速箱等組成。在混聯(lián)HEV的驅(qū)動(dòng)系統(tǒng)中,發(fā)動(dòng)機(jī)和兩個(gè)電機(jī)通過行星齒輪組連接,行星齒輪組由一個(gè)太陽齒輪、一個(gè)齒圈、一個(gè)行星齒輪架和幾個(gè)小齒輪組成。其中,主驅(qū)動(dòng)電機(jī)MG1、發(fā)電機(jī)MG2、發(fā)動(dòng)機(jī)分別與行星齒輪機(jī)構(gòu)中的齒圈、太陽輪、行星架相連,耦合機(jī)構(gòu)作為結(jié)構(gòu)的核心部件,可以實(shí)現(xiàn)發(fā)動(dòng)機(jī)轉(zhuǎn)速和扭矩的解耦以及發(fā)動(dòng)機(jī)與兩臺(tái)電機(jī)的功率分配。整車及動(dòng)力部件參數(shù)見表1。
1.1車輛縱向動(dòng)力學(xué)模型
利用縱向力平衡方程式(1),能夠推導(dǎo)出運(yùn)行過程中動(dòng)力系統(tǒng)需要提供給車輛的驅(qū)動(dòng)力。
Ft=Ff+Fw+Fi+Fj
Ff=Gfcosi
Fw=CDA21.15ua2
Fi=Gsini
Fj=δmdudt。(1)
式中:Ft為車輛所需驅(qū)動(dòng)力;Ff為滾動(dòng)阻力;Fw為空氣阻力;Fi為坡度阻力;Fj為加速阻力;G為車輛重力;f為滾動(dòng)阻力系數(shù);i為道路坡度;CD為空氣阻力系數(shù);A為車輛迎風(fēng)面積;ua2為車速;δ為車輛旋轉(zhuǎn)質(zhì)量系數(shù);m為車輛質(zhì)量;du/dt為車輛行駛加速度。
1.2耦合機(jī)構(gòu)模型
耦合機(jī)構(gòu)是混合動(dòng)力系統(tǒng)實(shí)現(xiàn)發(fā)動(dòng)機(jī)轉(zhuǎn)速、扭矩與路載雙解耦的核心部件,各動(dòng)力源部件與行星齒輪配合從而實(shí)現(xiàn)自動(dòng)變速。在行星齒輪中,齒圈、太陽輪及行星架之間轉(zhuǎn)速和扭矩的關(guān)系[14-15]如下:
Rrωr+Rsωs=(Rr+Rs)ωp,(2)
Rr+RsRrTr=Tp=Rr+RsRsTs。(3)
式中:Rr為齒圈的半徑;Rs為太陽輪的半徑;ωr為齒圈角速度;ωs為太陽輪角速度;ωp為行星架角速度;Tr為齒圈扭矩;Ts為太陽輪扭矩;Tp為行星架扭矩。
1.3發(fā)動(dòng)機(jī)模型
由于發(fā)動(dòng)機(jī)在工作時(shí)具有顯著的非線性,難以建立準(zhǔn)確的仿真模型,因此發(fā)動(dòng)機(jī)油耗模型通過查表法建立,發(fā)動(dòng)機(jī)MAP圖見圖2。燃油消耗量與扭矩、轉(zhuǎn)速、燃油消耗率的關(guān)系如下:
mfuel=f(ωice,Tice),(4)
Qfuel=Piceb367.1mfuelg。(5)
式中:mfuel為燃油消耗率;ωice為發(fā)動(dòng)機(jī)轉(zhuǎn)速;Tice為發(fā)動(dòng)機(jī)扭矩;Qfuel為燃油消耗量;Pice為發(fā)動(dòng)機(jī)功率;b為燃油密度。
1.4電機(jī)模型
研究對(duì)象裝配有兩個(gè)電機(jī),當(dāng)電機(jī)作為驅(qū)動(dòng)電機(jī)、發(fā)電機(jī)工作時(shí),電機(jī)功率表達(dá)式如式(6)、式(7)所示,兩個(gè)電機(jī)的效率MAP圖分別見圖3和圖4。
Pm=ηmTmωm,(6)
Pg=ηgTgωg。(7)
式中:Pm,Tm,ωm和ηm分別為主驅(qū)動(dòng)電機(jī)MG1的輸出電功率、輸出扭矩、轉(zhuǎn)速和工作效率;Pg,Tg,ωg和ηg分別為發(fā)電機(jī)MG2的發(fā)電功率、輸入扭矩、轉(zhuǎn)速和工作效率。
1.5動(dòng)力電池模型
動(dòng)力電池采用等效電路模型建模,見式(8)。
Pbatt=UbattIbatt
Ubatt=Ebatt-RbattIbatt
Ibatt=Ebatt-Ebatt2-4RbattPbatt2Rbatt
ΔSOC=∫IbattdtQbatt。(8)
式中:Pbatt,Ubatt,Ibatt分別為動(dòng)力電池的輸出功率、開路電壓和回路電流;Ebatt為動(dòng)力電池的電動(dòng)勢(shì);Rbatt為動(dòng)力電池的內(nèi)阻;Qbatt為動(dòng)力電池的容量。
2MPC-DBO控制器設(shè)計(jì)
為實(shí)現(xiàn)汽車動(dòng)力需求的最優(yōu)分配,改善整車燃油經(jīng)濟(jì)性和SOC穩(wěn)定性,建立了基于DBO-MPC的HEV多目標(biāo)控制策略,整車控制框架如圖5所示。采用Stacked LSTM算法對(duì)汽車的短期速度進(jìn)行預(yù)測(cè),并通過DBO算法對(duì)預(yù)測(cè)域內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行滾動(dòng)優(yōu)化,得到最優(yōu)控制量。
整車控制框架具體流程如下:1)基于汽車的歷史速度數(shù)據(jù),建立Stacked LSTM速度預(yù)測(cè)模型,預(yù)測(cè)汽車的速度。2)當(dāng)汽車行駛到k時(shí)刻時(shí),通過Stacked LSTM預(yù)測(cè)模型預(yù)測(cè)時(shí)刻[k,k+Lp]的速度。3)將預(yù)測(cè)車速輸入到整車控制器中,計(jì)算汽車的需求功率,構(gòu)建燃料消耗和SOC波動(dòng)最小化的目標(biāo)函數(shù)。4)根據(jù)所設(shè)立的目標(biāo)函數(shù),使用DBO算法對(duì)預(yù)測(cè)時(shí)域p內(nèi)的數(shù)據(jù)點(diǎn)進(jìn)行尋優(yōu),以獲得滿足迭代要求后的發(fā)動(dòng)機(jī)輸出功率最優(yōu)序列{u(k),u(k+1),…u(k+Lp)},再通過計(jì)算出的每個(gè)序列第一個(gè)最優(yōu)控制變量u(k)更新狀態(tài)變量SOC,并作用于前文所建立的HEV模型中。5)車輛進(jìn)入第k+1時(shí)刻,重復(fù)第k時(shí)刻的動(dòng)作,直到行駛狀態(tài)結(jié)束。
2.1基于Stacked LSTM的速度預(yù)測(cè)
傳統(tǒng)RNN在記憶之前的長序列時(shí)很難給出準(zhǔn)確的預(yù)測(cè)。因此,引入LSTM(long-short term memory) RNN架構(gòu)[16]來解決傳統(tǒng)RNN的這一問題。LSTM架構(gòu)在其隱藏層中有一個(gè)基本單元,稱為內(nèi)存塊。 LSTM的內(nèi)存塊有一個(gè)或多個(gè)內(nèi)存單元,此外還有3個(gè)門(輸入門、輸出門和遺忘門)。根據(jù)LSTM架構(gòu),計(jì)算LSTM存儲(chǔ)單元隱層的運(yùn)算(如圖6所示),并在每個(gè)時(shí)間步長t下更新,如式(9)所示:
ft=σ(WfhHt-1+WfxXt+bf)
it=σ(WihHt-1+WixXt+bi)
Ct′=tanh(WchHt-1+WcxXt+bc)
Ct=it⊙Ct′+ft⊙Ct-1
Ot=σ(WohHt-1+WoxXt+bo)
Ht=tanh[Ct]⊙Ot。(9)
式中:ft為 t 時(shí)刻的遺忘門,控制從上一時(shí)刻進(jìn)入的狀態(tài)變量Ct-1中遺忘的信息數(shù)量;it為t時(shí)刻的輸入門,控制保存t時(shí)刻Ct′的信息數(shù)量;Ct′為t 時(shí)刻的候選狀態(tài)變量,實(shí)現(xiàn)選擇性通過信息的功能;Ct為t時(shí)刻 LSTM 內(nèi)部的狀態(tài)變量;Ot為t時(shí)刻的輸出門,控制向外部狀態(tài)Ht輸出t時(shí)刻Ct的信息數(shù)量;σ為sigmoid 計(jì)算模塊;tanh為tanh計(jì)算模塊;Ht-1為t-1時(shí)刻的外部狀態(tài)變量;Ht為t時(shí)刻的外部狀態(tài)變量;W為各個(gè)門的權(quán)重;b為各個(gè)門的偏差;ε為Hadamard積,即兩個(gè)相同維度矩陣對(duì)應(yīng)元素相乘產(chǎn)生另一個(gè)新的相同維度矩陣的運(yùn)算。
在本研究提出的方法中,將構(gòu)建一個(gè)Stacked LSTM模塊的深度網(wǎng)絡(luò),用于預(yù)測(cè)未來車速。Stacked LSTM有以下兩個(gè)優(yōu)勢(shì):1)Stacked LSTM層使模型能夠在每個(gè)時(shí)間步從不同方面學(xué)習(xí)原始時(shí)間信號(hào)的特征;2)模型參數(shù)分布在模型的整個(gè)空間,不增加內(nèi)存容量,使模型能夠加速收斂,細(xì)化原始數(shù)據(jù)的非線性運(yùn)算。本研究中Stacked LSTM網(wǎng)絡(luò)主要由4個(gè)LSTM層組成,如圖7所示。首先,輸入層將窗口大小為L=10的一維序列作為輸入,再將其輸入饋送到Stacked LSTM網(wǎng)絡(luò)的第一個(gè)LSTM層,輸入層隱藏單元的大小等于輸入序列窗口的大小L。第一個(gè)LSTM層饋送到第二個(gè)LSTM層,依此類推,上一層的輸出即為下一層的輸入。4個(gè)LSTM層均有50個(gè)隱藏單元。最后,LSTM層饋入只有一個(gè)神經(jīng)元的全連接層,輸出時(shí)間步長為10的預(yù)測(cè)車速序列,全連接層的激活函數(shù)為線性激活函數(shù)。采用均方根誤差(RMSE)作為此預(yù)測(cè)模型的損失函數(shù):
R(k)=∑Li=1(vp(k+i)-v(k+i))2/L,(10)
R=∑Sk=1R(k)2/S。(11)
式中:v(k+i)為第k+i時(shí)刻的實(shí)際速度;vp(k+i)為k+i時(shí)刻的預(yù)測(cè)速度;R(k)為預(yù)測(cè)時(shí)域L在k時(shí)刻的均方根誤差;R為整個(gè)駕駛周期的均方根誤差。
2.2基于BDO算法的多目標(biāo)優(yōu)化
Jiankai Xue等[17]于2022年提出了一種新的群體智能優(yōu)化算法——蜣螂優(yōu)化算法(dung beetle optimizer,DBO),該算法同時(shí)兼顧全局搜索和局部開發(fā),具備快速收斂和高精度求解的優(yōu)勢(shì)。
DBO算法對(duì)蜣螂的滾球、跳舞、覓食、偷竊和繁殖行為進(jìn)行模仿來搜索數(shù)值范圍內(nèi)的最佳參數(shù)。其實(shí)現(xiàn)概述如下:1)設(shè)置最大迭代次數(shù)、蜣螂種群數(shù)量等參數(shù),并在搜索空間中隨機(jī)初始化每只蜣螂個(gè)體的位置;2)每次迭代后,不同的蜣螂根據(jù)自己的更新規(guī)則更新自己的位置,比較所有蜣螂的適應(yīng)值,記錄當(dāng)前迭代時(shí)間下最優(yōu)蜣螂的信息;3)重復(fù)上述步驟,直到滿足終止條件,輸出全局最優(yōu)蜣螂個(gè)體信息。DBO算法流程圖見圖8。其各個(gè)行為的位置更新公式如下。
1) 滾球行為
滾球行為的更新公式如下:
xt+1i=xti-α×k×xt-1i+b×Δx
Δx=|xti-xworst|。(12)
式中:t為當(dāng)前迭代次數(shù);xti為第i只蜣螂在第t次迭代時(shí)的位置信息;k∈(0,0.2]表示撓度系數(shù),為定值;b為屬于(0,1)的定值;α為自然系數(shù),賦值為-1或1;xworst表示全局最差位置;Δx用于模擬光強(qiáng)的變化。
2) 跳舞行為
跳舞行為的更新公式如下:
xt+1i=xti+tan(θ∈[0,π])|xti-xt-1i|。(13)
式中:|xti-xt-1i|為第i只蜣螂第t和t-1次迭代之間的差異。因此蜣螂位置的更新與當(dāng)前和歷史信息密切相關(guān)。
3) 繁殖行為
繁殖行為的更新公式如下:
xt+1i=X*-b1×(xti-Lb*)+b2×(xti-Ub*), (14)
Lb*=max(X*×(1-R),Lb), (15)
Ub*=max(X*×(1+R),Ub)。(16)
式中:xti為第i個(gè)卵球在第t次迭代的位置信息;b1和b2為兩個(gè)獨(dú)立的大小為1×dim維的隨機(jī)向量;X*表示當(dāng)前局部最優(yōu)位置;Lb*和Ub*分別為產(chǎn)卵的下界和上界;R=1-tmaxiter,maxiter為最大迭代次數(shù);Lb和Ub分別為優(yōu)化問題的下界和上界。
4) 覓食行為
覓食行為的更新公式如下:
xt+1i=xti+C1×(xti-Lbb)+C2×(xti-Ubb),(17)
Lbb=max(Xb×(1-R),Lb),(18)
Ubb=max(Xb×(1+R),Ub)。(19)
式中:xti為第i個(gè)蜣螂在第t次迭代的位置信息;C1為服從正態(tài)分布的隨機(jī)數(shù);C2為(0,1)范圍內(nèi)的隨機(jī)向量;Xb表示全局最優(yōu)位置;Lbb和Ubb分別為最佳覓食區(qū)域的下界和上界。
5) 偷竊行為
偷竊行為的更新公式如下:
xt+1i=Xb+S×g×(|xti-X*|+|xti-Xb|。(20)
式中:xti為第i個(gè)蜣螂小偷在第t次迭代的位置信息;g為大小為1×dim維的服從正態(tài)分布的隨機(jī)向量;S為常數(shù)。
將DBO算法嵌入到MPC模型控制器中,目的是對(duì)整車的燃料消耗和SOC穩(wěn)定性兩個(gè)目標(biāo)進(jìn)行優(yōu)化,并選擇發(fā)動(dòng)機(jī)輸出功率為優(yōu)化參數(shù)。采用DBO算法時(shí),設(shè)定蜣螂種群數(shù)量為30只,算法最大迭代次數(shù)為100次,每個(gè)蜣螂都被視為給定搜索空間中的一個(gè)點(diǎn)和一個(gè)可行的解決方案,它根據(jù)自身的變化規(guī)律,不斷迭代更新自己的位置,減小目標(biāo)函數(shù)的值。
系統(tǒng)的目標(biāo)函數(shù)如式(21)所示:
J=∫tft0αmfuel+βPbat3 600+γ(SOCref-SOC)2dt。(21)
式中:α為燃料的成本價(jià)格;β為電價(jià);γ為SOC懲罰因子[18-19]。
以電池SOC作為系統(tǒng)的狀態(tài)變量,發(fā)動(dòng)機(jī)功率作為系統(tǒng)的控制變量,構(gòu)造的狀態(tài)轉(zhuǎn)換方程如式(22)所示:
xk+1=f(xk,uk)
xk=SOC(k)
u(k)=Peng(k)。(22)
式中:xk為系統(tǒng)狀態(tài)變量;uk為系統(tǒng)控制變量。
最優(yōu)控制應(yīng)滿足以下約束條件:
0≤SOC(k)≤1
0≤neng(k)≤neng_max
Peng_min≤Peng(k)≤Peng_max
0≤Teng(neng(k))≤Teng_max(neng(k))
nmot_min≤nmot(k)≤nmot_max
Tmot_min(nmot(k))≤Tmot(nmot(k))≤
Tmot_max(nmot(k))
Ibat_max_char(k)≤Ibat(k)≤Ibat_max_disch(k)。(23)
式中:neng為發(fā)動(dòng)機(jī)轉(zhuǎn)速;Peng為發(fā)動(dòng)機(jī)功率;Teng為發(fā)動(dòng)機(jī)扭矩;nmot為電機(jī)轉(zhuǎn)速;Tmot為電機(jī)扭矩;Ibat為動(dòng)力電池電流。
3分析與討論
在Python環(huán)境下構(gòu)建基于Stacked LSTM神經(jīng)網(wǎng)絡(luò)的短期車速預(yù)測(cè)模型,并調(diào)用采集到的工況數(shù)據(jù)進(jìn)行訓(xùn)練和車速預(yù)測(cè)。此外,本研究也在Python環(huán)境下搭建MPC框架,該框架利用速度預(yù)測(cè)模型提供的實(shí)時(shí)預(yù)測(cè)車速進(jìn)行仿真試驗(yàn)。仿真試驗(yàn)在一臺(tái)配備Intel(R) Core(TM) i5-10200H CPU @ 2.40 GHz處理器和16 GB運(yùn)行內(nèi)存的電腦上運(yùn)行。
3.1速度預(yù)測(cè)模型有效性分析
針對(duì)車輛實(shí)際行駛環(huán)境復(fù)雜多變的特點(diǎn),該模型的訓(xùn)練集數(shù)據(jù)通過實(shí)際車輛在南寧道路工況下采集得到,包括擁堵路段、城區(qū)和高速公路等不同工況。經(jīng)過降噪和數(shù)據(jù)處理后的訓(xùn)練集如圖9所示,測(cè)試集則采用UDDS工況(如圖10所示)。為驗(yàn)證基于Stacked LSTM速度預(yù)測(cè)模型的有效性,選取傳統(tǒng)LSTM速度預(yù)測(cè)模型與該模型進(jìn)行對(duì)比試驗(yàn)。兩個(gè)速度預(yù)測(cè)模型的預(yù)測(cè)時(shí)域范圍為10 s,從歷史車速數(shù)據(jù)集中選取當(dāng)前時(shí)刻t前10 s的車速數(shù)據(jù)作為輸入。圖11示出兩個(gè)速度預(yù)測(cè)模型對(duì)UDDS工況的短期預(yù)測(cè)結(jié)果。圖12示出兩個(gè)速度預(yù)測(cè)模型的均方根誤差在預(yù)測(cè)時(shí)域的分布。由圖知,在一些速度突變的數(shù)據(jù)點(diǎn),兩個(gè)模型的均方根誤差均有些偏高,這是因?yàn)樗俣阮A(yù)測(cè)模型主要通過歷史車速進(jìn)行預(yù)測(cè),當(dāng)車速急劇變化時(shí)預(yù)測(cè)精度則會(huì)變低。但相對(duì)于傳統(tǒng)LSTM模型,Stacked LSTM算法學(xué)習(xí)能力提高,在一定程度上可以降低速度突變帶來的影響,并且可以看出,在整個(gè)駕駛工況中,Stacked LSTM速度預(yù)測(cè)模型的均方根誤差要比傳統(tǒng)LSTM速度預(yù)測(cè)模型低,經(jīng)過計(jì)算,Stacked LSTM速度預(yù)測(cè)模型的均方根誤差為2.622 0 km/h,傳統(tǒng)LSTM速度預(yù)測(cè)模型的均方根誤差為3.044 2 km/h。同時(shí),在實(shí)時(shí)性方面,Stacked LSTM速度預(yù)測(cè)模型每步平均預(yù)測(cè)時(shí)間為3 ms,而傳統(tǒng)LSTM速度預(yù)測(cè)模型為4 ms,滿足實(shí)時(shí)運(yùn)行的要求。因此,Stacked LSTM速度預(yù)測(cè)模型對(duì)行駛工況的短期速度實(shí)時(shí)預(yù)測(cè)是有效的。
3.2整車經(jīng)濟(jì)性分析
為了驗(yàn)證所提出策略的優(yōu)越性,建立了基于規(guī)則的模型和全局最優(yōu)DP模型,并在基于速度預(yù)測(cè)模型所預(yù)測(cè)的實(shí)車工況車速下對(duì)三種策略進(jìn)行比較。設(shè)定3種策略的SOC初始值均為0.55,仿真結(jié)果見圖13至圖16。由表2和圖14可知,基于規(guī)則的策略模型在整個(gè)行駛工況中發(fā)動(dòng)機(jī)起動(dòng)頻繁且輸出功率最大,油耗最高,100 km燃油消耗量達(dá)到4.667 5 L,與之相比,基于DBO-MPC的策略模型和基于DP的策略模型相對(duì)合理地使用動(dòng)力電池提供需求功率,其發(fā)動(dòng)機(jī)輸出功率較低且平穩(wěn),DP策略模型的發(fā)動(dòng)機(jī)使用頻率相對(duì)較少,油耗最低,相比基于規(guī)則的策略節(jié)油率達(dá)到了30.6%,基于DBO-MPC策略模型節(jié)油效果也比較明顯,相比基于規(guī)則的策略節(jié)油率達(dá)到25.3%。電量消耗方面,由圖13可知,DP策略模型初始階段大量使用電池提供能量,電池電量消耗較快,充電后SOC狀態(tài)依然不夠穩(wěn)定,且末期對(duì)電池大量充電也會(huì)對(duì)電池造成損耗;基于規(guī)則策略模型的電池大部分時(shí)間處于充電狀態(tài),中期經(jīng)歷連續(xù)放電,整個(gè)行駛周期電池SOC狀態(tài)波動(dòng)較大。而基于DBO-MPC的策略模型SOC狀態(tài)全程較為穩(wěn)定,避免連續(xù)或急速充放電對(duì)電池造成的損耗。
4結(jié)束語
提出了一種基于DBO-MPC的HEV能量管理策略。建立了基于Stacked LSTM的車速預(yù)測(cè)模型對(duì)未來車速進(jìn)行短期預(yù)測(cè),再以整車燃料消耗量最低與行駛過程電池SOC平衡為目標(biāo),采用DBO算法對(duì)預(yù)測(cè)時(shí)域內(nèi)發(fā)動(dòng)機(jī)的功率分配進(jìn)行優(yōu)化求解,得到最優(yōu)控制序列。仿真結(jié)果表明:基于Stacked LSTM的車速預(yù)測(cè)模型比傳統(tǒng)LSTM預(yù)測(cè)模型的RMSE 降低了13.9%;基于DBO-MPC策略模型的燃油消耗量比基于規(guī)則策略模型節(jié)省了25.3%,SOC軌跡也更為平穩(wěn),驗(yàn)證了所提策略的有效性。
參考文獻(xiàn):
[1]LIAN R,PENG J,WU Y,et al.Rule-interposing deep reinforcement learning based energy management strategy for power-split hybrid electric vehicle[J/OL].Energy,2020,197:117297.
[2]WANG B,XU J,CAO B,et al.A novel multimode hybrid energy storage system and its energy management strategy for electric vehicles[J/OL].Journal of Power Sources,2015,281:432-443.
[3]ZHANG S,XIONG R,CAO J.Battery durability and longevity based power management for plug-in hybrid electric vehicle with hybrid energy storage system[J/OL].Applied Energy,2016,179:316-328.
[4]CASTAINGS A,LHOMME W,TRIGUI R,et al.Comparison of energy management strategies of a battery/supercapacitors system for electric vehicle under real-time constraints[J/OL].Applied Energy,2016,163:190-200.
[5]CHEN Z,XIA B,YOU C,et al.A novel energy management method for series plug-in hybrid electric vehicles[J/OL].Applied Energy,2015,145:172-179.
[6]Dehghani N L,Mohammadi Darestani Y,Shafieezadeh A.Optimal Life-Cycle Resilience Enhancement of Aging Power Distribution Systems:A MINLP-Based Preventive Maintenance Planning[J/OL].IEEE Access,2020,8:22324-22334.
[7]Banvait H,Anwar S,Chen Y.A rule-based energy management strategy for Plug-in Hybrid Electric Vehicle (PHEV)[C/OL]//2009 American Control Conference.St.Louis:[s.n.],2009.
[8]顧琰浩,吳曉東,許敏.增程式電動(dòng)車自適應(yīng)工況辨識(shí)策略研究[J].車用發(fā)動(dòng)機(jī),2021(1):1-8.
[9]張新亮,周童.基于雙模式優(yōu)化算法的并聯(lián)混合動(dòng)力汽車能量管理策略研究[J].車用發(fā)動(dòng)機(jī),2020(6):48-52.
[10]韋超毅,吳雨輪,林長波,等.基于行駛工況識(shí)別的混合動(dòng)力貨車能量管理策略[J].陜西科技大學(xué)學(xué)報(bào),2022,40(4):158-164.
[11]張風(fēng)奇,胡曉松,許康輝,等.混合動(dòng)力汽車模型預(yù)測(cè)能量管理研究現(xiàn)狀與展望[J].機(jī)械工程學(xué)報(bào),2019,55(10):86-108.
[12]魏麗青,萬幸.插電式混合動(dòng)力汽車車速預(yù)測(cè)及能量管理策略[J].車用發(fā)動(dòng)機(jī),2022(3):69-75.
[13]HE H,HUANG R,MENG X,et al.A novel hierarchical predictive energy management strategy for plug-in hybrid electric bus combined with deep deterministic policy gradient[J/OL].Journal of Energy Storage,2022,52:104787.
[14]ZENG X,CUI H,SONG D,et al.Jerk Analysis of a Power-Split Hybrid Electric Vehicle Based on a Data-Driven Vehicle Dynamics Model[J/OL].Energies,2018,11(6):1537.
[15]崔皓勇.混聯(lián)式兩檔AMT客車模式切換協(xié)調(diào)控制研究[D].長春:吉林大學(xué),2019.
[16]HOCHREITER S,SCHMIDHUBER J.Long Short-Term Memory[J/OL].Neural Computation,1997,9(8):1735-1780.
[17]XUE J,SHEN B.Dung beetle optimizer:a new meta-heuristic algorithm for global optimization[J].The Journal of Supercomputing,2023,79(7):7305-7336.
[18]霍志偉.基于預(yù)測(cè)控制的混聯(lián)式插電混合動(dòng)力汽車能量管理策略研究[D].重慶:重慶理工大學(xué),2022.
[19]LI J,WU X,XU M,et al.A real-time optimization energy management of range extended electric vehicles for battery lifetime and energy consumption[J/OL].Journal of Power Sources,2021,498:229939.
Energy Management Strategy of Hybrid Electric Vehicle Based on DBO-MPC
MAO Xingyu1,MENG Yanmei1,XU Enyong2,3,ZHAO Deping3,CHEN Yuanling1,LIU Xin1
(1.College of Mechanical Engineering,Guangxi University,Nanning530004,China;2.School of Mechanical Science and Engineering,Huazhong University of Science and Technology,Wuhan430074,China;3.Dongfeng Liuzhou Motor Co.,Ltd.,Liuzhou545005,China)
Abstract: The energy management strategy of hybrid electric vehicle(HEV) directly determines the fuel economy, driving performance and life of vehicle. In order to solve the contradiction between the optimal energy management strategy of HEV and the uncertainty of real-time driving conditions, the energy management strategy of HEV based on model predictive control(MPC) and Dung beetle optimizer(DBO) was proposed based on the research object of hybrid HEV. First, the strategy used the vehicle speed prediction model to predict future driving speed based on stacked long-short term memory neural network(Stacked LSTM-NN). Then, according to the predicted vehicle speed, the power distribution problem of HEV was described as a rolling optimization problem within the MPC prediction range. Considering the cost function of fuel consumption and battery protection, the DBO algorithm was used to optimize the engine power in the forecast time domain. Finally, under urban dynamometer driving schedule(UDDS) conditions, the speed prediction accuracy and fuel economy of proposed strategy were simulated and compared with other strategies. Compared with the traditional LSTM speed prediction model, the RMSE of Stacked LSTM speed prediction model reduces by 13.9%, and the average prediction time of each step reduces by 1 ms. Compared with the rule-based strategy, the fuel saving rate of DBO-MPC strategy model reached 25.3%, and the SOC state is more stable and the battery protection effect is better.
Key words: hybrid electric vehicle;energy management;control strategy;vehicle speed prediction
[編輯: 袁曉燕]