吳進(jìn)軍 顏丙杰 方繼根 王西峰 謝志鵬 史 洋 李 亮
1.中機(jī)生產(chǎn)力促進(jìn)中心,北京,1000442.清華大學(xué)汽車安全與節(jié)能國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京,1000843.寧波吉利汽車研究開(kāi)發(fā)有限公司,寧波,3153364.東風(fēng)汽車集團(tuán)股份有限公司技術(shù)中心,武漢,430058
國(guó)內(nèi)外對(duì)插電式混合動(dòng)力汽車整車能量管理策略進(jìn)行了大量的研究,目前,已提出的控制策略主要有基于規(guī)則的啟發(fā)式策略[1]、可實(shí)時(shí)計(jì)算的瞬時(shí)優(yōu)化控制策略、基于模型預(yù)測(cè)的能量管理策略,以及基于最優(yōu)理論的最優(yōu)控制策略。
瞬時(shí)優(yōu)化控制策略主要是指等效燃油消耗最小策略(equivalent consumption minimization strategy, ECMS),其思想是在車輛行駛過(guò)程中的每個(gè)時(shí)刻,實(shí)時(shí)計(jì)算滿足當(dāng)前駕駛員需求功率中的發(fā)動(dòng)機(jī)輸出功率和電機(jī)輸出功率分別對(duì)應(yīng)的燃油消耗量和耗電量,將該瞬時(shí)的電機(jī)耗電量等效為瞬時(shí)的燃油消耗量,并獲得當(dāng)前時(shí)刻的等效油耗,求取使得該瞬時(shí)燃油消耗最小的發(fā)動(dòng)機(jī)和電機(jī)的輸出功率(即最優(yōu)分配策略[2-4])。
模型預(yù)測(cè)控制(model predictive control, MPC)是一種基于模型的、滾動(dòng)實(shí)施并結(jié)合反饋校正的優(yōu)化控制算法。FU等[5]利用智能交通系統(tǒng)(intelligent transportation systems, ITS)獲得交通流信息,基于MPC提出了一種能量?jī)?yōu)化算法,分析了預(yù)測(cè)車速信息的準(zhǔn)確度對(duì)不同控制策略的影響。
最優(yōu)控制策略是基于最優(yōu)化方法或最優(yōu)控制理論開(kāi)發(fā)出來(lái)的混合動(dòng)力汽車整車能量管理策略,研究最多的是基于Bellman動(dòng)態(tài)規(guī)劃(dynamic programming, DP)的控制策略, 動(dòng)態(tài)規(guī)劃分為確定性動(dòng)態(tài)規(guī)劃(deterministic dynamic programming, DDP)和隨機(jī)動(dòng)態(tài)規(guī)劃(stochastic dynamic programming, SDP)。
SDP是在DDP的基礎(chǔ)上引入隨機(jī)狀態(tài)變量發(fā)展而來(lái)的,通常針對(duì)多條工況進(jìn)行研究。LIN等[6]、LIU等[7]采用SDP對(duì)并聯(lián)混合動(dòng)力構(gòu)型進(jìn)行能量?jī)?yōu)化分配;MOURA等[8]系統(tǒng)地討論了可控消耗型策略相對(duì)于常規(guī)消耗維持型策略的潛在優(yōu)勢(shì),并討論了油電價(jià)格比對(duì)SDP優(yōu)化效果的影響。
目前大多數(shù)能量管理策略無(wú)論是借助先進(jìn)的車載終端獲取大量實(shí)時(shí)的交通數(shù)據(jù),或是實(shí)時(shí)分析駕駛員駕駛意圖,最終目的都是通過(guò)優(yōu)化擋位或功率分配來(lái)提高整車燃油經(jīng)濟(jì)性能,但有關(guān)同時(shí)優(yōu)化擋位與功率分配的報(bào)道較少。本文主要針對(duì)電控機(jī)械式自動(dòng)變速器(automated mechanical transmission, AMT)擋位與功率分配同步優(yōu)化過(guò)程中計(jì)算量大,以及最優(yōu)擋位與最優(yōu)功率分配嚴(yán)格一一對(duì)應(yīng)實(shí)用性差的問(wèn)題,提出了一種可實(shí)際應(yīng)用的次優(yōu)能量管理策略。通過(guò)SDP獲得最優(yōu)的擋位與功率分配;創(chuàng)新地提出了通過(guò)算法內(nèi)部約束與外部修正相結(jié)合的雙重?fù)跷患s束方法,來(lái)避免換擋過(guò)程的“反復(fù)”,以保證駕駛性能;并采用瞬時(shí)優(yōu)化算法實(shí)現(xiàn)換擋過(guò)程中的最優(yōu)功率分配,解決了換擋修正過(guò)程中的最優(yōu)功率分配和擋位不匹配問(wèn)題,使整個(gè)優(yōu)化算法具有更好的實(shí)用潛力。
駕駛員模型通常為一個(gè)PI控制器模型[9],輸入為期望車速與實(shí)際車速之差,輸出為油門和踏板信號(hào),則加速踏板和制動(dòng)踏板位置可描述為
(1)
|θ|∈[0,100%]
式中,KP、KI分別為比例系數(shù)和積分系數(shù),兩者可通過(guò)試錯(cuò)法來(lái)確定;va為實(shí)際車速,km/h;vr為期望車速,km/h;θ為踏板開(kāi)度,加速踏板為正,制動(dòng)踏板為負(fù)。
通過(guò)查表得到當(dāng)前踏板位置θ與AMT輸入軸轉(zhuǎn)速n,求得駕駛員的需求功率Pr,并構(gòu)建需求功率MAP圖,見(jiàn)圖1。
圖1 需求功率Fig.1 The damand power
為便于優(yōu)化策略的開(kāi)發(fā),建立了簡(jiǎn)化的面向控制的壓縮天然氣(compressed natural gas, CNG)發(fā)動(dòng)機(jī)模型,單位時(shí)間內(nèi)的CNG消耗量可表示為
(2)
式中,Qcng為單位時(shí)間內(nèi)的CNG消耗量,mL/s;Te為發(fā)動(dòng)機(jī)輸出扭矩,N·m;ωe為發(fā)動(dòng)機(jī)角速度,rad/s;Pe為發(fā)動(dòng)機(jī)輸出功率,W;ρcng為CNG密度,kg/m3;g為重力加速度,本文取9.8 m/s2;b為CNG消耗率,可通過(guò)一定轉(zhuǎn)速和轉(zhuǎn)矩查找準(zhǔn)靜態(tài)發(fā)動(dòng)機(jī)萬(wàn)有特性MAP圖得到。
在運(yùn)行過(guò)程中,電機(jī)既可作為電動(dòng)機(jī)工作,也可作為發(fā)電機(jī)工作,與發(fā)動(dòng)機(jī)模型相似,電機(jī)功率計(jì)算模型可表示為
(3)
式中,Pm為電機(jī)功率,W;Tm為電機(jī)輸出扭矩,N·m;ωm為電機(jī)角速度,rad/s;ηm為電機(jī)效率,可通過(guò)一定轉(zhuǎn)速和轉(zhuǎn)矩查找電機(jī)準(zhǔn)靜態(tài)效率MAP圖得到。
忽略電池壽命及溫升影響,將動(dòng)力電池簡(jiǎn)化為開(kāi)路電壓串聯(lián)一個(gè)內(nèi)阻的等效電路,見(jiàn)圖2。
圖2 動(dòng)力電池等效電路Fig.2 Power battery equivalent circuit diagram
(4)
式中,Uoc為開(kāi)路電壓;Qbat為電池容量,A·h;Rint為電池內(nèi)阻,Ω;Pele為電池功率,W;Rdis、Rchg分別為放電狀態(tài)和充電狀態(tài)下的電池內(nèi)阻,Ω。
汽車行駛過(guò)程的受力示意圖見(jiàn)圖3,汽車縱向動(dòng)力學(xué)平衡方程為
(5)
式中,Ttq為作用在車輪上的驅(qū)動(dòng)力矩,N·m;Tb為作用在車輪上的制動(dòng)力矩,N·m;m為整車總質(zhì)量,kg;f1、f2分別為第一和第二滾動(dòng)阻力系數(shù);v為車速,m/s;CD為空氣阻力系數(shù);ρa(bǔ)ir為空氣密度,kg/m3;A為迎風(fēng)面積,m2;α為道路坡道角,rad;δ為旋轉(zhuǎn)質(zhì)量換算系數(shù);r為車輪半徑,m。
圖3 汽車行駛受力示意圖Fig.3 The schematic diagram of the driving force of a car
優(yōu)化發(fā)動(dòng)機(jī)與電機(jī)間的功率分配和AMT擋位可最大程度地提高整車的燃油經(jīng)濟(jì)性,但在一定需求功率下,最優(yōu)功率分配與最優(yōu)擋位之間嚴(yán)格的對(duì)應(yīng)關(guān)系在實(shí)際應(yīng)用過(guò)程中將難以保證。離線優(yōu)化所得的最優(yōu)決策組合(最優(yōu)功率分配和換擋操作),在實(shí)際應(yīng)用過(guò)程中有可能造成AMT抖振,從而影響駕駛舒適性,故需要對(duì)換擋操作進(jìn)行約束,但此時(shí)原有發(fā)動(dòng)機(jī)和電機(jī)最優(yōu)分配已無(wú)法保證燃油經(jīng)濟(jì)性最優(yōu),甚至?xí)夯淙加徒?jīng)濟(jì)性。針對(duì)上述問(wèn)題,本文提出了一種可實(shí)際應(yīng)用的次優(yōu)能量管理策略(圖4),具體步驟如下:
(1)將復(fù)雜的4維(需求功率Pr、車速v、SOC值Ssoc、當(dāng)前擋位)2參數(shù)(擋位動(dòng)作、發(fā)動(dòng)機(jī)功率)優(yōu)化問(wèn)題轉(zhuǎn)換為3維(需求功率、車速、SOC值)2參數(shù)(目標(biāo)擋位、發(fā)動(dòng)機(jī)功率)優(yōu)化問(wèn)題,以減小計(jì)算量;
(2)針對(duì)最優(yōu)決策在實(shí)施過(guò)程中可能出現(xiàn)的頻繁升降擋問(wèn)題,提出了內(nèi)部約束與外部修正相結(jié)合的方法,在內(nèi)部?jī)?yōu)化過(guò)程中引入對(duì)換擋操作的懲罰項(xiàng)λ,對(duì)頻繁換擋進(jìn)行約束,在外部(即最優(yōu)結(jié)果后處理)研究不同SOC值下的最優(yōu)換擋曲線,歸納出一般規(guī)律;
圖4 次優(yōu)能量管理策略的框架圖Fig.4 Frame of the sub-optimal energy management strategy
(3)對(duì)最優(yōu)擋位進(jìn)行修正,將最優(yōu)擋位圖轉(zhuǎn)化為簡(jiǎn)單的二參數(shù)換擋邏輯,解決頻繁換擋問(wèn)題的同時(shí)可簡(jiǎn)化換擋邏輯;
(4)換擋邏輯的改變使得初始最優(yōu)功率分配不再適用,此時(shí)采取瞬時(shí)能量?jī)?yōu)化控制策略,實(shí)時(shí)獲取最優(yōu)功率分配。
最后利用實(shí)車采集的工況數(shù)據(jù),仿真驗(yàn)證在不同工況與路況條件下所提策略的有效性。
由實(shí)車采集得到重慶303公交線路的運(yùn)行工況數(shù)據(jù),根據(jù)汽車縱向動(dòng)力學(xué)方程,可計(jì)算出相應(yīng)工況下的變速箱輸入端駕駛員需求功率的變化。選取駕駛員需求功率和車速作為狀態(tài)變量,并將其離散化,即
(6)
式中,NPr為需求功率的離散個(gè)數(shù);Nv為車速的離散個(gè)數(shù)。
駕駛員需求功率的單步轉(zhuǎn)移概率可描述為:在當(dāng)前需求功率和當(dāng)前車速條件下,下一時(shí)刻需求功率出現(xiàn)的概率,其表達(dá)式為
(7)
i,j=1,2,…,NPrl=1,2,…,Nv
利用最大近似值原理,需求功率的單步轉(zhuǎn)移概率可通過(guò)數(shù)據(jù)統(tǒng)計(jì)獲得,即
(8)
在數(shù)據(jù)統(tǒng)計(jì)過(guò)程中,數(shù)據(jù)取整或離散精度不高時(shí)易導(dǎo)致需求功率邊界值(如最大值或最小值)僅出現(xiàn)一次(即Mil=0),為方便計(jì)算,規(guī)定下一時(shí)刻需求功率將以100%的概率向相同狀態(tài)轉(zhuǎn)移。
采用SDP優(yōu)化需求轉(zhuǎn)矩的分配,離散狀態(tài)變量可表示為
xk={Ssoc,k,Pr,k,vk}
(9)
式中,xk為優(yōu)化過(guò)程中的第k步狀態(tài)變量集合;Ssoc,k為第k步電池SOC的離散值;vk為第k步車速的離散值;Pr,k為第k步需求功率的離散值。
狀態(tài)變量Pr以概率矩陣的形式隨機(jī)轉(zhuǎn)移,得到電池SOC和車速的離散狀態(tài)方程分別如下:
(10)
(11)
ck=mgf1cosαk+mgsinαk-
式中,Δt為時(shí)間步長(zhǎng)。
同時(shí)選取控制變量如下:
uk={Pe,k}
(12)
式中,uk為優(yōu)化過(guò)程中的第k步控制變量集合;Pe,k為第k步發(fā)動(dòng)機(jī)功率離散值。
由于動(dòng)力系統(tǒng)的限制,上述狀態(tài)變量和控制變量必須滿足如下約束條件:
(13)
式中,ωm,min、ωm,max分別為電機(jī)的最小和最大角速度,rad/s;ωe,min、ωe,max分別為發(fā)動(dòng)機(jī)的最小和最大角速度,rad/s;Pm,k、ωm,k分別為第k步的電機(jī)功率和角速度;Pm,min、Pm,max分別為角速度ωm時(shí)的電機(jī)最小和最大功率,kW;Pe,k、ωe,k分別為第k步的發(fā)動(dòng)機(jī)功率和角速度;Pe,min、Pe,max分別為角速度ωe時(shí)的發(fā)動(dòng)機(jī)最小和最大功率,kW;Ssoc,min、Ssoc,max分別為電池SOC值的下限和上限。
由于系統(tǒng)具有時(shí)不變特性以及運(yùn)行過(guò)程無(wú)終端時(shí)間約束,因此可將混合動(dòng)力系統(tǒng)能量管理建立為一個(gè)無(wú)限時(shí)域優(yōu)化問(wèn)題。在約束條件下,尋找最優(yōu)的控制變量,使得目標(biāo)函數(shù)在無(wú)限時(shí)間域內(nèi)的期望最小,并建立如下目標(biāo)函數(shù):
(14)
式中,J為目標(biāo)函數(shù)(即代價(jià)函數(shù));E為期望函數(shù);Ssoc,e為期望的終端SOC值;pcng為CNG的價(jià)格,元/kg;pele為電價(jià),元/(kW·h);Pele為電池功率,W;f為單步代價(jià)函數(shù);γ為折扣因子,滿足γ∈[0,1];λ1、λ2分別為SOC和擋位的懲罰因子;gp,k+1、gp,k分別為第k+1步和第k步的擋位值。
本文主要采用值迭代法進(jìn)行求解[10-12],該方法與DDP相似,在每一個(gè)狀態(tài)離散點(diǎn)遍歷所有可能的需求分配以獲得最優(yōu)的決策變量。迭代求解過(guò)程見(jiàn)圖5。
圖5 迭代求解過(guò)程Fig.5 The iterative solution process
(1)算法初始化。設(shè)定折扣因子γ=0.95,指定錯(cuò)誤容差ε=1%,初始目標(biāo)函數(shù)J0(x,u)=0,迭代次數(shù)k=1。
(2)貝爾曼迭代。在每一個(gè)狀態(tài)變量x和控制變量u下,將目標(biāo)函數(shù)表示為貝爾曼迭代方程的形式,即
(15)
式中,X為離散的狀態(tài)變量可行域;U為離散的控制變量可行域;x′為在控制變量u下,狀態(tài)變量x轉(zhuǎn)移到的新?tīng)顟B(tài)。
(3)終止條件判斷。判斷相鄰兩次迭代的目標(biāo)函數(shù)值之差是否滿足終止條件,即
|Jk+1(x)-Jk(x)|<ε(1-γ)/(2γ)
(16)
若滿足終止條件,即代價(jià)函數(shù)收斂到最優(yōu),則令最優(yōu)目標(biāo)值J*=Jk(x),進(jìn)入步驟(4);否則,返回步驟(2)。
(4)求解最優(yōu)控制策略。最優(yōu)控制策略即為使目標(biāo)函數(shù)收斂時(shí)的控制變量,可表示為
u*(x)=arg min(J*)
(17)
基于大量歷史工況數(shù)據(jù),采用SDP獲得最優(yōu)擋位與最優(yōu)功率分配,其中在Ssoc=40%狀態(tài)下的換擋策略與最優(yōu)發(fā)動(dòng)機(jī)功率分別見(jiàn)圖6和圖7。
圖6 最優(yōu)擋位(Ssoc=40%)Fig.6 Optimal position(Ssoc=40%)
圖7 最優(yōu)發(fā)動(dòng)機(jī)功率(Ssoc=40%)Fig.7 Optimal engine power(Ssoc=40%)
由圖6可以看出,在Ssoc=40%狀態(tài)下,不同擋位之間有明顯的分界線,與實(shí)際過(guò)程中常用的二參數(shù)換擋曲線類似[13-14]。此外,該換擋曲線在一定車速范圍內(nèi),隨著需求功率的增大,表現(xiàn)出延時(shí)升擋的特性,相較于固定的一條換擋曲線具有更優(yōu)異的動(dòng)力性能。
圖8 修正的換擋曲線Fig. 8 Modified shift curve
通過(guò)研究不同SOC狀態(tài)的換擋曲線,可構(gòu)建完整的換擋曲線來(lái)分析,見(jiàn)圖8。以1擋→2擋換擋曲線為例,點(diǎn)線為通過(guò)SDP優(yōu)化算法獲得的最優(yōu)換擋曲線,其左側(cè)為1擋,右側(cè)為2擋;通過(guò)修正邏輯得到升降擋曲線,實(shí)線為降擋曲線,虛線為升擋曲線;因此在降擋曲線左側(cè)和升擋曲線右側(cè)的區(qū)域,其擋位與SDP優(yōu)化的擋位結(jié)果一致,最優(yōu)功率通過(guò)查表最優(yōu)功率分配獲得;在擋位陰影部分以內(nèi)的區(qū)域,則采用瞬時(shí)優(yōu)化控制策略實(shí)時(shí)獲取最優(yōu)功率分配。
所采用的仿真工況為實(shí)車采集重慶303路公交車運(yùn)行數(shù)據(jù),線路共有33個(gè)站點(diǎn)。該公交運(yùn)行工況的速度-時(shí)間曲線見(jiàn)圖9。
圖9 公交工況的速度-時(shí)間曲線Fig.9 The speed-time curve of bus condition
為驗(yàn)證所提方法換擋策略的有效性,將基于測(cè)試工況與基于常規(guī)換擋策略的EV-CS策略進(jìn)行對(duì)比,仿真結(jié)果見(jiàn)圖10。為分析所提方法對(duì)整車燃油經(jīng)濟(jì)性改善的效果,將采用所提方法構(gòu)建的換擋策略,分別與EV-CS策略、ECMS策略以及DP策略進(jìn)行對(duì)比[15-16],見(jiàn)圖11。為保證對(duì)比的有效性,所采用的對(duì)比策略與所提策略具有相同目標(biāo)函數(shù)中的單步代價(jià)函數(shù)f(x,u)。
圖10 換擋曲線對(duì)比Fig.10 Gear curves of simulation
由圖11可以看出,4種控制策略均基于相同的車速工況(該工況為圖9的返程工況),且4種控制策略的電量均在最后耗盡。由SOC值-時(shí)間曲線可知,EV-CS策略優(yōu)先耗電,而在電量維持階段(Ssoc=40%)的時(shí)間最長(zhǎng),因此,EV-CS策略在初期的氣耗較低,在后期的氣耗變高;DP策略基于全程工況完全已知的假設(shè),具有全局優(yōu)化性能,因此該策略可將電能在全程進(jìn)行平衡;ECMS策略為瞬時(shí)最優(yōu)策略;本文所提策略引入了隨機(jī)狀態(tài)變量,是一種基于SDP的預(yù)測(cè)控制策略。與ECMS策略相比,本文所提策略的優(yōu)化結(jié)果考慮了未來(lái)一段時(shí)間的工況變化情況;與針對(duì)單一工況的DP策略相比,所提策略的優(yōu)化過(guò)程是基于狀態(tài)概率的轉(zhuǎn)移,優(yōu)化結(jié)果本質(zhì)上是針對(duì)多條工況“平均意義上”的最優(yōu),更具有實(shí)際應(yīng)用意義。不同控制策略下的終點(diǎn)SOC、氣耗、電耗和費(fèi)用見(jiàn)表1。由表1可知,本文所提策略的燃油經(jīng)濟(jì)性有顯著的提升效果。
圖11 仿真結(jié)果對(duì)比Fig.11 Comparison of simulation curves
EV-CSECMS本文DP終點(diǎn) SOC值 (%)35.0134.8735.1535.00百公里氣耗(m3)14.7112.5411.8710.39百公里電耗(kW·h)43.4543.5743.3443.31費(fèi)用 (元)109.645100.00096.75590.065費(fèi)用節(jié)省率 (%)8.8011.7617.86
(1)本文基于隨機(jī)動(dòng)態(tài)規(guī)劃方法,提出了面向?qū)嶋H應(yīng)用的次優(yōu)能量管理策略。隨機(jī)動(dòng)態(tài)規(guī)劃算法在確定性動(dòng)態(tài)規(guī)劃的基礎(chǔ)上引入了隨機(jī)過(guò)程,使得優(yōu)化過(guò)程變得更為復(fù)雜,但隨機(jī)動(dòng)態(tài)規(guī)劃生成的優(yōu)化結(jié)果是以表格的形式存儲(chǔ)的,且其優(yōu)化結(jié)果是車輛的全狀態(tài)反饋,具有很大的實(shí)用潛力。
(2)通過(guò)分析不同SOC狀態(tài)下的換擋曲線,獲得了具有一般性的換擋規(guī)律,也在一定程度上提高了優(yōu)化算法的可用性。