韋超毅, 吳雨輪, 林長(zhǎng)波, 許恩永, 余 寨
(1.廣西大學(xué) 機(jī)械工程學(xué)院, 廣西 南寧 530004; 2.東風(fēng)柳州汽車有限公司, 廣西 柳州 545005)
對(duì)于具有多動(dòng)力源的混合動(dòng)力汽車而言,能量管理策略是開發(fā)其節(jié)油潛力的關(guān)鍵.因此,能量管理策略的制定對(duì)混合動(dòng)力汽車的設(shè)計(jì)具有重要意義.
混合動(dòng)力汽車的能量管理策略通常分為4類,即基于規(guī)則的能量管理策略、瞬時(shí)優(yōu)化策略、全局優(yōu)化策略和基于工況自適應(yīng)的能量管理策略[1].目前在工業(yè)生產(chǎn)中應(yīng)用最為廣泛的基于規(guī)則的能量管理策略是根據(jù)研發(fā)人員制定的規(guī)則來分配發(fā)動(dòng)機(jī)與電機(jī)的扭矩,該策略易于實(shí)現(xiàn)但其節(jié)能效果有限;作為最具有代表性的瞬時(shí)優(yōu)化策略——等效燃油消耗最小策略(Equivalent consumption mini-mization strategy,ECMS)能通過選取合適的等效系數(shù)來獲取較為理想的節(jié)油效果[2-5],然而ECMS通常只針對(duì)特定的工況進(jìn)行優(yōu)化,Gong等[1]驗(yàn)證了ECMS對(duì)復(fù)雜行駛工況的優(yōu)化效果欠佳的缺點(diǎn),并將駕駛風(fēng)格識(shí)別方法與ECMS結(jié)合,根據(jù)不同駕駛風(fēng)格調(diào)整等效燃油系數(shù),實(shí)現(xiàn)了需求功率的合理分配.
對(duì)于全局優(yōu)化策略以及基于工況自適應(yīng)的能量管理策略,前者一般可以采用動(dòng)態(tài)規(guī)劃算法或龐特里亞金極小值原理獲得理論最優(yōu)解[6-9],但動(dòng)態(tài)規(guī)劃算法計(jì)算負(fù)荷較大,且兩種方法均須要預(yù)知行駛工況,難以應(yīng)用于實(shí)車控制;后者通常利用設(shè)備采集一段歷史時(shí)間內(nèi)的車速、加速度等工況信息,通過對(duì)得到的工況信息進(jìn)行分析來預(yù)測(cè)未來行駛工況,根據(jù)預(yù)測(cè)結(jié)果實(shí)時(shí)調(diào)整控制策略中的相關(guān)參數(shù),從而實(shí)現(xiàn)工況自適應(yīng)控制[10].此外,越來越多的研究人員將機(jī)器學(xué)習(xí)應(yīng)用于能量管理策略的制定中,Liu等[11]用馬爾可夫方法對(duì)行駛工況進(jìn)行識(shí)別后,利用強(qiáng)化學(xué)習(xí)算法實(shí)現(xiàn)了需求功率的分配.宋大鳳等[12]采用誤差反向傳播(Back propagation,BP)神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)動(dòng)態(tài)規(guī)劃的優(yōu)化結(jié)果并制定相應(yīng)的策略,在達(dá)到近似最優(yōu)效果的同時(shí),大幅提高了運(yùn)算速度.
基于以上研究,本文將行駛工況類別作為瞬態(tài)變量并建立工況識(shí)別模型,以燃油消耗量最小為目標(biāo),采用動(dòng)態(tài)規(guī)劃算法對(duì)載貨汽車在四種典型工況下功率的分配進(jìn)行全局優(yōu)化,利用BP神經(jīng)網(wǎng)絡(luò)對(duì)動(dòng)態(tài)規(guī)劃優(yōu)化的結(jié)果進(jìn)行學(xué)習(xí),得到各典型工況對(duì)應(yīng)的基于神經(jīng)網(wǎng)絡(luò)的控制策略,當(dāng)車輛行駛時(shí),通過工況識(shí)別模型對(duì)行駛工況進(jìn)行識(shí)別,根據(jù)工況所屬的類別采用相應(yīng)的控制策略對(duì)需求功率進(jìn)行分配,從而達(dá)到工況自適應(yīng)控制的目的,仿真結(jié)果驗(yàn)證了所提策略的有效性.
本文以某款研發(fā)中的混聯(lián)式混合動(dòng)力載貨汽車作為研究對(duì)象,其動(dòng)力系統(tǒng)結(jié)構(gòu)如圖1所示,動(dòng)力系統(tǒng)主要由柴油發(fā)動(dòng)機(jī)、驅(qū)動(dòng)電機(jī)MG1、發(fā)電機(jī)MG2、電池組及前行星排PG1、后行星排PG2等部件構(gòu)成,控制器局域網(wǎng)絡(luò)(Controller area network,CAN)總線用于實(shí)現(xiàn)電池管理系統(tǒng)(Battery management system,BMS)與發(fā)動(dòng)機(jī)控制單元(Engine control unit,ECU)、電機(jī)控制器間的通信連接,ECU通過對(duì)發(fā)動(dòng)機(jī)與電機(jī)的轉(zhuǎn)速轉(zhuǎn)矩進(jìn)行控制達(dá)到整車驅(qū)動(dòng)控制的目的,系統(tǒng)主要部件參數(shù)如表1所示.
圖1 行星混聯(lián)系統(tǒng)構(gòu)型
表1 整車參數(shù)
柴油發(fā)動(dòng)機(jī)是該混合動(dòng)力系統(tǒng)的關(guān)鍵部件,利用臺(tái)架試驗(yàn)數(shù)據(jù)建立其油耗數(shù)值模型,油耗mfuel是關(guān)于發(fā)動(dòng)機(jī)轉(zhuǎn)速ωe和轉(zhuǎn)矩Te的函數(shù):
mfuel=f(ωe,Te)
(1)
該發(fā)動(dòng)機(jī)的萬有特性曲線如圖2所示,圖中藍(lán)色虛線為發(fā)動(dòng)機(jī)的最優(yōu)工作曲線.最優(yōu)曲線中,發(fā)動(dòng)機(jī)轉(zhuǎn)速與輸出功率的數(shù)值關(guān)系如圖3所示.
圖2 發(fā)動(dòng)機(jī)萬有特性曲線
圖3 發(fā)動(dòng)機(jī)最優(yōu)工作曲線
該混合動(dòng)力系統(tǒng)配備有兩個(gè)電機(jī),分別是主驅(qū)動(dòng)電機(jī)MG1,發(fā)電機(jī)MG2,電機(jī)與控制器配合達(dá)到驅(qū)動(dòng)或發(fā)電的目的,電機(jī)電功率的表達(dá)式為:
Pm=ηmTmωmPg=ηgTgωg
(2)
式(2)中:Pm、Tm、ωm和ηm分別是驅(qū)動(dòng)電機(jī)的電功率、轉(zhuǎn)矩、轉(zhuǎn)速和工作效率;Pg、Tg、ωg和ηg分別是發(fā)電機(jī)的電功率、轉(zhuǎn)矩、轉(zhuǎn)速和工作效率.
動(dòng)力電池是混合動(dòng)力系統(tǒng)中重要的儲(chǔ)能部件,采用歐姆內(nèi)阻等效電路模型對(duì)其工作狀態(tài)進(jìn)行描述.電池內(nèi)阻Rbat、電池內(nèi)電流Ibat以及開路電壓Ubat存在以下關(guān)系:
(3)
式(3)中:Pbat為電池輸出功率;ηg、ηm為驅(qū)動(dòng)電機(jī)和發(fā)電機(jī)的工作效率;μg、μm的取值取決于電池的充放電狀態(tài),當(dāng)μg、μm取值為1時(shí)為發(fā)電狀態(tài),當(dāng)μg、μm取值為-1時(shí)為放電狀態(tài).
當(dāng)電池的初始荷電狀態(tài)SOC0與電池總?cè)萘縌bat已知時(shí),任意時(shí)刻的電池荷電狀態(tài)SOCt便可由式(4)計(jì)算得到:
(4)
實(shí)際行駛工況具有不確定性,駕駛員在不同工況下對(duì)油門踏板和制動(dòng)踏板的操作差異會(huì)間接影響車輛的節(jié)油表現(xiàn).因此,將車輛所處的工況類別作為一種瞬態(tài)變量,對(duì)行駛工況作出準(zhǔn)確地識(shí)別后采取與之匹配的控制策略,以此進(jìn)一步開發(fā)混合動(dòng)力載貨汽車的節(jié)油潛力.
典型的行駛工況可以根據(jù)駕駛員所處的道路條件和交通密度分成四種:擁堵工況、城市工況、郊區(qū)工況,高速工況[13].常見的工況特征有平均車速、最高車速、最高加速度以及怠速時(shí)間比等62種[14-15].參照文獻(xiàn)[16],本文選取平均車速vmean和怠速時(shí)間比ri作為行駛工況識(shí)別的特征參數(shù).
本文采用反向傳播神經(jīng)網(wǎng)絡(luò)建立行駛工況識(shí)別模型,選取四種典型行駛工況作為工況識(shí)別模型的訓(xùn)練樣本,典型行駛工況的車速信息如圖4所示.
圖4 四種典型行駛工況
考慮到工況識(shí)別應(yīng)具有實(shí)時(shí)性,但車輛驅(qū)動(dòng)模式不宜頻繁切換,因此將工況識(shí)別周期設(shè)定為150 s,識(shí)別結(jié)果更新周期為3 s[17].在車輛運(yùn)行時(shí)的任意時(shí)刻t,通過采集設(shè)備獲取[t-150 s,t]時(shí)間內(nèi)的歷史車速信息,根據(jù)采集得到的車速信息計(jì)算特征參數(shù),將特征參數(shù)輸入至訓(xùn)練好的行駛工況識(shí)別模型中,即時(shí)輸出當(dāng)前工況所屬的工況類別.
混合動(dòng)力系統(tǒng)的最優(yōu)化能量管理實(shí)質(zhì)上是具有多個(gè)約束條件的多階段控制問題,相較于其它優(yōu)化算法,基于Bellman最優(yōu)原理的動(dòng)態(tài)規(guī)劃算法更適用于求解多階段決策最優(yōu)化問題.因此本文以燃油消耗最小為優(yōu)化目標(biāo),采用動(dòng)態(tài)規(guī)劃算法對(duì)典型工況下混合動(dòng)力載貨汽車功率分配問題進(jìn)行優(yōu)化,從而實(shí)現(xiàn)車輛驅(qū)動(dòng)需求功率在發(fā)動(dòng)機(jī)功率與電池功率間的最優(yōu)分配,車輛驅(qū)動(dòng)需求功率Preq的表達(dá)式為:
Preq=Peηe+Pbatηbat
(5)
式(5)中:Pe發(fā)動(dòng)機(jī)輸出功率,ηe為發(fā)動(dòng)機(jī)到車輪的傳動(dòng)效率,ηbat為動(dòng)力電池的工作效率.
將循環(huán)工況離散成N個(gè)階段,根據(jù)循環(huán)工況的目標(biāo)車速計(jì)算得出每一階段車輛驅(qū)動(dòng)需求功率后,通過控制電池輸出功率的大小調(diào)節(jié)發(fā)動(dòng)機(jī)的工作區(qū)間,使其工作于最優(yōu)工作曲線上,從而提高燃油經(jīng)濟(jì)性,因此選取電池功率Pbat作為全局優(yōu)化控制的決策變量uk,選取電池SOC作為控制系統(tǒng)的狀態(tài)變量xk.在離散時(shí)域中,系統(tǒng)的狀態(tài)轉(zhuǎn)移函數(shù)可通過式(6)描述:
xk+1=f(xk,uk)
(6)
本文選取燃油消耗量為控制系統(tǒng)的優(yōu)化目標(biāo),因此,全局優(yōu)化的目標(biāo)函數(shù)為:
(7)
式(7)中:J為全局優(yōu)化過程中燃油消耗總成本;costbe(xk,uk)為優(yōu)化過程中某一階段發(fā)動(dòng)機(jī)的燃油消耗成本.
基于動(dòng)態(tài)規(guī)劃算法的優(yōu)化原理,逆向求解得到各階段、各狀態(tài)的最小狀態(tài)轉(zhuǎn)移成本和對(duì)應(yīng)的最優(yōu)控制量,從而將一個(gè)多階段優(yōu)化問題分解成一系列單步優(yōu)化問題.其中,第N階段與第k(0≤k (8) (9) 為提升動(dòng)態(tài)規(guī)劃算法的求解效率,并確保優(yōu)化過程中混合動(dòng)力系統(tǒng)是平穩(wěn)運(yùn)行的,需要對(duì)系統(tǒng)中各部件的工作狀態(tài)進(jìn)行約束.此外,為實(shí)現(xiàn)電池電量平衡,以及防止電池放電深度過大,需要對(duì)電池SOC進(jìn)行限制[19].控制系統(tǒng)相應(yīng)的物理約束條件如下: (10) 式(10)中:SOCmax、SOCmin為電池荷電狀態(tài)的最大值與最小值;Pbat_max、Pbat_min分別是電池功率的最大值、最小值;Pe_maxPe_min、 分別是發(fā)動(dòng)機(jī)最優(yōu)工作曲線上功率的最大值與最小值. 在約束條件下逆向計(jì)算得到各階段、各狀態(tài)的最小狀態(tài)轉(zhuǎn)移成本函數(shù)和相應(yīng)的最優(yōu)控制量后,系統(tǒng)狀態(tài)的最優(yōu)控制序列和相應(yīng)的最優(yōu)轉(zhuǎn)移路徑就可以通過正向?qū)?yōu)的方法獲得. 為保持電量平衡,將電池SOC的初始值與終值均設(shè)定為0.8,采用動(dòng)態(tài)規(guī)劃算法分別對(duì)該貨車在四種典型工況下功率的分配方式進(jìn)行優(yōu)化求解.其中,動(dòng)態(tài)規(guī)劃求解高速工況時(shí),電池SOC、驅(qū)動(dòng)需求功率、發(fā)動(dòng)機(jī)輸出功率以及電池輸出功率的優(yōu)化結(jié)果如圖5所示.從需求功率、發(fā)動(dòng)機(jī)功率和電池功率的優(yōu)化結(jié)果可以看出,基于動(dòng)態(tài)規(guī)劃算法的全局優(yōu)化控制能夠?qū)π枨蠊β蔬M(jìn)行合理的分配,使混合動(dòng)力系統(tǒng)在純電動(dòng)、聯(lián)合驅(qū)動(dòng)、制動(dòng)能量回收等多個(gè)工作模式之間靈活切換,以此達(dá)到降低燃油消耗的目的. 圖5 高速工況動(dòng)態(tài)規(guī)劃結(jié)果 由于動(dòng)態(tài)規(guī)劃算法須預(yù)知整個(gè)行駛工況的車速信息,并且其求解過程存在維數(shù)災(zāi)難,因此該方法難以應(yīng)用于實(shí)車控制器中[20].為將動(dòng)態(tài)規(guī)劃的優(yōu)化結(jié)果進(jìn)行應(yīng)用,采用BP神經(jīng)網(wǎng)絡(luò)對(duì)動(dòng)態(tài)規(guī)劃得到最優(yōu)功率分配數(shù)據(jù)進(jìn)行學(xué)習(xí),將四種典型工況優(yōu)化數(shù)據(jù)作為樣本訓(xùn)練相應(yīng)的神經(jīng)網(wǎng)絡(luò)模型,分別得到適應(yīng)于四種典型工況的控制策略,該控制策略的框架如圖6所示,將電池SOC、需求車速以及需求功率作為神經(jīng)網(wǎng)絡(luò)的輸入,輸出為電池功率. 圖6 基于神經(jīng)網(wǎng)絡(luò)的控制策略框架 分別選取70%、15%和15%的比例隨機(jī)分配樣本數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的訓(xùn)練、測(cè)試和驗(yàn)證樣本,設(shè)定神經(jīng)網(wǎng)絡(luò)中隱藏神經(jīng)元個(gè)數(shù)為10個(gè),采用Levenberg-Marquardt算法對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練.為驗(yàn)證基于神經(jīng)網(wǎng)絡(luò)的控制策略的有效性,將含有多種工況片段的中國重型汽車能耗工況C-WTVC的動(dòng)態(tài)規(guī)劃結(jié)果作為樣本訓(xùn)練神經(jīng)網(wǎng)絡(luò),制定適應(yīng)于C-WTVC工況的控制策略.動(dòng)態(tài)規(guī)劃優(yōu)化與基于神經(jīng)網(wǎng)絡(luò)的控制策略的仿真結(jié)果如表2所示,與動(dòng)態(tài)規(guī)劃優(yōu)化結(jié)果相比,基于神經(jīng)網(wǎng)絡(luò)的控制策略顯著提高了求解速度,且油耗僅增加2.7%.動(dòng)態(tài)規(guī)劃優(yōu)化與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的電池SOC、電池功率對(duì)比如圖7和圖8所示,從圖7和圖8可以看出,采用兩種控制策略時(shí)電池的輸出功率基本一致,兩者電池SOC變化軌跡及其趨勢(shì)也基本一致,兩種控制策略均能保持SOC的平穩(wěn)和電量的平衡,由此證明采用神經(jīng)網(wǎng)絡(luò)建立的控制策略是有效可行的.因此,采用上述方法分別建立適應(yīng)于擁堵、城市、郊區(qū)和高速工況的控制策略,并存儲(chǔ)到離線策略庫中. 表2 動(dòng)態(tài)規(guī)劃優(yōu)化和神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)的優(yōu)化結(jié)果 圖7 兩種策略的電池SOC對(duì)比 圖8 兩種策略的電池功率對(duì)比 本文所制定的能量管理策略是將工況識(shí)別方法、動(dòng)態(tài)規(guī)劃算法和基于BP神經(jīng)網(wǎng)絡(luò)的離線策略庫相結(jié)合,該能量管理策略流程如圖9所示,具體流程如下: (1)對(duì)四種典型工況選取適當(dāng)?shù)奶卣鲄?shù),訓(xùn)練用于工況識(shí)別的神經(jīng)網(wǎng)絡(luò)模型. (2)采用動(dòng)態(tài)規(guī)劃算法對(duì)四種典型工況進(jìn)行優(yōu)化,獲取不同工況下相應(yīng)的需求功率最優(yōu)分配數(shù)據(jù);利用神經(jīng)網(wǎng)絡(luò)對(duì)全局最優(yōu)的優(yōu)化結(jié)果進(jìn)行學(xué)習(xí),制定擁堵工況、城市工況、郊區(qū)工況、高速工況相應(yīng)的基于神經(jīng)網(wǎng)絡(luò)的控制策略,并納入離線策略庫. (3)車輛運(yùn)行時(shí),通過工況識(shí)別模型識(shí)別當(dāng)前的工況類型,根據(jù)工況所屬類別從離線策略庫中選擇相應(yīng)的基于神經(jīng)網(wǎng)絡(luò)的控制策略,從而對(duì)混合動(dòng)力貨車的能量分配進(jìn)行實(shí)時(shí)優(yōu)化. 圖9 能量管理策略控制流程 為驗(yàn)證本文所提策略的有效性,將一段隨機(jī)工況作為仿真工況,再分別采用未進(jìn)行工況識(shí)別的C-WTVC工況神經(jīng)網(wǎng)絡(luò)控制策略以及基于工況識(shí)別的能量管理策略對(duì)隨機(jī)工況進(jìn)行仿真并對(duì)比二者結(jié)果.隨機(jī)工況的車速信息及工況識(shí)別結(jié)果如圖10、11所示.圖11中1、2、3、4分別代表擁堵、城市、郊區(qū)和高速工況. 圖10 隨機(jī)工況 未進(jìn)行工況識(shí)別的控制策略和基于工況識(shí)別的能量管理策略仿真所用時(shí)長(zhǎng)分別為266 s和274 s,二者用時(shí)十分接近.此外,采用工況識(shí)別前和采用工況識(shí)別后的發(fā)動(dòng)機(jī)工作點(diǎn)分布對(duì)比如圖12所示,相比采取工況識(shí)別前,采用基于工況識(shí)別的能量管理策略后發(fā)動(dòng)機(jī)工作于1 000~1 800 r/min的經(jīng)濟(jì)轉(zhuǎn)速區(qū)間的比例由81.1%提升至89.8%,發(fā)動(dòng)機(jī)處于高負(fù)荷的工作時(shí)間的比例也有了一定降低,由此表明發(fā)動(dòng)機(jī)能更多處于其更高效的工作區(qū)進(jìn)行動(dòng)力輸出. 圖11 工況識(shí)別結(jié)果 圖12 采用工況識(shí)別前和工況識(shí)別后的 發(fā)動(dòng)機(jī)工作點(diǎn)分布對(duì)比 采用工況識(shí)別前和采用工況識(shí)別后的油耗電池SOC對(duì)比如圖13、14所示,未采用工況識(shí)別的能量管理策略總?cè)加拖牧繛?.87 L,百公里綜合油耗為18.23 L;基于工況識(shí)別的能量管理策略總?cè)加拖牧繛?.69 L,百公里油耗為17.09 L,總?cè)加拖牧拷档土?.25%.從圖14中可以得出,采用未進(jìn)行工況識(shí)別的能量管理策略時(shí),動(dòng)力電池放電深度為0.16,SOC的初值與終值分別為0.80、0.84;采用基于工況識(shí)別的能量管理策略時(shí)動(dòng)力電池放電深度為0.11,SOC的初值與終值分別為0.80、0.79.由此表明:基于工況識(shí)別的能量管理策略具有更好的放電深度和保持電量平衡的能力. 圖13 工況識(shí)別前和工況識(shí)別后的油耗對(duì)比 圖14 工況識(shí)別前和工況識(shí)別后的SOC對(duì)比 綜上所述,基于工況識(shí)別的能量管理策略能夠根據(jù)當(dāng)前行駛工況的類別與需求功率的變化,實(shí)時(shí)采取相應(yīng)的控制策略對(duì)驅(qū)動(dòng)需求功率進(jìn)行削峰填谷,合理地切換混合動(dòng)力系統(tǒng)的工作模式,控制發(fā)動(dòng)機(jī)的開關(guān)機(jī)狀態(tài)及工作區(qū)間,有效提高了混合動(dòng)力貨車的燃油經(jīng)濟(jì)性能. 本文以一款混聯(lián)式混合動(dòng)力載貨汽車為研究對(duì)象,提出基于行駛工況識(shí)別的能量管理策略,主要結(jié)論如下: (1)以燃油消耗最小為目標(biāo),采用動(dòng)態(tài)規(guī)劃算法對(duì)四種典型工況的功率分配進(jìn)行全局優(yōu)化,獲得每種工況的全局最優(yōu)結(jié)果. (2)為解決動(dòng)態(tài)規(guī)劃算法存在的問題,分別制定了適應(yīng)于四種典型工況的基于神經(jīng)網(wǎng)絡(luò)的控制策略,在此基礎(chǔ)上,結(jié)合工況識(shí)別方法,根據(jù)實(shí)時(shí)識(shí)別工況所屬類別,采用相應(yīng)的控制策略對(duì)整車驅(qū)動(dòng)所需功的分配進(jìn)行實(shí)時(shí)優(yōu)化,達(dá)到減少燃油消耗的目的. (3)采用本文提出的能量管理策略對(duì)一段隨機(jī)工況進(jìn)行仿真運(yùn)算,結(jié)果表明:相對(duì)于工況識(shí)別前的控制策略,基于行駛工況識(shí)別的能量管理策略能更好地將驅(qū)動(dòng)需求功率在動(dòng)力源之間進(jìn)行分配,在保持電池電量平衡與電池SOC穩(wěn)定的同時(shí),整車燃油消耗降低了6.25%,驗(yàn)證了所提策略的有效性.3.2 全局優(yōu)化結(jié)果
3.3 基于神經(jīng)網(wǎng)絡(luò)的控制策略
4 仿真分析
4.1 能量管理策略流程
4.2 仿真及結(jié)果分析
5 結(jié)論