張瑞軒,黃 晨,王猛猛
(北京林業(yè)大學工學院,北京 100083)
隨著全球人口的不斷增多,石油的需求和成本不斷增加[1],由于石油使用造成空氣污染和溫室氣體,傳統(tǒng)燃油車面臨淘汰。為了應對能源危機,同時實現(xiàn)“碳中和”,出現(xiàn)了電動汽車(EV)、混合動力汽車(HEV)、燃料電池汽車(FEV)等新能源汽車。與純電動汽車相比,混合動力汽車有著更長的續(xù)航里程,與傳統(tǒng)燃油車相比,混合動力汽車有著更好的燃油經(jīng)濟性。同時混合動力汽車也具有較好的經(jīng)濟性[2],因此可以作為傳統(tǒng)燃油車向純電動汽車過渡可靠的產(chǎn)品[3]。
混合動力汽車可以通過控制電機、發(fā)動機進行轉(zhuǎn)矩分配,使得發(fā)動機一直位于高效點工作,實現(xiàn)油耗的降低。能量管理策略對于節(jié)能減排起著重要的作用,可以通過滿足功率需求,設(shè)置不同工況模式,采用算法預測形式環(huán)境等管理策略,來延長電池的使用壽命,減少燃料(電能)消耗,提高續(xù)航里程。
本文從汽車能量管理的基本概念出發(fā),闡述各種混合動力汽車能量管理的分類及意義,對最近幾年所提出的能量管理策略的研究成果進行全面系統(tǒng)地梳理,從不同角度呈現(xiàn)其未來的研究方向,對未來能量管理策略具有一定的參考意義。
“能量管理策略”指利用高水平控制算法,以決定產(chǎn)生合適的功率流在不同動力源之間的功率分流[4]。能量管理策略是在整車水平的控制系統(tǒng)中執(zhí)行,通過伺服閉環(huán)控制系統(tǒng),來協(xié)調(diào)整車的動力總成,以滿足某些性能目標。HEV是指由兩種及以上的動力源混合驅(qū)動的汽車。能量管理策略通過綜合考慮電源荷電狀態(tài)(State of Charge,SOC)、車輛轉(zhuǎn)矩需求、發(fā)動機性能和工況等因素,控制發(fā)動機和電動機的協(xié)調(diào)運行[5],實現(xiàn)兩個動力源輸出功率的合理分配??梢詫崿F(xiàn)提高能量利用率、延長動力源壽命、提高車輛動力學性和穩(wěn)定性。
插電式混合動力汽車(Plug-in hybrid electric vehicle,PHEV)有三種工作模式:發(fā)動機模式、純電動模式、兩者混合協(xié)同模工作式,根據(jù)電池充放電的方式不同,汽車的運行狀態(tài)可分為電量消耗、電量維持和混合運行三種模式。
目前混合動力汽車能量管理策略可分為三類,分別是基于規(guī)則的能量管理策略、基于優(yōu)化的能量管理策略、基于學習的管理策略,如圖1所示?;谝?guī)則的管理策略簡單易行,但較為死板,不能實現(xiàn)最優(yōu)控制;基于優(yōu)化的能量管理策略分為基于預測工況全局優(yōu)化的能量管理策略、基于瞬時工況自適應的管理策略[6-7]兩種類型。全局優(yōu)化的管理策略可以最大限度發(fā)揮性能,但因計算量大、計算復雜而受到限制;瞬時優(yōu)化管理策略可以根據(jù)駕駛員狀態(tài)以及工況,實時進行調(diào)整。隨著對于智能駕駛的深入研究,基于深度強化學習的能量管理策略也被提出,可以隨著訓練,對控制策略不斷優(yōu)化更新[8]。
圖1 混合動力汽車能量管理策略分類圖
基于規(guī)則的能量管理策略是最早研究、目前廣泛應用的能量控制策略,主要分為簡單規(guī)則能量管理策略和基于模糊規(guī)則能量管理策略。
2.1.1 簡單規(guī)則控制策略
簡單規(guī)則控制策略是以關(guān)鍵部件的穩(wěn)態(tài)效率圖為依據(jù),根據(jù)油門踏板開度與開度變化率,確定需求功率,再結(jié)合車速、發(fā)動機轉(zhuǎn)速、SOC等狀態(tài)輸入確定相應的輸出變量。
Banvait[9]、Zhang[10]等以電池SOC作為模式切換參數(shù),控制車輛在電量消耗模式(charging of depleting,CD)和電量維持模式(charging of sustain,CS)切換,CD模式中電機為主要動力源,若所需轉(zhuǎn)矩過大,啟動發(fā)動機。周能輝[11]等以加速踏板開度為模式切換參數(shù),分為多個運行階段,結(jié)合功率需求和SOC調(diào)整模式切換參數(shù)。
簡單規(guī)則控制策略計算量小、容易實現(xiàn),但十分依賴經(jīng)驗數(shù)據(jù),若切換參數(shù)設(shè)置不合理,則無法合理分配能量,效果變差。
2.1.2 模糊規(guī)則控制策略
針對簡單規(guī)則控制策略依賴單一數(shù)值作為閾值,不能時刻精確控制的缺點,模糊邏輯控制將明確數(shù)字經(jīng)過隸屬度函數(shù)模糊化成滿足度指標,然后通過一系列模糊規(guī)則或者專家知識庫的推理和聚集計算出系統(tǒng)輸出。模糊規(guī)則控制策略,可以更好的針對控制模式之間的過渡區(qū)控制[12]。
LI[13]等提出了基于多個模糊邏輯控制器的能量管理策略,該策略首先根據(jù)電池SOC和電池端電壓確定電池工作狀態(tài),再根據(jù)電池工作狀態(tài)和所需功率確定發(fā)動機的目標輸出功率,還有發(fā)動機組的部控制;黃稟通[14]等根據(jù)整車需求轉(zhuǎn)矩和電池SOC作為模糊控制規(guī)則,并利用遺傳算法進行優(yōu)化,最終得到油耗及排放綜合最小化;于瑞廣[15]等基于發(fā)動機效率建立了模糊邏輯控制器,使用神經(jīng)網(wǎng)絡模型對模糊邏輯控制器的隸屬度函數(shù)進行學習,通過變尺度優(yōu)化方法的改進型學習算法不斷修正,降低了輸出轉(zhuǎn)矩的誤差。
模糊規(guī)則控制策略算法相對簡單,易于實現(xiàn),實時性強。但是規(guī)則的設(shè)定非常依賴設(shè)計者,無法完全發(fā)揮混合動力汽車的節(jié)能優(yōu)勢。
瞬時優(yōu)化策略以瞬時目標最大化和最小化,合理地分配發(fā)動機以及電機的功率,使得發(fā)動機處于最佳工作區(qū)間,實現(xiàn)瞬時油耗最小。目前主要包括基于等效燃油消耗最小控制策略(equivalent consumption minimization Strategy,ECMS)和基于極小值原理控制策略(Pontryagin’s minimum principle,PMP)。
2.2.1 基于等效燃油消耗最小控制策略
基于等效燃油消耗最小控制策略的實質(zhì),是通過實時計算發(fā)動機和電機在不同功率輸出下車輛性能,綜合確定最佳功率輸出分配。
TULPULE[16]等針對PEHV,提出了一定工況下ECMS能量管理策略,將電池瞬時消耗量等效成燃油消耗量,與發(fā)動機瞬時燃油消耗量求和為優(yōu)化目標,以電池SOC為變量,分配電機、發(fā)動機輸出功率,優(yōu)化后油耗大幅降低。劉星[17]提出了針對于多工況的模糊自適應瞬時優(yōu)化能量管理策略,在不同工況保證燃油經(jīng)濟性的同時有效的電池SOC,提高了其適應不同工況的魯棒性。He[18]等將ECMS與自適應的方法相結(jié)合,提出了基于工況識別的自適應等效燃油消耗最小控制策略(Adaptive-ECMS),提升了算法對多種工況的適應度。Khayyer[19]等通過傳感器獲取行駛距離并以60 s為周期預估車速,將這些信號用于等效系數(shù)的調(diào)整,從而獲得了Adaptive-ECMS。
2.2.2 基于極小值原理控制策略
Hamilton函數(shù)是關(guān)于控制變量的函數(shù),基于極小值原理控制策略通過求取每個時刻Hamilton函數(shù)的最小值,獲取最佳控制變量。PMP可看作以Hamilton函數(shù)為優(yōu)化目標的瞬時優(yōu)化能量管理策略[20]。
TRIBIOLI[21]等對于不同工況采用PMP進行優(yōu)化,運用回歸分析方法分析優(yōu)化結(jié)果,提取可用規(guī)則,并應用于整車能量管理。Hou[22]等提出了一種近似最小值方法,基于發(fā)動機燃油效率線性片段擬合的瞬時Hamilton最優(yōu)化問題可以簡化為凸優(yōu)化問題,可以在汽車控制器中實現(xiàn)工程應用。隗寒冰[23]等基于PMP引入電池充放電等效因子和SCR溫升速率權(quán)重因子,提出SCR起燃時間最短策略和油耗與排放多目標綜合優(yōu)化控制策略,PMP具有較小的計算復雜度,但是計算量過大,難以實時實現(xiàn),需要建立合理簡化的整車模型,在選取適當?shù)刃禂?shù)和協(xié)同因子后,獲得近似全局最優(yōu)管理策略。
基于全局優(yōu)化的能量控制策略是針對已知的循環(huán)工況,應用最優(yōu)控制理論,動態(tài)的去分配發(fā)動機、電動機能量,使整車性能達到最佳狀態(tài)。采取的優(yōu)化算法主要包括動態(tài)規(guī)劃算法(Dynamic programming,DP)、凸優(yōu)化算法、遺傳算法等。
2.3.1 動態(tài)規(guī)劃算法控制策略
動態(tài)規(guī)劃算法是最具代表性、最廣泛的全局優(yōu)化控制策略,是將問題分解為一系列子問題,將問題離散化并求解,合并子問題的解得出結(jié)果。
張博[24]等針對不同形式里程下控制策略,進行DP全局優(yōu)化,得到動力總成在典型循環(huán)工況下以及不同行駛里程下的最佳控制策略。YU[25]等針對具有多種儲能系統(tǒng)的混合動力汽車,考慮各子系統(tǒng)的效率,采用動態(tài)規(guī)劃實現(xiàn)了固定工況下系統(tǒng)效率全局最優(yōu),并保持各系統(tǒng)平衡。針對電量維持型動力電池,Pérez L V[26]等在目標函數(shù)中引入了懲罰函數(shù),防止SoC在計算過程中超出約束邊界。
DP 是求解多階段決策過程最優(yōu)化的數(shù)學方法,將問題離散化,選取合適變量,可以求解給定工況下最佳控制策略,但是計算量較大,不能用于實時控制策略之中。
2.3.2 凸優(yōu)化算法控制策略
凸優(yōu)化是求解凸集合的最優(yōu)化算法,凸優(yōu)化問題具有局部最優(yōu)解一定是全局最優(yōu)解的性質(zhì),因此可以簡化計算過程[27]。針對 PHEV 能量管理策略問題,凸優(yōu)化可以將復雜的非線性問題轉(zhuǎn)為半定問題,極大地減少運算時間,提高算法的實時性能。
NAFISI[28]等考慮了電網(wǎng)對PHEV能量管理的影響,提出了一種基于凸優(yōu)化算法的的兩級優(yōu)化法,可以減小能量損失。MURGOVSKI N[29]等將發(fā)動機起動控制作為到 PHEV 能量管理的參數(shù),并合理簡化為凸優(yōu)化問題采用凸優(yōu)化方法實現(xiàn)能量管理策略、發(fā)動機起停的綜合優(yōu)化,能較高效地完成計算。
該算法目標函數(shù)必須是凸函數(shù),約束條件為凸形式,具有一定限制性。將越多因素考慮到能量管理策略中,并轉(zhuǎn)化為合理的凸優(yōu)化模型,可以得到較好的能量管理策略。
每種控制策略和算法都有其優(yōu)勢以及局限性,利用兩種甚至多種控制策略,實現(xiàn)優(yōu)勢互補,組成混合能量管理控制策略。曾繁琦等綜合規(guī)則能量管理策略和瞬時優(yōu)化能量管理策略,首先對規(guī)則能量管理策略進行優(yōu)化,將懲罰函數(shù)引入等效能量最小策略,改善的燃油經(jīng)濟性并維持動力電池SOC,既能保持規(guī)則控制策略的控制性,也能實現(xiàn)實施優(yōu)化策略的實用性。
隨著人工智能技術(shù)的逐漸發(fā)展,基于學習能量管理策略逐漸興起。深度學習通過組合低層特征形成更加抽象的高層表示屬性類別或特征,再結(jié)合強化學習決策優(yōu)勢,解決復雜能量管理問題。深度強化學習可以解讀為:“深度”是指深度學習,“強化”表示不斷訓練,“學習” 意味著對管理策略不斷優(yōu)化。
Liu T[30]等提出了基于Q-learning和Dyna算法的HEV自適應能量管理策略,并且測試結(jié)果優(yōu)于傳統(tǒng)能量控制策略。谷歌近期提出了深度確定性策略梯度算法[31](Deep Deterministic Policy Gradient,DDPG)解決了執(zhí)行連續(xù)性動作的控制問題,同時大幅提升算法收斂速度和控制效果。相信隨著人工智能的發(fā)展,將會有越來越多的深度強化學習能量管理策略出現(xiàn)。
未來對于駕駛信息的獲取將更為重視,將會有兩種途徑獲取駕駛信息。第一種是基于實時數(shù)據(jù)和數(shù)學模型對未來駕駛信息進行預測,LIESSNER R[32]等基于馬爾科夫鏈和聚類算法對交通信息和駕駛風格中的一系列數(shù)據(jù)進行分析,并生成替換周期,預測了后期的行駛工況數(shù)據(jù)。連靜[33]等提出基于駕駛意圖識別的非線性自回歸神經(jīng)網(wǎng)絡車速預測方法,并基于車速預測的提出邏輯動態(tài)模型預測控制策略,可以預測未來行駛工況并輸出需求功率。實際駕駛環(huán)境中,也會受到天氣變化,交通狀況等多種外界條件影響,需進一步改進,提高預測精度。
第二種是利用車輛導航系統(tǒng)(GPS)、地理信息系統(tǒng)(GIS)、車聯(lián)網(wǎng)技術(shù)(V2X)和智能交通系統(tǒng)(ITS)等獲取交通信息。汽車將通過探測數(shù)據(jù)以及交通信息,進行一個最佳SOC規(guī)劃,實時調(diào)整控制策略。KAMAL[34]等提出了基于智能交通系統(tǒng)的預測方法,通過智能交通系統(tǒng)獲取前車工況、交通信號及道路坡度等信息,將這些信息融合并計算車輛的最佳控制輸入。SUN[35]等提出了結(jié)合交通信息的預測能量管理策略,基于實時交通信息進行最佳SOC規(guī)劃,結(jié)果表明該方法可獲得與DP近似的燃油濟性。越來越多的研究者將 GPS 與各種能量管理策略相結(jié)合,提高能量管理效率,如Ramadan等將GPS與規(guī)則控制策略進行融合。同時未來將在車-路-人-網(wǎng)-環(huán)境-基礎(chǔ)設(shè)施之間,進行無線通信和信息交換,形成車聯(lián)網(wǎng)智能化網(wǎng)絡[36]。有了這些技術(shù)的加持,能量管理策略將會更加完善。
不過目前車聯(lián)網(wǎng)的發(fā)展還不完善,導航信息仍有缺失以及缺乏實時性,同時道路交通情況復雜,這些仍制約著基于交通信息能量管理策略的發(fā)展。
本文介紹了能量管理的基本概念,結(jié)合HEV能量管理策略發(fā)展現(xiàn)狀,對最近幾年提出的有代表性的HEV能量管理策略進行了收集和整理,并分類綜述,有啟發(fā)和參考意義?;谝?guī)則的能量管理策略,按照規(guī)則進行能量分配,計算簡單,但效果較差;基于優(yōu)化的管理策略,效果較好,但是算法較為復雜,且難以實現(xiàn)實時運算調(diào)整,需要合理簡化算法,在確保高精度的同時實現(xiàn)實時應用能力。混合動力汽車的能量管理策略正向?qū)崟r性與優(yōu)化性同時滿足發(fā)展著,混合能量管理策略融合不同種類管理策略優(yōu)點;深度強化學習管理策略可以增強算法的優(yōu)化能力;駕駛信息管理策略可以提高算法優(yōu)化潛力。
未來能量管理策略,將融合多維度信息,不斷優(yōu)化算法,以實現(xiàn)最優(yōu)能量管理策略。筆者認為,下一步的研究工作可以參考以下兩方面:
(1)車輛行駛狀態(tài)信息的獲?。嚎梢酝ㄟ^車輛多個維度的行駛狀態(tài)信息的獲取,更加精確地得知車輛行駛狀態(tài),并進行準確的預測。獲得的行駛狀態(tài)信息越多,對于車輛行駛狀態(tài)的預測越準確,能量管理策略越完善。
(2)優(yōu)化算法:一個好的算法應具有較低的時間復雜度以及空間復雜度,時間復雜度是指執(zhí)行算法所需要的計算工作量,空間復雜度是指算法需要消耗的內(nèi)存空間。應利用合適的算法,并不斷進行優(yōu)化,使其能通過簡單的計算,得到最優(yōu)的結(jié)果。未來深度強化學習,將可以通過人工智能進行算法的不斷優(yōu)化。