張新亮,周童
(1.江蘇工程職業(yè)技術(shù)學(xué)院航空與交通工程學(xué)院,江蘇 南通 226007;2.江蘇省智能網(wǎng)聯(lián)汽車工程技術(shù)研究開發(fā)中心,江蘇 南通 226007;3.南通大學(xué)電氣工程學(xué)院,江蘇 南通 226019)
近年來,人均汽車保有量迅速增長,與之相伴的環(huán)境污染、化石能源短缺等問題越發(fā)嚴(yán)重,進(jìn)而極大地推動了新能源汽車技術(shù)的發(fā)展[1]。其中,混合動力汽車能夠改變驅(qū)動模式以適應(yīng)各類路況、有效降低燃油的消耗量,已成為新能源汽車領(lǐng)域的重要發(fā)展方向之一。而整車的能量管理策略則是其中的關(guān)鍵因素,在保證汽車正常行駛的同時,優(yōu)化分配驅(qū)動電機(jī)與發(fā)動機(jī)的目標(biāo)扭矩,以提高車輛燃油經(jīng)濟(jì)性[2]。
早期的能量管理策略以基于規(guī)則的控制策略為主,算法簡單,易于實現(xiàn),實時性強(qiáng),但其規(guī)則的設(shè)定往往依賴于工程師的調(diào)試經(jīng)驗以及大量試驗數(shù)據(jù),并不能保證最優(yōu)的效果。通過動態(tài)規(guī)劃(DP)[3]、龐特亞金最小值原理(PMP)[4]以及模型預(yù)測控制(MPC)[5]等算法的引入來獲取最優(yōu)的控制策略,能夠提高車輛的燃油經(jīng)濟(jì)性,但其應(yīng)用的前提是需要已知行駛工況的信息,并不適用于實際路況。也有學(xué)者提出采用遺傳算法、模擬退火和蟻群算法等來求解能量管理策略問題,從優(yōu)化的結(jié)果中提取控制策略來減少車輛燃油消耗[6]。但是這種優(yōu)化后的結(jié)果只針對確定的行駛工況,在其他工況下未必能取得最優(yōu)的結(jié)果,也在一定程度上限制了其應(yīng)用范圍。考慮到行駛工況的不確定性以及車輛實際行駛過程中存在著許多無法預(yù)測的因素,如駕駛員的駕駛意愿、駕駛習(xí)慣和道路類型等,許多專家學(xué)者提出采用隨機(jī)動態(tài)規(guī)劃(SDP)方法來解決混合動力汽車的最優(yōu)控制問題[7],已經(jīng)實現(xiàn)了應(yīng)用并取得了一定的成果,但卻忽略了擋位效率在動力源轉(zhuǎn)矩分配過程中的影響,不合理的擋位選擇或者頻繁地?fù)Q擋將增加不必要的燃油消耗,嚴(yán)重影響了整車的能量利用率。
本研究以一款并聯(lián)混合動力汽車為研究對象,借鑒了隨機(jī)動態(tài)規(guī)劃的基本思想,在制定能量管理策略時將擋位考慮在內(nèi),提出了雙模式優(yōu)化算法(隨機(jī)動態(tài)規(guī)劃、離散粒子群算法)。將標(biāo)準(zhǔn)循環(huán)工況NEDC下駕駛員需求功率抽象為隨車速變化的隨機(jī)過程(具有馬爾科夫性質(zhì)),利用離散粒子群算法具有可調(diào)參數(shù)少、收斂速度快、算法簡單等優(yōu)點對車輛擋位的選擇進(jìn)行優(yōu)化。根據(jù)駕駛員需求功率的轉(zhuǎn)移概率矩陣,以維持動力電池組荷電狀態(tài)平衡和擋位效率最佳為約束,對發(fā)動機(jī)輸出扭矩進(jìn)行馬爾科夫決策過程建模,采用策略迭代法求解來獲得較佳的燃油經(jīng)濟(jì)性。最后,在Matlab/Simulink中仿真驗證了所提出策略的有效性。
并聯(lián)混合動力汽車系統(tǒng)結(jié)構(gòu)(見圖1)包括發(fā)動機(jī)、驅(qū)動電機(jī)、AMT(自動離和手動變速器)及蓄電池(動力電池組)等。動力傳動系采用同軸安裝方式,永磁同步電機(jī)直接與后橋相連,有效提高了傳動效率,使得行車充電以及制動能量回收成為可能。通過動力源工作方式的多種組合,可有效應(yīng)對復(fù)雜的行駛工況,實現(xiàn)提高整車燃油經(jīng)濟(jì)性與降低尾氣排放的雙重目標(biāo)。主要部件參數(shù)見表1。
圖1 并聯(lián)混合動力汽車結(jié)構(gòu)示意
表1 動力系統(tǒng)主要部件參數(shù)
混合動力汽車能量管理的前提就是滿足駕駛員的功率需求,之后優(yōu)化發(fā)動機(jī)、驅(qū)動電機(jī)目標(biāo)扭矩的配比,以獲得最佳的燃油經(jīng)濟(jì)性[8],在此過程中還應(yīng)考慮電池組荷電狀態(tài)(State of charge)平衡和擋位效率的因素。若已知駕駛員需求功率,混合動力汽車能量管理策略優(yōu)化問題可簡化為只要確定發(fā)動機(jī)或者驅(qū)動電機(jī)目標(biāo)扭矩即可。考慮到車輛的燃油經(jīng)濟(jì)性與發(fā)動機(jī)的運行區(qū)間密切相關(guān),因此本研究將發(fā)動機(jī)的目標(biāo)扭矩作為系統(tǒng)的優(yōu)化對象,通過隨機(jī)動態(tài)規(guī)劃(也稱為馬爾科夫決策)方法進(jìn)行求解。
車輛在實際行駛過程中,駕駛員根據(jù)道路擁擠狀況、自身的駕駛意愿以及駕駛習(xí)慣等通過油門踏板和制動踏板來表達(dá)功率的需求,其值是變化的、不可知的,但可以用隨機(jī)模型來表示。因此,本研究將駕駛員需求功率視為一個Markov過程[9],即駕駛員的需求功率在下一時刻的值只與當(dāng)前值及車速相關(guān),與之前的狀態(tài)無關(guān)。
在標(biāo)準(zhǔn)循環(huán)工況下,利用車輛動力學(xué)公式反推算出每一時刻的需求功率,并采取近鄰法對其進(jìn)行量化,通過最大似然估計法獲得需求功率的轉(zhuǎn)移概率。詳細(xì)步驟可參考文獻(xiàn)[7,9]。圖2示出NEDC工況下,實時車速30 km/h時,駕駛員需求功率的轉(zhuǎn)移概率矩陣。
圖2 車速為30 km/h時需求功率轉(zhuǎn)移概率矩陣
馬爾科夫決策過程模型是一種描述智能體(Agent)與環(huán)境之間相互作用的模型,其結(jié)構(gòu)見圖3。Agent根據(jù)環(huán)境狀態(tài)的輸入,做出決策并產(chǎn)生動作作為輸出,進(jìn)而對環(huán)境的狀態(tài)產(chǎn)生影響。一般可用四元組來表示,其中狀態(tài)集合S代表所有可能狀態(tài)的集合,行動集合A代表所有可能行動的集合,T是狀態(tài)轉(zhuǎn)移函數(shù),R是立即收益函數(shù)。智能體在狀態(tài)st執(zhí)行動作a后到達(dá)下一個狀態(tài)st+1的概率可表示為Pa(st,st+1),其可獲得的立即收益為Ra(st)。其中st,st+1∈S,Pa(st,st+1)∈T,Ra(st)∈R。
圖3 馬爾科夫決策過程模型
將發(fā)動機(jī)扭矩優(yōu)化看成一個離散的馬爾科夫決策過程,即找到在每一個轉(zhuǎn)移時刻,系統(tǒng)在當(dāng)前狀態(tài)下應(yīng)當(dāng)采取的行動,其所對應(yīng)的策略序列π(S)可表示為
π(S)={π(s1),π(s2),…π(sN)},
(1)
π(st+1) =f(π(st),ut) 。
(2)
式中:動作a可用控制量ut來表示,即為發(fā)動機(jī)扭矩Te;狀態(tài)變量S則由電池組的SOC、車輛速度v、擋位g和駕駛員需求功率Pdem構(gòu)成:
S=[SOC,v,g,Pdem]。
(3)
同時,系統(tǒng)的約束條件為
(4)
將Agent在狀態(tài)st時刻采取策略π(st)的期望收益定義為
(5)
(6)
在狀態(tài)變量S中,動力電池組的荷電狀態(tài)SOC屬于確定性變量,車速v和需求功率Pdem是隨機(jī)變量,而擋位g則屬于可優(yōu)化變量。不恰當(dāng)?shù)膿跷贿x擇或者頻繁地切換擋位會造成整車能量利用率降低,甚至引起不必要的燃油消耗。因此,根據(jù)車輛運行的狀態(tài)以及駕駛員的需求功率,對擋位選擇進(jìn)行優(yōu)化尤為必要。
粒子群優(yōu)化算法(PSO)是一種利用群體粒子間的信息傳遞而搜索到最優(yōu)值的算法,其優(yōu)點包括收斂速度快、精度高、易實現(xiàn)等[10]。針對實際應(yīng)用中的離散問題,則衍生出離散粒子群算法(DPSO)。其方式是在迭代過程中,通過兩個最優(yōu)解的比較確定粒子的更新速度及位置:一個最優(yōu)解為Pbest,它是粒子到達(dá)當(dāng)前位置所獲得的最優(yōu)解;另一個最優(yōu)解為Gbest,它是整個粒子群到達(dá)當(dāng)前位置所獲得的最優(yōu)解。第i個粒子在t+1次迭代時,速度vi(t+1)及位置xi(t+1)的更新方程為
vi(t+1)=w(t)vi(t)+c1r1(Pbest-
xi(t))+c2r2(Gbest-xi(t)),
(7)
(8)
式中:t為迭代次數(shù);w為慣性權(quán)重;c1為自身認(rèn)知學(xué)習(xí)因子;c2為社會認(rèn)知學(xué)習(xí)因子;r1,r2和r3為服從[0,1]上的均勻隨機(jī)數(shù);S(v)=1/(1+e-v)為sigmoid轉(zhuǎn)換函數(shù)。
為了避免算法陷入局部最優(yōu)解的陷阱,引入慣性權(quán)重w(t)調(diào)整策略。定義全局最優(yōu)粒子的適應(yīng)度值fbst、當(dāng)前全部粒子適應(yīng)度的平均值favg和適應(yīng)度值優(yōu)于favg的粒子的平均適應(yīng)度值fca,則調(diào)整策略可表示如下:
1) 第i個粒子的適應(yīng)度值fi優(yōu)于fca
(9)
2) 第i個粒子的適應(yīng)度值fi優(yōu)于favg劣于fca
(10)
式中:N為最大迭代次數(shù)。
3) 第i個粒子的適應(yīng)度值fi劣于favg
(11)
式中:m1,m2為控制參數(shù),其中m1>1,m2>0。
這里,對粒子的編碼按照(Te,g(t))組合來表示(見圖4)。其中Te為發(fā)動機(jī)的目標(biāo)扭矩,Te的范圍為[0,320];擋位g(t)的范圍為[1,5]。
圖4 粒子編碼表示
需要指出的是,本研究在對粒子編碼過程中,假設(shè)發(fā)動機(jī)目標(biāo)扭矩以40為步長變化,且同一擋位對應(yīng)發(fā)動機(jī)扭矩在同一區(qū)間內(nèi)變化時效率是不變的。擋位優(yōu)化目標(biāo)函數(shù)Fobj可構(gòu)造如下:
(12)
(13)
式中:f(Te,g(t),v)代表在車速v下,發(fā)動機(jī)扭矩與當(dāng)前擋位組合的效率;η為最佳效率;mg(t)為擋位切換的代價函數(shù),防止擋位頻繁切換所造成不必要的損耗。這里假設(shè)擋位g是由變量ug控制:
g(t)=g(t-1)+ug(t),ug∈{-1,0,1}。
(14)
根據(jù)貝爾曼(Bellman)最優(yōu)化原理,將式(5)采用遞歸的形式進(jìn)行表示:
(15)
引入一個中間變量動作值函數(shù)Qπ(st,a),定義如下:
(16)
則系統(tǒng)的最佳策略,即每個狀態(tài)的值函數(shù)最小可以通過下式計算得到:
(17)
這里采用策略迭代法,交替使用“求值計算”和“策略改進(jìn)”,得出最終的策略序列。整個算法的結(jié)構(gòu)框圖見圖5。
圖5 算法結(jié)構(gòu)框圖
利用Matlab/Simulink強(qiáng)大的數(shù)值計算和卓越的數(shù)據(jù)可視化特點[8],搭建了控制策略仿真驗證平臺,整車參數(shù)設(shè)置:整備質(zhì)量M=2 950 kg,迎風(fēng)面積A=4.45 m2,風(fēng)阻系數(shù)Cd=0.62,輪胎半徑r=0.362 m,主減速比i0=6.166。
新歐洲標(biāo)準(zhǔn)行駛循環(huán)(NEDC)工況下,車輛行駛的需求扭矩見圖6。其中,需求扭矩為負(fù)表明此時可對動力電池組進(jìn)行充電,實現(xiàn)能量回收,從而提高整車能量的利用率。從圖7a可以看出,所提出的能量管理策略能夠較好地滿足循環(huán)工況中的速度要求,實現(xiàn)了對目標(biāo)車速的跟隨,偏差較小。圖7b為優(yōu)化前后擋位選擇的對比。由圖7b可知,車速較低時以純電動模式運行,整車所需的動力完全由驅(qū)動電機(jī)提供,避免了發(fā)動機(jī)低速高油耗現(xiàn)象。隨著車速的提高,整車進(jìn)入發(fā)動機(jī)驅(qū)動模式并適時地進(jìn)行行車充電,維持電池組的SOC平衡。圖7c示出測試工況下動力電池組荷電狀態(tài)的變化趨勢。由圖7c可以看出,采用本研究提出的策略后SOC偏離初始值(0.65)的范圍更小,表明動力電池組充放電的損耗較低,效率更高。測試工況完成后,采用基于規(guī)則的能量管理策略與本研究策略所對應(yīng)的SOC為0.648 6和0.649 1。
圖6 NEDC工況下車輛行駛的需求扭矩
圖7 測試工況的仿真結(jié)果
為了更好地對比算法的效果,圖8和圖9分別示出驅(qū)動電機(jī)和發(fā)動機(jī)的工作點分布。從圖8可以看出,采用基于規(guī)則的能量管理策略的驅(qū)動電機(jī)工作點較為集中,且效率相對較高。而采用本研究提出的策略,驅(qū)動電機(jī)的工作點較為分散,且有較多的工作點落在了發(fā)電機(jī)模式下。表明驅(qū)動電機(jī)需要適時地進(jìn)行行車充電或者制動能量回收,以保證動力電池組的SOC平衡。從圖9可以看出,采用本研究提出的能量管理策略后,發(fā)動機(jī)的工作點基本都落在高效的區(qū)域,有效地提高了燃油的利用率。在測試工況完成后,兩種策略所對應(yīng)的100 km油耗(折算后)分別為14.21 L,12.87 L。測試數(shù)據(jù)說明本研究提出的控制策略能夠滿足駕駛員需求功率,又能夠有效降低車輛的油耗。
圖8 驅(qū)動電機(jī)工作點分布對比
圖9 發(fā)動機(jī)扭矩-轉(zhuǎn)速工作點
提出了一種基于雙模式優(yōu)化算法的并聯(lián)混合動力汽車能量管理策略,能依據(jù)駕駛員需求功率的轉(zhuǎn)移概率矩陣,以等效燃油消耗量最小為目標(biāo),將整車能量管理策略簡化為發(fā)動機(jī)輸出轉(zhuǎn)矩的尋優(yōu)問題。同時,利用離散粒子群算法對擋位選擇進(jìn)行優(yōu)化。在維持動力電池組荷電狀態(tài)平衡和擋位效率最佳的約束下,采用策略迭代法,交替使用“求值計算”和“策略改進(jìn)”,求出最優(yōu)的序列。在Matlab/Simulink下進(jìn)行了仿真驗證,結(jié)果表明,與基于規(guī)則的策略相比,本研究提出的策略所對應(yīng)的百公里油耗降低了9.42%。