陳文凱,莊 健,,凌建群,喬信起
(1.上海交通大學(xué)動力機械及工程教育部重點實驗室,上海 200240;2.上海柴油機股份有限公司,上海 200090)
截止2020年,中國擁有超過3.5億臺機動車,其中一部分為重型柴油車,約占4.8%。盡管目前我國重載柴油車數(shù)量相對較低,但是它們產(chǎn)生的污染排放物占全部機動車污染物排放量的84%。特別是對于碳煙顆粒物排放,最新的國VI排放標(biāo)準(zhǔn)不僅要求顆粒物的總質(zhì)量排放繼續(xù)大幅減少,還嚴(yán)格限制了顆粒物排放個數(shù)。因此,一個準(zhǔn)確的柴油機碳煙質(zhì)量排放預(yù)測模型對于柴油機以及后處理系統(tǒng)的開發(fā)設(shè)計具有十分重要的作用。
目前,針對柴油機碳煙排放質(zhì)量的預(yù)測方法主要是基于試驗脈譜的標(biāo)定。這類方法較為簡單,在特定的工況下準(zhǔn)確率較高,但通常它們試驗的次數(shù)較少,很難模擬出實際車輛路載中的排放規(guī)律。此外,脈譜標(biāo)定法每次試驗時考慮的發(fā)動機工況數(shù)據(jù)也較少,常以發(fā)動機轉(zhuǎn)速和轉(zhuǎn)矩為主。但實際影響發(fā)動機排放的因素非常復(fù)雜,僅由兩個變量主導(dǎo)的脈譜數(shù)據(jù)的簡單插值擬合必然對最終的碳煙顆粒質(zhì)量預(yù)測造成誤差。因此,本文將以最符合實際路載工況的非道路瞬態(tài)循環(huán)NRTC為測試基礎(chǔ),基于數(shù)據(jù)驅(qū)動構(gòu)建高準(zhǔn)確度的碳煙質(zhì)量預(yù)測模型。
本研究采用的試驗柴油機為上海柴油機股份有限公司生產(chǎn)的直列、電控高壓共軌、增壓中冷柴油機SC7H260G4,其技術(shù)參數(shù)見表1。
表1 SC7H260G4柴油機技術(shù)參數(shù)
試驗儀器設(shè)備包括測功機、進氣管、油耗儀、空氣流量計、缸內(nèi)壓力采集系統(tǒng)等,能測量發(fā)動機轉(zhuǎn)速、轉(zhuǎn)矩、進氣流量、排氣溫度壓力等參數(shù)。為實現(xiàn)碳煙顆粒排放質(zhì)量的測量,采用李斯特公司生產(chǎn)的AVL483光學(xué)聲波傳感器實時采集DPF入口的碳煙質(zhì)量濃度,其原理如圖1所示。
圖1 AVL 483光學(xué)聲波測量原理
AVL 483測量室的一端發(fā)出調(diào)制后的黑體紅外光波,此時發(fā)動機尾氣中存在黑體效應(yīng)的碳煙顆粒會吸收特定波長的調(diào)制光子,處于激發(fā)態(tài);碳煙顆粒吸收光子能量后,受熱膨脹會以熱的方式向外釋放能量;這種周期性的調(diào)制加熱過程會使碳煙顆粒產(chǎn)生周期性的壓力波,從而能被聲波檢測器檢測,之后通過解調(diào)制、放大和濾波等信號處理,記錄碳煙粒子的存在。最終得到的傳感器信號的幅度與尾氣中碳煙的質(zhì)量濃度呈正相關(guān)的關(guān)系。
隨著國VI排放法規(guī)的推出,為了更好地控制機動車污染物排放,針對柴油機排放測試循環(huán),一方面要保證廣泛的發(fā)動機輸出,另一方面要保證CO、HC、NO 和顆粒物排放都嚴(yán)格控制在排放標(biāo)準(zhǔn)內(nèi)。本文選用非道路瞬態(tài)試驗循環(huán)NRTC(Non-Road Transient Cycle)作為試驗系統(tǒng)模擬路載工況的測試條件。
NRTC測試循環(huán)是由美國EPA與歐盟委員會合作開發(fā)的移動式非道路柴油發(fā)動機的瞬態(tài)行駛測試循環(huán)。目前非道路用發(fā)動機的許多排放標(biāo)準(zhǔn)都須進行NRTC測試,包括歐盟Stage III/IV法規(guī)和美國EPA Tier 4法規(guī)。隨著行駛時間的變化,NRTC測試循環(huán)中發(fā)動機基準(zhǔn)轉(zhuǎn)速和基準(zhǔn)轉(zhuǎn)矩的變化如圖2所示。整個測試循環(huán)的總持續(xù)時間為1 238 s,交流測功機的使用保證了發(fā)動機工況可以每1 s調(diào)整1次,每一個工況的發(fā)動機轉(zhuǎn)速和轉(zhuǎn)矩可通過除以最大轉(zhuǎn)速和最大轉(zhuǎn)矩分別獲得其基準(zhǔn)轉(zhuǎn)速和基準(zhǔn)轉(zhuǎn)矩。通過實時改變每一工況點的狀態(tài),NRTC測試循環(huán)可最大程度地模擬實際道路工況中加速、減速和怠速等一系列路載工況。
圖2 NRTC循環(huán)中發(fā)動機的基準(zhǔn)轉(zhuǎn)速和基準(zhǔn)轉(zhuǎn)矩
為獲得碳煙排放質(zhì)量的預(yù)測模型,本文在NRTC測試循環(huán)中采集了大量與碳煙質(zhì)量濃度相關(guān)的各種傳感器數(shù)據(jù),如發(fā)動機轉(zhuǎn)矩、轉(zhuǎn)速、噴油量、噴油壓力等,并構(gòu)建了一個大型的碳煙排放質(zhì)量數(shù)據(jù)集。以發(fā)動機轉(zhuǎn)矩、轉(zhuǎn)速、噴油量、噴油壓力等為輸入,以柴油機碳煙排放的質(zhì)量濃度作為預(yù)測目標(biāo),構(gòu)建了機器學(xué)習(xí)預(yù)測模型,模型的評價指標(biāo)采用平均絕對誤差(MAE),均方誤差(MSE)和均方根誤差(RMSE)。
式中:y為每個工況的預(yù)測數(shù)據(jù);?為每個工況的實測數(shù)據(jù);為所有工況的總數(shù)。
模型的構(gòu)建流程如圖3所示,分為7個步驟:(1)從各種傳感數(shù)據(jù)源中獲取碳煙排放質(zhì)量數(shù)據(jù)。(2)數(shù)據(jù)預(yù)處理,解決碳煙排放質(zhì)量數(shù)據(jù)集中存在的數(shù)據(jù)丟失、數(shù)據(jù)離異和長尾數(shù)據(jù)等問題,保證數(shù)據(jù)集樣本的準(zhǔn)確性和均衡性。(3)數(shù)據(jù)轉(zhuǎn)換,實現(xiàn)數(shù)據(jù)擴展和數(shù)據(jù)歸一化。(4)模型訓(xùn)練,將經(jīng)處理后的碳煙排放質(zhì)量數(shù)據(jù)集分為訓(xùn)練集和測試集,用訓(xùn)練集數(shù)據(jù)對預(yù)測模型進行訓(xùn)練,得到模型超參數(shù)。(5)超參數(shù)微調(diào),對模型里面的超參數(shù)進行手動微調(diào),保證模型訓(xùn)練過程盡快收斂并且訓(xùn)練出來的模型不會出現(xiàn)過擬合的現(xiàn)象。(6)批處理(batch reference),與訓(xùn)練過程類似,測試過程中每次迭代時每一批數(shù)據(jù)集都進行歸一化,以保證與訓(xùn)練集數(shù)據(jù)格式相同。(7)模型評估,利用測試集數(shù)據(jù)對預(yù)測模型進行準(zhǔn)確度評估。
圖3 機器學(xué)習(xí)模型構(gòu)建流程
柴油機排放具有工況復(fù)雜和強非線性的特點,基于數(shù)據(jù)驅(qū)動的訓(xùn)練策略對數(shù)據(jù)集具有較大的依賴性,且訓(xùn)練好的模型容易出現(xiàn)過擬合和陷入局部最優(yōu)的情況,導(dǎo)致單一預(yù)測模型無法保證全局范圍的預(yù)測精度,使模型穩(wěn)定性不強。因此,本文首先選用機器學(xué)習(xí)算法中的LGB梯度樹算法和循環(huán)神經(jīng)網(wǎng)絡(luò)算法分別實現(xiàn)模型構(gòu)建和分析。不同于常規(guī)梯度樹算法GBDT和XGBoost的節(jié)點分裂和數(shù)據(jù)存儲方式,LGB算法采用直方圖來構(gòu)建數(shù)據(jù)節(jié)點的離散分割方式,其思想是將連續(xù)的浮點特征分割成個離散值,并構(gòu)造個直方圖,對所有的訓(xùn)練數(shù)據(jù)進行遍歷后,統(tǒng)計出每個離散值在直方圖中的累計統(tǒng)計量。因此,當(dāng)算法模型對每個標(biāo)簽特征進行選擇評分時,只需要根據(jù)離散的直方圖,就可以找到最佳的分割點。這種方法可以顯著降低模型訓(xùn)練時對硬件內(nèi)存的消耗量并且減少算力,十分適用于中大型的數(shù)據(jù)集。圖4描述了基于碳煙排放質(zhì)量數(shù)據(jù)集的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。為了充分利用碳煙排放質(zhì)量數(shù)據(jù)集內(nèi)部的時序關(guān)系,循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)引入了長短期記憶模塊(LSTM)去連接不同的神經(jīng)元。不同于常規(guī)神經(jīng)網(wǎng)絡(luò)利用多層結(jié)構(gòu)去獲取更準(zhǔn)確的結(jié)果,循環(huán)神經(jīng)網(wǎng)絡(luò)內(nèi)部的單個LSTM更新模塊存在4個不同的層相互作用,能夠?qū)崿F(xiàn)遺忘、獲取現(xiàn)有輸入、更新上一個神經(jīng)元的輸出狀態(tài)和根據(jù)現(xiàn)有的狀態(tài)輸出預(yù)測值等一系列復(fù)雜功能。
圖4 基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
為了進一步利用各子模型的預(yù)測特性,可以將子模型的預(yù)測值進行拼接耦合形成新的數(shù)據(jù)特征,然后將此數(shù)據(jù)特征加入原始的碳煙排放質(zhì)量數(shù)據(jù)集?;诖藬?shù)據(jù)增強后的碳煙排放質(zhì)量數(shù)據(jù)集,邏輯回歸算法被運用于學(xué)習(xí)訓(xùn)練并實現(xiàn)自動賦予子模型不同的權(quán)重。圖5描述了自學(xué)習(xí)策略構(gòu)建最終融合模型的流程,以此來提高模型的預(yù)測精度和泛化性。
圖5 基于自學(xué)習(xí)策略的模型融合流程
試驗系統(tǒng)在NRTC測試循環(huán)下獲得的轉(zhuǎn)速和轉(zhuǎn)矩變化如圖6所示。試驗中柴油機轉(zhuǎn)矩的變化范圍為0~1 000 Nm,轉(zhuǎn)速變化范圍為600~2 400 r/min,基本上能覆蓋柴油機的怠速轉(zhuǎn)速到最大轉(zhuǎn)速間的所有變化工況。此外,柴油機在NRTC測試循環(huán)中大多數(shù)工況的轉(zhuǎn)速都大于1 200 r/min,表明基于NRTC循環(huán)的試驗系統(tǒng)能較好地模擬整車實際的運行路載工況。
圖6 試驗柴油機NRTC循環(huán)中轉(zhuǎn)矩與轉(zhuǎn)速的變化
圖7給出了試驗系統(tǒng)在一個NRTC循環(huán)周期期間產(chǎn)生的碳煙瞬時質(zhì)量濃度,以及在這個周期的不同時間段內(nèi)碳煙質(zhì)量濃度與轉(zhuǎn)矩之間的變化關(guān)系。由圖7a可知,發(fā)動機碳煙排放的質(zhì)量濃度并不是有規(guī)律地波動在一個固定范圍內(nèi)。由于NRTC測試循環(huán)中存在大量發(fā)動機轉(zhuǎn)速和轉(zhuǎn)矩瞬時巨大跳動的工況,導(dǎo)致碳煙的排放也會經(jīng)常出現(xiàn)突然的峰值。為進一步分析柴油機啟動與怠速、中速運行及加速運行這3種工況下碳煙排放量與轉(zhuǎn)矩之間的關(guān)系,結(jié)合圖6b中的轉(zhuǎn)速變化,可用0~200 s、200~400 s、600~800 s這3個時段分別粗略代表這3類工況。
如圖7b所示,在柴油機怠速啟動階段,當(dāng)轉(zhuǎn)矩逐漸增大時,碳煙的瞬態(tài)排放量也會逐漸增大。這是由于柴油機啟動過程中,轉(zhuǎn)矩和轉(zhuǎn)速都會經(jīng)歷一個逐漸上升的過程,但是發(fā)動機的負(fù)荷仍然是以小負(fù)荷為主。而小負(fù)荷時發(fā)動機的燃空比和溫度均較低,氣缸內(nèi)稀薄混合氣區(qū)較大導(dǎo)致大多數(shù)的燃油顆粒處于燃燒界限以外而不能充分氧化燃燒,從而形成顆粒聚合的有利條件,導(dǎo)致較多顆粒物(主要為未燃的燃油組分和部分氧化產(chǎn)物)的產(chǎn)生。
當(dāng)柴油機處于中速運行工況,由圖7c可知,柴油機在不同轉(zhuǎn)矩下產(chǎn)生的碳煙排放基本一樣。這是因為NRTC循環(huán)中200~400 s內(nèi)轉(zhuǎn)矩和轉(zhuǎn)速都呈現(xiàn)出劇烈的上下變化,負(fù)荷的突然增大和減小都會造成碳煙顆粒的增加。比如:當(dāng)?shù)退俅筘?fù)荷時,燃空比和溫度都較高,使柴油分子大量裂解和脫氫,但較低的轉(zhuǎn)速不利于燃燒速度的加快,造成了柴油顆粒(主要成分為碳煙)的大量增加。因此,這種轉(zhuǎn)速和轉(zhuǎn)矩的上下突然變化會使碳煙顆粒的排放在這個階段數(shù)量大致相同。
當(dāng)柴油機處于加速運行狀態(tài)時,由圖6b可知,試驗系統(tǒng)在600~800 s內(nèi)除了兩端的突變區(qū)域,中間區(qū)域為穩(wěn)定的轉(zhuǎn)速上升過程。由圖7d可知,此時碳煙顆粒物的整體趨勢是隨著轉(zhuǎn)矩的增大而逐漸減小。這是由于柴油機在大負(fù)荷低轉(zhuǎn)速區(qū)產(chǎn)生的碳煙顆粒較多,隨著轉(zhuǎn)速的增大,碳煙顆粒與氧氣充分進行燃燒,導(dǎo)致顆粒物的數(shù)量會逐漸下降。但是當(dāng)轉(zhuǎn)矩為700 Nm時,其碳煙的顆粒物會出現(xiàn)明顯增大的情況,對比圖6a可知,此時(700 s處)轉(zhuǎn)矩出現(xiàn)突然下降的變化,會使顆粒物的燃燒情況變惡劣,導(dǎo)致顆粒物排放突然增加。
圖7 試驗系統(tǒng)NRTC循環(huán)在不同時間段內(nèi)碳煙質(zhì)量濃度與轉(zhuǎn)矩之間的關(guān)系
本文在進行超過100組NRTC循環(huán)試驗后,構(gòu)建了一個柴油機碳煙排放質(zhì)量數(shù)據(jù)集。表2列出了數(shù)據(jù)集中所有與碳煙質(zhì)量相關(guān)的傳感器數(shù)據(jù)標(biāo)簽,此數(shù)據(jù)集一共由153 106組數(shù)據(jù)組成。所有的數(shù)據(jù)在模型訓(xùn)練前需要進行數(shù)據(jù)處理和分析,圖8給出了第90 000~110 000個工況點部分傳感器參數(shù)的變化情況。由圖可知,在某一個時間段內(nèi)碳煙的測量值為0,且在這個時間段前后,碳煙質(zhì)量濃度的測量值明顯高于正常碳煙的數(shù)據(jù)波動范圍。通過觀察轉(zhuǎn)速、噴油量和進氣量在不同狀態(tài)點的變化情況可知,此時柴油機轉(zhuǎn)速較低且噴油量和進氣量都接近0,表明此時傳感器采集到的發(fā)動機運行數(shù)據(jù)異常。因此,數(shù)據(jù)處理的手段分為3步:(1)剔除在90 000~110 000個工況點內(nèi)碳煙質(zhì)量濃度為0的所有數(shù)據(jù)。(2)對較大的碳煙質(zhì)量異常值進行閾值處理。(3)對數(shù)值型數(shù)據(jù)進行歸一化和標(biāo)準(zhǔn)化處理。此外,為了保證碳煙質(zhì)量這一列數(shù)據(jù)的分布均勻,避免出現(xiàn)“長尾效應(yīng)”,也采用了對數(shù)變換來保持?jǐn)?shù)據(jù)的敏感性。
表2 試驗系統(tǒng)NRTC循環(huán)內(nèi)收集到的與碳煙質(zhì)量相關(guān)的所有傳感器數(shù)據(jù)標(biāo)簽
圖8 第90 000~11000個工況點傳感器參數(shù)的變化情況
圖9描述了經(jīng)過數(shù)據(jù)處理后傳感器數(shù)據(jù)的相關(guān)性熱力圖,可以發(fā)現(xiàn)在所有的傳感器標(biāo)簽中,CEXREAL(DPF入口氧濃度)對碳煙排放質(zhì)量濃度的影響最大,其值為-0.61。由NRTC循環(huán)測試結(jié)果可知,DPF入口氧濃度越大,碳煙顆粒被氧化清除的概率越大,這表明氧濃度與碳煙排放質(zhì)量呈明顯的負(fù)相關(guān)關(guān)系,與熱力圖分析的結(jié)果一致。
圖9 原始傳感器數(shù)據(jù)相關(guān)性熱力圖
圖10a描述了LGB梯度樹模型的訓(xùn)練流程。將處理好的碳煙排放質(zhì)量數(shù)據(jù)集分為訓(xùn)練集和測試集后,折交叉驗證的思想被應(yīng)用于對數(shù)據(jù)集進行分層,這意味著預(yù)測模型的輸出值是由初始設(shè)定的個訓(xùn)練模型輸出值的平均值組成,有利于提高預(yù)測精度,在本試驗中值設(shè)置為5,模型中其余參數(shù)被設(shè)置為:{’num_leaves’:120,’learning_rate’:0.0 1,’objective’:’regression’,’min_child_samples’:30,’metric’:’mse’,’lambda_l1’:0.1,’n_splits’=5}。通過再次進行5次NRTC循環(huán)測試試驗,收集與原始的碳煙排放質(zhì)量數(shù)據(jù)集數(shù)據(jù)標(biāo)簽相同的6 475組數(shù)據(jù)作為測試集,來對交叉驗證后訓(xùn)練完成的預(yù)測模型進行進一步驗證比較,試驗結(jié)果如圖10b所示??梢杂^察到LGB梯度樹模型對于測試集中碳煙排放質(zhì)量的預(yù)測結(jié)果與實際碳煙排放質(zhì)量試驗數(shù)據(jù)的狀態(tài)分布都保持良好的一致性,并且數(shù)據(jù)的分布范圍整體在0~40 mg/m之間。兩類數(shù)據(jù)的演化形態(tài)十分相似,表明了訓(xùn)練好的LGB梯度樹模型能夠較為準(zhǔn)確地預(yù)測實時碳煙排放質(zhì)量。
圖10 LGB梯度樹模型訓(xùn)練流程及最終預(yù)測模型與試驗結(jié)果比較
基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)如圖11a所示。模型一共分為3層,且第1層的LSTM單元數(shù)設(shè)置為30,每一層網(wǎng)絡(luò)的激活函數(shù)設(shè)置為Relu函數(shù),Batch Normalization(BN)位于網(wǎng)絡(luò)的第3層。由于模型輸入數(shù)據(jù)量較大,每次模型訓(xùn)練的數(shù)據(jù)塊(batch)數(shù)設(shè)置為1 200。通過再次進行5次NRTC循環(huán)測試試驗,收集到的與原始的碳煙排放質(zhì)量數(shù)據(jù)集標(biāo)簽相同的6 475組數(shù)據(jù)作為測試集,與LGB梯度樹模型類似,對訓(xùn)練完成的循環(huán)神經(jīng)網(wǎng)絡(luò)模型進行驗證比較,試驗結(jié)果如圖11b所示??梢杂^察到,當(dāng)瞬時排放量在0~25 mg/m之間時,預(yù)測結(jié)果與試驗數(shù)據(jù)的狀態(tài)分布都保持一致,但是當(dāng)碳煙瞬時排放量在25 mg/m以上時,預(yù)測結(jié)果與試驗數(shù)據(jù)中的一些離異值仍存在不匹配的現(xiàn)象,這表明了神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)對于數(shù)據(jù)的離異值不能起到很好的預(yù)測作用。
圖11 循環(huán)神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)及最終模型預(yù)測結(jié)果與試驗結(jié)果比較
盡管LGB梯度樹模型在當(dāng)前數(shù)據(jù)集上能獲得優(yōu)異的預(yù)測精度,但它是基于決策樹算法的延展,當(dāng)訓(xùn)練集數(shù)據(jù)量較大時,模型的預(yù)測準(zhǔn)確度很容易出現(xiàn)下降。此外,循環(huán)神經(jīng)網(wǎng)絡(luò)模型由于考慮碳煙排放質(zhì)量數(shù)據(jù)集中的時序關(guān)系,以及引入LSTM單元模型,導(dǎo)致模型訓(xùn)練的參數(shù)較多,容易出現(xiàn)過擬合現(xiàn)象。因此,為了進一步提高模型預(yù)測的準(zhǔn)確度并分散模型過擬合的風(fēng)險,模型融合的方法可以集成各子模型的輸出差異。試驗結(jié)果見表3,可以發(fā)現(xiàn)經(jīng)過自學(xué)習(xí)策略訓(xùn)練后的融合模型在6 475組數(shù)據(jù)的測試集上的預(yù)測精度明顯高于單模型預(yù)測結(jié)果。
表3 不同模型的實時碳煙排放質(zhì)量預(yù)測結(jié)果與試驗結(jié)果比較及硬件資源對比
通過開展柴油機試驗系統(tǒng)在非道路瞬態(tài)循環(huán)(NRTC)下的排放試驗研究,得到了柴油機碳煙排放質(zhì)量在不同時間段隨著轉(zhuǎn)矩變化的規(guī)律。
通過收集試驗柴油機在大量NRTC循環(huán)中的碳煙排放質(zhì)量數(shù)據(jù),以及反映發(fā)動機運行狀態(tài)的多種傳感器標(biāo)簽數(shù)據(jù),構(gòu)建了一個超過150 000組數(shù)據(jù)工況的柴油機碳煙排放質(zhì)量數(shù)據(jù)集?;诖藬?shù)據(jù)集,構(gòu)建了LGB梯度樹模型和基于LSTM的循環(huán)神經(jīng)網(wǎng)絡(luò)模型,并實現(xiàn)了碳煙排放質(zhì)量的實時準(zhǔn)確預(yù)測。考慮到預(yù)測精度和模型穩(wěn)定性等因素的影響,模型融合的方法被用于進一步改善模型的預(yù)測效果。將融合模型的預(yù)測結(jié)果與試驗數(shù)據(jù)進行對比,結(jié)果表明,融合模型對于不同非道路瞬態(tài)循環(huán)的工況點,其預(yù)測的碳煙排放質(zhì)量的MAE和RMSE誤差都能控制在2.5 mg/m以內(nèi),表明了最終的融合模型對碳煙排放質(zhì)量預(yù)測的高準(zhǔn)確度,可以為柴油機后處理過程中碳載量的準(zhǔn)確計算以及控制策略的開發(fā)提供參考。