王志堅(jiān) ,王秀雷 ,趙康荏,史彥曉,帥石金,李國(guó)祥
(1. 濰柴動(dòng)力股份有限公司,山東 濰坊 261061;2. 清華大學(xué) 車輛與運(yùn)載學(xué)院,北京 100084;3. 山東大學(xué) 能源與動(dòng)力工程學(xué)院,山東 濟(jì)南 250061)
柴油機(jī)匹配選擇性催化還原(SCR)技術(shù)可滿足國(guó)Ⅴ、國(guó)Ⅵ排放法規(guī),是目前主流的NOx排放控制技術(shù)路線.NOx排放故障診斷是排放法規(guī)最重要的車載診斷系統(tǒng)(OBD)功能要求之一,對(duì)于國(guó)Ⅵ重型柴油機(jī),根據(jù)GB17691—2018重型柴油車污染物排放限值及測(cè)量方法(中國(guó)第六階段),當(dāng)NOx排放超過(guò)限值1.2g/(kW·h)時(shí),在臺(tái)架的OBD認(rèn)證過(guò)程中,一個(gè)冷熱態(tài)全球瞬態(tài)試驗(yàn)循環(huán)(WHTC)結(jié)束前,OBD系統(tǒng)報(bào)NOx排放超標(biāo)故障,激活轉(zhuǎn)矩限制器.國(guó)Ⅵ重型柴油機(jī)使用兩只NOx傳感器分別直接測(cè)量發(fā)動(dòng)機(jī)的NOx原始排放和SCR下游NOx排放,NOx排放故障診斷受到NOx傳感器精度和信號(hào)漂移的影響,且車載NOx傳感器對(duì)NH3有交叉敏感性[1].為此國(guó)內(nèi)外公司和學(xué)者做了大量研究,提出了基于MAP映射和基于物理模型的診斷方法,前者需大量的標(biāo)定試驗(yàn),成本高且靜態(tài)條件下標(biāo)定的MAP無(wú)法準(zhǔn)確表達(dá)瞬態(tài)條件下的NOx排放狀態(tài)[2],基于物理模型的方法需要電控系統(tǒng)很強(qiáng)的計(jì)算能力,且部分模型參數(shù)難以從實(shí)車上獲取[3-4],從而限制了其在實(shí)際產(chǎn)品上的應(yīng)用.
由于現(xiàn)有NOx排放故障診斷算法存在準(zhǔn)確率偏低的不足,有必要應(yīng)用智能算法提高準(zhǔn)確率.?dāng)?shù)據(jù)驅(qū)動(dòng)模型的方法因在開發(fā)成本和時(shí)間上的優(yōu)越性,被廣泛應(yīng)用于柴油機(jī)故障診斷模型的建立.戴金池等[5]基于神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)柴油機(jī)的瞬態(tài)NOx排放數(shù)據(jù)預(yù)測(cè),Pu等[6]基于機(jī)器學(xué)習(xí)實(shí)現(xiàn)納米級(jí)的顆粒物分布規(guī)律預(yù)測(cè),Najafi等[7]基于支持向量機(jī)和自適應(yīng)神經(jīng)模糊系統(tǒng)實(shí)現(xiàn)油耗、煙度、爆發(fā)壓力和增壓器轉(zhuǎn)速等的數(shù)據(jù)預(yù)測(cè).孫立民[8]基于概率神經(jīng)網(wǎng)絡(luò)(PNN),對(duì)船舶用柴油機(jī)高壓系統(tǒng)節(jié)流閥狀態(tài)進(jìn)行故障診斷研究,診斷準(zhǔn)確率為95%.文獻(xiàn)[9—10]基于神經(jīng)網(wǎng)絡(luò)結(jié)合缸蓋振動(dòng)和曲軸角加速度信號(hào)對(duì)柴油機(jī)失火進(jìn)行故障診斷,基于分類的思想診斷準(zhǔn)確率高達(dá)100%.張永祥等[11]基于加窗和卷積神經(jīng)網(wǎng)絡(luò)算法,可以有效地對(duì)柴油機(jī)拉缸進(jìn)行故障診斷,Ding等[12]基于小波包能量和深度卷積神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)對(duì)機(jī)床主軸軸承的智能診斷,Ince等[13]提出一種將數(shù)據(jù)生成和故障診斷結(jié)合起來(lái)的算法,該算法能夠自動(dòng)提取故障特征數(shù)據(jù),且具有優(yōu)越的故障診斷能力,但是以上都是將穩(wěn)態(tài)、瞬態(tài)分開建模,并應(yīng)用不同的模型參數(shù)進(jìn)行故障診斷,沒有考慮實(shí)際道路條件下的模型泛化性能.因此,有必要建立一種模型,能夠?qū)λ矐B(tài)和實(shí)際道路過(guò)程進(jìn)行準(zhǔn)確的NOx排放故障診斷,更好地適應(yīng)產(chǎn)品的應(yīng)用需求.
柴油機(jī)的運(yùn)行是一個(gè)連續(xù)的過(guò)程,之前時(shí)刻的NOx排放狀態(tài)將會(huì)影響下一個(gè)時(shí)刻柴油機(jī)的NOx排放狀態(tài),NOx排放故障診斷是一個(gè)典型的基于時(shí)間序列的診斷問(wèn)題.對(duì)NOx排放進(jìn)行故障診斷是典型的分類問(wèn)題,受多種因素的影響,魯棒性要求也較高,支持向量機(jī)(SVM)作為一種典型的二分類機(jī)制,少數(shù)的支持向量將決定最終的分類結(jié)果,適合于魯棒性要求較高的故障診斷問(wèn)題.基于以上分析,筆者針對(duì)實(shí)際情況,將NOx排放故障診斷抽象為時(shí)間序列的分類問(wèn)題,提出一種基于時(shí)間窗口與SVM的NOx排放故障診斷算法,針對(duì)WHTC和實(shí)際道路(PEMS)試驗(yàn)數(shù)據(jù)建立統(tǒng)一的故障診斷模型,結(jié)合診斷放行、延遲時(shí)間條件,使用時(shí)間窗口將特征輸入離散化,使用SVM算法將時(shí)間窗口分類,分別將WHTC循環(huán)作為訓(xùn)練集和測(cè)試集;WHTC循環(huán)作為訓(xùn)練集,PEMS數(shù)據(jù)作為測(cè)試集;WHTC循環(huán)與PEMS數(shù)據(jù)的集合作為訓(xùn)練集和測(cè)試集,模型均具有很高的診斷準(zhǔn)確率,說(shuō)明模型具備良好的泛化性能.同時(shí)對(duì)比了PNN及長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)等其他神經(jīng)網(wǎng)絡(luò)模型,基于時(shí)間窗口與SVM的NOx排放故障診斷模型具有更高的診斷準(zhǔn)確率和泛化性能.
表1~表3為柴油發(fā)動(dòng)機(jī)、SCR后處理及整車主要技術(shù)參數(shù).
表1 發(fā)動(dòng)機(jī)主要技術(shù)參數(shù)Tab.1 Engine main technical parameters
表2 SCR后處理主要技術(shù)參數(shù)Tab.2 Main technical parameters of SCR aftertreatment
表3 整車主要技術(shù)參數(shù)Tab.3 Vehicle main technical parameters
發(fā)動(dòng)機(jī)試驗(yàn)臺(tái)架總體布置示意如圖1所示.試驗(yàn)采用湘儀動(dòng)力測(cè)試儀器有限公司CAC265交流電力測(cè)功機(jī)測(cè)量轉(zhuǎn)速和轉(zhuǎn)矩,采用AVL公司483微煙度計(jì)測(cè)量碳煙(soot)排放,且不受顆粒物中的可溶性有機(jī)物(SOF)、硫酸鹽和礦物質(zhì)等成分的影響,HORIBA公司MEXA-7200D氣體分析儀測(cè)量排氣中NOx、氣態(tài)HC等.試驗(yàn)使用國(guó)Ⅵ標(biāo)準(zhǔn)柴油.
圖1 發(fā)動(dòng)機(jī)試驗(yàn)臺(tái)架示意Fig.1 Schematic of experimental set-up
基于時(shí)間窗口和SVM的NOx排放診斷策略,需要兼容WHTC(OBD認(rèn)證)和整車路譜工況(診斷策略的整車適應(yīng)性驗(yàn)證),并且區(qū)分正常SCR催化消聲器和劣化SCR催化消聲器(使用熱老化方法降低SCR轉(zhuǎn)化效率,使得NOx排放結(jié)果控制在1.0~1.2g/(kW·h)).因此,基于臺(tái)架WHTC和整車路譜工況及正常SCR催化消聲器和劣化SCR催化消聲器,分別采集試驗(yàn)數(shù)據(jù)用于模型的訓(xùn)練和驗(yàn)證.
針對(duì)臺(tái)架,運(yùn)行熱態(tài)WHTC,采集正常SCR催化消聲器的試驗(yàn)數(shù)據(jù)(圖2a),NOx排放為0.35g/(kW·h),滿足法規(guī)要求,SCR上游NOx排放平均值為453.6×10-6、下游排放平均值為9.2×10-6,SCR上游排氣溫度平均值為275.0℃.圖2b為采集劣化SCR催化消聲器的試驗(yàn)數(shù)據(jù),NOx排放為1.18g/(kW·h),SCR上游NOx排放平均值為486.0×10-6、下游排放平均值為116.0×10-6,SCR上游排氣溫度平均值為271.1℃.
圖2 熱態(tài)WHTC循環(huán)下的NOx排放Fig.2 NOx emissions during hot WHTC cycle
針對(duì)整車,根據(jù)GB 17691—2018實(shí)際道路行駛測(cè)量方法(PEMS),進(jìn)行整車路譜工況數(shù)據(jù)采集,發(fā)動(dòng)機(jī)臺(tái)架進(jìn)行路譜模擬,包括10%負(fù)荷和100%負(fù)荷兩種應(yīng)用場(chǎng)景.圖3為路譜工況,10%負(fù)荷的路譜平均轉(zhuǎn)速為1133r/min,平均轉(zhuǎn)矩為416N·m;100%負(fù)荷的路譜平均轉(zhuǎn)速為1131r/min,平均轉(zhuǎn)矩為877N·m.整車PEMS雖然只認(rèn)證整車排放,并不認(rèn)證NOx排放故障診斷功能,但因?yàn)镻EMS認(rèn)證是基于整車的實(shí)際道路工況,適合驗(yàn)證NOx排放故障診斷策略的整車適應(yīng)性.因此,用PEMS認(rèn)證的整車工況驗(yàn)證NOx排放故障診斷策略的整車適應(yīng)性.
圖3 路譜工況Fig.3 Working condition of road spectrum
采集正常SCR催化消聲器的整車路譜試驗(yàn)數(shù)據(jù),10%負(fù)荷和100%負(fù)荷的NOx排放分別為0.34g/(kW·h)、0.59g/(kW·h),滿足PEMS法規(guī)要求,10%負(fù)荷、100%負(fù)荷路譜的SCR上游NOx排放平均值分別為501.7×10-6、687.8×10-6,下游NOx排放平均值分別為3.6×10-6、25.7×10-6,SCR上游排氣溫度平均值分別為274.3℃、314.0℃.
采集劣化SCR催化消聲器的整車路譜試驗(yàn)數(shù)據(jù),10%負(fù)荷和100%負(fù)荷的NOx排放分別為1.71g/(kW·h)、1.66g/(kW·h);10%負(fù)荷和100%負(fù)荷的路譜的SCR上游NOx排放平均值分別為484.5×10-6、755.3×10-6,下游NOx排放平均值分別為100.4×10-6、99.8×10-6;SCR上游排氣溫度平均值分別為265.2℃、345.1℃.
灰色關(guān)聯(lián)度分析(GRA)是一種用于多因素分析的統(tǒng)計(jì)方法,在一個(gè)灰色系統(tǒng)中,評(píng)價(jià)結(jié)果受其他誘發(fā)因素影響的相對(duì)強(qiáng)弱,通過(guò)灰色關(guān)聯(lián)度來(lái)衡量相似或相異程度[13].相比其他分析方法,灰色關(guān)聯(lián)度分析在樣本多少及樣本有無(wú)規(guī)律的情況下同樣適用[5],數(shù)據(jù)處理的流程如下.
(1) 確定灰色關(guān)聯(lián)度分析法的比較矩陣(轉(zhuǎn)速、噴油量、冷卻液溫度、SCR上/下游NOx排放、SCR上/下游排氣溫度、廢氣流量、尿素噴射量、機(jī)油壓力、中冷后溫度、中冷后壓力、排氣背壓和煙度,共14個(gè)變量)和參考矩陣(NOx排放,將NOx體積流量轉(zhuǎn)化為NOx排放),將各參數(shù)與NOx排放進(jìn)行關(guān)聯(lián),來(lái)判斷不同參數(shù)變化對(duì)NOx排放的影響,即
通過(guò)除以矩陣每列的最大值將量綱歸一化為
(2) 計(jì)算灰色關(guān)聯(lián)系數(shù)為
(3) 計(jì)算灰色關(guān)聯(lián)度,比較矩陣和參考矩陣的灰色關(guān)聯(lián)度為
式中:Xi、Y0分別為比較矩陣和參考矩陣;n、i分別為輸入特征變量的個(gè)數(shù)和數(shù)據(jù)采集的條數(shù);ξ0i(k)為第k個(gè)特征輸入的關(guān)聯(lián)系數(shù);γ0i[Y0, Xi′(k)]為第k個(gè)特征輸入的關(guān)聯(lián)度;ρ為分辨系數(shù),設(shè)定值為0.5.
根據(jù)式(5)可以得到灰色關(guān)聯(lián)度向量,通過(guò)大小次序可以判斷出各變量對(duì)NOx排放的影響程度,圖4所示灰色關(guān)聯(lián)度的前8位,都大于0.85,根據(jù)關(guān)聯(lián)度分析和工程經(jīng)驗(yàn),將轉(zhuǎn)速、噴油量、SCR上/下游NOx排放、SCR上/下游排氣溫度、廢氣流量及尿素噴射量共8個(gè)變量作為最終的輸入特征,特征輸入能夠很好地描述柴油機(jī)的工作狀況,且符合比較容易準(zhǔn)確獲取的原則[7-8].
圖4 灰色關(guān)聯(lián)度分析Fig.4 Grey correlation analysis
NOx排放的故障診斷結(jié)果為診斷模型的輸出結(jié)果,NOx排放為參考矩陣,最終確定的8個(gè)變量作為診斷模型的特征輸入.
圖5 為歸一化數(shù)據(jù)處理后的時(shí)間窗口持續(xù)時(shí)間以及間隔時(shí)間,為清晰地表達(dá)時(shí)間動(dòng)態(tài)變化過(guò)程,將輸入特征進(jìn)行預(yù)處理,取時(shí)間窗口的特征平均值、方差值分別代表發(fā)動(dòng)機(jī)當(dāng)前的運(yùn)行狀態(tài)與穩(wěn)定性,作為診斷模型的特征輸入.
圖5 特征輸入的時(shí)間窗口Fig.5 Time window for feature input
采用時(shí)間窗口法進(jìn)行NOx排放診斷,測(cè)試數(shù)據(jù)從0s開始,隨著測(cè)試的進(jìn)行,累積時(shí)間逐漸增加,當(dāng)累積時(shí)間達(dá)到系統(tǒng)設(shè)定值時(shí)停止計(jì)算,間隔時(shí)間達(dá)到設(shè)定值后,重新進(jìn)行時(shí)間窗口計(jì)算,如圖6所示.特征輸入計(jì)算式為
圖6 時(shí)間窗口特征輸入計(jì)算示意Fig.6 Schematic diagram of feature input calculation for time window
發(fā)動(dòng)機(jī)在低負(fù)荷區(qū),后處理的溫度低,轉(zhuǎn)化效率降低,易產(chǎn)生故障診斷的誤報(bào)錯(cuò);在高負(fù)荷區(qū),后處理溫度高,且廢氣流量較大,后處理的化學(xué)反應(yīng)處在極限條件下,也易產(chǎn)生故障診斷的誤報(bào)錯(cuò).基于上述問(wèn)題,限定發(fā)動(dòng)機(jī)NOx排放故障診斷的放行范圍如表4所示.其中,SCR排氣溫度是SCR上/下游排氣溫度的算術(shù)平均值.
表4 診斷放行范圍Tab.4 Diagnose release range
滿足診斷放行邊界后,發(fā)動(dòng)機(jī)及SCR系統(tǒng)需要一定的延遲時(shí)間進(jìn)入穩(wěn)定工作狀態(tài),狀態(tài)穩(wěn)定后放行故障診斷,提高故障診斷穩(wěn)定性,避免誤診斷,參考文獻(xiàn)[2,4—5]放行延遲時(shí)間,取值為10s.
對(duì)于如何區(qū)分正常與劣化的SCR催化消聲器,可以抽象為時(shí)間序列分類問(wèn)題,用于數(shù)據(jù)分類的模型有SVM、PNN和LSTM等.其中,SVM是建立在統(tǒng)計(jì)學(xué)習(xí)理論上,SVM模型將向量映射到一個(gè)更高維的空間里,在這個(gè)空間里建立一個(gè)最大間隔超平面H,在超平面H的兩邊建有兩個(gè)互相平行的超平面H1、H2,平行超平面間的距離越大,分類器的總誤差越小,SVM遵循結(jié)構(gòu)風(fēng)險(xiǎn)最小化原理,泛化能力強(qiáng)[14-15];PNN是用線性學(xué)習(xí)算法來(lái)完成非線性模式分類工作,能夠達(dá)到快速分類處理的效果,PNN模型具備結(jié)構(gòu)簡(jiǎn)潔、訓(xùn)練難度小并且收斂速度快等優(yōu)點(diǎn)[16-18];LSTM是為了解決長(zhǎng)期以來(lái)的問(wèn)題而專門設(shè)計(jì)出來(lái)的,LSTM能夠存儲(chǔ)并傳遞長(zhǎng)期記憶和短期記憶,并將其用于當(dāng)前的數(shù)據(jù)預(yù)測(cè)中,時(shí)間越臨近,對(duì)當(dāng)前數(shù)據(jù)預(yù)測(cè)的影響權(quán)重越大,訓(xùn)練工作量大,學(xué)習(xí)時(shí)間長(zhǎng),特別適合預(yù)測(cè)復(fù)雜的連續(xù)時(shí)間數(shù)據(jù)[5,19].
對(duì)于NOx排放故障診斷這種復(fù)雜的時(shí)間序列分類問(wèn)題,將連續(xù)時(shí)間數(shù)據(jù)處理為時(shí)間窗口,弱化了窗口之間的時(shí)間先后影響,理論上并不能發(fā)揮LSTM的優(yōu)勢(shì).考慮到ECU計(jì)算能力,不可能做到實(shí)時(shí)的機(jī)器學(xué)習(xí)和參數(shù)優(yōu)化,只能離線學(xué)習(xí),在線使用,因而在考慮準(zhǔn)確率的基礎(chǔ)上,還要求高泛化性能,即模型要適應(yīng)WHTC循環(huán)和不同的路譜工況,而PNN通常需要更多的數(shù)據(jù)對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練才能進(jìn)一步提高網(wǎng)絡(luò)模型的故障診斷準(zhǔn)確率[16-18],PNN相對(duì)不適用于此應(yīng)用場(chǎng)景.因此,最終選擇SVM算法研究NOx排放故障診斷.
3.2.1 SVM模型
使用SVM算法進(jìn)行分類處理,SVM算法核心思想是在特征空間中找到最優(yōu)分類面,使帶有不同標(biāo)簽的特征向量到最優(yōu)分類面的距離最大化.圖7為SVM模型架構(gòu)示意,最優(yōu)分類超平面H的公式為
圖7 SVM模型架構(gòu)示意Fig.7 Architecture diagram of SVM model
式中:m為訓(xùn)練集樣本數(shù)量;i為樣本空間中第i個(gè)樣本;w為權(quán)值矩陣;b為偏置;C為懲罰因子;a為拉格朗日系數(shù),取值為1;iξ為松弛變量.
對(duì)樣本的輸入特征值進(jìn)行標(biāo)準(zhǔn)化,消除量綱的影響,即
式中:x為標(biāo)準(zhǔn)化前的樣本點(diǎn);x′為標(biāo)準(zhǔn)化后的樣本點(diǎn);μ為樣本的均值;σ為樣本的標(biāo)準(zhǔn)差.將發(fā)動(dòng)機(jī)NOx排放超1.2的狀態(tài)記作故障狀態(tài),輸出標(biāo)定為1;不超1.2的狀態(tài)記作正常狀態(tài),輸出標(biāo)定為0.
3.2.2 核函數(shù)選擇
常見的核函數(shù)主要包括線性核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)(RBF)等,采用徑向基核函數(shù)完成低維特征到高維特征的映射[6,20],徑向基核函數(shù)通常根據(jù)樣本數(shù)據(jù)ix與樣本數(shù)據(jù)中心點(diǎn)xj之間的歐氏距離來(lái)定義其在高維特征中的值.通常,樣本數(shù)據(jù)距離樣本中心越近將會(huì)有更大的特征映射值,距離樣本中心越遠(yuǎn)將會(huì)有更小的特征映射值,其表達(dá)式為
3.2.3 學(xué)習(xí)算法
由于SVM是借助二次規(guī)劃來(lái)求解支持向量,當(dāng)樣本數(shù)量較大時(shí),特征輸入矩陣計(jì)算的復(fù)雜度較大,針對(duì)此問(wèn)題,采用序列最小優(yōu)化(SMO)的啟發(fā)式算法[8-10],ξi的定義是降低了異常點(diǎn)對(duì)分類模型的影響,在實(shí)際的推導(dǎo)過(guò)程中轉(zhuǎn)變?yōu)? ≤ ai≤ C 的約束條件,通過(guò)拉格朗日函數(shù),SVM最優(yōu)超平面的目標(biāo)函數(shù)可優(yōu)化為
式中:iα為拉格朗日因子;iy為樣本觀測(cè)值.SMO算法通過(guò)每次只優(yōu)化兩個(gè)變量,將其他的變量都視為常數(shù),通過(guò)反復(fù)迭代求得權(quán)重w與偏置b,使樣本點(diǎn)最終滿足Karush-Kuhn-Tucker(KKT)條件,KKT的條件為
式中:yi為第i個(gè)樣本的觀測(cè)值;wxi+b為第i個(gè)樣本的預(yù)測(cè)值;α*i為拉格朗日因子的解.
3.3.1 貝葉斯優(yōu)化算法
貝葉斯優(yōu)化算法(Bayesian optimization,BO)是一種基于后驗(yàn)概率的尋優(yōu)方式[5],其核心思想在于根據(jù)高斯先驗(yàn)擴(kuò)充目標(biāo)函數(shù)的統(tǒng)計(jì)學(xué)模型,利用統(tǒng)計(jì)模型尋找目標(biāo)函數(shù)的最優(yōu)位置.其優(yōu)化過(guò)程如下.
(1)通過(guò)當(dāng)前樣本建立高斯過(guò)程回歸模型(Gaussian process,GP),即
式中:X、y分別為樣本的屬性和觀測(cè)值;X*為待預(yù)測(cè)的樣本集合;,若考慮到輸入數(shù)據(jù)的噪聲方差 nσ,則有,I為單位矩陣,K由平方指數(shù)協(xié)方差函數(shù)k(x,x′|θ)所得,一般描述的公式為
(2) 選取目標(biāo)函數(shù)所對(duì)應(yīng)的最優(yōu)解作為下一個(gè)迭代更新的指標(biāo),通過(guò)擴(kuò)充樣本數(shù)據(jù)來(lái)完成迭代尋優(yōu)的算法,當(dāng)前最優(yōu)解的均值與方差將會(huì)決定下次尋優(yōu).貝葉斯尋優(yōu)過(guò)程如式(19)所示.
式中:μ、σ分別是樣本空間D中點(diǎn)x點(diǎn)的均值與方差;β用于調(diào)節(jié)平均值和標(biāo)準(zhǔn)差的重要程度,取值為1.為了避免陷入尋優(yōu)局部最小值,在迭代尋優(yōu)過(guò)程中若當(dāng)前最優(yōu)解的方差σ<tσ(設(shè)定tσ為0.5),將判定當(dāng)前尋優(yōu)陷入局部最優(yōu)解,此時(shí)將修改高斯過(guò)程模型中協(xié)方差函數(shù) k(x, x′|θ)的核參數(shù)θ,將核參數(shù)θ乘以當(dāng)前迭代次數(shù),并更新尋優(yōu)模型.通過(guò)反復(fù)迭代直到滿足迭代終止條件,獲得目標(biāo)函數(shù)的最優(yōu)解.
3.3.2 參數(shù)優(yōu)化
SVM算法的權(quán)重矩陣w與偏置b在訓(xùn)練的過(guò)程中能夠自動(dòng)地迭代更新,而模型的徑向基因子g和懲罰因子C是超參數(shù),合理地選擇超參數(shù)能夠有效地提升分類模型的準(zhǔn)確性[5-6].利用貝葉斯優(yōu)化算法優(yōu)化分類模型超參數(shù),設(shè)在D維參數(shù)空間中,通過(guò)擴(kuò)充滿足邊界條件內(nèi)的目標(biāo)函數(shù)最優(yōu)值,最終到達(dá)模型最優(yōu)位置,如圖8所示.貝葉斯優(yōu)化SVM模型主要包括初始化、目標(biāo)函數(shù)計(jì)算、更新尋優(yōu)模型和迭代尋優(yōu)等操作[6-7].
圖8 故障診斷模型的建模過(guò)程示意Fig.8 Modeling process of fault diagnosis model
懲罰因子C與徑向基因子g構(gòu)造尋優(yōu)參數(shù)Xi=(CXi, gXi),CXi的變化范圍為[0.0001,100000],gXi的變化范圍為[0.0001,100000],最大進(jìn)化次數(shù)為50,損失函數(shù)定義為
式中:n為驗(yàn)證集樣本數(shù)量;y?j為預(yù)測(cè)值;yj為實(shí)值;I{}為指示函數(shù);wj為樣本觀測(cè)值權(quán)重.
利用5折交叉驗(yàn)證進(jìn)行完成模型尋優(yōu)[5],損失函數(shù)如圖9a所示.當(dāng)時(shí)間窗口為105s時(shí),超參數(shù)優(yōu)化過(guò)程如圖9b所示,經(jīng)貝葉斯優(yōu)化后,懲罰因子C為2.94,徑向基因子g為1.96,WHTC訓(xùn)練集上診斷準(zhǔn)確率從86.63%提高到99.61%.
圖9 貝葉斯優(yōu)化過(guò)程Fig.9 Bayesian optimization process
根據(jù)式(21)計(jì)算NOx排放故障診斷準(zhǔn)確率.
式中:η為準(zhǔn)確率;rw為診斷正確的窗口數(shù);sw為有效窗口總數(shù).
對(duì)比了時(shí)間窗口時(shí)長(zhǎng)對(duì)診斷準(zhǔn)確率的影響,如圖10所示.其中,WHTC-PEMS表示“-”前面數(shù)據(jù)作為訓(xùn)練集,“-”后面數(shù)據(jù)作為測(cè)試集.隨著窗口時(shí)間的延長(zhǎng),模型預(yù)測(cè)準(zhǔn)確率逐漸上升并最終趨于穩(wěn)定,繼續(xù)延長(zhǎng)時(shí)間窗口意義不大,甚至準(zhǔn)確率反而下降,拐點(diǎn)大約在105s.結(jié)合工程應(yīng)用,推薦時(shí)間窗口取值為105s,此時(shí)利用WHTC作為模型訓(xùn)練集,在PEMS數(shù)據(jù)上的故障診斷準(zhǔn)確率達(dá)到96.99%.其他測(cè)試集與訓(xùn)練集的建模組合,其模型故障診斷準(zhǔn)確率均可達(dá)到99%以上,說(shuō)明SVM模型具備良好的泛化性能.
圖10 時(shí)間窗口時(shí)長(zhǎng)對(duì)診斷準(zhǔn)確率的影響Fig.10 Influence of time window duration on diagnostic accuracy
WHTC與PEMS工況的數(shù)據(jù)分布對(duì)比如圖11所示.對(duì)于轉(zhuǎn)速分布規(guī)律,WHTC與PEMS工況相比,WHTC、10%負(fù)荷PEMS工況和100%負(fù)荷PEMS工況在低轉(zhuǎn)速工況區(qū)間(1000r/min以下)的數(shù)據(jù)占比分別為16.7%、6.4%和14.3%;在中間轉(zhuǎn)速工況區(qū)間(1000~1300r/min)的數(shù)據(jù)占比分別為74.4%、92.3%和 65.5%;在高轉(zhuǎn)速工況區(qū)間(1300r/min以上)的數(shù)據(jù)占比分別為8.9%、1.2%和20.2%.WHTC的低轉(zhuǎn)速工況區(qū)間數(shù)據(jù)比較完整,中間、高轉(zhuǎn)速工況區(qū)間數(shù)據(jù)相對(duì)不完整.對(duì)于噴油量分布(與負(fù)荷分布相當(dāng)),WHTC與PEMS工況相比,WHTC、10%負(fù)荷PEMS工況和100%負(fù)荷PEMS工況在低噴油量工況區(qū)間(75mg/ cyc以下)其數(shù)據(jù)占比分別為40.5%、57.5%和24.0%;在中間噴油量工況區(qū)間(75~150mg/cyc)的數(shù)據(jù)占比分別為44.2%、42.5%和51.3%;在高噴油量工況區(qū)間(150mg/cyc以上)的數(shù)據(jù)占比分別為15.3%、0.0%和24.7%.WHTC在低、中間噴油量工況區(qū)間數(shù)據(jù)比較完整,高噴油量工況區(qū)間數(shù)據(jù)相對(duì)不完整.
圖11 WHTC與PEMS工況數(shù)據(jù)分布對(duì)比Fig.11 Comparison of distribution of working condition data between WHTC and PEMS
只利用WHTC數(shù)據(jù)訓(xùn)練故障診斷模型,在PEMS數(shù)據(jù)進(jìn)行驗(yàn)證,由于訓(xùn)練數(shù)據(jù)在中間、高轉(zhuǎn)速工況區(qū)間與高噴油量工況區(qū)間的數(shù)據(jù)相對(duì)不完整,會(huì)影響模型在對(duì)應(yīng)工況區(qū)間的故障診斷準(zhǔn)確率.WHTC數(shù)據(jù)作為訓(xùn)練集,PEMS數(shù)據(jù)作為測(cè)試集,故障診斷模型在10%負(fù)荷、100%負(fù)荷PEMS工況的故障診斷準(zhǔn)確率分別為98.67%和94.81%,如表5所示,高負(fù)荷的診斷準(zhǔn)確率相對(duì)較低,與分析結(jié)果相符.不同SCR狀態(tài)下,故障診斷模型在柴油機(jī)PEMS工況數(shù)據(jù)的診斷準(zhǔn)確率分別為97.29%、96.69%,正常與裂化SCR催化消聲器的診斷準(zhǔn)確率差異不大,見表6.
表5 不同負(fù)荷下柴油機(jī)PEMS工況數(shù)據(jù)的故障診斷準(zhǔn)確率Tab.5 Fault diagnostic accuracy of diesel engine PEMS operating data under different loads
表6 不同狀態(tài)下柴油機(jī)PEMS工況數(shù)據(jù)的故障診斷準(zhǔn)確率Tab.6 Fault diagnostic accuracy of diesel engine PEMS operating data under different conditions
在Matlab中建立PNN模型[11-13]與LSTM模型[5],PNN拓?fù)浣Y(jié)構(gòu)為:1層輸入層,5層隱藏層,1層分類層;LSTM的拓?fù)浣Y(jié)構(gòu)為:1層輸入層,1層LSTM層,2層全連接層,1層分類輸出層.采用相同的方法訓(xùn)練并優(yōu)化超參數(shù),PNN的超參數(shù)主要為隱藏層神經(jīng)元個(gè)數(shù)與徑向基因子,LSTM的超參數(shù)主要為L(zhǎng)STM層神經(jīng)元個(gè)數(shù)、批處理尺寸及學(xué)習(xí)率.表7為不同模型對(duì)PEMS試驗(yàn)數(shù)據(jù)的診斷準(zhǔn)確率,說(shuō)明SVM模型在面對(duì)未知輸入時(shí),依然能夠利用訓(xùn)練集數(shù)據(jù),結(jié)合時(shí)間窗口計(jì)算和放行條件,使得SVM模型相對(duì)PNN和LSTM具有更高的泛化能力.
表7 不同模型的故障診斷準(zhǔn)確率Tab.7 Fault diagnosis accuracy of different models
(1) 建立了基于時(shí)間窗口和SVM的NOx排放故障診斷模型,以轉(zhuǎn)速、噴油量、SCR系統(tǒng)上/下游NOx排放、排氣流量、SCR系統(tǒng)上/下游排氣溫度和尿素噴射量作為模型輸入特征,利用WHTC循環(huán)和PEMS試驗(yàn)數(shù)據(jù)進(jìn)行訓(xùn)練和驗(yàn)證,能夠取得較高的診斷準(zhǔn)確率.
(2) WHTC循環(huán)試驗(yàn)數(shù)據(jù)作為訓(xùn)練集,貝葉斯參數(shù)優(yōu)化后,模型對(duì)PEMS試驗(yàn)數(shù)據(jù)的故障診斷準(zhǔn)確率達(dá)到96.99%,同時(shí)在不同的訓(xùn)練集、驗(yàn)證集組合中都能夠保持99%以上的故障診斷準(zhǔn)確率,說(shuō)明模型具有較高的泛化性能.
(3) 對(duì)比PNN及LSTM神經(jīng)網(wǎng)絡(luò)等其他類型模型,基于時(shí)間窗口與SVM的NOx排放故障診斷模型具有更高的診斷準(zhǔn)確率和泛化性能.