劉洋,潘金沖,張云龍,帥石金
(清華大學汽車安全與節(jié)能國家重點實驗室,北京 100084)
為應對日趨嚴峻的環(huán)境問題,集成三效催化轉化器(Three-Way Catalytic Converter,TWC)和汽油機顆粒捕集器(Gasoline Particulate Filter,GPF)的后處理系統已經逐漸成為汽油車的標準配置。后處理系統在使用過程中可能發(fā)生故障,這不僅會影響發(fā)動機管理系統(Engine Management System,EMS)的正常運行,也會在很大程度上造成車輛排放和動力性能惡化。根據《輕型汽車污染物排放限值及測量方法(中國第六階段)》中的要求,汽油車需要具備車載診斷系統(On-Board Diagnostics,OBD)的功能,后處理系統相關傳感器和部件的診斷正是其中重要的一環(huán)。
TWC老化失效是OBD法規(guī)中要求診斷的主要故障之一,到目前為止已經發(fā)展了近二十年。從總體趨勢來看,診斷條件由穩(wěn)態(tài)、固定閾值拓展到非穩(wěn)態(tài)、動態(tài)閾值[1-3],診斷策略由基于傳感器信號過渡到基于經驗或機理模型的方法[4-6]。目前TWC老化診斷主要面臨建模困難、標定工作量大等問題。
近年來,隨著“深度學習”概念的提出,有關神經網絡的研究和應用在各個領域內迎來了新的熱潮。基于神經網絡的智能化方法在解決復雜故障診斷問題時具有其獨特優(yōu)勢[7-9]。本研究同時應用反向傳播神經網絡(Back Propagation Neural Network,BPNN)和深度置信網絡(Deep Belief Network,DBN)進行TWC老化診斷策略的開發(fā)和驗證。
BPNN分為工作信號正向傳遞和誤差信號反向傳遞兩個子過程。其結構由一個輸入層、一個輸出層還有若干隱層組成,每層均含有一定數量的神經元節(jié)點。1989年Robert Hecht-Nielsen通過數學方法證明了單隱層BPNN可以逼近閉區(qū)間內的任意連續(xù)函數[10],從而表明了BPNN在解決非線性分類問題上的優(yōu)勢。
以一個常見的單隱層BPNN為例(見圖1),每一層節(jié)點的輸入僅來自于前一層節(jié)點的輸出。輸入信號先前向傳播到隱層節(jié)點,經過激活函數映射后,再將隱層的輸出信息傳播到輸出節(jié)點,最后得到輸出結果。該過程可用如下公式描述:
(1)
xj=f(Sj)。
(2)
式中:xi為第i個神經元節(jié)點的輸出;xj為第j個神經元節(jié)點的輸出;wij為節(jié)點i和節(jié)點j的權值;bj為節(jié)點j的偏置;f為激活函數,一般選擇sigmoid或線性函數。
圖1 BPNN結構
在BPNN中,誤差函數表達為
(3)
式中:yk為神經網絡的理論輸出;yk′為神經網絡的實際輸出。
誤差信號反向傳遞的過程即BPNN的訓練過程,其基于Widrow-Hoff學習規(guī)則,沿著相對誤差平方和的最速下降方向,連續(xù)調整網絡的權值和偏置,使得誤差函數達到最小值。其調參順序由輸出層到隱層開始,由隱層到輸入層結束。
DBN是一個概率生成模型,由多倫多大學的Geoff Hinton提出[11]。DBN由若干受限玻爾茲曼機(Restricted Boltzmann Machine,RBM)串聯組成,每層RBM的輸出將作為下一層的輸入。
RBM的結構見圖2,其由一個顯層和一個隱層構成,兩層若干個神經元之間均為雙向連接。
圖2 RBM雙向連接結構
類似BP神經網絡,RBM的層級參數有權重w、顯層偏置b和隱層偏置c。RBM的能量公式為
(4)
式中:vi為第i個顯層神經元的取值;hj為第j個隱層神經元的取值;wij為兩層之間的權值;bi和cj分別為顯層和隱層的偏置,表示在每一個可見節(jié)點的取值和每一個隱層節(jié)點的取值之間都存在一個能量值。隱層神經元和顯層神經元被激活的概率為
P(hj|v)=σ(cj+∑iwijvi),
(5)
P(vi|h)=σ(bi+∑jwijhj)。
(6)
式中:σ為sigmoid函數,也可以根據情況選擇其他函數。
RBM的工作原理由式(7)所描述,其中x為輸入向量,μ為[0,1]內的隨機數,由此可以得到隱層/顯層的每個神經元的激活結果。
hj=1,P(hj|x)≥μ;hj=0,P(hj|x)<μ。
(7)
vi=1,P(vi|x)≥μ;vi=0,P(vi|x)<μ。
(8)
RBM采用對比散度算法進行網絡的訓練[12],具體步驟如下:
1) 令初始值v0=x0,由式(5)對所有隱層神經元計算得到P(h0=1|v0),由gibbs采樣原理從中抽取h0~P(h0|v0)。
2) 對所有顯層神經元,按照式(6)計算得到P(v1=1|h0),從中抽取v1~P(v1|h0)。
3) 通過v1再次計算隱層中每個神經元被激活的概率,得到P(h1=1|v1)。
4) 對RBM參數進行更新:
w←w+λ[P(h0=1|v0)v0T-
P(h1=1|v1)v1T];
b←b+λ(v0-v1);
c←c+λ[P(h0=1|v0)-P(h1=1|v1)]。
從DBN的結構組成和算法原理中可以看出其具有強大的特征提取能力,近年來對于DBN的實際應用也不斷證實了這種觀點[13-14]。當然,DBN本質上是深層的神經網絡,其對模型訓練和求解的硬件載體相對于BPNN有更高的要求。
神經網絡的故障診斷本質上是應用神經網絡的特點解決分類問題,其具體流程見圖3。
圖3 神經網絡診斷流程
首先,需要通過傳感器采集被診斷部件的相應信息,為了使診斷結果適應于不同背景,需要保證提供原始數據的部件與其他同類部件之間具有良好的一致性。同時,為避免大的數據波動,需要保證采集工作在較穩(wěn)定的狀態(tài)下進行。
其次,需要對原始數據進行預處理,包括數據篩選和特征提取兩部分。其中特征提取過程為神經網絡提供了重要的輸入數據集,應保證提取的特征向量之間擁有較高的非相關性,并且需要根據具體情況對特征數據進行歸一化處理。
隨后,從總的特征數據中提取訓練數據集進行神經網絡的訓練。訓練過程將離線進行,不斷調節(jié)相關訓練參數優(yōu)化訓練時間和收斂結果。
最后,提取測試數據集并對訓練完畢的神經網絡診斷模型進行驗證。根據診斷結果精度,對上述各環(huán)節(jié)進行反饋和調整。
氧傳感器是TWC系統的重要電子部件,一般在TWC前后各布置一個。目前常用的氧傳感器有兩種類型,分別為階躍型氧傳感器和寬氧傳感器,兩者輸出特性曲線不同。為便于對信號進行對比,TWC前后氧傳感器均使用階躍型氧傳感器。
TWC工作時的機理主要由以下反應描述[15]:
(9)
對于新鮮的TWC,其中的鈰氧化物具有良好的儲氧能力,當發(fā)動機的工作狀態(tài)偏離理論空燃比(偏稀或偏濃時),TWC將對這種變化作出響應,進行相應的儲氧和放氧過程,從而使得TWC后端的排氣始終保持在理論空燃比左右(見圖4),此時TWC的轉化效率最高;由于高溫、催化劑中毒等原因,TWC逐漸老化,其儲氧能力不斷下降,即最大儲氧量不斷減少,此時TWC后的排氣不再維持在理論空燃比,而是產生一定程度的波動(見圖5),此時TWC轉化效率下降;當TWC老化達到臨界狀態(tài)時,催化劑基本喪失儲氧能力,TWC前后氧傳感器的電壓信號將趨于一致(見圖6)。
圖4 新鮮TWC前后氧傳感器信號對比
圖5 老化TWC前后氧傳感器信號對比
圖6 臨界TWC前后氧傳感器信號對比
常規(guī)的TWC老化診斷策略采用振幅模型化法[16],通過大量試驗建立TWC老化的經驗模型或儲氧量動態(tài)模型。在實車運行中用實際采集到的后氧傳感器信號與模型預測的后氧信號作對比,結合閾值判斷TWC的老化程度。這種診斷策略的主要問題是動態(tài)模型建模復雜,且在各穩(wěn)態(tài)工況下標定相關參數的工作量很大。而采用神經網絡開發(fā)TWC診斷算法的優(yōu)點在于:神經網絡本質上是一種“黑箱”模型,在建模過程中已知TWC系統的輸入輸出參數就可以擬合出相應的表達式;基于網絡訓練的調參過程只需要手動設置初始參數,其余過程完全由算法自動執(zhí)行。
構建神經網絡數據集的原始數據來源于TWC實車試驗數據,試驗用車參數見表1。
表1 試驗用整車參數
催化器老化在天津索克臺架上按照GM875循環(huán)進行,得到16萬km老化和臨界老化的TWC樣件。在實車上分別安裝連同新鮮TWC在內的3種不同老化程度的樣件,運行NEDC循環(huán)。以50 Hz采樣頻率對TWC前后氧傳感器信號進行采集,部分結果見圖7。
圖7 NEDC循環(huán)臨界TWC前后氧傳感器信號采集
后氧傳感器的信號波形可以直觀地表現TWC的老化情況,故用平均值和標準差2個時域參數對其進行描述。前氧傳感器的電壓信號實質上是發(fā)動機所有工況信息的集中體現,也需要提取其波形中的信息。為了消除前氧傳感器信號的不確定性影響[17],將前后氧傳感器的均值和標準差做差,最終以前后氧傳感器均值的差值、前后氧傳感器標準差的差值、后氧傳感器的均值和后氧傳感器的標準差作為故障特征輸入,分別記為UFR_AVG,UFR_SD,UR_AVG和UR_SD。
以1 s為單位對原始數據加時間窗分段處理,對于得到的每段數據求算4個時域參數作為輸入。為了取得較好的訓練結果,隨機地抽取每一種TWC狀態(tài)的時域參數組合。最終構成2 400×4的輸入數據集,包含3種TWC老化狀態(tài)各800組。部分輸入數據集見表2。
表2 TWC老化診斷輸入數據集(部分)
為定量描述三種TWC的老化狀態(tài),對其進行向量形式的編碼,結果見表3。故障向量與輸入一一對應,構成總行數相同的輸出數據集。
表3 TWC老化故障編碼
將數據集分為訓練集和測試集,根據神經網絡數據集分類的常規(guī)要求,按照3∶1比例選取1 800組作為訓練樣本,600組作為測試樣本。根據原始數據計算的輸入參數可能在[0,1]范圍之外,故需要對訓練數據和測試數據進行相同算法的歸一化處理,本研究中采用的歸一化算法如下:
(10)
式中:x和y分別為歸一化前和歸一化后的結果;xmax和xmin分別為x中的最大值和最小值。
神經網絡訓練參數的選取將對網絡訓練和測試結果造成較大影響,本研究重點考慮隱層節(jié)點數、激活函數、學習次數、收斂精度和學習率。經過大量試驗,最終選擇含有3個隱層的神經網絡作為診斷模型的基本結構,其中輸入層含4個節(jié)點,輸出層含3個節(jié)點,三個隱層各含50,10,10個節(jié)點;激活函數選擇logsig,學習次數設置為5 000次,收斂精度取0.01,學習率取0.01。神經網絡及訓練結果見圖8至圖11。
圖8 神經網絡結構
圖9 神經網絡訓練曲線
圖10 神經網絡訓練狀態(tài)
圖11 網絡訓練回歸曲線
從神經網絡的訓練結果看出,當學習次數達到設定的上限5 000次時,最優(yōu)收斂誤差為0.082 701。在前500次學習過程中,學習曲線的收斂速度很快,但隨著學習次數的增加,收斂速度趨于平緩。該趨勢表明此時繼續(xù)增加學習次數對提升收斂的意義不大,也證明了在給定的數據集下,神經網絡的訓練結果總存在一個上限。過度增加學習次數容易出現過擬合現象。
使用測試集對訓練完畢的BPNN進行驗證,部分測試輸出見表4。由表4可知,由于新鮮和老化TWC的后氧傳感器信號較為相似,所以兩者中部分輸出向量的對應分量存在數值接近的情況,導致誤診發(fā)生,而臨界TWC輸出向量的對應分量則區(qū)分度明顯。反映到實際診斷精度上,3種不同狀態(tài)TWC的總體診斷精度為79.52%,新鮮TWC的診斷精度為76.15%,16萬km老化TWC的診斷精度為66.55%,臨界TWC診斷精度則為95.85%,完全符合其故障向量輸出分布情況。
表4 TWC老化診斷結果(部分)
對于在實際工況下運行的TWC系統,基于BPNN的診斷方法將面臨兩方面的問題:一方面是實際工況多變而復雜,氧傳感器的電壓信號隨老化狀態(tài)的變化不再像穩(wěn)態(tài)工況下那么直觀,故障特征值的維度將提高;另一方面,按照上述特征提取方法進行數據處理必然會在一定程度上占用控制器的計算資源,影響診斷的實時性。而且這種方法本質上也基于經驗,其可靠性在復雜診斷條件下難以保證。由于DBN在特征提取能力方面的優(yōu)勢,對基于DBN的TWC診斷模型進行訓練和驗證。
DBN的模型機制使其在訓練數據方面相比于傳統神經網絡擁有更大的需求,由于實際獲得的原始數據往往有限,所以需要采用深度學習中常用的數據增強[18]對DBN數據集進行擴充,這里選擇在原始數據集上疊加隨機噪聲的方法。對采集到的前后氧傳感器原始數據分別進行2 s的時間加窗預處理,得到1 200×200的輸入數據集;采用awgn函數分別加入信噪比為20 dB,30 dB,40 dB和50 dB的噪聲,最終將數據集擴充為6 000×200。
DBN的訓練過程包含了預訓練和微調兩部分。首先初始化DBN各層參數;然后輸入訓練集對每層RBM進行訓練和堆疊,完成DBN的訓練;最后DBN通過dbnunfoldtonn函數將預訓練參數傳遞給BP神經網絡進行微調,在預訓練結果收斂到目標值附近后,采用BP算法進一步逼近。DBN參數設置與BPNN主要不同在于對預訓練參數的設置,并且由于數據量的增大,引入了batchsize(批大小)變量對數據進行分組訓練。經過大量的網絡訓練試驗,選取最優(yōu)的參數組合(見表5)。
表5 DBN參數設置
使用測試集對訓練完畢的DBN神經網絡進行驗證,計算診斷精度并與BP神經網絡進行對比,結果見表6??梢?,基于DBN的TWC老化診斷算法在簡化了特征提取過程的同時,精度相比于基于BP神經網絡的診斷精度提升了11.23%,達到90.75%。但作為代價,訓練時間增加為原來的7.76倍,模型運算次數也增加為原來的37.06倍。在實際汽油車TWC診斷上的應用,應當權衡精度、時間成本與單片機性能三者,進行算法的合理選擇。
表6 基于神經網絡的TWC老化診斷算法對比
基于BPNN開發(fā)了TWC老化診斷算法,根據實車循環(huán)工況數據,手動提取4種故障特征建立數據集。在合理的網絡訓練參數設置下,3種TWC老化狀態(tài)的診斷精度達到79.52%?;贒BN對TWC老化診斷算法進行改進,采用數據增強的手段得到網絡訓練需要的數據集。在大量試驗的基礎上,分別設置DBN預訓練參數和調優(yōu)參數,最終診斷精度達到90.75%,提升11.23%,證明基于DBN的神經網絡診斷算法相比于傳統BPNN算法具有更好的表達能力,并且簡化了手動提取故障特征的過程;但其需要消耗數倍于BPNN的訓練時間成本和模型計算量,故需要根據實際診斷需求辯證地選擇算法?;谏窠浘W絡的TWC老化診斷算法建模簡便,具有較高的精度和泛化能力,且對工況瞬態(tài)變化不敏感,網絡離線訓練和在線診斷的結合在更為嚴格的排放法規(guī)實施下具有很好的應用前景。