許小偉,嚴運兵,王小輝
(1.武漢科技大學(xué)汽車與交通工程學(xué)院,湖北 武漢,430081; 2.武漢理工大學(xué)能源與動力工程學(xué)院,湖北 武漢,430063)
支持張量機在柴油機故障預(yù)測中的應(yīng)用研究
許小偉1,嚴運兵1,王小輝2
(1.武漢科技大學(xué)汽車與交通工程學(xué)院,湖北 武漢,430081; 2.武漢理工大學(xué)能源與動力工程學(xué)院,湖北 武漢,430063)
為了解決柴油機故障預(yù)測中大樣本、非線性以及高維數(shù)據(jù)的數(shù)據(jù)預(yù)測問題,避免以向量輸入帶來的結(jié)構(gòu)信息丟失和數(shù)據(jù)相關(guān)性被破壞等現(xiàn)象,結(jié)合支持向量機(SVM)的學(xué)習(xí)框架和交替投影的思想,研究基于在線支持張量機(OSTM)的柴油機故障預(yù)測算法和流程,并以測試精度、學(xué)習(xí)時間和均方根誤差作為評價指標,利用遠程監(jiān)測系統(tǒng)采集的數(shù)據(jù),分別應(yīng)用在線支持向量機(OSVM)和OSTM進行故障預(yù)測和分析。結(jié)果表明,與OSVM方法相比,OSTM方法測試精度較高,學(xué)習(xí)時間大幅縮短,預(yù)測模型的收斂速度較快,能有效在線預(yù)測柴油機故障。
柴油機;在線支持向量機;在線支持張量機;故障預(yù)測
柴油機是集機、電、液、氣于一體的多部件復(fù)雜混聯(lián)系統(tǒng),具有信號源多、運動部件多等特點,監(jiān)測信號眾多且多為非平穩(wěn)信號,相互干擾較大且?guī)в蟹蔷€性和復(fù)雜耦合的特征,導(dǎo)致故障信號的幅值、頻率難以掌握,很難建立準確的數(shù)學(xué)模型描述其故障的發(fā)生機理。同時,柴油機各零部件的劣化方式各不相同,不僅各種預(yù)測的方法不能通用,而且依靠單一預(yù)測模型也難以準確進行故障預(yù)測。另外,柴油機企業(yè)逐漸重視視情維修,在柴油機中安裝了大量的監(jiān)控裝置和設(shè)備,采集的大量數(shù)據(jù)使故障預(yù)測的計算過程過于繁瑣,導(dǎo)致傳統(tǒng)的預(yù)測模型無法滿足柴油機維護與管理的需要。因此,為了解決柴油機故障預(yù)測中的超大樣本、非線性以及高維復(fù)雜數(shù)據(jù)等問題,研究者結(jié)合傳統(tǒng)的故障診斷和預(yù)測方法,引入了壽命消耗監(jiān)控(Life Consumption Monitoring,LCM)[1]、粒子濾波(Particle Filter,PF)[2]、貝葉斯網(wǎng)絡(luò)[3]以及支持向量機(Support Vector Machine,SVM)[4]等機器學(xué)習(xí)工具進行柴油機的故障預(yù)測分析。
傳統(tǒng)的機器學(xué)習(xí)往往采用批量或離線式學(xué)習(xí)方法,但在柴油機故障預(yù)測的工程應(yīng)用中,學(xué)習(xí)機的數(shù)據(jù)是以序列的方式獲取的,數(shù)據(jù)被源源不斷地送往學(xué)習(xí)系統(tǒng)。在這種情況下,對大規(guī)模樣本進行訓(xùn)練的代價較高、耗時較長、精度較低,因此需要采用在線學(xué)習(xí)算法進行分析[5]。其中,常見的在線學(xué)習(xí)算法包括在線支持向量機(Online Support Vector Machine,OSVM)[6]、雙重更新在線學(xué)習(xí)(Double Updating Online Learning,DUOL)[7]等。
同時,在柴油機故障診斷與預(yù)測中,監(jiān)測參數(shù)包括飛輪段瞬時轉(zhuǎn)速信號、氣缸蓋振動信號、油底殼油液信號以及潤滑系統(tǒng)、冷卻系統(tǒng)溫度和壓力信號等數(shù)據(jù)源,通常被表示成多維數(shù)組,即張量。但是在工程應(yīng)用中,傳統(tǒng)的機器學(xué)習(xí)算法多采用向量輸入模式。對于復(fù)雜的柴油機狀態(tài)參數(shù),為了滿足當(dāng)前學(xué)習(xí)機的要求,通常假設(shè)各參數(shù)之間相互獨立,或者采用加權(quán)平均的方式將高維數(shù)據(jù)簡化為一維或者低維數(shù)據(jù),并以向量的模式作為模型的輸入。將張量數(shù)據(jù)向量化解決了高維數(shù)據(jù)的模型輸入問題,但同時會導(dǎo)致數(shù)據(jù)之間的結(jié)構(gòu)信息丟失和相關(guān)性被破壞等問題[8-9]。因此,本文基于支持向量機的學(xué)習(xí)框架和交替投影的思想,分析以序列方式獲取張量數(shù)據(jù)的在線二分類問題,并針對柴油機監(jiān)測的原始數(shù)據(jù)進行應(yīng)用分析。
在模式識別、機器學(xué)習(xí)、計算機視覺和圖像處理等研究領(lǐng)域中,如人臉圖像被表示成二階張量,步態(tài)輪廓序列[10]和多光譜影像[11]通常被表示成三階張量。而在工程實際應(yīng)用中,數(shù)據(jù)一般采用向量模式表示,即無論原始數(shù)據(jù)是一維向量、兩維矩陣還是高階張量,幾乎總是轉(zhuǎn)換成對應(yīng)的向量模式來處理。將張量向量化可能出現(xiàn)破壞原始數(shù)據(jù)的結(jié)構(gòu)和內(nèi)在相關(guān)性,掩蓋數(shù)據(jù)原本存在的冗余信息和高階依賴性,以及維數(shù)災(zāi)難和過擬合等問題[9]。為了避免出現(xiàn)上述問題,基于支持向量機的學(xué)習(xí)框架和交替投影的思想,Tao[8]把經(jīng)典的線性C-SVM、V-SVM和最小二乘支持向量機(Least Squares Support Sector Machine,LS-SVM)擴展到一般的張量模式,進而擴展了支持張量機(Support Tensor Machine,STM)的應(yīng)用領(lǐng)域。
1.1 支持張量機
基于支持張量機的柴油機故障診斷與預(yù)測是利用支持張量機的模型對高維的樣本進行分類或者回歸,判斷其工作狀態(tài)為正常還是故障,即確定其樣本標簽為+1或者-1,屬于樣本的二分類問題。
(1)
構(gòu)建式(1)的拉格朗日方程:
(2)
式中:αi、βi為Lagrange乘子,αi≥0,βi≥0。
L(ω,b,α,β,ε)對各變量的偏導(dǎo)數(shù)為:
(3)
(4)
(5)
(6)
1.2 在線支持張量機
先前討論的STM都是批量學(xué)習(xí)(batchlearning),在算法執(zhí)行之前所有樣本的細節(jié)都很清楚,根據(jù)所有的樣本學(xué)習(xí)出故障預(yù)測函數(shù);而在線支持張量機(OnlineSupportTensorMachine,OSTM)在算法設(shè)計階段或執(zhí)行之前無完全信息可用,輸入的樣本往往是實時到達的,根據(jù)每個新來的樣本,邊學(xué)習(xí)邊給出結(jié)果。
根據(jù)樣本獲得的先后順序,將樣本定義為(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)。OSTM算法對于新獲得樣本,利用預(yù)測函數(shù)給出其類別標簽yi的預(yù)測值,然后對比樣本標簽yi的真實值,如果預(yù)測值與真實值相同,則接受該預(yù)測函數(shù),否則優(yōu)化模型參數(shù),確定新的預(yù)測函數(shù)。整個過程是重復(fù)迭代的過程,直至所有樣本完成運算。
本文以某鋼鐵企業(yè)內(nèi)部運輸機車的16缸柴油機動力系統(tǒng)為例,利用遠程監(jiān)測與管理系統(tǒng),實時采集與燃油系統(tǒng)相關(guān)的狀態(tài)參數(shù),包括振動信號、瞬時轉(zhuǎn)速、油液參數(shù)和熱工參數(shù)等,并結(jié)合傳統(tǒng)的故障診斷和預(yù)測方法,引入機器學(xué)習(xí)工具OSTM進行柴油機工作狀態(tài)的故障預(yù)測分析。
2.1 試驗平臺
根據(jù)柴油機動力系統(tǒng)的工作特點,結(jié)合現(xiàn)有動力系統(tǒng)的狀態(tài)監(jiān)測技術(shù),設(shè)計了柴油機工作狀態(tài)監(jiān)測的功能結(jié)構(gòu)示意圖,如圖1所示。
通過采集柴油機動力系統(tǒng)的狀態(tài)參數(shù),進行初步的狀態(tài)監(jiān)測與故障診斷,并將診斷的結(jié)果及狀態(tài)參數(shù)通過3G/GPRS無線通信模塊發(fā)送到柴油機遠程監(jiān)測與管理中心,再進行柴油機動力系統(tǒng)的故障預(yù)測與健康管理。其中,故障預(yù)測分析試驗平臺以Visual C++6.0作為可視化集成開發(fā)環(huán)境,MATLABR2010a為數(shù)據(jù)分析工具,Microsoft SQL Server 2008為后端數(shù)據(jù)庫管理系統(tǒng),所使用電腦的CPU為Intel T2400 1.83 GHz,內(nèi)存為2.50 GB,操作系統(tǒng)為Windows 7。
Fig.1 Schematic diagram of the functional structure of the monitoring system
2.2 試驗數(shù)據(jù)的采集及分析流程
該柴油機平均每天工作20 h。在數(shù)據(jù)采集的試驗中,將柴油機的工作狀態(tài)分為怠速、低速、中速、高速和空載5種工況。柴油機運行時,每小時采集10組振動信號和轉(zhuǎn)速信號,每天采集1組油液信號,每分鐘采集1組熱工參數(shù),共采集了3個月。
故障分析數(shù)據(jù)樣本集的參數(shù)如表1所示。在每組數(shù)據(jù)中,振動信號包括16個氣缸、三維空間的3項數(shù)據(jù),每項1024個點;轉(zhuǎn)速信號包括16個氣缸分別發(fā)生故障以及全部正常工況下的17項數(shù)據(jù),每項1024個點;油液信號包括油底殼中潤滑油的溫度和壓力以及不同成分磨粒的密度等共計25項數(shù)據(jù),每項100個點;熱工參數(shù)包括冷卻水、潤滑油、燃油的溫度和壓力等共計25項數(shù)據(jù),每項100個點。利用OSTM進行數(shù)據(jù)分析時,若對于某一空間的狀態(tài)參數(shù)沒有更新,則用上一組數(shù)據(jù)替代。
在試驗完成后查閱機車數(shù)據(jù)記錄日志,發(fā)現(xiàn)該燃油系統(tǒng)從第72 天開始柴油機出現(xiàn)冒黑煙、機體偶爾有異常振動的現(xiàn)象;第86天進行拆裝檢修時,發(fā)現(xiàn)主機第5缸的噴油嘴針閥燒蝕而導(dǎo)致噴油嘴卡死的現(xiàn)象。
為了驗證在線支持張量機在柴油機故障預(yù)測應(yīng)用中的可行性,以預(yù)測精度、學(xué)習(xí)時間和均方根誤差作為評價標準,采用OSTM和OSVM兩種算法進行對比分析,其分析流程如圖2所示。
2.3 結(jié)果與分析
在柴油機的故障預(yù)測分析時,將樣本集的前60%作為訓(xùn)練集,剩下的40%作為測試集。由于數(shù)據(jù)量較大,故每間隔15 天取一組數(shù)據(jù),共取6組進行數(shù)據(jù)分析。
兩種算法下預(yù)測精度隨時間的變化趨勢如圖3所示。從圖3中可以看出,二者的預(yù)測精度均較高,滿足工程應(yīng)用的要求。在樣本采集時間的前75 天,隨著樣本采集時間的延長,分析的樣本數(shù)量增多,兩種算法的預(yù)測精度都逐漸提高,但其增幅逐漸減小,預(yù)測模型和參數(shù)逐漸趨于穩(wěn)定;當(dāng)出現(xiàn)故障樣本時,預(yù)測精度會稍微下降,其原因在于先前的正常樣本數(shù)目遠大于故障樣本的數(shù)目,即存在數(shù)據(jù)偏移現(xiàn)象,導(dǎo)致預(yù)測結(jié)果與實際工況存在一定的偏差,需要通過對不同類別的樣本采用不同的懲罰因子,調(diào)節(jié)因數(shù)據(jù)偏移造成的分類誤差。因此,可以預(yù)計經(jīng)過一定的參數(shù)調(diào)整后,其預(yù)測精度將會繼續(xù)上升至穩(wěn)定狀態(tài)。而根據(jù)機車日志中的數(shù)據(jù)記錄,可以發(fā)現(xiàn)該燃油系統(tǒng)在第72天之后開始出現(xiàn)故障,即出現(xiàn)了故障樣本,從而導(dǎo)致預(yù)測精度的變化曲線出現(xiàn)拐點,即柴油機的實際運行工況與數(shù)據(jù)分析的結(jié)果比較一致。
Fig.3 Variation of prediction accuracy with sample collecting time
另外從圖3中還可看出, OSTM的預(yù)測精度總體上高于OSVM的預(yù)測精度,其原因在于將張量向量化可能出現(xiàn)破壞原始數(shù)據(jù)的結(jié)構(gòu)和內(nèi)在相關(guān)性,掩蓋數(shù)據(jù)原本存在的冗余信息和高階依賴性以及維數(shù)災(zāi)難和過擬合等問題;當(dāng)突然出現(xiàn)故障樣本時,OSVM曲線的變化速率要快于OSTM,這是因為其模型相對簡單,更容易遭受數(shù)據(jù)偏差的影響。
圖4所示為兩種算法下學(xué)習(xí)時間隨樣本采集時間的變化趨勢。從圖4可以看出,隨著樣本采集時間的增加,OSTM的學(xué)習(xí)時間遠小于OSVM的學(xué)習(xí)時間,其原因在于將張量向量化的過程中,需要使用交叉投影以及主成分分析等方法降維,運算時間較長,且樣本數(shù)量越大耗時越長。另外,采用OSVM和OSTM的在線學(xué)習(xí)算法,其學(xué)習(xí)時間在理想情況下應(yīng)該是穩(wěn)定不變或者是緩慢增長的,而圖4中兩種方法的學(xué)習(xí)時間均按一定斜率的斜線形式增長,表明本文所使用的故障預(yù)測模型需要繼續(xù)優(yōu)化。
Fig.4 Variation of learning time with sample collecting time
圖5所示為兩種算法下的均方根誤差隨樣本采集時間的變化趨勢。從圖5可以看出,OSTM的均方根誤差較小,預(yù)測模型的收斂速度較快;但當(dāng)出現(xiàn)故障樣本時,其均方根誤差也會出現(xiàn)一段上升的過程,其原因同預(yù)測精度的變化原因一致。
本文結(jié)合SVM的學(xué)習(xí)框架和交替投影的思想,研究了基于OSTM的柴油機故障預(yù)測算法和流程,并利用遠程監(jiān)測系統(tǒng)采集的柴油機瞬時轉(zhuǎn)速和熱工參數(shù)等數(shù)據(jù),分別采用OSVM和OSTM兩種方法進行故障預(yù)測的應(yīng)用分析。以預(yù)測精度、學(xué)習(xí)時間和均方根誤差作為3個評價指標,對比分析兩種算法下的故障預(yù)測結(jié)果,發(fā)現(xiàn)OSTM充分利用了數(shù)據(jù)更充分的結(jié)構(gòu)信息及其相關(guān)性,預(yù)測精度較高,學(xué)習(xí)時間大幅降低,預(yù)測模型的收斂速度較快,而且其故障預(yù)測結(jié)果與實際記錄一致。因此,數(shù)據(jù)分析和試驗結(jié)果都證明了基于OSTM進行柴油機故障預(yù)測具有可行性和有效性,有一定的推廣價值。
[1] Vincent Rouet , Frédéric Minault, Guillaume Diancourt, et al. Concept of smart integrated life consumption monitoring system for electronics[J]. Microelectronics Reliability, 2007,47(12):1921-1927.
[2] 林國語,賈云獻,孫磊,等. 基于粒子濾波的非線性設(shè)備狀態(tài)估計[J]. 現(xiàn)代制造工程, 2014(1):97-101.
[3] 蔡志強,孫樹棟,司書賓,等.基于FMECA的復(fù)雜裝備故障預(yù)測貝葉斯網(wǎng)絡(luò)建模[J].系統(tǒng)工程理論與實踐,2013,33(1):187-193.
[4] 別鋒鋒,劉揚,周國強,等. 基于局域波法和SVM模型的往復(fù)機械故障預(yù)測方法研究[J]. 中國機械工程, 2011,22(6):687-691.
[5] Cavallanti G, Cesa-Bianchi N, Gentile C. Tracking the best hyperplane with a simple budget perceptron[J]. Machine Learning, 2007, 69(2/3): 143-167.
[6] Orabona F, Castellini C, Caputo B, et al. On-line independent support vector machines [J]. Pattern Recognition, 2010, 43(4): 1402-1412.
[7] Zhao Peilin, Hoi S C H, Jin Rong. Double updating online learning[J]. Journal of Machine Learning Research, 2011, 12: 1587-1615.
[8] Tao Dacheng, Li Xuelong, Wu Xindong, et al. Supervised tensor learning[J]. Knowledge and Information Systems, 2007, 13(1): 1-42.
[9] 周蓉,楊曉偉,吳廣潮. 在線支持張量機[J]. 計算機科學(xué)與探索,2013,7(7):611-619.
[10] Lu Haiping, Plataniotis K N, Venetsanopoulos A N. MPCA: multilinear principal component analysis of tensor objects[J]. IEEE Transactions on Neural Networks, 2008, 19(1): 18-39.
[11]張樂飛,黃昕,張良培.高分辨率遙感影像的支持張量機分類方法[J]. 武漢大學(xué)學(xué)報:信息科學(xué)版,2012, 37(3): 314-317.
[12]Kolda T G, Bader B W. Tensor decompositions and applications[J]. SIAM Review, 2009, 51(3): 455-500.
[責(zé)任編輯 鄭淑芳]
Prediction of diesel engine failure based on OSTM
XuXiaowei1,YanYunbing1,WangXiaohui2
(1. College of Automobile and Traffic Engineering, Wuhan University of Science and Technology, Wuhan 430081, China;2. School of Energy and Power Engineering, Wuhan University of Technology, Wuhan 430063, China)
To resolve the prediction problems with giant sample size, nonlinear and high dimensional data for diesel engines, this paper, aided by the framework of support vector machine (SVM) and the alternating projection method, studied the algorithm and process of diesel engine failure prediction on the basis of online support tensor machine (OSTM) to avoid loss of structural information and damage to data correlation resulting from vector input. Prediction accuracy, learning time and mean square error (MSE) were employed as evaluation indicators, and data collected by distant monitoring system were used in diesel engine failure prediction on the basis of OSVM and OSTM, respectively. The results show that compared with OSVM, OSTM is more accurate in failure prediction, boasting less learning time, higher convergence speed and greater efficiency.
diesel engine; OSVM; OSTM; failure prediction
2014-12-11
許小偉(1983-),男,武漢科技大學(xué)講師,博士.E-mail:xxw15@163.com
TK428
A
1674-3644(2015)02-0106-05