賀立敏, 王峴昕, 韓 冰
(1.中遠(yuǎn)海運(yùn)發(fā)展股份有限公司,上海 200135;2.上海船舶運(yùn)輸科學(xué)研究所 航運(yùn)技術(shù)與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200135)
基于隨機(jī)森林和支持向量機(jī)的船舶柴油機(jī)故障診斷
賀立敏1, 王峴昕2, 韓 冰2
(1.中遠(yuǎn)海運(yùn)發(fā)展股份有限公司,上海 200135;2.上海船舶運(yùn)輸科學(xué)研究所 航運(yùn)技術(shù)與安全國(guó)家重點(diǎn)實(shí)驗(yàn)室,上海 200135)
針對(duì)船舶低速二沖程柴油機(jī)故障的分析問(wèn)題,提出基于隨機(jī)森林和支持向量機(jī)的船舶柴油機(jī)故障診斷方法。對(duì)船舶低速二沖程柴油機(jī)MAN B&W 6S50MC-C建立故障仿真模型并驗(yàn)證其有效性;在此基礎(chǔ)上,通過(guò)故障仿真模型生成故障樣本。運(yùn)用基于隨機(jī)森林的VarSelRF特征選擇算法對(duì)故障數(shù)據(jù)進(jìn)行降維,提出運(yùn)用支持向量機(jī)對(duì)降維后的故障數(shù)據(jù)進(jìn)行分類的方法。通過(guò)仿真試驗(yàn)驗(yàn)證并分析該方法的有效性。
船舶工程;船舶柴油機(jī);故障診斷;隨機(jī)森林;特征選擇;支持向量機(jī)
船舶柴油機(jī)作為船舶動(dòng)力系統(tǒng)中的關(guān)鍵設(shè)備,在保證船舶正常運(yùn)行方面發(fā)揮著重要作用。船舶柴油機(jī)出現(xiàn)故障不僅會(huì)直接影響船舶動(dòng)力系統(tǒng),而且會(huì)間接影響船舶其他重要設(shè)備。因此,對(duì)船舶柴油機(jī)進(jìn)行維護(hù)和維修具有重要意義。[1]以往船舶柴油機(jī)故障是依靠輪機(jī)員的經(jīng)驗(yàn)判斷的,隨著柴油機(jī)實(shí)時(shí)監(jiān)控系統(tǒng)逐步普及,可將傳感器采集到的狀態(tài)參數(shù)作為專家分析評(píng)估柴油機(jī)運(yùn)行狀態(tài)的依據(jù)。此外,隨著智能算法的研究逐步深入,眾多有效的模式識(shí)別算法已應(yīng)用到船舶柴油機(jī)故障診斷中,用智能算法取代專家分析法來(lái)對(duì)船舶柴油機(jī)進(jìn)行故障診斷是未來(lái)的發(fā)展趨勢(shì),能快速、有效、實(shí)時(shí)地對(duì)柴油機(jī)的狀態(tài)進(jìn)行診斷,提高維護(hù)效率,降低人力成本。
船舶柴油機(jī)是包含眾多子系統(tǒng)的復(fù)雜非線性系統(tǒng),各子系統(tǒng)之間相互影響,將常規(guī)的基于線性假設(shè)的模型應(yīng)用到船舶柴油機(jī)故障診斷中往往難以達(dá)到理想的效果。[2]此外,目前配備實(shí)時(shí)監(jiān)測(cè)系統(tǒng)的船舶柴油機(jī)上布置有眾多用來(lái)采集柴油機(jī)實(shí)時(shí)狀態(tài)參數(shù)的測(cè)點(diǎn),大量數(shù)據(jù)在不處理的情況下利用會(huì)增加診斷系統(tǒng)的運(yùn)算開(kāi)銷,對(duì)系統(tǒng)的快速性產(chǎn)生不利影響。這里針對(duì)上述2個(gè)問(wèn)題對(duì)船舶柴油機(jī)故障診斷方法進(jìn)行研究。
支持向量機(jī)算法適于解決小樣本、非線性等問(wèn)題,對(duì)船舶柴油機(jī)表現(xiàn)較好;隨機(jī)森林算法具有準(zhǔn)確率高、魯棒性好、易于使用和運(yùn)算開(kāi)銷小等優(yōu)點(diǎn),運(yùn)用該類方法對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行處理有利于簡(jiǎn)化故障診斷系統(tǒng)的運(yùn)算,提高診斷的效率。因此,這里提出基于隨機(jī)森林和支持向量機(jī)的船舶柴油機(jī)故障診斷方法,建立故障診斷的模型,對(duì)低速二沖程柴油機(jī)的幾種常見(jiàn)故障進(jìn)行分析,并通過(guò)數(shù)值試驗(yàn)驗(yàn)證該方法的有效性。
對(duì)船舶低速二沖程柴油機(jī)MAN B&W 6S50MC-C進(jìn)行故障分析。[3]由于柴油機(jī)故障狀態(tài)數(shù)據(jù)難以通過(guò)試驗(yàn)獲得,因此利用AVL Boost 2016軟件對(duì)柴油機(jī)常見(jiàn)的4種故障進(jìn)行仿真,并通過(guò)與正常工況下的狀態(tài)參數(shù)相對(duì)比驗(yàn)證仿真模型的有效性。MAN B&W 6S50MC-C的主要參數(shù)見(jiàn)表1。
表1 MAN B&W 6S50MC-C的主要參數(shù)
AVL Boost 2016平臺(tái)下的MAN B&W 6S50MC-C仿真模型見(jiàn)圖1。系統(tǒng)共包含33個(gè)元件,其中:SB1~SB3為系統(tǒng)邊界;VP1~VP5為掃氣箱;PL1為進(jìn)氣總管;CO1為空冷器;TC1為渦輪增壓器;C1~C6為氣缸;MP1~MP8為傳感器測(cè)點(diǎn)。
圖1 AVL Boost 2016平臺(tái)下的 MAN B&W 6S50MC-C仿真模型
為獲得理想的仿真結(jié)果,對(duì)仿真模型的參數(shù)進(jìn)行合理的設(shè)置,尤其是關(guān)鍵部件(如氣缸和燃燒模型)的參數(shù)。仿真模型主要參數(shù)見(jiàn)表2。
表2 MAN B&W 6S50MC-C仿真模型主要參數(shù)
氣缸及燃燒模型是仿真中的關(guān)鍵模塊,對(duì)仿真結(jié)果的影響明顯,因此需謹(jǐn)慎設(shè)置?;钊S曲軸角的運(yùn)動(dòng)曲線見(jiàn)圖2,燃燒放熱規(guī)律和已燃燃油質(zhì)量分?jǐn)?shù)曲線見(jiàn)圖3,排氣閥升程曲線見(jiàn)圖4。仿真結(jié)果與臺(tái)架試驗(yàn)值對(duì)比見(jiàn)表3。
由仿真結(jié)果可知,除了透平后溫度以外,其余狀態(tài)參數(shù)均控制在5%以內(nèi),同時(shí)一個(gè)循環(huán)內(nèi)氣缸內(nèi)的溫度和壓力變化曲線及柴油機(jī)扭矩變化曲線(見(jiàn)圖5~圖7)與實(shí)際柴油機(jī)的運(yùn)行規(guī)律擬合良好,故該仿真模型能較好地模擬真實(shí)工況。通過(guò)改變正常工況下的參數(shù)來(lái)產(chǎn)生故障樣本,記錄故障狀態(tài)下各測(cè)點(diǎn)的觀測(cè)值。
圖2 活塞隨曲軸角的運(yùn)動(dòng)曲線
a) 燃燒放熱規(guī)律
b) 已燃燒油質(zhì)量分?jǐn)?shù)圖3 燃燒放熱規(guī)律和已燃燃油質(zhì)量分?jǐn)?shù)
圖4 排氣閥升程曲線
表3 仿真結(jié)果與臺(tái)架試驗(yàn)值對(duì)比
對(duì)各缸供油量減少、壓縮比降低、排氣閥提前關(guān)閉和增壓器效率降低等4種常見(jiàn)的船舶柴油機(jī)故障進(jìn)行仿真,在仿真模型中改變各部件對(duì)應(yīng)的參數(shù),對(duì)故障工況進(jìn)行模擬。定義各參數(shù)在5%范圍內(nèi)的偏離為正常工況;5%~10%,10%~20%及20%以上的偏離分別為輕微、中等和嚴(yán)重故障??偣卜抡嫔?00個(gè)故障樣本,每種故障樣本中輕微、中等和嚴(yán)重故障的比例分別為40%,40%和20%。對(duì)于參數(shù)在5%范圍內(nèi)變化的正常工況,對(duì)每種故障類型仿真生成30個(gè)正常工況樣本。
圖5 氣缸壓力變化曲線
圖6 氣缸溫度變化曲線
圖7 柴油機(jī)扭矩變化曲線
在仿真結(jié)果中,每個(gè)樣本包含17種狀態(tài)值,分別為壓縮前溫度及壓力、透平前溫度及壓力、透平后溫度及壓力、中冷前溫度及壓力、中冷后溫度及壓力、掃氣箱進(jìn)口溫度及壓力、掃氣溫度及壓力、排氣溫度及壓力和最大燃燒壓力。
船舶柴油機(jī)的測(cè)點(diǎn)眾多,采集到的數(shù)據(jù)量龐大,需對(duì)監(jiān)測(cè)數(shù)據(jù)進(jìn)行篩選處理,以簡(jiǎn)化運(yùn)算,提高診斷的快速性。因此,采用基于隨機(jī)森林的特征選擇算法對(duì)故障樣本數(shù)據(jù)進(jìn)行處理。
采用支持向量機(jī)對(duì)降維之后的數(shù)據(jù)進(jìn)行分類和診斷,由于是多種故障的分類,因此采用多分類支持向量機(jī)中一對(duì)一的分類策略進(jìn)行診斷,即對(duì)每種狀態(tài)兩兩建立分類平面,生成決策函數(shù),采用投票法將得分最高的一類作為診斷結(jié)果。[4]
2.1基于隨機(jī)森林的VarSelRF算法[5]
隨機(jī)森林算法[6]是一種包含多個(gè)決策樹(shù)的集成學(xué)習(xí)方法,以決策樹(shù)為基學(xué)習(xí)器,運(yùn)用Bagging的方法進(jìn)行集成,能顯著提高基學(xué)習(xí)器的性能,具有泛化性能強(qiáng)、運(yùn)算開(kāi)銷小和不存在過(guò)擬合等優(yōu)點(diǎn)。隨機(jī)森林采用自助法(Bootstrap)重采樣技術(shù)生成多個(gè)隨機(jī)決策樹(shù)作為基分類器,在生成若干決策樹(shù)之后采用Bagging方法集成。
隨機(jī)決策樹(shù)生成方法為:從樣本中有放回地選取樣本集,重復(fù)k次,這k個(gè)樣本集作為決策樹(shù)的訓(xùn)練集生成k個(gè)決策樹(shù),未被抽取的約36.8%的樣本作為袋外樣本(OOB)。從原有的特征中隨機(jī)選取m個(gè)特征進(jìn)行最優(yōu)分割點(diǎn)篩選,重復(fù)上述步驟生成決策樹(shù)。
VarSelRF是基于隨機(jī)森林的特征選擇算法,采用基于袋外樣本誤差率的反向刪除方法。該方法根據(jù)隨機(jī)森林中每個(gè)變量的重要性得分對(duì)變量進(jìn)行排序,將一定比例的得分最低的變量剔除,從而實(shí)現(xiàn)特征選擇。
2.2支持向量機(jī)算法
船舶柴油機(jī)故障診斷實(shí)質(zhì)上是一個(gè)分類問(wèn)題,有眾多解決方法。由故障樣本數(shù)據(jù)的產(chǎn)生過(guò)程可知其為監(jiān)督學(xué)習(xí)問(wèn)題,通常采用的分類方法有神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林和支持向量機(jī)等。針對(duì)船舶柴油機(jī)故障的特點(diǎn),支持向量機(jī)更加適合解決該問(wèn)題。支持向量機(jī)更加適合解決復(fù)雜非線性的小樣本問(wèn)題,神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過(guò)程需大量樣本,且納入新故障類型之后需重新訓(xùn)練,對(duì)新故障類型的推廣能力差。隨機(jī)森林簡(jiǎn)單易實(shí)現(xiàn),不存在過(guò)擬合問(wèn)題,但針對(duì)復(fù)雜非線性的小樣本問(wèn)題的表現(xiàn)不如支持向量機(jī)。[7]因此,在對(duì)故障模型進(jìn)行分類時(shí)采用支持向量機(jī)的方法。
支持向量機(jī)的主要原理為:尋找特征空間中的最優(yōu)分離超平面,使不同類別樣本間的幾何間隔最大化,用最優(yōu)分離超平面作為分類的依據(jù)。[8]
支持向量機(jī)算法等價(jià)于求解二次規(guī)劃問(wèn)題,即
(1)
s.t.yi(ωi·x+b)≥1,i=1,2,…,l
(2)
式(1)和式(2)中:αi為拉格朗日乘子。令目標(biāo)函數(shù)的偏導(dǎo)數(shù)為零,可得
(3)
(4)
由此,目標(biāo)函數(shù)可轉(zhuǎn)化為一個(gè)簡(jiǎn)單的形式??紤]到誤分類點(diǎn)的存在,引入軟間隔最大化,原問(wèn)題等價(jià)于
(5)
(6)
式(5)和式(6)中:C為懲罰系數(shù),反映分類器能在多大程度上允許誤分類點(diǎn)存在。
對(duì)于非線性問(wèn)題,不能通過(guò)一個(gè)超平面分離正負(fù)例,但存在一個(gè)超曲面能區(qū)分正負(fù)例,因此可采用核方法將原空間樣本映射到高維的特征空間,在特征空間里樣本線性可分。[9]核方法不直接尋求原空間到特征空間的映射關(guān)系,而是引入核函數(shù)直接計(jì)算內(nèi)積。核函數(shù)定義為
K(xi,xj)=〈Φ(xi),Φ(xj)〉 (i,j=1,2,…,l)
(7)
常用的核函數(shù)有高斯徑向基函數(shù)和多項(xiàng)式核函數(shù),其表達(dá)式分別為
由此核函數(shù)形式的支持向量機(jī)分類問(wèn)題可表示為
(10)
(11)
通過(guò)求解該規(guī)劃問(wèn)題,最終得到的決策函數(shù)為
(12)
采用基于隨機(jī)森林和支持向量機(jī)的故障診斷方法對(duì)故障數(shù)據(jù)進(jìn)行計(jì)算,各參數(shù)分別為:壓縮前壓力P1,壓縮前溫度T1,中冷前壓力P2,中冷前溫度T2,中冷后壓力P3,中冷后溫度T3,掃氣箱進(jìn)口壓力P4,掃氣箱進(jìn)口溫度T4,掃氣壓力P5,掃氣溫度T5,排氣壓力P6,排氣溫度T6,透平前壓力P7,透平前溫度T7,透平后壓力P8,透平后溫度T8,最大燃燒壓力Pz。故障1為各缸供油量減少,故障2為壓縮比降低,故障3為排氣閥提前關(guān)閉,故障4為增壓器效率降低。
數(shù)值試驗(yàn)的流程見(jiàn)圖8,將故障原始數(shù)據(jù)均分為訓(xùn)練集和測(cè)試集,對(duì)訓(xùn)練集中的樣本進(jìn)行特征選擇處理并建立支持向量機(jī)的故障分類模型,最后用測(cè)試樣本驗(yàn)證故障診斷模型的有效性。
圖8 數(shù)值試驗(yàn)流程
采用VarSelRF算法對(duì)故障樣本及正常樣本進(jìn)行特征提取,反向刪除過(guò)程中每輪迭代的變量剔除率設(shè)為0.2。根據(jù)隨機(jī)森林重要性得分的定義計(jì)算出每個(gè)變量的平均準(zhǔn)確率下降,歸一化后得到各變量的重要性得分,4種故障對(duì)應(yīng)特征的重要性得分見(jiàn)圖9。
利用支持向量機(jī)對(duì)篩選出的變量進(jìn)行診斷,核函數(shù)采用高斯徑向基函數(shù),利用網(wǎng)格法調(diào)整參數(shù),根據(jù)經(jīng)驗(yàn)取懲罰系數(shù)C=10,根據(jù)不同的故障特點(diǎn)調(diào)整σ2的取值,可得到4種常見(jiàn)故障與正常工況的決策函數(shù)。用測(cè)試集進(jìn)行驗(yàn)證,可得到分類器的識(shí)別準(zhǔn)確率,最終結(jié)果見(jiàn)表4。
根據(jù)提出的方法,對(duì)每種狀態(tài)兩兩建立決策函數(shù)。為方便展示結(jié)果,只對(duì)故障狀態(tài)和正常狀態(tài)建立分類模型,在與其他故障狀態(tài)進(jìn)行區(qū)分時(shí)采用的方法與此類似。由表4可知,該方法在從17個(gè)輸入變量中選取2個(gè)變量的同時(shí)取得了很高的診斷準(zhǔn)確率,因此該方法能有效選取相關(guān)特征,剔除冗余特征,并能準(zhǔn)確診斷故障狀態(tài)。
a) 故障1重要性得分
b) 故障2重要性得分
c) 故障3重要性得分
d) 故障4重要性得分圖9 4種故障對(duì)應(yīng)特征的重要性得分
表4 特征選擇與診斷準(zhǔn)確率
本文提出基于隨機(jī)森林和支持向量機(jī)的故障診斷方法對(duì)船舶低速柴油機(jī)MAN B&W 6S50MC-C進(jìn)行分析。建立MAN B&W 6S50MC-C的仿真模型,驗(yàn)證模型的有效性;利用該模型生成柴油機(jī)正常工況和故障工況下的狀態(tài)數(shù)據(jù),并將其作為訓(xùn)練數(shù)據(jù)。
由計(jì)算結(jié)果可知,該方法能有效提取船舶柴油機(jī)故障的特征變量,減少無(wú)關(guān)變量和冗余變量,并能準(zhǔn)確診斷故障的狀態(tài),對(duì)提高船舶柴油機(jī)故障診斷系統(tǒng)的快速性和準(zhǔn)確性具有一定的指導(dǎo)意義。
[1] 郭江華,侯馨光,陳國(guó)鈞,等.船舶柴油機(jī)故障診斷技術(shù)研究[J].中國(guó)航海,2005,28(4):75-78.
[2] 柴艷有.基于核學(xué)習(xí)理論的船舶柴油機(jī)故障診斷研究[D].哈爾濱:哈爾濱工程大學(xué),2012.
[3] 王公勝.船用低速二沖程柴油機(jī)工作過(guò)程仿真與故障模擬[D].大連:大連海事大學(xué),2010.
[4] 潘明清.基于支持向量機(jī)的機(jī)械故障模式分類研究[D].杭州:浙江大學(xué),2005.
[5] BREIMAN L.Random Forests [J].Machine Learning,2001,45:5-32.
[6] ZHOU Zhihua.Ensemble Methods:Foundation and Algorithm [M].Boca Raton:CRC Press,2012:57-61.
[7] OZER S,CHEN C H,CIRPAN H A.A Set of New Chebyshev Kernel Functions for Support Vector Machine Pattern Classification [J].Pattern Recognition,2011,44:1435-1447
[8] 李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012:95-124 .
[9] KUNG S Y.Kernel Methods and Machine Learning [M].Cambridge:Cambridge University Press,2014:360-364.
FaultDiagnosisofMarineDieselEngineBasedonRandomForestandSupportVectorMachine
HELimin1,WANGXianxin2,HANBing2
(1.COSCO SHIPPING Development Co.,Ltd.,Shanghai 200135,China; 2.State Key Laboratory of Navigation and Safety Technology,Shanghai Ship and Shipping Research Institute,Shanghai 200135,China)
A fault diagnosis method for marine diesel engine based on random forest and support vector machine is proposed.The fault model of MAN B&W 6S50MC-C marine diesel engine is established and verified with test-bed experiment results.The model is used to generate sample simulations of typical engine faults for processing.The VarSelRF algorithm based on the random forest is used to exclude irrelevant factors and identify effective features to facilitate the diagnosis process,improving the process speed.The processed data is classified by support vector machine classification algorithm.The effectiveness of the proposed method is verified by numerical experiments.
ship engineering; marine diesel engine;fault diagnosis;random forest;feature selection;support vector machine
U664.121.1
A
2017-03-17
上海市青年科技啟明星計(jì)劃資助項(xiàng)目(15QB1400800)
賀立敏(1961—),男,上海人,工程師,研究方向?yàn)椴裼蜋C(jī)應(yīng)用及管理、船舶經(jīng)濟(jì)運(yùn)行管理。E-mail:he.limin@coscoshipping.com
1000-4653(2017)02-0029-05