劉嘉煜,夏曉毛,宋予熙
(博世汽車部件(長沙)有限公司,湖南 長沙 410100)
隨著工業(yè)4.0時(shí)代的到來,日益增長的對(duì)于質(zhì)量和產(chǎn)量需求及更復(fù)雜的制造系統(tǒng),使得現(xiàn)代制造業(yè)對(duì)加工設(shè)備的穩(wěn)定性和可靠性的要求日趨嚴(yán)格。為了提升生產(chǎn)效率,減少制造成本,合理維修策略的制定及對(duì)于設(shè)備運(yùn)行狀態(tài)的實(shí)時(shí)把控尤為重要。
20世紀(jì)90年代開始,兩種維修策略在實(shí)際生產(chǎn)過程中運(yùn)用較為廣泛,一種是修復(fù)性維護(hù),也被稱為故障驅(qū)動(dòng)的維修,是一種在設(shè)備故障已經(jīng)出現(xiàn)后進(jìn)行維修的方式,這種方式可能導(dǎo)致生產(chǎn)過程中非計(jì)劃性的停機(jī);另一種是按照固定的時(shí)間周期性進(jìn)行預(yù)防性維護(hù),維修計(jì)劃主要根據(jù)工程師的經(jīng)驗(yàn)決定[1]。Nowlan和Heap提出,89%的航空設(shè)備故障不存在狀態(tài)急劇惡化階段,故障可能按照某種模式隨機(jī)出現(xiàn)[2],所以基于時(shí)間的周期性維護(hù)可能由于維修計(jì)劃制定不合理造成生產(chǎn)資源的浪費(fèi)或?qū)е略O(shè)備在兩次維護(hù)間隔之間損壞。近年來,基于設(shè)備狀態(tài)的預(yù)測性維護(hù)[3]由于其在降低維修成本,減少故障停機(jī)時(shí)間和延長設(shè)備使用壽命方面的潛力,在制造業(yè)的應(yīng)用逐步增加。
預(yù)測性維護(hù)實(shí)現(xiàn)的核心在于通過非破壞性的方式對(duì)設(shè)備運(yùn)行過程中能夠反映其健康狀態(tài)的數(shù)據(jù)進(jìn)行監(jiān)控,并基于實(shí)時(shí)數(shù)據(jù)進(jìn)行診斷性分析和預(yù)測性分析,輔助維修計(jì)劃的制定。診斷性分析旨在對(duì)特定故障進(jìn)行探測,并確定其產(chǎn)生的根本原因,而預(yù)測性分析主要基于當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù)對(duì)未來設(shè)備的工作狀況和剩余使用壽命(Remaining Useful Life,RUL)進(jìn)行預(yù)測。
設(shè)備狀態(tài)的分析可依據(jù)其故障過程的物理公式,也可由數(shù)據(jù)驅(qū)動(dòng),通過數(shù)據(jù)挖掘的手段對(duì)其狀態(tài)進(jìn)行識(shí)別。由于設(shè)備的復(fù)雜性逐漸提高,其狀態(tài)衰退機(jī)制難以明確,物理模型在實(shí)際生產(chǎn)過程中的準(zhǔn)確應(yīng)用受到了限制,因此,在先進(jìn)的傳感器技術(shù)和提升的計(jì)算機(jī)算力的幫助下,數(shù)據(jù)驅(qū)動(dòng)下,運(yùn)用傳統(tǒng)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)方法的預(yù)測性分析模式逐漸占據(jù)主要地位。
在基于傳統(tǒng)機(jī)器學(xué)習(xí)方法的預(yù)測性分析模式中,對(duì)采集的數(shù)據(jù)進(jìn)行特征提取并進(jìn)行特征篩選得到設(shè)備狀態(tài)的特征表示,這些特征被送入后續(xù)模型,如邏輯回歸,決策樹、支持向量機(jī)等,用于模型的訓(xùn)練。訓(xùn)練好的模型最后將用于設(shè)備健康狀態(tài)預(yù)測。然而特征工程的好壞對(duì)模型的表現(xiàn)起到關(guān)鍵作用,這一過程需要較豐富的領(lǐng)域知識(shí),數(shù)據(jù)預(yù)處理和不完全的特征提取可能導(dǎo)致原始數(shù)據(jù)中能夠反映設(shè)備狀態(tài)的信息丟失。
近年來,日益蓬勃發(fā)展的深度學(xué)習(xí)網(wǎng)絡(luò),如在自然語言處理(Natural Language Processing,NLP),圖像描述等方面起重要作用的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Networks,RNN),為本質(zhì)為時(shí)間序列的產(chǎn)線傳感器采集信號(hào)的表征提供了新思路。這些方法直接通過深度神經(jīng)網(wǎng)絡(luò)從原始的時(shí)域信號(hào)中自適應(yīng)地提取設(shè)備狀態(tài)特征表示,無需額外的領(lǐng)域知識(shí),可端到端地實(shí)現(xiàn)設(shè)備故障的預(yù)測。
為解決傳統(tǒng)RNN梯度消失和梯度爆炸問題提出的長短時(shí)記憶網(wǎng)絡(luò)(Long Short-Term Memory,LSTM)中引入了門的操作,其對(duì)于歷史信息的記憶能力使其在捕捉傳感器數(shù)據(jù)中的時(shí)序信息方面更具優(yōu)勢。Zhao R[4]等發(fā)現(xiàn)使用基于LSTM的網(wǎng)絡(luò)可以獲取傳感器信號(hào)中的有效特征,并在刀具磨損預(yù)測任務(wù)上進(jìn)行了驗(yàn)證。Zhao R[5]認(rèn)為,除了時(shí)間上的信息外,不同維度傳感器數(shù)據(jù)之間包含的空間關(guān)系和數(shù)據(jù)中的噪音會(huì)使得僅僅使用LSTM變得不夠魯棒,所以選擇采取先使用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)提取局部特征。文獻(xiàn)[6]中結(jié)合使用LSTM和CNN對(duì)原始信號(hào)進(jìn)行特征提取后送入回歸層,實(shí)現(xiàn)對(duì)刀具后刀面磨損值的預(yù)測。
常用的非破壞性設(shè)備狀態(tài)監(jiān)測方式包括采集聲信號(hào)、紅外信號(hào)及振動(dòng)信號(hào)等[7],在Mourbray提出的P-F曲線中,振動(dòng)信號(hào)能夠以相對(duì)較早的提前量幫助識(shí)別設(shè)備的潛在故障[8],文獻(xiàn)[9]中利用振動(dòng)信號(hào)分別對(duì)設(shè)備的磨損,故障及剩余使用壽命進(jìn)行了預(yù)測。同時(shí)考慮到實(shí)際生產(chǎn)環(huán)境中的噪聲影響,傳感器的成本及安裝的難易程度,本文中選擇采用振動(dòng)信號(hào)進(jìn)行設(shè)備故障的探測。
本文通過在車削機(jī)臺(tái)刀桿上加裝加速度傳感器,以26 000 Hz的頻率采集x,y,z三個(gè)方向的振動(dòng)信號(hào)。利用車削機(jī)臺(tái)不同的故障狀態(tài)下,產(chǎn)品加工過程中的數(shù)據(jù)進(jìn)行基于特征提取的機(jī)器學(xué)習(xí)模型和長短時(shí)記憶網(wǎng)絡(luò)的訓(xùn)練,實(shí)現(xiàn)在真實(shí)生產(chǎn)環(huán)境下對(duì)機(jī)臺(tái)的不同故障類別的實(shí)時(shí)探測。
由于傳統(tǒng)機(jī)器學(xué)習(xí)模型對(duì)于特征工程的要求較高,為提高模型的擬合準(zhǔn)確度,首先要對(duì)特征值進(jìn)行篩選,去除無關(guān)冗余特征。本文基于Fisher Score進(jìn)行關(guān)鍵特征的選取,其主要思想為對(duì)不同類別區(qū)分能力較強(qiáng)的特征應(yīng)該具有類內(nèi)方差較小,而類間方差較大的特點(diǎn)[10]。記總樣本數(shù)為n,第i類樣本數(shù)為ni,i∈[1,...C],C為樣本類別總數(shù),第i類樣本集為ωi,x(k)表示樣本x在特征k上的取值, 表示第i類樣本特征k取值的均值,
表示所有樣本特征k取值的均值。則特征k的類間方差
類內(nèi)方差
特征k在數(shù)據(jù)集上的Fisher Score
Fisher Score越大,則特征對(duì)于不同類別的區(qū)分能力越強(qiáng)。通過保留Fisher Score較大的特征進(jìn)行特征篩選。
LSTM是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò),通過不同的門結(jié)構(gòu)來控制信息的傳遞。通過細(xì)胞狀態(tài)的使用,使得模型對(duì)不同時(shí)間間隔前后的數(shù)據(jù)具有記憶功能。這一點(diǎn)為在時(shí)間上具有明顯依賴性的設(shè)備狀態(tài)監(jiān)控提供了有力的幫助。
式中,i t為輸入門,f t為遺忘門,o t為輸出門,⊙表示逐元素相乘,σ(·)表示sigmoid激活函數(shù)。參數(shù)W f、為隱藏層神經(jīng)元個(gè)數(shù))、U f、和通過模型學(xué)習(xí)得到,且在所有時(shí)刻取相同值。
LSTM層最后時(shí)刻的輸出 作為樣本xi的特征表示,通過全連接層和softmax層預(yù)測得到不同類別的概率softmax的計(jì)算公式為
為使得模型學(xué)習(xí)到不同時(shí)間維度信息,通過堆疊多個(gè)非線性LSTM層的方式得到深層LSTM,模型隱層的輸出在時(shí)間方向傳遞的同時(shí)也作為下一LSTM層的輸入。在僅考慮過去時(shí)間步長信息的LSTM的基礎(chǔ)上提出的雙向長短時(shí)記憶網(wǎng)絡(luò),由于其信息流可雙向傳遞的特點(diǎn),為模型同時(shí)考慮過去與未來信息的影響提供了一種可行方式。
由于模型結(jié)構(gòu)復(fù)雜,參數(shù)量巨大,而實(shí)際生產(chǎn)過程中可獲取的樣本量較小,為了避免模型過擬合,通過在全連接層之前引入dropout層的方式,在訓(xùn)練過程中隨機(jī)隱藏部分隱層輸出,對(duì)模型進(jìn)行正則化。
對(duì)于深度學(xué)習(xí)模型,為獲取最優(yōu)權(quán)重,模型訓(xùn)練過程中,通過最小化損失函數(shù)交叉熵(Cross Entropy,CE),使用Adam進(jìn)行模型權(quán)重的更新,并使用階梯式的方式調(diào)整訓(xùn)練過程的學(xué)習(xí)率。交叉熵的計(jì)算公式為
為對(duì)比基于特征提取與傳統(tǒng)機(jī)器學(xué)習(xí)算法的模型和深度學(xué)習(xí)模型對(duì)真實(shí)生產(chǎn)環(huán)境下運(yùn)行設(shè)備的故障探測能力,本文通過在不同時(shí)間段進(jìn)行的兩次實(shí)驗(yàn),分別采集了車削機(jī)臺(tái)在兩種不同故障狀態(tài)及正常狀態(tài)下的產(chǎn)品加工過程中的振動(dòng)數(shù)據(jù),其中,第一次實(shí)驗(yàn)的數(shù)據(jù)用作訓(xùn)練集,第二次實(shí)驗(yàn)數(shù)據(jù)用作測試集,故障狀態(tài)及訓(xùn)練集與測試集劃分見表1。振動(dòng)數(shù)據(jù)來源于車削機(jī)臺(tái)刀桿上安裝的加速度傳感器,傳感器以26 000Hz的頻率采集產(chǎn)品加工過程中x,y,z三個(gè)方向振動(dòng)數(shù)據(jù)。
表1 數(shù)據(jù)集描述
對(duì)于本文研究的車削工藝,一片產(chǎn)品的加工過程大致可分為進(jìn)刀段、粗車段、精車段與退刀段,其x軸方向的振動(dòng)信號(hào)如圖1所示。由于進(jìn)刀與退刀段的過程表現(xiàn)受周圍環(huán)境影響較大,故本文中僅提取與當(dāng)前工序狀態(tài)相關(guān)性較強(qiáng)的粗車段與精車段數(shù)據(jù)進(jìn)行后續(xù)的分析。同時(shí),為消除加工不同型號(hào)產(chǎn)品引入的振動(dòng)強(qiáng)度差異,將x,y,z軸數(shù)據(jù)處理為對(duì)于三軸總振幅的相對(duì)值。在數(shù)據(jù)預(yù)處理后,對(duì)表2所示模型進(jìn)行了訓(xùn)練。
表2 模型及訓(xùn)練數(shù)據(jù)描述
圖1 產(chǎn)品加工過程中的x軸方向振動(dòng)數(shù)據(jù)及加工階段劃分
對(duì)于傳統(tǒng)機(jī)器學(xué)習(xí)模型LR,SVC,DT和RF,首先對(duì)x,y,z三個(gè)方向振動(dòng)數(shù)據(jù)提取時(shí)域、頻域、時(shí)-頻域特征。樣本數(shù)據(jù)記為樣本數(shù)據(jù)的快速傅里葉變換,結(jié)果記為p(f),短時(shí)傅里葉變換,結(jié)果記為S(t,f),HHT(Hilbert-Huang Transform,希爾伯特黃變換)后得到的解析信號(hào)的實(shí)部與虛部分別記為a(t)與b(t)。其中,對(duì)于頻譜偏度取均值,最大值對(duì)應(yīng)頻率及過95%置信區(qū)間的點(diǎn)個(gè)數(shù)作為特征值;頻段的劃分取用0Hz,
3 500Hz,5 000Hz,65 00Hz,8 000Hz,9 500Hz,11 000Hz,26 000Hz,HHT作用于經(jīng)驗(yàn)?zāi)B(tài)分解處理后得到的1~10層本征模態(tài)函數(shù)。由此,每個(gè)產(chǎn)品數(shù)據(jù)由264維特征向量表征,經(jīng)特征篩選降維處理后,用于上述四類模型的訓(xùn)練。對(duì)于SVC、DT和RF,模型超參數(shù)的選擇采用在訓(xùn)練集上進(jìn)行5折交叉驗(yàn)證,最大化加權(quán)f1 score的方法。
對(duì)于可直接處理時(shí)序數(shù)據(jù)的LSTM模型,為減少采樣過程中引入的隨機(jī)性[11],以100個(gè)樣本點(diǎn)為一組,對(duì)粗車段和精車段不同軸信號(hào)分別求取均值、標(biāo)準(zhǔn)差、最大值和最小值,保留100個(gè)時(shí)間步長,每個(gè)時(shí)間步長由32維向量構(gòu)成。由于原始數(shù)據(jù)樣本量較小而模型結(jié)構(gòu)相對(duì)復(fù)雜,為防止過擬合的情況發(fā)生,對(duì)于每個(gè)產(chǎn)品的數(shù)據(jù),通過隨機(jī)截?cái)嗟姆绞?,生? 000個(gè)樣本,經(jīng)過二次采樣處理的訓(xùn)練集大小擴(kuò)充為278 000。所用模型結(jié)構(gòu)見表3和表4,對(duì)每種結(jié)構(gòu)的模型分別嘗試了單向與雙向傳遞的網(wǎng)絡(luò)。最后的輸出均接入節(jié)點(diǎn)個(gè)數(shù)為3的全連接層和softmax層,得到不同類別的概率。
表3 隱藏層神經(jīng)元個(gè)數(shù)相同的LSTM模型結(jié)構(gòu)
表4 隱藏層神經(jīng)元個(gè)數(shù)不同的LSTM模型結(jié)構(gòu)
最終模型的表現(xiàn)使用加權(quán)精確率(precision),召回率(recall)和f1 score來衡量。對(duì)于每種機(jī)臺(tái)狀態(tài)類別i,其樣本個(gè)數(shù)記為則對(duì)于類別i
式中,M代表混淆矩陣,M[i,j]為真實(shí)值為i,預(yù)測值為j的樣本個(gè)數(shù)。模型總體的加權(quán)準(zhǔn)確率、精確率、召回率和f1 score為
不同模型在測試集上的加權(quán)平均精確率、召回率與f1 score,以及其分類結(jié)果的混淆矩陣見表5和如圖2所示,其中LSTM(128)代表神經(jīng)元個(gè)數(shù)為128的單層單向LSTM網(wǎng)絡(luò),deepLSTM(8-8-8)代表每層神經(jīng)元個(gè)數(shù)均為8的三層單向LSTM網(wǎng)絡(luò),biLSTM(8-8-8)代表每層神經(jīng)元個(gè)數(shù)均為8的三層雙向LSTM網(wǎng)絡(luò)。在Logistic回歸、支持向量機(jī)、決策樹與隨機(jī)森林中,隨機(jī)森林取得最高的精確率、召回率與f1 score,但其傾向于將設(shè)備正常狀態(tài)誤判為故障狀態(tài)。在不同結(jié)構(gòu)的LSTM模型中,3層隱藏層,每層8個(gè)神經(jīng)元的結(jié)構(gòu)取得了最好的表現(xiàn),在測試集上的f1 score為0.875。導(dǎo)致人工構(gòu)造特征進(jìn)行訓(xùn)練的傳統(tǒng)機(jī)器學(xué)習(xí)模型表現(xiàn)整體劣于不同結(jié)構(gòu)的LSTM模型的原因,一方面可能在于模型擬合能力的限制,無法捕捉不同工況下采集的振動(dòng)模式的差異,另一方面可能在于人為構(gòu)造特征導(dǎo)致的有效信息丟失。
圖2 不同模型預(yù)測結(jié)果的混淆矩陣
表5 不同類別模型表現(xiàn)對(duì)比
(續(xù))
圖3和表6對(duì)比了使用不同LSTM模型結(jié)構(gòu)得到的f1 score。在所有本文中嘗試的結(jié)構(gòu)中,每層神經(jīng)元個(gè)數(shù)均為8的三層單向LSTM網(wǎng)絡(luò)得到了最高的預(yù)測準(zhǔn)確度。其中對(duì)于單向傳遞的LSTM,當(dāng)每層神經(jīng)元個(gè)數(shù)均為8或16時(shí),隱層從一層到三層,模型的預(yù)測準(zhǔn)確度逐步提高,但四層模型的表現(xiàn)劣于一層。當(dāng)模型層數(shù)為2,3,4層時(shí),雙向LSTM的準(zhǔn)確度反而低于單向LSTM。對(duì)于三層LSTM,隱藏層使用相同神經(jīng)元個(gè)數(shù)的模型預(yù)測能力優(yōu)于每層使用不同神經(jīng)元個(gè)數(shù)的模型。
表6 不同神經(jīng)元個(gè)數(shù)的3層LSTM準(zhǔn)確度對(duì)比
圖3 不同LSTM模型結(jié)構(gòu)預(yù)測結(jié)果的f1 score
本文使用產(chǎn)品加工過程中的振動(dòng)數(shù)據(jù),嘗試對(duì)車削機(jī)臺(tái)的兩種常見故障進(jìn)行預(yù)測,以實(shí)現(xiàn)生產(chǎn)過程中的預(yù)測性維護(hù)功能。在綜合對(duì)比了Logistic回歸、支持向量機(jī)、決策樹及隨機(jī)森林等使用數(shù)字信號(hào)處理方法所提取特征進(jìn)行訓(xùn)練的傳統(tǒng)機(jī)器學(xué)習(xí)模型,與不同結(jié)構(gòu)的使用原始數(shù)據(jù)進(jìn)行訓(xùn)練的LSTM在不同時(shí)間段采集的生產(chǎn)數(shù)據(jù)上的預(yù)測表現(xiàn)后得出,能有效捕獲時(shí)序信息的深度學(xué)習(xí)網(wǎng)絡(luò)LSTM,對(duì)車削機(jī)臺(tái)故障預(yù)測的能力整體高于傳統(tǒng)機(jī)器學(xué)習(xí)模型,最高的準(zhǔn)確率可達(dá)87.5%。
為提高預(yù)測結(jié)果的準(zhǔn)確度,多源異質(zhì)數(shù)據(jù)融合已成為設(shè)備健康度監(jiān)測的主要趨勢。由于本文中僅考慮振動(dòng)數(shù)據(jù),后續(xù)工作中會(huì)結(jié)合更多數(shù)據(jù)源,如伺服電機(jī)數(shù)據(jù)及外部環(huán)境溫度數(shù)據(jù)等,向更多類別的故障預(yù)測方向進(jìn)行探索。