張 氫 李帥杭 陳 星 肖炳林 李 恒
1同濟(jì)大學(xué)機(jī)械與能源工程學(xué)院 上海 201804 2海南省鍋爐壓力容器與特種設(shè)備檢驗(yàn)所 ???570203
3廣州港股份有限公司南沙集裝箱碼頭分公司 廣州 510100
海洋運(yùn)輸是最主要的國際物流運(yùn)輸方式,它承擔(dān)了我國進(jìn)出口貨運(yùn)總量的90%。岸邊集裝箱起重機(jī)(以下簡稱岸橋)是整個碼頭完成貨物從海洋到陸地轉(zhuǎn)移的核心裝備。為防止岸橋發(fā)生故障導(dǎo)致的碼頭效率降低、停工,甚至人員安全事故,針對岸橋的故障檢測是十分必要的。如今,我國的集裝箱碼頭正在陸續(xù)進(jìn)行智能化改造,同時建設(shè)新的自動化、智能化碼頭。
目前,對齒輪箱的故障診斷研究正在飛速發(fā)展,針對齒輪箱振動數(shù)據(jù)的診斷方法較多[1-3]。然而這些方法大耗費(fèi)時間較長,需要額外設(shè)計診斷模型的自我更新等問題。在對齒輪箱的無監(jiān)督故障診斷領(lǐng)域中,現(xiàn)有的研究并不多。Luo J等[4]提出了一種基于流形學(xué)習(xí)和支持向量機(jī)的半監(jiān)督學(xué)習(xí)方法,通過少量的標(biāo)記樣本訓(xùn)練,從行星齒輪箱試驗(yàn)臺中獲取數(shù)據(jù),實(shí)驗(yàn)驗(yàn)證了其方法的有效性。Cheng G等[5]將從EMD分解后獲得的能量特征值作為無監(jiān)督的SOM網(wǎng)絡(luò)的數(shù)據(jù)輸入,進(jìn)行故障分類,實(shí)驗(yàn)證明該方法能夠準(zhǔn)確地提取和區(qū)分這些信號的故障特征。李狀[6]利用C均值聚類算法對ART2神經(jīng)網(wǎng)絡(luò)的分類性能進(jìn)行了優(yōu)化,在風(fēng)電機(jī)組齒輪箱的實(shí)機(jī)信號上成功進(jìn)行了無監(jiān)督的故障診斷。這些方法能夠在試驗(yàn)臺數(shù)據(jù)或運(yùn)行較為穩(wěn)定的風(fēng)機(jī)齒輪箱中獲得較好的診斷結(jié)果,但岸橋齒輪箱的工況更加復(fù)雜、存在大量的加速減速和正反轉(zhuǎn)運(yùn)動,使得其故障診斷尤其是無監(jiān)督的故障診斷難度增大。在基于岸橋齒輪箱的大數(shù)據(jù)故障檢測中,遇到的很大的問題是故障數(shù)據(jù)缺失,無法訓(xùn)練,也無法自行學(xué)習(xí)更新。
本文提出了一種基于無監(jiān)督機(jī)器學(xué)習(xí)的岸橋齒輪箱故障檢測方法。通過對岸橋的振動信號進(jìn)行處理,提取能夠反應(yīng)其狀態(tài)的特征值,然后通過無監(jiān)督的機(jī)器學(xué)習(xí)方法判斷齒輪箱的健康狀態(tài)。
在對信號進(jìn)行聚類分析前,首先要明確聚類的對象,性能良好的對象應(yīng)該能夠表征當(dāng)前信號的數(shù)據(jù)模式,這些數(shù)據(jù)模式不應(yīng)受到轉(zhuǎn)速、載荷等其他因素的影響,能夠正確區(qū)分正常模式的數(shù)據(jù)與故障模式的數(shù)據(jù)。此外,為了減少無監(jiān)督聚類的訓(xùn)練時間,聚類對象需要盡可能的正交,即去除冗余的特征值,保留下能夠充分表征當(dāng)前信號的特征值。
實(shí)際中采集到的振動信號為一段隨機(jī)的離散信號,為了反映該段信號的振動模式,以該段信號的統(tǒng)計特征值作為表征該信號的特征值。振動信號的統(tǒng)計特征值可分為兩類,時域統(tǒng)計特征值與頻域統(tǒng)計特征值。
本文采用的時域統(tǒng)計特征值包括均值、標(biāo)準(zhǔn)差、均方根值(有效值)、峰值指標(biāo)、脈沖指標(biāo)、波形指標(biāo)、峭度指標(biāo)、偏度指標(biāo)、裕度指標(biāo)等。其中標(biāo)準(zhǔn)差反映了信號圍繞均值的波動程度,描述了信號的波動分量;均方根值描述了振動信號的能量,穩(wěn)定性好,重復(fù)性好;峰值指標(biāo)和脈沖指標(biāo)可用來檢測信號中是否存在沖擊;峭度指標(biāo)對信號的沖擊特征很敏感,當(dāng)數(shù)值過大時,表明機(jī)械中可能存在由于間隙過大、滑動副表面存在破損等原因?qū)е碌臎_擊性振動;裕度指標(biāo)可用于檢測機(jī)械設(shè)備的磨損情況;偏度指標(biāo)反映振動信號的非對稱性。
頻域統(tǒng)計特征包括功率譜重心指標(biāo)、均方譜、功率譜方差、相關(guān)因子、諧波因子、譜原點(diǎn)矩等。功率譜是反映單位頻帶內(nèi)信號功率隨頻率的變化情況,也就是信號功率在頻域內(nèi)的分布情況。功率被定義成幅值的平方的時間平均分量,而這個過程也可以看做是去除頻域諧波分量的相位信息的過程。功率譜重心指標(biāo)反映了能量重心位置的變化程度,可以較好地描述信號頻域特征的變化;功率譜方差反映了能量分布的離散程度;功率譜均方頻率表征功率譜主頻帶的位置;相關(guān)因子反映了譜能量分布的相關(guān)程度;諧波因子反映了譜的分布狀態(tài)和譜寬情況;譜原點(diǎn)矩反映功率譜的總體能量情況。
這些時域、頻域特征值能夠較好地反映機(jī)械設(shè)備在故障狀態(tài)與非故障狀態(tài)下的差異[7,8],選擇其構(gòu)成的特征矩陣作為機(jī)器學(xué)習(xí)的對象。
不同的特征值之間存在較大的數(shù)量級差異,需通過各特征值歸一化來避免某一較大的特征值占據(jù)主導(dǎo)地位。
Z-Score標(biāo)準(zhǔn)化既適用于數(shù)值比較集中的情況也適用于數(shù)值分散的情況,且能保證歸一化結(jié)果相對穩(wěn)定。此外,Z-Score標(biāo)準(zhǔn)化在分類、聚類算法中或者使用PCA等技術(shù)進(jìn)行降維時,其性能表現(xiàn)較好,故本文選用Z-Score標(biāo)準(zhǔn)化。
Z-Score標(biāo)準(zhǔn)化后數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,其轉(zhuǎn)化函數(shù)為
式中:μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差。
因?yàn)楦魈卣髦抵g可能存在信息重疊,為了提升機(jī)器學(xué)習(xí)的效率,減少不必要的計算量,在提取了上述信號特征之后需要對特征值進(jìn)行降維,本文采用主成分分析法(PCA)對特征進(jìn)行降維,利用正交變換來對一系列可能相關(guān)的變量的觀測值進(jìn)行線性變換,從而投影為一系列線性不相關(guān)變量的值,這些不相關(guān)變量稱為主成分。
求解歸一化后的特征值矩陣的協(xié)方差矩陣,再求出其協(xié)方差矩陣的特征值,就可以得到各個成分的貢獻(xiàn)率。貢獻(xiàn)率表明主成分綜合變量數(shù)據(jù)的能力,貢獻(xiàn)率越大說明其綜合原始變量數(shù)據(jù)的能力越強(qiáng)。一般選取排名靠前且累計貢獻(xiàn)率大于80%的主成分。
在有監(jiān)督機(jī)器學(xué)習(xí)方法中,需要獲取大量的有標(biāo)簽數(shù)據(jù)作為輸入,具體到故障檢測領(lǐng)域中,即需要大量的實(shí)際故障數(shù)據(jù)作為訓(xùn)練集與測試集。然而,目前在港口機(jī)械中,由于機(jī)型眾多,機(jī)構(gòu)組成復(fù)雜,工況各異,這些小樣本的監(jiān)督學(xué)習(xí)標(biāo)簽局限性比較大,同時這些標(biāo)簽數(shù)據(jù)由于歷史原因又少,在效果上差強(qiáng)人意。
本文考慮使用無監(jiān)督的方法進(jìn)行岸橋的故障檢測,目前常用的無監(jiān)督方法主要有:K-Means、ART2網(wǎng)絡(luò)、SOM網(wǎng)絡(luò)等聚類方法。K-Means聚類作為一種啟發(fā)式算法,極適用于大數(shù)據(jù)處理任務(wù),目前已經(jīng)在計算機(jī)視覺、天文學(xué)、故障診斷等領(lǐng)域取得成功應(yīng)用。
K-Means算法源于信號處理中的一種向量量化方法,其聚類的目的是:把n個點(diǎn)劃分到k個類別中,使得每個點(diǎn)都屬于離他最近的均值對應(yīng)的類別[9]。K-Means聚類的步驟為:
1)選取k個聚類中心,也稱其為該類的質(zhì)心。若完全隨機(jī)選取質(zhì)心,則可能使聚類過程計算量過大,增加不必要的迭代步驟。因此,在選擇質(zhì)心時需要增大距已選質(zhì)心較遠(yuǎn)的點(diǎn)的被選中的概率。
2)對每個樣本點(diǎn)i,計算其所屬的類別
式中:x(i)為樣本,μj為類的質(zhì)心,c(i)為計算出的樣本所屬的新類,‖a-b‖2為計算兩者間的歐幾里得距離。
此步可具體分為計算距離與尋找新類2步,主要的計算量發(fā)生在距離計算中。為加快迭代聚類過程,通過elkan K-means算法,利用三角形的幾何特性可減少大量的計算步驟。
3)對每個類別,重新計算其質(zhì)心位置
重復(fù)2)、3),直至收斂或達(dá)到終止條件。
損失函數(shù)為
本文基于聚類的無監(jiān)督故障診斷方法由3部分構(gòu)成:對振動信號進(jìn)行預(yù)處理得到特征矩陣;然后通過PCA算法對特征進(jìn)行降維;最后通過K-Means算法對簡化后的特征矩陣進(jìn)行聚類。無監(jiān)督故障診斷模型如圖1所示。
圖1 無監(jiān)督故障診斷模型
采用某大學(xué)的公開數(shù)據(jù)集對本文提出的方法進(jìn)行驗(yàn)證。該實(shí)驗(yàn)選擇了安裝有14 in的軸承在采樣頻率12 kHz下的驅(qū)動端數(shù)據(jù),軸承存在內(nèi)圈故障、滾動體故障、6點(diǎn)鐘方向的外圈故障,轉(zhuǎn)速為1 797 r/min。
從3組故障數(shù)據(jù)中各選出10條故障樣本,再加上從3組對應(yīng)的正常數(shù)據(jù)中各選出30條樣本,組成總數(shù)90的數(shù)據(jù)集。
每條數(shù)據(jù)可計算出20維特征值,對特征值矩陣歸一化后進(jìn)行PCA主成分分析。為了便于可視化分析與展示,設(shè)置約簡后的特征維數(shù)為3,可以計算出最終的3維特征值主成分貢獻(xiàn)率之和為88.83%,認(rèn)為能夠表征原特征空間。
表1所示為某大學(xué)數(shù)據(jù)集中部分樣本特征值示例,0~5為正常樣本特征值,70~72為滾動體故障樣本特征值,87~89為外圈故障樣本特征值。對比表中各特征值可知,經(jīng)過上述處理流程后,不同故障類型的樣本能夠明顯區(qū)分開。
表1 各樣本特征值
在對經(jīng)過PCA后的特征矩陣進(jìn)行聚類分析,設(shè)置聚類類別為4。通過K-Means算法將這90條數(shù)據(jù)分為4類,每類樣本數(shù)分別為60、17、12、1。選取前2維特征值對聚類結(jié)果進(jìn)行可視化,如圖2所示。
圖2 某大學(xué)數(shù)據(jù)集聚類結(jié)果
采用國內(nèi)某碼頭岸橋設(shè)備的實(shí)機(jī)振動信號作為數(shù)據(jù)源。如圖3所示,為岸橋起升機(jī)構(gòu)的傳感器安裝示意圖,共7個測點(diǎn)。
圖3 傳感器布置
起升機(jī)構(gòu)上7個傳感器的采樣頻率為51 200 Hz與25 600 Hz。電動機(jī)轉(zhuǎn)速800~1 200 r/min,岸橋裝卸集裝箱質(zhì)量范圍為28~65 t。
當(dāng)該岸橋出現(xiàn)異常時,將該時刻的數(shù)據(jù)添加到總數(shù)據(jù)集中,即可運(yùn)用本文提出的無監(jiān)督方法分辨出該異常數(shù)據(jù)。此次實(shí)驗(yàn)的數(shù)據(jù)集中包含示例岸橋的某一個時刻檢測到的異常實(shí)際數(shù)據(jù),后經(jīng)停機(jī)拆箱檢查后確認(rèn)此為一軸承發(fā)生故障所致。
起重機(jī)原始數(shù)據(jù)中,各個測點(diǎn)間數(shù)據(jù)獨(dú)立,文以單個岸橋的機(jī)構(gòu)為分析對象,首先對原始數(shù)據(jù)進(jìn)行整理,將機(jī)構(gòu)的多測點(diǎn)數(shù)據(jù)整合為一條。
之后對振動數(shù)據(jù)進(jìn)行特征值提取,得到特征矩陣。通過數(shù)據(jù)歸一化消除特征值間的數(shù)量級差異,同時使得后續(xù)特征約簡與聚類分析過程的性能得以提升。
將歸一化后的特征值矩陣通過PCA進(jìn)行降維,確定最終的特征維數(shù)為5。此時,各主成分貢獻(xiàn)率之和為88.06%,表明約簡后的特征仍能夠較為全面的表征原始信號。
通過K-Means方法進(jìn)行聚類分析,設(shè)置最終聚類類別為3,得到聚類結(jié)果后發(fā)現(xiàn)添加的故障數(shù)據(jù)被單獨(dú)分為一類。選取前2維特征值對聚類結(jié)果進(jìn)行可視化,如圖4所示。實(shí)驗(yàn)證明本文提出的方法能夠分辨出異常的岸橋振動數(shù)據(jù)。
圖4 岸橋?qū)嶋H振動數(shù)據(jù)聚類結(jié)果
本文以港口中實(shí)際運(yùn)行的岸橋?yàn)閷ο螅M(jìn)行了故障檢測的研究。針對目前港機(jī)缺乏充足的故障標(biāo)簽數(shù)據(jù)的情況,提出了一種基于無監(jiān)督方法的岸橋故障檢測方法。通過提取反映設(shè)備當(dāng)前狀況的特征值,對其進(jìn)行必要的歸一化與降維,優(yōu)化數(shù)據(jù)集,增強(qiáng)了下一步聚類分析的性能。通過實(shí)機(jī)檢測到的數(shù)據(jù)進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果驗(yàn)證了該方法的有效性。