苗中華,周廣興,劉海寧,劉成良
(1.上海大學 機電工程與自動化學院,上海 200072;2. 上海交通大學 機械與動力工程學院,上海 200240)
重大裝備的安全服役與智能維護是我國裝備制造業(yè)面臨的重要課題。相比定期維護及事后維修,基于狀態(tài)的設(shè)備維護(Condition-Based Maintenance, CBM)被認為是目前最有效的維護策略[1]。然而,基于狀態(tài)的設(shè)備維護需要采集多路傳感信息,尤其在低轉(zhuǎn)速條件下連續(xù)長時間采樣,將造成海量冗余數(shù)據(jù)。如何在海量冗余數(shù)據(jù)中進行信號有效特征提取是智能維護領(lǐng)域亟需探索的基礎(chǔ)理論和關(guān)鍵技術(shù)難題。
在鐵路系統(tǒng)的常規(guī)維護中,工人用鐵錘敲擊機車車輪,根據(jù)敲擊聲音來判斷車輪是否有裂紋;工程領(lǐng)域中經(jīng)驗豐富的維護人員根據(jù)機器工作時發(fā)出的聲音就能夠判斷機器是否運行正常。上述現(xiàn)象潛在的物理原理是由于零部件損傷改變了其特征頻率,進而改變了聲音的音色。然而,工程應用領(lǐng)域?qū)@種僅憑聽力系統(tǒng)所實現(xiàn)的生物本能診斷能力的運作原理,包括耳朵對聲音信號的處理及大腦中診斷知識的建立,卻鮮有解釋。
Barlow[2]開創(chuàng)性地提出了視神經(jīng)系統(tǒng)信息處理的一個基本原則是:冗余度壓縮(Redundancy Reduction)。進一步地,F(xiàn)?ldiák[3]將稀疏編碼(Sparse Coding)的概念與冗余度壓縮建立了聯(lián)系?;谏鲜黾僭O(shè)性研究,Olshausen等[4-5]首先在《Nature》雜志上發(fā)表論文指出:從自然圖像中學習出了與哺乳動物初級視覺皮層神經(jīng)元具有相同特性的基函數(shù),并進一步將稀疏編碼解釋為諸多生物傳感系統(tǒng)信息處理的基本策略。Smith等[6]也在《Nature》上發(fā)表論文驗證了移不變稀疏編碼(Shift-Invariant Sparse Coding)是生物聽覺系統(tǒng)的有效建模手段,并提出了相應的基函數(shù)學習方法。上述研究表明:移不變稀疏編碼可以作為維護人員僅憑聽力系統(tǒng)所實現(xiàn)的生物本能診斷能力的一種有效解釋,其必然也應具有在機械旋轉(zhuǎn)設(shè)備故障診斷中應用的潛力。
本文借鑒神經(jīng)科學研究的相關(guān)進展,在前人探索研究的基礎(chǔ)上[7-8],從模擬人耳對聲音信號處理原理的角度,研究利用稀疏編碼進行信號有效特征提取的若干問題,并進行實驗驗證。
稀疏編碼的概念源于視神經(jīng)網(wǎng)絡(luò)的研究,是對只有小部分神經(jīng)元同時處于活躍狀態(tài)的多維數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)的表示方法。就生物神經(jīng)學而言,稀疏編碼是指:生物感知系統(tǒng)進化極度高效的編碼策略來最大化傳遞到大腦的信息,同時最小化能量的消耗與對神經(jīng)資源的占用——感知信息由海量存在的神經(jīng)元中極少數(shù)激活神經(jīng)元所表示。從數(shù)學的角度講,稀疏編碼被假設(shè)為是對多維數(shù)據(jù)進行線性分解的一種表示方法。一個輸入信號X=[x1,x2,…,xM]T可以被表示成基函數(shù)的加權(quán)和,再加上附加噪聲:
(1)
式中,矩陣D∈RM×K被稱作字典(Dictionary),其中列向量為基函數(shù)dk,又稱作原子(Atoms),s=[s1,s2,…,sK]T是輸入信號x的稀疏表示(Sparse Representation),ε通常假設(shè)為高斯噪聲。
稀疏編碼即是基于給定信號x與字典D求解稀疏表示s。在式(1)所示的模型中,基函數(shù)的個數(shù)可以大于輸入信號的維數(shù),即:M (2) 從本質(zhì)上講,稀疏性是上述兩個問題的共同優(yōu)化目標。對字典學習而言,稀疏性能夠促進基函數(shù)對數(shù)據(jù)特征模式的捕捉;對系數(shù)求解來說,稀疏性從模式識別的簡約原則(Parsimony Principle)[9]上能夠使得后續(xù)推理過程變得簡單。 基于給定字典精確求解信號的稀疏表示被證明是一個NP-Hard問題[10],通常采用匹配追蹤算法[11-12]或者最大后驗概率估計(Maximum A Posterior, MAP)[13-14]近似求解。 (3) (4) (5) (6) (7) 同時,每一個樣本的似然可以被表示成: (8) 根據(jù)式(4)中的似然函數(shù),并假設(shè)系數(shù)的先驗概率分布為Laplace分布,則似然式(8)可被推導為: (9) (10) 式中第一項可以看作逼近誤差,第二項可以看作具有懲罰參數(shù)β=2σ2θ的稀疏約束,從而將字典的最大似然估計轉(zhuǎn)換成求解最優(yōu)化問題。根據(jù)式(10)和式(5)可以完成字典D的學習以及稀疏表示s的求解。 在信號處理過程中經(jīng)常將一個較長信號分割成若干固定長度信號段。在分割過程中,時間序列中的特征模式會由于信號段長度的不同而被“移動”到信號段內(nèi)的不同時間位置。由于稀疏編碼將時間序列表示成基函數(shù)的加權(quán)和,而為了表示被移動的特征模式,就必須在字典中構(gòu)造同一基函數(shù)在不同時間位置的若干實例。然而,同一基函數(shù)在不同時間位置的實例仍然對應于同一信號事件。因此,需要引入移不變稀疏編碼算法來解決同一基函數(shù)在不同時間位置的實例仍對應相同事件的難題。 移不變稀疏編碼模型通過在原稀疏編碼模型中引入附加參數(shù)來滿足其“移不變”的特性: (11) 式中:Tl為移位算子,將基函數(shù)在位置范圍l∈[-L,L]內(nèi)移動;sk,j是移動到位置l處的基函數(shù)dk的系數(shù);向量ε仍舊假設(shè)為高斯噪聲。 移不變稀疏編碼的系數(shù)求解與字典學習算法可從標準稀疏編碼的對應算法得到。給定有限數(shù)據(jù)集X={x1,x2,…,xN},并假設(shè)基函數(shù)服從均勻分布,基函數(shù)與其對應系數(shù)的最大后驗概率估計器為: (12) Subject to C (13) 式中,卷積算子 *是式(11)中移位算子Tl的一個特例;sk,j∈RM-K+1是基函數(shù)dk在信號xi中的稀疏激活;C定義了一個約束,防止求解的dk太大而sk,j太小。當設(shè)定變量d不變時,可以基于凸優(yōu)化方法求解s,同理,當設(shè)定變量s不變時,可基于凸優(yōu)化求解d。字典學習可通過迭代地交替求解這兩個問題來實現(xiàn);當目標函數(shù)收斂后,基于學習的基函數(shù)可求得稀疏解[15]。 從信號處理角度來講,稀疏編碼受益于字典學習來保證稀疏表示的稀疏性。通過字典學習,信號的特征模式被基函數(shù)捕捉;然后通過系數(shù)求解將信號中以一段時間序列表示的特征模式代之以一個非零系數(shù)表示,從而構(gòu)成原信號的稀疏表示。因此,從理論上講,稀疏編碼可以作為設(shè)備狀態(tài)監(jiān)測中的一種有效特征提取方法。下面以軸承故障數(shù)據(jù)為例,驗證稀疏編碼在振動信號分析中的可行性。 振動數(shù)據(jù)取自美國凱斯西儲大學(Case Western Reserve University, CWRU)的開放數(shù)據(jù)集[16]。該數(shù)據(jù)集被國內(nèi)外基于狀態(tài)維護的學者廣泛使用,被認為是測試和驗證設(shè)備狀態(tài)識別新方法的一個基準。軸承試驗裝置示意如圖1所示。左側(cè)是一個2 HP的三相感應電動機(型號:Reliance Electric 2HP IQPreAlert),右側(cè)是用于產(chǎn)生額定負載的測力計,二者通過扭矩傳感器自動對準配合,測試軸承安裝在電機驅(qū)動端,振動傳感器安裝在電機的驅(qū)動端上側(cè)。 圖1 軸承試驗裝置示意圖 為了模擬軸承故障,分別在軸承的內(nèi)圈、外圈(6∶00, 3∶00,12∶00方向)及滾動體上采用電火花加工的方式引入單點缺陷。缺陷尺寸分別為0.007、0.014、0.021、0.028 英寸,其中前三種尺寸采用SKF6205-2RS JEM型軸承,最后一種尺寸采用NTN 軸承。分別在0、1、2、3 hp 四種負載下獲取振動數(shù)據(jù),采集頻率取12 kHz。 表1 軸承正常狀態(tài)振動數(shù)據(jù)列表 軸承正常狀態(tài)下采集的信號如表1所示,不同故障狀態(tài)下采集的振動數(shù)據(jù)如表2所示。為了便于信號分析,每種軸承狀態(tài)下的振動數(shù)據(jù)被分割成包含1 024個采樣點的數(shù)據(jù)樣本,并對數(shù)據(jù)樣本邊緣做光滑處理以減少信號分析中邊緣效應。經(jīng)過數(shù)據(jù)分割,表1中每種工況下的正常數(shù)據(jù)樣本為236個,表2中不同工況及故障類型下的數(shù)據(jù)樣本為128個,共計8024個數(shù)據(jù)樣本。不失一般性地,負載為0 hp的正常及不同故障類型下的樣本數(shù)據(jù)中隨機抽取一半用于振動數(shù)據(jù)字典學習,所抽取數(shù)據(jù)樣本標號末尾以“?”符號標記,剩余數(shù)據(jù)樣本標號末尾以“”符號標記。 表2 故障狀態(tài)下的軸承振動數(shù)據(jù)列表 從機械診斷學角度講,瞬時振動脈沖波動攜帶了重要的診斷信息,是設(shè)備狀態(tài)識別的重要依據(jù)。因此,捕捉和分析瞬時振動脈沖是振動信號處理和特征提取的目的之一。如果能夠通過字典學習出振動信號中的瞬時脈沖作為基函數(shù),無疑會促進稀疏編碼對振動信號的特征提取。分別對表1與表2所抽取的振動樣本數(shù)據(jù)(末尾以“?”符號標記)進行字典學習。指定基函數(shù)長度為80,每個字典中基函數(shù)個數(shù)為10。考慮到信號分割瞬時脈沖可能出現(xiàn)在信號段內(nèi)的任意位置,采用基于移不變稀疏編碼模型算法[14]進行字典學習,并進行稀疏求解。所學習出的振動信號字典如圖2所示,從每一類振動數(shù)據(jù)中學習出的10個函數(shù)被標記為子字典Di(i∈[1,15]) 圖2 從每一類軸承振動數(shù)據(jù)中學習出的字典(圖中每一個子字典Di,從對應的數(shù)據(jù)樣本學習得到) 圖3 原始振動信號及其時域頻譜圖 從圖2可以看出:從軸承正常狀態(tài)振動數(shù)據(jù)中學習出的基函數(shù)明顯有別于從故障狀態(tài)振動數(shù)據(jù)中學習出的基函數(shù),且沒有明顯的劇烈瞬時脈沖;從內(nèi)外圈故障振動數(shù)據(jù)學習到的基函數(shù)波形比球故障振動數(shù)據(jù)的基函數(shù)波形更集中一些。這些不同可以從脈沖產(chǎn)生的機理來解釋: (1) 軸承在正常狀態(tài)下,滾動體在內(nèi)外圈包圍的滾道內(nèi)平穩(wěn)滾動,沒有沖擊產(chǎn)生。因而,軸承正常狀態(tài)下的振動信號無明顯的瞬時脈沖波動,但可能存在軸承剛性非線性、不同滾動體承載非線性或電機其他干擾源等因素,故會有均勻的微弱振動脈沖產(chǎn)生; (2) 當內(nèi)圈或外圈出現(xiàn)損傷時,均勻排列的滾動體在滾道內(nèi)滾動過程中會依次循環(huán)撞擊損傷部位,因此,振動信號中會周期性地產(chǎn)生瞬時脈沖波動。 (3) 當損傷部位是在滾動體上時,每次損傷部位與內(nèi)外圈滾道的撞擊時間、撞擊角度都是隨機的,因此,振動信號雖然幅值較大,但無明顯規(guī)律。不同軸承狀態(tài)下的振動信號的波形特點決定了學習出的基函數(shù)具有不同的結(jié)構(gòu)特點。 為了驗證所學習出的字典的有效性,我們采用這些字典來求解振動信號的稀疏表示。不失一般性地,從內(nèi)圈故障數(shù)據(jù)樣本集I070中抽取一個信號樣本進行稀疏表示的求解。該信號樣本原始波形和時頻譜如圖3所示。采用從同類振動數(shù)據(jù)I070中學習出的字典Di求解該信號的稀疏表示,結(jié)果如圖4所示。字典Di中的10個基函數(shù)依次豎直排列在圖4中左側(cè),與之水平對應的右側(cè)是各個基函數(shù)在原振動信號中的稀疏激活。稀疏激活中的每個尖峰表示對應的基函數(shù)在橫軸所示的位置被激活,尖峰的幅值大小表示基函數(shù)的強度。由圖4不難看到,稀疏表示中僅有少量的非零脈沖。 圖4 基函數(shù)及其稀疏激活 根據(jù)式(1)所示的稀疏編碼模型可知,一個原始振動信號可由基函數(shù)及其稀疏激活進行重構(gòu),結(jié)果見圖5。對比圖3和圖5,不難看到:振動信號被很好的復原,時域波形上的瞬時脈沖更加突出,時頻譜上的高頻信號成分的周期性也更加明顯。這一結(jié)果與稀疏編碼模型中的高斯噪聲假設(shè)有關(guān),由于信號重構(gòu)僅利用基函數(shù)與稀疏激活,假設(shè)噪聲的成分被剔除,這在一定程度上起到了噪聲抑制的作用。上述信號分析過程驗證了從振動信號中學習出的字典有效性。 圖5 重構(gòu)振動信號及其時頻譜圖 上述稀疏編碼算法以及針對振動信號的稀疏表示,可以直接用于基于狀態(tài)的設(shè)備狀態(tài)監(jiān)控以及故障診斷。以美國凱斯西儲大學公開的數(shù)據(jù)集為例,進行基于稀疏編碼的人工軸承故障診斷實驗分析研究。 將圖4中基函數(shù)的稀疏激活取絕對值并在沿縱軸方向進行疊加,從而得到所有基函數(shù)在振動信號時間段內(nèi)的激活統(tǒng)計,如圖6所示。從圖中下側(cè)可以看到,在橫軸方向上尖峰出現(xiàn)的位置對應于上側(cè)的原始信號中的瞬時脈沖,并且其周期性更加明顯。從稀疏激活的絕對值統(tǒng)計圖中可以很容易地估計出脈沖出現(xiàn)的周期,經(jīng)實際計算所得平均周期為0.006 2 s。這一周期對應著軸承內(nèi)圈損傷時的通過頻率162.2 Hz。 圖6 基函數(shù)稀疏激活絕對值之和(內(nèi)圈損傷) 圖7 基函數(shù)稀疏激活絕對值之和(外圈損傷) 圖8 基函數(shù)稀疏激活絕對值之和(滾動體損傷) 以上分析說明,稀疏編碼在振動信號分析中的應用與常規(guī)的人工機械設(shè)備診斷方法相一致,從而進一步驗證了稀疏編碼可以作為一種有效的振動信號分析工具。 受設(shè)備維護人員憑借聽覺系統(tǒng)所實現(xiàn)的生物本能診斷能力的啟發(fā),本文借鑒生物感知系統(tǒng)“冗余度壓縮”的信息處理原則,引入神經(jīng)科學研究中的稀疏編碼算法,提出了連續(xù)長時間采樣時振動信號有效特征提取方法。詳細闡述了稀疏編碼的理論背景、算法和模型,特別對稀疏編碼相關(guān)的字典學習與稀疏表示求解進行了深入的分析總結(jié)。通過將稀疏編碼應用于軸承振動信號分析,驗證了其在挖掘振動信號中設(shè)備狀態(tài)信息的有效性。基于人工軸承故障數(shù)據(jù)集進行的實驗驗證表明:基于稀疏編碼的振動信號特征提取算法不僅能有效提取設(shè)備狀態(tài)特征,而且稀疏特征具有良好的可分性。該方法可用于設(shè)備故障診斷,為基于狀態(tài)的設(shè)備智能維護提供有效工具。 [1]Jardine A K S, Lin D, Banjevic D. A review on machinery diagnostics and prognostics implementing condition-based maintenance[J]. Mechanical systems and signal processing, 2006, 20(7): 1483-1510. [2]Barlow H B. Possible principles underlying the transformation of sensory messages [J]. Sensory communication, 1961: 217-234. [3]F?ldiák P. Forming sparse representations by local anti-hebbian learning [J]. Biological cybernetics, 1990, 64(2): 165-170. [4]Olshausen B A. Emergence of simple-cell receptive field properties by learning a sparse code for natural images [J]. Nature, 1996, 381(6583): 607-609. [5]Olshausen B A, Field D J. Sparse coding of sensory inputs [J]. Current opinion in Neurobiology, 2004, 14(4): 481-487. [6]Smith E C, Lewicki M S. Efficient auditory coding [J]. Nature, 2006, 439(7079): 978-982. [7]尚麗.稀疏編碼算法及其應用研究[D]. 合肥:中國科學技術(shù)大學, 2004. [8]劉海寧. 基于稀疏編碼的設(shè)備狀態(tài)識別及其重型軋輥磨床監(jiān)測應用[D].上海交通大學,2011. [9]Wright J, Yang A Y, Ganesh A, et al. Robust face recognition via sparse representation [J]. Pattern Analysis and Machine Intelligence, IEEE Transactions on, 2009, 31(2): 210-227. [10]Davis G, Mallat S, Avellaneda M. Adaptive greedy approximations [J]. Constructive approximation, 1997, 13(1): 57-98. [11]Mallat S G, Zhang Z. Matching pursuits with time-frequency dictionaries [J]. Signal Processing, IEEE Transactions on, 1993, 41(12): 3397-3415. [12]Pati Y C, Rezaiifar R, Krishnaprasad P. Orthogonal matching pursuit: recursive function approximation with applications to wavelet decomposition[C]1993, IEEE. 40-44 vol. 1. [13]Lewicki M S, Sejnowski T J. Learning overcomplete representations [J]. Neural Computation, 2000, 12(2): 337-365. [14]Lewicki M S, Olshausen B A. Probabilistic framework for the adaptation and comparison of image Codes [J]. JOSA A, 1999, 16(7): 1587-1601. [15]Grosse R, Raina R, Kwong H, et al. Shift-invariant sparse coding for audio classification [J]. Cortex, 2007, 9: 8. [16]Loparo K, Bearings vibration data set[D]. Case Western Reserve University, 2003.1.2 系數(shù)求解與字典學習
1.3 移不變稀疏編碼
2 基于稀疏編碼的振動信號分析
2.1 軸承振動數(shù)據(jù)獲取
2.2 軸承振動信號字典學習
2.3 振動信號的稀疏編碼分解與重構(gòu)
3 基于稀疏編碼的人工軸承故障診斷實驗研究
4 結(jié) 論