丁家滿,原 琦,李 川
(昆明理工大學(xué) 信息工程與自動(dòng)化學(xué)院,云南 昆明 650500)
在城市軌道交通迅速發(fā)展的今天,輪對(duì)軸承作為列車運(yùn)行的核心部件,因?yàn)殚L(zhǎng)期處在高速運(yùn)轉(zhuǎn)的工作環(huán)境下,導(dǎo)致輪對(duì)軸承極易產(chǎn)生損壞。在列車高速運(yùn)行情況下,一旦軸承發(fā)生故障將造成車輛延誤,若對(duì)故障發(fā)現(xiàn)不及時(shí)并且沒有采取相應(yīng)有效措施,容易引起重大事故,甚至造成嚴(yán)重人員傷亡。因此,開展列車輪對(duì)軸承狀態(tài)監(jiān)測(cè)和故障診斷方面的研究尤為重要,而且十分必要[1-3]。
常見的列車輪對(duì)軸承狀態(tài)監(jiān)測(cè)與故障診斷方法有共振解調(diào)方法、沖擊脈沖方法、小波分析等[4-6],這些方法在早期輪對(duì)軸承故障診斷中應(yīng)用較為廣泛,在單一故障診斷方面取得較好的診斷效果,近些年涌現(xiàn)出了諸如基于模糊理論、知識(shí)推理、遺傳算法和人工神經(jīng)網(wǎng)絡(luò)等具有智能特點(diǎn)的故障診斷方法[7-11]。文獻(xiàn)[12]采用高斯RBF神經(jīng)網(wǎng)絡(luò)建立智能故障診斷系統(tǒng)用于機(jī)械齒輪箱故障診斷。文獻(xiàn)[13]結(jié)合小波分解和集合經(jīng)驗(yàn)?zāi)B(tài)分解來(lái)提取信號(hào)故障特征,利用能量判別法和搜索算法進(jìn)行故障模式識(shí)別。文獻(xiàn)[14]利用局部均值分解對(duì)信號(hào)進(jìn)行分解,從中提取時(shí)域統(tǒng)計(jì)量和能量等特征參數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),訓(xùn)練故障診斷模型。然而,在現(xiàn)實(shí)中,隨著輪對(duì)軸承之間的耦合性越來(lái)越高,造成故障的原因大多數(shù)是多重原因,輪對(duì)軸承信號(hào)的采集也是多方面的,采集到的故障信號(hào)信息也存在不確定性,即便符合某種分布,很可能也存在波動(dòng)情況。例如軸承振動(dòng)信號(hào)基本符合正態(tài)分布,但信號(hào)均值在[a,b]之間,方差在[c,d]之間漂移。另外,在對(duì)原始信號(hào)進(jìn)行特征提取會(huì)帶來(lái)特征以外的信息缺失問題。對(duì)于這種情況,采用傳統(tǒng)方法,簡(jiǎn)單使用分布函數(shù)來(lái)代替或者用區(qū)間來(lái)表達(dá)都不合適,都存在無(wú)法完整描述、信息丟失的問題。
針對(duì)上述問題,本文引入概率包絡(luò)理論,以SVM為分類模型,提出一種基于概率包絡(luò)的輪對(duì)軸承故障診斷方法(PE-SVM)。在對(duì)原始輪對(duì)軸承信號(hào)分布類型檢驗(yàn)的基礎(chǔ)上,建立概率包絡(luò)模型,提取其幾何形狀特征作為SVM的輸入,訓(xùn)練并得到診斷模型。診斷結(jié)果表明該方法較好地包容了輪對(duì)軸承故障診斷中存在的不確定性問題,提高了診斷精度。
概率包絡(luò)(Probability Envelope,PE)結(jié)合概率論和區(qū)間理論,通過計(jì)算隨機(jī)變量的累計(jì)概率函數(shù)(Cumulative Probability Distribution Function,CDF)積分面積變化范圍,將不確定性變量的波動(dòng)漂移包裹在一個(gè)具有上下邊界的區(qū)域內(nèi),防止信息丟失。概率包絡(luò)同時(shí)考慮了不確定參數(shù)固有的隨機(jī)性和不精確性。
(1)
(2)
則CDF函數(shù)的范圍為PE,可表示為
(3)
利用PE將變量X的累積概率函數(shù)限制在一個(gè)范圍內(nèi),即有
(4)
圖1 概率包絡(luò)示意
證據(jù)結(jié)構(gòu)體(Dempster-Shafer Structure,DSS)由有限個(gè)焦元組成,每個(gè)焦元由一個(gè)區(qū)間和區(qū)間信度組成,即
{([x1,y1],m1),([x2,y2],m2),…,([xn,yn],mn)}
所有焦元對(duì)應(yīng)的信度之和為1,即∑mi=1。
假若樣本空間為R,則處于這個(gè)鄰域R的證據(jù)結(jié)構(gòu)體m即mass函數(shù)可以表示為
2R→[0,1]
則置信函數(shù)為
(5)
似然函數(shù)為
(6)
概率包絡(luò)的核心是由多個(gè)DSS構(gòu)成,與證據(jù)結(jié)構(gòu)體之間可以相互轉(zhuǎn)化。
由DSS可以繪制出概率包絡(luò)下邊界為
(7)
概率包絡(luò)上邊界為
(8)
如果將概率包絡(luò)看成整體,那么證據(jù)結(jié)構(gòu)體就是它的組成部分。將所有證據(jù)結(jié)構(gòu)體xi值按mi間隙縱向排列并將其連接成線可以得到概率包絡(luò)上邊界。同理,將所有證據(jù)結(jié)構(gòu)體yi值按mi間隙縱向排列并將其連接成線可以得到概率包絡(luò)下邊界。反之,將概率包絡(luò)水平均勻切成n片,可以近似得到多個(gè)證據(jù)結(jié)構(gòu)體,切線兩個(gè)端點(diǎn)組成證據(jù)結(jié)構(gòu)體的區(qū)間,切片的高度為其信度(均勻切片,故所有證據(jù)結(jié)構(gòu)體的信度相等,為n分之一),如圖2所示。
圖2 概率盒的等信度離散化
針對(duì)故障信號(hào)出現(xiàn)的各類不確定性問題,利用概率包絡(luò)建模將采集到的不確定信號(hào)繪制在一個(gè)包絡(luò)結(jié)構(gòu)體內(nèi)。在分析軸承故障信號(hào)分布特點(diǎn)的基礎(chǔ)上,采用3種建模方法,其建模過程分為以下幾個(gè)步驟:
step1對(duì)采集到的原始信號(hào)進(jìn)行時(shí)頻域概率分布比對(duì),判斷其分布類型。
step2若原始信號(hào)基本遵循某種概率分布規(guī)律,則利用原始參數(shù)概率包絡(luò)建模方法(the Probability Envelope Modeling Method Based on Original Parameters,OPPEM)進(jìn)行概率包絡(luò)建模。
step3若原始信號(hào)不遵循某種概率分布規(guī)律時(shí),提取其無(wú)量綱特征并分析其分布特點(diǎn),判斷是否遵循某種概率分布規(guī)律,若滿足則采用特征參數(shù)概率包絡(luò)建模方法(the Probability Envelope Modeling Method Based on Characteristic Parameters,CPPEM)。
step4若所提取的特征信息無(wú)法確定概率分布類型時(shí),則采用概率包絡(luò)定義建模方法(the Probability Envelope Modeling Method Based on Definition,DPEM)。
建模流程如圖3所示。
圖3 建模流程
在針對(duì)不同的分布采用不同的建模方法對(duì)信號(hào)進(jìn)行概率包絡(luò)建模后,提取出概率包絡(luò)的特征量作為后續(xù)診斷的特征不僅可以增加診斷精度而且可以降低因?yàn)閿?shù)據(jù)規(guī)模增大帶來(lái)的時(shí)間消耗問題。本文通過提取概率包絡(luò)的幾何形狀構(gòu)成特征向量。
(1)累積包絡(luò)寬度
累積包絡(luò)寬度主要是為了描述信號(hào)數(shù)據(jù)的不確定的范圍,其計(jì)算公式為
(9)
(2)對(duì)數(shù)累積包絡(luò)寬度
其本質(zhì)是對(duì)累積包絡(luò)寬度取對(duì)數(shù)運(yùn)算,在壓縮不確定范圍的同時(shí),消除模型的異方差等特性,其計(jì)算公式為
(10)
(3)累積區(qū)間寬度
累積區(qū)間寬度主要是為了描述不確定性信號(hào)的取值平均范圍,其計(jì)算公式為
(11)
(4)邊界值
其本質(zhì)是獲取PE的累積置信區(qū)間,即PE上下界的各自加和,計(jì)算公式為
(12)
(5)矛盾區(qū)間統(tǒng)計(jì)
矛盾區(qū)間統(tǒng)計(jì)本質(zhì)是計(jì)算DSS的上界值大于下界值的特殊信號(hào)點(diǎn)的個(gè)數(shù),其計(jì)算公式為
(13)
(6)權(quán)重區(qū)間
其本質(zhì)是計(jì)算對(duì)數(shù)累積包絡(luò)寬度之外的焦元權(quán)重區(qū)間,其計(jì)算公式為
(14)
基于概率包絡(luò)的故障診斷方法的主要思想是將提取到的概率包絡(luò)的幾何形狀作為特征向量輸入到支持向量機(jī)SVM,訓(xùn)練得到分類器,進(jìn)行故障診斷。
基于概率包絡(luò)故障診斷算法如下:
Input: 信號(hào)數(shù)據(jù){x1,x2,…,xm}
Output: 故障分類診斷結(jié)果
Step1forn=1 tom
Step2概率包絡(luò)建模
Step3提取特征向量{y1,y2,…,yn}
Step4end
Step5將特征數(shù)據(jù)切分為訓(xùn)練集{a1,a2,…as}和測(cè)試集{b1,b2,…bt}
Step6初始化參數(shù)K(K折交叉驗(yàn)證)
Step7forj=1 toK
Step8選取徑向核函數(shù)
Step9確定參數(shù)懲罰因子C和σ
Step10end
Step11fori=1 toS
Step12確定松弛變量和權(quán)重系數(shù):ε,w
Step13訓(xùn)練模型
yi(wTxi+b)≥1-εi(i=1,2,…,n;εi≥0)
Step14end
Step15測(cè)試數(shù)據(jù)測(cè)試模型得出分類精度
本文分別選用了公共數(shù)據(jù)集和實(shí)測(cè)數(shù)據(jù)進(jìn)行了3次實(shí)驗(yàn),實(shí)驗(yàn)一主要驗(yàn)證本文提出基于概率包絡(luò)的特征提取方法的有效性,實(shí)驗(yàn)二和實(shí)驗(yàn)三分別從公共數(shù)據(jù)集和實(shí)測(cè)數(shù)據(jù)進(jìn)一步說(shuō)明本文方法的有效性及泛化能力。其中滾動(dòng)軸承振動(dòng)數(shù)據(jù)選用NSFI/UCR智能維護(hù)系統(tǒng)中心的公共數(shù)據(jù)集(IMS-www.imscenter.net)。實(shí)驗(yàn)裝置如圖4所示,其中安裝了4個(gè)軸承,旋轉(zhuǎn)速度為2 000 r/min,采樣頻率為1 024 Hz,軸和軸承上施加了6 000磅(約2.78 kN)的徑向載荷。
圖4 軸承故障測(cè)試實(shí)驗(yàn)裝置
本實(shí)驗(yàn)選取數(shù)據(jù)集1中的第三個(gè)軸承的數(shù)據(jù),其中正常與內(nèi)圈故障數(shù)據(jù)各60 000條。
對(duì)原始信號(hào)進(jìn)行頻譜分析,其時(shí)域波形和頻譜如圖5所示。
圖5 軸承時(shí)域波形圖和頻譜圖
由圖5可知,因?yàn)楦鱾鞲衅鳈z測(cè)信號(hào)較為復(fù)雜,采集到的信號(hào)中常包含背景噪聲和其他不確定性,假如無(wú)法完整、準(zhǔn)確地提取故障特征,將影響甚至導(dǎo)致故障診斷精度的下降。
針對(duì)以上存在的問題,采用本文方法對(duì)原始信號(hào)建立概率包絡(luò)模型,其正常軸承和內(nèi)圈故障的概率包絡(luò)圖如圖6所示。
圖6 概率包絡(luò)建模
由圖6可知,當(dāng)軸承出現(xiàn)故障時(shí),所構(gòu)建的概率包絡(luò)模型與正常軸承信號(hào)所建光滑曲線包絡(luò)相比,既有趨勢(shì)的相似,又有形狀特征的區(qū)別。如此,將所有信息包裹在概率包絡(luò)中,經(jīng)過概率包絡(luò)建模后的原始信號(hào)降低了因噪聲干擾和數(shù)據(jù)不確定性帶來(lái)的問題。
經(jīng)過概率包絡(luò)建模后的信號(hào),分別對(duì)正常軸承和內(nèi)圈故障軸承采用概率包絡(luò)的特征提取方法得到特征向量,見表1、表2。
本實(shí)驗(yàn)選取累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計(jì)和累積區(qū)間寬度為三類特征向量。當(dāng)利用SVM故障診斷時(shí),為了避免因參數(shù)選取不當(dāng)造成模型的不準(zhǔn)確,采用k折交叉驗(yàn)證(k-fold Cross Validation)的方法尋求出最恰當(dāng)?shù)膮?shù)值,其中k設(shè)為5,最終確認(rèn)SVM參數(shù)C和σ值分別為100和0.01。本實(shí)驗(yàn)分別從正常軸承和內(nèi)圈故障軸承數(shù)據(jù)中抽取,每300條數(shù)據(jù)為一組共200組,每組分別提取概率包絡(luò)特征,其中2/3用于訓(xùn)練SVM生成分類模型,用剩余1/3測(cè)試數(shù)據(jù)進(jìn)行故障診斷,并給出診斷結(jié)果及其分析。
表1 正常軸承特征向量
表2 內(nèi)圈故障特征向量
在相同信號(hào)源的條件下,基于相同的SVM分類原理,采用小波變換提取特征,進(jìn)行訓(xùn)練和故障診斷(WT-SVM),與本文方法的診斷結(jié)果對(duì)比見表3。
表3 PE-SVM和WT-SVM
從表3可以看出,相對(duì)于采用WT-SVM診斷方法而言,采用本文提出的PE-SVM診斷方法不僅在訓(xùn)練時(shí)間上具有明顯的優(yōu)勢(shì),而且診斷精確度較高。這種差別形成的原因一方面是本文方法使用概率盒來(lái)表達(dá)參數(shù)不確定性,使得對(duì)于振動(dòng)信號(hào)不確定性的描述更加全面,提取的特征更具區(qū)分度;另一方面,本文提出的基于概率包絡(luò)故障診斷算法采用k折交叉驗(yàn)證來(lái)尋找并確定最恰當(dāng)?shù)某瑓?shù),避免了過擬合的問題。
為更好驗(yàn)證本文方法的有效性,再次進(jìn)行一組對(duì)比實(shí)驗(yàn)。重新從數(shù)據(jù)集1的軸承3中截取出60 000條數(shù)據(jù)構(gòu)成新的原始數(shù)據(jù)集,部分?jǐn)?shù)據(jù)見表4。
表4 原始數(shù)據(jù)
采用概率包絡(luò)分別對(duì)采集到的信號(hào)數(shù)據(jù)進(jìn)行建模,正常和內(nèi)圈故障軸承概率包絡(luò)模型如圖7所示。
圖7 概率包絡(luò)建模
在建模后分別采用PE-SVM診斷方法和基于樸素貝葉斯網(wǎng)絡(luò)的概率包絡(luò)方法(PE-BN)進(jìn)行診斷對(duì)比分析,即先利用概率包絡(luò)對(duì)數(shù)據(jù)進(jìn)行特征提取,然后分別基于SVM和樸素貝葉斯網(wǎng)絡(luò)進(jìn)行訓(xùn)練和測(cè)試對(duì)比。利用概率包絡(luò)提取出的正常和內(nèi)圈故障軸承特征,見表5、表6。
表5 正常軸承特征向量
表6 內(nèi)圈故障特征向量
此次實(shí)驗(yàn)選取對(duì)數(shù)累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計(jì)和權(quán)重區(qū)間為特征向量作為SVM和樸素貝葉斯網(wǎng)絡(luò)的輸入進(jìn)行故障分類診斷。SVM參數(shù)設(shè)定采用k折交叉驗(yàn)證的方法確定出參數(shù)值,其中k設(shè)為5,最終選取出SVM參數(shù)C和的σ值分別為10和0.5,同時(shí)將特征值按6∶4隨機(jī)分為訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),將其分別傳入SVM和樸素貝葉斯網(wǎng)絡(luò)中進(jìn)行故障分類診斷。對(duì)比結(jié)果見表7。
表7 PE-SVM和PE-BN
表7結(jié)果是在采用概率包絡(luò)提取到相同特征向量的基礎(chǔ)上兩種方法的對(duì)比。一方面,表明采用本文提出的PE-SVM方法在訓(xùn)練時(shí)間上與PE-BN方法相當(dāng),但是在診斷精確度上優(yōu)于PE-BN方法。另一方面,兩種方法的診斷精確度綜合平均為99.03%,進(jìn)一步突顯本文采用概率包絡(luò)進(jìn)行不確性建模和故障特征提取的方法有效性。
為了更好地驗(yàn)證本文方法的泛化能力,進(jìn)行了第三次實(shí)驗(yàn),選取實(shí)測(cè)輪對(duì)軸承數(shù)據(jù)集中的外圈故障、滾動(dòng)體故障和正常軸承數(shù)據(jù)各5 000條,數(shù)據(jù)采樣頻率為10 240 Hz。對(duì)實(shí)測(cè)信號(hào)數(shù)據(jù)建立概率包絡(luò)模型,并提取累積包絡(luò)寬度、矛盾區(qū)間統(tǒng)計(jì)和累積區(qū)間寬度為三類概率包絡(luò)形狀特征,采用本文PE-SVM方法進(jìn)行故障診斷,其分類診斷精度和時(shí)間見表8。
表8 基于實(shí)測(cè)數(shù)據(jù)的診斷結(jié)果
由表8可以看出,由于樣本數(shù)量的降低和實(shí)測(cè)平臺(tái)部署環(huán)境與公開實(shí)驗(yàn)平臺(tái)環(huán)境差異性,尤其是將外圈、滾動(dòng)體故障混合在一起診斷,分類診斷精度有所下降,但故障診斷精度仍然穩(wěn)定在98%以上,并且分類診斷時(shí)間大幅縮短,因而表明本文所提PE-SVM故障診斷方法具有良好的泛化能力。
本文針對(duì)信號(hào)不確定性問題,引入概率包絡(luò)理論,將信號(hào)的不確定性包裹在概率包絡(luò)中,解決了特征提取信息丟失的問題。實(shí)驗(yàn)表明本文方法有效可行,在兼顧診斷模型訓(xùn)練效率的同時(shí),提高了故障診斷的精確度。本文方法具有較好的泛化能力,除了能用于列車輪對(duì)軸承故障診斷之外,對(duì)于其他類型的機(jī)械故障,也具備良好診斷效果。