国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于支持向量機(jī)的健康狀態(tài)評估方法①

2018-04-20 01:16春,
關(guān)鍵詞:軸箱決策樹均值

張 春, 舒 敏

(北京交通大學(xué) 高速鐵路網(wǎng)絡(luò)管理教育部工程研究中心,北京 100044)

(北京交通大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,北京 100044)

近年來,高速列車(HSTS)的速度已經(jīng)提升到300多公里/小時(shí)[1],根據(jù)國際鐵路聯(lián)盟的報(bào)告,截至2015年4月,整個(gè)世界運(yùn)行的高速鐵路數(shù)量已經(jīng)達(dá)到了3603輛,使得列車的安全性和可靠性備受關(guān)注[2]. 軸箱軸承作為高速鐵路動車組的關(guān)鍵部件之一,有著舉足輕重的位置[3],其主要作用是限制相對運(yùn)動和減少機(jī)器旋轉(zhuǎn)部件之間的摩擦力. 在高速鐵路動車組中,每對輪軸都需要配備一個(gè)軸箱軸承,由于高應(yīng)力和載荷的影響,軸箱軸承會磨損、破壞乃至失效,這將會不同程度地影響列車的安全性與經(jīng)濟(jì)適用性,因此,許多科學(xué)家和企業(yè)致力于研究軸箱軸承的故障監(jiān)測與剩余壽命預(yù)測. 通過比較在正常情況和故障情況下運(yùn)行軸箱軸承的溫度范圍,發(fā)現(xiàn)軸箱軸承在不同的健康狀態(tài)下,由于載荷以及徑向力的不同,導(dǎo)致摩擦力不同,從而伴隨產(chǎn)生的熱量不一致的現(xiàn)象. 因此,使用基于機(jī)器學(xué)習(xí)的判別軸箱軸承的不同健康狀態(tài)的分類方法應(yīng)運(yùn)而生,其根據(jù)溫度范圍做出健康狀態(tài)評估,指導(dǎo)運(yùn)維決策. 基于機(jī)器學(xué)習(xí)的分類方法主要包括三個(gè)步驟: 特征提取、特征選擇和特征分類. 常被提取的特征可以是統(tǒng)計(jì)特征[4],自回歸滑動平均(ARMA)特征[5],直方圖特征[5]或小波特征[6],常用的特征選取技術(shù)包括主成分分析(PCA)[7],遺傳算法(GA)和決策樹(DT). 在本文的研究中使用了統(tǒng)計(jì)特征和基于決策樹方法的特征選取技術(shù).

本文提出了一種以支持向量機(jī)(SVM)為算法基礎(chǔ),基于決策樹與層次分析法進(jìn)行改進(jìn)的健康狀態(tài)評估的方法,. 支持向量機(jī)[8]是一種以數(shù)據(jù)為驅(qū)動,有效進(jìn)行故障預(yù)測與診斷的機(jī)器學(xué)習(xí)方法,目前已經(jīng)成功地應(yīng)用在各大領(lǐng)域和系統(tǒng)中,包括智能電網(wǎng)[8]、汽車液壓制動系統(tǒng)[9]、汽油發(fā)動機(jī)氣門[10]、軸承[12,13]等. 支持向量既可以克服神經(jīng)網(wǎng)絡(luò)等方法所固有的過擬合和欠擬合問題,又可以在樣本稀疏的條件下實(shí)現(xiàn)較高的分類效果. 此外,其通過尋求最小化結(jié)構(gòu)化風(fēng)險(xiǎn)來提高模型的泛化性能,實(shí)現(xiàn)經(jīng)驗(yàn)風(fēng)險(xiǎn)和置信范圍的最小化[14].

目前基于支持向量機(jī)的多分類方法主要有一對一法(One-Against-One SVM,OAO-SVM)、一對多法(One-Against-All SVM,OAA-SVM)、基于有向無環(huán)圖法(Decision Directed Acyclic Graph SVM,DDAGSVM)和決策樹方法(Decision Tree,SVMDT-SVM)[15].OAA-SVM與OAO-SVM的分類準(zhǔn)確率比較高,但是前者需要訓(xùn)練N個(gè)決策樹來遍歷整個(gè)數(shù)據(jù)集,后者需要訓(xùn)練N(N-1)/2個(gè)決策面,所需時(shí)間均較長; DDAVSVM需要訓(xùn)練N(N-1)/2個(gè)決策面,DT-SVM需要訓(xùn)練N-1個(gè)決策面,由于這兩種方法的訓(xùn)練數(shù)據(jù)結(jié)構(gòu)為樹形,其遍歷過程自頂向下逐層遞減,所以訓(xùn)練速度比前兩者有大大的提高. 相對DDAV-SVM需要遍歷N-1個(gè)決策面,DT-SVM方法在識別階段只需要遍歷log2N個(gè)決策面,時(shí)間優(yōu)勢更加明顯. 另外決策樹很容易理解和解釋,還可以通過更緊湊的結(jié)合形成影響圖,增強(qiáng)對事件與關(guān)系的關(guān)注度,同時(shí)在部分?jǐn)?shù)據(jù)缺失的情況下,也可以達(dá)到較好的分類效果. 綜合考慮軸箱軸承故障樣本數(shù)據(jù)的稀缺性、各類樣本分布的不規(guī)律性以及各特征權(quán)重不一致的特點(diǎn),本文優(yōu)先選取決策樹算法.

1 相關(guān)工作

1.1 支持向量機(jī)理論基礎(chǔ)

指導(dǎo)思想: 尋找一個(gè)分類超平面,將兩類樣本分別劃分到超平面兩側(cè),并且使得每類的樣本與分類超平面的距離達(dá)到最大. 其中,每個(gè)類別中與分類超平面最近的點(diǎn)被稱為支持向量. 并且,每個(gè)類別的支持向量到分類超平面的距離相等的時(shí)候才能達(dá)到最優(yōu)分類超平面. 針對二分類問題,若問題線性可分,則找到其最優(yōu)分類面將訓(xùn)練樣本完全分開(即使得每一類數(shù)據(jù)與超平面距離最近的向量與超平面之間的距離最大),如圖1所示; 若問題線性不可分,則通過使用核函數(shù)將特征向量從低維空間映射到高維空間使其線性可分,如圖2所示.

圖1 線性可分情況

計(jì)算模型: 給定訓(xùn)練樣本集{x[i],y[i]},i=1,2,3,…,n,y,其中,y=+1為類別1,y=-1為類別2.

假設(shè)n維空間的分類超平面是則任意一點(diǎn)(x,y)到這個(gè)超平面的距離為,而SVM的目標(biāo)就是尋找可以正確區(qū)分所有樣本的w,b,并使得對于任意一個(gè)支持向量(x,y)有:

圖2 非線性可分情況

由于同一個(gè)分類超平面w,b可以成比例的放縮.因此總可以經(jīng)過適當(dāng)?shù)姆趴s找到合適的w,b使得支持向量處的值為1或-1. 所以這時(shí)目標(biāo)公式(1)就簡化為:

而此時(shí)的約束條件可以表達(dá)為:

在實(shí)際應(yīng)用過程中一般采用的公式(2)的另一種等價(jià)凸函數(shù)形式,見下述公式(4),因此問題轉(zhuǎn)化為下述公式(4)和公式(5).

將公式(4)和公式(5)轉(zhuǎn)換為標(biāo)準(zhǔn)形式公式(6)和公式(7),

然后根據(jù)對偶理論,可以通過求解該問題的對偶問題得到最優(yōu)解,其對應(yīng)的對偶問題為公式(8):

1.2 決策樹理論基礎(chǔ)

決策樹是一種用于對實(shí)例進(jìn)行分類的樹形結(jié)構(gòu).決策樹由節(jié)點(diǎn)(node)和有向邊(directed edge)組成. 節(jié)點(diǎn)的類型有兩種: 內(nèi)部節(jié)點(diǎn)和葉子節(jié)點(diǎn). 其中,內(nèi)部節(jié)點(diǎn)表示一個(gè)特征或?qū)傩缘臏y試條件(用于分開具有不同特性的記錄),葉子節(jié)點(diǎn)表示一個(gè)分類. 一旦我們構(gòu)造了一個(gè)決策樹模型,以它為基礎(chǔ)來進(jìn)行分類將是非常容易的. 具體做法是,從根節(jié)點(diǎn)開始,對實(shí)例的某一特征進(jìn)行測試,根據(jù)測試結(jié)構(gòu)將實(shí)例分配到其子節(jié)點(diǎn)(也就是選擇適當(dāng)?shù)姆种?; 沿著該分支可能達(dá)到葉子節(jié)點(diǎn)或者到達(dá)另一個(gè)內(nèi)部節(jié)點(diǎn)時(shí),那么就使用新的測試條件遞歸執(zhí)行下去,直到抵達(dá)一個(gè)葉子節(jié)點(diǎn). 當(dāng)?shù)竭_(dá)葉子節(jié)點(diǎn)時(shí),我們便得到了最終的分類結(jié)果.

如圖3所示為決策樹的一個(gè)實(shí)例,僅僅用兩個(gè)feature就可以對數(shù)據(jù)集(表1)中的5個(gè)記錄實(shí)現(xiàn)了準(zhǔn)確的分類.

圖3 決策樹實(shí)例

表1 數(shù)據(jù)集

得到規(guī)則如下:

1.3 AHP算法

層次分析法是一種定性與定量相結(jié)合的基于運(yùn)籌學(xué)理論的層次權(quán)重決策分析方法[16],其主要特點(diǎn)是用兩兩重要性程度表示出兩個(gè)方案的相應(yīng)1~9級重要性程度等級(如表2所示),以此判斷各個(gè)因素的相對重要性.

層次分析法按照上述標(biāo)準(zhǔn)將復(fù)雜系統(tǒng)簡單化,劃分為目標(biāo)層、準(zhǔn)則層和指標(biāo)層,對每層構(gòu)建判斷矩陣,通過比較和計(jì)算獲得不同的權(quán)重,來對每一層進(jìn)行決策,同時(shí)有效利用專家經(jīng)驗(yàn)的干預(yù),得到更加合理的方案.

1.4 基于決策樹的SVM算法

基于決策樹的SVM分類方法的基本思想是將一個(gè)N類可分的問題分解為若干個(gè)二分類問題. 首先將數(shù)據(jù)集劃分為兩個(gè)子集,然后對兩個(gè)子集繼續(xù)劃分,依次類推,直至最后的子集不能被劃分為止,在這個(gè)過程中會動態(tài)生成一棵二叉樹.

DT-SVM生成的決策樹有兩種不同的方式[17]:

1)偏態(tài)樹. 根節(jié)點(diǎn)表示所有類元素的集合,每一次SVM都通過二分類法單獨(dú)剝離出一個(gè)類別作為葉子節(jié)點(diǎn),其他類別繼續(xù)作為子樹根節(jié)點(diǎn),循環(huán)直到所有類別都為葉子節(jié)點(diǎn)結(jié)束. 如圖4所示.

2)正態(tài)樹. 根節(jié)點(diǎn)是所有類元素集合,首先SVM將所有類元素分成兩部分,然后再對這兩部分進(jìn)行二分類,直到所有類別均變成子節(jié)點(diǎn)結(jié)束,如圖5所示.

雖然DT-SVM對于N分類問題只需要構(gòu)造N-1個(gè)分類器,具有較高的訓(xùn)練速度和分類速度,但是DTSVM存在錯(cuò)分類現(xiàn)象,即分類錯(cuò)誤越靠近樹根的地方,錯(cuò)誤延續(xù)的節(jié)點(diǎn)數(shù)據(jù)越多,其分類性能越差. 所以,在構(gòu)造決策樹的過程中必須秉持著先易類后難類的原則,先將比較容易分開的類放在根節(jié)點(diǎn),逐層類推直至葉子結(jié)點(diǎn). 因此如何確定決策樹的結(jié)構(gòu)是個(gè)關(guān)鍵問題.

圖4 DT-SVM 偏態(tài)樹

圖5 DT-SVM正態(tài)樹

另一方面,由于高速鐵路動車組的安全可靠性,基于故障狀態(tài)的現(xiàn)場數(shù)據(jù)特別少,導(dǎo)致數(shù)據(jù)不平衡的問題成為一大挑戰(zhàn),大類的數(shù)據(jù)遠(yuǎn)遠(yuǎn)超過了小類的數(shù)據(jù),故障樣本數(shù)據(jù)的稀缺導(dǎo)致分類精度存在偏差、不同樣本數(shù)據(jù)映射到高維空間的分布情況不同、分類過程中特征值所占權(quán)重不同. 另外二叉樹的遍歷都是從根節(jié)點(diǎn)開始,帶有一定的盲目性,會導(dǎo)致資源的浪費(fèi). 因此本文提出對基于決策樹的支持向量機(jī)方法進(jìn)行改進(jìn),平衡掉不同各類別數(shù)據(jù)量差異過大問題,彌補(bǔ)上述不足.

2 改進(jìn)的AHP-DT-SVM算法

DT-SVM構(gòu)造的分類二叉樹結(jié)構(gòu)不統(tǒng)一,并且不同的二叉樹結(jié)構(gòu)對分類的結(jié)果和精度影響較大,本文對DT-SVM算法進(jìn)行優(yōu)化,結(jié)合層次分析法確定特征值的權(quán)重,讓權(quán)重高的特征值位于二叉樹上層,保證盡可能高效的首先識別. 基于此的DT-SVM每次都會得到較好的分類二叉樹,避免隨機(jī)性造成的結(jié)果不準(zhǔn)確與精度不夠高的問題.

軸箱軸承在使用過程中,會受到載荷、潤滑、使用時(shí)間、維護(hù)措施以及疲勞擴(kuò)展的隨機(jī)性等多種因素的影響,而軸箱軸承的損壞主要是由摩擦產(chǎn)生,其次是軸箱徑向受力和軸向受力. 根據(jù)速度、表面破壞程度等影響因素的不同,軸箱軸承間產(chǎn)生的摩擦力度會有所差異,進(jìn)而導(dǎo)致產(chǎn)生的熱量不同,軸箱軸承產(chǎn)生的溫度高低也就會有所差別. 由于金屬的導(dǎo)熱性,跟軸箱有關(guān)的零部件也會接受熱量產(chǎn)生溫升. 此外,雖然同一轉(zhuǎn)向架不同軸箱運(yùn)行環(huán)境一致,但由于故障的產(chǎn)生,導(dǎo)致各自當(dāng)前溫度可能有差異. 因此可通過對比溫度范圍來進(jìn)一步確定軸箱健康狀態(tài). 另外,考慮到不同的特征值具有不同的影響程度,基于層次分析法的AHP-DT-SVM算法對軸箱軸承進(jìn)行健康狀態(tài)分類的過程如圖6所示.

圖6 基于AHP-SVM的健康狀態(tài)評估模型

1) 建立層次分析結(jié)構(gòu),在深入分析待研究問題的基礎(chǔ)上,將分析指標(biāo)劃分為不同的層次,建立多層次評價(jià)模型.

2) 構(gòu)造判斷矩陣,設(shè)置評價(jià)模型的重要性比較評價(jià)指標(biāo)集V={v1,v2,…,vn},vi為第i個(gè)需要進(jìn)行比較的指標(biāo),對同一層次的各因子關(guān)于上一層次某一準(zhǔn)則的重要性兩兩比較,然后構(gòu)建比較判斷矩陣.

3) 計(jì)算權(quán)重,采用算數(shù)平均法對判斷矩陣進(jìn)行計(jì)算,求得權(quán)重值,同時(shí)計(jì)算一致性比率CR,反復(fù)調(diào)整矩陣,直到CR<0.1停止.

4) 根據(jù)權(quán)重中確定DT-SVM決策樹的結(jié)構(gòu),同時(shí)計(jì)算類間分離性測度來對類進(jìn)行不斷地分離與合并,每次取最后一個(gè)合并的類與其他類做正負(fù)樣本訓(xùn)練分類器,并將其作為根節(jié)點(diǎn),依次類推,保證容易分的類先分離.

訓(xùn)練SVM分類器的算法步驟如下所述.

假設(shè)類別數(shù)為N,訓(xùn)練樣本集X由類Xi,i=1,2,…,N,j=2,3,…,N,其中,i<j.

DT-SVM過程具體如下.

1) 利用基于類分布的類間分離性測度計(jì)算公式,計(jì)算各類間的分離性測度其中,i<j.

ni為類X的樣本個(gè)數(shù),K為類別數(shù),式中,δij為類方差,表示樣本分布:

若δij,則類i與類j間無交集,反之,有交集.δij越大,則表明兩個(gè)類之間的分離性更加明顯.

2) 篩選出分離測度最小的兩類合并為一個(gè)類別,計(jì)算該類的類中心與方差,此時(shí)類別數(shù)據(jù)由N變?yōu)镹-1.

3) 計(jì)算2)中得到的類與其余類的分離性測度,選擇; 測度最小的類與之合并,計(jì)算類中心與方差,類別數(shù)目繼續(xù)減1.

4) 當(dāng)類別數(shù)據(jù)>2,繼續(xù)執(zhí)行步驟3),否則,算法結(jié)束.

3 基于AHP-DT-SVM的健康狀態(tài)評估過程

為了更清楚地說明此算法的關(guān)鍵步驟和和原理,下文結(jié)合軸箱軸承實(shí)際的健康狀態(tài)評估過程來對此優(yōu)化算法以及建模過程進(jìn)行解釋說明.

3.1 數(shù)據(jù)處理

1) 數(shù)據(jù)預(yù)處理-去噪與歸一化

步驟1. 利用聚類方法進(jìn)行去噪處理

步驟2. 利用Z-score標(biāo)準(zhǔn)化方法進(jìn)行歸一化處理. 該方法給予原始數(shù)據(jù)的均值和標(biāo)準(zhǔn)差進(jìn)行數(shù)據(jù)的標(biāo)準(zhǔn)化,經(jīng)過處理的數(shù)據(jù)符合標(biāo)準(zhǔn)正態(tài)分布,即均值為0,標(biāo)準(zhǔn)差為1,轉(zhuǎn)化函數(shù)為:其中μ為所有樣本數(shù)據(jù)的均值,σ為所有樣本數(shù)據(jù)的標(biāo)準(zhǔn)差.

步驟3. 對軸箱軸承溫度進(jìn)行回歸擬合,在確定擬合線的情況下,框定上下溫度界限,數(shù)據(jù)包含率達(dá)到95%即可,超出范圍的數(shù)據(jù)可判定為噪聲.

2)主成分分析法降維

可提取的有價(jià)值的軸箱軸承的特征值如表3所示.

表3 可提取和降維后的特征值表

考慮到以上特征有重復(fù)性并且有些特征對排序作用效果不明顯,本文采用主成分分析法對特征向量做進(jìn)一步的特征降維.

主成分分析法(Principal Component Analysis,PCA)是目前應(yīng)用最為廣泛的一種數(shù)據(jù)驅(qū)動方法[17],其可以從多元事物中解析出主要影響因素,揭示事物的本質(zhì),簡化復(fù)雜問題,從而實(shí)現(xiàn)對高維數(shù)據(jù)的線性降維.本質(zhì)是求得這個(gè)投影矩陣,用高維的特征乘以這個(gè)投影矩陣,便可以將高維特征的維數(shù)下降到指定的維數(shù).PCA的目標(biāo)是尋找r(r<n)個(gè)新變量,這r個(gè)新變量稱為“主成分”,它們可以在很大程度上反映原來n個(gè)變量的影響,并且這些新變量是互不相關(guān)的,也是正交的,并且能反映事物的主要特征,壓縮原有數(shù)據(jù)矩陣的規(guī)模. 那么,如何確定新變量的個(gè)數(shù)R是主成分分析的關(guān)鍵,我們需要進(jìn)一步分析每個(gè)主元素對信息的貢獻(xiàn),通過計(jì)算每一個(gè)特征值對于降低entropy(熵)的貢獻(xiàn)來進(jìn)行排序,選擇排序較高的留下來,去掉排序較低的特征值,從而達(dá)到降維的目的.

PCA算法步驟如下所述,這里假設(shè)有w條v維數(shù)據(jù)需要進(jìn)行降維處理. 降維后的特征值如表3所示.

1. 將原始數(shù)據(jù)按列組成v行w列矩陣R

2. 將R的每一行(代表一個(gè)屬性字段)進(jìn)行零均值化,即減去這一行的均值

4. 求出協(xié)方差矩陣的特征值及對應(yīng)的特征向量

5. 將特征向量按對應(yīng)特征值大小從上到下按行排列成矩陣,取前i行組成矩陣P

6.Y=PR,即為降維到i維后的數(shù)據(jù)

3.2 構(gòu)造軸承軸承健康狀態(tài)類型狀態(tài)集

本文首先根據(jù)趙佳穎和馬千里老師提供的溫度分類標(biāo)準(zhǔn)[18,19],確定軸箱軸承的4個(gè)健康狀態(tài),包括{A正常,B溫升,C強(qiáng)溫,D激溫}4類,相應(yīng)的狀態(tài)標(biāo)識函數(shù)值為f(s)={health,subhealth,deterioration,failure}; 然后利用支持向量機(jī)算法對數(shù)據(jù)進(jìn)行分類測試,根據(jù)準(zhǔn)確率對分類界限進(jìn)行調(diào)整,確定最終健康狀態(tài)分類判別標(biāo)準(zhǔn),構(gòu)建健康狀態(tài)模型.

3.3 層次結(jié)構(gòu)評估指標(biāo)體系構(gòu)建

整個(gè)評估系統(tǒng)可以分為目標(biāo)層、準(zhǔn)則層和方案層,具體架構(gòu)如圖7所示.

圖7 軸箱軸承健康狀態(tài)評估的層次結(jié)構(gòu)

3.4 評估指標(biāo)權(quán)重計(jì)算與一致性檢驗(yàn)

1) 評估指標(biāo)權(quán)重計(jì)算

AHP確定評估指標(biāo)的相對重要程度計(jì)算公式為:

式中,Vi和Vj都是影響程度值[20].

層次分析法有四種方法計(jì)算權(quán)重: 幾何平均法、算術(shù)平均法、特征向量法和最小二乘法. 本文主要利用算數(shù)平均法計(jì)算權(quán)重. 計(jì)算公式如下:

根據(jù)重要性等級標(biāo)度表以及公式(9)和(10),可得軸箱軸承健康狀態(tài)評估準(zhǔn)則層的判斷矩陣和權(quán)重如表4所示.

2)一致性檢驗(yàn)

為了避免主觀影響,盡量實(shí)現(xiàn)客觀化描述,對矩陣的一致性檢驗(yàn)必不可缺. 只有當(dāng)一致性比例CR<0.1時(shí),權(quán)重矩陣才可以接受,否則,需要進(jìn)行適當(dāng)修改,降低主觀因素影響.

表4 準(zhǔn)則層判斷矩陣

一致性比例CR(Consistency Ratio):,其中,一致性指標(biāo),為最大特征向量值平均隨機(jī)一致性指標(biāo)查表(表5)可獲得經(jīng)矩陣的一致性檢驗(yàn)的CR=0.02559<0.1,這表明了合成后的權(quán)重一致性滿足要求.

表5 平均隨機(jī)一致性指標(biāo)

3)計(jì)算準(zhǔn)則層對于目標(biāo)層的合成權(quán)重

3.5 確定診斷樹結(jié)構(gòu)

上文已經(jīng)提到構(gòu)建的健康狀態(tài)分類為(健康,溫升,強(qiáng)溫,激溫),根據(jù)合成權(quán)重值可以得到DT-SVM的診斷結(jié)構(gòu)如圖8所示[10].

圖8 DT-SVM診斷結(jié)構(gòu)圖

確定診斷結(jié)構(gòu)后,根據(jù)1.2節(jié)提到的改進(jìn)算法進(jìn)行求解,步驟如下.

1. 確定SVM分類性能參數(shù);

2. 輸入訓(xùn)練樣本,完成訓(xùn)練過程;

3. 將測試樣本輸入到訓(xùn)練完成的DT-SVM中,進(jìn)行檢驗(yàn);

4. 在保證樣本數(shù)據(jù)一致的情況下,基于AHP-DT-SVM方法、SVM方法和決策樹算法對軸箱軸承進(jìn)行健康狀態(tài)分類評估,得到對比實(shí)驗(yàn)結(jié)果.

4 實(shí)驗(yàn)分析和模型評價(jià)

4.1 實(shí)驗(yàn)平臺

本實(shí)驗(yàn)使用Weka(懷卡托智能分析環(huán)境)軟件作為分類平臺. Weka是一款數(shù)據(jù)挖掘工具,基于Java環(huán)境且開源、不收費(fèi),受到廣大數(shù)據(jù)挖掘工程師的歡迎,其只需要對數(shù)據(jù)進(jìn)行特征提取、選擇合適的的算法算法、對各類參數(shù)進(jìn)行調(diào)優(yōu)即可. 本實(shí)驗(yàn)采用的是Weka3.6穩(wěn)定版本,植入了SVM的擴(kuò)展包.

4.2 實(shí)驗(yàn)數(shù)據(jù)

本實(shí)驗(yàn)數(shù)據(jù)來源于國內(nèi)某動車組生產(chǎn)制造基地于2016年的所有動車組轉(zhuǎn)向架及其零部件服役數(shù)據(jù)以及所屬實(shí)驗(yàn)室的動車組試驗(yàn)臺上的模擬數(shù)據(jù). 經(jīng)過數(shù)據(jù)預(yù)處理操作之后,選取大約1萬條數(shù)據(jù).

試驗(yàn)臺模擬數(shù)據(jù)比較容易獲得,并且完整性較好,包含軸承全生命周期的所有數(shù)據(jù),缺點(diǎn)是缺乏列車實(shí)際運(yùn)行過程中環(huán)境因素等的影響,會有偏差; 列車運(yùn)行數(shù)據(jù)噪聲比較多,完整性較差,尤其是故障數(shù)據(jù)極度缺乏; 綜上所述,采用以上兩種數(shù)據(jù)結(jié)合的方式進(jìn)行分類分析. 部分服役數(shù)據(jù)樣例展示如表6所示,其中健康數(shù)據(jù)共5000條,溫升數(shù)據(jù)3000條,強(qiáng)溫?cái)?shù)據(jù)4500條,激溫?cái)?shù)據(jù)1500條,并且每個(gè)類別的數(shù)據(jù)都展示了兩個(gè)溫度值,代表這兩個(gè)溫度只都滿足于這個(gè)類別.

表6 目標(biāo)層合成權(quán)重

說明. 軸箱軸承溫度均值為同軸箱軸承其余傳感器所測溫度均值; 驅(qū)動側(cè)溫度均值為同一轉(zhuǎn)向架驅(qū)動側(cè)軸箱軸承傳感器所測溫度均值; 非驅(qū)動側(cè)溫度均值為同一轉(zhuǎn)向架非驅(qū)動側(cè)軸箱軸承傳感器所測溫度均值;同側(cè)軸承軸端溫度為所測軸箱軸承同側(cè)轉(zhuǎn)向架軸的軸端溫度.

4.3 實(shí)驗(yàn)分析

在Weka平臺上,分別利用AHP-DT-SVM算法、SVM算法和DT-SVM算法對同一樣本數(shù)據(jù)進(jìn)行分類,結(jié)果展示如表7所示. 同時(shí)圖9對分類后的軸箱軸承溫度做了具體說明.

通過表8可知: 基于DT-SVM算法時(shí)間性能最好,但是分類精度偏低并且由于根的不確定性導(dǎo)致的盲目性比較大; 基于SVM的分類算法雖然分類性能有所提高,但是所需分類器多且用時(shí)最長; 基于AHP-DT-SVM算法的分類精度最高,同時(shí)分類器個(gè)數(shù)也少,時(shí)間性能介于其他兩者算法之間. 因此,綜合分類器數(shù)量、所需時(shí)間以及分類精度三個(gè)因素,優(yōu)化后的AHPSVM算法相對于其他算法優(yōu)越性更高.

表7 部分?jǐn)?shù)據(jù)樣例展示表

圖9 四種狀態(tài)下特征向量值溫度范圍

表8 三類算法分類對比圖

此外,圖9也隱含了4種健康狀態(tài)下的數(shù)值分類規(guī)律: 圖9(a)表示的正常狀態(tài)下,軸溫低于105℃,與均溫差值不超過10℃; 圖9(b)表示的溫升狀態(tài),軸溫范圍大約在100℃~125℃之間,在臨界值波動時(shí)候,與軸溫均值超過了35℃,與驅(qū)動側(cè)溫度均值差超過了40℃; 圖9(c)表示的強(qiáng)溫狀態(tài),軸溫范圍大約在120℃~140℃之間,在臨界值波動時(shí)候,與軸溫均值差超過了55℃,與驅(qū)動側(cè)溫度均值差超過了60℃; 圖9(d)表示的激溫狀態(tài),軸溫超過了140℃,并且與軸溫均值差超過了65℃.

5 健康狀態(tài)評估模型

本文采用多特征向量分類方式來提高判別度,同時(shí)采用基于向量機(jī)的分類方式,提高判斷準(zhǔn)確度,從而對健康狀態(tài)進(jìn)行預(yù)測.

基于上述健康狀態(tài)評估模型以及AHP-DTSVM分類結(jié)果,我們可重新得到軸箱軸承健康狀態(tài)評估判斷標(biāo)準(zhǔn): 1)健康狀態(tài): 軸溫低于105℃,與均溫差值不超過10℃; 2)溫升狀態(tài): 軸溫范圍大約在100℃~125℃之間,與軸溫均值大于35℃,與驅(qū)動側(cè)溫度均值差大于40℃; 3)強(qiáng)溫狀態(tài): 軸溫范圍大約在120℃~140℃之間,與軸溫均值差大于55℃,與驅(qū)動側(cè)溫度均值差大于60℃; 4)激溫狀態(tài): 軸溫大于140℃,同時(shí)與軸溫均值差大于65℃. 當(dāng)軸溫處于兩狀態(tài)臨界值時(shí)候,用與軸溫均值差和驅(qū)動側(cè)溫度均值差來明確劃分狀態(tài).

6 結(jié)束語

本文提出了一種基于支持向量機(jī)和決策樹方法的AHP-DT-SVM算法,使用層次分析法計(jì)算特征值權(quán)重比例,然后結(jié)合決策樹和支持向量機(jī)方法對數(shù)據(jù)進(jìn)行分類,從而可以準(zhǔn)確快速的實(shí)現(xiàn)軸箱軸承溫度數(shù)據(jù)健康狀態(tài)分類,且基于此構(gòu)建健康狀態(tài)評估模型,以規(guī)范分類過程和評估結(jié)果,提高分類精度,指導(dǎo)修程修制優(yōu)化,提高動車組運(yùn)維效率.

1He QB,Wang J,Hu F,et al. Wayside acoustic diagnosis of defective train bearings based on signal resampling and information enhancement. Journal of Sound and Vibration,2013,332(21): 5635-5649. [doi: 10.1016/j.jsv.2013.05.026]

2Fumeo E,Oneto L,Anguita D. Condition based maintenance in railway transportation systems based on big data streaming analysis. Procedia Computer Science,2015,53: 437-446.[doi: 10.1016/j.procs.2015.07.321]

3王勇,韓偉,王鳳才. 高速鐵路軸箱軸承接觸潤滑機(jī)理. 機(jī)械設(shè)計(jì)與制造,2017,(5): 131-134.

4Sakthivel NR,Indira V,Nair BB,et al. Use of histogram features for decision tree-based fault diagnosis of monoblock centrifugal pump. International Journal of Granular Computing,Rough Sets and Intelligent Systems,2011,2(1):23-36. [doi: 10.1504/IJGCRSIS.2011.041458]

5Soman KP,Ramachandran KI. Insight into Wavelets: From Theory to Practice. 2nd rev. ed. Prentice-Hall of India Private Limited,2005.

6Peng YH,Flach PA,Brazdil P,et al. Decision tree-based data characterization for meta-learning. ECML/PKDD-2002 Workshop IDDM-2002. Helsinki,Finland. 2002.

7Zhao W,Tao T,Zio E. System reliability prediction by support vector regression with analytic selection and genetic algorithm parameters selection. Applied Soft Computing,2015,30: 792-802. [doi: 10.1016/j.asoc.2015.02.026]

8Jindal A,Dua A,Kaur K,et al. Decision tree and SVM-based data analytics for theft detection in smart grid. IEEE Transactions on Industrial Informatics,2016,12(3):1005-1016. [doi: 10.1109/TII.2016.2543145]

9Jegadeeshwaran R,Sugumaran V. Fault diagnosis of automobile hydraulic brake system using statistical features and support vector machines. Mechanical Systems and Signal Processing,2015,52-53: 436-446.

10Lei YG,Jia F,Lin J,et al. An intelligent fault diagnosis method using unsupervised feature learning towards mechanical big data. IEEE Transactions on Industrial Electronics,2016,63(5): 3137-3147. [doi: 10.1109/TIE.2016.2519325]

11Li N,Zhou R,Hu QH,et al. Mechanical fault diagnosis based on redundant second generation wavelet packet transform,neighborhood rough set and support vector machine. Mechanical Systems and Signal Processing,2012,28: 608-621. [doi: 10.1016/j.ymssp.2011.10.016]

12Liu RN,Yang BY,Zhang XL,et al. Time-frequency atomsdriven support vector machine method for bearings incipient fault diagnosis. Mechanical Systems and Signal Processing,2016,75: 345-370. [doi: 10.1016/j.ymssp.2015.12.020]

13郭磊,李興林,吳參,等. 基于支持向量機(jī)的滾動軸承性能退化評估方法. 軸承,2012,(8): 46-50.

14董寶玉. 支持向量技術(shù)及其應(yīng)用研究[博士學(xué)位論文]. 大連: 大連海事大學(xué),2016.

15Saaty TL. A scaling method for priorities in hierarchical structures. Journal of Mathematical Psychology,1977,15(3):234-281. [doi: 10.1016/0022-2496(77)90033-5]

16胡俊,滕少華,張巍,等. 支持向量機(jī)與哈夫曼樹實(shí)現(xiàn)多分類的研究. 廣東工業(yè)大學(xué)學(xué)報(bào),2014,31(2): 36-42.

17He QB,Yan RQ,Kong FR,et al. Machine condition monitoring using principal component representations.Mechanical Systems and Signal Processing,2009,23(2):446-466. [doi: 10.1016/j.ymssp.2008.03.010]

18趙佳穎,曹成鵬,孫景輝,等. 高速動車組輪對軸箱軸承溫度監(jiān)控技術(shù)優(yōu)化改進(jìn). 鐵道機(jī)車與動車,2013,(5): 37-38,50.

19馬千里. 車輛軸溫智能探測系統(tǒng)(THDS)探測客車熱軸預(yù)報(bào)規(guī)律的研究. 鐵道車輛,2016,54(2): 8-11.

20周曉蘭,謝紅. 高校圖書館網(wǎng)站評價(jià)指標(biāo)體系建立與指標(biāo)權(quán)重的計(jì)算研究. 現(xiàn)代情報(bào),2009,29(8): 99-102.

猜你喜歡
軸箱決策樹均值
帶有碳粉收集功能的新型轉(zhuǎn)向架接地軸端研究
某工程車軸箱結(jié)構(gòu)優(yōu)化及強(qiáng)度分析
信息時(shí)代基于決策樹對大學(xué)生情緒的分類
動車組轉(zhuǎn)向架軸箱剩余壽命預(yù)測方法研究
某地鐵車輛國產(chǎn)軸箱軸承與國產(chǎn)新型潤滑脂的應(yīng)用研究
簡述一種基于C4.5的隨機(jī)決策樹集成分類算法設(shè)計(jì)
均值—方差分析及CAPM模型的運(yùn)用
均值—方差分析及CAPM模型的運(yùn)用
淺談均值不等式的應(yīng)用
均值不等式的小應(yīng)用
永寿县| 乳山市| 城口县| 东兰县| 海盐县| 砚山县| 商都县| 仪陇县| 乌拉特中旗| 本溪| 嵩明县| 乐亭县| 铁岭市| 全椒县| 托克托县| 潞城市| 河间市| 巴林右旗| 衢州市| 喀喇沁旗| 沙河市| 南岸区| 六安市| 苗栗县| 宁强县| 巩义市| 长白| 兴义市| 霍山县| 拉萨市| 营口市| 钦州市| 托克逊县| 嵊泗县| 普格县| 阿巴嘎旗| 凭祥市| 灵寿县| 松桃| 镇坪县| 锦屏县|