国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于遺傳算法的多評(píng)價(jià)標(biāo)準(zhǔn)退化特征選擇方法?

2020-12-23 11:50:10陳志剛
關(guān)鍵詞:特征選擇子集魯棒性

陳志剛 肖 紅

(廣東工業(yè)大學(xué)計(jì)算機(jī)學(xué)院 廣州 510000)

1 引言

故障預(yù)測(cè)的最重要的目標(biāo)之一是預(yù)測(cè)系統(tǒng)的剩 余 可 用 壽 命(Remaining Useful Life,RUL)[1]。RUL 信息可用于工作人員避免意外停機(jī)時(shí)間和優(yōu)化維護(hù)活動(dòng)。它依賴于操作機(jī)械狀態(tài)監(jiān)測(cè)數(shù)據(jù)的使用,從而獲得有用的特征,以評(píng)估退化的程度,并預(yù)測(cè)退化現(xiàn)象的演變[1]。由于工業(yè)機(jī)械中監(jiān)測(cè)數(shù)據(jù)高維、非線程的特點(diǎn),同時(shí)對(duì)于機(jī)械失效表現(xiàn)先驗(yàn)知識(shí)的缺乏。有效預(yù)測(cè)故障是一項(xiàng)極具挑戰(zhàn)的任務(wù)[2]。作為預(yù)測(cè)模型的輸入,提取的特征的質(zhì)量直接影響學(xué)習(xí)模型的性能。顯然,正確反映退化進(jìn)展的特征可以確保高精度的預(yù)測(cè)結(jié)果。絕大多數(shù)系統(tǒng),往往不是突然失效,而是經(jīng)歷逐漸退化的過程直至故障[3]。理想的退化特征集合應(yīng)該表現(xiàn)出連續(xù)增加或減少的趨勢(shì),并且機(jī)械設(shè)備的惡化趨勢(shì)應(yīng)該與設(shè)備運(yùn)行時(shí)間存在相關(guān)性。由于監(jiān)測(cè)噪聲、退化過程的隨機(jī)性和操作環(huán)境的變化,優(yōu)良的特征應(yīng)該對(duì)這些干擾具有魯棒性[4]。因此,如何選擇能夠表征機(jī)械退化表現(xiàn)的特征是確保預(yù)測(cè)模型精確性的重要前提。相比于故障預(yù)測(cè)模型的研究,對(duì)于最佳退化特征進(jìn)行評(píng)價(jià)和選擇的研究相對(duì)較少。同時(shí),目前預(yù)測(cè)的特征選擇通常是基于人工檢查來考察特征的趨勢(shì)是否能夠根據(jù)工程評(píng)價(jià)捕獲機(jī)械退化進(jìn)程[2]。因此,為了提高預(yù)測(cè)模型的精確性和實(shí)現(xiàn)自動(dòng)化選擇有效的退化特性,本文利用遺傳算法啟發(fā)式搜索的特點(diǎn)提出了遺傳算法和退化特征評(píng)價(jià)標(biāo)準(zhǔn)(單調(diào)性、趨勢(shì)性、魯棒性)結(jié)合的自動(dòng)特征選擇方法。以特征單調(diào)性、趨勢(shì)性、健壯性的線性組合作為遺傳算法的適應(yīng)性函數(shù),引導(dǎo)遺傳算法的變異和搜索。該值能直接反映特征子集對(duì)機(jī)械退化過程的相關(guān)性。并利用該方法結(jié)合Javed[5]提出的基于改進(jìn)的極限學(xué)習(xí)機(jī)故障預(yù)測(cè)模型在2008年預(yù)測(cè)和健康管理(Prognostics and Health Management,PHM)挑戰(zhàn)賽的數(shù)據(jù)集來驗(yàn)證該方法的合理性。結(jié)果表明該方法可以實(shí)現(xiàn)自動(dòng)選擇滿足退化過程的特征子集,并有效提高預(yù)測(cè)模型的精度。

2 相關(guān)工作

特征選擇的目的是識(shí)別一組預(yù)測(cè)特征,它可以最準(zhǔn)確地表征故障進(jìn)展過程的預(yù)測(cè)。與PHM 的預(yù)測(cè)模型相比,很少學(xué)者對(duì)最優(yōu)退化特征子集進(jìn)行評(píng)價(jià)和選擇??紤]設(shè)備的退化與時(shí)間呈現(xiàn)相關(guān)性,Javed[6]基于滾動(dòng)軸承的振動(dòng)數(shù)據(jù)的特征提取上利用單調(diào)性與趨勢(shì)性兩個(gè)判斷準(zhǔn)則進(jìn)行最優(yōu)特征的選擇,進(jìn)而計(jì)算軸承的剩余壽命;同樣地,文獻(xiàn)[7]利用單調(diào)性與趨勢(shì)性構(gòu)造描述機(jī)械退化的特征進(jìn)行機(jī)械設(shè)備退化狀態(tài)識(shí)別;Liao[3]基于特征單調(diào)性作為適應(yīng)性函數(shù)利用遺傳規(guī)劃算法選取退化特征并進(jìn)行線性組合解決自動(dòng)發(fā)現(xiàn)高級(jí)特征的困難;文獻(xiàn)[8]基于同一機(jī)械設(shè)備的不同退化特征可能存在某種管理的考慮,設(shè)計(jì)了特征冗余性與有效性的特征選擇評(píng)價(jià)標(biāo)準(zhǔn),進(jìn)行退化特征選擇。由于機(jī)械一般呈現(xiàn)非線性退化趨勢(shì),為了評(píng)估退化特征具有非線性退化趨勢(shì),文獻(xiàn)[9]提出了一種利用Spurman系數(shù)計(jì)算退化特征非線性趨勢(shì)的方法。然而當(dāng)退化趨勢(shì)被隨機(jī)波動(dòng)掩蓋時(shí),文獻(xiàn)[3,6~7,9]的性能將降低。為了提高特征對(duì)機(jī)械設(shè)備不同操作環(huán)境的魯棒性,Li[10]提出了基于魯棒性進(jìn)行特征選擇的方法。考慮同一退化特征在機(jī)械退化不同階段可能呈現(xiàn)不同的有效性,Camci[11]退化特征劃分為片段,定義了所有片段的平均可分性來進(jìn)行特征選擇,并獲得最優(yōu)退化特征。對(duì)于利用遺傳算法進(jìn)行特征選擇的研究,更多集中于故障的診斷和狀態(tài)分類領(lǐng)域。L[12]提出了一種結(jié)合Bootstrap和遺傳規(guī)劃的高級(jí)特征發(fā)現(xiàn)方法診斷柴油機(jī)故障的有效性。Ondel[13]基于遺傳算法提出了一種順序向后選擇方法來選擇最相關(guān)的診斷特征。盡管診斷的特征評(píng)估已經(jīng)被研究,但是對(duì)于預(yù)測(cè)特征評(píng)估和選擇定義的度量是微不足道的。與診斷特征評(píng)估中的靜態(tài)點(diǎn)聚類不同,由于退化是一個(gè)連續(xù)的隨機(jī)過程,在退化特征評(píng)估中考慮連續(xù)序列。

綜上所述,雖然現(xiàn)有的特征選擇方法已有基于單調(diào)性、趨勢(shì)性和魯棒性的研究,但并未綜合性的考慮。同時(shí)基于遺傳算法的退化特征選擇更多集中于故障診斷領(lǐng)域,并且只考慮單指標(biāo),導(dǎo)致適應(yīng)函數(shù)單一和適應(yīng)環(huán)境能力不強(qiáng)壯的問題。因此,本文將能直接反映特征子集對(duì)機(jī)械退化過程的相關(guān)性的單調(diào)性、趨勢(shì)性、魯棒性進(jìn)行結(jié)合構(gòu)造遺傳算法的多指標(biāo)的適應(yīng)函數(shù),引導(dǎo)遺傳算法的變異和搜索。提高退化特征選擇的準(zhǔn)確度,同時(shí)實(shí)現(xiàn)自動(dòng)特性選擇。

3 算法提出

本文提出的特征選擇算法基礎(chǔ)框架如圖1 所示。監(jiān)測(cè)退化特征集作為算法輸入,然后初始化種群規(guī)模M ,種群規(guī)模代表了算法搜索范圍,若種群大小設(shè)置不合理,則算法難以達(dá)到全局最優(yōu)。擬提出的算法中關(guān)鍵步驟為適應(yīng)函數(shù)的設(shè)計(jì),利用了單調(diào)性、趨勢(shì)性和魯棒性3 個(gè)評(píng)價(jià)指標(biāo)構(gòu)建適應(yīng)度函數(shù),引導(dǎo)遺傳算法進(jìn)行最優(yōu)子集的搜索。

圖1 基于遺傳算法的最優(yōu)退化特征子集方法流程

選擇算子描述了生物進(jìn)化的淘汰過程,確保優(yōu)秀的基因在種群中遺傳,其保證了能更好描述機(jī)械設(shè)備退化狀態(tài)的特征組合被保留。交叉算子是生物進(jìn)化中父母本繁殖新一代的過程,是每一次迭代進(jìn)化獲得優(yōu)良個(gè)體的關(guān)鍵步驟。變異算子作為遺傳算法的輔助函數(shù),為個(gè)體進(jìn)化提供多樣性,從而實(shí)現(xiàn)搜索的隨機(jī)性。最后當(dāng)滿足迭代次數(shù)時(shí)則可輸出最優(yōu)的特征子集。

3.1 多指標(biāo)適應(yīng)函數(shù)設(shè)計(jì)

特征選擇的目的是發(fā)現(xiàn)一組最能代表機(jī)械退化進(jìn)程的特征集合。優(yōu)良的預(yù)測(cè)特征應(yīng)與機(jī)械設(shè)備性能下降、單調(diào)遞增或遞減、對(duì)異常值的魯棒性等相關(guān)。在此基礎(chǔ)上,提出了結(jié)合單調(diào)性、趨勢(shì)性和魯棒性指標(biāo)作為遺傳算法適應(yīng)度函數(shù),用于得到更為相關(guān)的退化特征選擇方法。

3.1.1 特征選擇評(píng)價(jià)指標(biāo)

在實(shí)際工程應(yīng)用上,機(jī)械的性能退化本質(zhì)上是一個(gè)隨機(jī)過程,因此將退化特征分成其趨勢(shì)部分和殘差時(shí),可以更好地度量3 種指標(biāo)。首先利用平滑方法將特征分解為均值趨勢(shì)和隨機(jī)部分如式(1)所示:

其中X( tk)為在tk時(shí)間點(diǎn)的退化特征值,XT( tk)為趨勢(shì)值,XR( tk)為殘差部分。

根據(jù)式(1)與文獻(xiàn)[2]單調(diào)性(Monotonicity,Mon)、趨勢(shì)性(Trendability,Tre)與魯棒性(Robustness,Rob)的特征選擇指標(biāo)可以定義如下:

其中單調(diào)性指標(biāo)Mon 為式(2),Mon 評(píng)估特征的持續(xù)增加或減少趨勢(shì)。

趨勢(shì)性指標(biāo)Tre 為式(3),測(cè)量特征和時(shí)間T之間的線性關(guān)系。

魯棒性指標(biāo)Rob 為式(4),反映了特征對(duì)異常值的容忍度。

式(2)~(4),K 為一段時(shí)間序列中的特征記錄次數(shù)總數(shù),為簡單的單位階躍函數(shù)。

經(jīng)過簡單的數(shù)據(jù)推導(dǎo)可以看出,基于上述三個(gè)評(píng)價(jià)指標(biāo)被限制在范圍[0,1]中,并且與候選特征的性能正相關(guān),這使得它們非常適合作為合適退化特征的測(cè)度。

3.1.2 適應(yīng)性函數(shù)構(gòu)建

在實(shí)際工程應(yīng)用上,選擇合適的退化特征進(jìn)行剩余壽命預(yù)測(cè)時(shí),只選擇單個(gè)特征評(píng)價(jià)指標(biāo)可能會(huì)導(dǎo)致選擇的特征的適應(yīng)性不全面,因此需要將上文所述評(píng)價(jià)標(biāo)準(zhǔn)進(jìn)行融合,適應(yīng)性函數(shù)作為遺傳算法中的最關(guān)鍵部分,決定了種群進(jìn)化過程的環(huán)境復(fù)雜程度,直接引導(dǎo)算法向全局最優(yōu)收斂。單指標(biāo)的適應(yīng)性函數(shù)導(dǎo)致種群對(duì)環(huán)境的適應(yīng)能力不強(qiáng)壯。因此,本文提出的方法將單調(diào)性(Mon)、趨勢(shì)性(Tred)、魯棒性(Rob)進(jìn)行融合構(gòu)造適應(yīng)度函數(shù)。適應(yīng)度越高的個(gè)體對(duì)應(yīng)的特征子集越有效。首先融合指標(biāo)定義為MTR(X),如式(5):

從式(5)可以看出融合的評(píng)價(jià)指標(biāo)與每個(gè)單獨(dú)的特征評(píng)價(jià)指標(biāo)線性相關(guān)且正相關(guān)。因此融合指標(biāo)所得出的特征與機(jī)械設(shè)備退化表現(xiàn)呈正相關(guān)。并且通過式(5)計(jì)算得出高分的特征更能有效描述設(shè)備退化過程。

遺傳算法中種群個(gè)體代表了可能的特征子集,個(gè)體的基因進(jìn)行二進(jìn)制編碼用于表示特征是否被選中。維度為N 的特征集進(jìn)行編碼后可得到相應(yīng)維度長度的基因鏈。因此,利用MTR(X)構(gòu)造個(gè)體適應(yīng)性函數(shù)時(shí),應(yīng)對(duì)個(gè)體基因串中所有編碼為1 的特征進(jìn)行計(jì)算融合指標(biāo)并進(jìn)行線性累加。

綜上所述,個(gè)體的適應(yīng)性函數(shù)Fit(Pi)可表示為式(6):

式(6)中P 代表種群個(gè)體;M 代表種群個(gè)體數(shù)目;N 代表個(gè)體基因鏈長度;j 表示N 維特征集中第j 個(gè)特征。當(dāng)個(gè)體基因鏈中第j 個(gè)特征被選擇,則pj=1,此時(shí)需要計(jì)算特征Xj的融合特征。

3.1.3 選擇算子設(shè)計(jì)

遺傳算法中的選擇算子根據(jù)個(gè)體適應(yīng)值的高低描述生物進(jìn)化過程。為保證適應(yīng)度高的個(gè)體進(jìn)入下一代,利用輪盤賭算法設(shè)計(jì)選擇算子,該算法保證了個(gè)體被選擇的概率與其適應(yīng)度成正比,選擇算子C(Pi)如式(7)所示:

3.1.4 交叉算子與變異算子設(shè)計(jì)

遺傳算法利用交叉算子描述生物進(jìn)化中通過交叉基因產(chǎn)生下一代的過程。特征子集的組合通過交叉算子來更新特征集的組合方式,從而使得在每一次迭代中考察多種交叉特征對(duì)融合指標(biāo)MTR的影響能力。為了父母本在交叉過程中大規(guī)模丟失已有的良好特征。結(jié)合定長基因段交叉的算法[15]設(shè)計(jì)交叉算法。要求進(jìn)行保留該基因點(diǎn),必須滿足MTR ≥2。

為了給遺傳算法的搜索提高多樣性和可能性,需要設(shè)計(jì)合適的變異算子。本文直接利用文獻(xiàn)[14]提出的變異算法,用于描述基因點(diǎn)的突變情況。這里不詳細(xì)描述。

4 實(shí)驗(yàn)

本節(jié)介紹所提出的特征選擇方法結(jié)合文獻(xiàn)[5]的剩余壽命預(yù)測(cè)方法應(yīng)用于2008PHM 挑戰(zhàn)賽中的數(shù)據(jù)集的可行性,并分析其實(shí)驗(yàn)結(jié)果。

4.1 PHM 挑戰(zhàn)賽數(shù)據(jù)

PHM 挑戰(zhàn)賽數(shù)據(jù)集包含218 個(gè)案例的多變量退化數(shù)據(jù),這些數(shù)據(jù)對(duì)系統(tǒng)進(jìn)行了全生命周期的追蹤。并且不存在對(duì)系統(tǒng)的任何先驗(yàn)知識(shí)。數(shù)據(jù)有三個(gè)操作變量和21 個(gè)傳感器測(cè)量。初始數(shù)據(jù)分析可以知道系統(tǒng)存在六個(gè)不同的操作設(shè)置,可能意味著不同的工作狀態(tài)和故障狀態(tài)。同時(shí)10 個(gè)測(cè)量變量似乎隨著時(shí)間而變化(2,3,4,5,6,7,8,9,11,12)。本文將該10 個(gè)變量與提出的方法得出的退化特征子集作為模型輸入,比較兩者對(duì)于剩余壽命預(yù)測(cè)的精度。

4.2 預(yù)測(cè)模型

為判斷選取的特征子集是否更好地描述機(jī)械設(shè)備的退化過程,提高預(yù)測(cè)模型的精度,本文利用文獻(xiàn)[5]提出的基于求和小波極限學(xué)習(xí)機(jī)建立多退化特征的剩余壽命預(yù)測(cè)模型進(jìn)行實(shí)驗(yàn)對(duì)比。該模型能夠同時(shí)預(yù)測(cè)剩余壽命時(shí)間和評(píng)估機(jī)械設(shè)備的退化狀態(tài)。因?yàn)轭A(yù)測(cè)模型不是本文的討論重點(diǎn),因此,這部分不進(jìn)行過多的討論。

4.3 實(shí)驗(yàn)參數(shù)

定義實(shí)驗(yàn)中算法模型的參數(shù)如下:

種群的規(guī)模初始為20,種群的最大遺傳次數(shù)設(shè)置為30 次。個(gè)體基因長度利用最大方差閾值[14]進(jìn)行確定,閾值設(shè)置為0.2。

4.4 實(shí)驗(yàn)結(jié)果

如表1 中所示,經(jīng)過本文提出的特則選擇算法處理后得到的特征評(píng)價(jià)指標(biāo)值。其中加粗的為選擇后的特征。最優(yōu)特征子集包含[2,3,4,5,7,8]6個(gè)特征。其融合評(píng)價(jià)標(biāo)準(zhǔn)MTR 值最高。初始數(shù)據(jù)分析中只考慮其單調(diào)性Mon 的10 個(gè)特征((2,3,4,5,6,7,8,9,11,12)中的6,9,11,12 在其他指標(biāo)的度量上都沒有達(dá)到滿意的結(jié)果。這表明該特征隨時(shí)間的變化并沒有明顯的趨勢(shì),同時(shí)。Rob 過低表示在面對(duì)測(cè)量干擾、噪聲影響上并沒有很好的魯棒性。因此,這類特征并不能充分地追蹤機(jī)械設(shè)備的退化情況。

表1 最優(yōu)特征子集的融合指標(biāo)度量

將經(jīng)選擇的特征子集與原始分析數(shù)據(jù)集作為預(yù)測(cè)模型的輸入,分析選擇的最優(yōu)特征子集是否提高預(yù)測(cè)模型的準(zhǔn)確度。利用PHM2008 提供的259個(gè)系統(tǒng)案例,原始特征進(jìn)行剩余壽命的預(yù)測(cè)結(jié)果如圖2所示。

圖2 原始特征剩余壽命預(yù)測(cè)結(jié)果圖

從圖2 可以看出大多數(shù)估計(jì)接近于實(shí)際值,但是存在大量的離群值,這極大降低了模型的性能。當(dāng)考慮所有259 個(gè)測(cè)試用例時(shí),這些預(yù)測(cè)異常的情況使得均絕對(duì)百分誤差接近100%;因此,大多數(shù)預(yù)測(cè)的正確性不高。圖3 表示經(jīng)特征選擇算法處理后提取的最優(yōu)特征子集作為模型輸入之后的剩余壽命預(yù)測(cè)結(jié)果。可以看出在測(cè)試案例中,利用本文提出的方法選取的特征子集比原始特性在預(yù)測(cè)剩余壽命的精度上要更高。這意味著最優(yōu)特征子集能更好地捕獲機(jī)械設(shè)備的退化進(jìn)程。優(yōu)化后的特征子集能夠提高預(yù)測(cè)模型的預(yù)測(cè)精度。

圖3 最優(yōu)特征子集剩余壽命預(yù)測(cè)結(jié)果圖

5 結(jié)語

本文利用遺傳算法與特征評(píng)價(jià)指標(biāo)融合提出了基于單調(diào)性、趨勢(shì)性、魯棒性結(jié)合的退化特征子集選擇方法。選擇的最優(yōu)特征子集能夠應(yīng)用于預(yù)測(cè)模型,以表征機(jī)械設(shè)備退化表現(xiàn)的特征。2008PHM 數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明,提出的特征選擇方法可以有效地選擇最優(yōu)的預(yù)測(cè)特征子集。但仍需要更多的其他機(jī)械設(shè)備案例以驗(yàn)證所提出的退化特征選擇方法的有效性。同時(shí)在未來的工作中,除了應(yīng)用已提出的特征評(píng)估指標(biāo),其他的評(píng)估標(biāo)準(zhǔn),如特征之間的相互影響,特征與退化模型的影響評(píng)價(jià)等都應(yīng)該納入考慮,以獲得更好的退化特征子集。

猜你喜歡
特征選擇子集魯棒性
由一道有關(guān)集合的子集個(gè)數(shù)題引發(fā)的思考
拓?fù)淇臻g中緊致子集的性質(zhì)研究
關(guān)于奇數(shù)階二元子集的分離序列
荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評(píng)價(jià)
Kmeans 應(yīng)用與特征選擇
電子制作(2017年23期)2017-02-02 07:17:06
基于非支配解集的多模式裝備項(xiàng)目群調(diào)度魯棒性優(yōu)化
西南交通大學(xué)學(xué)報(bào)(2016年6期)2016-05-04 04:13:11
聯(lián)合互信息水下目標(biāo)特征選擇算法
每一次愛情都只是愛情的子集
都市麗人(2015年4期)2015-03-20 13:33:22
金乡县| 永仁县| 登封市| 海伦市| 正定县| 柳河县| 靖州| 介休市| 禄劝| 宜春市| 渭南市| 武安市| 偏关县| 哈尔滨市| 含山县| 宜章县| 香港 | 海宁市| 渝北区| 西乌| 遵义市| 石棉县| 铅山县| 连城县| 武山县| 会东县| 屯昌县| 邵东县| 阿鲁科尔沁旗| 泉州市| 新竹县| 株洲市| 张北县| 龙山县| 澜沧| 临湘市| 广汉市| 千阳县| 三台县| 荆州市| 南京市|