張西寧, 雷威, 楊雨薇, 張雯雯
(西安交通大學(xué)機械制造系統(tǒng)工程國家重點實驗室, 710049, 西安)
自Baum等人建立隱馬爾科夫(HMM)理論基礎(chǔ)以來[1],HMM首先在語音識別領(lǐng)域得到廣泛應(yīng)用[2-4]。由于HMM具有嚴(yán)謹(jǐn)?shù)臄?shù)據(jù)結(jié)構(gòu)、可靠的計算性能以及良好的可解釋性,其應(yīng)用擴展到人臉檢測[5]、手語識別[6]、車牌識別[7]、機械設(shè)備監(jiān)測以及故障診斷等領(lǐng)域[8]。但是,解決HMM參數(shù)學(xué)習(xí)問題的Baum-Welch算法是一種局部擇優(yōu)的爬山算法,易陷入局部最優(yōu)解[9]。
由于智能優(yōu)化算法對目標(biāo)函數(shù)有無解析表達式不作要求,對計算中數(shù)據(jù)的不確定性也有很強的適應(yīng)能力[10]。因此,一些專家學(xué)者將智能優(yōu)化算法應(yīng)用到HMM模型的參數(shù)優(yōu)化中。Zheng等人采用遺傳算法對HMM進行參數(shù)優(yōu)化估計,并將改進后的HMM用于光伏逆變器故障的識別和診斷中[11]。Liao等人使用粒子群算法優(yōu)化HMM的參數(shù),并應(yīng)用于滾動軸承的故障診斷中[12]。李榮等人提出了一種采用改進遺傳退火算法優(yōu)化HMM參數(shù)的Web抽取方法,實驗表明該方法能有效提高抽取準(zhǔn)確率和尋優(yōu)性能[13]。
優(yōu)化算法多種多樣,每種方法都有優(yōu)缺點[14]。如遺傳算法具有較強的全局尋優(yōu)性能,但存在早熟、局部尋優(yōu)能力差的問題;粒子群算法收斂速度快、參數(shù)少,但存在易陷入局部最優(yōu)、搜索精度不高的問題;模擬退火算法通用性強,但收斂速度較慢。單一優(yōu)化算法都有應(yīng)用的優(yōu)勢與不足,不存在占絕對優(yōu)勢的優(yōu)化算法。融合不同的優(yōu)化算法或引入其他算法的思想,可充分發(fā)揮他們各自優(yōu)勢,提高算法的局部和全局尋優(yōu)能力[15],如基因粒子群算法(GAPSO)[16]、遺傳退火算法(GAA)[13]等。
本文提出一種采用自適應(yīng)的基因粒子群算法優(yōu)化隱HMM模型的方法。利用遺傳算法與粒子群算法之間的互補性,將這兩種算法相結(jié)合,改進了其遺傳操作。在此基礎(chǔ)上,使用了一種自適應(yīng)調(diào)整的優(yōu)化方法,對基因粒子群算法主要參數(shù)的設(shè)置方法進行改進,并應(yīng)用于滾動軸承的故障診斷中,驗證該方法的有效性。
滾動軸承的振動信號中包含著豐富的狀態(tài)信息。當(dāng)滾動軸承的運行狀態(tài)發(fā)生變化時,其時域信號的概率分布以及幅值信息會發(fā)生變化,頻域中的主能量譜峰的位置以及不同頻率的能量也會發(fā)生相應(yīng)的變化,同時時頻能量也會發(fā)生變化。不同的指標(biāo)表征的信息是不一致的,單域或者單一的特征難以全面地刻畫出滾動軸承的運行狀態(tài)。
本文通過提取滾動軸承振動信號的時域、頻域、時頻域特征構(gòu)造混合域的故障特征集。其中,時域特征包括均方值、方差、方根幅值等14個指標(biāo)[17];頻域特征包括13個頻譜指標(biāo)[18]和7個功率譜密度函數(shù)指標(biāo)[19],時頻特征可以通過提取振動信號的連續(xù)小波尺度能量譜構(gòu)造,表達式如下
(1)
式中:Wf(a,b)是小波變換的幅值;E(a)是信號在尺度為a時的能量值,稱為小波能譜。
連續(xù)小波能量譜能夠同時反映信號在時域和頻域上的能量分布特性。
使用不同方法提取出來的特征存在較大的差別,并不是特征維數(shù)越多越好。在提取的故障特征中可能存在不敏感特征,甚至是干擾特征,因此需要對提取的故障特征集進行降維。主分量分析(PCA)是一種基于特征融合的降維方法,不僅能夠有效地提取信號中的信息,而且降維后的數(shù)據(jù)各維度之間不存在冗余,在數(shù)據(jù)降維和特征壓縮方面應(yīng)用廣泛。本文采用PCA對故障特征集進行降維。
在粒子群算法(PSO)[20]中引入遺傳算法中的雜交和變異步驟,并改進了其遺傳操作,得到一種整體性能更優(yōu)的基因粒子群算法。新算法既保留了粒子群算法快速收斂的優(yōu)點,同時又融合了遺傳算法的全局搜索性能。
在每一代中,首先計算出每個個體的適應(yīng)度值,對其位置以及速度進行更新。然后按照適應(yīng)度值從小到大進行排序。選擇出排名靠前的保留數(shù)個體作為優(yōu)秀樣本保留到下一代;從種群中選擇交叉數(shù)和變異數(shù)個體進行雜交以及變異操作,后代作為下一代的組成部分。下一代種群便由保留個體、雜交產(chǎn)生的個體以及變異產(chǎn)生的個體組成。
GAPSO算法選擇了基于局部競爭機制[21]的選擇方法,主要是由于其計算量小,對群體規(guī)模沒有要求。雜交操作是把兩個父代個體進行重組進而生成新個體的操作,體現(xiàn)了不同個體間的信息交換,實現(xiàn)算法在全局范圍的搜索。變異操作的主要作用在于維持種群的多樣性,防止早熟收斂,采用施加隨機擾動的策略對選擇的粒子進行變異操作。
隱馬爾科夫模型是在馬爾科夫鏈的基礎(chǔ)之上發(fā)展起來的。由于實際問題比馬爾科夫鏈模型所描述的更為復(fù)雜,觀察到的事件并不是與狀態(tài)一一對應(yīng)的,而是通過一組概率分布相聯(lián)系,這樣的模型稱為HMM。HMM是一個雙重隨機過程:馬爾科夫鏈和一般隨機過程,其中馬爾科夫鏈用于描述狀態(tài)之間的轉(zhuǎn)移,一般隨機過程描述狀態(tài)和觀測變量之間的統(tǒng)計關(guān)系[22]。
將HMM應(yīng)用于工程實踐中需要解決3個問題:評估問題,解碼問題和學(xué)習(xí)問題。伴隨著3個問題的解決逐漸形成了3個基本算法:前-后向算法,Viterbi算法和Baum-Welch算法。
解決HMM參數(shù)學(xué)習(xí)問題的Baum-Welch算法是通過迭代逐步近似極大化似然函數(shù)的下界實現(xiàn)的,因此只能保證收斂到對數(shù)似然函數(shù)序列的局部極值點,而非全局極值點。在HMM理論中,由訓(xùn)練數(shù)據(jù)集得到HMM參數(shù)時,選取不同的初始模型參數(shù)將得到不同的訓(xùn)練結(jié)果,選取較好的初始模型,使最后求出的局部極大值和全局最大值接近[8]。初始狀態(tài)矩陣和狀態(tài)轉(zhuǎn)移矩陣的初值選取對HMM的訓(xùn)練結(jié)果影響不大,可以隨機選取,但混淆矩陣的初值對訓(xùn)練結(jié)果有較大影響,使用優(yōu)化算法對HMM初值的選取進行優(yōu)化。
為提高GAPSO算法的優(yōu)化性能,使用了一種自適應(yīng)調(diào)整的優(yōu)化方法[23],對算法中主要參數(shù)的設(shè)置進行改進,具體公式如下
C(t)=D(t)/max(D(t))
(4)
c1=2C;c2=2-c1
(5)
w=C(t)=D(t)/max(D(t))
(6)
式中:c1、c2表示自適應(yīng)的加速系數(shù);w表示自適應(yīng)的慣性權(quán)重;D(t)表示各粒子到全局最優(yōu)點的平均距離;C(t)表示各粒子到全局最優(yōu)點的平均距離與平均距離最大值的比值。
根據(jù)上述分析,本文提出了基于自適應(yīng)GAPSO算法優(yōu)化HMM初始參數(shù)的滾動軸承故障診斷方法。HMM初始參數(shù)優(yōu)化及模型訓(xùn)練流程如圖1所示,具體步驟如下:
(1)首先提取滾動軸承訓(xùn)練信號故障特征,構(gòu)造故障特征集;
(2)使用主成分分析(PCA)技術(shù)對提取出的故障特征集進行維數(shù)約簡,并對降維后的故障特征集進行標(biāo)量量化;
(3)將量化后的特征作為訓(xùn)練參數(shù)輸入到參數(shù)優(yōu)化環(huán)節(jié),參數(shù)優(yōu)化過程以前-后向算法作為適應(yīng)度函數(shù);
(4)將各種故障模式下的特征數(shù)據(jù)以及優(yōu)化后的初始參數(shù)作為Baum-Welch算法的輸入,訓(xùn)練各種故障模式下的HMM,建立模型庫。
圖1 HMM初始參數(shù)優(yōu)化及模型訓(xùn)練流程
圖2 待診斷信號的處理流程
待診斷信號的處理流程如圖2所示,其步驟如下:
(1)提取待診斷信號的故障特征,構(gòu)造故障特征集;
(2)對故障特征集進行降維與標(biāo)量量化,降維與量化方法與優(yōu)化訓(xùn)練流程相同;
(3)將量化后的待診斷特征輸入到訓(xùn)練好的模型中,使用前-后向算法計算各個模型輸出的對數(shù)似然概率值,似然概率值最大的那個模型對應(yīng)待診斷軸承的故障模式。
以某次滾動軸承的隱馬爾科夫模型的初始參數(shù)優(yōu)化為例來分析GAPSO算法的性能。
從圖3中可以看到,標(biāo)準(zhǔn)PSO算法的適應(yīng)度值很快收斂于86.04,而GAPSO算法則在多次跳變之后收斂于69.28。對比標(biāo)準(zhǔn)PSO算法與GAPSO算法的適應(yīng)度值收斂結(jié)果,可以推測是雜交和變異的操作使得GAPSO算法跳出局部最優(yōu),從而找出更加優(yōu)越的空間位置。
圖3 標(biāo)準(zhǔn)PSO算法和GAPSO算法的收斂曲線
下面,分析粒子跳出局部最優(yōu)的具體過程。以GAPSO算法中第45代到第46代為例,最優(yōu)適應(yīng)度值從80.88降到78.72。
從圖4可以看到,在第45代到第46代,第35號粒子跳出先前的局部最優(yōu)位置,成為適應(yīng)度值最低的粒子。
在算法中下一代的構(gòu)成包括保留粒子、雜交后代、變異后代。在參數(shù)設(shè)置時,種群規(guī)模為40,保留數(shù)為20,雜交數(shù)為14,變異數(shù)為6,并且每次更新按照保留粒子、雜交后代、變異后代的順序存放,因此第35號粒子為變異粒子。進而證明了該次跳出局部最優(yōu)是由于變異操作導(dǎo)致的。
(a)第45代
(b)第46代圖4 第45代和第46代群體最優(yōu)粒子的適應(yīng)度值
圖5是GAPSO算法和自適應(yīng)GAPSO算法的適應(yīng)度值收斂曲線,從圖中可以看出,自適應(yīng)GAPSO算法比GAPSO算法的收斂速度要快。
圖5 GAPSO算法和自適應(yīng)GAPSO算法的收斂曲線
圖6 慣性權(quán)重系數(shù)隨迭代次數(shù)的變化情況
圖6是自適應(yīng)GAPSO算法中慣性權(quán)重系數(shù)隨迭代次數(shù)變化曲線。在0~72步時,由于粒子處于剛開始搜索的階段,各粒子距離全局最優(yōu)均很遠,因此,D(t)與max(D(t))很接近,w接近于1。此時粒子適應(yīng)度值的收斂速度較快,全局搜索能力較強。隨著迭代的進行,粒子逐漸靠近全局最優(yōu)值,D(t)與max(D(t))的比值也逐漸減小。在第72步之后,當(dāng)慣性權(quán)重接近于0時,說明粒子已經(jīng)聚攏在全局最優(yōu)值的附近,此時粒子以前速度對當(dāng)前速度沒有影響,粒子則在全局最優(yōu)附近搜索更加優(yōu)越的位置,此時粒子的局部搜索能力較強。因此,這種自適應(yīng)的控制慣性權(quán)重的方法能夠在迭代收斂的過程中,平衡全局和局部搜索能力,有效地減少迭代步數(shù),從而提高收斂速度。
本文實驗臺如圖7所示,包括直流電機、滾動軸承安裝架、加載裝置和滾動軸承等部分。實驗軸承選用了4種6308深溝球軸承,分別是正常、內(nèi)圈剝落、外圈剝落和滾動體剝落狀態(tài)。實驗時,軸承內(nèi)圈轉(zhuǎn)速為1 050 r/min,傳感器為龍科測控公司的LK111-03加速度傳感器,數(shù)采卡為ART 2000型USB數(shù)據(jù)采集卡。采樣頻率為10 kHz,采樣時間持續(xù)4 s。
圖7 滾動軸承實驗臺
本文實驗每種狀態(tài)采集10組數(shù)據(jù),共40組數(shù)據(jù)。數(shù)據(jù)處理時,首先將每組數(shù)據(jù)分成10幀,每幀4 096點數(shù)據(jù),對每段數(shù)據(jù)提取混合域故障特征,并使用主分量分析對提取的混合域故障特征集進行降維。使用PCA對混合域特征集進行降維處理得到的特征,其2維特征累積貢獻率就達到88.90%,如圖8所示。
圖8 降維后的2維特征
初始狀態(tài)矩陣和狀態(tài)轉(zhuǎn)移矩陣的初值選取對HMM的訓(xùn)練結(jié)果影響不大,可以隨機選取。但混淆矩陣的初值對訓(xùn)練結(jié)果有較大影響,這里對其進行優(yōu)化。選取上節(jié)降維后的2維特征,并將每組的前10幀作為優(yōu)化混淆矩陣時的訓(xùn)練數(shù)據(jù)。算法對4種狀態(tài)的HMM模型初始參數(shù)優(yōu)化過程如圖9所示,這里將3種算法的優(yōu)化過程放在一起作對比。
(a)正常軸承模型
(b)內(nèi)圈故障模型
(c)外圈故障模型
從4種狀態(tài)的HMM初始參數(shù)的優(yōu)化過程可以看到,GAPSO和自適應(yīng)GAPSO算法優(yōu)化的適應(yīng)度收斂值遠低于標(biāo)準(zhǔn)PSO算法,說明這兩種方法的全局尋優(yōu)能力要優(yōu)于標(biāo)準(zhǔn)PSO算法。自適應(yīng)GAPSO算法與GAPSO算法的適應(yīng)度值的收斂值相差不大,但是自適應(yīng)GAPSO算法的收斂速度要優(yōu)于GAPSO算法。
(d)滾動體故障模型圖9 4種軸承狀態(tài)HMM初始參數(shù)的優(yōu)化過程
選取每種狀態(tài)的前10幀作為訓(xùn)練數(shù)據(jù),HMM的狀態(tài)數(shù)設(shè)為4,量化級數(shù)設(shè)為30,并將最大迭代步數(shù)設(shè)為20。將優(yōu)化的結(jié)果作為Baum_Welch算法的初始參數(shù),分別訓(xùn)練4種狀態(tài)下的HMM模型。
將降維后每種狀態(tài)的特征集后90幀作為測試集,每10幀作為一組輸入到訓(xùn)練好的模型中作測試用。由于自適應(yīng)GAPSO算法與GAPSO算法適應(yīng)度值收斂結(jié)果相差不大,這里僅對比標(biāo)準(zhǔn)PSO算法優(yōu)化4種HMM模型初始參數(shù)(PSO-HMM),以及自適應(yīng)GAPSO算法優(yōu)化4種HMM模型初始參數(shù)(自適應(yīng)GAPSO-HMM)的測試結(jié)果。PSO-HMM以及自適應(yīng)GAPSO-HMM的輸出結(jié)果如圖10和圖11所示。
表1對比了PSO-HMM與自適應(yīng)GAPSO-HMM分類正確率。從中可以看到,自適應(yīng)GAPSO-HMM的分類正確率要優(yōu)于PSO-HMM,其中內(nèi)圈故障數(shù)據(jù)的分類正確率提高了12.5%,滾動體故障數(shù)據(jù)的分類正確率提高了28.57%。
表1 PSO-HMM與自適應(yīng)GAPSO-HMM
(a)正常軸承
(b)內(nèi)圈故障軸承
(c)外圈故障軸承
為了充分對比自適應(yīng)GAPSO-HMM與PSO-HMM的分類效果和可靠性。定義了描述分類可靠性的量分類離散度[24]
(d)滾動體故障軸承圖10 4種軸承狀態(tài)PSO-HMM的診斷結(jié)果
式中:λi為第i種模式下的HMM模型參數(shù);logPmax(O|λi)、logPmax′(O|λi)、logPmin(O|λi)分別為在該模型下的最大、次大、最小對數(shù)似然概率值。分類離散度越接近100,說明分類效果越好;分類離散度越接近0,說明分類效果越差。
(a)正常軸承
(b)內(nèi)圈故障軸承
(c)外圈故障軸承
(d)滾動體故障軸承圖11 4種軸承狀態(tài)自適應(yīng)GAPSO-HMM的診斷結(jié)果
從表2中可以看到,自適應(yīng)GAPSO-HMM的分類效果要優(yōu)于PSO-HMM。其中內(nèi)圈故障數(shù)據(jù)的分類離散度提高了206.75%,外圈故障數(shù)據(jù)的分類離散度提高了0.54%,滾動體故障數(shù)據(jù)的分類正確率提高了268.58%。
表2 4種軸承狀態(tài)下PSO-HMM與自適應(yīng)GAPSO-的HMM分類離散度
本文提出了一種自適應(yīng)GAPSO算法優(yōu)化HMM模型初始參數(shù)的方法,給出了操作流程和改進方法。為驗證所提方法的有效性,在滾動軸承的故障診斷實驗中,將自適應(yīng)GAPSO-HMM與PSO-HMM作對比,得到結(jié)論如下。
(1)自適應(yīng)GAPSO算法中的雜交以及變異操作使算法具有較強的全局尋優(yōu)能力。
(2)自適應(yīng)GAPSO算法具有優(yōu)于GAPSO算法的收斂速度。
(3)自適應(yīng)GAPSO-HMM的分類效果優(yōu)于PSO-HMM,最高將分類準(zhǔn)確率提高了28.57%,分類離散度提高了268.5%。