黃稱意,朱錕鵬
(1.中國(guó)科學(xué)技術(shù)大學(xué)信息科學(xué)技術(shù)學(xué)院,合肥 230026;2.中國(guó)科學(xué)院合肥物質(zhì)科學(xué)研究院先進(jìn)制造技術(shù)研究所,江蘇 常州 213164)
刀具狀態(tài)是影響切削加工質(zhì)量和效率的重要因素。在實(shí)際加工過(guò)程中刀具與工件直接接觸,不可避免地會(huì)發(fā)生刀具磨損甚至斷裂等現(xiàn)象,對(duì)刀具狀態(tài)的準(zhǔn)確監(jiān)測(cè)并根據(jù)刀具狀態(tài)建立合理的換刀策略、減少意外停機(jī)時(shí)間、設(shè)置相應(yīng)的誤差補(bǔ)償,對(duì)于保證加工質(zhì)量并提高經(jīng)濟(jì)效益具有重要意義。
當(dāng)前刀具狀態(tài)監(jiān)測(cè)方法主要分為直接法和間接法,直接法容易受現(xiàn)場(chǎng)加工條件的影響而難以在實(shí)際加工過(guò)程中在線應(yīng)用[1],間接法則是利用多傳感器信號(hào)和智能化方法來(lái)推斷刀具狀態(tài),易于在工業(yè)環(huán)境中實(shí)現(xiàn)。其中切削力、振動(dòng)、聲發(fā)射、電流等是間接法中廣泛使用的傳感器信號(hào)[2],而多源信息融合則能夠綜合各種傳感器信號(hào),更魯棒地反映出刀具的狀態(tài)[3],所以本文采用了多源信號(hào)在特征層融合的方式。
從多源信號(hào)中提取的特征往往維數(shù)太高,降低了計(jì)算效率,不利于模型理解,而且信息冗余較高。特征選擇是實(shí)現(xiàn)降維的有效途徑之一,從特征全集中選擇出有效的子集是間接法刀具狀態(tài)監(jiān)測(cè)最基本、最重要的任務(wù)之一[4],因?yàn)槟P蛯W(xué)習(xí)和狀態(tài)預(yù)測(cè)在一定程度上取決于特征子集的選取。
神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)和隱馬爾可夫模型等是間接法中常用的智能化方法[5],各種過(guò)濾式特征選擇方法為其提供了有效的輸入。Zhang C J等[6]應(yīng)用皮爾遜相關(guān)系數(shù)法(PCC)選擇了關(guān)鍵性特征作為神經(jīng)模糊網(wǎng)絡(luò)的輸入,實(shí)現(xiàn)了刀具磨損與剩余壽命的預(yù)測(cè)。Malhi A等[7]提出一種基于主成分分析(PCA)的特征選擇方法,更準(zhǔn)確區(qū)分了軸承故障。牛博雅等[8]采用FS為基于支持向量機(jī)的刀具狀態(tài)識(shí)別模型提供了有判別性的輸入。其他方法:如最小冗余最大相關(guān)(mRMR)[9]、拉普拉斯得分(LP)[10]等也能按特定評(píng)價(jià)方式選擇特征。然而,其中通過(guò)綜合衡量類間散度和類內(nèi)散度的FS得分可能無(wú)法區(qū)別出樣本不均勻分布的情況。此外,F(xiàn)S和其他過(guò)濾式特征選擇方法一樣,通過(guò)簡(jiǎn)單計(jì)算得分高低快速選擇出特征子集,集合內(nèi)信息冗余性往往較高,特征數(shù)量或過(guò)濾閾值的確定存在較強(qiáng)的主觀性,難以得到滿意的結(jié)果。
針對(duì)上述不足,提出一種改進(jìn)的FS結(jié)合GA的兩步特征選擇方法,以得到綜合性能較好的特征子集。最后通過(guò)高速銑削加工實(shí)驗(yàn)收集的數(shù)據(jù),在主成分散點(diǎn)圖上直觀地比較特征子集的判別性,并從刀具磨損預(yù)測(cè)的精度和信息冗余方面,驗(yàn)證了提出方法的有效性,為改進(jìn)刀具監(jiān)測(cè)中常用的過(guò)濾式特征選擇方法提供了新思路。
根據(jù)Fisher score選擇的特征應(yīng)該滿足類間散度大,類內(nèi)散度小的特點(diǎn),定義訓(xùn)練樣本的第i個(gè)特征下的Fisher score為[11]:
(1)
圖1 不同分布的實(shí)例
針對(duì)圖1中存在的不足,一種改進(jìn)的線性判別率(FDR)被提出來(lái),形如[12]:
(2)
FDR主要是改進(jìn)了類間散度的衡量方式,從而解決了圖1中樣本分布不均勻的問(wèn)題,因?yàn)镕DR與基本的統(tǒng)計(jì)分布無(wú)關(guān),魯棒性更強(qiáng)。然而,即使是改進(jìn)的FDR,僅僅通過(guò)得分高低來(lái)選擇特征,并不一定能夠選擇出最具有判別性的特征。如圖2所示,在類內(nèi)分布相同的情況下,F(xiàn)DR(fi)>FDR(fj),即圖2a較圖2b得分更高,圖2b卻能夠更好地區(qū)分出各個(gè)類別。這說(shuō)明FDR是一種平均判別性評(píng)價(jià)方式,選擇的特征只能代表平均性能,從所有特征中選出合適的特征子集,不應(yīng)該只包含得分高的特征,應(yīng)該從子集的整體性能考慮,選擇最好的特征組合。另外,這兩種過(guò)濾式特征選擇方法在設(shè)定過(guò)濾閾值或確定特征數(shù)量時(shí)往往依靠經(jīng)驗(yàn),主觀性、隨機(jī)性太強(qiáng),而且得到的特征子集內(nèi)信息冗余性較強(qiáng)。
(a)
(b)
針對(duì)上述不足,為了從所有特征中自動(dòng)地選擇出較好的特征子集,降低信息冗余,同時(shí)保證刀具狀態(tài)預(yù)測(cè)的準(zhǔn)確性,提出一種改進(jìn)的FS結(jié)合GA的兩步特征選擇方法。即在FDR的基礎(chǔ)上,進(jìn)一步考慮樣本交叉系數(shù)的影響,而遺傳算法的種群初始化能夠基于上一步的得分,以概率的形式實(shí)現(xiàn),在適應(yīng)值函數(shù)中能夠方便靈活地加入對(duì)于特征數(shù)量和信息冗余的懲罰項(xiàng),根據(jù)問(wèn)題的復(fù)雜程度也可以考慮應(yīng)用精英保留策略和局部搜索策略等,加快收斂速度,最后種群通過(guò)不斷進(jìn)化自動(dòng)收斂到一個(gè)可行解,而無(wú)需人為設(shè)定特征數(shù)量或過(guò)濾閾值。
首先,在FDR的基礎(chǔ)上引入樣本交叉系數(shù),當(dāng)出現(xiàn)混疊現(xiàn)象(如圖2a)時(shí),對(duì)得分?jǐn)?shù)值進(jìn)行一定的削減,即:
(3)
接下來(lái),將NFS結(jié)合遺傳算法,各個(gè)特征的得分用于初始化種群,使得分高的特征以較大的概率被選擇,得分低的特征以較低的概率被選擇,從而避免出現(xiàn)僅僅選擇得分高的特征而不是選擇整體性能更好的特征組合的問(wèn)題。即,把所有特征{f1,f2,…,fd}得分[F(f1),F(f2),…,F(fd)],通過(guò)線性映射L(F(fi))到區(qū)間[ε,1-ε],ε取較小值:0<ε<0.1[13]:
(4)
其中,F(xiàn)max=max{F(f1),F(f2),…,F(fd)},Fmin=min{F(f1),F(f2),…,F(fd)}分別表示最大、最小NFS得分。
映射以后,在計(jì)算機(jī)上產(chǎn)生d個(gè)隨機(jī)數(shù){η1,η2,…,ηd},ηi∈(0,1),若L(F(fi))>ηi,則第i個(gè)特征被選擇并編碼為1,否則編碼為0,i=1,2,…,d。按照這種方法,無(wú)論NFS得分高低的特征都有可能被選擇,NFS得分高的特征以更大的概率被選擇并編碼為1。
在計(jì)算適應(yīng)值時(shí),為了使其能表示特征子集的綜合性能,同時(shí)考慮了分類率、特征數(shù)量和子集內(nèi)信息冗余性的影響。于是,設(shè)計(jì)適應(yīng)值函數(shù)為:
(5)
其中,第一項(xiàng)表示分類器交叉驗(yàn)證的分類率,第二、三項(xiàng)分別表示對(duì)特征子集內(nèi)信息冗余和特征數(shù)量的懲罰,μ和λ為可適應(yīng)問(wèn)題而調(diào)整的懲罰因子。
最后,每一次迭代經(jīng)過(guò)輪盤賭選擇、交叉、變異、局部搜索和精英保留等,不斷進(jìn)化形成適應(yīng)值越來(lái)越高的新種群,直到收斂于可行解。圖3是提出的兩步特征提取方法的執(zhí)行流程,而該算法的詳細(xì)過(guò)程的偽代碼見(jiàn)表1。
圖3 兩步特征選擇方法
表1 NFS結(jié)合遺傳算法的兩步特征選擇算法的偽代碼
續(xù)表
為了驗(yàn)證所提出的兩步特征選擇方法,在高速計(jì)算機(jī)數(shù)控銑床進(jìn)行銑削加工Inconel 718的工件,切削過(guò)程中加工參數(shù)保持不變,包括:主軸轉(zhuǎn)速10 360 r/min、進(jìn)給速度為155 mm/min、徑向切削深度0.125 mm,軸向切削深度0.2 mm以及采樣率50 kHz/通道。在切削試驗(yàn)過(guò)程中,用不同傳感器收集了三向切削力、振動(dòng)信號(hào)和高頻聲發(fā)射信號(hào),刀具磨損則是每次切削后在立式顯微鏡上測(cè)量得到的。有關(guān)數(shù)據(jù)在文獻(xiàn)[14]中有詳細(xì)說(shuō)明。
在不同刀具磨損狀態(tài)下,取小段沿x、z向切削力和振動(dòng)信號(hào),如圖4所示。可以發(fā)現(xiàn),隨著磨損的加劇,信號(hào)幅值越來(lái)越大,根據(jù)磨損情況出現(xiàn)了分層,說(shuō)明通過(guò)傳感器信號(hào)的間接監(jiān)測(cè)方法是可行的。
圖4 在不同刀具狀態(tài)下的信號(hào)幅值
然而,從傳感器收集的原始信號(hào)往往不能直接用于刀具監(jiān)測(cè)系統(tǒng)的輸入,需預(yù)處理后提取有代表性的特征。當(dāng)前研究中,從時(shí)域中提取了均方根、標(biāo)準(zhǔn)差、最大值、偏度、峭度和峰峰值等6個(gè)特征,在頻域中通過(guò)功率譜密度分析提取了譜均值、譜峭度和偏度等3個(gè)特征,在時(shí)頻域中通過(guò)應(yīng)用db4提取了3層小波包分解系數(shù)的能量最大值作為特征,因?yàn)槟芰扛叩南禂?shù)與機(jī)床的特征頻率有關(guān)[15]。
由于從多源傳感器提取的多域特征的單位或大小尺度不同,將其歸一化處理到區(qū)間[0,1]。圖5是映射之后的多域特征和刀具磨損以及其相關(guān)性分析的結(jié)果。從圖中容易發(fā)現(xiàn),有的特征與刀具磨損相關(guān)性較強(qiáng),然而直接將相關(guān)性強(qiáng)的特征組成子集將會(huì)存在嚴(yán)重的信息冗余,圖中均方值、標(biāo)準(zhǔn)差、最大值等之間的相似性也表明了這一點(diǎn),這說(shuō)明了特征選擇在刀具狀態(tài)監(jiān)測(cè)過(guò)程中是非常有必要的。
圖5 從Fx中提取的部分特征
根據(jù)刀具磨損的泰勒經(jīng)驗(yàn)曲線,把刀具狀態(tài)分為初始、中度和嚴(yán)重磨損三種狀態(tài)(1-2-3)。應(yīng)用FDR對(duì)所有特征進(jìn)行評(píng)分,結(jié)果見(jiàn)圖6,曲線上沒(méi)有明顯的跳變點(diǎn)(FS曲線類似如此),難以直接判斷出合適的特征數(shù)量或過(guò)濾閾值,根據(jù)經(jīng)驗(yàn)設(shè)置特征數(shù)量或過(guò)濾閾值的方式主觀性太強(qiáng),而且選擇得到的特征子集中特征變量之間的冗余性太強(qiáng)。
圖6 特征的FDR得分曲線
從各類樣本中分別選擇出50個(gè)樣本,應(yīng)用3類(1-2-3)和2類(1-2)FS對(duì)所有特征評(píng)分,選擇在對(duì)應(yīng)評(píng)價(jià)標(biāo)準(zhǔn)下最好10個(gè)特征組成特征子集。為了直觀的看出這兩個(gè)特征子集判別性之間的差異,利用主成分方法分別對(duì)這兩個(gè)子集集合進(jìn)行分析,選擇第一主成分和第二主成分在直角坐標(biāo)系繪制出各類樣本的散點(diǎn)圖,結(jié)果如圖7所示。在主成分分析之后,只有少量的信息丟失,因此利用第一、二主成分繪制的散點(diǎn)圖能夠基本反映出對(duì)應(yīng)特征子集下各類樣本的分布情況[16]。從圖7可以看出,相比圖7的右圖,圖7的左圖利用1-2-3類FS選擇的特征在初始磨損和中度磨損之間距離較近,說(shuō)明多分類中FS選擇的得分高的特征并不一定能夠很好的區(qū)分出所有的類別。
圖7 1-2-3類FS和1-2類FS選擇的前10個(gè)最好特征對(duì)應(yīng)的主成分散點(diǎn)圖
對(duì)于改進(jìn)的FDR,按照上述同樣的思路進(jìn)行分析,但是特征數(shù)量與提出的兩步方法保持一致,設(shè)置為8個(gè)。在3類(1-2-3)FDR下繪制的散點(diǎn)圖如圖8的左圖所示,容易觀察到,F(xiàn)DR中依然存在上述問(wèn)題,即選擇出得分高的特征組成的特征子集并沒(méi)有很好地區(qū)分出所有類別,尤其是前兩類(1-2),而利用提出的方法選擇的特征子集,對(duì)于上述同樣的樣本,則能夠較好地區(qū)分開(kāi),說(shuō)明這種特征選擇算法能從集合整體性能的角度選擇特征子集,而不僅僅是組合得分高的特征。
圖8 1-2-3類FDR和提出的方法選擇的8個(gè)特征對(duì)應(yīng)的主成分散點(diǎn)圖
除了從主成分散點(diǎn)圖上直觀地比較判別性之外,接下來(lái),從相同高斯過(guò)程回歸模型上刀具磨損預(yù)測(cè)精度和特征子集內(nèi)信息冗余性的角度,將提出的方法與其他各種常用的特征選擇方法進(jìn)行對(duì)比。由于提出的方法選擇了一共包含8個(gè)特征變量,為了保持特征數(shù)量的一致性,這里各種方法都選擇對(duì)應(yīng)評(píng)判標(biāo)準(zhǔn)下最好的8個(gè)特征組成子集,包括: PCC、PCA、FS和mRMR等4種特征選擇方法。
根據(jù)各個(gè)方法選擇的特征子集,隨機(jī)選擇約2/3的樣本用于高斯過(guò)程回歸模型的訓(xùn)練,剩下樣本用于測(cè)試模型的預(yù)測(cè)精度,預(yù)測(cè)精度通過(guò)均方誤差(MSE)和均方根誤差(RMSE)定量描述,結(jié)果取5次的平均值,記錄于表2中,可以發(fā)現(xiàn),各種方法選擇出的特征子集并不相同,在相同模型上,提出的方法實(shí)現(xiàn)了更小的刀具磨損預(yù)測(cè)誤差。另外,根據(jù)式(5),從體現(xiàn)模型預(yù)測(cè)精度、特征數(shù)量和信息冗余的綜合性評(píng)價(jià)函數(shù)上看,即根據(jù)適應(yīng)值函數(shù),提出的方法選擇出的特征子集擁有最大的適應(yīng)值,這是種群不斷進(jìn)化的結(jié)果,說(shuō)明提出的方法能夠根據(jù)需要,在適應(yīng)值函數(shù)中方便靈活的加入對(duì)應(yīng)的考量因素,得到綜合性能更好的特征子集。
表2 各種方法選擇出8個(gè)特征時(shí)的性能結(jié)果
為了從信息冗余性的角度將各種過(guò)濾式特征選擇方法與提出的方法進(jìn)行比較,特征子集之間的平均相關(guān)性(AC)、歸一化互信息(NMI)和最大互信息系數(shù)(MIC)作為特征間信息冗余性的度量指標(biāo)。其中,AC能夠有效衡量集合內(nèi)平均線性相關(guān)程度,NMI是基于信息度量標(biāo)準(zhǔn),可以衡量非線性關(guān)系,而MIC則具有很強(qiáng)的普適性,可以識(shí)別任何函數(shù)關(guān)系[17]。冗余性測(cè)量結(jié)果見(jiàn)表3,容易觀察到,其他條件相同的情況下,所提出的方法選擇得到的特征子集實(shí)現(xiàn)了很小的特征間信息冗余,從NMI和MIC的角度,均是所有方法中冗余性最低的,從AC來(lái)看,也明顯低于除了mRMR外的各種方法,雖然稍微高于mRMR,但也是一個(gè)可接受范圍內(nèi)的負(fù)相關(guān)系數(shù)值。這說(shuō)明從各個(gè)角度進(jìn)行計(jì)算、評(píng)判,這種兩步特征選擇方法均有效降低了特征子集內(nèi)的信息冗余性。PCA、PCC和FS是通過(guò)簡(jiǎn)單的得分排序選擇出得分高的特征,但得分高的特征往往具有相似性,這一點(diǎn)從圖5可以看出,這樣并沒(méi)有考慮特征之間的信息冗余性,所以這些簡(jiǎn)單的過(guò)濾式特征選擇方法難以選擇出綜合性能較好的特征子集。mRMR特征選擇方法不僅考慮了相關(guān)性,也考慮了冗余性,但是不可避免地需要人為的確定特征的數(shù)量或者設(shè)置閾值。而提出的方法通過(guò)將改進(jìn)的FS結(jié)合遺傳算法,能夠從預(yù)測(cè)精度、信息冗余和特征數(shù)量等方面綜合考量,自動(dòng)得到合適的特征子集。
表3 各種特征選擇方法得到的特征子集中信息冗余性
本文以刀具狀態(tài)監(jiān)測(cè)為目標(biāo),針對(duì)Fisher score等過(guò)濾式特征選擇方法中的不足,提出了一種改進(jìn)的FS結(jié)合遺傳算法的兩步式特征選擇方法。通過(guò)在銑削試驗(yàn)收集的多傳感器數(shù)據(jù)上,提取時(shí)域、頻域和時(shí)頻域特征,從特征子集的判別性、相同模型上刀具磨損預(yù)測(cè)精度和特征子集內(nèi)信息冗余性的角度,將提出的方法與其他常用的特征選擇方法進(jìn)行對(duì)比,驗(yàn)證了提出的方法的有效性。這種將簡(jiǎn)單的過(guò)濾式特征選擇方法結(jié)合啟發(fā)式算法的方法為克服過(guò)濾式特征選擇方法中的不足提供了新思路,為各種先進(jìn)的刀具狀態(tài)監(jiān)測(cè)方法提供了有效的輸入。