何 濤,王 幸,王少東,王正家,盛文婷
(湖北工業(yè)大學(xué) a.機(jī)械工程學(xué)院;b.現(xiàn)代制造質(zhì)量工程湖北省重點(diǎn)實(shí)驗(yàn)室,武漢 430068)
零件作為工業(yè)制造領(lǐng)域中最基本的組成單元,其質(zhì)量在工業(yè)制造領(lǐng)域中有著決定性的影響[1]。零件缺陷識(shí)別是實(shí)現(xiàn)產(chǎn)品質(zhì)量檢測(cè)的至關(guān)重要環(huán)節(jié),保證產(chǎn)品質(zhì)量對(duì)制造業(yè)的發(fā)展有著舉足輕重的作用。由于在眾多機(jī)械零件中諸如齒輪這類環(huán)形零件呈現(xiàn)非線性、不規(guī)則和一定自相似性的特點(diǎn),使得傳統(tǒng)檢測(cè)工具很難準(zhǔn)確識(shí)別零件缺陷。因此,探索一種有效的零件缺陷識(shí)別方法,以滿足產(chǎn)品質(zhì)量檢測(cè)的需求。
分形理論作為一門新興的非線性學(xué)科,適用于自然界中不規(guī)則事物的分析和處理。隨著科學(xué)技術(shù)的發(fā)展,分形理論在圖像處理中已取得廣泛的應(yīng)用和一系列的成果[2]。單分形方法僅用單一維數(shù)來描述目標(biāo)物體的特征,不能完整地刻畫其復(fù)雜性。文獻(xiàn)[3]提出了多重分形理論,即利用廣義維數(shù)與多重分形譜來描述客觀物體。文獻(xiàn)[4]在去趨勢(shì)波動(dòng)分析法(DFA)的基礎(chǔ)上提出了多重分形去趨勢(shì)波動(dòng)分析(Multifractality Detrended Fluctuation Analysis,簡稱MF-DFA),該方法避免了人為因素的影響,能夠更準(zhǔn)確地刻畫隱藏在非平穩(wěn)時(shí)間序列中的多重分形特征,可較大幅度提高目標(biāo)物體的識(shí)別準(zhǔn)確度[5],目前該方法已經(jīng)應(yīng)用到各領(lǐng)域。文獻(xiàn)[6]應(yīng)用二維MF-DFA法計(jì)算糖尿病人的視網(wǎng)膜病變圖像的局部廣義Hurst指數(shù),再將Hurst指數(shù)作為LSSVM中的訓(xùn)練輸入量,對(duì)視網(wǎng)膜圖像進(jìn)行檢測(cè)和分類識(shí)別,提高了圖像識(shí)別的靈敏性和準(zhǔn)確性。文獻(xiàn)[7]引入滑動(dòng)窗口技術(shù)對(duì)傳統(tǒng)MF-DFA算法進(jìn)行改進(jìn),計(jì)算液壓泵的多重分形譜參數(shù),最終利用半監(jiān)督馬氏距離模糊C均值法實(shí)現(xiàn)了液壓泵退化狀態(tài)的識(shí)別。
傳統(tǒng)二維MF-DFA法存在過度覆蓋的問題,因此本文提出一種基于改進(jìn)MF-DFA的零件圖像特征提取與缺陷識(shí)別研究方法。首先利用改進(jìn)MF-DFA法計(jì)算預(yù)處理后的正常與缺陷齒輪圖像的多重分形譜;然后選擇多重分形譜中缺陷特征較為明顯區(qū)域的數(shù)據(jù),通過核化主成分分析法(Kernelized Principal Component Analysis,簡稱KPCA)從中獲取齒輪圖像的缺陷特征值;最后利用支持向量機(jī)(Support Vector Machines,簡稱SVM)實(shí)現(xiàn)齒輪缺陷識(shí)別。
以多重分形算法為基礎(chǔ)的多重分形去趨勢(shì)波動(dòng)分析算法得到了廣泛應(yīng)用,可用在二維以及高數(shù)位序列[8]。對(duì)于齒輪和軸承這類環(huán)形零件,需要使用二維多重分形去趨勢(shì)波動(dòng)分析(MF-DFA)法,能更全面刻畫零件圖像的信息,進(jìn)而可以挖掘更顯著的多分形特征。對(duì)MF-DFA法進(jìn)行改進(jìn),提出三角覆蓋的二維MF-DFA算法,可更精確地計(jì)算零件圖像數(shù)據(jù)的多重分形譜,并高效地進(jìn)行多重分形特征分析。
當(dāng)q≠0時(shí),測(cè)度波動(dòng)函數(shù)Fq(s)為:
(1)
當(dāng)q=0時(shí),測(cè)度波動(dòng)函數(shù)Fq(s)為:
(2)
(a) 覆蓋順序1(b)覆蓋順序2
(c) 覆蓋順序3(d)覆蓋順序4圖1 二維MF-DFA覆蓋順序
不斷改變正方形模塊的邊長s,得到一組不同尺度s下的測(cè)度波動(dòng)函數(shù)Fq(s),再將log(s)和log(Fq(s))進(jìn)行線性擬合運(yùn)算得到廣義Hurst指數(shù)h(q),最后將其帶入式(3)中計(jì)算奇異指數(shù)α與奇異譜f(α),即可得到序列x(m,n)的多重分形譜。
(3)
在二維MF-DFA算法中,雖然使用正方形模塊計(jì)算獲得零件的多重分形譜較簡便,但是該方法容易造成過度覆蓋問題,導(dǎo)致計(jì)算結(jié)果不夠準(zhǔn)確。對(duì)比圖2和圖3可知,三角形模塊覆蓋圖形輪廓曲線只計(jì)算不為零的模塊部分,取得的覆蓋輪廓比正方形模塊覆蓋輪廓更貼切地表達(dá)圖像輪廓的本質(zhì)。采用正方形模塊覆蓋輪廓曲線內(nèi)的面積占整幅圖像總面積的73.44%,而采用三角形模塊覆蓋相同輪廓曲線內(nèi)的面積占圖形總面積的61.33%。故可知三角形覆蓋方法在保證圖像完全覆蓋的情況下,較好的解決了過度覆蓋的問題,提高了圖像覆蓋的精確度。因此,本文引入三角形模塊覆蓋法替換傳統(tǒng)正方形模塊覆蓋法,使用三角覆蓋的二維MF-DFA分析目標(biāo)圖像的特征。
圖2 正方形覆蓋輪廓 曲線圖像 圖3 三角形覆蓋輪廓 曲線圖像
眾所周知,二元多項(xiàng)式擬合運(yùn)算的復(fù)雜度比一元一次多項(xiàng)式擬合運(yùn)算的復(fù)雜度更高[9]。因此,本文的三角覆蓋二維MF-DFA法選用一元一次多項(xiàng)式擬合來計(jì)算圖像測(cè)度波動(dòng)函數(shù)Fq(s)。具體流程如下所示:
(1)對(duì)一幅大小為M×N的圖像x(m,n)構(gòu)造去均值的和序列Y(i,j)。
(4)
(a) 模塊1 (b)模塊2
(c) 模塊3 (d)模塊4圖4 三角形覆蓋模塊
yv(k)=a1k+a2;k=1,2,...,s
(5)
(4)計(jì)算均方誤差F2(s,v)
(6)
(5)對(duì)于Ns個(gè)小區(qū)間,求其F2(s,v)的均值,并計(jì)算q階波動(dòng)函數(shù)Fq(s)。
當(dāng)q≠0時(shí),測(cè)度波動(dòng)函數(shù)Fq(s)為:
(7)
當(dāng)q=0時(shí),測(cè)度波動(dòng)函數(shù)Fq(s)為:
(8)
(6)重復(fù)第(5)步,不斷改變等腰三角形模塊高h(yuǎn)的數(shù)值,獲得一組不同h值下的測(cè)度波動(dòng)函數(shù)Fq(s),對(duì)s和Fq(s)分別取對(duì)數(shù)得到log(s)和log(Fq(s))。將兩者進(jìn)行線性擬合得到廣義Hurst指數(shù)h(q),并帶入式(3)中計(jì)算其對(duì)應(yīng)的奇異指數(shù)α和奇異譜f(α)得到目標(biāo)圖像的多重分形譜。
如果直接對(duì)系統(tǒng)采集的圖像進(jìn)行廣義Hurst指數(shù)h(q)計(jì)算,圖像的背景區(qū)域和噪音光斑會(huì)對(duì)最終的計(jì)算結(jié)果造成影響。故在計(jì)算廣義Hurst指數(shù)h(q)前需對(duì)圖像進(jìn)行預(yù)處理,即將采集的齒輪圖像經(jīng)過二值化、面積濾波、背景區(qū)域灰度值還原以及零件區(qū)域灰度值取反處理后,零件圖像區(qū)域的特征被完整保留,如圖5所示。
(a) 正常齒輪預(yù)處理圖像 (b)缺齒齒輪預(yù)處理圖像圖5 齒輪零件預(yù)處理圖像
齒輪這類零件的圖像具備分形特性,判斷這類零件圖像是否滿足多重分形的特征,需要計(jì)算這類零件圖像的廣義Hurst指數(shù)h(q),當(dāng)對(duì)應(yīng)的h(q)值隨著q的變化而變化時(shí),齒輪零件圖像才具有多重分形特性。使用三角覆蓋二維MF-DFA算法對(duì)經(jīng)過預(yù)處理后的齒輪圖像進(jìn)行分析和計(jì)算得到其廣義Hurst指數(shù)h(q),其中q值范圍為-13.5~+13.5,取值間隔為0.1。計(jì)算結(jié)果如圖6所示,其中q值為橫坐標(biāo),廣義Hurst指數(shù)h(q)值為縱坐標(biāo),可以觀察到正常與缺陷齒輪圖像的h(q)均隨著q值的改變而顯著變化。據(jù)此可知正常與缺陷齒輪圖像具有多重分形特性,并用多重分形譜對(duì)其進(jìn)行特征分析。
圖6 正常與缺陷齒輪零件預(yù)處理圖像Hurst指數(shù)h(q)
使用三角覆蓋的二維MF-DFA算法分別對(duì)正常與缺陷齒輪圖像進(jìn)行多重分形譜的計(jì)算,計(jì)算結(jié)果如圖7所示,圖中橫坐標(biāo)為奇異指數(shù)α,縱坐標(biāo)為對(duì)應(yīng)的奇異譜f(α)。
圖7 正常與缺陷齒輪圖像的多重分形譜
單張齒輪圖像的多重分形譜不能充分詮釋齒輪零件圖像的整體特征。為了得到齒輪零件最具代表性的特征值,采集正常與缺陷齒輪在不同位置狀態(tài)下的圖像各20張,分別計(jì)算這些圖像的多重分形譜,將計(jì)算好的20張正常齒輪零件圖像的多重分形譜與其對(duì)應(yīng)的20張缺陷齒輪的多重分形譜以不同顏色繪制在圖8中,用于齒輪圖像的缺陷特征分析。
從圖8可知,多重分形譜線頂點(diǎn)(奇異譜f(α)為最大值的點(diǎn))的右側(cè),正常齒輪圖像多重分形譜線與缺陷齒輪圖像的多重分形譜線相互雜糅,區(qū)分困難。而在譜線頂點(diǎn)的左側(cè),正常齒輪圖像與缺陷齒輪圖像的多重分形譜線相互錯(cuò)開,各自成束,缺陷特征明顯,易于區(qū)分。故選擇多重分形譜線頂點(diǎn)左側(cè)區(qū)域的數(shù)據(jù)作為齒輪缺陷特征數(shù)據(jù)資源,如圖9所示,圖中每條譜線分別代表其對(duì)應(yīng)的齒輪零件圖像的特征數(shù)據(jù)。
圖8 齒輪圖像多重分形譜
圖9 齒輪缺陷特征數(shù)據(jù)資源
齒輪缺陷特征數(shù)據(jù)資源來自20張正常齒輪圖像與20張缺陷齒輪圖像,每張圖像包含106個(gè)數(shù)據(jù),即每張齒輪圖像包含106個(gè)特征值,特征值維數(shù)為106。核主成分分析(KPCA)作為主成分分析(PCA)的一種非線性擴(kuò)展方法[10],KPCA是在PCA的基礎(chǔ)上利用非線性映射函數(shù)完成非線性變換,將非線性的原始低維空間數(shù)據(jù)映射到高維線性特征空間中,在線性特征空間中利用PCA算法對(duì)數(shù)據(jù)進(jìn)行特征提取,從而有效地提取樣本數(shù)據(jù)的非線性信息[11]。故本文選用核主成分分析(KPCA)算法對(duì)這些數(shù)據(jù)進(jìn)行降維處理,獲得精確的齒輪圖像缺陷特征值。
KPCA算法具體降維步驟如下所示:
(1)選取樣本個(gè)數(shù)為n,影響因子為m,構(gòu)成的樣本數(shù)據(jù)集為A:
(2)選用核函數(shù),目前常用的核函數(shù)主要有多項(xiàng)式核函數(shù)、神經(jīng)網(wǎng)絡(luò)核函數(shù)以及高斯徑向基(RBF)核函數(shù)[12]。其中徑向核函數(shù)計(jì)算過程較簡便且分類效果好,其表達(dá)式:
(9)
(10)
其中,
(5)選擇較大特征值的主成分,即選取前q個(gè)λi的累計(jì)貢獻(xiàn)率Bq需大于值0.95,如式(11)所示:
(11)
圖10 A特征值的累計(jì)貢獻(xiàn)率Bi
將每張正常與缺陷齒輪圖像的特征值作為二維空間點(diǎn)的位置坐標(biāo),如圖11所示。觀察此圖可知,齒輪缺陷數(shù)據(jù)點(diǎn)組成了兩個(gè)群簇分別代表正常和缺陷齒輪零件圖像,表明齒輪缺陷特征提取成功。
圖11 齒輪圖像缺陷特征值
(1)獲取齒輪圖像缺陷識(shí)別訓(xùn)練集與測(cè)試集
成功提取齒輪圖像的缺陷特征值Y,Y為40×2的矩陣,由20張正常齒輪圖像和20張缺陷齒輪圖像組成,矩陣Y的每行數(shù)據(jù)代表每張齒輪圖像的缺陷特征值。將Y轉(zhuǎn)化為齒輪圖像缺陷識(shí)別的訓(xùn)練集與測(cè)試集,根據(jù)Lib-SVM的標(biāo)準(zhǔn)[13]進(jìn)行格式調(diào)整。
隨機(jī)抽取Y中10張正常和10張缺陷齒輪圖像的缺陷特征值,將其整合后作為齒輪缺陷訓(xùn)練數(shù)據(jù)集D2。整合剩余的10張正常與10張缺陷齒輪圖像的特征值作為齒輪圖像缺陷測(cè)試數(shù)據(jù)集E2。D2與E2均是大小為20×2的矩陣。根據(jù)Lib-SVM標(biāo)準(zhǔn)調(diào)整D2與E2的格式,對(duì)它們進(jìn)行歸一化處理得到齒輪圖像的缺陷標(biāo)準(zhǔn)訓(xùn)練集train_chq2和測(cè)試集test_chq2。train_chq2與test_chq2皆是大小為20×2的矩陣。D2、E2、train_chq2及test_chq2的數(shù)據(jù)量較大,本文將每張齒輪圖像的缺陷特征值作為每個(gè)二維空間點(diǎn)的位置坐標(biāo),如圖12和圖13所示,即D2、E2、train_chq2及test_chq2用二維圖像進(jìn)行表達(dá)。
(a) 齒輪圖像缺陷訓(xùn)練數(shù)據(jù)集D2
(b) 齒輪圖像缺陷測(cè)試數(shù)據(jù)集E2圖12 齒輪圖像缺陷訓(xùn)練與測(cè)試數(shù)據(jù)集
(a) 齒輪圖像缺陷標(biāo)準(zhǔn)訓(xùn)練集train_chq2
(b) 齒輪圖像缺陷標(biāo)準(zhǔn)測(cè)試集test_chq2圖13 齒輪圖像缺陷標(biāo)準(zhǔn)訓(xùn)練集與測(cè)試集
(2)齒輪圖像缺陷識(shí)別Lib-SVM最佳參數(shù)選擇
得到齒輪圖像的缺陷標(biāo)準(zhǔn)訓(xùn)練集train_chq2后,需要將其進(jìn)行交叉驗(yàn)證以獲取Lib-SVM齒輪圖像缺陷識(shí)別的最佳懲罰因子c2和核函數(shù)參數(shù)g2。
在范圍2-7~27內(nèi)多次改變(c2,g2)的數(shù)值,將train_chq2中20張圖像的數(shù)據(jù)隨機(jī)分成4個(gè)數(shù)據(jù)量相同的部分,依次將train_chq2的每一個(gè)部分作為齒輪測(cè)試集進(jìn)行預(yù)測(cè),train_chq2其他3個(gè)部分作為齒輪圖像訓(xùn)練集對(duì)Lib-SVM進(jìn)行訓(xùn)練,分別計(jì)算這四個(gè)部分齒輪缺陷識(shí)別準(zhǔn)確率的平均數(shù)p,取使p值最大時(shí)其對(duì)應(yīng)的懲罰因子c2和核函數(shù)參數(shù)g2作為齒輪缺陷識(shí)別的最佳參數(shù)。
交叉驗(yàn)證結(jié)果如圖14所示,圖中的線條為p等高線,每條線上的數(shù)值為p的100倍。本次測(cè)試p的最大值為100%。且有多組的數(shù)值不同的(c2,g2)參數(shù)組合可以使得p取得最大值。當(dāng)懲罰參數(shù)c2過高時(shí)會(huì)造成過學(xué)習(xí)狀態(tài),因此選取其中懲罰參數(shù)c2最小的那組作為最佳參數(shù)值,故本次最佳參數(shù)(c2,g2)的取值分別為c2=0.007 812 5,g2=0.007 812 5。
圖14 最佳參數(shù)(c2,g2)交叉驗(yàn)證結(jié)果
(1)齒輪缺陷識(shí)別預(yù)測(cè)結(jié)果
將齒輪圖像最佳缺陷識(shí)別參數(shù)(c2,g2)與訓(xùn)練集train_chq2帶入Lib-SVM中的樣本訓(xùn)練函數(shù)(svmtrain)進(jìn)行訓(xùn)練可獲得齒輪圖像缺陷識(shí)別SVM模型model。隨后將model和測(cè)試集test_chq2帶入Lib-SVM中的模型測(cè)試函數(shù)(svmpredict)進(jìn)行分類運(yùn)算即可獲得齒輪圖像缺陷識(shí)別預(yù)測(cè)結(jié)果。本次齒輪圖像缺陷識(shí)別預(yù)測(cè)準(zhǔn)確率Accuracy1為100%,標(biāo)志著本次齒輪圖像缺陷識(shí)別成功。
如圖15所示,測(cè)試集test_chq2中20張正常與缺陷齒輪圖像的特征值全部被精準(zhǔn)識(shí)別預(yù)測(cè),用不同形狀和不同顏色的幾何圖形標(biāo)示。其中上部區(qū)域代表正常齒輪圖像特征值預(yù)測(cè)結(jié)果,下部區(qū)域代表缺陷齒輪圖像特征值預(yù)測(cè)結(jié)果。
圖15 齒輪圖像缺陷識(shí)別預(yù)測(cè)結(jié)果
(2)齒輪缺陷識(shí)別結(jié)果分析
本次研究的齒輪圖像缺陷識(shí)別預(yù)測(cè)結(jié)果準(zhǔn)確率高達(dá)100%,結(jié)果分析如下:一方面根據(jù)齒輪圖像缺陷特征數(shù)據(jù)資源,正常齒輪圖像與缺陷齒輪圖像的多重分形譜線各自聚集成束,大致錯(cuò)開且無重疊現(xiàn)象,譜線的缺陷特征明顯。驗(yàn)證了本文提出的基于三角覆蓋二維MF-DFA法計(jì)算的多重分形譜可以很好地表達(dá)零件圖像的缺陷特征。根據(jù)齒輪圖像缺陷特征值數(shù)據(jù),進(jìn)一步得到正常與缺陷齒輪圖像的數(shù)據(jù)點(diǎn)各自聚集成簇,同時(shí)證明本次選用KPCA可以精確提取零件圖像的缺陷特征值,再利用Lib-SVM算法建立零件圖像缺陷識(shí)別模型,能夠?qū)α慵娜毕轄顟B(tài)進(jìn)行精準(zhǔn)識(shí)別預(yù)測(cè)。
本文將常用的多重分形去趨勢(shì)波動(dòng)進(jìn)行改進(jìn),提出了一種基于三角覆蓋的二維MF-DFA算法,用來表達(dá)齒輪圖像的缺陷特征。使用KPCA法融合多重分形和核主成分分析,提取齒輪圖像的多重分形缺陷特征值,再采用Lib-SVM對(duì)齒輪圖像數(shù)據(jù)進(jìn)行建模和缺陷識(shí)別,識(shí)別準(zhǔn)確率高達(dá)100%。結(jié)果表明運(yùn)用該方法可以很好地識(shí)別零件圖像的缺陷,標(biāo)志著零件圖像缺陷識(shí)別成功,同時(shí)驗(yàn)證了三角覆蓋二維MF-DFA法能夠較好地表達(dá)零件的缺陷特征。