趙登超,劉 明,周 超,黃宇星
(福州大學(xué) 機(jī)械工程及自動(dòng)化學(xué)院,福建 福州 350116)
表面微觀形貌影響制件的使用壽命[1-3]。近年來科技發(fā)展對(duì)制件表面精度提出了越來越高的要求[4-5]。由于表面形貌對(duì)表面的耐磨性、耐蝕性、潤(rùn)滑等方面具有重大的影響[6-8],準(zhǔn)確表征表面形貌有著至關(guān)重要的意義。不同加工工藝獲得的表面形貌存在結(jié)構(gòu)差異[9]。零件在加工后,表面會(huì)留下反映其加工方法特點(diǎn)的表面形貌[10-11]。針對(duì)不同加工表面,正確選用評(píng)定參數(shù)對(duì)工程應(yīng)用至關(guān)重要[12]。但由于目前粗糙度參數(shù)眾多,評(píng)定參數(shù)選取沒有統(tǒng)一標(biāo)準(zhǔn),單純采用某一粗糙度參數(shù)來表征不同加工過程的表面質(zhì)量是不合理的[13]。吳乙萬等人[14]分析了當(dāng)前超精密光學(xué)鏡片表面評(píng)定方法的不足,提出引用表面三維粗糙度參數(shù)來表征精密光學(xué)鏡片三維表面形貌,發(fā)現(xiàn)其中的粗糙度參數(shù)中Sq、Sdr、Sdq可以很好地表征超精密光學(xué)表面性能;楊潔等人[15]運(yùn)用機(jī)器視覺選取12個(gè)三維粗糙度參數(shù),結(jié)合端銑、刨、車等加工工藝,發(fā)現(xiàn)Sq、Ssk、Sds這3個(gè)參數(shù)可以作為三維表面粗糙度評(píng)價(jià)的可靠參數(shù)。
拋光作為一種表面精加工工藝[16],廣泛應(yīng)用于集成電路、光學(xué)玻璃、各類機(jī)械系統(tǒng)等領(lǐng)域[17-18]。但影響表面拋光質(zhì)量的因素眾多,如拋光液的濃度、磨粒種類、大小,拋光布的材質(zhì)、機(jī)械性能等[19-20]。由于拋光布是輸送拋光液的關(guān)鍵部件[21-22],對(duì)表面拋光質(zhì)量起著重要作用。目前,大多采用傳統(tǒng)的一維粗糙度參數(shù)來表征表面拋光質(zhì)量作為評(píng)價(jià)拋光布的拋光效果,其一維評(píng)定參數(shù)不能反映整個(gè)拋光表面空間上的信息分布[23]。隨著表面測(cè)量技術(shù)的進(jìn)步,測(cè)量精度的提高,人們獲得了更多的表面形貌細(xì)節(jié)。為準(zhǔn)確表征這些細(xì)節(jié),評(píng)定參數(shù)進(jìn)入三維表征時(shí)代。
本文將采用2012年頒布的ISO 25178中的高度類、空間類、混合類中的12個(gè)粗糙度參數(shù)[24-26],結(jié)合銅的拋光實(shí)驗(yàn),并利用機(jī)器學(xué)習(xí)中的“監(jiān)督”學(xué)習(xí)算法[27]—線性判別分析,對(duì)拋光后所獲得的銅表面粗糙度參數(shù)進(jìn)行聚類、降維分析,為選取合理粗糙度參數(shù)表征拋光布拋光效果方面提供解決方案。
線性判別分析是機(jī)器學(xué)習(xí)中的“監(jiān)督”學(xué)習(xí)算法[28]。這一方法最早由FISHER R A[29]于1936年提出,最初用于二分類問題降維分析。后來RAOC R[30]于1948年將其推廣到多分類線性判別分析中。與LDA方法十分相似的另一種方法是主成分分析法(principal component analysis,PCA)[31],都是常用的線性變換降維方法。不同的是,PCA是一種“無監(jiān)督”學(xué)習(xí)算法,它不需要類別標(biāo)簽,致力于尋找使全部數(shù)據(jù)方差最大化的坐標(biāo)軸成分。LDA則關(guān)心的是能夠最大化類間區(qū)分度的坐標(biāo)軸成分。
LDA方法如圖1所示。
圖1 LDA示意圖
定義“類內(nèi)散度矩陣”如下式所示:
Sω=∑0+∑1
(1)
定義“類間散度矩陣”如下式所示:
Sb=(μ0-μ1)(μ0-μ1)T
(2)
同時(shí)考慮二者,則可得到欲最大化的目標(biāo)J如下式所示:
(3)
式中:J—Sb和Sω的“廣義瑞利商”[33]。
這就是LDA二分類求解方法。對(duì)于多分類求解,假定存在N類,且第i類示例數(shù)為mi。定義全局散度矩陣St為:
(4)
式中:μ—所有示例的均值向量。
LDA方法四分類問題示意圖如圖2所示。
圖2 LDA方法四分類問題示意圖
將類間散度矩陣Sω重新定義為每個(gè)類別的散度矩陣之和,即:
(5)
其中:
(6)
由式(4~6)可得:
(7)
為得到欲最大化目標(biāo),使用3者中的任何2個(gè)即可,目前常用的優(yōu)化目標(biāo)為:
(8)
式中:W∈Rd×(N-1);tr(·)—矩陣的跡。
矩陣的跡可通過如下廣義特征值問題求解:
SbW=λSωW
(9)
為確保所建立LDA模型的準(zhǔn)確性,筆者選擇logistic回歸對(duì)模型進(jìn)行交叉驗(yàn)證[34]。
logistic回歸是針對(duì)線性可分問題的一種易實(shí)現(xiàn)的模型。定義幾率比P,它指特定事件發(fā)生的幾率,如下式所示:
(10)
式中:p—所要預(yù)測(cè)事件的發(fā)生幾率。
更進(jìn)一步,定義logit函數(shù),它是幾率比的對(duì)數(shù)函數(shù),如下式所示:
(11)
logit函數(shù)的輸入值范圍介于區(qū)間[0,1],它能將輸入轉(zhuǎn)化到整個(gè)實(shí)數(shù)范圍內(nèi),由此可以將對(duì)數(shù)幾率記為輸入特征值的線性表達(dá)式,如下式所示:
(12)
此處是在給定特征的條件下,某一個(gè)樣本屬于類別1的條件概率。當(dāng)預(yù)測(cè)某一個(gè)樣本屬于特定類別的概率時(shí),它是logit函數(shù)的反函數(shù),也稱作sigmoid函數(shù),這就是邏輯斯諦回歸模型,如下式所示:
(13)
式中:z—凈輸入,也就是樣本特征與權(quán)重的線性組合。
其計(jì)算公式為:
z=ωTx=ω0x0+ω1x1+…+ωmxm
(14)
本研究將直徑1.5 cm的紫銅棒切割為高1.5 cm的12個(gè)圓柱,并用80、120、240、360、600、800、1 000、1 200、1 500、2 000號(hào)砂紙對(duì)試樣表面依次進(jìn)行打磨。每道砂紙打磨后在顯微鏡下觀察其表面,直至其表面劃痕均勻、方向一致后進(jìn)行下一道砂紙打磨,至2 000號(hào)砂紙打磨完畢后進(jìn)行拋光實(shí)驗(yàn)。
拋光布選取絲絨、真絲絨、平絨和呢絨4種拋光布,如圖3所示。
圖3 實(shí)驗(yàn)所用的4類拋光布(從左至右依次為真絲絨、絲絨、呢絨、平絨)
拋光液選取粒度為7 μm的氧化鋁過飽和液。拋光后用無水乙醇進(jìn)行表面清洗,吹干備用。
本研究采用P-2拋光機(jī),4種拋光布對(duì)金屬銅進(jìn)行拋光實(shí)驗(yàn),每拋光5 min進(jìn)行一次表面形貌掃描。拋光機(jī)的研磨盤直徑200 mm,拋盤轉(zhuǎn)速1 400 r/min。表面形貌掃描采用法國(guó)產(chǎn)的STIL共聚焦輪廓儀,其采樣率100 Hz~30 kHz,最小分辨率為2 nm。
STIL共聚焦輪廓儀如圖4所示。
本次實(shí)驗(yàn)中,掃描分辨率為4 μm,掃描面積為1 mm×1 mm的正方形區(qū)域。實(shí)驗(yàn)樣品基于ISO 25178選取12個(gè)三維粗糙度參數(shù)中的6個(gè)高度類參數(shù)Sa、Sq、Sku、Ssk、Sv和Sp,3個(gè)空間類參數(shù)Str、Sal和Std,2個(gè)混合類參數(shù)Sdq和Sdr。
將獲得的金屬銅拋光表面三維粗糙度數(shù)據(jù)制成數(shù)據(jù)集,摘錄其中部分測(cè)量數(shù)據(jù),每個(gè)樣本代表數(shù)據(jù)中的一行,如表1所示。
圖4 共聚焦輪廓儀
樣本Sa/umSq/umSkuSskStr…Std/(℃)Sdq類別11.642.072.07-0.1440.583…980.925絲絨…281.602.052.050.5460.505…1570.855真絲絨…550.911.151.150.0240.505…1760.527平絨…821.291.643.620.380.595…1740.763呢絨…1081.111.431.430.5230.406…3.250.627呢絨
為了方便機(jī)器學(xué)習(xí)算法對(duì)數(shù)據(jù)識(shí)別并學(xué)習(xí),筆者對(duì)108個(gè)樣本(每類拋光布27個(gè)樣本)的12個(gè)特征記作108×12維的矩陣X∈R108×12,如下式所示:
(15)
類似的,對(duì)于目標(biāo)變量(4類拋光布),可用一個(gè)108行的列向量y表示:
(16)
式中:y(i)取值分別為1、2、3、4。(1—絲絨;2—真絲絨;3—平絨;4—呢絨)
為避免數(shù)據(jù)抽樣不合理所造成模型精確度低,訓(xùn)練效率低[35],筆者將數(shù)據(jù)的訓(xùn)練集和測(cè)試集按6∶4的比例進(jìn)行分層抽樣,保證訓(xùn)練集和測(cè)試集同分布,并對(duì)訓(xùn)練集和測(cè)試集進(jìn)行標(biāo)準(zhǔn)化處理。
LDA訓(xùn)練模型結(jié)果在二維子空間的可視化展示,及模型所得各參數(shù)對(duì)區(qū)分四類拋光布的區(qū)分率及累計(jì)區(qū)分率,如圖5所示。
圖5 LDA模型訓(xùn)練結(jié)果可視化展示
從圖5(a)中可以看出:在運(yùn)用LDA降維后,數(shù)據(jù)在LD1、LD2二維特征子空間上除呢絨與平絨外,整體判別情況較好,呈線性可區(qū)分狀態(tài),且主要集中在LD1方向呈線性可區(qū)分;結(jié)合圖5(b)中前兩個(gè)線性判別Sa、Sq單個(gè)特征對(duì)區(qū)分4類拋光布的區(qū)分率分別為64.3%、30.6%,累計(jì)區(qū)分率為94.9%,幾乎獲取了區(qū)分4類拋光布的全部有用信息。由此可知:LD1為Sa,LD2為Sq。對(duì)于呢絨數(shù)據(jù)包圍著平絨呈現(xiàn)出線性不可分,可能原因是平絨和呢絨的拋光效果接近,差異不顯著造成的,也可能是由于算法的誤判造成的,需做進(jìn)一步分析。
本研究取對(duì)拋光布區(qū)分率最大的粗糙度參數(shù)Sa,并運(yùn)用單因素方差分析法,分析4類拋光布之間的顯著性關(guān)系。
4類拋光布間顯著性關(guān)系如表2所示。
表2 4類拋光布之間顯著性關(guān)系
從表2中可以看出:4類拋光布僅平絨和呢絨之間不存在顯著性差異(p>0.05),其余兩者之間均存在顯著性差異。
為檢驗(yàn)?zāi)P偷臏?zhǔn)確性,本研究對(duì)絲絨、真絲絨、平絨,絲絨、真絲絨、呢絨分別進(jìn)行l(wèi)ogistic回歸分析,結(jié)果如圖6所示。
圖6 logistic回歸交叉檢驗(yàn)結(jié)果
從圖6中可知:對(duì)于絲絨、真絲絨、平絨,其logistic回歸交叉驗(yàn)證結(jié)果顯示所建立的LDA模型僅誤判了絲絨類別中一個(gè)樣本點(diǎn),各類別間線性區(qū)分度很好。對(duì)于絲絨、真絲絨、呢絨,LDA模型僅誤判了兩個(gè)樣本點(diǎn)。Logistic回歸交叉驗(yàn)證結(jié)果表明該LDA模型比較精確。
4類拋光布拋光后金屬銅的表面三維形貌如圖7所示。
圖7 4類拋光布拋光后金屬銅的表面三維形貌
從圖7中可以看出:4類拋光布中,絲絨、真絲絨拋光的表面凸峰高度分布不均勻性較大,平絨和呢絨的表面凸峰分布相對(duì)均勻,絲絨、真絲絨與平絨和呢絨相比表面平坦化程度較差,拋光效果不如平絨和呢絨。
本文對(duì)拋光后所獲得的銅表面粗糙度參數(shù)進(jìn)行了聚類、降維分析。線性判別分析結(jié)果表明:不同拋光布對(duì)所選取的三維粗糙度參數(shù)中的部分參數(shù)的影響具有差異性。
研究發(fā)現(xiàn):Sa、Sq幾乎獲得了區(qū)分4類拋光布拋光效果的全部有用信息,其中,Sa包含區(qū)分4類拋光布拋光效果的信息量最大,原因可能是其磨拋本質(zhì)為磨料顆粒對(duì)拋光表面進(jìn)行微小切削作用[36-37]。由于不同種類的拋光布對(duì)拋光液的存儲(chǔ)及拋光液中拋光顆粒送入拋光表面的能力不同,造成對(duì)拋光表面微小切削的強(qiáng)度不同,反應(yīng)在表面形貌上為高度變化的不同[38-39]。Sa作為機(jī)械表面常用的形貌高度綜合評(píng)價(jià)參數(shù),可以更好地表征這一變化過程。
在評(píng)價(jià)不同種類拋光布拋光效果是否具有顯著性差異方面,與采用傳統(tǒng)的單因素方差分析法相比,線性判別分析可以4提供各分類之間是否具有顯著性差異的可視化展示,使結(jié)果更加直觀。