王子涵 楊秀芝 段現(xiàn)銀 蔣宇輝 王興東
(①武漢科技大學(xué)機(jī)械學(xué)院,湖北 武漢430070;② 湖北理工學(xué)院智能輸送技術(shù)與裝備湖北省重點(diǎn)實(shí)驗(yàn)室,湖北 黃石 435003)
隨著精密制造技術(shù)的廣泛應(yīng)用和快速發(fā)展,現(xiàn)在市場(chǎng)對(duì)數(shù)控機(jī)床加工精度的需求日益增長(zhǎng)。由于在加工操作期間由諸如電動(dòng)機(jī)和軸承之類(lèi)的部件產(chǎn)生的熱量,機(jī)床的溫度升高使機(jī)床形變引起熱誤差,并且整體精度降低。更為重要的是大量科學(xué)研究和加工實(shí)踐表明,熱致誤差約占高精度機(jī)床總誤差的40%~70%[1-2]。目前減少機(jī)床的熱誤差的方法主要有2個(gè)方向,分別是硬件和軟件。硬件方向是從機(jī)床本身的材料和結(jié)構(gòu)進(jìn)行研究,通過(guò)采用新型材料和改善結(jié)構(gòu)來(lái)從根本上減少機(jī)床熱誤差。軟件方向是利用補(bǔ)償?shù)乃枷虢?zhǔn)確的機(jī)床熱誤差預(yù)測(cè)模型,通過(guò)該模型預(yù)測(cè)補(bǔ)償誤差去抵消機(jī)床的原始熱誤差,從而達(dá)到減少熱誤差的目的。而因?yàn)檐浖芯康慕?jīng)濟(jì)成本比硬件少得多,且適應(yīng)性更強(qiáng),因此軟件補(bǔ)償是數(shù)控機(jī)床熱誤差研究的最重要方向。
如余文利等[3]使用混沌粒子群優(yōu)化的灰色模型(GM)來(lái)建立熱誤差模型,提高了模型的迭代速度,而比單一的GM模型和ANN的預(yù)測(cè)精度更高;張毅[4-6]提出了結(jié)合灰色模型和反向傳播(BP)神經(jīng)網(wǎng)絡(luò)的灰色神經(jīng)網(wǎng)絡(luò),通過(guò)對(duì)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的優(yōu)化,提高了模型的泛化能力;鄭金勇等[6-7]利用遺傳算法(GA)來(lái)優(yōu)化灰色神經(jīng)網(wǎng)絡(luò)從而建立熱誤差模型,與BP神經(jīng)網(wǎng)絡(luò)相比進(jìn)一步提高了模型的預(yù)測(cè)精度。李彬等[8]基于GA進(jìn)一步優(yōu)化基于小波分析優(yōu)化過(guò)的BP神經(jīng)網(wǎng)絡(luò),用小波基函數(shù)替代隱含層節(jié)點(diǎn)的激勵(lì)函數(shù),解決了BP神經(jīng)網(wǎng)絡(luò)易于陷入局部最小值過(guò)度擬合的問(wèn)題。
而本文使用了一種新的高效的基于BP神經(jīng)網(wǎng)絡(luò)的算法,通過(guò)學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)權(quán)重上的概率分布,使模型在擬合不足和擬合過(guò)度之間達(dá)到平衡,稱(chēng)為貝葉斯神經(jīng)網(wǎng)絡(luò)(BNN)[9-13]。BNN在訓(xùn)練樣本數(shù)據(jù)稀少時(shí)有著比其他網(wǎng)絡(luò)更好的性能,適合機(jī)床熱誤差實(shí)驗(yàn)數(shù)據(jù)少,難獲取的特性[14]。
貝葉斯神經(jīng)網(wǎng)絡(luò),是一種為通過(guò)為神經(jīng)網(wǎng)絡(luò)的權(quán)重引入不確定性進(jìn)行正則化的新型神經(jīng)網(wǎng)絡(luò)模型,使之可以任意精度近似任何連續(xù)函數(shù)。
如圖1中所示的網(wǎng)絡(luò)體系結(jié)構(gòu)是最常用的一種標(biāo)準(zhǔn)BP神經(jīng)網(wǎng)絡(luò),由輸入層、隱藏層和輸出層組成。隱藏層通常使用S型激活函數(shù),而輸出層通常使用線性函數(shù)。一個(gè)神經(jīng)網(wǎng)絡(luò)模型可以視為一個(gè)條件分布模型P(y∣x,w),輸入x,輸出預(yù)測(cè)值y的分布,w為神經(jīng)網(wǎng)絡(luò)中的權(quán)重[9],每個(gè)權(quán)重都有一個(gè)固定值,這是由經(jīng)典BP神經(jīng)網(wǎng)絡(luò)提供的。相應(yīng)地,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)可以視作是一個(gè)最大似然估計(jì)(MLE):
(1)
其中:D對(duì)應(yīng)我們用來(lái)訓(xùn)練的數(shù)據(jù)集,xi為每個(gè)節(jié)點(diǎn)的輸入,yi為每個(gè)節(jié)點(diǎn)的輸出,w為每個(gè)節(jié)點(diǎn)的權(quán)重。MLE 中不對(duì)w的先驗(yàn)概率作假設(shè),也就是認(rèn)為w取什么值的機(jī)會(huì)都均等。如果為w引入先驗(yàn),那就變成了最大后驗(yàn)估計(jì)(MAP):
(2)
貝葉斯估計(jì)同樣引入先驗(yàn)假設(shè),與 MAP 的區(qū)別是貝葉斯估計(jì)求出w的后驗(yàn)分布P(w∣D),而不限于argmax值。如圖2所示,神經(jīng)網(wǎng)絡(luò)的權(quán)重為一個(gè)分布而不是一個(gè)具體的數(shù)值,這樣我們就可以為神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)引入不確定性。由于我們求得的是分布,基于w由x預(yù)測(cè)y的概率模型為:
(3)
此時(shí)預(yù)測(cè)值y為后驗(yàn)分布P(w∣D)上的所有可能的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值的期望。根據(jù)貝葉斯理論,后驗(yàn)分布為:
(4)
P(D)取決于樣本數(shù)據(jù)集,而對(duì)于P(w)的形式,文獻(xiàn)[10]給出了一個(gè)混合尺度高斯先驗(yàn):
(5)
其每個(gè)權(quán)重其分布的先驗(yàn)都是2種相同均值、不同標(biāo)準(zhǔn)差的高斯分布的疊加。
為了后驗(yàn)分布P(D∣w)和期望,Blundell C等[10]利用變分的方法讓高斯分布θ的參數(shù)代入q(w∣θ)去逼近真正的后驗(yàn),把求后驗(yàn)分布的問(wèn)題轉(zhuǎn)變成求解最好的θ問(wèn)題,這個(gè)過(guò)程可以通過(guò)最小化2個(gè)分布的 KL 散度實(shí)現(xiàn):
Eq(w∣θ)[logP(D∣w)]
(6)
Blundell C[10]把第一項(xiàng)叫作復(fù)雜性代價(jià),描述的是權(quán)重和先驗(yàn)的契合程度;把第二項(xiàng)叫作似然代價(jià),描述對(duì)樣本的擬合程度。我們可寫(xiě)成目標(biāo)函數(shù)的形式:
F(D,θ)=DKL[q(w∣θ)‖P(w)]-
Eq(w∣θ)[logP(D∣w)]
(7)
優(yōu)化這個(gè)目標(biāo)函數(shù)就是貝葉斯神經(jīng)網(wǎng)絡(luò)正則化,在2種代價(jià)中取平衡。
在機(jī)床工作期間,由于進(jìn)給機(jī)構(gòu)絲杠和螺母之間的摩擦以及軸承的摩擦而產(chǎn)生大量的熱量,這導(dǎo)致機(jī)床結(jié)構(gòu)的變形影響精度。因此,除了主軸系統(tǒng)外,有必要測(cè)量驅(qū)動(dòng)系統(tǒng)的熱特性,其工作主要包括溫度場(chǎng)和熱誤差2個(gè)方面,得出溫度和誤差之間明確的數(shù)學(xué)關(guān)系。本文的實(shí)驗(yàn)平臺(tái)為某公司的BF-850L立式五軸數(shù)控機(jī)床,本文的研究主軸誤差為Z軸誤差,平臺(tái)的搭建如圖3a所示,測(cè)量熱誤差儀器為雷尼紹RENISHAW激光干涉儀和菲力爾紅外熱像儀FLIR TG42;溫度的測(cè)量分為2種方式,第一種是接觸式測(cè)量,例如主軸電機(jī)和絲桿螺母通常使用磁吸式溫度傳感器進(jìn)行測(cè)量;而對(duì)于難以測(cè)量的部件,我們使用紅外熱像儀輔助測(cè)量數(shù)據(jù)。在本文中,我們使用了紅外熱像儀測(cè)量主軸軸承T2的溫度數(shù)據(jù)。
在實(shí)驗(yàn)正式開(kāi)始之前,先測(cè)量了機(jī)床在環(huán)境溫度T0下的Z軸方向主軸誤差E幾何,即幾何誤差,研究[15-16]表明機(jī)床誤差主要由幾何誤差和熱誤差構(gòu)成。故
E熱=E總-E幾何
(8)
如此,根據(jù)正式實(shí)驗(yàn)中激光干涉儀測(cè)量數(shù)據(jù)E總就很容易得出主軸熱誤差E熱。
在熱誤差實(shí)驗(yàn)中,溫度傳感器的具體位置溫度測(cè)點(diǎn)為表1和圖3b所示。為了模擬正常工作的工況,主軸的轉(zhuǎn)速被設(shè)定為8 000 r/min,X、Y、Z進(jìn)給軸以20 m/min做往復(fù)運(yùn)動(dòng),每15 min測(cè)量1次主軸的重復(fù)定位精度和各溫度點(diǎn)當(dāng)前溫度數(shù)值。
表1 各溫度傳感器具體位置
機(jī)床在230 min達(dá)到熱穩(wěn)定狀態(tài)[17-19]時(shí)停止測(cè)量,此時(shí)機(jī)床熱源和外界環(huán)境熱量交換平衡,溫度基本不會(huì)變化,誤差也趨于穩(wěn)定。溫度和熱誤差變化如圖4所示。
在實(shí)驗(yàn)中我們盡可能多地選用了8個(gè)溫度測(cè)點(diǎn),以防溫度場(chǎng)的重要信息丟失導(dǎo)致輸入模型的數(shù)據(jù)不完整,降低了模型預(yù)測(cè)的準(zhǔn)確性。但例如T3和T4的溫度變化存在共線性關(guān)系,使模型的預(yù)測(cè)精度降低,同時(shí)增大了模型的復(fù)雜性和后期處理數(shù)據(jù)的時(shí)間[20-21]。為了盡可能精確篩選溫度場(chǎng)中的關(guān)鍵點(diǎn),我們使用了K-means算法對(duì)8個(gè)溫度測(cè)點(diǎn)進(jìn)行了聚類(lèi)分析,并從各個(gè)聚類(lèi)中挑選出對(duì)熱誤差影響最大的點(diǎn)作為模型的輸入變量。
在此,取K值為3,于此將對(duì)熱誤差相似影響的溫度點(diǎn)分成3個(gè)簇分別聚集在一起。聚類(lèi)結(jié)果如表2所示。在聚類(lèi)后,各簇溫度變量之間有很強(qiáng)的相似性,為了減少相似溫度點(diǎn)之間的耦合效應(yīng),我們?cè)跇?gòu)建熱誤差模型時(shí)使用相關(guān)系數(shù)法在每簇溫度變量中選出一個(gè)對(duì)熱誤差影響最大的溫度點(diǎn)作為模型的輸入,溫度與熱誤差斜率之間的相關(guān)系數(shù)為:
表2 K-means聚類(lèi)結(jié)果
(9)
式中:Tij代表第j次測(cè)量中第i個(gè)測(cè)量位置的溫度數(shù)據(jù)。Ti是第i個(gè)測(cè)量點(diǎn)溫度數(shù)據(jù)的平均值,kj是第j次測(cè)量的定位誤差數(shù)據(jù)的直線擬合斜率,kji是所有斜率的平均值[9]。各溫度變量的相關(guān)系數(shù)如表3所示,相關(guān)系數(shù)越大,溫度測(cè)量點(diǎn)與熱誤差的相關(guān)性越強(qiáng),就越反映熱誤差的實(shí)際變化。結(jié)合表2,最后選定T1、T5、T6作為模型的輸入變量。
表3 溫度變量相關(guān)系數(shù)
為了驗(yàn)證貝葉斯神經(jīng)網(wǎng)絡(luò)(BNN)模型的性能,我們引入了BP神經(jīng)網(wǎng)絡(luò)進(jìn)行對(duì)比,從2個(gè)方面分析了模型的性能。首先,我們使用一組數(shù)據(jù)進(jìn)行誤差建模,并比較每種模型的擬合能力。然后,為了比較每個(gè)模型的泛化能力,我們使用了在不同工作條件下的另一組實(shí)驗(yàn)數(shù)據(jù)進(jìn)行預(yù)測(cè)。
將BP神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)設(shè)為3-7-1,兩種模型的學(xué)習(xí)速率設(shè)為0.005,迭代次數(shù)為1 000次。模型搭建完成后,把實(shí)驗(yàn)數(shù)據(jù)輸入模型中,擬合性能如圖7所示,由圖5可以看出BP和BNN的擬合精度都很優(yōu)秀,但BNN的效果更好,為了更為明確得出結(jié)論,我們將殘差波動(dòng)幅度ΔEmax、 殘差平均值ΔE、均方誤差MSE以及預(yù)測(cè)精度η作為模型性能評(píng)估標(biāo)準(zhǔn)。其中預(yù)測(cè)精度η的計(jì)算公式為:
(10)
表4 模型性能指標(biāo)
為了驗(yàn)證模型的泛化性能,我們將主軸的轉(zhuǎn)速調(diào)整為4 000 r/min,X、Y、Z進(jìn)給軸以10 m/min做往復(fù)運(yùn)動(dòng),以同樣的時(shí)間頻率測(cè)量溫度和熱誤差數(shù)據(jù),導(dǎo)入模型中,預(yù)測(cè)結(jié)果如圖6所示,各項(xiàng)性能指標(biāo)如表5所示。
表5 模型性能指標(biāo)
從圖表中很容易看出,在改變工況后,BP模型的性能大幅降低,殘差波動(dòng)幅度ΔEmax、 殘差平均值ΔE和均方誤差MSE數(shù)值是BNN模型數(shù)值的數(shù)倍,其中MSE更是達(dá)到了4倍,模型的預(yù)測(cè)準(zhǔn)確率降為72.252 1%,遠(yuǎn)低于之前的89.292 1%的預(yù)測(cè)準(zhǔn)確率。而B(niǎo)NN模型僅小了3.253 7%,兩者的預(yù)測(cè)準(zhǔn)確率相差15.763 8%。由此可見(jiàn)BNN的性能明顯高于BP,表明該模型的泛化能力較強(qiáng)。根據(jù)熱誤差建模和驗(yàn)證實(shí)驗(yàn)的結(jié)果,貝葉斯神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)性能明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò),總體精度提高了88.015 9%,這證明了該模型的穩(wěn)定性和準(zhǔn)確性。
本文基于貝葉斯神經(jīng)網(wǎng)絡(luò)的建模預(yù)測(cè)機(jī)床的熱誤差,通過(guò)測(cè)量熱誤差數(shù)據(jù)和獲得溫度敏感點(diǎn),并將相應(yīng)的值用作模型的訓(xùn)練,并且可以通過(guò)模型預(yù)測(cè)來(lái)獲得在每個(gè)時(shí)刻和每個(gè)溫度的熱誤差。實(shí)驗(yàn)結(jié)果表明,貝葉斯神經(jīng)網(wǎng)絡(luò)模型的性能明顯優(yōu)于BP神經(jīng)網(wǎng)絡(luò),其最大預(yù)測(cè)精度高出了15.763 8%,機(jī)床的總體精度提高了88.015 9%。