盧彥群,侯建偉
(河北工程大學(xué),河北 邯鄲 057000)
雙列圓錐滾子軸承(TRBs)用于在靜態(tài)和動(dòng)態(tài)條件下支撐預(yù)緊力(P)、軸向載荷(Fa)、徑向載荷(Fr)和扭矩(T)等 4 種載荷及其組合。該類軸承由 2 個(gè)內(nèi)圈、1 個(gè)外圈和 2 組圓錐滾子組成,2 個(gè)內(nèi)圈之間由一個(gè)等寬的間隙(δ)隔開,圓錐滾子在內(nèi)、外圈之間形成兩列。δ 的作用是便于調(diào)整軸承的整體游隙和預(yù)緊力,并便于承受 P、Fa、Fr和 T 的作用。組合式載荷會(huì)在軸承滾道上產(chǎn)生接觸應(yīng)力(S)和局部變形(α),也會(huì)引起滾道自身的旋轉(zhuǎn)和 δ 的變化,這很難進(jìn)行實(shí)驗(yàn)預(yù)測和驗(yàn)證,此外,如果軸承上承受的載荷與制造商的建議值不同,則軸承可能出現(xiàn)故障。譬如,如果 P 值較小,F(xiàn)r和 T 值很高,則可能在滾道上產(chǎn)生超過 1 000MPa 的 S 值和顯著的局部變形(αmax)。這可能會(huì)導(dǎo)致缺陷產(chǎn)生,如點(diǎn)蝕和疲勞剝落[1]。除了這些不希望的摩擦學(xué)問題外,P 的降低可能導(dǎo)致外滾道的某些接觸區(qū)域產(chǎn)生更大的應(yīng)力,進(jìn)而導(dǎo)致滾子脫離外滾道[2]。因此,通常通過分析技術(shù)或數(shù)值方法(如有限元法——FEM)來確定此類機(jī)械裝置的最佳載荷組合。雖然使用有限元法有許多明顯的優(yōu)勢,但它的確也有一些缺點(diǎn):比如在利用有限元模型處理機(jī)械接觸、大位移和材料非線性問題時(shí),會(huì)產(chǎn)生高昂的計(jì)算費(fèi)用,且在處理機(jī)械接觸問題時(shí)的一個(gè)最大缺陷是網(wǎng)格尺寸及模型收斂問題,也就是說,如果圓錐滾子和滾道之間的接觸面較小,而兩個(gè)接觸體之間的單元格尺寸較大,則接觸應(yīng)力的計(jì)算將不太準(zhǔn)確[3]。一些研究人員[4]采用這種方法,分析了在若干種 P 和 Fr作用情況下的接觸體網(wǎng)格尺寸對(duì)圓錐滾子和滾道之間接觸應(yīng)力的影響。
眾所周知,單獨(dú)使用有限元(即沒有軟計(jì)算或數(shù)據(jù)挖掘——DM技術(shù))來優(yōu)化運(yùn)轉(zhuǎn)工況或預(yù)測軸承故障的設(shè)計(jì)方法,涉及到不可接受的計(jì)算成本問題。因而,為了預(yù)測安裝在雙列 TRB 上的輪轂的接觸應(yīng)力分布,洛斯塔多等人使用了基于 DM 技術(shù)的各種類型的回歸模型。其應(yīng)力分布由 P、Fr和摩擦系數(shù)決定,所得回歸模型可作為該類機(jī)械裝置設(shè)計(jì)階段的可行方案。此外,為了優(yōu)化這些機(jī)械裝置的運(yùn)行狀況,洛斯塔多等人[5]還采用了有限元和 DM 相結(jié)合的方法,以確定雙排 TRB 的最大承載能力。在這種情況下,研究的重點(diǎn)是找到輸入載荷(P、Fa、Fr和 T)的組合方式:當(dāng)兩排滾子的接觸應(yīng)力比都接近 25% 時(shí),F(xiàn)r最大,即此時(shí)具有最大承載能力。其他一些研究者使用基于機(jī)器學(xué)習(xí)法的分類技術(shù)來事先預(yù)測軸承的失效與故障,這些預(yù)測滾子大多數(shù)僅僅依賴于實(shí)驗(yàn)數(shù)據(jù)。例如,為了預(yù)測滾動(dòng)軸承的失效,蘇古曼等人采用了決策樹以及基于內(nèi)核的鄰域得分和多類支持向量機(jī)(SVM)等手段,其中涵蓋了狀態(tài)良好的軸承、內(nèi)圈故障的軸承、有外圈故障的軸承和有內(nèi)外圈同時(shí)存在故障的軸承。格里亞斯和安東尼亞迪斯[6]使用 SVM 方法對(duì)滾動(dòng)軸承故障進(jìn)行自動(dòng)診斷,這是一種有效的方法,在滾動(dòng)軸承故障診斷中具有潛在的應(yīng)用價(jià)值。最近,康卡等人采用人工神經(jīng)網(wǎng)絡(luò)(ANN)和 SVW 檢測和診斷滾珠軸承的機(jī)械故障,通過對(duì)各種缺陷的振動(dòng)響應(yīng)分析,對(duì)神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)進(jìn)行訓(xùn)練和測試,結(jié)果表明,上述算法可用于軸承故障的自動(dòng)診斷。蔣川等人提出了一種新穎的、基于經(jīng)驗(yàn)的小波變換和模糊相關(guān)分類的滾動(dòng)軸承故障診斷新方法,實(shí)驗(yàn)表明,該方法能有效地診斷滾動(dòng)軸承的三種不同工作狀態(tài),且檢測率高于 SVW 和反向傳播神經(jīng)網(wǎng)絡(luò)(BPANN)。
新近出版的文獻(xiàn)采用基于 FEM 和 DM 相結(jié)合的分類技術(shù),來探究 TRB 的最佳運(yùn)行條件。用于對(duì)定義承載條件的明確響應(yīng)進(jìn)行分類的 DM 技術(shù)可分為有監(jiān)督數(shù)據(jù)集和無監(jiān)督數(shù)據(jù)集[7]。在有監(jiān)督數(shù)據(jù)集中,每個(gè)數(shù)據(jù)實(shí)例的類標(biāo)簽是已知的,新實(shí)例由構(gòu)建模型進(jìn)行預(yù)測;然而,在無監(jiān)督數(shù)據(jù)集中,沒有實(shí)例標(biāo)簽,且可以用一組特定的相似度量對(duì)實(shí)例進(jìn)行分組。有監(jiān)督數(shù)據(jù)集和無監(jiān)督數(shù)據(jù)集技術(shù)都有應(yīng)用,但鑒于無監(jiān)督技術(shù)的結(jié)果不能令人滿意,故在該項(xiàng)工作中對(duì)有監(jiān)督技術(shù)給與了更多的關(guān)注。無監(jiān)督分類算法是基于有限正態(tài)混合模型的一種聚類算法,而有監(jiān)督分類算法數(shù)量較多,本文將其分為以下幾種:線性分類法、非線性分類法、分類樹和基于規(guī)則的分類法。
本文的主要目標(biāo)是建立精確的模型,以更高的精度自動(dòng)區(qū)分雙列 TRB 的預(yù)設(shè)運(yùn)行狀態(tài)——從幾個(gè)預(yù)先配置的 P、Fa、Fr和 T 負(fù)載組合來定義該狀態(tài)(例如:壞、差、好和優(yōu))。分類模型可以提供運(yùn)行狀況的相關(guān)信息,包括某些不良狀況的附加信息,比如過高的接觸應(yīng)力、過大的局部變形、點(diǎn)蝕和疲勞剝落等。為了實(shí)現(xiàn)這一目標(biāo),將機(jī)器學(xué)習(xí)法應(yīng)用于從雙排 TRB 的有限元模型中所得的數(shù)據(jù)集,這些若干負(fù)載下的數(shù)據(jù)集可以定義實(shí)驗(yàn)設(shè)計(jì)(DoE)后的運(yùn)行狀況。而后,創(chuàng)建了幾個(gè)模型并對(duì)其特征進(jìn)行約減、數(shù)學(xué)變換和參數(shù)整定,接下來,根據(jù)幾個(gè)魯棒性標(biāo)準(zhǔn)對(duì)所選模型進(jìn)行測試,以確定其泛化程度[8]。
圖1a 顯示了施加在每個(gè) TRB 部件上載荷狀況(P、Fa、Fr和 T):內(nèi)滾道上施加 P 荷載,外滾道上施加 Fa、Fr和 T 荷載。內(nèi)圈被 δ 分隔成兩邊對(duì)等的滾道,以便于軸承的拆卸和 P 的施加。由此可以理解,影響 TRB 的載荷是怎樣組合而成的,軸承是否可能會(huì)出現(xiàn)故障。例如,如果 TRB 上的組合載荷值等于制造商的建議值,則 δtop應(yīng)等于 δbottom(見圖 1a),此時(shí),外滾道的頂部和底部區(qū)域的接觸應(yīng)力值不等于零(見圖1b),在這種情況下,所有滾子始終與內(nèi)外滾道保持機(jī)械接觸,而且局部變形量與接觸應(yīng)力也較小,這樣可以避免出現(xiàn)疲勞剝落和點(diǎn)蝕。與此相比,如果軸承承受不恰當(dāng)?shù)妮d荷(例如:過高的 Fr和 T 值,再加上較低的 P 值),那么 δtop與 δbottom則會(huì)不同,其結(jié)果會(huì)導(dǎo)致的 TRB 故障運(yùn)行(見圖1c)。如圖 1d 所示,只有一小部分外滾道(上部區(qū)域)承受非常高的應(yīng)力,而外滾道底部區(qū)域的接觸應(yīng)力值則為零。這將導(dǎo)致出現(xiàn)點(diǎn)蝕和疲勞剝落,進(jìn)而導(dǎo)致 TRB 故障。為了量化具有兩列滾道軸承滾子的“懸起”效應(yīng),對(duì) TRB 的每列滾子的接觸比 S 做如下定義:
圖 1 所研究軸承的主要組成與負(fù)載
式中,Stop為各列滾子的頂部接觸應(yīng)力,Sbottom為各列滾子的底部接觸應(yīng)力。如果兩列滾子的接觸比(S1和 S2)大于 20%,則可防止 TRB 滾子懸起。
此外,為了量化軸承滾道的旋轉(zhuǎn)效應(yīng),從而判斷軸承故障,將間隙差(Δδ)做如下定義:
式中,δtop為 TRB 頂部內(nèi)圈間隙;δbottom為 TRB 底部內(nèi)圈間隙。TRB 正確運(yùn)行的最佳條件是其Δδ 已盡可能減小。
但是,為了盡量減少外滾道的正常局部變形,以避免出現(xiàn)點(diǎn)蝕或疲勞剝落,在埃詩曼等人研究成果的基礎(chǔ)上,提出下式:
式中,αmax為最大局部變形量;dr為圓錐滾子的平均直徑(此處,其值等于 11.3 mm)。所以,作為一般規(guī)則,本案例中的 αmax的值在任何點(diǎn)都不應(yīng)超過外滾道 0.001 13mm。
一旦確定了 TRB 能夠正常工作的條件,就要考慮各工況下 δ、α、S1和 S2的取值范圍。本文將工況分為四類(壞、差、好和優(yōu)),每類工況示蹤的實(shí)例數(shù)如下:“壞”工況,試驗(yàn) 15 例,檢測 4 例;“差”工況,試驗(yàn) 16 例,檢測 14 例;“好”工況,試驗(yàn) 27 例,檢測 6 例;“優(yōu)”工況,試驗(yàn) 25 例,檢測 6 例。表 1 根據(jù)檢測結(jié)果概括了各工況下的參數(shù)范圍。
表1 各類工況下的參數(shù)取值范圍
在本案例中,為研究不同載荷組合,建立了的軸承三維有限元模型(其中包括圓錐滾子、內(nèi)外滾道及用來安裝 TRB 的輪軸),并利用一個(gè)雙列 TRB 的一半模型進(jìn)行了模擬。為了降低仿真計(jì)算成本,本案例僅考慮對(duì)稱幾何條件和對(duì)稱加載狀況,且將 8 節(jié)點(diǎn)和 6 節(jié)點(diǎn)的三維有限元結(jié)合起來,并使用線性函數(shù)進(jìn)行完全積分,從而構(gòu)建 TRB 有限元模型。該研究所涉及的 TRB的幾何尺寸為:孔徑 78mm,外徑 130mm,寬度90mm,每列 25 個(gè)圓錐滾子。根據(jù)經(jīng)驗(yàn)并結(jié)合實(shí)際情況,假設(shè)輪軸和內(nèi)圈之間的摩擦系數(shù)為0.2,滾子與內(nèi)圈之間以及滾子與外圈之間的摩擦系數(shù)為 0.001。完整的 TRB 有限元模型由 734 84個(gè)單元、84 009 個(gè)節(jié)點(diǎn)和 3 289 個(gè)自由度組成。與傳統(tǒng)的“節(jié)點(diǎn)-段”接觸檢測算法相比,“部分分隔”接觸檢測算法能夠減少計(jì)算接觸應(yīng)力的誤差,同時(shí)可以減少接觸應(yīng)力的網(wǎng)格密度[9],為了改善 TRB 不同部分之間的機(jī)械接觸檢測質(zhì)量,本研究選擇了后者。整個(gè)有限元模型的雅可比因子始終大于 0.6,因此,沒有生成零體積的元素,此外,任何元素的縱橫比(定義為元素最長邊緣與其最短邊緣之間的比率)從未超過10:1。
在材料屬性上,賦予圓錐滾子與滾道以線彈性和各向異性鋼,且滾子的楊氏模量(E)為 208GPa,泊松比(ν)為 0.29。輪轂是以E = 200GPa 和 ν = 0.29 的假設(shè)而建模。TRB 的不同組成部分如圖 2a 所示,調(diào)整后的有限元模型最終網(wǎng)格尺寸如圖 2b 所示。
圖 2 三維有限元模型
該案例對(duì)所提出的有限元模型進(jìn)行了調(diào)整和實(shí)驗(yàn)驗(yàn)證,使所得結(jié)果盡可能真實(shí)。這一過程通過對(duì)接觸運(yùn)動(dòng)副(滾子和滾道)的網(wǎng)格尺寸以及滾道之間的相對(duì)位移的調(diào)整來實(shí)現(xiàn),其中施加的力 P 分別為 300、400、500 和 600 N,力 Fr為 2 000N。
2.2.1 滾子與滾道網(wǎng)格尺寸的匹配
眾所周知,機(jī)械接觸問題中的非線性是有限元法求解實(shí)際接觸應(yīng)力的主要難點(diǎn)之一。就這類非線性問題而言,有些有限元模型只具有有限的接觸面,而網(wǎng)格尺寸很大,這很可能產(chǎn)生不切實(shí)際的接觸應(yīng)力。這一問題往往通過使接觸副之間的網(wǎng)格更小化來解決,即增加接觸節(jié)點(diǎn)的數(shù)量,或增加有限元模型函數(shù)的多項(xiàng)式次數(shù)[10]。為此,德米漢和坎伯對(duì)圓柱滾子軸承的有限元模型進(jìn)行了調(diào)整。該案例研究了單元格大小對(duì)滾道與滾子接觸應(yīng)力的影響以及內(nèi)外滾道的相對(duì)位移等情況,同時(shí)還對(duì)滾子和滾道之間不同網(wǎng)格尺寸的接觸應(yīng)力與理論數(shù)據(jù)進(jìn)行了比較,其間,當(dāng)有限元模型所得結(jié)果與理論和實(shí)驗(yàn)所得結(jié)果之間的差異不顯著時(shí),模型調(diào)整完成。類似于德米漢的工作方式,本案例逐漸遞減網(wǎng)格尺寸,相繼構(gòu)建出含局部精細(xì)網(wǎng)格接觸區(qū)域的有限元模型。這種通過使用漸小化網(wǎng)格尺寸來創(chuàng)建連續(xù)網(wǎng)格的方法需經(jīng)過不斷改進(jìn),直到這些有限元模型外滾道上的接觸應(yīng)力與理論模型上的接觸應(yīng)力幾乎沒有差異為止。本案例以赫茲[11]圓柱體理論模型為基礎(chǔ),對(duì)所提出的有限元模型的不同網(wǎng)格尺寸進(jìn)行了比較,并使用平均絕對(duì)百分比誤差(MAPE)來確定有限元模型的網(wǎng)格大小何時(shí)有效。MAPE 的定義如下:
式中,YyiFEM為每個(gè)有限元模型在不同擬用網(wǎng)格尺寸時(shí)的接觸應(yīng)力;
YyiFEM為理論模型中的接觸應(yīng)力;m 為各尺寸網(wǎng)格下的節(jié)點(diǎn)總數(shù);
k 為局部接觸區(qū)各節(jié)點(diǎn)的接觸應(yīng)力之一;
yi 是調(diào)整參數(shù),在本案例中對(duì)應(yīng)于接觸面積元素的網(wǎng)格大小。當(dāng)接觸元素(包括滾子和滾道)接觸區(qū)尺寸分別為 5.1、1.0 和 0.2 mm時(shí),網(wǎng)格尺寸調(diào)整所獲得的 MAPE 如表 2 所示,它顯示了預(yù)加載 P 分別等于 300、400、500 和 600 N 和
表2 調(diào)整網(wǎng)格密度時(shí),有限元模型的MAPE及其計(jì)算成本
Fr等于 2 000 N 時(shí)的 MAPE,此外還對(duì)每個(gè)網(wǎng)格所需的平均計(jì)算時(shí)間進(jìn)行了探討。
根據(jù)經(jīng)驗(yàn),當(dāng) MAPE 小于 6% 時(shí),才被認(rèn)為是合理的,當(dāng)然還要考慮計(jì)算成本,因?yàn)閷?duì)任何使用 FEM 解決的問題,其 MAPE 和計(jì)算成本都要達(dá)到預(yù)期的目標(biāo),以此為準(zhǔn)則,本案例中滿足此要求的要素是那些網(wǎng)格尺寸為 0.2 mm 的單元格(對(duì)所有的 P 進(jìn)行預(yù)加載和模擬,其 MAPE 和計(jì)算成本均低于閾值)。
2.2.2 基于滾道相對(duì)位移的 TRB 的調(diào)整
在有限元模型的驗(yàn)證中,但凡對(duì)網(wǎng)格尺寸做出調(diào)整,都要考慮內(nèi)外滾道的相對(duì)位移的變化,因?yàn)閮?nèi)外滾道的相對(duì)位移主要用于檢驗(yàn)有限元模型的網(wǎng)格尺寸、摩擦系數(shù)和彈性特征(E 和 v)的是否恰當(dāng)。實(shí)驗(yàn)中,用圖 3a 中所示的、帶有 2 只紅色鉛筆的比較儀來測量該相對(duì)位移,在有限元模型中,該位移在屬于模型本身對(duì)稱平面的兩個(gè)節(jié)點(diǎn)之間進(jìn)行測量,如圖 2a 所示。在網(wǎng)格尺寸調(diào)整過程中,載荷 P 值分別為 300、400、500 和 600 N,F(xiàn)r值為 2 000 N。Fr通過加載單元(型號(hào)為 HBM U3,加載能力為 5kN)施加于 TRB,P 由一個(gè)螺絲通過一個(gè)鋼質(zhì)套管施加在軸承內(nèi)圈上,用一個(gè)安裝在套管上的應(yīng)變儀來測量 P 值,在擰動(dòng)螺絲時(shí),套管壓向內(nèi)圈。圖 3b 顯示了不同 P 值和 Fr值下,從試驗(yàn)臺(tái)獲得的相對(duì)位移與從有限元模型獲得的相對(duì)位移之間的差異:虛線表示實(shí)驗(yàn)產(chǎn)生的相對(duì)位移,實(shí)線表示有限元模型產(chǎn)生的相對(duì)位移。這些成對(duì)兒的曲線表明,所獲得的這兩種相對(duì)位移之間的差異較小,此外,圖 3b 也表明,無論是有限元模型還是實(shí)驗(yàn)數(shù)據(jù),當(dāng)施加最低的 P 時(shí),相對(duì)位移較大,當(dāng)施加最高的P時(shí),相對(duì)位移最小,同時(shí)圖 3b 還表明,隨著預(yù)緊力的增加,滾道與滾子接觸剛度增加,TRB 變形減小。圖 3c 表達(dá)了通過實(shí)驗(yàn)和有限元模型得出的不同相對(duì)位移值的詳情,這種剛度變化與考茲拉絲和卡尼亞[12]之前報(bào)道的荷載-撓度關(guān)系非常吻合,這表明 TRB 中的預(yù)載值越高,其剛度越大。從圖 3b 還可以推斷出:如果網(wǎng)格尺寸有效,那么與實(shí)驗(yàn)數(shù)據(jù)和有限元模型的預(yù)設(shè)參數(shù)(Ebearing= 200 Gpa,Ehub= 208 GPa,ν = 0.29,摩擦系數(shù) = 0.001 和 0.2)相一致。雖然優(yōu)化過程中使用的荷載比網(wǎng)格調(diào)整過程中使用的荷載高(見表 4),但在 2.2.1的預(yù)設(shè)參數(shù)和網(wǎng)格尺寸描述中,已經(jīng)為優(yōu)化過程中的所有有限元模擬做了設(shè)置。這主要是因?yàn)樵趦?yōu)化過程中 TRB 所承受的載荷始終在廠家規(guī)定的范圍內(nèi),所以,TRB 的所有部件都不會(huì)發(fā)生永久性變形。
圖 3 內(nèi)外圈相對(duì)位移監(jiān)測
因?yàn)樾枰紤]的變量和因子的數(shù)量及每個(gè)變量的級(jí)差非常多,所以,所取樣本數(shù)無法覆蓋整個(gè)可能性空間,因此,實(shí)驗(yàn)設(shè)計(jì)在這項(xiàng)工作中的應(yīng)用,大大減少了取樣組合,在模型所需的樣本數(shù)量和有限元模擬實(shí)際需求之間,提供了一個(gè)很好的折衷。本案例實(shí)施了 3 個(gè)層級(jí)的 3k 全因子DoE,其層級(jí)與因子數(shù)值見表 3。
在建立了如表 3 所示的因子和層級(jí)后,生成了設(shè)計(jì)矩陣和荷載組合。該案例必需要進(jìn)行 81次實(shí)驗(yàn)或有限元模擬,以盡量涵蓋所有可能性,并隨之優(yōu)化預(yù)設(shè)負(fù)載,以改善雙排 TRB 的工作條件。表 4 給出了所實(shí)施實(shí)驗(yàn)或有限元模擬的次數(shù),以及要模擬的負(fù)載值。
表3 基于各因子和3K全因子法的DOE參數(shù)、范圍、等級(jí)選擇
表4 設(shè)計(jì)矩陣及擬模擬的載荷組合
?
為了平衡變量的權(quán)重并改善統(tǒng)計(jì)分析結(jié)果,首先,在使用分類方法之前,對(duì)所有數(shù)據(jù)集中的變量,都在 0 和 1 之間進(jìn)行了規(guī)范化處理,然后,對(duì)差異性和相關(guān)性進(jìn)行了探索性分析,對(duì)方差進(jìn)行了統(tǒng)計(jì)分析。方差統(tǒng)計(jì)涵蓋參數(shù)性分析和非參數(shù)性分析,包括方差分析、巴特利特檢、布朗-福賽斯分析以及弗萊格-凱琳檢測[13]等。這些分析旨在確定每個(gè)特征的意義,確定這四類方法之間是否存在顯著差異,是否包含任何冗余特性,此外,主成分分析(PCA)生成了一個(gè)具有新特征的新的數(shù)據(jù)集,并在隨后對(duì)其進(jìn)行了研究。差異和相關(guān)性分析是一種流行的方法,成功地運(yùn)用于該課題[14],它產(chǎn)生變量初始空間的正交變化,以創(chuàng)建一組稱為主成分(PCs)的變量。正交投影捕捉數(shù)據(jù)中的大部分方差,并將一組相關(guān)成分轉(zhuǎn)換成一組非線性相關(guān)的成分。此外,為了最終應(yīng)用所提出的分類方法,對(duì)所提出的DoE中的數(shù)據(jù)進(jìn)行了聚類分析,以確定輸入變量是否能夠便捷地定義分類問題。
該課題采用了幾種監(jiān)督分類技術(shù),按照所研究的四個(gè)類別對(duì)雙排 TRB 的呈現(xiàn)條件進(jìn)行分類。
表5 采用的分類技術(shù)
為完成這一過程,將包含選定特征的數(shù)據(jù)集用作輸入,而這些特征定義了預(yù)設(shè)條件(P、Fa、Fr和 T)。為了簡化模型,建立了魯棒性更好的分類模型,對(duì)其進(jìn)行了特征約簡和參數(shù)調(diào)整,而后,對(duì)這一階段的模型進(jìn)行了測試,以確定它們的實(shí)際推廣能力,此外還對(duì)模型的性能測試結(jié)果進(jìn)行了比較,以確定和選擇最準(zhǔn)確的模型,最后,對(duì)結(jié)果進(jìn)行驗(yàn)證,以確保模型能夠在不經(jīng)過量訓(xùn)練的情況下,盡量解決更多問題。
整個(gè)分類過程按照以下方法進(jìn)行:把數(shù)據(jù)集分成 2 組——第 1 組叫做訓(xùn)練數(shù)據(jù)集,由計(jì)劃 DoE 的 81 個(gè)樣本組成;第 2 組叫做實(shí)驗(yàn)數(shù)據(jù)集,由在 DoE 中所建議范圍內(nèi)的一些隨機(jī)實(shí)例所形成(32 個(gè)樣本)。選擇訓(xùn)練數(shù)據(jù)集并使用重復(fù) 10 次的交叉驗(yàn)證來構(gòu)建和培訓(xùn)模型。由于某些方法(例如,神經(jīng)網(wǎng)絡(luò)或支持向量機(jī))在學(xué)習(xí)過程中使用隨機(jī)初始值,因此該培訓(xùn)有必要多次重復(fù)(本案例重復(fù)了 50 次),以提高結(jié)果的準(zhǔn)確性。在培訓(xùn)過程中,設(shè)法調(diào)整每種算法的最重要的參數(shù),以獲得更好的結(jié)果,對(duì)于每種算法,選擇最精確的模型進(jìn)行測試,而且在此期間使用了尚未用于培訓(xùn)的數(shù)據(jù)集。這種測試可以選擇最精確的模型,因?yàn)樗鼈兊木_性是通過以前未使用的實(shí)例來確定的。對(duì)于每種分類技術(shù),在選擇了最精確的模型后,對(duì)該選擇過程進(jìn)行了驗(yàn)證,結(jié)果表明,所選模型能夠成功地解決各個(gè)方面的問題,最后,根據(jù)這些最精確的模型,對(duì)最優(yōu)預(yù)設(shè)值進(jìn)行了最佳分類,確保了 TRB 的正確的工作條件。
模型的魯棒性是模型選擇中一個(gè)實(shí)用的參數(shù),而其作為一個(gè)目標(biāo)函數(shù),通常情況下需要通過 95% 置信水平下的整體分類來驗(yàn)證其精度。當(dāng)總體分類準(zhǔn)確度相似(比如:靈敏性、非加權(quán)卡巴統(tǒng)計(jì)、特異性、檢出率、發(fā)病率、陽性預(yù)測值、陰性檢出率、預(yù)測值和平衡精準(zhǔn)度等)時(shí),也考慮其他標(biāo)準(zhǔn)(見表 6)。
表6 優(yōu)化分類模型準(zhǔn)確性且可以選擇最佳分類模型指標(biāo)
在 v3.4.1 統(tǒng)計(jì)軟件環(huán)境下,用 R 語言對(duì)提議的方法進(jìn)行編程,并開發(fā)分類模型[15]。
一旦 FE 模型通過驗(yàn)證,自動(dòng)程序則會(huì)根據(jù)表 4 中所建議的 DoE 進(jìn)行 81 次有限元模擬,其結(jié)果如表 7 所示(S1、S2、αmax和Δδ)。
表7 基于表4定義的DoE的81次有限元模擬結(jié)果
?
圖 4 表達(dá)了根據(jù)施加荷載(見表 1)情況和從有限元模擬(見表 7)結(jié)果中獲得的數(shù)據(jù)集分布,其中圖 4a 顯示了αmax、S1和 S2的三維圖形數(shù)據(jù)集分布,圖 4 b 顯示了Δδ,S1和 S2的三維圖形數(shù)據(jù)集分布。在這兩個(gè)圖中,都可以看到與優(yōu)、好、差和壞條件相關(guān)的圖案結(jié)構(gòu)。
圖 4 載荷與模擬數(shù)據(jù)集分布
此外,32 個(gè)新的有限元模型被用于新的荷載組合測試分類程序(見表 8),同樣,用一個(gè)自動(dòng)程序來運(yùn)行 32 個(gè)新的有限元模擬,其結(jié)果見表 9。
表8 新荷載組合模擬
表9 按表8輸入的有FE模擬結(jié)果
?
?
實(shí)驗(yàn)進(jìn)行期間,按照提議四種方法的對(duì)數(shù)據(jù)集的四個(gè)變量進(jìn)行了方差同質(zhì)性的統(tǒng)計(jì)檢驗(yàn),表 10 所列的統(tǒng)計(jì)數(shù)據(jù)以及 P 值均為計(jì)算值。此外,還進(jìn)行了相關(guān)分析,其結(jié)論是:盡管 Fr是最重要的特征,但在當(dāng)前的實(shí)驗(yàn)條件下,四個(gè)特征都具有重要意義。
表10 各變量方差均勻性檢驗(yàn)結(jié)果
隨后,將數(shù)據(jù)集引入 PCA 中,結(jié)果表明,所有新的 PCs 所闡釋的數(shù)據(jù)方差比例(見表 11)與原始特征大致相同。鑒于此,人們認(rèn)為使用原始特性是更好的選擇,因?yàn)槭褂靡阎獙傩远皇撬鼈兊木€性組合將構(gòu)建更容易理解的模型。
表11 PCs的重要性
從這一點(diǎn)出發(fā),采用無監(jiān)督聚類方法,根據(jù) 4 個(gè)原始特征得到 4 組分類。依據(jù) DoE 信息和實(shí)例的相似性度量,使用 EM 算法擬合而成高斯有限元混合模型,確定數(shù)據(jù)的累加是否可以定義和如何定義 4 個(gè)集群。對(duì)這種無監(jiān)督算法進(jìn)行多元混合評(píng)價(jià)(見圖 5),可以看到,貝葉斯信息準(zhǔn)則(BIC)在絕對(duì)值上隨著集群數(shù)量的增加而顯著增加。進(jìn)一步的分析結(jié)果表明,采用簡單的聚類技術(shù),不能將數(shù)據(jù)按照誤差較小的類劃分為 4 組。對(duì)于一個(gè)集群和接下來的 3 個(gè)多元混合物(EII、VII、EEI)來說,最好的 BIC 值為343.45。
圖 5 集群數(shù)與BIC的關(guān)系
多元混合體如下:EII(球形、等體積)、VII(球形、等體積)、EEI(對(duì)角線、等體積、等形狀)、VEI(對(duì)角線、變體積、等形狀)、EVI(對(duì)角線、等體積、變形狀)、VVI(對(duì)角線、變體積、變形狀)、EEE(橢圓體、等體積、等形狀、同方向)、EVE(橢圓體、等體積、同方向)、VEE橢圓體、等形狀、同方向)、VVE(橢圓體、同方向)、EEV(橢圓體、等體積、等形狀)、VEV(橢圓體、等形狀)、EVV(橢圓體、等體積)和VVV(橢圓體、變體積、變形狀、變方向)。
至此,由于采用 PCA 對(duì)變量進(jìn)行特征約簡,以及使用聚類技術(shù)對(duì)群組進(jìn)行分類都沒有使分類方法得到改善,因此對(duì)所有原始特征進(jìn)行了監(jiān)督分類,并利用該方法建立了多個(gè)模型,而且利用訓(xùn)練數(shù)據(jù)集進(jìn)行了訓(xùn)練,同時(shí),在此階段對(duì)算法的定義參數(shù)進(jìn)行了優(yōu)化,提高了算法的精度。表 12 顯示了技術(shù)方法、在分析期間已調(diào)優(yōu)的參數(shù)、參數(shù)的調(diào)優(yōu)范圍以及為最終模型的選用值。一個(gè)重復(fù) 50 次的十倍交叉驗(yàn)證過程決定了模型的分類精度,而分析該精度的主要準(zhǔn)則為總體精度。但是,如果對(duì)誤差百分比有任何疑問,則也要對(duì)其他魯棒性準(zhǔn)則進(jìn)行審視。
表12 各項(xiàng)技術(shù)最重要參數(shù)的調(diào)整及研究值的選定
?
對(duì)每種技術(shù)而言,在其最精確模型的訓(xùn)練階段,都要進(jìn)行測試,而測試數(shù)據(jù)集可用來確定每一種方法的實(shí)際泛化能力,培訓(xùn)和測試階段的結(jié)果見表 13。這些測試表明,非線性分類方法中的 ANN 和 SVM、分類樹中的 C4.5 和 evTree 以及基于規(guī)則的方法等方法在訓(xùn)練階段都能得到非常準(zhǔn)確的結(jié)果。然而,當(dāng)將新的實(shí)例應(yīng)用于模型時(shí),精度要低得多。這一現(xiàn)象說明,在訓(xùn)練階段,一些模型存在過度擬合,所以測試數(shù)據(jù)集對(duì)分析模型的真實(shí)泛化能力非常有用。
表13 使用所有數(shù)據(jù)集時(shí),訓(xùn)練和測試階段的結(jié)果(最精確的模型由斜體字表示)
這一具有所有的原始特征并基于 FDA 的模型,在對(duì)最佳預(yù)設(shè)條件進(jìn)行分類的過程中,提供了最大的準(zhǔn)確性,且基于判別分析的不同非線性技術(shù)的精度差異也不太顯著,此外,為確定哪個(gè)FDA 是最準(zhǔn)確,我們可以采用其他建議的標(biāo)準(zhǔn)來判別(例如,對(duì)于未加權(quán)的 kappa 統(tǒng)計(jì),使用FDA 的價(jià)值大于使用 MDA)。
表 14 顯示了使用所選 FDA 模型的測試數(shù)據(jù)集的混合矩陣,該矩陣表明,“優(yōu)秀”級(jí)別的預(yù)測是相當(dāng)準(zhǔn)確的,該級(jí)別必須確保 TRB 的正確工作條件。這個(gè)預(yù)測顯示出每一個(gè)被標(biāo)記為“優(yōu)秀”的級(jí)別是如何被預(yù)測為“優(yōu)秀”的。然而,由于 16 個(gè)實(shí)例中有 6 個(gè)預(yù)測錯(cuò)誤,所以級(jí)別被標(biāo)記為“差”的實(shí)例較難分類,而“壞”和“好”級(jí)預(yù)測了所有標(biāo)記的實(shí)例,只有一個(gè)例外。此外,表 15 顯示了分類模型性能的更多統(tǒng)計(jì)信息。
表14 基于FDA的模型在測試階段的混淆矩陣
表15 測試階段基于FDA的模型統(tǒng)計(jì)
雖然在 FDA 模型中使用測試數(shù)據(jù)集時(shí)總準(zhǔn)確率為 75%,但當(dāng)對(duì)這些結(jié)果進(jìn)行分析時(shí),可以看出該準(zhǔn)確度可以得到提高。本案例中,可以把所定義的 4 種級(jí)別的問題簡化為 2 類,第一類涵蓋原來的“壞”和“差”,它使得 TRB 在不恰當(dāng)?shù)臈l件下運(yùn)行;另一類包括了“優(yōu)”和“好”,意味著 TRB 在合適的條件下工作。在本例中,表16 中顯示的混淆矩陣表明,只有兩個(gè)實(shí)例被預(yù)測為與其標(biāo)簽不同的類。這意味著當(dāng)合并相關(guān)類以減少類的數(shù)量時(shí),模型的總精度可以提高到 93.75%。
表16 測試階段僅為“壞-差”和“好-優(yōu)”兩各級(jí)別的基于FDA模型的混淆矩陣
FDA 是基于 LDA 的線性技術(shù),但有一個(gè)額外的懲罰策略,該懲罰模型采用彈性網(wǎng)絡(luò)技術(shù):L1懲罰實(shí)際上消除了預(yù)測因子,而 L2懲罰降低了判別函數(shù)的系數(shù)。判別空間構(gòu)造模型的維數(shù)等于 3(θ1,θ2,θ3),解釋模型的方差百分比在各個(gè)維度上分別為 66%、29.46%、4.54%,此外,得到的三向維度與原始特征的關(guān)系如表 17 所示,它表明在四個(gè)原始特征中,只使用了 P、Fr和Fa,沒有使用 T,其中,h(·)為鉸鏈函數(shù),如式(5)所示。表 18 給出了用于判別空間各維度的預(yù)測結(jié)果。
表17 所得3D模型與原始特征的關(guān)系
表18 各維和全維度的預(yù)測結(jié)果
本文驗(yàn)證了一種基于數(shù)據(jù)分析和機(jī)器學(xué)習(xí)技術(shù)的兩步方法,該方法既可應(yīng)用于有限元模型分析,也可應(yīng)用于數(shù)據(jù)挖掘。其目標(biāo)是創(chuàng)建一個(gè)可以自動(dòng)分類的組合載荷模型,該載荷可以界定一個(gè)雙排 TRB 的、與其穩(wěn)定的工作狀態(tài)相關(guān)的預(yù)置條件。為此,建立了雙排 TRB 的三維有限元模型,并成功地對(duì)其進(jìn)行了數(shù)值模擬,且模擬和實(shí)驗(yàn)結(jié)果一致。在此模型的基礎(chǔ)上,按照所提出的DoE方法,執(zhí)行了一個(gè)將負(fù)載與定義工作條件的類別相結(jié)合的數(shù)據(jù)集,隨后對(duì)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,其中包括探索性分析以及方差和相關(guān)性分析,以消除不重要的變量,同時(shí)建立了幾種分類模型,并通過特征約簡和參數(shù)調(diào)優(yōu)技術(shù)對(duì)它們進(jìn)行了優(yōu)化。為了確定方法的性能,使用了新的實(shí)例測試和驗(yàn)證了優(yōu)化的模型,結(jié)果表明,一些方法在定義可能性空間時(shí)產(chǎn)生了過度擬合,但在生成模型時(shí)所使用新的實(shí)例沒有降低模型的性能。最后,可以看出最精確的模型是在非線性分類方法組內(nèi),更具體地說,它是在柔性的判別分析的基礎(chǔ)上產(chǎn)生了 93.75% 的、非常準(zhǔn)確的結(jié)果,而最初的四個(gè)類被減少到只有兩個(gè)。結(jié)果表明,將有限元法與機(jī)器學(xué)習(xí)技術(shù)相結(jié)合,可以成功地確定機(jī)械裝置的工作狀態(tài)。