趙藝琪,聶小龍,趙四新,高加強,劉新寬
(1.上海理工大學 材料與化學學院,上海 200093;2.寶鋼研究院,上海 201900)
齒輪鋼在汽車、鐵路、船舶等工程機械中廣泛使用,是特殊合金鋼中要求較高的關鍵材料,是保證安全的核心部件制造材料。近幾年,齒輪鋼正朝著高性能、長壽命、運行平穩(wěn)、低噪音、高安全性、低成本、易加工等多品種方向發(fā)展[1],其中20Cr鋼是一種廣泛使用的低碳合金齒輪鋼。淬透性是評價齒輪鋼質(zhì)量的重要指標,鋼材淬透性穩(wěn)定與否對齒輪熱處理后畸變影響很大。淬透性帶寬主要是由不同爐次鋼材化學成分控制偏差或同一爐次鋼化學成分的不均勻性所致。轎車齒輪鋼淬透性一般要求全帶控制在6 HRC以下,并且要求同一爐鋼材的淬透性帶寬不大于4 HRC[2]。而鋼的淬透性預測是實現(xiàn)窄淬透性帶寬精確控制、降低熱處理畸變的重要手段。
1938年Jominy用端淬試驗法得出端淬曲線以來,相關研究人員循著定性、半定量和定量研究的途徑,對端淬曲線做了大量研究工作,現(xiàn)已提出一些定量計算公式。新版《機械工程手冊》采用的是由余柏海先生建立的非線性端淬曲線通用計算公式,反映了鋼端淬曲線的基本形態(tài)和變化規(guī)律,堪稱定量研究鋼的淬火工藝與組織結(jié)構(gòu)、力學性能關系的重要成果[3-4]。而美國汽車工程師學會則推薦了線性擬合公式來計算端淬曲線[5]。但是用這些方法得到的預測值與實測值之間還是存在一定的差距,這使得這些方法在實際生產(chǎn)中的應用存在局限性。因此,只有利用更加先進和準確的數(shù)學方法,開發(fā)一種準確度高、使用快捷方便的數(shù)學模型,用于齒輪鋼淬透性的預測問題,才能解決齒輪鋼淬透性預測面臨的難題。
極限學習機(Extreme learning machine, ELM)是一種基于單隱層前饋神經(jīng)網(wǎng)絡(Single-hidden layer feedforward neural network, SLFN)的新算法。2003年,南洋理工大學黃廣斌首次提出了該算法[6],相對于傳統(tǒng)的神經(jīng)網(wǎng)絡學習算法,該運算速度更快且泛化性能更優(yōu),不需要自身設置訓練參數(shù),可以隨機生成隱含層神經(jīng)元的閾值以及輸入層與隱含層之間的連接權值,因此在不丟失精確度的同時,大大提升了運算效率。本著學習和探討的精神,本文首次嘗試運用擬合齒輪鋼端淬曲線計算式,以提高端淬曲線精度,實現(xiàn)淬透性和化學成分之間的雙重反饋,并得到較為滿意的結(jié)果[6-11]。
ELM是為改進BP(Back propagation)神經(jīng)網(wǎng)絡訓練過程中泛化能力差等問題而提出的一種基于單層前饋神經(jīng)網(wǎng)絡的特殊的SLFN。ELM在訓練之前可以隨機地產(chǎn)生輸入層與隱含層之間的連接權值W和隱含層神經(jīng)元的閾值b,只需要確定隱含層神經(jīng)元的激活函數(shù)和隱含層神經(jīng)元個數(shù),即可利用最小誤差化的限制條件計算出輸出權重β。本文所用的ELM預測模型結(jié)構(gòu)如圖1所示。
圖1 ELM神經(jīng)網(wǎng)絡結(jié)構(gòu)
本文選擇某工廠生產(chǎn)20Cr齒輪鋼的成分和端淬曲線數(shù)據(jù)作為ELM預測模型的訓練樣本,試樣外形如圖2(a)所示,取樣方法按照GB/T 225—2006《鋼 淬透性的末端淬火試驗方法(Jominy試驗)》從φ60 mm規(guī)格的成品軋材上取得,末端淬火試樣按照GB/T 5216—2014《保證淬透性結(jié)構(gòu)鋼》中的技術條件900 ℃×60 min正火、880 ℃×60 min端淬處理進行。選取同一爐次兩個具有對比性的試樣,其生產(chǎn)過程與所采用工藝完全相同。試樣的平均成分通過直讀光譜儀和化學分析法測試得到,測試結(jié)果見表1。本文按照GB/T 225—2006要求在端淬試樣上與規(guī)定測試面90°及45°角的表面磨制硬度測試面,如圖2(b)所示,利用數(shù)顯塑料洛氏硬度計(XHRS-150)對測試面J1.5(從試樣端淬末端測量為1.5 mm的截面)、J3、J5、J7、J9、J11位置處的硬度進行測試,測試結(jié)果見表2。
表1 20Cr齒輪鋼化學成分測試結(jié)果(質(zhì)量分數(shù),%)
表2 20Cr齒輪鋼端淬硬度值測試結(jié)果(HRC)
利用Matlab R2018a軟件對20Cr齒輪鋼淬透性進行模型建立及預測。數(shù)據(jù)共有146組,隨機選取其中100組數(shù)據(jù)用作訓練,剩下的46組數(shù)據(jù)作為測試數(shù)據(jù)。
采用ELM算法模型的網(wǎng)絡結(jié)構(gòu)為n×i×M,其中,輸入層個數(shù)n=13,中間層i=9,輸出層M=6。網(wǎng)絡的13個輸入是鋼的常用成分,分別為C、Si、Mn、P、S、Cu、Ni、Cr、Mo、Nb、V、B、Ti,輸出值為齒輪鋼J1.5、J3、J5、J7、J9、J11處的硬度。隱含層在神經(jīng)網(wǎng)絡中起抽象作用,它可以從輸入層中提取特征。一般來說,隱含層層數(shù)越多,處理數(shù)據(jù)的能力越強,但是,增加隱含層層數(shù)勢必會增加訓練的復雜程度,導致樣本數(shù)量的增加以及訓練時間的延長。因此一般選擇一個隱含層,然后按需要增加隱含層。本文所用模型為單層。隱含層節(jié)點數(shù)的選擇十分復雜,一般與輸入層和輸出層個數(shù)相關,且節(jié)點越多,精確度越高。模型中,在比較了計算速度和預測結(jié)果后,中間層選擇了9個節(jié)點。
本文還嘗試利用ELM模型根據(jù)端淬硬度曲線數(shù)據(jù)預測齒輪鋼的化學成分。采用ELM算法模型的網(wǎng)絡結(jié)構(gòu)為n×i×M,其中,輸入層個數(shù)n=6,6個輸入是齒輪鋼端淬曲線中J1.5、J3、J5、J7、J9、J11處的硬度;中間層i=9;輸出層M=13,13個輸出為齒輪鋼的化學成分,主要是常見元素C、Si、Mn、P、S、Cu、Ni、Cr、Mo、Nb、V、B、Ti的含量;隱含層節(jié)點數(shù)為9。
圖3為隨機抽取進行結(jié)果驗證的46個產(chǎn)品J1.5、J3、J5、J7、J9、J11(端淬距離分別為1.5,3,5,7,9,11 mm)的實測淬透性曲線,從圖3中可以看出,實測的硬度分布波動較大,J1.5處硬度分布波動大約在3 HRC 以內(nèi),而圖3(c,d)中J3、J9、J11的硬度分布波動范圍達到4 HRC,個別硬度點,如圖3(a,b,d)中,J5、J7處硬度分布波動范圍甚至達到6 HRC,這說明實際測量的硬度波動較大,產(chǎn)品硬度曲線上下限寬帶過大,影響了齒輪鋼產(chǎn)品的質(zhì)量穩(wěn)定性。
圖3 齒輪鋼產(chǎn)品淬透性曲線
圖4比較了ELM根據(jù)46組化學成分數(shù)據(jù)預測的硬度值和實測值。從圖4中可以看出,預測值與實測值之間的誤差很小,基本上維持在±1 HRC,而且模擬的硬度波動不大,基本保持在1~2 HRC。
圖4 不同端淬距離處試樣實測硬度值與ELM預測硬度值對比
圖5(a)為J1.5、J9處的預測誤差分布散點圖,圖5中兩條橫線為硬度誤差以1 HRC為分界以及硬度誤差百分數(shù)以3%為分界的統(tǒng)計圖。從圖5(a)中可以看出,J1.5處的預測結(jié)果十分精確,誤差幾乎全部維持在3%以內(nèi),實測值和預測值之間的誤差基本上不超過1 HRC。圖5(b)為J3、J11處的預測結(jié)果,與J1.5處的預測結(jié)果相當,從誤差分布圖上可以看出,預測誤差基本上可以維持在3%以內(nèi),不超過1 HRC。而J5、J7、J9處的預測值波動稍大,其原因在于J5、J7、J9處的實測硬度值波動非常大,從而導致預測結(jié)果與實測值之間的誤差加大,即使如此,預測誤差還是更多地控制在3%、1 HRC 以內(nèi)。
圖5 端淬曲線上各硬度點的預測誤差分布
圖6為端淬曲線上各硬度點預測誤差分布統(tǒng)計圖,可更直觀地體現(xiàn)圖5的結(jié)論。
圖6 端淬曲線上各硬度點預測誤差分布統(tǒng)計圖
圖7為ELM與非線性方程法[12]、BP神經(jīng)網(wǎng)絡建立的預測模型計算結(jié)果之間的對比。由圖7可知,ELM的預測精度最高,其次為BP神經(jīng)網(wǎng)絡,非線性方程法預測效果最不理想。表3可以更加直觀地反應3種方法的預測精度,在6個硬度點上,ELM的硬度均方根誤差均較小,且相對非線性方程法,往往相差2~3倍,整體均方根誤差縮小20%左右。非線性方程法預測值往往比實測值高2~3 HRC,預測精度不高,與實際值相差較大。BP神經(jīng)網(wǎng)絡方法因為追求與每個實測值之間的逼近程度,造成預測值存在上下波動,局部某些值存在與實際值相差很大的情況。而ELM預測值基本穩(wěn)定在一個中間值,上下波動很小。
表3 ELM與傳統(tǒng)方法預測各點硬度均方根誤差(HRC)
由圖7可知,BP神經(jīng)網(wǎng)絡的預測結(jié)果整體精度不高,這跟BP神經(jīng)網(wǎng)絡本身存在的弊端有關。而相比BP神經(jīng)網(wǎng)絡方法,ELM輸入層和隱含層之間的連接權值和隱含層的閾值隨機確定,確定后不需要調(diào)整,也就是說,與傳統(tǒng)的神經(jīng)網(wǎng)絡相比,減少了前端的運算量,速算速度加快。同時,隱含層和輸出值之間的連接權值也不需要調(diào)整,而是通過多元回歸的方式確定,與回歸分析中擬合系數(shù)的方法大致相同,算法的基本思想發(fā)生改變;另外,由于ELM僅需求解輸出權重,用到的方法是回歸分析法,所以它的學習過程更容易在所有單元都是極小值的情況下收斂,即不存在局部最優(yōu)解的問題。因為ELM用到了回歸分析的基本原理,數(shù)據(jù)處理時經(jīng)過了不斷的學習和訓練,所以預測精度更高更精確。
圖7 ELM與傳統(tǒng)方法硬度值對比
本文還用ELM模型從端淬硬度曲線反推齒輪鋼的化學成分,計算結(jié)果如圖8所示。圖8(a)為C、Mn、Cr 3個合金元素預測值與模擬值的散點圖,圖8(b~d)為C、Mn、Cr 3個合金元素誤差百分數(shù)的散點圖。C元素預測值和實測值之間的誤差幾乎小于5%,Mn、Cr元素的誤差分數(shù)分別小于3%和2%,也就是說用ELM可精確預測齒輪鋼的化學成分。
圖8 C、Mn、Cr組分實測值與ELM模擬值對比(a)及誤差分布(b~d)
齒輪鋼材料不可避免存在不同程度的成分偏析,甚至端淬試樣的不同部位成分也不相同,從而造成較大的硬度波動。而ELM模型根據(jù)測量的淬透性硬度值計算齒輪鋼測試部位的成分,可以很方便地對成分偏析造成的硬度帶寬進行評估。如表4所示,同時測量某個試樣J5位置的部位1和部位2的硬度值(見表5),再根據(jù)測量成分預測其硬度值,發(fā)現(xiàn)部位1根據(jù)成分預測的硬度值(46.35 HRC)和實際測量值(45.14 HRC)吻合很好,誤差只有0.4%。而部位1根據(jù)熔煉時給出的成分預測的硬度(42.76 HRC)和實際測量值(45.14 HRC)相差2.38 HRC,存在5.2%的誤差。部位2也符合上述規(guī)律。這說明,兩個部位的硬度偏差主要是由成分偏差引起。
表4 某試樣J5截面兩個不同部位測量的成分(質(zhì)量分數(shù),%)
表5 實測及根據(jù)成分預測試樣J5截面不同位置處的硬度值對比(HRC)
1)本文首次嘗試運用ELM模型擬合20Cr齒輪鋼端淬曲線,實現(xiàn)了淬透性曲線和化學成分之間的雙重反饋,并得到較為滿意的結(jié)果。
2)ELM可以根據(jù)齒輪鋼的化學成分預測其淬透性,計算精度明顯好于傳統(tǒng)計算方法,均方根誤差縮小20%左右。
3)ELM也能通過齒輪鋼淬透性硬度曲線反測化學成分,元素含量誤差在5%以內(nèi)。