趙春陽,王恩會,方 志,郭春雨,段興駿,侯新梅
(北京科技大學(xué)鋼鐵共性技術(shù)協(xié)同創(chuàng)新中心,北京 100083)
非氧化物材料因其強度高,具有良好的抗氧化、抗熱震和抗腐蝕性能,被廣泛應(yīng)用于冶金、電力和化工等行業(yè)[1-3]。在實際服役條件下,作為高溫設(shè)備內(nèi)襯耐火材料重要組成的非氧化物材料其本身的氧化行為易導(dǎo)致相應(yīng)耐火材料高溫性能不斷惡化,進(jìn)而降低服役壽命。因此明晰非氧化物材料在高溫服役過程中的反應(yīng)行為對相應(yīng)耐火材料服役壽命的預(yù)測和優(yōu)化設(shè)計尤為重要[2-5]。
在非氧化物材料高溫服役過程的反應(yīng)行為研究方面,由于高溫反應(yīng)的復(fù)雜性及實驗條件的苛刻性,反應(yīng)數(shù)據(jù)準(zhǔn)確獲取困難且重現(xiàn)性差,而現(xiàn)有的測試僅考慮單一因素,與材料實際服役條件相距甚遠(yuǎn)。除了實驗手段外,多采用動力學(xué)模型進(jìn)行分析[5-8],但是動力學(xué)模型的建立往往都需要進(jìn)行大量數(shù)據(jù)處理,當(dāng)遇到不同的反應(yīng)機理時不可避免地需要更多的表達(dá)式來描述反應(yīng)行為,且很難同時滿足描述準(zhǔn)確性高和模型參數(shù)簡單兩個條件,實際應(yīng)用效果不佳[9-12]。
隨著人工智能的快速發(fā)展和大數(shù)據(jù)技術(shù)在材料領(lǐng)域的應(yīng)用探索,越來越多的機器學(xué)習(xí)算法被用于解決材料制備和性能等方面的研究。人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)是基于簡單處理元素(神經(jīng)元)組成的相互連接的并行系統(tǒng),該系統(tǒng)利用已有數(shù)據(jù)學(xué)習(xí)輸入和輸出之間的函數(shù)關(guān)系,而無需事先假設(shè)輸入與輸出關(guān)系,具有自學(xué)習(xí)功能和高速尋找優(yōu)化解的能力。因此,ANN在復(fù)雜系統(tǒng)的實際應(yīng)用中具有強大的優(yōu)勢[13-15]。反向傳播(back propagation, BP)學(xué)習(xí)算法是一種按照誤差逆向傳播訓(xùn)練多層前反饋神經(jīng)網(wǎng)絡(luò)的算法,通過輸出層得到輸出結(jié)果和期望輸出的誤差間接調(diào)整各層之間的權(quán)值,從而達(dá)到優(yōu)化網(wǎng)絡(luò)的目的。ANN與BP的結(jié)合在解決非線性回歸問題方面有巨大潛力[16-17],有望更好地認(rèn)知非氧化物材料在高溫服役過程的反應(yīng)行為。
本文以典型非氧化物材料SiC為例,將BP-ANN應(yīng)用于描述其氧化行為,建立精度較高的人工神經(jīng)網(wǎng)絡(luò)模型,為非氧化物材料的氧化行為和對應(yīng)耐火材料的優(yōu)化設(shè)計研究提供新思路和新途徑。
神經(jīng)網(wǎng)絡(luò)模型的建立是基于對已有數(shù)據(jù)輸入與輸出關(guān)系的不斷學(xué)習(xí)來實現(xiàn)的。訓(xùn)練網(wǎng)絡(luò)用到的SiC氧化實驗數(shù)據(jù)是筆者課題組之前試驗獲得的[18]和補充的不同水蒸氣體積分?jǐn)?shù)條件下的氧化數(shù)據(jù),如圖1所示(圖中Δm為粉末質(zhì)量變化量,m0為粉末初始質(zhì)量)。
圖1 不同條件下SiC質(zhì)量增益分?jǐn)?shù)隨時間變化曲線Fig.1 Curves of SiC mass gain percentage with time under different conditions
在本文中,使用了由輸入層、隱藏層和輸出層組成的三層標(biāo)準(zhǔn)反向傳播神經(jīng)網(wǎng)絡(luò)。反向傳播是一種計算非線性多層網(wǎng)絡(luò)梯度的方法。在早期的標(biāo)準(zhǔn)算法中,隨機初始賦予神經(jīng)網(wǎng)絡(luò)一組權(quán)值,然后根據(jù)輸入數(shù)據(jù)調(diào)整權(quán)值,使輸出誤差達(dá)到最小[19]。但這種算法效率低下,而且不可靠,因為需要大量的迭代才能收斂。因此,標(biāo)準(zhǔn)算法的許多變體被開發(fā)出來,其中Levenberg-Marquardt是最受歡迎也是速度最快的算法[20]。所以,本文采用Levenberg-Marquardt算法進(jìn)行BP-ANN訓(xùn)練,采用mapminmax函數(shù)進(jìn)行數(shù)據(jù)歸一化處理,采用歸一化均方誤差性能函數(shù)(mean squared error, MSE)進(jìn)行系統(tǒng)誤差性能函數(shù)修正。
用于網(wǎng)絡(luò)訓(xùn)練的數(shù)據(jù)是在熱重分析儀上完成的,其輸出值的x軸為時間,y軸為質(zhì)量變化率。在熱重測試中,能夠影響最終結(jié)果的因素只有兩個,即氧化時間和氧化溫度,本文將這二者作為輸入值,將樣品的質(zhì)量變化率作為輸出值,進(jìn)行BP-ANN訓(xùn)練。一個好的神經(jīng)網(wǎng)絡(luò)建模過程中,不僅要保證誤差較小,相關(guān)性較好,而且要對訓(xùn)練集以外的樣本有較強的預(yù)測能力。為盡量保證所建模型的可靠性,在空氣環(huán)境的數(shù)據(jù)除1 300 ℃以外其他4個溫度下的氧化數(shù)據(jù)中均勻取50個數(shù)據(jù)點作為訓(xùn)練集,1 300 ℃中的50個氧化數(shù)據(jù)點作為預(yù)測樣本集,用于驗證網(wǎng)絡(luò)預(yù)測的有效性。在不同水蒸氣體積分?jǐn)?shù)環(huán)境的實驗數(shù)據(jù)中,將Ar+10%H2O條件下1 300 ℃和文獻(xiàn)[18]中Ar+20%H2O條件下1 200 ℃的數(shù)據(jù)作為預(yù)測樣本集,其余作為訓(xùn)練集。所有輸入數(shù)據(jù)都在訓(xùn)練前進(jìn)行歸一化處理,用于描述SiC的氧化行為的BP-ANN結(jié)構(gòu)如圖2所示,圖中h1~hn表示隱藏層的神經(jīng)元,具體的神經(jīng)元個數(shù)將在本文后續(xù)進(jìn)行討論。
圖2 BP-ANN結(jié)構(gòu)Fig.2 BP-ANN structure
隱藏層神經(jīng)元的多少直接影響B(tài)P-ANN的預(yù)測能力,神經(jīng)元過少將不足以表達(dá)系統(tǒng)的復(fù)雜非線性關(guān)系,神經(jīng)元過多則會導(dǎo)致過擬合造成網(wǎng)絡(luò)泛化能力下降。從網(wǎng)絡(luò)精度和泛化能力綜合考慮,將隱藏層神經(jīng)元的數(shù)量從5~14進(jìn)行調(diào)整,觀察BP-ANN的預(yù)測結(jié)果精度變化,從中選擇最佳精度。預(yù)測結(jié)果的誤差隨神經(jīng)元數(shù)量的變化如圖3所示。
通過圖3可以看出,當(dāng)隱藏層的神經(jīng)元為9個時,BP-ANN的預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)的相對誤差僅為2.83%,所以接下來將用神經(jīng)元數(shù)量為2-9-1的神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)進(jìn)行訓(xùn)練,該神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)為1 000次,學(xué)習(xí)效率為0.01。
用訓(xùn)練好的BP-ANN對1 300 ℃時SiC的氧化行為進(jìn)行預(yù)測,其預(yù)測值與實驗數(shù)據(jù)比較如圖4所示??梢园l(fā)現(xiàn),預(yù)測結(jié)果與實驗結(jié)果的誤差為2.83%,說明了該模型的可靠性。廣泛用于描述SiC氧化行為的動力學(xué)模型雖參數(shù)意義明確,但其公式較為復(fù)雜且前期需要進(jìn)行大量的數(shù)據(jù)處理工作。相比之下BP-ANN的模型更為簡單,僅需要將獲得的熱重曲線輸入到模型中,運行該模型,即可預(yù)測某一溫度下的SiC氧化行為,這證明了BP-ANN在預(yù)測非氧化物材料方面具有良好的應(yīng)用前景。
圖3 隱藏層含有5~14個神經(jīng)元時的預(yù)測數(shù)據(jù)與 實驗數(shù)據(jù)的相對誤差Fig.3 Relative errors of predicted data and experimental data when the hidden layer contains 5~14 neurons
圖4 SiC質(zhì)量增益分?jǐn)?shù)隨時間變化曲線Fig.4 Curve of SiC mass gain percentage with time
圖5 隱藏層含有3~12個神經(jīng)元時的預(yù)測數(shù)據(jù)與 實驗數(shù)據(jù)的相對誤差Fig.5 Relative errors of predicted data and experimental data when the hidden layer contains 3~12 neurons
BP-ANN除了能夠預(yù)測不同溫度的SiC氧化行為,還可以對某一特定溫度下長時間的氧化行為進(jìn)行預(yù)測。本文將SiC在空氣中1 400 ℃條件下1~8 h的氧化數(shù)據(jù)作為訓(xùn)練集,8~10 h作為預(yù)測樣本集。預(yù)測結(jié)果的相對誤差隨神經(jīng)元的變化如圖5所示。
通過圖5可以看出,當(dāng)隱藏層的神經(jīng)元為5個時,BP-ANN的預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)的相對誤差僅為2.87%,所以接下來將用神經(jīng)元數(shù)量為2-5-1的神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)進(jìn)行訓(xùn)練,該神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)為1 000次,學(xué)習(xí)效率為0.01。用訓(xùn)練好的BP-ANN對1 400 ℃下8~10 h的SiC的氧化行為進(jìn)行預(yù)測,其預(yù)測值與實驗數(shù)據(jù)的比較結(jié)果如圖6所示。計算表明,預(yù)測結(jié)果與實驗結(jié)果相對誤差為2.87%,進(jìn)一步說明了該模型的可靠性,也體現(xiàn)了該模型在預(yù)測SiC等相關(guān)非氧化物材料服役壽命方面的可行性。
圖6 SiC質(zhì)量增益分?jǐn)?shù)隨時間變化曲線Fig.6 Curve of SiC mass gain percentage with time
圖7 隱藏層含有5~11個神經(jīng)元時的預(yù)測數(shù)據(jù)與 實驗數(shù)據(jù)的相對誤差Fig.7 Relative errors of predicted data and experimental data when the hidden layer contains 5~11 neurons
為了能夠進(jìn)一步體現(xiàn)BP-ANN對于復(fù)雜非線性數(shù)據(jù)的擬合優(yōu)勢,將具有水蒸氣體積分?jǐn)?shù)、溫度、時間三個因素的數(shù)據(jù)輸入BP-ANN進(jìn)行訓(xùn)練,驗證其預(yù)測效果。同樣地,首先進(jìn)行神經(jīng)元選擇,測試不同神經(jīng)元個數(shù)對預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)之間相對誤差的影響,結(jié)果如圖7所示。因為當(dāng)神經(jīng)元個數(shù)調(diào)整至12個時,神經(jīng)網(wǎng)絡(luò)已經(jīng)過擬合,故不再進(jìn)行測試。
通過圖7可以看出,當(dāng)隱藏層的神經(jīng)元為8個時,BP-ANN的預(yù)測數(shù)據(jù)與實驗數(shù)據(jù)的相對誤差僅為2.94%,所以接下來將用神經(jīng)元數(shù)量為3-8-1的神經(jīng)網(wǎng)絡(luò)模型對數(shù)據(jù)進(jìn)行訓(xùn)練,該神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)為1 000次,學(xué)習(xí)效率為0.01。用訓(xùn)練好的BP-ANN對SiC在Ar+10%H2O條件下1 300 ℃、Ar+15%H2O條件下1 200 ℃和Ar+20%H2O條件下1 200 ℃的氧化行為進(jìn)行預(yù)測,其預(yù)測值與實驗數(shù)據(jù)比較如圖8所示。計算表明,預(yù)測結(jié)果與實驗結(jié)果的相對誤差為2.94%。由上可見,在三個甚至更多影響因素的情況下,BP-ANN仍具有出色的預(yù)測能力,且其操作簡單,誤差較小,在描述非氧化物材料復(fù)雜的高溫反應(yīng)行為方面具有特定優(yōu)勢。
圖8 不同條件下SiC質(zhì)量增益分?jǐn)?shù)隨時間變化曲線Fig.8 Curves of SiC mass gain percentage with time under different conditions
建立氧化動力學(xué)模型是研究氧化行為、認(rèn)識氧化規(guī)律的重要手段,氧化過程的反應(yīng)活化能、反應(yīng)速率常數(shù)都是氧化動力學(xué)模型中的重要參數(shù)。為進(jìn)一步驗證BP-ANN對氧化行為描述的準(zhǔn)確性,通過對神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果進(jìn)行回歸,可以得到對應(yīng)的反應(yīng)活化能。神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果計算的反應(yīng)活化能和反應(yīng)速率常數(shù)與實驗數(shù)據(jù)擬合回歸得到的數(shù)據(jù)對比分別如表1和表2所示。
表1 實驗數(shù)據(jù)與BP-ANN預(yù)測數(shù)據(jù)計算的反應(yīng)活化能Table 1 Reaction activation energy calculated from experimental data and neural network predicted data
表2 實驗數(shù)據(jù)與BP-ANN預(yù)測數(shù)據(jù)計算的反應(yīng)速率常數(shù)Table 2 Reaction rate constant calculated from experimental data and neural network predicted data
在表1和表2中可以清晰地看到:BP-ANN預(yù)測數(shù)據(jù)計算的反應(yīng)活化能與實驗數(shù)據(jù)計算的反應(yīng)活化能相差不大,相對誤差最大為1.98%;預(yù)測數(shù)據(jù)計算的反應(yīng)速率常數(shù)與實驗數(shù)據(jù)計算的反應(yīng)速率常數(shù)的相對誤差最大僅為3.56%,均在誤差允許的范圍內(nèi)。結(jié)合預(yù)測數(shù)據(jù)的準(zhǔn)確性,表明BP-ANN具有描述整體氧化行為和確定動力學(xué)參數(shù)的能力,在研究非氧化物材料氧化行為方面應(yīng)用前景廣闊。
(1)SiC作為非氧化物材料的典型代表,是耐火材料的重要組成部分,對其氧化行為的研究尤為重要。通過隱藏層神經(jīng)元個數(shù)的精度測試,本文建立了不同神經(jīng)元個數(shù)的BP-ANN,用于預(yù)測不同反應(yīng)環(huán)境下SiC的氧化行為。
(2)通過網(wǎng)絡(luò)訓(xùn)練,BP-ANN預(yù)測SiC的氧化數(shù)據(jù)與實驗數(shù)據(jù)的相對誤差均低于3%,這種方法可以解決之前氧化模型無法兼顧描述準(zhǔn)確性和參數(shù)簡單的問題,而且在處理多元非線性數(shù)據(jù)時具有出色的結(jié)果,僅需將SiC的氧化數(shù)據(jù)輸入模型后訓(xùn)練、預(yù)測即可。
(3)將BP-ANN預(yù)測數(shù)據(jù)回歸計算得到的氧化反應(yīng)活化能和反應(yīng)速率常數(shù)與實驗數(shù)據(jù)回歸計算的相比,相對誤差不超過4%。這表明該BP-ANN不僅可以描述氧化行為,還可以確定氧化動力學(xué)參數(shù),在研究非氧化物材料氧化行為和設(shè)計對應(yīng)耐火材料方面應(yīng)用前景廣闊。