溫海峰 趙錫睿 崔浩然 劉英浩 陳洋 王洪伍 左柏強(qiáng) 李健 謝劍 郭云龍 劉欣,4
(1 中國(guó)兵器工業(yè)集團(tuán)航空彈藥研究院有限公司,哈爾濱,150036;2 北京理工大學(xué),北京,100081;3 空裝駐哈爾濱地區(qū)第三軍事代表室,哈爾濱,150000;4 北京理工大學(xué)長(zhǎng)三角研究院(嘉興),浙江嘉興,314019)
作為世界上最大的鋼鐵產(chǎn)出國(guó),我國(guó)鋼材質(zhì)量與西方發(fā)達(dá)國(guó)家存在較大的差距,國(guó)內(nèi)鋼鐵產(chǎn)業(yè)面臨著大而不強(qiáng)的問(wèn)題。雖然我國(guó)的鋼鐵產(chǎn)量很大,但產(chǎn)品質(zhì)量和競(jìng)爭(zhēng)力相對(duì)較低。制造業(yè)的轉(zhuǎn)型升級(jí)是解決鋼鐵質(zhì)量問(wèn)題、推動(dòng)制造業(yè)發(fā)展的關(guān)鍵。隨著現(xiàn)代科技的突飛猛進(jìn),為了提升產(chǎn)品性能、保障作戰(zhàn)能力,推動(dòng)我國(guó)航空航天和國(guó)防裝備的發(fā)展,高強(qiáng)高硬材料、智能制造和輕量化設(shè)計(jì)領(lǐng)域的相關(guān)技術(shù)在航空和國(guó)防裝備領(lǐng)域扮演著愈發(fā)重要的角色,新產(chǎn)品也呈現(xiàn)出微型化的發(fā)展趨勢(shì),提高鑄鋼件質(zhì)量和性能已經(jīng)刻不容緩。
衡量金屬的力學(xué)性能時(shí),強(qiáng)度和塑性常被視作兩個(gè)關(guān)鍵指標(biāo),材料失效通常是由強(qiáng)度和塑性缺陷引起的[1]。而熱處理工藝通過(guò)控制金屬材料的溫度變化和保溫時(shí)間,改變金屬材料中的晶體結(jié)構(gòu)、晶粒大小、相含量以及組織分布等特征,以此對(duì)材料的強(qiáng)度、塑性和其他力學(xué)性能產(chǎn)生顯著影響,是制造過(guò)程的重點(diǎn)工序。在我國(guó),熱處理加工量約50Mt/年[2]。而在現(xiàn)代裝備制造業(yè)中,熱處理不僅是改善和控制材料性能,提高產(chǎn)品使用壽命、可靠性和安全性的關(guān)鍵工藝,也是實(shí)現(xiàn)裝備輕量化的重要途徑。
全面質(zhì)量控制是熱處理工藝[3]中的重要環(huán)節(jié),其目的是消除零件熱處理缺陷,提高鑄鋼件質(zhì)量。熱處理質(zhì)量控制涉及設(shè)備及儀表控制、工藝材料及參數(shù)控制和工藝過(guò)程控制等方面,已貫徹實(shí)施熱處理技術(shù)標(biāo)準(zhǔn)[4-5]。一直以來(lái),熱處理過(guò)程中的微觀組織演變與材料性能之間的聯(lián)系復(fù)雜卻關(guān)鍵,現(xiàn)有的經(jīng)驗(yàn)公式和試驗(yàn)方法在應(yīng)對(duì)不同材料和熱處理參數(shù)時(shí)存在局限性,也很難滿足多樣化力學(xué)性能需求。因此,全面理解和準(zhǔn)確把握熱處理過(guò)程中各種物理參數(shù)的變化規(guī)律仍然是具有挑戰(zhàn)性的難題。
隨著現(xiàn)代數(shù)字化技術(shù)的快速發(fā)展,數(shù)值模型[6-7]在各個(gè)領(lǐng)域得到了廣泛的應(yīng)用。仿真技術(shù)通過(guò)虛擬機(jī)理分析實(shí)現(xiàn)了對(duì)組織結(jié)構(gòu)、應(yīng)力分布和熱力學(xué)性質(zhì)之間相互關(guān)系的更加深入的研究,為熱處理領(lǐng)域的工藝設(shè)計(jì)提供了理論支持[8]。相較于物理方法,仿真分析在驗(yàn)證數(shù)學(xué)模型的正確性方面具有優(yōu)勢(shì)。它并不需要物理參數(shù)完全與實(shí)際過(guò)程一一對(duì)應(yīng),而是通過(guò)虛擬方法來(lái)評(píng)估數(shù)學(xué)模型在不同條件下的適用性。但隨著工業(yè)技術(shù)的發(fā)展,產(chǎn)品生產(chǎn)設(shè)備數(shù)量越來(lái)越多,仿真分析的生產(chǎn)設(shè)計(jì)過(guò)程也逐漸趨向于多元化和復(fù)雜化。由于可操作變量多元,數(shù)據(jù)量大,仿真計(jì)算時(shí)間往往很長(zhǎng)、預(yù)測(cè)準(zhǔn)確性差,并且對(duì)變量的調(diào)整一般只能逐步到位。此外,由于高維度調(diào)整過(guò)程的復(fù)雜性,很難用圖形軌跡來(lái)準(zhǔn)確表達(dá)復(fù)雜產(chǎn)品的質(zhì)量特征。
隨著大數(shù)據(jù)時(shí)代的到來(lái),數(shù)據(jù)驅(qū)動(dòng)模型應(yīng)運(yùn)而生,其核心是訓(xùn)練和擬合,利用從互聯(lián)網(wǎng)或其他渠道收集的大量數(shù)據(jù),通過(guò)不斷調(diào)整模型參數(shù),最終使預(yù)測(cè)與真實(shí)數(shù)據(jù)相吻合。在熱處理車間的運(yùn)行過(guò)程中,會(huì)有大量的數(shù)據(jù)產(chǎn)生。這些數(shù)據(jù)包括與熱處理工藝過(guò)程相關(guān)的信息,主要有:工序的時(shí)間(如到達(dá)時(shí)間、加工時(shí)間、冷卻時(shí)間等),加工設(shè)備的情況,條件參數(shù)和各種工藝參數(shù)等。在收集到這些數(shù)據(jù)之后,可以通過(guò)建立數(shù)據(jù)驅(qū)動(dòng)模型實(shí)現(xiàn)對(duì)工藝結(jié)果的快速、精確預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)作為一種數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型,具有強(qiáng)大的自適應(yīng)能力和非線性建模能力,能夠通過(guò)學(xué)習(xí)和訓(xùn)練自動(dòng)提取特征并對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)和分類,在工程領(lǐng)域,反向傳播(BP)神經(jīng)網(wǎng)絡(luò),被廣泛應(yīng)用于處理各種場(chǎng)景下的復(fù)雜非線性問(wèn)題。但由于神經(jīng)網(wǎng)絡(luò)為黑盒模型,在可解釋性上較差,為彌補(bǔ)這個(gè)缺陷,可以結(jié)合傳統(tǒng)的熱處理仿真技術(shù)與神經(jīng)網(wǎng)絡(luò),基于工藝經(jīng)驗(yàn)知識(shí)對(duì)熱處理工藝仿真進(jìn)行準(zhǔn)確預(yù)測(cè)。
部件熱處理生產(chǎn)過(guò)程中,因?yàn)椴煌蔚脑牧习凑胀瑯拥墓に噮?shù)熱處理后性能指標(biāo)差異較大,需要在工藝范圍內(nèi)調(diào)整工藝參數(shù),使得熱處理后性能指標(biāo)滿足工藝要求。本文的研究目的是解決在熱處理過(guò)程中如何提高熱處理結(jié)果預(yù)測(cè)的準(zhǔn)確性、實(shí)現(xiàn)快速預(yù)測(cè)的問(wèn)題,提供一種面向熱處理產(chǎn)品的預(yù)測(cè)方法,對(duì)熱處理產(chǎn)品的力學(xué)性能等指標(biāo)進(jìn)行準(zhǔn)確、快速的預(yù)測(cè),并基于預(yù)測(cè)結(jié)果,對(duì)工藝參數(shù)進(jìn)行優(yōu)化。
本文提出的熱處理產(chǎn)品預(yù)測(cè)方法首先進(jìn)行材料數(shù)據(jù)構(gòu)建、幾何模型網(wǎng)格劃分、熱交換設(shè)置等操作,以構(gòu)建熱處理有限元仿真模型,將熱處理工藝參數(shù)作為模型輸入,得到熱處理有限元仿真結(jié)果,并通過(guò)更改輸入來(lái)得到多組仿真數(shù)據(jù);然后采用基于數(shù)據(jù)驅(qū)動(dòng)的人工智能模型代理熱處理有限元仿真模型,實(shí)現(xiàn)工藝仿真結(jié)果的準(zhǔn)確、快速預(yù)測(cè),在基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型的基礎(chǔ)上,采用啟發(fā)式算法[9-11]搜索最佳的熱處理工藝參數(shù)。
結(jié)構(gòu)件的熱處理過(guò)程包括預(yù)熱、加熱、保溫等流程,考慮到設(shè)備老化、人工選擇參數(shù)不準(zhǔn)確、原料中元素含量的微量差別等不確定因素,有可能導(dǎo)致各種不良現(xiàn)象的出現(xiàn),如裂紋、變形、殘余應(yīng)力、組織不合格等,這將直接對(duì)產(chǎn)品性能造成影響。實(shí)際加工過(guò)程中,甚至?xí)霈F(xiàn)不同批次的同一原材料按照同樣的工藝參數(shù)熱處理后性能指標(biāo)差異較大的情況。
目前熱處理加工環(huán)節(jié)的加工參數(shù)主要是由工人根據(jù)工藝卡片和經(jīng)驗(yàn)選擇,人工選擇參數(shù)并進(jìn)行加工,加工效率較低,成品質(zhì)量穩(wěn)定性較差。傳統(tǒng)的熱處理預(yù)測(cè)方法是采用有限元方法對(duì)熱處理結(jié)果進(jìn)行預(yù)測(cè)[12],以便根據(jù)預(yù)測(cè)結(jié)果及時(shí)發(fā)現(xiàn)工藝參數(shù)的不足并進(jìn)行快速調(diào)整。
當(dāng)前主流的熱處理有限元仿真方法是根據(jù)電磁場(chǎng)、溫度場(chǎng)、氣體流場(chǎng)、組織場(chǎng)、應(yīng)力應(yīng)變場(chǎng)間相互影響,應(yīng)用彈塑性力學(xué)和相變動(dòng)力學(xué)對(duì)材料熱處理后的性能與畸變進(jìn)行預(yù)測(cè)。在本文提出的方法中,熱處理工藝參數(shù)將被作為仿真模型的輸入,結(jié)合仿真軟件和材料數(shù)據(jù),對(duì)熱處理淬火扭曲[13]、淬裂、相變、熱處理硬度、殘余應(yīng)力、體積膨脹、金屬微結(jié)構(gòu)和金屬熱處理整個(gè)工藝過(guò)程進(jìn)行模擬分析。用于熱處理仿真的材料數(shù)據(jù)包括:材料的密度、導(dǎo)熱系數(shù)、焓、楊氏模量、泊松比、屈服強(qiáng)度、熱應(yīng)變和硬化曲線,而進(jìn)行熱處理仿真需要輸入的熱處理工藝中涉及的典型參數(shù)有:熱處理時(shí)長(zhǎng)、淬火工藝溫度、淬火處理介質(zhì)、回火工藝溫度、回火時(shí)長(zhǎng)等。通過(guò)對(duì)熱處理的整個(gè)工藝過(guò)程進(jìn)行模擬分析,得到各項(xiàng)仿真分析結(jié)果,發(fā)現(xiàn)金屬在熱處理過(guò)程中可能產(chǎn)生的缺陷,提前發(fā)現(xiàn)工藝設(shè)計(jì)中存在的問(wèn)題,以實(shí)現(xiàn)對(duì)熱處理工藝等環(huán)節(jié)的及時(shí)改進(jìn)。作為仿真模型的輸入,熱處理工藝參數(shù)用進(jìn)行表示,有限元仿真模型定義為,仿真結(jié)果用進(jìn)行表示,采用有限元方法進(jìn)行熱處理仿真過(guò)程可以表示為式(1):
使用有限元方法進(jìn)行熱處理仿真的過(guò)程中,需要構(gòu)建有限元模型,進(jìn)行網(wǎng)格劃分和網(wǎng)格的局部細(xì)化,設(shè)置邊界條件等一系列操作。建模完成以后,對(duì)模型進(jìn)行數(shù)值求解的過(guò)程會(huì)消耗較多的計(jì)算資源。由于有限元方法建模和求解過(guò)程復(fù)雜,當(dāng)有多個(gè)熱處理方案需要進(jìn)行驗(yàn)證時(shí),采用有限元的方法進(jìn)行熱處理仿真,不能較快地給出仿真結(jié)果,影響方案驗(yàn)證的效率。此外,有限元方法的計(jì)算公式多根據(jù)經(jīng)驗(yàn)公式給出,最終的仿真結(jié)果可能與實(shí)際結(jié)果存在一定的差距,結(jié)果的準(zhǔn)確性難以保證。
隨著人工智能技術(shù)的飛速發(fā)展,由數(shù)據(jù)驅(qū)動(dòng)的人工智能算法也被應(yīng)用于熱處理工藝結(jié)果預(yù)測(cè)中。針對(duì)上述有限元熱處理仿真的不足,本文采用數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法替代原有限元方法。用表示基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法,則可以用式(2)表示采用基于數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法對(duì)熱處理結(jié)果的預(yù)測(cè):
構(gòu)建數(shù)據(jù)驅(qū)動(dòng)的機(jī)器學(xué)習(xí)算法,對(duì)熱處理工藝仿真結(jié)果進(jìn)行預(yù)測(cè)時(shí),將采取神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)作為基礎(chǔ),搭建回歸模型。其中,神經(jīng)網(wǎng)絡(luò)的輸入層接收熱處理工藝的各個(gè)參數(shù)作為輸入,熱處理結(jié)果作為模型的標(biāo)簽值,采用式(3)定義的損失函數(shù)結(jié)合反向傳播訓(xùn)練神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)模型對(duì)仿真模型的替代。
構(gòu)建基于數(shù)據(jù)驅(qū)動(dòng)的熱處理結(jié)果預(yù)測(cè)模型時(shí),基于大量的材料—工藝—質(zhì)量關(guān)聯(lián)參數(shù),運(yùn)用支持向量機(jī)回歸、嶺回歸等回歸模型能夠描述原料、工藝與成品質(zhì)量之間的數(shù)學(xué)關(guān)系,并通過(guò)實(shí)驗(yàn)對(duì)模型的準(zhǔn)確性進(jìn)行了驗(yàn)證,預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果基本相符。
設(shè)置熱處理的材料、工藝參數(shù)作為模型的輸入,成品質(zhì)量參數(shù)作為模型輸出,訓(xùn)練熱處理材料—工藝—質(zhì)量回歸模型,并檢驗(yàn)?zāi)P蜏?zhǔn)確性。
將數(shù)據(jù)集按照6:2:2 的比例劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,如圖1 所示。
圖1 數(shù)據(jù)集劃分
采用決策樹回歸模型建立回歸模型進(jìn)行熱處理質(zhì)量預(yù)測(cè)。根據(jù)模型預(yù)測(cè)的精度對(duì)回歸模型進(jìn)行評(píng)價(jià),選取預(yù)測(cè)最為準(zhǔn)確的回歸模型參數(shù)。
決策樹是一個(gè)類似于流程圖的樹狀結(jié)構(gòu),用于描述實(shí)例的分類特征。節(jié)點(diǎn)以及連接節(jié)點(diǎn)的有向邊構(gòu)成了分類決策樹的基本結(jié)構(gòu),樹的最頂層是根結(jié)點(diǎn),此時(shí)所有樣本都在一起,經(jīng)過(guò)該節(jié)點(diǎn)后樣本被劃分到各子節(jié)點(diǎn)中[14]。每個(gè)子節(jié)點(diǎn)再用新的特征來(lái)進(jìn)一步?jīng)Q策,直到最后的葉節(jié)點(diǎn)。葉節(jié)點(diǎn)上只包含單純一類樣本,不需要再進(jìn)行劃分。其中,內(nèi)部結(jié)點(diǎn)表示一個(gè)特征或?qū)傩?,葉節(jié)點(diǎn)表示一個(gè)類,每個(gè)內(nèi)部結(jié)點(diǎn)表示在一個(gè)屬性上的測(cè)試,每個(gè)分支代表一個(gè)屬性輸出,而每一個(gè)樹葉結(jié)點(diǎn)代表類或類分布[15]。
決策樹是一種常用于機(jī)器學(xué)習(xí)領(lǐng)域的預(yù)測(cè)模型[16]。它能建立特征屬性和目標(biāo)值之間的映射關(guān)系。決策樹只產(chǎn)生單一的輸出,如需復(fù)數(shù)個(gè)輸出結(jié)果,可以針對(duì)不同的輸出建立獨(dú)立的決策樹進(jìn)行處理。與其他結(jié)構(gòu)復(fù)雜的機(jī)器學(xué)習(xí)分類算法不同,決策樹分類算法是一種簡(jiǎn)單而高效的算法,它能夠處理幾乎任何能用特征向量和分類標(biāo)簽表示的訓(xùn)練集數(shù)據(jù)?;跊Q策樹的分類預(yù)測(cè)算法,其時(shí)間復(fù)雜度僅以樹結(jié)構(gòu)的層數(shù)為因素,它們之間的關(guān)系是線性的。這通常意味著決策樹模型在處理數(shù)據(jù)時(shí)非常高效,能夠勝任實(shí)時(shí)預(yù)測(cè)場(chǎng)景下的任務(wù)。
決策樹最重要的概念就是不純度函數(shù)的概念。當(dāng)一個(gè)節(jié)點(diǎn)需要分割的時(shí)候,實(shí)際上就是找到一個(gè)合適的特征的一個(gè)合適的取值作為閾值進(jìn)行分割。主要依據(jù)不純度的變化來(lái)找到那個(gè)合適的特征的合適的取值。不純度函數(shù)不是一個(gè)具體的函數(shù),它是滿足一系列約束的函數(shù)的總稱。
根據(jù)輸出實(shí)例的取值范圍不同,決策樹有不同的種類。如果輸出實(shí)例是離散的,那么決策樹是一個(gè)分類樹;如果輸出實(shí)例是連續(xù)的,那么決策樹是一個(gè)回歸樹;如果決策樹是分類樹,那么輸出空間定義為輸出實(shí)例所有取值的集合。這個(gè)集合是有限集合,不失一般性,使用個(gè)取值。
不純度函數(shù)的計(jì)算公式:
1948 年,“信息熵”的概念由克勞德·香農(nóng)提出,提供了一種衡量信息不確定性和信息量的量化方法,同時(shí)闡述了不確定性和信息量之間的直接聯(lián)系。信息熵相當(dāng)于信息量的期望,信息熵是對(duì)事件不確定度的一種度量[17]。信息熵越大,說(shuō)明事物越具有不穩(wěn)定因素,越具有不確定性。信息量的大小可以反映對(duì)于事件不確定性的消除程度,而信息熵的大小可以體現(xiàn)事件的不確定性。熵越大,隨機(jī)變量的不確定性越大。
信息熵三大性質(zhì):?jiǎn)握{(diào),即概率越大的事情攜帶的信息量越小,越穩(wěn)定;非負(fù);可累加,混合事件的信息熵可以轉(zhuǎn)化為單個(gè)事件信息熵的累加。
信息熵的計(jì)算公式:
決策樹是一種監(jiān)督學(xué)習(xí)算法[18]。根據(jù)決策樹的結(jié)構(gòu)決策樹可分為二叉決策樹和多叉樹,例如有的決策樹算法只產(chǎn)生二叉樹(其中,每個(gè)內(nèi)部節(jié)點(diǎn)正好分叉出兩個(gè)分支),而另外一些決策樹算法可能產(chǎn)生非二叉樹。決策樹學(xué)習(xí)的目標(biāo)是在損失函數(shù)的意義下,選擇最優(yōu)決策樹的問(wèn)題。
決策樹是一種基于歸納學(xué)習(xí)所發(fā)展的分類模型,在解決分類問(wèn)題時(shí),模型通過(guò)利用特征向量對(duì)實(shí)例加以判斷以實(shí)現(xiàn)分類效果,其本質(zhì)上是基于if-then 規(guī)則集合的分層判斷過(guò)程,也可以被視作描述實(shí)例特征與類別之間關(guān)系的條件概率分布[19]。決策樹的原理是歸納推理,歸納即是從特殊到一般的過(guò)程,歸納推理則是從若干個(gè)事實(shí)表現(xiàn)出的特征、特性或?qū)傩灾?,通過(guò)比較、總結(jié)、概括而得出一個(gè)規(guī)律性的結(jié)論。歸納推理的基本假定,即任一假設(shè)如果能在足夠大的訓(xùn)練樣本集中很好地逼近目標(biāo)函數(shù),則其也能在未見樣本中很好地逼近目標(biāo)函數(shù)。
在決策樹模型構(gòu)建完成后,應(yīng)用該決策模型對(duì)一個(gè)給定的類標(biāo)號(hào)未知的元組進(jìn)行分類是通過(guò)測(cè)試該元組的屬性值,得到一條由根節(jié)點(diǎn)到葉子節(jié)點(diǎn)的路徑,而葉子節(jié)點(diǎn)就存放著該元組的類預(yù)測(cè)。這樣就完成了一個(gè)未知類標(biāo)號(hào)元組數(shù)據(jù)的分類,同時(shí)決策樹也可以表示成分類規(guī)則。
通常情況下,決策樹的學(xué)習(xí)算法可以描述為這樣一個(gè)過(guò)程:采用遞歸方法,不斷選擇最優(yōu)特征,基于最優(yōu)特征分割樣本集,同時(shí)保證每個(gè)子集盡可能純凈[20]。在這一過(guò)程中,構(gòu)建決策樹和劃分特征空間是同時(shí)進(jìn)行的。決策樹的構(gòu)建過(guò)程包括構(gòu)造和剪枝兩個(gè)關(guān)鍵階段,構(gòu)建過(guò)程中體現(xiàn)了遞歸分治、自上而下的特點(diǎn),而選擇最優(yōu)分支特征屬性和劃分訓(xùn)練數(shù)據(jù)是基于決策表創(chuàng)建決策樹的重要步驟之一。
決策樹的構(gòu)造:
1)首先:創(chuàng)建一個(gè)起始節(jié)點(diǎn)(根節(jié)點(diǎn)),在根節(jié)點(diǎn)處放置所有樣本數(shù)據(jù),將當(dāng)前節(jié)點(diǎn)的分裂屬性設(shè)置為最優(yōu)特征,基于這個(gè)屬性將樣本數(shù)據(jù)分為子集,同時(shí)需使各個(gè)子集內(nèi)樣本數(shù)據(jù)盡可能純凈,得到最好分類效果,為了得到該決定性特征,必須評(píng)估每個(gè)特征[21];
2)如果所有子集已經(jīng)達(dá)到基本正確分類的要求,則創(chuàng)建葉節(jié)點(diǎn),在每個(gè)葉節(jié)點(diǎn)置入對(duì)應(yīng)的子集;
3)如果還有子集不能滿足正確分類的要求,則基于當(dāng)下子集重新選擇最優(yōu)的特征,實(shí)施分割過(guò)程,并創(chuàng)建相應(yīng)的節(jié)點(diǎn),重復(fù)執(zhí)行,當(dāng)所有樣本數(shù)據(jù)子集都被基本正確地分類,或者不再有合適的特征,停止構(gòu)造。這種情況下,所有子集都已經(jīng)被分到對(duì)應(yīng)的葉節(jié)點(diǎn)上,有了明確的類,從而完成了決策樹的構(gòu)建[22]。
要使決策樹停止分裂可以采用剪枝的方法,剪枝分為兩種,分別為預(yù)先剪枝和后剪枝。在預(yù)先剪枝的算法中,選取適合的測(cè)度值是關(guān)鍵。預(yù)先剪枝發(fā)生在決策樹構(gòu)造過(guò)程中,節(jié)點(diǎn)分裂之前,可以避免計(jì)算冗余,縮短訓(xùn)練周期,同時(shí)能直接生成最終分類結(jié)果。后剪枝發(fā)生在已經(jīng)構(gòu)建完成的決策樹上,基于相應(yīng)的測(cè)度值將分支替換為葉節(jié)點(diǎn)。后剪枝算法會(huì)增加整體算法的計(jì)算時(shí)間,但分類效果會(huì)略微準(zhǔn)確。在大樣本問(wèn)題中,后剪枝算法的時(shí)間代價(jià)往往遠(yuǎn)遠(yuǎn)大于預(yù)先剪枝算法,但對(duì)于小樣本問(wèn)題,后剪枝相較于預(yù)先剪枝更具有優(yōu)勢(shì)。
熱處理材料—工藝—質(zhì)量回歸模型采用基于信息熵的決策樹分類學(xué)習(xí)算法(ID3)。該算法消除了選擇屬性過(guò)程中的隨機(jī)成分,以信息熵的下降速率衡量屬性選擇的效果。ID3 算法是一種經(jīng)典的決策樹分類學(xué)習(xí)算法,它基于信息熵進(jìn)行屬性選擇,通過(guò)計(jì)算每個(gè)屬性的信息增益來(lái)衡量其對(duì)分類的貢獻(xiàn)程度。在概率模型的選擇上,ID3 使用了極大似然估計(jì),其核心思路是:采用信息增益作為決策特征(非葉子結(jié)點(diǎn))的度量,基于該特征的不同值構(gòu)建分支,得到子集后對(duì)其遞歸實(shí)施此方法,直到每個(gè)子集中只存在同一類別為止。最終,將訓(xùn)練好的決策樹用于對(duì)樣本外數(shù)據(jù)進(jìn)行分類處理[23]。ID3 的優(yōu)點(diǎn)在于:簡(jiǎn)單易行、計(jì)算復(fù)雜度小、理論明確、具備較強(qiáng)的學(xué)習(xí)能力、在處理大規(guī)模分類問(wèn)題時(shí)表現(xiàn)好。缺點(diǎn)在于:會(huì)趨于選擇取值空間大的屬性,但實(shí)際問(wèn)題中這樣的屬性對(duì)分類來(lái)說(shuō)價(jià)值較小,只能處理離散屬性且容易受到噪聲數(shù)據(jù)干擾,對(duì)于所有屬性的信息增益都需計(jì)算,計(jì)算代價(jià)大。
實(shí)現(xiàn)步驟:
1)開始時(shí),構(gòu)建根節(jié)點(diǎn),在根節(jié)點(diǎn)處對(duì)每一個(gè)可能特征的信息增益進(jìn)行計(jì)算,基于計(jì)算結(jié)果,從中選擇節(jié)點(diǎn)的特征,確保其信息增益最大;
2)根據(jù)上一步選擇特征的不同值構(gòu)造子節(jié)點(diǎn),遞歸調(diào)用上一步方法對(duì)子節(jié)點(diǎn)進(jìn)行操作,當(dāng)每個(gè)特征的信息增益都小于設(shè)定的可接受值,或沒(méi)有合適的特征時(shí),結(jié)束構(gòu)造;
3)獲得前述步驟所構(gòu)造的決策樹。
具體步驟[23]:
本文中采用35CrMnSi 和58SiMn 作為實(shí)驗(yàn)材料,收集了兩類合金在2021 年1 -12 月的熱處理數(shù)據(jù),各有221條。對(duì)采集到的數(shù)據(jù)進(jìn)行清洗以后,以合金元素的各成分含量(如碳含量、硅含量等)和熱處理加工的工藝參數(shù)(例如淬火裝爐溫度和淬火加熱溫度)作為模型的輸入變量,以材料的力學(xué)性能如抗拉強(qiáng)度、硬度等作為模型的輸出變量。使用決策樹回歸算法,將均方誤差(MSE),平均絕對(duì)誤差(MAE)和均方根誤差(RMSE)作為評(píng)價(jià)指標(biāo),驗(yàn)證2 中所提到的模型對(duì)于不同輸出變量的準(zhǔn)確度。
仿真數(shù)據(jù)分為兩類,分別對(duì)應(yīng)兩種材料(35CrMnSi和58SiMn),在表1 中給出了仿真數(shù)據(jù)的相關(guān)信息,包括初始數(shù)據(jù)集規(guī)模、采集時(shí)間范圍、清洗后的數(shù)據(jù)集規(guī)模以及輸入輸出變量。
通過(guò)與實(shí)際熱處理的數(shù)據(jù)對(duì)比后,建立如表2 和表3的預(yù)測(cè)數(shù)據(jù)結(jié)果。首先對(duì)于35CrMnsi 而言,表2 的結(jié)果顯示,決策樹回歸模型對(duì)洛氏硬度y2 屬性的預(yù)測(cè)值精度最高,其RMSE 為1.09,對(duì)抗拉強(qiáng)度y1 的預(yù)測(cè)值最差。
表2 35CrMnSi 在決策樹回歸模型中的結(jié)果
表3 58SiMn 在決策樹回歸模型中的結(jié)果
對(duì)于58SiMn 而言,表3 的結(jié)果顯示,決策樹回歸模型對(duì)布氏硬度y3 屬性的預(yù)測(cè)值精度最高,其RMSE 為0.62,對(duì)屈服強(qiáng)度y1 的預(yù)測(cè)值最差;此外,對(duì)于斷面收縮率的預(yù)測(cè)精度也較高,其RMSE 為1.00。
通過(guò)上述結(jié)果可以發(fā)現(xiàn),基于決策樹回歸模型的熱處理材料—工藝—質(zhì)量仿真預(yù)測(cè)建模對(duì)于兩種材料的適用性有所差異,比如對(duì)于35CrMnSi 在預(yù)測(cè)洛氏硬度時(shí)具有較高的準(zhǔn)確度,而對(duì)于58SiMn 則更推薦將該方法用于布氏硬度、斷面收縮率的預(yù)測(cè)中。
為了提高熱處理后材料的性能和質(zhì)量,本文提出了一種基于數(shù)據(jù)驅(qū)動(dòng)的工藝仿真預(yù)測(cè)方法,并使用仿真軟件與實(shí)際實(shí)驗(yàn)得到的數(shù)據(jù)進(jìn)行對(duì)比分析,驗(yàn)證了方法的有效性。主要研究?jī)?nèi)容如下:
1)首先介紹了熱處理及質(zhì)量控制必要性,將傳統(tǒng)的熱處理仿真與數(shù)據(jù)驅(qū)動(dòng)模型進(jìn)行對(duì)比,說(shuō)明了傳統(tǒng)仿真技術(shù)的局限性以及數(shù)據(jù)驅(qū)動(dòng)算法在處理具有非線性關(guān)系和強(qiáng)耦合性數(shù)據(jù)的優(yōu)點(diǎn);
2)基于決策樹回歸算法對(duì)熱處理工藝的仿真模型進(jìn)行搭建,構(gòu)建回歸模型進(jìn)行熱處理質(zhì)量預(yù)測(cè),并通過(guò)與實(shí)際數(shù)據(jù)的對(duì)比實(shí)驗(yàn)選出預(yù)測(cè)最為準(zhǔn)確的質(zhì)量參數(shù)?;谒x出的模型和參數(shù)可以優(yōu)選出最適合兩種材料熱處理工藝仿真預(yù)測(cè)的模型。
在未來(lái)的工作中,可以考慮更多的回歸模型以通過(guò)對(duì)比找到每個(gè)質(zhì)量參數(shù)適合的模型,并和啟發(fā)式算法相結(jié)合,實(shí)現(xiàn)數(shù)據(jù)驅(qū)動(dòng)模型在各種環(huán)境條件下面向不同鑄鋼件材料開展性能預(yù)測(cè)的泛化能力,進(jìn)而在實(shí)際應(yīng)用中更加廣泛使用。隨著數(shù)據(jù)科學(xué)的不斷發(fā)展,可通過(guò)加入新的回歸模型,提高本文提出模型方法的預(yù)測(cè)與優(yōu)化精度。