張仁琳
(福建三鋼(集團(tuán))有限責(zé)任公司中板廠,福建 三明 365000)
中厚板是典型的以熱軋或控軋狀態(tài)交付最終用戶使用的鋼材產(chǎn)品,其產(chǎn)品性能是衡量產(chǎn)品質(zhì)量的主要依據(jù)[1],影響中厚板性能的主要因素是化學(xué)成分和生產(chǎn)工藝,研究、開(kāi)發(fā)產(chǎn)品性能預(yù)測(cè)系統(tǒng),了解并掌握中厚板化學(xué)成分和生產(chǎn)工藝對(duì)其性能的影響規(guī)律具有重要意義。
研究開(kāi)發(fā)中厚板產(chǎn)品性能預(yù)測(cè)系統(tǒng),可以利用現(xiàn)有數(shù)據(jù)庫(kù)中的海量數(shù)據(jù),結(jié)合當(dāng)今主流的數(shù)據(jù)挖掘技術(shù),建立基于大數(shù)據(jù)技術(shù)的產(chǎn)品性能預(yù)測(cè)模型,并開(kāi)發(fā)交互軟件,使技術(shù)人員能在仿真環(huán)境下實(shí)現(xiàn)產(chǎn)品性能預(yù)測(cè),甚至是新產(chǎn)品性能的預(yù)測(cè),這樣可以大大提高中厚板工藝控制的準(zhǔn)確性和降低新產(chǎn)品研發(fā)的周期和成本。k 最鄰近(k Nearest Neighbor,簡(jiǎn)稱(chēng)k-NN)算法是數(shù)據(jù)挖掘領(lǐng)域常用的機(jī)器學(xué)習(xí)算法,具有簡(jiǎn)單易用、模型訓(xùn)練時(shí)間快、預(yù)測(cè)效果好、對(duì)異常值不敏感等優(yōu)點(diǎn),是一種非參的、惰性的算法模型[2-3]。目前還未將k-NN 算法應(yīng)用于中厚板性能預(yù)測(cè)上,因此本文利用福建三鋼中厚板數(shù)據(jù)庫(kù)資料,探索k-NN 算法在中厚板性能預(yù)測(cè)領(lǐng)域的應(yīng)用。
中厚板生產(chǎn)線從坯料庫(kù)接收板坯進(jìn)入加熱爐進(jìn)行加熱,加熱到軋鋼所需溫度,出鋼后經(jīng)過(guò)粗軋和精軋軋制,然后進(jìn)行控冷、熱矯,送入冷床進(jìn)行冷卻,再根據(jù)規(guī)格和訂單需求進(jìn)行火切或組合剪(切頭剪、圓盤(pán)剪、定尺剪)處理。具體工藝流程如圖1 所示。
圖1 中厚板生產(chǎn)工藝流程
化學(xué)成分是影響中厚板性能的內(nèi)因。鋼中碳含量的不同,以及合金元素種類(lèi)和多少的不同,都會(huì)使鋼板性能產(chǎn)生不同,特別是Nb、V、Ti、Mn 等合金元素能改善鋼板的塑性和強(qiáng)度。
板坯加熱溫度的上限通常取鐵碳相圖中固相線以下100~150 ℃,另外從細(xì)化晶粒的要求出發(fā),需充分考慮加熱溫度,不可使加熱后的奧氏體晶粒變得粗大及不均。
軋鋼過(guò)程主要通過(guò)控制、調(diào)整生產(chǎn)條件,包括壓縮率、開(kāi)軋溫度、冷卻速度、反紅溫度等,使最終獲得的金相組織是細(xì)小、有均勻鐵素體及片狀彌散度大的珠光體組織,從而保證鋼板可獲得良好的機(jī)械性能。
k-NN 算法又稱(chēng)為k 近鄰算法或者k 最近鄰算法,是數(shù)據(jù)挖掘領(lǐng)域中基于實(shí)例學(xué)習(xí)的非參數(shù)回歸預(yù)測(cè)法,通過(guò)搜索訓(xùn)練集數(shù)據(jù)庫(kù)中與預(yù)測(cè)值特征向量最相似的k 個(gè)樣本來(lái)進(jìn)行分類(lèi)和預(yù)測(cè)[4]。如果某一個(gè)樣本與該訓(xùn)練集空間中k 個(gè)最相似(即訓(xùn)練集空間中最近鄰)的樣本中的絕大多數(shù)都屬于某一個(gè)類(lèi)別,則該樣本也屬于這個(gè)類(lèi)別。k-NN 算法采用距離度量的方式判斷歷史數(shù)據(jù)與預(yù)測(cè)值特征向量的近似程度。
k-NN 方法中有三個(gè)最基本的要素,即k 值的選取、距離的度量以及分類(lèi)決策時(shí)的規(guī)則。本文以曼哈頓距離(Manhattan Distance)作為距離算法,以加權(quán)平均值法作為預(yù)測(cè)值輸出算法。
3.2.1 建立k-NN 模型的訓(xùn)練集
中厚板生產(chǎn)過(guò)程中,鋼板性能(以屈服強(qiáng)度為例)是一個(gè)由多重因素相互影響的復(fù)雜過(guò)程,影響因素很多,包括化學(xué)成分、壓縮率、開(kāi)軋溫度、反紅溫度、冷卻速度等。將已有的數(shù)據(jù)庫(kù)構(gòu)建為訓(xùn)練集S(同時(shí)作為測(cè)試集),S 由i 個(gè)樣本組成,每個(gè)樣本由m 個(gè)特征向量(輸入變量)及輸出變量y 構(gòu)成,其數(shù)學(xué)表達(dá)式為:
3.2.2 建立距離算法
設(shè)yp為預(yù)測(cè)值(輸出變量),xp為預(yù)測(cè)值yp的特征向量,計(jì)算特征向量xp與訓(xùn)練集S 中歷史特征向量xm的曼哈頓距離dm:
3.2.3 預(yù)估鋼板性能
基于上述方法,在訓(xùn)練集內(nèi)尋找出k 個(gè)距離最小的樣本,k 值采用經(jīng)驗(yàn)得出。
最后,將k 個(gè)樣本的屬性值采用加權(quán)平均值法計(jì)算出目標(biāo)鋼板性能的預(yù)測(cè)值yp:
式中:ωi是第i 個(gè)樣本的權(quán)重。
3.2.4 確定k 值
本文擬定k=2、3、4、5、6 五個(gè)值進(jìn)行了模型訓(xùn)練,最終結(jié)果如表1 所示。
表1 模擬訓(xùn)練結(jié)果統(tǒng)計(jì)
訓(xùn)練結(jié)果表明,k=2 時(shí)預(yù)測(cè)誤差最小、精度最高。
模型應(yīng)用包含以下四方面:自動(dòng)預(yù)測(cè),可實(shí)現(xiàn)每塊鋼板在下冷床時(shí)的性能值預(yù)測(cè);投用情況分析及跟蹤,該功能包含投用情況查詢和投用情況分鋼種查詢;手動(dòng)預(yù)測(cè),可以選擇已經(jīng)自動(dòng)預(yù)測(cè)完成的鋼板,修改特征值后(部分工藝參數(shù),如開(kāi)軋溫度)重新計(jì)算,該模塊可以感知各個(gè)特征對(duì)屈服、抗拉、延伸影響的趨勢(shì),為軋制工藝的調(diào)整提供依據(jù);根據(jù)時(shí)間段查詢各個(gè)規(guī)格鋼種的預(yù)測(cè)值統(tǒng)計(jì),統(tǒng)計(jì)項(xiàng)包含“小于2%”“小于5%”“小于6%”“小于9%”“小于5 MPa”“小于10 MPa”“小于20 MPa”“小于30 MPa”的占比,以便對(duì)模型進(jìn)行優(yōu)化,同時(shí)按鋼種生成規(guī)格數(shù)據(jù)分布圖。
k-NN 算法屬于大數(shù)據(jù)挖掘算法,數(shù)據(jù)樣本的規(guī)模越大,其預(yù)測(cè)結(jié)果越科學(xué)、準(zhǔn)確,基于k-NN 算法的中厚板性能預(yù)測(cè)模型考慮了中厚板性能影響的多面性和非線性,以中厚板生產(chǎn)的各項(xiàng)指標(biāo)和成分作為特征向量,以中厚板各項(xiàng)性能指標(biāo)作為輸出向量,是一種多因素的綜合模型[5]。本文利用三鋼中板廠現(xiàn)有數(shù)據(jù)庫(kù),構(gòu)建了k-NN 預(yù)測(cè)模型的訓(xùn)練集和測(cè)試集,得出k=2 時(shí)模型預(yù)測(cè)精度較高。此外,將今后的生產(chǎn)數(shù)據(jù)不斷補(bǔ)充到訓(xùn)練集中,以進(jìn)一步提高模型預(yù)測(cè)精度?;趉-NN 算法的鋼板性能預(yù)測(cè)模型可實(shí)現(xiàn)實(shí)時(shí)預(yù)測(cè),從而指導(dǎo)中厚板生產(chǎn)的工藝調(diào)整。