廖東,鄭兆穎,邢相棟,卞衛(wèi)新,張寶婷
(1.廣西北港新材料有限公司,廣西 北海 536000;2.西安建筑科技大學(xué)冶金工程學(xué)院,陜西 西安 710055;3.陜鋼集團(tuán)漢中鋼鐵有限責(zé)任公司,陜西 漢中 712400)
高爐煉鐵作為現(xiàn)代煉鐵的主要方法,產(chǎn)量占世界生鐵總產(chǎn)量的95%以上。燒結(jié)礦是高爐煉鐵主要原料之一,質(zhì)量對后續(xù)的冶煉工作至關(guān)重要,其還原性能對高爐操作和消耗均有重要影響[1-2]。影響燒結(jié)礦還原性的因素包括粒度、氣孔率、礦物組成及結(jié)構(gòu)、脈石成分等。傳統(tǒng)燒結(jié)礦RI的檢測方法滯后,檢驗(yàn)過程繁瑣復(fù)雜,耗時(shí)較長。因此,快速預(yù)測燒結(jié)礦RI,實(shí)時(shí)提出改善RI的調(diào)控因素,對于獲取高品質(zhì)燒結(jié)礦具有重要的指導(dǎo)作用,已成為目前燒結(jié)礦生產(chǎn)的重點(diǎn)研究方向。
聚類分析用來研究影響因素之間不同程度的相似性,達(dá)到“物以類聚”的效果。變量聚類作為聚類分析中的一種方法,過程簡單,耗時(shí)較短,近年來越來越多地應(yīng)用于工業(yè)生產(chǎn)數(shù)據(jù)分析和性能指標(biāo)預(yù)測等領(lǐng)域[3]。 陳少飛等[1]利用聚類分析處理高爐煉鐵數(shù)據(jù)離群問題,將 “無效離群點(diǎn)”剔除的同時(shí),最大程度保留了 “有效離群點(diǎn)”,保證了高爐煉鐵數(shù)據(jù)的穩(wěn)定性以及處理的準(zhǔn)確性,全面篩選得到能夠反映爐況波動的強(qiáng)相關(guān)變量,完成了對高爐爐況變化的詳細(xì)劃分。魯杰等[4]關(guān)于高爐操作爐型的研究中,對冷卻壁溫度進(jìn)行聚類分析,解決了指標(biāo)重復(fù)性大的問題,準(zhǔn)確合理地表征了高爐操作爐型的狀況及變化原因,為高爐煉鐵大數(shù)據(jù)分析中的聚類算法選擇提供了有利參考。Johanna等[5]根據(jù) k-means聚類分析了粉塵吸入后的數(shù)據(jù),聚類區(qū)分了三種相似程度小的操作條件作為探索性分析,評估了工業(yè)回轉(zhuǎn)窯加注粉塵前后的運(yùn)行情況,為回轉(zhuǎn)窯-電爐工藝注入粉塵提供了理論指導(dǎo)。然而,目前對鐵礦粉燒結(jié)領(lǐng)域的有關(guān)預(yù)測中,更多是集中在燃耗、成品率、轉(zhuǎn)鼓指數(shù)等技術(shù)指標(biāo)方面[6-9],針對冶金還原性能的預(yù)測較少,尚未實(shí)現(xiàn)工業(yè)化應(yīng)用。
因此,基于某鋼廠400 m2燒結(jié)機(jī)產(chǎn)品檢測數(shù)據(jù),調(diào)研分析了60組燒結(jié)礦RI及化學(xué)成分,采用變量聚類得到影響燒結(jié)礦RI的新因子,展開最佳子集回歸,得到最佳子集?;谟^測值的方差膨脹因子(variance inflation factor,VIF)、Durbin-Watson統(tǒng)計(jì)量和Grubbs檢驗(yàn)統(tǒng)計(jì)量,對回歸方程進(jìn)行異常值檢驗(yàn),建立預(yù)測回歸模型,并利用測試集進(jìn)行回歸模型誤差驗(yàn)證,為改善燒結(jié)礦RI提供參考。
現(xiàn)代燒結(jié)主要用于生產(chǎn)高爐所需的具有一定轉(zhuǎn)鼓強(qiáng)度和冶金性能的燒結(jié)礦。燒結(jié)過程示意圖如圖1所示。
圖1 燒結(jié)過程示意圖Fig.1 Sintering Process Diagram
燒結(jié)原料包括鐵礦石、石灰石、白云石、生石灰、焦粉和其他少量添加物,各組分經(jīng)過輸送系統(tǒng)到混合機(jī)充分混合,以獲得化學(xué)成分均勻穩(wěn)定的混合料。隨后進(jìn)入燒結(jié)系統(tǒng),包括布料器、點(diǎn)火器、燒結(jié)機(jī)、風(fēng)箱、排氣除塵設(shè)備等,進(jìn)行燒結(jié)焙燒得到燒結(jié)礦。最后燒結(jié)礦經(jīng)破碎、篩分、冷卻得到燒結(jié)產(chǎn)品。
燒結(jié)生產(chǎn)是通過調(diào)整燒結(jié)過程中的原料參數(shù)配比、操作參數(shù)和設(shè)備參數(shù)來優(yōu)化燒結(jié)礦性能。其中,混合料的化學(xué)成分很大程度地影響了燒結(jié)礦還原性。因此,建立合適的燒結(jié)礦還原性預(yù)測模型對于提高燒結(jié)礦質(zhì)量具有重要意義。
調(diào)研60組監(jiān)測燒結(jié)礦RI和化學(xué)成分的訓(xùn)練集,選取 TFe、CaO、SiO2、Al2O3、MgO、S、TiO2、R、FeO、MgO/Al2O3、CaO/TFe和SiO2/Al2O3共12種因子作為變量,進(jìn)行變量聚類分析。利用變量聚類對具有相同特征的聚類變量進(jìn)行分組,通過指標(biāo)降維選擇有代表性的指標(biāo)并生成一些新變量[2]。結(jié)合凝聚層次法,將相似的變量組合在一起,減少要分析的變量數(shù)。
最佳子集回歸是根據(jù)所有預(yù)測變量集生成最高決定系數(shù)R2的子集模型,能夠有效識別最優(yōu)模型,估計(jì)回歸系數(shù),使預(yù)測未知響應(yīng)得到的方差比所有預(yù)測變量的完整模型的方差更?。?0-11]。將變量聚類的結(jié)果作為自變量,RI作為因變量,建立燒結(jié)礦RI的預(yù)測模型。
為了全面反映變量對RI的影響,利用降維的思想,將 TFe、CaO、SiO2、Al2O3、MgO、S、TiO2、R、FeO、MgO/Al2O3、CaO/TFe 和 SiO2/Al2O3共 12 種因 子通過聯(lián)結(jié)法定義聚類之間的距離,利用最長距離法,確保聚類中的所有因子都在最大距離范圍內(nèi),并趨向于生成具有類似直徑的聚類。以歐式距離作為相似性統(tǒng)計(jì)量,采用最長距離法進(jìn)行變量聚類,共進(jìn)行了10步,最終合并了2類。用兩點(diǎn)間的距離定義相似性水平,距離水平越小,表明彼此位置越近,樣本間差異越小,得到的變量聚類分析結(jié)果如表1所示,聚類分析樹狀圖如圖2所示。
表1 變量聚類分析結(jié)果Table 1 Analysis Results of Variable Clustering
圖2 聚類分析樹狀圖Fig.2 Tree Diagram for Clustering Analysis
由表1可以看出,當(dāng)點(diǎn)群數(shù)為2時(shí),相似性水平最低,距離水平最高,分別為29.744 6和1.405 11,此時(shí)新聚類號中觀測值的個(gè)數(shù)為8個(gè)因子。由圖2可以看出, 變量聚類得到 TiO2、FeO、Al2O3、MgO、S、R、CaO/TFe和SiO2共8個(gè)因子,即燒結(jié)礦 RI的新因子。
為了生成最高R2值的子集模型,采用最佳子集回歸,得到回歸模型。根據(jù)3個(gè)標(biāo)準(zhǔn)進(jìn)行模型篩選:①R2達(dá)到最大。②預(yù)測平方和PRESS達(dá)到最小。③Mallows Cp值接近且小于預(yù)測變量個(gè)數(shù)。④距離偏差S達(dá)到最小。計(jì)算模型分別如式(1)~(4)所示。
式中,SS誤差為誤差距離平方和;S S合計(jì)為總誤差平方和;yi為第i個(gè)觀測響應(yīng)值;為第i個(gè)擬合響應(yīng)值;為平均響應(yīng)值;ei為第i個(gè)殘差值;hi為 X(XTX)-1XT(X 為設(shè)計(jì)矩陣,XT為設(shè)計(jì)矩陣的轉(zhuǎn)置)中第i個(gè)對角線元素;SSE為殘差平方和;MSE為平均誤差平方;n為觀測值個(gè)數(shù);p為模型中的項(xiàng)數(shù);為指代在含K個(gè)自變量的線性回歸模型中第i個(gè)y樣本數(shù)據(jù)的擬合值。
以燒結(jié)礦RI為因變量,SiO2、Al2O3、MgO、S、TiO2、R、FeO和CaO/TFe為自變量,建立燒結(jié)礦RI的最佳子集回歸模型,如表2所示。
由表2可以看出,七變量模型{SiO2、MgO、S、TiO2、R、FeO、CaO/TFe}方差較小,表明數(shù)據(jù)值與擬合值的距離小,模型描述響應(yīng)的程度高。七變量模型{SiO2、Al2O3、MgO、S、R、FeO、CaO/TFe}Mallows Cp值為8,正好等于模型項(xiàng)數(shù)加預(yù)測變量個(gè)數(shù),模型相對精確。六變量模型{SiO2、MgO、S、R、FeO、CaO/TFe}R2較高,表明模型擬合數(shù)據(jù)的優(yōu)度高,預(yù)測能力出色。六變量模型{SiO2、MgO、TiO2、R、FeO、CaO/TFe}PRESS最低,為690.1,說明擬合值與觀測值之間偏差的度量小,模型的預(yù)測能力強(qiáng),在估計(jì)真實(shí)回歸系數(shù)和預(yù)測未來響應(yīng)時(shí)較為精確且無偏倚。
采用模型對燒結(jié)礦RI進(jìn)行分析時(shí),會遇到許多偏離大部分評價(jià)數(shù)據(jù)的異常點(diǎn),異常值會使得數(shù)據(jù)分布不均勻,若把它們與正常評價(jià)數(shù)據(jù)一同進(jìn)行數(shù)據(jù)分析和模型訓(xùn)練,將會給模型訓(xùn)練帶來不利影響[12-13]。為了檢測出這些異常點(diǎn),需對模型進(jìn)行VIF、Durbin-Watson 統(tǒng)計(jì)量和 Grubbs檢驗(yàn)[14],計(jì)算公式分別如式(5)~(10)所示。
式中,R2(Xj)表示將 Xj的判定系數(shù)作為響應(yīng)變量,將模型中的其他項(xiàng)作為預(yù)測變量。
式中,d為誤差距離;ei-1為第i個(gè)殘差;ei為上一個(gè)觀測值的殘差;n為觀測值個(gè)數(shù)。
Grubbs檢驗(yàn)統(tǒng)計(jì)量的臨界值P的單側(cè)、雙側(cè)檢驗(yàn)公式如式(9)和(10)所示。
式中,n為樣本中的觀測值個(gè)數(shù);T代表服從自由度為n-2的t分布的隨機(jī)變量。
根據(jù)Grubbs檢驗(yàn)和Grubbs檢驗(yàn)統(tǒng)計(jì)量的P值等診斷統(tǒng)計(jì)量,結(jié)果如表3所示。
表3 異常觀測值的Grubbs檢驗(yàn)Table 3 Grubbs Testing of Abnomal Observation Values
顯著性水平0.05表示在實(shí)際上不存在異常值時(shí)得出存在異常值的風(fēng)險(xiǎn)為5%。由表3可知,Grubbs檢驗(yàn)統(tǒng)計(jì)量的P值為0.044,小于顯著性水平0.05,說明存在異常值。
刪除異常值后, 建立 SiO2、MgO、TiO2、R、FeO和CaO/TFe與燒結(jié)礦RI之間的最優(yōu)預(yù)測回歸模型,如式(11)所示。
由式(11)可以看出,對燒結(jié)礦RI影響權(quán)重排序?yàn)?CaO/TFe、R、TiO2、SiO2、MgO 和 FeO。
對比刪除異常值前后的回歸結(jié)果,分析回歸方程的統(tǒng)計(jì)量,結(jié)果如表4所示。
表4 刪除異常值前后的回歸結(jié)果對比Table 4 Comparison of Regression Results before and after Removing Abnomal Values
由表4可以看出,刪除異常值前,MgO的P=0.054>0.05,TiO2的 P=0.108>0.05,效應(yīng)均不顯著。刪除異常值后,重新建立回歸模型,MgO的P=0.017<0.05,TiO2的 P=0.028<0.05, 均變成顯著性因子。新模型的R2為99.88%,R2(調(diào)整)提高了0.02%,R2(預(yù)測)提高了 0.03%,S 降低了 0.222 6,模型預(yù)測更為精準(zhǔn)。
使用15個(gè)測試集對燒結(jié)礦RI回歸預(yù)測模型進(jìn)行評價(jià),標(biāo)準(zhǔn)有以下3種:均方根誤差RMSE,平均絕對誤差MAE和平均相對百分比誤差MAPE,如式(12)~(14)。
式中,f(xi)為燒結(jié)礦 RDI的預(yù)測值,yi為樣本的實(shí)際值,n為樣本預(yù)測個(gè)數(shù)。
利用三種評價(jià)標(biāo)準(zhǔn)結(jié)合15個(gè)測試集數(shù)據(jù)對燒結(jié)礦RI預(yù)測模型進(jìn)行評判,結(jié)果如表5所示。
表5 預(yù)測模型評判Table 5 Judgment on Predictive Model
由表5可以看出,聚類分析方法在燒結(jié)礦還原性能預(yù)測方面有明顯的優(yōu)勢。模型的均方根誤差的 “邊界值”為0.98,模型的均方根誤差僅為0.975 0,預(yù)測值與實(shí)際值之間的偏差小。模型的平均絕對誤差的“邊界值”為0.85,模型的平均絕對誤差為0.815 2,所有單個(gè)預(yù)測值與算術(shù)平均值的偏差絕對值的平均值小。模型的平均相對百分比誤差的“邊界值”為0.05,模型的平均相對百分比誤差是0.015 3,絕對誤差和預(yù)測值之間的平均值小。模型擬合效果好。
模型的預(yù)測值與真實(shí)值對比如圖3所示。由圖3可以看出,燒結(jié)礦RI回歸模型的預(yù)測值與實(shí)驗(yàn)值吻合良好,預(yù)測值與實(shí)驗(yàn)值數(shù)據(jù)點(diǎn)更貼近理想45°線,預(yù)測結(jié)果較為精準(zhǔn)。
圖3 模型預(yù)測值與真實(shí)值對比Fig.3 Comparison of Values by Model Prediction and True Values
圖4 模型相對誤差Fig.4 Relative Errors of Model
(1)選取12個(gè)影響燒結(jié)礦RI的因子并進(jìn)行變量聚類,選擇相關(guān)性小且具有代表性的SiO2、Al2O3、MgO、S、TiO2、R、FeO 和 CaO/TFe 共 8 個(gè) 因子反映對燒結(jié)礦RI的影響。
(2)最佳子集回歸得到影響燒結(jié)礦RI的最主要因素為 SiO2、MgO、TiO2、R、FeO 和 CaO/TFe 共6個(gè)因子,利用 VIF、Durbin-Watson統(tǒng)計(jì)量和Grubbs檢驗(yàn)異常值,建立預(yù)測回歸模型,即RI=13.61w(SiO2)-6.47w(MgO)-19.2w(TiO2)+37.03w(R)-2.91w(FeO)-190.9[w(CaO)/w(TFe)]。
(3)模型的R2達(dá)到99.88%,模型擬合效果好,相對誤差均在3%以下。模型預(yù)測值與實(shí)驗(yàn)值數(shù)據(jù)點(diǎn)更貼近理想45°線,驗(yàn)證了模型的實(shí)用性,能夠快速有效地預(yù)測燒結(jié)礦RI。