劉書含,孫文強,2,范天驕,謝國威
(1.東北大學 冶金學院,沈陽 110819;2.東北大學 國家環(huán)境保護生態(tài)工業(yè)重點實驗室,沈陽 110819;3.中鋼集團 鞍山熱能研究院有限公司,遼寧 鞍山 114044)
在鋼鐵企業(yè)中,高爐煤氣、焦爐煤氣和轉爐煤氣作為重要的二次能源,約占總能耗的30%[1].然而,煤氣消耗量受影響因素較多,難以準確預測,不同設備的煤氣消耗量同樣具有差異性,給能源綜合管理帶來弊端.加熱爐作為典型的煤氣消耗用戶,其煤氣消耗量約占軋鋼生產能耗的76% ~80%[2].然而,由于受到前后生產環(huán)節(jié)的制約和煤氣管網(wǎng)壓力的影響,加熱爐生產波動較大,其煤氣消耗量的精準預測一直較為困難,嚴重制約了加熱爐的節(jié)能降耗及煤氣系統(tǒng)智能管控的發(fā)展.因此,建立一種高性能的加熱爐煤氣消耗預測模型對煤氣預測及智能化調度至關重要.
為了預測煤氣消耗量,較為常用的方法是以先驗知識為基礎建立機理模型.郝曉靜等[3]開發(fā)了高爐數(shù)據(jù)預處理軟件,為高爐煤氣消耗量的在線預測提供了有效方法.Sun等[4]考慮了煤氣產生系數(shù)和消耗系數(shù)隨產量非線性變化的情況,建立了鋼鐵企業(yè)副產煤氣的機理預測模型.梁青艷等[5]考慮生產過程中影響加熱爐煤氣流量波動狀況的靜態(tài)及動態(tài)因素,建立了基于生產狀態(tài)的分時段煤氣消耗動態(tài)預測模型.雖然機理模型可以有效地分析影響煤氣消耗量的因素,但加熱爐的煤氣消耗量受多種生產因素的干擾而波動較大,機理模型的預測結果難以滿足實際需求.
隨著計算機技術迅速發(fā)展,人工神經(jīng)網(wǎng)絡法、小波分析法等數(shù)據(jù)模型被應用于煤氣消耗量預測.徐化巖等[6]依據(jù)小波分析方法、BP神經(jīng)網(wǎng)絡法、最小二乘支持向量機的性質建立了基于數(shù)據(jù)驅動的高爐煤氣消耗量的復合預測模型.結果表明,數(shù)據(jù)模型在不同程度上存在滯后性.張琦等[7]采用灰色關聯(lián)度分析了影響高爐煤氣消耗量的因素,建立了高爐煤氣BP神經(jīng)網(wǎng)絡預測模型,對高爐煤氣的消耗量進行有效預測.聶秋平[8]將灰色理論與徑向基函數(shù)神經(jīng)網(wǎng)絡進行組合,建立了基于灰色神經(jīng)網(wǎng)絡的煤氣消耗預測模型.機理研究的不斷深入和數(shù)據(jù)模型的不斷發(fā)展為煤氣消耗量預測提供新的思路.王彥輝[9]將機理模型和數(shù)據(jù)模型結合,提出煤氣消耗量預測的理論構想.這種混合模型在高爐煤氣產生量預測方面取得了較好的應用效果.Sun等[10]利用機理、數(shù)據(jù)和事件混合驅動的模型對高爐煤氣的產生量進行了有效預測.賴茜等[11]對比分析了不同工況下回歸分析法和人工神經(jīng)網(wǎng)絡法應用于高爐煤氣產生量的預測效果.
為了更好地提高加熱爐煤氣消耗量的預測精度,本文對加熱爐的操作事件進行了有效辨識,根據(jù)各事件對應的運行狀態(tài)選擇最佳數(shù)據(jù)模型,同時依托某鋼鐵聯(lián)合企業(yè)加熱爐生產過程的實際數(shù)據(jù),建立融合事件和數(shù)據(jù)的混合預測模型,為鋼廠能源智能管控提供理論和技術支持.
差分自回歸移動平均模型(ARIMA)[12]的模型本質是一個組合模型,由自回歸項(AR)、差分項(Difference)和移動平均項(MA)三部分構成,如式(1)所示:
式中:VAR(p)為煤氣消耗量的自回歸項,p為自回歸項數(shù),該模型描述煤氣消耗量當前值與歷史值之間的關系,用煤氣歷史消耗數(shù)據(jù)對煤氣的未來消耗數(shù)據(jù)進行預測;d為煤氣消耗量的時間序列轉變?yōu)槠椒€(wěn)序列時所做的差分次數(shù),用于提高煤氣消耗數(shù)據(jù)的平穩(wěn)性;VMA(q)為煤氣消耗量的移動平均項,q為移動平均項數(shù),該模型關注的是自回歸模型中煤氣消耗量誤差項的累加.
ARIMA模型精度的關鍵是參數(shù)p,d,q的選定,意義在于將煤氣消耗量數(shù)據(jù)的非平穩(wěn)時間序列轉化為平穩(wěn)時間序列,然后將煤氣消耗量對其自身的滯后值及對隨機誤差項的現(xiàn)值和滯后值進行回歸,其預測方程可以表示為
式中:Vyt為煤氣消耗量的預測值,m3/min;Vμ為常數(shù)項,m3/min;α為煤氣消耗量的自相關系數(shù);Vγt-1為自回歸過程中煤氣消耗量的前i階多元線性函數(shù)值,m3/min;V?t為煤氣消耗量的誤差值,m3/min;β為煤氣消耗量的誤差系數(shù);V?t-1為移動平均過程中煤氣消耗量的前i階多元線性函數(shù)值,m3/min.
人工神經(jīng)網(wǎng)絡模型(ANN)[13-14]是近年來高速發(fā)展的一種深度學習方法,BP-ANN是一種多層的前饋神經(jīng)網(wǎng)絡,也是一種應用廣泛的人工神經(jīng)網(wǎng)絡[15],其結構如圖1所示.ANN主要結構包含輸入層、隱藏層和輸出層,神經(jīng)元只在相鄰層之間實現(xiàn)全連接.該模型的原理是:煤氣消耗信號由輸入層神經(jīng)元正向傳播,經(jīng)過網(wǎng)絡訓練輸出預測值,得到的預測值由輸出層向輸入層反饋,將誤差進行反向傳播,從而逐步調整各個權值.常規(guī)三層ANN權值修正公式如下所示:
圖1 煤氣消耗量ANN拓撲結構圖Fig.1 Topology of artificial neural network for predicting gas consumption
式中:E為網(wǎng)絡預測輸出的煤氣消耗數(shù)據(jù)與實際輸出煤氣消耗數(shù)據(jù)之間的誤差平方和;η為網(wǎng)絡學習速率;αij為t時刻預測煤氣消耗數(shù)據(jù)的輸入層第i個神經(jīng)元與隱含層第j個神經(jīng)元的連接權值;αjk為t時刻預測煤氣消耗數(shù)據(jù)的隱含層第j個神經(jīng)元與輸出層第k個神經(jīng)元的連接閾值;βij(t)為t時刻預測煤氣消耗數(shù)據(jù)的隱含層第i個神經(jīng)元與輸出層第j個神經(jīng)元的連接閾值;βjk(t)為t時刻預測煤氣消耗數(shù)據(jù)的隱含層第j個神經(jīng)元與輸出層第k個神經(jīng)元的連接閾值.
加熱爐的運行狀態(tài)由標志性的操作事件決定,包含加熱爐檢修事件、加熱爐待料事件.由此可將加熱爐分為正常運行、停爐檢修、待料運行三種運行狀態(tài).在預測加熱爐的煤氣消耗量時,首先應采集加熱爐的操作事件,然后根據(jù)不同的操作事件確定加熱爐的運行狀態(tài),選取與之相關的歷史數(shù)據(jù)進行數(shù)據(jù)建模,完成對加熱爐煤氣消耗量的預測.在確定各狀態(tài)對應的預測方法時,本文考慮了目前廣泛使用的ARIMA模型和ANN模型.與單一預測方法相比,混合驅動模型預測效果更好.圖2為混合驅動模型預測方法流程圖.
圖2 加熱爐煤氣消耗量混合預測方法流程圖Fig.2 Flowchart of hybrid method for predicting gas consumption of reheating furnaces
(1)平均絕對誤差.平均絕對誤差(MAE)表示煤氣消耗量的預測值和煤氣消耗量的真實值之間絕對誤差的平均值,反映預測值誤差的實際情況,表達式如下:
式中:VYt為t時刻煤氣消耗量的真實值,m3/min;Vyt為t時刻煤氣消耗量的預測值,m3/min.
(2)平均相對誤差.平均相對誤差(MAPE)表示煤氣消耗量的預測值與真實值相對誤差的絕對值的平均數(shù),它具有下限(0),無上限,表達式如下:
(3)對稱平均絕對誤差.對稱平均絕對誤差(SMAPE)可以有效彌補有關煤氣消耗量平均絕對誤差在觀測值為0時的缺陷,它具有下限(0)和上限(2),表達式如下:
本文采用某鋼鐵聯(lián)合企業(yè)的加熱爐高爐煤氣消耗量數(shù)據(jù),每5 min采樣一次,試驗中的數(shù)據(jù)采用2020年8月2日00:00至8月5日11:15實測的現(xiàn)場數(shù)據(jù).時間序列包括1000 個樣本(5 000 min).ANN 模型中,第1~600個樣本(0~3 000 min)作為訓練集,第601~700個樣本(3 005~3 500 min)作為驗證集,第701~1 000個樣本(3 505~5 000 min)作為測試集.煤氣消耗量的時間序列如圖3所示,表1列出了已知運行狀態(tài)時間段.
表1 加熱爐運行狀態(tài)Table 1 Operational modes of the reheating furnace
圖3 加熱爐高爐煤氣消耗量時間序列圖Fig.3 Time series data of blast furnace gas consumption of the reheating furnace
不同的時間段內ARIMA和ANN模型預測精度是未知的,因此有必要單獨討論加熱爐不同運行狀態(tài)下各模型的預測性能.
某段正常運行時期(4 700~4 840 min)的預測結果如圖4(a)所示.結合表2可知,正常運行期加熱爐高爐煤氣的消耗量相對穩(wěn)定.ARIMA模型的MAE,MAPE和SMAPE分別為1 055.39 m3/min,0.010 2和0.010 2,比ANN模型的MAE(1 712.30 m3/min),MAPE(0.016 6),SMAPE(0.016 7)低.由此可見,在正常運行期,ARIMA模型的性能優(yōu)于ANN模型.
在加熱爐運行過程中,由于自身故障或外部調試等因素,將出現(xiàn)停爐檢修期;或由于生產限制,需保持空燒保溫狀態(tài),將出現(xiàn)待料運行期.前者表現(xiàn)為隨著時間的變化,煤氣的消耗量逐漸降為0;后者表現(xiàn)為煤氣消耗量逐漸降低(煤氣消耗量不為0)而后逐漸上升至正常運行水平.停爐檢修期因事件信號的迅速輸入,可直接判斷出煤氣的消耗量;而在停爐檢修期結束,煤氣消耗量逐漸上升至正常運行水平(恢復期)的過程中,ARIMA模型泛化能力更強.在待料運行期,ANN模型可以更好地適應加熱爐高爐煤氣量的波動情況,滯后性較小.當預測數(shù)據(jù)在3 590~3 640 min時,加熱爐處于停爐檢修期,預測效果如圖4(b)所示.此時ARIMA與ANN預測精度相同,均能夠準確地預測煤氣消耗量.隨后在高爐煤氣消耗量由0增長到120 000 m3/min的過程中,ANN與ARIMA預測都存在不同程度的滯后,但誤差基本控制在2 000 m3/min以內.從表2中可以看出,ARIMA模型在停爐檢修期(含恢復期)的MAE和SMAPE分別為441.23 m3/min和0.238 7,低于ANN模型的MAE(669.96 m3/min)和SMAPE(0.244 7).由此可見,在停爐檢修期(含恢復期),ARIMA模型表現(xiàn)出比ANN模型更好的性能.
表2 各運行狀態(tài)下ARIMA和ANN的預測性能Table 2 Prediction performance of ARIMA and ANN models at each operational mode
圖4 ARIMA和ANN模型在各運行期的預測結果Fig.4 Prediction of ARIMA and ANN models for each operational operation
圖4(c)描述了待料運行期(4 490~4 640 min)的預測結果.由圖可知,與ARIMA模型相比,ANN模型預測的效果更好.在4 500 min時,ARIMA和ANN都出現(xiàn)了滯后現(xiàn)象,ANN的預測結果在4 535 min時便可將平均絕對誤差控制在4 000 m3/min以內,而ARIMA絕對誤差始終高于4 000 m3/min,因此ARIMA的滯后現(xiàn)象較ANN更 為 嚴 重. ARIMA 模 型 的 MAE 為5 016.91 m3/min, 約 為 ANN 模 型(3 722.83 m3/min)的1.5倍;MAPE為0.101 4,接近ANN 模型的2倍(0.069 7);SMAPE為0.100 4,比ANN模型高0.035 2.結果表明,在待料運行期,ANN模型可以較好地適應波動情況,而ARIMA存在的滯后性,預測效果比ANN模型差.
根據(jù)加熱爐不同的操作事件選取不同的子模型建立混合預測模型.對圖4(a)~(c)進行比較分析可知,在正常運行期ARIMA模型預測精度更高,在停爐檢修期ARIMA模型依舊保持良好的性能,在待料運行期ANN模型的泛化能力更強.而混合驅動預測模型集成了加熱爐不同運行狀態(tài)下各模型的優(yōu)勢,對煤氣消耗量進行準確預測,預測結果如圖5所示.結果表明,該混合預測模型在加熱爐不同運行期皆可表現(xiàn)出良好的預測性能.圖6比較了ARIMA,ANN和混合模型的預測誤差.由圖可知,混合預測模型可以有效地提高預測的精度.ARIMA,ANN模型和混合模型的預測性能如表3所示.
圖5 混合模型的預測結果Fig.5 Prediction of the hybrid model
圖6 各模型的預測誤差Fig.6 Prediction errors
表3 各模型的總體預測性能Table 3 Prediction performance of all models for the whole period
從表3中可以看出,混合模型根據(jù)設備不同的操作事件采用不同的預測模型對煤氣消耗量進行預測,因而較不區(qū)分事件的ARIMA和ANN模型更具有針對性.混合模型的MAE和SMAPE值分別為1 542.45 m3/min和0.066 5,模型優(yōu)越性顯著,這種差異得益于對運行事件的精準辨識以及與數(shù)據(jù)模型的高度融合,驗證了事件和數(shù)據(jù)融合驅動下的混合預測模型的準確性及可行性.
(1)本文提出的融合事件和數(shù)據(jù)的加熱爐煤氣消耗量混合預測方法對加熱爐操作事件進行了分類辨識,結合生產大數(shù)據(jù)對加熱爐的高爐煤氣消耗量進行了預測.利用篩選并處理后的1 000組加熱爐高爐煤氣消耗量數(shù)據(jù),證實該方法預測性能好,滯后性小,實現(xiàn)了加熱爐高爐煤氣消耗量的精準預測.
(2)相比于ARIMA模型和ANN模型,混合預測模型的精確度更高.對于加熱爐高爐煤氣消耗量,混合預測方法的MAE為1 542.45 m3/min,小 于ARIMA (2 141.28 m3/min) 和ANN(2 068.27 m3/min)方法的MAE.混合預測方法的MAPE(0.065 4)和SMAPE(0.066 5)也分別低于ARIMA 方 法 的MAPE(0.081 9)和SMAPE(0.088 7),以及ANN方法的MAPE(0.083 5)和SMAPE(0.079 6).