汪潔,張婷暄,張君健,孫懷宇
(沈陽化工大學 化學工程學院,遼寧 沈陽 110142)
化工生產的流程精細復雜[1],具有復雜性以及非線性[2]等特點,在化工生產的過程中會產生大量的數據,這些數據體現了化工過程中各種不同參數的變化以及化工過程的特性。由于化學反應本身具有較大的不穩(wěn)定性,容易受到外界環(huán)境如原料成分、環(huán)境溫度、壓力、催化劑等因素的影響[3],所以如果是完全基于機理來對化工生產過程進行模擬是比較困難的。而利用深度學習算法來對化工數據進行分析和預測,可以優(yōu)化有意義的參數,從而提高化工生產的產品質量。
隨著大數據、人工智能等信息技術的發(fā)展,國內外的制造行業(yè)正以飛快的速度實現與人工智能的融合[4],然而對于化工領域來說,人工智能與之結合的程度還比較低,尚存在較大發(fā)展空間。
干燥通常是指將熱量加于濕物料并使其濕組分蒸發(fā),從而得到一定濕含量固體產品的過程[5]。PVC流化床干燥器是化工生產中重要的一個干燥設備,國內外常用的PVC 干燥裝置有回轉筒式干燥器、氣流干燥器以及流化床干燥器[6]。由于流化床干燥器具有流程簡單、熱效率高、連續(xù)操作動力消耗低等一系列性能優(yōu)勢,使得流化床干燥生產工藝在PVC行業(yè)中得以普遍應用。
流化床干燥過程是一個復雜的過程,流化床內部物料在氣流中呈懸浮狀態(tài),如液體沸騰一樣發(fā)生著強烈的熱質交換[7]。在干燥過程中讀取的是各個測量點的實時數據,而由于物料是流動的,每個測量點的數據變化和最后的產品之間又存在著時間間隔,導致當前流股干燥結束后的含水量難以被實時監(jiān)測。而在實際生產中,為了避免產品的含水量過高,使用過度干燥導致工廠生產的成本增加。這時如果可以提前預測到產品的含水量,就可以在產品干燥結束前發(fā)現是否有不合格的產品,從而對干燥過程的參數進行及時調節(jié),這樣可以節(jié)省許多時間和成本。深度學習是近年來發(fā)展十分迅速的研究領域,并且在人工智能的很多子領域都取得了巨大的成功[8]。本文以實際生產過程中獲得的DCS 運行數據為樣本,基于pytorch 深度學習框架構造長短期記憶網絡LSTM 模型,對化工干燥產品的含水量進行預測。
Pytorch 是Facebook 在2017 年開源的一款深度學習框架[9],它是基于torch 更新后的一種產品,不僅能夠實現強大的GPU 加速,同時還支持動態(tài)神經網絡。盡管Pytorch 的發(fā)布晚于TensorFlow, 但它的使用率在近幾年飛速提升 ,特別是在科研領域得到了大量的應用[10]。
本文是在系統(tǒng)Win11、512G(SSD)的硬盤、INTEL 酷睿I5-11320H 的CPU 和內存16 GB 的PC機上通過python3.8.5 版本和anaconda4.9.2 版本來使用Pytorch 構造LSTM 深度學習模型。Anaconda 指的是一個開源的Python 發(fā)行版本,其包含了Conda、Python 等180 多個科學包及其依賴項[11]。
長短期記憶網絡(LSTM)是循環(huán)神經網絡(RNN)的一種變體,是一種具備時序記憶能力的循環(huán)神經網絡[12],能夠很好地發(fā)現時間序列中所隱含的規(guī)律。LSTM模型將隱藏層的RNN細胞替換為LSTM細胞,能夠有效地克服傳統(tǒng)RNN 在處理大型時間序列數據時可能會出現的梯度爆炸和梯度消失等問題[13]。
LSTM 模型的核心概念在于細胞狀態(tài)以及“門”結構[14]。LSTM 的網絡結構由3 個門控和1 個記憶細胞構成,記憶細胞用于保存歷史信息。3 種門結構分別為遺忘門ft、輸入門it和輸出門ot,這些門結構以特殊的方式進行交互,不斷控制著信息進行更新[15]。LSTM 模型基本結構如圖1 所示。
圖1 LSTM 模型基本結構
圖1 中每一個箭頭都表示著一個向量,意味著從一個節(jié)點的輸出到另一個節(jié)點的輸入,圓圈則表示向量的相加或相乘計算,箭頭分叉表示兩個節(jié)點復制。
2.2.1 輸入門
輸入門主要決定輸入xt能在記憶單元Ct中保留多少成分。首先將前一層隱藏狀態(tài)的信息ht-1和當前輸入的信息xt傳遞到Sigmoid 函數中去,其次將前一層隱藏狀態(tài)的信息ht-1和當前輸入的信息xt傳遞到tanh 函數中去,創(chuàng)造一個新的侯選值向量。輸入門結構如圖2 所示。
圖2 LSTM 輸入門結構
輸入門的公式可以表示為:
式中:σ—Sigmoid 函數;
Wi、Wc—輸入門it和候選向量的權重矩陣,相應的偏置分別為bi和bc;
xt—在t時刻的輸入;
ht-1表示t-1 時刻的隱藏狀態(tài)。
2.2.2 遺忘門
來自前一個隱藏狀態(tài)的信息ht-1和當前輸入的信息xt同時傳遞到 Sigmoid 函數中去,得到的輸出值介于0 和1 之間,0 意味著不保留,1 意味著都保留。遺忘門結構如圖3 所示。
圖3 LSTM 遺忘門結構
遺忘門的公式為:
式中:bf—遺忘門ft的偏置項;
Wf—遺忘門的權重矩陣。
2.2.3 細胞狀態(tài)
主要是用來確定上一層細胞狀態(tài)Ct-1有多少信息保留在細胞狀態(tài)Ct中,以及確定輸入xt中有多少信息保留在Ct中。前一層的細胞狀態(tài)Ct-1與遺忘向量ft逐點相乘。如果Ct-1乘以接近0 的值,就表示在新的細胞狀態(tài)中這些信息將會被丟棄。然后再將得到的值與輸入門的輸出值相加,將神經網絡在t時刻傳入的有效信息更新到細胞狀態(tài)中去。至此,細胞狀態(tài)便完成了更新。
經過輸入門和遺忘門之后,t時刻的細胞狀態(tài)為:
2.2.4 輸出門
輸出門決定控制單元Ct輸出到ot的信息有多少能輸出到隱藏層ht中,用來確定下一個隱藏狀態(tài)的值。先將前一個隱藏狀態(tài)信息ht-1和當前輸入信息xt傳遞到Sigmoid 函數中得到ot,然后將新的細胞狀態(tài)Ct傳遞給tanh 函數。再將tanh 的輸出與Sigmoid 的輸出相乘,便得到了隱藏狀態(tài)最終的輸出值ht。最后將ht作為當前細胞的輸出,把新的細胞狀態(tài)和新的隱藏狀態(tài)傳遞到下一個時間步長中去。輸出門結構如圖4 所示。
圖4 LSTM 輸出門結構
輸出門的公式為:
式中:Wo—輸出門ot的權重矩陣;
bo—輸出門的偏置項。
3.1.1 原始數據
本次實驗的數據為某工廠干燥工藝中干燥器部分DCS 系統(tǒng)所產生的數據,其工藝流程圖如圖5 所示。低壓蒸汽與空氣進入干燥器對物料進行干燥,低壓蒸汽管線設置遠傳溫度表進行溫度監(jiān)測,同時設置壓力指示控制儀表與壓力調節(jié)閥相連,控制進入干燥器的低壓蒸汽流量??諝夤芫€設置流量指示控制儀表與流量調節(jié)閥相連,控制進入干燥器的空氣流速。同時在干燥器上方設置八旋旋風分離器,干燥器進八旋旋風分離器管線設置溫度遠傳儀表,干燥器上方設置壓力指示控制儀表,控制八旋旋風分離器的進風流速。同時在干燥器內設置溫度遠傳儀表,監(jiān)控2UT-2201 一床上部溫度一室、 2UT-2201一床中部溫度一室、 2UT-2201 一床下部溫度一室、2UT-2201 一床二室上部溫度、 2UT-2201 一床二室下部溫度、2UT-2201 二床上部溫度、2UT-2201 二床下部溫度。表1 為各個參數意義表。
圖5 流化床干燥工藝流程簡圖
表1 各個參數意義表
通過對該工藝實驗流程的初步分析,由于在干燥過程中,主要影響干燥效果的參數是溫度,所以選取了2TI2249、2TI2224、2TI2225、2TI2226、2TI2234、2TIC2235、2TI2228、2TIC2229、2TIC2227、2TIC2230這10 個重要測溫點與含水量數據AIA2203 作為原始數據,時序數據樣例見表2。該數據集記錄了11 520 條數據。
表2 干燥數據集
本次實驗,將干燥數據集前70%數據作為訓練集訓練模型,并將干燥數據集剩下的30%數據作為測試集,以此來驗證該模型的預測能力。
3.1.2 數據處理
為了保證LSTM 模型能夠快速收斂并且保持數據一致性,以此來提高模型的預測精度,在輸入時對數據進行了歸一化處理,在輸出時進行去歸一化處理。
式中:x—輸入數據;
xmin—輸入數據的最小值;
xmax—輸入數據的最大值;
x'—歸一化后的輸入數據。
本文基于前i(i=720)行的特征向量對第i+ 1行的含水量數據進行預測。i為時間序列長度, 化工干燥數據的預測流程圖如圖6 所示。
圖6 基于LSTM 的干燥數據預測流程
在LSTM 神經網絡中,隱藏層神經元的個數的選擇至關重要,若神經元數量過少,則會導致欠擬合,若神經元數量過多,則會導致過擬合。
本文通過大量的實驗,最終發(fā)現隱藏層神經元個數為32 比較好。本次實驗采用Adam 優(yōu)化器,它比SGD 優(yōu)化器更加穩(wěn)定,LSTM 層的層數為1 層,學習率為0.001,訓練的輪數為50 輪,損失函數為MSELoss 均方損失函數,模型的搭建在Pytorch 深度學習框架下實現。
為了更好地展現LSTM 模型對含化工干燥數據含水量的預測結果,本文選取均方誤差(MSE)、平均絕對誤差(MAE)和均方根誤差(RMSE)3 項評價指標來衡量預測結果與實際值之間的差距。具體計算方法如表3 所示。
表3 評價指標及計算公式
其中,yi為實際的含水量值,y?i為預測的含水量值,N為測試集的樣本數量。經過表3 中的公式計算可得:MSE=0.000 058 7,MAE=0.005 968 9,RMSE=0.007 663 9。
在本次實驗中,所選擇的測溫點10 s 測量一次數據,實驗采用的數據集共有11 520 條數據。從工廠操作人員處得知,整個工段流程時間不超過2 h,故本次實驗的時間序列長度為720。利用訓練好的LSTM 模型,對測試集數據進行預測,其損失函數圖形如圖7 所示,圖8 為真實值與預測值的對比。
圖7 損失函數圖
圖8 模型的預測值與真實值
由圖8 可以看出,隨著訓練次數的增加,損失函數減小到了較小的范圍內,模型的預測值和干燥數據的真實值走向非常接近,說明了LSTM 模型的訓練效果非常好。
由于化工產品的干燥含水量數據具有非線性、非平穩(wěn)性以及序列間的相關性等特點,導致一些傳統(tǒng)的預測方法所預測的精度都不高,如傳統(tǒng)的人工神經網絡對化工干燥含水量數據預測后的準確率非常低。近年來,LSTM 神經網絡模型已經被許多學者用來預測具有時間序列的數據,如金融領域的股票收盤價,并且得到的預測結果相比其他的方法具有更高的準確率,這說明了LSTM 在處理時序數據方面具有獨特的優(yōu)勢。
本文基于Pytorch 深度學習框架構造LSTM 神經網絡模型,并將其運用于預測化工干燥含水量的問題上,實驗發(fā)現,用該模型來進行預測,得到的預測值和真實值的走向非常逼近,并且MSE、MAE、RMSE 這3 項衡量預測結果與實際值之間差距的評價指標均較小,說明模型的預測精度高,誤差較小,代表模型具有較強的泛化能力,同時也證明了LSTM 神經網絡用于處理化工干燥含水量這類順序數據同樣具有一定的優(yōu)越性。
由此可見,LSTM 神經網絡模型用于對工廠實際生產的產品含水量進行實時預測的效果非常好,在實際生產中,這對工廠加快生產效率、降低人力成本、提高化工產品質量起到了極其重要的作用。未來可以考慮對數據進行降噪處理或對LSTM 模型的結構做出改進,以進一步提高精度。