顧茜,錢繼春
廈門煙草工業(yè)有限責(zé)任公司,信息技術(shù)部,福建省廈門市海滄新陽工業(yè)區(qū)新陽路1號(hào) 361022
葉絲干燥作為制絲過程的一道重要工序,其加工強(qiáng)度直接影響卷煙的感官質(zhì)量[1]。相對(duì)于滾筒干燥,氣流干燥由于加工時(shí)間短,加工穩(wěn)定性要明顯低于滾筒干燥。某卷煙工廠的新型氣流式烘絲機(jī)為CDT-5L,工序的設(shè)備運(yùn)行參數(shù)超過50項(xiàng),生產(chǎn)過程中氣流干燥出口葉絲含水率波動(dòng)大,造成后續(xù)工序的物料含水率不穩(wěn)定,成品煙絲質(zhì)量下降。近年來,針對(duì)氣流干燥階段水分控制的問題已進(jìn)行了較多研究[2-6],其中,許冰洋等通過收縮特性分析準(zhǔn)確表征了葉絲脫水過程中的干燥動(dòng)力學(xué)特性[2];張二強(qiáng)等通過氣固流動(dòng)數(shù)值模擬,提出添加弧形導(dǎo)流板結(jié)構(gòu)使得煙絲顆粒在干燥塔內(nèi)的分布更為均勻[3];周冰等基于貝葉斯網(wǎng)絡(luò)分析方法構(gòu)建了以工藝參數(shù)為節(jié)點(diǎn)、影響關(guān)系為路徑、影響大小為路徑參數(shù)的網(wǎng)絡(luò)模型,通過定量分析工藝參數(shù)間的關(guān)系,對(duì)關(guān)鍵控制參數(shù)進(jìn)行優(yōu)化調(diào)整[5]。上述研究成果有效指導(dǎo)了氣流干燥的生產(chǎn)過程控制,但對(duì)于加工過程細(xì)粒度控制尤其是干燥料頭關(guān)鍵控制的研究較少,實(shí)際生產(chǎn)過程中嚴(yán)重依賴基于人工經(jīng)驗(yàn)的決策。
制絲生產(chǎn)的過程數(shù)據(jù)是典型的時(shí)序數(shù)據(jù),常見的時(shí)間序列預(yù)測(cè)模型包括指數(shù)平滑、移動(dòng)平均自回歸(ARIMA)模型等基于統(tǒng)計(jì)方法的預(yù)測(cè)。近年來,深度學(xué)習(xí)技術(shù)在時(shí)序數(shù)據(jù)上的應(yīng)用研究也不斷深入,循環(huán)神經(jīng)網(wǎng)絡(luò)模型(RNN)已被證明能較好地捕捉事物的時(shí)間規(guī)律,被廣泛應(yīng)用于機(jī)器翻譯、語音識(shí)別等問題中[7-9]。RNN中最常使用的兩種結(jié)構(gòu)是LSTM和Seq2Seq[10-11],關(guān)于RNN在時(shí)序數(shù)據(jù)上的應(yīng)用,國(guó)內(nèi)外學(xué)者進(jìn)行了廣泛的研究[12-18],如張建晉等提出LSTM針對(duì)時(shí)序數(shù)據(jù)擴(kuò)展到網(wǎng)絡(luò)節(jié)點(diǎn)單元實(shí)現(xiàn)短期趨勢(shì)特征和歷史周期特征的統(tǒng)一建模[12],Srivastava等基于Seq2Seq模型對(duì)時(shí)空數(shù)據(jù)進(jìn)行預(yù)測(cè)[13],毛鶯池等提出時(shí)序降噪自動(dòng)編碼器(TSDA)壓縮高維檢測(cè)數(shù)據(jù),表征傳感器測(cè)點(diǎn)時(shí)空特征[14],丁小歐等通過建立時(shí)序相關(guān)圖模型,對(duì)傳感器設(shè)備采集數(shù)據(jù)進(jìn)行異常檢測(cè)[16]。
因此,本文以出口葉絲含水率實(shí)時(shí)趨勢(shì)預(yù)測(cè)為研究對(duì)象,通過將工業(yè)物聯(lián)網(wǎng)的時(shí)間序列數(shù)據(jù)處理技術(shù)引入制絲線葉絲干燥生產(chǎn)控制過程,設(shè)計(jì)實(shí)驗(yàn)對(duì)比三次指數(shù)平滑、LSTM和Seq2Seq算法對(duì)出口葉絲含水率實(shí)時(shí)趨勢(shì)模擬效果,對(duì)生產(chǎn)場(chǎng)景的算法選擇進(jìn)行優(yōu)化,從而輔助葉絲干燥工序的人工決策,以提高氣流干燥生產(chǎn)過程的控制能力,穩(wěn)定葉絲質(zhì)量。
卷煙制絲工藝所產(chǎn)生的實(shí)時(shí)數(shù)據(jù)主要包括三類:設(shè)備狀態(tài)數(shù)據(jù)、生產(chǎn)運(yùn)行數(shù)據(jù)、生產(chǎn)操作數(shù)據(jù),這些數(shù)據(jù)都是時(shí)刻變化的,具有很強(qiáng)的時(shí)間屬性。該卷煙工廠的SCADA系統(tǒng)比較完整地采集了設(shè)備狀態(tài)數(shù)據(jù)、關(guān)鍵生產(chǎn)運(yùn)行數(shù)據(jù)和部分生產(chǎn)操作數(shù)據(jù),以一系列時(shí)間戳連續(xù)的形式存儲(chǔ)在Wonderware的歷史數(shù)據(jù)庫中。
制絲生產(chǎn)數(shù)據(jù)具有明顯的周期性特征,事實(shí)上,很多生產(chǎn)操作都涉及延遲反饋下的序列決策。例如,葉絲干燥料頭的控制操作呈現(xiàn)明顯的時(shí)間變化規(guī)律;生產(chǎn)操作人員需要根據(jù)一段時(shí)間內(nèi)的葉絲含水率變化情況,調(diào)整烘絲機(jī)參數(shù)設(shè)置。
本實(shí)驗(yàn)所使用的數(shù)據(jù)為CDT-5L氣流式烘絲機(jī)葉絲干燥工序2019年1月起連續(xù)6個(gè)月的生產(chǎn)監(jiān)控?cái)?shù)據(jù),數(shù)據(jù)采集時(shí)間間隔為10s,有效數(shù)據(jù)48萬余條。
本實(shí)驗(yàn)所使用的CPU環(huán)境為Intel Core i5-7200U,具有8GB RAM和128 GB SSD,用于研究普通硬件配置下時(shí)序數(shù)據(jù)庫和算法的表現(xiàn)。
本實(shí)驗(yàn)所使用的GPU環(huán)境為云端V100服務(wù)器,顯存為16GB,可以支撐深度神經(jīng)網(wǎng)絡(luò)計(jì)算。
本實(shí)驗(yàn)所使用的軟件平臺(tái)為開源深度學(xué)習(xí)引擎Tensorflow 1.6,開源時(shí)間序列數(shù)據(jù)庫InfluxDB 1.7,Python版本為3.6。Tensorflow在CPU和GPU環(huán)境下都能實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)計(jì)算加速,具有良好的平臺(tái)適應(yīng)性。InfluxDB是當(dāng)前比較流行的時(shí)間序列數(shù)據(jù)庫,廣泛應(yīng)用于DevOps監(jiān)控和IoT傳感器等大規(guī)模的時(shí)序數(shù)據(jù)存儲(chǔ)與實(shí)時(shí)分析場(chǎng)景。
根據(jù)實(shí)時(shí)生產(chǎn)參數(shù)的變化情況,葉絲干燥生產(chǎn)一般分為三個(gè)階段:料頭、料中和料尾。料頭料尾階段,烘絲機(jī)內(nèi)部的葉絲流量遠(yuǎn)小于料中正常生產(chǎn)時(shí)物料流量,產(chǎn)生“干頭干尾”煙絲[19],需要手動(dòng)操作隨時(shí)調(diào)整相應(yīng)的控制參數(shù)。料中階段,葉絲流量比較平穩(wěn),控制參數(shù)變化主要通過烘絲機(jī)內(nèi)部PID自動(dòng)調(diào)節(jié),此階段進(jìn)行精準(zhǔn)的手動(dòng)“微調(diào)”可以有效提升葉絲干燥質(zhì)量。出口葉絲含水率是衡量干燥工序生產(chǎn)質(zhì)量的重要指標(biāo),但是,氣流干燥加工穩(wěn)定性較差,導(dǎo)致出口葉絲含水率指標(biāo)實(shí)時(shí)波動(dòng)較大,由于PID自動(dòng)調(diào)節(jié)的存在,這種波動(dòng)往往呈現(xiàn)比較明顯的周期性,我們基于三次指數(shù)平滑算法實(shí)時(shí)提煉出參數(shù)指標(biāo)的整體變化趨勢(shì)并進(jìn)行預(yù)測(cè),為烘絲機(jī)控制調(diào)整提供參考。
指數(shù)平滑法的基本思想是隨機(jī)事件對(duì)當(dāng)前參數(shù)值預(yù)測(cè)結(jié)果的影響隨時(shí)間間隔增大呈指數(shù)衰減,同時(shí),時(shí)間序列還經(jīng)常呈現(xiàn)出周期性變化的事件[20]。三次指數(shù)平滑算法是指數(shù)平滑的擴(kuò)展,由Holt和Winters提出,明確地增加了對(duì)單變量時(shí)間序列的周期性支持。
三次指數(shù)平滑算法由一個(gè)預(yù)測(cè)方程和三個(gè)平滑方程——關(guān)于水平 、趨勢(shì) 和周期 ,對(duì)應(yīng)三個(gè)平滑參數(shù):水平因子 、趨勢(shì)因子 、周期因子 ,每隔時(shí)間段就開始周期性重復(fù)的行為被稱為“季節(jié)”,季節(jié)性的實(shí)現(xiàn)分為加法方法和乘法方法兩種。
(1)加法方法表示具有線性季節(jié)性的三次指數(shù)平滑算法即季節(jié)變化在整個(gè)系列中大致恒定。它的實(shí)現(xiàn)方程為:
其k是(h-1)/m的整數(shù)部分,確保用于預(yù)測(cè)的季節(jié)性指數(shù)的估計(jì)值來自樣本的最后一點(diǎn)。
(2)乘法方法表示具有指數(shù)季節(jié)性的三次指數(shù)平滑算法即表示季節(jié)變化與系列水平呈比例變化:
相比主要由PID進(jìn)行調(diào)控的料中生產(chǎn),葉絲干燥的料頭生產(chǎn)需要大量的人工操作交互,最基本的操作方式,就是結(jié)合前幾個(gè)時(shí)刻的生產(chǎn)參數(shù)指標(biāo),根據(jù)經(jīng)驗(yàn)推斷出下一時(shí)刻最合適的調(diào)整策略。模仿學(xué)習(xí)(Imitation Learning)是從歷史數(shù)據(jù)中學(xué)習(xí)出策略的一種有效方法[21],在葉絲干燥料頭操作這一場(chǎng)景中,引入記憶機(jī)制的RNN相比傳統(tǒng)神經(jīng)網(wǎng)絡(luò)更接近人的思維習(xí)慣,適合作為模仿學(xué)習(xí)的建模方向。
傳統(tǒng)RNN多采用反向傳播時(shí)間(BPTT)算法,隨時(shí)間增加,網(wǎng)絡(luò)層數(shù)增多,會(huì)產(chǎn)生梯度消失或梯度爆炸的問題[10]。LSTM算法針對(duì)這些缺陷進(jìn)行了改進(jìn),引入三個(gè)控制門:輸入門 ,遺忘門 和輸出門 ,產(chǎn)生讓梯度得以長(zhǎng)時(shí)間可持續(xù)流動(dòng)的路徑。LSTM模型增加了記憶單元 專門進(jìn)行線性的循環(huán)信息傳遞,同時(shí)將非線性的輸出信息傳遞給短期記憶單元 。在每一個(gè)時(shí)刻,遺忘門 控制上一時(shí)刻記憶 的遺忘程度,輸入門 控制當(dāng)前時(shí)刻候選狀態(tài) 有多少信息需要寫入長(zhǎng)期記憶,輸出門 控制當(dāng)前時(shí)刻內(nèi)部狀態(tài) 需要輸出多少信息給 。整個(gè)網(wǎng)絡(luò)可以描述為:
其中 σ為logistic函數(shù),其輸出區(qū)間為(0,1),描述了信息能夠通過的比例,?為向量元素乘,為當(dāng)前時(shí)刻輸入,ht-1為上一時(shí)刻的外部狀態(tài),W為神經(jīng)網(wǎng)絡(luò)的權(quán)重,b為神經(jīng)網(wǎng)絡(luò)的偏置。
圖1 LSTM模型結(jié)構(gòu)Fig.1 LSTM structure
本文采用的模型評(píng)估標(biāo)準(zhǔn)為均方根誤差(RMSE):
圖2 LSTM模型評(píng)估階段計(jì)算圖Fig.2 Evaluation phase dataflow graph based on LSTM model
在出口葉絲含水率預(yù)測(cè)的場(chǎng)景中,影響的結(jié)果并非只是前幾個(gè)時(shí)刻出口葉絲含水率,還有工藝氣溫度、循環(huán)熱風(fēng)溫度、干燥塔出口氣流流量、膨脹單元入口氣流流量等等,本文嘗試用Seq2Seq模型進(jìn)行多變量序列預(yù)估。
Seq2Seq是一個(gè)編碼—解碼(Encoder-Decoder)的網(wǎng)絡(luò),處理的是序列到序列映射的任務(wù) ,Encoder將輸入的序列編碼映射到語義空間,變?yōu)楣潭ㄩL(zhǎng)度的向量表達(dá);Decoder將這個(gè)語義向量解碼,變成可變長(zhǎng)度的目標(biāo)的信號(hào)序列。在引入注意力機(jī)制后,輸出網(wǎng)絡(luò)會(huì)自動(dòng)學(xué)習(xí)與其對(duì)應(yīng)的輸入關(guān)系的權(quán)重[11]。Seq2Seq結(jié)構(gòu)最靈活的地方在于輸入序列和輸出序列的長(zhǎng)度是可變的,可以用于翻譯,聊天機(jī)器人,句法分析,文本摘要等,也適用于序列預(yù)估的場(chǎng)景。
在本文中,我們以 個(gè)時(shí)間點(diǎn)的數(shù)據(jù)作為輸入,之后 個(gè)時(shí)間點(diǎn)的數(shù)據(jù)作為輸出,這個(gè)長(zhǎng)度為 的窗口可以滑動(dòng)構(gòu)建出一批批的樣本。Encoder和Decoder的結(jié)構(gòu)采用RNN的LSTM模型。整個(gè)網(wǎng)絡(luò)可以描述為:
在RNN中,當(dāng)前時(shí)間的隱藏狀態(tài)是由上一時(shí)間的狀態(tài)ht-1和當(dāng)前時(shí)間的輸入xt共同決定的,因此在Encoder階段:
同樣在Decoder階段,隱藏狀態(tài)輸出有:
對(duì)于Decoder的第i個(gè)時(shí)刻,對(duì)應(yīng)的語義向量ci表示為:
其中 是每一個(gè)Encoder的隱藏狀態(tài)對(duì)應(yīng)的權(quán)重:
通過Decoder的隱藏狀態(tài)加上Encoder的隱藏狀態(tài)來計(jì)算分?jǐn)?shù)用于計(jì)算權(quán)重 的 表示為:
將語義向量和Decoder的隱藏狀態(tài)串起來:
最后通過一個(gè)激活函數(shù)計(jì)算輸出的目標(biāo)值yt。
圖3 Seq2Seq計(jì)算圖Fig.3 Seq2Seq dataflow graph
阻礙時(shí)間序列預(yù)測(cè)在制絲實(shí)時(shí)生產(chǎn)應(yīng)用的一個(gè)主要障礙是,當(dāng)前的時(shí)間序列算法通常需要在離線數(shù)據(jù)集上進(jìn)行訓(xùn)練,而在SCADA/HMI中直接應(yīng)用算法耗時(shí)耗力,工控系統(tǒng)升級(jí)昂貴、風(fēng)險(xiǎn)高,在實(shí)時(shí)數(shù)據(jù)監(jiān)控領(lǐng)域,遠(yuǎn)不及快速迭代的互聯(lián)網(wǎng)架構(gòu)。
InfluxDB是一款在互聯(lián)網(wǎng)行業(yè)廣泛使用的開源時(shí)序數(shù)據(jù)庫,是開源實(shí)時(shí)數(shù)據(jù)處理框架TICK(Telegraf,InfluxDB,Kapacitor,Chronograf)的核心,支持對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行存儲(chǔ)、統(tǒng)計(jì)分析和可視化展現(xiàn),前端可視化也可用開源組件Grafana替換Chronograf。TICK或TIGK框架通過Restful API輸入輸出,支持容器化和分布式部署。我們根據(jù)實(shí)際情況對(duì)TICK架構(gòu)進(jìn)行了改進(jìn),跳過Telegraf將葉絲干燥生產(chǎn)實(shí)時(shí)數(shù)據(jù)通過現(xiàn)有數(shù)據(jù)采集手段直接存儲(chǔ)到InfluxDB中,歷史數(shù)據(jù)則從Wonderware中導(dǎo)出,采用離線數(shù)據(jù)導(dǎo)入方案存儲(chǔ)到InfluxDB;提供Chronograf或Grafana兩種可視化方案,然后連接開源深度學(xué)習(xí)框架Tensorflow或Pytorch在線或離線嘗試各種時(shí)間序列預(yù)測(cè)算法,希望可以打造一個(gè)面向云端、擴(kuò)展性強(qiáng)、自主可控的秒級(jí)端到端時(shí)間序列數(shù)據(jù)應(yīng)用框架,為氣流烘絲機(jī)操作提供有效參考。
圖4 基于時(shí)間序列數(shù)據(jù)庫的實(shí)時(shí)數(shù)據(jù)分析系統(tǒng)設(shè)計(jì)Fig.4 Real-time data analysis system design based on TSDB
該實(shí)時(shí)數(shù)據(jù)分析系統(tǒng)有以下優(yōu)勢(shì):
(1)提供了基于Python的標(biāo)準(zhǔn)數(shù)據(jù)傳輸模塊,從Wonderware中導(dǎo)出的離線歷史數(shù)據(jù)通過簡(jiǎn)單的數(shù)據(jù)處理,可以整合牌號(hào)、批次等信息后再快速寫入InfluxDB,便于進(jìn)一步篩選數(shù)據(jù);
(2)基于企業(yè)已有的批次管理系統(tǒng),可將實(shí)時(shí)數(shù)據(jù)寫入InfluxDB,不需要過多改造;
(3)實(shí)現(xiàn)參數(shù)趨勢(shì)實(shí)時(shí)預(yù)測(cè),報(bào)警和數(shù)據(jù)查詢、統(tǒng)計(jì)、可視化配置簡(jiǎn)單,可以快速遷移、推廣到其它場(chǎng)景;
(4)與深度學(xué)習(xí)平臺(tái)打通,實(shí)時(shí)在線完成耗時(shí)最長(zhǎng)、最為繁瑣的數(shù)據(jù)預(yù)處理過程。
將歷史生產(chǎn)數(shù)據(jù)從離線模塊導(dǎo)入InfluxDB中,首先選定某批次前40分鐘的生產(chǎn)數(shù)據(jù),通過InfluxQL將劇烈波動(dòng)的出口葉絲含水率數(shù)據(jù)按分鐘聚合,然后用三次指數(shù)平滑算法擬合并預(yù)測(cè),實(shí)驗(yàn)結(jié)果列在表1中:
表1 某批次氣流烘絲出口葉絲含水率三次指數(shù)平滑算法預(yù)測(cè)Tab. 1 Cubic exponential smoothing algorithm for predicting moisture content of tobacco leaf (batch No. 20190406021) at the outlet of air flow drying machine
圖5 基于三次指數(shù)平滑算法的某批次出口葉絲含水率預(yù)測(cè)Fig.5 Prediction of moisture content of tobacco leaf from a certain batch based on cubic exponential smoothing algorithm
圖5是三次指數(shù)平滑模型預(yù)測(cè)值和實(shí)際值的擬合與預(yù)測(cè)曲線??梢钥闯?,分組聚合后出口葉絲含水率指標(biāo)整體趨勢(shì)比較平穩(wěn),三次指數(shù)平滑算法對(duì)該批次數(shù)據(jù)中段擬合效果較好,前段、后段誤差相對(duì)較大,RMSE為0.0179,總體上比較準(zhǔn)確地反映了出口葉絲含水率的變化趨勢(shì)。數(shù)據(jù)庫提供的InfluxQL實(shí)現(xiàn)了時(shí)間序列數(shù)據(jù)的實(shí)時(shí)聚合和算法調(diào)參,在Grafana或Chronograf上操作簡(jiǎn)單易行,操作人員可以根據(jù)指標(biāo)趨勢(shì)隨時(shí)季節(jié)數(shù),直至得到理想的預(yù)測(cè)趨勢(shì);提供報(bào)警規(guī)則配置界面,顯示在可視化UI的報(bào)警日志界面可通過Restful API傳遞給其它系統(tǒng)。圖6是在Grafana中搭建的制絲生產(chǎn)實(shí)時(shí)數(shù)據(jù)模擬可視化界面,在時(shí)序數(shù)據(jù)庫中集成了制絲生產(chǎn)數(shù)據(jù)和現(xiàn)場(chǎng)環(huán)境溫濕度數(shù)據(jù),可實(shí)現(xiàn)參數(shù)實(shí)時(shí)告警監(jiān)控。
圖6 制絲生產(chǎn)實(shí)時(shí)數(shù)據(jù)看板Fig.6 Real-time data dashboard for tobacco primary processing base on Grafana
工作時(shí)工藝氣溫度是葉絲干燥工序料頭最頻繁調(diào)整的參數(shù),因此可以分析料頭階段工作時(shí)工藝氣溫度隨時(shí)間的變化,通過深度神經(jīng)網(wǎng)絡(luò)進(jìn)行表達(dá)。我們編寫Python程序訪問InfluxDB,獲得2018年6月至2019年4月某牌號(hào)的葉絲干燥工序工作時(shí)工藝氣溫度參數(shù)生產(chǎn)數(shù)據(jù),用Pandas工具庫進(jìn)行處理,將每批次前150 s工作時(shí)工藝氣溫度數(shù)據(jù)送入模型中訓(xùn)練。
從圖7看出擬合效果非常顯著,模型基本學(xué)習(xí)到該牌號(hào)葉絲干燥料頭的工藝氣溫度變化規(guī)律,并且在測(cè)試批次上的泛化效果良好,成功模仿了料頭工藝氣溫度趨勢(shì)。
圖7 基于LSTM的某牌號(hào)工作時(shí)工藝氣溫度料頭預(yù)測(cè)Fig.7 Process gas temperature prediction based on LSTM
圖8 LSTM網(wǎng)絡(luò)的學(xué)習(xí)過程Fig.8 Learing process of LSTM Network
圖8描述的是在普通CPU上,LSTM模型訓(xùn)練耗時(shí)1 min 10 s,整個(gè)端到端的機(jī)器學(xué)習(xí)過程在3 min內(nèi)完成,可以及時(shí)有效為生產(chǎn)操作提供參考。
進(jìn)一步地,我們對(duì)該方法的應(yīng)用進(jìn)行嘗試,根據(jù)現(xiàn)有工藝指標(biāo)綜合評(píng)價(jià),選取四個(gè)主要品牌,篩選出每個(gè)牌號(hào)葉絲干燥的料頭階段處理最好的20個(gè)批次,利用LSTM模型按時(shí)間順序擬合,圖9黑色曲線顯示各品牌后8批表現(xiàn)良好的料頭曲線趨勢(shì),紅色曲線是LSTM模型的擬合效果,藍(lán)色曲線是模型生成的指導(dǎo)各牌號(hào)葉絲干燥料頭工藝氣溫度控制參考趨勢(shì)。在LSTM模型中,距離預(yù)測(cè)時(shí)間點(diǎn)更近的料頭趨勢(shì)影響權(quán)重越高,因而該模型也能比較好地模擬配方微調(diào)等因素對(duì)葉絲干燥生產(chǎn)過程的影響,從而使預(yù)測(cè)的參考料頭趨勢(shì)遵循一定的操作慣性,提高模仿學(xué)習(xí)的準(zhǔn)確性與輔助生產(chǎn)的可操作性。
Seq2Seq Attention模型對(duì)設(shè)備的性能要求較高,要在內(nèi)存足夠的單機(jī)或集群上訓(xùn)練。由于硬件資源限制,本文的Seq2Seq Attention模型只在離線數(shù)據(jù)上完成訓(xùn)練。我們選取CTD入口物料流量、入口葉絲含水率、工作時(shí)干燥塔氣流流量、塔內(nèi)含氧量、工藝氣溫度、排潮氣體流量、出口葉絲含水率、出口葉絲溫度等參數(shù)作為多變量輸入,預(yù)測(cè)出口葉絲含水率變化趨勢(shì)。
如圖10所示,由于本身就帶有滑窗的性質(zhì),生產(chǎn)實(shí)時(shí)數(shù)據(jù)即使不經(jīng)過聚合預(yù)測(cè)曲線也相對(duì)平滑,但該模型存在一些缺陷:
(1)模型收斂緩慢、訓(xùn)練時(shí)間長(zhǎng),對(duì)硬件資源要求比較高
(2)模型預(yù)測(cè)曲線會(huì)逐漸向訓(xùn)練集的平均值靠近,卻對(duì)實(shí)時(shí)的輸入變量變化反應(yīng)遲鈍
圖9 各牌號(hào)葉絲干燥工藝氣溫度料頭參考趨勢(shì)Fig.9 Reference trend of air temperature in tobacco leaf drying process
圖10 基于Seq2Seq的某牌號(hào)出口葉絲含水率預(yù)測(cè)Fig.10 Prediction of moisture content of tobacco leaf at the outlet of air flow drying machine based on Seq2Seq
為進(jìn)一步量化以上三種算法的性能評(píng)估,我們選取2018年6月至2019年4月某牌號(hào)的葉絲干燥工序生產(chǎn)數(shù)據(jù),對(duì)料頭生產(chǎn)階段工藝氣溫度和料中出口葉絲含水率趨勢(shì)進(jìn)行預(yù)測(cè),結(jié)果如下:
葉絲干燥料頭模仿學(xué)習(xí)階段,三次指數(shù)平滑、LSTM、Seq2Seq三種算法性能對(duì)比見表2。從表2可以看出,LSTM模型訓(xùn)練在CPU環(huán)境下收斂速度比GPU環(huán)境下的Seq2Seq算法更快,測(cè)試集上誤差最低,整體性能最好。
對(duì)料中出口葉絲含水率趨勢(shì)進(jìn)行預(yù)測(cè)時(shí),三次指數(shù)平滑算法具有顯著優(yōu)勢(shì),尤其是預(yù)測(cè)時(shí)間僅0.8 s左右,可實(shí)現(xiàn)準(zhǔn)實(shí)時(shí)預(yù)測(cè),見表3。兩次實(shí)驗(yàn)中Seq2Seq模型在測(cè)試集上表現(xiàn)都不如LSTM,原因可能是因?yàn)樵撃P褪褂枚鄬尤B接層對(duì)時(shí)序數(shù)據(jù)進(jìn)行壓縮時(shí),時(shí)序數(shù)據(jù)中相當(dāng)一部分信息在壓縮過程中被丟棄,對(duì)模型效果造成了一定影響。
表2 葉絲干燥料頭階段算法對(duì)比分析結(jié)果Tab. 2 Comparison of algorithm performance in cut tobacco drying start stage
表3 出口葉絲含水率趨勢(shì)預(yù)測(cè)算法對(duì)比分析結(jié)果Tab. 3 Comparison of algorithm performance in prediction of tobacco leaf moisture content
在本文中我們提出了一套在線可行的端到端制絲實(shí)時(shí)數(shù)據(jù)應(yīng)用解決方案,通過集成時(shí)間序列數(shù)據(jù)庫與深度學(xué)習(xí)算法建立生產(chǎn)指標(biāo)實(shí)時(shí)趨勢(shì)預(yù)測(cè)、料頭生產(chǎn)模仿學(xué)習(xí)、多變量參數(shù)趨勢(shì)模型,最優(yōu)模型預(yù)測(cè)誤差都在2%以內(nèi),完成了在最大化利用現(xiàn)有系統(tǒng)前提下的邊緣計(jì)算初步探索。料頭操作輔助和實(shí)時(shí)指數(shù)平滑預(yù)測(cè)應(yīng)用試運(yùn)行階段,烘絲機(jī)出口煙絲含水率的穩(wěn)定性得到了明顯提高,SD均值由原來的0.35下降到到0.271,CPK均值由0.78提高到0.837,提高了產(chǎn)品工藝質(zhì)量的穩(wěn)定性。
本文通過對(duì)葉絲干燥的場(chǎng)景進(jìn)行拆解,將傳統(tǒng)LSTM和Seq2Seq模型針對(duì)生產(chǎn)時(shí)序數(shù)據(jù)進(jìn)行改進(jìn)、將三次指數(shù)平滑算法構(gòu)建在時(shí)序數(shù)據(jù)庫上,充分利用了時(shí)序特征,橫向集成最優(yōu)算法模型,可視化體驗(yàn)和預(yù)測(cè)精度良好,提升了解決方案在葉絲干燥工序整體的應(yīng)用效果,并為大數(shù)據(jù)分析和算法開發(fā)奠定基礎(chǔ)。
研究結(jié)果表明:
(1)三次指數(shù)平滑算法集成在時(shí)序數(shù)據(jù)庫中,可實(shí)現(xiàn)精度良好、準(zhǔn)實(shí)時(shí)的葉絲出口含水率趨勢(shì)預(yù)測(cè),有效輔助生產(chǎn)作業(yè)。
(2)在料頭生產(chǎn)關(guān)鍵參數(shù)模仿學(xué)習(xí)方面,LSTM模型在整體性能上具有顯著優(yōu)勢(shì)。
最后,結(jié)合經(jīng)驗(yàn)與思考,我們認(rèn)為制絲實(shí)時(shí)數(shù)據(jù)應(yīng)用下一階段的重點(diǎn)研究方向主要有以下幾點(diǎn):
(1)打通邊緣計(jì)算“最后一公里”,實(shí)現(xiàn)適配多場(chǎng)景的低延遲數(shù)據(jù)采集、高可靠性分布式存儲(chǔ)與行業(yè)工業(yè)互聯(lián)網(wǎng)平臺(tái)的實(shí)時(shí)對(duì)標(biāo);
(2)結(jié)合數(shù)字孿生或增強(qiáng)視覺技術(shù)的可視化實(shí)時(shí)數(shù)據(jù)應(yīng)用;
(3)挖掘生產(chǎn)監(jiān)控視頻數(shù)據(jù)的價(jià)值,基于計(jì)算機(jī)視覺技術(shù)實(shí)現(xiàn)實(shí)時(shí)缺陷檢測(cè)與報(bào)警。