裴莉莉,余 婷,李 偉,戶媛姣,石 麗
(長安大學,陜西 西安 710000)
制絲環(huán)節(jié)是卷煙加工過程中重要的一步[1-3],由于其工藝流程復雜,涉及參數(shù)眾多,使得葉絲填充率常常處于波動中[4]。不穩(wěn)定的葉絲填充率將嚴重影響后期煙絲填充值,而煙絲填充值是卷煙質量評價中的重要指標之一[5],因此該問題會導致品牌卷煙質量穩(wěn)定性下降。成品葉絲填充率在一定程度上能夠決定卷煙的耗絲量,其值的大小和波動直接影響到煙支的質量及其穩(wěn)定性[6-7]。近些年來,國內對煙絲填充值和葉絲填充率都積極地開展了研究[8]。2014年,唐軍等[9]對煙絲填充值和煙支質量及其穩(wěn)定性做了相關性分析,結果表明兩者呈線性相關。2017年,崔升[10]首次探討了HXD工藝參數(shù)對煙絲質量的影響。2018年,張明文等[11]利用離子色譜儀開展了葉絲干燥工序對煙絲成分含量影響的研究;同年,邱承宇等[12]設計正交試驗分析了制絲溫度對葉絲質量的影響。2019年,張雯等[13]利用相似性原理對煙絲結構分布穩(wěn)定性評價;同年,方利梅等[14]提出了一種結合K均值聚類算法和改進遺傳算法的自動煙絲摻配工藝。雖然國內對葉絲的重視程度也在逐漸上升,但從研究量來說還是很少的,并且結合當下高效而準確的人工智能手段的文獻也極為有限。為了進一步提升煙支質量并保持其穩(wěn)定性,利用人工智能中常用的數(shù)據(jù)分析模型,深入挖掘制絲工藝中各個流程參數(shù)對葉絲填充率的影響是極為必要的[15]。
本文主要對卷煙廠生產(chǎn)數(shù)據(jù)進行多源異構數(shù)據(jù)融合與數(shù)據(jù)清洗,之后采用相關性分析和機器學習中MLP神經(jīng)網(wǎng)絡,分析制絲過程中的生產(chǎn)參數(shù)對葉絲填充率的影響,為葉絲生產(chǎn)過程提供了科學、有效的參數(shù)優(yōu)化及重點參數(shù)穩(wěn)定性監(jiān)控的指導。
浙江某卷煙廠提供其制絲階段工藝流程和制絲全過程各工序數(shù)據(jù)參數(shù),以及不同批次工單的生產(chǎn)數(shù)據(jù),共四類數(shù)據(jù)表,分別為生產(chǎn)過程統(tǒng)計數(shù)據(jù)表、葉片過程檢驗數(shù)據(jù)表、葉絲過程檢驗數(shù)據(jù)表以及批次工單對應關系數(shù)據(jù)表,具體原始數(shù)據(jù)表的基本信息如表1所示。
卷煙廠制絲階段的工藝流程圖如圖1所示,本試驗探究的是“自動開包→葉絲裝箱”的全過程。由圖1可以看出,流程分A、B、C 3個生產(chǎn)流水線,雖然數(shù)據(jù)分為3塊,但實際只有2個工段,其中松散一次加料和二次加料為制葉段,烘絲為制絲段。再通過1.1和1.2介紹的方法,構建數(shù)據(jù)表,得到28個生產(chǎn)過程參數(shù),1776組批次數(shù)據(jù)用于分析,其中包括A線294組、B線754組、C線728組。
表1 原始生產(chǎn)數(shù)據(jù)
圖1 制絲階段工藝流程圖
由表1可以看出,每種表的結構以及特征是不同的,因此需要利用多源異構數(shù)據(jù)融合技術對表進行整合,同時為了探究制絲工藝中各個參數(shù)的變化對葉絲填充率穩(wěn)定性的影響。本試驗對全線數(shù)據(jù)進行差分處理,從而得到最終可用于相關性分析的數(shù)據(jù)表。由于四類生產(chǎn)及檢驗數(shù)據(jù)表中都存在著缺失數(shù)據(jù)和異常數(shù)據(jù),因此需要運用數(shù)據(jù)清洗手段將這些異常值找到并采用“人機協(xié)作”的方式對錯誤數(shù)據(jù)進行檢測與消除。
相關性分析是數(shù)據(jù)挖掘的一種重要方法,結合該方法可以給出特征因子之間的相關性,也可以得到特征因子與待測指標之間的相關性,并進行特征選擇。由于制絲階段工藝復雜、需要分析的參數(shù)較多,利用目前較為流行的數(shù)學統(tǒng)計模型較為合理,同時本試驗所采用的數(shù)據(jù)量上萬條,也確實能夠滿足統(tǒng)計分析的要求。因此分別采用Pearson、Spearman相關性指數(shù)對葉絲填充率的影響因子進行分析,最終對相關性進行量化,Pearson、Spearman相關性指數(shù)的計算公式分別為:
(1)
(2)
式中X、Y分別為特征因子數(shù)據(jù)集,cov(X,Y)為X,Y的協(xié)方差,E表示數(shù)據(jù)集的數(shù)學期望;n為X、Y兩變量的等級對字數(shù),即樣本含量;di為同對等級之差(i=1,2,3,…,n)。
對A、B、C線和整體分別進行相關性分析,由圖2可以看出,2種相關性分析方法分析出的結果較為一致,不存在需要單獨討論的參數(shù)值。
為了更好地完成參數(shù)重要性權值的量化,本試驗選取2個指數(shù)的平均值作為整體不分線時的重要性權值,具體的權值量化表如表2所示。同時將影響因子進行排序,由圖3可以看出,制絲過程參數(shù)對葉絲填充值穩(wěn)定性影響的變化。KLD排潮風門開度、SIROX蒸汽薄膜閥開度、KLD總蒸汽壓力、KLD熱風風門開度、冷卻溫度、1區(qū)蒸汽薄膜閥開度、KLD熱風蒸汽薄膜閥開度、冷卻水分、2區(qū)蒸汽薄膜閥開度、SIROX后溫度對葉絲填充值穩(wěn)定性的影響較大,因此在生產(chǎn)過程中應嚴格控制該指標,從而保證葉絲生產(chǎn)的穩(wěn)定性。
圖2 制絲過程參數(shù)對葉絲填充率的相關性分析
表2 制絲過程參數(shù)量化權值
利用MLP神經(jīng)網(wǎng)絡對葉絲填充率進行量化與驗證,利用真實值與預測值的平均絕對誤差及線性相關系數(shù)對結果進行評價,所用神經(jīng)網(wǎng)絡結構如圖4所示。
圖3 制絲過程參數(shù)對葉絲填充率的影響
MLP神經(jīng)網(wǎng)絡最突出的特點是通過誤差的反向傳播來反復修正權值和閾值,使得誤差函數(shù)值達到最小,準確度達到預期標準。式(3)表示了MLP神經(jīng)網(wǎng)絡的誤差函數(shù):
(3)
式(3)中,dj表示輸出節(jié)點預測值,yj表示真實值;n為測量值的總個數(shù)。
圖4 MLP神經(jīng)網(wǎng)絡模型
在反向傳播的過程中,最常用的誤差最小化方法為梯度下降算法,即沿著相對誤差平方和的最快下降方向,對網(wǎng)絡超參數(shù)進行調整。在網(wǎng)絡訓練過程中,通過學習率的設定使得每次反向傳播迭代后總體的誤差逐漸減小,最終達到系統(tǒng)可以接受的范圍,即獲得最優(yōu)權值。以上過程具體實現(xiàn)可由圖5表示。
為了更加準確地得到制絲過程中不同的流程對葉絲填充率的影響,需要在計算模型訓練完成后對有影響的主導因素再次利用模型訓練的方式進行分析。本項目采用敏感性分析的方法,通過影響的權重大小來衡量不同過程參數(shù)對葉絲填充率的影響程度。實現(xiàn)框圖如圖6所示。
具體實現(xiàn)方法為:
(1)使用影響特征變量進行模型訓練,得到最優(yōu)模型M1,記錄準確率為P1;
圖5 MLP算法模型優(yōu)化流程
(2)對M1權重系數(shù)進行分析,舍棄權重系數(shù)最小的3%的值(非主導因素)對應的因素變量;
(3)對第2步中非主導因素去除后的因素重新進行模型訓練,得到最優(yōu)模型M2,記錄其準確率為P2;
(4)判斷若P1>P2,則M1傳入第7步;若P1 (5)對M2重復第二步分析,并繼續(xù)第三步,得到M3和P3順序執(zhí)行第4步,判斷P2與P3的關系; (6)迭代以上步驟,得到精度最高的模型Mi; (7)認為此模型中的權重系數(shù)均為顯著影響因素??烧J為這些因素為主導因素,并分析各自因素影響的大小。 用MLP神經(jīng)網(wǎng)絡模型對填充率進行量化,并對相關性分析結果進行驗證,分線及整體準確率如表3所示。由表3可以看出,整體不分線將數(shù)據(jù)放入模型時的驗證精度明顯高于分線時的精度,可見數(shù)據(jù)量越大,結果越準確。 表3 MLP神經(jīng)網(wǎng)絡模型性能結果 真實值及驗證值的對比如圖7所示,從圖7中可以看出,輸入28個變量時,軟紅長嘴整體分析的R2為0.938,均方根誤差為0.039,平均絕對誤差為0.020。預測結果誤差相對較小,具有較高精度。軟紅長嘴分為A、B、C三個生產(chǎn)流水線分析時,A線的R2為0.895,均方根誤差為0.051,平均絕對誤差為0.026;B線的R2為0.851,均方根誤差為0.062,平均絕對誤差為0.036;C線的R2為0.880,均方根誤差為0.051,平均絕對誤差為0.027。同時由圖8也可以看出真實值與驗證值的變化趨勢一致,說明實驗結果合理準確。 圖8 MLP神經(jīng)網(wǎng)絡模型的預測結果對比 本文基于制絲工藝流程及多源異構的煙廠生產(chǎn)線數(shù)據(jù),首先利用數(shù)據(jù)融合及數(shù)據(jù)清洗技術構建制絲工藝過程參數(shù)數(shù)據(jù)集,之后利用2種不同的相關性分析方法對浙江某卷煙廠軟紅長嘴的制絲流程中各個參數(shù)及葉絲填充率進行了相關性分析,得到制絲過程參數(shù)的相關性指數(shù)及其量化后的重要性權值。最后,利用機器學習中MLP神經(jīng)網(wǎng)絡模型對葉絲填充率的參數(shù)因子的權重進行量化并對結果進行驗證。結果表明,葉絲填充率的真實值與驗證值平均絕對誤差僅為0.020,說明本研究得到的相關性排序及其量化結果是很有意義的,通過改善以上重點影響因子的波動能夠很好地指導制絲過程,提高葉絲填充率的穩(wěn)定性,從而提升品牌煙支質量。3.2 基于MLP神經(jīng)網(wǎng)絡的填充率影響因子量化與驗證結果
4 結論