吳 悅
(紅云紅河煙草(集團(tuán))有限責(zé)任公司新疆卷煙廠,烏魯木齊 830026)
煙草原料在同一加工線上的不同批次之間的質(zhì)量表現(xiàn)并不完全相同,這種批次間的差異性主要由原料差異、工藝參數(shù)變化和操作差異等因素造成[1]。盡管不同批次煙絲使用的原料屬于同一配方,但由于原料來源、產(chǎn)地、品種、等級(jí)和貯存時(shí)間等因素的差異,原料本身會(huì)存在一定的非均一性,導(dǎo)致理化性狀和組分特征存在差異。在連續(xù)生產(chǎn)過程中,工藝參數(shù)難以保持絕對(duì)不變,設(shè)備狀態(tài)、環(huán)境溫濕度等變化都可能導(dǎo)致工藝條件存在微小變化。另外,由于操作人員的經(jīng)驗(yàn)和技能差異也會(huì)影響操作的標(biāo)準(zhǔn)性,從而導(dǎo)致加工結(jié)果存在差異[2]。
評(píng)價(jià)不同批次煙絲加工的差異性,對(duì)于保證卷煙產(chǎn)品內(nèi)在品質(zhì)的穩(wěn)定性具有重要意義[3],這種評(píng)價(jià)可以找出影響煙絲和卷煙質(zhì)量的原料、工藝等關(guān)鍵因素[4],據(jù)此優(yōu)化工藝參數(shù)的設(shè)定,縮小批次間差異,提高產(chǎn)品質(zhì)量的一致性[5]。此外,對(duì)煙絲加工批次間差異性的評(píng)價(jià)和控制,也有助于控制質(zhì)量波動(dòng),保證卷煙產(chǎn)品的穩(wěn)定性[6]。在卷煙生產(chǎn)企業(yè),越來越多的技術(shù)人員開始關(guān)注到智能數(shù)據(jù)分析技術(shù)在產(chǎn)品質(zhì)量方面的應(yīng)用[7]。
智能數(shù)據(jù)分析在金融、安全、醫(yī)療、能源和工業(yè)[8]等多個(gè)領(lǐng)域的決策中發(fā)揮著重要作用,在工業(yè)生產(chǎn)制造中,異常檢測是智能數(shù)據(jù)分析的重要組成部分[9],其任務(wù)是揭示給定數(shù)據(jù)集中的異常行為。目前有幾種常用方法,包括統(tǒng)計(jì)模型、聚類、神經(jīng)網(wǎng)絡(luò)、決策樹、基于最近鄰的方法和行為模式匹配等對(duì)異常檢測產(chǎn)生了比較大的作用。但是在應(yīng)用上有一個(gè)很大的挑戰(zhàn),那就是隨著生產(chǎn)制造過程的進(jìn)行,每天都有大量數(shù)據(jù)產(chǎn)生,但可用的標(biāo)注數(shù)據(jù)往往有限,尤其是神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等技術(shù)在小數(shù)據(jù)集上的表現(xiàn)不佳,因此有必要將研究方向轉(zhuǎn)向其他方法以應(yīng)對(duì)不同場景的挑戰(zhàn)。
卷煙生產(chǎn)制造產(chǎn)生的大量數(shù)據(jù)屬時(shí)間序列數(shù)據(jù),大部分時(shí)間序列異常檢測算法都基于時(shí)間序列之間的距離進(jìn)行決策,然而在處理不斷變化的時(shí)間序列時(shí),一般的距離度量方法,如Lp-norm 范數(shù)或歐氏距離(Euclidean Distance,ED),難以實(shí)現(xiàn),主要是因?yàn)閷?shí)際生產(chǎn)中2 個(gè)時(shí)間序列長度并不一致,以及微小的時(shí)間扭曲也會(huì)導(dǎo)致較大的度量懲罰。為解決這個(gè)問題,Lines 等[9]提出的彈性相似度度量(Elastic Similarity Measure,ESM)顯示出能夠解決這類問題的潛力,在時(shí)間序列窗口內(nèi)采用靈活的對(duì)齊模式,從而顯著提高計(jì)算出的相似度的準(zhǔn)確性。
在過去的幾十年中,動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)作為ESM 的代表之一,在語音識(shí)別、簽名驗(yàn)證、手勢識(shí)別、時(shí)間序列分類和相似度測量等領(lǐng)域[10]因?yàn)樵陟`活的點(diǎn)對(duì)點(diǎn)對(duì)齊方面表現(xiàn)出色而得到廣泛應(yīng)用。由于DTW 的二次復(fù)雜度較高,使得其難以用于在線處理,目前計(jì)算優(yōu)化進(jìn)行了廣泛研究并取得了令人鼓舞的進(jìn)展[11],使得目前的邊緣計(jì)算設(shè)備能夠快速且在線取得相應(yīng)結(jié)果。
在卷煙制絲的實(shí)際生產(chǎn)實(shí)踐中,大部分企業(yè)采用以過程能力指數(shù)(Process Capability Index,CPK)和西格瑪水平為代表的統(tǒng)計(jì)過程控制(SPC)對(duì)產(chǎn)品質(zhì)量進(jìn)行評(píng)價(jià)[12],然而,首先這2 個(gè)指標(biāo)的計(jì)算基于正態(tài)分布的假設(shè),但實(shí)際數(shù)據(jù)分布可能并非總是正態(tài)分布,導(dǎo)致它們的準(zhǔn)確性受到影響。其次,統(tǒng)計(jì)量的度量要求生產(chǎn)過程在一定時(shí)間范圍內(nèi)保持穩(wěn)定,但生產(chǎn)過程不可避免會(huì)因各種因素波動(dòng),無法滿足使統(tǒng)計(jì)過程控制有效的正態(tài)性假設(shè)[13]。最后,雖然CPK 指數(shù)關(guān)注過程能力和規(guī)格限的匹配程度,但可能忽略了過程的偏移情況,即使CPK 值較高,實(shí)際產(chǎn)品質(zhì)量也可能受到影響[14]。因此,雖然這些度量在理論上可以提供有關(guān)生產(chǎn)過程能力的重要信息,但在實(shí)踐中,可能需要額外的工具和技術(shù)來應(yīng)對(duì)實(shí)際生產(chǎn)過程的復(fù)雜性和動(dòng)態(tài)性。最值得關(guān)注的一點(diǎn)是,由于料頭和料尾過程難以滿足正態(tài)分布假設(shè),絕大多數(shù)包含設(shè)備、產(chǎn)品變化的關(guān)鍵信息被截取、剔除,只關(guān)注料中的穩(wěn)態(tài)數(shù)據(jù),導(dǎo)致數(shù)據(jù)利用率不高、關(guān)鍵變化信息缺失。
本文的主要貢獻(xiàn)是設(shè)計(jì)一種有效的批次間差異評(píng)價(jià)方法,能夠克服傳統(tǒng)比較不同速度下的相似過程,不需要滿足正態(tài)分布假設(shè),能夠?qū)⑸a(chǎn)各個(gè)階段的信息提取并評(píng)價(jià),并且具有直觀的可視化結(jié)果,具有進(jìn)一步結(jié)合煙草行業(yè)熟悉的SPC 相關(guān)技術(shù)進(jìn)一步拓展的可能性。
異常檢測的主要任務(wù)在于識(shí)別給定數(shù)據(jù)集中的異?;蛘?shù)據(jù)點(diǎn)或模式[15],在機(jī)器學(xué)習(xí)領(lǐng)域可以根據(jù)可用數(shù)據(jù)的性質(zhì)劃分為有監(jiān)督、無監(jiān)督或半監(jiān)督的問題:如果標(biāo)記的數(shù)據(jù)集包含正常和異常樣本,可以建立有監(jiān)督的分類任務(wù),利用最近鄰、決策樹或神經(jīng)網(wǎng)絡(luò)等方法解決;如果數(shù)據(jù)無標(biāo)簽,那么只能采用無監(jiān)督的聚類方法,使用無監(jiān)督或半監(jiān)督方法則訓(xùn)練單類模型,如支持向量機(jī)或SOM 網(wǎng)絡(luò)等,在正常數(shù)據(jù)樣本上進(jìn)行訓(xùn)練,如果新的樣本超過正常樣本一定閾值,那么則認(rèn)為新的樣本存在異常。
局部離群因子[16]是一個(gè)基于最近鄰方法的示例,它對(duì)每個(gè)局部結(jié)構(gòu)而不是每個(gè)數(shù)據(jù)點(diǎn)進(jìn)行評(píng)分,并將得分最高的局部結(jié)構(gòu)報(bào)告為異常局部結(jié)構(gòu),其中離群值和離群值組很容易根據(jù)結(jié)構(gòu)的特征進(jìn)行劃分,與傳統(tǒng)算法相比,該方法能夠更有效地檢測異常值,特別是對(duì)于具有非球形聚類的數(shù)據(jù)集。
隔離森林[17]作為另一種檢測方法及其擴(kuò)展,在機(jī)器監(jiān)測數(shù)據(jù)和高維數(shù)據(jù)[18]等異常檢測領(lǐng)域取得了成功應(yīng)用。該方法試圖通過隨機(jī)選擇任何可用特征,然后在所選特征的最大值和最小值之間隨機(jī)設(shè)置一個(gè)閾值來隔離觀察樣本。通過遞歸分割,可以生成一棵樹結(jié)構(gòu),而異常值通常從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的路徑更短。這種方法的計(jì)算復(fù)雜度為O(nlogn),其中n是對(duì)象的數(shù)量。
近年來,使用神經(jīng)網(wǎng)絡(luò)進(jìn)行異常檢測的興趣逐漸增加。基于神經(jīng)網(wǎng)絡(luò)的檢測在不同領(lǐng)域發(fā)揮著重要作用,如使用無監(jiān)督學(xué)習(xí)進(jìn)行壓水反應(yīng)堆的異常檢測[19],以及使用圖神經(jīng)網(wǎng)絡(luò)進(jìn)行工業(yè)物聯(lián)網(wǎng)的異常檢測[20]。然而,基于神經(jīng)網(wǎng)絡(luò)的異常檢測主要存在著黑盒原理的問題——很難由專家驗(yàn)證檢測過程,而且神經(jīng)網(wǎng)絡(luò)需要大量數(shù)據(jù)進(jìn)行訓(xùn)練。
在任何異常檢測系統(tǒng)中,都隱含了一般性正常的狀態(tài),在半監(jiān)督的情況下,基于正常狀態(tài)的模型,而檢測的任務(wù)是找到未見過樣本與正常模型的匹配程度,匹配程度越高,樣本為異常的可能性越低。然而,在很多情況下,使用簡單的相似度度量,如ED,很難將正常行為與觀察到的時(shí)間序列匹配,這可能導(dǎo)致高假陽性檢測。而DTW 作為一種可行的解決方案[21-22],則通過提供所需的彈性,實(shí)現(xiàn)了最佳的對(duì)齊,從而降低了假陽性,并能同時(shí)檢測異常。
對(duì)于監(jiān)測應(yīng)用來說,基于狀態(tài)的異常檢測模型從理論上說應(yīng)該非常有效,這些應(yīng)用的輸入數(shù)據(jù)是從相同的數(shù)據(jù)分布中生成的,并且在平穩(wěn)區(qū)間內(nèi)變化很?。坏菑膶?shí)際應(yīng)用的角度來看,滿足給定的數(shù)據(jù)分布幾乎是不可能的,因?yàn)閷?shí)際生產(chǎn)環(huán)境各種傳感器不可避免地存在漂移和隨機(jī)干擾。判斷這種漸進(jìn)變化是臨時(shí)的(即真正地異常)還是(生產(chǎn)環(huán)境本身的影響)是一項(xiàng)非常具有挑戰(zhàn)性的工作。
動(dòng)態(tài)時(shí)間規(guī)整(Dynamic Time Warping,DTW)[23]是一種用于測量2 個(gè)時(shí)間序列之間相似度的方法。它能夠處理非線性的時(shí)間扭曲,因此在多個(gè)數(shù)據(jù)挖掘任務(wù)中可以進(jìn)行靈活的對(duì)齊,在很多領(lǐng)域,DTW 都表現(xiàn)出了出色的性能,對(duì)于2 個(gè)長度不等的時(shí)間序列,即
式中:Xm是一個(gè)長度為m的向量,其元素{x1,x2,…,xm}是序列X的樣本值,類似地,Yn是一個(gè)長度為n的向量,其元素{y1,y2,…,yn}是序列Y的樣本值。這2 個(gè)向量可以代表任何時(shí)間序列數(shù)據(jù),例如音頻信號(hào)、傳感器讀數(shù)、股票價(jià)格等。為了尋找這2 個(gè)時(shí)間序列之間的相似度,本方法通過尋找2 個(gè)時(shí)間序列之間的最小累積點(diǎn)對(duì)點(diǎn)對(duì)齊來實(shí)現(xiàn),在現(xiàn)實(shí)世界中,2 個(gè)時(shí)間序列的長度不可能完全一致(例如Xm和Yn中m和n大多數(shù)情況下并不相等),換句話說,如果可以找到一種方式來“對(duì)齊”這2 個(gè)序列,使得它們的總體距離最小,那么這個(gè)總體距離就可以作為2 個(gè)時(shí)間序列之間距離的評(píng)價(jià)方式,在DTW 中這種“對(duì)齊”的方式被稱為一個(gè)“路徑”。
一個(gè)路徑p是一個(gè)長度為k的序列{p1,p2,…,pk},其中每個(gè)pi=(i,j)表示一個(gè)對(duì)齊的點(diǎn)對(duì)。為了保證這個(gè)路徑的唯一性,這個(gè)路徑必須滿足以下的約束。
1)邊界條件:
公式(2)的意義在于路徑p必須從2 個(gè)序列的開始處開始,到2 個(gè)序列的結(jié)束處結(jié)束。
2)連續(xù)性:對(duì)于所有的i,pi+1-pi=(1,0),(0,1)或者(1,1)。也就是說,路徑不能跳過任何一個(gè)點(diǎn)。
3)單調(diào)性:對(duì)于所有的i,pi+1≥pi。也就是說,路徑不能回溯。
在以上定義的基礎(chǔ)上,路徑p定義使得路徑上的點(diǎn)對(duì)的距離總和最小。這個(gè)距離總和可以定義為
其中d(pi)是點(diǎn)(x,y)對(duì)pi的距離,通??梢远x為歐氏距離
這個(gè)問題可以通過動(dòng)態(tài)規(guī)劃來求解。首先定義一個(gè)距離矩陣D,其中D(i,j)表示序列X的前i個(gè)點(diǎn)和序列Y的前j個(gè)點(diǎn)的最小距離。那么D(n,m)就是想要求的最小距離。這個(gè)矩陣可以通過以下的遞推公式來計(jì)算
式中:d(i,j)=(xi-yj)2是點(diǎn)(i,j)的距離。公式(5)的含義是,對(duì)于每一個(gè)點(diǎn)對(duì)(i,j),都可以通過在(i-1,j),(i,j-1)或者(i-1,j-1)中選擇一個(gè)距離最小的點(diǎn)對(duì)來達(dá)到。
這個(gè)遞推公式的初值可以定義為
公式(6)(7)(8)分別表示X的前i個(gè)點(diǎn)和第一個(gè)點(diǎn)的最小距離,以及X的第一個(gè)點(diǎn)和Y的前j個(gè)點(diǎn)的最小距離。
如圖1 所示,2 個(gè)隨機(jī)時(shí)間序列x,y,通過遞推公式,就可以從(1,1)開始,依次計(jì)算出矩陣D 的所有元素,然后,通過回溯這個(gè)矩陣來找到最佳的路徑。具體的回溯過程是從(n,m)開始,依次在(i-1,j)(i,j-1)和(i-1,j-1)中選擇一個(gè)距離最小的點(diǎn)對(duì),直到回到(1,1)。
圖1 2 個(gè)當(dāng)變量時(shí)間序列x,y 的DTW 路徑和距離矩陣
圖1 (a)為DTW 距離矩陣,每個(gè)像素的顏色代表了相應(yīng)的距離,顏色的深淺通常用來表示距離的大小,深色表示大的距離,可以幫助我們直觀地看到2 個(gè)序列之間的相似性和差異性。如果2 個(gè)序列非常相似,那么Distance Matrix 的可視化圖中將會(huì)有一條明亮的對(duì)角線。圖1(b)為DTW 路徑,如果2 個(gè)序列相似的部分越多,那么這些部分在可視化圖中將會(huì)越接近對(duì)角線。
在復(fù)雜的數(shù)據(jù)環(huán)境中,單變量分析方法常常無法充分利用所有的數(shù)據(jù)信息,這限制了其在實(shí)際問題中的應(yīng)用。特別是在處理時(shí)間序列數(shù)據(jù)時(shí),每個(gè)時(shí)間點(diǎn)可能包含多個(gè)觀測值,因此需要將分析方法拓展到多變量情況。雖然動(dòng)態(tài)時(shí)間扭曲(DTW)方法在單變量情況下可以有效地計(jì)算2 個(gè)時(shí)間序列之間的最優(yōu)匹配,但在多變量情況下,每個(gè)時(shí)間點(diǎn)都包含多個(gè)觀測值,這就要求計(jì)算多個(gè)時(shí)間序列之間的最優(yōu)匹配,以便更準(zhǔn)確地反映數(shù)據(jù)的特性。因此,考慮多變量情況是實(shí)現(xiàn)更準(zhǔn)確分析和更全面的數(shù)據(jù)利用的必然選擇,這對(duì)于提高分析方法的強(qiáng)大性和適應(yīng)性具有重要意義。
為了說明如何將動(dòng)態(tài)時(shí)間扭曲(DTW)推廣到多變量情景,考慮一個(gè)批次生產(chǎn)過程(batch process),如公式(9)所示,矩陣X 大小為(m×P),表示該生產(chǎn)批次數(shù)據(jù)有m個(gè)采樣點(diǎn)以及P個(gè)傳感器;同理,公式(10)中,需要對(duì)比的批次大小為(n×P),表示該生產(chǎn)批次數(shù)據(jù)有n個(gè)采樣點(diǎn)以及P個(gè)傳感器,在每個(gè)批次中,有m或n個(gè)采樣點(diǎn),每個(gè)采樣點(diǎn)都通過P個(gè)傳感器進(jìn)行多維度觀測,生成了一個(gè)P維向量。例如,xi(P)表示第i個(gè)采樣點(diǎn)通過第P個(gè)傳感器得到的觀測值。矩陣X 和Y 分別表示2 個(gè)批次的所有觀測值,其中每行代表一個(gè)采樣點(diǎn)的所有觀測值,每列代表在所有采樣點(diǎn)上的一個(gè)特定傳感器的觀測值。
對(duì)于某一時(shí)刻t0,所對(duì)應(yīng)的采樣點(diǎn)分別為i和j,一般情況下考慮生產(chǎn)中的各種因素i≠j,那么對(duì)于該時(shí)刻,行向量xi與yj之間的距離可以由公式(11)表示
該距離為余弦距離,其幾何含義為空間中2 個(gè)向量的夾角。其中,Xi,k和Yj,k分別是向量xi和yj在k 維上的元素;兩向量的點(diǎn)乘(即在每一維上的元素相乘然后求和),表示了向量xi和在各維度上的共享信息;而分母分別是2 個(gè)向量的歐幾里得長度,用于對(duì)各自的向量進(jìn)行歸一化。因此,公式(11)定義了矩陣X 和某一時(shí)刻在空間中的夾角,如果2 個(gè)向量越相似,余弦相似度越接近1;如果2 個(gè)向量越不相似,夾角越大,余弦相似度越接近-1。用1 減去余弦相似度,得到的就是余弦距離,其值范圍在0~2 之間,數(shù)值越小,表示2 個(gè)向量越相似。
具體算法如算法1 所示。
除了統(tǒng)計(jì)過程控制(SPC)相關(guān)技術(shù)以外,在實(shí)踐中還經(jīng)常使用“黃金批次”或“優(yōu)質(zhì)批次”指代在一系列生產(chǎn)批次中,質(zhì)量、性能或產(chǎn)量最優(yōu)的一個(gè)批次,其過程數(shù)據(jù)也常作為基準(zhǔn),用來與其他批次進(jìn)行比較,或者用來優(yōu)化生產(chǎn)過程,但是并沒有一個(gè)統(tǒng)一的方法論,直觀與樸素的實(shí)踐是各個(gè)過程變量都要控制在一定范圍內(nèi)波動(dòng)。
之前討論了如何使用DTW 計(jì)算2 個(gè)多維時(shí)間序列之間的相似度,在此基礎(chǔ)上,在處理制絲生產(chǎn)過程數(shù)據(jù)時(shí),可以選擇一個(gè)性能最優(yōu)的“黃金批次”,并用它的時(shí)間序列數(shù)據(jù)作為參考,計(jì)算其他批次與“黃金批次”之間的DTW 距離。
如果某一個(gè)批次與“黃金批次”的DTW 距離較小,則說明這個(gè)批次的時(shí)間序列與“黃金批次”在時(shí)間結(jié)構(gòu)上更加相似,該批次的生產(chǎn)過程更為接近最優(yōu);反之,如果DTW 距離較大,則說明這個(gè)批次在生產(chǎn)過程上存在明顯差異,需要進(jìn)行優(yōu)化。
之前使用公式(11)以及算法1,可以得到“黃金批次”與被評(píng)價(jià)批次之間的距離,重復(fù)該過程,可以計(jì)算黃金批次與其他所有批次的DTW 距離DTW1,DTW2,…DTWk。
為了合理的設(shè)置閾值,
公式(12)中,5%prercentile表示5%分位數(shù),用來確定總體批次與“黃金批次”的DTW 距離下界;同理公式(13)使用95%分位數(shù)確定總體批次與“黃金批次”的DTW 距離上界。之后,可以通過視覺化展示每個(gè)批次的DTWi及閾值范圍,直觀地評(píng)價(jià)不同批次與黃金批次的相似程度,從而分析每個(gè)批次的生產(chǎn)過程與黃金批次存在的差異,指導(dǎo)生產(chǎn)過程優(yōu)化。
松散回潮是煙草加工過程中的關(guān)鍵工序之一,其主要目的是調(diào)節(jié)煙葉的濕度和溫度,為后續(xù)工序的加工提供理想的濕度狀態(tài)的煙葉原料。
一般來說松散回潮工序可以分為煙葉的預(yù)處理和松散回潮兩部分,預(yù)處理包括煙葉的開包、分切、真空回潮等,將原料煙葉進(jìn)行預(yù)處理;松散回潮是在松散回潮機(jī)內(nèi)完成的工序。松散回潮機(jī)主要由鋼制框架、不銹鋼外殼、旋轉(zhuǎn)環(huán)、支承輪、傳動(dòng)裝置、喂料斗、出料斗、升降系統(tǒng)和熱風(fēng)加熱系統(tǒng)等組成。煙葉進(jìn)入滾筒后,控制系統(tǒng)會(huì)根據(jù)煙葉的流量和在線水分探測結(jié)果計(jì)算出所需的加水量,然后在適當(dāng)?shù)臅r(shí)間將計(jì)算所得的加水量準(zhǔn)確噴淋在煙葉上完成濕化過程。滾筒內(nèi)部分為增濕區(qū)和水分平衡區(qū),增濕區(qū)主要通過煙葉表面對(duì)水分的吸附作用來增加濕度,水分平衡區(qū)則利用滲透作用使煙葉內(nèi)外的水分含量達(dá)到平衡。為了提供理想的加熱濕化環(huán)境,熱風(fēng)加熱系統(tǒng)會(huì)提供適量的熱風(fēng),與蒸汽混合后吹入滾筒內(nèi)部,通過控制熱風(fēng)與蒸汽的比例可以精確調(diào)節(jié)空氣濕度,實(shí)現(xiàn)煙葉理想的加熱增濕效果。此外,還可以通過調(diào)節(jié)滾筒的轉(zhuǎn)速和傾斜角度來控制煙葉在滾筒內(nèi)的停留時(shí)間,以達(dá)到所需的增濕效果。出料端安裝有在線水分檢測儀,可以實(shí)時(shí)檢測煙葉的濕度,并將信號(hào)反饋給控制系統(tǒng),完成濕度的閉環(huán)控制。
松散回潮工序的數(shù)據(jù)采集主要集中在煙葉流量、水分、溫度和加水量等方面,這些數(shù)據(jù)的監(jiān)測對(duì)于評(píng)估濕化效果和反饋控制至關(guān)重要。
本次測試采用的實(shí)驗(yàn)數(shù)據(jù)為某卷煙廠正常生產(chǎn)時(shí)所采集的離線數(shù)據(jù),在松散回潮機(jī)的進(jìn)料端安裝有電子皮帶秤,可以實(shí)時(shí)檢測并控制進(jìn)入滾筒的煙葉流量,確保流量穩(wěn)定;同時(shí)在進(jìn)出料端分別安裝在線水分檢測儀,監(jiān)測煙葉的水分含量,根據(jù)兩端水分?jǐn)?shù)據(jù)計(jì)算并控制加水量。為了記錄系統(tǒng)加水量與實(shí)際加水量的對(duì)比,還需要檢測和記錄實(shí)際的加水量值。出料端的溫度探頭能夠監(jiān)測煙葉出料的溫度,與水分?jǐn)?shù)據(jù)配合判斷加熱濕化的效果。另外,壓縮空氣壓力、給水系統(tǒng)壓力、滾筒轉(zhuǎn)速和傾角等數(shù)據(jù)也需要被檢測和控制,這些數(shù)據(jù)與加水量和濕化效果密切相關(guān)。壓縮空氣壓力能確保氣動(dòng)元件工作正常,給水系統(tǒng)壓力影響加水量的穩(wěn)定,滾筒轉(zhuǎn)速和傾角決定了煙葉在筒內(nèi)的停留時(shí)間,從而影響濕化效果。表1 為松散回潮工序主要變量描述,通過對(duì)表1 中的多種數(shù)據(jù)的監(jiān)控收集和分析,可以實(shí)現(xiàn)煙葉濕化過程的閉環(huán)控制,確保煙葉得到均勻而適量的濕化處理,為后續(xù)工序提供理想狀態(tài)的煙葉原料。
表1 松散回潮工序主要變量描述
讀取某卷煙廠x 牌號(hào)2022 年1 月—2022 年6 月所生產(chǎn)的100 個(gè)批次的松散回潮設(shè)備生產(chǎn)數(shù)據(jù),整理為三維過程變量數(shù)據(jù)X(100×18×Ki),其中選取第1 批次作為參考批次,其余99 個(gè)批次作為被評(píng)價(jià)批次,由于原料重量、采集結(jié)束點(diǎn)等不同,100 個(gè)批次的采樣數(shù)Ki均不相同。
為了說明本文所提出方法的有效性,先采用參考批次自身進(jìn)行比較和評(píng)價(jià),圖2 為DTW 距離矩陣與動(dòng)態(tài)規(guī)整路徑,X(縱坐標(biāo))為參考批次,Y(橫坐標(biāo))為被評(píng)價(jià)批次,在DTW 路徑上為一條斜率為1 的直線,圖像中矩陣顏色的深淺代表DTW 路徑的長度,DTW 路徑矩陣中各點(diǎn)均同步對(duì)齊,總距離為0。
圖2 參考批次自身進(jìn)行差異性評(píng)價(jià)的結(jié)果
圖3 為隨機(jī)選取了一個(gè)批次采用本文所提出的方法進(jìn)行差異性評(píng)價(jià),由于參考批次X其采樣點(diǎn)為300個(gè),被評(píng)價(jià)批次Y為321 個(gè),其DTW 路徑矩陣大小為(300,321),因此被評(píng)價(jià)批次Y在第300 個(gè)采樣點(diǎn)之后的21 個(gè)點(diǎn),均以映射的方式扭曲至參考批次X的最后一個(gè)點(diǎn),與其計(jì)算余弦距離。從圖3 可以看出,在被評(píng)價(jià)批次生產(chǎn)開始初期,約25 個(gè)點(diǎn),其距離與參考批次迅速加大,在生產(chǎn)中期保持平穩(wěn),以線性關(guān)系緩慢增加,之后在生產(chǎn)結(jié)束階段將距離進(jìn)一步加大,可以判斷出該批次與參考批次的主要差異在于料頭和料尾的控制過程中,可能出現(xiàn)生產(chǎn)結(jié)束前清線不徹底導(dǎo)致批次采樣時(shí)間增加的問題。
圖3 參考批次與隨機(jī)選擇的批次差異性評(píng)價(jià)的結(jié)果
圖4 進(jìn)一步說明參考批次與其他99 個(gè)批次之間的差異性的一般結(jié)論,其中橫坐標(biāo)為批次數(shù),縱坐標(biāo)為每個(gè)批次的DTW 距離,灰色虛線為100 個(gè)批次與參考批次的平均DTW 距離,可以看出,99 個(gè)批次與參考批次之間平均DTW 距離為292.73,最小差異為251.63,最大差異為349.12,其中虛線的部分為被評(píng)價(jià)批次與參考批次距離的95%分位數(shù),表明使用本文所提出的方法,任意批次與參考批次均可以計(jì)算出唯一的DTW距離,該距離能夠表明被評(píng)價(jià)批次與參考批次的差異性,從而從量化地給出結(jié)論。
圖4 參考批次與99 個(gè)被評(píng)價(jià)批次的距離匯總
為了更深入地理解一段時(shí)間內(nèi)的生產(chǎn)總體情況,本文提出的方法可以與煙草行業(yè)廣泛使用的統(tǒng)計(jì)過程控制(Statistical Process Control,SPC)方法相結(jié)合。SPC是一種通過統(tǒng)計(jì)分析來識(shí)別并控制生產(chǎn)過程中的質(zhì)量變化的方法,以便實(shí)現(xiàn)穩(wěn)定和預(yù)期的生產(chǎn)結(jié)果。在這種情況下,SPC 可以與我們的方法一起使用,以深入分析批次之間的差異性。
圖5 是一個(gè)用于結(jié)合本文所提出方法與SPC 技術(shù)結(jié)合分析批次間差異性的統(tǒng)計(jì)控制圖,其顯示了批次間的差異隨時(shí)間變化的情況,其中橫坐標(biāo)為批次數(shù),縱坐標(biāo)為每個(gè)批次的DTW 距離,統(tǒng)計(jì)控制圖通常包括中心線(表示過程平均值或目標(biāo)),以及上控制限(UCL)和下控制限(LCL),上規(guī)格限(USL)與下規(guī)格限(LSL),規(guī)格線和控制線可以根據(jù)歷史生產(chǎn)狀況自行確定,本圖中使用2 個(gè)標(biāo)準(zhǔn)差確定規(guī)格線,3 個(gè)標(biāo)準(zhǔn)差確定控制線。
圖5 使用SPC 控制圖評(píng)價(jià)參考批次與99 個(gè)被評(píng)價(jià)批次之間的差異性
在圖5 中,如果所有數(shù)據(jù)點(diǎn)都在UCL 和LCL 之間,那么可以認(rèn)為過程在統(tǒng)計(jì)控制下,即過程穩(wěn)定無特殊原因?qū)е碌淖儺悾坏桥?6 的數(shù)據(jù)點(diǎn)在UCL 或LCL 之外,這表示該批次出現(xiàn)了特殊原因的變異,需要進(jìn)行調(diào)查和改進(jìn)。進(jìn)一步地,如果數(shù)據(jù)點(diǎn)出現(xiàn)系統(tǒng)性的、非隨機(jī)的模式(例如連續(xù)上升或下降,或者出現(xiàn)周期性的波動(dòng)),即使所有數(shù)據(jù)點(diǎn)都在控制限之內(nèi),也可能表示過程中存在潛在的問題,需要對(duì)這一段時(shí)間的生產(chǎn)進(jìn)行重點(diǎn)關(guān)注。
本文提出了使用動(dòng)態(tài)時(shí)間規(guī)整(DTW)對(duì)多變量時(shí)間序列距離度量的方法,從而對(duì)制絲批次間差異評(píng)價(jià),為煙草制絲質(zhì)量控制提供了一種數(shù)據(jù)驅(qū)動(dòng)的新思路。
在分析了煙草加工批次間差異的成因及其評(píng)價(jià)的意義,指出了統(tǒng)計(jì)模型、聚類、神經(jīng)網(wǎng)絡(luò)等傳統(tǒng)異常檢測方法在小樣本場景下的局限性,在此基礎(chǔ)上詳細(xì)介紹了DTW 算法原理,并將其推廣到處理多變量時(shí)間序列數(shù)據(jù)的場景,設(shè)計(jì)了利用DTW 距離來評(píng)價(jià)不同加工批次與優(yōu)質(zhì)批次差異的框架。
在實(shí)驗(yàn)部分,以卷煙生產(chǎn)中的松散回潮工序?yàn)槔?,?yīng)用所提方法對(duì)100 個(gè)批次進(jìn)行了差異性評(píng)估并進(jìn)行了可視化,驗(yàn)證了該方法的有效性。進(jìn)一步結(jié)合統(tǒng)計(jì)過程控制相關(guān)技術(shù),展示了所提出方法與傳統(tǒng)SPC 技術(shù)的結(jié)合應(yīng)用,以更全面地分析和控制批次間的質(zhì)量差異;為煙草制絲質(zhì)量控制提供了一種數(shù)據(jù)驅(qū)動(dòng)的新思路,也可拓展至其他工業(yè)批次生產(chǎn)過程的質(zhì)量評(píng)價(jià)與控制場景。
本研究的創(chuàng)新點(diǎn)在于,利用DTW 這種彈性時(shí)間序列匹配方法,可以有效地評(píng)價(jià)不同速率下時(shí)間序列數(shù)據(jù)的相似性,克服了傳統(tǒng)方法的局限性,為煙草加工等小樣本批次生產(chǎn)過程提供了新的質(zhì)量分析手段??傮w而言,研究工作具有良好的應(yīng)用前景和推廣價(jià)值。在實(shí)驗(yàn)部分,將所提出的方法應(yīng)用到了卷煙生產(chǎn)中的松散回潮工序,并對(duì)100 個(gè)批次進(jìn)行了差異性評(píng)估。結(jié)果表明,方法能有效地識(shí)別出批次之間的質(zhì)量差異,并通過可視化的方式展現(xiàn)出這些差異。此外,本文還討論了如何將本研究的方法與統(tǒng)計(jì)過程控制(SPC)相結(jié)合,以提供更深入的批次差異性分析。
本研究的方法提供了一種有效的工具,可以幫助卷煙生產(chǎn)企業(yè)更好地理解和控制制絲生產(chǎn)過程,從而提高產(chǎn)品質(zhì)量的一致性和穩(wěn)定性。同時(shí),本方法也為其他需要處理多變量時(shí)間序列數(shù)據(jù)的工業(yè)生產(chǎn)場景提供了一個(gè)新的解決方案。盡管本方法在煙草制絲質(zhì)量控制方面顯示出了顯著的效果,但其在其他領(lǐng)域的應(yīng)用仍需要進(jìn)一步研究和驗(yàn)證。