国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于單料片煙互信息的卷煙配方維護(hù)方法

2021-03-24 05:28:20馮潤澤雒興剛張忠良湯建國喬丹娜
煙草科技 2021年3期
關(guān)鍵詞:互信息列表卷煙

馮潤澤,雒興剛,張忠良*,湯建國,喬丹娜

1. 杭州電子科技大學(xué)管理學(xué)院,杭州市杭州經(jīng)濟(jì)開發(fā)區(qū)白楊街道2 號大街1158 號 310018 2. 云南中煙工業(yè)有限責(zé)任公司技術(shù)中心,昆明市五華區(qū)紅錦路367 號 650231

卷煙葉組配方由不同產(chǎn)地、部位、等級的單料片煙配比而成,而卷煙配方維護(hù)是保證卷煙產(chǎn)品質(zhì)量穩(wěn)定性的手段,需要考慮配方中單料片煙之間的配伍性[1]。在我國卷煙生產(chǎn)實踐中,單料片煙是由單產(chǎn)地、單一等級的原煙加工而成或根據(jù)一定規(guī)則組合而成的,是卷煙配方的最小模塊,其相互之間的配伍性是兩個或多個單料片煙組合后形成的卷煙配方感官質(zhì)量潛力的表現(xiàn)[2]。在工業(yè)企業(yè)的實際生產(chǎn)過程中,會因為一些不可抗拒因素(如自然災(zāi)害、供應(yīng)短缺等)造成供應(yīng)鏈中一種或幾種單料片煙的產(chǎn)能下降,從而導(dǎo)致卷煙配方質(zhì)量方面的波動,就需要通過評吸人員的評吸工作來尋找替代的單料片煙[3]。人工評吸不僅時間長、成本高,而且容易受到客觀環(huán)境和主觀因素的影響[4],因此研究更加快速、低成本且能反映工業(yè)企業(yè)實際生產(chǎn)過程的卷煙配方維護(hù)方法已成為企業(yè)的迫切需求[5]。

長期以來,一些科研人員對卷煙配方維護(hù)進(jìn)行了研究,如一些學(xué)者通過配方的紅外光譜信息以及熱解差異度來輔助卷煙配方維護(hù)過程[1-2];王林等[6]使用感官質(zhì)量評吸方法構(gòu)建了配方模塊,評價了煙葉質(zhì)量的差異;郭科等[7]使用BP 神經(jīng)網(wǎng)絡(luò)建立了葉組化學(xué)成分與感官質(zhì)量和煙氣化學(xué)成分之間的映射,得到了所選取煙葉的配方最佳比例;楊蕾等[8]使用GC/MS 法分析了煙絲中的揮發(fā)性成分,提高了配方葉組中主要致香成分含量;楊超等[9]采用因子分析、聚類分析統(tǒng)計方法分析了煙葉的化學(xué)成分,完善了配方維護(hù)的評價方式;一些學(xué)者通過數(shù)據(jù)挖掘或智能優(yōu)化算法將經(jīng)驗轉(zhuǎn)化為數(shù)據(jù),完成配方維護(hù)的相關(guān)工作[10-11];雖然已有工作對卷煙配方維護(hù)進(jìn)行了一些探索,但是現(xiàn)有研究基本沒有過多考慮單料片煙之間的配伍性問題;雒興剛等[12]運(yùn)用關(guān)聯(lián)規(guī)則挖掘?qū)ふ铱尚械膯瘟掀瑹熍湮橐?guī)則,但是此方法只能考慮非主干單料片煙之間的替換,并不能解決主干單料片煙缺失的情況;王楠等[13]利用非負(fù)矩陣分解的方法挖掘單料片煙之間隱含的配伍規(guī)則,并且解決了任意單料片煙缺失的配方維護(hù)問題,但該方法只能隱式地考慮配伍性,并不能把配伍性反映在顯式的模型或者算法中,并且只能評估數(shù)量相等的單料片煙的替換過程,不能反映實際生產(chǎn)過程中大量數(shù)量不對等的維護(hù)情況。

基于此,提出了一種基于互信息的卷煙配方維護(hù)方法,利用歷史數(shù)據(jù)挖掘單料片煙之間的配伍性規(guī)律,還原實際生產(chǎn)過程中配方人員的經(jīng)驗以及配方維護(hù)過程。此方法使用互信息來表示單料片煙之間的配伍性,將配伍性顯式地表示在算法中,并用替換單料片煙與被替換單料片煙在配方中作用的相似性來生成推薦列表,以期能夠保證新形成配方的整體配伍性,并解決實際生產(chǎn)過程中出現(xiàn)頻率最高的數(shù)量不對等替換的度量問題,同時減少評吸人員的工作量,為配方維護(hù)人員提供合理可行的配方維護(hù)方案。

1 材料與方法

1.1 數(shù)據(jù)準(zhǔn)備

選擇某煙草公司3 年(即2010 年1 月到2012年12 月)的數(shù)據(jù)進(jìn)行研究。數(shù)據(jù)包括24 種卷煙品牌,1 534 種配方,1 220 種單料片煙(單料片煙包括3 個部位、6 種顏色、3 個檔次,以及國內(nèi)和國外2 個地區(qū))。

配方數(shù)據(jù)文件包含1 534 條配方信息及其22個屬性信息,其中1 534 條配方信息被重新編號為FBI0001 ~FBI1534,在配方信息中,根據(jù)配方生效時間將各品牌內(nèi)的配方重新排序,即在同一個品牌配方數(shù)據(jù)中,編號靠后配方數(shù)據(jù)的生效時間一定比編號靠前數(shù)據(jù)的生效時間晚。單料片煙被編號為AD0001 ~AD0716 和DLC0001 ~DLC2072 且數(shù)據(jù)不連續(xù)。調(diào)研發(fā)現(xiàn),卷煙配方人員根據(jù)先驗知識就可以通過煙葉的部位、產(chǎn)地、顏色等信息來完成卷煙配方的維護(hù)工作。因此,單料片煙的數(shù)據(jù)根據(jù)其物理屬性(部位、顏色、檔次、地區(qū))被重新劃分為36 個類別,其中部位分為上部、中部、下部,顏色分為枯黃色和其他(因為除枯黃色外其他顏色數(shù)量較少,故將除枯黃色的顏色合并為其他),檔次分為上等、中等、下等,地區(qū)分為國內(nèi)和國外,組合共36 類,稱為36 種單料片煙。部位為上部、顏色為枯黃色、檔次為上等、地區(qū)為國內(nèi)的單料片煙分為單料片煙1,部位為上部、顏色為枯黃色、檔次為上等、地區(qū)為國外的單料片煙分為單料片煙2 等依此類推。

將數(shù)據(jù)轉(zhuǎn)換為配方矩陣F(m×n),其中,行表示1 534 個配方(m),列表示36 種單料片煙(n),矩陣中的值表示配方i包含單料片煙j的數(shù)量。

1.2 方法

1.2.1 互信息

互信息由Church 等[14]于1989 年提出,該方法已經(jīng)在圖像配準(zhǔn)、機(jī)器學(xué)習(xí)、量子信道通信等領(lǐng)域廣泛應(yīng)用[15-20]。

在數(shù)據(jù)集中,第j種單料片煙被定義為Cigj,因此,共現(xiàn)關(guān)系信息CR(Cigj)的計算公式為:

其中:n為數(shù)據(jù)集中單料片煙的總種類個數(shù);Fq(Cigj,Cigk)表示單料片煙j和單料片煙k在數(shù)據(jù)集中一起出現(xiàn)的相對頻率,計算公式為:

其中:Q(Cigj,Cigk)為Cigj和Cigk同時出現(xiàn)在一個配方中的次數(shù);QAll為配方總數(shù)。Fq(Cigj,Cigk)的值越大,說明在卷煙配方中,單料片煙j和單料片煙k越經(jīng)常同時出現(xiàn)。

所有單料片煙的共現(xiàn)關(guān)系集合CR可表示為:

第j個單料片煙和第k個單料片煙之間的互信息計算公式為:

其中:Q(Cigi)為包含Cigi的配方個數(shù),QAll為 配方總數(shù)。

通過1.1 的數(shù)據(jù)集可以得出CR。本研究中提出的方法基于以下假設(shè):配伍性良好的單料片煙會有較高的概率同時出現(xiàn)在同一個配方中。

1.2.2 基于互信息的卷煙配方維護(hù)算法

基于互信息的卷煙配方維護(hù)算法主要衡量替換單料片煙和被替換單料片煙在配方中作用的相似性。在一個配方中替換單料片煙的作用通過替換單料片煙和每一個剩余單料片煙的互信息進(jìn)行計算。圖1 中展示了exi和Cigj的作用,線旁邊的數(shù)值顯示了線兩端連接節(jié)點單料片煙之間的互信息值。其中exi∈Fi表示了在第i個配方中一個替換單料片煙,Cigji表示配方中的缺失單料片煙,fpi∈Fi表示了在第i個配方中,除去被替換單料片煙之外剩余單料片煙的第p個單料片煙。

將替換單料片煙的作用role(exi)表示為一個n維向量,由以下公式得到:

圖1 exi和Cigj的作用Fig.1 Roles of exi and Cigj

Fq(Cigj,Cigk)可根據(jù) 公 式(2)得到,Mutual(Cigj,Cigk)的值越大,說明單料片煙Cigj和Cigk配伍性越好。

同樣,對于單料片煙Cigj,role(Cigj)可以將公式(6)中exi替換為Cigj來表示。例如,在圖1 中,n即為4,role(ex)可以表示為一個4 維向量。單料片 煙exi的 作 用role(exi)=(22.33,10.56,0.08,2.79),單 料 片 煙Cigj的 作 用9.98,0.12,3.17)。

計算替換單料片煙作用role(exi)和被替換單料片煙作用之間的漢明距離[21]HD(exi,是對于第i個配方來說的,例如,在圖1 中9.98|+|0.08-0.12|+|2.79-3.17|=3.42。

基于互信息的卷煙配方維護(hù)方法如圖2 所示。

圖2 基于互信息的卷煙配方維護(hù)方法流程圖Fig.2 Flow chart of proposed cigarette blend maintenance method based on mutual information

1.2.3 卷煙配方維護(hù)效果評估

在實際的配方維護(hù)過程中,除了一對一替換,多數(shù)情況下是數(shù)量不相等的單料片煙替換過程,如:一換多、多換一、多換多、直接增加、直接刪去等。在之前的研究工作中大多為一對一替換與多對多替換[1-2,10,14],還沒有對數(shù)量不相等的單料片煙替換過程進(jìn)行研究。因此,提出一種排名方式來評估數(shù)量不對等的單料片煙替換實驗效果的優(yōu)劣,但本研究中仍不考慮直接增加和直接刪去兩種情況。

由于在實際配方維護(hù)過程中新配方都由上一個版本的配方調(diào)整得到,如版本3 一定是由版本2調(diào)整得到,而非版本1 調(diào)整得到,因此在衡量算法效果時,只考慮能否預(yù)測成功配方與其下一個版本配方的替換結(jié)果。衡量算法效果的指標(biāo)計算方法如圖3~圖5 所示。

圖3 配方矩陣轉(zhuǎn)化Fig.3 Blend matrix conversion

圖4 一次配方維護(hù)過程Fig.4 A blend maintenance process

圖5 平均排名avg 計算方法Fig.5 Calculating method for average rank avg

如圖3 所示,首先將源數(shù)據(jù)轉(zhuǎn)化為配方矩陣,在源數(shù)據(jù)中,F(xiàn)BI001 由AD0001、AD0002、AD0004等原煙構(gòu)成,由于AD0001、AD0002 屬于單料片煙1,AD0003 屬于單料片煙7 等,統(tǒng)計配方FBI001 中各單料片煙的數(shù)量,可以得到配方矩陣F(m×n)。如圖4 可知在配方FBI001 經(jīng)維護(hù)后變?yōu)镕BI002 的過程中,F(xiàn)BI001 是包括3 個單料片煙1,5 個單料片煙2 等的配方,在本次維護(hù)過程中,單料片煙4 和單料片煙6 中有一個單料片煙缺少,所以在本次卷煙配方維護(hù)中,單料片煙4 和單料片煙6 為缺失單料片煙,即被替換單料片煙,并且在本次維護(hù)中,使用了單料片煙1、單料片煙3 和單料片煙7替換了單料片煙4 和單料片煙6,所以在FBI002 中單料片煙1、單料片煙3 和單料片煙7 各增加了一個。單料片煙4 和單料片煙6 被單料片煙1、單料片煙3 和單料片煙7 替換,是典型的數(shù)量不相等的單料片煙替換過程。如圖5,為了評估算法的效果,對于被替換的單料片煙4 和單料片煙6 都用1.2.2 節(jié)中算法計算一次后,排序得到推薦列表,在兩個推薦列表中,分別找出替換單料片煙的排名,然后取各自排名的最小值。因為單料片煙1 和單料片煙7 在單料片煙4 推薦列表中的排名更靠前,單料片煙3 在單料片煙6 推薦列表中的排名更靠前,可認(rèn)為單料片煙1 和單料片煙7 在作用上可以替換單料片煙4,而單料片煙3 在作用上可以替換單料片煙6。在得到替換單料片煙的排名最小值后,取各自排名最小值的平均值即可得到替換單料片煙在推薦列表List中的平均排名avg。

根據(jù)平均排名,計算以下3 種模型性能度量指標(biāo):①在推薦單料片煙的有序列表List中實際替換單料片煙平均排名avg的平均數(shù)。②在推薦單料片煙的有序列表List中實際替換單料片煙平均排名avg的中位數(shù)。③實際替換的單料片煙平均排名avg位于推薦單料片煙列表List的前5 位的百分比。由于使用的是實際生產(chǎn)中替換過程的真實數(shù)據(jù),因此如果前兩個指標(biāo)越小,第三個指標(biāo)越大,則說明算法推薦越接近實際生產(chǎn),算法推薦效果越好。

2 結(jié)果與討論

2.1 實驗設(shè)置

對于所有非只增加或者只減少單料片煙的維護(hù),都用1.2.2 節(jié)中的方法進(jìn)行實驗,然后根據(jù)

1.2.3 節(jié)中的方法計算出算法性能度量指標(biāo)。

2.2 算法測試結(jié)果及分析

對24 種品牌共1 534 個配方和36 種單料片煙使用1.2.2 節(jié)中描述的方法進(jìn)行實驗,實驗結(jié)果如表1 所示。

表1 排名平均數(shù)、排名中位數(shù)及各排名內(nèi)單料片煙數(shù)量的比例Tab.1 Rank average,rank median and percentage of single-grade strips in each rank

由表1 中排名平均數(shù)可知,在推薦單料片煙的有序列表List中實際替換單料片煙平均排名avg的平均數(shù)為6.585(共36 種單料片煙)。由排名中位數(shù)可知,在推薦單料片煙的有序列表List中,有一半的實際替換的單料片煙平均排名為1。第3個度量指標(biāo)說明有85.66%的實際替換單料片煙平均排名avg在推薦單料片煙的有序列表List中的排名≤5,排名≤15 的比例達(dá)到90.16%,從上述度量指標(biāo)可以看出本算法表現(xiàn)良好,與實際生產(chǎn)中的替換過程相吻合。

由上述實驗數(shù)據(jù)繪制的排名統(tǒng)計圖見圖6。

圖6 實際替換單料片煙平均排名的分布Fig.6 Distribution of average rank of actual single-grade tobacco strip substitution

由圖6 可以看到,在實際替換過程中,大部分實際替換單料片煙的平均排名在推薦單料片煙的有序列表List中排名為1,并且大部分都集中在排名前6 位,之后數(shù)量呈現(xiàn)為下降趨勢。但是在排名33 至36 位范圍內(nèi)也集中了一部分?jǐn)?shù)量,經(jīng)過查找原始數(shù)據(jù)發(fā)現(xiàn)這些單料片煙出現(xiàn)次數(shù)極少,且只在特定的配方中出現(xiàn),因此在算法計算過程中無法進(jìn)行準(zhǔn)確檢測,就會被認(rèn)為這些單料片煙與配方中剩余的單料片煙的配伍性非常差,在單料片煙的有序列表List中就會排名靠后。因此這個問題不是算法本身的問題,與單料片煙本身的使用頻率、屬性等有關(guān),遇到只在特定配方中出現(xiàn)的單料片煙時,再去考慮這些出現(xiàn)次數(shù)極少的單料片煙即可。

根據(jù)上述實驗,可以繪制出排名百分比統(tǒng)計圖,見圖7。

圖7 實際替換單料片煙平均排名百分比的分布Fig.7 Distribution of average rank percentage of actual single-grade tobacco strip substitution

由圖7 可以看出,有約76%的實際替換單料片煙排在推薦列表List中的第1 位,排名百分比趨勢為先快速上升,達(dá)到約90%時上升趨勢開始趨緩,然后在平均排名33 時又開始快速上升至100%,說明算法可以很好地還原實際生產(chǎn)過程中單料片煙的替換過程,并且能得到配伍性良好的單料片煙,可以輔助實際生產(chǎn)中的配方維護(hù)工作。

3 結(jié)論

①提出一種基于互信息的卷煙配方維護(hù)方法,該方法通過計算單料片煙之間的共現(xiàn)頻率,從而計算出單料片煙之間的互信息,并通過某一配方中候選單料片煙與剩余單料片煙之間的互信息來評估候選單料片煙與該配方中剩余單料片煙之間的配伍性,從而完成配方維護(hù)過程。②提出的衡量算法效果的度量指標(biāo)解決了數(shù)量不對等的單料片煙替換過程的效果度量問題,可以衡量在實際生產(chǎn)過程中更為常見的數(shù)量不對等的多對多的單料片煙替換問題。根據(jù)實驗結(jié)果,缺失單料片煙在推薦列表中排名平均數(shù)為6.585,排名中位數(shù)為1,且在推薦列表中排名≤5 的缺失單料片煙占比為85.66%。本算法達(dá)到了較好的效果,且與實際生產(chǎn)過程中的配方維護(hù)過程相吻合,能夠還原配方人員的經(jīng)驗以及實際生產(chǎn)中配方維護(hù)的過程,且利用該方法可以生成候選卷煙配方維護(hù)方案,有效減少卷煙配方維護(hù)工作量。

猜你喜歡
互信息列表卷煙
巧用列表來推理
學(xué)習(xí)運(yùn)用列表法
擴(kuò)列吧
基于互信息的貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)學(xué)習(xí)
聯(lián)合互信息水下目標(biāo)特征選擇算法
改進(jìn)的互信息最小化非線性盲源分離算法
電測與儀表(2015年9期)2015-04-09 11:59:22
基于增量式互信息的圖像快速匹配方法
不含3-圈的1-平面圖的列表邊染色與列表全染色
卷煙包裝痕跡分析
我國卷煙需求預(yù)測研究述評
开化县| 申扎县| 银川市| 沙河市| 辽阳市| 元朗区| 岳普湖县| 沙湾县| 迁西县| 镇江市| 鸡东县| 余庆县| 宣武区| 微山县| 亳州市| 安溪县| 武宁县| 焦作市| 威信县| 平谷区| 共和县| 安塞县| 康乐县| 广安市| 福州市| 博客| 资中县| 云霄县| 同仁县| 兰溪市| 甘泉县| 淄博市| 杂多县| 石城县| 邻水| 呈贡县| 晋江市| 莱州市| 宁海县| 迁西县| 格尔木市|