国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于決策樹和正交試驗(yàn)設(shè)計(jì)的打葉復(fù)烤工藝參數(shù)優(yōu)化

2020-12-07 08:48:31黃小艷趙廣仁黃晶謝俊力賈智偉
天津農(nóng)業(yè)科學(xué) 2020年9期
關(guān)鍵詞:參數(shù)優(yōu)化正交試驗(yàn)決策樹

黃小艷 趙廣仁 黃晶 謝俊力 賈智偉

摘? ? 要:打葉復(fù)烤過程的工藝參數(shù)設(shè)置是穩(wěn)定煙葉質(zhì)量的關(guān)鍵,為了提高煙葉質(zhì)量的穩(wěn)定性,本文提出了一種基于決策樹與正交試驗(yàn)設(shè)計(jì)的參數(shù)優(yōu)化方法。使用決策樹算法模型挖掘與分析打葉復(fù)烤歷史數(shù)據(jù)的工藝參數(shù)與出口水分指標(biāo)之間的關(guān)系,得到工藝參數(shù)對(duì)指標(biāo)的影響權(quán)重排序,由此設(shè)計(jì)因素水平表進(jìn)行正交試驗(yàn)設(shè)計(jì),根據(jù)試驗(yàn)結(jié)果對(duì)決策樹模型進(jìn)行驗(yàn)證與修正,并獲得較優(yōu)參數(shù)組合,現(xiàn)場(chǎng)驗(yàn)證表明修正后的預(yù)測(cè)結(jié)果與實(shí)際相比誤差小于5%,所獲得的參數(shù)組合充分滿足現(xiàn)場(chǎng)需求。

關(guān)鍵詞:打葉復(fù)烤;參數(shù)優(yōu)化;決策樹;正交試驗(yàn)

中圖分類號(hào):TS443? ? ? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? DOI 編碼:10.3969/j.issn.1006-6500.2020.09.015

Abstract: The setting of technological parameters in threshing and redrying process is the key to stabilize the quality of tobacco leaves. In order to improve the stability of tobacco quality, a parameter optimization method based on decision tree and orthogonal experimental design was proposed. The decision tree algorithm model was used to mine and analyze the relationship between the process parameters of threshing and redrying and the export moisture index from historical data, and the influence weight of the process parameters on the indexes was obtained. The orthogonal experiment design was carried out by designing the factor level table. According to the experimental results, the decision tree model was verified and modified, and the optimal combination of parameters was obtained. The field verification showed that the modified model was feasible since the error between prediction and the actual results was less than 5%, and the obtained parameter combination fully met the field demand.

Key words: threshing and redrying; process parameter optimization; decision tree; orthogonal experiment

打葉復(fù)烤是卷煙生產(chǎn)加工中不可缺少的一部分,穩(wěn)定煙草打葉復(fù)烤質(zhì)量一直是企業(yè)面臨的重要問題,合理設(shè)置工藝參數(shù)是解決這一問題的有效方法。在煙葉打葉復(fù)烤加工過程中,煙葉水分的穩(wěn)定性是多年來業(yè)界關(guān)注的重要課題,加工設(shè)備的工藝參數(shù)設(shè)置通常為現(xiàn)場(chǎng)技術(shù)人員根據(jù)經(jīng)驗(yàn)和現(xiàn)場(chǎng)臨時(shí)情況進(jìn)行調(diào)整,囿于現(xiàn)場(chǎng)人員的經(jīng)驗(yàn)和能力差異,煙葉水分指標(biāo)常常難以達(dá)到理想水平。因此,這一過程中的工藝參數(shù)優(yōu)化成為關(guān)注的重點(diǎn)。楊洋等[1]利用層次分析法(AHP)和正交試驗(yàn)對(duì)指定的煙葉進(jìn)行檢驗(yàn),經(jīng)過多組對(duì)比試驗(yàn),得出能顯著提高烤煙品質(zhì)的參數(shù)組合。通過設(shè)置不同的潤(rùn)葉參數(shù)并觀察潤(rùn)二的出口煙葉溫度變化,徐國(guó)金[2]發(fā)現(xiàn),適當(dāng)增加風(fēng)機(jī)頻率和潤(rùn)葉段的蒸汽用量可以顯著改善出口的濕度和溫度。吳芳等[3]對(duì)3種不同產(chǎn)地的煙葉試驗(yàn)了11組的不同來自經(jīng)驗(yàn)的參數(shù)組合,試驗(yàn)結(jié)果與唐瑩[4]的研究結(jié)果類似:針對(duì)不同產(chǎn)地的煙葉原料,適合的工藝參數(shù)設(shè)置會(huì)讓打葉復(fù)烤的質(zhì)量水平得到較大提高。劉彥嶺等[5]采用均勻試驗(yàn)與多元線性回歸分析建立了潤(rùn)葉段的2個(gè)指標(biāo)與各工藝參數(shù)的調(diào)整模型,該模型可以準(zhǔn)確地控制和優(yōu)化潤(rùn)葉效果。然而,這些參數(shù)優(yōu)化研究大多是基于現(xiàn)場(chǎng)人員或企業(yè)的經(jīng)驗(yàn),即使較少的模型建立與分析,數(shù)據(jù)也來源于根據(jù)經(jīng)驗(yàn)參數(shù)設(shè)置得到的指標(biāo),對(duì)歷史數(shù)據(jù)的挖掘不夠,所設(shè)計(jì)試驗(yàn)代表性存在問題,因此,本文通過采用決策樹方法對(duì)歷史生產(chǎn)工藝參數(shù)與出口濕度關(guān)系進(jìn)行分析和建模,選取重要工藝參數(shù)建立因素水平表,設(shè)計(jì)正交試驗(yàn)方案,驗(yàn)證并修正模型,獲得最優(yōu)參數(shù)組合,采用現(xiàn)場(chǎng)試驗(yàn)對(duì)最優(yōu)參數(shù)組合進(jìn)行檢驗(yàn)。

1 材料和方法

1.1 試驗(yàn)材料

郴州復(fù)烤廠2019年全年生產(chǎn)工藝參數(shù)及煙草指標(biāo)數(shù)據(jù),包括A3CD1、A2CD2、A4CH1、B3F、C3F、C2FABCD等煙葉等級(jí)。全年工藝參數(shù)記錄119 472項(xiàng),每項(xiàng)記錄包括潤(rùn)葉區(qū)8項(xiàng)參數(shù)、打葉區(qū)5項(xiàng)參數(shù)、復(fù)燥區(qū)13項(xiàng)參數(shù),相當(dāng)于打葉、復(fù)燥區(qū)26項(xiàng)參數(shù)。正交試驗(yàn)和最后驗(yàn)證采用材料為郴州C3F。

1.2 系統(tǒng)概述

算法設(shè)計(jì)如圖1所示。對(duì)原始?xì)v史數(shù)據(jù)進(jìn)行預(yù)處理后,用決策樹進(jìn)行訓(xùn)練,通過輸入?yún)?shù)組合預(yù)測(cè)輸出,建立決策樹模型。根據(jù)模型所得的工藝參數(shù)重要性排序設(shè)計(jì)正交試驗(yàn)方案。依據(jù)正交試驗(yàn)結(jié)果修正決策樹模型,并進(jìn)行極差分析獲得最優(yōu)參數(shù)組合,利用改進(jìn)的決策樹模型對(duì)指標(biāo)進(jìn)行預(yù)測(cè)和驗(yàn)證。

1.3 數(shù)據(jù)預(yù)處理

煙葉的工藝參數(shù)及理化指標(biāo)數(shù)據(jù)來源于打葉復(fù)烤過程中的生產(chǎn)線數(shù)據(jù)采樣采集系統(tǒng)。這些數(shù)據(jù)直接反映了煙葉在打葉復(fù)烤過程中的實(shí)時(shí)情況。由于該過程由多個(gè)生產(chǎn)環(huán)節(jié)組成,數(shù)據(jù)預(yù)處理階段應(yīng)消除異常值和缺失值,為后續(xù)的模型訓(xùn)練和數(shù)據(jù)挖掘提供高質(zhì)量的數(shù)據(jù)。

根據(jù)打葉復(fù)烤工藝參數(shù)的順序構(gòu)造輸入空間X,空間的向量為x(x1,x2,…,xp ),p=26,。打葉復(fù)烤的質(zhì)量指標(biāo)主要由煙葉產(chǎn)量水分值決定,計(jì)算公式如下:

一般優(yōu)化的目標(biāo)為Y = 12%[6]。

1.4 數(shù)據(jù)處理

對(duì)郴州復(fù)烤廠2019年之前的歷史數(shù)據(jù)按照70%和30%的比例進(jìn)行抽取,分別作為CART決策樹[7-8]的訓(xùn)練集和測(cè)試集,獲得工藝參數(shù)特征對(duì)煙葉出口水分的映射,采用機(jī)器學(xué)習(xí)方法Scikit_learn 模塊中的Decision tree Regression模型對(duì)訓(xùn)練數(shù)據(jù)集進(jìn)行擬合。

回歸過程中,為了使決策樹回歸模型最優(yōu)化,主要對(duì)模型里的超參數(shù)max_depth(樹最大深度)進(jìn)行優(yōu)化[9-10]。為了更好地評(píng)估回歸模型的性能,將使用均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)作為模型指標(biāo),定義如下:

其中均方根誤差(RMSE)對(duì)回歸中的特大特小誤差反應(yīng)非常敏感,能夠很好地反映出回歸的精確度,而平均絕對(duì)誤差(MAE)則能較好的描述預(yù)測(cè)值與實(shí)際值的離散程度。

1.5 算法模型評(píng)價(jià)

表1是經(jīng)過決策回歸樹模型不同超參數(shù)的優(yōu)化之后的實(shí)際值和預(yù)測(cè)值的均方根誤差、平均絕對(duì)誤差和出口水分特征的精確度的對(duì)比。由表1可知,對(duì)于多維度的輸入樣本X,決策樹模型經(jīng)過優(yōu)化后最好的精確度達(dá)到95.91%,說明 CART決策樹回歸算法對(duì)訓(xùn)練集和驗(yàn)證集具有較好的適應(yīng)性。

表2是精確度最高時(shí)(max_depth=10)決策樹模型的特征重要度排序,表示模型中對(duì)出口水分指標(biāo)影響較大的的工藝參數(shù)的排序,由于指標(biāo)涉及到26個(gè)不同的參數(shù),同時(shí)每個(gè)變量的取值范圍都比較大,所以難以使用遍歷方法來對(duì)參數(shù)的范圍和水平選取進(jìn)行優(yōu)化,根據(jù)現(xiàn)場(chǎng)需求,設(shè)計(jì)正交試驗(yàn)方案求取最優(yōu)參數(shù)組合。

1.6 基于特征重要度的正交試驗(yàn)設(shè)計(jì)

正交試驗(yàn)設(shè)計(jì)是研究多因素多水平的一種試驗(yàn)設(shè)計(jì)方法。當(dāng)試驗(yàn)涉及的因素在3個(gè)或3個(gè)以上,而且因素間可能有交互作用時(shí),試驗(yàn)工作量會(huì)變得很大,甚至難以全面實(shí)施。針對(duì)這個(gè)困擾,正交試驗(yàn)設(shè)計(jì)是一種更好的選擇。正交試驗(yàn)設(shè)計(jì)的主要工具是正交表,根據(jù)試驗(yàn)的因素?cái)?shù)、因素的水平數(shù)以及是否具有交互作用等需求查找相應(yīng)的正交表,依托正交表從全面試驗(yàn)中挑選出部分有代表性的點(diǎn)進(jìn)行試驗(yàn),可以實(shí)現(xiàn)以最少的試驗(yàn)次數(shù)達(dá)到與全面試驗(yàn)等效的結(jié)果。針對(duì)本次試驗(yàn)的多維度多水平的實(shí)際情況,采用正交試驗(yàn)設(shè)計(jì),既能在滿足試驗(yàn)條件的同時(shí)又能保障煙葉復(fù)烤廠的經(jīng)濟(jì)效應(yīng)性[11-12]。

應(yīng)用決策樹模型得到工藝參數(shù)特征重要度排序(表2)后,考慮到生產(chǎn)現(xiàn)場(chǎng)可提供的煙葉試驗(yàn)次數(shù)有限,每個(gè)因素選取3個(gè)水平,根據(jù)生產(chǎn)現(xiàn)場(chǎng)技術(shù)人員的實(shí)際經(jīng)驗(yàn)確定各因素的水平取值,獲得9因素3水平的正交設(shè)計(jì)表L27(93)(表3)進(jìn)行正交試驗(yàn)設(shè)計(jì)。對(duì)應(yīng)的具體工藝參數(shù)選擇實(shí)施方案見表4,針對(duì)不同的工藝參數(shù)組合,利用決策樹模型可以預(yù)測(cè)相應(yīng)的出口煙葉水分值,同樣列在表4中。

2 結(jié)果與分析

對(duì)表4中的正交試驗(yàn)方案進(jìn)行現(xiàn)場(chǎng)檢驗(yàn)可以獲得對(duì)應(yīng)出口水分實(shí)際值,與預(yù)測(cè)水分值相比,兩者存在一定的差距,因此將所獲得的27組現(xiàn)場(chǎng)數(shù)據(jù)以2∶7的比例分別加入訓(xùn)練集和測(cè)試集,加大訓(xùn)練集中現(xiàn)場(chǎng)數(shù)據(jù)的權(quán)重后重新訓(xùn)練,獲得的新的預(yù)測(cè)值與實(shí)際出口水分值得對(duì)比如圖2所示,兩者差距小于5%。相同等級(jí)(郴州C3F)葉片理化特性的年際差異可能是造成這種差異的主要原因,符合現(xiàn)場(chǎng)的實(shí)際情況,驗(yàn)證了決策樹模型的適應(yīng)性。

根據(jù)正交試驗(yàn)設(shè)計(jì)組合,采用極差分析法對(duì)正交試驗(yàn)方案對(duì)應(yīng)結(jié)果進(jìn)行分析。因子A的K1為A第一水平因素對(duì)應(yīng)的各試驗(yàn)指標(biāo)之和的平均值。由于本試驗(yàn)不考慮交互作用,因此3組方案A1、A2、A3在相同試驗(yàn)條件下執(zhí)行。如果A對(duì)試驗(yàn)指標(biāo)沒有影響,那么輸出KA1, KA2, KA3理論上應(yīng)該是相等的,如果實(shí)際上不相等,KA1均值、KA2均值和KA3均值的值分別反映了A1、A2和A3對(duì)試驗(yàn)指標(biāo)的影響。由于水分值應(yīng)盡可能接近12%(實(shí)際要求),筆者單獨(dú)調(diào)整A,使A因素的水平達(dá)到最優(yōu),其他因素的最優(yōu)水平也用相同方法得到。

極差分析法得到的最優(yōu)參數(shù)組合如表6所示。對(duì)應(yīng)的決策樹模型預(yù)測(cè)的水分值為12.44,現(xiàn)場(chǎng)試驗(yàn)值為11.93,差值為0.51,相對(duì)誤差為4.27%,滿足現(xiàn)場(chǎng)要求。

3 結(jié)論與討論

由于歷史數(shù)據(jù)均來源于正常生產(chǎn)的歷史記錄,相應(yīng)的工藝參數(shù)設(shè)置往往由現(xiàn)場(chǎng)經(jīng)驗(yàn)決定,參數(shù)范圍具有局限性和不完整性的特點(diǎn),所以基于歷史數(shù)據(jù)的決策樹模型泛化能力存在天然的不足,特別當(dāng)試驗(yàn)參數(shù)與現(xiàn)場(chǎng)經(jīng)驗(yàn)參數(shù)設(shè)置相差較大時(shí),預(yù)測(cè)結(jié)果可能與現(xiàn)場(chǎng)試驗(yàn)結(jié)果相差較大。改善這一問題的有效方法是擴(kuò)大歷史數(shù)據(jù)的取值范圍以及樣本數(shù)量。

本研究采用決策樹模型對(duì)打葉復(fù)烤工藝參數(shù)與出口水分的關(guān)系進(jìn)行建模,以工藝參數(shù)為自變量,出口水分指標(biāo)為因變量形成映射,并對(duì)模型超參數(shù)進(jìn)行最優(yōu)化,優(yōu)化后模型精確度為95.91%。由于可供試驗(yàn)的次數(shù)較少,根據(jù)決策樹模型的特征重要度獲得工藝參數(shù)的重要性排序,由此設(shè)計(jì)正交試驗(yàn)方案,根據(jù)正交試驗(yàn)結(jié)果修正模型,并采用極差分析獲得最優(yōu)參數(shù)組合,將該工藝參數(shù)組合的現(xiàn)場(chǎng)試驗(yàn)結(jié)果與模型預(yù)測(cè)進(jìn)行對(duì)比,發(fā)現(xiàn)誤差為0.51,相對(duì)誤差小于5%。這一對(duì)比表明所采用的決策樹模型預(yù)測(cè)效果良好,可以為打葉復(fù)烤前的工藝參數(shù)決策提供良好的幫助。決策樹與正交試驗(yàn)設(shè)計(jì)所形成的最優(yōu)參數(shù)組合具有較好的現(xiàn)場(chǎng)效果,滿足現(xiàn)場(chǎng)生產(chǎn)需要。

參考文獻(xiàn):

[1]楊洋,楊雨波,吳昊,等.煙草加工中打葉復(fù)烤工藝參數(shù)優(yōu)化[J].農(nóng)業(yè)工程,2018, 8(8):83-85.

[2]徐國(guó)金.不同潤(rùn)葉設(shè)備參數(shù)對(duì)潤(rùn)葉質(zhì)量的影響[J].農(nóng)業(yè)與技術(shù),2017,37(6):99.

[3]吳芳,喻文蓉,李德綜,等.不同工藝參數(shù)的設(shè)定與打葉復(fù)烤質(zhì)量的關(guān)系[J].科技與企業(yè),2012(14):324.

[4]唐瑩.打葉復(fù)烤工藝參數(shù)優(yōu)化探討[J].科技傳播,2013,5(16):134-135.

[5]劉彥嶺,王澤理,周強(qiáng),等.打葉復(fù)烤潤(rùn)葉段水分溫度控制模型的建立[J].安徽農(nóng)學(xué)通報(bào),2017,23 (22):109-111.

[6]吳洪田,李曉紅,崔焰,等.打葉煙葉質(zhì)量檢驗(yàn): YC/T147 -2010[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,2011.

[7]蘇志同,汪武珺.基于隨機(jī)森林的煅燒工藝參數(shù)的研究和分析[J].軟件,2018,39(4):148-150.

[8]BOGDAN Z, VUKOBRATOV IC,RASTISLAV J R. Struharik. Co-processor for evolutionary full decision tree induction[J]. Microprocessors and microsystems,2016,45: 253-269.

[9]張長(zhǎng)水. 統(tǒng)計(jì)機(jī)器學(xué)習(xí)若干理論、方法與應(yīng)用研究[D]. 北京:清華大學(xué),2008.

[10]BAS B L, PENNING DE V,MAARTEN V S,et al.? Propensity score estimation using classification and regression trees in the presence of missing covariate data[J]. Epidemiologic methods,2018,7(1): 20-49.

[11]盧幼祥,徐其敏,楊波,等.基于正交設(shè)計(jì)的皖南煙葉葉片復(fù)烤工藝參數(shù)優(yōu)化研究[J].安徽農(nóng)業(yè)科學(xué),2015,43(27):218-219,224.

[12]戰(zhàn)磊,肖明禮,尹智華,等.復(fù)烤溫度對(duì)西南清香型煙葉質(zhì)量的影響[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2018,44(2):136-139,150.

猜你喜歡
參數(shù)優(yōu)化正交試驗(yàn)決策樹
一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹算法
決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
電子制作(2018年16期)2018-09-26 03:27:06
基于神經(jīng)網(wǎng)絡(luò)的動(dòng)力電池組焊接參數(shù)優(yōu)化研究
傾斜式子棉清理機(jī)工作質(zhì)量影響因素分析
復(fù)方萬年青膠囊神經(jīng)保護(hù)作用成分的水提取工藝研究
研究LTE與WCDMA系統(tǒng)間小區(qū)互操作與參數(shù)優(yōu)化
基于磁流變技術(shù)的汽車發(fā)動(dòng)機(jī)隔振系統(tǒng)的參數(shù)優(yōu)化
科技視界(2016年23期)2016-11-04 08:17:36
基于MADYMO的航空座椅約束系統(tǒng)優(yōu)化設(shè)計(jì)
科技視界(2016年18期)2016-11-03 21:44:44
祁山藥醇提物提取工藝研究
科技視界(2016年20期)2016-09-29 11:36:29
基于決策樹的出租車乘客出行目的識(shí)別
舒城县| 梁山县| 宁强县| 棋牌| 类乌齐县| 潮安县| 永嘉县| 错那县| 孟津县| 交口县| 郎溪县| 东兰县| 新营市| 阜阳市| 荣成市| 淮阳县| 加查县| 同仁县| 正宁县| 乌兰县| 桃园县| 乳山市| 七台河市| 瑞金市| 丰台区| 丁青县| 什邡市| 乐安县| 连云港市| 太白县| 青田县| 仲巴县| 汝阳县| 册亨县| 盘山县| 大英县| 阜康市| 北川| 林芝县| 中宁县| 南华县|