張志成++侯開虎++陳興侯++劉雅琴++姚洪發(fā)++張慧
摘要:為解決多因素內在化學成分對不同品種煙葉的影響分析,為實現(xiàn)生產過程質量均勻化奠定基礎,通過ANTARIS II近紅外光譜儀采集不同等級的成品煙葉煙堿、總糖、還原糖、總氮、K和CL六種化學成分含量。采用灰熵關聯(lián)分析方法,分析分為七個步驟:通過對原始數(shù)據進行規(guī)格化處理;計算出不同等級煙葉的各評價指標相對于最優(yōu)參考序列、最差參考序列的關聯(lián)系數(shù);計算不同等級煙葉不同指標關聯(lián)系數(shù)密度分布值;根據每種指標所占的權重計算權重密度分布值;計算灰色關聯(lián)熵;計算灰色熵關聯(lián)度;形成不同等級成品煙葉樣品的相對關聯(lián)度,根據灰色熵關聯(lián)度進行不同等級煙葉的聚類分析。以麒麟復烤廠的23個等級成品煙的六個化學成分為分析對象,最后聚為五個類別,每個類別在六個指標含量上總是最接近的。通過把灰色熵關聯(lián)方法建立的煙葉聚類模型與傳統(tǒng)感官品吸結論進行比較,證實通過灰色熵關聯(lián)方法建立的煙葉聚類模型與傳統(tǒng)品吸結論比較吻合,可以用此方法對選后煙葉進行分析,建立復烤加工配方的參考模型,有利于提高配方的科學性,在均質化生產模型建立上邁進重要的一步。
Abstract: In order to solve the influence of multi-factor intrinsic chemical composition on different varieties of tobacco leaves, and lay the foundation for achieving the homogenization of the production process the nicotine, different levels of finished tobacco tobacco nicotine, total sugar, reducing sugar, total nitrogen, K and CL six chemical composition content were obtained by ANTARIS II near infrared spectroscopy. Using the gray entropy correlation analysis method, the analysis is divided into seven steps: normalizing the raw data; calculating the correlation coefficient of the evaluation index of different grades of tobacco leaves relative to the optimal reference sequence and the worst reference sequence; calculating different grades and the relative entropy degree of the samples with different grades of finished tobacco leaves, according to the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, the gray entropy correlation degree, Clustering analysis of different grades of tobacco leaves. The six chemical constituents of the 23 grade grades of the Kirin re-drying factory were analyzed for the five categories, each of which was always the closest to the six indicators. he tobacco leaf clustering model established by the gray entropy correlation method was compared with the traditional sensory absorption theory. It was confirmed that the tobacco leaf clustering model established by the gray entropy correlation method was consistent with the traditional method. This method can be used to analyze post-election tobacco leaves, the establishment of re-roasting processing formula reference model is conducive to improving the scientific formula, and in the homogenization of the establishment of an important step in the production model.
關鍵詞:煙葉內在化學成分;加權;灰熵關聯(lián)分析;聚類分析
Key words: tobacco leaf internal chemical composition;weighting;gray entropy correlation analysis;cluster analysisendprint
中圖分類號:S572 文獻標識碼:A 文章編號:1006-4311(2018)02-0186-05
0 引言
經過近幾十年的發(fā)展,我國煙葉的總體質量正在穩(wěn)步的提高,但相對于國外而言,中國的煙葉質量的總體水平并不高。成品煙葉的質量往往是決定卷煙質量的根本,煙葉復烤環(huán)節(jié)也就成了煙草生產過程中至關重要的環(huán)節(jié)。朱尊權[1]指出:“煙葉的化學性質和物理性質往往決定煙葉的質量”。左天覺[2]指出:“煙葉的可用性或者說契合性就是煙葉的質量”。復烤過程的質量均勻性和穩(wěn)定性是提升產品質量的要求?;瘜W成分對均質化生產的研究一直以來都是煙草行業(yè)研究的重點,陰耕云[3]等人用化學指標衡量打葉復烤片煙均質性進行了研究;符在德等[4,5]以化學成分均質性為研究目標,進行了化學指標均值性評價和初烤煙精選分級等相關問題。
隨著大數(shù)據研究浪潮的來臨,統(tǒng)計學的諸多方法,已經開始廣泛地應用在煙葉質量測評方面,灰色關聯(lián)分析法就是目前比較常見的基于煙葉化學成分對煙葉質量進行測評的方法。楊進文[6]等人用灰色關聯(lián)度對煙草不同模塊的化學成分進行分析;譚仲夏[7,8]運用灰色關聯(lián)對不同品種煙葉內在質量進行了分析?;疑P聯(lián)分析法能夠處理樣本量不大并且并不一定具有典型分布或線性關系的數(shù)據,相對于傳統(tǒng)的通經分析、聚類分析和多元回歸分析等方法具有更佳的適用性和實用性。
灰色系統(tǒng)利用較少的原始數(shù)據進一步挖掘一些未知的信息,目的是尋求體系中的規(guī)律,用于解釋所研究的問題,其灰色模型對數(shù)據的容量大小和概率分布沒有嚴格要求,適用性較強[9]。與此同時,現(xiàn)有的灰色關聯(lián)方法存在一些缺點:測度值分布離散的情況下測度值大的決定了總體關聯(lián)度的偏向;計算測度值平均值的辦法掩蓋了許多測度值的個性,造成信息的損失?;诨疑P聯(lián)分析方法的缺點,本文采用了改進了的灰關聯(lián)分析方法,一定程度上彌補了灰關聯(lián)法的缺點[10,11]。近年來,對模糊系統(tǒng)的問題研究的灰色方法被廣泛運用在各種研究中,灰色熵關聯(lián)分析也被廣泛運用,但在煙草行業(yè)的研究中還比較少見。
本文采用灰色關聯(lián)熵方法對麒麟復烤廠成品煙葉的化學成分進行綜合評價。通過采集不同等級的成品煙葉樣本作為研究對象,利用ANTARIS II近紅外光譜儀對煙葉的主要化學成分進行檢測,主要檢測指標包括:煙堿、總糖、還原糖、總氮、K和Cl,然后利用灰色關聯(lián)熵分析法,引入不同化學成分的衡量比重,通過相對灰熵加權關聯(lián)度作為成品煙葉聚類測度,建立成品煙葉內在化學成分的灰色關聯(lián)熵分析聚類模型。
1 灰色關聯(lián)熵分析模型
灰色關聯(lián)分析模型就是對運行機制模糊的灰色關系進行模式化和序列化,然后量化和序化灰色關系,因此對復雜系統(tǒng)建模時灰色關聯(lián)分析是研究問題的重要手段?;疑P聯(lián)分析的原理是通過比較數(shù)列與參考數(shù)列幾何形狀的相似程度來判斷因素間關聯(lián)程度,這種方法能夠很好的解決線性關系不明確的問題?;谊P聯(lián)分析存在一定的缺點,例如局部點的關聯(lián)傾向,信息的損失,因此,根據有關的研究[10]認為,灰關聯(lián)熵分析法能有效的克服灰色關聯(lián)度分析法的缺點,是改進了的灰關聯(lián)分析方法。
灰關聯(lián)熵分析法分析確定因子間影響程度的有效方法,基本步驟:①采用標準化、初值化和均值化等無量綱化方法對原始數(shù)據進行轉換;②進一步計算出序列對應參考序列的關聯(lián)系數(shù);③求出灰熵關聯(lián)分布的密度值;④求出序列灰關聯(lián)熵;⑤依據序列灰熵關聯(lián)度的大小進行排序,關聯(lián)度值越大說明序列間關聯(lián)性越好。
1.1 參考序列的選擇
設選取的樣品數(shù)為m,選取的評價指標數(shù)為n,由此評價單元序列表示為{Xak}(a=1,2,3,…,m;k=1,2,3,…,n;本研究中m=23,n=5)。
灰色關聯(lián)分析選擇一組序列作為參考序列,其他的序列為比較序列,通過比較序列和參考序列的相似程度判斷聯(lián)系的緊密性,參考序列的選擇沒有既定的標準,一般選擇最優(yōu)參考序列和最差參考序列分別比較。設最優(yōu)參考序列為{Xsk}(k=1,2,3,…,n),對應所選樣本各項指標的最大值,最差參考序列為{Xtk}(k=1,2,3,…,n),對應所選樣本各項指標的最小值[12-14]。
1.2 原始數(shù)據無量綱化處理
測量指標間的數(shù)據差異往往較大,測量數(shù)據不統(tǒng)一,無法進行序列之間的比較,應對原始數(shù)據進行標準化處理。灰關聯(lián)度分析的數(shù)據規(guī)格化處理就是對數(shù)據無量綱化處理,無量綱化方法常用的有初值化和均值化,這里采用了均值化對數(shù)據進行處理。設處理后的數(shù)據為Yik,初始數(shù)據為Xik,XK為樣本指標均值,公式如下:
Yik=Xik/XK (1)
1.3 關聯(lián)系數(shù)的計算[12-14]
1.3.1 與最優(yōu)參考序列比較的關聯(lián)系數(shù)按式(2)計算:
)
1.3.2 相對于最差參考序列的關聯(lián)系數(shù)計算公式為:
1.4 關聯(lián)熵的計算
按照式(4)計算灰色關聯(lián)系數(shù)分布的密度值,按照式(5)計算加權分布密度值,按照式(6)計算灰關聯(lián)熵,按照式(7)計算灰熵關聯(lián)度。設各個指標的權重為λk[15]。
1.5 定義并計算相對灰熵關聯(lián)度
對于最優(yōu)參考灰熵關聯(lián)度ri (s)越大,同時對于最差參考灰熵關聯(lián)度ri (t)越小,表示所評價序列越理想,被比較單元序列{Xik}相對于{Xsk}和{Xtk}的相對灰熵關聯(lián)度為[10]:
根據相對灰熵關聯(lián)度的大小對評價的序列進行排序。
2 成品煙葉化學成分的灰色關聯(lián)度模式聚類分析
2.1 樣本數(shù)據集的建立
用近紅外光譜儀對選定的23個等級成煙的6個化學指標進行測定,并計算其所占的含量百分比,建立評價成品煙葉質量的灰色模式識別數(shù)據集,如表1所示。
2.2 原始數(shù)據無量綱化處理endprint
將原始數(shù)據按公式(1)進行規(guī)范化處理,結果如表2所示;并計算各評價單元序列相對最優(yōu)(差)參考序列的差值。
2.3 關聯(lián)系數(shù)與關聯(lián)度的計算
根據麒麟復烤廠復烤過程質量控制的標準,各化學成分的權重為:煙堿占0.4;總糖占0.2;還原糖占0.2;總氮占0.1,K占0.05,CL占0.05,依據公式(2),(3),(4),(5),(6),(7)分別計算各評價單元相對于最優(yōu)參考序列、最差參考序列的關聯(lián)系數(shù)和關聯(lián)度,結果如表3,4,5所示。
2.4 相對灰熵關聯(lián)度的計算
依據公式(6)計算23個批次成品煙葉的相對灰熵關聯(lián)度,并進行排序,確定不同等級成品煙葉化學指標排序,結果如表6所示。
2.5 煙葉品種的聚類分析
通過使用SPSS軟件,選擇K-均值聚類法根據表6中的灰熵關聯(lián)度對煙葉品種進行聚類分析,根據最終聚類中心把煙葉品種分為4個等級,如表7所示。與麒麟復烤廠長期以來對煙葉品吸的分類比較,本論文所建立的聚類分析模型與經驗所得的分類結論吻合,分類上更加細致準確。
3 小結與討論
通過采集麒麟復烤廠不同等級的成品煙葉樣本,利用檢測儀器得出其主要化學成分的各項指標,最后得出了23個等級成品煙葉的相對灰熵關聯(lián)度,并進行了化學指標含量排序,最后得到表6。再用K-均值聚類法對樣本種類進行分類,共分為5個類別,從表7中可以看出,B2F、B3F、B(2F、BB03、BB01、B03等級的煙葉內在化學成分最為接近,B01、CF03、F03、C4C03、CC03等級的煙葉內在化學成分最為接近,YCC03、C3FL、C4X2F、C3X2F、C4F、X03、X30、X2F等級的煙葉內在化學成分最為接近,此結論與傳統(tǒng)感官判斷得出的結論比較吻合。因此,可以利用灰色系統(tǒng),加入各化學指標所占的權重,以定義的灰熵相對關聯(lián)度為測度的方法,對選后煙葉進行分析,建立復烤廠選后煙葉內在化學成分的灰色關聯(lián)熵聚類模型,代替?zhèn)鹘y(tǒng)的統(tǒng)感官判斷方法來確定煙葉進行配比方案,保證煙葉內在化學成分的均勻性,從而保證產品的質量的均質化。此模型的使用有利于實現(xiàn)煙葉品質判定的數(shù)據化和科學化,為不同客戶的煙葉配方的確定提供新的數(shù)據支撐。
參考文獻:
[1]朱尊權.煙葉的可用性與卷煙的安全性[J].煙草科技,2000,8.
[2]左天覺.煙葉質量和可用性理論模型工[J].煙草科技通訊,1977(04):54-61.
[3]陰耕云,徐世濤,侯讀成,等.以化學指標衡量打葉復烤片煙均質性的初步研究.中國煙草學會工業(yè)專業(yè)委員會2010年煙草工藝學術研討會論文集[C].
[4]符在德.煙葉化學成分檢測及其在打葉復烤均質化加工中的研究與應用[D].吉首大學.
[5]李東亮.基于化學成分的煙草質量評價方法研究與應用[D].鄭州:河南農業(yè)大學,2008.
[6]楊進文,史雨剛,王曙光,等.用灰色關聯(lián)度對煙草不同模塊化學成分分析[J].山西工業(yè)大學學報,2013,33(2).
[7]譚仲夏.應用灰色關聯(lián)對不用品種煙葉內在質量的分析[J].中國農學通報,2006,22(8).
[8]馮連軍,朱列書,朱靜嫻.湖南烤煙煙葉主要物理特性與主要化學指標間的灰色關聯(lián)度分析[J].安徽農業(yè)大學學報,2012,39(1):140-143.
[9]Liu S, Forrest J, Yang Y. A summary of the progress in grey system rese-arch[C]//Grey Systems and Intelligent Services, 2013 IEEE International
[10]張岐山,郭喜江.灰關聯(lián)熵分析方法[J].系統(tǒng)工程理論與實踐,1996(8):7-11.
[11]劉思峰,蔡華,楊英杰,等.灰色關聯(lián)分析模型研究進展[J]. 系統(tǒng)工程理論與實踐,2013,33(8):2041-2046.
[12]譚仲夏,秦西云.灰色關聯(lián)分析方法在煙草內在質量評價上的應用[J].安徽農業(yè)科學,2006,34(5):924.
[13]李碩,李成義,李敏,等.基于灰色關聯(lián)分析方法評價商品甘草藥材質量[J].中國實驗方劑學雜志,2015,21(1):89-94.
[14]王平,王云峰.綜合權重的灰色關聯(lián)分析法在河流水質評價中的應用[J].水資源保護,2013(05):52-54,64.
[15]吳喜榮.基于灰關聯(lián)熵分析法的瀝青混合料抗裂性能影響因素分析[J].水利與建筑工程學報,2017(02):92-95,137.endprint