杜 文,張其龍,易建華,黃振軍,任建新
湖南中煙工業(yè)有限責(zé)任公司技術(shù)中心,長沙市勞動中路426號 410007
按產(chǎn)地、品種和等級細(xì)分煙葉原料超過千種,配方人員需要進(jìn)行大量的單料煙評吸和試制工作來維護(hù)卷煙產(chǎn)品內(nèi)在質(zhì)量的穩(wěn)定。通過客觀檢測數(shù)據(jù)來評價不同煙葉間的可替代性對于卷煙產(chǎn)品設(shè)計具有重要的意義[1]。然而,目前我國煙草工業(yè)企業(yè)普遍使用的糖、氮、堿、氯等煙葉常規(guī)化學(xué)成分指標(biāo)在煙葉內(nèi)在質(zhì)量評價中只能起到非常有限的參考作用[2-3]。因此,進(jìn)行了本研究,旨在為卷煙產(chǎn)品葉組設(shè)計和配方打葉設(shè)計提供參考。
2004年度片煙樣品,按產(chǎn)地、等級和品種不同取樣80類,每類均為工業(yè)企業(yè)作為同一種煙葉使用的原料。每類煙葉取樣12~60個,共取樣2482個,取自儲存了一年左右的湖南中煙工業(yè)有限責(zé)任公司的片煙倉庫。
M PA型近紅外光譜儀(德國B ruker公司),配積分球和旋轉(zhuǎn)樣品臺采樣附件;Cyc lotec 1093型旋風(fēng)磨(瑞典Foss公司)。
1.2.1 樣品常規(guī)化學(xué)指標(biāo)的近紅外檢測
樣品于40℃下烘干,粉碎,過40目篩。用近紅外(N IR)光譜儀采集煙末樣品的漫反射近紅外光譜,掃描條件:分辨率8 cm-1,光譜范圍4000~9000 cm-1,重復(fù)掃描64次。用N IR模型預(yù)測煙末樣品的總糖、總氮、總堿、氯、纖維素、淀粉、多酚、灰份、醚提取物總量和總揮發(fā)堿。
1.2.2 煙葉集之間的可替代性評價
在超過30個樣本的類中隨機(jī)取15個樣品構(gòu)成一類,共取30類450個樣品作外部檢驗集,編號V 1~V 30。剩余的2032個樣品作目標(biāo)集,共80類,編號D1~D 80。編號序號x相同的外部檢驗集樣品Vx和目標(biāo)集樣品Dx具有相同的產(chǎn)地、等級和品種屬性。
設(shè)某煙葉集X1有n1個樣本,某煙葉集X2有n2個樣本,每個樣本均有p個檢測指標(biāo),那么評價煙葉X1與X2之間是否可替代可用多元統(tǒng)計中的均值檢驗問題來表示:對于協(xié)方差不同的兩個多元正態(tài)分布,其均值差異檢驗被稱作Behrens-Fisher問題[4-5],在此問題中,若兩個多元正態(tài)分布X1,X2的樣本數(shù)n1,n2均大于數(shù)據(jù)維數(shù)p,可依據(jù)近似T2分布檢驗樣本均值所屬的總體均值(μ1,μ2)是否相同[6],即兩組樣本是否有顯著性差異:
對于假設(shè)H0:μ1-μ2=0,顯著性水平為α的拒絕臨界值c2可由F分布計算[7]:
式中:ν=
進(jìn)行多元近似T2檢驗的前提是多元變量要符合正態(tài)分布。因此,依據(jù)正態(tài)分布的特點(diǎn)對多個變量逐一進(jìn)行正態(tài)分布檢驗[8]。即計算2482個樣本的10項化學(xué)成分指標(biāo)的xj-zj數(shù)據(jù),每100個樣本為一段,每項指標(biāo)得到25對xj-zj數(shù)據(jù),以總堿為例,x1為從小到大排列的第100個檢測值(0.89),z1為累積概率為(100的正態(tài)分布累積點(diǎn)(-1.75),依次計算,得到總堿檢測值的x-z關(guān)系圖(圖1)。計算每項化學(xué)成分檢測值x-z數(shù)據(jù)的線性相關(guān)系數(shù),評價其分布的正態(tài)性,結(jié)果,總糖、總堿、總氮、淀粉、纖維素、多酚、灰份、揮發(fā)堿、氯、醚提取物總量的相關(guān)系數(shù)分別為0.9727,0.9806,0.9933,0.9936,0.9964,0.9981,0.9983,0.9939,0.9309,0.9904。自由度為25,顯著性水平α為0.05的線性相關(guān)檢驗臨界值為0.9591。由此可見,除氯以外,其他9項指標(biāo)均超過該臨界值,即這9項指標(biāo)可視作符合正態(tài)分布,可以進(jìn)行多元近似T2檢驗。
若兩個多樣本多變量數(shù)據(jù)集中各變量符合正態(tài)分布,且兩個分布的協(xié)方差等價,則其均值向量是否有顯著性差異可用Hotelling’s T2檢驗來判斷[9]。由于煙葉化學(xué)成分的波動受農(nóng)業(yè)、流通、工業(yè)等環(huán)節(jié)多種復(fù)雜因素的影響,各類煙葉的化學(xué)成分值分布有顯著的不同[10],不同數(shù)據(jù)集間協(xié)方差等價的條件不具備,故用Box’sM-test[7]檢驗樣本數(shù)分別為n1和n2的兩個p元數(shù)據(jù)集的協(xié)方差S1和S2是否等價,對于假設(shè)H0:Σ1=Σ2,統(tǒng)計量C符合卡方(χ2)分布:
圖1 煙葉總堿檢測值(x)-正態(tài)分布累積點(diǎn)(z)關(guān)系圖
給定顯著性水平α,拒絕H0的臨界值為:(α)。
用式(3)對80類煙葉中樣本數(shù)大于30的30個數(shù)據(jù)集的協(xié)方差進(jìn)行兩兩配對檢驗,結(jié)果見圖2。由圖2可見,對于9項檢測指標(biāo)p=9,檢驗臨界值(0.05)=61.6,大部分C值超出了該臨界值,表明各分布的協(xié)方差不能視作等價。
圖2 協(xié)方差等價性檢驗
對于協(xié)方差不等價的多元分布,需要用近似Hotelling’s T2檢驗判斷分布之間是否有顯著性差異[4]。
用式(1)計算檢驗集V 1~V 30與目標(biāo)集D 1~D 80之間的T2值,用式(2)計算其在顯著性水平α=0.01下的拒絕臨界值c2,以T2/c2值判斷兩煙葉數(shù)據(jù)集是否有顯著性差異,若T2/c2<1,則表明兩種煙葉無顯著性差異,即具有可替代性。計算結(jié)果見表1。表1數(shù)據(jù)顯示:①檢驗集30類煙葉(V 1~V 30)與目標(biāo)集(D 1~D 30)的T2/c2<1,而與其他目標(biāo)集的T2/c2>1,表明檢驗集30類煙葉都被正確地判斷為與其原來所屬的目標(biāo)煙葉具有可替代性,并與其他目標(biāo)煙葉不具有可替代性,本研究采用的煙葉替代性評價方法分辨性好;②T2/c2>1的結(jié)果,可以用來作為評價煙葉數(shù)據(jù)集相似性的度量,T2/c2值越小,煙葉間的相似性越高,替代使用的可行性越高。譬如,檢驗集V 22(瀏陽C2L)與目標(biāo)集D 23(瀏陽C3F)間的T2/c2值為1.33,說明瀏陽C2L和瀏陽C3F較相似,相互替代使用有較高的可行性。
表1 檢驗集與目標(biāo)集間的近似T2檢驗結(jié)果(T2/c2值從小到大排序前6位)①
(續(xù)表1)
用總糖、總堿、總氮、淀粉、纖維素、多酚、灰份、揮發(fā)堿和醚提取物總量9項化學(xué)成分指標(biāo)通過多元均值檢驗評價煙葉間的可替代性具有較高的準(zhǔn)確性,T2/c2值越小,相似性越高,T2/c2值可為相似煙葉的尋找提供有價值的線索。如果加入更多化學(xué)成分指標(biāo)信息,煙葉可替代性判別的可靠性應(yīng)會更高。
[1] Dale Hill.迎接挑戰(zhàn)——認(rèn)識煙葉的質(zhì)量和可用性[J].煙草科技,1997(1):34-36.
[2] 薛超群,尹啟生,王信民,等.烤煙煙葉香氣質(zhì)量與其常規(guī)化學(xué)成分的相關(guān)性[J].煙草科技,2000(9):27-30.
[3] 朱尊權(quán).煙葉的可用性與卷煙的安全性[J].煙草科技,2000(8):3-6.
[4] R ichard A J,Dean W W.Applied Multivariate Statistical Analysis(6 th Edition)[M].Hongkong:Pearson Education Asia Ltd.,2007:291-296.
[5] NelD J,Vander Merwe C A.A solution to the multivariate Behrens-Fisher problem[J].Comm unications in Statistics–Theory and Methods,1986,15:3719-3735.
[6] Krishnamoorthy K,Yu J Modified Nel,Van der Mer we.Test for the multivariate Behrens-Fisher problem[J].Statistics&Probability Letters,2004,66:161-169.
[7] Box G E P.Prob lem s in the analysis of growth and wear curves[J].Biometrics,1950(6):362-389.
[8] Filliben J J.The probability plot correlation coefficient test for normality[J].Technometrics,1975,17(1):111-117.
[9] Chou YM,Mason R L,Young J C.Power comparisons for a Ho telling’s T2statistic[J].Communications in Statistics,PartB-Simulation and Computation,1999,28:1031-1050.
[10]杜文,譚新良,易建華,等.用煙葉化學(xué)成分進(jìn)行煙葉質(zhì)量評價[J].中國煙草學(xué)報,2007,13(3):25-31.