李石頭,廖 付,何文苗,張立立,帖金鑫,李永生,郝賢偉,田雨農(nóng),畢一鳴,吳繼忠,王 輝,徐清泉
浙江中煙工業(yè)有限責任公司技術(shù)中心,杭州市西湖區(qū)科海路118 號 310024
卷煙的品質(zhì)和風格特色是產(chǎn)品設(shè)計人員通過對不同產(chǎn)地、品種、等級的煙葉進行配比而形成的。在某種原料用完后,需通過單料煙評吸、配方評吸等環(huán)節(jié)來確定替代煙葉或替代配方。煙葉替代及配方工作強度大、主觀性強,主要依賴于配方人員的經(jīng)驗積累及評吸判斷。若能通過儀器檢測方法,利用客觀數(shù)據(jù)來輔助配方,對提高卷煙質(zhì)量穩(wěn)定性有重要意義[1-4]。
近年來,近紅外光譜檢測技術(shù)以其快速、無損和低成本等優(yōu)點,在農(nóng)業(yè)、化工、食品等行業(yè)有廣泛的應(yīng)用[5]。利用近紅外光譜結(jié)合化學計量學方法,可以實現(xiàn)煙葉常規(guī)化學[6]、部位[7]、產(chǎn)地[8]的識別及風格特征分析[9]。然而,無論是化學指標模型或者光譜投影,僅能從部分角度對煙葉進行評價,在輔助配方工作中時有發(fā)生計算結(jié)果與配方人員的感官評價不符且難以解釋的現(xiàn)象。相似度是一種從整體上刻畫兩個圖譜一致性的方法,在化學領(lǐng)域常用于利用中紅外光譜或氣質(zhì)聯(lián)用色譜對化合物進行鑒定。
近紅外光譜沒有顯著的特征峰,且圖譜受基線、散射、噪聲等影響,因而對近紅外光譜相似方面的研究鮮有報道。本研究中,提出一種基于近紅外光譜相似表征煙葉相似的煙葉替代方法,通過光譜預(yù)處理與光譜相似算法的結(jié)合,抑制光譜中干擾因素的影響,旨在建立基于光譜相似的片煙相似、片煙組合相似的卷煙配方維護技術(shù)。
2015—2017 年用于卷煙配方的復(fù)烤片煙,包括我國的云南、四川、河南、湖南、湖北、貴州、山東、廣西、福建以及巴西、津巴布韋等產(chǎn)區(qū),共計400個(由浙江中煙工業(yè)有限責任公司技術(shù)中心提供)。
片煙樣本取樣后在低于50 ℃下烘干4 h 左右,直到可以用手指捻碎為準。利用Foss Cyclotec 1093旋風磨(丹麥福斯公司)進行磨粉,樣本粉末過60目(孔徑250 μm)篩。取適量煙末放入樣品杯中,取一固定質(zhì)量砝碼放置在樣品上方,使其自然壓實后進行近紅外掃描。近紅外光譜由美國TheromFisher公司Antaris II型傅里葉變換近紅外光譜儀采集,采集范圍為10 000~4 000 cm-1,光譜分辨率為8 cm-1;掃描次數(shù)為72次。為避免散射的影響,近紅外光譜進行了Savitzky-Golay(SG)平滑和標準正態(tài)校正處理。
1.3.1 光譜預(yù)處理
儀器采集的近紅外光譜受基線、散射等影響,需進行適當?shù)念A(yù)處理才可計算光譜相似度[10]。常用的預(yù)處理方法有導(dǎo)數(shù)法[11]、多元散射校正(Multiplicative Scatter Correction,MSC)[12]、標準正態(tài)變量校正(Standard Normal Variate Correction,SNV)[13]等算法。一階導(dǎo)數(shù)譜和二階導(dǎo)數(shù)譜是紅外光譜預(yù)處理中的常用方法。通過求一階導(dǎo)數(shù)可以消除光譜中的常數(shù)項差異,例如常數(shù)性基線;二階導(dǎo)數(shù)譜可以消除光譜的一次項差異。MSC 和SNV 方法是常用的散射校正算法。兩種方法均假定光譜中含有一個乘性和一個加性干擾項,通過全譜來估計校正參數(shù)。這類方法的缺點是光譜中由物質(zhì)含量變化導(dǎo)致的光譜形變同樣被引入到校正參數(shù)的估計中,致使參數(shù)估計不準確。為此,使用局部校正(Localized Standard Normal Variate Correction,LSNV)來估計校正參數(shù),從而得到更靈活的模型和更好的校正效果[14]。局部校正模型可以表示為:
其中:xj為第j 個波段的原始光譜;xjcorr表示第j個波段校正后的光譜;aj、bj分別代表第j 個波段的校正參數(shù),j=1,2,…,k,k表示光譜波段數(shù)。圖1展示了局部校正效果,其中,a1…a5表示加性校正參數(shù),b1…b5表示乘性校正參數(shù)。
圖1 局部校正算法(LSNV)示意圖Fig.1 Schematic diagram of localized standard normal variate correction algorithm
1.3.2 光譜相似度算法
(1)光譜相關(guān)映射Spectral correlation measure(SCM)[15]
光譜相關(guān)映射表征光譜形態(tài)的相似性,以相關(guān)系數(shù)的形式計算兩條光譜的相似度。
其中:n為光譜變量數(shù);xi,yi為兩條光譜第i波數(shù)的吸光度值,i=1,2,…,n為光譜平均值。
(2)歐幾里得距離Euclidean distance measure(EDM)[16]
歐幾里得距離直接計算了歐氏空間中兩條光譜幅值(吸光度)的差異。將光譜假定為歐氏空間中的向量,光譜相似性轉(zhuǎn)化為向量之間距離大小。
其中:n為光譜變量數(shù);xi,yi為兩條光譜第i波數(shù)的吸光度值,i=1,2,…,n。
(3)光譜信息散度Spectral information divergence(SID)[17]
散度源自于信息測度理論,每個光譜向量均可以視為具有概率統(tǒng)計特性的信息源,兩條光譜的概率pi、qi可以描述為:
兩條光譜的相對熵為:
其中:n為光譜變量數(shù);xi,yi為兩條光譜第i波數(shù)的吸光度值,i=1,2,…,n;X,Y表示兩條近紅外光譜。
最后,根據(jù)兩條光譜之間的相對熵可得到光譜的信息散度(SID):
SCM表征了光譜形態(tài)的相似性,相關(guān)性越大,說明光譜獨立程度越弱,相似性越高;EDM 衡量了光譜間的距離差異,距離越小,則光譜之間相似性越高;SID 將光譜看作是概率分布,通過衡量光譜之間的互信息大小確定兩條光譜之間的相似程度,散度越小,光譜相似度越高。相關(guān)性、距離和散度是相似性度量的幾種不同的表現(xiàn)形式,通過研究,采用涵蓋3 種度量的方式表征相似度(Spectral similarity,SS)[18],SS越小,相似性越高。
近紅外光譜主要是對含氫基團X-H(X=C、N、O)振動的倍頻和合頻的吸收光譜,其中包含了煙葉中大多數(shù)類型有機化合物的組成和結(jié)構(gòu)信息,而煙葉風格和品質(zhì)特點主要由這些化學物質(zhì)及其含量決定的。近紅外光譜作為煙葉中各有機物的一種表征形式,基本可以從整體上反映煙葉的綜合品質(zhì);基于光譜的物質(zhì)基礎(chǔ),再通過合理的樣本選擇、光譜處理、特征波數(shù)選擇以及相似度算法,達到以光譜相似來表征煙葉相似的目的。
利用光譜相似進行煙葉替代分為兩個步驟,對于由多個片煙組成的被替代目標,不是直接求解一個多片煙擬合光譜與目標光譜相似,而是針對目標中的每一個片煙,用光譜相似的方式確定若干個備選片煙,再通過擬合光譜的方式找出與目標最相似的組合。
這種方式的優(yōu)點在于遵循了配方中“相似替代”的常用原則。對于目標中的每個片煙,都以光譜相似的形式,約束了其候選樣本在化學、部位、香型等方面與目標片煙的差異程度,從而保障了目標葉組與替代葉組在煙葉“配伍性”等方面的接近程度,最大限度地避免了計算相似但感官評價不相似的問題。在第二步中,通過計算機可以根據(jù)各個片煙候選集模擬出大量配方,再以相似度為依據(jù)篩選出與目標煙葉組合最接近的替代煙葉組合。
1.5.1 三點評吸方法(Triangular Test)[19]
由10位從事煙葉原料及配方工作的評吸人員組成評價小組(10人均為男性,均獲得國家煙草質(zhì)量監(jiān)督檢驗中心頒發(fā)的感官評吸證書,并具有5年以上卷煙感官評吸經(jīng)驗)。通過人工卷制煙支,選取單支質(zhì)量為(860±70)mg 的煙支在平衡箱(濕度(60±2)%、溫度(20.0±0.5)℃)內(nèi)平衡24 h,然后采用三點評吸的方法進行感官評價。
1.5.2 描述評價方法
評吸人員組成和煙支樣品制備方法同1.5.1。采用企業(yè)煙葉質(zhì)量感官評價方法,由評價小組采用定量打分和文字描述相結(jié)合的方法對香氣質(zhì)、香氣量、刺激性、余味、成團性、雜氣、柔和性等方面進行評價打分,評分范圍為0~10 分。在每個樣本評價結(jié)束后,以10人評價小組的平均值作為該樣本各指標的分值。
首先考察在不同預(yù)處理方式下,光譜相似與煙葉相似間的關(guān)系。對庫存片煙進行相似度的計算,利用公式7,對任意一個片煙,計算其與庫存所有片煙的光譜相似度。然后將計算結(jié)果按相似度大小排序,統(tǒng)計與目標片煙最接近的片煙在產(chǎn)地、部位、化學等指標的相似程度。
從表1 中可以看出,在不進行任何預(yù)處理時,相似片煙與目標片煙的產(chǎn)地、部位符合度分別只有57.3%和52.3%,主要化學成分總糖和煙堿的相對偏差分別為6.1%和9.9%。幾項指標的差異性都高于人的感官差異閾值。經(jīng)過預(yù)處理后,得到的相似片煙與目標片煙在各項指標的一致性都有提升,其中,使用一階導(dǎo)數(shù)+局部校正LSNV 的預(yù)處理方法結(jié)果最好,產(chǎn)地與部位符合度分別達到82.0%和75.7%。經(jīng)分析發(fā)現(xiàn),產(chǎn)地不匹配的樣本常分布于云南、四川、貴州交界處,部位不匹配的樣本常由C4F等級構(gòu)成,其相似片煙為下部模塊。在化學成分含量方面,所提出的方法計算的相似片煙與目標片煙差異最小,因此,經(jīng)過恰當?shù)念A(yù)處理和計算,光譜相似可以在產(chǎn)地、部位、常規(guī)化學等方面表征煙葉相似。
表1 不同預(yù)處理方法下光譜相似與煙葉相似的關(guān)系Tab.1 Relationship between spectral similarity and tobacco similarity under different pre-processing methods (%)
將2.1 中的相似度計算應(yīng)用于煙葉替代過程中。對某季度二類卷煙牌號A 進行庫存測算后,確定7 個需要替代的片煙(配方占比為35%)。對于每一個目標片煙,分別計算庫存400個片煙與其的光譜相似度,按相似度大小進行排序,分別給出一定數(shù)量的片煙候選集合。
通過設(shè)定一個經(jīng)驗的相似度閾值,可以篩選出每個目標片煙所選出的相似片煙。由于云南、貴州等地片煙較多,經(jīng)驗表明,7 個備選片煙基本能滿足替代要求。因此在相似片煙多于7個時,僅選擇相似度最高的7個片煙作為候選。經(jīng)統(tǒng)計,與目標片煙產(chǎn)地相符的比例為52.9%,部位相符的比例為76.5%。對于產(chǎn)地不符的相似片煙,往往來自于目標產(chǎn)地的相鄰省份。相鄰省份有著相近地理及氣候,其煙葉在風格及品質(zhì)上較為接近。
表2 中根據(jù)光譜相似篩選出片煙ZW15TLS 的相似片煙為2017 年和2015 年的津巴布韋片煙。通過調(diào)查發(fā)現(xiàn),2016年津巴布韋由于氣候異常,導(dǎo)致煙葉生產(chǎn)異常,煙堿偏高,香氣減弱,刺激增大。因此,在相似度篩選中,算法判定2016 年津巴布韋煙葉與目標煙葉不在相似范圍內(nèi)。對于相似度算法篩選出的跨產(chǎn)區(qū)(省份)煙葉,如GZ14CDE 的備選煙葉CQ14CAQ。通過查閱片煙配方發(fā)現(xiàn),GZ14CDE 煙葉主要來自貴州省德江縣,CQ14CAQ煙葉主要來自重慶酉陽縣,兩個縣區(qū)相距僅150千米,在環(huán)境氣候等方面較為相似。
表2 目標片煙及篩選出的相似片煙①Tab.2 Target strips and selected similar strips
在單一煙葉替代實際應(yīng)用中,配方人員對光譜相似篩選出的煙葉還會進行驗證,如表2 中YN16CDC 篩選出的第一相似片煙為GX17XBI,通過評吸發(fā)現(xiàn),除勁頭和煙氣濃度外,在香氣量和香氣質(zhì)等方面,兩個樣本均有一定的差異,在配方人員的建議下,將GX17XBI刪除。這種通過光譜相似篩選片煙,然后經(jīng)過配方專家調(diào)整確認,刪除不恰當?shù)耐扑]目標的形式,可為下一步通過片煙組合模擬配方提供客觀合理的片煙原料。
實驗中,對表2中的相似片煙按目標片煙在卷煙配方中的使用比例進行模擬,在形成多個模擬配方后,按公式7計算模擬片煙組合與目標片煙組合間的相似程度并排序。實驗發(fā)現(xiàn),單一片煙中相似度排序第一的候選片煙在片煙組合中并沒有出現(xiàn)在最接近的替代組合中。需替代的目標煙葉組合及篩選出的替代煙葉組合見表3。從結(jié)果看,除ZW15TLS 出現(xiàn)了多個候選外,其他片煙的候選基本確定且產(chǎn)地、部位與目標較為接近。其中,CQ14CAQ 替代GZ14CDE 的原因已在2.2 節(jié)中進行了分析,而SC16CDE 主要構(gòu)成為四川涼山煙葉,其備選的YN16CHA 主要構(gòu)成為云南煙葉,GZ17CEQ 主要構(gòu)成為貴州畢節(jié)煙葉。目標及備選煙葉產(chǎn)區(qū)相鄰,且都呈現(xiàn)清香型風格。
各個替代煙葉組合和目標煙葉組合的主要化學成分差異見表4。由表4可知,目標煙葉組合與替代煙葉組合的主要化學成分均較為接近,在總糖、煙堿、鉀、氯等指標上基本相同,僅在還原糖上略有差異。
表3 目標煙葉組合及篩選出的替代煙葉組合Tab.3 Target blended tobacco and selected substituted combination
表4 目標煙葉組合及篩選出的替代煙葉組合的主要化學成分差異Tab.4 Differences in main chemical components between target blended tobacco and selected substituted combination (%)
根據(jù)2.3節(jié)分析,綜合考慮相似度排序及化學差異,選取了近紅外模擬配方中與目標接近的1號和2號模擬樣本,分別與目標樣本進行三點評價。三點評價中的原假設(shè)為:不可能根據(jù)特性強度來區(qū)別這兩個樣本。在這種情況下正確識別出單個樣本的概率為P=1/3。備擇假設(shè):可以根據(jù)特性強度來區(qū)別這兩個樣本。在這種情況下正確識別出單個樣本的概率為P>1/3。在兩組實驗中,正確識別出兩個相同樣本的人數(shù)均為3 人,利用二項式模型計算p 值為0.701,遠大于0.05。因此,接受原假設(shè),認為評吸小組無法識別2個樣本間的差異。
對目標組合及兩個替代組合進行感官評價,結(jié)果見表5。評價結(jié)果表明:1號、2號樣本與目標樣本相比,感官質(zhì)量基本保持一致,個別指標略有變化,相比目標樣本,1 號樣本在香氣質(zhì)、香氣量上略有提升,柔和性略欠;2號樣本在香氣量上略欠,但成團性和柔和性較好。兩個樣本的差異均在感官質(zhì)量管控范圍內(nèi),這個結(jié)果也與三點評價的結(jié)果相符。
表5 目標樣本和模擬樣本感官評價分析結(jié)果Tab.5 Sensory evaluation results of target samples and simulation samples
①提出了一種基于近紅外光譜的煙葉替代方法。通過局部校正預(yù)處理及集成光譜相似度算法,排除了光譜中的基線、散射等干擾因素,實現(xiàn)了從光譜相似到煙葉相似的轉(zhuǎn)化。目標煙葉與相似煙葉的產(chǎn)地、部位符合度分別為82.0%、75.7%,總糖、煙堿等主要化學成分的平均差異小于5%。②基于上述算法,提出一種片煙相似+組合相似的卷煙配方維護方法,所選擇的替代配方在化學、感官方面與原配方無顯著差異。