薛寶燕,郭東鋒,邵伏文,劉炎紅,郭建,裴洲洋
(1.安徽省煙草專賣(mài)局(公司)煙葉管理處,安徽 合肥 230022;2.安徽中煙工業(yè)有限責(zé)任公司技術(shù)中心,安徽 合肥230088;3.安徽皖南煙葉有限責(zé)任公司,安徽 宣城 242000)
大量研究表明,卷煙主流煙氣中的氫氰酸是煙葉中含氮化合物通過(guò)燃燒裂解產(chǎn)生的[1–3],氫氰酸的釋放受到煙葉原料產(chǎn)地、部位、年份等[4–5]的影響,卷煙的溫度平衡時(shí)間[6]、輔材[7]、配方打葉[8]、工藝參數(shù)[9]、化學(xué)添加劑[10–11]、抽吸方式[12]等對(duì)氫氰酸的釋放也有較大影響,所以,氫氰酸釋放量的大小復(fù)雜而多變。圍繞主流煙氣釋放研究,運(yùn)用統(tǒng)計(jì)學(xué)、數(shù)據(jù)挖掘或機(jī)器學(xué)習(xí)等手段[13–14]研究了焦油、氫氰酸、一氧化碳等煙氣成分。MINE (maximal information-based nonparametric exploration)是2011年由David N. Reshef 等[15]研究開(kāi)發(fā)的一種探索連續(xù)型變量間關(guān)系的新算法,目前在煙草科研中鮮有應(yīng)用。筆者擬以氫氰酸與煙葉中主要含氮化合物的關(guān)系疏密為研究對(duì)象,運(yùn)用MINE 算法探索氫氰酸與含氮化合物之間的關(guān)系,以期為卷煙“減害降焦”提供技術(shù)參考。
選取2012年度貴州(興義、貴陽(yáng)),遼寧鳳城,云南(大理、石林、玉溪),江西贛州,陜西(商洛、安康),湖南(鳳凰、桂陽(yáng)、寧鄉(xiāng)),河南(宜陽(yáng)、三門(mén)峽),廣西百色,湖北宜昌,安徽宣城,重慶黔江濯水,福建南平,四川涼山煙區(qū)的B2F、C3F、X2F共計(jì)60個(gè)樣品,采用統(tǒng)一輔材進(jìn)行單料煙的卷制。
1.2.1 煙氣氫氰酸檢測(cè)
按照YC/T 403—2011 測(cè)定煙樣氫氰酸。
1.2.2 煙葉化學(xué)成分的測(cè)定
氨基酸含量的測(cè)定按照YC/T 282—2009 進(jìn)行; 總氮及煙堿的測(cè)定按照YC/T 160—2002 和YC/T 161—2002 進(jìn)行;煙葉硝酸根離子和蛋白質(zhì)含量測(cè)定分別參照文獻(xiàn)[16]和[17]方法進(jìn)行。
數(shù)據(jù)整理在Microsoft Excel 中進(jìn)行,統(tǒng)計(jì)分析及作圖在R3.1 開(kāi)源軟件平臺(tái)進(jìn)行。采用拉依達(dá)(PauTa)準(zhǔn)則(3σ 準(zhǔn)則)對(duì)數(shù)據(jù)進(jìn)行清洗整理,對(duì)整理后出現(xiàn)的缺失值采取KNN(最近鄰法)進(jìn)行補(bǔ)缺。HCN 與含氮化合物間相關(guān)分析采用皮爾遜(Pearson)相關(guān)分析法。MINE 算法在R3.1 開(kāi)源軟件平臺(tái)實(shí)現(xiàn)。
對(duì)煙葉中氫氰酸以及主要含氮化合物和氨基酸含量的統(tǒng)計(jì)描述列于表1。氫氰酸含量變幅為154~316mg/支,數(shù)據(jù)形態(tài)呈現(xiàn)出右偏態(tài)尖頂峰,變異系數(shù)達(dá)16.43%,數(shù)據(jù)分布較為離散;煙葉中硝酸根離子變異系數(shù)為52.10%,變異較大,數(shù)據(jù)形態(tài)呈現(xiàn)出右偏態(tài)平頂峰,變幅在0.004 8%~0.068 2%,數(shù)據(jù)分布離散較大;煙葉中總氮和蛋白質(zhì)變異系數(shù)均在15%以下,總氮變幅在1.14%~2.09%,蛋白質(zhì)變幅在3.74%~6.49%,數(shù)據(jù)分布相對(duì)集中;煙堿含量變異系數(shù)33.70%,變幅在1.13%~3.94%,數(shù)據(jù)呈現(xiàn)出右偏態(tài)平頂峰,數(shù)據(jù)分布較為離散;氨基酸含量變異廣泛,除亮氨酸變異系數(shù)為19.17%外,其余氨基酸變異系數(shù)均超過(guò)了20%,其中蘇氨酸、谷氨酸、丙氨酸、纈氨酸、蛋氨酸、色氨酸、賴氨酸、脯氨酸和氨基酸總量變異在20%~50%,而天冬氨酸、甘氨酸、半胱氨酸、異亮氨酸、絡(luò)氨酸、苯丙氨酸、組氨酸和精氨酸變異系數(shù)均超過(guò)了50%,氨基酸含量在煙葉中存在較大變異,數(shù)據(jù)離散程度較高。
表1 烤煙煙葉氫氰酸與含氮化合物含量統(tǒng)計(jì)描述 Table 1 Statistical description for HCN yields and contents of nitrogen compositions of flue-cured tobacco leaf
表1 (續(xù))
對(duì)氫氰酸與主要含氮化合物及氨基酸總量進(jìn)行簡(jiǎn)單相關(guān)分析,結(jié)果見(jiàn)圖1。氫氰酸與煙葉中總氮、煙堿、蛋白質(zhì)、氨基酸總含量呈顯著正相關(guān),與氮堿比呈顯著負(fù)相關(guān)。圖2 表明,氫氰酸釋放量與丙氨酸、半胱氨酸、絡(luò)氨酸、組氨酸、色氨酸和精氨酸呈顯著正相關(guān)。說(shuō)明氫氰酸釋放不僅與含氮化合物總量相關(guān),而且與含氮化合物的種類也存在密切關(guān)系。
由于相關(guān)分析只能簡(jiǎn)單描繪2個(gè)變量間關(guān)系的疏密程度,并能?chē)?yán)格定義變量間的因果邏輯關(guān)系,因此,為了進(jìn)一步探討氫氰酸與煙葉中含氮化合物的關(guān)系,采取MINE 算法對(duì)2組變量間的關(guān)系進(jìn)一步探索。
圖1 氫氰酸與主要含氮化合物相關(guān)分析矩陣 Fig.1 Scatterplot matrix between HCN and main nitrogen compositions
圖2 氫氰酸與氨基酸相關(guān)分析矩陣 Fig.2 Scatterplot matrix between HCN and amino acids in flue-cured tobacco
MINE 算法作為近年來(lái)新開(kāi)發(fā)的應(yīng)用于研究連續(xù)型變量關(guān)系的算法,其主要評(píng)價(jià)指標(biāo)MIC 具有廣泛性和較強(qiáng)的抗干擾能力,可以遍歷探索2個(gè)連續(xù)變量間的關(guān)系,且不局限于線性關(guān)系,還可以探索非線性關(guān)系,甚至是多重函數(shù)疊加的復(fù)雜關(guān)系[15,18]。
為了進(jìn)一步考察氫氰酸釋放量與煙葉中含氮化合物的親疏關(guān)系,在R 開(kāi)源軟件平臺(tái)對(duì)氫氰酸與含氮化合物之間的關(guān)系進(jìn)行了分析,結(jié)果見(jiàn)表2。從MINE 信息提取結(jié)果MIC 指標(biāo)(反映HCN 和含氮化合物之間關(guān)系強(qiáng)弱[15])來(lái)看,總氮/煙堿與HCN 關(guān)系達(dá)0.001 顯著水平,關(guān)系最為密切;其次為總氮、煙堿、蛋白質(zhì),均達(dá)到0.05 顯著水平;與HCN 關(guān)系密切的氨基酸包括半胱氨酸、精氨酸以及谷氨酸,其他氨基酸與HCN 關(guān)系親疏程度不同,但是并未達(dá)到顯著水平(在樣本容量n=60 條件下)??梢钥闯?,HCN 主要與煙葉中的總氮、煙堿、蛋白質(zhì)以及氨基酸(半胱氨酸、谷氨酸、精氨酸)關(guān)系最為密切。
煙葉中的總氮、蛋白質(zhì)是HCN 生成的主要來(lái)源。本研究結(jié)果表明,HCN 與煙葉常規(guī)化學(xué)成分中總氮、煙堿存在顯著的關(guān)系,這與黃朝章等[19]的研究結(jié)論一致??偟煞侄?,從具體含氮化合物單體來(lái)看,煙堿對(duì)HCN 的形成有直接影響,氨基酸中的半胱氨酸、谷氨酸、精氨酸對(duì)煙氣成分中的HCN 有直接作用;王晶等[17]研究認(rèn)為,所有堿性氨基酸和雜環(huán)氨基酸都與氫氰酸呈顯著正相關(guān),所有酸性氨基酸與氫氰酸都沒(méi)有顯著相關(guān)性,同時(shí)還認(rèn)為對(duì)煙草主流煙氣中氫氰酸釋放量起主要作用的氨基酸依次是苯丙氨酸、色氨酸、組氨酸、丙氨酸、脯氨酸和絲氨酸,這與本研究結(jié)論有一定差異。這可能是對(duì)于數(shù)據(jù)分析所采用的方法不同所致,另一方面筆者傾向于認(rèn)為相關(guān)關(guān)系僅能表達(dá)變量間關(guān)系疏密,但是從邏輯推演上來(lái)看,因果邏輯關(guān)系尚需要回歸等參數(shù)或非參數(shù)方法支撐。由于煙葉中含氮化合物種類、含量的差異性,以及受數(shù)據(jù)分布形態(tài)、統(tǒng)計(jì)方法的運(yùn)用等影響,針對(duì)含氮化合物單體的研究也不排除其他研究結(jié)果或結(jié)論的可靠性。
表2 基于MINE 算法的氫氰酸與含氮化合物關(guān)系信息提取 Table 2 Extracted information for the relationship between HCN and nitrogen compositions based on MINE algorithm
氫氰酸是卷煙煙氣中7 種有害成分之一,對(duì)卷煙的危害性指數(shù)有著重要的影響。對(duì)氫氰酸和煙葉中主要含氮化合物的相關(guān)分析表明,主流煙氣中的氫氰酸與煙葉中的總氮、煙堿、蛋白質(zhì)、氨基酸總含量以及游離氨基酸中的丙氨酸、半胱氨酸、絡(luò)氨酸、組氨酸、色氨酸和精氨酸呈顯著正相關(guān)關(guān)系,與氮堿比呈顯著負(fù)相關(guān)關(guān)系。運(yùn)用MINE 算法考察氫氰酸與主要含氮化合物的關(guān)系表明,氫氰酸與總氮、煙堿、蛋白質(zhì)以及氨基酸關(guān)系最為密切。
綜合分析認(rèn)為,煙氣中氫氰酸的釋放量與煙葉中的總氮關(guān)系最為密切,同時(shí)氫氰酸的釋放還與蛋白質(zhì)、游離氨基酸中的特定氨基酸(總量、半胱氨酸、谷氨酸、精氨酸)高度相關(guān),與鄭宏偉等[20]研究天門(mén)冬氨酸的裂解行為結(jié)論有相似之處。
由于氫氰酸是卷煙在700~1 000℃燃燒時(shí)產(chǎn)生的,而卷煙燃燒又受輔材、配方、燃燒狀態(tài)等的影響,煙葉中的含氮化合物還包括葉綠素、TSNAs、氨、酰胺等重要化合物,對(duì)這些化合物還需要進(jìn)一步跟蹤檢測(cè)。MINE 算法雖可以得出氫氰酸與含氮化合物的關(guān)系親疏,但是其具體函數(shù)或非函數(shù)關(guān)系需要進(jìn)一步探索研究,由于本研究所用方法為機(jī)器學(xué)習(xí)MINE 算法,與傳統(tǒng)線性分析略有不同,因此,該方法的進(jìn)一步拓展應(yīng)用尚需要更深入的實(shí)踐和研究。
[1] 謝劍平,劉惠民,朱茂祥.卷煙煙氣危害性指數(shù)研究[J].煙草科技,2009(2):5–15.
[2] 謝劍平.CORESTA 熱點(diǎn)研究問(wèn)題[J].中國(guó)煙草學(xué)報(bào),2006,12(1):13–16.
[3] 王彥亭,謝劍平,張虹,等.降低卷煙煙氣中有害成分的技術(shù)研究及應(yīng)用[J].中國(guó)煙草學(xué)報(bào),2003,9(3):3–9.
[4] 王濤,鮑峰偉,王劉勝,等.卷煙主流煙氣七種有害成分釋放量與煙葉產(chǎn)地、年份之間的關(guān)系[J].湖北農(nóng)業(yè)科學(xué),2014(6):1330–1333.
[5] 陳敏,郭吉兆,鄭賽晶,等.煙葉部位、產(chǎn)地與卷煙主流煙氣7 種有害成分釋放量關(guān)系研究[J].中國(guó)煙草學(xué)報(bào),2012,18(5):16–22.
[6] 許永,張霞,劉巍,等.溫濕度平衡時(shí)間對(duì)卷煙主流煙氣氫氰酸釋放量影響的研究[J].應(yīng)用化工,2012(7):1140–1142.
[7] 曾萬(wàn)怡,向能軍,龔為民,等.紙質(zhì)濾嘴棒對(duì)卷煙主流煙氣中有害物質(zhì)的影響[J].中國(guó)造紙,2014(6):35–39.
[8] 趙樂(lè),彭斌,于川芳,等.輔助材料設(shè)計(jì)參數(shù)對(duì)卷煙7種煙氣有害成分釋放量的影響[J].煙草科技,2012(10):46–50.
[9] 陳昆燕,馮廣林,李東亮,等.打葉復(fù)烤各工序?qū)頍熤髁鳠煔鈿淝杷崤c苯并[a]芘和巴豆醛釋放量的影響[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(bào):自然科學(xué)版,2014,40(2):144–147.
[10] 者為,廖頭根,王明鋒,等.均苯三甲酸合銅選擇性降低卷煙主流煙氣中的HCN[J].煙草科技,2014(10):45–48.
[11] 周宛虹,孫文梁,王律,等.胺基修飾的介孔二氧化硅選擇性降低卷煙煙氣中的氫氰酸[J].煙草科技,2013(4):42–45.
[12] 許永,張霞,劉巍,等.抽吸方式對(duì)卷煙主流煙氣中氫氰酸釋放量的影響[J].中國(guó)煙草學(xué)報(bào),2011,17(6):4–7.
[13] 王浩軍,郭東鋒,杜叢中,等.基于關(guān)聯(lián)規(guī)則的皖南焦甜香煙葉外觀特征分析[J].中國(guó)煙草科學(xué),2014,35(5):93–97.
[14] 侯小東,杜詠梅,劉新民,等.分類樹(shù)模型在煙草農(nóng)業(yè)研究中的應(yīng)用[J].中國(guó)煙草科學(xué),2012,33(5):93–96.
[15] Reshef D,Reshef A,F(xiàn)inucaneK,et al.Detecting novel associations in large data sets[J].Science,2011,334:1518–1524.
[16] 許自成,張莉,肖漢乾,等.烤煙硝酸鹽、亞硝酸鹽含量與若干品質(zhì)指標(biāo)的典型相關(guān)分析[J].鄭州輕工業(yè)學(xué)院學(xué)報(bào),2005(1):43–46.
[17] 王晶,胡立中,朱棟梁,等.煙葉中游離態(tài)氨基酸與卷煙主流煙氣中氫氰酸的相關(guān)關(guān)系[J].光譜實(shí)驗(yàn)室,2012(6):3793–3797.
[18] 拉羅斯.?dāng)?shù)據(jù)挖掘方法與模型[M].劉燕權(quán),等,譯.北京:高等教育出版社,2011:116–180.
[19] 黃朝章,蔡國(guó)華,趙藝強(qiáng),等.單料煙主流煙氣HCN與煙葉常規(guī)化學(xué)成分的相關(guān)性[J].煙草科技,2013(2):62–64.
[20] 鄭宏偉,劉新建,崔偉,等.天門(mén)冬氨酸熱裂解行為對(duì)卷煙煙氣成分的影響[J].湖北農(nóng)業(yè)科學(xué),2014(9):2149–2152.
湖南農(nóng)業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版)2015年5期