周 密,馮 灝,劉 杰,皮江一,王會(huì)霞,周陶鴻,
彭青枝1,2,張 莉1,2
(1.湖北省食品質(zhì)量安全監(jiān)督檢驗(yàn)研究院,湖北 武漢 430075;2.湖北省食品質(zhì)量安全檢測工程技術(shù)研究中心,湖北 武漢 430075)
蜂蜜是蜜蜂采集植物的花蜜、分泌物或蜜露,與自身分泌物混合后,經(jīng)充分釀造而成的天然甜物質(zhì)[1]。隨著人們健康意識(shí)的提高,蜂蜜作為一種天然食品漸受青睞。自然界中分泌花蜜的植物種類繁多,不同植物來源蜂蜜所具備的活性功能也不盡相同[2],產(chǎn)品價(jià)格更是千差萬別。市場上部分不法商販?zhǔn)芾骝?qū)使,對蜂蜜進(jìn)行摻雜使假,掩蓋或錯(cuò)誤標(biāo)識(shí)蜂蜜蜜源信息是常見的使假手段之一[3]。而我國作為蜂產(chǎn)品出口大國,此種違法現(xiàn)象不僅損害了消費(fèi)者的合法權(quán)益,制約了我國蜂產(chǎn)業(yè)在經(jīng)濟(jì)全球化中的進(jìn)程,更是給國際蜂產(chǎn)業(yè)的健康、可持續(xù)發(fā)展留下隱患。因此,為了保護(hù)消費(fèi)者利益和促進(jìn)生產(chǎn)者的公平競爭,保障蜂產(chǎn)業(yè)的繁榮發(fā)展,對蜂蜜植物源進(jìn)行鑒別研究意義重大。
蜂蜜富含多種礦物質(zhì)元素,占比雖小,但提供了重要的樣品信息[4],能為蜂蜜屬性區(qū)分提供依據(jù),如魏月等[5]分析了云南南部4種植物源蜂蜜中21種礦質(zhì)元素,結(jié)合典型判別分析,對4種蜂蜜的植物源歸屬判別正確率達(dá)90%,表明在氣候和土壤環(huán)境相似的情況下,不同植物源蜂蜜之間礦質(zhì)元素存在差異;陳輝等對蜂蜜產(chǎn)地[6]和植物源[7]的鑒別研究不僅能將來自河北、北京等地的荊條蜜進(jìn)行產(chǎn)地溯源,還能有效鑒別來自不同地區(qū)的荊條、椴樹、洋槐、油菜蜂蜜,表明同種植物源蜂蜜產(chǎn)地之間的差異或小于不同植物源之間引起的差異,因此,利用蜂蜜中多種礦質(zhì)元素對不同地區(qū)蜂蜜樣品進(jìn)行植物源鑒別是可行的。
截尾數(shù)據(jù)(Censored data)指監(jiān)測數(shù)據(jù)中污染物的檢測值小于檢出限或者定量下限的不完全數(shù)據(jù)[8],在食品化學(xué)污染物評價(jià)中不可避免。受限于植物生長自然環(huán)境、樣品狀態(tài)、儀器條件等因素,電感耦合等離子體質(zhì)譜儀(ICP-MS)測定蜂蜜樣品時(shí),截尾數(shù)據(jù)總是客觀存在的,世界衛(wèi)生組織(World health organization,WHO)建議在對食品中低含量污染物進(jìn)行暴露評估過程中,當(dāng)?shù)陀跈z出限的結(jié)果數(shù)據(jù)小于數(shù)據(jù)總量的60%時(shí),所有小于檢出限的結(jié)果均以二分之一檢出限值進(jìn)行替換參與計(jì)算[9]。如Hannah等[10]在評估土壤中鋅、錳元素含量時(shí),比較了替換法(Substitution method)、最大似然估計(jì)法(Maximum likelihood estimation)、次序統(tǒng)計(jì)量回歸法(Regression on order substitution)、生存分析法(Survival analysis)4種不同截尾數(shù)據(jù)處理方法,發(fā)現(xiàn)使用替換法將截尾數(shù)據(jù)按二分之一檢出限值處理時(shí)能較好地計(jì)算樣本幾何平均值。盡管國內(nèi)外有通過ICP-MS進(jìn)行元素分析并建立判別模型鑒別蜂蜜植物源的報(bào)道[5,11],但并未涉及ICP-MS中截尾數(shù)據(jù)對模型判別能力的研究,且識(shí)別模型單一,缺少對模型參數(shù)的優(yōu)化。因此,為提高蜂蜜植物源模型的鑒別能力,有必要建立蜂蜜中ICP-MS截尾數(shù)據(jù)和識(shí)別模型參數(shù)的研究。本文采用ICP-MS測定荊條、洋槐、葵花、油菜4種植物源蜂蜜中的16種金屬元素,再利用替換法按二分之一檢出限值處理截尾數(shù)據(jù)并建立支持向量機(jī)(Support vector machine,SVM)分類模型,并進(jìn)一步通過網(wǎng)格搜索法(Grid search,GS)、遺傳算法(Genetic algorithm,GA)和粒子群優(yōu)化算法(Particle swarm optimization,PSO)3種尋優(yōu)算法優(yōu)化模型參數(shù),有效提高了判別能力,以期為規(guī)范蜂蜜市場秩序提供技術(shù)支持。
NexION 350X型電感耦合等離子發(fā)射光譜質(zhì)譜聯(lián)用儀(美國PerkinElmer公司),檢測器帶電信號(hào)稀釋功能;Multiwave Pro型微波消解儀(奧地利Anton paar公司);BHW-09A24S型恒溫消解趕酸儀(上海博通化學(xué)科技有限公司);WNE29型恒溫水浴鍋(德國Memmert公司);Purelab Chorus型超純水系統(tǒng)(英國ELGA公司)。
硝酸(優(yōu)級(jí)純,德國Merck公司);Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb單元素標(biāo)準(zhǔn)儲(chǔ)備液(1 000 mg/L,國家有色金屬及電子材料分析測試中心);實(shí)驗(yàn)室用水為去離子水。
1.2.1 樣品前處理 樣品收集:蜂蜜樣品來源于武漢市蜂產(chǎn)品質(zhì)量工程控制技術(shù)研究中心,植物源屬性明確。其中,油菜蜜37例,荊條蜜36例,洋槐蜜13例,葵花蜜11例,共計(jì)97例,測試前于-20℃冷凍貯藏。
微波消解程序:設(shè)置微波消解儀最大工作功率1 500 W,在10 min內(nèi)由室溫升溫至120℃,保持5 min;然后在10 min內(nèi)由120℃升溫至180℃,保持20 min。
元素分析前處理:樣品分析前于水浴鍋內(nèi)40℃恒溫水浴至樣品結(jié)晶完全融化,充分混勻后稱取約1 g(精確至0.001 g)樣品至聚四氟乙烯消解罐內(nèi),加入10.0 mL硝酸,放置過夜后于微波消解儀中按上述微波消解程序消解,消解完畢后145℃加熱趕酸至約1.0 mL消化液,轉(zhuǎn)移聚四氟乙烯罐中消化液至50 mL刻度離心管,用水多次洗滌聚四氟乙烯罐內(nèi)壁,合并洗液至刻度離心管中,并定容至50 mL,待測。
參考GB 5009.268-2016《食品安全國家標(biāo)準(zhǔn)食品中多元素的測定》[12]中第一法(ICP-MS法)測定樣品中Na、Mg、Al、K、Ca、Ti、Cr、Mn、Ni、Cu、Zn、As、Se、Cd、Ba、Pb 16種元素,采用碰撞檢測模式消除Ca、Ti、As、Se元素的測定干擾,45Sc、72Ge、103Rh、185Re內(nèi)標(biāo)混合使用溶液由儀器在線加入,質(zhì)量濃度均為200μg/L。
1.2.2 儀器測定條件 霧化器氣體流速0.96 L/min,輔助器氣體流速1 L/min,等離子體氣體流速17 L/min,碰撞池氣體流速(氦氣)5 mL/min,ICP射頻功率為1 500 W,脈沖電壓為875 V,掃描次數(shù)20次,重復(fù)次數(shù)2次,樣品沖洗時(shí)間13 s,讀數(shù)延遲7 s。
1.2.3 數(shù)據(jù)分析 方差分析采用SPSS Statistics 25.0(美國IBM公司)軟件,SVM算法優(yōu)化和數(shù)據(jù)圖繪制采用Matlab 2014a(美國Mathworks公司)軟件。
對荊條、油菜、洋槐、葵花4種植物源蜂蜜中16種元素含量按“1.2”方法分析,97例蜂蜜樣品平行測定3次;連續(xù)測定11次空白(2.0%硝酸溶液),以儀器響應(yīng)值的3倍標(biāo)準(zhǔn)偏差除以工作曲線斜率,按1.0 g試樣定容至50 mL計(jì)算得方法檢出限(LOD),結(jié)果見表1。
表1數(shù)據(jù)顯示,受植物源生長環(huán)境、蜂蜜樣品存儲(chǔ)條件等因素影響,部分樣品中Al、Ti、Cr、Ni、As、Se、Cd、Ba、Pb測試結(jié)果小于方法檢出限(Min
表1 4種不同植物源蜂蜜中16種金屬元素含量Table 1 Contents of metal elements in the four kinds of botanical source honeys (mg/kg,n=3)
支持向量機(jī)是Cortes等[13]基于統(tǒng)計(jì)學(xué)理論提出的一種新的核函數(shù)機(jī)器學(xué)習(xí)算法,在鑒別分類及回歸預(yù)測分析中應(yīng)用廣泛[14-16]。數(shù)據(jù)處理采用Lin等[17]開發(fā),李洋等[18]優(yōu)化的LIBSVM工具箱建立SVM分類模型。首先選取合適的核函數(shù)類型,研究顯示,基于高斯徑向基函數(shù)(Gaussian radial basis function)的SVM模型表現(xiàn)出優(yōu)秀的分類性能,且參數(shù)的優(yōu)化過程簡單[19],因此本研究選擇高斯徑向基函數(shù)建立SVM分類模型。
2.2.1 樣品集的劃分 采用Kennard-Stone法將4種植物源蜂蜜共計(jì)97例樣品按2∶1劃分為訓(xùn)練集和測試集[20],利用訓(xùn)練集建立判別模型,并將測試集作為未知樣品代入模型檢驗(yàn),樣品集劃分如下:訓(xùn)練集65例,其中荊條蜜24例,洋槐蜜9例,葵花蜜7例,油菜蜜25例;測試集32例,其中荊條蜜12例,洋槐蜜4例,葵花蜜4例,油菜蜜12例。
2.2.2 選擇輸入變量建立模型 通過單因素分析選出4種植物源蜂蜜間具有顯著性差異的13種元素Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb,考慮截尾數(shù)據(jù)的存在,將輸入變量分為:①所有樣品均不含截尾數(shù)據(jù)的變量(7種):Na、Mg、K、Ca、Mn、Cu、Zn;②樣品中含截尾數(shù)據(jù)且按二分之一檢出限進(jìn)行替換處理的數(shù)據(jù)變量(13種):Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb。將訓(xùn)練集和測試集數(shù)據(jù)標(biāo)準(zhǔn)化到[1,2]之間,尋優(yōu)參數(shù)設(shè)置為默認(rèn)參數(shù)(懲罰參數(shù)c為1,核函數(shù)參數(shù)g的默認(rèn)值為1/k,k是類別數(shù))[16],將訓(xùn)練集進(jìn)行K折交叉驗(yàn)證(K=3),建立蜂蜜植物源SVM分類模型,將測試集代入模型驗(yàn)證。判別結(jié)果表明,含截尾數(shù)據(jù)建立的SVM分類模型,其訓(xùn)練集、測試集共計(jì)97例樣品的綜合判別正確率達(dá)91.8%,高于不含截尾數(shù)據(jù)所建模型的綜合判別正確率82.5%,表明客觀存在的截尾數(shù)據(jù)中同樣包含較為重要的樣品信息,在建立分類模型時(shí),應(yīng)充分考慮截尾數(shù)據(jù),使用替換法按二分之一檢出限值處理,增加數(shù)據(jù)組輸入變量,以提高模型準(zhǔn)確度。除葵花蜜在兩組變量輸入模型中判別正確率為100%外,其余植物源蜂蜜均存在歸類錯(cuò)誤的情況。含截尾數(shù)據(jù)的訓(xùn)練集中,65例樣品僅4例歸類錯(cuò)誤,判別正確率達(dá)93.8%,而測試集中32例樣品的判別正確率僅為87.5%,可能由于樣品量較少,模型過擬合導(dǎo)致,因此,為進(jìn)一步提高模型穩(wěn)健性,有必要進(jìn)一步優(yōu)化SVM分類模型參數(shù)。
采用高斯徑向基核函數(shù)建立SVM模型時(shí),懲罰參數(shù)c和核函數(shù)參數(shù)g對于控制模型的復(fù)雜度、逼近誤差及模型的測量精度有重要影響,可使用GS、GA、PSO算法對懲罰參數(shù)和核函數(shù)參數(shù)進(jìn)行尋優(yōu)分析[16]。GS法在log2c與log2g為[-8,8]區(qū)間尋優(yōu),GS法尋優(yōu)結(jié)果見圖1A,隨著得到交叉驗(yàn)證準(zhǔn)確率的提高,log2c與log2g參數(shù)所形成的網(wǎng)格顏色由藍(lán)色變?yōu)辄S色,搜索得最佳參數(shù)c=4.00,g=1.41,交叉驗(yàn)證最佳正確率為90.8%,將其投影到二維平面得GS法尋優(yōu)等高線圖(圖1B);設(shè)置種群數(shù)量為20,最大進(jìn)化代數(shù)為50進(jìn)行GA算法尋優(yōu),通過最佳適應(yīng)度曲線發(fā)現(xiàn),在迭代次數(shù)為0~15時(shí),交叉驗(yàn)證率不斷提高,20次迭代后達(dá)到最大值,最佳參數(shù)為c=5.10,g=1.86,交叉驗(yàn)證正確率為90.8%(圖1C);設(shè)置種群數(shù)量為20,最大進(jìn)化代數(shù)為100進(jìn)行PSO算法尋優(yōu),經(jīng)過80次迭代后交叉驗(yàn)證正確率達(dá)最大值90.8%,最佳參數(shù)c=62.8,g=1.26(圖1D)。
圖1 SVM模型c、g參數(shù)尋優(yōu)結(jié)果圖Fig.1 The parameter optimization results of c and gA:3D display of GS optimization results(GS尋優(yōu)結(jié)果三維顯示);B:contour diagram of GS optimization results(GS尋優(yōu)結(jié)果等高線圖);C:GA optimization results(GA尋優(yōu)結(jié)果);D:PSO optimization results(PSO尋優(yōu)結(jié)果)
將訓(xùn)練集結(jié)合尋優(yōu)參數(shù)建立SVM分類模型,并利用測試集進(jìn)行驗(yàn)證,結(jié)果見表2。3種尋優(yōu)算法建立的SVM分類模型綜合判別正確率均有一定程度的提高,其中,采用PSO算法進(jìn)行參數(shù)尋優(yōu)后模型識(shí)別效果提升最為顯著,訓(xùn)練集判別正確率為100%(圖2A),測試集有3例分類錯(cuò)誤(圖2B),1例荊條蜜(分類標(biāo)簽1)錯(cuò)誤分類至油菜蜜(分類標(biāo)簽4)中,1例洋槐蜜(分類標(biāo)簽2)錯(cuò)誤分類至荊條蜜中,1例油菜蜜分類至荊條蜜中,判別正確率為90.6%,且訓(xùn)練集、測試集綜合判別正確率由91.8%提升至96.9%。
表2 優(yōu)化參數(shù)SVM模型分類結(jié)果Table 2 Model classification results of SVM by parameter optimization
圖2 PSO-SVM分類標(biāo)簽和真實(shí)標(biāo)簽圖Fig.2 PSO-SVM classification label and the actual labelA:training set(訓(xùn)練集);B:testing set(測試集)
本文基于荊條、洋槐、葵花、油菜4種植物源蜂蜜中13種顯著差異性金屬元素,結(jié)合替換法處理的截尾數(shù)據(jù),有效建立了SVM蜂蜜植物源鑒別模型。方差分析結(jié)果表明,4種不同植物源蜂蜜中Na、Mg、Al、K、Ca、Mn、Ni、Cu、Zn、As、Se、Ba、Pb存在顯著性差異;采用替換法處理的截尾數(shù)據(jù)作為輸入變量較不含截尾數(shù)據(jù)的SVM分類模型識(shí)別率高;利用PSO算法參數(shù)尋優(yōu)后建立的SVM判別模型對97例蜂蜜植物源屬性的綜合判別正確率達(dá)96.9%,可為食品屬性鑒別提供有益思路。