国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

拉曼光譜數(shù)據(jù)處理方式對(duì)大米產(chǎn)地鑒別模型的影響

2021-06-07 08:25:06李良翠黃家樂房雪婷
中國食品學(xué)報(bào) 2021年5期
關(guān)鍵詞:響水盤錦曼光譜

沙 敏,李良翠,黃家樂,余 倩,劉 唱,房雪婷

(南京財(cái)經(jīng)大學(xué)管理科學(xué)與工程學(xué)院 南京210023)

水稻是最重要的谷類作物之一[1],是一種復(fù)雜的食物基質(zhì),富含蛋白質(zhì)、脂肪、淀粉和其它營養(yǎng)素[2],其質(zhì)量受眾多因素的影響,如遺傳、生長條件和加工過程[3]。隨著居民生活水平的提高,地理標(biāo)志產(chǎn)品因其質(zhì)量更優(yōu)而頗受消費(fèi)者喜愛。與此同時(shí),市場(chǎng)上出現(xiàn)張冠李戴或摻假銷售的現(xiàn)象,給欺詐者帶來不公平的經(jīng)濟(jì)利益,破壞了消費(fèi)者對(duì)生產(chǎn)者的信任度[4]。為消費(fèi)者、生產(chǎn)者、零售商開發(fā)一個(gè)可確定大米地理來源的有效工具是非常必要的。

感官鑒別[5]、生物學(xué)鑒別[6-7]和化學(xué)鑒別(穩(wěn)定同位素[8-9]、微量元素[10-11]、揮發(fā)性成分[12-14])等技術(shù)已被大量報(bào)道用于鑒別大米的地理起源。這些方法中,廉價(jià)、快速和非破壞性的光譜分析結(jié)合模式識(shí)別的方法越來越受歡迎,并普遍應(yīng)用于固態(tài)和液態(tài)多組分復(fù)雜樣品的分析。

以拉曼光譜技術(shù)為例,若干文獻(xiàn)報(bào)道了其在大米產(chǎn)地鑒別中的應(yīng)用[15-19]。這些研究所用的大米樣品大多是去殼后的米粒,光譜采集僅涉及米粒外部的化學(xué)成分。眾所周知,米粒中碳水化合物、蛋白質(zhì)、脂肪和水的質(zhì)量百分比分別在70%~80%,7%~8%,1%~2%和11%~12%范圍,且各成分在米粒中分布不均勻[20],而大米的加工工藝如拋光等會(huì)導(dǎo)致大米表面的差異,因此,僅采集大米表面的拉曼光譜不足以反映大米的整體成分信息。為了準(zhǔn)確分析,需對(duì)米粒進(jìn)行粉碎、篩分,收集成分盡可能均勻的米粉樣品,而現(xiàn)有大米及其它成分不均勻產(chǎn)品的產(chǎn)地、品種等的鑒別文獻(xiàn)[21-24]均是基于2 次或3 次測(cè)量取平均值的方法獲取樣品的譜圖信息,未考慮波動(dòng)較大導(dǎo)致差異數(shù)據(jù)的可能性。多次測(cè)量取平均值僅可有效消除隨機(jī)誤差帶來的影響,而樣品成分不均一這一客觀事實(shí)不屬于隨機(jī)誤差。每個(gè)譜圖的信息存在些許區(qū)別[25],而片面地取平均值后可能使一些關(guān)鍵信息消失,數(shù)據(jù)不一定準(zhǔn)確。為使所得樣品譜圖數(shù)據(jù)庫能夠更加全面地反映樣品的信息,需多次采集來獲取足夠多的譜圖信息。

針對(duì)現(xiàn)有研究的不足,本文以中國東北6 個(gè)地區(qū)的地理標(biāo)志大米為例,采用拉曼光譜檢測(cè)技術(shù)獲取大米的拉曼光譜信息,考察不同的數(shù)據(jù)處理方法對(duì)大米產(chǎn)地鑒別準(zhǔn)確度的影響。首先對(duì)大米進(jìn)行粉碎均勻處理,依次經(jīng)精加工、粉碎、篩分獲取較為均勻的米粉樣品。其次,考慮到可能存在的數(shù)據(jù)差異,每個(gè)樣品經(jīng)拉曼光譜儀采集5 次,分析所得數(shù)據(jù),剔除可能的差異數(shù)據(jù)。最后,篩選的數(shù)據(jù)分別考察取和不取平均值對(duì)大米產(chǎn)地鑒別模型的影響,以期尋求可使同種樣品內(nèi)差異減小、不同樣品間差異擴(kuò)大的數(shù)據(jù)處理方式,為后續(xù)建立產(chǎn)地鑒別模型提供依據(jù)。

1 材料與方法

1.1 材料

6 種地理標(biāo)志大米分別為遼寧省盤錦市的盤錦大米,黑龍江省牡丹江市寧安市的響水大米,吉林省通化縣西江鎮(zhèn)的西江大米,黑龍江省農(nóng)墾總局建三江分局的建三江大米,黑龍江省哈爾濱市五常市的五常大米,吉林省延邊朝鮮族自治州的延邊大米。大米為2017年間種植,為了保證樣品的代表性,在地理標(biāo)志大米種植區(qū)域內(nèi)分散采樣,分別在10,10,6,7,7 個(gè)和5 個(gè)采樣點(diǎn)采集盤錦、響水、西江、建三江、五常和延邊大米樣品,每個(gè)采樣點(diǎn)各采集了2 份大米,每份大米采集約2 kg 樣品。

1.2 設(shè)備與儀器

NA12345 礱谷機(jī)、NA-JCB 碾米機(jī),寧波科麥儀器有限公司;15B 型立式粉碎機(jī)(內(nèi)置網(wǎng)孔直徑為0.6 mm 的篩網(wǎng)),臺(tái)州巴菱電器有限公司;Prott-ezRaman-d3 便攜式激光拉曼光譜儀,美國Enwave Optronics 公司;拉曼測(cè)試樣品池(石英材質(zhì),長4 cm,寬2 cm,厚3 mm,正中央圓形凹槽直徑1.5 cm,深度2 mm),中國科學(xué)院上海有機(jī)化學(xué)研究所;JA1003 電子分析天平,上海力辰儀器科技有限公司;分級(jí)篩(100 目和140 目),上虞市華豐五金儀器有限公司。

1.3 方法

1.3.1 供試品制備 將水稻進(jìn)行晾曬、脫粒、挑選、礱谷和碾米等處理,每份水稻礱谷2 次,碾米1 次。加工后的每份米分別稱取20 g,在0.5 min 內(nèi)緩慢加入到已預(yù)運(yùn)行1 min 的粉碎機(jī)中,粉碎2 min,確保粉碎完全。所得米粉依次經(jīng)100 目和140 目篩進(jìn)行篩分,收集粒度為100~140 目的米粉,作為拉曼光譜測(cè)試的供試品,置于冰柜中冷藏儲(chǔ)存,測(cè)試前將樣品移至干燥器中平衡至室溫。

1.3.2 光譜采集 經(jīng)前期研究得最佳拉曼光譜采集參數(shù)如下[25]:激發(fā)波長785 nm,功率450 mW,CCD 檢測(cè)器-85℃,掃描范圍250~2 339 cm-1,分辨率1 cm-1,曝光時(shí)間4 s,掃描次數(shù)3 次,激光與樣品表面的距離5 mm。米粉置于石英樣品池中,考慮到樣本的不均勻性,分別在5 個(gè)不同的位置各采集1 張拉曼光譜。

1.3.3 數(shù)據(jù)處理 為了從原始譜圖數(shù)據(jù)中去除干擾的和無關(guān)的信息,在數(shù)據(jù)分析之前應(yīng)對(duì)原始數(shù)據(jù)做一些預(yù)處理。本文中,拉曼光譜數(shù)據(jù)依次用wden 小波函數(shù)進(jìn)行去噪處理,用多元散射校正(Multiplicative scatter correction,MSC)消除散射的影響,用mapminmax 函數(shù)進(jìn)行歸一化。然后,綜合運(yùn)用相對(duì)標(biāo)準(zhǔn)偏差(Relative standard deviation,RSD)分析和層次聚類分析(Hierarchical clustering analysis,HCA)剔除潛在的差異數(shù)據(jù)。最后,基于支持向量機(jī)(Support vector machine,SVM)對(duì)樣本地理來源進(jìn)行鑒別,考察剔除差異數(shù)據(jù)和取平均值的數(shù)據(jù)處理方式對(duì)模型的影響。所有數(shù)據(jù)預(yù)處理和模型構(gòu)建均基于MATLAB 2016a進(jìn)行。

2 結(jié)果與分析

2.1 數(shù)據(jù)預(yù)處理

以盤錦大米為例,樣品信息和譜圖編號(hào)信息如表1所示。以6 種大米第1 批次第1 份米的其中1 個(gè)拉曼光譜為例,經(jīng)去噪、MSC、歸一化處理后的譜圖如圖1所示。由于其它批次大米的拉曼光譜經(jīng)上述預(yù)處理后的譜圖與圖1均類似,譜圖峰較密集的區(qū)域位于250~1 500 cm-1之間,因此后續(xù)分析采用該區(qū)域數(shù)據(jù)。由圖1可知,6 種大米高度相似,肉眼難以區(qū)分。

表1 盤錦大米樣品和譜圖信息Table 1 Information of Panjin rice samples and their spectra

圖1 6 種大米第1 批次第1 份米的1 個(gè)拉曼光譜經(jīng)去噪、MSC、歸一化處理后的圖譜Fig.1 Raman spectra of the first part of the first batch of the six kinds of rice after denoising,MSC and normalization

2.2 差異數(shù)據(jù)剔除

2.2.1 相對(duì)標(biāo)準(zhǔn)偏差分析 掃描范圍在250~1 500 cm-1之間,盤錦大米每批次每份米的5 個(gè)拉曼光譜經(jīng)數(shù)據(jù)預(yù)處理后的相對(duì)標(biāo)準(zhǔn)偏差值如表2所示。由于米粉的不均勻性、儀器的波動(dòng)性、環(huán)境及人為因素等干擾拉曼光譜的采集,RSD 值普遍在11%~14%之間波動(dòng)。其中,第5 批次第1 份米和第6 批次第2 份米的RSD 值較大,懷疑存在波動(dòng)較大的差異數(shù)據(jù)。

表2 每份大米的5 個(gè)拉曼光譜數(shù)據(jù)的相對(duì)標(biāo)準(zhǔn)偏差值Table 2 The values of relative standard deviation of five Raman spectral data for each rice

2.2.2 層次聚類分析 為了更直觀的找出可能的差異數(shù)據(jù),對(duì)每份米的5 個(gè)拉曼光譜進(jìn)行層次聚類分析。分別使用歐氏距離(euclid)、標(biāo)準(zhǔn)歐氏距離(seuclid)、城市街區(qū)距離(cityblock)和余弦距離(cosine)作為距離度量方法,采用平均距離法(average)、最短距離法(single)和最長距離法(complete)創(chuàng)建系統(tǒng)聚類樹[26]。以盤錦大米第5 批次第1 份米為例,不同創(chuàng)建聚類樹方法對(duì)應(yīng)的同表象型相關(guān)系數(shù)值如表3所示,以標(biāo)準(zhǔn)歐氏距離和平均距離法作為距離度量方法及創(chuàng)建聚類樹方法對(duì)應(yīng)的同表象型相關(guān)系數(shù)值最大,所創(chuàng)建的聚類樹(圖2)最佳。由圖2可知,譜圖2和3 最為相似,5和1 次之,譜圖4與其它4 個(gè)譜圖的差異顯著,判斷譜圖4為可疑的差異數(shù)據(jù)。將剔除譜圖4后剩余的4 個(gè)拉曼光譜數(shù)據(jù)進(jìn)行RSD 分析,RSD 值為12.279%,在正常波動(dòng)范圍11%~14%之間,證實(shí)譜圖4為差異數(shù)據(jù),后續(xù)建模分析時(shí)應(yīng)將其剔除。

表3 不同創(chuàng)建聚類樹方法下的同表象型相關(guān)系數(shù)值Table 3 The cophenetic correlation coefficients for the clustering trees using different methods

圖2 盤錦大米第5 批次第1 份米的5 張拉曼光譜HCA 分析聚類樹圖Fig.2 The clustering tree of the five Raman spectra of the first part of the fifth batch of Panjing rice

對(duì)剔除差異數(shù)據(jù)后的盤錦大米的第5 批次2份米的拉曼光譜數(shù)據(jù)(9 個(gè))進(jìn)行HCA 分析(圖3)。由圖3可知,9 張譜圖混在一起無明顯聚成兩類的趨勢(shì),說明2 份米之間的差異較小。上述研究結(jié)果表明,RSD 分析可以預(yù)判是否存在差異數(shù)據(jù),HCA 分析可找出潛在的差異數(shù)據(jù),最后再經(jīng)RSD驗(yàn)證可明確差異數(shù)據(jù),兩者綜合運(yùn)用提供了精確、可靠的剔除差異數(shù)據(jù)的方法。

圖3 盤錦大米第5 批次2 份米的9 張拉曼光譜HCA 分析聚類樹圖Fig.3 The clustering tree of the nine Raman spectra of the fifth batch of Panjing rice

重復(fù)上述步驟,對(duì)盤錦大米剩余的9 個(gè)批次樣品做同樣的分析,得差異數(shù)據(jù)如表4所示。研究發(fā)現(xiàn),表2中RSD 值超過14%的均存在顯著差異數(shù)據(jù),剔除差異數(shù)據(jù)后的RSD 值均小于14%(表4),說明可通過RSD 值的波動(dòng)范圍初步判斷是否存在差異數(shù)據(jù),后續(xù)建模應(yīng)剔除表4中的7 個(gè)數(shù)據(jù)。對(duì)響水、西江、建三江、五常和延邊大米的拉曼光譜數(shù)據(jù)分析后,發(fā)現(xiàn)分別存在8,5,4,2 個(gè)和4個(gè)差異數(shù)據(jù)。

表4 剔除差異數(shù)據(jù)后的RSD 值Table 4 The values of RSD for each rice after eliminating the difference data

2.3 不同數(shù)據(jù)處理方式下的模型鑒別結(jié)果

以剔除差異數(shù)據(jù)前、后和取平均值前、后的4種拉曼光譜數(shù)據(jù)(A~D)分別建立大米產(chǎn)地鑒別模型,將每個(gè)批次第1 份米的數(shù)據(jù)作為訓(xùn)練集數(shù)據(jù),第2 份米的數(shù)據(jù)作為測(cè)試集數(shù)據(jù),SVM 建模使用徑向基核函數(shù)(Radial basis function,RBF),通過網(wǎng)格搜索技術(shù)對(duì)gamma 和c 參數(shù)進(jìn)行優(yōu)化,最終通過測(cè)試集的識(shí)別率比較模型的優(yōu)劣,結(jié)果如表5所示。未剔除差異數(shù)據(jù)和未取平均值處理的數(shù)據(jù)(A),其所建模型的識(shí)別率最低,小于80%,分類效果不理想;數(shù)據(jù)經(jīng)剔除差異處理后(B),模型識(shí)別準(zhǔn)確率小幅提升,提高了約2%;數(shù)據(jù)經(jīng)取平均值處理后(C),模型的識(shí)別準(zhǔn)確率有所提高,提升了約6%,相較剔除差異數(shù)據(jù)而言,取平均值的效果更佳;當(dāng)數(shù)據(jù)經(jīng)2 種方法處理后(D),所建立模型的分類鑒別能力大大提升,平均識(shí)別率提高了約13%,且每種大米的識(shí)別率均有所提高。

表5 不同數(shù)據(jù)下的模型鑒別結(jié)果Table 5 Results of discrimination model using different data

對(duì)采用數(shù)據(jù)C 和D 建模的結(jié)果進(jìn)行分析,探究差異數(shù)據(jù)對(duì)模型鑒別能力的影響,結(jié)果如圖4。采用數(shù)據(jù)C 時(shí),共有7 個(gè)錯(cuò)誤分類樣本,其中,延邊大米有1 個(gè)樣本被錯(cuò)誤地歸為五常大米;建三江大米有1 個(gè)樣本被錯(cuò)誤地歸為五常大米,1 個(gè)被錯(cuò)誤地認(rèn)為是盤錦大米。而采用數(shù)據(jù)D 時(shí),錯(cuò)誤分類樣本數(shù)減少為4 個(gè),延邊大米可與其它大米完全區(qū)分開,建三江大米也可與盤錦大米和五常大米正確區(qū)分。結(jié)果表明,差異數(shù)據(jù)降低了鑒別模型的準(zhǔn)確性,建模分析前應(yīng)進(jìn)行剔除處理。

圖4 大米樣本被錯(cuò)誤分類的情況圖Fig.4 Figure for rice samples misclassified

以響水、西江和盤錦大米為例,對(duì)數(shù)據(jù)B 和D進(jìn)行主成分分析,探究數(shù)據(jù)取平均值對(duì)模型鑒別能力的影響,結(jié)果如圖5所示。使用數(shù)據(jù)B 時(shí),響水大米和盤錦大米可以明顯區(qū)分,但西江大米與盤錦大米的大多數(shù)數(shù)據(jù)混雜在一起,西江大米與響水大米的少數(shù)數(shù)據(jù)混在一起,3 類大米無明顯分界,較難區(qū)分。數(shù)據(jù)取平均值后(即數(shù)據(jù)D),響水大米與盤錦大米分散在很遠(yuǎn)的兩端,可以容易區(qū)分;響水大米與西江大米有明顯的分界,可以進(jìn)行區(qū)分;西江大米有1 個(gè)數(shù)據(jù)落入盤錦大米的樣品簇中,其余數(shù)據(jù)與盤錦大米不交融。由此可知,雖然樣品成分不均一,但是數(shù)據(jù)取平均值后,可使同種大米樣品內(nèi)的差異減小、不同大米樣品間差異擴(kuò)大,有利于分類鑒別模型準(zhǔn)確率的提升。

圖5 3 種大米在前3 主成分上的分布圖Fig.5 Distribution of the three kinds of rice samples on the first three principal components

3 結(jié)論

本文以盤錦大米、響水大米、西江大米、建三江大米、五常大米和延邊大米6 種地理標(biāo)志大米為例,探究拉曼光譜數(shù)據(jù)處理方式對(duì)大米產(chǎn)地鑒別模型的影響。稻谷樣品分別經(jīng)精米加工、粉碎和篩分操作,得粒度為100~140 目的米粉。其次,分別在5 個(gè)測(cè)量點(diǎn)采集每份米粉樣品的拉曼光譜,所得拉曼光譜依次經(jīng)去噪、多元散射校正和歸一化預(yù)處理。然后,分別經(jīng)相對(duì)標(biāo)準(zhǔn)偏差和層次聚類分析剔除每個(gè)米粉樣品的差異數(shù)據(jù)。最后,將剔除差異后的所有數(shù)據(jù)和取平均值后的數(shù)據(jù)分別經(jīng)支持向量機(jī)建立分類模型。結(jié)果表明,RSD 分析可以預(yù)判是否存在差異數(shù)據(jù),HCA 分析可找出潛在的差異數(shù)據(jù),再經(jīng)RSD 分析,可最終明確差異數(shù)據(jù),兩者綜合運(yùn)用提供了精確、可靠的剔除差異數(shù)據(jù)的方法。此外,取平均值后的數(shù)據(jù)可使相同大米樣品內(nèi)的數(shù)據(jù)差異縮小、不同大米樣品間的差異擴(kuò)大,有效提高模型的識(shí)別準(zhǔn)確率,所得模型對(duì)6 種地理標(biāo)志大米的鑒別準(zhǔn)確率達(dá)91.11%。本文所探究的數(shù)據(jù)處理方式為構(gòu)建大米產(chǎn)地溯源模型提供了更為準(zhǔn)確、有效的方法,所提出的數(shù)據(jù)處理方法、產(chǎn)地鑒別模型具有潛在推廣應(yīng)用價(jià)值。

猜你喜歡
響水盤錦曼光譜
盤錦紅海灘
新少年(2023年11期)2023-12-05 12:21:38
響水澗花海
江淮法治(2022年8期)2022-05-18 02:42:40
響水化工園區(qū)關(guān)閉啟示
響水流泉落花來
開水不響響水不開
盤錦人工島建設(shè)條件分析
盤錦地下流體觀測(cè)在地震預(yù)報(bào)中的作用
遼寧盤錦大米升級(jí)推出“玉粳香”生態(tài)大米
BMSCs分化為NCs的拉曼光譜研究
便攜式薄層色譜-拉曼光譜聯(lián)用儀重大專項(xiàng)獲批
靖安县| 湛江市| 小金县| 永川市| 赤峰市| 雷波县| 无为县| 汉寿县| 马山县| 长白| 阜南县| 九龙坡区| 东丰县| 海宁市| 青浦区| 肃宁县| 霍邱县| 汾西县| 斗六市| 灵台县| 台湾省| 浦县| 郯城县| 桐庐县| 师宗县| 南雄市| 上栗县| 通渭县| 桃江县| 镶黄旗| 许昌市| 青河县| 天门市| 万山特区| 木兰县| 岳池县| 新竹市| 峨山| 舟曲县| 监利县| 郎溪县|