后其軍,鞠興榮,袁 建,何 榮,朱貞映(南京財(cái)經(jīng)大學(xué)食品科學(xué)與工程學(xué)院,江蘇省糧油品質(zhì)控制及深加工技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇南京210023)
不同產(chǎn)地稻谷近紅外技術(shù)建模效果的比較
后其軍,鞠興榮*,袁 建,何 榮,朱貞映
(南京財(cái)經(jīng)大學(xué)食品科學(xué)與工程學(xué)院,江蘇省糧油品質(zhì)控制及深加工技術(shù)重點(diǎn)實(shí)驗(yàn)室,江蘇南京210023)
選取安徽省、江蘇省、湖南省、黑龍江省四個(gè)不同產(chǎn)地的代表性稻谷樣品,測(cè)定其水分含量、粗蛋白含量、脂肪酸值以及直鏈淀粉含量,掃描其近紅外光譜,運(yùn)用偏最小二乘法(Partial least square,PLS)建立定量分析模型,比較不同地區(qū)同一指標(biāo)之間建模效果,探索近紅外建模是否需要分區(qū)域進(jìn)行。結(jié)果表明:在樣品具有足夠代表性的前提下,對(duì)各省化學(xué)指標(biāo)建立的模型都是可靠的,但是同一指標(biāo)不同地區(qū)之間建模效果有所不同,四省水分含量建模決定系數(shù)(R2)分別為0.91、0.97、0.94、0.85;粗蛋白含量建模決定系數(shù)(R2)分別為0.94、0.78、0.87、0.72;脂肪酸值建模決定系數(shù)(R2)分別為0.77、0.60、0.83、0.65;直鏈淀粉含量建模決定系數(shù)(R2)分別為0.68、0.58、0.69、0.53。
不同產(chǎn)地,稻谷,近紅外技術(shù),建模效果
近 紅 外 光 譜(Near Infrared Reflectance Spectroscopy,NIRS)技術(shù)作為一種新崛起的物理測(cè)試技術(shù),具有分析速度快、分析指標(biāo)全面、成本低廉等多種優(yōu)勢(shì)。近年來(lái)在各個(gè)領(lǐng)域均有涉及[1-4],在食品、農(nóng)作物等定性定量分析中也應(yīng)用的越來(lái)越廣泛[5-6],在谷物類(lèi)的研究方面也不乏研究成果,齊龍等[7]闡述了近紅外技術(shù)在大米檢測(cè)中的應(yīng)用主要有品種鑒定、品質(zhì)鑒定以及礦質(zhì)元素含量檢測(cè)三方面,王傳梁等[8]利用近紅外檢測(cè)技術(shù)測(cè)定大米中的脂肪含量,利用偏最小二乘法建立數(shù)學(xué)模型,證明了近紅外測(cè)定大米脂肪含量的可行性。
在稻谷的主要成分中,粗蛋白質(zhì)含量及水分含量是影響其品質(zhì)的主要因素,為評(píng)價(jià)稻谷品質(zhì)質(zhì)量的重要指標(biāo),直鏈淀粉含量更是稻谷定等的重要依
據(jù),脂肪酸值則是反映稻谷新陳度的重要指標(biāo),對(duì)稻谷的儲(chǔ)藏和加工都有重要影響。檢測(cè)稻谷直鏈淀粉含量和粗蛋白含量可以判定稻谷品質(zhì)的優(yōu)劣,分析稻谷水分含量和脂肪酸值可以研究稻谷儲(chǔ)藏的品質(zhì)變化。目前關(guān)于近紅外技術(shù)在谷物品質(zhì)分析中的應(yīng)用已經(jīng)很多,但是很多研究并沒(méi)有嚴(yán)格區(qū)分樣品來(lái)源,缺少對(duì)單一省份的稻谷樣品進(jìn)行分析比較。
本實(shí)驗(yàn)選取黑龍江省、江蘇省、安徽省、湖南省四個(gè)不同產(chǎn)地的代表性稻谷樣品,測(cè)定其水分含量、粗蛋白含量、脂肪酸值以及直鏈淀粉含量,掃描其近紅外光譜,運(yùn)用近紅外光譜分析技術(shù)建立數(shù)學(xué)分析模型,比較不同地區(qū)同一指標(biāo)之間建模效果的差異性。旨在為稻谷收購(gòu)過(guò)程中形成更加便捷科學(xué)化的數(shù)據(jù)參考,從而提高稻谷收購(gòu)的質(zhì)量水平,為稻谷收購(gòu)過(guò)程科學(xué)快速提供理論依據(jù)以及為是否需要建立區(qū)域模型提供新的研究思路。
1.1 材料與儀器
稻谷實(shí)驗(yàn)樣品 選取安徽省、江蘇省、湖南省、黑龍江省四個(gè)地區(qū)的稻谷,其中,安徽省樣品135份、江蘇省樣品180份、湖南省樣品98份、黑龍江省樣品135份。樣品從各省糧庫(kù)獲取,選取的樣品均為每個(gè)省種植較多的品種且樣品經(jīng)過(guò)除雜和不完善粒的篩選。將樣品用密封袋包裝后編號(hào)置于低溫儲(chǔ)藏室保存?zhèn)溆谩?/p>
SupNIR-2700近紅外分析儀(附有自動(dòng)旋轉(zhuǎn)樣品盤(pán)) 聚光科技(杭州)有限公司;K-360全自動(dòng)凱氏定氮儀 上海步琦有限公司;BS-224S型天平 北京賽多利斯儀器系統(tǒng)有限公司;101-3AS型電熱鼓風(fēng)恒溫干燥箱 上海蘇進(jìn)儀器設(shè)備廠(chǎng);FW80多功能粉碎機(jī) 天津泰斯特儀器有限公司;JFYZ分樣器 上海加定糧油檢測(cè)儀器廠(chǎng)。
1.2 實(shí)驗(yàn)方法
1.2.1 稻谷水分含量測(cè)定 采用恒溫箱烘干法測(cè)定稻谷水分含量,方法參照GB/T 5497-1985《糧食、油料檢驗(yàn)水分測(cè)定法》[9]。每個(gè)樣品重復(fù)測(cè)定三次,取其平均值作為最終結(jié)果。
1.2.2 稻谷粗蛋白含量測(cè)定 采用凱氏定氮法測(cè)定稻谷粗蛋白含量,方法參照GB/T 5511-2008《谷物和豆類(lèi)氮含量測(cè)定和粗蛋白質(zhì)含量計(jì)算凱氏法》[10]。每個(gè)樣品重復(fù)測(cè)定三次,取其平均值作為最終結(jié)果。
1.2.3 稻谷脂肪酸值測(cè)定 采用標(biāo)準(zhǔn)氫氧化鉀溶液滴定法測(cè)定稻谷脂肪酸值,方法參照GB/T 15684-1995《谷物制品脂肪酸值測(cè)定法》[11]。每個(gè)樣品重復(fù)測(cè)定三次,取其平均值作為最終結(jié)果。
1.2.4 稻谷直鏈淀粉含量化學(xué)方法的測(cè)定 采用分光光度計(jì)于720 nm處測(cè)定顯色復(fù)合物吸光度的方法測(cè)定稻谷直鏈淀粉含量,方法參照GB/T 15683-2008《大米直鏈淀粉含量的測(cè)定》[12]。每個(gè)樣品重復(fù)測(cè)定三次,取其平均值作為最終結(jié)果。
1.2.5 光譜采集 近紅外分析儀開(kāi)機(jī)預(yù)熱30 min,經(jīng)過(guò)性能測(cè)試后,對(duì)收集到的稻谷樣品分別進(jìn)行光譜掃描。為獲得穩(wěn)定的、有代表性的圖譜,在環(huán)境溫度25℃、環(huán)境濕度60%的條件下采用自動(dòng)旋轉(zhuǎn)樣品盤(pán)采集樣品圖譜,每個(gè)樣品重復(fù)裝樣2次,采集光譜范圍是1000~1800 nm,分辨率8 cm-1,每間隔1 nm取一次光譜數(shù)據(jù),每個(gè)樣品掃描64次取平均值。
1.2.6 光譜預(yù)處理 對(duì)收集到的代表性圖譜進(jìn)行預(yù)處理,選擇的預(yù)處理的方法為Savitzky-Golay導(dǎo)數(shù)、Savitzky-Golay平滑、多元散射校正(MSC)以及均值中心化的組合方式。
1.2.7 近紅外光譜分析模型的建立 利用SupNIR-2700系列光柵型近紅外光譜儀自帶的RIMP定標(biāo)軟件,設(shè)定對(duì)收集的譜圖與化學(xué)測(cè)量值一一對(duì)應(yīng),采用隨機(jī)方法劃分樣品集,以80%作為校正集,20%作為驗(yàn)證集,選擇偏最小二乘法建立稻谷水分含量、粗蛋白含量、脂肪酸值以及直鏈淀粉含量的定量分析模型,儀器中建模的參數(shù)設(shè)置為:最大主因子數(shù)20;交互驗(yàn)證分堆數(shù)8;馬氏距離閾值10.00;學(xué)生殘差T值2.50;最近鄰距離閾值10.00。
1.2.8 近紅外建模結(jié)果的相關(guān)參數(shù)說(shuō)明 SEC(Standard error of calibration)、SEP(Standard error of prediction)分別代表建模的校正標(biāo)準(zhǔn)差和預(yù)測(cè)標(biāo)準(zhǔn)差,SECV (Standard error of cross validation)代表交互驗(yàn)證標(biāo)準(zhǔn)差,是反映建模數(shù)據(jù)準(zhǔn)確性的參數(shù),SEC、SEP、SECV值越接近0且同時(shí)相互之間越接近越好,RC(校正相關(guān)系數(shù)),表示校正模型中化學(xué)測(cè)試數(shù)據(jù)與預(yù)測(cè)數(shù)據(jù)之間的相關(guān)性,RP(預(yù)測(cè)相關(guān)系數(shù))是反映模型預(yù)測(cè)能力的參數(shù),RP值越高,表明模型預(yù)測(cè)能力越強(qiáng),RPD(Ratio of performance to standard deviate)值則是評(píng)價(jià)模型分辨能力的重要參數(shù),表示了近紅外分析將分布標(biāo)準(zhǔn)差范圍之內(nèi)的樣品分級(jí)的數(shù)目[13],RPD值越大,表示模型的預(yù)測(cè)效果越好,R2即為RC的平方,是模型的決定系數(shù),反映建模樣品集中測(cè)量值與預(yù)測(cè)值之間的相關(guān)性,是對(duì)建模效果最為直觀(guān)的判斷參數(shù)。
2.1 不同地區(qū)稻谷水分含量建模效果的比較
由圖1可以看出,對(duì)于水分含量所建的近紅外模型,四個(gè)省份的稻谷水分含量都呈現(xiàn)明顯的線(xiàn)性分布,其中江蘇省的線(xiàn)性最為明顯,所得到的模型線(xiàn)性最好,方程為Y=0.97x+0.50,決定系數(shù)R2值高達(dá)0.97,反映出收集的稻谷代表性良好,水分含量的測(cè)定值準(zhǔn)確。安徽省與湖南省稻谷水分含量建模效果也比較理想,決定系數(shù)R2值均超過(guò)0.90,而黑龍江省稻谷水分含量分布的不是特別均勻,決定系數(shù)R2值為0.85,建模效果不如其他三省。四省具體的建模報(bào)告見(jiàn)表1。
四個(gè)地區(qū)的SEC與SEP值都比較小,說(shuō)明參比值與預(yù)測(cè)值之間的標(biāo)準(zhǔn)差較小,數(shù)據(jù)準(zhǔn)確度高;每個(gè)地區(qū)模型的SECV與SEP值接近,說(shuō)明實(shí)驗(yàn)樣品代表性很好;RC與RP都超過(guò)0.9,反映了參比值與預(yù)測(cè)值之間的相關(guān)性很高;表1中的RPD(RPDC/RPDV)值基本上都超過(guò)了2,說(shuō)明構(gòu)建的近紅外模型的預(yù)測(cè)效果較好。范維燕等[14]利用近紅外技術(shù)對(duì)不同品種、不同地區(qū)、不同儲(chǔ)藏時(shí)間的144份稻谷進(jìn)行水分含量模型的建立,認(rèn)為修正偏最小二乘法所建立的模型效果最
好,測(cè)試值與預(yù)測(cè)值的相關(guān)性高達(dá)0.996,說(shuō)明近紅外技術(shù)可以用于稻谷水分含量的測(cè)定。與之相比,本實(shí)驗(yàn)中測(cè)試值與預(yù)測(cè)值相關(guān)性最高的是江蘇省的0.9831(表1),低于0.996,這可能與選用的建模方法不同有關(guān)。
圖1 不同地區(qū)稻谷水分含量近紅外模型圖Fig.1 Rice moisture content near infrared model diagram of different regions
2.2 不同地區(qū)稻谷粗蛋白含量建模效果的比較
圖2 不同地區(qū)稻谷粗蛋白含量近紅外模型圖Fig.2 Rice crude protein content near infrared model diagram of different regions
表1 不同產(chǎn)地稻谷水分含量建模報(bào)告Table1 Rice moisture content model report of different regions
對(duì)于稻谷粗蛋白含量所建的近紅外模型,四個(gè)省份的稻谷粗蛋白含量都呈現(xiàn)明顯的線(xiàn)性分布,其中安徽省的線(xiàn)性最為明顯,所得到的模型線(xiàn)性最好,方程為Y=0.94x+0.47,決定系數(shù)R2值高達(dá)0.94(圖2),反映出收集的稻谷代表性良好,粗蛋白含量的測(cè)定值準(zhǔn)確。江蘇省與湖南省稻谷粗蛋白含量的建模效果也比較理想,決定系數(shù)R2值均超達(dá)到0.80左右,圖2中顯示黑龍江省稻谷粗蛋白含量分布的不是特別均勻,決定系數(shù)R2值為0.72,建模效果不如其他三省。四省具體的建模報(bào)告見(jiàn)表2。
表2 不同產(chǎn)地稻谷粗蛋白含量建模報(bào)告Table2 Rice crude protein content model report of different regions
四個(gè)地區(qū)的SEC與SEP值都比較小,說(shuō)明參比值與預(yù)測(cè)值之間的標(biāo)準(zhǔn)差較小,數(shù)據(jù)準(zhǔn)確度高;每個(gè)地區(qū)模型的SECV與SEP值接近,說(shuō)明實(shí)驗(yàn)樣品代表性很好;四省建模報(bào)告中的RC值都超過(guò)0.84,說(shuō)明建模效果較好;江蘇省與黑龍江省建模的RP值略低于0.80,說(shuō)明模型的預(yù)測(cè)能力不如安徽省和湖南省模型的預(yù)測(cè)能力強(qiáng);就表2中的RPD(RPDC/RPDV)值而言,江蘇省與黑龍江省的較低,說(shuō)明構(gòu)建的近紅外模型效果沒(méi)有安徽省與湖南省的建模效果好。Bagchi T B等[15]選取不同品種的印度稻谷,對(duì)其蛋白含量進(jìn)行了分析,選用128個(gè)樣品作為建模集,并用29個(gè)樣品作為驗(yàn)證集進(jìn)行模型的驗(yàn)證,得到的近紅外模型的決定系數(shù)R2為0.749,驗(yàn)證集中參比值與預(yù)測(cè)值之間的相關(guān)性很高,R值達(dá)到近0.96。說(shuō)明近紅外技術(shù)可以用于稻谷粗蛋白含量的測(cè)定,從表2中的RP值可以發(fā)現(xiàn),模型的預(yù)測(cè)能力并非完全取決于校正模型的高R值。
2.3 不同地區(qū)稻谷脂肪酸值建模效果的比較
圖3可以發(fā)現(xiàn):對(duì)于稻谷脂肪酸值所建的近紅外模型,四個(gè)省中湖南省呈現(xiàn)明顯的線(xiàn)性分布,方程為Y=0.83x+4.28,所得到的模型穩(wěn)定性最好,決定系數(shù)R2值高達(dá)0.83,反映出收集的稻谷代表性良好,脂肪酸值含量的測(cè)定值準(zhǔn)確。安徽省建模效果也比較理想,決定系數(shù)R2值達(dá)到0.77,圖3中顯示黑龍江省與江蘇省脂肪酸值分布的不是特別均勻,建模R2分別為0.65、0.60,建模的效果不如安徽省與湖南省。四省具體的建模報(bào)告見(jiàn)表3。
相比水分含量和粗蛋白含量而言,四個(gè)地區(qū)脂肪酸值的SEC與SEP值都偏大,說(shuō)明參比值與預(yù)測(cè)值之間的標(biāo)準(zhǔn)差較大,這與脂肪酸值測(cè)定過(guò)程中產(chǎn)生的無(wú)效數(shù)據(jù)有關(guān);每個(gè)地區(qū)模型的SECV與SEP值接近,說(shuō)明實(shí)驗(yàn)樣品代表性較好;從建模報(bào)告中可以明顯的發(fā)現(xiàn),RPD值偏低,均小于2,因此關(guān)于脂肪酸值的近紅外建模效果就不如水分含量和粗蛋白含量建模效果好,模型的預(yù)測(cè)能力也沒(méi)有他們強(qiáng);就四個(gè)省而言,安徽省與湖南省脂肪酸值建模效果還是明顯優(yōu)于江蘇省和黑龍江省。范維燕等[16]用來(lái)自不同地區(qū)的150份稻谷作為建模集,50份作為驗(yàn)證集,研究近紅外技術(shù)在脂肪酸值測(cè)定中的應(yīng)用,認(rèn)為修正偏
最小二乘法建模效果最好,預(yù)測(cè)值和參比值之間有很好的相關(guān)性,定標(biāo)標(biāo)準(zhǔn)偏差為1.9205,可以用近紅外技術(shù)測(cè)定稻谷脂肪酸值。本實(shí)驗(yàn)中有三個(gè)省定標(biāo)標(biāo)準(zhǔn)差大于1.9205,說(shuō)明測(cè)試化學(xué)值的準(zhǔn)確性還有待提高。
圖3 不同地區(qū)稻谷脂肪酸值近紅外模型圖Fig.3 Rice fatty acid value near infrared model diagram of different regions
表3 不同產(chǎn)地稻谷脂肪酸值建模報(bào)告Table3 Rice fatty acid value model report of different regions
圖4 不同地區(qū)稻谷直鏈淀粉含量近紅外模型圖Fig.4 Rice amylose content near infrared model diagram of different regions
2.4 不同地區(qū)稻谷直鏈淀粉含量建模效果的比較
稻谷直鏈淀粉含量所建的近紅外模型如圖4所示,四個(gè)省份的稻谷直鏈淀粉含量都分布的比較散,呈現(xiàn)一定的線(xiàn)性卻不十分明顯,決定系數(shù)R2值在0.53~0.69不等,說(shuō)明測(cè)試值與預(yù)測(cè)值之間存在一定的偏差,預(yù)測(cè)值與測(cè)試值之間的相關(guān)性不夠顯著。安徽省與湖南省的建模效果優(yōu)于江蘇省和黑龍江省,四省具體的建模報(bào)告見(jiàn)表4。
四個(gè)地區(qū)的RC值都明顯的高于RP值,表明校建模效果不錯(cuò),但是預(yù)測(cè)能力一般,這可能是由于建模集劃分采用隨機(jī)方法造成的,導(dǎo)致驗(yàn)證集的樣品代表性不足,而且RPD值不是很高,說(shuō)明驗(yàn)證集樣品的測(cè)量值與預(yù)測(cè)值之間也存在一定的偏差。Xie L H等[17]選取中國(guó)八大稻谷主產(chǎn)地的稻谷688份測(cè)定稻谷的直鏈淀粉含量,并用近紅外技術(shù)建立數(shù)學(xué)模型,其中491份用于建模,197份用于驗(yàn)證,認(rèn)為不同的建模方法以及預(yù)處理方法對(duì)建模結(jié)果存在不同的影響,R2值0.3~0.9不等,修正偏最小二乘法建模的效果最好,R2值最高可達(dá)到0.9。建模效果優(yōu)于本實(shí)驗(yàn)結(jié)果,未來(lái)研究中可以考慮補(bǔ)充樣品對(duì)模型進(jìn)行擴(kuò)充從而提高建模效果和預(yù)測(cè)能力,嘗試更多建模方法不斷優(yōu)化近紅外模型。
本實(shí)驗(yàn)用近紅外光譜技術(shù)對(duì)安徽、江蘇、湖南、黑龍江四省稻谷重要品質(zhì)指標(biāo)進(jìn)行建模,通過(guò)建模效果的比較,探索近紅外建模是否需要分區(qū)域進(jìn)行。實(shí)驗(yàn)結(jié)果表明,在樣品具有足夠代表性的前提下,對(duì)各化學(xué)指標(biāo)建立的模型都是可靠的,但是同一指標(biāo)不同地區(qū)之間建模效果有所不同,四省水分含量建模決定系數(shù)R2分別為0.91、0.97、0.94、0.85;粗蛋白含量建模決定系數(shù)R2分別為0.94、0.78、0.87、0.72;脂肪酸值建模決定系數(shù)R2分別為0.77、0.60、0.83、0.65;直鏈淀粉含量建模決定系數(shù)R2分別為0.68、0.58、0.69、0.53。建議近紅外技術(shù)建立模型可以嘗試分區(qū)域進(jìn)行。
[1]Stubbs T L,Kennedy A C,F(xiàn)ortuna A M.Using NIRS to predict fiber and nutrient content of dry land cereal cultivars[J].Journal of Agricultural and Food Chemistry,2010,58(1):398-403.
[2]修連存,鄭志忠,俞正奎,等.近紅外光譜分析技術(shù)在蝕變礦物鑒定中的應(yīng)用[J].地質(zhì)學(xué)報(bào),2007,81(11):1584-1590.
表4 不同產(chǎn)地稻谷直鏈淀粉含量建模報(bào)告
Table4 Rice amylose content model report of different regions
地區(qū) SEC RC SECV SEP RP RPDC RPDV FACTOR安徽 1.0061 0.8236 1.0281 1.0587 0.7604 1.5106 1.5452 8江蘇 1.0999 0.7593 1.1832 2.8563 0.3994 1.3266 1.0365 10湖南 0.7269 0.8325 0.7731 0.7516 0.7018 1.6527 1.3360 8黑龍江 1.1591 0.7293 1.5133 3.8793 0.3613 1.3573 0.7712 14
Comparison of modeling effect among rice from different regions with near infrared technology
HOU Qi-jun,JU Xing-rong*,YUAN Jian,HE Rong,ZHU Zhen-ying
(College of Food Science&Engineering,Nanjing University of Finance and Economics,Jiangsu Key Laboratory of Quality Control and Deep-Utilizing Technology of Cereals and Oils,Nanjing 210023,China)
The representative rice samples were selected from four provinces of Anhui,Jiangsu,Hunan and Heilongjiang.With the determination of its moisture content,crude protein content,fatty acid values and amylose content,scanning the near infrared spectra,establishing the quantitative analysis model by using partial least squares(PLS),comparing the different modeling results of same index of different regions to explore whether establishing the model of near infrared technology need to distinguish areas.The results showed that if the samples were representative enough,the modeling effect of same index between different areas exist certain differences based on reliable model built of different indexes.Four provinces moisture content modeling determination coefficient(R2)were 0.91,0.97,0.94,0.85,crude protein content modeling determination coefficient(R2)were 0.94,0.78,0.87,0.72,fatty acid value modeling determination coefficient(R2)were 0.77,0.60,0.83,0.65,amylose content modeling determination coefficient(R2)were 0.68,0.58,0.69,0.53,respectively.
different areas;rice;near infrared technology;modeling effect
TS201.1
A
1002-0306(2016)08-0125-06
10.13386/j.issn1002-0306.2016.08.017
2015-09-14
后其軍(1991-),男,在讀碩士研究生,研究方向:食品加工與檢測(cè)技術(shù),E-mail:houqijuny@126.com。
*通訊作者:鞠興榮(1957-),男,博士,研究方向:食品營(yíng)養(yǎng)、功能食品及農(nóng)產(chǎn)品深加工,E-mail:xingrongju@163.com。
國(guó)家科技支撐計(jì)劃(2013BAD17B02-2);江蘇省普通高校研究生科研創(chuàng)新計(jì)劃項(xiàng)目(KYZZ_0276)。