阮長青 ,鹿保鑫 ,梁雪梅 ,李志江 ,張愛武 ,張東杰
(1.黑龍江八一農(nóng)墾大學(xué)食品學(xué)院,黑龍江大慶 163319;2.黑龍江省農(nóng)產(chǎn)品加工與質(zhì)量安全重點實驗室,黑龍江大慶 163319;3.北大荒現(xiàn)代農(nóng)業(yè)產(chǎn)業(yè)技術(shù)省級培育協(xié)同創(chuàng)新中心,黑龍江大慶 163319)
黑龍江省是我國大豆主產(chǎn)區(qū),而北安則是黑龍江省大豆的主產(chǎn)區(qū)。市場經(jīng)常會出現(xiàn)一些以次充好和冒牌的黑龍江大豆、北安大豆。如何保護(hù)和提升黑龍江省大豆品牌優(yōu)勢,實現(xiàn)原產(chǎn)地溯源和種質(zhì)資源保護(hù),進(jìn)而提升大豆種植業(yè)和加工業(yè)整體水平,成為農(nóng)業(yè)科技者和監(jiān)管機構(gòu)關(guān)注的問題。
產(chǎn)地鑒別、溯源技術(shù)對特色名優(yōu)品牌產(chǎn)品保護(hù)的應(yīng)用日益廣泛[1]。近紅外光譜分析技術(shù)將樣品中有機分子含氫基團的特征信息,用于對比光譜曲線趨勢不同、不同地區(qū)、組成與含量不同的大豆樣品,從而確定未知樣品與已知樣品的關(guān)系,具有樣品制備簡單、無污染、分析快速的特點[2]。
由于大豆中礦物元素含量在不同地域間存在差異,利用礦物元素進(jìn)行的大豆產(chǎn)地判別是可行的[3],但檢測的設(shè)備昂貴、成本高、周期長。研究表明,近紅外高光譜成像技術(shù)可實現(xiàn)大豆非轉(zhuǎn)基因親本與轉(zhuǎn)基因品種的判別分析[4],利用近紅外光譜分析的理論及技術(shù)優(yōu)勢對非轉(zhuǎn)基因大豆進(jìn)行產(chǎn)地鑒別是一種有益的嘗試。從黑龍江省不同產(chǎn)地和品種的大豆樣品中篩選出有明顯差異的光譜波段,結(jié)合化學(xué)計量手段,建立近紅外光譜定性、定量分析模型并進(jìn)行北安地區(qū)大豆的產(chǎn)地判別。
隨機選取北安地區(qū)地理標(biāo)志的63份大豆樣品,其他3個地區(qū)108份,在每個區(qū)域的9個采樣點按“S”進(jìn)行布點,隨機采樣獲得共計171份樣品,每500 g為一個樣品。
樣品經(jīng)挑選、清洗、60℃下干燥、磨粉、篩分(100目),密封于-20℃條件下保存?zhèn)溆谩?/p>
采用凱氏定氮法、索氏抽提法、灼燒法、苯酚-硫酸法分別測定蛋白、油脂、總灰分、可溶性糖含量[5-8]。
傅立葉近紅外光譜儀開機、預(yù)熱,每隔1 h掃描一次背景,單通道采集光譜。漫反射鍍金積分球,InGaAs檢測器,分辨率8 cm-1,環(huán)境溫度25±1℃,相對濕度20%~30%,光譜范圍12 000~4 000 cm-1,掃描64次。
1.4.1 建模和預(yù)測
隨機選擇北安和其他地區(qū)全部樣品量的2/3作為訓(xùn)練集樣品,用于模型的建立;1/3作為驗證集樣品,用于模型的驗證。北安地區(qū)建模訓(xùn)練集樣品個數(shù)為42個,預(yù)測集樣品個數(shù)為21個;其他地區(qū)建模訓(xùn)練集樣品個數(shù)為72個,預(yù)測集樣品個數(shù)為36個。
1.4.2 基于定性分析的大豆產(chǎn)地判別模型
利用OPUS7.5軟件選出有明顯差異的波段建立定性分析模型。預(yù)處理方式分別為矢量歸一化(SNV)、一階導(dǎo)數(shù)(FD) /平滑、一階導(dǎo)數(shù)/SNV/平滑、二階導(dǎo)數(shù)(SD) /平滑、二階導(dǎo)數(shù)/SNV/平滑等,平滑點數(shù)分別記為5PS、9PS、13PS、17PS、21PS、25PS,為防止外界干擾、提高模型精度,采用因子化法對光譜進(jìn)行計算處理。通過比較S值來確定最優(yōu)預(yù)處理方式及光譜計算方法,建立定性分析模型[9-10]。
1.4.3 基于定量分析的大豆產(chǎn)地判別模型
采用交叉檢驗以偏最小二乘法(PLS)在特征波段建立定量分析模型。將北安大豆組分值用1表示,其他地區(qū)大豆組分值用-1表示,以0作為中間值判斷真?zhèn)?。通過模型將計算值大于0的視為北安大豆,小于0的為其他地區(qū)大豆,系統(tǒng)自動優(yōu)化篩選出最優(yōu)波段及預(yù)處理方式,光譜的預(yù)處理方式有消除常數(shù)偏移量、減去一條直線、SNV、最小-最大歸一化、多元散射矯正(MSC)、內(nèi)部標(biāo)準(zhǔn)、一階導(dǎo)數(shù)/平滑、二階導(dǎo)數(shù)/平滑、一階導(dǎo)數(shù)/減去一條直線/平滑、一階導(dǎo)數(shù)/SNV/平滑、一階導(dǎo)數(shù)/MSC/平滑等,通常采用檢驗集檢驗方式進(jìn)行模型檢驗,并最終建立定量分析模型。定量分析模型判別方法選用PLS,用一個線性模型來描述獨立變量Y與預(yù)測變量組X之間的關(guān)系。
1.4.4 模型驗證方法
利用OPUS 7.5軟件分別選擇定性分析,聚類分析測試和定量分析工具欄,調(diào)入模型,調(diào)入預(yù)測樣品光譜圖,獲得結(jié)果。
不同產(chǎn)地大豆品質(zhì)的差異分析見表1。
由表1可知,不同地區(qū)其營養(yǎng)成分含量差異較大,北安大豆中蛋白質(zhì)、油脂、可溶性糖及灰分含量均高于其他地區(qū)大豆(p<0.05),可溶性糖的含量比其他地區(qū)大豆高出近10%,這可能與北安地區(qū)獨有的氣候和土壤環(huán)境有關(guān)[11]。試驗表明,將樣品大豆?fàn)I養(yǎng)成分作為鑒別北安大豆的指標(biāo)是可行的。
表1 不同產(chǎn)地大豆品質(zhì)的差異分析
北安與其他地區(qū)大豆的近紅外光譜圖見圖1。
經(jīng)過不同的預(yù)處理后,對北安大豆與其他地區(qū)大豆進(jìn)行紅外光譜掃描(圖1),在7 495.12 cm-1處有較寬吸收峰,是脂肪族烴中C-H振動所引起的;在7 945.29 cm-1處的吸收峰是脂肪烴中的-CH2的二級振動所引起的;在8 393.14 cm-1處的吸收峰與蛋白質(zhì)和脂肪中的N-H鍵、C-H鍵、O-H鍵及C=O鍵的振動有關(guān)。結(jié)果表明,不同產(chǎn)地的近紅外光譜走勢大體一致,利用一階導(dǎo)數(shù)對光譜預(yù)處理后進(jìn)行方差分析,發(fā)現(xiàn)品種相同的大豆在不同的產(chǎn)地近紅外光譜也存在顯著性差異。
大豆在經(jīng)過不同的預(yù)處理之后,在波段70 00~7 500,7 900~8 400 cm-1處差異明顯,出現(xiàn)波段特性,選取波段范圍為 7 000~7 500,7 900~8 400,7 000~7 500,7 900~8 400 cm-1區(qū)域進(jìn)行建模分析。
不同的預(yù)處理方式對不同波段的影響見表2。
表2 不同的預(yù)處理方式對不同波段的影響
由表2可知,根據(jù)S值的大小來評價模型的準(zhǔn)確度,即S>1時,表示兩類樣品被唯一鑒別,S值越大模型準(zhǔn)確度越高;S<1時,表示兩類樣品未被均勻鑒別,S值越小模型準(zhǔn)確度越低。當(dāng)采用因子化法結(jié)合二階導(dǎo)數(shù)/5點平滑的預(yù)處理方式時,北安大豆和其他地區(qū)大豆樣品均能被唯一鑒別,且S值為1.313,因此選取該預(yù)處理方式并建立定性分析模型。
不同地區(qū)大豆樣品的因子化2D得分散點圖見圖2。
由圖2可知,將近紅外光譜技術(shù)與因子化法結(jié)合在特征波段采用二階導(dǎo)數(shù)/SNV/5點平滑對大米產(chǎn)地進(jìn)行判別,準(zhǔn)確率大于90%以上。
建立近紅外光譜與樣品組分化學(xué)值相關(guān)聯(lián)的模型,采用PLS法根據(jù)樣品光譜波段的差異波段范圍、預(yù)處理方式的選擇及維數(shù)的確立,利用加互驗證均方根誤差(RMSECV)進(jìn)行優(yōu)化處理,得出最優(yōu)組合。R2為定向系數(shù),其值越大表示預(yù)測含量值越接近真值,而RMSECV越小,模型的預(yù)測性能越好[12]。大豆中蛋白質(zhì)、油脂、灰分和可溶性糖的定量分析結(jié)果如下。
北安大豆中蛋白質(zhì)經(jīng)篩選分析處理后選擇無光譜預(yù)處理方式,最優(yōu)組合波段為9 400.9~6 098 cm-1和 5 450.6~4 249.8 cm-1,其 RMSECV 為 0.108,R2為99.46%,維數(shù)為10;其他地區(qū)大豆中蛋白質(zhì)采用消除常數(shù)偏移量處理方式,組合波段為9 400.9~7 498.5 cm-1和 6 100.9~5 447.7 cm-1,其 RMSECV為0.305,R2為97.26%,維數(shù)為7。
大豆蛋白質(zhì)預(yù)測值與參考值、RMSECV與維數(shù)的關(guān)系圖見圖3。
北安大豆中灰分采用多元散射校正的預(yù)處理方式,選擇特征波段7 501.3~6 799.7 cm-1和4 600.6~4 249.8 cm-1為最優(yōu)組合,其RMSECV為0.066 8,R2為94.16%,維數(shù)為6;其他地區(qū)大豆中灰分采用消除常數(shù)偏移量的預(yù)處理方式,特征波段為9 400.9~7 498.5 cm-1和 5 450.6~4 249.8 cm-1,其 RMSECV為0.070 5,R2為93.38%,維數(shù)為9。
大豆灰分預(yù)測值與參考值、RMSECV與維數(shù)的關(guān)系圖見圖4。
北安大豆中油脂采用消除常數(shù)偏移量的預(yù)處理方式,最優(yōu)組合波段9 400.9~6 098 cm-1和5 450.6~4 249.8 cm-1,其 RMSECV為 0.064,R2為 99.38%,維數(shù)為8;其他地區(qū)大豆中油脂采用最小-最大歸一化的預(yù)處理方式,組合波段為7 501.3~6 098和5 025.6~4 597.8,其RMSECV為0.093 1,R2為 99.48%,維數(shù)為8。
大豆油脂預(yù)測值與參考值、RMSECV與維數(shù)的關(guān)系圖見圖5。
北安大豆中可溶性糖采用SNV的處理方式,選擇特征波段為7 501.3~5 447.7 cm-1,其RMSECV為0.010 2,R2為100.00%,維數(shù)為10;其他地區(qū)大豆中可溶性糖采用無光譜預(yù)處理的方式,選擇特征波段為 5 775.7~5 447.7 cm-1,其 RMSECV為 0.046 4,R2為99.99%,維數(shù)為10。
大豆可溶性糖預(yù)測值與參考值、RMSECV與維數(shù)關(guān)系圖見圖6。
以大豆4種成分定量優(yōu)化分析結(jié)果確定定量分析模型。PLS法較其他方法建立的回歸模型更易于辨識系統(tǒng)信息與噪聲,也能夠在自變量存在嚴(yán)重多重相關(guān)性的條件下進(jìn)行回歸建模,其模型效果具有較高的精度。
調(diào)入已建立的定性定量分析模型,對北安大豆和其他地區(qū)大豆進(jìn)行分析。
定性定量分析模型對預(yù)測集大豆樣品的判定結(jié)果見表3。
表3 定性定量分析模型對預(yù)測集大豆樣品的判定結(jié)果
由表3可知,定性分析時,北安大豆和其他地區(qū)大豆的正確鑒別率分別為100.0%和97.1%。定量分析時,以灰分為基準(zhǔn),北安大豆和其他地區(qū)大豆的正確鑒別率均高達(dá)100.0%,這可能與北安地區(qū)特殊的地質(zhì)環(huán)境,大豆對礦物質(zhì)的富集能力較強有關(guān)[12];以蛋白質(zhì)、油脂、可溶性糖為基準(zhǔn),正確鑒別率均高于94.4%。表明建立的定性、定量分析模型對北安和其他地區(qū)的大豆的產(chǎn)地判別是可行的。
選取北安與其他地區(qū)大豆共171份樣品進(jìn)行產(chǎn)地鑒別研究,通過因子化法建立了定性鑒別分析模型,其S值為1.313。結(jié)果表明,北安地區(qū)、其他地區(qū)大豆正確鑒別率分別為100.0%和97.1%。采用PLS法建立的定量分析對北安大豆各組分的正確鑒別率分別為蛋白質(zhì)100.0%,灰分100.0%,油脂96.2%,可溶性糖96.2%。除此之外,其他地區(qū)大豆各組分的正確鑒別率為蛋白質(zhì)97.2%,灰分100.0%,油脂94.4%,可溶性糖94.4%,其中對北安和其他地區(qū)的灰分進(jìn)行定量分析鑒別的正確率最高。由此可知,采用FTNIS法結(jié)合因子化法和PLS法所建立的定性分析模型和定量分析模型可以用于快速準(zhǔn)確判別北安大豆,對于實現(xiàn)北安地區(qū)以及黑龍江省非轉(zhuǎn)基因大豆品牌的保護(hù)提供了技術(shù)支持。