曾韋珊,黃林旺,呂欣欣,毛積鵬,2,馮志恒,劉天頤,黃少偉
(1.華南農(nóng)業(yè)大學(xué) a.林學(xué)與風(fēng)景園林學(xué)院;b.廣東省森林植物種質(zhì)創(chuàng)新與利用重點(diǎn)實(shí)驗(yàn)室,廣東 廣州 510642;2.臺(tái)山市紅嶺種子園,廣東 臺(tái)山 529223)
濕加松Pinus elliottii×P.caribaea是濕地松Pinus elliottii與加勒比松Pinus caribaea,包括古巴本種、洪都拉斯和巴哈馬變種的雜交子代,為20世紀(jì)50年代由澳大利亞昆士蘭林業(yè)研究所培育,其綜合了雙親的優(yōu)良特性,具有生長(zhǎng)速度快、生長(zhǎng)量大、耐水濕、樹干通直、抗性好等優(yōu)點(diǎn)[1-2],目前在我國(guó)南方省區(qū)廣泛使用。松針(pine needles)為松科植物Pinaceae 松屬Pinus植物的針形葉,其含有豐富的營(yíng)養(yǎng)成分和黃酮類活性物質(zhì),具有多樣的保健作用,如抗衰老氧化[3]、抗癌[4]、抑菌[5]等。類黃酮(flavonoids)化合物是具有廣泛生物活性的植物次生代謝產(chǎn)物,主要包括查耳酮、黃酮、黃酮醇、黃烷雙醇、花色素苷、縮合單寧等,其參與植物的生長(zhǎng)發(fā)育和防御,是植物色素的主要來源,在植物各個(gè)部位都有積累,此外,類黃酮化合物的抗氧化、抗癌、抗誘變、抗紫外線輻射等作用對(duì)人類的健康有積極作用,其中黃酮類成分兒茶素和表兒茶素具有抗氧化、抗心血管疾病、抗癌等作用[6]。目前檢測(cè)植物提取物中活性成分的方法主要有高效液相色譜-質(zhì)譜(HPLC-MS)、氣相色譜-質(zhì)譜(GC-MS)、紫外分光光度計(jì)法等[7],雖然上述測(cè)定方法精準(zhǔn)度較高,但存在預(yù)處理復(fù)雜、操作過程中試劑易污染、不易操作、成本高等局限性[8]。
近紅外光譜(Near Infrared Spectroscopy,NIRS)技術(shù)能將光譜測(cè)量、化學(xué)計(jì)量學(xué)和基本測(cè)量相結(jié)合,對(duì)樣品成分含量進(jìn)行快速檢測(cè),可以客觀地反映樣品成分的整體物質(zhì)基礎(chǔ),并反映其有機(jī)成分、礦物質(zhì)組成和特征成分。相比于其他技術(shù),具有操作簡(jiǎn)便、高效、低成本、分析時(shí)間短等優(yōu)點(diǎn)[9],已被廣泛應(yīng)用于農(nóng)林業(yè)[10]、食品[11]、醫(yī)藥[12]等領(lǐng)域。在林木研究中,近紅外光譜技術(shù)被用于營(yíng)養(yǎng)物質(zhì)含量檢測(cè)、品種鑒別、霉變和缺陷判別等方面,如Yi 等[13]預(yù)測(cè)了在570~1 840 nm波段內(nèi)的核桃營(yíng)養(yǎng)成分,其中水、蛋白質(zhì)、脂肪的決定系數(shù)(R2)分別為0.952、0.977 和0.990,預(yù)測(cè)均方根誤差(RMSEP)分別為0.058、0.182和0.191;Manfredi 等[14]利用便攜式紅外光譜儀與多元統(tǒng)計(jì)分析結(jié)合對(duì)榛子品種分類,發(fā)現(xiàn)向后消去偏二乘(backward elimination partial least square,BE-PLS)分類模型的交叉驗(yàn)證準(zhǔn)確率達(dá)98.18%,比偏最小二乘(partial least square,PLS)高;Canneddu 等[15]用近紅外光譜預(yù)測(cè)影響澳洲堅(jiān)果風(fēng)味的過氧化值(peroxide value,PV)和酸度指數(shù)(acidity index,AI),過氧化值的R2為0.72,酸度指數(shù)的R2為0.8。本研究用96 份濕加松松針粉材料,構(gòu)建了兒茶素和表兒茶素總量近紅外模型,能夠快速測(cè)定濕加松松針中的活性成分含量,為濕加松高含量活性成分的篩選提供基礎(chǔ)。
以種植于廣東省臺(tái)山市紅嶺種子園的6年生濕加松子代測(cè)定林為研究材料,于2019年8月隨機(jī)采取111 個(gè)生長(zhǎng)旺盛且無病蟲害單株的當(dāng)年生松針組織部位鮮樣約100 g,立即將采集到的松針樣品帶回實(shí)驗(yàn)室去除枝梢、枯葉。利用鼓風(fēng)干燥箱在75℃條件下對(duì)松針進(jìn)行加熱干燥,干燥時(shí)間為72 h。干燥后的松針經(jīng)過充分粉碎后過60 目篩,裝入密封袋,得到111 份濕加松松針粉末樣本。隨機(jī)選擇其中96 份樣本作為預(yù)測(cè)集,其余15 份樣本作為外部驗(yàn)證集。
1.2.1 濕加松針葉兒茶素和表兒茶素含量的測(cè)定
樣品前處理。用電子天平稱取200 mg 濕加松松針粉樣本,放入2 mL 離心管中。加入600 μL甲醇溶液,渦旋振蕩30 s,室溫超聲15 min。12 000 r/min 4℃離心10 min,吸取上清液并使其過0.22 μm 濾膜,將過濾液裝入檢測(cè)瓶待分析。
液質(zhì)聯(lián)用儀分析條件。美國(guó)Waters 公司API5000 三重四極桿液質(zhì)聯(lián)用儀,色譜條件:色譜 柱ACQU ITY UPLC?BEH C18(2.1×100 mm,1.7 μm),柱溫40℃,進(jìn)樣量5 μL。流動(dòng)相:以0.1%甲酸作A 相,甲醇為B 相,流速0.25 mL/min。洗脫梯度:10% B,0~1 min;10 %~33 % B,1~3 min;33 %,3~10 min B;33%~50% B,10~15 min;50%~90% B,15~20 min;90 % B,20~21 min;90%~10% B,21~22 min;10% B,22~25 min。
質(zhì)譜條件。電噴霧負(fù)離子源(ESI),用多重反應(yīng)離子監(jiān)測(cè)(MRM)模式進(jìn)行掃描,離子源溫度500℃,電壓4 500 V,氣簾氣是30 psi,碰撞氣為6 psi,霧化氣和輔助氣均為50 psi。
1.2.2 光譜采集
使用型號(hào)為DA7200 的近紅外光譜分析儀(瑞典波通儀器公司),在進(jìn)行光譜采集前將樣品放置于溫度為22℃左右的實(shí)驗(yàn)室中24 h,掃描樣品前儀器開機(jī)預(yù)熱30 min,光譜掃描波長(zhǎng)為950~1 650 nm,光斑直徑為3.5 cm,SPC 文件分辨率為5 nm,光譜采集速度約為100 條光譜/s,掃描次數(shù)為100 次/s。每一個(gè)松針粉樣品掃描3 次,重復(fù)裝樣3 次,取平均光譜,保存數(shù)據(jù)用于后續(xù)分析。
1.2.3 光譜預(yù)處理
近紅外光譜儀除了采集樣品本身的信息外,還包含了噪音、樣品背景、雜散光等其他信息。為了消除干擾信息,提高模型精準(zhǔn)度,需對(duì)原始光譜進(jìn)行異常樣品的剔除、降噪、有效信息提取等預(yù)處理。常用的預(yù)處理方法有:平滑(Smoothing)、導(dǎo)數(shù)(Derivative)、數(shù)據(jù)增強(qiáng)變換(Data enhancement)、標(biāo)準(zhǔn)正態(tài)變量變換(Standard normal variable transformation,SNV)、多元散射校正(Multiplicative scatter correction,MSC)和傅里葉變換(Fourier transform,TF)等[16]。平滑算法(Smoothing)假設(shè)光譜噪聲是以零為中心而產(chǎn)生的均勻隨機(jī)白噪聲,若多次測(cè)量求取平均值可消除噪聲并提高樣品信號(hào);樣品的不均勻性、光透過樣品或從樣品反射回來產(chǎn)生的散射會(huì)對(duì)樣品光譜帶來誤差,標(biāo)準(zhǔn)正態(tài)變量變換算法(SNV)可以用來校正因散射而引起的光譜誤差,在光譜研究中有著廣泛的應(yīng)用;多元散射校正將樣品集的平均光譜與每個(gè)樣品任意波長(zhǎng)點(diǎn)下反射吸光度值看成近似線性關(guān)系,以消除由樣本顆粒分布不均勻、顆粒大小不同所產(chǎn)生的散射對(duì)光譜的影響,校正光譜信息;導(dǎo)數(shù)算法是近紅外模型中常用的一種預(yù)處理方法,其能夠有效消除基線漂移和其他干擾背景,提高模型準(zhǔn)確性。
1.2.4 近紅外模型的建立
在獲得近紅外光譜數(shù)據(jù)以及參照數(shù)據(jù)以后,依次進(jìn)行光譜數(shù)據(jù)預(yù)處理、建立近紅外模型、模型外部驗(yàn)證3 個(gè)步驟。將采集的光譜數(shù)據(jù)導(dǎo)入The Unscrambler 軟件,光譜波長(zhǎng)范圍為950~1 650 nm,對(duì)光譜進(jìn)行預(yù)處理,用偏最小二乘法(Partial Least Square Regression,PLS)回歸分析建立模型,在PLS 算法中采用交叉證實(shí)法。偏最小二乘判別分析法根據(jù)觀察或測(cè)量到的若干變量值對(duì)研究對(duì)象進(jìn)行判別分析,是一種有監(jiān)督的判別分析方法,其可以減少變量間多重共線性產(chǎn)生的影響,并根據(jù)不同處理樣本的特征建立一定的判別準(zhǔn)則,即要求由各因素構(gòu)成的數(shù)據(jù)矩陣X分解得到的隱變量t與由各目標(biāo)構(gòu)成的數(shù)據(jù)矩陣Y分解得到的隱變量u相關(guān)程度最大或重疊最大,并利用它對(duì)新的觀測(cè)對(duì)象進(jìn)行類別判定[17]。模型建好后,剔除異常值優(yōu)化模型,得到濕加松兒茶素和表兒茶素總量預(yù)測(cè)最優(yōu)近紅外模型。
1.2.5 近紅外模型的評(píng)價(jià)
在建立光譜模型的過程中,需要借助化學(xué)計(jì)量學(xué)指標(biāo)對(duì)模型的好壞進(jìn)行統(tǒng)計(jì)分析。本研究采用樣本校正相關(guān)系數(shù)R2、校正均方根誤差RMSEC、交互驗(yàn)證相關(guān)系數(shù)R2cv、交互驗(yàn)證均方根誤差RMSEV、預(yù)測(cè)均方根誤差RMSEP 等參數(shù)評(píng)價(jià)模型的質(zhì)量,公式如下[18]:
式(1)~(2)中:n為樣品數(shù),Si為實(shí)測(cè)值,為實(shí)測(cè)值的平均值,為預(yù)測(cè)值。
在上述指標(biāo)中,R2、R2cv、RMSEC、RMSEV和RMSEP 是有效評(píng)價(jià)模型的指標(biāo),其中,R2、評(píng)價(jià)模型的擬合效果,RMSEC、RMSEV 和RMSEP 評(píng)價(jià)模型的預(yù)測(cè)精度。模型中校正集相關(guān)系數(shù)R2和交互驗(yàn)證集相關(guān)系數(shù)的值越接近1,校正集均方根誤差(Root Mean Square Error of Calibration,RMSEC)和交互驗(yàn)證集均方根誤差(Root Mean Square Error of Validation,RMSEV)值越小,則模型的預(yù)測(cè)效果越好[19]。通過驗(yàn)證集進(jìn)行外部驗(yàn)證檢驗(yàn)?zāi)P唾|(zhì)量,得到的相關(guān)系數(shù)(Related coefficient,R)越高,預(yù)測(cè)均方根誤差(Root Mean Square Error of Prediction,RMSEP)越低,模型效果越好。此外,模型的校正集、預(yù)測(cè)集和驗(yàn)證集各個(gè)評(píng)價(jià)指標(biāo)越接近,說明最終得到的模型效果越好、越理想。
松針粉樣品的兒茶素和表兒茶素含量用液質(zhì)聯(lián)用儀測(cè)定(表1),96 個(gè)校正集樣品兒茶素和表兒茶素總量最小值為2.7660 μg·g-1,最大值為66.9120 μg·g-1,平均值為17.5294 μg·g-1,標(biāo)準(zhǔn)差為11.1553 μg·g-1。15 個(gè)驗(yàn)證集樣品兒茶素和表兒茶素總量最小值為8.5960 μg·g-1,最大值為28.9250 μg·g-1,平均值為15.715 0 μg·g-1,標(biāo)準(zhǔn)差為5.6942 μg·g-1。
近紅外光譜是分子在近紅外光照射下,伸縮振動(dòng)產(chǎn)生的倍頻與伸縮振動(dòng)和彎曲振動(dòng)產(chǎn)生的合頻吸收,其與分子的結(jié)構(gòu)密切相關(guān),分子結(jié)構(gòu)不同或所處化學(xué)環(huán)境不同,產(chǎn)生的光譜信息有明顯差異,因此,可通過分析樣品吸收光譜時(shí)得到的光譜信息,統(tǒng)計(jì)數(shù)據(jù)建立模型。本實(shí)驗(yàn)通過軟件The Unscrambler 9.7 采集96 個(gè)濕加松松針粉樣品的近紅外反射光譜,得到樣品的近紅外原始光譜圖,如圖1所示。光譜波段為950~1 650 nm,從圖中可看到一個(gè)顯著的吸收峰,樣品的吸光度在0.2 以下,同一波長(zhǎng)不同樣品的吸收強(qiáng)度各不相同,但是不同波長(zhǎng)下所有樣品的走勢(shì)、波峰、波谷基本相似,在1 460 nm 處吸收峰較強(qiáng)。每份樣品在同一波長(zhǎng)下的吸光度不同,表明濕加松松針粉樣品間兒茶素和表兒茶素總量有差異,近紅外光譜和成分含量之間的關(guān)系可以通過建立數(shù)學(xué)模型來反映。
表1 濕加松針葉兒茶素和表兒茶素總量校正集與驗(yàn)證集統(tǒng)計(jì)表Table 1 Statistical table of total amount of catechin and l-epicatechin correction set and verification set of Pinus elliottii×P.caribaea needles
圖1 96 個(gè)校正集樣品近紅外原始反射光譜Fig.1 Near infrared original reflection spectrum of 96 correction set samples
本研究用一種及多種處理方法結(jié)合對(duì)近紅外原始光譜進(jìn)行預(yù)處理,結(jié)果見表2。不同的預(yù)處理方式對(duì)濕加松兒茶素和表兒茶素總量的建模效果不同,分別采用Smoothing S.Golay、MSC 和Normalize 方式處理模型,模型并未得到明顯優(yōu)化,甚至處理后的參數(shù)值比原始參數(shù)低;而對(duì)模型分別進(jìn)行SNV、Derivatives S.Golay、Smoothing S.Golay+Derivatives S.Golay+SNV、Derivatives S.Golay+MSC、Smoothing S.Golay+Derivatives S.Golay+MSC、Derivatives S.Golay+SNV、Smoothing S.Golay+Derivatives S.Golay 預(yù)處理,模型得到了優(yōu)化,且預(yù)處理方式為Smoothing S.Golay+Derivatives S.Golay 時(shí),模型的校正相關(guān)系數(shù)R2和交互驗(yàn)證相關(guān)系數(shù)R2cv值最大,校正均方根誤差RMSEC 和交互驗(yàn)證均方根誤差RMSEV值最低,模型達(dá)到最佳。
使用The Unscrambler 9.7 軟件對(duì)近紅外光譜數(shù)據(jù)進(jìn)行處理,用偏最小二乘法(Partial least squares method,PLS)交叉驗(yàn)證(Cross validation)建立近紅外光譜預(yù)測(cè)模型,建模波段為950~1 650 nm,主成分?jǐn)?shù)為16,預(yù)處理方法為Smoothing S.Golay+Derivatives S.Golay,預(yù)處理后光譜圖如圖2所示。建模結(jié)果見圖3,兒茶素和表兒茶素總量最優(yōu)模型的校正相關(guān)系數(shù)R2為0.935 2,交互驗(yàn)證相關(guān)系數(shù)R2cv為0.754 5,表明模型擬合度高,校正均方根誤差RMSEC 為2.145 8,交互驗(yàn)證均方根誤差RMSEV 為4.313 3,模型預(yù)測(cè)能力良好。
表2 濕加松兒茶素和表兒茶素總量不同預(yù)處理模型結(jié)果Table 2 Results of different pretreatment models of total catechin and l-epicatechin in Pinus elliottii × P.caribaea
圖2 Smoothing S.Golay+Derivatives S.Golay 處理紅外光譜圖Fig.2 Near infrared spectrogram processed by Smoothing S.Golay+Derivatives S.Golay Method
隨機(jī)選取15 份(不包括校正集樣品)樣品對(duì)已建立的近紅外模型進(jìn)行外部驗(yàn)證,結(jié)果表明,松針樣品的兒茶素和表兒茶素含量的外部檢驗(yàn)相關(guān)系數(shù)為0.833 9,預(yù)測(cè)均方根誤差RMSEP 為3.739 1,絕對(duì)誤差在0.02~8.82 之間,相對(duì)誤差在0.19%~50.53%之間,表明模型的預(yù)測(cè)值與真實(shí)值吻合程度高,可用于樣品含量的初步預(yù)測(cè)。
圖3 濕加松針葉兒茶素和表兒茶素總量模型預(yù)測(cè)結(jié)果Fig.3 Prediction results of total needle catechin and l-epicatechin model of Pinus elliottii×P.caribaea
圖4 兒茶素和表兒茶素總量模型的外部驗(yàn)證結(jié)果Fig.4 External validation results of total catechin and l-epicatechin model
近紅外光譜分析的核心在于基于化學(xué)計(jì)量學(xué)的數(shù)學(xué)模型建立,在采集光譜的過程中往往會(huì)受到儀器自身或者外部測(cè)試環(huán)境等因素的影響而產(chǎn)生噪聲,需對(duì)原始光譜進(jìn)行預(yù)處理。光譜預(yù)處理方法對(duì)建立預(yù)測(cè)能力強(qiáng)、穩(wěn)定性好的模型尤為重要,在不同物種最優(yōu)近紅外模型建立中,預(yù)處理方法不盡相同,如油菜硫苷近紅外模型采用Derivatives SG3+SNV 預(yù)處理,建立的模型較好[20];向日葵籽仁油酸、亞油酸和棕櫚酸的最佳光譜預(yù)處理方法分別為SNV+1st,MSC+1st,SNV[21];在建立杉木中綜纖維素和木質(zhì)素含量近紅外模型時(shí),采用二階微分處理和平滑預(yù)處理,所得模型可快速測(cè)定木材中綜纖維素和木質(zhì)素含量[22];在梨果糖濃度的近紅外光譜預(yù)處理方法研究中,王偉明等[23]發(fā)現(xiàn)使用平滑預(yù)處理得到的模型較好。本研究對(duì)濕加松兒茶素和表兒茶素總量的近紅外模型采用了10 種預(yù)處理方式,發(fā)現(xiàn)預(yù)處理方法為Smoothing S.Golay+Derivatives S.Golay 時(shí)模型最優(yōu),建立的模型能夠滿足樣品成分含量的快速測(cè)定。
利用近紅外光譜技術(shù)測(cè)定兒茶素和表兒茶素含量,目前已有相關(guān)報(bào)道,因材料、方法等不同,有些方法對(duì)兒茶素含量的評(píng)估效果較為理想,有些則效果不佳。李賽楠等[24]建立火炬松表兒茶素近紅外預(yù)測(cè)模型,經(jīng)過MSC+FD+S.Golay 預(yù)處理后,校正相關(guān)系數(shù)RC為0.973 9,模型達(dá)到最優(yōu);黃俊仕等[25]建立了檢測(cè)綠茶滋味品質(zhì)指標(biāo)酚氨比近紅外預(yù)測(cè)模型,并將近紅外光譜技術(shù)與化學(xué)計(jì)量學(xué)方法結(jié)合,有效提高檢測(cè)精度;陳華才等[26]用近紅外光譜技術(shù)對(duì)茶多酚中的總兒茶素含量進(jìn)行測(cè)定,發(fā)現(xiàn)波長(zhǎng)為1 000~2 500 nm,光譜經(jīng)過SNV 預(yù)處理后,建模效果最好;劉洪林[27]對(duì)功夫紅茶咖啡堿和5 種兒茶素組分進(jìn)行近紅外快速測(cè)定,發(fā)現(xiàn)6 種成分中兒茶素模型預(yù)測(cè)能力最低,表兒茶素居中,總體上各模型預(yù)測(cè)性能優(yōu);郭志明[28]利用近紅外光譜檢測(cè)綠茶中的有效成分,結(jié)果發(fā)現(xiàn)LS-SVM 模型的泛化能力和預(yù)測(cè)精度俱佳;陳美麗等[29]對(duì)茉莉花中的主要成分建立近紅外光譜分析模型,發(fā)現(xiàn)模型中兒茶素和表兒茶素的預(yù)測(cè)值與真實(shí)值間相關(guān)系數(shù)達(dá)0.9 以上,模型預(yù)測(cè)準(zhǔn)確性高。
迄今為止,基于近紅外光譜技術(shù)對(duì)濕加松針葉兒茶素和表兒茶素總量測(cè)定的研究未見報(bào)道。本研究建立的濕加松針葉兒茶素和表兒茶素總量近紅外預(yù)測(cè)模型,準(zhǔn)確度高,重復(fù)性好,可靠性好,可用于濕加松針葉兒茶素和表兒茶素總量的快速測(cè)定和質(zhì)量評(píng)價(jià),有助于今后濕加松高含量活性成分的優(yōu)良個(gè)體的篩選,為今后培育高產(chǎn)、優(yōu)質(zhì)的濕加松個(gè)體奠定基礎(chǔ)。但本試驗(yàn)對(duì)儀器的穩(wěn)定性要求嚴(yán)格且建模所采用的松針樣品數(shù)量有限,故建立的模型有一定的局限性,今后可加大建模樣本量進(jìn)一步提高模型的預(yù)測(cè)效果。
本研究采用近紅外光譜技術(shù),選擇Smoothing S.Golay+Derivatives S.Golay 預(yù)處理方法,剔除數(shù)據(jù)中的異常值,建立了濕加松針葉兒茶素和表兒茶素含量的近紅外預(yù)測(cè)模型。校正相關(guān)系數(shù)R2為0.935 2,校正均方根誤差(RMSEC)為2.145 8,交互驗(yàn)證相關(guān)系數(shù)R2cv=0.754 5,交互驗(yàn)證均方根誤差(RMSEV)為4.313 4,外部驗(yàn)證相關(guān)系數(shù)R為0.833 9,預(yù)測(cè)均方根誤差(RMSEP)為3.739 1。模型的相關(guān)系數(shù)較高,表明建立的近紅外光譜預(yù)測(cè)模型精度高,預(yù)測(cè)效果佳,適用于濕加松針葉兒茶素和表兒茶素含量的快速鑒定,有利于加快對(duì)高含量生物活性成分的濕加松個(gè)體篩選的研究。