李 斌, 蓮 花, 布 仁, 渠 弼, 白文明
(內(nèi)蒙古醫(yī)科大學(xué),內(nèi)蒙古 呼和浩特 010110)
防風(fēng)為傘形科植物防風(fēng)Saposhnikoviadivaricate(Turcz.)Schischk.的干燥根,主產(chǎn)于我國內(nèi)蒙古、遼寧、河北等北方或東北地區(qū)[1],具有祛風(fēng)解表、勝濕止痛、止痙等功效[2]。防風(fēng)中含有豐富的香豆素、色原酮、多糖、聚乙炔類成分[3],研究發(fā)現(xiàn),防風(fēng)具有抑制類風(fēng)濕關(guān)節(jié)炎、陣痛、消化性潰瘍,保護(hù)神經(jīng)系統(tǒng),抗痙攣、抗炎、抗腫瘤等活性[4-8]。東北三省和內(nèi)蒙古是防風(fēng)的道地產(chǎn)區(qū),其在我國境內(nèi)的分布較廣,受到生長環(huán)境的影響,藥效成分的含量及臨床藥效等均可能出現(xiàn)較大差異[9]。加之,我國中藥材市場普遍存在混用、亂用及以次充好等現(xiàn)象,使得防風(fēng)產(chǎn)地的鑒別非常重要。
近紅外分光譜法以其能夠進(jìn)行快速、無損分析的特點(diǎn),已廣泛應(yīng)用于中藥材質(zhì)量控制的研究[10-13]。雖然有報(bào)道基于(中)紅外光譜法可有效地判別不同產(chǎn)地的防風(fēng)[14],但該方法需要將樣品壓片,耗時(shí)費(fèi)力,無法滿足在線分析的要求。
本研究采集并購買內(nèi)蒙古自治區(qū)(赤峰)、遼寧(阜新)、河北、甘肅、黑龍江這5個(gè)產(chǎn)地防風(fēng),利用漫反射方式采集近紅外光譜,結(jié)合主成分分析(PCA)和偏最小二乘判別分析(PLS-DA)等方法,建立預(yù)測(cè)防風(fēng)產(chǎn)地屬性的快速無損分析方法。
1.1 儀器 NIRMaster傅里葉變換近紅外光譜儀(瑞士Buchi公司);DFY-1000C中藥粉碎機(jī)(上海左樂儀器有限公司);JET1002G/00電子天平(瑞士梅特勒-托利多公司)。
1.2 防風(fēng) 防風(fēng)共5批,分別為2019年采自內(nèi)蒙古自治區(qū)赤峰、遼寧省阜新境內(nèi)的2批,以及2018年購自河北、甘肅、黑龍江防風(fēng)市場的3批,經(jīng)內(nèi)蒙古醫(yī)科大學(xué)藥學(xué)院生藥教研室渠弼副教授鑒定為正品,按每份約50 g的量分成若干份,中藥粉碎機(jī)粉碎,共得到內(nèi)蒙古產(chǎn)15份、遼寧產(chǎn)15份、河北產(chǎn)30份、甘肅產(chǎn)30份、黑龍江產(chǎn)30份。
2.1 分析條件 溫度24~26 ℃;相對(duì)濕度45%~50%;粉末累積掃描次數(shù)32次;掃描范圍10 000~4 000 cm-1;分辨率為8 cm-1。
2.2 樣品測(cè)定 采用積分球漫反射法,將防風(fēng)粉末置于樣品杯中,自動(dòng)旋轉(zhuǎn)測(cè)量3個(gè)位置的近紅外光譜,結(jié)果見圖1。
2.3 數(shù)據(jù)分析 本研究采用主成分分析(PCA)、偏最小二乘判別分析(PLS-DA)建立判別不同產(chǎn)地防風(fēng)的判別模型,并通過外部未知樣品對(duì)判別模型進(jìn)行驗(yàn)證。為了使不同產(chǎn)地防風(fēng)光譜之間具有可比性,在建立相應(yīng)模型前將對(duì)漫反射近紅外光譜進(jìn)行K-M轉(zhuǎn)換[15];為了分離重疊吸收峰,并校正基線漂移和光散亂對(duì)近紅外光譜有效信息的影響,采用基于Savitzky-Golay算法的微分處理法(1階、2階微分)和標(biāo)準(zhǔn)正態(tài)變量變換處理法(SNV)對(duì)光譜進(jìn)行前處理。
圖1 不同產(chǎn)地防風(fēng)近紅外光譜圖
將不同產(chǎn)地防風(fēng)進(jìn)行隨機(jī)分組,分別為校正組95份(內(nèi)蒙古、遼寧產(chǎn)各10份,河北、甘肅、黑龍江產(chǎn)各25份)、驗(yàn)證組25份(各產(chǎn)地5份)。參照文獻(xiàn)[16-17]報(bào)道,基于校正組防風(fēng)的近紅外光譜進(jìn)行PCA分析,將近紅外光譜在各載荷上的得分投影到坐標(biāo)系中,確定能表征不同產(chǎn)地防風(fēng)差異的2個(gè)載荷,相同產(chǎn)地防風(fēng)近紅外光譜將出現(xiàn)在坐標(biāo)系的相近區(qū)域,而不同產(chǎn)地的將出現(xiàn)在坐標(biāo)系的較遠(yuǎn)區(qū)域,從而可進(jìn)行區(qū)分。為了評(píng)價(jià)所建立模型的優(yōu)劣,選用校正組以外的防風(fēng)(驗(yàn)證組)來驗(yàn)證模型對(duì)未知樣品的鑒別能力。
參照文獻(xiàn)[18]報(bào)道,定義驗(yàn)證組防風(fēng)的95個(gè)近紅外光譜為自變量(X),各近紅外光譜的分組信息為因變量(Y)。由于本研究所用防風(fēng)來源于5個(gè)產(chǎn)地,所以每1個(gè)近紅外光譜(自變量)對(duì)應(yīng)的因變量數(shù)為5個(gè),每1個(gè)因變量代表1個(gè)產(chǎn)地,當(dāng)該因變量代表的產(chǎn)地與對(duì)應(yīng)的近紅外光譜的產(chǎn)地一致時(shí)取值1,否則取值-1,再基于驗(yàn)證組防風(fēng)的自變量及因變量數(shù)據(jù),利用PLS2算法建立判別防風(fēng)產(chǎn)地的數(shù)學(xué)模型。為了避免監(jiān)督學(xué)習(xí)算法出現(xiàn)過擬合現(xiàn)象,選用驗(yàn)證組的樣品對(duì)預(yù)測(cè)模型的優(yōu)劣進(jìn)行評(píng)價(jià),由于PLS2算法給出的預(yù)測(cè)結(jié)果為5個(gè)變量數(shù)值,故最接近1的變量所代表的產(chǎn)地即為防風(fēng)原產(chǎn)地。另外,也可通過主成分分析對(duì)預(yù)測(cè)得到的因變量數(shù)據(jù)(PLS2模型獲得的預(yù)測(cè)數(shù)值)進(jìn)行降低維度處理后,以二維坐標(biāo)散點(diǎn)圖中的樣品分布區(qū)域(99.9%等概率區(qū)域)來判斷防風(fēng)原產(chǎn)地,即相同產(chǎn)地防風(fēng)出現(xiàn)在二維坐標(biāo)系的相近區(qū)域內(nèi),不同產(chǎn)地的出現(xiàn)在較遠(yuǎn)的區(qū)域。然后,采用坐標(biāo)系散點(diǎn)圖的方式表示原產(chǎn)地預(yù)測(cè)結(jié)果,數(shù)據(jù)解析均基于FreeMat v4.0軟件完成。
3.1 PCA 圖2顯示,除校正組(圖2a)外,其余各組前處理光譜建立的模型都能將不同原產(chǎn)地防風(fēng)進(jìn)行分離,并且無重疊;99.9%等概率區(qū)域(橢圓處)無重疊,其中基于2階微分加SNV處理光譜的鑒別模型對(duì)校正組中不同產(chǎn)地防風(fēng)的分離效果最佳,并對(duì)驗(yàn)證組防風(fēng)具有同樣的鑒別效果(圖2f),原產(chǎn)地鑒別的準(zhǔn)確率為100%,故確定該模型為防風(fēng)原產(chǎn)地的鑒別模型;內(nèi)蒙古自治區(qū)、遼寧省產(chǎn)防風(fēng)的等概率橢圓區(qū)域相對(duì)較大,即相同原產(chǎn)地的組內(nèi)差異比其他原產(chǎn)地大,其原因可能是建立判別模型時(shí)上述2個(gè)產(chǎn)地的防風(fēng)較少,導(dǎo)致通過PCA獲得的主成分所代表的與這2個(gè)產(chǎn)地防風(fēng)特征有關(guān)的信息量降低,從而使組內(nèi)差異變大。
圖2 基于校正組近紅外光譜建立的鑒別模型及驗(yàn)證組防風(fēng)鑒別結(jié)果(Ⅰ)
圖3顯示,4 344、4 444 cm-1位置附近的載荷值較大,表明近紅外吸收對(duì)判別模型的判別結(jié)果起到了顯著作用,是不同產(chǎn)地防風(fēng)差異的關(guān)鍵因素;該處吸收峰主要來源于C-H基團(tuán)的合頻振動(dòng),在近紅外光譜的對(duì)應(yīng)位置(圖1a)上可觀察到強(qiáng)度較大者。另外,通過觀察經(jīng)前處理(2階微分+SNV)后的低波數(shù)段的擴(kuò)大圖(圖1b)發(fā)現(xiàn),上述2個(gè)波數(shù)位置附近吸收強(qiáng)度及吸收峰形狀有較大差異。
圖3 主成分分析載荷圖
圖4顯示,不同產(chǎn)地防風(fēng)近紅外光譜差異主要出現(xiàn)在低波數(shù)段,表明與該波數(shù)段吸收源對(duì)應(yīng)的成分在不同產(chǎn)地防風(fēng)中含量或分布狀況可能存在明顯差異,可得到很好的分離。
3.2 PLS-DA 圖5顯示,光譜前處理的有無對(duì)防風(fēng)原產(chǎn)地判別結(jié)果的影響較小,即產(chǎn)地鑒別模型能很好地將不同產(chǎn)地防風(fēng)進(jìn)行分離,而且99.9%等概率區(qū)域(橢圓處)無重疊。綜合考慮散點(diǎn)圖上校正組防風(fēng)各點(diǎn)的分散情況和模型對(duì)驗(yàn)證組防風(fēng)的預(yù)測(cè)準(zhǔn)確度(圖5e),最終選擇基于二階微分處理光譜的PLS2算法為建立模型的方法,發(fā)現(xiàn)內(nèi)蒙古自治區(qū)、遼寧省產(chǎn)防風(fēng)的等概率橢圓區(qū)域相對(duì)較大,表明這2個(gè)產(chǎn)地防風(fēng)組內(nèi)差距比其他產(chǎn)地大,與PCA結(jié)果一致,其主要原因?yàn)楫?dāng)?shù)胤里L(fēng)數(shù)較少。
圖6顯示,5 028、4 924、4 664、4 472 cm-1附近的取值較大,表明上述波數(shù)處吸光度對(duì)判別結(jié)果的貢獻(xiàn)率較高,與上述波數(shù)對(duì)應(yīng)的吸收源(成分)可能是不同產(chǎn)地防風(fēng)差異的關(guān)鍵因素;該處吸收峰主要來源于C-H基團(tuán)的合頻振動(dòng),近紅外光譜(圖1a)對(duì)應(yīng)位置上可觀察到明顯較強(qiáng)的一系列吸收峰,與PCA結(jié)果一致,進(jìn)一步證明是該波數(shù)段對(duì)應(yīng)成分的含量或分布狀況等在不同產(chǎn)地防風(fēng)之間產(chǎn)生差異,可得到很好的分離。
圖4 不同產(chǎn)地防風(fēng)差光譜散點(diǎn)圖
圖5 基于校正組近紅外光譜建立的鑒別模型及驗(yàn)證組防風(fēng)鑒別結(jié)果(Ⅱ)
圖6 PLS-DA模型的回歸系數(shù)散點(diǎn)圖
防風(fēng)是典型的道地藥材,藥用價(jià)值與原產(chǎn)地有著密切的關(guān)系,所以防風(fēng)的原產(chǎn)地鑒別是其質(zhì)量控制的重要環(huán)節(jié)。本研究基于近紅外光譜結(jié)合化學(xué)計(jì)量學(xué)的方法,建立通過防風(fēng)的近紅外光譜預(yù)測(cè)原產(chǎn)地的快速、無損分析方法,且該方法的預(yù)測(cè)精度符合實(shí)際應(yīng)用的要求。不同產(chǎn)地防風(fēng)的藥效存在較大差異,而造成藥效差異的原因非常復(fù)雜,可能是多個(gè)藥效成分協(xié)同作用的結(jié)果,所以很難用單一或幾個(gè)化學(xué)成分的含量來評(píng)價(jià)其藥用價(jià)值。近紅外光譜的吸收主要來源于分子中含氫基團(tuán)的倍頻和合頻振動(dòng),理論上中草藥中含有的全部有機(jī)物都將在該波段產(chǎn)生光譜吸收,即防風(fēng)的近紅外光譜幾乎包含了所有藥效成分的光譜信息。利用近紅外光譜法對(duì)防風(fēng)原產(chǎn)地進(jìn)行鑒別分析,實(shí)際上是以防風(fēng)中含有的絕大部分藥效物質(zhì)為基礎(chǔ)進(jìn)行的判別分析。所以,判別結(jié)果反映的是防風(fēng)整體性質(zhì)的差異,迎合中藥質(zhì)量控制過程中整體評(píng)價(jià)藥材屬性的最新研究思路。本研究建立的防風(fēng)原產(chǎn)地鑒別方法的操作非常簡單,僅需要將防風(fēng)進(jìn)行粉碎后采集近紅外光譜,并將近紅外光譜帶入數(shù)學(xué)模型即可。不僅分析速度快、樣品前處理簡單,而且光譜檢測(cè)前后藥材的藥用屬性不發(fā)生變化,有潛力作為制劑過程中中藥材原產(chǎn)地篩選的在線分析技術(shù),提高中藥材質(zhì)量控制的現(xiàn)代化程度。