楊天鳴,吳 燕,蘇 蕊,付海燕,楊 琛,張 璐,黃國貞
(中南民族大學藥學院,湖北 武漢 430074)
中藥的真?zhèn)蝺?yōu)劣鑒別自古以來為醫(yī)家所重視。中藥材緊缺,價格較貴,受利益所驅,出現(xiàn)了不少偽品和混淆品。中藥材的偽品和混淆品不僅直接影響了中藥的質量,而且造成入藥混亂。中藥炮制是為了適應中醫(yī)臨床辨證用藥的需要而發(fā)展起來的一項傳統(tǒng)制藥技術,而炮制方法工藝中由于不規(guī)范或誤傳誤用極大影響了炮制品的功效。因此,建立鑒別中藥材品種和炮制品的快速分析方法迫在眉睫。
由于中藥材絕大部分為植物中藥,因此植物學家鑒別植物種群的理論與方法被沿用于植物中藥的品種鑒別分析中。然而,市面流通的中藥材通常為植物的干燥組織或以飲片形式出現(xiàn),常常需要有經驗的專家對樣品進行顯微鑒別和薄層分析判別,但僅靠上述判別方法難以滿足要求并且常常出現(xiàn)錯判。為保證中藥材鑒定的客觀性、準確性與可靠性,現(xiàn)代分析檢測技術被用于中藥材品種鑒別[1-5],如色譜指紋圖譜、DNA分子遺傳標記法、激光拉曼光譜法、熒光光譜、電子鼻等。近紅外光譜(near-infrared,NIR) 技術以其光譜穩(wěn)定性好和信息量豐富等特點,近年已被逐步引入到中藥藥材整體質量控制中,并顯示出無損、快速、綠色的技術優(yōu)勢,但近紅外光譜中隱含的大量化學信息,需要借助化學計量學方法提取解析[6-16]。因此,化學模式識別方法成為近紅外光譜用于中藥材的真?zhèn)?、產地以及炮制前后藥材的鑒別的關鍵技術[6-16]。
作者利用近紅外漫反射光譜技術,通過多元散射校正(MSC)光譜預處理方法結合主成分-馬氏距離判別分析方法,建立了一種快速無損鑒別中藥材及炮制品的方法。
選擇7種中藥材為研究對象,菖蒲、赤芍、川穹、丹參、生甘草、開口箭、炮制品炙甘草,分別編號為A、B、C、D、E、F、G,除開口箭來自湖北宜昌外,其余藥材均來自武漢德仁堂大藥房。所有樣品洗凈、去泥沙,曬干。
實驗所用藥材均經中南民族大學藥學院萬定榮教授鑒定。
AntarisⅡ型傅立葉變換近紅外光譜儀(配有積分球漫反射采樣系統(tǒng)、InGaAs檢測器以及石英樣品杯,Result軟件用于光譜的采集,TQ 8.0軟件用于分析數(shù)據(jù)處理),美國Thermo Nicolet公司;FW-100型高速萬能粉碎機,天津泰斯特儀器有限公司;200 目標準檢驗篩(孔徑0.074 mm),浙江上虞五四紗篩廠;DZF-6021型真空干燥箱,上海索譜儀器有限公司。
1.3.1樣品的制備
全部中藥材用中藥粉碎機粉碎后過200目篩,制成細粉,然后在60 ℃下真空干燥24 h,干燥細粉儲存在干燥器內,備用。
1.3.2近紅外指紋圖譜的采集
將處理后的樣品分別盛入樣品池內,采用近紅外光譜儀的積分球漫反射附件采集近紅外光譜圖。采集條件:光譜范圍為10 000~4 000 cm-1,掃描次數(shù)為32次,分辨率為8 cm-1。光源采用empty門衰減,增益為2倍;以金箔為參比進行掃描;溫度為(25±1) ℃,濕度為(45±2)%。每種藥材測定10次,7種藥材共得到70個樣品光譜。分別以樣品測定順序按01~70進行編號,并劃分訓練集與預測集。樣品編號見表1。
表1樣品編號對照表
Tab.1Adetaileddatasetlistofallsamples
編號藥材訓練集預測集A菖蒲01~0708~10B赤芍11~1718~20C川穹21~2728~30D丹參31~3738~40E生甘草41~4748~50F開口箭51~5758~60G炙甘草61~6768~70
1.3.3光譜數(shù)據(jù)處理
所采集的光譜數(shù)據(jù)通過多元散射校正(MSC)進行光譜數(shù)據(jù)預處理。所得校正光譜由主成分分析確定其最佳主成分數(shù),再通過馬氏距離對其進行建模分析。
由于紅外原始光譜中常存在因量測樣品顆粒不勻、散射和各種噪聲及物理擾動等因素,致使對不同波長點量測光譜存在不同程度的差異和影響。因此,需要通過對藥材近紅外原始光譜進行多元散射校正以克服光譜散射所導致的差異。7種中藥材的近紅外(NIR)原始光譜、多元散射校正光譜如圖1所示。
由圖1可以看出,不同品種中藥材的近紅外光譜存在一定的差異,但部分樣品光譜差異較小,且重疊嚴重,通過肉眼不易分辨。經過MSC處理后的光譜曲線相對平滑,信噪比得到改善,光譜基線得到校正。
2.2.1基于主成分-馬氏距離的判別分析模型
主成分-馬氏距離判別分析方法[17-18]是通過對原始光譜變量進行轉換,用降維后的新變量進行線性組合,最大限度表征原始光譜信息特征。再將表征不同樣本原始光譜信息的特征新變量進行馬氏距離計算[18]表示數(shù)據(jù)的協(xié)方差,根據(jù)距離度量值進行判別分析。馬氏距離計算原理:設X是從均值為μ、協(xié)方差為v的母體G中抽取的樣本,記:
D2(X,μ)=(X -μ)′v-1(X -μ)
若定義X與母體G的距離D2(X,G)為X與均值μ的距離D2(X,μ),則D2(X,μ)即為馬氏距離。
馬氏距離具有3個性質:平移不變性、旋轉不變性和仿射不變性,在多目標識別和多傳感器融合理論中有較多的應用。
對7種不同中藥材和炮制品的70個樣品近紅外光譜的多元散射校正指紋信息建立主成分-馬氏距離判別分析模型,其中每種藥材的7個樣品光譜作為訓練集,3個樣品光譜作為預測集。通過主成分分析(PCA)對光譜特征進行提取,前9個主成分的變量貢獻率達到96.6%,故利用主成分為9的累計方差足以解釋總方差,從而實現(xiàn)樣品近紅外多元散射校正指紋信息數(shù)據(jù)的降維,再基于馬氏距離方法計算每兩個樣本之間的相似度,以距離度量值對7種不同中藥材和炮制品進行類別劃分。表2為7種中藥材間訓練集和預測集樣品的相互馬氏距離的平均值及預測分類歸屬結果。
表27種中藥材間相互平均馬氏距離及預測分類歸屬
Tab.2MeanMahalanobisdistancebetweensevenkindsofchineseherbsanditsclassificationpredictionresult
實際分類ABCDEFG預測分類歸屬預測識別率/%A152138573677560511479131059881A100B13877077118569894698426456934B100C36751188109034338227108606721C100D563098903415074668091745144D100E11496698682056690047258151739E100F131202648108319174581204255753F100G989769316699515417385752082G100
從表2可以看出,7種中藥材的馬氏距離平均值明顯不同,表明7種中藥材的近紅外漫反射光譜具有較為明顯的差異,通過計算相互間的馬氏距離,能夠對不同種類的中藥材進行明確的區(qū)分,且對7種中藥材的預測分類歸屬均與實際分類相符,其預測分類正確識別率均達到100%。
為了直觀分析其預測分類歸屬的識別結果,可任選取到兩種藥材的距離為度量。表3和表4列出了以到A類樣品菖蒲的距離和到B類樣品赤芍的距離為度量時,7種中藥材各10個樣品對菖蒲和赤芍的馬氏距離。
表37種中藥材各10個樣品對菖蒲(A)的馬氏距離
Tab.3MahalanobisdistancebetweentensamplesfromsevenkindsofChineseherbsandAcorusgramineussamples
ABCDEFG11701384936515617114911312799322158138963637564211520131349905318713879364856301148713118991041491386536835611114831311799065128138793748562111494131239880612313883374355861150613119986371711387837025632114901312398858118138893656567011497131099909912213870365056241148513117988810193138813630566111511131159892
表47種中藥材各10個樣品對赤芍(B)的馬氏距離
Tab.4MahalanobisdistancebetweentensamplesfromsevenkindsofChineseherbsandRadixpaeoniaerubrasamples
ABCDEFG1138071031188598626983263769592138741751193698376961262669273138370811189398806963268369184138480811183998976969264069365139510541180899327036263369296139420671178699266993262369227138710771183899076986267369548138550401193198796974266469489138170421195398826957266568951013765047119419898704126406926
從表3 和表4可見,每種藥材的各10個樣品間的距離基本一致,說明各類樣本自身特征性質的穩(wěn)定性很好。且每種藥材間的距離有明顯的差別,可進行各類樣本間相似度的評價。
表3中以各藥材到菖蒲的距離為度量時,B類樣品赤芍與A類樣品菖蒲的距離最遠,表明化學成分等差異最大,其余按距離由大到小依次為:F類樣品開口箭,E類樣品生甘草,G類樣品炙甘草,D類樣品丹參,C類樣品川穹。
表4中以各藥材到赤芍的距離為度量時,A類樣品菖蒲最遠,其余按距離由大到小依次為:C類樣品川穹,D類樣品丹參,G類樣品炙甘草,E類樣品生甘草和F類樣品開口箭。
為了直觀判別分析各種藥材間的分類情況和相似度,將表3和表4的馬氏距離值投影在二維平面坐標上,即7種中藥材分別到菖蒲的距離和赤芍的距離的二維空間中的距離度量值的判別分析圖如圖2所示。
圖2 7種中藥材馬氏距離判別分析圖
從圖2可以看出,基于多元散射校正預處理技術,結合主成分-馬氏距離判別分析方法對7種中藥材和炮制品進行判別時均能正確分類歸屬,無類別混淆的情況發(fā)生。說明模型具有較高的可靠性。同時,在以A樣品菖蒲與B樣品赤芍建立的二維空間內,B樣品赤芍與A樣品菖蒲的距離最遠,表明這兩種藥材的化學成分等差異最大。B類樣品赤芍和F類樣品開口箭距離較小,說明這兩種藥材的化學成分和藥性差異較小。C類樣品川芎和D類丹參距離也相近,說明這兩種藥材的化學成分差異較小,故兩種藥材均用于活血行瘀止痛,具有較為相同或相似的化學成分和性質。E類樣品生甘草和G類炮制品炙甘草距離非常相近,說明該炮制品炙甘草與生甘草之間化學成分差異較小、性質變化不大。
采用多元散射校正預處理的主成分-馬氏距離判別分析模式識別法,結合近紅外光譜漫反射技術對外觀相近、容易混淆的不同中藥材和炮制品進行鑒別,建立了一種適用于中藥材和炮制品分類的快速識別和譜性相似度評價的模型方法,分類歸屬正確識別率均為100%。該方法具有快速、準確、無損、綠色的優(yōu)點,為中藥材的用藥安全和相近藥材的真?zhèn)闻袆e提供了一種有實際應用價值的檢測手段。
參考文獻:
[1]李彩君,林巧玲,謝培山,等.高良姜中黃酮類成分薄層色譜指紋圖譜鑒別[J].中藥新藥與臨床藥理,2001,12(3):183-187.
[2]曾金祥,魏娟,畢瑩,等.吳茱萸指紋圖譜及化學模式識別研究[J].中國實驗方劑學雜志,2013,19(24):143-147.
[3]孫濤,滕少娜,孔德英,等.DNA 條形碼技術應用于人參鑒定[J].中國生物工程雜志,2013,33(4):143-148.
[4]姚杰,魏永巨,孫體健.三維熒光指紋圖譜用于鑒別真?zhèn)魏駱愕难芯縖J].中國藥物與臨床,2013,13(12):1521-1522.
[5]劉紅秀,駱德漢,李衛(wèi)東,等.基于電子鼻的中藥材鑒別新方法研究[J].遼寧中醫(yī)藥大學學報,2011,13(10):32-35.
[6]FU H Y,HUAN S Y,XU L,et al.Moving window partial least-squares discriminant analysis for identification of different kinds of bezoar samples by near infrared spectroscopy and comparison of different pattern recognition method[J].Journal of Near Infrared Spectroscopy,2007,15(5):291-297.
[7]LEE M J,SEO D Y,LEE H E,et al.In line NIR quantification of film thickness on pharmaceutical pellets during a fluid bed coating process[J].International Journal of Pharma and Bio Sciences,2011,403(1-2):66-72.
[8]LI B X,WEI Y H,DUAN H G,et al.Discrimination of the geographical origin ofCodonopsispilosulausing near infrared diffuse reflection spectroscopy coupled with random forests and k-nearest neighbor methods[J].Vibrational Spectroscopy,2012,62:17-22.
[9]XIN N,GU X F,WU H,et al.Discrimination of raw and processedDipsacusasperoidesby near infrared spectroscopy combined with least squares-support vector machine and random forests[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2012,89:18-24.
[10]STORDRANGE L,LIBNAU F L,MALTHE-SORENSSEN D,et al.Feasibility study of NIR for surveillance of a pharmaceutical process,including a study of different preprocessing techniques[J].Journal of Chemometrics,2002,16(8-10):529-541.
[11]CHEN Q S,ZHAO J W,LIN H.Study on discrimination of roast green tea (CamelliasinensisL.) according to geographical origin by FT-NIR spectroscopy and supervised pattern recognition[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2009,72(4):845-850.
[12]FU H Y,HUANG D C,YANG T M,et al.Rapid recognition of Chinese herbal pieces ofArecacatechuby different concocted processes using Fourier transform mid-infrared and near-infrared spectroscopy combined with partial least-squares discriminant analysis[J].Chinese Chemical Letters,2013,24(7):639-642.
[13]劉沐華,張學工,周群,等.模式識別和紅外光譜法相結合鑒別中藥材產地[J].光譜學與光譜分析,2005,25(6):878-881.
[14]許長華,周群,孫素琴,等.二維相關紅外光譜法與阿膠的真?zhèn)舞b別[J].分析化學,2005,33(2):221-224.
[15]LI Y M,SUN S Q,ZHOU Q,et al.Study of traditional Chinese animal drugs using FT-IR and 2D-IR correlation spectroscopy[J].Spectrochimica Acta Part A:Molecular and Biomolecular Spectroscopy,2006,63(3):565-573.
[16]WANG C Y,XIANG B R,ZHANG W.Application of two-dimensional near-infrared (2D-NIR) correlation spectroscopy to the discrimination of three species ofDendrobium[J].Journal of Chemometrics,2009,23(9):463-470.
[17]KIM H,KIM D,BANG S Y.Extensions of LDA by PCA mixture model and class-wise features[J].Pattern Recognition,2003,36(5):1095-1105.
[18]李玉榕,項國波.一種基于馬氏距離的線性判別分析分類算法[J].計算機仿真,2006,23(8):86-88.