鄒華彬
(山東大學(xué)化學(xué)與化工學(xué)院,濟(jì)南,250100)
亦采用雙指標(biāo)等級(jí)序列個(gè)性化模式識(shí)別法[29-30,33]對(duì)4種中藥紅外指紋圖譜進(jìn)行了分析,當(dāng)統(tǒng)計(jì)相似尺度Pg≥Pg+1.1S~Pg≥Pg+1.3S時(shí),可以精確鑒別4種復(fù)方,且樣品的正確識(shí)別率為90.5%~95.2%。2種理論方法的分析結(jié)果等價(jià),皆可以將4種組成相似的生物復(fù)雜體系-中藥復(fù)方進(jìn)行精確鑒別分類,且相互驗(yàn)證。但2個(gè)中藥品種常數(shù)具有確定的絕對(duì)定量標(biāo)準(zhǔn),且具有鑒別判斷的簡(jiǎn)易性、明確的物理意義和生物學(xué)意義。
1.1 儀器 美國(guó)NICOLET-5700-FT-IR傅立葉變換紅外光譜儀(光譜范圍4 000~400 cm-1,分辨力4 cm-1);高速粉碎機(jī),壓片機(jī),分析天平(METTLE TOLEDO),靈敏度0.1 mg。
1.2 試劑 溴化鉀(分析純,國(guó)藥集團(tuán)化學(xué)試劑有限公司)。
1.3 分析樣品 桂附地黃丸、明目地黃丸、金匱腎氣丸及知柏地黃丸(皆為水丸或濃縮丸)樣品如下。見(jiàn)表1。
本論文中所研究的4種中藥復(fù)方組成如下[40]:
桂附地黃丸:地黃、茯苓、牡丹皮、山藥、山茱萸、澤瀉、附子、肉桂。
金匱腎氣丸:地黃、茯苓、牡丹皮、山藥、山茱萸、澤瀉、附子、牛膝、車前子、桂枝。
明目地黃丸:地黃、茯苓、牡丹皮、山藥、山茱萸、澤瀉、白芍、當(dāng)歸、枸杞、蒺藜、菊花、石決明。
知柏地黃丸:地黃、茯苓、牡丹皮、山藥、山茱萸、澤瀉、黃柏、知母。
由上述4種中藥復(fù)方的組成分看,他們皆具有6種相同的草藥,金匱腎氣丸與桂附地黃丸具有7種相同的草藥。4種中藥復(fù)方之間的化學(xué)成分具有很高的相似組成,且各自的化學(xué)成分具有非常高的復(fù)雜性。因此,準(zhǔn)確鑒別它們具有極大的困難。
2.1 理論方法 2個(gè)中藥品種常數(shù)的理論推導(dǎo)根據(jù)生物體系的雙指標(biāo)信息理論方程-生物遺傳與變異信息理論方程[38]。任意2個(gè)樣品或任意樣品2個(gè)不同演化階段的遺傳與變異信息量為:
表1 4種中藥復(fù)方樣品
I=-(PglnPg+PalnPva+PblnPvb)(1)
下面列出各個(gè)變量定義見(jiàn)文獻(xiàn)[5-9]:
共有峰率Pg:2個(gè)比較的指紋圖譜a、b中的共有峰數(shù)與該2個(gè)指紋圖譜的獨(dú)立峰數(shù)Nd的比值。Pg它只是共有峰Ng的函數(shù)。簡(jiǎn)化表示為P。該共有峰率指標(biāo)與Jaccard及Sneath、Sokal系數(shù)[41]本質(zhì)相同。
Pva:圖譜a的變異峰率。Pvb:圖譜b的變異峰率。
Pa=na/Nd,Pb=nb/Nd(5)
Pa,Pb分別是樣品a,b的變異峰占獨(dú)立峰的比例。
表2 最大信息量區(qū)間之Pg及其該區(qū)間對(duì)應(yīng)的信息量變化率
注:*對(duì)稱度為α=0.5,1時(shí),最大信息量對(duì)應(yīng)的共有峰率Pg=0.61;△對(duì)稱度為α=0時(shí),最大信息量對(duì)應(yīng)的供共有峰率Pg=0.70。根據(jù)圖1信息理論方程曲線,以最大信息量點(diǎn)對(duì)應(yīng)的Pg為中心,取其左右各變化0.05計(jì)算信息量,以直觀給出信息量的變化程度。對(duì)稱度ɑ=0,對(duì)應(yīng)的最大信息量點(diǎn)為Pg=0.70=70%;對(duì)稱度ɑ=0.5,1,對(duì)應(yīng)的最大信息量點(diǎn)皆為Pg=0.61=61%.插入Pg=0.66這個(gè)點(diǎn),是為了增加數(shù)據(jù)點(diǎn)的密度
圖1 信息理論方程曲線
注:對(duì)稱變異曲線對(duì)稱度α=1(Pa=Pb),非對(duì)稱變異曲線α=0.5(Pb=1/2Pa),α=0(Pa≠0,Pb=0)
各類指紋峰之間的關(guān)系為:Nd=Ng+na+nb,Na=Ng+na,Nb=Ng+nb
Nd:2個(gè)相互比較的指紋圖譜的獨(dú)立峰,即指比較的2個(gè)指紋圖譜a、b中吸收峰的種類數(shù)。Na:指紋圖譜a的總指紋峰數(shù)。Nb:指紋圖譜b的總指紋峰數(shù)。na:圖譜a的變異峰數(shù);nb:圖譜b的變異峰數(shù)。
該方程存在著2個(gè)極大值信息量,分別對(duì)應(yīng)于對(duì)稱變異Pa=Pb,α=1,共有峰率為Pg=61.0%,及極端非對(duì)稱變異,α=0,Pa≠0,Pb=0,共有峰率為69.5%。見(jiàn)圖1。
根據(jù)I~Pg圖,可以發(fā)現(xiàn),對(duì)于對(duì)稱變異α=1及非對(duì)稱變異α=0.5曲線的最高點(diǎn)在Pg=0.610,且在Pg=0.610附近存在一個(gè)平坦區(qū)域,信息量變化不大。而對(duì)于極端非對(duì)稱變異α=0,曲線的最高點(diǎn)在Pg=0.695,且在Pg=0.695附近存在一個(gè)平坦區(qū)域,信息量變化很小。
當(dāng)對(duì)稱性系數(shù)α=1,α=0.5,最大信息量對(duì)應(yīng)的Pg皆為0.61,最大信息對(duì)應(yīng)的共有峰率Pg區(qū)間皆對(duì)應(yīng)于0.55~0.66。
無(wú)論在對(duì)稱變異還是非對(duì)稱變異,在最大信息量對(duì)應(yīng)的共有峰率Pg左右變化5%的范圍內(nèi),信息量的變化皆小于2.49%,小于3%。這說(shuō)明,由于各種因素導(dǎo)致的生物變異的變化相對(duì)于最大信息量點(diǎn)之Pg±5%的范圍內(nèi),最大信息量變化小于2.49%,該變化范圍可以認(rèn)為處于中藥品種特征的臨界變化區(qū)域。見(jiàn)表2。
2個(gè)樣品的共有峰率越高,相似性越大,品質(zhì)越相似。因此,根據(jù)表1,考慮到各類因素對(duì)中藥及實(shí)驗(yàn)的隨機(jī)波動(dòng)性影響,可以確定Pg=61%及Pg=70%作為判別生物體系的品種常數(shù)及優(yōu)化判別中藥品種的絕對(duì)理論標(biāo)準(zhǔn),其變化區(qū)間為Pg≥(61±3)%及Pg≥(70±3)%,結(jié)合最大有效樣本數(shù)法對(duì)樣本集進(jìn)行合理優(yōu)化分類[37],同時(shí)可以避免為了追求基于經(jīng)驗(yàn)知識(shí)的完全分類而形成的過(guò)度分類,如神經(jīng)網(wǎng)絡(luò)法中易出現(xiàn)的過(guò)度分類。
2.2 實(shí)驗(yàn)方法
2.2.1 實(shí)驗(yàn)條件 中藥樣品粉碎并過(guò)80目篩,60 ℃烘干2 h,<4 ℃保存。KBr壓片法測(cè)試紅外指紋圖譜。每個(gè)樣品平行測(cè)量指紋圖譜6次,每個(gè)樣品的紅外指紋圖譜峰波數(shù)是6次測(cè)量中出現(xiàn)次數(shù)的平均值。紅外指紋圖譜以約25 cm-1平滑處理,最佳靈敏度80。
2.2.2 重復(fù)性實(shí)驗(yàn)和穩(wěn)定性實(shí)驗(yàn) 樣品S20平行測(cè)量6次,任意4次測(cè)量指紋圖譜中每個(gè)吸收峰波數(shù)的平均值構(gòu)成組合數(shù)值指紋圖譜。他們之間的最低共有峰率為93%,具有優(yōu)良的重復(fù)性。原藥粉末在<4 ℃下保存,具有良好的穩(wěn)定性。
2.3 指紋圖譜測(cè)定與實(shí)驗(yàn)數(shù)據(jù)分析
2.3.1 指紋圖譜測(cè)定 根據(jù)實(shí)驗(yàn)條件,測(cè)試4類42個(gè)中藥復(fù)方原藥粉末的紅外指紋圖譜。見(jiàn)圖2~5。由圖2~5可見(jiàn),4種復(fù)方中藥原藥粉末的紅外指紋圖譜具有很高的相似性及復(fù)雜性,極難憑觀察直觀鑒別4類中藥原藥粉末的紅外指紋圖譜。必須用數(shù)理分析方法對(duì)其指紋圖譜數(shù)據(jù)進(jìn)行分析,以得到嚴(yán)謹(jǐn)精確的品質(zhì)鑒別結(jié)果。
圖2 桂附地黃丸和金匱腎氣丸原藥粉末紅外指紋圖譜疊加圖
注:在1 600 cm-1處由下至上分別為桂附地黃丸S1,S3,S8,S10,金匱腎氣丸S11,S14,S18
圖3 明目地黃丸和知柏地黃丸原藥粉末紅外指紋圖譜疊加圖
注:在1 600 cm-1處由下至上明目地黃丸S24,S26,S32,知柏地黃丸S34,S38,S42
圖4 桂附地黃丸,金匱腎氣丸,明目地黃丸,知柏地黃丸原藥粉末紅外指紋圖譜疊加圖
注:在1 600 cm-1處由下至上分別為桂附地黃丸S1,S3,S8,S10,金匱腎氣丸S11,S14,S18,明目地黃丸S24,S26,S32,知柏地黃丸S34,S38,S42
圖5 桂附地黃丸,金匱腎氣丸,明目地黃丸,知柏地黃丸原藥粉末紅外指紋圖譜疊加圖
注:2 900 cm-1處由下至上桂附地黃丸S1,S3,S8,S10,金匱腎氣丸S11,S14,S18明目地黃丸S19,S24,S26,S32,知柏地黃丸S34,S37,S38,S42
2.3.2 實(shí)驗(yàn)數(shù)據(jù)分析 采用Shapiro-Wilk檢驗(yàn)方法,確定每個(gè)樣品的組合指紋圖譜峰及42個(gè)樣品的共有峰及變異峰。以任一樣品為標(biāo)準(zhǔn),計(jì)算其他樣品與該樣品的共有峰率,并按共有峰率由高到低的方法排序,構(gòu)成樣本及其對(duì)應(yīng)的共有峰率的符號(hào)-數(shù)值二元序列,即雙指標(biāo)序列。根據(jù)得到的2個(gè)中藥品種理論判別標(biāo)準(zhǔn)Pg=61.0%,Pg=69.5%,結(jié)合群體特征序列最大有效樣本數(shù)法[38]:
Y:群體特征序列最大有效樣本數(shù);Nci:第i個(gè)樣本的核心特征序列中的樣本數(shù);Nri:第i個(gè)樣本的關(guān)聯(lián)序列中的樣本數(shù);M:群體樣本總數(shù)。Y反映了群體分類中有效分類程度,Y越大說(shuō)明品質(zhì)聚分類越清晰,關(guān)聯(lián)序列中的樣本數(shù)越少,核心特征序列中的樣本數(shù)越多,越接近理想聚分類。
分別在Pg≥(61±3)%,Pg≥(70±3)%優(yōu)化Pg,得到4個(gè)品種的整體優(yōu)化特征序列,即樣品清晰分類且具有最大有效樣本數(shù),以實(shí)現(xiàn)4種中藥復(fù)方6種兩兩配對(duì)關(guān)系的精確鑒別。
當(dāng)Pg≥61%,Pg≥72%時(shí)4種中藥經(jīng)過(guò)優(yōu)化的特征序列。見(jiàn)表3。
采用鑒別標(biāo)準(zhǔn)Pg≥61%,由每個(gè)樣品的特征序列看,下列5個(gè)藥品配對(duì)可以得到精確鑒別:桂附地黃丸-金匱腎氣丸;桂附地黃丸-明目地黃丸;金匱腎氣丸-明目地黃丸;金匱腎氣丸-知柏地黃丸;明目地黃丸-知柏地黃丸。
而桂附地黃丸-知柏地黃丸二者的特征序列交疊嚴(yán)重,無(wú)法清晰區(qū)分二者。因而無(wú)法得到準(zhǔn)確鑒別。
表3 4種中藥經(jīng)過(guò)優(yōu)化的特征序列
注:a.核心特征序列;b,關(guān)聯(lián)序列,該序列部分中的樣品不屬于核心特征序列樣品對(duì)應(yīng)的類。每個(gè)樣品的特征序列由核心特征序列+關(guān)聯(lián)序列構(gòu)成。c,特征序列中的斜黑體部分,表示當(dāng)鑒別標(biāo)準(zhǔn)Pg≥72%時(shí)4種中藥的特征序列,而每個(gè)樣本的整個(gè)序列表示Pg≥61%時(shí)4種中藥的特征序列
當(dāng)Pg≥72%時(shí),S35,S37的特征序列中,關(guān)聯(lián)序列等于或長(zhǎng)于核心特征序列,因而無(wú)法正確識(shí)別,其余40個(gè)樣品得到正確的品種判別,正確識(shí)別率為40/42=95.2%,錯(cuò)誤識(shí)別率為2/42=4.8%。不僅上述5個(gè)藥品對(duì)得到精確鑒別,在此情況下,桂附地黃丸-知柏地黃丸也得到精確鑒別。對(duì)于桂附地黃丸-知柏地黃丸配對(duì),依據(jù)非對(duì)稱變異品種常數(shù)Pg=70(69.5)%,結(jié)合群體特征序列最大有效樣本數(shù)法[37],在不同Pg條件下,優(yōu)化分類樣品,所得結(jié)果見(jiàn)表4。
表4 4種復(fù)方非對(duì)稱變異常數(shù)Pg=(70±x*)%的優(yōu)化結(jié)果
x*,x=-1,0,1,2,5
由表4結(jié)果知,當(dāng)Pg≥69%~75%時(shí),桂附地黃丸-知柏地黃丸藥品對(duì)皆可得到精確鑒別。但Pg≥72%時(shí),有效樣本數(shù)最大,分類最合理,而Pg≥75%時(shí),雖然樣本的正確識(shí)別了100%,但有效樣本數(shù)最小,說(shuō)明過(guò)度分類,并不合理。通過(guò)對(duì)實(shí)驗(yàn)測(cè)量的指紋圖譜數(shù)據(jù)進(jìn)行詳細(xì)分析,可以發(fā)現(xiàn)評(píng)判這4類中藥的品種標(biāo)準(zhǔn)可以確定為Pg≥61%,Pg≥72%。見(jiàn)表5。
表5 4種復(fù)方配對(duì)遵從的品種常數(shù)Pg(%)
在上述相似尺度下,6對(duì)中藥配對(duì)皆可得到準(zhǔn)確判別分類,樣品正確識(shí)別率95.2%,具有最大有效樣本數(shù)。在類的層次上,類的正確識(shí)別率為100%。
中藥品種的科學(xué)鑒別是中藥現(xiàn)代研究的核心課題之一。只有在科學(xué)上絕對(duì)保證品種鑒別的可靠性,才能保證療效的可靠性,為中醫(yī)藥正名,并為中醫(yī)藥的現(xiàn)代深化科學(xué)研究奠定不可動(dòng)搖的基礎(chǔ)。目前的中藥品種鑒別都基于經(jīng)驗(yàn)知識(shí),即使是眾多的模式識(shí)別理論方法,也是基于經(jīng)驗(yàn)知識(shí)或?qū)W習(xí)樣本獲得經(jīng)驗(yàn)參量,這些方法皆無(wú)法得到不可懷疑的結(jié)論。本研究根據(jù)生物體系共有遺傳變異信息理論方程確定了2個(gè)中藥品種常數(shù)Pg=61%,Pg=70%,在科學(xué)上提出了2個(gè)判別中藥品種的絕對(duì)理論定量標(biāo)準(zhǔn)?;谒鼈兘⒌?個(gè)品種判別理論標(biāo)準(zhǔn)Pg≥(61±3)%及Pg≥(70±3)%,對(duì)4種組成相似的中藥復(fù)方的6種配對(duì)進(jìn)行了精確鑒別。結(jié)合文獻(xiàn)[37-39]可以證明,基于生物遺傳與變異信息理論方程在2種變異狀態(tài)取得最大信息量所對(duì)應(yīng)的共有峰率[37],確實(shí)可以反映生物體系的本質(zhì)相似特征。該理論方法無(wú)需任何經(jīng)驗(yàn)知識(shí)、主觀設(shè)定參數(shù),只需依據(jù)實(shí)驗(yàn)測(cè)量值,結(jié)合最大有效樣本數(shù)法就可實(shí)現(xiàn)對(duì)某些中藥這類生物復(fù)雜體系的精確鑒別及模式識(shí)別。最大有效樣本數(shù)法可以防止其他模式識(shí)別方法容易產(chǎn)生的過(guò)度擬合分類現(xiàn)象,而保證給出最優(yōu)合理結(jié)果。這也證明,在生物體系中同樣存在如同物理學(xué)、化學(xué)中的精確定理定律,有待人們?nèi)グl(fā)現(xiàn)。
依據(jù)生物遺傳與變異信息理論推導(dǎo)的2個(gè)中藥品種絕對(duì)定量標(biāo)準(zhǔn)而不是依據(jù)經(jīng)驗(yàn)標(biāo)準(zhǔn)對(duì)中藥精確鑒別,這應(yīng)是生物體系中藥鑒別理論方法的一個(gè)重要突破。該理論方法亦具有巨大的簡(jiǎn)易性,且也應(yīng)適用于任意生物體系的精確分類鑒別。另一方面,作者多年的系統(tǒng)實(shí)驗(yàn)研究及理論研究發(fā)現(xiàn),基于生物體系的紅外、液相指紋圖譜信息及分子種類信息對(duì)生物體系進(jìn)行鑒別、分類、聚類及模式識(shí)別研究,結(jié)果較基于成分的含量信息更可靠。因?yàn)檫@些信息主要反映的是生物體系的物質(zhì)結(jié)構(gòu)信息,結(jié)構(gòu)決定功能,結(jié)構(gòu)決定品種特性。理論上,這2個(gè)品種常數(shù)適用于基于紅外指紋圖譜、液相指紋圖譜、分子種類信息的生物體系品種的絕對(duì)定量鑒別。
目前的中醫(yī)藥研究,主要聚焦于其中的化學(xué)成分、功效研究,對(duì)中醫(yī)藥數(shù)理基礎(chǔ)理論研究工作缺乏應(yīng)有的重視。要使以幾千年經(jīng)驗(yàn)為基礎(chǔ)的中醫(yī)藥演化至以數(shù)理理論為基礎(chǔ)的現(xiàn)代科學(xué),發(fā)現(xiàn)其中的精確科學(xué)原理,用于更好地指導(dǎo)中醫(yī)藥現(xiàn)代研究,還有漫漫之路有待探索。但這是能夠發(fā)揚(yáng)光大祖國(guó)中醫(yī)藥學(xué)的必由之路。
致謝:本文部分?jǐn)?shù)據(jù)取自我的研究生韓智峰、張新玲的畢業(yè)論文。