劉鴻 譚穎 肖宗朋
(1.黔南民族職業(yè)技術(shù)學(xué)院 貴州省都勻市 58000)(2.西南民族大學(xué)計(jì)算機(jī)科學(xué)與工程學(xué)院 四川省成都市 610000)
藏醫(yī)藥學(xué)作為世界四大傳統(tǒng)醫(yī)學(xué)之一,不僅以青藏高原自身醫(yī)學(xué)理論與實(shí)踐為基礎(chǔ),還吸收了中醫(yī)學(xué)、印度醫(yī)學(xué)等醫(yī)學(xué)精華,是具有完整理論基礎(chǔ)的少數(shù)民族傳統(tǒng)醫(yī)學(xué)體系。但極具民族特色的醫(yī)學(xué)理論與晦澀難懂的藏醫(yī)文獻(xiàn),阻擋了藏醫(yī)藥學(xué)的推廣。為方便研究人員能根據(jù)個(gè)人需要對(duì)傳統(tǒng)藏醫(yī)藥方劑進(jìn)行查詢與使用,本研究利用現(xiàn)代信息技術(shù),收集、整理經(jīng)典的藏醫(yī)藥方劑與藥材信息,將其存儲(chǔ)在關(guān)系型數(shù)據(jù)庫(kù)中,實(shí)現(xiàn)藏醫(yī)藥方劑、藥材信息的數(shù)字化存儲(chǔ),實(shí)現(xiàn)信息資源共享。
消化系統(tǒng)是人體最大的免疫和內(nèi)分泌器官, 為所有飲食必經(jīng)的要道, 因此易受到病原的侵犯。在當(dāng)今社會(huì),很多人受工作影響,無(wú)法按時(shí)吃飯休息,使消化系統(tǒng)承受了巨大的壓力,發(fā)生在胃腸道的疾病也在不斷增加。而藏醫(yī)藥學(xué)注重人的整體調(diào)和,內(nèi)外平衡以求達(dá)到療效,對(duì)于消化系統(tǒng)方面的常見病、慢性病及疑難雜病的診療具有自己的特色和優(yōu)勢(shì)。由于藏醫(yī)復(fù)方成分往往多達(dá)數(shù)十位藥材,因此本研究將依靠數(shù)據(jù)挖掘技術(shù)尋找其中的核心處方,以期發(fā)現(xiàn)傳統(tǒng)藏醫(yī)藥方劑的用藥配伍規(guī)律。
本研究主要收集并整理藏醫(yī)藥相關(guān)數(shù)據(jù)資料,包括《晶珠本草》、《藍(lán)琉璃》、《妙音本草》等藏藥經(jīng)典著作,參考《中國(guó)藏藥材大全》[1]、《藏藥方劑寶庫(kù)》[2]對(duì)其內(nèi)容進(jìn)行整理歸類,并對(duì)收集到的數(shù)據(jù)進(jìn)行規(guī)范化,方劑及藥材數(shù)據(jù)中的藥物名稱均參考《中華本草?藏藥卷》和《四川省藏藥材標(biāo)準(zhǔn)》2014 版進(jìn)行統(tǒng)一。
通過(guò)前期的文獻(xiàn)收集與整理工作,我們發(fā)現(xiàn)藏藥制劑的主治十分廣泛, 一個(gè)制劑往往可以治療多個(gè)系統(tǒng)疾病。在疾病描述方面,多參照現(xiàn)代醫(yī)學(xué)知識(shí)體系。疾病信息主要按照生理系統(tǒng)性疾病進(jìn)行分類,例如消化系統(tǒng)疾病、呼吸系統(tǒng)疾病、循環(huán)系統(tǒng)疾病等[3]。為方便保存整理成果及為后續(xù)研究提供參考,本研究搭建了“藏醫(yī)藥傳統(tǒng)方劑藥材數(shù)據(jù)庫(kù)”,并使用SQL Sever 軟件進(jìn)行數(shù)據(jù)的存儲(chǔ)與后臺(tái)管理工作。
1.3.1 數(shù)據(jù)預(yù)處理與頻數(shù)統(tǒng)計(jì)
為保證后續(xù)數(shù)據(jù)挖掘工作能順利開展,需對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。首先將方劑數(shù)據(jù)根據(jù)其主治的病名和癥狀屬性按照生理系統(tǒng)性疾病進(jìn)行分類。此外,數(shù)據(jù)庫(kù)為保證文獻(xiàn)記載的全面和準(zhǔn)確性,保留了其中的描述性文字,因此在數(shù)據(jù)預(yù)處理時(shí)需對(duì)文本內(nèi)容進(jìn)行抽取。在處理過(guò)程中,部分方劑中出現(xiàn)的輔助藥物或食材,如茶、白糖、生米等不再計(jì)入統(tǒng)計(jì);將方劑組成中出現(xiàn)的“各適量”、“各等量”、“g”、“握”等詞都刪除,使非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。
根據(jù)藏醫(yī)治療消化系統(tǒng)疾病的441 個(gè)記載在冊(cè)的方劑,使用SPSS 軟件統(tǒng)計(jì)出方劑中藥物的使用頻率。取出排名前30 的藥物作為高頻藥物,根據(jù)藏醫(yī)藥學(xué)的藥材性味理論,整理藥材的“六味”、“三化味”及“十七效”等信息。
1.3.2 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則主要反映事物之間的關(guān)聯(lián)性,目前常用于傳統(tǒng)醫(yī)藥領(lǐng)域,主要是從大量且復(fù)雜的傳統(tǒng)醫(yī)藥信息中發(fā)掘不同數(shù)據(jù)集之間潛在的聯(lián)系,常見于方劑配伍規(guī)律的研究等。關(guān)聯(lián)規(guī)則的興趣度由其支持度(support)和置信度(confidence)來(lái)度量,它們分別反映規(guī)則的有用性和確定性。在用藥規(guī)律挖掘中,支持度是指所有藥物組合中同時(shí)出現(xiàn)兩味或者多味藥材組合的概率;置信度則是在某一藥材出現(xiàn)的條件下,另一藥物出現(xiàn)的概率。同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則稱為強(qiáng)關(guān)聯(lián)規(guī)則。
Apriori 算法是挖掘布爾關(guān)聯(lián)規(guī)則頻繁項(xiàng)集的經(jīng)典算法,其最大的優(yōu)勢(shì)是算法流程簡(jiǎn)單直觀,原理易于理解。Apriori 算法挖掘過(guò)程主要包含兩個(gè)階段:第一階段采用逐層搜索的迭代方法,從數(shù)據(jù)集中找出所有的頻繁項(xiàng)集,即項(xiàng)集出現(xiàn)的次數(shù)至少與預(yù)定義的最小支持計(jì)數(shù)一樣;第二階段再?gòu)倪@些頻繁項(xiàng)集中產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須同時(shí)滿足最小支持度和最小置信度[4]。
本研究首先通過(guò)頻數(shù)統(tǒng)計(jì)得到治療消化系統(tǒng)疾病的方劑中使用頻率較高的藥物及其藥味藥性特點(diǎn),并計(jì)算出頻率。借助SPSS Modeler18.0 軟件,使用Apriori 算法對(duì)高頻藥物進(jìn)行關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)核心藥對(duì)和配藥組合,并繪制關(guān)聯(lián)網(wǎng)絡(luò)圖。
1.3.3 因子分析
因子分析是通過(guò)研究很多變量間的相關(guān)系數(shù)矩陣,將變量間復(fù)雜的關(guān)系劃分為少數(shù)的幾個(gè)綜合因子,并可以據(jù)此對(duì)所有變量進(jìn)行分類的一種統(tǒng)計(jì)分析方法。通過(guò)這種方法,可以從許多變量中找出隱藏的具有代表性的因子,即把相關(guān)性高的變量歸入一個(gè)因子,不僅可以將變量數(shù)目減少,還能檢驗(yàn)對(duì)變量間關(guān)系的假設(shè)。在本研究中通過(guò)因子分析法對(duì)高頻藥物進(jìn)行歸類,從而發(fā)掘不同藏藥類群的主要特性[5]。
袁安十六歲,李離、吳耕十五,上官星雨最小,十四歲。他們?cè)谌A陰縣下的一個(gè)破廟里結(jié)拜成兄妹,袁安年長(zhǎng),堪堪成了大哥。
首先取出排名靠前的前30 味藥物,將每一味藥物作為變量,每個(gè)方劑作為個(gè)體進(jìn)行統(tǒng)計(jì),其中方劑中含有該藥物記為1,沒(méi)有則記為0,為因子分析做準(zhǔn)備,使用SPSS Statistics22.0 軟件對(duì)整理完畢的高頻藥物數(shù)據(jù)矩陣進(jìn)行因子分析[6]。
藏醫(yī)藥傳統(tǒng)方劑藥材數(shù)據(jù)庫(kù)共收錄了4499 首單驗(yàn)方,以及752 種藥材信息,15 類系統(tǒng)疾病類別以及233種疾病與癥狀名。實(shí)現(xiàn)了傳統(tǒng)文獻(xiàn)向現(xiàn)代數(shù)字化的轉(zhuǎn)變,保障了傳統(tǒng)文獻(xiàn)的存儲(chǔ)和傳承,也為后續(xù)的數(shù)據(jù)挖掘研究提供了有效的數(shù)據(jù)來(lái)源。
2.2.1 頻數(shù)統(tǒng)計(jì)分析
藏醫(yī)藥傳統(tǒng)方劑藥材數(shù)據(jù)庫(kù)中存有治療消化系統(tǒng)疾病方劑有441 首,總計(jì)使用藥物310 種,用藥頻次3207味,通過(guò)SPSS 軟件得到用藥頻次排名前30 味藏藥。根據(jù)統(tǒng)計(jì)結(jié)果顯示,藏醫(yī)治療消化系統(tǒng)疾病的前30 味藥物中,使用頻次為1826 次,占總體使用的50%以上,十分具有代表性。因此,統(tǒng)計(jì)整理了使用頻率前30 味藥物的性味信息,藥材六味中辛味的出現(xiàn)頻數(shù)最多,藏醫(yī)學(xué)中的三化味是指患者服用藥物后,在體內(nèi)經(jīng)吸收后其原來(lái)的藥味發(fā)生變化,最終轉(zhuǎn)化為甘、酸、苦三味,經(jīng)統(tǒng)計(jì),苦味頻率最高,其次為甘味。藏藥的十七效作為藏醫(yī)遣藥組方的理論基礎(chǔ),對(duì)臨床用藥有著極大的影響,對(duì)此統(tǒng)計(jì)結(jié)果顯示溫性藥物最多,出現(xiàn)頻率高達(dá)28.4%,其次為輕、銳性藥物,如表1、表2、表3 所示。
表1:使用頻率前30 味藥物的六味統(tǒng)計(jì)
表2:使用頻率前30 味藥物的三化味統(tǒng)計(jì)
表3:使用頻率前30 味藥物的十七效統(tǒng)計(jì)
2.2.2 關(guān)聯(lián)規(guī)則
針對(duì)頻數(shù)統(tǒng)計(jì)的結(jié)果,將高頻藥物數(shù)據(jù)導(dǎo)入至SPSS Modeler18.0 軟件中,選擇Apriori 算法模型,構(gòu)建數(shù)據(jù)流,設(shè)最低條件支持度為10,最小規(guī)則置信度為75%,為了發(fā)現(xiàn)核心藥對(duì),將最大前項(xiàng)數(shù)設(shè)為1,發(fā)掘兩種中藥之間的關(guān)聯(lián)規(guī)則,得到4 條藥對(duì)關(guān)聯(lián)規(guī)則,如表4 所示。為發(fā)現(xiàn)藥味數(shù)更多的藥物搭配關(guān)聯(lián)規(guī)則,同樣選擇Apriori 算法模型進(jìn)行分析,設(shè)最低條件支持度仍為10,最小規(guī)則置信度改為80%,最大前項(xiàng)數(shù)設(shè)為5,得到4 條三種藥物間的關(guān)聯(lián)規(guī)則,如表5 所示。
表4:消化系統(tǒng)疾病高頻藥對(duì)關(guān)聯(lián)規(guī)則表
表5:消化系統(tǒng)疾病高頻藥物組合關(guān)聯(lián)規(guī)則表
2.2.3 因子分析
進(jìn)行因子分析前,應(yīng)通過(guò)KMO 檢驗(yàn)與Bartlett 球形檢驗(yàn)判斷數(shù)據(jù)是否適合進(jìn)行因子分析,高頻藥物的數(shù)據(jù)經(jīng)檢驗(yàn)后顯示,KMO 值為0.624>0.5,Bartlett 球形檢驗(yàn)的卡方值為2922.182,自由度為435,顯著性Sig=.000<0.05,測(cè)試值均符合,適合做因子分析。
運(yùn)用主成分分析法提取公因子,發(fā)現(xiàn)前11 個(gè)主成分對(duì)總方差的累積貢獻(xiàn)率達(dá)到了64.363%,包含大部分信息,因此提取前11 個(gè)主成分,并選擇最大正交旋轉(zhuǎn)法,將11 個(gè)公因子旋轉(zhuǎn)后,得到其載荷矩陣,其中將載荷系數(shù)絕對(duì)值大于0.5 的變量全部取出[7-9],其結(jié)果如表6所示。
表6:消化系統(tǒng)疾病高頻用藥載荷系數(shù)表
本次研究通過(guò)收集整理傳統(tǒng)的藏醫(yī)藥藥材和方劑信息,將數(shù)據(jù)按統(tǒng)一標(biāo)準(zhǔn)進(jìn)行規(guī)范化處理,并使用SQL Sever 對(duì)其進(jìn)行數(shù)字化存儲(chǔ)和管理,建立了藏醫(yī)藥傳統(tǒng)方劑藥材數(shù)據(jù)庫(kù)。不僅有利于傳統(tǒng)文獻(xiàn)的保存,也便于研究人員深度挖掘藏醫(yī)藥的用藥原理和配伍規(guī)律。
為了推動(dòng)藏醫(yī)藥在消化系統(tǒng)疾病方面的研究,本研究借助數(shù)據(jù)挖掘的算法發(fā)現(xiàn)其傳統(tǒng)文獻(xiàn)記載的藥方中隱含的配伍規(guī)律。首先對(duì)方劑中的藥材及其藥味等進(jìn)行頻數(shù)統(tǒng)計(jì),我們發(fā)現(xiàn)治療消化系統(tǒng)疾病的方劑中前三十味高頻藥材中辛味藥材最多,其次為苦味和甘味,辛味藥物具有增生胃溫,健胃消積,驅(qū)殺腸胃中的寄生蟲等功效,可用于胃寒、消化不良、不思飲食等病癥。甘味藥材有滋補(bǔ)強(qiáng)身的功能,對(duì)食道阻塞等病較為有效,苦味藥物主要有開胃、驅(qū)蟲、止渴、清熱解毒等功效。對(duì)頻數(shù)較高的常用藏藥功能進(jìn)行分類,蓽茇、光明鹽、干姜、白豆蔻、胡椒、肉桂等藥多有溫中散寒、恢復(fù)脾陽(yáng)溫煦功能,主治寒性培根病、隆病等癥;石榴、訶子、小米辣、阿魏等藥多用于提升胃陽(yáng)、助消化;紅花、巖精、甘青青蘭、小葉杜鵑、甘青烏頭等藥多用于清熱瀉下;紫硇砂、堿花、鐵線蓮等藥多用于理氣通便、消脹。
從關(guān)聯(lián)分析的結(jié)果可以看出,從藥對(duì)到角藥搭配中,石榴的出現(xiàn)頻率最高,根據(jù)藏醫(yī)的三因?qū)W說(shuō)和君臣佐使的配藥思想,治療消化系統(tǒng)疾病的方劑中,石榴多為君藥,有健胃消食的作用;蓽茇、白豆蔻、肉桂為臣藥,共奏溫中行氣、化滯除濕的作用,對(duì)脾胃虛寒等寒癥效果顯著;紅花可為佐藥,活血化瘀,可對(duì)消化道的供血功能進(jìn)行調(diào)理。
對(duì)高頻藥物進(jìn)一步展開因子分析,可以得出傳統(tǒng)文獻(xiàn)記載的方劑中包含的遣方思路。公因子F1 的組方藥物與關(guān)聯(lián)規(guī)則分析的結(jié)果相似,因此其組方思路不多做贅述;公因子F2 以清熱瀉下、消除壅滯為主;公因子F3 主要起清熱疏肝的功效、公因子F4 主要提升胃溫、F5 以溫中散寒為主;F6 主要是清熱止瀉;F7 則以行氣止痛、提胃陽(yáng)為主;F8 則是清熱滋補(bǔ)、活血的功效;F9 為除寒健胃;F10 可殺蟲解毒、消積利便;F11 體現(xiàn)了健胃消食、強(qiáng)體壯肌為主的遣方思路。
本文使用多種數(shù)據(jù)挖掘技術(shù),分析藏醫(yī)藥傳統(tǒng)方劑治療消化系統(tǒng)疾病的用藥規(guī)律,可以發(fā)現(xiàn)其核心藥物搭配與隱含的組方思路。該研究對(duì)發(fā)掘方劑中的用藥規(guī)律以及優(yōu)化藥方有較大的意義。