林景峰,胡文悅,劉甘露,馬華萍,韓振蘊(yùn)
韓振蘊(yùn)教授是北京中醫(yī)藥大學(xué)深圳醫(yī)院的主任醫(yī)師,從事抑郁癥研究工作20余年,臨床擅長(zhǎng)采用中西醫(yī)結(jié)合方式治療癡呆、中風(fēng)、焦慮抑郁、失眠、頭痛、頭暈、帕金森病等神經(jīng)內(nèi)科常見病和疑難雜病[1]。R軟件是一種為統(tǒng)計(jì)計(jì)算和繪圖而生的語言和環(huán)境,是一套開源的數(shù)據(jù)分析解決方案,由一個(gè)龐大且活躍的全球性研究型社區(qū)維護(hù),囊括了在其他軟件中尚不可用的、先進(jìn)的統(tǒng)計(jì)計(jì)算例程,擁有頂尖水準(zhǔn)的制圖功能[2]。本研究搜集并整理韓振蘊(yùn)教授治療抑郁癥的中藥方劑,基于R軟件平臺(tái),使用多種數(shù)據(jù)挖掘技術(shù)探究其用藥特點(diǎn),并為抑郁癥的臨床用藥提供理論支持。
1.1 數(shù)據(jù)來源 選取2017年9月17日—2018年11月21日北京中醫(yī)藥大學(xué)腦病科韓振蘊(yùn)教授診治的抑郁癥病人69例,共138診次。
1.2 納入標(biāo)準(zhǔn) ①符合《國(guó)際疾病分類》(ICD-10)中抑郁癥的診斷標(biāo)準(zhǔn);②中醫(yī)方面符合《中醫(yī)內(nèi)科疾病診療常規(guī)》中郁病的診斷標(biāo)準(zhǔn);③韓振蘊(yùn)教授使用中藥湯劑診治者。
1.3 排除標(biāo)準(zhǔn) ①研究對(duì)象共病有其他嚴(yán)重精神障礙;②妊娠及哺乳期病人。
1.4 研究方法 規(guī)范中藥名稱,將規(guī)范后的中藥按照二分類的量化方法進(jìn)行處理,以不同病人作為數(shù)據(jù)庫(kù)的行標(biāo),不同中藥作為數(shù)據(jù)庫(kù)的列標(biāo),并對(duì)中藥按照“使用=1,未使用=0”的規(guī)則進(jìn)行賦值,建立Excel數(shù)據(jù)庫(kù)。
1.5 統(tǒng)計(jì)學(xué)處理 采用R軟件(Version:3.5.1)進(jìn)行描述性統(tǒng)計(jì)分析和多種方法的數(shù)據(jù)挖掘分析。數(shù)據(jù)挖掘方面采用關(guān)聯(lián)度分析和聚類分析。其中,關(guān)聯(lián)度分析運(yùn)用了Pearson相關(guān)系數(shù)的關(guān)聯(lián)分析,基于Apriori算法的相關(guān)度分析。聚類分析運(yùn)用層次聚類的平均聯(lián)動(dòng)方法和劃分聚類的K均值(K-means)算法和圍繞中心點(diǎn)的劃分(PAM)算法。
2.1 基本分析 單味中藥的頻次分析所收集的138張中藥處方中共使用了146味中藥,平均每味藥使用頻次為16.73次。單味中藥的使用頻數(shù)在30次以上的中藥有25味(17.1%)。詳見圖1。
圖1 使用頻數(shù)在30次以上中藥的頻數(shù)分布圖
2.2 相關(guān)分析 相關(guān)系數(shù)可以用來描述兩種中藥之間的聯(lián)帶關(guān)系。R軟件可以計(jì)算多種相關(guān)系數(shù),包括Pearson相關(guān)系數(shù)、Spearman相關(guān)系數(shù)、Kendall相關(guān)系數(shù)等[2]。
2.2.1 Pearson相關(guān)分析 對(duì)146種藥物進(jìn)行Pearson相關(guān)系數(shù)分析,根據(jù)韓振蘊(yùn)教授臨床經(jīng)驗(yàn)篩選了抑郁癥相關(guān)藥對(duì)20對(duì),相關(guān)關(guān)聯(lián)藥物及Pearson相關(guān)系數(shù)見表1。
表1 Pearson相關(guān)系數(shù)居前20位的藥對(duì)
2.2.2 對(duì)基于Pearson相關(guān)系數(shù)的可視化 利用R軟件corrplot包對(duì)146味藥物Pearson相關(guān)系數(shù)進(jìn)行可視化作圖。詳見圖2。
圖2 146味藥物Pearson相關(guān)系數(shù)的可視化點(diǎn)圖
2.2.3 運(yùn)用Apriori算法進(jìn)行相關(guān)度分析 運(yùn)用R軟件的arulesViz包和arules包進(jìn)行基于Apriori算法的相關(guān)度分析。選擇支持度為0.5,置信度為0.8,篩選出的所有藥物組合見表2。降低組合的支持度納入門檻,取支持度為0.1,置信度為0.8,可得到5 882對(duì)符合要求的藥物相關(guān)組合。其中l(wèi)ift值較高的相關(guān)組合見圖3。從圖3可以看出,lift值較高的組合以補(bǔ)腎安神類藥物組合為主,說明韓振蘊(yùn)教授在臨床用藥治療抑郁癥時(shí),補(bǔ)腎安神類藥物以固定組合的方式來使用的情況較多。韓振蘊(yùn)教授臨床診治老年病人較多,年老精氣自半,需在疏肝解郁的基礎(chǔ)上辨證加入補(bǔ)腎安神的藥對(duì),如巴戟天、肉蓯蓉配合生龍骨、生牡蠣等藥物。本研究對(duì)得到的5 882個(gè)組合進(jìn)行plot作圖分析,plot的顏色深度代表組合藥物的置信度。可見,在支持度>0.1的組合中,藥物的置信度和lift值均較為客觀,詳見圖4。故此關(guān)聯(lián)分析具有較好的可信度。對(duì)得到的5 882個(gè)組合進(jìn)行plot作圖分析,plot的顏色深度代表組合藥物的order(本研究中可以認(rèn)為是藥物組合中包含藥物的個(gè)數(shù)),詳見圖5??梢?,在支持度>0.1的組合中,藥物的置信度良好,同時(shí)有大量組合含有較多的藥物,故可得到新的置信度和支持度都較好,且藥物數(shù)量較多的藥物組合。對(duì)藥物關(guān)聯(lián)規(guī)則進(jìn)行整體構(gòu)圖分析,結(jié)果見圖6。從圖6可以看出,柴胡、當(dāng)歸、生龍骨、生牡蠣、木香、梔子、白術(shù)、丹參、茯苓、陳皮、半夏、炙甘草等藥物為韓振蘊(yùn)教授臨床用藥最為中心的藥物。
表2 基于Apriori算法支持度大于0.5、置信度大于0.8的相關(guān)藥對(duì)
圖4 基于Apriori算法,支持度大于0.1的藥物的置信度和lift值
圖5 基于Apriori算法,支持度大于0.1的藥物的置信度和order值
圖6 基于Apriori算法,支持度大于0.1的藥物關(guān)聯(lián)規(guī)則整體構(gòu)圖分析
2.3 聚類分析 聚類分析可分為層次聚類(hierarchical agglomerative clustering)和劃分聚類(partitioning clustering),對(duì)于層次聚類來說,最常用的算法是單聯(lián)動(dòng)(single linkage)、全聯(lián)動(dòng)(complete linkage )、平均聯(lián)動(dòng)(average linkage)、質(zhì)心(centroid)和Ward方法。對(duì)于劃分聚類來說,最常用的算法是K-means和PAM。本研究運(yùn)用R軟件實(shí)現(xiàn)層次聚類的平均聯(lián)動(dòng)方法和K-means算法及PAM算法,并對(duì)各種算法所得到的聚類結(jié)果進(jìn)行比較分析。
2.3.1 確定聚類數(shù)目
2.3.1.1 利用mclust包確定聚類數(shù)目 對(duì)146味中藥進(jìn)行聚類數(shù)目測(cè)試,具體測(cè)試結(jié)果見圖7。由此可見,取1類的聚類數(shù)目是最優(yōu)的聚類數(shù)目。但由于聚類數(shù)目并不能只有1類,故此方法不適合作為本次藥物聚類數(shù)目的確定方法。
圖7 利用mclust包確定聚類數(shù)目
2.3.1.2 利用組內(nèi)平方誤差和(sum of squared error,SSE)確定最佳聚類數(shù)目 最佳聚類數(shù)目為3個(gè)。詳見圖8。
圖8 利用SSE來確定聚類數(shù)目
2.3.1.3 利用PAM算法確定最佳聚類數(shù)目 K-means算法取得的是均值,異常點(diǎn)對(duì)其影響較大,孤立的點(diǎn)易聚為一類,本研究使用PAM算法進(jìn)行改進(jìn)。利用PAM算法計(jì)算最佳聚類數(shù)目,得到最佳聚類數(shù)目為9個(gè)。
2.3.1.4 利用AP算法來確定最佳聚類數(shù)目 本質(zhì)上是類似K-means或者層次聚類一樣,是一種聚類方法,因?yàn)椴恍枰馣-means一樣提供聚類數(shù),會(huì)自動(dòng)算出最佳聚類數(shù),因此,也可以作為一種計(jì)算最佳聚類數(shù)目的方法。經(jīng)計(jì)算,得到的聚類數(shù)為29個(gè)。
2.3.1.5 利用輪廓系數(shù)(average silhouette method)計(jì)算最佳聚類數(shù)目 最佳聚類數(shù)目為10個(gè)。詳見圖9。
圖9 利用輪廓系數(shù)來確定聚類數(shù)目
2.3.1.6 利用Gap Statistic方法尋找最佳聚類數(shù)目 計(jì)算結(jié)果的最佳聚類數(shù)目為1個(gè),不符合要求。詳見圖10。
圖10 利用Gap Statistic方法確定聚類數(shù)目
綜合以上分析,本研究聚類數(shù)目可以暫時(shí)確定為3個(gè)、9個(gè)、10個(gè)和29個(gè)類別。
2.3.2 層次聚類 對(duì)146味中藥進(jìn)行層次聚類,可以將這些中藥分為3類、9類、10類或29類。詳見圖11。聚類數(shù)目為3個(gè)時(shí)的聚類結(jié)果詳見圖12。當(dāng)取聚類數(shù)目為3個(gè)時(shí),具體分類見表3。第一類藥物以疏肝化痰、理氣安神為主;第二類藥物以補(bǔ)腎填精為主;第三類藥物以通絡(luò)活血行氣為主。藥物被分成9類與被分成10類的聚類結(jié)果類似。本研究取分為10類的聚類結(jié)果。詳見圖13。該結(jié)果主要在聚類為3類的基礎(chǔ)上進(jìn)行了更加具體的藥物分類。當(dāng)藥物被聚類成29類時(shí),可以從中得到許多藥對(duì)。詳見圖14、表4。具體可見的藥對(duì)如枸杞子與龍眼肉、墨旱蓮與女貞子、白僵蠶與全蝎、海藻與昆布、巴戟天和肉蓯蓉、楮實(shí)子和沙苑子、石菖蒲和郁金等。
圖11 146味中藥的層次聚類分布圖
圖12 聚類數(shù)目為3個(gè)時(shí)的層次聚類結(jié)果分布圖
表3聚類數(shù)目為3個(gè)時(shí)的層次聚類結(jié)果
序號(hào) 藥物1白芍,白薇,柏子仁,半夏,薄荷,北沙參,萆薢,鱉甲,蒼術(shù),柴胡,炒白術(shù),陳皮,赤芍,刺五加,大黃,膽南星,淡豆豉,淡竹葉,當(dāng)歸,浮小麥,附子,瓜蔞,廣藿香,桂枝,何首烏,厚樸,黃柏,黃連,黃芩,火麻仁,藿香,雞內(nèi)金,姜半夏,焦麥芽,焦山楂,焦神曲,酒大黃,決明子,蓮子心,靈芝,羚羊角,麥冬,牡丹皮,木香,炮姜,佩蘭,枇杷葉,砂仁,山藥,生地,生龍骨,生牡蠣,石斛,桃仁,菟絲子,瓦楞子,五味子,薤白,旋復(fù)花,薏苡仁,澤瀉,浙貝母,珍珠母,知母,梔子,枳殼,枳實(shí),炙甘草,炙黃芪,竹茹,紫蘇梗2巴戟天,白術(shù),楮實(shí)子,磁石,大棗,杜仲,茯苓,枸骨葉,合歡花,黃精,黃芪,雞血藤,漏蘆,鹿角膠,清半夏,肉蓯蓉,三七,沙苑子,生姜,石菖蒲,熟地,鎖陽,太子參,益智仁,淫羊藿,郁金3阿膠,艾葉,白僵蠶,白芷,補(bǔ)骨脂,車前子,川芎,丹參,丹皮,黨參,地龍,佛手,茯神,藁本,葛根,鉤藤,枸杞子,龜甲,海藻,紅花,紅景天,僵蠶,昆布,龍眼肉,鹿角霜,綿萆薢,墨旱蓮,木瓜,牛膝,女貞子,羌活,全瓜蔞,全蝎,肉豆蔻,肉桂,桑寄生,沙參,山茱萸,首烏藤,酸棗仁,天麻,烏梅,細(xì)辛,香附,香櫞,延胡索,益母草,棗仁,珍珠粉
圖13 聚類數(shù)目為10個(gè)時(shí)的層次聚類結(jié)果分布圖
圖14 聚類數(shù)目為29個(gè)時(shí)的層次聚類結(jié)果分布圖
表4聚類數(shù)目為29個(gè)時(shí)的層次聚類結(jié)果
序號(hào) 藥物序號(hào) 藥物1阿膠,補(bǔ)骨脂,黨參,枸杞子,龍眼肉,鹿角霜,肉豆蔻,酸棗仁16火麻仁,雞內(nèi)金,焦麥芽,靈芝,炙黃芪2丹皮,墨旱蓮,女貞子,全瓜蔞,沙參,山茱萸,17蒼術(shù),瓜蔞,焦山楂,焦神曲3白僵蠶,龜甲,全蝎18薤白,枳殼,紫蘇梗4丹參,香附19半夏,萆薢,黃芩,藿香,佩蘭5鉤藤,紅景天,牛膝,桑寄生,天麻20桂枝,黃柏,桃仁,菟絲子,薏苡仁6白芷,藁本,羌活,細(xì)辛,延胡索21附子,厚樸,酒大黃,炮姜7車前子,地龍,僵蠶,綿萆薢,棗仁22白芍,大黃,枳實(shí)8川芎,佛手,海藻,紅花,昆布,烏梅,香櫞,益母草23枇杷葉,山藥,生地,澤瀉,浙貝母,知母9艾葉,茯神,葛根,木瓜,肉桂,首烏藤,珍珠粉24白薇,刺五加,浮小麥,牡丹皮,珍珠母10巴戟天,楮實(shí)子,杜仲,黃精,黃芪,雞血藤,鹿角膠,肉蓯蓉,三七,沙苑子,熟地,鎖陽,淫羊藿2526柏子仁,蓮子心,羚羊角柴胡,炒白術(shù),赤芍,淡豆豉,當(dāng)歸,生龍骨,生牡蠣11磁石,漏蘆,石菖蒲,郁金27薄荷,廣藿香,梔子12白術(shù),大棗,茯苓,清半夏,生姜28鱉甲,膽南星,黃連,竹茹13枸骨葉,合歡花,太子參,益智仁29何首烏14陳皮,姜半夏,木香,砂仁,瓦楞子,旋復(fù)花,炙甘草15北沙參,淡竹葉,決明子,麥冬,石斛,五味子
2.3.3 K-means聚類分析 當(dāng)取聚類數(shù)目為3類時(shí),146種中藥主要可以分為疏肝行氣健脾、活血通絡(luò)、補(bǔ)腎滋陰3類藥物。詳見圖15。此3類藥物也符合韓振蘊(yùn)教授的臨床用藥習(xí)慣。韓振蘊(yùn)教授臨床治療抑郁癥病人中年輕婦女和更年期婦女也較為常見,女子以血為本,血能攝氣,血行則氣行,故在疏肝行氣健脾的基礎(chǔ)上注重辨證,加以活血通絡(luò)等藥物進(jìn)行治療。
2.3.4 PAM聚類分析 PAM聚類分析得到的結(jié)果與K-means聚類分析得到的結(jié)果類似。詳見圖16。
圖15 K-means聚類結(jié)果
圖16 PAM聚類結(jié)果
抑郁癥又稱為抑郁障礙,是以持久顯著的心境低落狀態(tài)為主要特征的一種危害人類身心健康的常見病[3]。抑郁癥在中醫(yī)內(nèi)科學(xué)主要屬于“郁病”的范疇,從病因病機(jī)方面分析以“肝失疏泄,脾失運(yùn)化,心神失養(yǎng),臟腑陰陽氣血失和”為主要原因,治療方面則在疏肝解郁的基礎(chǔ)上施以辨證論治[4]。本研究基于R軟件平臺(tái),利用多種數(shù)據(jù)挖掘技術(shù)分析韓振蘊(yùn)教授治療抑郁癥的臨床用藥規(guī)律。在Pearson相關(guān)系數(shù)分析方面,可以得到韓振蘊(yùn)教授平時(shí)處方中的20個(gè)高相關(guān)度的中藥對(duì)。但此相關(guān)系數(shù)未考慮到支持度與置信度的問題。故利用Apriori算法進(jìn)行相關(guān)度分析,對(duì)支持度與置信度進(jìn)行了限定,篩選高頻藥物中的藥物組合。
根據(jù)表2可得出結(jié)論,在高頻用藥的中藥中,以疏肝健脾理氣類藥物的藥物組合為主。將支持度調(diào)低,篩選中高頻的藥物組合,得到圖3。從圖3可以看出,在中高頻的藥物組合中,以疏肝健脾理氣類和補(bǔ)腎填精類藥物為主。具體原因有幾個(gè)方面:①抑郁癥臨床上以肝郁脾虛證為主[5-6],有研究表明抑郁癥病人肝郁占41%,脾虛占16%[7]。而肝郁脾虛型抑郁癥在治療用藥方面需以疏肝健脾理氣藥為主。圖6中標(biāo)出了韓振蘊(yùn)教授門診中最為核心的藥物,主要為柴胡、當(dāng)歸、生龍骨、生牡蠣、木香、梔子、白術(shù)、丹參、茯苓、陳皮、半夏、炙甘草等藥物。其中當(dāng)歸、柴胡理氣疏肝活血,生龍骨、生牡蠣重鎮(zhèn)安神,丹參活血安神,木香、丹參活血理氣,半夏、陳皮、茯苓、白術(shù)健脾理氣,諸藥合用,共奏疏肝健脾、安神理氣之功效。②韓振蘊(yùn)教授門診有不少老年抑郁癥病人,此類病人在辨證時(shí)多在肝氣郁結(jié)的基礎(chǔ)上存在肝腎不足,故用藥時(shí)需用到不少補(bǔ)益肝腎的藥物。圖15 K-means聚類分析表明,韓振蘊(yùn)教授臨床較為常用的補(bǔ)益肝腎藥物主要為褚實(shí)子、巴戟天、肉蓯蓉、鎖陽、黃精等。此類藥物大多為溫潤(rùn)補(bǔ)益之品,對(duì)老年抑郁癥存在肝腎不足者效果佳。
本研究?jī)H對(duì)韓振蘊(yùn)教授處方中的中藥組成進(jìn)行了分析,并未針對(duì)病人年齡、性別等與藥物組成進(jìn)行交叉分析;同時(shí),本研究樣本量為69例,樣本量有限,研究結(jié)論需更大的樣本量進(jìn)行驗(yàn)證。另外,本研究未將藥物劑量作為加權(quán)指標(biāo)對(duì)藥物組成進(jìn)行加權(quán),未考慮藥物劑量所造成的影響。故后期仍需進(jìn)行更加深入的數(shù)據(jù)挖掘。