肖宗朋 劉 鴻 陳建英 唐東明 譚 穎
西南民族大學(xué)計(jì)算機(jī)系統(tǒng)國(guó)家民委重點(diǎn)實(shí)驗(yàn)室,四川 成都 610041
2019年12月,湖北省武漢市首次報(bào)告新型冠狀病毒肺炎(COVID-19)病例,其主要傳染源是感染人群和無癥狀患者,傳播方式主要有三種直接傳播,接觸傳播和氣溶膠傳播[1]。COVID-19已作為急性呼吸道傳染病被列入乙類傳染病,按照甲類傳染病管理。中醫(yī)藥及中西醫(yī)結(jié)合策略在這次疫情的防治中發(fā)揮了積極的作用,在湖北省中醫(yī)藥救治參與率有著91.05%,而全國(guó)除湖北省以外的地區(qū)中醫(yī)藥參與救治的病例更是高達(dá)96.37%[2]。
藏醫(yī)學(xué)在千百年的醫(yī)學(xué)實(shí)踐中針對(duì)傳染性疾病積累了豐富的治療經(jīng)驗(yàn)[3]。史料記載,吐蕃王朝第三十代藏王仲時(shí)期若患麻風(fēng)病,自愿做活葬,以絕其傳染源[4]。自新冠肺炎疫情暴發(fā)以來,西藏、青海推廣關(guān)于新冠肺炎運(yùn)用藏醫(yī)藥防治的方案,取得良好的效果。由于藏藥組方配伍的獨(dú)特性,其復(fù)方成分往往多達(dá)數(shù)十味藥材,本研究運(yùn)用數(shù)據(jù)挖掘技術(shù)尋找其中的核心處方,以期為藏醫(yī)藥治療COVID-19提供有益的借鑒。
1.1 數(shù)據(jù)來源和錄入 本研究的數(shù)據(jù)主要來源于青海省2月25日頒布的《青海省新型冠狀病毒肺炎藏醫(yī)藥防治方案(試行第二版)》[5]和西藏自治區(qū)藏醫(yī)藥管理局2月23日頒布的《新型冠狀病毒感染肺炎藏醫(yī)藥防治方案(試行第二版)》[6]所載的方劑。進(jìn)行方劑整理時(shí),參考《中國(guó)藏藥材大全》[7]、《藏藥方劑寶庫(kù)》[8]對(duì)其進(jìn)行歸類。選用Excel進(jìn)行方劑和藥材信息的基礎(chǔ)錄入。
1.2 數(shù)據(jù)分析
1.2.1 數(shù)據(jù)預(yù)處理與頻數(shù)統(tǒng)計(jì) Apriori算法是一種針對(duì)單維、單層、布爾關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘算法,挖掘關(guān)聯(lián)規(guī)則時(shí),只能處理分類型變量,并要求待處理的數(shù)據(jù)在存儲(chǔ)時(shí)要以項(xiàng)集的方式存在,即事物表和事實(shí)表[9]兩種。為保證后續(xù)數(shù)據(jù)挖掘工作能順利開展,需要對(duì)待處理數(shù)據(jù)按照算法所需的數(shù)據(jù)要求進(jìn)行預(yù)處理。如方劑《清肺止咳丸》配方中出現(xiàn)的“各適量”“各等量”“g”等詞都刪除,使非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)化為結(jié)構(gòu)化數(shù)據(jù)。使用jieba算法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,提取藥物名,去除干擾因素的文字,然后使用collection中的Counter計(jì)數(shù)器來進(jìn)行方劑中出現(xiàn)的藥物頻數(shù)統(tǒng)計(jì)。
1.2.2 關(guān)聯(lián)規(guī)則 關(guān)聯(lián)規(guī)則主要反映數(shù)據(jù)集中數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)性。在數(shù)據(jù)集中,若大量記錄在具有特征屬性A的同時(shí),也頻繁出現(xiàn)特征屬性B,則稱特征屬性A和B構(gòu)成頻繁模式。挖掘頻繁模式可以發(fā)現(xiàn)數(shù)據(jù)中隱含的關(guān)聯(lián)和相關(guān)性,即關(guān)聯(lián)規(guī)則。
關(guān)聯(lián)規(guī)則目前常用于傳統(tǒng)醫(yī)藥領(lǐng)域,主要是從大量且復(fù)雜的傳統(tǒng)醫(yī)藥信息中發(fā)掘不同數(shù)據(jù)集之間潛在的聯(lián)系,常見于方劑配伍規(guī)律的研究。關(guān)聯(lián)規(guī)則的興趣度由其支持度(support)和置信度(confidence)來度量,它們分別反映規(guī)則的有用性和確定性。在用藥規(guī)律挖掘中,支持度是指所有藥物組合中同時(shí)出現(xiàn)兩味或者多味藥材組合的概率;置信度則是在某一藥材出現(xiàn)的條件下,另一藥物出現(xiàn)的概率。
Apriori算法是進(jìn)行關(guān)聯(lián)規(guī)則分析的經(jīng)典算法,主要包含兩個(gè)階段:首先采用逐層搜索的迭代方法,從整理完畢的數(shù)據(jù)集中找出所有的頻繁項(xiàng)集,即項(xiàng)集出現(xiàn)的次數(shù)滿足預(yù)定義最小支持度閾值;隨后從產(chǎn)生頻繁項(xiàng)集中發(fā)現(xiàn)滿足條件的強(qiáng)關(guān)聯(lián)規(guī)則,即這些規(guī)則必須同時(shí)滿足最小支持度和最小置信度[10]。
1.2.3 聚類分析 不同的藏藥之間有著各式各樣的聯(lián)系,通過聚類分析,可以從不同藏藥中找出共同點(diǎn)。在本研究中通過聚類分析法對(duì)高頻藥物進(jìn)行歸類,從而發(fā)掘不同藏藥類群的主要特性。首先取出頻數(shù)靠前的前12味藥物,將每一味藥物作為變量,每個(gè)藥物作為個(gè)體進(jìn)行藥味和藥性的統(tǒng)計(jì),其中藥物中有此特性記為1,沒有則記為0。按照此方法完成高頻藥物數(shù)據(jù)矩陣的整理后,使用SPSS Statistics 22.0軟件進(jìn)行聚類分析。
2.1 主要藏藥頻次分析 通過對(duì)藏醫(yī)用藥的統(tǒng)計(jì),得到藏藥114味,其中使用頻次較高的前12味藏藥依次為訶子、紅花、毛訶子、檀香、牛黃、木香、余甘子、天竺黃、寬筋藤、藏木香、麝香、沉香。這些高頻數(shù)的藏醫(yī)藥使用的總構(gòu)比占36.39%,詳見表1。通過分析使用頻率前12味藥物的藥味信息,辛味的出現(xiàn)頻數(shù)最多。藥性統(tǒng)計(jì)發(fā)現(xiàn),溫性的頻率最高,其次為涼性。歸經(jīng)統(tǒng)計(jì)發(fā)現(xiàn),以肺和肝最多,胃其次,結(jié)果見表2、3、4。
表1 頻率前12味藥物統(tǒng)計(jì)
表2 使用頻率前12味藥味的統(tǒng)計(jì)
表3 使用頻率前12味藥性統(tǒng)計(jì)
表4 使用頻率前12味藥物的歸經(jīng)統(tǒng)計(jì)
2.2 關(guān)聯(lián)規(guī)則 通過jieba算法對(duì)相關(guān)數(shù)據(jù)進(jìn)行預(yù)處理,除去了除藥材名以外的干擾項(xiàng),將處理后的數(shù)據(jù)導(dǎo)入關(guān)聯(lián)規(guī)則算法中。運(yùn)行程序后,手動(dòng)輸入最小規(guī)則置信度為75%,最低條件支持度為25%,得到11條數(shù)據(jù),見表5。
2.3 聚類分析 對(duì)治療疫病頻次排名前12味的藏藥進(jìn)行聚類分析,結(jié)合藏藥理論,共得到5個(gè)聚類組合,結(jié)果見表6和圖1。
表5 藥物間的關(guān)聯(lián)度分析
表6 高頻用藥聚類組合
圖1 高頻用藥聚類分析譜系圖
藏醫(yī)學(xué)認(rèn)為“疫病”屬于熱病范疇,發(fā)病初期多會(huì)呈現(xiàn)早期熱癥的征兆。進(jìn)行治療時(shí),主要采取“集熱平穩(wěn)”的療法;染病中期階段主要以“散熱驅(qū)邪,抑制傳播”為主;后期采取“滋補(bǔ)、調(diào)養(yǎng)身體”與“并發(fā)癥防治”的療法[11]。本研究主要采用數(shù)據(jù)挖掘技術(shù)[12]進(jìn)行藏醫(yī)藥治療疫病的研究,分析用藥規(guī)律。通過藥物頻次分析得知,用于清熱解毒的有牛黃、毛訶子、沉香和寬筋藤;活血的有檀香和麝香;治療炎癥的有天竺黃和牛黃;滋補(bǔ)養(yǎng)身的有訶子和紅花。通過高頻藏藥用藥分析,可以得出治療以清熱、涼血、消炎、活血為主,亦兼顧補(bǔ)血、滋陰。
從藥性上來看辛味藥材最多,其次為苦味和甘味。辛味藥物有通行血脈、散里寒、散結(jié)滯、殺蟲等功效;甘味藥有滋補(bǔ)強(qiáng)身之功,對(duì)食道阻塞等病較為有效;苦味藥有開胃、清熱解毒等功效。藥物以入肺經(jīng)為主,其次入肝、胃的藏藥較多。新冠肺炎病毒是一種包膜的RNA病毒,除呼吸道感染外,有的患者胃腸道也會(huì)存在感染,所以除咳嗽、發(fā)熱外,如若出現(xiàn)腹痛等癥狀也應(yīng)該引起重視[13]。
通過關(guān)聯(lián)規(guī)則得出,余甘子的使用頻率較多,因?yàn)橛喔首佑辛己玫目咕饔肹14]。置信度較高的組合有“余甘子→訶子(100%)”,“余甘子→毛訶子(100%)”以及“余甘子→訶子and毛訶子(100%)”。在藏醫(yī)中余甘子、訶子、毛訶子三種藥物常常配合使用,其組合稱為“三果”,是藏醫(yī)使用較多的基本藥物[15]。Kumar M S等[16]研究“三果”在感染傷口的愈合作用,結(jié)果表明對(duì)假單胞菌、鏈球菌等的抑菌作用效果明顯,可以促進(jìn)傷口愈合。所以在治療傳染性疾病中,“三果”還是以抑菌、消炎作用為主。
高頻藥物通用過聚類分析形成5個(gè)聚類,C1:檀香、麝香、紅花、沉香、木香。藥物以歸胃經(jīng)的藥物居多,多為行氣止痛藥、活血化瘀藥。肺絡(luò)不暢可發(fā)生瘀血的癥狀,進(jìn)而損傷肺功能,應(yīng)及時(shí)活血化瘀。C2:藏木香。藏木香具有抗炎和抗菌作用[17],主要用于清血熱和祛風(fēng)。C3:牛黃、寬筋藤。牛黃味甘、苦,性涼,可清熱解毒、豁痰定驚,治療內(nèi)臟炎癥、傳染病高燒等疾?。粚捊钐?,主治隆病、疫熱,符合藏醫(yī)理論熱病以“隆”病治療為主的原則。C4:毛訶子、余甘子、天竺黃。C5:訶子。C4和C5又出現(xiàn)“三果”組合,“三果”最基本的作用是預(yù)防腸胃疾病,其次在抗菌和抗炎方面也有良好的作用[18]。天竺黃,味澀,微帶甘味,性涼、鈍,解熱消炎,主治肺炎與各類肺病。毛訶子、余甘子、天竺黃三者相伍具有清熱止咳、消炎的功效。
藏醫(yī)學(xué)的理論基礎(chǔ)是“三因五源學(xué)”和“醫(yī)算結(jié)合學(xué)說”,從起居、飲食、藥物、外治四個(gè)方面來預(yù)防和治療疾病[19]。本研究通過青海和西藏防治新冠肺炎的藏醫(yī)處方,運(yùn)用數(shù)據(jù)挖掘的技術(shù)總結(jié)防治疫病的用藥特點(diǎn)。該方法對(duì)發(fā)掘方劑中的用藥規(guī)律,指導(dǎo)臨床合理用藥,具有一定的參考意義。