郭德海 鄭光 張潔 趙寧 張文江 苗青 呂誠 張瓊
摘要:目的? 利用文本挖掘技術(shù)總結(jié)慢性咳嗽的中醫(yī)診治規(guī)律。方法? 收集中國知識資源總庫(CNKI)、中文科技期刊數(shù)據(jù)庫(維普網(wǎng))、中國學術(shù)期刊數(shù)據(jù)庫(萬方數(shù)據(jù))、中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)中治療慢性咳嗽的文獻,建立數(shù)據(jù)庫,運用結(jié)構(gòu)化查詢語言處理數(shù)據(jù),采用數(shù)據(jù)分層算法分析慢性咳嗽中醫(yī)診治規(guī)律。結(jié)果? 共檢索出相關文獻3157篇。慢性咳嗽伴隨癥狀以咳痰、便秘、干咳、咯血、胸悶等較為多見,便秘、惡心、嘔吐等消化系統(tǒng)癥狀較為突出;常見證候要素有氣虛、痰濕、陰虛、肝火、陽虛、風寒、濕熱;常見證候有肝火犯肺、痰濕蘊肺、肺陰虧虛、虛實夾雜;常用方劑為止嗽散、麥門冬湯、二陳湯、麻黃湯、三拗湯、玉屏風散、半夏瀉心湯等;單味高頻藥物有甘草、桔梗、半夏、陳皮、麻黃等。結(jié)論? 利用文本挖掘的方法,可快捷、全面、系統(tǒng)地梳理慢性咳嗽臨床實踐中的中醫(yī)診治現(xiàn)狀,總結(jié)慢性咳嗽中醫(yī)診治規(guī)律,為臨床用藥和科研提供參考。
關鍵詞:文本挖掘;慢性咳嗽;癥狀;證候;方劑;中藥
中圖分類號:R2-05;R259.6??? 文獻標識碼:A??? 文章編號:1005-5304(2019)10-0101-04
DOI:10.3969/j.issn.1005-5304.2019.10.022????? 開放科學(資源服務)標識碼(OSID):
Abstract: Objective To summarize the laws of TCM diagnosis and treatment of chronic cough by text mining technology. Methods Articles about treatment for chronic cough were collected from CNKI, VIP, Wanfang Data, and CBM. A database was set up. Structure query language (SQL) was used to deal with data, and data hierarchical algorithm was used to analyze the laws of TCM diagnosis and treatment of chronic cough. Results Totally 3157 related articles were retrieved. Among them, the symptoms accompanied by chronic cough were expectoration, constipation, dry cough, hemoptysis, chest tightness, etc., and constipation, nausea, vomiting and other digestive symptoms were obvious; the common syndrome factors were qi deficiency, phlegm dampness, yin deficiency, liver fire, yang deficiency, wind cold, and damp heat and so on; the common syndromes were liver fire invading the lung, phlegm damp accumulation of lung, lung yin deficiency, and intermingled deficiency and excess; the common prescriptions were Zhisou Powder, Maimendong Decoction, Erchen Decoction, Mahuang Decoction, Sanao Decoction, Yupingfeng Powder, Banxia Xiexin Decoction, etc.; the single high-frequency Chinese materia medica were Glycyrrhizae Radix et Rhizoma, Platycodonis Radix, Pinelliae Rhizoma, Citri Reticulatae Pericarium, and Ephedrae Herba, etc. Conclusion Using the text mining method can quickly, comprehensively and systematically sort out the status quo of TCM diagnosis and treatment of chronic cough in clinical practice, summarize the laws of TCM diagnosis and treatment, and provide references for clinical medication and scientific research.
Keywords: text mining; chronic cough; symptoms; syndromes; prescriptions; Chinese materia medica
慢性咳嗽是指以咳嗽為主要或唯一癥狀,病程大于8周,X線胸片無明顯異常的咳嗽[1]。在大多數(shù)國家或地區(qū),慢性咳嗽的患病率>10%,為7.2%~33%不等[2]。中醫(yī)藥治療慢性咳嗽具有一定優(yōu)勢,其原因在于中醫(yī)“辨證論治,復方效應和標本兼治”的臨床模式[3]。文本挖掘是數(shù)據(jù)挖掘技術(shù)的一個分支,是從文本集中發(fā)現(xiàn)潛在、隱藏的歸納性知識的一門技術(shù)[4],能對海量數(shù)據(jù)進行整合、分析,獲得的結(jié)果更具有代表性、可信度更高[5],其在中醫(yī)藥領域的應用已日漸成熟。本研究利用文本挖掘技術(shù)對大量相關文獻進行分析,研究慢性咳嗽的中醫(yī)診治規(guī)律,以期為慢性咳嗽的臨床和科研工作提供參考。
1? 資料與方法
1.1? 數(shù)據(jù)來源
檢索范圍:中國知識資源總庫(CNKI),中文科技期刊數(shù)據(jù)庫(VIP),中國學術(shù)期刊數(shù)據(jù)庫(萬方數(shù)據(jù))及中國生物醫(yī)學文獻數(shù)據(jù)庫(CBM)建庫至2018年10月7日。本文的數(shù)據(jù)收集在檢索詞的層面不包含純西醫(yī)的條件,但包含中醫(yī)和中西醫(yī)結(jié)合的文獻。在上述文獻的基礎上,為進一步精簡相關文件,排除不包含中醫(yī)證候、癥狀、復方、疾病的文獻。
檢索策略:CNKI為主題“慢性咳嗽”+全文“中醫(yī)”或“中西醫(yī)結(jié)合”;VIP為題名+關鍵詞包含“慢性咳嗽”+“中醫(yī)”或“中西醫(yī)結(jié)合”;萬方數(shù)據(jù)為主題“慢性咳嗽”+“中醫(yī)”或者“中西醫(yī)結(jié)合”;CBM為題目、關鍵詞和摘要中檢索“慢性咳嗽”+“中醫(yī)”或“中西醫(yī)結(jié)合”。
1.2? 數(shù)據(jù)預處理
將數(shù)據(jù)整合至平面文本文件(TXT),以GB2312編碼保存。然后利用專有的文本提取工具(軟著登字第0261882號,登記號2010SR073409)將下載的非結(jié)構(gòu)化文本數(shù)據(jù)進行格式化轉(zhuǎn)換,并保存到大型關系型數(shù)據(jù)庫MS SQL Server 2014中[6-7]。數(shù)據(jù)預處理過程中,關鍵的一步是提取關鍵詞(包括核心和非核心2種類型)。
1.3? 數(shù)據(jù)清洗
導入的數(shù)據(jù)庫以“TableInitial”為表名稱,針對“序號”和“關鍵詞”2個數(shù)據(jù)列,分別用PMID和DescriptorName來表示。對原文獻的溯源分析發(fā)現(xiàn),相同的關鍵詞在同一篇文獻的標題和摘要中存在重復出現(xiàn)的情況。對于文本挖掘來說,前提假設是每篇文獻的貢獻度是相同的?;诖?,對于同一篇文獻中重復出現(xiàn)的關鍵詞,只計算1次。據(jù)此進行數(shù)據(jù)清洗工作。
1.4? 數(shù)據(jù)分析
針對清洗后的文獻數(shù)據(jù),應用基于共同出現(xiàn)原則的敏感關鍵詞頻數(shù)統(tǒng)計的數(shù)據(jù)分層算法[5],生成慢性咳嗽相關數(shù)據(jù)。本文的“癥狀”依據(jù)《中醫(yī)診斷學》[8]規(guī)范,名詞術(shù)語“證候、要素”依據(jù)《中醫(yī)診斷學》[8]和張志斌等[9-10]課題研究,中藥名稱依據(jù)《中藥學》[11]進行規(guī)范。但個別原文中藥名稱并未清楚表明炮制情況,如“半夏”共出現(xiàn)42個頻次,其中“法半夏、姜半夏”各1次,余40次均為“半夏”。
1.5? 數(shù)據(jù)可視化
根據(jù)得到的數(shù)據(jù)表DN_pairs_frqcy,抽出不同頻數(shù)關鍵詞對,分別用Excel、Cytoscape3.7進行可視化處理,得到慢性咳嗽的文獻挖掘結(jié)果。
2? 結(jié)果
2.1? 文獻數(shù)據(jù)
經(jīng)數(shù)據(jù)清洗,最終納入文獻3157篇。CNKI:中醫(yī)文獻1709篇,中西醫(yī)結(jié)合文獻922篇;VIP:中醫(yī)文獻1437篇,中西醫(yī)結(jié)合文獻312篇;萬方數(shù)據(jù):中醫(yī)文獻1095篇,中西醫(yī)結(jié)合文獻153篇;CBM:中醫(yī)文獻1632篇,中西醫(yī)結(jié)合文獻275篇。
2.2? 慢性咳嗽伴隨癥狀
慢性咳嗽伴隨癥狀有152個,頻次統(tǒng)計前12位(頻次≥47)的癥狀有咳痰、便秘、干咳、咯血、胸悶、發(fā)熱、胸痛、咯痰、氣短、疼痛、惡心、嘔吐(見表1)。這些癥狀可分為4類。①呼吸系統(tǒng)癥狀:咳痰、干咳、咯血、咯痰、氣短;②消化系統(tǒng)癥狀:便秘、惡心、嘔吐;③胸部癥狀:胸悶、胸痛;④全身癥狀:發(fā)熱、疼痛。作為伴隨癥狀,消化系統(tǒng)癥狀比較突出,尤其便秘癥狀頻次很高。
2.3? 慢性咳嗽常見證候
慢性咳嗽中醫(yī)證候要素有32個,前15位(頻次≥7)見表2,常見的證候要素有氣虛、痰濕、陰虛、肝火、陽虛、風寒等。其中,病位要素涉及肺、肝、脾、腎;病性要素有氣虛、陰虛、火、陽虛、濕熱、血瘀、痰瘀、氣滯;病因要素包括風寒、風熱、痰濕、痰飲、瘀血。慢性咳嗽中醫(yī)證候有68個,前9位(頻次≥4)見表3,其中肝火犯肺、痰濕蘊肺、肺陰虧虛、虛實夾雜比較多見(頻次≥10),還有氣陰兩虛、寒熱錯雜、風寒襲肺、陰虛肺燥、風熱犯肺。
2.4? 慢性咳嗽常用方劑
3157篇文獻涉及方劑70首,其中止嗽散是慢性咳嗽的首要方劑,出現(xiàn)頻次遠高于其他方劑;麥門冬湯、二陳湯、麻黃湯、三拗湯、玉屏風散、半夏瀉心湯、苓甘五味姜辛湯、小青龍湯、沙參麥冬湯、六君子湯、養(yǎng)陰清肺湯、射干麻黃湯、三子養(yǎng)親湯、溫膽湯也是常用方劑(頻次≥6,見表4)。慢性咳嗽的核心方劑止嗽散、二陳湯、麥門冬湯、三拗湯,構(gòu)成慢性咳嗽方劑網(wǎng)絡的核心軸,串聯(lián)起慢性咳嗽方劑網(wǎng)絡圖(見圖1)。網(wǎng)絡中慢性咳嗽處方的相關性和結(jié)點的大小呈正相關;連線表示方劑間相關性。
2.5? 慢性咳嗽常用中藥
3157篇文獻涉及中藥144味,甘草居于首位,桔梗、半夏、陳皮、麻黃處于重要位置(頻次≥25,見表5);中藥藥對共有1766對,其中“荊芥-桔?!薄瓣惼?桔?!薄敖酃?紫菀”“陳皮-炙甘草”“百部-桔?!薄鞍俨?荊芥”“甘草-麻黃”使用頻率名列前茅(頻次≥26,見表6)。桔梗、甘草、半夏作為核心軸串聯(lián)起止嗽散、三拗湯、小半夏加茯苓湯3個中藥集群,構(gòu)建起慢性咳嗽常用中藥網(wǎng)絡(見圖2)。
3? 討論
慢性咳嗽病因為內(nèi)外合邪、互為因果[12-13]。文本挖掘結(jié)果顯示,其證候要素以氣虛、痰濕、陰虛、肝火、陽虛、風寒、濕熱為主,病位涉及肺、肝、脾胃、腎、大腸,證候分型以肝火犯肺、痰濕蘊肺、肺陰虧虛、虛實夾雜為主。慢性咳嗽的病機是以內(nèi)傷為主、兼有外感、虛實夾雜。臟腑內(nèi)傷所致久咳,《素問·咳論篇》中“久咳不已……此皆聚于胃,關于肺”,《雜病源流犀燭》中“肺不傷不咳,脾不傷不久咳,腎不傷火不熾”對久咳肺與脾胃相關病機進行論述。文本挖掘結(jié)果顯示,慢性咳嗽常見癥狀有呼吸系統(tǒng)癥狀、消化系統(tǒng)癥狀、胸部癥狀、全身癥狀。便秘、惡心、嘔吐等消化系統(tǒng)癥狀高頻出現(xiàn),提示慢性咳嗽肺失宣降,在臟腑相關病機中與脾胃、大腸關系密切。
止嗽散由荊芥、桔梗、陳皮、紫菀、百部、白前、甘草組成,止咳化痰、疏表宣肺,該方“溫潤和平,不寒不熱,即無攻擊過當之虞,大有啟門驅(qū)賊之勢。是以客邪易散,肺氣安寧”[14],程氏和后世醫(yī)家用其“治諸般咳嗽”[14]。文本挖掘結(jié)果顯示,該方治療慢性咳嗽應用頻次遠高于其他方劑。其他主要方劑有:麥門冬湯滋養(yǎng)肺胃、降逆和中,用于肺胃陰虛、虛火上逆咳嗽;三拗湯宣肺解表,用于感冒風邪所致咳嗽;二陳湯燥濕化痰、理氣和中,用于濕痰咳嗽;玉屏風散益氣固表,用于肺氣虛所致咳嗽;半夏瀉心湯和胃降逆,用于胃氣不和之咳嗽。上述方劑基本涵蓋慢性咳嗽常用方劑功效類型,即:慢性咳嗽方劑功效以疏風散寒、宣肺止咳、燥濕化痰、益氣養(yǎng)陰、和胃降逆為主,與證候要素挖掘結(jié)果基本一致,印證了慢性咳嗽內(nèi)傷為主、肺脾相關、兼有外感的病因。
甘草味甘性平,補脾益氣、清熱解毒、祛痰止咳、緩急止痛、調(diào)和諸藥?!秱摗分懈什輪斡糜小吧訇幉《?,咽痛者,可與甘草湯”治療咽痛,復方運用如小柴胡湯、桔梗湯、麻黃杏仁甘草石膏湯,這些都是甘草直接或間接止咳的應用范例。文本挖掘結(jié)果甘草使用頻次居于首位,一方面由于其祛痰止咳、抗炎抗感染作用,另一方面也因“非甘草主病多,乃諸方必合甘草,始能曲當病情”[15]。排名第2位的桔梗味苦辛性平,宣肺利咽、祛痰排膿?,F(xiàn)代研究表明,不同產(chǎn)地桔梗水提液對由濃氨水引起的咳嗽次數(shù)均具有較好的抑制作用,并可明顯增加小鼠氣管的酚紅排泄量[16]。桔梗不僅單用可以止咳,且與荊芥、陳皮、紫菀組成藥對,具有很好的止咳化痰作用。文本挖掘結(jié)果顯示,“荊芥-桔?!薄瓣惼?桔?!薄敖酃?紫菀”藥對在止咳中藥藥對中名列前茅。通過網(wǎng)絡圖分析可見,常用中藥形成止嗽散、三拗湯、小半夏加茯苓湯3個中藥集群,表明宣肺解表、降逆化飲、祛痰止咳中藥是慢性咳嗽的主要用藥。這與文本挖掘結(jié)果相近。
綜上,文本挖掘技術(shù)可快捷、全面、系統(tǒng)地梳理慢性咳嗽臨床診治現(xiàn)狀,總結(jié)診治規(guī)律,發(fā)現(xiàn)臨床新的知識點和潛在問題,為知識更新、臨床指南的升級提供證據(jù)。同時,根據(jù)挖掘結(jié)果所形成的網(wǎng)絡圖可能形成新組方,揭示新的疾病、藥物關系,為中醫(yī)治療慢性咳嗽的臨床用藥和科研工作提供思路和參考。
參考文獻:
[1] 中華醫(yī)學會呼吸病學分會哮喘學組.咳嗽的診斷與治療指南(2015)[J].中華結(jié)核和呼吸雜志,2016,39(5):323-354.
[2] LAI K, PAN J, CHEN R, et al. Epidemiology of cough in relation to China[J]. Cough,2013,9(1):18.
[3] 張紓難,劉劍.中國《咳嗽的診斷與治療指南(2015)》“中醫(yī)部分”解讀[J].環(huán)球中醫(yī)藥,2016,9(6):699-701.
[4] AL-MUBAID H, SINGH R K. A text-mining technique for extracting gene-disease associations from the biomedical literature[J]. Int J Bioinform Res Appl,2010,6(3):270-286.
[5] Rodriguez-Esteban R. Biomedical text mining and its applications[J]. PLoS Compute Biol,2009,5(12):e1000597.
[6] 展俊平,鄭光,孟慶良,等.基于文本挖掘技術(shù)初步探討雷公藤應用相關的生物學基礎[J].中國中醫(yī)基礎醫(yī)學雜志,2018,24(4):556-559.
[7] 王麗穎,鄭光,趙學堯,等.基于文本挖掘的高血壓病中醫(yī)辨證用藥情況分析[J].世界中西醫(yī)結(jié)合雜志,2018,13(4):462-465,470.
[8] 朱文鋒.中醫(yī)診斷學[M].北京:中國中醫(yī)藥出版社,2017:2.
[9] 張志斌,王永炎.辨證方法新體系的建立[J].北京中醫(yī)藥大學學報, 2005,28(1):1-3.
[10] 張志斌,王永炎,呂愛平,等.論證候要素與證候靶點應證組合辨證[J].中醫(yī)雜志,2006,47(7):483-485.
[11] 高學敏.中藥學[M].北京:中國中醫(yī)藥出版社,2017.
[12] 史利卿,馬建嶺,楊凱,等.慢性咳嗽中醫(yī)病因病機及證候?qū)W規(guī)律的認識與探討[J].現(xiàn)代中醫(yī)臨床,2017,24(5):1-5.
[13] 洪廣祥.慢性咳嗽中醫(yī)藥治療再探討[J].中醫(yī)藥通報,2010,9(3):10-14.
[14] 程鐘齡.醫(yī)學心悟[M].田代華,整理.北京:人民衛(wèi)生出版社,2006:148.
[15] 鄒澍.本經(jīng)疏證[M].陸拯,姜建國,點校.北京:中國中醫(yī)藥出版社, 2013:27.
[16] 朱繼孝,曾金祥,張亞梅,等.不同產(chǎn)地桔梗鎮(zhèn)咳祛痰作用比較研究[J].世界科學技術(shù)-中醫(yī)藥現(xiàn)代化,2015,17(5):976-980.
(收稿日期:2019-03-07)
(修回日期:2019-04-30;編輯:季巍巍)