郭燕周,馬建偉
數(shù)據(jù)挖掘技術(shù)在糖尿病中醫(yī)證候及方藥中的應(yīng)用
郭燕周,馬建偉
[摘要]數(shù)據(jù)挖掘是指從大量數(shù)據(jù)中挖掘有趣模式和知識的過程。它涉及多學(xué)科領(lǐng)域,包含多種挖掘方法,常用的有聚類分析、關(guān)聯(lián)規(guī)則、無尺度網(wǎng)絡(luò)分析等。現(xiàn)將近幾年數(shù)據(jù)挖掘在糖尿病中醫(yī)證候、方藥規(guī)律研究領(lǐng)域的應(yīng)用作一綜述。文章分四部分內(nèi)容:第一部分主要概述數(shù)據(jù)挖掘及其在糖尿病中醫(yī)證候及方藥規(guī)律研究方面使用的可能性;第二部分主要從糖尿病、糖尿病并發(fā)癥、糖尿病合并癥方面分別運用數(shù)據(jù)挖掘技術(shù)分析中醫(yī)證候的情況;第三部分主要從文獻、臨床兩個方面總結(jié)目前數(shù)據(jù)挖掘技術(shù)在糖尿病方藥規(guī)律研究中的應(yīng)用情況;第四部分通過總結(jié)各醫(yī)家數(shù)據(jù)挖掘結(jié)果得出糖尿病中醫(yī)證候大多以陰虛燥熱、氣陰兩虛、陰陽兩虛為主,且氣陰兩虛證較為常見,其常用藥物有黃芪、生地、太子參、麥冬、丹參等,常用藥對有黃芪、山藥,黃芪、當(dāng)歸,山藥、山茱萸等,同時分析了數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥研究領(lǐng)域中的不足及其重要作用和意義。
[關(guān)鍵詞]數(shù)據(jù)挖掘;糖尿??;證候;綜述
[DOI]10.3969/j.issn.2095-140X.2015.09.008
隨著信息時代的到來,數(shù)據(jù)呈爆炸式增長,來自商業(yè)、社會、科學(xué)、工程、醫(yī)學(xué)以及日常生活的方方面面的數(shù)據(jù)注入計算機網(wǎng)絡(luò)及各種數(shù)據(jù)存儲設(shè)備,怎樣從海量數(shù)據(jù)中發(fā)現(xiàn)有價值的信息,成為社會發(fā)展的迫切需要,數(shù)據(jù)挖掘技術(shù)由此應(yīng)運而生。數(shù)據(jù)挖掘也稱為數(shù)據(jù)中的知識發(fā)現(xiàn),是指從大量數(shù)據(jù)中挖掘有趣模式和知識的過程[1]。與傳統(tǒng)數(shù)據(jù)分析的區(qū)別在于,數(shù)據(jù)挖掘是在無明確假設(shè)的前提下去挖掘信息,發(fā)現(xiàn)隱含的、潛在的知識。數(shù)據(jù)挖掘涉及機器學(xué)習(xí)、數(shù)理統(tǒng)計、神經(jīng)網(wǎng)絡(luò)、數(shù)據(jù)庫、模式識別、粗糙集等多學(xué)科領(lǐng)域,它包含許多種挖掘方法,常用的有聚類分析、關(guān)聯(lián)規(guī)則、決策樹、無尺度網(wǎng)絡(luò)分析、粗糙集理論等。近年來,中醫(yī)藥蓬勃發(fā)展,每年有大量的臨床研究成果及個人經(jīng)驗等文獻發(fā)表,出現(xiàn)了百花齊放的局面,但在一些重要理論方面仍是眾說紛紜,缺乏統(tǒng)一,且很多研究樣本量小,標(biāo)準(zhǔn)制定不規(guī)范,主觀性較強,如何客觀、標(biāo)準(zhǔn)化地探索中醫(yī)診療規(guī)律,總結(jié)經(jīng)驗,已成為中醫(yī)發(fā)展迫在眉睫的問題。將數(shù)據(jù)挖掘技術(shù)引入到中醫(yī)藥領(lǐng)域中,無疑將對促進中醫(yī)藥科研、臨床的健康發(fā)展產(chǎn)生重要影響。
1數(shù)據(jù)挖掘技術(shù)應(yīng)用于中醫(yī)證候及治療研究的可行性
近年來,隨著電子病歷廣泛應(yīng)用,各大醫(yī)院積累了大量的臨床數(shù)據(jù)。這些數(shù)據(jù)在統(tǒng)計中具有多態(tài)性、不完整性、較強的時間性和冗余性,加之很多數(shù)據(jù)多為文本形式,且不夠規(guī)范,這就使醫(yī)療數(shù)據(jù)更為復(fù)雜。以中醫(yī)證候為例,臨床中在描述同一個癥狀時,往往有不同的表述方法,如大便清稀、大便溏薄、每天大便2~3次、腹瀉等,意思均相近,無本質(zhì)區(qū)別,而中藥方藥中也存在此問題,如延胡索也可稱為元胡索、玄胡索、元胡、延胡等。對于上述情況,傳統(tǒng)的統(tǒng)計方法無法承擔(dān)分析任務(wù),它們大多只適用于具有數(shù)學(xué)特征、符合統(tǒng)計規(guī)律的數(shù)據(jù),而數(shù)據(jù)挖掘技術(shù)在對上述數(shù)據(jù)進行預(yù)處理后不僅能夠描述中醫(yī)證候及方藥分布的總體特征,而且能夠從復(fù)雜的癥狀中歸納出中醫(yī)證型,分析出癥狀與癥狀、癥狀與方藥、癥狀與證型等之間潛在的關(guān)聯(lián)規(guī)則。而在數(shù)量龐大的方藥中應(yīng)用數(shù)據(jù)挖掘技術(shù)甚至可以總結(jié)出配伍規(guī)律,發(fā)現(xiàn)潛在的藥對、核心藥物、核心處方等,這不僅為臨床醫(yī)生提供診療策略,而且對中醫(yī)理論的創(chuàng)新性發(fā)展及其客觀化、規(guī)范化研究均具有重要的推動作用。數(shù)據(jù)挖掘技術(shù)作為一種新的數(shù)據(jù)分析方法已逐漸引起醫(yī)學(xué)界的廣泛關(guān)注,它的應(yīng)用為中醫(yī)診療的規(guī)范化、標(biāo)準(zhǔn)化研究提供了一種新的途徑。
2數(shù)據(jù)挖掘技術(shù)在糖尿病及其并發(fā)癥、合并癥中醫(yī)證候研究中的應(yīng)用
2.1數(shù)據(jù)挖掘技術(shù)在糖尿病證候中的應(yīng)用李建生等[2]利用人工神經(jīng)網(wǎng)絡(luò)(artificial neural network, ANN)結(jié)合模糊系統(tǒng)(fuzzy system, FS),建立了糖尿病中醫(yī)證候診斷模型,用該模型對1134例糖尿病住院患者臨床資料進行數(shù)據(jù)挖掘,最終確定了氣陰兩虛證、腎陰虧虛證、血瘀證、肺燥津傷證等6個常見證候主癥和次癥診斷標(biāo)準(zhǔn),與原中醫(yī)證候診斷標(biāo)準(zhǔn)比較,符合率達86%。姜兆順等[3]依托結(jié)構(gòu)化糖尿病臨床信息采集系統(tǒng)對多家醫(yī)院的糖尿病住院患者癥狀進行數(shù)據(jù)挖掘,通過描述性統(tǒng)計發(fā)現(xiàn)糖尿病最常見的癥狀是乏力,其次是口渴多飲、視物模糊、肢體麻木、頭暈等;常見的舌質(zhì)多為黯、紅、淡,舌苔多薄白,舌體多胖大,有齒痕。從以上分析可知,糖尿病辨證多以氣虛、陰虛為主,且氣虛以脾氣虛多見;通過關(guān)聯(lián)規(guī)則分析得出:與乏力相關(guān)且常同時出現(xiàn)的癥狀有口渴喜飲、舌黯紅、視物模糊、頭暈、肢體麻木、苔膩等,與口渴喜飲相關(guān)的癥狀有乏力、視物模糊、頭暈、肢體麻木、苔薄,與多食易饑相關(guān)的癥狀有口渴喜飲、苔薄、乏力、尿頻、肢體麻木。林蘭等[4]收集了350例糖尿病患者的臨床資料,首先通過聚類分析將樣本聚類為6類,然后運用混合聚類法將6類樣本癥狀提取出來,根據(jù)中醫(yī)證候診斷標(biāo)準(zhǔn),得出糖尿病的主要證候為陰虛熱盛、氣陰兩虛、陰陽兩虛,常見的兼證有濕熱、血瘀、氣滯;同時將全部樣本按年齡及病程各分為3類,運用上述方法研究證候的動態(tài)演變規(guī)律,結(jié)果發(fā)現(xiàn)年齡在45歲以內(nèi)或病程在5年以內(nèi)的患者以陰虛熱盛為主,年齡在 46~60歲或病程為5~15年的患者以氣陰兩虛為主,年齡在60歲以上或病程在15年以上的患者以陰陽兩虛為主。方朝暉等[5]收集813例2型糖尿病患者的電子病歷,對其中醫(yī)證候進行數(shù)據(jù)挖掘,運用頻數(shù)和構(gòu)成比分析及Liquorice復(fù)雜網(wǎng)絡(luò)節(jié)點度頻度及點式互信息分析等統(tǒng)計方法進行研究,總結(jié)出2型糖尿病的中醫(yī)證候以氣陰兩虛夾瘀為主要特征,其次為氣陰兩虛證、熱盛傷津證、氣虛血瘀證、陰陽兩虛證。龔燕冰等[6]運用因子分析對2501例2型糖尿病患者的中醫(yī)證候及病位、病性等進行數(shù)據(jù)挖掘,采用方差最大旋轉(zhuǎn)法得出26個因子,對各因子進行證候的歸納、合并,最終得出糖尿病的主要證候是氣虛、陰虛,其次為血瘀、陽虛,同時可兼夾熱盛、氣滯、內(nèi)風(fēng);病位在肝、脾、腎。于彥與張敬鋒[7]采用流行病學(xué)調(diào)查的方式對某院2型糖尿病門診患者進行中醫(yī)證候的數(shù)據(jù)挖掘,運用因子分析法獲得15個共因子(各因子由相互關(guān)聯(lián)的不同癥狀組成),經(jīng)歸納總結(jié)并結(jié)合頻數(shù)分析后發(fā)現(xiàn)2型糖尿病以陰虛證、痰瘀互結(jié)證最多見,其次為肝胃郁熱證、陽虛證、氣虛證、氣滯證等。秦玉花等[8]對783例腎虛證糖尿病患者的癥候辨證因子及其相關(guān)性進行調(diào)查研究,結(jié)果發(fā)現(xiàn)“小便黃赤”及“口渴飲水”兩個因子頻次最高,而證、舌、脈的相關(guān)性分析經(jīng)提取因子載荷并進行聚類分析后最終指向3大類:第1類主要癥狀有面色淡白、精神萎靡、面目浮腫、舌質(zhì)淡胖、白天尿頻等,可歸為腎陽虛類;第2類主要癥狀為尿后余瀝、小便失禁、小便黃赤、小便澀少、大便失禁、面色暗黑等,可歸為陰陽兩虛類;第3類主要癥狀有潮熱、心悸、舌上津少、行動不便、腰痛、癡呆等,可歸為腎陰虛類。
2.2數(shù)據(jù)挖掘技術(shù)在糖尿病并發(fā)癥證候中的應(yīng)用尚瑩瑩等[9]調(diào)查200例糖尿病并胃輕癱綜合征患者的臨床癥狀,在聚類分析的基礎(chǔ)上進行主成分分析,獲得4類證候群,依據(jù)證候判定規(guī)則歸納為4型:脾虛濕熱、胃陰虧虛、脾虛氣滯、肝胃不和。鄭紅[10]通過維普數(shù)據(jù)庫檢索出30篇有關(guān)糖尿病性周圍神經(jīng)病變的文獻,通過頻數(shù)分析、聚類分析等研究該病的組方診治規(guī)律,結(jié)果發(fā)現(xiàn)使用頻次較高的藥物依次是黃芪、當(dāng)歸、川芎、丹參、地龍、赤芍等;而聚類后獲得的藥物可歸納為三大功效:益氣活血、通絡(luò)止痛、清熱利濕,據(jù)此可推斷該病的基本證候為氣虛血瘀、濕熱阻絡(luò)。鄭洪光等[11]應(yīng)用描述性統(tǒng)計、聚類分析等數(shù)據(jù)挖掘方法對130例糖尿病腎病的中醫(yī)證候特點及中醫(yī)證型進行分析,研究結(jié)果表明該病癥狀以乏力、尿濁、口渴、肢體水腫、食欲不振、面目浮腫、腰膝酸軟、潮熱等較為常見。經(jīng)聚類后歸納為4型:肝腎氣陰兩虛證、脾腎陽虛證、肝腎陰虛陽亢證、血瘀夾痰濕證。王穎輝等[12]利用因子分析及轉(zhuǎn)移概率分析研究301例糖尿病腎病患者的中醫(yī)證候演變規(guī)律,結(jié)果發(fā)現(xiàn)陽虛癥患者有向陽虛夾痰濕轉(zhuǎn)化的趨勢,而陰虛者有向氣陰兩虛及陽虛的轉(zhuǎn)化趨勢,而血瘀癥患者多相對穩(wěn)定。
2.3數(shù)據(jù)挖掘技術(shù)在糖尿病合并癥證候中的應(yīng)用倪青等[13]通過多中心的結(jié)構(gòu)化、規(guī)范化數(shù)據(jù)采集系統(tǒng)對1274例糖尿病合并冠心病住院患者中醫(yī)證候進行數(shù)據(jù)挖掘,運用描述性統(tǒng)計方法得出糖尿病合并冠心病患者的主要癥狀為口干、多飲、乏力、胸悶、多尿,間接推論出陰虛、氣虛、血瘀等為其基本病機,中醫(yī)證候研究結(jié)果發(fā)現(xiàn)該病以氣陰兩虛最多,其次為痰濕、瘀血等證,為中醫(yī)臨床辨治提供了一些思路。陳世波等[14]將265例糖尿病合并代謝綜合征的病歷以發(fā)病病程分為3組,運用無尺度網(wǎng)絡(luò)分析、描述性統(tǒng)計等數(shù)據(jù)挖掘方法對該病的癥候特征、分布及演變趨勢進行研究發(fā)現(xiàn),病程<5年的患者常見癥狀為乏力、口干、視物模糊、口渴多飲、舌黯紅、苔黃等,證候以陰虛、熱盛為主要特征;病程5~10年者常見癥狀為視物模糊、口渴多飲、乏力、口干、舌黯紅、苔膩等,證候以氣陰兩虛為主要特征;病程>10年者常見癥狀為口干、口渴、多飲、乏力、胸悶、肢體麻木、視物模糊、小便頻、舌黯紅、苔薄等,證候以氣虛、血瘀為主要特征。據(jù)此得出氣虛、陰虛是該病的基本病機,且貫穿病程始終。王佳笑等[15]收集了1287例2型糖尿病合并高血壓病的臨床病案資料,通過數(shù)據(jù)挖掘技術(shù)中的因子分析研究該病的中醫(yī)證候要素,結(jié)果得到氣虛、陰虛、陽虛、血瘀、陽亢、濕痰、熱盛7個證候,與中醫(yī)理論及臨床實際基本符合。成杰輝等[16]采集309例糖尿病并急性腦梗死的臨床資料,應(yīng)用聚類分析等數(shù)據(jù)挖掘方法將該病中醫(yī)證候聚為四種證型:氣虛血瘀證、風(fēng)痰上擾證、痰熱腑實證、痰瘀阻絡(luò)證,經(jīng)統(tǒng)計學(xué)驗證與專家辨證結(jié)果具有較好的一致性。
3數(shù)據(jù)挖掘技術(shù)在糖尿病中藥用藥規(guī)律研究中的應(yīng)用
3.1基于文獻的用藥規(guī)律數(shù)據(jù)挖掘方朝暉等[17]為研究中醫(yī)治療糖尿病用藥規(guī)律,檢索了中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫、中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫等,搜集整理了112個中藥處方,運用頻數(shù)分析、關(guān)聯(lián)規(guī)則分析等統(tǒng)計方法進行數(shù)據(jù)挖掘,結(jié)果發(fā)現(xiàn)糖尿病常用的中藥依次為生地黃、當(dāng)歸、黃芪、熟地黃、葛根、茯苓、丹參、麥冬、丹皮、川芎等,常用藥對配伍為生地黃、葛根,黃芪、生地黃,熟地黃、山藥與山茱萸,生地、葛根與當(dāng)歸等。文玉敏等[18]為研究早期糖尿病腎病中醫(yī)用藥規(guī)律,檢索了中國知網(wǎng)等5個文獻數(shù)據(jù)庫并整理出符合條件的134篇(方劑137首)進行數(shù)據(jù)挖掘,運用頻數(shù)分析、關(guān)聯(lián)規(guī)則等方法得出該病的核心藥味是生黃芪、生地黃、丹參,間接推論出早期糖尿病腎病的基本病機為氣陰兩虛、血瘀;此外還發(fā)現(xiàn)常見的藥對有黃芪、山藥,黃芪、水蛭,黃芪、當(dāng)歸,川芎、茯苓等。高爾寧等[19]在中國期刊全文數(shù)據(jù)庫篩選出關(guān)于2型糖尿病胰島素抵抗的3947篇文獻(共計115首方劑),運用改進關(guān)聯(lián)度系數(shù)法、復(fù)雜系統(tǒng)熵聚類法等對中藥數(shù)據(jù)進行研究,結(jié)果發(fā)現(xiàn)常用藥物為黃芪、地黃、丹參、黃連、葛根、山藥等;常用藥對有柴胡、白術(shù),甘草、細辛,白芍、豬苓,白芍、烏梅,黃連、桂枝等,常見的兩味核心組合有丹參、黃芪,地黃、黃芪,山藥、丹參等,3味核心組合有丹參、黃芪、黃連及地黃、黃芪、黃連等。郭東臣等[20]通過檢索《新編國家中成藥》、《中國藥典》、《國家基本藥物》等文獻,運用頻數(shù)分析、關(guān)聯(lián)規(guī)則等統(tǒng)計方法對其中的中成藥藥物組方及配伍規(guī)律等進行調(diào)查分析,結(jié)果得出使用頻次較高的藥物依次是:黃芪、天花粉、地黃、人參、山藥等,而經(jīng)常出現(xiàn)的藥對有生地、天花粉,黃芪、山藥,黃芪、人參,天花粉、知母,山茱萸、山藥等。陳莞蘇等[21]搜集整理了190首國家級名老中醫(yī)的糖尿病驗方,首先依據(jù)病性將中藥功效統(tǒng)一規(guī)范,然后運用因子分析對驗方中的藥物功效進行數(shù)據(jù)挖掘,經(jīng)分析得到9個因子,其中滋陰的因子占50%,提示陰液不足是糖尿病的重要病機,其他各因子中扶正與祛邪藥物共存,提示糖尿病病機復(fù)雜,滋補的同時不忘祛邪,如氣血滋陰生津,利水祛濕同時補氣益精等。唐文彥等[22]收集古今方415首進行數(shù)據(jù)挖掘,通過頻數(shù)分析發(fā)現(xiàn)古今方中常用的藥物依次是麥門冬、栝蔞根、黃芪、黃連、人參、甘草、生地等,其中古方常用的藥物有麥門冬、黃連、甘草、栝蔞根、人參、茯苓等,今方常用的藥物是黃芪、山藥、生地、丹參、栝蔞根、山茱萸等,從古今藥物對比可知,古方以滋陰清熱藥物較多,而今方以益氣養(yǎng)陰藥物為多。姚美村等[23]從文獻中搜集整理了106首治療消渴病的復(fù)方,運用關(guān)聯(lián)規(guī)則研究其中的藥對配伍規(guī)律,以單味藥分析發(fā)現(xiàn)上消中以麥冬、知母為主,中消中以黃連、知母為主,下消中以茯苓、熟地和山茱萸為主;以兩味藥組合分析發(fā)現(xiàn),上消常見藥對有知母與石膏、知母與麥冬、知母與生地等;中消常見藥對有人參與甘草、知母與人參等;下消常見的藥對有茯苓與麥冬、熟地與黃芪等。
3.2基于臨床的用藥規(guī)律數(shù)據(jù)挖掘蔡莉[24]搜集整理了某院名老中醫(yī)的門診醫(yī)案,對其中的2型糖尿病病歷進行數(shù)據(jù)挖掘,通過數(shù)據(jù)預(yù)處理,運用描述性分析、關(guān)聯(lián)規(guī)則中的Apriori算法等得出老中醫(yī)常用的藥物為生地黃、黃芪、蒼術(shù)、麥冬、茯苓,常用的藥對為生地黃、山茱萸,生地黃、蒼術(shù),黃芪、蒼術(shù)。倪青等[25]運用無尺度網(wǎng)絡(luò)分析等數(shù)據(jù)挖掘方法對2型糖尿病合并代謝綜合征患者的中醫(yī)用藥規(guī)律、藥證關(guān)系進行客觀化研究,結(jié)果發(fā)現(xiàn)治療該病以益氣養(yǎng)陰藥為主,代表藥物是炙黃芪、太子參,與其相關(guān)聯(lián)的藥物有生地黃、五味子、川芎、當(dāng)歸等,以藥推證可知,糖尿病合并代謝綜合征的基本證候是氣虛、陰虛;為進一步研究藥證關(guān)系,作者對不同病程的藥物關(guān)系分別進行了無尺度網(wǎng)絡(luò)分析,病程在5年以內(nèi)者常用藥物是生地黃、麥冬、當(dāng)歸、赤芍,基本證候是陰虛、熱盛、津傷、血瘀;病程5~10 年者常用藥物以麥冬、丹參、知母、玄參、炙黃芪最為多見,基本證候是氣虛、陰虛、熱盛、津傷、血瘀;病程10年以上者常見藥物是炙黃芪、當(dāng)歸、赤芍,基本證候是氣虛、血瘀。周強等[26]基于SAS 9.2統(tǒng)計軟件對仝小林教授治療糖尿病腎病的門診病歷進行數(shù)據(jù)挖掘,通過藥物頻次分析獲悉,仝教授在糖尿病腎?、笃诨颊叩闹委熤凶畛S玫乃幬镆来问屈S連、水蛭粉、大黃、黃芩、干姜、葛根、紅曲等;Ⅳ期患者常用的藥物是大黃、水蛭粉、黃連、炙黃芪、生姜、黃芩、紅曲等;Ⅴ期患者常用藥物為大黃、炙黃芪、水蛭粉、制附片、丹參、生姜、茯苓等。李蘭濤等[27]收集了經(jīng)魏子孝教授診治的88例糖尿病性周圍神經(jīng)病變患者的病案資料,運用關(guān)聯(lián)規(guī)則分析發(fā)現(xiàn)所有醫(yī)案的核心處方是紅花、桃仁、地龍、雞血藤、生黃芪、陳皮;同時利用互信息統(tǒng)計方法挖掘出魏教授常用的藥對有杜仲、桑寄生,桃仁、紅花,地龍、桃仁,紅花、當(dāng)歸,生黃芪、紅花,生黃芪、當(dāng)歸,紅花、赤芍等。另外魏教授對治療2型糖尿病合并冠心病也頗有心得,王泉蓉等[28]運用關(guān)聯(lián)規(guī)則分析對其用藥配伍規(guī)律進行數(shù)據(jù)挖掘,總結(jié)出以下藥對:川芎、丹參,白芍、川芎,柴胡、枳殼,柴胡、丹參,丹參、枳殼,川芎、郁金,川芎、紅花等;對魏教授藥量配伍關(guān)系進行挖掘,得出蒼術(shù)、白術(shù)與郁金、柴胡等量配伍,且常用量為12 g,丹參、柴胡與丹參、郁金配伍量關(guān)系常為20 g︰12 g等寶貴經(jīng)驗。龔燕冰等[29]從2501例2型糖尿病例中選取3首常用復(fù)方,運用關(guān)聯(lián)規(guī)則分析方、癥、證三者的關(guān)系,結(jié)果發(fā)現(xiàn)服用生脈飲的患者中口渴欲飲、口干口渴、倦怠乏力關(guān)聯(lián)性高,且經(jīng)常同時出現(xiàn),它們體現(xiàn)了氣陰兩虛的表現(xiàn),與生脈飲的主治功能如出一轍;而六味地黃湯和四君子湯經(jīng)數(shù)據(jù)分析也論證了其方、癥、證的高度一致性。臧東靜等[30]收集了1009例老年糖尿病患者的臨床資料并按不同年齡段將其分為3組,用關(guān)聯(lián)規(guī)則算法分別對這3組中藥配伍規(guī)律進行研究,通過數(shù)據(jù)挖掘發(fā)現(xiàn)60~65歲年齡組,中藥以益氣、養(yǎng)陰、清熱、活血為主;66~70歲年齡組,所用中藥以益氣養(yǎng)陰、活血化瘀、健脾祛濕為主;大于70歲年齡組除了予益氣養(yǎng)陰、活血化瘀中藥治療之外,溫陽化濕也是一項重要的治法。
4總結(jié)與展望
目前糖尿病中醫(yī)證候歸納分析常用的數(shù)據(jù)挖掘方法有聚類分析、因子分析、主成分分析等,而其分布情況,多用描述性分析、無尺度網(wǎng)絡(luò)分析等方法。對方藥的分析常用的是頻數(shù)分析、關(guān)聯(lián)規(guī)則分析等。在分析藥藥關(guān)系、藥證關(guān)系、方證關(guān)系、證癥關(guān)系等中醫(yī)多維關(guān)系中,關(guān)聯(lián)規(guī)則應(yīng)用最為廣泛。從分析糖尿病中醫(yī)證候結(jié)果看,大多仍以陰虛燥熱、氣陰兩虛、陰陽兩虛為主,且氣陰兩虛證較為常見,在糖尿病并發(fā)癥、合發(fā)癥證候分析中,氣虛、陰虛仍是其共同的病機。在方藥分析中總結(jié)出常用藥物有黃芪、生地、太子參、麥冬、丹參等,常用藥對有黃芪、山藥,黃芪、當(dāng)歸,山藥、山茱萸等,絕大部分經(jīng)統(tǒng)計方法與專家意見驗證具有較好的一致性。這些均提示采用數(shù)據(jù)挖掘技術(shù)在一定程度上可以客觀反映中醫(yī)診療規(guī)律,對于中醫(yī)的客觀化辨證以及提升中醫(yī)的標(biāo)準(zhǔn)化、現(xiàn)代化等具有現(xiàn)實意義。
目前數(shù)據(jù)挖掘技術(shù)在中醫(yī)藥中的應(yīng)用尚處于起步階段,仍存在一些亟待解決的問題:①數(shù)據(jù)不規(guī)范,如中醫(yī)證候、證型、中藥名等缺乏統(tǒng)一,存在描述重復(fù)、歧義、不確定性等問題;②數(shù)據(jù)挖掘方法缺乏統(tǒng)一應(yīng)用標(biāo)準(zhǔn),同一類型數(shù)據(jù)存在多種挖掘方法,影響數(shù)據(jù)挖掘結(jié)果的可靠性及可衡量性;③數(shù)據(jù)挖掘的結(jié)果具有一定的局限性,需與客觀實際相結(jié)合。針對這些問題,在中醫(yī)數(shù)據(jù)挖掘研究中,設(shè)計應(yīng)力求嚴(yán)謹(jǐn),考慮全面,在數(shù)據(jù)預(yù)處理時務(wù)必按中醫(yī)相關(guān)標(biāo)準(zhǔn)名詞統(tǒng)一化;在數(shù)據(jù)挖掘方法的選擇上,應(yīng)根據(jù)研究的對象特征選擇最適合、最有效的方法,選擇困難時,可綜合多種方法聯(lián)合應(yīng)用;數(shù)據(jù)挖掘的結(jié)果需與中醫(yī)理論、臨床實際及名家經(jīng)驗相結(jié)合,反復(fù)論證其可靠性及合理性。雖然目前數(shù)據(jù)挖掘技術(shù)在中醫(yī)研究中還存在較多問題,但隨著理論和方法的不斷改進,它必將具有廣闊的發(fā)展前景,也必將更加有力地推動中醫(yī)藥現(xiàn)代化、信息化、規(guī)范化的進程。
[參考文獻]
[1]Jiawei Han, Micheline Kamber, Jian Pei.數(shù)據(jù)挖掘:概念與技術(shù)[M].北京:機械工業(yè)出版社,2012:1-6.
[2]李建生,胡金亮,王永炎,等.基于2型糖尿病數(shù)據(jù)挖掘的中醫(yī)證候診斷標(biāo)準(zhǔn)模型建立研究[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2008,14(5):367-370.
[3]姜兆順,倪青,林蘭,等.基于結(jié)構(gòu)化糖尿病臨床信息采集系統(tǒng)對2型糖尿病癥狀的研究[J].中國中醫(yī)藥信息雜志,2007,14(10):19-21.
[4]林蘭,倪青,龐健麗,等.基于數(shù)據(jù)挖掘技術(shù)的2型糖尿病辨證規(guī)范前瞻性研究[J].中國中醫(yī)藥信息雜志,2011,18(7):9-12.
[5]方朝暉,羅云,李中南,等.基于數(shù)據(jù)挖掘技術(shù)的2型糖尿病中醫(yī)證候規(guī)律研究[J].中醫(yī)藥臨床雜志,2013,25(8):663-665.
[6]龔燕冰,羅增剛,高思華,等.運用因子分析方法探索2型糖尿病證候要素及其靶位特征[J].中醫(yī)雜志,2011,52(13):1100-1102.
[7]于彥,張敬鋒.2型糖尿病的中醫(yī)證候規(guī)律研究[J].中國中醫(yī)基礎(chǔ)醫(yī)學(xué)雜志,2010,16(1):13-23.
[8]秦玉花,孫玉文,陳方超,等.2型糖尿病腎虛證量表調(diào)查及因子分析[J].中華中醫(yī)藥雜志,2013,28(11):3384-3386.
[9]尚瑩瑩,黃天生,李良,等.聚類分析和主成分分析在糖尿病胃輕癱中醫(yī)證型研究中的應(yīng)用[J].遼寧中醫(yī)雜志,2014,41(8):1567-1569.
[10]鄭紅.基于多元統(tǒng)計分析糖尿病性周圍神經(jīng)病變的組方證治規(guī)律[J].遼寧中醫(yī)雜志,2010,37(1):36-37.
[11]鄭洪光,李秀蘭,石燕萍,等.糖尿病腎病130例中醫(yī)證型分類研究[J].環(huán)球中醫(yī)藥,2012,5(10):783-784.
[12]王穎輝,趙進喜,王世東,等.基于因子分析及轉(zhuǎn)移概率分析的糖尿病腎病證候演變規(guī)律研究[J].中醫(yī)雜志,2014,55(15):1317-1322.
[13]倪青,于麗紅,陳世波,等.1274例2型糖尿病合并冠心病證治規(guī)律數(shù)據(jù)挖掘[J].中國中醫(yī)藥信息雜志,2010,17(9):99-102.
[14]陳世波,倪青,魏子孝,等.基于個體化診療平臺2型糖尿病合并代謝綜合征證候規(guī)律研究[J].中國中醫(yī)藥信息雜志,2007,14(11):18-21.
[15]王佳笑,趙時鵬,倪青,等.運用因子分析法探索2型糖尿病合并高血壓病中醫(yī)證候要素分布特點[J].陜西中醫(yī),2015,36(2):155-157.
[16]成杰輝,劉志龍,陳昕,等.糖尿病并發(fā)急性腦梗死的癥候研究[J].山西中醫(yī),2010,26(12):44-46.
[17]方朝暉,羅云,陸瑞敏,等.基于數(shù)據(jù)挖掘的中醫(yī)藥治療糖尿病用藥規(guī)律探析[J].中醫(yī)藥臨床雜志,2013,25(8):670-671.
[18]文玉敏,董興魯,嚴(yán)美花,等.早期糖尿病腎病經(jīng)驗方用藥規(guī)律[J].吉林中醫(yī)藥,2015,35(2):130-132.
[19]高爾寧,楊鴻,劉釗,等.治療二型糖尿病胰島素抵抗中藥復(fù)方用藥規(guī)律分析[J].環(huán)球中醫(yī)藥,2014,7(9):731-734.
[20]郭東臣,張慧敏,梁淑新,等.中成藥治2型糖尿病證治-方藥的調(diào)查分析[J].中成藥,2015,37(2):442-456.
[21]陳莞蘇,朱英,吳玉江,等.基于名老中醫(yī)驗方數(shù)據(jù)探討2型糖尿病病機特點[J].遼寧中醫(yī)雜志,2013,40(9):1818-1820.
[22]唐文彥,賈春華,趙曉紅.古今治療糖尿病用藥規(guī)律的聚類分析研究[J].承德醫(yī)學(xué)院學(xué)報,2000,17(1):135-138.
[23]姚美村,艾路,袁月梅,等.消渴病復(fù)方配伍規(guī)律的關(guān)聯(lián)規(guī)則分析[J].北京中醫(yī)藥大學(xué)學(xué)報,2002,25(6):48-50.
[24]蔡莉.基于名老中醫(yī)Ⅱ型糖尿病醫(yī)案的數(shù)據(jù)挖掘研究[J].佳木斯教育學(xué)院學(xué)報,2013(11):447-448.
[25]倪青,陳世波,周雪忠,等.基于無尺度網(wǎng)絡(luò)分析的2型糖尿病代謝綜合征方-藥-證關(guān)系[J].中國中醫(yī)藥信息雜志,2006,13(11):19-22.
[26]周強,仝小林,趙錫艷,等.仝小林教授治療糖尿病腎病門診病歷數(shù)據(jù)挖掘[J].中醫(yī)藥信息,2013,30(1):37-41.
[27]李蘭濤,張北華,高蕊,等.魏子孝教授糖尿病周圍神經(jīng)病變醫(yī)案數(shù)據(jù)挖掘分析[J].中國中西醫(yī)結(jié)合雜志,2010,30(9):986-988.
[28]王泉蓉,張廣德,邵鑫,等.魏子孝教授治療2型糖尿病合并冠心病醫(yī)案數(shù)據(jù)挖掘分析[J].中國中醫(yī)藥現(xiàn)代遠程教育,2014,12(6):20-22.
[29]龔燕冰,羅增剛,高思華,等.基于關(guān)聯(lián)規(guī)則的2型糖尿病方證關(guān)系的橫斷面研究[J].中醫(yī)雜志,2010,51(1):64-67.
[30]臧東靜,王佳笑,劉瑜,等.基于關(guān)聯(lián)規(guī)則的治療老年糖尿病中藥配伍初探[J].北京中醫(yī)藥,2014,33(11):846-848.
(收稿時間:2015-07-06修回時間:2015-07-20)
Data Mining Technique in Application of Syndromes and Prescriptions of Traditional Chinese Medicine for Diabetes
GUO Yan-zhou, MA Jian-wei
(Department of Traditional Chinese Medicine, General Hospital of Air Force, Beijing 100142, China)
[Abstract]Data Mining is a process of identifying the interesting mode and knowledge from mass data. It relates to many subjects and includes many mining methods such as clustering analysis, association rules, scale-free network analysis and etc. The article, which divided into four parts, reviewed applications of data mining technique in syndromes and prescriptions of traditional Chinese medicine (TCM) for diabetes in recent years. The first part was mainly about the possibility of applications on data mining technique in syndromes and prescriptions of TCM for diabetes. The second part was summarized the conditions that clinicians used data mining analyzed TCM syndromes from diabetes, diabetes complications and combination diseases of diabetes. The third part was summarized the application situation of data mining technique from literature and clinic. According to the results that clinicians had obtained by data mining, the last part was summarized that diabetes syndromes mainly were dryness-heat and Yin asthenia, deficiency of both Qi and Yin, and asthenia of both Yin and Yang, and the deficiency of both QI and YIN was the most one. Mongolian Milkvetch Root, Rehmannia Dride Rhizome, Radix Pseudostellariae, Ophiopogonis Japonicus and Salvia Miltiorrhiza Bunge were the most frequently used drugs in treatment of diabetes, and the common use of pair drugs were Mongolian Milkvetch Root and Dioscorea Batatas, Mongolian Milkvetch Root and Angelica, Dioscorea Batatas and Cornus Officinalis and etc. The article also analyzed the shortcomings, effect and significance of data mining technique in TCM research.
[Key words]Data mining; Diabetes mellitus; Symptom complex; Review
[文獻標(biāo)志碼][中國圖書資料分類號]R587.1;R255.4A
[文章編號]2095-140X(2015)09-0034-05
[通訊作者]馬建偉,E-mail:mjw8166@163.com
[基金項目]首都醫(yī)學(xué)發(fā)展基金(SF-2009-I-13);首都臨床特色應(yīng)用研究課題(Z121107001012011)
[作者單位]100036 北京,空軍總醫(yī)院中醫(yī)科