国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)據(jù)挖掘在中醫(yī)文獻研究中的應用

2017-07-12 15:12:50張勝男車立娟李明
醫(yī)學信息 2017年13期
關鍵詞:文獻研究中醫(yī)數(shù)據(jù)挖掘

張勝男+車立娟+李明

摘要:大數(shù)據(jù)時代,數(shù)據(jù)挖掘作為有效地信息處理技術(shù),可以在中醫(yī)文獻中提煉出潛在的、有用的信息。數(shù)據(jù)挖掘廣泛應用于特定疾病、方劑、醫(yī)案、名老專家臨床經(jīng)驗與針灸的文獻研究中。本文簡要介紹了關聯(lián)規(guī)則分析、聚類分析、決策樹算法和神經(jīng)網(wǎng)絡數(shù)據(jù)挖掘方法,以及在中醫(yī)文獻研究中的應用情況。

關鍵詞:中醫(yī);數(shù)據(jù)挖掘;文獻研究

中圖分類號:R2-03 文獻標識碼:A 文章編號:1006-1959(2017)13-0022-03

Abstract:The era of big data,data mining as an effective information processing technology,in the literature of traditional Chinese medicine extract potential and useful information.Data mining is widely applied to specific diseases,prescriptions,medical records,literature research and clinical experience of senior experts of acupuncture.This paper briefly introduces the association rules analysis,cluster analysis,decision making tree algorithm and neural network data mining method,and application in TCM literature research.

Key words:Traditional Chinese medicine;Data mining;Literature research

“大數(shù)據(jù)”已成為互聯(lián)網(wǎng)信息技術(shù)行業(yè)的流行詞匯。大數(shù)據(jù)時代,人們不再追求精準和因果關系,而是更為關注相關關系[1]。中醫(yī)學也迎來了大數(shù)據(jù)時代,從海量中醫(yī)數(shù)據(jù)中提取有用的信息也變得更加困難,數(shù)據(jù)挖掘作為有效地信息處理技術(shù),可以幫助中醫(yī)研究者挖掘海量數(shù)據(jù)中有用的信息。數(shù)據(jù)挖掘(Data Mining,DM)就是從大量的、不完全的、有噪聲的、模糊的、隨機的數(shù)據(jù)中,提取隱含在其中、不為人知但又是潛在有用的信息和知識的過程[2],數(shù)據(jù)挖掘也被稱為數(shù)據(jù)庫中知識發(fā)現(xiàn),即從一個大的數(shù)據(jù)堆中找出有用的知識,從數(shù)據(jù)中挖掘知識[3]。這是一個從大量不完整的數(shù)據(jù)中發(fā)現(xiàn)、抽取有意義數(shù)據(jù)的過程。數(shù)據(jù)庫知識發(fā)現(xiàn)技術(shù)最早是在1989年的美國人工智能協(xié)會第11屆年會上提出的[4],而后漸漸成為人們在海量數(shù)據(jù)中尋找有效知識的一個必備方法。在中醫(yī)文獻研究中,常用的數(shù)據(jù)挖掘方法有關聯(lián)規(guī)則分析、聚類分析、決策樹算法和神經(jīng)網(wǎng)絡,尤其是關聯(lián)規(guī)則分析和聚類分析最為常用。也有很多中醫(yī)文獻研究需要綜合應用多種數(shù)據(jù)挖掘方法。

1 關聯(lián)規(guī)則分析

關聯(lián)規(guī)則分析又稱為購物籃分析,目的是在一定的支持度和置信度限制下尋找事務之間的內(nèi)在的聯(lián)系。它是由Agrawal等人于1993年提出來的。關聯(lián)規(guī)則里的重要概念[5]:項集、支持度、頻繁項集、置信度。支持度是度量一個項集出現(xiàn)的頻率,例如項集{A,B}的支持度是由同時包含A和B的事務總數(shù)組成的。頻繁項集是在數(shù)據(jù)集中出現(xiàn)頻率高的那些項集,利用這些頻繁集創(chuàng)建描述關聯(lián)關系的規(guī)則[6],這是關聯(lián)規(guī)則的核心部分。頻率的閾值是用支持度來定義的。概率(Probability)是關聯(lián)規(guī)則的屬性,規(guī)則A=>B的概率是使用{A}的支持度除項集{A,B}的支持度計算的,該概率在數(shù)據(jù)挖掘研究領域中也稱置信度。關聯(lián)規(guī)則分析是數(shù)據(jù)挖掘領域中最活躍和成熟的方法之一,在中醫(yī)文獻研究中,關聯(lián)規(guī)則分析常用在組方用藥規(guī)律研究、病機的研究、針灸用穴規(guī)律的研究中,值得關注的是,關聯(lián)規(guī)則分析在方證研究領域中也有所發(fā)展。關聯(lián)規(guī)則在用藥規(guī)律研究中旨在尋找有用的藥對、藥組、藥癥,甚至可以發(fā)現(xiàn)新方;關聯(lián)規(guī)則在癥候病機的研究中著重挖掘病機與病機之間、癥候與病機之間的關聯(lián);關聯(lián)規(guī)則在針灸用穴研究中,著重發(fā)現(xiàn)特定疾病選穴與經(jīng)絡之間的聯(lián)系;關聯(lián)規(guī)則在方證研究中,旨在尋找經(jīng)方里的規(guī)律,幫助臨床更好的應用經(jīng)方。

1.1組方用藥規(guī)律的研究

甘永康等[7]應用數(shù)據(jù)挖掘方法對葉天士《臨證指南醫(yī)案》治療泄瀉方劑的組方規(guī)律進行分析,得到葉天士治療泄瀉常用的藥物、核心組合及發(fā)現(xiàn)新方,這為臨床選方用藥提供了新思路。

有些學者采用古今文獻對比的思路研究了某病用藥規(guī)律,沈劼等[8]運用關聯(lián)規(guī)則分析并對比了古今醫(yī)家治療卵巢早衰的用藥規(guī)律。挖掘出古代中醫(yī)治療卵巢早衰的核心藥物是當歸、川芎、白芍、茯苓、熟地黃等,為八珍湯基礎方加減。得到關聯(lián)度比較好的藥對為當歸-川芎、當歸-白芍等。現(xiàn)代中醫(yī)治療卵巢早衰的核心藥物是當歸、熟地黃、菟絲子、枸杞子、山藥等。得到關聯(lián)度較好的藥對為當歸-熟地黃、熟地黃-菟絲子等;古代中醫(yī)和現(xiàn)代中醫(yī)治療卵巢早衰共同選擇的核心藥物為當歸、熟地黃、白芍、茯苓,核心藥對為當歸-熟地黃。在分析古今醫(yī)家治療卵巢早衰時,得到支持度最高的藥物為當歸,可以認為古今醫(yī)家均視陰血虧虛為本病的一個病理基礎,但用藥有一定區(qū)別,古代方用藥立足于補益氣血,現(xiàn)代方用藥以滋補肝腎陰血為主。

1.2 癥候病機的研究

簡維雄等[9]在基于現(xiàn)代文獻研究高血壓的證型病機特征時,運用了關聯(lián)規(guī)則方法,得出高血壓病機以肝腎陰虛為本,痰濁,瘀血為標,風陽內(nèi)動為像。瘀血與痰濁、陽亢、肝陽化風、肝腎陰虛、陰虛陽亢、肝火上炎等病機關聯(lián);痰濁與瘀血、肝陽化風、肝火上炎、肝腎陰虛、陽亢、陰虛陽亢、氣虛、陰虛等病機關聯(lián);肝腎陰虛證與病機瘀血傾向關聯(lián);肝腎陰虛證和肝陽上亢證時與病機痰濁、肝陽化風、瘀血傾向關聯(lián);血瘀證與瘀血傾向關聯(lián)。

1.3針灸用穴規(guī)律研究

章薇等[10]運用關聯(lián)規(guī)則探析古代針灸治療尿失禁的用穴規(guī)律,得出治療尿失禁多選陰經(jīng),重視手足三陰經(jīng)腧穴偏重特定穴,陰經(jīng)又以足厥陰肝經(jīng)取穴最多,五輸穴與其他特定穴配伍最為常用,原穴配伍五輸穴支持度最高;而且發(fā)現(xiàn)古代醫(yī)家治療尿失禁不取膀胱經(jīng)募穴中極。這說明數(shù)據(jù)挖掘技術(shù)也可以用來研究針灸的用穴規(guī)律。

1.4方證研究

在方證研究領域中,徐建虎等[11]運用數(shù)據(jù)挖掘技術(shù)分析古今醫(yī)案專著、臨床經(jīng)驗專著及期刊雜志中的小柴胡湯醫(yī)案,發(fā)現(xiàn)小柴胡湯證臨床病證規(guī)律。子午二個時辰定時發(fā)作的病變常采用小柴胡湯治療;少陽提綱證(口苦、咽干、目眩) 和小柴胡湯四大主癥(往來寒熱、胸脅苦滿、嘿(mo)嘿不欲飲食、心煩喜嘔) 具有診斷小柴胡湯證的指標意義;“但見一證”指往來寒熱、胸脅苦滿、心煩喜嘔、嘿嘿不欲飲食四者之一;小柴胡湯證主脈是弦脈。

2 聚類分析

聚類是指將物理或抽象對象集合構(gòu)成為由類似的對象組成的多個類的過程[12],聚類分析是將數(shù)據(jù)進行類似對象組的劃分,從而實現(xiàn)類的分析過程。在人類的行為中是一項非常重要的分析方法,也是一種常見的數(shù)據(jù)挖掘方法。聚類分析可分為R型聚類和Q型聚類。R型聚類可以把有線性關系的變量歸到一類,然后讓研究者自己去根據(jù)變量的情況判斷選擇代表性指標。而Q型聚類主要根據(jù)對象相似度,把整體分成若干類別,研究者在不同類別中尋找共同規(guī)律。無論是R型還是Q型聚類分析,都僅僅歸類而不呈現(xiàn)結(jié)論,需要完成下一步分析,屬于探索性分析[4]。多用于疾病的中醫(yī)證候分類,為中醫(yī)臨床辨證論治依據(jù)提供分型的方法學[13],也應用于方劑中的用藥規(guī)律、用藥方案篩選等相關研究中。

劉嘉輝等[14]探討名老中醫(yī)治療原發(fā)性肝癌的用藥規(guī)律,搜集首屆國醫(yī)大師及首批國家級名老中醫(yī)的醫(yī)案提取方藥信息,應用聚類分析和關聯(lián)規(guī)則分析進行數(shù)據(jù)挖掘。聚類分析顯示名老中醫(yī)治療原發(fā)性肝癌的藥物可歸為5類:補益氣血類、理氣活血類、解毒軟堅類、利水滲濕類和健脾消食類。關聯(lián)規(guī)則分析顯示:關聯(lián)性強的主要為益氣健脾藥和理氣藥、活血藥、清熱解毒藥、消食藥的配伍組合。名老中醫(yī)治療原發(fā)性肝癌謹守“正虛邪實”的病機本質(zhì),在扶正健脾基礎上辨證運用清熱解毒、疏肝理氣、活血散結(jié)等治法。陳欣然[15]利用聚類分析和關聯(lián)規(guī)則對近15年的反流性食管炎中醫(yī)臨床期刊文獻進行了用藥規(guī)律和證候研究。藥物聚類組得出7種證型,與《實用中醫(yī)消化病學》中該病的5種分類證型比較,少1種脾虛胃熱型,多出4種證型脾胃濕熱證、氣郁痰阻證、痰熱互結(jié)證和脾虛痰濕證,證明臨床用藥的趨向已經(jīng)改變。在藥物的研究中發(fā)現(xiàn)大部分排名靠前的藥對中藥物功能相近,如穿山甲、桃仁,穿山甲、紅花均可活血化瘀、通絡止痛;還有沿用經(jīng)典用藥配伍,如石青、寒水石出自《素問病機氣宜保命集》中的雙玉散等等。對于藥癥研究,大便艱難與玉竹相關性最高,白花蛇舌草、太子參、丁香、大棗、檳榔、黃芪、竹茹均與燒心相關聯(lián),說明主癥燒心的用藥多選擇扶正祛邪、清熱解毒、軟堅散結(jié)的藥物。

3 決策樹算法

決策樹算法是利用信息論中的信息增益,以尋找數(shù)據(jù)庫中具有最大信息量的屬性字段,建立一個決策樹的節(jié)點,而后根據(jù)字段不同取之建立分支[4]。這種方法以樹狀結(jié)構(gòu)表示模型,容易理解。國際上最早的最有影響的決策樹算法是ID3算法。決策樹算法在基于臨床病例數(shù)據(jù)探索辨證規(guī)則的研究中使用較多,可以是研究專家的辨證規(guī)律,也可以是臨床專病的辨證規(guī)則研究。決策樹算法可用于中醫(yī)臨床疾病辨證的輔助診斷。

余學杰等[16]使用決策樹算法將中醫(yī)專家的臨床診斷數(shù)據(jù)逐步分類以獲得專家的辯證規(guī)律,研究者成功獲取了多種證名與證候的規(guī)則,這說明利用決策樹算法研究專家的辯證規(guī)律是可行的。黃嘉韻等[17]收集臨床鼻鼽病例資料,建立了鼻鼽辯證分型決策樹模型,并且獲得了較高的準確率。通過決策樹算法探索專病辨證規(guī)律具有可行性,在中醫(yī)臨床辨證過程中將會起到輔助診斷的作用。

4 神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)路又稱為人工神經(jīng)網(wǎng)絡,是模仿人腦神經(jīng)元而產(chǎn)生的一種仿生物技術(shù)類數(shù)據(jù)挖掘方法[4]。神經(jīng)網(wǎng)絡的目的在于提取規(guī)則,在證候分類、證候診斷規(guī)則以及預測研究中經(jīng)常使用,神經(jīng)網(wǎng)絡對已知證候與癥狀的關系或者對于建立專家系統(tǒng)都是有益的,但對某一個疾病的證候規(guī)律研究往往有局限性。有學者將神經(jīng)網(wǎng)絡運用在診斷學中四診的研究,例如張康等[18]通過神經(jīng)網(wǎng)絡對舌圖像進行胖舌,瘦舌和正常舌的自動歸類。

5 總結(jié)與展望

數(shù)據(jù)挖掘技術(shù)在中醫(yī)文獻研究中已經(jīng)得到廣泛應用,在某一項研究中可以使用多種挖掘技術(shù),這些挖掘技術(shù)不僅相互交叉又相互補充。其中關聯(lián)規(guī)則在中醫(yī)文獻研究中使用較多,也趨漸成熟。聚類分析在中醫(yī)文獻研究中的使用頻率也慢慢增多,然而在數(shù)據(jù)挖掘軟件中,聚類分析呈現(xiàn)出的結(jié)果僅僅是歸類而無結(jié)論,這就需要研究者深入探索再分析。在數(shù)據(jù)預處理方面,數(shù)據(jù)首先要規(guī)范化才能進行數(shù)據(jù)挖掘,其中癥狀的標準化一直是一個難點,需要我們研究人員深入探索,在癥狀標準化方面作進一步的研究。數(shù)據(jù)挖掘已經(jīng)在中醫(yī)文獻研究領域中有很大的嘗試,但有些數(shù)據(jù)量不夠大,隨著時代的進步,數(shù)據(jù)挖掘在中醫(yī)文獻研究領域中有更深的探索。

參考文獻:

[1]張華敏,王永炎.高概念大數(shù)據(jù)時代中醫(yī)理論研究的機遇[J].中國中醫(yī)基礎醫(yī)學志,2015,21(1):4-6.

[2]劉興方,韓學杰.數(shù)據(jù)挖掘技術(shù)在醫(yī)案研究中的應用與討論[J].中國實驗方劑學志,2014,20(9):247-250.

[3]JiaweiHan,MichelineKamber,JianPei,等.數(shù)據(jù)挖掘:概念與技術(shù)[M].機械工業(yè)出版社,2012.

[4]郝峰.消化性潰瘍近15年中醫(yī)文獻研究[D].北京中醫(yī)藥大學,2012.

[5]JamieMacLennan,ZhaohuiTang,BogdanCrivat,等.數(shù)據(jù)挖掘原理與應用(第2版):SQL Server 2008數(shù)據(jù)庫[M].清華大學出版社,2010.

[6]陳文偉,黃金才.數(shù)據(jù)倉庫與數(shù)據(jù)挖掘[M].北京:人民郵電出版社,2004.

[7]甘永康,劉華一,劉惠.基于數(shù)據(jù)挖掘的《臨證指南醫(yī)案》治療泄瀉用藥規(guī)律分析[J].中國中醫(yī)基礎醫(yī)學雜志,2016,22(1):115-116,130.

[8]沈劼,王旭東,李新霞,等.卵巢早衰古今用藥規(guī)律探析[J].中國中醫(yī)藥現(xiàn)代遠程教育,2016,14(21):42-45.

[9]簡維雄,陳偶英,張穩(wěn),等.基于高血壓病中醫(yī)藥現(xiàn)代文獻證型、病機特征研究[J].中華中醫(yī)藥學刊,2015,33(12):2871-2874.

[10]章薇,譚志高,曹卷舒,等.基于數(shù)據(jù)挖掘技術(shù)探析古代針灸治療尿失禁的用穴規(guī)律[J].中國針灸,2015,35(12):1299-1303.

[11]徐建虎,陳甲秀,張琦,等.基于2898則古今醫(yī)案的數(shù)據(jù)挖掘探討小柴胡湯病證規(guī)律[J].時珍國醫(yī)國藥,2014,25(8):2026-2029.

[12]王欣,徐騰飛,唐連章.SQL Server 2005數(shù)據(jù)挖掘?qū)嵗治鯷M].中國水利水電出版社,2008:185.

[13]蘇曉宇.數(shù)據(jù)挖掘聚類分析方法在中醫(yī)臨床中的運用[J].實用中西醫(yī)結(jié)合臨床,2010,10(6):90-93.

[14]劉嘉輝,韋志輝,呂東勇,等.基于數(shù)據(jù)挖掘的名老中醫(yī)治療原發(fā)性肝癌用藥規(guī)律研究[J].中華中醫(yī)藥雜志,2016,31(1):58-61.

[15]陳欣然.基于數(shù)據(jù)挖掘技術(shù)的近15年反流性食管炎中醫(yī)臨床期刊文獻研究[D].北京中醫(yī)藥大學,2014.

[16]余學杰,李書珍,李曉燕,等.基于決策樹提取中醫(yī)專家辨證規(guī)律初探[J].遼寧中醫(yī)雜志,2015,42(1):19-24.

[17]黃嘉韻,郭宏,鄺艷萍.基于決策樹算法的鼻鼽辨證規(guī)律初步研究[J].中華中醫(yī)藥雜志,2016,31(11):4770-4773.

[18]張康,張鶴林,金石,等.基于神經(jīng)網(wǎng)絡的舌體胖瘦分析[J].中華中醫(yī)藥雜志,2014,29(10):3111-3114.

編輯/成森

猜你喜歡
文獻研究中醫(yī)數(shù)據(jù)挖掘
探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
電力與能源(2017年6期)2017-05-14 06:19:37
國內(nèi)外老年人權(quán)益保障文獻研究的學術(shù)梳理
中醫(yī)健康教育相關的護理研究現(xiàn)狀分析與思考
南樂《目連戲》文獻研究綜述
戲劇之家(2016年22期)2016-11-30 18:53:48
我國中小企業(yè)物流管理現(xiàn)狀及其對策
引產(chǎn)術(shù)后胎盤殘留的中醫(yī)治療方法
今日健康(2016年12期)2016-11-17 14:53:45
中醫(yī)英譯的誤譯現(xiàn)象探析
芻議中醫(yī)養(yǎng)生理念在瑜伽教學中的融入
體育時空(2016年8期)2016-10-25 20:56:21
關于中西醫(yī)結(jié)合治療乳腺增生病38例臨床觀察
孙吴县| 瑞安市| 博客| 仪陇县| 沙河市| 大同市| 桑植县| 张家界市| 涞源县| 兴安县| 读书| 阿图什市| 通化市| 东安县| 宜章县| 大余县| 新邵县| 岐山县| 丁青县| 聂荣县| 偃师市| 常熟市| 客服| 天津市| 民勤县| 新野县| 东乌珠穆沁旗| 贵定县| 安福县| 岳池县| 清苑县| 高青县| 且末县| 兴城市| 三台县| 靖远县| 苍梧县| 当阳市| 永丰县| 琼中| 东城区|