胡綠慧 任玉蘭
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對古今針灸臨床治療方案數(shù)據(jù)量大、關聯(lián)性強的特點,運用關聯(lián)分析中的Apriori算法,結(jié)合針灸學科特點和臨床診治規(guī)律,將經(jīng)過篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實驗結(jié)果表明,基于WEKA的關聯(lián)規(guī)則挖掘技術能有效的為針灸腧穴規(guī)律研究提供信息支持。
關鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關聯(lián)規(guī)則
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)07-1361-03
針灸學是以中醫(yī)理論為指導,在繼承和發(fā)揚古代針灸學術思想和實踐經(jīng)驗的基礎之上,運用傳統(tǒng)和現(xiàn)代科學技術研究經(jīng)絡、腧穴、操作技能、治療法則、作用機制和防治疾病的一門學科,作為中醫(yī)學科體系中最具特色和優(yōu)勢的學科,以其獨特的治療方法和卓越的臨床療效得到了國內(nèi)外廣泛關注和高度重視。臨床上,由腧穴、施術方法和治療時間組成的針灸處方是實現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術的發(fā)展,醫(yī)學信息的迅猛增加,而人腦的儲存和處理信息的能力又有一定的局限性,因此會對臨床問題的思考、信息的判斷、尋找解決問題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對針灸臨床治療方案的數(shù)據(jù)特點,借鑒循證醫(yī)學的理念和方法整理、加工、更新以及評價古今針灸治療疾病的臨床證據(jù),通過運用數(shù)據(jù)倉庫存儲、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關針灸知識,結(jié)合針灸學科特點和臨床診治規(guī)律;通過對關聯(lián)規(guī)則及相關算法進行分析,將針灸穴位數(shù)據(jù)與關聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導醫(yī)生的臨床治療方案決策。
1 關聯(lián)規(guī)則挖掘算法
1.1 關聯(lián)規(guī)則挖掘的基本概念
關聯(lián)規(guī)則挖掘是指從事務數(shù)據(jù)庫,關系數(shù)據(jù)庫和其他信息存儲中的大量數(shù)據(jù)的項集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關聯(lián)和相關性。
1.2 APRIORI算法
經(jīng)典的關聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項集探索K+1項集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項目集,然后掃描數(shù)據(jù)庫并進行計數(shù),以確定這些候選項目集是大的。即掃描一次事務數(shù)據(jù)庫,找出頻繁1-項集的集合L1,基于L1來尋找所有可能的候選2-項集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項集。其中,候選項集的生成主要通過兩個步驟:連接和剪枝。即在第i趟掃描過程中,對候選項目集的集合Ci進行計數(shù),也就是說用大項目集的集合Li生成Ci+1。只有一個項目集的所有子集都是大的,它才被認為是一個候選。為了生成大小為i+1的候選,要對前一趟掃描發(fā)現(xiàn)的大項目集進行連接運算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個運行于Java平臺的開源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔數(shù)據(jù)挖掘任務的機器學習算法,包括對數(shù)據(jù)進行預處理,分類,回歸、聚類、關聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應用于一個數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時,用戶可以自定義算法的各個相關參數(shù),并且可以實現(xiàn)對測試集的驗證, 和對算法的比較。Weka提供了可編程的接口,使我們可以通過拓展算法來實現(xiàn)新的功能,同時Weka也允許我們通過調(diào)用它的公用包,在自己的項目中利用包中的算法實現(xiàn)相應的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時還提供了對CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過JDBC訪問數(shù)據(jù)庫的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應用
在中醫(yī)藥領域,數(shù)據(jù)挖掘技術已應用于中醫(yī)藥數(shù)據(jù)庫的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評價、處方分析、圖像識別等研究。目前,已有不少學者開始將數(shù)據(jù)挖掘技術利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學的學者在從事這方面的研究,還有待進一步的發(fā)展,使用數(shù)據(jù)挖掘方法來處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開放源代碼平臺,用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對于古代文獻數(shù)據(jù)參照了《中國針灸文獻提要》、《中國醫(yī)籍大辭典》《中國針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書籍,選取影響范圍較大、傳播范圍廣的著作;對于現(xiàn)代文獻數(shù)據(jù)采用計算機檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項。文獻錄入要保證忠實原始文獻并進行規(guī)范,對難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項。部分數(shù)據(jù)如表1所示。
通過WEKA平臺使用關聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉兩穴配伍使用最多,他們的支持度和置信度都達到最高。具體配伍、置信度見表3。
通過對針灸治療面癱數(shù)據(jù)庫進行分析,從用關聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識進行分析,其結(jié)果顯示:應用針灸療法治療貝爾面癱的經(jīng)絡腧穴的應用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來看,重視局部取穴,地倉、頰車、陽白、合谷、翳風等面部穴位的應用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時迎香、下關、四白等穴位的應用也十分常見,體現(xiàn)了“經(jīng)脈所過、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點以經(jīng)脈辨治為主,對經(jīng)脈的選擇中,特別重視對翳風、合谷、風池等祛風解表穴位的應用,體現(xiàn)了對病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運用是針灸處方的主要部分,這與針灸理論與臨床實踐是相符的。
5 結(jié)論
本文以大量針灸文獻為基礎,采用關聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術,對針灸臨床治療文獻海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻:
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機對照試驗研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應用[M].南京:南京理工大學,2009.
[3] 宋新葵.一種新的改進的Apriori算法[J].微計算機信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對古今針灸臨床治療方案數(shù)據(jù)量大、關聯(lián)性強的特點,運用關聯(lián)分析中的Apriori算法,結(jié)合針灸學科特點和臨床診治規(guī)律,將經(jīng)過篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實驗結(jié)果表明,基于WEKA的關聯(lián)規(guī)則挖掘技術能有效的為針灸腧穴規(guī)律研究提供信息支持。
關鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關聯(lián)規(guī)則
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)07-1361-03
針灸學是以中醫(yī)理論為指導,在繼承和發(fā)揚古代針灸學術思想和實踐經(jīng)驗的基礎之上,運用傳統(tǒng)和現(xiàn)代科學技術研究經(jīng)絡、腧穴、操作技能、治療法則、作用機制和防治疾病的一門學科,作為中醫(yī)學科體系中最具特色和優(yōu)勢的學科,以其獨特的治療方法和卓越的臨床療效得到了國內(nèi)外廣泛關注和高度重視。臨床上,由腧穴、施術方法和治療時間組成的針灸處方是實現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術的發(fā)展,醫(yī)學信息的迅猛增加,而人腦的儲存和處理信息的能力又有一定的局限性,因此會對臨床問題的思考、信息的判斷、尋找解決問題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對針灸臨床治療方案的數(shù)據(jù)特點,借鑒循證醫(yī)學的理念和方法整理、加工、更新以及評價古今針灸治療疾病的臨床證據(jù),通過運用數(shù)據(jù)倉庫存儲、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關針灸知識,結(jié)合針灸學科特點和臨床診治規(guī)律;通過對關聯(lián)規(guī)則及相關算法進行分析,將針灸穴位數(shù)據(jù)與關聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導醫(yī)生的臨床治療方案決策。
1 關聯(lián)規(guī)則挖掘算法
1.1 關聯(lián)規(guī)則挖掘的基本概念
關聯(lián)規(guī)則挖掘是指從事務數(shù)據(jù)庫,關系數(shù)據(jù)庫和其他信息存儲中的大量數(shù)據(jù)的項集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關聯(lián)和相關性。
1.2 APRIORI算法
經(jīng)典的關聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項集探索K+1項集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項目集,然后掃描數(shù)據(jù)庫并進行計數(shù),以確定這些候選項目集是大的。即掃描一次事務數(shù)據(jù)庫,找出頻繁1-項集的集合L1,基于L1來尋找所有可能的候選2-項集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項集。其中,候選項集的生成主要通過兩個步驟:連接和剪枝。即在第i趟掃描過程中,對候選項目集的集合Ci進行計數(shù),也就是說用大項目集的集合Li生成Ci+1。只有一個項目集的所有子集都是大的,它才被認為是一個候選。為了生成大小為i+1的候選,要對前一趟掃描發(fā)現(xiàn)的大項目集進行連接運算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個運行于Java平臺的開源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔數(shù)據(jù)挖掘任務的機器學習算法,包括對數(shù)據(jù)進行預處理,分類,回歸、聚類、關聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應用于一個數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時,用戶可以自定義算法的各個相關參數(shù),并且可以實現(xiàn)對測試集的驗證, 和對算法的比較。Weka提供了可編程的接口,使我們可以通過拓展算法來實現(xiàn)新的功能,同時Weka也允許我們通過調(diào)用它的公用包,在自己的項目中利用包中的算法實現(xiàn)相應的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時還提供了對CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過JDBC訪問數(shù)據(jù)庫的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應用
在中醫(yī)藥領域,數(shù)據(jù)挖掘技術已應用于中醫(yī)藥數(shù)據(jù)庫的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評價、處方分析、圖像識別等研究。目前,已有不少學者開始將數(shù)據(jù)挖掘技術利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學的學者在從事這方面的研究,還有待進一步的發(fā)展,使用數(shù)據(jù)挖掘方法來處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開放源代碼平臺,用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對于古代文獻數(shù)據(jù)參照了《中國針灸文獻提要》、《中國醫(yī)籍大辭典》《中國針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書籍,選取影響范圍較大、傳播范圍廣的著作;對于現(xiàn)代文獻數(shù)據(jù)采用計算機檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項。文獻錄入要保證忠實原始文獻并進行規(guī)范,對難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項。部分數(shù)據(jù)如表1所示。
通過WEKA平臺使用關聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉兩穴配伍使用最多,他們的支持度和置信度都達到最高。具體配伍、置信度見表3。
通過對針灸治療面癱數(shù)據(jù)庫進行分析,從用關聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識進行分析,其結(jié)果顯示:應用針灸療法治療貝爾面癱的經(jīng)絡腧穴的應用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來看,重視局部取穴,地倉、頰車、陽白、合谷、翳風等面部穴位的應用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時迎香、下關、四白等穴位的應用也十分常見,體現(xiàn)了“經(jīng)脈所過、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點以經(jīng)脈辨治為主,對經(jīng)脈的選擇中,特別重視對翳風、合谷、風池等祛風解表穴位的應用,體現(xiàn)了對病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運用是針灸處方的主要部分,這與針灸理論與臨床實踐是相符的。
5 結(jié)論
本文以大量針灸文獻為基礎,采用關聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術,對針灸臨床治療文獻海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻:
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機對照試驗研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應用[M].南京:南京理工大學,2009.
[3] 宋新葵.一種新的改進的Apriori算法[J].微計算機信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.
摘要:針灸腧穴規(guī)律在針灸臨床治療中起著十分重要的作用,針對古今針灸臨床治療方案數(shù)據(jù)量大、關聯(lián)性強的特點,運用關聯(lián)分析中的Apriori算法,結(jié)合針灸學科特點和臨床診治規(guī)律,將經(jīng)過篩選轉(zhuǎn)換的數(shù)據(jù)在Weka平臺中分析,充分利用其中的類和可視化功能,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果。實驗結(jié)果表明,基于WEKA的關聯(lián)規(guī)則挖掘技術能有效的為針灸腧穴規(guī)律研究提供信息支持。
關鍵詞: Weka;針灸腧穴規(guī)律;數(shù)據(jù)挖掘;關聯(lián)規(guī)則
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2014)07-1361-03
針灸學是以中醫(yī)理論為指導,在繼承和發(fā)揚古代針灸學術思想和實踐經(jīng)驗的基礎之上,運用傳統(tǒng)和現(xiàn)代科學技術研究經(jīng)絡、腧穴、操作技能、治療法則、作用機制和防治疾病的一門學科,作為中醫(yī)學科體系中最具特色和優(yōu)勢的學科,以其獨特的治療方法和卓越的臨床療效得到了國內(nèi)外廣泛關注和高度重視。臨床上,由腧穴、施術方法和治療時間組成的針灸處方是實現(xiàn)針灸療效的重要條件,但在針灸臨床治療決策中,如何選取最優(yōu)化的針灸處方是針灸醫(yī)生面臨的一大難題。隨著信息技術的發(fā)展,醫(yī)學信息的迅猛增加,而人腦的儲存和處理信息的能力又有一定的局限性,因此會對臨床問題的思考、信息的判斷、尋找解決問題的辦法和制定臨床治療方案決策造成必然的困擾。
本文針對針灸臨床治療方案的數(shù)據(jù)特點,借鑒循證醫(yī)學的理念和方法整理、加工、更新以及評價古今針灸治療疾病的臨床證據(jù),通過運用數(shù)據(jù)倉庫存儲、管理針灸診斷、治療疾病的古代和現(xiàn)代臨床證據(jù)以及相關針灸知識,結(jié)合針灸學科特點和臨床診治規(guī)律;通過對關聯(lián)規(guī)則及相關算法進行分析,將針灸穴位數(shù)據(jù)與關聯(lián)規(guī)則相結(jié)合,將歷代針灸數(shù)據(jù)在WEKA軟件中進行挖掘,得出用穴規(guī)律、腧穴配伍規(guī)律等的分析結(jié)果,從而指導醫(yī)生的臨床治療方案決策。
1 關聯(lián)規(guī)則挖掘算法
1.1 關聯(lián)規(guī)則挖掘的基本概念
關聯(lián)規(guī)則挖掘是指從事務數(shù)據(jù)庫,關系數(shù)據(jù)庫和其他信息存儲中的大量數(shù)據(jù)的項集之間發(fā)現(xiàn)有趣的、頻繁出現(xiàn)的模式、關聯(lián)和相關性。
1.2 APRIORI算法
經(jīng)典的關聯(lián)規(guī)則挖掘算法是Agrawal R提出的Apriori算法,該算法是利用大項目集的任一子集也一定是大的這一性質(zhì)。使用逐層搜索的迭代方法,利用K項集探索K+1項集,將原始數(shù)據(jù)結(jié)構(gòu)分層。Apriori算法的基本思想是生成特定規(guī)模的候選項目集,然后掃描數(shù)據(jù)庫并進行計數(shù),以確定這些候選項目集是大的。即掃描一次事務數(shù)據(jù)庫,找出頻繁1-項集的集合L1,基于L1來尋找所有可能的候選2-項集集合L2,類似上一步,L2用于尋找 L3,如此循環(huán),直到不能找到頻繁項集。其中,候選項集的生成主要通過兩個步驟:連接和剪枝。即在第i趟掃描過程中,對候選項目集的集合Ci進行計數(shù),也就是說用大項目集的集合Li生成Ci+1。只有一個項目集的所有子集都是大的,它才被認為是一個候選。為了生成大小為i+1的候選,要對前一趟掃描發(fā)現(xiàn)的大項目集進行連接運算。
2 Weka的框架結(jié)構(gòu)
WEKA的全名是懷卡托智能分析環(huán)境(Waikato Environment for Knowledge Analysis),是一個運行于Java平臺的開源系統(tǒng),是現(xiàn)今最完備的數(shù)據(jù)挖掘工具之一。
Weka主要提供了數(shù)據(jù)挖掘的框架結(jié)構(gòu),集合了大量能承擔數(shù)據(jù)挖掘任務的機器學習算法,包括對數(shù)據(jù)進行預處理,分類,回歸、聚類、關聯(lián)規(guī)則以及在新的交互式界面上的可視化。這些算法一般是直接應用于一個數(shù)據(jù)集上,還可以在其他的Java代碼中調(diào)用。在這些數(shù)據(jù)挖掘算法生成模型時,用戶可以自定義算法的各個相關參數(shù),并且可以實現(xiàn)對測試集的驗證, 和對算法的比較。Weka提供了可編程的接口,使我們可以通過拓展算法來實現(xiàn)新的功能,同時Weka也允許我們通過調(diào)用它的公用包,在自己的項目中利用包中的算法實現(xiàn)相應的功能。使用WEKA不僅支持本身提供的ARFF格式的數(shù)據(jù),同時還提供了對CSV文件的支持,而這種格式是被很多其他軟件所支持的。此外,WEKA還提供了通過JDBC訪問數(shù)據(jù)庫的功能。
3 Apriori算法在針灸腧穴規(guī)律中的應用
在中醫(yī)藥領域,數(shù)據(jù)挖掘技術已應用于中醫(yī)藥數(shù)據(jù)庫的建立、方劑配伍規(guī)律的研究、名老中醫(yī)經(jīng)驗總結(jié)、中醫(yī)藥數(shù)據(jù)規(guī)范處理,以及臨床診斷、療效評價、處方分析、圖像識別等研究。目前,已有不少學者開始將數(shù)據(jù)挖掘技術利用在臨床診療決策方面,而數(shù)據(jù)挖掘在針灸臨床決策的研究還處于起步階段,研究還比較少,主要是成都中醫(yī)藥大學的學者在從事這方面的研究,還有待進一步的發(fā)展,使用數(shù)據(jù)挖掘方法來處理大量的針灸臨床數(shù)據(jù)已顯得十分重要。本研究挖掘工具采用Weka3.7開放源代碼平臺,用Apriori方法,以貝爾面癱病例數(shù)據(jù)為例,找出其中的用穴規(guī)律。
3.1 數(shù)據(jù)選擇與處理
對于古代文獻數(shù)據(jù)參照了《中國針灸文獻提要》、《中國醫(yī)籍大辭典》《中國針灸薈萃·現(xiàn)存針灸醫(yī)籍卷》等書籍,選取影響范圍較大、傳播范圍廣的著作;對于現(xiàn)代文獻數(shù)據(jù)采用計算機檢索和手工檢索;數(shù)據(jù)以針灸療法治療貝爾面癱1400條醫(yī)案為例,取每條數(shù)據(jù)病名、針灸方法、穴位、療程等字段?,F(xiàn)代數(shù)據(jù)分為篇名、作者、病名、取穴等數(shù)據(jù)項。文獻錄入要保證忠實原始文獻并進行規(guī)范,對難以規(guī)范需要特殊處理的內(nèi)容填入“備注”項。部分數(shù)據(jù)如表1所示。
通過WEKA平臺使用關聯(lián)規(guī)則挖掘結(jié)果得出:針灸治療面癱地倉、頰車兩穴使用頻次最高,療效最好。其他具體穴位使用頻次見表2。針灸治療面癱腧穴配伍規(guī)律中,頰車與地倉兩穴配伍使用最多,他們的支持度和置信度都達到最高。具體配伍、置信度見表3。
通過對針灸治療面癱數(shù)據(jù)庫進行分析,從用關聯(lián)規(guī)則挖掘結(jié)果并結(jié)合針灸專業(yè)知識進行分析,其結(jié)果顯示:應用針灸療法治療貝爾面癱的經(jīng)絡腧穴的應用有明顯的規(guī)律特征。首先,從腧穴使用頻次分析來看,重視局部取穴,地倉、頰車、陽白、合谷、翳風等面部穴位的應用,體現(xiàn)了“腧穴所在,主治所在”的治療規(guī)律;同時迎香、下關、四白等穴位的應用也十分常見,體現(xiàn)了“經(jīng)脈所過、主治所及”的治療規(guī)律;其用穴還體現(xiàn)了針灸辯證論治的特點以經(jīng)脈辨治為主,對經(jīng)脈的選擇中,特別重視對翳風、合谷、風池等祛風解表穴位的應用,體現(xiàn)了對病因辨證治療的原則。從分析結(jié)果可以看出,循經(jīng)取穴是針灸治療面癱的重要原則,特定穴的運用是針灸處方的主要部分,這與針灸理論與臨床實踐是相符的。
5 結(jié)論
本文以大量針灸文獻為基礎,采用關聯(lián)規(guī)則挖掘方法,得出針灸治療面癱的用穴規(guī)律和配伍規(guī)律,為臨床醫(yī)生的治療方案提供了決策依據(jù)。 數(shù)據(jù)挖掘技術,對針灸臨床治療文獻海量數(shù)據(jù)的處理和分析有著重要的意義,其結(jié)果將為今后針灸臨床和科研提供新的思路和參考。
參考文獻:
[1] 梁繁榮,余曙光,李瑛,等.針灸治療貝爾麻痹臨床多中心隨機對照試驗研究[J].中醫(yī)雜志,2004,45(8):584.
[2] 馬麗偉.關聯(lián)規(guī)則算法研究及其在中醫(yī)藥數(shù)據(jù)挖掘中的應用[M].南京:南京理工大學,2009.
[3] 宋新葵.一種新的改進的Apriori算法[J].微計算機信息,2009,12(45):78-81.
[4] Agrawal R,Mannila H,Srikant R,et al.Fast discovery of association rules[J].Advances in Knowledge Discovery and Data Mining,1996:327-328.
[5] Karaboga D,Basturk B.On the performance of Artificial Bee Colony(ABC) algorithm[J].Applied Soft Comprting, 2010,8(1):687-697.