,,,, ,
芳香類方藥在古代中國疫病防治過程中具有重要作用,以“辟穢”“除惡”為典型[1-2]。元代許國禎所撰《御藥院方》記載芳香類方藥不僅用于中風(fēng)、脾胃、瘡腫、折傷等疾病,而且在治療婦、兒、五官諸種病癥有顯著療效[3]?,F(xiàn)代臨床中,芳香類方藥的單方、驗(yàn)方、秘方得到傳承[4],如以芳香開竅藥物為主創(chuàng)立的“芳香類方藥三寶”,即蘇合香丸、至寶丹、紫雪丹,在高熱神昏痙厥急危病人搶救,及溫?zé)嵋卟〉闹委熤杏兄豢赡绲墓僛5]。尤其在2003年,以芳香類方藥為主藥的方劑在SARS肆虐期間起到了西藥無法取代的防治效果。
目前學(xué)界對芳香類方藥防治疾病的實(shí)驗(yàn)驗(yàn)證研究屢見不鮮,不論是傳統(tǒng)醫(yī)學(xué)還是現(xiàn)代研究均發(fā)現(xiàn)芳香類方藥在疾病尤其是外治中有顯著效果,但是其防治知識存在于歷代文獻(xiàn)和醫(yī)家的臨床經(jīng)驗(yàn)記載中,信息分散且疏于整理。
若能在大數(shù)據(jù)集成基礎(chǔ)上與現(xiàn)代數(shù)據(jù)挖掘方法相結(jié)合,圍繞芳香類方藥外治證治規(guī)律,進(jìn)行結(jié)構(gòu)化處理予以集中存儲,并對其中特色方藥外治證治規(guī)律及古文獻(xiàn)中內(nèi)涵的學(xué)術(shù)價(jià)值予以分析挖掘,不僅便于學(xué)習(xí)、傳承和應(yīng)用,而且通過臨床驗(yàn)證反過來促使其不斷優(yōu)化,真正做到古為今用,進(jìn)而促進(jìn)芳香類方藥外治理論與實(shí)踐的發(fā)展,為中醫(yī)外科學(xué)、方劑學(xué)提供可信的文獻(xiàn)學(xué)依據(jù),具有及其重要的意義。
數(shù)據(jù)挖掘又稱“數(shù)據(jù)庫中的知識發(fā)現(xiàn)”,是從海量數(shù)據(jù)中,提取、轉(zhuǎn)換、分析一些潛在的、有價(jià)值的信息或知識的過程。近年來數(shù)據(jù)挖掘在中醫(yī)藥領(lǐng)域得到廣泛應(yīng)用[6-9]。以歷代中醫(yī)典籍中芳香類方藥資源的分析利用和知識發(fā)現(xiàn)為目的,基于南京中醫(yī)藥大學(xué)特色數(shù)據(jù)庫——中醫(yī)藥古籍全文數(shù)據(jù)庫,通過應(yīng)用數(shù)據(jù)倉庫、人工智能、認(rèn)知模型、數(shù)據(jù)挖掘等方法與思路,利用頻數(shù)分析、因子分析、R型(指標(biāo))聚類分析等分析方法,遵循“數(shù)據(jù)挖掘-原生態(tài)信息再現(xiàn)-保護(hù)性利用-理論指導(dǎo)實(shí)踐”的研究模式,建立相關(guān)數(shù)據(jù)平臺,從多維角度分析挖掘中醫(yī)典籍中芳香類方藥外治用藥經(jīng)驗(yàn)與組方規(guī)律。
主要基于南京中醫(yī)藥大學(xué)中醫(yī)藥古籍全文數(shù)據(jù)庫,該庫是目前國內(nèi)較全面的古籍?dāng)?shù)據(jù)庫,現(xiàn)收錄有線裝中醫(yī)藥古籍2 300多種,其中珍善本300多種、孤本10余種,還有各家抄、稿本,此外還收錄了綜合性匯編叢書中的中醫(yī)古籍,如《四庫全書》《中醫(yī)古籍孤本大全》《中華善本再造》?!锻饪普凇贰动兛菩牡眉贰动冡t(yī)大全》《太平圣惠方》等古籍文獻(xiàn)資源為構(gòu)建芳香類方藥學(xué)科體系奠定了重要的物質(zhì)基礎(chǔ)。
數(shù)據(jù)庫的構(gòu)建主要包括數(shù)據(jù)收集與整理建立數(shù)據(jù)采集系統(tǒng);書目元數(shù)據(jù)分配、標(biāo)引及分類、原文圖像掃描、文本錄入構(gòu)建數(shù)據(jù)庫管理系統(tǒng);癥、方、藥、法-證關(guān)聯(lián)分析建立數(shù)據(jù)挖掘分析系統(tǒng),其構(gòu)建思路與流程如圖1所示。按照《中醫(yī)古籍書目元數(shù)據(jù)標(biāo)準(zhǔn)》對古籍元數(shù)據(jù)源進(jìn)行收集,包括朝代、書名、著者、版本、卷號、摘要、醫(yī)案名(按照醫(yī)家、病者及病證特點(diǎn)命名)、出版年等;“以方列病、以方列法”收集方劑名稱、劑型、中藥名、方劑組成、外治方法等;“以病列法、以病列方”對疾病名稱、證候、病機(jī)等重新排列組合。對于同一病案中同一疾病相關(guān)的多次診療記錄,記為不同方案,予以分別收集。對于同一醫(yī)家醫(yī)案所治疾病相同,且用藥用方相同時(shí),予以采集,但是不予重復(fù)統(tǒng)計(jì)。
圖1 芳香類方藥數(shù)據(jù)庫構(gòu)建思路與流程
中醫(yī)典籍記載往往包括模糊化的病史、癥狀、體征、治療情況等,以及發(fā)病季節(jié)、發(fā)病影響因素,體質(zhì)等信息[10]。且由于歷代醫(yī)家典籍醫(yī)案疾病表述,方藥記載名稱有諸多相異之處,以致中醫(yī)藥數(shù)據(jù)結(jié)構(gòu)化一直顯得非常復(fù)雜。在南京中醫(yī)藥大學(xué)古籍全文數(shù)據(jù)庫中,除了典籍醫(yī)案本身具有的類型繁多、關(guān)系復(fù)雜的特點(diǎn)之外,由于不同流派、不同醫(yī)家臨床診斷和治療的思維決策過程的個(gè)體化特色非常明顯,這種個(gè)性化特色一方面代表了典籍醫(yī)案所折射的證治思想實(shí)質(zhì)所在,另一方面,也造成了這種“以人為綱”的典籍醫(yī)案的數(shù)據(jù)分析挖掘與“以病為綱”的基于流行病學(xué)癥候調(diào)查基礎(chǔ)上的一般意義上的醫(yī)學(xué)數(shù)據(jù)挖掘的巨大差異。
在典籍病案信息的規(guī)范化方面,為了體現(xiàn)方法的客觀性,既要遵照中醫(yī)界現(xiàn)有的規(guī)范或標(biāo)準(zhǔn)對相關(guān)信息進(jìn)行取舍、合并或分解,又要與醫(yī)家流派的特色緊密結(jié)合,以保證規(guī)范后的信息不偏離名醫(yī)醫(yī)案的本質(zhì),只有這樣才能從源頭上保證挖掘結(jié)果不失真。參照《中國中醫(yī)藥主題詞表》《中醫(yī)癥狀鑒別診斷》《方劑學(xué)大辭典》《中華本草》等工具書對中藥名、外治方法等進(jìn)行規(guī)范處理,如古籍中記載的藥物名稱“良姜”規(guī)范為“高良姜”。
在數(shù)據(jù)庫框架構(gòu)建的基礎(chǔ)上對芳香類方藥古籍文獻(xiàn)信息進(jìn)行篩選、整理和有序化處理,如文獻(xiàn)的標(biāo)引、自動分詞,按照《中醫(yī)外科學(xué)》[11]中傳統(tǒng)分類方法分別納入,如瘡瘍、乳房疾病、肛門直腸疾病等。同時(shí)根據(jù)《中藥學(xué)》教材,將常用66種芳香類方藥,按照6種功效,即芳香解表、芳香化濕、芳香溫里助陽、芳香理氣、芳香開竅、芳香活血分別進(jìn)行歸類分析。對古籍中存在“同書異名”“同名異書”現(xiàn)象,以及處方中方藥描述存在“異藥同名”“同藥異名”現(xiàn)象,采用改進(jìn)的編輯距離算法,對數(shù)學(xué)名稱進(jìn)行自動化、智能化的規(guī)范處理[12]。對病案中繁體字、異體字、古今字及通假字等參照《漢字簡化字總表》要求進(jìn)行整理統(tǒng)一。同時(shí)對古籍原文中較難理解的內(nèi)容進(jìn)行注釋、釋義,按照古籍整理通則的要求對文獻(xiàn)進(jìn)行整理、歸納,將具體數(shù)據(jù)結(jié)構(gòu)化和規(guī)范化處理,轉(zhuǎn)化為計(jì)算機(jī)能夠識別處理的語言。
芳香類方藥外治文獻(xiàn)具有一定的特殊性,數(shù)據(jù)收集的質(zhì)量將直接影響數(shù)據(jù)庫的構(gòu)建,因此必須對文獻(xiàn)收集工作進(jìn)行質(zhì)量控制,以提高文獻(xiàn)收集整理的準(zhǔn)確度與可信度。
名醫(yī)特色體現(xiàn)在“理-法-方-藥”的各個(gè)層面。要研究典籍芳香類方藥外治證治特色,就需要從其典籍醫(yī)案信息的不同角度對其中蘊(yùn)含的相關(guān)性和規(guī)律性信息進(jìn)行全面探討。在中醫(yī)經(jīng)驗(yàn)繼承中[13],運(yùn)用單用一種方法試圖實(shí)現(xiàn)臨證證治經(jīng)驗(yàn)的全面繼承是不現(xiàn)實(shí)的,多種分析挖掘方法相結(jié)合才有可能在古籍全文數(shù)據(jù)庫數(shù)據(jù)中尋找模式,發(fā)現(xiàn)規(guī)律,歸納隱含的邏輯關(guān)系,發(fā)現(xiàn)多個(gè)信息單元之間相互關(guān)聯(lián)規(guī)則。如證的規(guī)律、治的規(guī)律、防的規(guī)律、方的規(guī)律、藥的規(guī)律,以及病、證、治、防、方、藥相互之間關(guān)系的規(guī)律等。并可通過對數(shù)據(jù)的綜合分析進(jìn)行癥狀序列模式、疾病轉(zhuǎn)歸的異常和趨勢進(jìn)行預(yù)測性研究。本文中,我們將優(yōu)化分析挖掘方法組合中存在的不足予以算法優(yōu)化與重新組合,從癥候、治法、方藥信息入手,通過藥物配伍、藥癥相關(guān)、癥-證相應(yīng)等角度對其診療經(jīng)驗(yàn)作深入分析,通過“理-法-方-藥”之間多維關(guān)系的揭示,分析其用藥特色、組方結(jié)構(gòu)與配伍規(guī)律,以更好更客觀地反映典籍醫(yī)案中的隱含知識。
用戶登錄芳香類方藥外治數(shù)據(jù)挖掘系統(tǒng),進(jìn)入數(shù)據(jù)挖掘操作界面(圖2)。首先錄入數(shù)據(jù),將目標(biāo)數(shù)據(jù)導(dǎo)入數(shù)據(jù)表中進(jìn)行數(shù)據(jù)挖掘。可根據(jù)數(shù)據(jù)挖掘類型分別選擇組方分析(頻次統(tǒng)計(jì)、組方規(guī)律、新方分析)、方證分析(網(wǎng)絡(luò)展示、關(guān)鍵藥物、關(guān)鍵癥狀)、癥候分析(癥狀排序、癥狀規(guī)律、癥狀聚類)等選項(xiàng),實(shí)現(xiàn)多維關(guān)聯(lián)規(guī)則分析。
圖2 芳香類方藥外治數(shù)據(jù)挖掘系統(tǒng)操作界面
以《醫(yī)宗金鑒》為例,對古籍中40種芳香類方藥進(jìn)行頻次分析,得出總頻次為837次,其中使用頻次在4次以上的中藥有26味,頻數(shù)為808次,占總頻數(shù)的96.5%,是《醫(yī)宗金鑒》外治用藥的主要芳香類藥物。使用頻數(shù)最多的前10味藥物,按照頻率遞減順序排列分別是麝香、當(dāng)歸、沒藥、白芷、川芎、藏紅花、蒼術(shù)、木香、血竭、細(xì)辛(表1)。
表1 藥物頻數(shù)及頻率
對頻數(shù)在4次以上的26味芳香類方藥,按照功效進(jìn)行分類。在《醫(yī)宗金鑒》外治用藥中芳香類方藥中占主導(dǎo)地位的是芳香活血類藥物,頻數(shù)為392次,占總用藥的48.5%;其次是芳香解表類藥物,頻數(shù)為129次,占總用藥的16.0%;第3位是芳香開竅類藥物,頻數(shù)為125次,占總用藥的15.5%,詳見表2。
表2 藥類頻數(shù)及頻數(shù)
構(gòu)建26種藥物關(guān)聯(lián)網(wǎng)狀圖,清晰、直觀地反映藥物之間的關(guān)聯(lián)程度(圖3)。如圖3所示,藍(lán)色粗線代表關(guān)聯(lián)程度較強(qiáng),反之,藍(lán)色細(xì)線代表關(guān)聯(lián)程度較弱。其中當(dāng)歸與白芷,當(dāng)歸與沒藥,當(dāng)歸與川芎,當(dāng)歸與肉桂,沒藥與川芎,沒藥與肉桂,沒藥與血竭,沒藥與藏紅花的關(guān)聯(lián)程度最強(qiáng)。
圖3 藥物關(guān)聯(lián)分析結(jié)果
對頻次在4次以上的26種藥物進(jìn)行關(guān)聯(lián)規(guī)則分析,設(shè)置支持度>20%,置信度>80%,共獲得關(guān)聯(lián)規(guī)則12條,結(jié)果見表3。支持度表示箭頭前后藥物(對)同時(shí)出現(xiàn)的概率;置信度表示箭頭前藥物出現(xiàn)條件下,箭頭后藥物(對)出現(xiàn)的幾率。結(jié)果顯示當(dāng)當(dāng)歸或沒藥二者其中一味出現(xiàn)時(shí),另一味中藥和肉桂出現(xiàn)的概率為100%。
表3 高頻次藥物關(guān)聯(lián)規(guī)則分析結(jié)果
芳香類方藥外治文獻(xiàn)整理與利用研究是中醫(yī)外科、方劑學(xué)研究的重要組成部分,本文利用現(xiàn)代計(jì)算機(jī)和網(wǎng)絡(luò)技術(shù),針對芳香類方藥外治醫(yī)案,探索性地構(gòu)建基于關(guān)聯(lián)規(guī)則方法分析的數(shù)據(jù)挖掘系統(tǒng),對芳香類方藥予以調(diào)査梳理,根據(jù)獲得的結(jié)果確定數(shù)據(jù)采集、分類與標(biāo)引的規(guī)范標(biāo)準(zhǔn),便于對可獲取的病案信息進(jìn)行結(jié)構(gòu)化或半結(jié)構(gòu)化處理,深入挖掘芳香類方藥外治用藥規(guī)律,旨在為中藥學(xué)芳香類方藥理論及實(shí)踐發(fā)展提供新的嘗試。后期將在繼續(xù)查找相關(guān)古籍完善數(shù)據(jù)庫、使芳香類方藥外治數(shù)據(jù)庫信息全面化的同時(shí),補(bǔ)充摘要、主題分類等信息,使數(shù)據(jù)庫更加完善,使標(biāo)引更加細(xì)致化。