国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

數(shù)字人文視角下藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)研究
——以《四部醫(yī)典》為例

2023-11-24 06:34:34梁世豪李昕娛王文欣宋雪雁
現(xiàn)代情報(bào) 2023年11期
關(guān)鍵詞:藏醫(yī)學(xué)熱癥古籍

沈 旺 梁世豪 李昕娛 王文欣 宋雪雁

(吉林大學(xué)商學(xué)與管理學(xué)院,吉林 長(zhǎng)春 130012)

藏醫(yī)學(xué)古籍是藏族人民醫(yī)學(xué)智慧的匯集,是我國(guó)寶貴的醫(yī)學(xué)資源。從古至今遺留下來的藏醫(yī)學(xué)經(jīng)典古籍有《醫(yī)學(xué)大全》《無畏的武器》《月王藥診》《四部醫(yī)典》《晶珠本草》等,蘊(yùn)含著大量可挖掘利用的內(nèi)容信息。數(shù)字人文(Digital Humanities)起源于人文計(jì)算(Humanities Computing),其目的是將數(shù)字技術(shù)融入學(xué)術(shù)研究,以解決人文領(lǐng)域存在的問題。在數(shù)字人文領(lǐng)域,研究熱點(diǎn)涉及文化遺產(chǎn)、GIS技術(shù)應(yīng)用、語(yǔ)料庫(kù)建設(shè)、數(shù)字檔案以及數(shù)字圖書館等,相關(guān)技術(shù)包括知識(shí)圖譜、關(guān)聯(lián)數(shù)據(jù)、IIIF、人工智能等。數(shù)字人文技術(shù)的發(fā)展,推動(dòng)著人文社科領(lǐng)域相關(guān)資源開發(fā)利用新途徑的發(fā)現(xiàn)。本文以藏醫(yī)學(xué)經(jīng)典古籍《四部醫(yī)典》為例,運(yùn)用統(tǒng)計(jì)分析、關(guān)聯(lián)分析、聚類分析、可視化技術(shù)等方法工具,挖掘藏醫(yī)學(xué)古籍中的病癥關(guān)系、病因關(guān)系、用藥規(guī)律以及可能的新處方,并通過可視化圖片呈現(xiàn),擬為研究藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)提供一種可行的思路,有助于藏醫(yī)學(xué)古籍的開發(fā)與利用,也有利于藏醫(yī)學(xué)的發(fā)展與傳播。

1 研究回顧

1.1 藏醫(yī)學(xué)古籍研究

通過對(duì)國(guó)內(nèi)外藏醫(yī)學(xué)古籍以及數(shù)字人文領(lǐng)域現(xiàn)有文獻(xiàn)研究的梳理發(fā)現(xiàn),由于藏醫(yī)學(xué)古籍的民族特性,國(guó)外相關(guān)研究甚少,僅有Dhondrup W等[1]利用層次分類對(duì)《四部醫(yī)典》中5種疾病的病因關(guān)系進(jìn)行了可視化分析。國(guó)內(nèi)相關(guān)研究較為豐富,曹明澤等[2]梳理了藏藥發(fā)展史,占堆等[3]以時(shí)間為線梳理了藏醫(yī)藥學(xué)的發(fā)源、發(fā)展以及未來。梁成秀[4]對(duì)《四部醫(yī)典》的編撰進(jìn)行了解讀,不過更多學(xué)者的研究重點(diǎn)在挖掘藏醫(yī)藥古籍中蘊(yùn)含的用藥思想與規(guī)律。文成當(dāng)智等利用復(fù)雜網(wǎng)絡(luò)等分析方法,發(fā)掘出藏醫(yī)學(xué)用藥傾向“食療加藥物,藥物加治法”的規(guī)律,從藏醫(yī)藥學(xué)的“味性化味”理論出發(fā),揭示藏醫(yī)學(xué)用藥規(guī)律的科學(xué)內(nèi)涵[5-6]。旦增米吉等[7]從《四部醫(yī)典》中含有印度獐牙菜的處方出發(fā),挖掘藏醫(yī)學(xué)用藥配伍規(guī)律。

1.2 數(shù)字人文研究

數(shù)字人文主要指的是以數(shù)字化的資源為對(duì)象,利用一系列的數(shù)字技術(shù)對(duì)其進(jìn)行收集、加工和利用,以此來實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)的過程[8]。數(shù)字人文相關(guān)研究主要涉及數(shù)字人文工具開發(fā)、數(shù)字人文整體情況研究、數(shù)字人文項(xiàng)目借鑒研究以及人文資源實(shí)例研究。

首先在工具開發(fā)方面,國(guó)外研究較豐富。Moretti G等[9]開發(fā)了能幫助人文學(xué)者在數(shù)字環(huán)境中進(jìn)行大量文本數(shù)據(jù)分析的工具——ALCIDE?;?個(gè)不同的數(shù)字人文項(xiàng)目,Zwaan J M等[10]介紹了可視化工具Storyteller,相較于其他可視化工具,其具有能交互式展示復(fù)雜數(shù)據(jù)的優(yōu)勢(shì)。Terras M等[11]為解決人文學(xué)者在計(jì)算上存在的技術(shù)障礙,通過實(shí)例研究探索最能滿足人文學(xué)者研究需求的高性能計(jì)算設(shè)施。Arnold T等[12]將重點(diǎn)放在對(duì)詞袋、詞頻模型的超越,通過使用核心編程語(yǔ)言編寫的軟件包R,以便能對(duì)數(shù)字人文相關(guān)的文本分析進(jìn)行更人性化的研究。

其次在數(shù)字人文的整體情況研究方面,Joo S等[13]運(yùn)用文本挖掘技術(shù),聚焦數(shù)字人文近10年的研究熱點(diǎn)與趨勢(shì),發(fā)現(xiàn)文化遺產(chǎn)、地理信息、語(yǔ)義網(wǎng)等關(guān)鍵詞。國(guó)內(nèi),劉煒等[14]為促進(jìn)數(shù)字人文的整體發(fā)展,將數(shù)字人文的理論結(jié)構(gòu)與方法論在宏觀層面進(jìn)行了深入探討。周晨[15]ADDIN以WoS核心合集數(shù)據(jù)為基礎(chǔ)進(jìn)行內(nèi)容分析,發(fā)掘了目前國(guó)際上數(shù)字人文的發(fā)展現(xiàn)狀、研究熱點(diǎn)等情況。鄧君等[16]以CNKI的文獻(xiàn)為數(shù)據(jù)基礎(chǔ),利用文獻(xiàn)計(jì)量學(xué)等方法技術(shù)研究了我國(guó)數(shù)字人文的研究熱點(diǎn)與發(fā)展情況,并進(jìn)行了可視化展示。Su F L[17]通過社會(huì)網(wǎng)絡(luò)分析并借助可視化工具,對(duì)數(shù)字人文研究中有關(guān)跨國(guó)合作的主題、模式、結(jié)構(gòu)等進(jìn)行了深度研究。李娜[18]回顧并梳理了國(guó)際數(shù)字人文近20年的文獻(xiàn)研究,探尋了其熱點(diǎn)主題、演化路徑以及知識(shí)基礎(chǔ)等內(nèi)容。

數(shù)字人文項(xiàng)目借鑒研究,文獻(xiàn)研究主要在國(guó)內(nèi)。郭金龍等[19]在綜述數(shù)字人文領(lǐng)域文本挖掘技術(shù)的相關(guān)應(yīng)用后,重點(diǎn)介紹了歐美發(fā)達(dá)國(guó)家(地區(qū))在其中的前沿實(shí)踐,期望為我國(guó)數(shù)字人文的發(fā)展與轉(zhuǎn)型尋找可借鑒之處。徐志瑋[20]以“挖掘數(shù)據(jù)挑戰(zhàn)”項(xiàng)目為例,研究了國(guó)際合作視角下數(shù)字人文的研究現(xiàn)狀,為國(guó)內(nèi)相關(guān)部門提供決策參考。

最后,對(duì)于數(shù)字人文的研究更多集中于案例研究。國(guó)外,Earley-Spadoni T[21]通過實(shí)例研究的方法探討了如何通過數(shù)字人文拓寬地理空間技術(shù)在考古上的應(yīng)用,使考古學(xué)家受益。Hoeve C D[22]論證了利用數(shù)字人文技術(shù)進(jìn)行家譜和家族史研究的可行性以及重要性,為家譜研究提供了思路。Hu S F等[23]利用有關(guān)尼泊爾語(yǔ)言的文獻(xiàn)資料,展示了一種基于Web的多媒體制圖,在集成地理空間數(shù)據(jù)的同時(shí)還可以集成多媒體數(shù)據(jù)。Fedeli A[24]通過語(yǔ)言編碼與數(shù)字編輯對(duì)古蘭經(jīng)手稿文本進(jìn)行了研究,并提供了一個(gè)可進(jìn)行多協(xié)作工作的跨國(guó)、跨文化系統(tǒng),在數(shù)字編輯手稿以及數(shù)據(jù)多協(xié)作處理方面有重要意義。Plets G等[25]通過實(shí)例,研究出了針對(duì)于大量考古文本的文本挖掘方法,幫助追蹤、分析以及情境化考古術(shù)語(yǔ)的變化。國(guó)內(nèi),趙思淵[26]利用《中國(guó)地方歷史文獻(xiàn)數(shù)據(jù)庫(kù)》闡明數(shù)據(jù)化與文本挖掘的實(shí)現(xiàn)路徑,并提出以元數(shù)據(jù)為基礎(chǔ)的針對(duì)數(shù)據(jù)庫(kù)這一新文獻(xiàn)形態(tài)的方法論。鄧君等[27]利用中國(guó)歷史人物傳記資料庫(kù)(CDBD)中的清代進(jìn)士數(shù)據(jù)源并借助于數(shù)字技術(shù)對(duì)其進(jìn)行剖析,實(shí)現(xiàn)了對(duì)于清代進(jìn)士群體的社會(huì)網(wǎng)絡(luò)關(guān)系的知識(shí)發(fā)現(xiàn),為傳統(tǒng)的人文研究提供了新的研究范式。夏翠娟等[28]以兩氏家譜為例,詳細(xì)闡釋了關(guān)聯(lián)數(shù)據(jù)在家譜中的應(yīng)用與作用。歐陽(yáng)劍以大量古籍文本為基礎(chǔ),采用一定分析挖掘方法,幫助深層次開發(fā)與利用古籍,是一次對(duì)模式創(chuàng)新的嘗試。Huang J J等[29]提出一個(gè)新的社會(huì)網(wǎng)絡(luò)研究框架,幫助人們理解和分析歷史人物的社會(huì)關(guān)系,并通過中國(guó)傳記數(shù)據(jù)庫(kù)中的項(xiàng)目數(shù)據(jù)驗(yàn)證了其有效性。張毅等[30]以方志數(shù)據(jù)庫(kù)的建設(shè)為例,結(jié)合國(guó)內(nèi)外數(shù)字人文發(fā)展情況,對(duì)如何活化利用特藏資源進(jìn)行了說明。李斌等[31]以《左傳》知識(shí)庫(kù)為研究對(duì)象,利用各種語(yǔ)言處理技術(shù),為古籍文本內(nèi)容的標(biāo)記和結(jié)構(gòu)化人文知識(shí)庫(kù)的構(gòu)建提供了創(chuàng)新性方法。常博林等[32]以《資治通鑒》為研究對(duì)象,成功構(gòu)建了基于詞和實(shí)體檢索并且能夠進(jìn)行知識(shí)挖掘的知識(shí)庫(kù),同時(shí)利用時(shí)間序列分析,挖據(jù)出了歷史中人、地、事所蘊(yùn)含的信息。岑蕭萍等[33]以《易經(jīng)》為例,利用文本挖掘以及可視化,挖掘并展示了六十四卦中存在的聯(lián)系,提供了新的中醫(yī)古籍挖掘思路。湯萌等[34]以《石倉(cāng)契約》為研究對(duì)象,利用元數(shù)據(jù)和可視化等方法技術(shù),率先探索了這些方法在進(jìn)行民間賬簿資源挖掘的可行性。

從上述研究中可以看到,采用數(shù)字人文的方法對(duì)古籍文獻(xiàn)進(jìn)行深度開發(fā)與利用是當(dāng)前的研究趨勢(shì)。因此,本文選擇藏醫(yī)學(xué)古籍資源作為研究對(duì)象,運(yùn)用數(shù)據(jù)挖掘可視化分析方法,提出數(shù)字人文視角下的藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)過程并進(jìn)行可視化分析,展現(xiàn)藏醫(yī)學(xué)古籍?dāng)?shù)據(jù)價(jià)值的內(nèi)涵。

1.3 知識(shí)發(fā)現(xiàn)研究

隨著不斷的完善,知識(shí)發(fā)現(xiàn)的定義也在隨著社會(huì)的進(jìn)步不斷地發(fā)展。最初的定義追溯到了1996年法耶德所認(rèn)為的,知識(shí)發(fā)現(xiàn)是從大量的數(shù)據(jù)中鑒別出有效模式的非凡的過程[35]。而國(guó)內(nèi)研究對(duì)于知識(shí)發(fā)現(xiàn)的定義則更為貼切,大多數(shù)的學(xué)者認(rèn)為知識(shí)發(fā)現(xiàn)是指對(duì)大量的積累的數(shù)據(jù)進(jìn)行挖掘和分析,并從其中獲取有效的、有用的以及新穎的可以理解的知識(shí)[36]。近年來,互聯(lián)網(wǎng)的進(jìn)步帶來了海量的數(shù)據(jù),挖掘其中有價(jià)值的知識(shí)已經(jīng)成為眾多學(xué)者研究的熱點(diǎn)。尤其是在醫(yī)學(xué)領(lǐng)域中,為了支持和輔助臨床決策,大量的學(xué)者對(duì)疾病、病癥以及藥物的內(nèi)在關(guān)聯(lián)進(jìn)行挖掘和研究,誕生了眾多研究成果。虞紅蕾等[37]構(gòu)建了經(jīng)方領(lǐng)域的消渴病知識(shí)圖譜,并在此基礎(chǔ)上進(jìn)行知識(shí)發(fā)現(xiàn)和知識(shí)查詢,對(duì)于中醫(yī)藥智能問診、臨床輔助決策都有重要的意義。安欣宇等[38]采用路徑發(fā)現(xiàn),鏈路預(yù)測(cè)從知識(shí)圖譜中挖掘了知識(shí)之間的隱含關(guān)聯(lián),發(fā)現(xiàn)了38種治療精神分裂癥的藥物之間存在隱含關(guān)聯(lián),為發(fā)現(xiàn)潛在的治療精神分裂癥疾病的藥物提供了相應(yīng)的幫助。蔡妙芝等[39]提出了基于SPO語(yǔ)義三元組的疾病知識(shí)發(fā)現(xiàn)模型,以糖尿病為例揭示了糖尿病相關(guān)的以及常見的并發(fā)癥、檢測(cè)手段及治療方式,為疾病的臨床診療和日常防控提供了借鑒。

從上述研究來看,對(duì)醫(yī)學(xué)領(lǐng)域中相關(guān)知識(shí)進(jìn)行挖掘?qū)τ诩膊〉闹委熀皖A(yù)防都有十分重大的意義,這也是本文將《四部醫(yī)典》作為研究對(duì)象的原因之一。

2 研究對(duì)象與研究過程

2.1 研究對(duì)象

本研究以藏醫(yī)學(xué)古籍《四部醫(yī)典》為研究對(duì)象,選用版本[40]為1987年上??茖W(xué)技術(shù)出版社出版的,由宇妥·元丹貢布等著、馬世林等譯注的中譯本,在超星圖書館獲得電子資源。此譯注版本以多個(gè)版本的藏文《四部醫(yī)典》為基礎(chǔ)進(jìn)行譯注,行文更符合現(xiàn)代漢語(yǔ)習(xí)慣,在保證內(nèi)容完整性的前提下更易于理解與分析內(nèi)容?!端牟酷t(yī)典》是公元8世紀(jì)由著名藏醫(yī)藥學(xué)家宇妥·元丹貢布編著,被譽(yù)為“藏醫(yī)藥百科全書”。全書共有4部,包括《總則本》《論述本》《密訣本》和《后序本》,共156章。第一部綱領(lǐng)性地介紹了人體的生理、病理、診斷及治療。第二部詳細(xì)介紹了人體的生理解剖及疾病發(fā)生的原理、原因和途徑等。第三部詳細(xì)論述了各類疾病的診斷和治療。第四部介紹脈診、尿診及各種方劑的配方、功效和用途以及外傷的療法等?!端牟酷t(yī)典》中包含藏醫(yī)學(xué)種種,有著關(guān)于藏醫(yī)學(xué)方面最根本、最完整、最系統(tǒng)的理論體系,其內(nèi)容可以為藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)提供充分的數(shù)據(jù)支持。研究數(shù)據(jù)主要來源于《四部醫(yī)典》的第三部《密訣本》和第四部《后序本》?!睹茉E本》中依照內(nèi)科疾病、熱疾、腑臟疾病、私處疾病、零星雜癥、瘡癥等分別敘述病因、病緣、癥狀、治法等。《后序本》中從脈診、尿診開始,再敘述湯劑、散劑、丸劑等消除疾病的方法,以及催吐藥、滴鼻藥劑、各類導(dǎo)劑等疾病排除方法,最后再是針刺放血、灸法、藥浴等外用治療方法。此兩部分內(nèi)容是《四部醫(yī)典》中重點(diǎn)敘述的部分,占據(jù)大部分篇幅,包含了藏醫(yī)學(xué)關(guān)于疾病診斷、治療、用藥等幾乎所有內(nèi)容,保證了內(nèi)容分析的全面性。

2.2 研究過程

本文主要利用Python、Gephi、R語(yǔ)言等工具軟件,按照文檔識(shí)別與校對(duì)、數(shù)據(jù)分詞與提取、數(shù)據(jù)存儲(chǔ)、數(shù)據(jù)分析處理、數(shù)據(jù)可視化、結(jié)果闡釋的研究過程,最終實(shí)現(xiàn)知識(shí)發(fā)現(xiàn)。

藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)的過程如圖1所示。①文檔識(shí)別與校對(duì)階段:主要是對(duì)《四部醫(yī)典》PDF資源進(jìn)行OCR識(shí)別與人工校對(duì),重點(diǎn)對(duì)將進(jìn)行數(shù)據(jù)分析的部分校對(duì);②文本分詞與提取階段:針對(duì)分析需要,從第三部《密訣本》中分詞提取了疾病名稱、疾病癥狀、疾病部位以及部分疾病病因等相關(guān)實(shí)體。從第四部《后序本》中分詞提取了方劑類型、處方用藥以及主治疾病等相關(guān)實(shí)體,存儲(chǔ)在對(duì)應(yīng)數(shù)據(jù)庫(kù)或工具表中為數(shù)據(jù)分析處理做準(zhǔn)備;③數(shù)據(jù)分析處理階段:這一部分主要是針對(duì)古籍中的不同內(nèi)容采取不同的方法分析處理。病癥關(guān)系分析進(jìn)行了疾病癥狀的聚類分析以及疾病部位的關(guān)聯(lián)分析。病因關(guān)系分析進(jìn)行了詞云分析以及關(guān)聯(lián)分析。用藥規(guī)律分析進(jìn)行了方劑類型、藥材種類、主治疾病的統(tǒng)計(jì),然后進(jìn)行藥材的聚類分析以及關(guān)聯(lián)分析。最后通過聚類分析和關(guān)聯(lián)分析的綜合運(yùn)用進(jìn)行新處方的預(yù)測(cè)分析。該環(huán)節(jié)主要使用Python軟件以及R語(yǔ)言來完成,是整個(gè)研究的核心部分;④數(shù)據(jù)可視化及結(jié)果闡釋階段:針對(duì)分析結(jié)果利用相關(guān)可視化工具方法得到可視化結(jié)果圖以及結(jié)合藏醫(yī)學(xué)基本理論,闡釋分析結(jié)果,完成藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn),可視化的過程包括利用Python的Matplotlib繪制條形圖、散點(diǎn)圖來實(shí)現(xiàn)可視化。利用其中的Wordcloud庫(kù)進(jìn)行詞云可視化,以及利用Gephi軟件和R語(yǔ)言以及SPSS26.0進(jìn)行關(guān)聯(lián)網(wǎng)絡(luò)圖可視化。

3 藏醫(yī)學(xué)古籍《四部醫(yī)典》知識(shí)發(fā)現(xiàn)

3.1 文本識(shí)別及人工校對(duì)

文本識(shí)別和人工校對(duì)是研究的起點(diǎn),其結(jié)果直接影響了研究的準(zhǔn)確性。因此,在本階段當(dāng)中,筆者依托于超星圖書館所獲得的《四部醫(yī)典》的電子資源,其版本在上一章中進(jìn)行了具體說明,利用Acrobat Pro DC來進(jìn)行OCR識(shí)別。為了保證本研究的真實(shí)性和權(quán)威性,對(duì)OCR的結(jié)果按照電子資源進(jìn)行人工校對(duì)以避免出現(xiàn)識(shí)別結(jié)果和真實(shí)電子資源不符的情況。此外,還選取了其他平臺(tái)同版本的電子資源同OCR結(jié)果進(jìn)行比較,最大程度上保證了文本識(shí)別結(jié)果和數(shù)據(jù)資源的一致性。

3.2 文本分詞及實(shí)體提取

藏醫(yī)學(xué)古籍《四部醫(yī)典》的知識(shí)發(fā)現(xiàn)主要是通過兩個(gè)部分來呈現(xiàn)的,首先是文本的分詞以及實(shí)體提取,這一部分的結(jié)果是整個(gè)研究的基礎(chǔ),其次是數(shù)據(jù)處理和可視化階段。

醫(yī)學(xué)古籍不同于其他的文本形式,在《四部醫(yī)典》中無論是在病癥、病因還是處方當(dāng)中,許多詞匯是以標(biāo)點(diǎn)符號(hào)來進(jìn)行分割的,因此這在一定程度上減輕了分詞的工作量。所以在文本分詞中,本研究利用Python的Jieba分詞的基礎(chǔ)上,同時(shí)采用標(biāo)點(diǎn)符號(hào)劃分的方法來對(duì)經(jīng)過OCR后的文本進(jìn)行分詞。如在原始文本的處方中,藥材之間用“、”“,”來進(jìn)行隔斷,因此可以根據(jù)標(biāo)點(diǎn)來將不同的藥材進(jìn)行分割,根據(jù)標(biāo)點(diǎn)分詞在一定程度上減輕了分詞的工作量且提升了效果。對(duì)于較為生僻的藥材以及詞匯,采用輸入詞典的方法來確保不會(huì)出現(xiàn)預(yù)期以外的單詞,如對(duì)于“喜馬拉雅紫茉莉”的處理,將其規(guī)定為一個(gè)詞組以避免其出現(xiàn)“喜馬拉雅”和“紫茉莉”拆分為兩個(gè)詞組的情況。

在實(shí)體提取階段,由人工方式來對(duì)涉及的實(shí)體進(jìn)行識(shí)別和提取,主要對(duì)《四部醫(yī)典》的《密訣本》《后序本》中所涉及的疾病的病因、病癥、藥方等進(jìn)行提取得到了相應(yīng)的疾病病因、疾病病癥以及藥方實(shí)體。

在數(shù)據(jù)處理和可視化的階段,本文通過對(duì)藏醫(yī)學(xué)古籍《四部醫(yī)典》的內(nèi)容進(jìn)行聚類分析、關(guān)聯(lián)分析、詞云分析、統(tǒng)計(jì)分析,得到了病癥關(guān)系、病因關(guān)系、用藥規(guī)律、預(yù)測(cè)新處方等分析的分析結(jié)果,然后采用相應(yīng)的技術(shù)手段將其進(jìn)行了可視化展示并對(duì)其結(jié)果進(jìn)行了相應(yīng)的解讀和闡釋。

3.3 病癥關(guān)系分析及可視化

在本節(jié)中,針對(duì)疾病的癥狀、疾病的發(fā)生部位分別進(jìn)行聚類分析以及關(guān)聯(lián)分析。在聚類分析中使用K-means聚類方法以期獲得不同疾病的癥狀之間的區(qū)別和聯(lián)系。在關(guān)聯(lián)分析中采用Apriori算法并根據(jù)不同疾病發(fā)病部位的信息建立了關(guān)聯(lián)網(wǎng)絡(luò),以期獲得不同疾病發(fā)病部位之間的潛在關(guān)聯(lián)。最后,利用Matplotlib函數(shù)與Gephi軟件分別進(jìn)行散點(diǎn)圖和關(guān)聯(lián)網(wǎng)絡(luò)圖可視化,更好地解讀聚類分析和關(guān)聯(lián)分析的結(jié)果。疾病癥狀聚類散點(diǎn)圖中,同一形狀顏色的點(diǎn)代表同一類別。疾病部位關(guān)聯(lián)圖中,每個(gè)節(jié)點(diǎn)代表一個(gè)部位,節(jié)點(diǎn)越大代表疾病部位出現(xiàn)次數(shù)越多,節(jié)點(diǎn)間連線,反映了疾病部位之間聯(lián)系的強(qiáng)弱,權(quán)重越大代表聯(lián)系越強(qiáng)。

3.3.1 疾病癥狀類別分析可視化

由于不同的疾病在癥狀上存在一定的相似性,因此病癥聚類分析利用疾病癥狀的相似性聚類,以期將疾病劃為多個(gè)類,探索同一類別下疾病與癥狀間的情況,以此更好地區(qū)分不同疾病的相似癥狀,提高診斷的準(zhǔn)確性。病癥關(guān)系分析中,提取了《密訣本》中的不同疾病及其癥狀的實(shí)體,采用手肘法確定了聚類所形成的簇為4,利用Python進(jìn)行K-means聚類分析,如圖2所示。疾病癥狀聚類結(jié)果中,藍(lán)色圓點(diǎn)、綠色圓點(diǎn)、紅色五角星和天藍(lán)色圓點(diǎn)分別屬于聚類類別0、1、2、3。

圖2 疾病癥狀聚類結(jié)果

從整個(gè)聚類分析的結(jié)果來看,可以直觀看到類別1數(shù)量最多,而類別0中的疾病有不消化癥、胃病、大腸病、便秘等,癥狀排在前幾的也是呃逆、疼痛、腸鳴、不消化,與腹瀉、腸胃等疾病有關(guān),此類別下還有痼疾痞塊、脾病等,說明它們之間在癥狀表現(xiàn)上有一定相似性。類別1的數(shù)量較多,有45種疾病,涉及的疾病種類更多樣化,如頭部疾病、口腔病、眼病、鼻病、耳病等,癥狀上多是疼痛、腫脹、發(fā)癢、發(fā)熱、刺痛、口苦等,說明這些疾病常見的癥狀主要是疼痛發(fā)癢等。類別2癥狀上多是疼痛、腫脹、刺痛、腸鳴、脹滿,涉及的疾病相比較而言多是與潰爛、瘡癥等相關(guān),還有就是臟腑、內(nèi)臟等疾病。類別3多是失眠、熱癥、疼痛、刺痛、尿色等癥狀,全是與熱癥有關(guān)的疾病。

關(guān)于疾病的診斷,從癥狀上來看,疼痛、刺痛等相關(guān)癥狀出現(xiàn)頻率最高,這也是身體最直觀的反應(yīng)。從整體上來看,不同的疾病的癥狀表現(xiàn)有其特殊性,病癥聚類分析通過疾病癥狀進(jìn)行聚類,可以幫助梳理疾病在癥狀表現(xiàn)上具有的相似性,提高診斷的準(zhǔn)確性。

3.3.2 疾病部位關(guān)聯(lián)網(wǎng)絡(luò)可視化

疾病的發(fā)生往往涉及到多個(gè)部位,因此在疾病部位的關(guān)聯(lián)分析中,本節(jié)利用從《密訣本》中提取的疾病及其發(fā)病部位的實(shí)體信息,據(jù)此建立了不同疾病發(fā)病部位之間的關(guān)聯(lián)并進(jìn)行了可視化的分析。圖3為關(guān)聯(lián)可視化圖,可以清晰地看到藏醫(yī)學(xué)對(duì)疾病的認(rèn)知是從身體的各個(gè)部位出發(fā)的,在進(jìn)行疾病診斷時(shí)需要多方面考慮。

圖3 疾病部位關(guān)聯(lián)圖

藏醫(yī)學(xué)理論中,龍、赤巴、培根是藏醫(yī)學(xué)獨(dú)特的身體部位稱呼。在圖3中看到代表它們的點(diǎn)不僅碩大,并且之間的連線權(quán)重也大,說明它們不僅在疾病部位描述中出現(xiàn)的次數(shù)多,而且經(jīng)常同時(shí)出現(xiàn),聯(lián)系十分緊密。這種情況也再次印證了龍、赤巴、培根是藏醫(yī)學(xué)基礎(chǔ)理論的三大因素。此外,可視化中心部分呈現(xiàn)的疾病部位——口、頭、心、眼、胃等,也涉及到身體各個(gè)部位,連線亦錯(cuò)綜復(fù)雜,體現(xiàn)了藏醫(yī)學(xué)認(rèn)為身體部位不是孤立的而是相互聯(lián)系的思想。

3.4 病因關(guān)系分析及可視化

本節(jié)主要選取了《密訣本》中部分疾病的“病因”“病緣”“疾病分析”3個(gè)部分內(nèi)容進(jìn)行病因關(guān)系分析,選擇的疾病與熱癥相關(guān)——未成型熱癥、陳舊熱癥、擴(kuò)散熱癥、虛熱癥、伏熱癥、熱癥擴(kuò)散、濁熱癥、紊亂熱癥8種疾病。

在藏醫(yī)學(xué)理論當(dāng)中,疾病的病因主要是指產(chǎn)生疾病的根本原因,而病緣則是指被引發(fā)的條件,可以具體劃分為“生發(fā)”“積發(fā)”“具體外緣”。生發(fā)是指可以使得疾病多樣化的條件,積發(fā)是指可以讓疾病集聚明顯的爆發(fā)的條件,具體的外緣則主要指的是可以使得疾病明顯、迅速的爆發(fā)。這3種形式均為藏醫(yī)學(xué)理論中的病緣,僅僅是因?yàn)楸憩F(xiàn)的形式有所區(qū)別。

病因往往和疾病的產(chǎn)生相關(guān),而病緣往往與疾病的發(fā)生相關(guān),了解和把握疾病病因的關(guān)系,厘清疾病病緣的產(chǎn)生,對(duì)于把握整個(gè)疾病的爆發(fā)具有十分重要的意義。所以,在本節(jié)中,首先對(duì)疾病的病因在分詞的基礎(chǔ)上進(jìn)行了詞云展示,以期迅速獲得與病因相關(guān)的信息中藏醫(yī)所重點(diǎn)關(guān)注的對(duì)象。其次,針對(duì)于病因病緣間的關(guān)系進(jìn)行了關(guān)聯(lián)分析及可視化。關(guān)聯(lián)可視化的節(jié)點(diǎn)有疾病名稱、疾病病因、疾病病緣以及疾病分類,權(quán)重相同,著重展示疾病在病因方面的聯(lián)系。

3.4.1 病因詞云分析可視化

病因的詞云分析當(dāng)中,利用《密訣本》中與熱癥相關(guān)的病因?qū)嶓w,對(duì)病因中所出現(xiàn)的詞匯進(jìn)行了詞頻統(tǒng)計(jì),然后利用Python形成了熱癥的詞云圖。病因詞云分析突出展示了在藏醫(yī)學(xué)中被反復(fù)高頻提及的詞匯,有利于迅速抓住藏醫(yī)學(xué)中的核心要素。在詞云圖中可以直觀地看到龍、赤巴、培根這三大藏醫(yī)學(xué)專用名詞在病因分析中也占突出位置,再次印證龍、赤巴、培根在藏醫(yī)學(xué)中的重要地位,是藏醫(yī)學(xué)的理論基礎(chǔ)。還可以清晰地看到此次分析的疾病種類——未成型熱癥、陳舊熱癥、擴(kuò)散熱癥、虛熱癥等。除了上述的關(guān)鍵詞之外,年齡、自性、境域、時(shí)刻、飲食、起居等病因病緣也較為突出,展現(xiàn)了藏醫(yī)學(xué)在診斷疾病病因時(shí)的基本情況。詞云展示結(jié)果如圖4所示。

圖4 熱癥詞云圖

3.4.2 病因病緣關(guān)系分析可視化

病因關(guān)系分析可視化有助于了解疾病產(chǎn)生上的相似性,幫助疾病預(yù)防。在病因關(guān)系分析當(dāng)中,提取《密訣本》中有關(guān)熱癥的疾病及其病因的實(shí)體,因?yàn)椴煌臒岚Y在病因、病緣及病緣的產(chǎn)生上存著一定的相似性,因此,據(jù)此且基于Apriori算法建立不同熱癥的病因、病緣之間的關(guān)聯(lián)并進(jìn)行可視化分析。如圖5所示,不同的疾病中涉及到了不同的病緣,但是不同的病緣的產(chǎn)生存在著相似趨向,因此從這個(gè)角度來看,虛熱癥、未成型熱癥、紊亂熱癥、熱癥擴(kuò)散以及伏熱癥在外緣形成上存在一定的相似性。如虛熱癥的外緣為外緣虛熱,其形成多與年齡、境遇、時(shí)刻、病體等因素相關(guān)。未成型熱癥的外緣為外緣未成型以及外緣擴(kuò)散,其形成多與自性、年齡、時(shí)刻等因素相關(guān)。伏熱癥的外緣為外緣隱伏其產(chǎn)生多與年齡、病體等因素相關(guān)。因此,上述闡述所涉及的熱癥及其外緣的產(chǎn)生上幾乎受到了一致因素的影響。其中紊亂熱癥、伏熱癥、熱癥擴(kuò)散在病因涉及部位上更具相似性,其大多都涉及到了肝、腎、心等部位;未成型熱癥、陳舊熱癥、濁熱癥、擴(kuò)散熱癥間在病因病緣上存在著一定的關(guān)聯(lián),如未成型熱癥和陳舊熱癥之間存在著夾風(fēng)陳舊熱癥的表現(xiàn),而濁熱癥和陳舊熱癥在外緣上都是外緣陳舊等諸如此類的關(guān)聯(lián)。了解病因關(guān)系有利于醫(yī)生全面把握不同疾病之間的關(guān)系,判斷其他潛在疾病,從整體上制訂治療方案,這也體現(xiàn)了藏醫(yī)學(xué)中相互聯(lián)系的思想。

圖5 熱癥病因關(guān)系圖

3.5 用藥規(guī)律分析及可視化

關(guān)于用藥規(guī)律的分析首先進(jìn)行用藥基本情況統(tǒng)計(jì),之后再依據(jù)每組處方的藥材情況分別進(jìn)行聚類分析與關(guān)聯(lián)分析。本節(jié)中,K-means聚類分析展現(xiàn)的是用藥相似性之間表現(xiàn)的主治疾病、方劑類型的關(guān)聯(lián)情況,而基于Apriori算法的關(guān)聯(lián)分析展現(xiàn)了藏醫(yī)學(xué)的常用藥材與常用藥材組合,節(jié)點(diǎn)代表的每一種藥材,權(quán)重代表使用的藥材之間的關(guān)聯(lián)強(qiáng)弱程度。

3.5.1 用藥基本情況統(tǒng)計(jì)

用藥基本情況分別對(duì)方劑類型、處方用藥以及主治疾病進(jìn)行了統(tǒng)計(jì)。如圖6所示,用以分析的用藥數(shù)據(jù)中方劑類型共有15種,數(shù)量從多到少依次是散劑、湯劑、瀉藥配方、草藥配方等。其中散劑配方數(shù)量遙遙領(lǐng)先,共有123方,接著是湯劑74方,瀉藥配方50方,草藥配方40方等,方劑種類大多還是消除疾病的處方。

圖6 方劑類型統(tǒng)計(jì)情況

其次,對(duì)處方整體用藥情況進(jìn)行統(tǒng)計(jì)。因涉及藥材種類繁多,只截取了前20進(jìn)行可視化展示。如圖7所示,可以清楚地看到訶子、蓽茇、小豆蔻、紅花、白糖的數(shù)量相比較其他藥材明顯更多且差距較大,而后續(xù)藥材使用數(shù)量的差距就開始變小,但其他藥材使用量差距較小。從表1剩余部分藥材統(tǒng)計(jì)情況中,也可以觀察到藥材使用頻次的差距也是十分小的。

表1 剩余部分藥材統(tǒng)計(jì)情況

圖7 藥材統(tǒng)計(jì)情況

圖8 主治疾病統(tǒng)計(jì)情況

用藥藥材的統(tǒng)計(jì)是對(duì)藏醫(yī)學(xué)用藥的整體了解,這可以看出藏醫(yī)學(xué)用藥偏向于生活常見食材,這反映藏醫(yī)學(xué)優(yōu)先考慮以食養(yǎng)病的思想。同時(shí)藥材統(tǒng)計(jì)中一些較為罕見的藥材,也將藏醫(yī)學(xué)與其他醫(yī)學(xué)用藥方面的特殊性區(qū)分開來。

最后是對(duì)主治疾病的統(tǒng)計(jì),可以看到消化不良以及黃水病排在前列,數(shù)據(jù)中也有不少關(guān)于熱癥的疾病?!睹茉E本》中就提到很多關(guān)于熱癥的講述——熱癥的總治法、未成型熱癥、虛熱癥、伏熱癥、陳舊熱癥等,因此《后序本》中關(guān)于熱癥治療也不少。此部分的統(tǒng)計(jì)是對(duì)藏醫(yī)學(xué)主治疾病的基本了解,也為后續(xù)新處方預(yù)測(cè)分析的疾病選擇做了前期了解。

3.5.2 藥材關(guān)聯(lián)分析可視化

基于Apriori算法的藥物關(guān)聯(lián)分析,其目的是探尋藏醫(yī)學(xué)在治療疾病時(shí)所使用藥材間存在的關(guān)聯(lián)與規(guī)律。藥材關(guān)聯(lián)分析利用了《密訣本》中不同疾病治療所需的藥方實(shí)體,根據(jù)不同的藥材在不同處方的共現(xiàn)來建立不同藥材之間的關(guān)聯(lián)并進(jìn)行了可視化分析。如圖9所示,可以清晰地看到較為突出的點(diǎn)有訶子、紅花、蓽茇、白糖、小豆蔻、白檀香、竹黃等,這些藥材同樣是出現(xiàn)頻次最高的幾類藥物,說明它們是藏醫(yī)學(xué)用藥的重要藥材。接著觀察線條的權(quán)重,可以直觀地看到藥材間關(guān)聯(lián)的緊密程度,即哪些藥材之間同時(shí)使用的頻率更高。

藍(lán)色線條中,以訶子為中心的藥物——刺芒龍膽、離婁、巴豆、臘腸果、澤漆、白檀香等,相互之間聯(lián)系就很緊密。此外,紅花、竹黃、小豆蔻、蓽茇之間的聯(lián)系同樣十分緊密,再向外桂皮、胡椒、石榴、白糖等的聯(lián)系也較為突出。從圖中還能觀察到部分藥材的聯(lián)系是獨(dú)立的,由于參數(shù)設(shè)置的原因,不能說這些獨(dú)立的藥材與其他藥物之間沒有聯(lián)系,只能說明關(guān)聯(lián)很弱。

可視化結(jié)果直觀地展現(xiàn)了藥材的重要性以及藥材之間關(guān)聯(lián)的強(qiáng)弱,這些關(guān)系反映出藏醫(yī)學(xué)用藥的常用藥材以及常用藥材組合,為理清藏醫(yī)學(xué)用藥規(guī)律有極大幫助。

3.5.3 藥材類別分析可視化

在藥物類別分析中提取了《密訣本》中不同處方的方劑類型實(shí)體以及藥材實(shí)體,是根據(jù)處方用藥情況進(jìn)行K-means聚類,觀察聚類結(jié)果中同一類別下藥劑類型和主治疾病的情況。圖10為聚類可視化結(jié)果,藍(lán)色圓點(diǎn)、綠色圓點(diǎn)、紅色五角星、天藍(lán)色圓點(diǎn)、紫色五角星分別代表聚類類別0、1、2、3、4。圖中可以直觀地看到天藍(lán)色圓點(diǎn)最多,即類別3數(shù)量最多,結(jié)合整個(gè)聚類分析結(jié)果,類別0中數(shù)量最多的藥劑類型是散劑與丸劑,主治疾病大多是消化不良,用藥藥材前幾有胡椒、蓽茇、生姜、藏紅鹽、小豆蔻等;類別1中則是瀉藥配方數(shù)量最多,主治疾病中脈病、頭部疾病以及涉及五臟六腑的占比較多,藥材中澤漆、訶子、刺芒龍膽、大黃、狼毒等排在前列;類別2最多的仍是散劑,其次是膏劑、藥油,疾病上突出的是熱癥相關(guān)疾病,藥材則是紅花、竹黃、白糖、訶子、牛黃等;類別3中是湯劑、散劑,主治疾病上主要是黃水病、消化不良和龍型疾病,藥材主要有訶子、秦艽、地衣、紫草、黃連等;類別4最多的仍是散劑,主治疾病則是消化不良、嘔逆、肺病、腹瀉和痔瘡,藥材主要有蓽茇、小豆蔻、干姜、桂皮、石榴等。

圖10 藥物聚類結(jié)果

圖11 中藥使用頻率統(tǒng)計(jì)圖

聚類結(jié)果體現(xiàn)出了不同主治疾病之間的聯(lián)系,并且對(duì)于發(fā)現(xiàn)同類疾病新的治療藥物具有一定的參考價(jià)值,這同時(shí)也體現(xiàn)了不同的藥劑類型在治療不同疾病時(shí)的一種相似性,如研究發(fā)現(xiàn)散劑在治療消化不良以及與消化系統(tǒng)相關(guān)的疾病中使用最多,瀉藥的配方多和內(nèi)臟相關(guān)等,這些發(fā)現(xiàn)對(duì)于理解藏醫(yī)的醫(yī)學(xué)思想有巨大的幫助。當(dāng)然不同疾病需要不同類型的藥劑,這同時(shí)也說明了在藏醫(yī)學(xué)中認(rèn)為,不同的藥劑類型對(duì)于疾病的治療效果也是存在著差異的。

3.5.4 方劑藥材偏向性分析

考慮到每一類方劑數(shù)量不等,對(duì)各種類型方劑在不同類別中的占比進(jìn)行了統(tǒng)計(jì),如表2所示。方劑類別占比情況有助于了解不同方劑中使用藥材的偏向性。類別分布中,瀉藥配方在類別1中占比最大,而其他方劑幾乎沒有出現(xiàn)在此類別中,可以看出瀉藥配方在藥材使用上與其他方劑差異較大。

表2 各方劑類別占比情況

從表1來看,藥材的使用偏向性除了受到疾病的影響以及藥物作用效果的影響,同樣也受到了藥物使用方法的影響,不同的藥物要根據(jù)其特性來組成不同的藥劑,以此來最大程度地保留藥材效用。如湯劑在類別3中占比最大,該類目下的訶子、秦艽、地衣、紫草、黃連、廣木香、沙棘等藥材都是湯劑慣常使用或可考慮使用的藥材。

3.6 新處方預(yù)測(cè)分析

新處方預(yù)測(cè)是利用該類疾病現(xiàn)有處方的用藥規(guī)律預(yù)測(cè)新的用藥處方[41],本研究選取的是主治疾病與熱癥相關(guān)的處方進(jìn)行新處方預(yù)測(cè)分析。數(shù)據(jù)主要來源于《四部醫(yī)典》的《密訣本》以及《后序本》與治療熱癥相關(guān)的處方,共有124個(gè)處方被錄入到R語(yǔ)言中進(jìn)行數(shù)據(jù)分析。

這些處方所處理的熱癥包括熱癥總治、陳舊熱癥、擴(kuò)散熱癥、伏熱癥、紊亂熱癥、寒熱、濁熱癥、熱癥擴(kuò)散治療法、虛熱癥、未成型熱癥共10個(gè)方面。

這些數(shù)據(jù)輸入到R語(yǔ)言中進(jìn)行數(shù)據(jù)分析,同時(shí)也對(duì)處方中的藥材名稱進(jìn)行了統(tǒng)一,以此來確保藥方的準(zhǔn)確性。同時(shí),為了保證研究的嚴(yán)謹(jǐn)性,也對(duì)相應(yīng)的處方根據(jù)《中華本草》進(jìn)行了合理完善。藥材規(guī)范如表3所示。

表3 藏醫(yī)藥材規(guī)范表

首先利用R語(yǔ)言的itemFrequency的數(shù)據(jù)分析功能,對(duì)與治療熱癥相關(guān)的藥物進(jìn)行用藥頻次統(tǒng)計(jì),結(jié)果如表4所示。

表4 藏醫(yī)治療“熱癥”方劑中使用頻次前20的藥材

使用頻次從高到低排列,依次為紅花、竹黃、訶子、牛黃、檀香、秦艽、砂仁、藏茵陳、川烏,這體現(xiàn)這些藥物在治療熱癥方面為藏醫(yī)比較常用的藥材。“紅花”作為藏醫(yī)中治療“熱癥”最為常用的一味藥材,它的使用率達(dá)到了30%左右,紅花是藏醫(yī)中應(yīng)對(duì)熱癥效果比較出眾的一味藥材。當(dāng)然,其中也發(fā)現(xiàn)一些有趣的現(xiàn)象,如在藏醫(yī)用藥中大部分的藥物均為藏醫(yī)比較獨(dú)特的藥材,如藏茵陳、哇夏嘎等,但白糖在藏醫(yī)治療熱癥方面使用頻率較高,與此相類似的是中醫(yī)藥中的“白砂糖”也是一味清熱的藥物,從這一方面來看,可以看到除藏醫(yī)其用藥的獨(dú)特性以外,在某些方面與傳統(tǒng)的中醫(yī)還存在一些關(guān)聯(lián)。

基于關(guān)聯(lián)規(guī)則的藏醫(yī)治療“熱癥”的組方規(guī)律分析中,將支持度設(shè)為0.06,置信度設(shè)為0.09,得到基于124個(gè)處方的58條關(guān)聯(lián)規(guī)則數(shù)據(jù)。在關(guān)聯(lián)數(shù)據(jù)的處理中使用了比較經(jīng)典的Apriori模型,在這一模型中常用的衡量標(biāo)準(zhǔn)有支持度(Support)、置信度(Confidence)以及提升度(Lift),支持度在本研究中被認(rèn)為是某一藥物出現(xiàn)的頻次,置信度則是指某對(duì)或者某幾個(gè)藥物共同出現(xiàn)的頻率,提升度則是指前一個(gè)藥物出現(xiàn)對(duì)于后一個(gè)藥物出現(xiàn)的提升水平,這反映出關(guān)聯(lián)規(guī)則的有效性。下面給出支持度、置信度以及提升的公式定義[42]:

Sup(藏藥)=P(藏藥)

ConF(關(guān)聯(lián)規(guī)則)=P(后一味藏藥|前一味或幾味藏藥)

Lift(關(guān)聯(lián)規(guī)則)=P(后一味藏藥|前一味或幾味藏藥)/P(藏藥)

將前10條的關(guān)聯(lián)規(guī)則按照其提升度的從低到高排序,如表5所示。

表5 Confidence>0.09前20關(guān)聯(lián)規(guī)則排序

在上述的藥物關(guān)聯(lián)圖中,可以看到節(jié)點(diǎn)的大小表示該節(jié)點(diǎn)的置信度的大小,而顏色的深淺則表示關(guān)聯(lián)規(guī)則的提升度,基于124個(gè)處方所發(fā)現(xiàn)的關(guān)聯(lián)規(guī)則提升度均在合理的區(qū)間。

從圖12可以看到,不同的藥物根據(jù)其之間的相似性分別成為了不同的類別,地衣、黃連、秦艽、紫草、大株紅景天的距離比較近,說明這幾味藥材在治療熱癥方面是比較常用的藥材組合。中間的部分,以紅花為中心,向外擴(kuò)展鏈接了竹黃、牛黃以及丁香等,這說明紅花作為一個(gè)重要的中心節(jié)點(diǎn),在藏醫(yī)中常常與其他藥材進(jìn)行組配治療。右邊則是訶子、毗黎勒以及余甘子,這3味藥材是藏醫(yī)中俗稱的“三果”,是治療熱癥中極為常用的藥材組合。

圖12 “熱癥”藥物關(guān)聯(lián)圖

通過上述的關(guān)聯(lián)規(guī)則的展示以及可視化,可以直觀地看到藏醫(yī)在治療“熱癥”方面比較常用的藥物組合以及藏醫(yī)常用的核心藥物,這對(duì)于理解藏醫(yī)的用藥思路以及治病思路有很大的幫助。

通過關(guān)聯(lián)規(guī)則的呈現(xiàn)得到了藏醫(yī)的核心藥物,在此基礎(chǔ)上選取治療熱癥中使用率較高的前20味藥材來進(jìn)行新處方的知識(shí)發(fā)現(xiàn)。

首先對(duì)前20味的藥材進(jìn)行數(shù)據(jù)處理,本文將這20個(gè)藥材在每個(gè)處方中出現(xiàn)的情況,定義為二分類變量,結(jié)果如下:

將處理好的數(shù)據(jù)輸入到Spss26.0中進(jìn)行數(shù)據(jù)處理,利用系統(tǒng)聚類的方法進(jìn)行聚類,將最小聚類數(shù)量約定為5,最大聚類數(shù)量約定為10,利用組間鏈接的方法形成新的聚類,結(jié)果如圖13所示。

圖13 新方生成的層次聚類結(jié)果

此部分目的在于,依托于高頻的治療熱癥的藥材,根據(jù)他們之間的相似度距離來形成新的處方,先前的研究將新處方生成均為3~5味的藥材組合[43],所以據(jù)此將本研究新處方的藥材組合約定為3味、4味以及5味藥材,形成的備選處方如表6所示。以上就是利用藏醫(yī)治療熱癥的處方所形成的新處方預(yù)測(cè),從數(shù)據(jù)處理的角度看來,利用藥物之間的關(guān)聯(lián)規(guī)則形成新的治療方案,是未來值得去探索的一個(gè)方向。這些研究成果有利于醫(yī)學(xué)領(lǐng)域發(fā)現(xiàn)新的治療方案,為現(xiàn)有的治療提供一個(gè)參考。本研究只是從數(shù)據(jù)層面提供一個(gè)基本的探索方向,新處方的具體效用還需實(shí)踐進(jìn)行檢驗(yàn)。

表6 基于層次聚類的藏醫(yī)治療“熱癥”的新處方預(yù)測(cè)

4 結(jié) 語(yǔ)

本研究從數(shù)字人文視角出發(fā),以《四部醫(yī)典》這一經(jīng)典藏醫(yī)學(xué)古籍為內(nèi)容主體,利用文本分詞、統(tǒng)計(jì)分析、關(guān)聯(lián)分析、聚類分析、可視化技術(shù)等相關(guān)工具方法,對(duì)《四部醫(yī)典》中的《密訣本》《后序本》分別進(jìn)行病癥關(guān)系分析、病因關(guān)系分析、用藥規(guī)律分析以及新處方預(yù)測(cè)分析,挖掘藏醫(yī)學(xué)古籍價(jià)值內(nèi)涵,推動(dòng)藏醫(yī)學(xué)古籍的傳承和利用。

在技術(shù)上,利用統(tǒng)計(jì)分析、關(guān)聯(lián)分析、聚類分析等方法,提取藏醫(yī)學(xué)古籍中可用的數(shù)據(jù)信息,對(duì)數(shù)據(jù)進(jìn)行整理,得到可進(jìn)行分析的結(jié)構(gòu)化數(shù)據(jù),為藏醫(yī)學(xué)古籍內(nèi)容挖掘提供了一個(gè)可探索的方向。在內(nèi)容成果上,主要有以下幾點(diǎn):①對(duì)疾病癥狀的聚類分析不僅能得到疾病的類目情況,還梳理出疾病在癥狀表現(xiàn)上具有的相似性,有助于疾病診斷;②病癥的關(guān)聯(lián)分析印證了龍、赤巴、培根在藏醫(yī)學(xué)中的重要地位,還體現(xiàn)出人體是一個(gè)整體的系統(tǒng),身體各部位之間緊密聯(lián)系;③病因分析中,龍、赤巴、培根等是重要的疾病發(fā)病的部位,境域、時(shí)刻、年齡等是大部分疾病的病緣,這些也體現(xiàn)出藏醫(yī)在診斷疾病病因中的基本情況信息;④病因關(guān)系的分析展示了不同熱癥之間的關(guān)聯(lián)關(guān)系,這有利于了解不同疾病在疾病產(chǎn)生時(shí)的相似性,幫助疾病預(yù)防;⑤從用藥統(tǒng)計(jì)情況來看,藏醫(yī)的處方種類比較多,其中散劑、湯劑類別的處方最多,從藥材來看,訶子、蓽茇、小豆蔻、紅花、白糖等是藏醫(yī)最常見的藥材,而這些藥材的統(tǒng)計(jì)也體現(xiàn)了藏醫(yī)以食養(yǎng)病的思想,在治療方面,消化不良、黃水病以及與熱癥相關(guān)的疾病是處方主治最多的疾??;⑥藥物的關(guān)聯(lián)分析,直觀地展現(xiàn)了訶子、紅花、蓽茇、白糖、小豆蔻、白檀香、竹黃等各種藥材的重要程度和關(guān)聯(lián)情況,有助于了解藏醫(yī)學(xué)藥物組合情況以及新處方預(yù)測(cè);⑦藥物的聚類分析,得到了藥材相似性體現(xiàn)出的主治疾病之間的聯(lián)系,并且這種藥材的相似性,有利于挖掘出同類疾病下新的治療藥物,以及能幫助了解不同方劑中使用藥材的偏向性;⑧新處方預(yù)測(cè)是對(duì)關(guān)聯(lián)分析與聚類分析的綜合運(yùn)用,得到了熱癥疾病的核心藥物組合,進(jìn)而得到新的用藥處方,為新處方的開發(fā)提供了參考方向。

本文以藏醫(yī)學(xué)古籍《四部醫(yī)典》為例,探索藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)的新路徑,對(duì)藏醫(yī)學(xué)古籍資源乃至中醫(yī)學(xué)古籍資源的開發(fā)利用有一定貢獻(xiàn),但還存在一定的提升空間。藏醫(yī)學(xué)古籍《四部醫(yī)典》共四部,其中第一、二部主要內(nèi)容是藏醫(yī)學(xué)基本理論,第三、四部主要內(nèi)容是疾病的治法和藥方,本文依據(jù)數(shù)據(jù)挖掘需要,將數(shù)據(jù)來源劃定為第三部和第四部,未來需要將第一、二部納入到研究范圍,進(jìn)一步完善研究成果。除此之外,藏醫(yī)學(xué)領(lǐng)域中的其他有價(jià)值的古籍也是值得關(guān)注的研究對(duì)象,從而構(gòu)建完整的藏醫(yī)學(xué)古籍知識(shí)發(fā)現(xiàn)和利用體系。

猜你喜歡
藏醫(yī)學(xué)熱癥古籍
中醫(yī)古籍“疒”部俗字考辨舉隅
我國(guó)北方地區(qū)圍產(chǎn)期奶牛乳熱癥發(fā)病率調(diào)查及分析
豬高熱癥的發(fā)病特點(diǎn)、臨床癥狀及防控措施
關(guān)于版本學(xué)的問答——《古籍善本》修訂重版說明
天一閣文叢(2020年0期)2020-11-05 08:28:06
關(guān)于古籍保護(hù)人才培養(yǎng)的若干思考
天一閣文叢(2018年0期)2018-11-29 07:48:08
藏醫(yī)學(xué)的起源及其相關(guān)問題研究
西藏研究(2017年3期)2017-09-05 09:45:12
我是古籍修復(fù)師
金橋(2017年5期)2017-07-05 08:14:41
淺述藏醫(yī)學(xué)對(duì)傳染病的認(rèn)識(shí)
藏醫(yī)學(xué)對(duì)痔瘡的認(rèn)識(shí)及其問卷調(diào)查
西藏科技(2016年9期)2016-09-26 12:21:41
探討藏醫(yī)學(xué)與因明學(xué)之間的關(guān)聯(lián)
西藏科技(2016年5期)2016-09-26 12:16:39
茶陵县| 郑州市| 太白县| 长顺县| 连平县| 泊头市| 武山县| 宜宾县| 磴口县| 永兴县| 海晏县| 黑山县| 邳州市| 常宁市| 商南县| 元氏县| 土默特左旗| 隆尧县| 西城区| 和顺县| 陆丰市| 新泰市| 阜新市| 迭部县| 株洲县| 巍山| 大英县| 淳安县| 东丽区| 五莲县| 两当县| 古蔺县| 沙河市| 磐石市| 阳江市| 玛沁县| 新沂市| 延吉市| 隆化县| 拜城县| 岑巩县|