国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中醫(yī)古籍醫(yī)案知識元標引方法的思考及對策

2022-05-18 02:22陳晗婷劉昕妍王于靜林子宜顧元燁楊曜嘉王維廣翟雙慶
南京中醫(yī)藥大學學報 2022年5期
關鍵詞:醫(yī)案病機古籍

陳晗婷,劉昕妍,王于靜,林子宜,顧元燁,楊曜嘉,王維廣,翟雙慶

(北京中醫(yī)藥大學中醫(yī)學院,北京 100029)

中醫(yī)古籍卷帙浩繁,其中醫(yī)案形式多樣,內(nèi)容豐富,記載了海量疾病診療方法與經(jīng)驗。但大部分古籍作為文物被各大圖書館、博物館收藏,這對檢索查閱造成困難。隨著中醫(yī)現(xiàn)代化研究的深入,傳統(tǒng)古籍整理手段與知識獲取方式已不能滿足當前中醫(yī)學發(fā)展和傳承的需要。對古籍中的醫(yī)案進行知識元標引,不僅能將醫(yī)案信息完整保留,實現(xiàn)資源共享,也能夠在數(shù)據(jù)深度挖掘方面,如特定證型診療規(guī)律[1]的研究、組方用藥[2]等方面發(fā)揮相應作用。

1 中醫(yī)古籍知識元標引現(xiàn)狀

20世紀70年代后期,弗拉基米爾·斯拉麥卡指出,知識的控制單位將從文獻深入到其中的數(shù)據(jù)、公式、事實、結(jié)論等最小的獨立的“知識元”[3]。在中醫(yī)古籍標引中,柳長華先生提出“知識元是知識系統(tǒng)中可以表達一個完整概念的不可分解的最小知識單元。知識元是由一個或一個以上的元概念和構建這個元概念的語義成分(屬性詞)構成的”[4]。知識元標引即通過分析文本內(nèi)容邏輯以“知識元-關系-知識元”的方式構建知識圖譜,形成中醫(yī)古籍結(jié)構化數(shù)據(jù)庫。

知識元標引通常有兩種模式:一是自上而下的標引模式,即以知識體、知識元、語義類型、語義關聯(lián)的順序,知識體量逐漸縮小進行標引(下文稱為“模板標引方法”)[5];二是自下而上的標引模式,即先對數(shù)據(jù)進行預處理,提取關鍵詞,提取關鍵句,最后定義知識元結(jié)構(下文稱為“節(jié)點自定標引方法”)[6]。

目前根據(jù)模板標引方法在中醫(yī)藥領域已構建的平臺有由中國中醫(yī)科學院研發(fā)的“古籍文獻知識加工平臺”[7],國家重點研發(fā)計劃立項的“中醫(yī)古籍‘病脈證并治’知識元標引系統(tǒng)”[8]。模板標引方法有結(jié)構清晰、標引難度小等優(yōu)點,但在標引醫(yī)案類文本時,尚存在不足之處。因此,本研究提出基于自下而上標引模式的節(jié)點自定標引方法,并構建了標引平臺“中醫(yī)經(jīng)典知識挖掘與傳播平臺”。下文將從標引醫(yī)案時模板標引方法標引流程及存在的問題,節(jié)點自定標引方法的解決對策,兩方法標引同一醫(yī)案的對比這三方面進行詳細論述。

2 模板標引方法

2.1 模板標引方法

模板標引方法依托“中醫(yī)古籍‘病脈證并治’知識元標引系統(tǒng)”進行介紹。系統(tǒng)提前為標引者設立“病脈證并治”“方劑”“本草”“醫(yī)案”等標引模板,并結(jié)合中醫(yī)理論與辨證特點,在各模板中搭建好固定“知識體-知識元”關系框架。以下為具體操作流程。

2.1.1 確定模板 登錄系統(tǒng)后,標引者可依據(jù)自身中醫(yī)理論知識判斷并選擇需標引文本所適用模板。如醫(yī)案類中醫(yī)古籍文本可選擇“醫(yī)案”標引模板。

2.1.2 確定知識元 標引者根據(jù)標引內(nèi)容,將需標引文本劃分至不同的知識元。在知識體(即所選模板)標引界面,模板提前設立該知識體所可能包含的全部知識元。如病脈證并治模板包含知識元:病名、病因、病位、病程、鑒別診斷、脈位、主脈、兼脈、死脈、辨證、病機、治則、治法、方劑、藥物、計量、炮制、加減法、煎法、制法、服法、中病反應、欲解時、針灸、其他治法、治案、預后、宜忌、誤治、釋義、其他,共計31個知識元。

2.1.3 確定語義 選定知識元相應內(nèi)容后,標引者可對知識元進一步拆分,對文本再次碎片化,提取語義并根據(jù)系統(tǒng)推薦選擇需創(chuàng)建的語義關聯(lián)。平臺提供釋義關系、并病關系、合病關系、舌機關系、傳變關系、誤治關系、組成關系、從屬關系、鑒別關系、脈機關系、癥機關系、病脈關系、病證關系、藥性功用關系、病因關系、病脈關系、方藥關系、真臟脈關系、脈證關系、藥效關系、藥證關系、方效關系、方證關系、配伍關系、癥治關系、證象關系、辨治關系、證因關系,共28種語義關系。操作界面如圖1。此標引方式具有較強結(jié)構性,便于研究人員索引與學習。

圖1 中醫(yī)古籍“病脈證并治”知識元標引系統(tǒng)操作界面Fig.1 The "combined treatment based on diagnosed disease, pulse and syndromes" system operation interface

2.2 標引示例

如標引文字:“一人久瘧,先間日,后一日一來,早晚不定,皆腎不納氣故也。用人參、茯苓、半夏各一錢,丁香、五味子各五分,益智、甘草各三分,姜水煎服?!盵9]195

根據(jù)文本,可提取知識元:病名-久瘧;病程-先間日,后一日一來,早晚不定;病機-腎不納氣;方劑-一人久瘧方劑;藥物-人參、茯苓、半夏,劑量-一錢;藥物-丁香、五味子,劑量-五分;藥物-益智、甘草,劑量-三分;服法-姜水煎服。

相應知識元下提語義并建立語義關系。“久瘧”提語義為“病癥-瘧”,“先間日,后一日一來,早晚不定”提語義為“癥候表現(xiàn)-瘧先間日”“癥候表現(xiàn)-瘧一日一來”“癥候表現(xiàn)-瘧早晚不定”,“腎不納氣”提語義為“病因病機-腎不納氣”,“一人久瘧方劑”提語義為“方劑-一人久瘧方劑”,“人參、茯苓、半夏”提語義為“藥物-人參”“藥物-茯苓”“藥物-半夏”,“一錢”提語義為“劑量-一錢”,“丁香、五味子”提語義為“藥物-丁香”“藥物-五味子”,“五分”提語義為“劑量-五分”,“益智、甘草”提語義為“藥物-益智”“藥物-甘草”,“三分”提語義為“劑量-三分”,“姜水煎服”提語義為“用法-姜水煎服”。建立五種語義關聯(lián),分別為病證關系、辨治關系、藥制量關系、方用關系、組成關系。形成知識圖譜如圖2所示。

圖2 久瘧案知識圖譜(模板標引方法)Fig.2 Knowledge graph of malaria case (Template indexing method)

2.3 模板標引方法存在的問題

2.3.1 標引復診醫(yī)案知識元及語義關聯(lián)模板數(shù)量不足 中醫(yī)古籍的記敘方式較為自由。由于“中醫(yī)古籍‘病脈證并治’知識元標引系統(tǒng)”僅支持建立其模板預設的語義關聯(lián),因此即使對于規(guī)范性較強的醫(yī)案類中醫(yī)古籍文本,系統(tǒng)也不能保證其知識元及語義關聯(lián)能夠完全適用。如含有復診過程的醫(yī)案,系統(tǒng)并未給出初診、復診、三診等知識元,標引時只能將所有診療過程統(tǒng)一劃分為單一知識元“癥候表現(xiàn)”或“治則治法”“誤治”等,無法反映出各部分診療過程所包含的邏輯關系。

且平臺提前為用戶設立標引模板雖然降低了標引難度,但固定的知識元與語義關聯(lián)并不利于開展一些探索性、需要自定義建立不同知識元間關系的研究。如地理環(huán)境因素對某一病癥的影響、特定年代與用藥的關系、特定證型與方藥的聯(lián)系等研究。

2.3.2 語義粒度較大 語義粒度[10]反映了語義文本所包含的信息量,文本包含信息量大,語義粒度便大,反之則小?!爸嗅t(yī)古籍‘病脈證并治’知識元標引系統(tǒng)”中,知識元為包含同一類中醫(yī)知識的語料的集合名稱,語義為知識元的再分,不同語義對應包含不同信息的文本。系統(tǒng)以其提前給出的語義(病證、病因病機、藥物、劑量等)為基本單位建立語義關聯(lián)。在實際標引中,用戶往往按知識元、語義將原文劃分,雖然結(jié)構清晰,但在語義粒度方面則有所欠缺。如標引病機“肝木乘脾”,根據(jù)模板標引方法應建立知識元病機-肝木乘脾,并提語義病因病機-肝木乘脾。但這種標引方式并不能表現(xiàn)肝氣疏泄太過,橫逆犯脾胃的病理過程,導致“中醫(yī)古籍‘病脈證并治’知識元標引系統(tǒng)”最終建立的知識網(wǎng)絡具有一定局限性,可能不利于中醫(yī)古籍的智能檢索或規(guī)則挖掘等研究的開展。

3 節(jié)點自定標引方法

節(jié)點自定標引方法主要從自定義建立語義及語義關系,并根據(jù)標引內(nèi)容選擇性建立附加節(jié)點三個方面進行?!肮?jié)點自定標引方法”的使用依托“中醫(yī)經(jīng)典知識挖掘與傳播平臺”(http://202.204.35.217/dp/login.html),在標引過程中,節(jié)點自定標引方法可有效解決模板標引方法存在的問題。

3.1 規(guī)定關系建立節(jié)點為最小知識單元

節(jié)點自定標引方法中知識元是將原文碎片化后得到的,可以表達一個完整概念,且不可拆分的最小知識單元。語義是對所屬知識元的解釋與補充,并取代知識元作為知識網(wǎng)絡中關系建立節(jié)點。如“杜仲溫腎陽”,為解釋動詞中所包含的中醫(yī)信息,我們可提取知識元“杜仲”“腎陽”。同時,為解釋杜仲溫補的功效,須對腎陽的屬性進行標引,即給腎陽標注增加這一特征,并以“注釋關系”標注特征和實體之間的關系。本句話的語義為“杜仲-杜仲”“腎陽-腎陽”,并在此兩者之間建立語義關聯(lián)“導致關系”,在“腎陽”和“增加”之間建立“注釋關系”。此方法使最終形成的知識網(wǎng)絡準確性大大增加,且能夠極大程度保留原文含義。見圖3。

圖3 “杜仲溫腎陽”知識圖譜(節(jié)點自定標引方法)Fig.3 Knowledge graph of "eucommia ulmoides increases kidney Yang" (Custom node method)

3.2 自定義建立語義關系

“中醫(yī)經(jīng)典知識挖掘與傳播平臺”支持自定義建立語義關系,自定義主要體現(xiàn)在建立語義聯(lián)系的過程中關系名稱、建立對象、建立數(shù)量、建立方向的高度標引自由。平臺支持在任意兩個語義之間建立語義關系,關系名稱可按用戶標引需要手動輸入;關系建立有“一對一”與“一對多”兩種建立形式,正向、逆向、雙向三種方向,且同一知識元無關系建立限制。如下文圖4知識圖譜中“常溪傷寒第二階段癥狀”,既可與癥狀“渴飲”“不多飲”建立一對多單向?qū)儆陉P系,又可與“常溪傷寒第一階段病機”“常溪傷寒第三階段病機”分別建立一對一單向?qū)е玛P系。在標引過程中,標引關系自由建立的實現(xiàn),對各團隊根據(jù)自身研究方向與研究內(nèi)容建立符合自身需要的標引手冊,并進行深度知識挖掘研究具有重要意義。

3.3 消歧方式

節(jié)點自定標引方法相對自由,雖然這有利于探索性研究或指向性研究的開展,但自由標引也可能造成標引命名不規(guī)范的問題,如同一標引內(nèi)容“二陳湯藥物組成”可能會出現(xiàn)“二陳湯的藥物組成”“二陳湯組成”“二陳湯的組成”等不同標引形式。為后續(xù)查找、研究工作造成困難。

由于中醫(yī)古籍目前并無敘詞表,課題組建立了相關知識元標引規(guī)則[11],規(guī)定非一級標引名稱藥物組成、癥狀、主治病癥、功效、制法、服法、用法、藥后調(diào)理、用藥后表現(xiàn)、應用注意事項、應用禁忌、治法、治療用藥;并從從屬、因果、空間關系、方藥、其他五方面規(guī)定標準關系名稱40個;設立關系申報機制,由專家討論標引關系的增減與應用語境,保證了標引的規(guī)范化,以便后期檢索與科學研究數(shù)據(jù)、深度挖掘整理等工作的開展。

3.4 選擇性建立附加節(jié)點

附加節(jié)點是對有原文對應的節(jié)點的歸納,以增強知識圖譜的結(jié)構性。如標引“外感風寒,惡寒發(fā)熱”,可將“惡寒”“發(fā)熱”歸納為“傷寒醫(yī)案癥狀”,“風邪”“寒邪”歸納為“傷寒醫(yī)案病機”。附加節(jié)點“傷寒醫(yī)案癥狀”“傷寒醫(yī)案病機”與有原文對應的節(jié)點“惡寒”“發(fā)熱”“風邪”“寒邪”共同作為一個完整醫(yī)案知識圖譜的組成部分。同時,附加節(jié)點展示了文本中各節(jié)點之間的邏輯關系。如麻黃湯的藥物組成為麻黃、桂枝、杏仁、甘草,標引時這四味藥并不直接屬于節(jié)點“麻黃湯”,而是增加一個附加節(jié)點“麻黃湯藥物組成”,這4味藥屬于這個附加節(jié)點。

3.5 標引示例

以《續(xù)名醫(yī)類案》中的醫(yī)案為例。該醫(yī)案主要闡述了張子和隨病情變化治療傷寒的用藥及經(jīng)驗。原文是“張子和曰:予之常溪,雪中冒寒入浴,重感風寒,遂病不起。但使煎通圣散單服之,一二日不食,惟渴飲水,亦不多飲。時時使人捶其股,按其腹,凡三四日不食,日飲水一二十度。至六日,有譫語妄見,以調(diào)胃承氣湯下之,汗出而愈。常謂人曰:傷寒勿妄用藥,惟飲水最為妙藥,但不可使之傷,常令揉散,乃大佳耳。至六七日,見有下證,方可下之,豈有變異哉。奈何醫(yī)者禁人飲水,至有渴死者。病患若不渴,強與水飲亦不肯飲也?!盵9]3

圖4、圖5分別為通過節(jié)點自定標引方法、模板標引方法標引后形成的知識網(wǎng)絡。

圖4 常溪傷寒案知識圖譜(節(jié)點自定標引方法)Fig.4 Knowledge graph of Changxi typhoid case(Custom node method)

圖5 常溪傷寒案知識圖譜(模板標引方法)Fig.5 Knowledge graph of Changxi typhoid case (Template indexing method)

比較以上兩圖可以發(fā)現(xiàn):

(1)在結(jié)構性方面,模板標引方法結(jié)構性較強。固定設置的關系框架使醫(yī)案結(jié)構一目了然。

(2)在原文表達方面,節(jié)點自定標引方法能夠更好地還原原文,體現(xiàn)原文中不同診次之間的病機和用藥變化。通過建立附加節(jié)點,節(jié)點自定標引方法體現(xiàn)了醫(yī)案的不同診療階段,并保留了早期診療過程中用藥對后續(xù)癥狀影響的邏輯關系。

(3)在粒度方面,節(jié)點自定標引法在標引實體中,顆粒度更小。節(jié)點自定標引方法共產(chǎn)生節(jié)點21個,模板標引方法共產(chǎn)生節(jié)點12個。通過自定義建立語義關系與提取最小知識元,節(jié)點自定標引方法將“傷寒勿妄用藥,惟飲水最為妙藥,但不可使之傷,常令揉散,乃大佳耳。至六七日,見有下證,方可下之,豈有變異哉。奈何醫(yī)者禁人飲水,至有渴死者。病患若不渴,強與水飲亦不肯飲也”這一治療經(jīng)驗簡化為“飲水”“揉散”“不傷之”。更小的粒度將易于后期數(shù)據(jù)挖掘與分析工作的進行。

4 討論

在對中醫(yī)古籍醫(yī)案的標引中,模板標引方法操作簡單,結(jié)構性強,但在完整保留中醫(yī)古籍原文含義與標引精度方面有所不足。節(jié)點自定標引方法通過規(guī)定知識元為最小知識單元,自定義建立標引關系,建立附加節(jié)點的形式,實現(xiàn)了知識網(wǎng)絡的構建。解決了模板標引方法存在的標引復診醫(yī)案知識元及語義關聯(lián)模板數(shù)量不足,語義粒度較大的問題。在保留標引原文與邏輯關系構建方面更為完善,并具有一定規(guī)范性。此方法對保留中醫(yī)古籍原文信息,進行中醫(yī)古籍數(shù)據(jù)挖掘研究具有重要意義。但節(jié)點自定標引方法也存在標引難度高,結(jié)構較為不清晰的問題,仍待進一步完善。

猜你喜歡
醫(yī)案病機古籍
西藏大批珍貴藏文古籍實現(xiàn)“云閱讀”
古籍修復師的巧手與匠心
以病機為主導的中醫(yī)臨床個體化評價方法初探
以關節(jié)炎為首發(fā)癥狀的結(jié)節(jié)病1例
類風濕關節(jié)炎并寰樞關節(jié)脫位死亡1例并文獻復習
譚波診治腦中風恢復期驗案2則
廣西古籍保護中心積極推動古籍普查工作
廣西壯族自治區(qū)圖書館舉辦古籍保護知識展
燥邪致瀉說
糖尿病從脾論治探討