国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

中醫(yī)方劑知識圖譜的構(gòu)建研究綜述

2022-10-28 09:57:26徐麗娜李燕
關(guān)鍵詞:醫(yī)藥學(xué)三元組方劑

徐麗娜,李燕

(甘肅中醫(yī)藥大學(xué)信息工程學(xué)院,甘肅 蘭州 730000)

0 引言

2012年5月17日,谷歌首次引入知識圖譜(Knowledge graph)的概念,以此來提高搜索引擎的能力[1]。知識圖譜是一種用圖來描述知識的方法,它由節(jié)點(diǎn)和邊組成,用來描述客觀世界中的各種概念、實(shí)體和實(shí)體之間的關(guān)系。知識圖譜作為一種知識表示方法,語義表達(dá)能力強(qiáng)、結(jié)構(gòu)靈活、效率高,在可解釋人工智能中發(fā)揮著非常重要的作用。隨著知識表示與存儲(chǔ)、大數(shù)據(jù)和機(jī)器學(xué)習(xí)的發(fā)展,知識圖譜理論與應(yīng)用取得了一些突破和快速發(fā)展。由于這些技術(shù)的進(jìn)步,工業(yè)界和學(xué)術(shù)界對知識圖譜產(chǎn)生了廣泛的興趣,并獲得了一定的研究成果。

隨著信息技術(shù)在醫(yī)療領(lǐng)域的快速發(fā)展及應(yīng)用,大量的醫(yī)療數(shù)據(jù)必須在該領(lǐng)域進(jìn)行處理。大量醫(yī)學(xué)數(shù)據(jù)的有效分析和利用,對于疾病的診療、風(fēng)險(xiǎn)評估、新藥研發(fā)、降低醫(yī)療費(fèi)用、醫(yī)學(xué)知識問答等具有重要作用。大數(shù)據(jù)分析在醫(yī)療領(lǐng)域應(yīng)用的關(guān)鍵是怎樣準(zhǔn)確、快速地從大量醫(yī)療數(shù)據(jù)中提取有價(jià)值的醫(yī)療信息,醫(yī)學(xué)知識圖譜構(gòu)建技術(shù)則提供了一種從醫(yī)學(xué)數(shù)據(jù)中提取知識、挖掘醫(yī)學(xué)信息的途徑,具有非常廣泛的應(yīng)用價(jià)值和發(fā)展前景。同時(shí)中醫(yī)方劑知識圖譜的發(fā)展也有重要意義,它以知識圖譜這種直觀簡潔的圖表述方式展示了方劑本身、方劑中草藥的組成、方劑與證、疾病等之間的關(guān)聯(lián)關(guān)系,讓更多的人更方便的了解方劑,運(yùn)用方劑,以便更好的使中醫(yī)學(xué)在人類健康問題上發(fā)揮重要作用,更全面的推廣中醫(yī)學(xué)知識。

2 知識圖譜的基本知識

知識圖譜的概念是谷歌在2012年提出來改進(jìn)搜索引擎的,它是一個(gè)典型的多邊關(guān)系圖,主要用于描述現(xiàn)實(shí)世界中的實(shí)體(除了用來指稱客觀世界中具體對象的概念)、概念(人們在認(rèn)識世界的過程中形成的客觀事物的概念化,如人或動(dòng)物等)和事件之間的客觀關(guān)系[1]。由節(jié)點(diǎn)(實(shí)體)和邊(實(shí)體之間的關(guān)系)組成。它本質(zhì)上是一個(gè)語義網(wǎng)絡(luò),用來揭示事物之間的關(guān)系。知識圖譜的目的是從各類復(fù)雜數(shù)據(jù)中提取概念、實(shí)體和關(guān)系,是事物關(guān)系的可計(jì)算模型,它根據(jù)知識范圍和不同領(lǐng)域的劃分,分為了普通知識圖譜和領(lǐng)域知識圖譜[2]。隨著科學(xué)技術(shù)的不斷發(fā)展,知識圖譜被廣泛應(yīng)用于NLP領(lǐng)域,如語義研究、智能問答、輔助決策等領(lǐng)域,并且也已經(jīng)成為了人工智能重要的驅(qū)動(dòng)和中心領(lǐng)域。

知識圖譜的一般表示是三元組形式,也就是三元組中的頭實(shí)體、尾實(shí)體以及兩個(gè)實(shí)體之間的關(guān)系,它表示實(shí)體的集合,包含某種實(shí)體的概念,并且表示實(shí)體之間的關(guān)系集,包括不同類型的關(guān)系。

知識圖譜的體系架構(gòu)分為三部分,如圖1所示,第一部分是源數(shù)據(jù)的獲取,可以從不同的渠道來獲取,包括常用關(guān)系數(shù)據(jù)庫方式來保存的結(jié)構(gòu)化數(shù)據(jù),許多網(wǎng)站和應(yīng)用日志采用的文本方式記錄的半結(jié)構(gòu)化數(shù)據(jù),以及使用語音、圖片、視頻等格式的非結(jié)構(gòu)化數(shù)據(jù)。第二部分是知識融合,用于關(guān)聯(lián)多數(shù)據(jù)源的知識,研究怎樣將來自多個(gè)不同來源的關(guān)于同一個(gè)實(shí)體或者概念的描述信息結(jié)合起來,以此來擴(kuò)大知識的范圍。第三部分是知識計(jì)算與知識的應(yīng)用,知識計(jì)算是知識圖譜能力輸出的主要方式,而知識應(yīng)用是將知識圖譜與特定的領(lǐng)域或者業(yè)務(wù)相結(jié)合,提高業(yè)務(wù)效率。

圖1 知識圖譜體系架構(gòu)圖

3 中醫(yī)方劑知識圖譜的構(gòu)建

“天人相應(yīng)”是中醫(yī)的核心概念之一,中醫(yī)的整體觀使中得醫(yī)藥知識方面蘊(yùn)含著豐富的關(guān)系知識,另一方面,面對不同得時(shí)代、地域、個(gè)體,也有各自的特點(diǎn),如傷寒、溫病的時(shí)代發(fā)展,艾灸在北方和南方九針的發(fā)展,正宗藥材的概念等,使中醫(yī)藥知識較分散,較難應(yīng)用,很多隱性知識較難去表述,這也讓中醫(yī)學(xué)界期待新的方法出現(xiàn)去解決這一難題。知識圖譜類似于人類思維的形式、注重表達(dá)關(guān)系的結(jié)構(gòu)特征,這與中醫(yī)藥知識來源于個(gè)人經(jīng)驗(yàn),注重整體關(guān)系的特點(diǎn)相吻合。且在知識的關(guān)聯(lián)性、表達(dá)性和利用知識方面的優(yōu)勢,使得中醫(yī)藥知識圖譜的研究得到不斷發(fā)展。

“中醫(yī)藥學(xué)語言系統(tǒng)(TCMLS)”為構(gòu)建中醫(yī)藥知識圖譜提供了相對完整的框架[3]。中醫(yī)藥學(xué)語言系統(tǒng)是基于本體概念和語義網(wǎng)的大規(guī)模語言系統(tǒng)。已經(jīng)發(fā)展成為一個(gè)包含超過10萬個(gè)中醫(yī)概念和超過100萬條語義關(guān)系的大型語義網(wǎng)絡(luò),基本覆蓋了中醫(yī)藥的概念體系,在范圍和完整性等方面均處于中醫(yī)藥領(lǐng)域的領(lǐng)先地位。

事實(shí)上,中醫(yī)藥學(xué)語言系統(tǒng)已經(jīng)有了一個(gè)知識庫的框架,自然可以通過添加概念屬性將其擴(kuò)展為領(lǐng)域知識庫。為了保持中醫(yī)藥學(xué)語言系統(tǒng)作為術(shù)語系統(tǒng)的簡潔性和穩(wěn)定性,在中醫(yī)藥學(xué)語言系統(tǒng)中只添加了概念的定義和摘要,而沒有其他信息的概念,根據(jù)知識圖譜的技術(shù)框架,可以將中醫(yī)藥學(xué)語言系統(tǒng)或其子本體之一轉(zhuǎn)化為領(lǐng)域知識庫,以此來支持知識服務(wù)系統(tǒng)的實(shí)施。由此可見,中醫(yī)藥知識圖譜技術(shù)體系實(shí)際上是對中醫(yī)藥學(xué)語言系統(tǒng)的自然延伸和完善,為傳統(tǒng)中醫(yī)藥學(xué)語言系統(tǒng)的應(yīng)用和自我完善提供了必要的技術(shù)路徑。另一方面,中醫(yī)藥工作者同時(shí)也建立了相對完整的數(shù)據(jù)庫系統(tǒng),包含了疾病、中藥、方劑、中藥成分等,為進(jìn)一步擴(kuò)展及完善中醫(yī)藥知識圖譜貢獻(xiàn)了豐富的數(shù)據(jù)。

基于中醫(yī)藥學(xué)語言系統(tǒng)來構(gòu)建方劑知識圖譜通常需要以下步驟來完成。首先需要收集相關(guān)的數(shù)據(jù),中醫(yī)方劑知識圖譜數(shù)據(jù)主要分為“方劑數(shù)據(jù)”和“術(shù)語數(shù)據(jù)”,其中方劑數(shù)據(jù)取自古往今來名醫(yī)大家總結(jié)的經(jīng)典名方,根據(jù)經(jīng)典名方結(jié)合專病用方經(jīng)驗(yàn)收錄的數(shù)據(jù),術(shù)語數(shù)據(jù)基本來源于國家中醫(yī)藥管理局頒發(fā)的中醫(yī)藥行業(yè)標(biāo)準(zhǔn),主要包括:疾病名稱、癥狀名稱、證候名稱、治法名稱、方劑名稱、藥物名稱等[4]。

緊接著需要對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,雖然目前各種書寫標(biāo)準(zhǔn)、診療標(biāo)準(zhǔn)以及教材都對數(shù)據(jù)標(biāo)準(zhǔn)化進(jìn)行了統(tǒng)一,使得術(shù)語的使用更加規(guī)范,但在應(yīng)用過程中仍然存在爭議。例如,在中醫(yī)藥研究中常見的正異名以及同義詞,尤其在實(shí)際構(gòu)建的過程中更為常見。此時(shí)我們可以基于現(xiàn)有的相關(guān)標(biāo)準(zhǔn)來構(gòu)建標(biāo)準(zhǔn)術(shù)語數(shù)據(jù)庫,來規(guī)范方劑中術(shù)語的正異名和同義詞,比如:“八月札=預(yù)知子”,“補(bǔ)氣養(yǎng)陰=滋陰益氣、養(yǎng)陰益氣=益氣滋陰”,按照標(biāo)準(zhǔn)來替換非標(biāo)準(zhǔn)用語,以此保證圖譜節(jié)點(diǎn)內(nèi)容的一致性[5]。

其次將對關(guān)系進(jìn)行定義,通過對實(shí)體以及實(shí)體之間的關(guān)系進(jìn)行定義將知識關(guān)聯(lián)起來是知識圖譜的本質(zhì)。作為一種表達(dá)方式,在知識圖譜中實(shí)體直觀的描述了知識的結(jié)構(gòu)以及相關(guān)概念的聯(lián)系。知識圖譜中每個(gè)實(shí)體都有特定的名稱、定義以及釋義,我們通常將實(shí)體關(guān)系定義為三元組,若以中醫(yī)方劑作為研究對象,則三元組的形式為“實(shí)體-關(guān)系-實(shí)體”,其中實(shí)體為方劑中的病、證、藥等,而關(guān)系可用來連接兩個(gè)實(shí)體,描述它們之間的關(guān)系,如當(dāng)歸芍藥散治療心血管疾病,當(dāng)歸芍藥散包含當(dāng)歸、芍藥、川芎等藥物[6]。

最后為圖形化展示,知識圖譜的最大優(yōu)點(diǎn)是可以使用空間形狀的圖像來展示知識點(diǎn)之間的相互關(guān)系。在數(shù)據(jù)圖形化方面,可選用neo4j圖數(shù)據(jù)庫來進(jìn)行展示,將三元組數(shù)據(jù)批量導(dǎo)入neo4j圖數(shù)據(jù)庫中可以更加簡潔明了的展示出實(shí)體及實(shí)體間關(guān)系[7]。

如圖2所示,是已經(jīng)構(gòu)建完成的中醫(yī)方劑知識圖譜的示例,它是以當(dāng)歸芍藥散方劑為實(shí)體建立的知識圖譜,可直接展示出當(dāng)歸芍藥散的主要組成草藥,分別為當(dāng)歸、茯苓、川芎和白術(shù),屬于氣虛證的概念,并且明確展示出可通過補(bǔ)氣法來治療肝虛氣郁證,以及當(dāng)歸芍藥散方劑的出處與其相關(guān)的內(nèi)容。

圖2 中醫(yī)方劑知識圖譜示意圖

4 討論

中醫(yī)學(xué)博大精深,中醫(yī)藥學(xué)同樣承載著從古至今無數(shù)名醫(yī)大家的智慧結(jié)晶,中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所基于中醫(yī)學(xué)語言系統(tǒng),以基本的概念知識作為框架,通過不斷地添加概念以及概念的屬性來擴(kuò)展領(lǐng)域知識圖譜的數(shù)據(jù)庫,雖然中醫(yī)藥學(xué)知識圖譜仍處在起步階段,但目前已經(jīng)有非常多的研究學(xué)者投入這項(xiàng)研究工作中,并且已小有成就,例如已經(jīng)在中醫(yī)藥知識服務(wù)平臺(tái)上線的項(xiàng)目,并且在中醫(yī)養(yǎng)生、證候研究、經(jīng)方研究、特色療法等領(lǐng)域做出貢獻(xiàn)。

構(gòu)建中醫(yī)知識圖譜的最終目的是整合和關(guān)聯(lián)一個(gè)領(lǐng)域內(nèi)不同的知識,以相對較小但質(zhì)量較高的領(lǐng)域知識為例,為進(jìn)一步整合特定類型疾病或證候的知識提供知識庫[8-10]。

同時(shí),中醫(yī)藥知識圖譜通過填充知識模式,提取中醫(yī)藥相關(guān)知識,涉及多種實(shí)體和關(guān)系,輔以“知識源”的搜索方式,區(qū)分已有知識來自知識圖中可能的隱含知識。對不同來源的知識進(jìn)行相互驗(yàn)證和解釋,有助于解釋中醫(yī)藥知識。使用知識圖譜可以方便地獲取和比較有關(guān)中醫(yī)藥食譜的知識,也有助于更多的中醫(yī)藥知識的繼承和創(chuàng)新,讓中醫(yī)藥領(lǐng)域知識圖譜得到更好地發(fā)展。

猜你喜歡
醫(yī)藥學(xué)三元組方劑
基于語義增強(qiáng)雙編碼器的方面情感三元組提取
軟件工程(2024年12期)2024-12-28 00:00:00
基于帶噪聲數(shù)據(jù)集的強(qiáng)魯棒性隱含三元組質(zhì)檢算法*
中藥方劑在治療黃褐斑中的應(yīng)用
《金匱要略》黃芪類方劑探析
關(guān)于余撓三元組的periodic-模
論方劑的配伍環(huán)境
中成藥(2018年6期)2018-07-11 03:01:24
甘草在方劑中的作用及配伍規(guī)律
中國民族傳統(tǒng)醫(yī)藥學(xué)現(xiàn)代傳承與高等教育
論蒙醫(yī)藥學(xué)的挖掘與展望
中醫(yī)藥學(xué)術(shù)語系統(tǒng)研究概述
门源| 博乐市| 阳西县| 宁夏| 乾安县| 樟树市| 利辛县| 镇坪县| 深圳市| 桦甸市| 保康县| 仙居县| 康马县| 尖扎县| 潮安县| 元阳县| 三河市| 岢岚县| 万安县| 宁化县| 将乐县| 宽甸| 铁岭县| 福建省| 乌兰浩特市| 芮城县| 环江| 定陶县| 伊宁县| 分宜县| 同德县| 肇源县| 来宾市| 铜陵市| 禄丰县| 平安县| 巢湖市| 东城区| 太谷县| 磐石市| 普兰店市|