摘要:作為智慧醫(yī)療的基石,醫(yī)學(xué)知識圖譜研究受到廣泛關(guān)注,已經(jīng)開發(fā)出疾病診斷、臨床決策、智能問答等典型的應(yīng)用場景。隨著技術(shù)發(fā)展和研究深入,醫(yī)學(xué)知識圖譜的應(yīng)用拓展到更多領(lǐng)域。本文對近年來醫(yī)學(xué)知識圖譜在個性化醫(yī)療、醫(yī)療保險控制、公共衛(wèi)生事件管理、科研發(fā)現(xiàn)、醫(yī)學(xué)健康教育等方面的應(yīng)用進(jìn)行綜述,總結(jié)其新的發(fā)展趨勢,為后續(xù)研究者提供參考。
關(guān)鍵詞:醫(yī)學(xué)知識圖譜;個性化醫(yī)療;醫(yī)療保險;公共衛(wèi)生事件管理;科研發(fā)現(xiàn);醫(yī)學(xué)健康教育
中圖分類號:R285" " " " " " " " " " " " " " " " " "文獻(xiàn)標(biāo)識碼:A" " " " " " " " " " " " " " " " "DOI:10.3969/j.issn.1006-1959.2024.19.040
文章編號:1006-1959(2024)19-0182-07
Prospect of New Application Fields of Medical Knowledge Graph
LI Changbiao1,DUAN Yongheng2,LI Bei1
(1.College of Life Science,Central South University,Changsha 410013,Hunan,China;
2.Scientific Research Department,Shenzhen Health Development Research and Data Management Center,
Shenzhen 518000,Guangdong,China)
Abstract:As the cornerstone of smart healthcare, medical knowledge graph research has received widespread attention, and typical application scenarios such as disease diagnosis, clinical decision-making, and intelligent Qamp;A have been developed. With technological advancement and in-depth research, its applications expand to more fields. In this paper, we review the applications of medical knowledge graphs in personalized medicine, health insurance control, public health event management, scientific research and discovery, and medical health education in recent years, and summarize its new development trend, which can provide reference for subsequent researchers.
Key words:Medical knowledge graph;Personalized medicine;Health insurance;Public health event management;Scientific discovery;Medical health education
隨著醫(yī)療信息化高速發(fā)展,醫(yī)療數(shù)據(jù)的類型和規(guī)模正以前所未有的速度快速增長,醫(yī)療行業(yè)真正進(jìn)入大數(shù)據(jù)人工智能時代。2017年國務(wù)院發(fā)布《新一代人工智能發(fā)展規(guī)劃》[1]提出,要發(fā)展智能醫(yī)療,推廣應(yīng)用人工智能治療的新模式、新手段,建立快速精準(zhǔn)的智能醫(yī)療體系。而醫(yī)療知識圖譜正是實現(xiàn)智慧醫(yī)療的基石,其能夠幫助建立融合臨床醫(yī)學(xué)與生命組學(xué)的語義關(guān)聯(lián),快速而高效地發(fā)現(xiàn)疾病和病因甚至新的最佳治療方案,有望帶來更高效精準(zhǔn)的醫(yī)療服務(wù)。中國科學(xué)院大學(xué)發(fā)布的《中國新經(jīng)濟(jì)發(fā)展報告2020》[2]中也提到,要以國內(nèi)頂級醫(yī)療機(jī)構(gòu)的臨床治療經(jīng)驗為基礎(chǔ),建設(shè)醫(yī)學(xué)知識圖譜(庫),并開展標(biāo)準(zhǔn)化應(yīng)用,以此實現(xiàn)不同學(xué)科、不同專業(yè)和不同地域之間臨床數(shù)據(jù)的統(tǒng)一標(biāo)引、存儲、檢索和聚合,這對于我國規(guī)范臨床術(shù)語,優(yōu)化診療流程,提升醫(yī)療質(zhì)量、臨床醫(yī)生工作效率和科研水平,及減少醫(yī)療差錯等具有重要意義。醫(yī)學(xué)知識圖譜不僅能夠有效地對多源異構(gòu)的醫(yī)學(xué)數(shù)據(jù)進(jìn)行組織,并且能以結(jié)構(gòu)化的數(shù)據(jù)形式促進(jìn)醫(yī)學(xué)知識關(guān)聯(lián)、醫(yī)學(xué)知識發(fā)掘及醫(yī)學(xué)領(lǐng)域的知識服務(wù),如智能搜索[3]、輔助醫(yī)療決策[4]、就醫(yī)導(dǎo)診[5]、智能問答[6]等。在關(guān)注醫(yī)學(xué)知識圖譜構(gòu)建技術(shù)的發(fā)展之外,隨著醫(yī)學(xué)研究領(lǐng)域的延伸及人工智能技術(shù)的加持,除了上述幾種傳統(tǒng)場景,研究人員也逐漸思考領(lǐng)域型知識圖譜在專業(yè)范圍下的深度應(yīng)用,如將基因組學(xué)數(shù)據(jù)納入知識圖譜[7]及新藥發(fā)現(xiàn)[8]等。本研究著重梳理較新領(lǐng)域的醫(yī)學(xué)知識圖譜的應(yīng)用,如個性化醫(yī)療、醫(yī)療保險控制、公共衛(wèi)生事件管理、科研發(fā)現(xiàn)、醫(yī)學(xué)健康教育等,將新技術(shù)進(jìn)行融合使醫(yī)學(xué)知識圖譜拓展至更多可能的應(yīng)用場景。
1知識圖譜概述
1.1知識圖譜概念" 知識圖譜(knowledge graph)是結(jié)構(gòu)化的語義知識庫,用于以符號形式描述物理世界中的概念及其相互關(guān)系。其基本組成單位是“實體-關(guān)系-實體”三元組,以及實體及其相關(guān)屬性——值對,實體間通過關(guān)系相互聯(lián)結(jié),構(gòu)成網(wǎng)狀的知識結(jié)構(gòu)。知識圖譜可以高效整合海量數(shù)據(jù)的有效信息,為實現(xiàn)語義智能化搜索以及知識互聯(lián)打下基礎(chǔ),已經(jīng)在醫(yī)療、金融、農(nóng)業(yè)等領(lǐng)域得到快速發(fā)展與廣泛應(yīng)用。
1.2知識圖譜分類" 知識圖譜可分為通用知識圖譜與垂直領(lǐng)域知識圖譜。通用知識圖譜不面向特定領(lǐng)域,可將其看作是“結(jié)構(gòu)化的百科知識”,這類知識圖譜包含了大量常識性知識,強調(diào)知識的廣度。常見的通用知識圖譜有WikiData、DBPedia、Google Knowledge Graph、YAGO、Concept Graph、Freebase、OwnThink等。領(lǐng)域知識圖譜則面向的是特定的領(lǐng)域,其基于行業(yè)數(shù)據(jù)構(gòu)建,側(cè)重于知識的深度。以知識圖譜應(yīng)用廣泛的醫(yī)學(xué)領(lǐng)域為例,醫(yī)學(xué)領(lǐng)域的知識具有專業(yè)性強、復(fù)雜度高等特點,如何基于現(xiàn)有的醫(yī)學(xué)數(shù)據(jù),進(jìn)行大規(guī)模、規(guī)范化、高質(zhì)量的醫(yī)學(xué)知識圖譜構(gòu)建并開展應(yīng)用,一直是目前研究的熱門。典型的大型醫(yī)學(xué)知識圖譜見表1。
2醫(yī)學(xué)知識圖譜應(yīng)用的新領(lǐng)域
醫(yī)學(xué)知識圖譜經(jīng)過多年的發(fā)展,已經(jīng)開發(fā)出諸如疾病診斷[18]、臨床決策[19,20]、智能問答[21,22]等典型的應(yīng)用場景。隨著研究的深入,知識圖譜也漸漸開始應(yīng)用于個性化醫(yī)療、醫(yī)療保險、公共衛(wèi)生事件管理、科研發(fā)現(xiàn)、醫(yī)學(xué)健康教育等新領(lǐng)域,本文主要對近年來開發(fā)的新場景的應(yīng)用現(xiàn)狀進(jìn)行綜述。
2.1個性化醫(yī)療" 個性化醫(yī)療,又稱“精準(zhǔn)醫(yī)療”,是根據(jù)個人的生活生理等數(shù)據(jù),從而產(chǎn)生量身定制的醫(yī)療方案的過程。其涉及信息多樣、龐大且復(fù)雜,對不同知識之間關(guān)聯(lián)性的發(fā)掘要求較高,而醫(yī)學(xué)知識圖譜很好地契合了個性化醫(yī)療的發(fā)展需求[23]。Ping P等[24]提出了心血管醫(yī)學(xué)中個體化知識圖譜(individualized knowledge graphs, iKGs)的概念,其本質(zhì)上是一個心血管知識網(wǎng)絡(luò)系統(tǒng),用于以全新的和信息豐富的方式來聚合和描述個體化的心血管健康數(shù)據(jù)。iKGs能夠?qū)⑸飳W(xué)知識與個體患者的病史和健康結(jié)果全面整合,從而改變臨床醫(yī)生和科研工作人員發(fā)現(xiàn)、交流和應(yīng)用新知識的方式,并幫助制定個性化的患者護(hù)理策略。Vilela J等[25]使用來自DisGeNET和GO的數(shù)據(jù)構(gòu)建了一個包含了基因、疾病和其他生物實體之間關(guān)系的醫(yī)學(xué)知識圖譜,其開發(fā)的方法可根據(jù)確定的基因-疾病關(guān)聯(lián)中豐富的生物途徑對患者進(jìn)行亞型分層,能夠為制定應(yīng)用于自閉癥譜系障礙(autism spectrum disorder, ASD)的個性化醫(yī)學(xué)方法指南提供一定指導(dǎo)。Gyrard A等[26]聚合了來自各種異構(gòu)來源的知識,如物聯(lián)網(wǎng)(IoT)設(shè)備、臨床記錄和電子病歷(EMRs)、鏈接開放數(shù)據(jù)(UMLS、ICD-10等)、醫(yī)學(xué)本體等,創(chuàng)建了個性化醫(yī)療保健知識圖譜(personalized healthcare knowledge graph, PHKG),這種基于患者健康情況,結(jié)合環(huán)境數(shù)據(jù)構(gòu)建的醫(yī)學(xué)知識圖譜,不僅可以支持個性化健康A(chǔ)pp的開發(fā),在保持患者知情的情況下,有助于幫助管理慢性疾病,并授權(quán)醫(yī)生就健康相關(guān)問題做出有效的決策,也可以通過持續(xù)監(jiān)測及時向患者發(fā)出警報。Chandak P等[15]整合了包括疾病相關(guān)蛋白質(zhì)擾動、生物過程和途徑、解剖和表型尺度以及整個批準(zhǔn)的藥物范圍及其治療作用等多個高質(zhì)量的資源構(gòu)建了醫(yī)學(xué)知識圖譜PrimeKG,由于其包含了大量的藥物與疾病之間的聯(lián)系,因此可用于支持AI對藥物如何影響疾病進(jìn)行分析,并且深入剖析分子和遺傳因素及其表型后果之間的關(guān)系,以此來制定個性化診斷策略和有針對性的治療方案。
由上可知,醫(yī)學(xué)知識圖譜在個性化醫(yī)療上的應(yīng)用是以患者個性化數(shù)據(jù)為基礎(chǔ),結(jié)合IoT設(shè)備和AI等前沿科技,從而開展的各類基于知識的個性化醫(yī)療手段。在未來,隨著可穿戴設(shè)備和超高速網(wǎng)絡(luò)的發(fā)展,個性化的醫(yī)療數(shù)據(jù)更加容易采集,將個體情況、環(huán)境背景信息與現(xiàn)有醫(yī)學(xué)知識結(jié)合利用,形成個性化的智能醫(yī)療服務(wù),不僅能夠有效提升用戶健康水平,也能減輕醫(yī)療保健方面的工作負(fù)擔(dān)。
2.2醫(yī)療保險風(fēng)險控制" 疾病診斷相關(guān)分組(diagnosis-related group, DRG)是一種根據(jù)患者年齡、疾病診斷、并發(fā)癥、合并癥及治療方式等因素將患者分成若干DRG組進(jìn)行管理的體系[27]。隨著我國對DRG的研究逐漸深入,諸如低碼高編、分解住院、住院費用轉(zhuǎn)移等問題漸漸顯現(xiàn)。對于醫(yī)療機(jī)構(gòu)來說,要想強化對醫(yī)療質(zhì)量和醫(yī)療行為的監(jiān)管,除了控制醫(yī)療費用,就需要具有自動化、智能化的醫(yī)保質(zhì)控能力[28-30]。而醫(yī)學(xué)知識圖譜的出現(xiàn),可以很好地解決這類問題,建立融合循證醫(yī)學(xué)和臨床指南等權(quán)威醫(yī)學(xué)知識、醫(yī)保支付政策、醫(yī)保監(jiān)控規(guī)則的知識圖譜,構(gòu)建基于知識圖譜的規(guī)則邏輯風(fēng)控預(yù)警模型,通過自動發(fā)掘數(shù)據(jù)之間的深層關(guān)系,降低審核過程對專業(yè)人員的依賴,從而為醫(yī)保監(jiān)管工作提供有力支撐。目前國內(nèi)已有像艾登等應(yīng)用醫(yī)學(xué)知識圖譜進(jìn)行醫(yī)保病案質(zhì)控,而在學(xué)界也有不少相關(guān)研究,例如,劉新奎等[31]將醫(yī)學(xué)知識圖譜與DRG相結(jié)合,有效地融合不同的醫(yī)療知識庫構(gòu)建DRG MKG(drg medical knowledge graphs),隨時更新醫(yī)學(xué)知識,以契合DRG的發(fā)展,輔助DRG分組器優(yōu)化。通過結(jié)合DRG、病案首頁及臨床知識等多組學(xué)數(shù)據(jù)構(gòu)建的醫(yī)學(xué)知識圖譜,不僅能有效開展疾病風(fēng)險預(yù)測、疾病早期診斷等工作,而且對于健康宣教、輔助診療也有很大推動作用,能夠促進(jìn)患者對疾病的客觀認(rèn)知,盡早配合治療,從而降低醫(yī)療費用,節(jié)約醫(yī)療資源。
醫(yī)學(xué)知識圖譜在檢測醫(yī)保欺詐方面也有一定應(yīng)用。Sun H等[32]利用醫(yī)學(xué)知識圖譜開發(fā)了一種能自動識別臨床可疑的FWA(fraud-waste-abuse)檢測索賠的方法。其數(shù)據(jù)來源于中國食品藥監(jiān)局、醫(yī)學(xué)教科書以及檢查信息,基于此設(shè)計了三種知識推理規(guī)則來識別三種不適當(dāng)?shù)脑\斷/藥物治療,利用該知識圖譜能夠檢測70%的可疑索賠。Li J等[33]基于20 000名被保險人的醫(yī)療保險文本數(shù)據(jù)構(gòu)建了醫(yī)學(xué)知識圖譜,在此基礎(chǔ)上,將表示學(xué)習(xí)和改進(jìn)的標(biāo)簽傳播算法(LPA)用于特征工程,然后結(jié)合醫(yī)療費用數(shù)據(jù)和XGBoost等技術(shù),形成了醫(yī)療保險欺詐檢測模型,該模型在醫(yī)療保險欺詐檢測中取得良好的效果,并且可用于輔助醫(yī)療保險報銷審計工作。
總的來說,醫(yī)學(xué)知識圖譜在醫(yī)療保險風(fēng)險控制方面的應(yīng)用,符合目前醫(yī)療服務(wù)流程規(guī)范化、收費透明化等趨勢。無論是DRG或者是醫(yī)療保險,對于疾病、藥物、檢查等多種醫(yī)學(xué)知識之間的關(guān)聯(lián)揭示,以及如何根據(jù)這些知識關(guān)聯(lián)進(jìn)行合理的資源分配和風(fēng)險調(diào)控,均存在一定需求。隨著醫(yī)保信息化、醫(yī)院管理精細(xì)化等要求的進(jìn)一步落實,利用醫(yī)學(xué)知識圖譜輔助患者醫(yī)療費用降低和醫(yī)療保險風(fēng)險控制,是一個可行的研究方向。
2.3公共衛(wèi)生事件管理" 突發(fā)公共衛(wèi)生事件通常會造成巨大的破壞,研究時效性與可理解性在解決這類事件中尤為重要,亟需快速分析研究現(xiàn)狀、抽取特定研究信息的方法。其中,與之相關(guān)的科學(xué)文獻(xiàn)是知識傳播的主要載體與重要途徑之一,但這類文獻(xiàn)中專業(yè)術(shù)語特殊性與歧義性很容易導(dǎo)致傳播受阻問題,為解決這類問題,劉華玲等[34]利用自然語言處理與知識圖譜技術(shù),以PubMed中所有新型冠狀病毒感染相關(guān)的文獻(xiàn)為基礎(chǔ),使用BERT-BiLSTM-CRF模型進(jìn)行命名實體識別,并對同名的研究者進(jìn)行消歧處理,最終建立的知識圖譜不僅可以快速查詢新型冠狀病毒感染相關(guān)的研究現(xiàn)狀、前沿?zé)狳c、研究進(jìn)程,也讓研究人員與投資者能夠快速尋找特定課題的意見領(lǐng)袖,從而推進(jìn)新型冠狀病毒感染相關(guān)科研工作。以公共衛(wèi)生事件管理為導(dǎo)向而構(gòu)建的醫(yī)學(xué)知識圖譜,能夠高效地對決策進(jìn)行支持,并且輔助相關(guān)政策的制定。Yang Y等[35]在3096篇新型冠狀病毒感染相關(guān)研究論文的基礎(chǔ)上,構(gòu)建了新型冠狀病毒感染建模研究相關(guān)的IE數(shù)據(jù)集,并提出了一種基于數(shù)據(jù)集的多任務(wù)文檔級信息抽取模型SS-DYGIE++?;诖藰?gòu)建的新冠病毒公共衛(wèi)生證據(jù)知識圖譜,不僅能夠呈現(xiàn)新型冠狀病毒感染的動態(tài)傳播趨勢,還可以顯示各種非藥物干預(yù)措施對新型冠狀病毒感染流行的影響,從而支持政策制定。葉荔姍[36]通過知識圖譜和深度學(xué)習(xí)等技術(shù)來監(jiān)測公共衛(wèi)生事件中的風(fēng)險人群,構(gòu)建人的時空動態(tài)軌跡模型以動態(tài)監(jiān)測疫情,在此基礎(chǔ)上搭建適用于不同疫情或突發(fā)事件的可擴(kuò)展可移植防控系統(tǒng),實現(xiàn)多元主體信息共享下的信息輔助閉環(huán)管理和防控協(xié)同。
在面對大規(guī)模的公共衛(wèi)生事件時,追蹤疾病傳播途徑、確定感染源頭是件十分耗費人力的工作,Shen Y等[37]利用醫(yī)學(xué)知識圖譜來進(jìn)行自動推斷傳播路徑和感染源,為預(yù)測和控制包括新型冠狀病毒感染在內(nèi)的傳染病提供了一個很好的解決方案和工具,即通過知識圖譜來自動推斷感染源,從而有效地利用有限的資源來檢測潛在風(fēng)險,實現(xiàn)疫情的快速控制。
公共衛(wèi)生事件管理中涉及到的知識是醫(yī)學(xué)知識和管理知識的融合,其不僅涵蓋醫(yī)藥衛(wèi)生、政策法律法規(guī)、人力物力等各個要素,也包括了各類要素之間的關(guān)聯(lián)。利用知識圖譜,不僅能很好地解決現(xiàn)有的知識體系中的知識過于分散,各個要素之間缺乏聯(lián)系等問題,還能借助知識推理等技術(shù),開展疾病流行趨勢預(yù)測等工作,進(jìn)一步挖掘現(xiàn)有公共衛(wèi)生數(shù)據(jù)的價值,用大數(shù)據(jù)賦能,實現(xiàn)公共衛(wèi)生領(lǐng)域智慧應(yīng)急。
2.4科研發(fā)現(xiàn)" 藥物發(fā)現(xiàn)是發(fā)現(xiàn)新的候選藥物的過程,是一個漫長、復(fù)雜和昂貴的過程,是由現(xiàn)有化學(xué)庫和數(shù)據(jù)庫中越來越多的數(shù)據(jù)驅(qū)動的,而將知識圖譜引入藥物研發(fā)領(lǐng)域,能夠為異構(gòu)生物醫(yī)學(xué)數(shù)據(jù)的整合提供了一個明確的框架和利用路徑,并縮短藥物發(fā)現(xiàn)的周期,降低藥物研發(fā)成本[38,39]。Sang S等[40]提出了一種基于生物醫(yī)學(xué)知識圖譜嵌入的遞歸神經(jīng)網(wǎng)絡(luò)方法,稱為GrEDeL,它通過挖掘已發(fā)表的生物醫(yī)學(xué)文獻(xiàn)來發(fā)現(xiàn)潛在的治療疾病的藥物,實驗結(jié)果表明,該方法不僅可以通過挖掘文獻(xiàn)有效地發(fā)現(xiàn)新藥,而且可以為候選藥物提供相應(yīng)的作用機(jī)制,能夠作為目前傳統(tǒng)藥物發(fā)現(xiàn)方法的補充。此外,基于醫(yī)學(xué)知識圖譜進(jìn)行藥物再利用預(yù)測和藥物不良反應(yīng)(adverse drug reaction, ADR)預(yù)測也是近年來較為熱門的方向。藥物再利用是指對那些已經(jīng)上市或正在開發(fā)(包括開發(fā)停止)的藥物進(jìn)行相關(guān)研究用于新治療用途的研發(fā)策略,目前的研究方法也是基于數(shù)據(jù)驅(qū)動,并且涉及多種類型的數(shù)據(jù)。Zhu Y等[41]提出了一種基于藥物知識圖譜的知識驅(qū)動藥物再利用方法,通過系統(tǒng)整合多個藥物知識庫,設(shè)計并開發(fā)了一個藥物知識圖譜,在此基礎(chǔ)上,使用基于路徑和嵌入的數(shù)據(jù)表示方法,將藥物知識圖中的信息轉(zhuǎn)換為有價值的輸入,從而讓機(jī)器學(xué)習(xí)模型對藥物再利用進(jìn)行預(yù)測。Asada M等[42]基于知識圖譜提出了一種新的從文獻(xiàn)中提取藥物-藥物相互作用(drug-drug interaction, DDI)的方法,該方法同時考慮了各種異構(gòu)信息,有效地解決了傳統(tǒng)的基于深度神經(jīng)網(wǎng)絡(luò)的DDI提取方法大多只考慮文本中藥物提及的上下文信息的缺點。由于當(dāng)一種藥物與另一種或多種藥物共同使用時,會引起不良反應(yīng),因此可基于提取的DDI進(jìn)行ADR預(yù)測[43]。Joshi P等[44]基于知識圖譜嵌入技術(shù),設(shè)計并訓(xùn)練了一個定制的深度神經(jīng)網(wǎng)絡(luò)(deep neural networks, DNN),稱為知識圖譜DNN,用于預(yù)測藥物不良反應(yīng),該方法在藥物肝損傷和新型冠狀病毒感染治療推薦藥物的個案研究上表現(xiàn)良好。Zeng X等[38]則對基于知識圖譜的藥物再利用和ADR預(yù)測在藥物研發(fā)中的應(yīng)用做了總結(jié),并將其劃分為5個基本步驟,從數(shù)據(jù)源收集數(shù)據(jù)、提取數(shù)據(jù)(包括化學(xué)屬性、藥物副作用、藥物靶標(biāo)等)、嵌入模型的不同輸入(包括三元組、藥物-藥物相互作用矩陣等)、編碼(在嵌入過程中,使用不同結(jié)構(gòu)的模型來學(xué)習(xí)知識圖譜的表示,并用特定的得分和損失函數(shù)來訓(xùn)練模型)、預(yù)測(通過識別三元組是否是事實或使用實體嵌入進(jìn)行預(yù)測)。
蛋白質(zhì)是控制生物和生命本身的基本大分子,對蛋白質(zhì)的研究有助于理解人類健康和發(fā)展疾病療法。利用知識圖譜對非結(jié)構(gòu)化文本(如氨基酸序列或蛋白質(zhì)描述)和結(jié)構(gòu)化數(shù)據(jù)(如已知的蛋白質(zhì)相互作用)之間的相互依賴關(guān)系進(jìn)行建模,能夠更好地表現(xiàn)和利用蛋白質(zhì)相關(guān)的生物醫(yī)學(xué)知識,并進(jìn)行蛋白質(zhì)相關(guān)研究[45]。例如有研究人員以基因本體GO和Uniprot知識庫為基礎(chǔ)創(chuàng)建了用于蛋白質(zhì)科學(xué)的知識圖譜ProteinKG65,該知識圖譜將蛋白質(zhì)相關(guān)知識和蛋白質(zhì)序列轉(zhuǎn)換為GO術(shù)語或蛋白質(zhì)實體,從而實現(xiàn)蛋白質(zhì)功能和結(jié)構(gòu)預(yù)測。
EHR在多年的使用過程中,積累了大量醫(yī)療過程和結(jié)果相關(guān)的大數(shù)據(jù),但由于數(shù)據(jù)分散、數(shù)據(jù)異構(gòu)等特點,其利用程度仍然處于較低的水平。Shang Y等[46]設(shè)計研究了面向EHR的知識圖譜系統(tǒng),通過利用知識圖譜創(chuàng)建EHR數(shù)據(jù)軌跡,并通過語義規(guī)則進(jìn)行推理,從而識別EHR數(shù)據(jù)中的重要臨床發(fā)現(xiàn),并通過推理路徑更好地向醫(yī)生解釋那些被忽略的但是具有重要價值的醫(yī)學(xué)信息的意義。此外,基于BioMedKGs[17]提出的BIOS醫(yī)學(xué)科研選題工具,以PubMed、Sci-Hub等權(quán)威醫(yī)學(xué)文獻(xiàn)庫作為靈感來源,利用實體識別、文本指代消解領(lǐng)域文本無監(jiān)督相似度計算等技術(shù),對醫(yī)學(xué)文獻(xiàn)進(jìn)行解讀,并提取選題靈感,為醫(yī)學(xué)知識圖譜輔助科學(xué)研究提供了一種全新的思路。
2.5醫(yī)學(xué)健康教育" “健康中國行動(2019-2030年)”[47]指出,“普及健康知識”為實現(xiàn)國民健康的重要途徑。在已有的智能檢索與問答的應(yīng)用基礎(chǔ)上,以公眾自我管理能力為核心,以健康教育與非藥物干預(yù)為應(yīng)用場景,醫(yī)學(xué)知識圖譜在醫(yī)學(xué)知識普及和健康教育方面極具潛力。Cope B等[48]基于醫(yī)學(xué)知識圖譜開發(fā)了醫(yī)學(xué)教育相關(guān)的網(wǎng)站應(yīng)用,該應(yīng)用不僅能建立醫(yī)療邏輯可視化,以補充電子健康記錄,還能支持醫(yī)學(xué)生進(jìn)行臨床病例分析,提高醫(yī)學(xué)教學(xué)質(zhì)量。由于醫(yī)師培訓(xùn)課程要求對大量的知識進(jìn)行集中、快速的吸收,為了幫助醫(yī)學(xué)生優(yōu)化學(xué)習(xí)路徑;Ettorre A等[49]以O(shè)ntoSIDES等知識圖譜為基礎(chǔ),提出了一個能讓醫(yī)學(xué)生在SIDES平臺上進(jìn)行學(xué)習(xí)的模型,以兒科和心血管專業(yè)學(xué)習(xí)作為實例進(jìn)行實驗,發(fā)現(xiàn)該模型很好地提升了學(xué)習(xí)效果。Ansong S等[18]利用醫(yī)學(xué)知識圖譜解決了醫(yī)學(xué)培訓(xùn)系統(tǒng)中,在疾病診斷方面缺乏數(shù)據(jù)和可解釋性差等問題,從而構(gòu)建和完善了醫(yī)療培訓(xùn)系統(tǒng)中的疾病診斷功能。
在醫(yī)學(xué)知識科普方面,王麗敏等[50]以“4P”醫(yī)學(xué)模式為指導(dǎo),構(gòu)建了以疾病概述、臨床癥狀、臨床診斷、預(yù)防與康復(fù)指導(dǎo)、治療等為一級知識框架的膝關(guān)節(jié)骨性關(guān)節(jié)炎(knee osteoarthritis, KOA)疾病知識圖譜,將疾病知識圖譜以圖數(shù)據(jù)庫可視化呈現(xiàn)、Web端表示,建立起公眾可參與的KOA疾病知識查詢、應(yīng)答的途徑。既將普通用戶從海量的信息中解放出來,免去了公眾因缺少專業(yè)知識對信息進(jìn)行誤判、誤信,也使護(hù)理工作中的健康教育內(nèi)容能夠與時俱進(jìn)、快速更新。
3總結(jié)
醫(yī)學(xué)領(lǐng)域是知識圖譜建設(shè)與應(yīng)用最前沿的研究領(lǐng)域之一,一方面醫(yī)療信息化的發(fā)展累積了海量的醫(yī)學(xué)數(shù)據(jù);另一方面醫(yī)學(xué)領(lǐng)域知識本體數(shù)據(jù)庫的建立相對規(guī)范,為醫(yī)學(xué)知識圖譜的構(gòu)建打下了堅實的基礎(chǔ),比如IBM研發(fā)的Watson Health醫(yī)學(xué)知識圖譜,每秒能完成267篇非結(jié)構(gòu)化醫(yī)學(xué)文獻(xiàn)的知識自動抽取,并可在多個醫(yī)療領(lǐng)域輔助醫(yī)生診斷與治療。隨著和機(jī)器學(xué)習(xí)等技術(shù)結(jié)合,醫(yī)學(xué)知識圖譜的應(yīng)用場景越來越豐富。如今流行的大語言模型(large language models, LLMs),為AI在醫(yī)學(xué)領(lǐng)域的應(yīng)用帶來了新的希望。通過結(jié)合知識圖譜,LLMs有望解決缺乏事實知識、幻覺和可解釋性等諸多問題??梢灶A(yù)見的是,在科技向人工智能邁進(jìn)的階段,醫(yī)學(xué)知識圖譜將發(fā)揮更大的作用。
參考文獻(xiàn):
[1]中華人民共和國國務(wù)院.新一代人工智能發(fā)展規(guī)劃[EB/OL].(2017-7-20)[2023-9-17].https://www.gov.cn/zhengce/content/2017-07/20/content_5211996.htm
[2]中國科學(xué)院大學(xué)動善時新經(jīng)濟(jì)研究中心.中國新經(jīng)濟(jì)發(fā)展報告2020[M].北京:電子工業(yè)出版社,2020:7.
[3]Ebeid IA.MedGraph: A semantic biomedical information retrieval framework using knowledge graph embedding for PubMed[J].Front Big Data,2022,5:965619.
[4]Xu X,Wang X,Wu M,et al.Development of an interactive medical knowledge graph based tool set[J]. Procedia Computer Science,2023,221:578-584.
[5]Liu W,Yin L,Wang C,et al.Medical knowledge graph in Chinese using deep semantic mobile computation based on IoT and WoT[J].Wirel Commun Mob Com,2021,2021:1-13.
[6]Varshney D,Zafar A,Behera NK,et al.Knowledge graph assisted end-to-end medical dialog generation[J].Artif Intell Med,2023,139:102535.
[7]Nicholson DN,Greene CS.Constructing knowledge graphs and their biomedical applications[J].Comput Struct Biotechnol J,2020,18:1414-1428.
[8]MacLean F.Knowledge graphs and their applications in drug discovery[J].Expert Opin Drug Discov,2021,16(9):1057-1069.
[9]Afshar M,Gao YJ,Gupta D,et al.On the role of the UMLS in supporting diagnosis generation proposed by Large Language Models[J].J Biomed Inform,2024,157:104707.
[10]李丹亞,胡鐵軍,李軍蓮,等.中文一體化醫(yī)學(xué)語言系統(tǒng)的構(gòu)建與應(yīng)用[J].情報雜志,2011,30(2):147-151.
[11]昝紅英,竇華溢,賈玉祥,等.基于多來源文本的中文醫(yī)學(xué)知識圖譜的構(gòu)建[J].鄭州大學(xué)學(xué)報(理學(xué)版),2020,52(2):45-51.
[12]Pan Y,Chen Q,Peng W,et al.Medwriter: Knowledge-aware medical text generation[C]//Proceedings of the 28th International Conference on Computational Linguistics.2020:2363-2368.
[13]Long H,Zhu Y,Jia L,et al.An ontological framework for the formalization, organization and usage of TCM-Knowledge[J].BMC Med Inform Decis Mak,2019,19(Suppl 2):53.
[14]Schatz K,Korn D,Tropsha A,et al.Workflow for Domain-and Task-Sensitive Curation of Knowledge Graphs, with Use Case of DRKG[C]//2022 IEEE International Conference on Big Data (Big Data).IEEE,2022:3692-3701.
[15]Chandak P,Huang K,Zitnik M.Building a knowledge graph to enable precision medicine[J].Sci Data,2023,10(1):67.
[16]Lan G,Li Y,Hu M,et al.Knowledge graph integrated graph neural networks for Chinese medical text classification[C]//2021 IEEE International Conference on Bioinformatics and Biomedicine (BIBM).IEEE,2021: 682-687.
[17]Bang D,Lim S,Lee S,et al.Biomedical knowledge graph learning for drug repurposing by extending guilt-by-association to multiple layers[J].Nat Commun,2023,14(1):3570.
[18]Ansong S,Eteffa K F,Li C,et al.How to empower disease diagnosis in a medical education system using knowledge graph[C]//Web Information Systems and Applications: 16th International Conference, WISA 2019, Qingdao, China, September 20-22, 2019, Proceedings 16.Springer International Publishing,2019:518-523.
[19]Lyu K,Tian Y,Shang Y,et al.Causal knowledge graph construction and evaluation for clinical decision support of diabetic nephropathy[J].J Biomed Inform,2023,139:104298.
[20]Zhou G,E H,Kuang Z,et al.Clinical decision support system for hypertension medication based on knowledge graph[J].Comput Methods Programs Biomed,2022,227:107220.
[21]Wu X,Duan J,Pan Y,et al.Medical knowledge graph: Data sources, construction, reasoning, and applications[J].Big Data Min Anal,2023,6(2):201-217.
[22]Huang J,Chen Y,Li Y,et al.Medical knowledge-based network for Patient-oriented Visual Question Answering[J].Inform Process Manag,2023,60(2):103241.
[23]Ma C,An Q,Yang Z,et al.A Hybrid Recommendation Approach for Medical Services That Incorporates Knowledge Graphs[J].Processes,2022,10(8):1500.
[24]Ping P,Watson K,Han J,et al.Individualized Knowledge Graph: A Viable Informatics Path to Precision Medicine[J].Circ Res,2017,120(7):1078-1080.
[25]Vilela J,Asif M,Marques AR,et al.Biomedical knowledge graph embeddings for personalized medicine: Predicting disease‐gene associations[J].Expert Systems,2022:e13181.
[26]Gyrard A,Gaur M,Shekarpour S,et al.Personalized health knowledge graph[C]//CEUR workshop proceedings.NIH Public Access,2018,2317.
[27]劉新奎,楊林朋.疾病診斷相關(guān)分組(DRGs)在我國的發(fā)展與應(yīng)用[J].中華醫(yī)學(xué)圖書情報雜志,2018,27(8):48-51.
[28]肖曉蘭,韋艷靈.病案信息對DRGs發(fā)展的影響[J].中國病案,2016,17(12):6-8,42.
[29]馬忠凱.病案首頁質(zhì)量控制對DRG的影響分析[J].中國衛(wèi)生經(jīng)濟(jì),2018,37(12):94-95.
[30]康婭,閆學(xué)麗,楊曉雨,等.DRG付費體制助力病案首頁質(zhì)量控制[J].現(xiàn)代醫(yī)院,2021,21(12):1883-1885.
[31]劉新奎,楊林朋,昝紅英,等.基于疾病診斷相關(guān)分組的醫(yī)學(xué)知識圖譜庫構(gòu)建方法[J].醫(yī)學(xué)信息學(xué)雜志,2020,41(9):27-30.
[32]Sun H,Xiao J,Zhu W,et al.Medical Knowledge Graph to Enhance Fraud, Waste, and Abuse Detection on Claim Data: Model Development and Performance Evaluation[J].JMIR Med Inform,2020,8(7):e17653.
[33]Li J,Liu J,Liu X,et al.A medical insurance fraud detection model with knowledge graph and machine learning[C]//International Conference on Computer Application and Information Security (ICCAIS 2021). SPIE,2022,12260:531-540.
[34]劉華玲,孫毅.基于實體識別和信息融合的知識圖譜研究——以新冠肺炎疫情為例[J].計算機(jī)技術(shù)與發(fā)展,2022,32(9):107-113.
[35]Yang Y,Cao Z,Zhao P,et al.Constructing public health evidence knowledge graph for decision-making support from COVID-19 literature of modelling study[J].J Saf Sci Resil,2021,2(3):146-156.
[36]葉荔姍.數(shù)據(jù)與知識驅(qū)動的涉疫風(fēng)險人群防控系統(tǒng)研究[J].中國數(shù)字醫(yī)學(xué),2022,17(9):17-22.
[37]Shen Y,Liu Y,Jiao X,et al.Knowledge Graph: Applications in Tracing the Source of Large-Scale Outbreak - Beijing Municipality, China, 2020-2021[J].China CDC Wkly,2023,5(4):90-95.
[38]Zeng X,Tu X,Liu Y,et al.Toward better drug discovery with knowledge graph[J].Curr Opin Struct Biol,2022,72:114-126.
[39]Sosa DN,Altman RB.Contexts and contradictions: a roadmap for computational drug repurposing with knowledge inference[J].Brief Bioinform,2022,23(4):bbac268.
[40]Sang S,Yang Z,Liu X,et al.GrEDeL: A Knowledge Graph Embedding Based Method for Drug Discovery From Biomedical Literatures[J].IEEE Access,2019,7:8404-8415.
[41]Zhu Y,Che C,Jin B,et al.Knowledge-driven drug repurposing using a comprehensive drug knowledge graph[J].Health Informatics J,2020,26(4):2737-2750.
[42]Asada M,Miwa M,Sasaki Y.Integrating heterogeneous knowledge graphs into drug-drug interaction extraction from the literature[J].Bioinformatics,2023,39(1):btac754.
[43]Wang J,Zhang S,Li R,et al.Multi-view feature representation and fusion for drug-drug interactions prediction[J].BMC Bioinformatics,2023,24(1):93.
[44]Joshi P,V M,Mukherjee A.A knowledge graph embedding based approach to predict the adverse drug reactions using a deep neural network[J].J Biomed Inform,2022,132:104122.
[45]Balabin H,Hoyt CT,Gyori BM,et al.ProtSTonKGs: a sophisticated transformer trained on protein sequences, text, and knowledge graphs[C]//SWAT4HCLS 2022: Semantic Web Applications and Tools for Health Care and Life Sciences. 13th International Conference on Semantic Web Applications and Tools for Health Care and Life Sciences, Virtual Event, Leiden, Netherlands, January 10th to 14th, 2022.RWTH Aachen,2022:103-107.
[46]Shang Y,Tian Y,Zhou M,et al.EHR-Oriented Knowledge Graph System: Toward Efficient Utilization of Non-Used Information Buried in Routine Clinical Practice[J].IEEE J Biomed Health Inform,2021,25(7):2463-2475.
[47]中華人民共和國衛(wèi)生健康委員會.健康中國行動(2019-2030年)[EB/OL].(2019-7-15)[2023-9-17].http://www.nhc.gov.cn/cms-search/xxgk/getManuscriptXxgk.htm?id=e9275fb 95d5b4295be8308415d4cd1b2
[48]Cope B,Kalantzis M,Zhai C,et al.Maps of medical reason: applying knowledge graphs and artificial intelligence in medical education and practice[M].Bioinformational philosophy and postdigital knowledge ecologies,Springer,2022:133-159.
[49]Ettorre A,Rocha Rodríguez O,F(xiàn)aron C,et al.A knowledge graph enhanced learner model to predict outcomes to questions in the medical field[C]//International Conference on Knowledge Engineering and Knowledge Management.Cham: Springer International Publishing,2020:237-251.
[50]王麗敏,陳泓伯,王琦,等.以公眾健康教育與非藥物干預(yù)為主的膝關(guān)節(jié)骨性關(guān)節(jié)炎疾病知識圖譜的構(gòu)建[J].中華護(hù)理雜志,2022,57(10):1172-1177.
收稿日期:2023-08-21;修回日期:2023-11-03
編輯/王萌
基金項目:1.深圳市公共衛(wèi)生事件應(yīng)急管理知識圖譜研究(編號:738010014);2.中南大學(xué)研究生科研創(chuàng)新項目(校企聯(lián)合)(編號:164990007);3.中南大學(xué)創(chuàng)新創(chuàng)業(yè)教育教學(xué)改革研究項目(編號:150030010)
作者簡介:李昌鏢(1997.11-),男,江西吉安人,碩士研究生,主要從事醫(yī)學(xué)信息組織、知識圖譜研究
通訊作者:李蓓(1974.4-),女,湖南郴州人,碩士,副教授,主要從事信息組織、醫(yī)學(xué)大數(shù)據(jù)等研究