林鑫 李曉瑛 郭進(jìn)京 張化冰 趙嘉瑋 任慧玲
(1.中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院醫(yī)學(xué)信息研究所,北京 100020;2.中國醫(yī)學(xué)科學(xué)院/北京協(xié)和醫(yī)學(xué)院北京協(xié)和醫(yī)院內(nèi)分泌科,北京 100073)
藥品在產(chǎn)生治療作用的同時,可能會伴隨產(chǎn)生對患者生命健康帶來嚴(yán)重風(fēng)險的不良反應(yīng)。藥品不良反應(yīng)(Adverse Drug Reaction,ADR)是指合格藥品在正常用法用量下出現(xiàn)的與用藥目的無關(guān)的有害反應(yīng)[1],不僅能夠給患者生命健康帶來嚴(yán)重風(fēng)險,也會增加患者的住院時間及死亡率,帶來極大的經(jīng)濟(jì)負(fù)擔(dān)。其中,喹諾酮類藥品因具有抗菌作用強(qiáng)、口服吸收好等特點(diǎn),在臨床上應(yīng)用廣泛;與此同時,其ADR發(fā)生率明顯增加[2-4],有關(guān)的ADR報道日益增多,由此帶來的危害日益突出,因此喹諾酮類藥品的用藥問題應(yīng)引起極大關(guān)注。
藥品說明書作為一種法律文書,包含安全有效使用該藥品的全部信息,收錄了藥品除尚未發(fā)現(xiàn)的、特殊的不良反應(yīng)外的其他全部ADR,目前已成為醫(yī)生處方和患者安全有效用藥最基本且最重要的信息來源[5],是指導(dǎo)臨床合理用藥的重要依據(jù)。盡管藥品說明書在一定程度上可起到安全警戒的作用,但每種藥品的ADR僅在其相應(yīng)的說明書中出現(xiàn)。臨床中為確保合理用藥,醫(yī)生要同時兼顧療效與ADR的平衡,對于具有相同藥理作用的藥品,僅通過查找每個藥品的說明書來對其ADR及ADR發(fā)生頻率、嚴(yán)重程度等信息進(jìn)行對比,難以快速且準(zhǔn)確地作出最優(yōu)決策,耽誤患者救治時間。
因此,將文本形式的非結(jié)構(gòu)化藥品說明書轉(zhuǎn)化成計算機(jī)可識別的結(jié)構(gòu)化知識,將藥品及所致ADR的相關(guān)信息進(jìn)行結(jié)構(gòu)化組織,并對其之間的語義關(guān)系進(jìn)行定義與描述,將在很大程度上推動ADR信息的提取與利用,提高臨床分析的效率和準(zhǔn)確度。而本體作為對特定領(lǐng)域之中概念及其相互之間關(guān)系的規(guī)范表達(dá),是共享概念模型的明確的形式化規(guī)范說明[6],具有支持信息交流以及不同系統(tǒng)之間互操作的作用[7],能夠為信息共享和知識表達(dá)提供基礎(chǔ)[8]。
基于此,本研究選擇喹諾酮藥品,參照藥品說明書分析藥品與所致不良反應(yīng)等內(nèi)容之間的關(guān)系,建立具有豐富語義關(guān)系的喹諾酮類藥品不良反應(yīng)領(lǐng)域本體。通過對該本體進(jìn)行有效利用,將有助于藥品不良反應(yīng)的系統(tǒng)分析,輔助臨床醫(yī)師快速準(zhǔn)確地作出最優(yōu)用藥決策,確保臨床合理用藥。
類和屬性作為本體的重要組成元素,是本研究的不良反應(yīng)本體構(gòu)建過程的關(guān)鍵步驟。對于該本體的構(gòu)建,將參考藥品說明書,按照確定本體框架、定義類及類的層次關(guān)系、構(gòu)建本體屬性這3個步驟進(jìn)行,具體的流程及每個過程的數(shù)據(jù)來源見圖1。
圖1 不良反應(yīng)本體構(gòu)建過程
本研究構(gòu)建的本體面向的對象為喹諾酮類藥品的不良反應(yīng)信息。分析藥品說明書中的“不良反應(yīng)”相關(guān)內(nèi)容可發(fā)現(xiàn),說明書中除了記錄藥品可發(fā)生的不良反應(yīng)癥狀外,還記錄了不良反應(yīng)的發(fā)生頻率、發(fā)生人群等,如諾氟沙星片的說明書中有關(guān)胃腸道的不良反應(yīng)描述為“胃腸道反應(yīng):較為常見,可表現(xiàn)為腹部不適或疼痛、腹瀉、惡心或嘔吐”。因此,本體中除了要包含喹諾酮類藥品、不良反應(yīng)癥狀這兩類基本內(nèi)容外,為了能夠精準(zhǔn)表達(dá)藥品及不良反應(yīng)領(lǐng)域知識,還需包括不良反應(yīng)發(fā)生率、不良反應(yīng)發(fā)生人群等與不良反應(yīng)相關(guān)的內(nèi)容,以及藥品禁忌人群、給藥途徑等與藥品相關(guān)的內(nèi)容。通過分析這些領(lǐng)域內(nèi)的主要概念及概念間的關(guān)系,即可構(gòu)造概念之間的層次結(jié)構(gòu),從而建立本體的框架。
經(jīng)過分析,本研究構(gòu)建的藥品不良反應(yīng)本體將分為9個大類,分別為喹諾酮類藥品、不良反應(yīng)癥狀、不良反應(yīng)嚴(yán)重程度、不良反應(yīng)發(fā)生人群、不良反應(yīng)發(fā)生頻率、不良反應(yīng)緩解方式、給藥途徑、藥品劑型以及藥品禁忌人群。這9個大類中,喹諾酮類藥品及不良反應(yīng)癥狀為2個主要類。
由于本體構(gòu)建的最終目的是實現(xiàn)對領(lǐng)域知識的重用和共享[9],因此領(lǐng)域本體在構(gòu)建之前應(yīng)充分考慮復(fù)用已有的本體。鑒于目前領(lǐng)域內(nèi)較為成熟的不良事件本體(the Ontology of Adverse Events,OAE)及其衍生的相關(guān)本體[10-14]中涵蓋的ADR術(shù)語均為英文,且這部分術(shù)語并未在我國進(jìn)行推廣使用,國內(nèi)外不良事件與不良反應(yīng)的概念并不完全相同[15],這些本體尚且難以直接應(yīng)用于我國的藥品不良反應(yīng)研究。因此,對于已有本體的復(fù)用,本研究僅考慮復(fù)用相關(guān)本體中的屬性,而不再進(jìn)行類的復(fù)用。此外,由于目前不良反應(yīng)領(lǐng)域已有較成熟、權(quán)威的規(guī)范化詞表,本研究在構(gòu)建本體時將會參考利用這些詞表來減少重復(fù)性工作,簡化本體構(gòu)建的過程。
現(xiàn)今,喹諾酮類藥品已發(fā)展至第四代,且相應(yīng)的子類分別按照這四代藥品進(jìn)行劃分。參考《抗菌藥物治療學(xué)》《中國醫(yī)師藥師臨床用藥指南》《國家基本藥物目錄》等,匯總整理得到四代喹諾酮類藥品共164種,類的最底層(葉子節(jié)點(diǎn))為藥品通用名。
對于不良反應(yīng)癥狀類,WHO不良反應(yīng)術(shù)語集(WHO Adverse Reactions Terminology,WHOART)結(jié)構(gòu)簡潔易懂,術(shù)語集中主要記錄了ADR名稱,使用時較便利;同時,在我國已應(yīng)用多年,不良反應(yīng)報告者和監(jiān)測人員對其相對比較熟悉[16],其中包含的術(shù)語是世界上最受認(rèn)可的ADR術(shù)語[17]。因此,不良反應(yīng)癥狀這一類,考慮到本體的可擴(kuò)展性,將以WHOART(2015年中文更新版)中收錄的術(shù)語為基礎(chǔ),并參照藥品說明書中的實際記錄情況,及結(jié)合如監(jiān)管活動醫(yī)學(xué)詞典(Medical Dictionary for Regulatory Activities,MedDRA)等其他的不良反應(yīng)詞表對其進(jìn)行不斷地調(diào)整與補(bǔ)充。
WHOART的層級結(jié)構(gòu)較為細(xì)致,共分為4級,分別是系統(tǒng)器官分類(System Organ Classes,SOC)、高位語(High Level Terms,HLT)、首選術(shù)語(Preferred Terms,PT)以及收錄術(shù)語(Included Terms,IT),SOC為最高層級,其下位類分別為HLT、PT和IT。在WHOART中,PT是對單一醫(yī)學(xué)概念進(jìn)行獨(dú)特表達(dá)的專用術(shù)語,可用于對不良反應(yīng)術(shù)語進(jìn)行表征和區(qū)分,IT是PT的同義描述。在本研究中,擬構(gòu)建的本體不良反應(yīng)癥狀類采用WHOART中從SOC至PT的層級結(jié)構(gòu),IT不作為單獨(dú)的層級,而作為其對應(yīng)PT的同義詞出現(xiàn)。
對于不良反應(yīng)嚴(yán)重程度類,美國衛(wèi)生及公共服務(wù)部于2017年發(fā)布了常見不良事件評價標(biāo)準(zhǔn)(Common Terminology Criteria for Adverse Events,CTCAE)5.0中英文版本[18],包含836個不良事件術(shù)語,這些術(shù)語均源自MedDRA的低位語,同時也針對每個不良事件進(jìn)行了嚴(yán)重程度(1~5級)的劃分。本研究將以這5級嚴(yán)重程度的劃分為基礎(chǔ)建立不良反應(yīng)嚴(yán)重程度類,并將不良反應(yīng)癥狀與其對應(yīng)的嚴(yán)重程度之間建立關(guān)系。
對于不良反應(yīng)發(fā)生頻率類,國際醫(yī)學(xué)科學(xué)組織委員會(Council for International Organization of Medical Science,CIMOS)推薦使用下述5個術(shù)語和百分率表示藥物不良反應(yīng)發(fā)生頻率[19]:十分常見(≥10%)、常見(≥1%,<10%)、偶見(≥0.1%,<1%)、罕見(≥0.01%,<0.1%)、十分罕見(<0.01%)。本研究將參考這種劃分方式,同時在構(gòu)建過程中對各個術(shù)語在藥品說明書中的同義描述進(jìn)行不斷總結(jié),并納入本體。
對于藥品劑型類及給藥途徑類,參考中華人民共和國國家衛(wèi)生健康委員會(以下簡稱“衛(wèi)健委”)發(fā)布的《國家基本藥物目錄(2018年版)》及《藥物制劑學(xué)》等相關(guān)材料進(jìn)行整理歸納,其中藥品劑型類下分為口服劑型、注射劑型、外用劑型和其他劑型4個子類,這4個子類共包含56種劑型。
對于不良反應(yīng)發(fā)生人群、不良反應(yīng)緩解方式、藥品禁忌人群3個大類中包含的子類,需要依據(jù)藥品說明書中“不良反應(yīng)”“禁忌”“注意事項”3個字段的實際記錄情況進(jìn)行整理,并將其歸類后納入至本體。
在明確不良反應(yīng)本體的框架和基本層次結(jié)構(gòu)后需定義類的屬性關(guān)系,本體中類的屬性包括對象屬性(object property)和數(shù)值屬性(datatype property)。其中對象屬性描述的是類之間的關(guān)系,數(shù)值屬性描述的是類的固有屬性,描述了概念的本質(zhì)特征,數(shù)值屬性對于理解領(lǐng)域內(nèi)概念的內(nèi)涵,揭示領(lǐng)域知識具有不可替代的作用[9]。此外,本體中的注釋屬性(annotation property)屬于元數(shù)據(jù),即用于描述數(shù)據(jù)的數(shù)據(jù),可用來解釋本體中的類、屬性等。
對于對象屬性,在分析本體中這9個類之間的聯(lián)系,以及參考已有OAE本體、RxNorm等知識組織系統(tǒng)的基礎(chǔ)上,本研究構(gòu)建了8個對象屬性,各屬性的定義域、值域及復(fù)用情況見表1。
表1 喹諾酮類藥品不良反應(yīng)本體的對象屬性
對于數(shù)值屬性,通過對不良反應(yīng)領(lǐng)域知識進(jìn)行分析,除了包括概念同義詞以外,還可依據(jù)本研究復(fù)用的規(guī)范化詞表中的實際記錄情況來進(jìn)行補(bǔ)充。例如,對于不良反應(yīng)嚴(yán)重程度類,CTCAE 5.0英文版中同時收錄了不良事件術(shù)語對應(yīng)的NCIt Code、NCIt PT、NCIt Definition、MedDRA TermType等數(shù)據(jù)項,但涵蓋的術(shù)語量僅為MedDRA中很少的一部分。為了最大程度地促進(jìn)本體或術(shù)語集的交互,本研究將利用相同的方法分別實現(xiàn)WHOART與MedDRA 22.0版本及CTCAE 5.0版本的術(shù)語映射;對于映射成功的WHOART中的PT術(shù)語,將這些術(shù)語對應(yīng)的MedDRA Code及NCIt Code作為不良反應(yīng)癥狀類術(shù)語的數(shù)值屬性,對應(yīng)的NCIt Definition則作為注釋納入本體。本研究共構(gòu)建15個數(shù)值屬性,各數(shù)值屬性的含義及賦值類別見表2。
表2 喹諾酮類藥品不良反應(yīng)本體的數(shù)值屬性
喹諾酮類藥品種類十分豐富,相應(yīng)地本體所涉及的藥品種類繁多,工作量巨大。衛(wèi)健委發(fā)布的《國家基本藥物目錄》作為政府舉辦的基層醫(yī)療衛(wèi)生機(jī)構(gòu)和其他各類醫(yī)療機(jī)構(gòu)配備與使用藥物的依據(jù),參考我國疾病譜變化、藥品不良反應(yīng)監(jiān)測評價等因素每3年調(diào)整一次,其中涵蓋的藥物不僅能夠適應(yīng)基本醫(yī)療衛(wèi)生需求,而且是臨床首選、優(yōu)先使用的一線藥物[20]。因此,本研究將以《國家基本藥物目錄(2018年版)》中收錄的喹諾酮類藥品為例,從國家藥監(jiān)局網(wǎng)站、藥智網(wǎng)等獲取相關(guān)藥品的說明書,據(jù)此完成本體中相關(guān)屬性的建立。
此外,國際化資源標(biāo)識符(Internationalized Resource Identifiers,IRI)作為本體在世界范圍內(nèi)的唯一標(biāo)識符[21],促進(jìn)了本體間的交互及復(fù)用。本研究在本體構(gòu)建之初便對本體中概念的IRI進(jìn)行設(shè)定,統(tǒng)一采用“ADR+六位數(shù)字”的形式進(jìn)行表示,且六位數(shù)字從000001開始依次遞增。
依據(jù)前文介紹的本體框架及整理歸納后的各個類涉及的概念,參照藥品說明書的實際記錄情況,在Protégé中可逐層創(chuàng)建子類,本體類的樹狀結(jié)構(gòu)如圖2所示。
圖2 不良反應(yīng)本體類的樹狀結(jié)構(gòu)
其中,對于不良反應(yīng)癥狀類中概念的命名,由于WHOART中SOC術(shù)語的命名不能體現(xiàn)描述的是藥品不良反應(yīng),所以在本體中,SOC術(shù)語后統(tǒng)一加“-ADR”;考慮到WHOART中PT術(shù)語中會包含HLT術(shù)語,為了便于區(qū)分和構(gòu)建屬性,本體中HLT術(shù)語后統(tǒng)一加“[HLT]”,PT術(shù)語的命名則保持不變。除此之外,在WHOART中,部分PT術(shù)語無對應(yīng)的HLT術(shù)語,而直接與SOC術(shù)語對應(yīng);在本體中,針對此類術(shù)語在每個SOC下新建一個類,其命名為“SOC名稱-ADR[無HLT]”,該類的子類術(shù)語為該SOC層級下無HLT術(shù)語的PT術(shù)語。以“丙酮酸降低”為例,其各上位類在本體中的命名情況如圖3所示。
圖3 “丙酮酸降低”各上位類的命名情況
在利用藥品說明書分析藥品與不良反應(yīng)之間的關(guān)系時,為縮短本體構(gòu)建周期,本研究使用Python的Jieba分詞來對說明書中的“不良反應(yīng)”字段進(jìn)行切分,同時參考WHOART構(gòu)建自定義詞典導(dǎo)入Jieba以提高分詞準(zhǔn)確率;考慮到藥品說明書中某些癥狀詞可能不被WHOART收錄,因此在經(jīng)過Jieba分詞后還須結(jié)合人工對分詞結(jié)果審核,并將未被收錄的術(shù)語參考相關(guān)術(shù)語集納入本體。
對于不良反應(yīng)癥狀類,前期通過將WHOART與MedDRA及CTCAE進(jìn)行映射,共建立2 020個癥狀類術(shù)語的數(shù)值屬性MedDRA Code;將256個癥狀類術(shù)語與不良反應(yīng)嚴(yán)重程度類建立對象屬性,并建立了256個術(shù)語的數(shù)值屬性NCIt Code。以“發(fā)熱”為例,在Protégé上可對構(gòu)建完成的屬性進(jìn)行修改、瀏覽,如圖4所示。其中,發(fā)熱的英文翻譯為fever,在MedDRA中對應(yīng)術(shù)語的編碼為10037660,在NCIt中對應(yīng)術(shù)語的編碼為C143485,在WHOART中的編碼為725;同義詞包括體溫升高、發(fā)燒、發(fā)熱反應(yīng)等;當(dāng)發(fā)熱作為不良事件時,可表現(xiàn)為1~5級的嚴(yán)重程度。此外,對于藥品說明書中并未在本體中出現(xiàn)的癥狀詞如納差等,參考其英文翻譯及MedDRA等相關(guān)詞表,結(jié)合專家意見,將其補(bǔ)充至不良反應(yīng)癥狀類相關(guān)術(shù)語的同義描述中。本體中新納入58個癥狀類術(shù)語的同義描述。
對于藥品類,依據(jù)藥品說明書的實際記錄情況即可在本體中將喹諾酮類藥品和對應(yīng)的不良反應(yīng)癥狀建立對象屬性。需要注意的是,有的藥品說明書中還會記錄不良反應(yīng)的發(fā)生頻率,對于此類同時描述“藥品-不良反應(yīng)癥狀-不良反應(yīng)發(fā)生頻率”2個以上實體之間的關(guān)系,本研究參考Hong等[14]在構(gòu)建ODAE(Ontology of Drug Adverse Events)時的經(jīng)驗,將多個對象屬性連接來描述這些實體間的關(guān)系。以“腹瀉”這一癥狀為例,其在本體中構(gòu)建的對象屬性如圖5所示。
圖4 癥狀類術(shù)語—發(fā)熱的屬性示例
圖5 鹽酸左氧氟沙星片與腹瀉之間的對象屬性
以第三代喹諾酮類藥品鹽酸左氧氟沙星片為例,其對象屬性及數(shù)值屬性構(gòu)建情況如圖6所示。其中,注釋部分的Reference表示藥品說明書的來源,點(diǎn)擊網(wǎng)址即可鏈接到相應(yīng)藥品的藥品說明書界面;同時本研究所構(gòu)建的本體在將藥品與不良反應(yīng)癥狀進(jìn)行關(guān)聯(lián)的基礎(chǔ)上,還描述了藥品說明書中記錄的藥品發(fā)生此不良反應(yīng)時的發(fā)生頻率、緩解方式、不良反應(yīng)的嚴(yán)重程度等,對實體間語義關(guān)系的描述較為細(xì)致。此外,通過選擇圖6中屬性右側(cè)的“@”來添加注釋描述不良反應(yīng)的發(fā)現(xiàn)途徑,如圖6(a)中的厭食是通過臨床試驗患者對左氧氟沙星的綜合暴露發(fā)現(xiàn)的不良反應(yīng),圖6(b)中的肝衰竭是通過上市后的使用發(fā)現(xiàn)的不良反應(yīng)。
對于不良反應(yīng)發(fā)生頻率類,將頻率的百分比作為數(shù)值屬性進(jìn)行描述,同時在本體構(gòu)建過程中將藥品說明書中出現(xiàn)的同義描述納入本體;以“十分罕見”為例,其表示的發(fā)生頻率百分比為“<0.01%”,藥品說明書中的同義描述包括極少數(shù)患者、非常罕見等,詳見圖7。
圖6 鹽酸左氧氟沙星片的對象屬性及數(shù)值屬性(部分)
圖7 不良反應(yīng)發(fā)生頻率類術(shù)語—十分罕見的屬性示例
Protégé中提供的OntoGraf可視化插件可實現(xiàn)本體語義關(guān)系的圖形化展示,圖8為本研究所構(gòu)建的不良反應(yīng)本體的OntoGraf圖。其中,不同類型的線條代表了不同類型的語義關(guān)系,實線指向該類的子類,如不良反應(yīng)癥狀包含胃腸疾病類不良反應(yīng)、神經(jīng)系統(tǒng)疾病類不良反應(yīng)等多個下位類;虛線表示類與類之間存在語義關(guān)系,箭頭由定義域指向值域,如喹諾酮類藥品與不良反應(yīng)癥狀之間具有語義關(guān)系,該語義關(guān)系的定義域為藥品,值域為不良反應(yīng)癥狀。
本研究構(gòu)建了同時包含喹諾酮類藥品和不良反應(yīng)的本體,并對它們之間的邏輯關(guān)系進(jìn)行定義與描述,克服了以往不良反應(yīng)詞表缺乏明確的邏輯推理與分類結(jié)構(gòu),難以進(jìn)行自動檢索、計算分析與聚合的缺點(diǎn)[22]。該本體同時還將藥品不良反應(yīng)的發(fā)生頻率、嚴(yán)重程度等引入關(guān)系中,語義關(guān)系揭示的較為細(xì)致,有助于促進(jìn)藥品不良反應(yīng)的系統(tǒng)查詢,并為進(jìn)一步藥品不良反應(yīng)知識的采集、梳理、表示和利用奠定基礎(chǔ)。
圖8 不良反應(yīng)本體關(guān)系展示的OntoGraf圖
當(dāng)然本研究還存在一定的局限性。如本體構(gòu)建過程中概念及屬性的提取大多由手工創(chuàng)建,費(fèi)時費(fèi)力,可能會出現(xiàn)因主觀判斷造成的一些錯誤結(jié)論,同時也并未對構(gòu)建完成的本體的性能和質(zhì)量進(jìn)行客觀有效的評價。未來本研究將細(xì)化WHOART中收錄的ADR術(shù)語,并將中國本地術(shù)語與其進(jìn)行融合,同時也將進(jìn)行更加深入的研究和擴(kuò)展,如利用該本體進(jìn)行不良反應(yīng)的知識發(fā)現(xiàn);此外,考慮將真實世界中藥品不良反應(yīng)數(shù)據(jù)納入該本體,擴(kuò)展本體的覆蓋范圍。
本文構(gòu)建了同時包含喹諾酮類藥品和不良反應(yīng)癥狀的喹諾酮類藥品不良反應(yīng)領(lǐng)域本體,通過系統(tǒng)收集相關(guān)藥品的藥品說明書,將其中的知識概念進(jìn)行語義關(guān)聯(lián),知識表達(dá)精準(zhǔn)完整,語義關(guān)系揭示細(xì)致,以期能夠夠為大規(guī)模藥品不良反應(yīng)本體及其他領(lǐng)域本體的構(gòu)建提供借鑒;此外,該本體也將面向醫(yī)師與患者,為臨床中該類藥品的合理使用提供參考。