陳紅霞,曹 霞,黎亞雄
(1.湖北科技學(xué)院 基礎(chǔ)醫(yī)學(xué)院病生教研室,湖北 咸寧 437100;2.湖北科技學(xué)院 網(wǎng)絡(luò)管理中心,湖北 咸寧 437100)
病理生理學(xué)領(lǐng)域本體構(gòu)建探索
陳紅霞1,曹 霞1,黎亞雄2
(1.湖北科技學(xué)院 基礎(chǔ)醫(yī)學(xué)院病生教研室,湖北 咸寧 437100;2.湖北科技學(xué)院 網(wǎng)絡(luò)管理中心,湖北 咸寧 437100)
病理生理學(xué)探索疾病的病因與條件、發(fā)病機制和患病機體的代謝和機能變化。該學(xué)科與生物物理學(xué)、病理學(xué)、免疫學(xué)、生物化學(xué)與分子生物學(xué)、生理學(xué)等學(xué)科存在大量知識交叉,使得其知識的范圍和邊界交叉,而且不斷擴張。我們根據(jù)病理生理學(xué)學(xué)科的特點將病理生理學(xué)領(lǐng)域本體分為P-Core(病理生理學(xué)基礎(chǔ)本體),P-Process(病理生理過程本體),P- Administrative(規(guī)則文檔本體),使其具體應(yīng)用于以醫(yī)學(xué)教育為目的的知識基礎(chǔ)體系,以診斷幫助信息為目的臨床輔助工具。
教學(xué)領(lǐng)域本體;病理生理學(xué);OWL;本體開發(fā)與集成
引言
本體(Ontology)源自 “形而上學(xué)”的哲學(xué)分支,是對客觀世界本質(zhì)的描述。知識工程學(xué)者借用了這個概念并賦予新的涵義[1-2],用以解決知識表示和知識組織方面等方面的問題。構(gòu)建領(lǐng)域本體的目的是捕獲領(lǐng)域內(nèi)及相關(guān)領(lǐng)域的知識,確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯,從不同層次的形式化模式上給出這些概念和概念之間相互關(guān)系的明確定義,并通過本體工程的推理機制精確地表示其中的隱含信息。近年來從正式出版的文獻來看,國內(nèi)外學(xué)者對本體理論、本體建模、本體應(yīng)用研究較多,相對于具體領(lǐng)域的本體開發(fā)研究較少,對于教學(xué)領(lǐng)域尤其是醫(yī)學(xué)教學(xué)領(lǐng)域則更少。
我們嘗試使用protégé4.1為開發(fā)工具,以O(shè)WL作為本體的描述語言,以病理生理學(xué)領(lǐng)域為研究對象來開發(fā)領(lǐng)域本體,為病理生理學(xué)教學(xué)知識基礎(chǔ)體系和臨床診斷輔助工具打下比較堅實的基礎(chǔ)。
病理生理學(xué)作為基礎(chǔ)醫(yī)學(xué)基石學(xué)科之一,肩負著基礎(chǔ)醫(yī)學(xué)課程到臨床課程之間的“橋梁”作用。其主要研究疾病發(fā)生的原因和條件,疾病過程中患病機體的機能、代謝的動態(tài)變化及其發(fā)生機理,揭示疾病發(fā)生和發(fā)展規(guī)律,闡明疾病的本質(zhì)。病理生理學(xué)以生理學(xué)、生物化學(xué)與分子生物學(xué)、免疫學(xué)、病理學(xué)、生物物理學(xué)等學(xué)科為基礎(chǔ),同時與這些學(xué)科又存在大量的知識交叉。
該學(xué)科的特點導(dǎo)致其醫(yī)學(xué)事實的知識表達是一項復(fù)雜的事情,幾乎不可能用一個單一的本體描述出來。因此我們將病理生理學(xué)領(lǐng)域本體設(shè)計為一個聯(lián)合相關(guān)的本體集合,每一個本體代表一個章節(jié)或者某種疾病相關(guān)的條目。這些子本體分別為:
(1)P-Core:病理生理學(xué)基礎(chǔ)本體。
(2)P-Process:病理生理過程本體,此本體為本體類型中的任務(wù)本體。
(3)P- Administrative:規(guī)則文檔本體。
為了方便本體(Ontology)的開發(fā)與應(yīng)用,國內(nèi)外的研究團體開發(fā)了多種類型的本體構(gòu)建工具比較著名的有KAON、OILEd、OntoEdit和Protégé等。
Protégé由斯坦福大學(xué)醫(yī)學(xué)院醫(yī)學(xué)情報研究小組開發(fā)。因其特性有:集本體編輯和知識庫編輯于一體,支持各種知識表示要素,方便定義各種知識規(guī)則等。幾乎成為國內(nèi)外本體研究機構(gòu)的首選工具,我們選取Protégé4.1作為本體開發(fā)工具,以Protégé內(nèi)置插件Pellet作為推理機。
與開發(fā)工具類似的是,出于本體自身的需求和具體工程的考慮,研究人員提出了多種構(gòu)建方法如:骨架法(Skeletal Methodology),企業(yè)建模法(Gruninger & Fox“評價法”),Methontology法,循環(huán)獲取法等,我們遵循斯坦福大學(xué)醫(yī)學(xué)院開發(fā)的七步法。
本體描述語言起源于知識工程領(lǐng)域?qū)χR表示的研究。近年來為了使本體構(gòu)建好后推理方便,描述邏輯悄然盛行,已經(jīng)成為知識工程研究中一種重要的知識表示方法,目前正被積極應(yīng)用于本體的描述。以此為基礎(chǔ)的本體描述語言主要有:OIL、DAML+OIL、OWL等。
OWL(Web Ontology Language)是W3C 2004年推薦的本體描述語言的標(biāo)準(zhǔn), 有三個子語言:OWL Full、OWL DL和OWL Lite。OWL Full 以資源描述架構(gòu)(resource description framwork:RDF)[3]并提供兼容敘述。OWL Lite僅僅提供精準(zhǔn)屬性計算。OWL DL基于描述邏輯同時具有豐富表達方式。我們選取OWL DL作為本體的描述語言。
為了進行領(lǐng)域本體的構(gòu)造,首先應(yīng)確定該領(lǐng)域內(nèi)的概念集。我們從實用性角度出發(fā),兼顧基礎(chǔ)教學(xué)與臨床,擬建立一套完整的病理生理學(xué)知識表示體系,概念集中概念的確定主要來自三個方面:
(1)人民衛(wèi)生出版社2013年出版的國家十二五普通高等教育本科國家級規(guī)劃教材 《病理生理學(xué)(第8版)》(王建枝,殷蓮華等主編)。
(2)《MeSH》詞表,依照此詞表來確定概念之間的等級以及概念之間的相互關(guān)系。
(3)從Wikipeidia中選取,結(jié)合《MeSH》來修正概念之間的層次關(guān)系。
我們以教材《病理生理學(xué)(第8版)》(王建枝,殷蓮華等主編)中的第12章:缺血-再灌注損傷為例,來說明病理生理學(xué)教學(xué)領(lǐng)域本體的構(gòu)建。
1.IRIP-Core:缺血-再灌注損傷基礎(chǔ)本體
這部分焦點集中在描述缺血-再灌注損傷研究與實踐的基本信息,主要工作是:收集缺血-再灌注損傷相關(guān)的術(shù)語,復(fù)用Geno Ontology、蛋白質(zhì)本體[4]等國際上著名本體中的數(shù)據(jù),使用語義Wiki來保證知識獲取的有效性。同時還依賴于作為科研支持的頂級本體Basic Formal Ontology所轄基礎(chǔ)范圍。為了將這些知識有效的融合為一體,我們采用了類似Minimal Information to ReferenceExternal Ontology Terms(MIREOT)的實驗方法[5]。其OWL示例如下:
2.IRIP-Process:描述缺血-再灌注損傷病理的過程本體
這部分旨在描述身體組織中缺血-再灌注損傷病理原因條件、發(fā)生的機制及影響等,歸類于任務(wù)本體一類。其OWL示例如下:
3.IRIP- Administrative:規(guī)則文檔本體
這部分可以從病理生理學(xué)獨立開來,旨在覆蓋與病理生理學(xué)相關(guān)的官方文檔如:管理機構(gòu)、法律、規(guī)章制度、官方認(rèn)可的分類系統(tǒng)和標(biāo)準(zhǔn)等。舉個例子來說,跟本章相關(guān)的國際定義的標(biāo)簽系統(tǒng)ISBT-128。ISBT-128標(biāo)準(zhǔn)化了血液及其相關(guān)產(chǎn)物的象征編碼,允許它們在全世界的血庫和注射服務(wù)中可讀。偽OWL示例如下:
>(此處為我們描述Pathological_status的信息).
本研究首次構(gòu)建了病理生理學(xué)領(lǐng)域本體,并以缺血-再灌注損傷為例子闡述了構(gòu)建的基本方法、本體描述語言和編輯工具的選擇。我們不僅僅是要構(gòu)建一個以教育為目的的知識基礎(chǔ),還希望構(gòu)建一個以診斷幫助信息為目的臨床輔助工具和可以作為醫(yī)學(xué)語義計算的推理基礎(chǔ)、作為開發(fā)協(xié)同系統(tǒng)的核心詞匯集等。在實踐過程中,研究人員發(fā)現(xiàn)存在一些問題:如概念與概念之間存在交叉,明確劃分界限存在問題。該領(lǐng)域本體集并未能包含所有病理生理學(xué)的本體知識。
本文側(cè)重對面向病理生理學(xué)領(lǐng)域本體構(gòu)造進行探討,本課題組后續(xù)將進行實證性研究,以證明其有效性。另外,還將繼續(xù)開展病理生理學(xué)領(lǐng)域本體的其它應(yīng)用性研究。如通過本體推理機制來發(fā)現(xiàn)隱含知識,進行醫(yī)學(xué)語義計算和醫(yī)學(xué)知識挖掘;使用本體映射或本體集成技術(shù)使其成為構(gòu)建其他本體的基石等。
[1]Gruber T R.A TransIation Approach to PortabIe OntoIogy Specifications[J].KnowIedge Acguisition,1993,(5):199 ~ 220.
[2] Studer R,Benjamins V R,F(xiàn)enseI D. KnowIedge Engineering,PrincipIes and Methods[J]. Data and KnowIedge Engineering,1998,25(1-2):161 ~ 197.
[3] 姜恩波. RDF原理、結(jié)構(gòu)初探[J]. 現(xiàn)代圖書情報技術(shù), 2001, (5): 32-33.
[4] Darren A. Natale, et al., “Protein Ontology: a controlled structured network of protein entities”, Nucleic Acids Research, 2013, 42(1): D415-21.
[5] Almeida, M.B.; Proetti, A.B.; Ai, J. (2011); Smith, B. The Blood Ontology: an ontology in the domain of hematology - Proceedings of the International Conference of Biomedical Ontologies,? (ICBO), 2011.
2095-4654(2015)11-0084-03
2015-08-01
湖北科技學(xué)院教研項目(2011B057;2013-AX-013)
TP182