国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

動物疫情信息分析系統(tǒng)本體的構建

2018-01-06 06:53徐全剛李金花柳宜江韋美伊孫向東
中國動物檢疫 2018年1期
關鍵詞:術語本體疫病

徐全剛,李金花,柳宜江,劉 平,曾 恒,高 璐,韋美伊,孫向東

(1. 中國動物衛(wèi)生與流行病學中心,山東青島 266032;2. 武漢大學計算機學院,湖北武漢 430072;3. 北京郵電大學,北京 100876)

動物疫情信息分析系統(tǒng)本體的構建

徐全剛1,李金花1,柳宜江2,劉 平1,曾 恒1,高 璐1,韋美伊3,孫向東1

(1. 中國動物衛(wèi)生與流行病學中心,山東青島 266032;2. 武漢大學計算機學院,湖北武漢 430072;3. 北京郵電大學,北京 100876)

本研究以動物疫病為特定領域,在理解本體論理論和方法的基礎上,探討基于本體論的動物疫病領域本體構建方法。即采用七步法,自上向下構建領域本體,以Protégé 3.0為本體編輯工具,初步建立了動物疫病領域本體框架模型,并驗證了該本體用于網(wǎng)絡檢索的可行性。該本體的構建為動物疫情信息分析系統(tǒng)本體的開發(fā)和應用奠定了基礎。

動物疫?。活I域本體;知識組織;信息分析系統(tǒng);構建方法

隨著計算機及信息技術的發(fā)展和因特網(wǎng)的普及,社會各領域信息化程度日益提高,動物疫病領域信息化進程也得到快速發(fā)展。目前網(wǎng)絡上存在大量的文字、圖像、數(shù)據(jù)、音頻、視頻等多種形式的動物疫病信息資源。各種類型數(shù)字資源既豐富了動物疫病相關數(shù)據(jù)的存儲和傳播方式,又形成了廣闊的信息海洋。然而,不同軟件系統(tǒng)運用各自的術語體系或詞表來描述信息資源,導致不同系統(tǒng)間的知識共享和重用十分困難。而對于信息資源豐富的互聯(lián)網(wǎng)來說,大量的非結構或半結構化數(shù)據(jù),使得智能軟件代理對互聯(lián)網(wǎng)上異構和分布信息的有效訪問和檢索得不到保證,因而降低了信息資源的利用效率。

如何充分利用計算機來解讀和表達動物疫病領域的理論與實踐經(jīng)驗,利用互聯(lián)網(wǎng)動態(tài)監(jiān)視動物疫病流行情況,使動物疫病領域的海量信息得到高效準確采集、存儲與利用?這些問題不僅是動物疫病領域數(shù)字化進程中必須面對的,也是全人類知識數(shù)字化進程中必須解決的難題。

建立統(tǒng)一、規(guī)范的知識模型,是解決上述問題的有效方法之一。就當今計算機科學及信息技術研究領域的發(fā)展狀況來看,本體(Ontology)作為一種有效的知識組織方法,得到廣泛關注和研究,已被廣泛應用于信息系統(tǒng)、知識工程、自然語言理解和信息檢索等方面。而領域本體的構建是各種應用得以實現(xiàn)的前提。

1 本體概述

所謂本體,最著名或最多被引用的定義是由Gruber[1]提出的“本體是概念模型的明確規(guī)范說明”。通俗地講,本體是用來描述某個領域甚至更廣范圍內的概念,以及概念之間的關系,使這些概念和關系在共享范圍內具有大家共同認可的、明確的、唯一的定義。

Maedche[2]把本體結構定義為一個五元組O:={C,R,HC,rel,AO}。C和R是兩個不相交的集合,其中:C為概念(Concept)集合;R為關系(Relation)集合;HC表示概念層次或分類層次,即概念間的分類關系(Taxonomy relation):rel表示概念間的非分類關系(Non-taxonomy relation);AO表示使用某種邏輯語言表達的本體公理(Axiom)集。

Studer[3]等學者認為本體有四大特征:第一,本體是明確的(Explicit),指概念所屬的上位類與在使用次概念時的限制條件應預先得到明確定義和說明;第二,本體是形式化的(Formal),指本體應該具有機器可讀性;第三,本體是共享的(Shared),指在一個本體中,知識所表達的觀念、觀點應該抓住知識的共性;第四,本體是概念化的,它是一個概念體系,又稱概念模型(Conceptualization)。

本體清晰地描述了領域知識的結構,進而為知識的表示打好基礎。動物疫病本體就是刻畫動物疫病領域實體、屬性、關系和過程的一種模型,目的是讓動物疫病知識更好地被重用、共享和處理。這種形式化描述可成為知識軟件系統(tǒng)中可重用和共享的組件,讓機器能夠理解,也為人與人、組織與組織及計算機之間的通信提供統(tǒng)一的術語和概念,使知識共享成為可能,同時也有利于知識的獲取,并提高獲取的速度和可靠性。

2 動物疫情分析系統(tǒng)本體構建

2.1 一般原則

領域本體構建應面向特定領域和特定應用目的。雖然構建本體的目的都是為了實現(xiàn)知識共享和重用,從客觀意義上說,本體的描述應和特定的任務、目的無關,但人們在構建領域本體時總是基于一定的應用目的,因此對于所描述知識的選擇是與特定任務相關的。本文所構建的本體庫是為開發(fā)動物疫情分析系統(tǒng)而量身定制的。領域本體中包含的概念數(shù)目應該是盡可能最小化冗余的,領域本體規(guī)模應該是有限增長的。領域本體構建不可能一蹴而就,而是一個不斷反復修改、逐步完善的過程。鑒于缺少相關實踐經(jīng)驗指導,動物疫病領域本體的構建需要不斷摸索和重復以下流程[4]:確定本體的應用目的和范圍;領域分析:定義本體所有術語的意義及術語之間的各種關系;本體表示:一般用語義模型來表示本體;本體評價:評價的標準是“清晰性、一致性、完整性、可擴展性”;本體的建立:對于符合上述標準的本體,以文件形式存放,否則要重新進行領域分析(圖1)。

圖1 本體構建流程

2.2 構建方法

由于研究者來自于不同領域,有著不同的學科背景,因此關于本體構建,目前還沒有統(tǒng)一的標準。在構建方法上,有骨架法、METHONTOLOGY法、TOVE法、KACTUS工程法、SENSUS法、IDEF5法和七步法等。有分析指出,上述7種方法均允許在系統(tǒng)間進行互操作,提供知識共享和復用機制,其成熟度依次為七步法、METHONTOLOGY法、IDEF5法、TOVE法、骨架法、SENSUS法、KACTUS工程法[5]。其中,七步法是由美國斯坦福大學醫(yī)學院開發(fā)的,主要用于領域本體的構建。本研究在構建動物疫病領域本體時,結合自身的學科特點,較多地參考了該方法和流程[6]。

2.2.1確定專業(yè)領域和范疇 在構建本體時必須首先明確本體覆蓋哪個專業(yè)領域、構建本體的目標是什么等問題。本研究以動物疫病作為特定研究領域,以基于動物疫病領域本體的知識查詢和檢索為應用目的,探討基于本體論的領域知識、組織方法。

2.2.2列舉動物疫病領域中的術語清單 原則上,應盡可能多地收集該學科的術語,做到領域的全覆蓋。從動物疫病相關教材、書籍和辭典、國家標準和行業(yè)標準等文獻中篩選出專業(yè)術語,列出術語清單,并將術語解釋一并收入。

2.2.3定義類及類的等級關系 建立一個領域本體的等級體系,有幾種可行的方法[7]。自上向下法:由領域中最大的概念開始,再將這些概念按照學科知識結構分級細化,形成概念的等級體系。自下向上法:由底層最小類的概念開始(它們是這個等級體系的葉子節(jié)點),將這些細化的類歸并在其上層概念之下,逐級遞進,形成概念的等級體系。綜合法:是上述兩種方法的綜合運用,先定義領域中各種不同的類,再按照學科知識結構將其組織起來,逐步形成概念的等級體系。研究者可以根據(jù)自身對專業(yè)領域的理解程度來確定采取什么方法定義“類”。在構建動物疫病知識本體時,采用自上向下法。關于動物疫病知識本體等級體系分類的表達方式,可參考通用教材和領域專家編撰的專業(yè)著作當中的相關動物疫病知識體系結構。這樣比較符合學科體系的分類習慣,易于被最終用戶所理解和接受。本文按照農業(yè)部發(fā)布的第1125號公告[8],將動物疫病分為一、二、三類動物疫病(圖2);每類動物疫病又可分為多種動物共患病、牛病、綿羊和山羊病、豬病、禽病、兔病、蠶蜂病、犬貓病、魚類病、甲殼類病、貝類病、兩棲與爬行類病等12個類別;最后一級就是具體的動物疫病名稱,如口蹄疫、牛瘟、非洲豬瘟、禽流感等。鑒于一類動物疫病只有17種,也沒有完全覆蓋上述12個類別,所以也可將這17種疫病直接歸入一類動物疫病的下一層級。在定義類及其等級關系過程中,首先要理解和辨析術語釋義,在此基礎上,再對上述清單中的術語進行語義分析,確定術語之間的關系,如同義關系、等級關系、類與實例關系(Is-A關系)、概念與屬性關系,等等。本研究以protégé 3.0為本體編輯工具,按照下述過程,初步建立了動物疫病領域本體框架。

圖2 動物疫病本體體系

2.2.3.1詞義辨析 動物疫病領域也是由多個學科相互支撐配合的一個有機整體,包含傳染病學、微生物學、流行病學、免疫學等多方面的知識。隨著科技的不斷進步,動物疫病領域的發(fā)展也是日新月異??傮w來看,該領域的專業(yè)性很強。該領域的概念體系具有鮮明特色,是通過獨特的術語表達出來的。由于語言的變遷、學科的融合和發(fā)展等因素影響,以及長期以來該領域術語缺乏規(guī)范化,導致了部分術語外延寬泛、內涵不清,常出現(xiàn)一詞多用、多詞一義、詞義演變等現(xiàn)象。因此,在構建本體時,理解和辨析術語釋義是一個相當重要的基礎工作。

2.2.3.2合并與歸類 “合并”是將同義詞放在一起,作為同一概念的不同稱謂,如布魯氏菌病又稱“布病”“懶漢病”“地中海弛張熱”“馬爾他熱”等?!皻w類”是參照術語注釋,將一個術語歸并到它的上位概念中去,成為其上位概念的子概念或實例。例如:高致病性禽流感是禽流感的子概念,而H5N1、H5N2、H5N6、H5N8、H7N7等亞型禽流感則是高致病性禽流感病毒的實例。

2.2.3.3一詞多用情況的處理 分析一詞多用及詞義演變的情況。當一個術語出現(xiàn)在多種動物疫病中時,為其加上括號和修飾詞,以保證其唯一性。例如:豬瘟、高致病性豬藍耳病、豬細小病毒病、豬偽狂犬病都能引起母豬流產,在構建本體時分別標示為“流產(豬瘟)”“流產(高致病性豬藍耳病)”“流產(豬細小病毒?。薄傲鳟a(豬偽狂犬?。?。以上3項工作是交互進行,不能截然分開的。然后在此基礎上進行概念抽提,以確定領域本體的核心概念。核心概念應是相對穩(wěn)定的,在對動物疫病領域本體進行擴展時,只需要在層次結構的某些分支下增加新的概念。

2.2.4定義類及其等級體系的屬性及分面 這是一個描述類內在結構的過程,同時也是描述某個類實例與其他類實例之間關系的過程。屬性的建立以學科知識和應用目的為基礎,在確立了屬性之后,還要對其分面進行限制。屬性的分面主要有取值限定、取值類型、應用范圍等。有一點需要注意,某個類的所有子類都要繼承該類的屬性。因此,一個屬性應被定義在擁有該屬性的最大類上。

2.2.5創(chuàng)建實例 實例是領域本體中的最小概念。創(chuàng)建實例的過程就是為屬性和關系賦值的過程。

3 討論

本研究探討了基于本體理論的動物疫病領域知識組織方法,初步建立了動物疫病領域本體框架,并驗證了該本體應用于網(wǎng)絡檢索的可行性。研究表明,本體論是對領域知識的概念化說明,是采用框架系統(tǒng)對概念及其關系進行的描述,也是動物疫病知識的一種可行的表達方法。在方法學上,構建動物疫病領域本體可借鑒美國斯坦福大學醫(yī)學院提出的“七步法”,并結合自身的學科特點和研究目的進行適當調整。類及其等級的建立要符合學科的知識體系結構,屬性的設置根據(jù)應用目的和學科內容。另外,要在屬性充分完善的基礎上創(chuàng)建實例,以防止數(shù)據(jù)丟失。protégé 3.0是一個方便實用的本體編輯工具,既可以表示知識的等級結構,也可以表示知識的組成結構。在進一步的大規(guī)模研究中,應先對其進行本地化,以提供更方便、合理的使用。

本研究應用本體論作為動物疫病知識表示的理論和方法。建立動物疫病領域本體,必將有利于改善和解決動物疫病防控數(shù)字化進程中所面臨的問題,并為動物疫病信息檢索系統(tǒng)、教育系統(tǒng)、自然語言理解等研究提供智能基礎作為目的,最終通過建立基于本體論的動物疫病領域知識的結構化表達,推進動物疫病防治信息化的發(fā)展,實現(xiàn)知識的高效準確采集、存儲與利用,促進領域知識的共享和重用。這是一項具有開創(chuàng)性的、意義深遠的工作,也是一項十分艱辛的工作。

構建領域本體需要在深入理解領域知識的基礎上進行,離不開領域專家的參與。這在本體論工程中已經(jīng)形成共識。領域專家的參與可以保證領域本體中概念層次結構、概念關聯(lián)關系等的完備性和正確性。作為動物疫病領域的專業(yè)人員,在理解本體理論和方法的基礎上構建動物疫病領域本體,是信息時代賦予我們的使命。

[1] GRUBER T R. A translation approach to portable ontology specifications[J]. Knowledge acquisition,1993,5(2):199-220.

[2] MAEDCHE A. Ontology learning for the semantic web[M]. Boston:Kluwer Academic Publishers,2002.

[3] ERDMANN M,STUDER R. Ontologies as conceptual models for xml documents[R]. Banff:Proceedings of the 12thWorkshop on Knowledge Acquisition,Modeling and Management,1999.

[4] 楊秋芬,陳躍新. Ontology 方法學綜述[J]. 計算機應用研究,2002,19(4):5-7.

[5] 李景,孟連生. 構建知識本體方法體系的比較研究[J].現(xiàn)代圖書情報技術,2004,20(7):17-22.

[6] NOY N F,MCGUINNESS D L. Ontology development l01:A guide to creating your first ontology [EB/OL].[2017-10-22]. http://protege.stanford.edu/publieations/ontology_development/ontology l01.pdf.

[7] USCHOLD M,GRUNINGER M. Ontologies:principles,methods and applications[J]. Knowledge engineering review,1996,11(2):93-136.

[8] 農業(yè)部獸醫(yī)局. 中華人民共和國農業(yè)部公告第1125號[A]. 北京:農業(yè)部,2008.

Ontology Construction of Animal Disease Information Analysis System

Xu Quangang1,Li Jinhua1,Liu Yijiang2,Liu Ping1,Zeng Heng1,Gao Lu1,Wei Meiyi3,Sun Xiangdong1
(1. China Animal Health and Epidemiology Center,Qingdao,Shandong 266032,China;2. College of Computer Science,Wuhan University,Wuhan,Hubei 430072,China;3. Beijing University of Posts and Telecommunications,Beijing 100876,China)

Based on understanding ontology theory and method,taking animal disease as a specific field,the construction method of animal disease domain ontology based on ontology was discussed in this research. Taking the seven-step method and top-down strategy,an ontology model of animal disease was set up initially by software protege 3.0,and the feasibility of the ontology for network retrieval was verified. The foundation was laid for development and application of animal disease information analysis system by ontology constructed in this study.

animal disease;domain ontology;knowledge organization;information analysis system;construction method

國家重點研發(fā)計劃項目(2016YFC1201304)

同等貢獻作者:徐全剛、李金花

孫向東

S831.7

A

1005-944X(2018)01-0013-04

10.3969/j.issn.1005-944X.2018.01.004

朱迪國)

猜你喜歡
術語本體疫病
梨火疫病的識別與防控
中醫(yī)名醫(yī) 征戰(zhàn)疫病
眼睛是“本體”
豬的主要疫病及防控措施(下)
豬的主要疫病及防控措施(上)
基于本體的機械產品工藝知識表示
專題
Care about the virtue moral education
有感于幾個術語的定名與應用
從術語學基本模型的演變看術語學的發(fā)展趨勢
武山县| 卫辉市| 长武县| 富蕴县| 舟曲县| 隆回县| 慈溪市| 南宁市| 汾西县| 东莞市| 平安县| 阿城市| 平度市| 哈巴河县| 宿迁市| 梁山县| 日照市| 涡阳县| 新乡县| 栾川县| 湖州市| 固安县| 通江县| 天门市| 柳林县| 大英县| 铜陵市| 山东| 十堰市| 运城市| 泌阳县| 大关县| 大宁县| 明溪县| 伊川县| 义马市| 桐梓县| 平利县| 勐海县| 洞口县| 济阳县|