李貫峰
摘 要:針對農(nóng)業(yè)領(lǐng)域存在的知識表示、共享、重用等問題,將本體理念與技術(shù)引入農(nóng)業(yè)領(lǐng)域。介紹了本體論的有關(guān)概念和理論,在關(guān)于本體已有研究的基礎(chǔ)上,提出了構(gòu)建農(nóng)業(yè)領(lǐng)域本體的基本原則、流程和方法。最后,以枸杞病蟲害知識為例構(gòu)建了領(lǐng)域本體,可為促進枸杞病蟲害綜合防治的知識共享及重用提供參考。
關(guān)鍵詞:農(nóng)業(yè)本體; 知識建模; 知識管理;農(nóng)業(yè)信息化
DOIDOI:10.11907/rjdk.162137
中圖分類號:TP301
文獻標識碼:A文章編號:1672-7800(2016)012-0065-03
0 引言
隨著信息技術(shù)的飛速發(fā)展,信息量不斷增加,如何合理描述、表達、組織和管理海量無序的知識資源,并有效進行知識共享和服務是知識管理領(lǐng)域迫切需要解決的問題。本體(Ontology)作為共享概念模型的明確的形式化規(guī)范說明,為知識和概念提供了一個科學的組織方法。由于本體的支持,知識服務如搜索、積累和組織等效率得到極大提高,同時知識的發(fā)現(xiàn)、重用和共享變成現(xiàn)實。作為農(nóng)業(yè)信息化的基礎(chǔ),農(nóng)業(yè)領(lǐng)域知識是一種可以大幅度提高農(nóng)業(yè)勞動力和生產(chǎn)效率的生產(chǎn)要素。因此,研究農(nóng)業(yè)領(lǐng)域的本體知識建模,構(gòu)建面向本體的農(nóng)業(yè)知識庫,完善農(nóng)業(yè)知識服務體系,是推動農(nóng)業(yè)信息化合理發(fā)展的必要措施。
為加強農(nóng)民和農(nóng)技人員對農(nóng)作物病蟲害認識,有效指導病蟲害的防治工作,農(nóng)作物病蟲害知識和信息的表示與共享技術(shù)顯得尤為重要。目前已有的農(nóng)作物病蟲害知識表示方法有: 基于模糊推理的知識表示方法[1]、基于產(chǎn)生式規(guī)則表示知識[2]和基于案例推理的知識提取方法[3]等。這些傳統(tǒng)方法構(gòu)建的知識庫不僅具有很強的領(lǐng)域特性,而且在知識獲得、表達、共享和重用等方面都存在不足。隨著本體論研究在農(nóng)業(yè)信息管理領(lǐng)域的滲透,農(nóng)業(yè)病蟲害本體的研究不斷深入,如水稻病蟲草害本體[4]、蔬菜病蟲害知識庫[5]、柑橘病蟲害本體[6]、玉米病蟲害[7]等,但大多數(shù)相關(guān)研究都存在領(lǐng)域的局限性。本文借助本體理論的思想,運用本體方法組織知識,選擇枸杞病害和蟲害作為研究對象,構(gòu)建結(jié)構(gòu)良好的枸杞病蟲害領(lǐng)域本體庫,為枸杞病蟲害知識服務提供支持。
1 本體與農(nóng)業(yè)本體
本體論原是哲學領(lǐng)域中為研究存在而發(fā)展出來的一個概念,現(xiàn)在被用于信息科學中,其概念和內(nèi)涵也隨之改變和不斷完善。在信息科學領(lǐng)域中本體論是一種利用計算機語言和模型來進行領(lǐng)域知識表示和組織,結(jié)合信息技術(shù)進行知識管理、共享和服務的科學方法論。本體是通過領(lǐng)域?qū)<业姆e極參與和通力協(xié)作而構(gòu)建的領(lǐng)域概念、關(guān)系和公理體系的集合,以計算機能理解的語言和形式描述、表示和組織知識,促進知識重用、知識共享和知識服務[8]。農(nóng)業(yè)本體是農(nóng)業(yè)學科領(lǐng)域內(nèi)概念、概念與概念間的相互關(guān)系以機器能理解的形式化語言表示和組織農(nóng)業(yè)知識和模型。農(nóng)業(yè)本體給農(nóng)業(yè)領(lǐng)域提供了統(tǒng)一的術(shù)語和概念,使得農(nóng)業(yè)知識高效可靠地獲取、共享和服務成為可能。隨著本體論研究在農(nóng)業(yè)領(lǐng)域的滲透,本體在農(nóng)業(yè)知識庫構(gòu)建、知識共享服務及智能檢索等方面具有良好的應用前景。
2 本體構(gòu)建
2.1 本體模型
本體在結(jié)構(gòu)上包含5個基本建模原語:概念、關(guān)系、函數(shù)、公理和實例。概念通常也被稱為類,指任何事物,表示領(lǐng)域中具有相同屬性的對象的名詞集合,是知識領(lǐng)域內(nèi)的標準與規(guī)范,為知識的共建共享提供了基礎(chǔ),概念以層次關(guān)系加以組織;關(guān)系描述概念相互之間的交互關(guān)系,如繼承關(guān)系、整體與部分的關(guān)系等;函數(shù)是一種特殊的關(guān)系;公理采取特定邏輯形式的斷言(包括規(guī)則在內(nèi)),表示任何情況下都正確的描述;實例代表元素,也就是概念中的具體例子,是整個本體的基礎(chǔ)對象。本體是知識概念化的顯式規(guī)范說明,它將知識以一種明確的、形式化的方式表示出來。本體可以表示為一個五元組O=(V,C,R,A,X),其中,V表示論域中的術(shù)語集,C表示概念集,R表示概念間的層次關(guān)系,具有自反性、無環(huán)性、有向性和傳遞性,A表示概念和關(guān)系的屬性值集合,X表示公理集,是對概念和關(guān)系屬性值的約束。
2.2 本體構(gòu)建原則
本體是一種先進的信息資源知識組織方法,本體構(gòu)建是一項復雜的系統(tǒng)工程,目前沒有統(tǒng)一的本體構(gòu)建方法和規(guī)則,Gruber提出本體構(gòu)建的5個原則,即本體的定義具備清晰性、完整性、一致性、最大單向可擴展性和最小編碼相關(guān)性[9]。對于領(lǐng)域本體的構(gòu)建,還應遵循以下4個原則: 標準化建設(shè)原則、本體復用原則、協(xié)作原則和評建結(jié)合的原則。其中,標準化可以提高本體的共享性、防止和避免信息應用相互脫節(jié);本體復用采用多層次繼承方法,減少和避免本體的重復定義;協(xié)作原則要求眾多領(lǐng)域?qū)<?、知識工程師和IT人員協(xié)作參本體構(gòu)建;評建結(jié)合原則要求在本體構(gòu)建過程中檢驗本體是否完整,是否滿足用戶的實際需求,需要不斷接受評估和提高。
2.3 本體構(gòu)建方法和流程
隨著本體在各領(lǐng)域的廣泛應用,出現(xiàn)了多種本體構(gòu)建方法,國內(nèi)外比較有影響的本體構(gòu)建方法有骨架法、IDEF5法、TOVE法、METHONTOLOGY法、XHEMICALS方法、SENSUS方法及七步法等[6,10]。本文借鑒本體構(gòu)建相關(guān)方法,依據(jù)農(nóng)業(yè)領(lǐng)域知識的特點,確定了農(nóng)業(yè)領(lǐng)域本體構(gòu)建的方法,其流程如圖1所示,具體思路如下:①構(gòu)建本體之前,進行需求分析,確定領(lǐng)域本體框架,明確領(lǐng)域本體的應用目標和范疇;②通過專業(yè)相關(guān)書籍、文獻資料、權(quán)威網(wǎng)站信息等途徑獲取領(lǐng)域知識,結(jié)合農(nóng)業(yè)領(lǐng)域?qū)<医ㄗh,對領(lǐng)域知識進行分析、整理和歸納,得到所需領(lǐng)域的概念和關(guān)系;③對領(lǐng)域知識充分了解的基礎(chǔ)上,結(jié)合需求分析,將領(lǐng)域中的主要概念和關(guān)系列舉出來,在農(nóng)業(yè)領(lǐng)域?qū)<抑笇?,確定領(lǐng)域的核心概念和關(guān)系;④基于前面劃分的概念層次結(jié)構(gòu),使用本體構(gòu)建工具對類、屬性和實例等本體元素進行編碼及形式化定義,實施本體構(gòu)建;⑤本體建立后,領(lǐng)域內(nèi)概念的定義是否清楚,關(guān)系是否明確,需要運用推理工具自動判斷和檢驗,并對有邏輯錯誤的地方進行修改,以滿足用戶的實際需求;⑥本體創(chuàng)建是一個反復迭代的過程,需要不斷優(yōu)化和完善,以便更好地適應實際使用。
3 枸杞病蟲害本體構(gòu)建實現(xiàn)
3.1 應用背景分析
枸杞病蟲害本體是利用計算機語言規(guī)范枸杞病蟲害的相關(guān)概念、概念間的關(guān)系,形成對枸杞病蟲害知識組織結(jié)構(gòu)的共同理解,為進一步建立枸杞病蟲害語義Web,開展枸杞病蟲害知識服務奠定基礎(chǔ)。在枸杞病蟲害本體的支持下,對枸杞病蟲害知識的獲取、搜索和使用等相關(guān)服務的效率大為改善,實現(xiàn)真正意義上的知識重用和共享。
3.2 知識及獲取
在學習了很多相關(guān)枸杞病蟲害書籍和大量文獻資料的基礎(chǔ)上,結(jié)合枸杞病蟲害領(lǐng)域?qū)<医ㄗh,以寧夏地區(qū)常見的枸杞蚜蟲、枸杞紅癭蚊、枸杞癭螨等51種枸杞害蟲和根腐病、炭疽病、白粉病等15種枸杞病害為研究對象,對枸杞病蟲害領(lǐng)域知識進行分析、整理和歸納得出核心概念集合。
3.3 本體知識建模
由于枸杞病蟲害領(lǐng)域復雜的領(lǐng)域間關(guān)系,在本體構(gòu)建過程中以枸杞為核心,綜合考慮與其相關(guān)的枸杞病害類型、枸杞蟲害、蟲害體征、癥狀、危害部位、發(fā)生發(fā)展規(guī)律、病原、防治方法等要素,通過描述其領(lǐng)域中的類(概念)、屬性關(guān)系和實例(個體),構(gòu)建完整的枸杞病蟲害本體。
3.3.1 本體類結(jié)構(gòu)及層次模型建立
構(gòu)建本體類層次結(jié)構(gòu)模型是構(gòu)建領(lǐng)域本體過程中非常重要的任務。首先將枸杞病蟲害本體分為5個一級類,分別是枸杞病害(Disease)、枸杞蟲害(Pets)、危害部位(Part)、危害癥狀(Symptom)和防治方法(Prevention)。然后依據(jù)枸杞病蟲害的知識體系結(jié)構(gòu)內(nèi)容,對概念作進一步細分。在Protégé環(huán)境中,將下位概念逐一添加到一級子類中,形成如圖2所示的本體類層次結(jié)構(gòu)。
3.3.2 本體屬性關(guān)系定義
定義本體屬性是確定一個類內(nèi)部以及類之間關(guān)系的過程,通過定義本體屬性來建立概念間的關(guān)系是實現(xiàn)知識推理的基礎(chǔ)。屬性描述的是一個二元關(guān)系,Protégé中提供了3種類型的屬性關(guān)系,即對象屬性(Object properties)描述的是兩個概念的實例間的關(guān)系,數(shù)據(jù)屬性(Data properties) 指某個類屬于某一個數(shù)據(jù)類型,注釋性屬性(Annotation Properties) 是對概念屬性的注釋。在Protégé中定義屬性時除了包括屬性名稱、描述信息、數(shù)據(jù)類型的定義外,還要確定定義域、值域、頂級屬性、子屬性、逆屬性等約束信息。
通過分析整理,枸杞病蟲害領(lǐng)域本體中所定義的主要對象屬性如表1所示。比如,對象屬性cause,定義域為枸杞病害,值域為病因,表示枸杞葉片病害由某病因引起,而病因是枸杞疾病的根源,因此它們之間的關(guān)系是caused-by,這就是逆屬性關(guān)系。類似的方法可以定義數(shù)據(jù)屬性和注釋性屬性。使用Addsubproperty即可構(gòu)建子屬性,形成樹狀層次結(jié)構(gòu)。
3.3.3 本體實例添加
本體屬性關(guān)系確定之后,就要進一步為類添加實例。類是實例的抽象歸類和表示,實例是類的具體表現(xiàn),一個類可以賦予多個實例,形成實例集。每個實例繼承類中的特性,用屬性值描述實例的特征。如“枸杞蟲害”類中包含了很多害蟲的實例,對于其中的“蝽類”就包含了7種蟲害。在Protégé中選擇individuals選項可以在相應的類中添加實例,同時為實例添加相關(guān)的屬性及屬性值。例如在類“蛾類”中添加枸杞蛀果蛾、枸杞卷梢蛾、枸杞鞘蛾、枸杞絹蛾和枸杞黑絹蛾5個具體實例,在每個具體的實例中可以添加它的屬性內(nèi)容。
3.3.4 枸杞病蟲害本體知識庫
根據(jù)上述構(gòu)建步驟,將枸杞病蟲害作為研究對象,以診斷和防治為研究目標,抽取領(lǐng)域中的重要概念、屬性及實例,構(gòu)建了一個體系完善的枸杞病蟲害本體庫。構(gòu)建好的枸杞病蟲害本體的類結(jié)構(gòu)如圖3所示,共計37個本體
類,基本涵蓋了實際生產(chǎn)中主要的枸杞病蟲害種類。本體中有7個數(shù)據(jù)屬性和12個一級對象屬性用于描述枸杞病蟲害的基本信息,還包括51個害蟲實例,15個病害的實例和其它本體類的實例。
4 結(jié)語
本體以科學知識組織的方式實現(xiàn)了知識間邏輯關(guān)系的形式化定義。本文在農(nóng)業(yè)本體模型形式化定義、構(gòu)建原則、構(gòu)建流程和方法分析的基礎(chǔ)上,以枸杞病蟲害領(lǐng)域的相關(guān)知識為例,運用本體開發(fā)工具建立了枸杞病蟲害知識本體,構(gòu)建了枸杞病蟲害知識庫,為促進枸杞病蟲害防治知識應用和共享奠定了基礎(chǔ),為下一步利用知識庫進行本體檢索和推理等提供了參考,同時為其它領(lǐng)域本體構(gòu)建提供了借鑒。
參考文獻:
[1] 唐惠麗,周煉清,葉基瑤,等.基于模糊推理的農(nóng)業(yè)病蟲害專家系統(tǒng)[J].浙江農(nóng)業(yè)學報,2009,21(5):506-509.
[2] 王霓虹,竇智勇.城市綠化林帶病蟲害專家系統(tǒng)知識庫設(shè)計與實現(xiàn)[J].林業(yè)機械與木工設(shè)備,2009,37(8):36-37,40.
[3] 劉鶴,李東明,陳桂芬.基于CBR的蔬菜病蟲害診治專家系統(tǒng)的研究[J].安徽農(nóng)業(yè)科學,2010, 38(27):15380-15381.
[4] 戴才萍,黃義德,錢平,等.水稻病蟲草害本體的構(gòu)建研究[J].廣東農(nóng)業(yè)科學,2011,38(1):191-194.
[5] 姜大慶,蔡銀杰.基于本體的蔬菜病蟲害知識庫構(gòu)建[J].江蘇農(nóng)業(yè)科學,2012,40(7):368-370.
[6] 卜偉瓊,方逵,張曉玲,等.基于本體的柑橘病蟲害知識模型構(gòu)建[J].江蘇農(nóng)業(yè)科學,2013,41(10):363 -366.
[7] 張伶子,段青玲,李道亮.玉米病蟲害診治本體構(gòu)建技術(shù)研究[J].農(nóng)機化研究,2012,34(1):41-45.
[8] 熊大紅,方逵,戴小鵬,等.農(nóng)業(yè)本體構(gòu)建方法研究[J].農(nóng)機化研究,2011(11):48-52.
[9] STUDER R,BENJAMINS V R,F(xiàn)ENSEL D.Knowledge engineering,principles and methods[J].Data and knowledge engineering,1998,25(2):161-197.
[10] M T MALIAPPIS.Using agricultural ontologies[J].Metadata and Semantics,2009(6):493-498.
(責任編輯:孫 娟)