摘要 針對珍稀瀕危古樹名木產(chǎn)生的海量、復(fù)雜龐大卻又互不交叉且獨立存儲的相關(guān)的知識信息的問題,在語義關(guān)聯(lián)的基礎(chǔ)上對其進行本體化組織和有機結(jié)合十分必要。基于本體的理論和方法,對瀕危古樹名木健康保護領(lǐng)域資源涉及的概念應(yīng)用元數(shù)據(jù)進行知識抽取和語義描述,選取概念參考模型對領(lǐng)域內(nèi)概念進行統(tǒng)一組織整合,構(gòu)建瀕危古樹名木健康保護本體,以期全方位揭示出領(lǐng)域資源的知識內(nèi)容及其相互關(guān)系,在每一株古樹名木之間、古樹名木和健康保護之間建立起語義深層次關(guān)聯(lián)及可視化展示,進一步推動古樹名木健康保護知識服務(wù)。
關(guān)鍵詞 古樹名木;健康保護;本體;可視化
中圖分類號 S-058 文獻標(biāo)識碼 A 文章編號 0517-6611(2024)21-0216-06
doi:10.3969/j.issn.0517-6611.2024.21.045
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID):
Study of Ontology Construction and Visualization for Health Protection of Rare and Endangered Old and Famous Trees—A Case of Beijing
LIU Qian-ning1,MA Xiao-yan1,2,XIE Fang1 et al
(1.Beijing University of Agriculture,Beijing 102206;2.National Forestry and Grassland Ancient Tree Health and Ancient Tree Culture Engineering Technology Research Center,Beijing University of Agriculture,Beijing 102206)
Abstract In view of the problem of massive,complex and huge related knowledge information produced by rare and endangered ancient and famous trees,which are not interlinked and stored independently.It is necessary to organize and combine them organically on the basis of semantic association.Based on ontology theory and method,we carried out knowledge extraction and semantic description on the metadata of concept application in the field of health protection of endangered old and famous trees,the concept reference model was selected to organize and integrate the concepts in the field,and the health protection ontology of the endangered old and famous trees was constructed,it established semantic deep-level association between each old and famous tree,old and famous tree and health protection,further promote knowledge services on the health protection of ancient and famous trees.
Key words Ancient tree;Health protection;Ontology;Visualization
基金項目 市屬高校分類發(fā)展-都市農(nóng)林特色教師隊伍建設(shè)項目(110000-24T000002961733)。
作者簡介 劉乾凝(1968—),女,湖北荊州人,副研究館員,碩士,從事文獻計量學(xué)、圖書情報學(xué)研究。*通信作者:馬曉燕,教授,碩士,碩士生導(dǎo)師,從事古樹學(xué)科研究;解方,助理研究員,碩士,從事人力資源工作。
收稿日期 2024-05-27;修回日期 2024-06-04
古樹作為一種古老的植物樹種,是具有重要的科學(xué)、歷史和觀賞價值而又不可再生、珍稀瀕危的自然文化遺產(chǎn)。古樹名木健康保護資源的搜集、整理和保護研究,對于歷史文化保存和植物生態(tài)學(xué)研究等都有獨特的價值。近年來,古樹名木的保護管理工作受到中央和北京市委領(lǐng)導(dǎo)高度重視,強調(diào)“首都的古樹名木極為珍貴,要加強保護”,叮囑“古樹、鴿哨、老院落等都是北京胡同的文化符號,要保護好,留住鄉(xiāng)愁”,要“讓古樹活起來”。同時,北京市為了加強古樹名木的保護管理、維護古都風(fēng)貌,出臺了《北京市古樹名木保護管理條例》等地方性法規(guī)。
隨著互聯(lián)網(wǎng)的發(fā)展,不同的用戶對搜索不同類型的古樹名木信息的興趣各有不同,如古樹繁殖專家、技術(shù)人員對古樹樹種基因、健康保護檔案、健康監(jiān)測評估信息等的需求、古樹學(xué)者對基于語義的知識搜索需求、市民游客對古樹人文歷史、民俗文化等知識的關(guān)注?;诖?,政、學(xué)、商各界對古樹名木健康保護領(lǐng)域數(shù)據(jù)的知識組織開展了大量研究工作,如地理信息管理系統(tǒng)[1-3]、健康狀況評估模型[4]、北京市古樹名木保護智慧管理系統(tǒng)、AncientTree古樹名木監(jiān)測評估系統(tǒng)[5]、北京市園林綠化局官網(wǎng)、中國知網(wǎng)和百度學(xué)術(shù)等平臺?;谏鲜龉艠涿局R源,很明顯這些知識源來源于不同領(lǐng)域且主要以傳統(tǒng)數(shù)據(jù)庫形式進行存儲,存在信息融合能力差、難以形成對珍稀瀕危古樹名木健康保護全方位信息的深層次開發(fā)利用與知識共享等問題。因此,由于古樹自然衰老、區(qū)域生境以及全球氣候的變化,古樹瀕危衰弱發(fā)生有可能更頻繁,多領(lǐng)域合作建立古樹名木健康保護本體數(shù)據(jù)庫具有必要性和迫切性。
本體(ontology)利用形式化描述對象及對象間的關(guān)系,建立一個語義級的環(huán)境,可以很好地屏蔽信息資源的多維性、異構(gòu)性,從而將用戶和信息資源統(tǒng)一在一個虛擬的語義空間中,使計算機能夠理解信息的語義[6]。因此,基于本體知識表達、良好的概念層次和對邏輯推理的支持,可以真正實現(xiàn)語義級的知識服務(wù)[7]。
國內(nèi)學(xué)者針對歷史文化遺產(chǎn)具有多維異構(gòu)性的大數(shù)據(jù)特點,通過構(gòu)建本體、知識庫、開放性知識圖譜,使大規(guī)模數(shù)據(jù)的可視化和關(guān)聯(lián)成為可能。本體思想應(yīng)用于珍稀瀕危古樹名木健康風(fēng)險分析,可以解決古樹種植資源生產(chǎn)、城市園林綠化、古樹健康管理、古樹生態(tài)環(huán)境領(lǐng)域及古樹科研領(lǐng)域知識難于共享和應(yīng)用的難題。基于上述研究和古樹在復(fù)壯保護、環(huán)境保護等方面的多領(lǐng)域、多來源知識,該研究設(shè)計構(gòu)建了面向健康保護的古樹本體模型(下稱“古樹本體”),目的是分析珍稀瀕危古樹名木健康保護涉及領(lǐng)域技術(shù)服務(wù)信息數(shù)據(jù)的結(jié)構(gòu)特征,逐步構(gòu)建可以融合多源異構(gòu)信息知識的本體模型,對珍稀瀕危古樹名木健康保護知識源的歸納,理清思路,為構(gòu)建古樹領(lǐng)域健康保護技術(shù)服務(wù)數(shù)據(jù)庫做準(zhǔn)備,最終有助于促進古樹領(lǐng)域知識創(chuàng)新和傳播。鑒于此,筆者基于本體的理論和方法,對瀕危古樹名木健康保護領(lǐng)域資源涉及的概念應(yīng)用元數(shù)據(jù)進行知識抽取和語義描述,選取概念參考模型對領(lǐng)域內(nèi)概念進行統(tǒng)一組織整合,構(gòu)建瀕危古樹名木健康保護本體,以期全方位揭示出領(lǐng)域資源的知識內(nèi)容及其相互關(guān)系,在每一株古樹名木之間、古樹名木和健康保護之間建立起語義深層次關(guān)聯(lián)及可視化展示,進一步推動古樹名木健康保護知識服務(wù)。
1 相關(guān)本體實踐與研究述評
在農(nóng)業(yè)領(lǐng)域,目前大多已有的本體庫,如農(nóng)業(yè)古籍本體領(lǐng)域本體[8]、萬里茶道檔案領(lǐng)域本體模型[9]、花卉學(xué)文獻試驗性本體檢索系統(tǒng)[10]等均參考聯(lián)合國糧農(nóng)組織(Food and Agriculture Organization of the United Nations,簡稱FAO)的多語種敘詞表AGROVOC、國際農(nóng)業(yè)和生物中心敘詞表與美國國家農(nóng)業(yè)圖書館的敘詞表AgNIC,常用的農(nóng)業(yè)敘詞表有中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)信息研究所編制的中國農(nóng)業(yè)敘詞表(Chi-nese Agricultural Thesaurus,CAT)、FAO創(chuàng)建的AGROVOC(多語種農(nóng)業(yè)主題詞表) 、美國國家農(nóng)業(yè)圖書館創(chuàng)建的NALT美國國家農(nóng)業(yè)圖書館敘詞表、歐盟創(chuàng)建和維護的 EUROVOC(歐盟農(nóng)業(yè)主題詞表)等。
斯坦福大學(xué)開發(fā)的七步法是一種具有很強的邏輯性、可操作性以及可拓展性的領(lǐng)域本體的構(gòu)建方法,常常被相關(guān)學(xué)者在建立領(lǐng)域本體時所采用。例如,劉麗婷等[11]應(yīng)用七步法模型 ,在分析廣東省和海南省臺風(fēng)氣象災(zāi)害事件,抽提出林木臺風(fēng)氣象災(zāi)害事件的類、個體及屬性概念,進行元語言轉(zhuǎn)化的基礎(chǔ)上,應(yīng)用Protégé本體構(gòu)建軟件進行林木氣象災(zāi)害事件本體框架模型構(gòu)建。
針對多維異構(gòu)性的領(lǐng)域知識難以融合,相關(guān)學(xué)者通過構(gòu)建開放性知識圖譜,把復(fù)雜的知識領(lǐng)域通過數(shù)據(jù)挖掘、信息處理、知識計量和圖形繪制顯示出來,揭示知識領(lǐng)域的動態(tài)發(fā)展規(guī)律,使大規(guī)模數(shù)據(jù)的可視化和關(guān)聯(lián)成為可能,為相關(guān)研究提供切實的、有價值的參考。例如,田夢暉等[12]針對珍稀瀕危植物形態(tài)特征、分類等級、瀕危系數(shù)、保護措施等知識不明確的問題,設(shè)計了文本融合輕量級雙向轉(zhuǎn)換編碼表示模型(Albert)的知識抽取模型框架,實現(xiàn)批量抽取珍稀瀕危植物知識,從而構(gòu)建珍稀瀕危植物本體和知識圖譜,完成珍稀瀕危植物知識圖譜的可視化展示;段宇鋒等[13]以BFO作為上層本體,參考KACTUS法,通過復(fù)用PO構(gòu)建涵括720條實體和4 000多個實例的中文植物物種多樣性本體;張伶子等[14]針對現(xiàn)有農(nóng)業(yè)病蟲害專家系統(tǒng)領(lǐng)域知識共享和重用困難、癥狀輸入嚴(yán)重影響準(zhǔn)確率等問題,研究了基于領(lǐng)域知識、推理知識和任務(wù)知識的本體構(gòu)建技術(shù);劉桂鋒等[15]利用本體原理和本體構(gòu)建工具Protégé,抽取國家農(nóng)業(yè)科學(xué)數(shù)據(jù)中心的數(shù)據(jù)資源,構(gòu)建可視化數(shù)據(jù)資源的關(guān)聯(lián)關(guān)系,深度揭示與可視化農(nóng)業(yè)科學(xué)數(shù)據(jù)資源,實現(xiàn)了知識發(fā)現(xiàn)和數(shù)據(jù)增值,并為科學(xué)數(shù)據(jù)平臺建設(shè)提供了借鑒、參考;針對作物病蟲害數(shù)據(jù),吳賽賽等[16]構(gòu)建了一種基于深度學(xué)習(xí)的作物病蟲害知識圖譜;周樹斌等[17]通過融合詩詞文化基因與詩詞資源,利用知識圖譜技術(shù)的可視化分析,完成傳統(tǒng)詩詞資源微觀至基因、宏觀到時空的詩詞資源知識的關(guān)聯(lián)及可視化展示。
2 領(lǐng)域本體構(gòu)建理論與方法
2.1 本體理論
源自哲學(xué)領(lǐng)域的本體(ontology)這一概念,原本是對客觀世界本質(zhì)及其規(guī)律的抽象化,20世紀(jì)90年代以來,這個詞隨即被應(yīng)用到計算機領(lǐng)域,起到越來越重要的作用。雖然不同研究者對本體的定義有不同的描述,但在根本上,對本體的認(rèn)識是一致的,本體就是對某一研究領(lǐng)域應(yīng)用本體論的方法進行分析、構(gòu)建領(lǐng)域模型,是將現(xiàn)實世界中的某個領(lǐng)域抽象成一組概念和概念之間的關(guān)聯(lián)[18],或者說本體在信息科學(xué)領(lǐng)域是一種模型,是對客觀存在的對象類型或概念及其相互關(guān)系的規(guī)范描述和表達[19],并轉(zhuǎn)化為資源描述框架(resource description framework,RDF ),如Perez 等[20]認(rèn)為,本體可以用于在計算機領(lǐng)域表示知識,包含類、關(guān)系、公理、函數(shù)和實例5種要素,能夠規(guī)范特定范圍的基本概念、屬性、概念間的關(guān)系以及屬性和關(guān)系的約束規(guī)則[21]。
2.2 本體構(gòu)建方法與流程
根據(jù)上述文獻綜述,分析得出七步法最適合領(lǐng)域本體的構(gòu)建,其成熟度也是現(xiàn)有本體構(gòu)建方法中最好的,因此該研究在構(gòu)建本體的過程中也應(yīng)用了七步法的思想作為方法論構(gòu)建本體模型。筆者綜合主流本體構(gòu)建方法,從多個維度出發(fā)對珍稀瀕危古樹名木健康保護領(lǐng)域?qū)嶓w知識的概念、屬性、實體與實例、實例與實例之間的關(guān)系加以概括性的描述和定義。
設(shè)計古樹本體,具體步驟如下:確定本體的專業(yè)領(lǐng)域和范疇;考慮用現(xiàn)有本體的可能性;抽取古樹知識概念;構(gòu)建古樹上位本體;本體類及屬性的設(shè)計;按照需要,添加實例。
3 珍稀瀕危古樹名木健康保護領(lǐng)域本體構(gòu)建
3.1 確定本體的專業(yè)領(lǐng)域與范疇
古樹名木健康保護是“社會歷史-生態(tài)環(huán)境-科研管理”復(fù)雜復(fù)合系統(tǒng):古樹的遺傳育種滿足經(jīng)濟市場需求;古樹景觀資源的開發(fā)利用滿足人對綠色環(huán)境的需求;現(xiàn)有古樹的保護、撫育滿足古樹文化傳承的需要。北京市古樹名木數(shù)量最多,共有4萬多株古樹名木,樹種主要多為側(cè)柏、油松、國槐、榆樹等鄉(xiāng)土樹種,黃檗、青檀、流蘇、毛棶等也有分布,側(cè)柏、油松、檜柏、國槐占總數(shù)的90%以上,主要集中分布在全市的皇陵墓地、皇家園林、王府、寺廟及庭院等地,包括一級古樹6 000余株,二級古樹3.4萬余株,名木1 000余株。其中,健康古樹僅占30%,衰老或瀕危古樹已達5%,具有搶救和保護的必要性與迫切性。因此,筆者以北京市為例,構(gòu)建“珍稀瀕危古樹名木健康保護”領(lǐng)域本體知識,該本體的覆蓋范圍為古樹名木土壤環(huán)境監(jiān)測保護知識、病蟲害防治知識、古樹植物類別和繁殖知識、受損部位檢測修復(fù)知識等,涉及多方面范疇的主題,包括農(nóng)業(yè)科學(xué)、植物保護、生態(tài)學(xué)、生物學(xué)等領(lǐng)域。
古樹本體結(jié)合上述古樹領(lǐng)域知識的應(yīng)用領(lǐng)域和古樹名木健康保護信息的覆蓋范圍,構(gòu)建古樹名木健康保護領(lǐng)域的知識概念、公理、屬性、關(guān)系、規(guī)則和過程的規(guī)范化形式化的本體模型,其目標(biāo)是實現(xiàn)珍稀瀕危古樹名木健康保護領(lǐng)域知識融會、共享和重用,實現(xiàn)古樹名木健康保護信息的結(jié)構(gòu)化和語義化組織。
3.2 古樹知識概念的抽取
本體的構(gòu)建主要以北京市“珍稀瀕危古樹名木健康保護”為主題,開發(fā)一種可共享的、共同的概念集合[22]的古樹名木健康保護本體模型。為了完成古樹知識概念的抽取目標(biāo),從AncientTree古樹名木監(jiān)測評估系統(tǒng)、北京園林綠化局的官方網(wǎng)站、古樹名木保護服務(wù)網(wǎng)等網(wǎng)絡(luò)渠道獲取北京地區(qū)古樹名木健康保護的簡介信息,從簡介信息中以及利用相關(guān)文獻、工具書對古樹名木健康保護領(lǐng)域的知識分析匯總,抽象出可以描述古樹名木健康保護的核心類和屬性信息,如事物類、事件類、參與者類、時間類、地點類、團體類等,屬性信息有樹木的樹種、名稱、樹齡、冠幅、編號、生長環(huán)境、健康等級等。最終實現(xiàn)由古樹名木相關(guān)概念和健康保護描述信息構(gòu)成的古樹本體核心概念集。
3.2.1 結(jié)構(gòu)化知識抽取。
該研究以古樹為對象,實證研究所需數(shù)據(jù)來源主要包括紙質(zhì)文獻資源和網(wǎng)絡(luò)數(shù)字資源。首先,通過網(wǎng)絡(luò)數(shù)據(jù)采集的方式收集古樹資源,數(shù)據(jù)主要來源于在線《中國植物志》[23]中國知網(wǎng)、北京園林綠化局的官方網(wǎng)站、AncientTree 古樹名木監(jiān)測評估系統(tǒng)、古樹智慧管理系統(tǒng)、古樹名木保護服務(wù)網(wǎng)。在網(wǎng)絡(luò)數(shù)據(jù)采集的基礎(chǔ)上借鑒了《中國圖書館分類法》[24]之《農(nóng)業(yè)專業(yè)分類表》等權(quán)威成果,對文獻數(shù)據(jù)庫中的10 110 條古樹學(xué)文獻記錄中涉及古樹遺傳育種、古樹修復(fù)、生態(tài)環(huán)境、園林樹木等多學(xué)科數(shù)字文獻資源的整理,結(jié)合對古樹資源特征的分析、梳理,從中提煉出重要概念和關(guān)鍵術(shù)語。其次,該研究收集了有關(guān)北京古樹相關(guān)的報告和簡報、《中國植物志》[25]學(xué)術(shù)專著、保護規(guī)劃和管理條例、項目書、工作報告等紙質(zhì)資料作為數(shù)據(jù)源。再次,為了滿足古樹保護利用研究需要,使計算機自身具備理解和語義判讀,采用RDF三元組語義描述框架,定義古樹本體的所有數(shù)據(jù),從古樹實體自身到古樹數(shù)字資源記錄,確保每個記錄都可以具備語義化關(guān)聯(lián)。
3.2.2 半結(jié)構(gòu)化知識抽取。
在結(jié)構(gòu)化知識抽取中是以文本作為一個屬性值,但在屬性值的文本中還包含很多未挖掘到的隱藏信息,如古樹的屬性值中,還隱藏著別名、地點等實體關(guān)系信息,而抽取這些關(guān)系時屬于基于非結(jié)構(gòu)化數(shù)據(jù)的知識抽取。因此,在進行知識組織之前,以三元組知識自動抽取技術(shù)對古樹文本、圖片、圖像和音頻/視頻、XML、HTML等非結(jié)構(gòu)化信息進行資源預(yù)處理,以規(guī)范化的RDF三元組知識抽取形式對其進行抽取,提取出其中的語義關(guān)鍵信息。因此,通過結(jié)構(gòu)化和半結(jié)構(gòu)化知識抽取,本體的語義描述結(jié)構(gòu)跟本體本身架構(gòu)對應(yīng),古樹實體對應(yīng)1條RDF數(shù)據(jù),同時其實際對應(yīng)的內(nèi)容條目也均對應(yīng)RDF數(shù)據(jù),最終可以建立具備一定語義功能的關(guān)聯(lián)網(wǎng)絡(luò)。
3.3 定義古樹本體所有概念
該研究構(gòu)建的古樹知識本體涉及大量的專業(yè)詞匯與術(shù)語,確定共同認(rèn)可的領(lǐng)域知識本體的核心概念,其特點是多種概念形式以一種標(biāo)準(zhǔn)進行形式化聚合和定義,在共同具有的性質(zhì)中體現(xiàn)各自的特性。例如,不同樹種之間關(guān)于健康級別的劃分標(biāo)準(zhǔn)基本一致,但每一棵樹的屬性、歷史文化、生長環(huán)境、健康狀況、修復(fù)措施具有很大不同,因此在進行古樹領(lǐng)域健康保護事件本體模型框架的構(gòu)建時,既要考慮古樹名木健康保護類的通用性質(zhì)(知識概念頂層框架),又要結(jié)合不同樹種的特性(概念實例),使構(gòu)建的本體能夠充分展示古樹知識豐富的內(nèi)涵和外延,以此構(gòu)建古樹多維領(lǐng)域的知識概念體系,完整地反映古樹名木健康保護所涉及的知識內(nèi)容。
3.3.1 上位本體的構(gòu)建。
通過對初始語料庫進行詞典分詞和新詞發(fā)現(xiàn);識別朝代、年號、事件、機構(gòu)名、人名、古樹名等專有名詞;以及人工命名實體,抽取語料庫的人、事、物、時間、地點等實體,獲得古樹名木概念、事件概念、時間概念、地點概念、人物概念、機構(gòu)概念。基于獲取到的概念和關(guān)鍵術(shù)語,并復(fù)用已有的與該研究情境較為符合的CIDOC-CRM[26]、DC[27]、FOAF [28]、SHLNames[29] 、OWL-time[30]本體的實體設(shè)計,構(gòu)建古樹上位本體。最終將知識概念體系填充到古樹上位本體,最終確定了古樹名木類(gr:Ancient Tree)、事件類(gr:Event)、地點類(crm:Place)、人物類(crm:Person)、團體類(crm:Group)5個實體,實現(xiàn)古樹知識在不同領(lǐng)域的理解與共享,為形成完備的以古樹本體為核心的本體模型的構(gòu)建提供依據(jù)。
3.3.2 進行類和類的層級劃分。
該研究遵循從抽象到一般,再到具體概念的3層結(jié)構(gòu)的本體構(gòu)建方法,抽象出具備一定通用性的最頂層的抽象概念,即古樹名木類、事件類、地點類、人物類、團體類5個核心本體;根據(jù)古樹名木健康保護本體的個性化需求,進一步將上述5種抽象概念逐漸細(xì)化,定義了21個一級子類和43個二級子類。21個一級子類分別為樹種子類、分類類別子類、名稱子類、特征子類、健康等級子類、保護級別子類、健康保護現(xiàn)狀子類、樹體修復(fù)事件子類、樹體檢測事件子類、生境保護事件子類、基因克隆事件子類、歷史事件子類、評估者子類、檢測者子類、管護者子類、歷史人物子類、評估單位子類、檢測單位子類、管護單位子類、地理位置、行政區(qū)劃。
3.3.2.1
古樹名木類。該研究針對珍稀瀕危古樹名木健康保護的本體構(gòu)建,所以將樹種、分類類別、名稱、特征、健康等級、保護級別、健康保護現(xiàn)狀定義為古樹名木的一級子類;在樹種子類中,主要按照北京現(xiàn)存的古樹樹種進行搜集分類,即白皮松、側(cè)柏、圓柏、銀杏、油松、國槐、龍爪槐、歐椴、黃檗、青檀、楸樹、黑棗、酸棗、毛棶、流蘇等;在分類類別子類中,是按照植物物種間的親緣關(guān)系進行的物種分類,即門、綱、目、科、屬的層級結(jié)構(gòu)進行分類;在名稱子類中,主要是針對植物物種命名的描述,包括俗名、拉丁名、別名;在特征子類中,主要是按照生長習(xí)性、樹齡、高度、冠幅、胸圍、地理分布、編號、文化價值、功用價值等進行劃分;其中編號由11位數(shù)字組成,分別代表省份、市、區(qū)以及具體位置的代碼,如同居民的身份證;文化價值是古樹名木的民族和地域的重要標(biāo)志,銘刻著時代的印記;功用價值是古樹名木形成的獨特的旅游景觀資源經(jīng)濟價值或藥用價值;在保護等級子類中,一級古樹是樹齡500年以上的樹木,二級古樹是樹齡在300~499年的樹木,名木是具有重要歷史、文化、觀賞和科學(xué)價值或具有重要紀(jì)念意義的樹木,且不受樹齡限制、不分級,如歷史文化名人等所植或詠題的樹木。在其他健康級別子類中,古樹健康狀況評價劃分選取能反映古樹健康狀況的可目測指標(biāo),包括葉片、樹枝、樹干、根系4大類,或者對各項指標(biāo)打分并計算其綜合得分,健康等級分為4級:正常、衰弱、嚴(yán)重衰弱和瀕危[31],生長正常的古樹特征描述為整體長勢良好,無病蟲害,枝繁葉茂,枝干無損傷;生長衰弱的古樹特征描述為枝葉偶有枯落,或有少量的病蟲害,樹干有部分損傷,整體長勢有衰退趨勢;瀕危古樹特征描述為整體長勢差,枯損現(xiàn)象多,病蟲害嚴(yán)重,樹木已經(jīng)處于瀕臨死亡狀態(tài)。
3.3.2.2
事件類。為古樹名木健康保護人員在特定時間和地點對古樹的健康狀況保護、監(jiān)測、評價的行為,所以將生境保護事件、基因克隆事件、樹體修復(fù)事件、樹體檢測事件、歷史傳說事件定義為事件類的一級子類。
3.3.2.3
人物類(foaf:Person)。指參與古樹健康管理與評價的重要人物,包括古樹領(lǐng)域?qū)<覍W(xué)者、日常管理和維護人員、監(jiān)測巡查人員和歷史人物。
3.3.2.4
團體類(crm:Group)。古樹健康保護檢測的機構(gòu)或組織,包括國家林業(yè)(林草)局、省級園林綠化局及地方政府、土地部門、古樹保護管理機構(gòu)、古樹科研機構(gòu)、綠地養(yǎng)護相關(guān)協(xié)會和企業(yè)等。
3.3.2.5
地點類。包括行政區(qū)劃和地理位置。
3.4 定義類的屬性
在完成古樹名木健康保護領(lǐng)域本體類創(chuàng)建后,需要對各類的屬性以及類與類之間的關(guān)系做出定義和描述,以完善類的內(nèi)部數(shù)據(jù)結(jié)構(gòu),從而保證類的獨特性。對屬性規(guī)范化定義,明確概念之間的關(guān)系,從而形成直觀立體的語義關(guān)系網(wǎng)。屬性主要是指對象屬性(object property)與數(shù)據(jù)屬性(datatype property)。對象屬性指的是概念術(shù)語與概念術(shù)語之間的關(guān)系,主要是指類與類之間的關(guān)系、實例與實例之間的關(guān)系,具有明顯的指向性;數(shù)據(jù)屬性是指描述自身的屬性,是與RDF(XML Schema)數(shù)據(jù)類型之間的關(guān)系,數(shù)據(jù)型的值域是對屬性的取值范圍和約束條件的限定、補充和完善性說明。表1和2分別展示了基于本體的古樹數(shù)據(jù)中數(shù)據(jù)屬性和對象屬性。表1主要描述本體概念層中數(shù)據(jù)屬性的三元組實例,包括古樹名木的別稱、樹種類別、健康等級等關(guān)系,例如〈銀杏,拉丁名,Ginkgo biloba L.〉這個三元組表達的語義信息是“銀杏的學(xué)名是Ginkgo biloba L.”;
該究對象屬性關(guān)系見表2,創(chuàng)建并規(guī)范了對象屬性關(guān)系的定義域(domains)和取值范圍值域(ranges),明確知識抽取的邊界。定義域和值域的意義在于給關(guān)系和屬性的取值設(shè)定一定范圍的約束,比如對于 “復(fù)壯于(rejuvenated) ”這個關(guān)系來說,其主體只能是“樹種”實體,而其對象只能是“人物”實體。
通過對象屬性將古樹資源中的實體要素關(guān)聯(lián)起來,由此構(gòu)建古樹資源類及層級結(jié)構(gòu),并應(yīng)用Protégé進行了古樹本體模型框架的可視化展示(圖1),為后續(xù)實現(xiàn)古樹健康保護內(nèi)部資源與外部資源關(guān)聯(lián)提供依據(jù),為后續(xù)的語義推理和可視化提供了基本的邏輯結(jié)構(gòu)。其中,古樹名木、事件、人物、團體和地點均為超類“Thing”的子類;虛線為屬性關(guān)系,展示古樹名木與其他類的對象屬性。
在當(dāng)前的技術(shù)環(huán)境中,對于知識圖譜的保存,業(yè)界普遍采用了RDF三元組的存儲模型和建立在圖數(shù)據(jù)庫之上的存儲架構(gòu)2種不同的技術(shù)路徑。Neo4j作為一個開源的圖數(shù)據(jù)庫管理系統(tǒng),其底層利用圖結(jié)構(gòu)技術(shù)來保存數(shù)據(jù),這種數(shù)據(jù)庫技術(shù)的知識圖譜中,圖的頂點被看作是實體和概念,圖的邊則表示實體間的屬性和關(guān)系,這樣展現(xiàn)了知識內(nèi)在聯(lián)系的可視化存儲方式,為圖形化查詢和知識推導(dǎo)提供了便利,并且具備良好的擴展性,大大提升了數(shù)據(jù)檢索的效率。
因此,該研究決定采用Neo4j來保存古樹相關(guān)的知識圖譜,開發(fā)環(huán)境是pycharm,利用的編程語言是python,采用Cypher存儲語句將實體與實體間的關(guān)系等進行存儲,形成古樹名木健康保護知識圖譜。通過Cypher查詢語句進行知識查詢,得到知識圖譜可視化展示(圖2),其中藍色節(jié)點為古樹名木實體,橘紅色節(jié)點為與古樹實體存在關(guān)系的實體,邊則為兩者間的關(guān)系類型。知識圖譜中交互關(guān)聯(lián)的節(jié)點為隱藏關(guān)系的推理提供了很好的知識基礎(chǔ),如“九樓十八杈”與“香柏”節(jié)點之間的邊表示為“別名”,與“科類”節(jié)點之間的邊表示為“柏科”,則可推理出“香柏”與“科類”實體之間也存在“柏科”的關(guān)系。
4 古樹名木領(lǐng)域本體的拓展服務(wù)研究
珍稀瀕危古樹本體健康保護及可視化研究,明確了珍稀瀕危古樹名木的物種屬性及相關(guān)特征、瀕危及健康保護現(xiàn)狀、健康保護措施等信息,可以解決城市園林綠化、古樹樹種知識、古樹健康管理知識、古樹生態(tài)環(huán)境領(lǐng)域知識難于共享和應(yīng)用的難題,為實現(xiàn)古樹名木領(lǐng)域智能系統(tǒng)開發(fā)提供技術(shù)支撐。同時,基于Neo4j的知識圖譜存儲,有利于幫助科技工作者更快地獲取相關(guān)信息和更好地整合信息,進行科研創(chuàng)新的數(shù)據(jù)分析和發(fā)現(xiàn),拓展古樹名木保護利用研究范圍;有利于幫助古樹名木管理者提升古樹名木信息管理效率、保護利用和展示效能。今后將圍繞基于珍稀瀕危古樹名木本體及可視化研究,構(gòu)建智能問答和推薦系統(tǒng),加強珍稀瀕危古樹名木知識的關(guān)聯(lián)度和智能開發(fā)利用。
參考文獻
[1]
孫海寧,孫艷麗.北京市古樹名木管理信息系統(tǒng)的開發(fā)與應(yīng)用[J].林業(yè)資源管理,2020(2):161-166.
[2] 徐勝俠.基于WebGIS的頤和園古樹管理信息系統(tǒng)研究[D].北京:北京林業(yè)大學(xué),2019.
[3] 王元勝,甘長青,周肖紅.香山公園古樹名木地理信息系統(tǒng)的開發(fā)技術(shù)研究[J].北京林業(yè)大學(xué)學(xué)報,2003,25(2):53-57.
[4] 冷清清.古樹名木健康評估系統(tǒng)研究與開發(fā)[D].泰安:山東農(nóng)業(yè)大學(xué),2021.
[5] ANCIENTTREE古樹名木HMjbS56hSa7lEeoSO+Ddiw==監(jiān)測評估系統(tǒng)[EB/OL].[2020-08-24].http://gsjc.ancienttree.com.cn/index.php.
[6] GRUBER T R.A translation approach to portable ontology specifications[J].Knowledge acquisition,1993,5(2):199-220.
[7] 岳昆,王曉玲,周傲英.Web服務(wù)核心支撐技術(shù):研究綜述[J].軟件學(xué)報,2004,15(3):428-442.
[8] 何琳,曹玲.農(nóng)業(yè)古籍本體的構(gòu)建及其檢索機制研究[J].現(xiàn)代圖書情報技術(shù),2006(12):37-39,53.
[9] 趙雪芹,李天娥.面向數(shù)字人文的檔案領(lǐng)域本體構(gòu)建研究:以萬里茶道檔案資料為例[J].情報理論與實踐,2022,45(8):154-161.
[10] 李景.本體理論及在農(nóng)業(yè)文獻檢索系統(tǒng)中的應(yīng)用研究:以花卉學(xué)本體建模為例[D].北京:中國科學(xué)院研究生院(文獻情報中心),2004.
[11] 劉麗婷,李敖彬,梁學(xué)明,等.林木臺風(fēng)氣象災(zāi)害事件本體模型構(gòu)建初析[J].桉樹科技,2020,37(4):3-12.
[12] 田夢暉,陳明,席曉桃.融合Albert模型的珍稀瀕危植物知識圖譜的構(gòu)建[J].湖南農(nóng)業(yè)大學(xué)學(xué)報(自然科學(xué)版),2023,49(5):616-623.
[13] 段宇鋒,黃思思.基于BFO構(gòu)建中文植物物種多樣性領(lǐng)域本體的研究[J].現(xiàn)代圖書情報技術(shù),2015(12):72-79.
[14] 張伶子,段青玲,李道亮.玉米病蟲害診治本體構(gòu)建技術(shù)研究[J].農(nóng)機化研究,2012,34(1):41-45.
[15] 劉桂鋒,楊倩,劉瓊.農(nóng)業(yè)科學(xué)數(shù)據(jù)集的本體構(gòu)建與可視化研究:以“棉花病害防治”領(lǐng)域為例[J].情報雜志,2022,41(9):143-149,175.
[16] 吳賽賽,周愛蓮,謝能付,等.基于深度學(xué)習(xí)的作物病蟲害可視化知識圖譜構(gòu)建[J].農(nóng)業(yè)工程學(xué)報,2020,36(24):177-185.
[17] 周樹斌,高勁松,張強,等.文化基因視域下詩詞資源多維知識重組與可視化研究:以茶文化為例[J].圖書情報工作,2023,67(16):111-123.
[18] 趙麗.本體的理論及其應(yīng)用研究[D].蘭州:蘭州理工大學(xué),2006.
[19] 蔡璐,熊擁軍,劉燦姣.基于本體和元數(shù)據(jù)的非遺資源知識組織體系構(gòu)建[J].圖書館理論與實踐,2016(3):39-43.
[20] PEREZ A G,BENJAMINS V R.Overview of knowledge sharing and reuse components:Ontologies and problem solving methods[C]∥Proceedings of the IJCAI-99 workshop on ontologies and problem-solving methods.Stockholm,Sweden:IJCAI,1999:1-15.
[21] 袁國銘,陳殊聰,辛盈,等.本體構(gòu)建理論在石油領(lǐng)域的應(yīng)用研究[J].計算技術(shù)與自動化,2011,30(3):113-118.
[22] 申妍,魏小鵬,王建維.基于本體的產(chǎn)品知識表示方法研究[J].計算機系統(tǒng)應(yīng)用,2009,18(7):84-87.
[23] 中國科學(xué)院植物研究所.植物志:中國植物志[EB/OL].[2021-10-11].http://www.iplant.cn/frps.
[24] 國家圖書館《中國圖書館分類法》編輯委員會.中國圖書館分類法[M].4版.北京:國家圖書館出版社,1999.
[25] 中國科學(xué)院中國植物志編輯委員會.中國植物志:第7卷 裸子植物門[M].北京:科學(xué)出版社,1999.
[26] 王萍,黃新平.基于關(guān)聯(lián)開放數(shù)據(jù)的數(shù)字文化資源語義融合方法研究:歐洲數(shù)字圖書館案例分析[J].圖書情報工作,2016,60(12):29-37.
[27] DCMI Usage Board.Dublin CoreTM metadata element set,version1.1:ReferenceDescription[EB/OL].(2020-03-26)[2022-04-14].https://www.dublincore.org/specifications/dublin-core/dces/.
[28] DAN B,LIBBY M.FOAF vocabulary specification 0.99[EB/OL].(2014-01-14)[2022-03-22].http://xmlns.com/foaf/spec/.
[29] 上海圖書館.人名規(guī)范庫本體(shlnames)[EB/OL].[2022-03-22].http://data.library.sh.cn/ont/ontology/tree?g=http://ont.library.sh.cn/graph/shlnames.
[30] GeoNames Team.GeoNames[EB/OL].[2022-03-22].http://www.geonames.org.
[31] 北京市質(zhì)量技術(shù)監(jiān)督局.古樹名木健康快速診斷技術(shù)規(guī)程:DB11/T 1113—2014[S].北京:北京市質(zhì)量技術(shù)監(jiān)督局,2014.