国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

EXPRESS向OWL2本體模型自動(dòng)轉(zhuǎn)換研究

2018-03-20 02:38滿,劉
關(guān)鍵詞:數(shù)據(jù)類型本體約束

袁 滿,劉 峰

0 引 言

本體(Ontology)是語(yǔ)義網(wǎng)知識(shí)表示的基礎(chǔ)[1]。W3C在2004年推出標(biāo)準(zhǔn)Web本體語(yǔ)言[2],本體是面向計(jì)算機(jī)形式化的一種知識(shí)表達(dá)與描述框架,擁有形式化語(yǔ)言和開(kāi)發(fā)工具,具有強(qiáng)大的知識(shí)表達(dá)、賦值機(jī)制與語(yǔ)義推理能力[3]。不僅可以描述信息資源體系十分復(fù)雜的概念、屬性和關(guān)系,形成語(yǔ)義知識(shí)網(wǎng)絡(luò),還能實(shí)現(xiàn)具有語(yǔ)義推理功能的知識(shí)檢索[4]。因此它可以統(tǒng)一專業(yè)領(lǐng)域內(nèi)各個(gè)專業(yè)內(nèi)部的信息術(shù)語(yǔ),實(shí)現(xiàn)各專業(yè)間知識(shí)的共享、重用和互操作,解決各系統(tǒng)之間專業(yè)知識(shí)使用不一致的情況和應(yīng)用集成難的問(wèn)題。常用的本體構(gòu)建方法有骨架法、Tove法、五步循環(huán)法和Kactus工程法等。但當(dāng)前本體開(kāi)發(fā)代價(jià)過(guò)高的現(xiàn)實(shí)一直是制約語(yǔ)義網(wǎng)成功與普及的瓶頸[5]。而且傳統(tǒng)的本體構(gòu)建在抽取關(guān)鍵概念和關(guān)系時(shí),各領(lǐng)域?qū)<业膮⑴c增加了構(gòu)建領(lǐng)域本體的成本,限制了以領(lǐng)域本體為基礎(chǔ)的語(yǔ)義網(wǎng)的發(fā)展和普及。馬靜等[6]提出“特征詞條本體”的自動(dòng)構(gòu)建,葉光輝[7]提出基于UML(Unified Modeling Language)的敘詞表轉(zhuǎn)本體方法研究等。如今從現(xiàn)有知識(shí)源獲取領(lǐng)域知識(shí)、以(半)自動(dòng)方式學(xué)習(xí)本體,是本體開(kāi)發(fā)便捷而有效的途徑[8]。

EXPRESS語(yǔ)言是一種規(guī)范化信息建模語(yǔ)言,提供對(duì)論域中對(duì)象進(jìn)行詳細(xì)描述的一套規(guī)范(或定義)[9,10],以及與對(duì)象有關(guān)的信息和約束的描述[11-13]。為對(duì)知識(shí)進(jìn)行語(yǔ)義層次的共享和交換以及利用現(xiàn)有知識(shí)源進(jìn)行本體構(gòu)建,相關(guān)研究人員對(duì)EXPRESS向本體的轉(zhuǎn)換進(jìn)行了研究,為實(shí)現(xiàn)產(chǎn)品數(shù)據(jù)信息在語(yǔ)義層次的共享和交換問(wèn)題[14],并提出以EXPRESS作為描述語(yǔ)言的產(chǎn)品數(shù)據(jù)信息的本體表述方法。王歲花等[15]在語(yǔ)義共享方面研究了STEP(Standard for the Exchange of Product Model Data)存在的不足,并給出產(chǎn)品信息描述為OWL(Web Ontology Language)的實(shí)例。陳磊等[16]研究了STEP標(biāo)準(zhǔn)和本體OWL語(yǔ)言,給出基于本體的語(yǔ)義互操作框架,實(shí)現(xiàn)了產(chǎn)品信息的語(yǔ)義互操作。孟海忠[17]分析了STEP標(biāo)準(zhǔn)和本體OWL語(yǔ)言之間的語(yǔ)義映射規(guī)則,利用AP203的STEPPart21物理文件,構(gòu)建了產(chǎn)品信息的語(yǔ)義轉(zhuǎn)換器,用以解決產(chǎn)品信息的語(yǔ)義共享問(wèn)題。張開(kāi)明[18]研究了本體OWL2語(yǔ)言和規(guī)則交換格式RIF(Rule Interchange Format),給出STEP-to-OWL2/RIF映射方法和映射系統(tǒng)框架。建立了STEP標(biāo)準(zhǔn)的描述語(yǔ)言EXPRESS與OWL2/RIF之間的映射關(guān)系,給出STEP AP203文件和OWL文件的轉(zhuǎn)換方法。文獻(xiàn)[15,16]在方法研究上使用早期的本體語(yǔ)言,且沒(méi)有給出完整的映射方法和模型。文獻(xiàn)[17]中研究了對(duì)STEP標(biāo)準(zhǔn)進(jìn)行OWL/SWRL的描述并給出具體的分析,但是對(duì)類之間通用的約束并沒(méi)有給出詳細(xì)映射方法。文獻(xiàn)[18]雖然給出了STEP AP203物理文件轉(zhuǎn)換為OWL2文件的具體方法,并對(duì)STEP-to-OWL2/RIF映射系統(tǒng)進(jìn)行了理論研究,但沒(méi)有利用OWL2語(yǔ)言在糖衣語(yǔ)法上的新特性,例如DisjointClasses表達(dá)類的不相交性等。

以上研究利用現(xiàn)有知識(shí)源,進(jìn)行EXPRESS向本體的自動(dòng)構(gòu)建具有領(lǐng)域和模式的限制。筆者在不依賴領(lǐng)域的前提下,給出以EXPRESS作為描述語(yǔ)言的知識(shí)源自動(dòng)轉(zhuǎn)換生成OWL2本體模型的規(guī)則及算法。

1 EXPRESS向OWL2的映射

EXPRESS是面向?qū)ο蠛突谀J降恼Z(yǔ)言,Web本體語(yǔ)言O(shè)WL是一種定義和實(shí)例化“Web本體”的語(yǔ)言[19],OWL2是W3C于2012年提出的[20],是在OWL1的基礎(chǔ)上對(duì)本體語(yǔ)言的擴(kuò)展,同時(shí)在語(yǔ)法上進(jìn)行了改進(jìn),例如糖衣語(yǔ)法等。本體由類、關(guān)系、函數(shù)、公理和實(shí)例5個(gè)建模元語(yǔ)組成[21]。

EXPRESS和OWL2在某種程度上都有面向?qū)ο蟮乃枷?都建立在概念和關(guān)系之上。對(duì)比分析EXPRESS語(yǔ)言的模式和本體5個(gè)建模元語(yǔ),給出EXPRESS和OWL2語(yǔ)言通用概念的形式化定義。針對(duì)復(fù)雜定義將在生成后的本體文件中進(jìn)行再處理。

定義1 將EXPRESS語(yǔ)言中抽取的面向?qū)ο蟮耐ㄓ酶拍钚问交癁橐粋€(gè)6元組E,定義如下

其中E表示實(shí)體(Entity);A表示實(shí)體屬性(Entity attribute);R表示實(shí)體規(guī)則(Entity rule);F表示實(shí)體函數(shù)(Entity function);I表示實(shí)體實(shí)例(Entity instance);C表示實(shí)體約束(Entity Constraint),其中C包含(ONEOF,ANDOR,AND,OPTIONAL,UNIQUE,INVERSE)。

定義2 將OWL2語(yǔ)言中和EXPRESS語(yǔ)言中對(duì)應(yīng)的通用概念形式化為一個(gè)6元組O,定義如下

其中C表示類(Class);P表示屬性(Property),其中Property包含(ObjectProperty,DataTypeProperty);R表示限制(Restrictions);A表示公理(Axiom);I表示實(shí)例(Instance);C′表示約束(Constraint),其中C′包含(DisjointClass,UnionOf,IntersectionOf,ObjectMinCardinality,ObjectExactCardinality,InverseObjectProperty)。

依據(jù)定義1、定義2,EXPRESS語(yǔ)言和OWL2語(yǔ)言通用概念的形式化定義,結(jié)合面向?qū)ο蟮乃枷?給出定義1中的元素和定義2中的元素具體映射的定義。

定義3 映射定義:對(duì)于集合E中的元素ei與集合O中的元素oj相對(duì)應(yīng),用符號(hào)記為f(ei)→oj,其中f表示轉(zhuǎn)換規(guī)則。

下面根據(jù)定義3給出EXPREE向OWL2映射的形式化描述。

1)實(shí)體(Entity)映射。

定義4 依據(jù)面向?qū)ο笾袑?duì)象(Object)的概念,定義1的E中實(shí)體映射成定義2的O中的類,映射過(guò)程如下

其中Entityi表示EXPRESS語(yǔ)言中的實(shí)體,Classj表示OWL2語(yǔ)言中的類。

2)屬性(attribute)映射。

定義5 依據(jù)面向?qū)ο笾袑?duì)象屬性(Object attribute)的概念,定義1的E中實(shí)體屬性映射成定義2的O中的屬性,映射過(guò)程如下

其中EntityAttributei表示EXPRESS語(yǔ)言中的實(shí)體屬性,ObjectPropertyj、DataTypePropertyj表示OWL2語(yǔ)言中的對(duì)象屬性和數(shù)據(jù)屬性。

3)規(guī)則(Rule)映射。

定義6 依據(jù)面向?qū)ο笾蟹椒?Method)的概念,定義1的E中實(shí)體規(guī)則映射成定義2的O中的公理或限制,映射過(guò)程如下

其中EntityRulei表示EXPRESS語(yǔ)言中的實(shí)體規(guī)則,Axiomj和Restrictionj表示OWL2語(yǔ)言中的公理和限制。

4)函數(shù)(Function)映射。

定義7 依據(jù)面向?qū)ο笾蟹椒?Method)的概念,定義1的E中實(shí)體函數(shù)映射成定義2的O中的類,映射過(guò)程如下

其中Entity Functioni表示EXPRESS語(yǔ)言中的實(shí)體函數(shù),Classj表示OWL2語(yǔ)言中的類。

5)實(shí)例(Instance)映射。

定義8 依據(jù)面向?qū)ο笾袑?duì)象實(shí)例(Object instance)的概念,定義1的E中實(shí)體實(shí)例映射成定義2的O中的實(shí)例,映射過(guò)程如下

其中EntityInstancei表示EXPRESS語(yǔ)言中的實(shí)體實(shí)例,Instancej表示OWL2語(yǔ)言中的實(shí)例。

6)約束(EntityConstraint)映射。

定義9 依據(jù)面向?qū)ο笾蟹椒?Method)的概念,定義1的E中實(shí)體約束映射成定義2的O中的約束,映射過(guò)程如下

其中EntityConstrainti表示EXPRESS語(yǔ)言中的實(shí)體約束,Constraintj表示OWL2語(yǔ)言中的約束。

①約束(ONEOF)的映射。

定義10 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中不相交(ONEOF)約束映射成C′中的不相交(DisjointClass)約束,映射過(guò)程如下

其中ONEOFi表示EXPRESS語(yǔ)言中的約束,DisjointClassj表示OWL2語(yǔ)言中的約束。

②約束(ANDOR)的映射。

定義11 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中并集(ANDOR)約束映射成C′中的并集(UnionOf)約束,映射過(guò)程如下

其中ANDORi表示EXPRESS語(yǔ)言中的約束,UnionOfj表示OWL2語(yǔ)言中的約束。

③約束(AND)的映射。

定義12 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中交集(AND)約束映射成C′中的交集(IntersectionOf)約束,映射過(guò)程如下

其中ANDi表示EXPRESS語(yǔ)言中的約束,IntersectionOfj表示OWL2語(yǔ)言中的約束。

④約束(OPTIONAL)的映射。

定義13 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中可選(OPTIONAL)約束映射成C′中的最小基數(shù)(ObjectMinCardinality)約束,映射過(guò)程如下

其中OPTIONALi表示EXPRESS語(yǔ)言中的約束,ObjectMinCardinalityj表示OWL2語(yǔ)言中的約束。

⑤約束(UNIQUE)的映射。

定義14 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中唯一(UNIQUE)約束映射成C′中的準(zhǔn)確基數(shù)(ObjectExactCardinality)約束,映射過(guò)程如下

其中UNIQUEi表示EXPRESS語(yǔ)言中的約束,ObjectExactCardinalityj表示OWL2語(yǔ)言中的約束。

⑥約束(INVERSE)的映射。

定義15 依據(jù)面向?qū)ο笾蟹椒?Method)的概念和定義9,約束C中逆屬性(INVERSE)約束映射成C′中的逆屬性(InverseObjectProperty)約束,映射過(guò)程如下

其中INVERSEi表示EXPRESS語(yǔ)言中的約束,InverseObjectPropertyj表示OWL2語(yǔ)言中的約束。

2 EXPRESS向OWL2的具體轉(zhuǎn)換過(guò)程

對(duì)OWL2本體模型與EXPRESS模型綜合分析,得出二者轉(zhuǎn)換的規(guī)則。

規(guī)則1 當(dāng)OWL2中存在的核心概念和關(guān)鍵語(yǔ)法能直接匹配EXPRESS語(yǔ)言語(yǔ)義表達(dá)的要求,要優(yōu)先匹配這些概念和語(yǔ)法,同時(shí)保證關(guān)鍵語(yǔ)法和語(yǔ)義匹配的一致。

規(guī)則2 當(dāng)OWL2中沒(méi)有直接的核心概念或關(guān)鍵語(yǔ)法能夠匹配EXPRESS,可采用構(gòu)造概念和語(yǔ)法的方式進(jìn)行匹配,同時(shí)保證關(guān)鍵語(yǔ)法和語(yǔ)義匹配的一致。

規(guī)則3 當(dāng)OWL2中沒(méi)有與EXPRESS中對(duì)應(yīng)概念或語(yǔ)法相匹配時(shí),而在RDF(Resource Description Framework)和SWRL(Semantic Web Rule Language)中有相關(guān)的定義可以描述,則采用RDF和SWRL相關(guān)語(yǔ)法對(duì)其進(jìn)行匹配,同時(shí)保證關(guān)鍵語(yǔ)法和語(yǔ)義一致。

規(guī)則4 對(duì)于以上3種匹配方法均不能實(shí)現(xiàn)或難以實(shí)現(xiàn)匹配的情況,均采取原文直譯法。并對(duì)轉(zhuǎn)換后的本體采用本體編輯軟件進(jìn)行再處理。

2.1 模式匹配轉(zhuǎn)換

EXPRESS模式包含聲明對(duì)象,具體包括常量、實(shí)體、類型、函數(shù)、規(guī)則和過(guò)程。在OWL2中直接對(duì)模式的聲明Schema進(jìn)行表達(dá),根據(jù)轉(zhuǎn)換規(guī)則1,將EXPRESS中的USE和REFERENCE與OWL2中的owl:import進(jìn)行匹配。與EXPRESS不同的是OWL2在定義本體時(shí),需首先對(duì)XML命名空間進(jìn)行初始聲明,并將其封裝在rdf:RDF開(kāi)始標(biāo)記中。

2.2 數(shù)據(jù)類型匹配轉(zhuǎn)換

1)簡(jiǎn)單數(shù)據(jù)類型匹配關(guān)系。OWL2標(biāo)準(zhǔn)使用XSD(XML Schema Definition)Language定義的數(shù)據(jù)類型。因此,根據(jù)轉(zhuǎn)換規(guī)則1,EXPRESS中簡(jiǎn)單數(shù)據(jù)類型和OWL2中的內(nèi)嵌數(shù)據(jù)類型直接匹配,數(shù)據(jù)類型對(duì)應(yīng)關(guān)系如表1所示。

表1 EXPRESS簡(jiǎn)單數(shù)據(jù)類型和OWL2的匹配關(guān)系Tab.1 Matching relation of EXPRESSsimple data types and OWL2

2)自定義數(shù)據(jù)類型匹配關(guān)系。自定義數(shù)據(jù)類型使用TYPE語(yǔ)句定義,自定義類型將簡(jiǎn)單類型和取值范圍進(jìn)行重新定義,同時(shí)給出約束規(guī)則,以方便復(fù)用和擴(kuò)展。根據(jù)規(guī)則2和規(guī)則4,采用構(gòu)造OWL2類的方式進(jìn)行匹配。將自定義類型的名稱映射為OWL2的類名稱,同時(shí)給該類聲明一個(gè)數(shù)據(jù)屬性,其值域用來(lái)表示取值類型和范圍,命名規(guī)則是簡(jiǎn)單類型+_+ndt,定義域就是該類。為分類的方便,將所有的數(shù)據(jù)類型都定義為類ndt_type的子類。

3)枚舉類型匹配關(guān)系。枚舉項(xiàng)所組成的集合是枚舉數(shù)據(jù)類型,根據(jù)規(guī)則1和定義4,OWL2中的關(guān)鍵詞owl∶oneOf可以與之匹配。將EXPRESS中枚舉類型的名稱直接映射轉(zhuǎn)換為OWL2中類的名稱,EXPRESS中枚舉項(xiàng)組成的集合在OWL2中映射轉(zhuǎn)換為由Collection關(guān)鍵字枚舉的個(gè)體。

4)選擇數(shù)據(jù)類型匹配關(guān)系。選擇數(shù)據(jù)類型定義一個(gè)其他數(shù)據(jù)名稱的集合,該集合稱為選擇表。選擇表中的項(xiàng)是實(shí)體數(shù)據(jù)類型或自定義數(shù)據(jù)類型。SELECT數(shù)據(jù)類型的值是類型表中類型之一。在OWL2中沒(méi)有直接定義,根據(jù)規(guī)則2,通過(guò)構(gòu)造的方式進(jìn)行轉(zhuǎn)換,OWL2中unionOf可以表示并集,對(duì)于選擇數(shù)據(jù)類型的選擇表中項(xiàng)的集合通過(guò)構(gòu)造owl:unionOf實(shí)現(xiàn)轉(zhuǎn)換,對(duì)于選擇數(shù)據(jù)類型的取值通過(guò)構(gòu)造子類的形式進(jìn)行轉(zhuǎn)換,子類的命名規(guī)則為SELECT_+選擇類型名稱+_type。

5)聚集數(shù)據(jù)類型匹配關(guān)系。聚集(aggregate)數(shù)據(jù)類型是由幾個(gè)基本類型元素的集合組成,包括數(shù)組(array)、包(bag)、列表(list)和集合(set)4種數(shù)據(jù)類型。在OWL2中沒(méi)有直接與之相對(duì)應(yīng)的語(yǔ)法或概念,可通過(guò)組合的方式進(jìn)行表達(dá),因此,根據(jù)規(guī)則2和規(guī)則3,采用構(gòu)造的方式進(jìn)行映射。

2.3 實(shí)體類型匹配轉(zhuǎn)換

1)實(shí)體名稱。EXPRESS中的實(shí)體的名稱和OWL2中的類一致,因此,依據(jù)規(guī)則1和定義4,實(shí)體的名稱用〈owl ∶Class rdf ∶ID=“實(shí)體名稱”〉匹配。

2)實(shí)體屬性。EXPRESS中定義的實(shí)體屬性為顯示屬性時(shí),其取值可能是具體數(shù)據(jù),也可能是引用了其他的實(shí)體類型,根據(jù)規(guī)則1和定義5,筆者分別采用〈owl∶DatatypeProperty rdf∶ID=“has_屬性名”〉和owl∶ObjectProperty rdf∶ID=“has_屬性名”>匹配。EXPRESS中的INVERSE將屬性聲明為逆屬性,用來(lái)描述被聲明實(shí)體與其他實(shí)體中的一個(gè)屬性之間的互逆關(guān)系。根據(jù)規(guī)則1和定義15,利用OWL2中的InverseObjectProperty進(jìn)行匹配。

關(guān)鍵字OPTIONAL用來(lái)說(shuō)明屬性的值可為空值,根據(jù)規(guī)則1和定義13,在OWL2語(yǔ)言中可使用owl∶ObjectMinCardinality關(guān)鍵字匹配,并將最小基數(shù)的值設(shè)為0映射OPTIONAL關(guān)鍵字。

3)唯一性規(guī)則。對(duì)于EXPRESS中實(shí)體屬性的UNIQUE規(guī)則,根據(jù)規(guī)則1和定義14,在OWL2中,存在owl∶exactCardinality關(guān)鍵字,該關(guān)鍵字能限制OWL2類屬性基數(shù)的上下界,采取將該關(guān)鍵字的值都設(shè)為1以描述唯一性約束。

4)WHERE子句和局部規(guī)則匹配。對(duì)實(shí)體和實(shí)體屬性的約束使用WHERE子句和局部規(guī)則,在SWRL中定義了豐富的謂詞邏輯可以很好地描述這部分信息,因此,根據(jù)規(guī)則3、定義6和定義7,筆者采用SWRL規(guī)則描述WHERE子句和局部規(guī)則。例如,可使用Swrl∶equal表示兩個(gè)屬性或規(guī)則表達(dá)式相等。

5)超類與子類。EXPRESS中超類和子類是描述實(shí)體分類的層級(jí)關(guān)系。在EXPRESS實(shí)體中,即包含超類的聲明也包含子類的聲明,但在OWL2中只包括子類的聲明。根據(jù)規(guī)則1,用〈rdfs∶subClassOf〉匹配EXPRESS的實(shí)體中的subtype Of,實(shí)現(xiàn)超子類的轉(zhuǎn)換。對(duì)于EXPRESS中的超類運(yùn)算符oneOf、andor和and,它們限定了類之間的關(guān)系,根據(jù)定義10~定義12,可將它們和OWL2中的disjointclass、unionOf和intersectionOf進(jìn)行匹配,以約束類之間不相交、并集和補(bǔ)集關(guān)系。

3 自動(dòng)轉(zhuǎn)換流程及轉(zhuǎn)換算法

3.1 轉(zhuǎn)換流程

根據(jù)上面提出的轉(zhuǎn)換規(guī)則和定義,由EXPRESS模型向OWL2本體模型自動(dòng)轉(zhuǎn)換的流程為通過(guò)文檔預(yù)處理、詞法分析和語(yǔ)法分析以及概念的判斷,實(shí)現(xiàn)轉(zhuǎn)換功能并利用Protégé工具對(duì)結(jié)果進(jìn)行檢驗(yàn)。

3.2 自動(dòng)轉(zhuǎn)換算法

抽取EXPRESS文件中通用的概念、關(guān)系、規(guī)則和約束,其具有模式和語(yǔ)法固定特點(diǎn),利用詞法分析和語(yǔ)法分析以及關(guān)鍵字匹配的方式可實(shí)現(xiàn)將EXPRESS轉(zhuǎn)換生成OWL2文件,處理的主要流程包括文檔預(yù)處理、詞法分析、語(yǔ)法分析、數(shù)據(jù)類型與實(shí)體轉(zhuǎn)換,最后用Protégé本體工具對(duì)本體的合法性進(jìn)行檢測(cè)。下面給出具體的轉(zhuǎn)換算法。

1)EXPRESS文件的詞法分析。EXPRESS文件的詞法分析要求轉(zhuǎn)換工具剔除空格,讀取輸入的每個(gè)字符,對(duì)讀入的內(nèi)容進(jìn)行關(guān)鍵字符匹配分類、特殊標(biāo)點(diǎn)符號(hào)分類和語(yǔ)義解析,具體算法如下。

算法1 剔除空格和語(yǔ)義解析流程算法。

Input:讀取EXPRESS文件

Output:詞法分析后的文件

Algorithm:

if(character is blank)//判斷是否為空格

do nothing;

else if(character input)//讀取非空格的字符,并對(duì)關(guān)鍵字符進(jìn)行匹配分類

{將讀取的字符進(jìn)行分析,對(duì)特殊的標(biāo)點(diǎn)符號(hào)以及關(guān)鍵字進(jìn)行分類處理}

2)語(yǔ)法分析與映射轉(zhuǎn)換。語(yǔ)法分析就是針對(duì)詞法分析的結(jié)果,按照關(guān)鍵字的類型以及映射轉(zhuǎn)換的匹配關(guān)系和轉(zhuǎn)換原則進(jìn)行轉(zhuǎn)換,包括實(shí)體類型和數(shù)據(jù)類型的轉(zhuǎn)換,具體轉(zhuǎn)換算法如下。

①實(shí)體類型的轉(zhuǎn)換。

算法2 實(shí)體類型轉(zhuǎn)換算法。

Input:詞法分析后的文件

Output:EXPRESS實(shí)體類型對(duì)應(yīng)的OWL2文件

Algorithm:

for(int i=0;i<express.length;i++){//遍歷EXPRESS文件中的實(shí)體

if(實(shí)體繼承了父類)

{提取實(shí)體名轉(zhuǎn)換成OWL2中的類,同時(shí)判斷存放父類名的數(shù)組A是否存在該實(shí)體,不存在則轉(zhuǎn)換生成OWL2中的類;

依據(jù)“:”,提取屬性名和對(duì)應(yīng)類型,同時(shí)轉(zhuǎn)換生成OWL2中的屬性,定義域?yàn)閷?shí)體名,值域?yàn)閷?duì)應(yīng)的類型名}

else://實(shí)體沒(méi)有繼承關(guān)系

{提取實(shí)體名轉(zhuǎn)換生成OWL2中的類,依據(jù)“:”,提取屬性名和對(duì)應(yīng)的類型,同時(shí)轉(zhuǎn)換生成OWL2中的屬性,定義域?yàn)閷?shí)體名,值域?yàn)閷?duì)應(yīng)的類型名}

}//結(jié)束

②數(shù)據(jù)類型的轉(zhuǎn)換。

算法3 數(shù)據(jù)類型轉(zhuǎn)換算法。

Input:詞法分析后的文件

Output:EXPRESS自定義數(shù)據(jù)類型對(duì)應(yīng)的OWL2文件

Algorithm:

for(type in items){//遍歷EXPRESS文件中的類型實(shí)體

if(character=“=”)//利用等號(hào)進(jìn)行判斷

{等號(hào)左側(cè)為類型的名稱,轉(zhuǎn)換為OWL2中的類

if(讀取的類型是簡(jiǎn)單類型)

{按照簡(jiǎn)單類型轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換}

else if(讀取的類型是選擇類型)

{按照選擇類型轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換}

else if(讀取的類型是自定義類型)

{按照自定義類型轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換}

else if(讀取的類型是枚舉類型)

{按照枚舉類型轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換}

else

{按照聚集類型轉(zhuǎn)換規(guī)則進(jìn)行轉(zhuǎn)換}

}//結(jié)束

4 原型系統(tǒng)實(shí)現(xiàn)

上世紀(jì)80年代末期,為實(shí)現(xiàn)石油領(lǐng)域信息共享,國(guó)際石油領(lǐng)域和埃克森美孚公司等5家石油大公司聯(lián)合成立了POSC石油組織,構(gòu)建了全球石油領(lǐng)域勘探與開(kāi)發(fā)一體化上游數(shù)據(jù)模型標(biāo)準(zhǔn)——Epicentre,并采用擴(kuò)充后的EXPRESS描述該數(shù)據(jù)模型。Epicentre定義了1 479個(gè)實(shí)體,其中抽象實(shí)體是115個(gè)、75條Where規(guī)則、自定義數(shù)據(jù)類型337個(gè)。石油領(lǐng)域本體將是石油領(lǐng)域下一代語(yǔ)義標(biāo)準(zhǔn)的基礎(chǔ),利用筆者提出轉(zhuǎn)換規(guī)則轉(zhuǎn)換算法設(shè)計(jì)并開(kāi)發(fā)了本體轉(zhuǎn)換系統(tǒng),文件轉(zhuǎn)換通過(guò)上傳EXPRESS文件實(shí)現(xiàn)轉(zhuǎn)換生成OWL2文件,實(shí)體轉(zhuǎn)換和類型轉(zhuǎn)換都是在線輸入轉(zhuǎn)換,具體功能如圖1所示,并用Epicentre對(duì)本體轉(zhuǎn)換功能進(jìn)行了驗(yàn)證。

圖1 實(shí)體轉(zhuǎn)換模塊功能Fig.1 Entity conversion module function

筆者采用Python語(yǔ)言[22]及flask框架結(jié)合編譯原理的知識(shí)設(shè)計(jì)開(kāi)發(fā)了EXPRESS自動(dòng)轉(zhuǎn)換為OWL2的轉(zhuǎn)換工具,主要包含文件轉(zhuǎn)換、實(shí)體轉(zhuǎn)換、類型轉(zhuǎn)換、查看文件和轉(zhuǎn)換日志5個(gè)模塊。轉(zhuǎn)換后的本體在Protégé中的OWL Viz展示如圖2所示。

圖2 Epicentre模型的部分OWL Viz圖Fig.2 Partial OWL Viz diagram of Epicentre model

同時(shí)采用Jena推理機(jī),對(duì)轉(zhuǎn)換后的OWL文件進(jìn)行驗(yàn)證,按照Epicentre模型標(biāo)準(zhǔn)建立推理規(guī)則,對(duì)推理規(guī)則的準(zhǔn)確性驗(yàn)證、OWL文件中類和屬性的數(shù)量以及和Epicentre模型的對(duì)應(yīng)關(guān)系驗(yàn)證該轉(zhuǎn)換研究的完整性和一致性。下面給出部分推理規(guī)則和推理實(shí)例結(jié)果。如圖3和圖4所示。類well中對(duì)象屬性has_pty_economic_water_cut_limit和類pty_economic_water_cut_limit中對(duì)象屬性has_well互為逆屬性,建立類pty_economic_water_cut_limit的實(shí)例waterLimit1,實(shí)例waterLimit1通過(guò)對(duì)象屬性has_well關(guān)聯(lián)到類well的實(shí)例well1,依據(jù)規(guī)則1就可推理出實(shí)例well1通過(guò)對(duì)象屬性has_pty_economic_water_cut_limit關(guān)聯(lián)到實(shí)例waterLimit1。類well通過(guò)對(duì)象屬性has_wellbore關(guān)聯(lián)到類wellbore,類wellbore通過(guò)對(duì)象屬性has_pty_fluid_level關(guān)聯(lián)到類pty_fluid_level,依據(jù)規(guī)則2,實(shí)例well1也可通過(guò)對(duì)象屬性has_pty_fluid_level關(guān)聯(lián)到實(shí)例pty_fluid_level_instance。該推理的結(jié)果的正確性說(shuō)明了轉(zhuǎn)換的準(zhǔn)確性和一致性。

圖3 Jena推理規(guī)則Fig.3 Jena inference rule

圖4 Jena推理結(jié)果Fig.4 Jena inference results

5 結(jié) 語(yǔ)

筆者在不依賴傳統(tǒng)的本體構(gòu)建方法和領(lǐng)域?qū)<規(guī)椭那闆r下,利用OWL2語(yǔ)言和EXPRESS語(yǔ)言面向?qū)ο蟮奶攸c(diǎn),給出了EXPRESS語(yǔ)言向本體描述語(yǔ)言O(shè)WL2的通用轉(zhuǎn)換規(guī)則。即對(duì)EXPRESS語(yǔ)言中通用的概念、屬性、類型和關(guān)系都給出了通用的映射定義和轉(zhuǎn)換規(guī)則的形式化,同時(shí)定義并設(shè)計(jì)了實(shí)現(xiàn)兩種語(yǔ)言自動(dòng)轉(zhuǎn)換算法。該映射定義、轉(zhuǎn)換規(guī)則和轉(zhuǎn)換算法不受領(lǐng)域限制,具有通用性和實(shí)用性。在此基礎(chǔ)上,設(shè)計(jì)并開(kāi)發(fā)了通用的自動(dòng)轉(zhuǎn)換工具,大大減少了在本體構(gòu)建過(guò)程中依賴領(lǐng)域?qū)<业娜秉c(diǎn)以及人力、物力的耗費(fèi),并利用Epicentre模型驗(yàn)證了轉(zhuǎn)換規(guī)則和轉(zhuǎn)換工具的可行性。筆者自動(dòng)構(gòu)建了石油領(lǐng)域的勘探開(kāi)發(fā)本體模型,該本體模型目前在石油開(kāi)發(fā)領(lǐng)域的知識(shí)描述項(xiàng)目中得到了初步應(yīng)用,其他采用EXPRESS建模的領(lǐng)域可采用文中的研究成果實(shí)現(xiàn)向本體OWL2的自動(dòng)轉(zhuǎn)換,該成果具有普適性。下一步,將應(yīng)用該成果在知識(shí)管理、語(yǔ)義檢索和推理等領(lǐng)域進(jìn)行更深入的研究。

[1]SHADBOLT N,BERNERSLEE T.The Semantic Web Revisited[J].IEEE Intelligent Systems,2006,21(3):96-101.

[2]MAEDCHE A,STAAB S.Ontology Learning for the Semantic Web[J].IEEE Intelligent Systems,2001,16(2):72-79.

[3]戎軍濤.基于本體的學(xué)科知識(shí)門戶語(yǔ)義檢索機(jī)制研究[J].情報(bào)科學(xué),2016,34(6):47-51,62.RONG Juntao.Research on Ontology Based Semantic Retrieval Mechanism of Subject Knowledge Portal[J].Information Science,2016,34(6):47-51,62.

[4]成錦暉,鄭山紅.本體領(lǐng)域綜合概念相似度計(jì)算中的權(quán)重確定方法 [J].吉林大學(xué)學(xué)報(bào):理學(xué)版,2014,52(6):1272-1276.CHENG Jinhui,ZHENG Shanhong.Method of Weight Determination in Conceptual Similarity Computation of Ontology Domain[J].Journal of Jilin University:Science Edition,2014,52(6):1272-1276.

[5]Object Management Group.Unified Modeling Language Super Structure Specification,V2.0[EB/OL].(2005-04-04)[2017-01-15].http://www.omg.org/does/formal/05-07-04.pdf.

[6]馬靜,何雪楓,簡(jiǎn)旭文.動(dòng)態(tài)熱門話題的“特征詞條本體”自動(dòng)構(gòu)建與進(jìn)化研究 [J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2016,12(10):33-41.MA Jing,HE Xuefeng,JIAN Xuwen.A Study on the Automatic Construction and Evolution of Feature Term Ontology in Dynamic Hot Topics[J].New Technology of Library and Information Service,2016,12(10):33-41.

[7]葉光輝.基于UML的敘詞表轉(zhuǎn)本體方法研究[J].圖書(shū)館雜志,2014,33(7):28-33,18.YE Guanghui.Research on Ontology Conversion Method Based on UML[J].Library Journal,2014,33(7):28-33,18.

[8]LI Yukun,MENG Xiaofeng.Research on Personal Dataspace Management[C]∥Proc of ACM S1GMOD Int Conf on Management of Data.New York:S1GMOD 2008,2008:7-12.

[9]賀海濤,鄭山紅.基于中文文本的疾病領(lǐng)域本體學(xué)習(xí)的研究[J].吉林大學(xué)學(xué)報(bào):信息科學(xué)版,2014,32(1):76-81.HE Haitao,ZHENG Shanhong.Study on Disease Domain Ontology Learning Based on Chinese Text[J].Journal of Jilin University:Information Science Edition,2014,32(1):76-81.

[10]KOLAITISP.XML Schema Mappings,Data Exchange,and Meta Data Management[C]∥PODSSymposium on Principles of Database Systems.New York:ACM,2005:61-75.

[11]LENZERINI M.Data Integration:A Theoretical Perspective[C]∥SIGMOD ACM SIGMOD International Conference on Management of Data.New York:ACM Press,2002:233-246.

[12]HRISTIDISV,GRAVANOL,PAPAKONSTANTINOUY.Efticicnt IR-Style Keyword Search over Relational Databases[C]∥VLDB International Conference on Very Large Data Bases.New York:ACM Press,2003:850-861.

[13]BHALOTIA G,HULGCRI A,NAKHC C,et al.Keyword Searching and Browsing in Databases Using BANKS[C]∥ICDE International Conference on Data Engineering.Dallas:IEEE Computer Society,2002:431-440.

[14]QIU F,CHO J.Automatic Identification of User Interest for Personalized Search[C]∥SIGCOMM Special Interest Group on Data Communication.New York:ACM Press,2006:727-736.

[15]王歲花,閆林.Web本體語(yǔ)言O(shè)WL及在產(chǎn)品信息表達(dá)中的應(yīng)用[J].計(jì)算機(jī)應(yīng)用與軟件,2007,24(9):33-36.WANG Suihua,YAN Lin.Web Ontology Language OWL and Its Application in Product Information Expression[J].Computer Applications and Software,2007,24(9):33-36.

[16]陳磊,葉修梓,潘翔,等.基于本體的產(chǎn)品數(shù)據(jù)語(yǔ)義互操作[J].計(jì)算機(jī)集成制造系統(tǒng),2008,14(4):821-828.CHEN Lei,YE Xiuzi,PAN Xiang,et al.Ontology Based Semantic Interoperability of Product Data[J].Computer Integrated Manufacturing System,2008,14(4):821-828.

[17]孟海忠.基于OWL的STEP產(chǎn)品信息語(yǔ)義轉(zhuǎn)換器設(shè)計(jì)與實(shí)現(xiàn) [D].杭州:浙江工業(yè)大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2011:12-13.MENG Haizhong.Design and Implementation of STEP Product Information Semantic Converter Based on OWL[D].Hangzhou:College of Computer Science and Technology,Zhejiang University of Technology,2011:12-13.

[18]張開(kāi)明.SETP轉(zhuǎn)換為語(yǔ)義Web本體的研究[D].哈爾濱:哈爾濱工程大學(xué)機(jī)電工程學(xué)院,2013:27-28.ZHANG Kaiming.Research on SETPConversion to Semantic Web Ontology[D].Harbin:School of Mechanical and Electrical Engineering,Harbin Engineering University,2013:27-28.

[19]PATEL SCHNEIDER P,HAYES P,HORROCKS I.OWL Web Ontology Language Semantics and Abstract Syntax.W3C Recommendation[EB/OL].(2004-02-10)[2009-03-14].http:∥www.w3.org/TR/owl-sementics/.

[20]CHRISTINE GOLBREICH.OWL 2 Web Ontology Language New Features and Rationale(Second Edition)[EB/OL].(2012-02-10)[2013-03-14].http:∥www.w3.org/TR/owl2-new-features/.

[21]張曉丹,李靜,張秋霞,等.語(yǔ)義Web本體語(yǔ)言O(shè)WL2研究[J].電子設(shè)計(jì)工程,2015,23(16):28-31.ZHANG Xiaodan,LI Jing,ZHANG Qiuxia,et al.Research on Semantic Web Ontology Language OWL2[J].Electronic Design Engineering,2015,23(16):28-31.

[22]康計(jì)良.Python語(yǔ)言的可視化編程環(huán)境的設(shè)計(jì)與實(shí)現(xiàn)[D].西安:西安電子科技大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,2012:21-22.KANG Jiliang.Design and Implementation of Visual Programming Environment for Python Language[D].Xi'an:College of Computer Science and Technology,Xi'an Electronic and Science University,2012:21-22.

猜你喜歡
數(shù)據(jù)類型本體約束
眼睛是“本體”
如何理解數(shù)據(jù)結(jié)構(gòu)中的抽象數(shù)據(jù)類型
基于本體的機(jī)械產(chǎn)品工藝知識(shí)表示
馬和騎師
基于SeisBase模型的地震勘探成果數(shù)據(jù)管理系統(tǒng)設(shè)計(jì)
線上眾籌產(chǎn)品的特征分析與研究
相似度計(jì)算及其在數(shù)據(jù)挖掘中的應(yīng)用
適當(dāng)放手能讓孩子更好地自我約束
專題
Care about the virtue moral education
琼中| 胶南市| 富宁县| 岳普湖县| 成安县| 亳州市| 阿勒泰市| 平江县| 昭苏县| 柳州市| 嘉义县| 鄂伦春自治旗| 邛崃市| 达孜县| 麦盖提县| 大埔区| 庆阳市| 隆化县| 邯郸县| 马边| 吴川市| 铜山县| 廊坊市| 精河县| 客服| 滕州市| 固阳县| 龙陵县| 连城县| 富裕县| 玛多县| 大田县| 中山市| 商洛市| 台前县| 河源市| 府谷县| 汉中市| 墨竹工卡县| 吉木萨尔县| 东丰县|