鄭 羽
(安慶師范學(xué)院 現(xiàn)代教育技術(shù)中心, 安徽 安慶 246133)
?
電子目錄的本體模型研究
鄭 羽
(安慶師范學(xué)院 現(xiàn)代教育技術(shù)中心, 安徽 安慶 246133)
摘要:電子目錄中包含了豐富的語義關(guān)聯(lián)產(chǎn)品,本文提出了一個電子目錄的本體模型:在一個概念性的模型中描繪電子目錄的語義信息,并因此構(gòu)建正式的發(fā)音本體。用一種增強(qiáng)的實(shí)體關(guān)聯(lián)方法來表示模型構(gòu)造的基本集,為每步構(gòu)建提出了相應(yīng)的描述邏輯代表。
關(guān)鍵詞:電子目錄;EER 語義;本體
電子目錄,縮寫e-catalog,對于任何電子商務(wù)系統(tǒng)而言都是非常重要的部分。它包含了諸如價格、特點(diǎn)、提供或需求貨物、服務(wù)的商業(yè)伙伴等相關(guān)條文。一次商業(yè)交易包含了對上述信息的交換、處理以及語義上的豐富,這樣精確的信息顯然會明顯增強(qiáng)電子交易的質(zhì)量和效率,在這里本體扮演了很重要的作用。本體是了解語義WEB的要素之一[1-2]。為WEB應(yīng)用建設(shè)一個域名-匹配的本體被認(rèn)為是為用戶開發(fā)嵌入應(yīng)用的語義知識提供了便利[3]。盡管利用本體服務(wù)于電子目錄的想法以前被提起過,但在電子目錄中應(yīng)用本體的可行性方法還有待研究,可能是因?yàn)殡娮幽夸浿械谋倔w建模很困難。
1相關(guān)工作背景
為了在WEB中表示本體,基于XML的標(biāo)記語言例如DAML+OIL[3]和OWL迅速發(fā)展起來,這影響了基于WEB應(yīng)用(如電子商務(wù)系統(tǒng))的發(fā)展[4]。
DL是一個語言族,它使用結(jié)構(gòu)化的和容易理解的方法來表示一個應(yīng)用領(lǐng)域的語義學(xué)[5]。DL采用了一個比較正式的基于邏輯的語義學(xué),用概念描述方法,包括使用概念和角色構(gòu)造器的原子概念(一元參數(shù))和原子角色(二元參數(shù))。ALC是一個基本的DL,它使用諸如連接符、分離符、非運(yùn)算符、存在制約構(gòu)造函數(shù)?R.C、值限制構(gòu)造函數(shù)等布爾函數(shù)?R.C,這里的C和R分別表示原子概念和原子角色。
決不同電子商務(wù)系統(tǒng)之間的協(xié)同操作問題[4-5],特別對于電子目錄而言,它是電子商務(wù)系統(tǒng)中的關(guān)鍵組成,也是電子政務(wù)系統(tǒng)中最適合本體發(fā)揮作用的領(lǐng)域。明確定義的電子目錄模型中包含豐富的語義,對它的共享使得電子商務(wù)系統(tǒng)能夠提供多樣的協(xié)同服務(wù)。關(guān)于如何在電子目錄中應(yīng)用本體,文獻(xiàn)[5]提出了B2B集成的問題,關(guān)注的是商品信息。然而,人們假定基本的產(chǎn)品分類模型還是簡單的基于代碼的分層模型,諸如UNSPSC或者ecl@ss。
2電子目錄基本建模
圖1為使用EER的電子目錄模型?;镜慕T厥菍?shí)體,意味著一套商品對象以及實(shí)體間的關(guān)系[6]。雖然一個實(shí)體能與很多的角色有著相同的關(guān)系,每個ER角色都被分配了唯一的角色名。兩個實(shí)體之間的關(guān)系代表了實(shí)體間的任意語義聯(lián)系。然而,現(xiàn)在的電子目錄模型關(guān)注的是由下面兩種類型所組成的包含關(guān)系:類包含(isa)或以偏概全包含(部分-整體),前者用三角形繪制,后者用五角形繪制。關(guān)系的度以及關(guān)系中的實(shí)體數(shù)是兩個問題。實(shí)體和關(guān)系都有屬性,屬性值屬于預(yù)定義的一些范圍:整數(shù)、實(shí)數(shù)、布爾值、字符串值。
圖1使用EER的一個簡單電子目錄模型
在DL中,產(chǎn)品分類根據(jù)以下語法規(guī)則描述,字母A表示原子類,它的值是被預(yù)定義的整型、實(shí)型、字符串型和布爾型;字母C和D表示產(chǎn)品類;字母R和S表示原子角色,T表示通用的產(chǎn)品類。
C→A|T|CD|CD|?R.C
|?R.C|(≥nR.C)|(≤nR.C)
C?D概念包含,R-角色反演,R∈S+傳遞,R?S角色繼承。每一個語法的語義:當(dāng)I是由一個非空集合ΔI(I的抽象域)和一個解釋函數(shù)組成,指定給A一個集合AI?ΔI,給R一個二元關(guān)系RI?ΔI×ΔI。
TI=ΔI,(A)I=ΔIAI
(CD)ICI∩DI,(C)I=CI∪DI,
(?R.C)I={a∈ΔI|?b.(a,b)∈RI→b∈CI},
(?R.C)I={a∈ΔI|?b.(a,b)∈RI∧b∈CI},
(≥nRC)I={a∈ΔI|#{b.(a,b)∈RI∧b∈CI}≥n},
(≤nRC)I={a∈ΔI|#{b.(a,b)∈RI∧b∈CI}≤n},
(R-)I={(a,b)|a,b∈ΔI∧(b,a)∈RI},
(R∈S+)I={a,c∈ΔI|?b.(a,b),(b,c)∈RI→(a,c)∈RI}
如果I在CI?DI時滿足C?D,同樣,I滿足角色繼承關(guān)系:如果RI?SI,則R?S對每個R都成立。獨(dú)立的商品可以這樣假定:在一個ABox中有兩種:C(a)|R(a,b)。當(dāng)I是一個價值函數(shù),在I=(ΔI,.I)時,如果aI∈CI,則I滿足C(a),同樣,如果(aI,bI)∈RI,則I滿足R(a,b)。ABox的語義是一個開放的世界語義,它要求名稱具有唯一的特征,也就是說,如果a不同于b,則aI≠bI。角色填充構(gòu)造器R∶a(等同于?R.{a})的語義是{c∈ΔI|(c,aI)∈RI}。最后,為了支持最初定義的值類型如整型、實(shí)型、字符串型和布爾型,他們所表示的類型都有不同的解釋,語義應(yīng)該被擴(kuò)展來包含諸如I,ΔD,i.e.,I=(ΔI,ΔD,.I)的域[7]。
3語義關(guān)聯(lián)
為了使得語義建模能夠適合應(yīng)用領(lǐng)域,研究一下領(lǐng)域需要什么樣的語義關(guān)聯(lián),并且在模型中獲取它們是至關(guān)重要的。為了了解在實(shí)際中什么樣的語義關(guān)聯(lián)需求最大,分析已存在的目錄編碼系統(tǒng)包括UNSPSC,發(fā)現(xiàn)在圖2中現(xiàn)實(shí)的語義關(guān)聯(lián)在域中是最有用的。
圖2語義關(guān)聯(lián)分類
從電子目錄的語義關(guān)聯(lián)角度,最上一級可以劃分為包含、屬性、同義詞和反義詞等類別。包含關(guān)系表明了一個實(shí)體類型(產(chǎn)品類)由其他實(shí)體類型組成或者說包含其他實(shí)體類型。它可以被歸類到類包含或者以偏概全包含中,前者表示常出現(xiàn)在數(shù)據(jù)庫建模中的標(biāo)準(zhǔn)圖表類型/父型關(guān)聯(lián),而后者表示發(fā)生在整體和局部之間的關(guān)聯(lián)。
類包含關(guān)系(C是D的附屬)在DL中表示成:C?D。C的屬性繼承自D的屬性。繼承的屬性不需要在C中重復(fù)顯示,因?yàn)槔^承關(guān)系已經(jīng)包含在語義?中了。不過,繼承的屬性(C的Ai)可能會和被繼承類的屬性(D的Bi)使用不同的角色名。正因?yàn)槿绱耍枰谠黾咏巧?層次)Ai?Bi。以圖3為例,如果computer和notebook的屬性Class_code聲明分別使用不同的角色名computer_class_code和notebook_class_code,就需聲明:computer_class_code?notebook_class_code。
類包含可能還會有其他的限制,如覆蓋和不相交:
C?D1D2…Dn(C覆蓋了它的子類D1,…,Dn)。
對任意一對子類型Di和Dj,Di?Dj(D1,…,Dn彼此不相交)。
覆蓋限制代表了超級類的每個個體必須至少屬于一個它的子類。不相交限制代表了一個子類的任何個體不能作為其他的子類的個體。在EER記號中,使用加粗的線條或者將它們分別放入三角形中來表示覆蓋或者不相交關(guān)系(見圖3)。
圖3computer的類包含和覆蓋/不相交限制
4結(jié)束語
本文給出了基于EER和描述邏輯的本體建模方案,從基礎(chǔ)層面結(jié)合EER和描述邏輯搭建了該模型。該模型基于電子目錄,解決了基于代碼的分層模型的缺陷??紤]到本體概念在電子目錄領(lǐng)域的實(shí)際應(yīng)用,將來除了考慮由OWL提供的建模構(gòu)造器上關(guān)于表現(xiàn)力和復(fù)雜性的研究,同樣應(yīng)該考慮它在電子目錄領(lǐng)域的實(shí)際使用。
參考文獻(xiàn):
[1] 聶規(guī)劃,羅跡,陳冬林.電子目錄的SWRL規(guī)則研究[J].計算機(jī)工程與應(yīng)用, 2011,47(7):57-60.
[2] F. Baader, D. Calvanese, et al. The Description LogicHandbook: Theory, Implementation and Applications[M]. Cambridge University Press, 2003.
[3] 熊新階. EER模型中概化/特化的UML表達(dá)[J]. 廣東經(jīng)濟(jì)管理學(xué)院學(xué)報, 2006(8): 70-72.
[4] 劉平峰,章佩璐,陳冬林. 電子目錄本體合并中的實(shí)例消重機(jī)制[J]. 計算機(jī)工程, 2012(1):32-35.
[5] Z. Cui, D. Jones, and P. O'Brien. Semantic B2B Integration: Issues in Ontology-based Approaches[J].GMOD Record, ACM, 2002,31(1):17-19.
[6] 唐遠(yuǎn)翔,劉益. EER模型中超類/子類到XML模式的轉(zhuǎn)換研究[J]. 西昌學(xué)院學(xué)報(自然科學(xué)版), 2012(6):75-77.
[7] R. Elmasri and S.B. Navathe. Fundamentals of Database Systems[M]. 4th Edition.Pearson Addison Wesley, 2003.
Research on the Ontological Modeling of e-Catalogs using EER and Description Logics
ZHENG Yu
(Modern Education & Techology Center of Anqing Teacher′s College ,Anqing 246133,China)
Abstract:Electronic catalog containing rich semantics are always associated with products, and serves as a challenging domain for ontology application. Description Logics provide a theoretical core for most of the current ontology languages. In this paper, we present an ontological model of e-Catalogs. Our goal is to represent the semantic information of e-Catalog in a conceptual model, and then to construct a formally sound ontology. Additional semantic knowledge can be represented directly in description logic.
Key words:electronic catalog, EER, semantics, ontology
中圖分類號:TP311.13
文獻(xiàn)標(biāo)識碼:A
文章編號:1007-4260(2015)01-0064-03
DOI:10.13757/j.cnki.cn34-1150/n.2015.01.018
作者簡介:鄭羽,男,安徽桐城人,碩士,安慶師范學(xué)院現(xiàn)代教育中心工程師,研究方向?yàn)樾畔①Y源規(guī)劃、信息系統(tǒng)研究和建設(shè)。
收稿日期:2014-02-21