国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

一種基于模糊概念相似度的模糊本體構(gòu)建方法

2014-03-29 02:01:00李鵬劉勝全劉艷張華楠劉華鵬
關(guān)鍵詞:外延本體聚類

李鵬,劉勝全,2,劉艷,張華楠,劉華鵬

1.新疆大學(xué)信息科學(xué)與工程學(xué)院,烏魯木齊830046

2.新疆大學(xué)現(xiàn)代教育技術(shù)中心,烏魯木齊830046

1 引言

當(dāng)前語(yǔ)義Web[1]研究領(lǐng)域中,本體(Ontology)[2]通過(guò)對(duì)概念及其相互關(guān)系的規(guī)范化描述,可勾畫出某一領(lǐng)域的基本知識(shí)體系。但在許多應(yīng)用領(lǐng)域中,由經(jīng)典本體支持的形式化概念不足以表示模糊信息,通常的解決方法是將模糊集理論[3]引入本體以處理模糊信息。因此,模糊本體(Fuzzy Ontology)的構(gòu)建方法成為亟待解決的問(wèn)題。

手工構(gòu)建模糊本體費(fèi)時(shí)費(fèi)力,常需要領(lǐng)域?qū)<业慕忉?,故自?dòng)構(gòu)建方法成為目前國(guó)內(nèi)外主流的研究趨勢(shì),主要有基于模糊概念模型、基于語(yǔ)言變量、基于MDA及基于模糊聚類的構(gòu)建方法等。其中基于模糊聚類的構(gòu)建方法是依據(jù)模糊集理論,將模糊聚類技術(shù)引入到模糊本體的自動(dòng)構(gòu)建中,是目前模糊本體構(gòu)建的研究熱點(diǎn)之一。文獻(xiàn)[4]提出了一個(gè)模糊本體自動(dòng)生成框架,其自動(dòng)生成方法分為以下幾步:模糊形式概念分析、概念層次生成、模糊本體的框架生成。文獻(xiàn)[5]研究了一種從模糊背景生成模糊本體的方法,通過(guò)模糊概念格聚類生成模糊概念層次。文獻(xiàn)[6]提出一種基于模糊概念格的概念距離聚類方法來(lái)構(gòu)建模糊本體。但上述文獻(xiàn)對(duì)模糊概念間相似度的計(jì)算還存在不足,忽略了內(nèi)涵和外延對(duì)模糊概念的制約關(guān)系,最終影響了模糊概念聚類的質(zhì)量。本文提出一種基于模糊概念相似度的模糊本體構(gòu)建方法,對(duì)模糊概念的相似度從內(nèi)涵和外延兩個(gè)方法進(jìn)行了計(jì)算,并引入權(quán)重因子對(duì)內(nèi)涵和外延進(jìn)行調(diào)節(jié),以適應(yīng)不同領(lǐng)域中模糊概念的特點(diǎn)。

2 模糊本體相關(guān)理論知識(shí)

2.1 模糊本體構(gòu)建框架

本體是共享概念模型的明確的形式化規(guī)范說(shuō)明[2]。包含5個(gè)基本的建模元語(yǔ):概念、關(guān)系、函數(shù)、公理、實(shí)例。模糊本體表示的是模糊概念及其之間的模糊關(guān)系。模糊本體可用四元組OF=(CF,P,R,X)來(lái)表示,其中CF為模糊概念集,P為屬性集,R為模糊概念集與屬性集之間的笛卡爾積,X為公理集。模糊概念可表示為CF=,其中oi是對(duì)象,ai是oi的屬性[4]。

運(yùn)用模糊概念聚類方法構(gòu)建模糊本體,其構(gòu)建框架如圖1所示。

圖1 模糊本體構(gòu)建框架圖

其主要思想是首先抽取領(lǐng)域內(nèi)的不確定信息形成模糊形式背景,再運(yùn)用漸進(jìn)式算法從模糊形式背景中構(gòu)建出模糊概念格,然后采用基于模糊概念相似度的概念聚類算法將模糊概念格聚類并轉(zhuǎn)化為模糊概念層次,最后映射得到模糊本體原型。

2.2 模糊形式概念分析

為處理現(xiàn)實(shí)世界中的不確定信息,將模糊集理論與形式概念分析(FCA)相結(jié)合,從特定領(lǐng)域的不確定信息中構(gòu)造模糊形式背景,在構(gòu)造好的模糊形式背景上運(yùn)用一定的構(gòu)建算法構(gòu)建出模糊概念格,這一過(guò)程稱為模糊形式概念分析[7]。模糊形式概念分析建立在以下概念基礎(chǔ)之上。

定義1 模糊形式背景。一個(gè)模糊形式背景表示為F=(O,A,I),其中O為一個(gè)對(duì)象集合,A為一個(gè)屬性集合,映射I稱為隸屬度函數(shù)。這個(gè)函數(shù)滿足:I(o,a)=μ,其中o∈O,a∈A,μ∈[0,1]。

定義2 模糊概念。給定一個(gè)模糊形式背景F=(O,A,I)和閥值Φd,對(duì)?O1?O:

對(duì)?A1?A:

則模糊概念是二元對(duì)C1=(O1,A1),O1?O,A1?A,f(O1)=A1,g(A1)=O1。其中O1和A1分別為模糊概念C1的外延(extent)和內(nèi)涵(intent)。

定義3 模糊參數(shù)δ。對(duì)于對(duì)象集合O,屬性集合A=f(O),a∈A:

參數(shù)δ描述的是對(duì)象的平均隸屬度。

定義4設(shè)(O1,A1)和(O2,A2)為模糊形式背景(O,A,I)的兩個(gè)模糊概念,當(dāng)且僅當(dāng)O1?O2,則有A1?A2,則(O1,A1)是(O2,A2)的子概念,(O2,A2)是(O1,A1)的父概念。

定義5 模糊概念格。模糊形式背景F的所有模糊概念的集合記為CS(F),CS(F)上的結(jié)構(gòu)是一種偏序關(guān)系。若滿足O1?O2,則(O1,A1)≤(O2,A2),通過(guò)此關(guān)系得到的有序集-CS(F)=(CS(F),≤)稱為模糊形式背景F的模糊概念格。

算法1 模糊概念格的漸進(jìn)式構(gòu)建算法

用Intent(C)表示概念節(jié)點(diǎn)C的內(nèi)涵,Extent(C)表示概念節(jié)點(diǎn)C的外延。

步驟1 模糊概念格-CS(F)初始化為空。

步驟2 從模糊形式背景F取出一個(gè)對(duì)象x,形成節(jié)點(diǎn)({x},f({x})),如果-CS(F)中沒(méi)有節(jié)點(diǎn)C使得f({x})?Intent(C),則將節(jié)點(diǎn)({x},f({x}))加入-CS(F)。

步驟3 掃描-CS(F)中的所有節(jié)點(diǎn),找出所有內(nèi)涵小于等于新增對(duì)象x內(nèi)涵的節(jié)點(diǎn)C(Intent(C)?f(x)),則節(jié)點(diǎn)C為更新節(jié)點(diǎn)。將每個(gè)更新節(jié)點(diǎn)更新為(Extent(C)∪{x},Intent(C)),邊不更新;轉(zhuǎn)步驟5。

步驟4 掃描-CS(F)中的所有節(jié)點(diǎn),如果節(jié)點(diǎn)C與x的內(nèi)涵交集不等于-CS(F)中任意節(jié)點(diǎn)的內(nèi)涵,則定義為產(chǎn)生子節(jié)點(diǎn)(交集相同的節(jié)點(diǎn)中取外延最大的),將每個(gè)產(chǎn)生子節(jié)點(diǎn)與此x一起生成新生成節(jié)點(diǎn)(Extent(C)∪{x},Intent(C)∩f(x))。如果-CS(F)中存在新生成節(jié)點(diǎn)的更新節(jié)點(diǎn),則更新這些節(jié)點(diǎn),否則加入新生成節(jié)點(diǎn)到-CS(F),并連接新生成節(jié)點(diǎn)到它的子節(jié)點(diǎn)和父節(jié)點(diǎn)。

步驟5 直到所有的對(duì)象加入-CS(F)中;否則轉(zhuǎn)步驟2。

步驟6 搜索-CS(F)中所有沒(méi)有子節(jié)點(diǎn)的節(jié)點(diǎn),如果這樣的節(jié)點(diǎn)多于一個(gè),則生成底節(jié)點(diǎn)(Φ,A),并增加底節(jié)點(diǎn)到這些點(diǎn)的邊。搜索所有沒(méi)有父節(jié)點(diǎn)的節(jié)點(diǎn),如果這樣的節(jié)點(diǎn)多于一個(gè),則生成頂節(jié)點(diǎn)(Φ,A)加入-CS(F),并增加頂節(jié)點(diǎn)到這些點(diǎn)的邊。

3 基于模糊概念相似度的概念聚類算法

隨著模糊形式背景中對(duì)象和屬性數(shù)量的增加,模糊概念格中的模糊形式概念數(shù)量也會(huì)隨之增長(zhǎng)。同時(shí),很多對(duì)象會(huì)因?yàn)閷傩灾瞪系募?xì)微差別而被分到不同的模糊形式概念中,實(shí)際上,這些對(duì)象應(yīng)該屬于同一模糊概念,這樣模糊概念格就存在許多冗余的概念。故應(yīng)采用概念聚類的方法對(duì)模糊概念格中模糊形式概念進(jìn)行處理,并產(chǎn)生層次結(jié)構(gòu)。

基于模糊概念相似度的概念聚類算法,其中心思想是計(jì)算模糊概念格中有父子繼承關(guān)系的模糊形式概念的內(nèi)涵和外延相似度,增加內(nèi)涵及外延的權(quán)重因子,使之可根據(jù)所分析的目標(biāo)概念格的特點(diǎn)調(diào)節(jié),并以此為依據(jù)將相似度較高的模糊形式概念聚為一類,以取得較為滿意的聚類結(jié)果。

對(duì)于兩個(gè)模糊形式概念C1=(O1,A1),C2=(O2,A2),C1為C2的子概念,給出概念相似度相關(guān)定義如下:

定義6 外延相似度(similarity on Extent)兩個(gè)概念的外延相似度是用其外延集合的交集的勢(shì)的2倍除以兩個(gè)概念的外延集合的勢(shì)的和的結(jié)果。

定義7 內(nèi)涵相似度(similarity on Intent)兩個(gè)概念的內(nèi)涵相似度是計(jì)算其內(nèi)涵集合交集中的每個(gè)屬性在各自概念中的δ的偏差值的絕對(duì)值,再將其值減1的絕對(duì)值的和的2倍除以兩個(gè)概念的內(nèi)涵集合的勢(shì)的和的結(jié)果。

由于在模糊概念格中不同的模糊形式概念所包含的相同的屬性還可能存在程度上的差異,因此這里計(jì)算內(nèi)涵相似度時(shí)用到了模糊參數(shù)δ。

定義8 概念相似度(similarity on concept)兩個(gè)概念的總體概念相似度根據(jù)其外延和內(nèi)涵的相似度來(lái)進(jìn)行計(jì)算。

其中,α和β分別為外延和內(nèi)涵相似度的權(quán)重因子,可以根據(jù)所分析的目標(biāo)模糊形式概念格的特點(diǎn)進(jìn)行調(diào)節(jié)。

算法2 基于模糊概念相似度的概念聚類算法

輸入:模糊概念格-CS(F),相似度閥值Ts;

輸出:模糊概念聚類-CS′(F)。

步驟1預(yù)處理,讀取-CS(F)中的邊集CXCY(Cx為CY的父節(jié)點(diǎn),邊包括父子節(jié)點(diǎn)及節(jié)點(diǎn)間相似度相關(guān)參數(shù))。

步驟2 順序查找邊集中的邊CiCj(CiCj∈CXCY),計(jì)算概念相似度sim(Ci,Cj)。

步驟3 若sim(Ci,Cj)>Ts,聚類CiCj成為一個(gè)新節(jié)點(diǎn)Cij;否則轉(zhuǎn)步驟5。

步驟4 更新節(jié)點(diǎn)Cij({OX∪OY},{AX∪AY}),并代替父節(jié)點(diǎn)Ci,更新邊集,Ci的父節(jié)點(diǎn)連到Cij,Cij連到Cj的子節(jié)點(diǎn),刪除子節(jié)點(diǎn)Cj。

步驟5 轉(zhuǎn)到步驟2,直至不存在邊CiCj,使得sim(CiCj)>Ts成立

步驟6 邊集存入-CS′(F)。

4 模糊概念聚類映射規(guī)則

模糊概念聚類有以下性質(zhì)[8]:

(1)模糊概念聚類有層次關(guān)系,其層次關(guān)系可從模糊形式概念格中的模糊形式概念導(dǎo)出,即若兩聚類中的形式概念存在父子關(guān)系,則兩聚類也存在父子關(guān)系。

(2)一個(gè)模糊形式概念至少屬于一個(gè)模糊概念聚類,但可以同時(shí)屬于多個(gè)模糊概念聚類。

根據(jù)模糊概念聚類層次及模糊本體中元素的對(duì)應(yīng)關(guān)系,運(yùn)用映射規(guī)則可以構(gòu)造模糊本體原型。映射規(guī)則如圖2所示。

圖2 模糊概念聚類與模糊本體的映射規(guī)則

由圖2中模糊概念層次到模糊本體的映射規(guī)則可知,模糊概念層次中的概念節(jié)點(diǎn)標(biāo)識(shí)就是模糊本體的概念類名,概念節(jié)點(diǎn)的內(nèi)涵是模糊本體中相應(yīng)概念的屬性,概念節(jié)點(diǎn)的外延是模糊本體中相應(yīng)概念的實(shí)例,節(jié)點(diǎn)屬性的隸屬度值是模糊本體相應(yīng)概念的相應(yīng)屬性的值,模糊概念層次中概念間的層次關(guān)系是模糊本體相應(yīng)概念間的關(guān)系。這樣就把模糊概念層次映射成了模糊本體,包括模糊本體概念、模糊本體概念屬性,以及其隸屬度的值、模糊本體實(shí)例和模糊本體概念間分類關(guān)系。

通過(guò)上述映射規(guī)則得到的模糊本體原型,還需要領(lǐng)域?qū)<业膮⑴c,添加概念間非分類關(guān)系以及屬性、公理、實(shí)例等,擴(kuò)充模糊本體原型,才能得到比較完善的模糊本體。

5 實(shí)例構(gòu)建及比較

5.1 構(gòu)造模糊形式背景及模糊概念格

本文在Eclipse平臺(tái)下,采用Java語(yǔ)言實(shí)現(xiàn)模糊概念格的漸進(jìn)式構(gòu)建算法和基于模糊概念相似度的概念聚類算法,選用文獻(xiàn)[6]給出的實(shí)例數(shù)據(jù),以連續(xù)5天的天氣為對(duì)象,以溫度、紫外線、風(fēng)力和雨水為屬性,設(shè)定閥值Φd為0.5,約簡(jiǎn)后的模糊形式背景如表1所示。

表1 模糊形式背景

根據(jù)模糊形式背景表1,采用算法1[9]構(gòu)造模糊概念格,如圖3所示。

圖3 模糊概念格

各模糊形式概念的構(gòu)成及模糊參數(shù)值如表2所示。為方便描述,在表2中模糊形式背景中的7個(gè)屬性分別用符號(hào)a、b、c、d、e、f、g來(lái)代替。

表2 模糊形式概念構(gòu)成表

5.2 模糊概念聚類

利用第3章的基于模糊概念相似度的概念聚類算法,對(duì)圖3模糊概念格進(jìn)行聚類。計(jì)算模糊概念格中有父子繼承關(guān)系的模糊形式概念的概念相似度,如下所示。

本實(shí)例中選取α=β=0.5(即內(nèi)涵與外延權(quán)重相當(dāng)?shù)那闆r下):

sim(2,3)=0.60,sim(2,5)=0.70

sim(3,4)=0.58,sim(3,6)=0.53

取相似度閥值Ts=0.59,對(duì)模糊概念格進(jìn)行聚類,如圖4所示。

圖4 模糊概念聚類示意圖

5.3 模糊本體生成

由于節(jié)點(diǎn)1和節(jié)點(diǎn)7分別是領(lǐng)域內(nèi)最大概念和空概念,所以在模糊本體構(gòu)建中不作考慮,切斷其與其他節(jié)點(diǎn)的關(guān)系。

根據(jù)第4章映射規(guī)則,由圖4映射得到模糊本體原型如圖5。每個(gè)節(jié)點(diǎn)為模糊本體中一個(gè)模糊概念,節(jié)點(diǎn)的層次關(guān)系為模糊本體中的分類關(guān)系。

圖5 模糊本體原型

以模糊概念B為例,其屬性為溫度高(0.6),紫外線強(qiáng)(0.6),紫外線弱(0.9),風(fēng)力大(0.8),其實(shí)例為2、4、5,它是模糊模糊概念A(yù)的子概念。

在實(shí)際應(yīng)用中,還可以在領(lǐng)域?qū)<业闹笇?dǎo)下,將模糊本體原型導(dǎo)入本體編輯工具Protégé,添加概念間的非分類關(guān)系以及屬性、公理、實(shí)例等,最后得到較為完善的模糊本體。

5.4 比較

在邏輯學(xué)上,概念包含了概念的內(nèi)涵和外延。概念的內(nèi)涵是概念所反映的對(duì)象所特有的屬性,特別是本質(zhì)屬性在概念中的反映。概念的外延是具有概念所反映的本質(zhì)屬性的對(duì)象。概念的內(nèi)涵和外延具有反變關(guān)系,即指同一個(gè)從屬關(guān)系中,內(nèi)涵越豐富,外延就越小;反之,內(nèi)涵越簡(jiǎn)單,外延就越大。故在模糊概念聚類中,全面衡量模糊形式概念的內(nèi)涵外延的相似度是聚類的關(guān)鍵之處。

對(duì)比本文聚類方法與文獻(xiàn)[5]和文獻(xiàn)[6]方法,以聚類后模糊概念數(shù)量等于3為例,采用不同的聚類算法進(jìn)行模糊聚類后的模糊本體原型,如圖6所示。

圖6 模糊本體原型對(duì)比圖

可以看出,采用本文聚類算法產(chǎn)生的模糊本體更符合概念的反變關(guān)系,即模糊本體的上層概念外延較大,內(nèi)涵較簡(jiǎn)單,表示的概念較為抽象;下層概念外延較小,內(nèi)涵較豐富,表示的概念較為具體。不僅如此,本文在計(jì)算模糊概念相似度時(shí)引入了內(nèi)涵和外延的權(quán)重因子,可以根據(jù)所分析的目標(biāo)概念格的特點(diǎn)進(jìn)行調(diào)節(jié),力求更逼近領(lǐng)域中模糊概念實(shí)際的語(yǔ)義度量。

6 結(jié)束語(yǔ)

研究了模糊本體構(gòu)建中的基于模糊概念相似度的概念聚類算法,與文獻(xiàn)[5]和文獻(xiàn)[6]提出的模糊本體構(gòu)建方法相比,本文算法對(duì)模糊概念間的相似度從內(nèi)涵和外延兩個(gè)方面進(jìn)行了計(jì)算,并增加內(nèi)涵和外延的權(quán)重因子,可針對(duì)不同領(lǐng)域的模糊概念的特點(diǎn)對(duì)內(nèi)涵和外延的比重進(jìn)行調(diào)節(jié)。下一步的工作,將對(duì)模糊本體原型的生成算法以及模糊推理方法進(jìn)行研究。

[1]Berners-Lee T,Hendler J,Lassila O.The semantic Web[J].Scientific American,2001,284(5):34-43.

[2]Borst W N.Construction of engineering ontologies for know ledge sharing and reuse[D].Enschede:University of Twente,1997.

[3]Zadeh L A.Fuzzy sets[J].Information and Control,1965,8(3):338-353.

[4]Quan T T,Hui S C,Cao T H.FOGA:a fuzzy ontology generation framework for scholarly semantic Web[C]//Proceedings of the 2004 Know ledge Discovery and Ontologies Workshop(KDO’04),Pisa,Italy,2004.

[5]強(qiáng)宇,劉宗田,李旭,等.一種基于模糊聚類的模糊本體生成方法[J].計(jì)算機(jī)科學(xué),2006,33(4):148-150.

[6]李慧琳,劉寧,李冠宇.模糊本體構(gòu)建的概念距離聚類方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2012(4):1538-1541.

[7]劉宗田,強(qiáng)宇,周文,等.一種模糊概念格模型及其漸進(jìn)式構(gòu)造算法[J].計(jì)算機(jī)學(xué)報(bào),2007,30(2):184-188.

[8]Tho Q T,Hui S C,F(xiàn)ong A C M,et al.Automatic fuzzy ontology generation for semantic Web[J].IEEE Trans on Know ledge and Data Eng,2006,18(6):842-856.

[9]強(qiáng)宇.模糊概念格模型及其應(yīng)用研究[D].上海:上海大學(xué),2006.

猜你喜歡
外延本體聚類
Abstracts and Key Words
對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
基于DBSACN聚類算法的XML文檔聚類
關(guān)于工資內(nèi)涵和外延界定的再認(rèn)識(shí)
入坑
意林(2016年13期)2016-08-18 22:38:36
愛(ài)情的內(nèi)涵和外延(短篇小說(shuō))
《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
基于改進(jìn)的遺傳算法的模糊聚類算法
一種層次初始的聚類個(gè)數(shù)自適應(yīng)的聚類方法研究
自適應(yīng)確定K-means算法的聚類數(shù):以遙感圖像聚類為例
扎囊县| 临沧市| 车致| 濉溪县| 策勒县| 云南省| 新宁县| 天等县| 太仆寺旗| 华亭县| 分宜县| 黄梅县| 乌恰县| 康保县| 东光县| 嘉善县| 南靖县| 句容市| 河南省| 大田县| 灵石县| 天峻县| 文昌市| 巴林左旗| 贵定县| 崇仁县| 高雄县| 湘阴县| 铁岭县| 南江县| 吴桥县| 博爱县| 固原市| 镶黄旗| 高唐县| 汝南县| 桃源县| 临泽县| 板桥市| 沐川县| 于都县|