基于有向邊和屬性的相似度模型設(shè)計(jì)

2014-08-07 12:08:53張淑麗

微處理機(jī) 2014年5期

關(guān)鍵詞：重合結(jié)點(diǎn)權(quán)值

崔巖，張淑麗

（西北工業(yè)大學(xué)明德學(xué)院計(jì)算機(jī)信息技術(shù)系，西安710124）

基于有向邊和屬性的相似度模型設(shè)計(jì)

崔巖，張淑麗

（西北工業(yè)大學(xué)明德學(xué)院計(jì)算機(jī)信息技術(shù)系，西安710124）

通過分析單一條件下相似度算法的計(jì)算原理及設(shè)計(jì)思想，以有向圖的形式描述概念，分析和推導(dǎo)了有向邊、語(yǔ)義重合度及屬性相似度的計(jì)算模型，給出了一個(gè)含有語(yǔ)義及屬性權(quán)值的概念相似度計(jì)算模型。最后通過對(duì)比傳統(tǒng)模型的性能測(cè)試，驗(yàn)證了新模型對(duì)相似度計(jì)算的精度。

概念相似度；有向邊；屬性權(quán)值；本體

1 設(shè)計(jì)背景

概念相似度的研究，是在以本體為設(shè)計(jì)核心的檢索系統(tǒng)中研究的重點(diǎn)問題。它不僅對(duì)于語(yǔ)義提取中詞頻分析及閾值的設(shè)定有一定的參考意義，從應(yīng)用角度分析，它也直接影響查詢效率的高低與查找代價(jià)的大小。因此對(duì)于概念相似度的研究十分重要。

通過不同角度對(duì)概念之間相似度特點(diǎn)的分析和描述［1］，可以總結(jié)出某一個(gè)方面對(duì)概念相似度描述的計(jì)算模型。不同角度的側(cè)重各有差異，都有明顯的優(yōu)勢(shì)和缺陷，基于這些不同描述角度給出的計(jì)算模型，找出一個(gè)或者幾個(gè)最適合或最接近現(xiàn)實(shí)情況的模型，作為相似度計(jì)算的主要依據(jù)。

1.1 單一條件下的計(jì)算模型

（1）基于內(nèi)容的語(yǔ)義相似度計(jì)算模型

如果兩個(gè)概念共享的信息越多，則它們之間語(yǔ)義相似度也就越大?；谶@樣的原理，在概念網(wǎng)絡(luò)層次中，每個(gè)概念結(jié)點(diǎn)都可以看做是對(duì)其父結(jié)點(diǎn)的細(xì)化，它們繼承了父結(jié)點(diǎn)的信息。那么兩個(gè)概念的語(yǔ)義相似度就可以用它們最近共同的祖先結(jié)點(diǎn)的信息內(nèi)容來衡量。

這樣可以得到概念層次網(wǎng)絡(luò)中任意兩個(gè)概念之間的語(yǔ)義相似度。給定兩個(gè)概念c1和c2，其計(jì)算模型為公式（1）所示：

其中Anc（c1，c2）表示概念結(jié)點(diǎn)c1和c2在網(wǎng)絡(luò)中的最近共同祖先結(jié)點(diǎn)；IC（c）表示概念c所擁有的信息量。

（2）基于屬性的語(yǔ)義相似度計(jì)算模型

一般情況下，兩個(gè)客觀事物如果有多個(gè)屬性相同，則說明它們是相似的事物，概念，也具有類似的性質(zhì)。基于屬性的語(yǔ)義相似度計(jì)算模型就是根據(jù)這個(gè)原理來進(jìn)行相似度計(jì)算的。

由Tversky提出的一種語(yǔ)義相似度計(jì)算方法就是基于屬性的。如公式（2）所示。

其中：（c1∩c2）表示兩個(gè)概念相同的屬性集；c1-c2表示c1相對(duì)于c2所獨(dú)有的屬性集；c2-c1表示c2相對(duì)于c1所獨(dú)有的屬性集。

（3）基于距離的語(yǔ)義相似度計(jì)算模型

通過文獻(xiàn)［1］指出，語(yǔ)義相似度的計(jì)算是以概念層次結(jié)構(gòu)為基礎(chǔ)的，計(jì)算概念間與它們的最近公共父節(jié)點(diǎn)的距離來計(jì)算它們的語(yǔ)義距離，進(jìn)而計(jì)算出概念間的相似度。

在只存在上下位關(guān)系的概念層次機(jī)構(gòu)中，任意的兩個(gè)概念間，連通它們的最短路徑就是通過它們的最近公共父節(jié)點(diǎn)或者是通過它們的最近公共子節(jié)點(diǎn)，因此可以計(jì)算它們通過最近公共父節(jié)點(diǎn)或子節(jié)點(diǎn)的路徑距離為：

其中：d（c，min f）＝｜s（min f）-s（c）｜。min f是c1和c2最近公共父節(jié)點(diǎn)或子節(jié)點(diǎn)。由此，就可以計(jì)算出兩個(gè)概念之間的語(yǔ)義相似度了。

1.2 相似度分析與設(shè)計(jì)思路

上述三種計(jì)算模型是通過不同的三個(gè)角度來量化概念之間的相似度?；趦?nèi)容的語(yǔ)義相似度計(jì)算模型更具有理論說服性，它是由信息理論和概率統(tǒng)計(jì)理論當(dāng)中的有關(guān)知識(shí)作為理論根據(jù)的。基于屬性的語(yǔ)義相似度計(jì)算模型更符合人類對(duì)于客觀世界中事物相似性識(shí)別的認(rèn)知過程。但如果要做到準(zhǔn)確識(shí)別，就必須要對(duì)客觀事物的所有屬性進(jìn)行詳細(xì)描述才可以保證結(jié)果的正確性?；诰嚯x的語(yǔ)義相似度計(jì)算模型，相對(duì)比較直觀，便于理解和認(rèn)識(shí)，但是它首先應(yīng)該是在一個(gè)完整的概念層次網(wǎng)絡(luò)的基礎(chǔ)上才可以發(fā)揮作用。概念層次的組織結(jié)構(gòu)可以直接影響到語(yǔ)義的計(jì)算結(jié)果。

除了單一模型的提出，目前國(guó)內(nèi)研究中還提供了一些在綜合因素的考慮下建立的計(jì)算模型，如文獻(xiàn)［2-7］中，一方面是在語(yǔ)義重合度、語(yǔ)義密度、概念屬性的角度綜合考慮；另一方面，另辟蹊徑如從過濾無(wú)關(guān)概念的角度或語(yǔ)義矩陣的方式出發(fā)給出了新型的計(jì)算模型。這些都是從不同角度進(jìn)行的優(yōu)化。但基于本體的思想，構(gòu)建相似度計(jì)算模型的本身是為了構(gòu)造一個(gè)完整的領(lǐng)域本體之上的分析系統(tǒng)，緊扣語(yǔ)義和概念應(yīng)該是最為重要和本質(zhì)的要求。加入過多的因素或脫離語(yǔ)義本身進(jìn)行的排除性算法都會(huì)脫離基于本體的這個(gè)基礎(chǔ)概念。

針對(duì)上述分析結(jié)合不同計(jì)算模型的特點(diǎn)，本次項(xiàng)目把概念相似度放在一個(gè)層次結(jié)構(gòu)進(jìn)行描述，并在建模過程中，考慮結(jié)合屬性及語(yǔ)義重合度方面的因素作為影響因子，緊扣語(yǔ)義本身的特性推導(dǎo)影響因子，建立一個(gè)全新的計(jì)算模型。

2 新型相似度計(jì)算模型

2.1 計(jì)算模型的分析與構(gòu)想

系統(tǒng)中所有的概念都存在于本體層次網(wǎng)絡(luò)結(jié)構(gòu)當(dāng)中，這是一個(gè)有著比較嚴(yán)謹(jǐn)?shù)恼Z(yǔ)義結(jié)構(gòu)的體系［3］。因此，在這個(gè)結(jié)構(gòu)中所處的位置可以體現(xiàn)出概念之間的一些關(guān)系。這個(gè)結(jié)構(gòu)可以看成是一個(gè)由點(diǎn)和有向邊構(gòu)成的一個(gè)有向圖。其中的有向邊表示了概念間的相關(guān)性關(guān)系。

如果假設(shè)這個(gè)有向圖中所有的邊權(quán)值都是1，所有概念結(jié)點(diǎn)沒有屬性，那么計(jì)算任意兩個(gè)概念結(jié)點(diǎn)之間的相似度就是計(jì)算它們之間的距離。當(dāng)然現(xiàn)實(shí)情況并沒有這么簡(jiǎn)單，概念的屬性在其中也起著重要的作用，它一方面可以直觀反映出概念本身的特征，另一方面兩個(gè)概念的屬性之間相似性越大，概念的相似度也越高。所以它也可以很好的反映概念間的相似性關(guān)系。

概念之間有向邊的距離和概念屬性的相似性都可以從各自的角度反映出概念相似度的情況，但是都不夠完整［2］。這類問題已在文獻(xiàn)［3-6］中有很多論證。如果在計(jì)算概念間有向邊距離的同時(shí)，可以考慮到屬性對(duì)最后結(jié)果的影響，那么將無(wú)疑大大增加相似度計(jì)算的精度。所以，為了得到盡量接近現(xiàn)實(shí)描述的相似度計(jì)算模型，就必須考慮到概念的屬性對(duì)概念之間相似度的影響。另一方面文獻(xiàn)［6］針對(duì)相似度計(jì)算也提出要考慮屬性、內(nèi)容重合度等方面的因素。但是對(duì)于計(jì)算模型的建立只是通過簡(jiǎn)單的調(diào)節(jié)因子之間的疊加進(jìn)行。并且語(yǔ)義重合度與語(yǔ)義密度的計(jì)算有重復(fù)部分。在一個(gè)基于詞匯相似度計(jì)算的模式中，加入語(yǔ)義密度的因子似乎沒有太大的意義。

因此本項(xiàng)目的重點(diǎn)放在考慮屬性相似度計(jì)算及語(yǔ)義重合度和有向邊的相似度計(jì)算上。可以通過合理的公式推導(dǎo)，把屬性相似度及語(yǔ)義內(nèi)容的重合因素加入基于有向邊相似度的計(jì)算模型，建立一個(gè)統(tǒng)一的相似度模型。通過分析發(fā)現(xiàn)，在計(jì)算有向邊距離的時(shí)候，每條有向邊都假設(shè)權(quán)值為1，其實(shí)由于關(guān)系類型不一樣它們應(yīng)該具有不同的權(quán)值?？梢园颜Z(yǔ)義內(nèi)容重合度計(jì)算加入到有向邊計(jì)算模型中，而概念屬性之間的相似性從層次網(wǎng)絡(luò)的角度來分析，也可以看作是對(duì)每條邊權(quán)數(shù)的反映。所以，如果從層次網(wǎng)絡(luò)結(jié)構(gòu)中描述概念之間的相似度模型，可以考慮兩個(gè)方面的因素，一是加權(quán)之后有向邊的距離；二是概念屬性的相似性轉(zhuǎn)換成為邊的權(quán)數(shù)。

基于上述分析，建立計(jì)算模型的基本思想是：基于加權(quán)的有向邊和屬性的計(jì)算模型。確定影響有向邊權(quán)值的因素即屬性相似性的計(jì)算，給出計(jì)算這些因素的公式。而后推導(dǎo)出單位有向邊的距離與權(quán)值關(guān)系的計(jì)算公式。再根據(jù)任意兩個(gè)結(jié)點(diǎn)之間有向邊距離的計(jì)算公式，得出概念之間的權(quán)值從而給出概念間的相似度計(jì)算模型。

2.2 有向邊計(jì)算

一般在領(lǐng)域本體中，概念之間的關(guān)系有：上下位關(guān)系、同義關(guān)系、反義關(guān)系、對(duì)義關(guān)系、整體與部分關(guān)系等等［8］。在實(shí)現(xiàn)中，本體構(gòu)成的層次網(wǎng)絡(luò)中只需要考慮三種關(guān)系即可，繼承關(guān)系、整體與部分關(guān)系、同義關(guān)系。這三種關(guān)系幾乎占到了概念間關(guān)系的絕大多數(shù)情況。每種關(guān)系都是概念間不同的相關(guān)程度，一般地，同義關(guān)系的有向邊表示其兩端的概念為同一個(gè)意思，相關(guān)度最高。部分與整體關(guān)系的相關(guān)度小于繼承關(guān)系的有向邊。在本體層次網(wǎng)絡(luò)中，兩個(gè)直接相連的概念結(jié)點(diǎn)一定是處于不同層次，因此也就是父子結(jié)點(diǎn)。

設(shè)任意兩個(gè)相連父子結(jié)點(diǎn)為x和y，則有向邊相關(guān)程度的計(jì)算公式，如公式（4）所示：

其中：3／4和1／4為領(lǐng)域?qū)＜医o出的權(quán)值。該計(jì)算模型反映了有向邊的相關(guān)度和其類型之間的關(guān)系，將不同的類型轉(zhuǎn)換為對(duì)應(yīng)的數(shù)值。

2.3 屬性相似性計(jì)算

在本體的層次網(wǎng)絡(luò)中，概念的描述是非常詳細(xì)和準(zhǔn)確的，其中也包括了屬性描述。通過概念間擁有相同屬性的多少，在一定程度上就可以表示結(jié)點(diǎn)，也就是概念之間的相似程度。相同屬性越多，說明相似度越大，有向邊的權(quán)值也就越大。

由此得到有向邊與概念間屬性關(guān)系的公式，如公式（5）所示。

其中：Attr（x）、Arrt（y）表示概念x、y的屬性集合；Attr（x）∩Attr（y）表示概念x與概念y相同的屬性集合；Attr（x）∪Attr（y）表示概念x與概念y所有的屬性集合；cou（）表示屬性個(gè)數(shù)。

2.4 語(yǔ)義重合度計(jì)算

語(yǔ)義的重合度可以通過分析任意兩個(gè)概念結(jié)點(diǎn)之間所擁有的祖先結(jié)點(diǎn)的個(gè)數(shù)來判斷它們之間的重合度高低。顯然，如果兩個(gè)結(jié)點(diǎn)的祖先結(jié)點(diǎn)的個(gè)數(shù)越多，重合度就越高，如果一個(gè)都沒有，說明是完全沒有語(yǔ)義重合的兩個(gè)概念。

由此得到任意兩結(jié)點(diǎn)間的語(yǔ)義重合度的計(jì)算公式，如公式（6）所示。

其中：Up（x）、Up（y）表示概念結(jié)點(diǎn)x、y的祖先結(jié)點(diǎn)集合；Up（x）∩Up（y）表示概念x與概念y相同的祖先結(jié)點(diǎn)的集合；Up（x）∪Up（y）表示概念x與概念y所有的祖先結(jié)點(diǎn)的集合；cou（）表示對(duì)象個(gè)數(shù)。

2.5 權(quán)值因子計(jì)算公式

通過上面的推導(dǎo)，已經(jīng)把影響權(quán)值的因素量化并給出了公式，接下來計(jì)算有向邊的權(quán)值。這部分是相似度計(jì)算模型中最核心的部分，其表達(dá)式應(yīng)該為：

可以發(fā)現(xiàn)，當(dāng)WAttr（x，y）與WNode（x，y）的值為1時(shí)，權(quán)值最大。表示兩個(gè)結(jié)點(diǎn)是相同的概念。其他取值都小于1且無(wú)限趨近于0，當(dāng)然理論上存在屬性或語(yǔ)義完全不相交的情況，這時(shí)取值等于零。因此權(quán)值的取值范圍是［0，1］。

由此給出有向邊長(zhǎng)度與權(quán)值的公式，如公式（7）所示。

其中，β為調(diào)節(jié)因子。顯然當(dāng)權(quán)值為1時(shí)，長(zhǎng)度為0，表示父子結(jié)點(diǎn)x，y表示同一個(gè)概念。

基于2.2中的分析已經(jīng)得出了有向邊單位長(zhǎng)度的計(jì)算公式。在本體層次網(wǎng)絡(luò)中對(duì)于任意兩個(gè)結(jié)點(diǎn)的計(jì)算公式也可以得出。這里借鑒Leacock模型中的結(jié)點(diǎn)距離公式來得出任意兩個(gè)結(jié)點(diǎn)距離的計(jì)算公式。

Leacock模型中距離公式如公式（8）所示。

其中Anc（p，q）表示任意結(jié)點(diǎn)p、q的最近共同祖先結(jié)點(diǎn)。這里可以代入單位距離的公式從而建立任意結(jié)點(diǎn)距離與單位結(jié)點(diǎn)距離的關(guān)系。如公式（9）所示。

其中path（p，q）表示兩個(gè)結(jié)點(diǎn)p，q在網(wǎng)絡(luò)中最短的路徑上所有結(jié)點(diǎn)的集合。

由此，可以得出本體層次網(wǎng)絡(luò)中任意兩個(gè)概念的相似度計(jì)算公式，如公式（10）所示。

其中的α為調(diào)節(jié)因子。雖然從公式上看，這里概念的相似程度的量化似乎只和結(jié)點(diǎn)距離有關(guān)系，但實(shí)際上，這里距離的得出是包含了有向邊相關(guān)程度，和概念間屬性的相似度來作為計(jì)算依據(jù)的。因此可以較為準(zhǔn)確的反映出任意兩個(gè)概念之間的語(yǔ)義相關(guān)程度。

3 實(shí)際應(yīng)用效果

以基于有向邊和屬性的計(jì)算模型作為算法核心構(gòu)建的搜索引擎，已在一個(gè)實(shí)際項(xiàng)目上進(jìn)行應(yīng)用。對(duì)其基于本體的搜索引擎做了相關(guān)的性能測(cè)試。為了突出實(shí)驗(yàn)的對(duì)比效果，除了實(shí)現(xiàn)本模型外，加入Montserrat模型與傳統(tǒng)的Leacock模型進(jìn)行相同實(shí)驗(yàn)對(duì)象的結(jié)果比對(duì)。為方便區(qū)別，提出的相似度計(jì)算模型用ZKM模型表示。

利用Protégé本體建立工具，使用Jena API，Lucene開源工具包，Java語(yǔ)言作為編程語(yǔ)言。選取5組，共41個(gè)概念作為分析對(duì)象，實(shí)現(xiàn)了本項(xiàng)目的模型和其它兩個(gè)比對(duì)模型。

實(shí)驗(yàn)結(jié)果得到了比較理想的數(shù)據(jù)結(jié)果，選取其中一部分進(jìn)行介紹，如表1所示。

通過表1中計(jì)算的結(jié)果可以發(fā)現(xiàn)，本項(xiàng)目的相似度計(jì)算結(jié)果比其他兩個(gè)計(jì)算模型計(jì)算結(jié)果的有效性有了明顯提高。前四個(gè)例子分別選取的是belong-to、part of關(guān)系的概念，在計(jì)算結(jié)構(gòu)中都體現(xiàn)了比較好的相似性。最后一組是一個(gè)特例，概念“軟體”并不是本領(lǐng)域的專業(yè)詞匯，但是在臺(tái)灣的詞匯體系中，軟體就是軟件。這里算作是一種特殊關(guān)系進(jìn)行測(cè)試。由于在構(gòu)建領(lǐng)域本體中，作為陌生詞匯的“軟件”本身和軟件沒有直接聯(lián)系，但是通過追溯祖先結(jié)點(diǎn)和屬性重合度的權(quán)值調(diào)節(jié)，在最后的計(jì)算結(jié)果中也顯示了較高的相似度。從語(yǔ)義上，基本符合現(xiàn)實(shí)情況。

表1 不同相似度模型的計(jì)算結(jié)果（部分）

4 總結(jié)與展望

在本體概念架構(gòu)下的搜索引擎構(gòu)建中，概念相似度的分析始終是一個(gè)研究重點(diǎn)。相似度計(jì)算的精度會(huì)直接影響搜索的結(jié)果。目前對(duì)于相似度計(jì)算模型的優(yōu)化改良算法也非常之多。通過有向圖、語(yǔ)義、屬性及過濾云服務(wù)［2-10］等方面的計(jì)算模型也層出不窮，其目的無(wú)外乎就是可以容納更多影響語(yǔ)義的因素。但是在研究過程中，很容易陷入巨大的海量信息中難以自拔，一味的加入能考慮到的各種因素并不是好的解決問題的方法，最后由于邊際效益遞減的規(guī)律，往往會(huì)讓新的計(jì)算模型反而得不到理想的計(jì)算結(jié)果。項(xiàng)目的研究立足于從現(xiàn)實(shí)相關(guān)語(yǔ)義的角度出發(fā)，并沒有盲目追求加入很多其他的影響因素。從文獻(xiàn)［11］中可以發(fā)現(xiàn)，通過統(tǒng)計(jì)學(xué)分析發(fā)現(xiàn)，并不是所有和語(yǔ)義相關(guān)的因素都對(duì)概念相似度有明顯的影響，有些甚至?xí)蔀檎Z(yǔ)義分析的干擾項(xiàng)。因此去掉可能成為干擾項(xiàng)的影響因素，加強(qiáng)那些真正對(duì)語(yǔ)義影響重大的因素是本次項(xiàng)目探索的主題。

當(dāng)然在研究過程中也發(fā)現(xiàn)還有一些問題需要解決。比如領(lǐng)域本體的構(gòu)建方式本身就可能會(huì)對(duì)將來的相似度計(jì)算模型產(chǎn)生結(jié)構(gòu)上的影響，因此在考慮相似度計(jì)算模型的同時(shí)，還要研究領(lǐng)域本體構(gòu)建的方式，如何可以找到最適合的相似度計(jì)算模型。不同的模型考慮的重點(diǎn)是存在差異性的，這也會(huì)影響到最后分析的結(jié)果。因此，下一步的分析研究，可能要在關(guān)注優(yōu)化相似度計(jì)算模型的同時(shí)，考慮與領(lǐng)域本體構(gòu)建方式上的匹配問題。

［1］張功杰.面向本體的語(yǔ)義相似度計(jì)算及在檢索中的應(yīng)用［J］.計(jì)算機(jī)工程與應(yīng)用，2010（5）：131-133.

［2］向津.基于無(wú)關(guān)概念過濾的云服務(wù)相似推理技術(shù)研究［J］.計(jì)算機(jī)應(yīng)用與軟件，2013（1）：183-185，199.

［3］李景.本體理論在文獻(xiàn)檢索系統(tǒng)中的應(yīng)用研究［M］.北京：北京圖書館出版社，2005.

［4］劉宏哲.基于本體的語(yǔ)義相似度和相關(guān)度計(jì)算研究綜述［J］.計(jì)算機(jī)科學(xué)，2012（2）：8-13.

［5］甘明鑫.一種綜合加權(quán)的本體概念語(yǔ)義相似度計(jì)算方法［J］.計(jì)算機(jī)工程與應(yīng)用，2012，48（17）：148-153.

［6］崔其文.改進(jìn)的領(lǐng)域本體概念語(yǔ)義相似度計(jì)算方法［J］.計(jì)算機(jī)應(yīng)用與軟件，2012（2）：173-174，182.

［7］王春紅.基于本體和多代理的考試系統(tǒng)模型研究［J］.河北工業(yè)科技，2010（3）：174-176.

［8］Fleischman M，Hovy E.Multi-document person name resolution［C］.／／Harabagiu S，F(xiàn)arwell D，eds.Proceedings of the Workshop on Reference Resolution and its Applications.Barcelona，Spain july 2004：1-8.

［9］Kivela A，Hyvonen E.Ontological theories for the semantic Web［M］.Helsinki：HIIT Publications，2002：111-136.

［10］Rodriguez M，Egenbofer M.Derermining Semantic Similarity Among Entity Classes From Different Ontologies［J］.IEEE Transactions on Knowledge and Data Engineening，2008，15（2）：442-456.

［11］Alexander Maeche.Ontology learning for the semantic web［M］.Norwell：Kluwer Academic Publishers，2008：15-17.

［12］武成崗，焦文品，田啟家.基于本體論和多主體的信息檢索服務(wù)器［J］.計(jì)算機(jī)研究與發(fā)展，2001，38（6）：641-647.

［13］Bray T，Paoli J，Sperberg-McQueen C M，et al，Extensible Markup Language（XML）1.0（Second Edition）［EB／OL］.W3C Recommendation，http：／／www.w3c.org／TR／2000／TEC-xml.2007-10-06.

［14］Jianmin Yao，Ming Zhou，et al.An Automatic Evaluation Method for Localization Oriented Lexicalised EBMT System［A］.In Proceeding of the 19th International Confernce on Computational Linguistics［C］.（COLING2002）.Taipei，200.

［15］史英杰.云數(shù)據(jù)管理系統(tǒng)中查詢技術(shù)研究綜述［J］.計(jì)算機(jī)學(xué)報(bào)，2013（2）：219-225.

［16］常萬(wàn)軍.OWL本體存儲(chǔ)技術(shù)研究［J］.計(jì)算機(jī)工程與設(shè)計(jì)，2011（8）：2893-2896.

Sim ilarity Model Design Based on Edge and Attribute

CUIYan，ZHANG Shu-li
（Department of Computer Information Technology，Ming De College，Northwestern Polytechnical University，Xi＇an 710124，China）

Through the analysis of the calculation principle and design concept of similarity algorithm under the single condition，the concept of directed graph is described.The calculation models of the directed edge，the semantic overlap and the attribute similarity are analyzed and concluded to establish the concept similarity calculation modelwith semantic and attribute weight.Finally，the accuracy of the similarity calculation of the new model is verified by comparing with the traditional one.

Concept similarity；Directed edge；Weights of attributes；Ontology

10.3969／j.issn.1002-2279.2014.05.014

TP391

：A

：1002-2279（2014）05-0047-04

崔巖（1976-），男，河北邯鄲人，碩士研究生，講師，研究方向：數(shù)據(jù)庫(kù)技術(shù)與應(yīng)用。

2014-01-17

国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

基于有向邊和屬性的相似度模型設(shè)計(jì)

1 設(shè)計(jì)背景

2 新型相似度計(jì)算模型

3 實(shí)際應(yīng)用效果

4 總結(jié)與展望