蔡寅
摘 要:為了解決P2P定義域抽象與概念上表達(dá)的二義性和不兼容性,構(gòu)建了語義P2P系統(tǒng)參考模型語義映射,包括映射表達(dá)、映射實(shí)現(xiàn)、映射正確性、映射執(zhí)行者以及映射維護(hù)等各種問題的決策,從通用的、高層抽象的角度對(duì)涌現(xiàn)出來的分布式計(jì)算模式進(jìn)行建模,為該領(lǐng)域建立了一個(gè)通用的技術(shù)框架,使得研究成員相互間能更好地理解與交流,為各語義P2P系統(tǒng)間的比較提供了共同準(zhǔn)則。
關(guān)鍵詞關(guān)鍵詞:語義網(wǎng)絡(luò);P2P;SP2P參考模型;分布式計(jì)算
DOIDOI:10.11907/rjdk.161489
中圖分類號(hào):TP303
文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1672-7800(2016)008-0001-03
0 引言
目前,針對(duì)P2P的研究已經(jīng)產(chǎn)生了各種各樣的實(shí)現(xiàn)與體系結(jié)構(gòu)。各類研究者在知識(shí)管理、數(shù)據(jù)庫(kù)、信息檢索、P2P等方面的背景不同,導(dǎo)致了這些各種各樣的實(shí)現(xiàn)與體系結(jié)構(gòu)在定義域抽象與概念上表達(dá)的二義性和不兼容性。P2P仍然是一個(gè)不斷演化的領(lǐng)域。GUO Fangfang等[1]構(gòu)建了一種層次P2P模型,用于網(wǎng)絡(luò)安全數(shù)據(jù)融合告警系統(tǒng);劉衍珩等[2]構(gòu)建了P2P流媒體中動(dòng)態(tài)分級(jí)傳輸模型,用于流媒體的傳輸;吳鵬[3]針對(duì)文件共享只能按照文件標(biāo)識(shí)符查找的問題,構(gòu)建了異構(gòu)模式間的語義映射模型,將查詢請(qǐng)求中所有別名轉(zhuǎn)化成真實(shí)的數(shù)據(jù)表信息。目前存在不同的SP2P系統(tǒng)及其類型,如Piazza、Chatty Web、KEx、Somewhere、Hyperion、PeerDB、coDb、Esteem、Observer以及Edutella,這些系統(tǒng)互不兼容,具有不同的體系結(jié)構(gòu),是由具有不同知識(shí)背景的專家開發(fā)的。
參考模型創(chuàng)建有兩種不同的方法,Volker與Katarina[4]闡述了創(chuàng)建參考模型的兩種主要方法,即:①當(dāng)某個(gè)領(lǐng)域有大量系統(tǒng)可用時(shí),可以通過抽取現(xiàn)有系統(tǒng)的通用組件來開發(fā)參考模型;②對(duì)于一個(gè)領(lǐng)域,沒有較多系統(tǒng)可用時(shí),通過對(duì)現(xiàn)有與本領(lǐng)域相近的領(lǐng)域參考模型進(jìn)行提升得到。本文采用第一種方法,即從現(xiàn)有系統(tǒng)及其相關(guān)工作中抽取共同組件,以構(gòu)建SP2P系統(tǒng)參考模型,該SP2P系統(tǒng)參考模型捕獲了許多SP2P系統(tǒng)及其相關(guān)工作的共同特征,并對(duì)這些系統(tǒng)與相關(guān)工作的關(guān)鍵概念提供了標(biāo)準(zhǔn)化的描述。為了獲取參考模型的主要結(jié)構(gòu),本文著重對(duì)現(xiàn)有SP2P系統(tǒng)的顯著特征進(jìn)行識(shí)別,這些特征是有代表性的SP2P系統(tǒng)及其相關(guān)工作的用戶可視的各個(gè)方面,包括SP2P系統(tǒng)的共同方面與不同方面,這種方法就是面向特征的領(lǐng)域分析法(FODA)。對(duì)與SP2P系統(tǒng)相近領(lǐng)域的參考模型進(jìn)行研究,包括網(wǎng)格計(jì)算參考模型[5]與Web服務(wù)參考模型[6],這些參考模型代表了各個(gè)經(jīng)典領(lǐng)域,并采用第一種參考模型創(chuàng)建方法來加以創(chuàng)建。選取多個(gè)SP2P系統(tǒng)及其有代表性的相關(guān)研究工作來抽取SP2P系統(tǒng)的顯著特征,包括Chatty Web、KEx、P2PSLN及Piazza 4種系統(tǒng)及其相應(yīng)的組件、組件屬性以及組件之間的關(guān)系。
1 SP2P參考模型語義映射構(gòu)建
由于研究者的知識(shí)背景不同,并且SP2P領(lǐng)域仍然在不斷演化,目前存在許多各式各樣的SP2P實(shí)現(xiàn)與體系結(jié)構(gòu)。本文提出的SP2P參考模型滿足通用體系結(jié)構(gòu)的本質(zhì)需要,是對(duì)現(xiàn)有系統(tǒng)的主要方面進(jìn)行建模。一個(gè)特殊的SP2P系統(tǒng),例如Chatty Web、Piazza等,可以看成是參考體系結(jié)構(gòu)的一個(gè)實(shí)例。本模型是一個(gè)高層次的抽象,隱藏了開發(fā)者的實(shí)現(xiàn)細(xì)節(jié),然而,它使得導(dǎo)出具體的系統(tǒng)成為可能?;诒緟⒖寄P退鶆?chuàng)建的系統(tǒng)應(yīng)該容易修改。SP2P參考模型由7個(gè)主要結(jié)構(gòu)組成:
SP2P=
其中p表示結(jié)點(diǎn);r表示資源;qf表示查詢生成器;sn表示語義鄰居;rt表示路由;m表示映射;qa表示查詢結(jié)果。這7個(gè)結(jié)構(gòu)組成了任何SP2P系統(tǒng)所需要的最小組件,并能用于SP2P系統(tǒng)評(píng)估。
語義映射m=
1.1 映射表達(dá)
從以最簡(jiǎn)單形式進(jìn)行語義映射適合不同本體中發(fā)現(xiàn)查詢概念的同義詞。在具有更好表現(xiàn)力的映射中,邏輯關(guān)系用于發(fā)現(xiàn)概念間的關(guān)系、概念屬性和性質(zhì)。
邏輯關(guān)系集通常用于定義結(jié)點(diǎn)本體概念間的關(guān)系,包括{≡,\[,\],*,┷}。關(guān)系C1≡C2意味著兩個(gè)概念等價(jià),換言之,C1與C2是兩個(gè)相似的或同等意義的并可相互交換的兩個(gè)不同的概念,例如,“notebook”與“l(fā)aptop”是兩個(gè)等同的概念。關(guān)系C1\]C2表示C1超過C2,即C1比C2更具有一般性或更寬廣,例如,“system software”的概念比“operating system”的概念更具有一般性,更寬泛。關(guān)系C1\[C2表示C1低于C2,即C2比C1更具有一般性或更寬廣,例如,“book”比“publication”更不具有一般性,因?yàn)槌霭嫖锊粌H僅是書。關(guān)系┷表示兩個(gè)概念之間沒有語義關(guān)系,例如,“bank”作為財(cái)政機(jī)構(gòu)與“bank”作為河岸之間沒有語義關(guān)系。不能用以上關(guān)符號(hào)描述的其它兩個(gè)概念之間的關(guān)系用*來描述。
映射的表達(dá)對(duì)查詢結(jié)果的可擴(kuò)展程度有影響?;谟成湓试S的邏輯表達(dá)式,可以增加或減小查詢結(jié)果的可擴(kuò)展程度。需要精確映射的系統(tǒng)可能放松系統(tǒng)的約束條件,以增加查詢的召回率。例如,假定一個(gè)本體中的“大學(xué)”概念與第二個(gè)本體中的“教育學(xué)院”的概念是等價(jià)的,即:
大學(xué)≡教育學(xué)院
相應(yīng)地,映射操作返回值為1:
map(大學(xué),教育學(xué)院)=1.0
由于這兩個(gè)概念能同時(shí)被映射到一個(gè)共同的概念“學(xué)院”,因此,這個(gè)假定是有效的。
此外,假定“大學(xué)”或“教育學(xué)院”與“研究院”之間已確定具有相關(guān)的語義關(guān)系,即:
map(研究院,教育學(xué)院)=0.25
現(xiàn)提出如下查詢:
Query:列出該地區(qū)所有研究院的名字
嚴(yán)格的查詢結(jié)果為空,因?yàn)樵凇把芯吭骸迸c“大學(xué)”或“教育學(xué)院”之間沒有設(shè)置完全等價(jià)的關(guān)系。然而,如果放寬查詢的約束條件,即不是查找“研究院”與“教育學(xué)院”概念間的確切關(guān)系,而且考慮先前的查詢結(jié)果,將會(huì)有相應(yīng)的大學(xué)名字被檢索出來,因?yàn)椤把芯吭骸迸c“教育學(xué)院”之間的關(guān)系都會(huì)被確定為“學(xué)院”。
1.2 映射實(shí)現(xiàn)
如何進(jìn)行映射是一個(gè)非常重要的設(shè)計(jì)問題。結(jié)點(diǎn)使用例如WordNet的本地的同義詞辭典的副本,創(chuàng)建其自己的字典,構(gòu)建映射表,交換本體以翻譯本體間的概念。執(zhí)行映射方法的選擇受應(yīng)用范圍的影響,對(duì)于小范圍、特定領(lǐng)域的應(yīng)用,結(jié)點(diǎn)可能交換其局部本體或創(chuàng)建其局部字典以供翻譯;對(duì)于較大規(guī)模的應(yīng)用,可能需要局部同義詞字典,能夠完成一些推理,而不僅僅是處理與本地字典與表相關(guān)的簡(jiǎn)單的概念到概念的映射。映射可以被自動(dòng)地、半自動(dòng)地或手動(dòng)地進(jìn)行。
1.3 映射正確性測(cè)量
正確的語義映射是SP2P系統(tǒng)的基礎(chǔ)。很多研究者致力于對(duì)可能錯(cuò)誤的分類、對(duì)映射質(zhì)量的測(cè)量以及對(duì)查詢翻譯期間信息丟失的評(píng)估。映射正確性的測(cè)量有兩種方式,即數(shù)值測(cè)量與邏輯測(cè)量。數(shù)值測(cè)量適合于通過映射工具返回?cái)?shù)值,例如,一個(gè)映射操作得出概念間的語義關(guān)系,“Laptop”概念C1與“Notebook”概念C2的映射關(guān)系為:map(C1,C2)=1.0;“Operation system”概念C3與“Software”概念C4的映射關(guān)系為:map(C3,C4)=0.5或一些其它值。假如一個(gè)映射操作返回的數(shù)值≥δ(閾值),則認(rèn)為該映射是正確的。與本體概念間語義關(guān)系相關(guān)的數(shù)值由系統(tǒng)的設(shè)計(jì)者決定。例如,一個(gè)SP2P系統(tǒng)對(duì)于映射使用一致性表,賦給表中兩概念之間關(guān)系的值將被申明,并用于以后的映射過程。
邏輯測(cè)量是在映射操作期間得出邏輯關(guān)系,也即兩個(gè)概念間的關(guān)系是否滿足其邏輯操作{≡,\[,\],*,┷}中的一個(gè)。例如,“publication”與“book”間的邏輯關(guān)系為\]。
以上兩種方法可以改變,因此,邏輯關(guān)系可以轉(zhuǎn)換為數(shù)值關(guān)系,反之亦然。
1.4 映射執(zhí)行者
P2P系統(tǒng)設(shè)計(jì)者必須決定誰來實(shí)施映射,是發(fā)送結(jié)點(diǎn),還是接收結(jié)點(diǎn)?也即查詢轉(zhuǎn)換發(fā)生在發(fā)送查詢之前,還是發(fā)生在接收查詢之后?這是非常重要的決定,它影響到查詢路由。在某種程度上,查詢結(jié)點(diǎn)先執(zhí)行映射,再提交給語義相關(guān)的結(jié)點(diǎn)(如果映射的輸出結(jié)果高于某一給定閾值),這種約束可以用作一種結(jié)束查詢轉(zhuǎn)發(fā)策略。若一個(gè)接收結(jié)點(diǎn)接收一個(gè)查詢后再執(zhí)行映射,也即對(duì)查詢轉(zhuǎn)發(fā)沒有約束,任何一個(gè)查詢將會(huì)發(fā)給任何其它結(jié)點(diǎn),查詢接收結(jié)點(diǎn)回答各種查詢,或?qū)⑺鼈冝D(zhuǎn)發(fā)到其它結(jié)點(diǎn)。
1.5 映射維護(hù)
不同本體之間的映射需要維護(hù)。這是因?yàn)橛成潆S著本體的改變而過時(shí)。過時(shí)的映射會(huì)給整個(gè)系統(tǒng)帶來失敗的危險(xiǎn)。因此,有必要進(jìn)行以下處理:①語義映射維護(hù);②映射失敗檢測(cè);③容忍映射失敗。映射維護(hù)用于阻止映射失敗,需要進(jìn)行失敗檢測(cè)以至于修復(fù)。容忍映射失敗是必要的,目的在于降低因映射失敗給系統(tǒng)帶來的毀壞程度。
1.6 映射維護(hù)
在SP2P系統(tǒng)中,查詢結(jié)果的正確性需要評(píng)估,當(dāng)一個(gè)查詢得到多個(gè)查詢結(jié)果時(shí),需要選擇合適的查詢結(jié)果。因此,在SP2P參考模型中,需要查詢結(jié)果組件(qa)。換句話說,參考模型的查詢結(jié)果組件qa=
查詢結(jié)果評(píng)估的確定(qd)方式在SP2P系統(tǒng)中是一個(gè)重要的設(shè)計(jì)問題。結(jié)果確定可以手動(dòng)或自動(dòng)獲得,在手動(dòng)查詢結(jié)果確定方式中,查詢結(jié)果組件將結(jié)果呈現(xiàn)給用戶,由系統(tǒng)用戶決定其查詢結(jié)果的正確與否;在自動(dòng)查詢結(jié)果確定方式中,系統(tǒng)結(jié)點(diǎn)有確定查詢結(jié)果正確與否的能力。對(duì)于后者,系統(tǒng)設(shè)計(jì)者需要設(shè)計(jì)一系列的準(zhǔn)則來增強(qiáng)對(duì)SP2P系統(tǒng)的控制,以有能力決定查詢結(jié)果的正確與否。這種測(cè)量實(shí)例包括計(jì)算查詢結(jié)果概念與查詢概念間的語義關(guān)系。
結(jié)果選擇as=
查詢結(jié)果處理的另一個(gè)重要元素是結(jié)點(diǎn)對(duì)部分結(jié)果集成的能力。一些查詢結(jié)果可能是部分結(jié)果,因此,需要結(jié)點(diǎn)具有對(duì)多個(gè)部分結(jié)果集成的能力,也即結(jié)點(diǎn)必須能合成所有部分結(jié)果并為用戶和其它結(jié)點(diǎn)提供一個(gè)全都相同的結(jié)果。
查詢結(jié)果可能直接或間接地傳送到查詢結(jié)點(diǎn)。直接的應(yīng)答結(jié)果是哪些響應(yīng)結(jié)點(diǎn)不經(jīng)由中間結(jié)點(diǎn)而直接發(fā)給查詢結(jié)點(diǎn)的查詢應(yīng)答結(jié)果;間接的應(yīng)答結(jié)果是哪些經(jīng)由查詢映射路徑而到達(dá)查詢結(jié)點(diǎn)的查詢應(yīng)答結(jié)果。
查詢結(jié)果的到達(dá)依賴于路由行為,也即查詢結(jié)果路由返回到提出查詢的結(jié)點(diǎn),因此,查詢結(jié)果的到達(dá)是路由組件的一部分。
2 模型適應(yīng)性確認(rèn)
為了表明模型的適應(yīng)性,KEx、P2PSLN、Piazza以及Chaty Web系統(tǒng)體系結(jié)構(gòu)被映射到此參考模型。表1說明,所描述的最新系統(tǒng)擁有模型的核心組件,然而,它們?cè)诮M件屬性與組件關(guān)系的實(shí)現(xiàn)上互不相同。
3 結(jié)語
本文構(gòu)建了語義網(wǎng)絡(luò)P2P參考模型的語義映射,解決了P2P定義域抽象與概念上表達(dá)的二義性與不兼容性。采取結(jié)點(diǎn)本體概念間的映射表達(dá),用以發(fā)現(xiàn)概念間的關(guān)系、概念屬性和性質(zhì),其結(jié)點(diǎn)使用同義詞辭典創(chuàng)建其字典,構(gòu)建映射表,實(shí)現(xiàn)映射,交換本體以翻譯本體間的概念;采用數(shù)值測(cè)量與邏輯測(cè)量的方式實(shí)現(xiàn)了映射正確性測(cè)量,查詢結(jié)點(diǎn)先執(zhí)行映射,然后提交給語義相關(guān)的結(jié)點(diǎn),用于結(jié)束查詢轉(zhuǎn)發(fā)的策略。最后,本文給出了P2PSLN系統(tǒng)所呈現(xiàn)的概念與關(guān)系,建立了一個(gè)通用技術(shù)框架,為各語義P2P系統(tǒng)間的比較提供了共同準(zhǔn)則。
參考文獻(xiàn)參考文獻(xiàn):
[1]GUO FANGFANG,HU YIBING,XIU LONGTING,et al.A hierarchical P2P model and a data fusion method for network security situation awareness system[J].Wuhan University Journal of Natural Sciences[J].2016,21(2):126-132.
[2]劉衍珩,李松江,王愛民.P2P流媒體中動(dòng)態(tài)分級(jí)傳輸模型及傳輸算法[J].吉林大學(xué)學(xué)報(bào):工學(xué)版,2016,46(1):259-264.
[3]吳鵬.P2P網(wǎng)絡(luò)中的語義異構(gòu)和語義映射[J].制造業(yè)自動(dòng)化,2012,34(7):101-103.
[4]T BERNERS-LEE,M FISCHETTI.Weaving the web:the original design and ultimate destiny of the world wide web by its inventor[M].New York:Collins publishing,2000.
[5]M PARASHAR,S MEMBER,J C BROWNS.Conceptual and implementation models for the grid[J].Proceedings of the IEEE Journal,2005,93(3):653-668.
[6]K LASKEY,F(xiàn) MCCABE,J ESTEFAN,et al.Reference model for service oriented architecture[EB/OL].http://docs.oasis-open.org/soa-rm/v1.0,2010.
(責(zé)任編輯:孫 娟)