李 紀(jì),許小可
(大連民族大學(xué) 信息與通信工程學(xué)院, 遼寧 大連 116600)
在現(xiàn)實(shí)世界的很多復(fù)雜網(wǎng)絡(luò)中,節(jié)點(diǎn)對之間存在著積極和消極2種關(guān)系,如朋友和敵人、合作和對抗、贊成和反對等[1-2]。若將這2種關(guān)系抽象為網(wǎng)絡(luò)連邊的符號屬性,讓正邊表示積極關(guān)系,負(fù)邊表示消極關(guān)系,這類具有正或負(fù)符號連邊的特殊網(wǎng)絡(luò)就被稱為符號網(wǎng)絡(luò)[3-4]。符號網(wǎng)絡(luò)的相關(guān)研究不僅可以為復(fù)雜社會系統(tǒng)的網(wǎng)絡(luò)演化、結(jié)構(gòu)分析和動力學(xué)等提供豐富的理論依據(jù),還可以為信息技術(shù)領(lǐng)域的個(gè)性化推薦、態(tài)度預(yù)測、用戶特征分析等提供實(shí)際的應(yīng)用價(jià)值[5]。
在對符號網(wǎng)絡(luò)的研究中,通常需要考慮負(fù)邊信息的重要作用,并結(jié)合相關(guān)統(tǒng)計(jì)量來描述網(wǎng)絡(luò)的結(jié)構(gòu)特征。例如,Kunegis等[6]提出使用節(jié)點(diǎn)的正負(fù)度之差來描述節(jié)點(diǎn)的相對重要性,使用聚類系數(shù)來描述網(wǎng)絡(luò)的凝聚性特征。由于不同的實(shí)證網(wǎng)絡(luò)在規(guī)模、類型和結(jié)構(gòu)等方面具有較大差異,很多時(shí)候僅僅使用統(tǒng)計(jì)量的絕對數(shù)值對網(wǎng)絡(luò)結(jié)構(gòu)特征進(jìn)行定性或定量分析并不準(zhǔn)確[7]??茖W(xué)嚴(yán)謹(jǐn)?shù)姆椒ㄊ且朐摼W(wǎng)絡(luò)隨機(jī)化后的零模型作為參照對象,基于統(tǒng)計(jì)性方法對比分析原始網(wǎng)絡(luò)和零模型網(wǎng)絡(luò)相同統(tǒng)計(jì)量的相對大小。例如,Maslov等[8]使用零模型作為參照對象研究蛋白質(zhì)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的穩(wěn)定性和特異性,這種研究方法對于符號網(wǎng)絡(luò)也具有很高的參考價(jià)值。
一個(gè)與實(shí)證網(wǎng)絡(luò)具有某些相同性質(zhì)的隨機(jī)化網(wǎng)絡(luò)通常被稱為該實(shí)證網(wǎng)絡(luò)的隨機(jī)化副本,這類隨機(jī)化網(wǎng)絡(luò)在統(tǒng)計(jì)學(xué)上又被稱為零模型[9-11]。對于符號網(wǎng)絡(luò)零模型,最常見的是完全隨機(jī)置亂零模型和符號隨機(jī)置亂零模型。完全隨機(jī)置亂零模型是將原網(wǎng)絡(luò)的連邊符號和連邊位置都進(jìn)行隨機(jī)化置亂,符號隨機(jī)置亂零模型只是隨機(jī)化置亂連邊符號,連邊位置保持不變。以上2種零模型均可在研究符號網(wǎng)絡(luò)結(jié)構(gòu)特征時(shí)作為原始網(wǎng)絡(luò)的參照,與相關(guān)統(tǒng)計(jì)量結(jié)合就可準(zhǔn)確分析出符號網(wǎng)絡(luò)的非平凡結(jié)構(gòu)特征[12]。
“嵌入性”這一詞匯源自經(jīng)濟(jì)學(xué),在Granovetter[13]研究經(jīng)濟(jì)行為與社會結(jié)構(gòu)之間關(guān)系的文章中,對網(wǎng)絡(luò)嵌入性的概念做了較為全面的闡述。自此以后,嵌入性不論是在經(jīng)濟(jì)學(xué)領(lǐng)域還是復(fù)雜網(wǎng)絡(luò)領(lǐng)域都得到廣泛的重視。在復(fù)雜網(wǎng)絡(luò)領(lǐng)域,針對符號社會網(wǎng)絡(luò)嵌入性的研究中,結(jié)構(gòu)平衡理論提供了最基本的理論依據(jù)[14],像“朋友的朋友是我的朋友”這樣的推論已經(jīng)成為了具有廣泛文化認(rèn)同的格言。Leskovec等[3]利用共同鄰居節(jié)點(diǎn)數(shù)量來衡量節(jié)點(diǎn)對之間的嵌入水平,并驗(yàn)證了嵌入水平高的節(jié)點(diǎn)對之間更有可能是正邊連接,該特性已被廣泛用于符號社會網(wǎng)絡(luò)的符號預(yù)測研究中。此外,Yuan等[15]和Wu等[16]都通過設(shè)置不同數(shù)值的嵌入水平,來檢測新提出的符號預(yù)測方法的性能。然而,針對大規(guī)模在線符號社會網(wǎng)絡(luò)的嵌入性特征分析結(jié)果并不全面,尤其是沒有結(jié)合零模型進(jìn)行系統(tǒng)性分析。例如,Leskovec等[3]對符號社會網(wǎng)絡(luò)的嵌入性進(jìn)行了初步分析,但其研究只分析了節(jié)點(diǎn)對之間的嵌入水平與正邊比例之間的關(guān)系,沒有探討負(fù)邊構(gòu)成對于嵌入水平和網(wǎng)絡(luò)結(jié)構(gòu)特征的影響。
為了更精確地分析正邊拓?fù)浣Y(jié)構(gòu)、負(fù)邊拓?fù)浣Y(jié)構(gòu)、連邊符號特征等對網(wǎng)絡(luò)嵌入性特征的影響,除使用經(jīng)典的符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型外,又新提出3種更精細(xì)化的零模型:正邊隨機(jī)置亂零模型、負(fù)邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型,共5種零模型作為原始網(wǎng)絡(luò)的參照對象。結(jié)合本文中提出的正嵌入水平檢測統(tǒng)計(jì)量和負(fù)嵌入水平檢測統(tǒng)計(jì)量,分別對5個(gè)實(shí)證網(wǎng)絡(luò)的嵌入性進(jìn)行分析。實(shí)證網(wǎng)絡(luò)分析結(jié)果表明,在符號社會網(wǎng)絡(luò)中存在:正嵌入水平越強(qiáng),節(jié)點(diǎn)對之間的正邊比例越高;負(fù)嵌入水平越強(qiáng),節(jié)點(diǎn)對之間的正邊比例越低的嵌入性特征。5種零模型分析結(jié)果顯示,前2種經(jīng)典零模型的嵌入性特征與原始網(wǎng)絡(luò)有較大差異,而新提出的3種零模型卻與原始網(wǎng)絡(luò)具有相似的嵌入性特征。表明分別隨機(jī)化正邊或負(fù)邊拓?fù)浣Y(jié)構(gòu),與獨(dú)立隨機(jī)化連邊符號對符號社會網(wǎng)絡(luò)的正負(fù)嵌入性特征的破壞是不同的。本文結(jié)論不僅有助于人們充分理解符號網(wǎng)絡(luò)嵌入性這類結(jié)構(gòu)特征,還可以在符號預(yù)測和鏈接預(yù)測等方面發(fā)揮重要作用。
本文中共使用了5個(gè)實(shí)證符號社會網(wǎng)絡(luò)數(shù)據(jù)集,分別是Bitcoin-Alpha、Bitcoin-OTC、Wiki-Rfa、Slashdot和Epinions符號網(wǎng)絡(luò)。其中Bitcoin-Alpha符號網(wǎng)絡(luò)和Bitcoin-OTC符號網(wǎng)絡(luò)都來自比特幣網(wǎng)上交易平臺,前者來自Alpha平臺[17],后者來自O(shè)TC平臺。在交易比特幣過程中,交易平臺為了防止普通用戶在不知情的情況下與劣質(zhì)用戶之間進(jìn)行交易,進(jìn)而可能導(dǎo)致普通用戶利益受損,Alpha和OTC交易平臺都允許用戶之間相互標(biāo)記為朋友和敵人關(guān)系,從而可以促成普通用戶多與優(yōu)質(zhì)用戶之間進(jìn)行交易,并幫助普通用戶在交易時(shí)盡量躲避劣質(zhì)用戶。
Wiki-Rfa符號網(wǎng)絡(luò)是一個(gè)維基百科管理員投票網(wǎng)絡(luò)[18]。維基百科在選取管理員時(shí),每一位參與編輯維基百科的用戶都可以提出申請,成為維基百科管理員的候選人。后由候選人之間相互投贊成票和反對票,最后通過得票的多少選出新的管理員。Slashdot來自新聞網(wǎng)站Slashdot.com[3],Epinions來自符號網(wǎng)絡(luò)產(chǎn)品評論者網(wǎng)站Epinions.com[19-20]。這2個(gè)網(wǎng)站的用戶都可以發(fā)表自己的新聞或產(chǎn)品,并允許用戶間對各自新聞或產(chǎn)品給出喜歡或討厭的評價(jià)。
表1展示的是上述5個(gè)實(shí)證符號網(wǎng)絡(luò)的基本統(tǒng)計(jì)數(shù)據(jù),包含節(jié)點(diǎn)總數(shù)、連邊總數(shù)、正邊比例和負(fù)邊比例??梢园l(fā)現(xiàn)不同網(wǎng)絡(luò)的規(guī)模有較大差異,具體表現(xiàn)為節(jié)點(diǎn)和連邊總數(shù)從Bitcoin-Alpha網(wǎng)絡(luò)的幾千規(guī)模到Epinions網(wǎng)絡(luò)的幾十萬規(guī)模不等。基于該表也可以發(fā)現(xiàn),所有實(shí)證符號社會網(wǎng)絡(luò)均表現(xiàn)出正邊比例遠(yuǎn)高于負(fù)邊比例的統(tǒng)計(jì)情況。
表1 實(shí)證符號社會網(wǎng)絡(luò)基本統(tǒng)計(jì)數(shù)據(jù)
復(fù)雜網(wǎng)絡(luò)零模型的構(gòu)造方法主要有隨機(jī)置亂法和網(wǎng)絡(luò)模型法2種[21]。雖然網(wǎng)絡(luò)模型法構(gòu)造的零模型有時(shí)可以很好地刻畫網(wǎng)絡(luò)的物理機(jī)制[22-23],但是在分析網(wǎng)絡(luò)內(nèi)部更深層次的結(jié)構(gòu)特征時(shí),網(wǎng)絡(luò)模型法很難簡潔地構(gòu)造出零模型作為參照,甚至很有可能無法構(gòu)造出合適的零模型。隨機(jī)置亂法與網(wǎng)絡(luò)模型法的區(qū)別是,隨機(jī)置亂法并不是“從無到有”構(gòu)造零模型,而是在原始網(wǎng)絡(luò)的基礎(chǔ)上,隨機(jī)化原始網(wǎng)絡(luò)的連邊位置或某些特定元素,簡潔地為原始網(wǎng)絡(luò)構(gòu)造出合適的零模型作為參照。為了分析符號網(wǎng)絡(luò)內(nèi)部更深層次的結(jié)構(gòu)特征即嵌入性特征,使用的5種符號網(wǎng)絡(luò)零模型都是基于隨機(jī)置亂法構(gòu)造的,分別是符號隨機(jī)置亂零模型、完全隨機(jī)置亂零模型、正邊隨機(jī)置亂零模型、負(fù)邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型。構(gòu)造方法如圖1所示。前2種是在一般符號網(wǎng)絡(luò)中常用的零模型,后3種是新引入的零模型。
在圖1中,(a)表示一個(gè)擁有6個(gè)節(jié)點(diǎn)和7條邊的小型原始網(wǎng)絡(luò),包含3條正邊(BC、DF、EF)和4條負(fù)邊(AB、AC、CD、DE);(b)表示原始網(wǎng)絡(luò)隨機(jī)置亂符號元素后形成的符號隨機(jī)置亂零模型。
符號隨機(jī)置亂零模型構(gòu)造方法:在保持原始網(wǎng)絡(luò)連邊位置不變的基礎(chǔ)上,隨機(jī)選取一條正邊和一條負(fù)邊交換符號。例如將BC和DE交換符號,則BC變?yōu)樨?fù)邊,DE變?yōu)檎叄涂梢缘玫綀D1(b)所示的符號隨機(jī)置亂零模型。需要注意,在構(gòu)造符號隨機(jī)置亂零模型時(shí),置亂符號僅限正邊和負(fù)邊之間,因?yàn)檎吪c正邊、負(fù)邊與負(fù)邊之間置亂符號并不會讓原始網(wǎng)絡(luò)產(chǎn)生任何改變。
圖1 符號網(wǎng)絡(luò)5種零模型的構(gòu)造方法
為更詳細(xì)展示符號隨機(jī)置亂零模型的構(gòu)造過程,并將符號隨機(jī)置亂零模型構(gòu)造方法運(yùn)用到其算法中,設(shè)計(jì)如下偽代碼。其中布爾型變量result為成功置亂符號標(biāo)記,整型變量nswap為成功置亂符號次數(shù),整型變量max_tries為最大嘗試置亂符號次數(shù)。
符號隨機(jī)置亂零模型構(gòu)造算法
輸入:原始網(wǎng)絡(luò)G,置亂次數(shù)N;
輸出:符號隨機(jī)置亂零模型。
方法:
result= False;
for (nswap= 0,max_tries= 0;nswap { 從G中隨機(jī)選擇2條邊em,n和ex,y; if (vm!=vn!=vx!=vy&&(em,n和ex,y的符號不同) ) 交換em,n和ex,y的符號; result= True; nswap++; endif max_tries++; if (max_tries> 5*N) result= False; break; end if } returnG 在圖1中,(c)—(f)都表示原始網(wǎng)絡(luò)隨機(jī)置亂連邊位置后形成的零模型。其中(c)是完全隨機(jī)置亂零模型、 (d)是正邊隨機(jī)置亂零模型、(e)是負(fù)邊隨機(jī)置亂零模型、(f)是正負(fù)邊分別隨機(jī)置亂零模型。它們的具體構(gòu)造方法分別如下。 完全隨機(jī)置亂零模型構(gòu)造方法:不考慮連邊的正負(fù)符號,只是隨機(jī)選取2條邊進(jìn)行斷邊重連,并讓重連的2條新邊和斷開的2條原邊之間的符號保持不變。例如將BC和DE斷開,再重新連接成原始網(wǎng)絡(luò)中不存在的邊BD和CE,并讓BC和CE的符號相同,BD和DE的符號相同,就可以得到如圖1(c)所示的完全隨機(jī)置亂零模型。需要注意,由于完全隨機(jī)置亂零模型并不保證每個(gè)節(jié)點(diǎn)的正度值和負(fù)度值在置亂前后保持不變,因此隨機(jī)化程度在所有置亂連邊位置構(gòu)造的零模型中是最高的。 正邊隨機(jī)置亂零模型構(gòu)造方法:保持原始網(wǎng)絡(luò)的負(fù)邊連接關(guān)系不變,只是隨機(jī)選取2條正邊進(jìn)行斷邊重連。例如將BC和EF斷開,再重新連接成原始網(wǎng)絡(luò)中不存在的正邊BD和CE,就可以得到如圖1(d)所示的正邊隨機(jī)置亂零模型。 負(fù)邊隨機(jī)置亂零模型構(gòu)造方法:保持原始網(wǎng)絡(luò)的正邊連接關(guān)系不變,只是隨機(jī)選取2條負(fù)邊進(jìn)行斷邊重連。例如將CD和DE斷開,再重新連接成原始網(wǎng)絡(luò)中不存在的負(fù)邊BD和CE,就可以得到如圖1(e)所示的負(fù)邊隨機(jī)置亂零模型。 正負(fù)邊分別隨機(jī)置亂零模型構(gòu)造方法:若先對原始網(wǎng)絡(luò)進(jìn)行正邊隨機(jī)置亂得到正邊隨機(jī)置亂零模型,再對正邊隨機(jī)置亂零模型進(jìn)行負(fù)邊隨機(jī)置亂,就可以得到如圖1(f)所示的正負(fù)邊分別隨機(jī)置亂零模型。 需要注意,正邊隨機(jī)置亂零模型僅置亂了原始網(wǎng)絡(luò)的正邊拓?fù)浣Y(jié)構(gòu),對負(fù)邊拓?fù)浣Y(jié)構(gòu)沒有影響,因此可以用來分析正邊拓?fù)浣Y(jié)構(gòu)對網(wǎng)絡(luò)結(jié)構(gòu)特征的影響。同理,負(fù)邊隨機(jī)置亂零模型僅置亂了原始網(wǎng)絡(luò)的負(fù)邊拓?fù)浣Y(jié)構(gòu),對正邊拓?fù)浣Y(jié)構(gòu)沒有影響,因此可以用來分析負(fù)邊拓?fù)浣Y(jié)構(gòu)對網(wǎng)絡(luò)結(jié)構(gòu)特征的影響。正負(fù)邊分別隨機(jī)置亂零模型在構(gòu)造過程中,正邊只和正邊置亂,負(fù)邊只和負(fù)邊置亂,并沒有進(jìn)行正負(fù)邊之間的相互置亂。因此隨機(jī)化程度弱于完全隨機(jī)置亂零模型,但要強(qiáng)于正邊隨機(jī)置亂零模型和負(fù)邊隨機(jī)置亂零模型。 此外,需要說明的是,在圖1所示的零模型構(gòu)造過程中,所有零模型都只進(jìn)行了一次隨機(jī)置亂。若要生成足夠隨機(jī)化的零模型,實(shí)際實(shí)驗(yàn)中都需要進(jìn)行足夠多次數(shù)的重復(fù)置亂。在本文中,為了保證所有的零模型都足夠隨機(jī)化,設(shè)置的重復(fù)置亂次數(shù)都是原始網(wǎng)絡(luò)總邊數(shù)的5倍以上。 共同鄰居是目前最常用的檢測網(wǎng)絡(luò)嵌入水平的統(tǒng)計(jì)量。在無符號網(wǎng)絡(luò)中,共同鄰居對于檢測網(wǎng)絡(luò)的嵌入水平有著很好的效果。但在符號網(wǎng)絡(luò)中,忽略正邊和負(fù)邊的區(qū)別,直接使用共同正邊鄰居作為嵌入水平的檢測統(tǒng)計(jì)量,會造成負(fù)邊信息的全部損失。為充分利用符號網(wǎng)絡(luò)中特有的正邊和負(fù)邊信息,提出將符號網(wǎng)絡(luò)嵌入水平分為正嵌入水平和負(fù)嵌入水平兩類。其中正嵌入水平被用來分析正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響,負(fù)嵌入水平被用來分析負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響。 為了檢測符號網(wǎng)絡(luò)的正嵌入水平和負(fù)嵌入水平,對共同鄰居統(tǒng)計(jì)量進(jìn)行改進(jìn),分別定義正嵌入水平檢測統(tǒng)計(jì)量和負(fù)嵌入水平檢測統(tǒng)計(jì)量。2個(gè)新統(tǒng)計(jì)量的公式為: (1) 在使用上述正嵌入水平檢測統(tǒng)計(jì)量,分析正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響時(shí),可以繪制以正嵌入水平值為自變量,以該正嵌入水平值下節(jié)點(diǎn)對之間的正邊比例為因變量的函數(shù)曲線。函數(shù)公式為: (2) 式中:p+(k)表示正嵌入水平值為k的節(jié)點(diǎn)對之間的正邊比例;nk表示正嵌入水平值為k的節(jié)點(diǎn)對總數(shù);mτ是一個(gè)常數(shù),當(dāng)?shù)讦訉?jié)點(diǎn)對之間是正邊時(shí),其值為1,否則為0。 同理,在使用負(fù)嵌入水平檢測統(tǒng)計(jì)量分析負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響時(shí),可以繪制以負(fù)嵌入水平值為自變量,以該負(fù)嵌入水平值下節(jié)點(diǎn)對之間的正邊比例為因變量的函數(shù)曲線。函數(shù)公式為: p-(k)=1-p+(k) (3) 式中:p-(k)表示負(fù)嵌入水平值為k的節(jié)點(diǎn)對之間的正邊比例。 使用5種符號網(wǎng)絡(luò)零模型:符號隨機(jī)置亂零模型、完全隨機(jī)置亂零模型、正邊隨機(jī)置亂零模型、負(fù)邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型,共同作為原始網(wǎng)絡(luò)的參照對象。結(jié)合上文中提出的正嵌入水平檢測統(tǒng)計(jì)量和負(fù)嵌入水平檢測統(tǒng)計(jì)量,分別研究正邊拓?fù)浣Y(jié)構(gòu)、負(fù)邊拓?fù)浣Y(jié)構(gòu)、連邊符號特征等對符號網(wǎng)絡(luò)嵌入性特征的影響。 以Epinions符號網(wǎng)絡(luò)分析結(jié)果為例,其原網(wǎng)絡(luò)和5種零模型的p+(k)函數(shù)曲線如圖2所示。從圖2可以看出,隨著正嵌入水平的變化,節(jié)點(diǎn)之間存在連邊的比例是最高的,而且隨著嵌入性的增強(qiáng)存在連邊的比例也在增高。由于符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型中隨機(jī)化了不同連邊的依賴性,節(jié)點(diǎn)之間存在連邊的比例曲線都近似與X軸平行,說明這2個(gè)零模型中的一對節(jié)點(diǎn)之間是否存在連邊和網(wǎng)絡(luò)的正嵌入特征是無關(guān)的。剩余3種零模型的函數(shù)曲線與原網(wǎng)絡(luò)有著相同的上升趨勢,其中又以負(fù)邊隨機(jī)置亂零模型的上升趨勢與原網(wǎng)絡(luò)最為接近,但仍略低于原網(wǎng)絡(luò)。正邊隨機(jī)置亂零模型的上升趨勢略低于負(fù)邊隨機(jī)置亂零模型,完全隨機(jī)置亂零模型的上升趨勢在這3個(gè)零模型中是最低的。同時(shí)也需要注意,上述總結(jié)的函數(shù)曲線變化趨勢在較低的正嵌入水平值下并不顯著,甚至出現(xiàn)了相關(guān)的規(guī)律。 圖2 Epinions正嵌水平與正邊比例關(guān)系 不同零模型的函數(shù)曲線之所以表現(xiàn)出不同的變化趨勢,是由于相對于原網(wǎng)絡(luò),5種零模型的隨機(jī)化程度不同。符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型在生成過程中,均完全打亂了原網(wǎng)絡(luò)的正邊相關(guān)性,因此看不出正邊拓?fù)浣Y(jié)構(gòu)對嵌入性的影響。剩余3種零模型,正邊隨機(jī)置亂零模型只是隨機(jī)化網(wǎng)絡(luò)的正邊拓?fù)浣Y(jié)構(gòu),其負(fù)邊拓?fù)浣Y(jié)構(gòu)保持不變。負(fù)邊隨機(jī)置亂零模型只是隨機(jī)化網(wǎng)絡(luò)的負(fù)邊拓?fù)浣Y(jié)構(gòu),其正邊拓?fù)浣Y(jié)構(gòu)保持不變。正負(fù)邊分別隨機(jī)置亂零模型只是分別隨機(jī)化網(wǎng)絡(luò)的正邊拓?fù)浣Y(jié)構(gòu)和負(fù)邊拓?fù)浣Y(jié)構(gòu),并沒有讓正邊拓?fù)浣Y(jié)構(gòu)和負(fù)邊拓?fù)浣Y(jié)構(gòu)之間進(jìn)行置亂。因此,剩余3種零模型的隨機(jī)化程度均低于符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型。在Epinions符號網(wǎng)絡(luò)中,負(fù)邊比例又明顯低于正邊比例,因此負(fù)邊隨機(jī)置亂零模型、正邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型的隨機(jī)化程度依次降低,它們的函數(shù)曲線上升趨勢也依次降低。 與分析正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響類似,同樣以Epinions符號網(wǎng)絡(luò)為例,展現(xiàn)負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響。其原網(wǎng)絡(luò)和5種零模型的p-(k)函數(shù)曲線如圖3所示。 從圖3可以看出,隨著負(fù)嵌入水平增強(qiáng),原始網(wǎng)絡(luò)的一對節(jié)點(diǎn)之間的正邊比例降低,說明較強(qiáng)的負(fù)嵌入水平損害了節(jié)點(diǎn)對之間的正邊連接。符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型的函數(shù)曲線都近似與X軸平行,再次說明這2個(gè)零模型中的一對節(jié)點(diǎn)之間是否存在連邊和網(wǎng)絡(luò)的正嵌入特征是無關(guān)的。剩余3種零模型的函數(shù)曲線與原網(wǎng)絡(luò)有著相同的下降趨勢。但與分析正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響不同的是,這3種零模型的下降趨勢均強(qiáng)于原網(wǎng)絡(luò),說明這幾種零模型對于網(wǎng)絡(luò)正嵌入性和負(fù)嵌入性的影響是不同的。 圖3 Epinions負(fù)嵌入水平與正邊比例關(guān)系圖 4.3.1量化分析指標(biāo) 從定性上看,由于Bitcoin-Alpha、Bitcoin-OTC、Wiki-Rfa、Slashdot符號網(wǎng)絡(luò)的結(jié)果和Epinions在圖2、圖3中的結(jié)果是類似的,因此就不再一一展示。為了量化檢驗(yàn)上述正邊拓?fù)浣Y(jié)構(gòu)和負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號社會網(wǎng)絡(luò)嵌入性的影響模式,使用原始網(wǎng)絡(luò)的p+(k)和p-(k)函數(shù)值與不同零模型之差作為量化檢驗(yàn)指標(biāo)。2種檢驗(yàn)指標(biāo)的公式為: (4) 式中:D+(nul)指標(biāo)被用來檢驗(yàn)正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響模式;D-(nul)指標(biāo)被用來檢驗(yàn)負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響模式;S+(net)表示原始網(wǎng)絡(luò)的p+(k)函數(shù)與X軸差值累加;S+(nul)表示某種零模型的p+(k)函數(shù)與X軸差值累加;S-(net)表示原始網(wǎng)絡(luò)的p-(k)函數(shù)與X軸差值累加;S-(nul)表示某種零模型的p-(k)函數(shù)與X軸差值累加。式(4)中S+和S-計(jì)算公式都可以表示為: (5) 4.3.2嵌入性特征的統(tǒng)計(jì)檢驗(yàn)分析 首先引入假設(shè)檢驗(yàn)方法,分別推斷原始網(wǎng)絡(luò)S+(net)與零模型S+(nul)之間是否有顯著性差異、原始網(wǎng)絡(luò)S-(net)與零模型S-(nul)之間是否有顯著性差異。以S+為例(S-檢驗(yàn)過程類似,因此不再敘述),可將原假設(shè)和備擇假設(shè)定為: H0:S+(net)=〈S+(nul)〉 H1:S+(net)≠〈S+(nul)〉 式中:〈S+(nul)〉為零模型S+(nul)的均值??梢詷?gòu)造差異檢驗(yàn)統(tǒng)計(jì)量Z為: (6) 式中:σ+(nul)為零模型S+(nul)的標(biāo)準(zhǔn)差。 假設(shè)檢驗(yàn)結(jié)果如表2所示,可以看出,所有P值均小于0.01,因此可以拒絕原假設(shè)H0,接受備擇假設(shè)H1。在統(tǒng)計(jì)學(xué)上說明原始網(wǎng)絡(luò)與5種零模型間的S+和S-均有顯著性的差異。為了進(jìn)一步定量分析原始網(wǎng)絡(luò)與5種零模型間的差異程度,下面還需要使用D+(nul)和D-(nul)指標(biāo)來衡量。 分別計(jì)算原網(wǎng)絡(luò)與5種零模型的D+(nul)和D-(nul)指標(biāo)值,最終結(jié)果如表3所示??梢姺栯S機(jī)置亂零模型和完全隨機(jī)置亂零模型的D+(nul)指標(biāo)明顯大于另外3種零模型。說明符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型的p+(k)函數(shù)曲線與原網(wǎng)絡(luò)的相差較大,另外3種零模型與原網(wǎng)絡(luò)的相差較小。而在另外3種零模型中,呈現(xiàn)負(fù)邊隨機(jī)置亂零模型、正邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型的D+(nul)指標(biāo)值依次升高,說明3種零模型的p+(k)函數(shù)曲線與原網(wǎng)絡(luò)的差異在依次增大。以上數(shù)據(jù)差異模式與Epinions符號網(wǎng)絡(luò)中正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響模式相符,從而可以說明,在本文使用的所有數(shù)據(jù)集中均存在與Epinions符號網(wǎng)絡(luò)相似的正邊嵌入性質(zhì)。 同時(shí),還可發(fā)現(xiàn)符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型的D-(nul)指標(biāo)呈現(xiàn)負(fù)值,而另外3種零模型呈現(xiàn)正值。說明符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型的S-(nul)要大于原網(wǎng)絡(luò)的S-(net),因此它們的p-(k)函數(shù)曲線總體位于原網(wǎng)絡(luò)之上。新提出的3種零模型的S-(nul)要小于原網(wǎng)絡(luò)的S-(net),它們的p-(k)函數(shù)曲線總體位于原網(wǎng)絡(luò)的下方。以上差異模式基本與Epinions符號網(wǎng)絡(luò)中負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響模式相符,說明使用的所有符號網(wǎng)絡(luò)數(shù)據(jù)集中,均存在與Epinions符號網(wǎng)絡(luò)相似的負(fù)邊嵌入性質(zhì),也說明不同的零模型隨機(jī)化的拓?fù)浣Y(jié)構(gòu)性質(zhì)對于網(wǎng)絡(luò)嵌入性的影響是不同的。 表2 實(shí)證符號網(wǎng)絡(luò)數(shù)據(jù)集假設(shè)檢驗(yàn)結(jié)果 表3 實(shí)證符號網(wǎng)絡(luò)數(shù)據(jù)集量化分析結(jié)果 通過正嵌入水平下的節(jié)點(diǎn)對之間正邊比例函數(shù),定性分析正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響,發(fā)現(xiàn)正嵌入水平越高的節(jié)點(diǎn)對之間正邊比例越高;通過負(fù)嵌入水平下的節(jié)點(diǎn)對之間正邊比例函數(shù),定性分析負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響,發(fā)現(xiàn)負(fù)嵌入水平越高的節(jié)點(diǎn)對之間正邊比例越低。 符號隨機(jī)置亂零模型和完全隨機(jī)置亂零模型的嵌入性特征與原始網(wǎng)絡(luò)有較大差異,新提出的正邊隨機(jī)置亂零模型、負(fù)邊隨機(jī)置亂零模型和正負(fù)邊分別隨機(jī)置亂零模型卻與原始網(wǎng)絡(luò)具有相似的嵌入性特征。說明分別隨機(jī)化正邊或負(fù)邊拓?fù)浣Y(jié)構(gòu),與獨(dú)立隨機(jī)化連邊符號對符號社會網(wǎng)絡(luò)的正負(fù)嵌入性特征的破壞是不同的。 使用零模型作為參照對象分析符號網(wǎng)絡(luò)嵌入性的方法還可以推廣到加權(quán)網(wǎng)絡(luò)、雙層網(wǎng)絡(luò)等其他類型網(wǎng)絡(luò)中,從而豐富網(wǎng)絡(luò)結(jié)構(gòu)性質(zhì)的研究方法庫。目前僅給出嵌入性檢測統(tǒng)計(jì)量來分析符號網(wǎng)絡(luò)的結(jié)構(gòu)特性,分析角度有限,不足以全面刻畫符號網(wǎng)絡(luò)的結(jié)構(gòu)性質(zhì),未來還可以引入更多的統(tǒng)計(jì)量,更全面地分析符號網(wǎng)絡(luò)的結(jié)構(gòu)性質(zhì)。3 符號網(wǎng)絡(luò)嵌入水平統(tǒng)計(jì)量
4 參照零模型的符號網(wǎng)絡(luò)嵌入性分析
4.1 正邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響
4.2 負(fù)邊拓?fù)浣Y(jié)構(gòu)對符號網(wǎng)絡(luò)嵌入性的影響
4.3 參照零模型的嵌入性特征量化分析
5 結(jié)論