国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型

2018-07-28 07:19:12盧恒亮
電腦知識(shí)與技術(shù) 2018年11期

盧恒亮

摘要:為了提升網(wǎng)絡(luò)社區(qū)挖掘的精度,需要組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型對(duì)同配和異配網(wǎng)絡(luò)中的社區(qū)結(jié)構(gòu)進(jìn)行挖掘。但是采用當(dāng)前模型進(jìn)行網(wǎng)絡(luò)社區(qū)挖掘時(shí),無(wú)法給出網(wǎng)絡(luò)社區(qū)劃分的指標(biāo),存在挖掘精度低的問(wèn)題。為此,提出一種基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型。該模型先定義網(wǎng)絡(luò)社區(qū)概念,對(duì)不同類(lèi)型網(wǎng)絡(luò)社區(qū)結(jié)構(gòu)進(jìn)行統(tǒng)一,引入二分團(tuán)的緊密度對(duì)初始社區(qū)進(jìn)行劃分,給出網(wǎng)絡(luò)社區(qū)劃分的指標(biāo),對(duì)孤立點(diǎn)進(jìn)行社區(qū)劃分,組建基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型,利用該模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘。實(shí)驗(yàn)仿真證明,所提模型可以在不知道網(wǎng)絡(luò)類(lèi)型的前提下準(zhǔn)確地挖掘出有內(nèi)涵的社區(qū)結(jié)構(gòu),并可以有效地提取社區(qū)類(lèi)型特征。

關(guān)鍵詞:隨機(jī)網(wǎng)絡(luò)集成;廣義網(wǎng)絡(luò)社區(qū);挖掘模型

中圖分類(lèi)號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)11-0014-03

1 概述

目前,在復(fù)雜網(wǎng)絡(luò)中社區(qū)結(jié)構(gòu)時(shí)候最為普遍的拓?fù)浣Y(jié)構(gòu),據(jù)不完全統(tǒng)計(jì),各種類(lèi)型的復(fù)雜網(wǎng)絡(luò)都具有較為突出的社區(qū)結(jié)構(gòu),有所區(qū)別的是相同網(wǎng)絡(luò)區(qū)域中的結(jié)點(diǎn)相互反應(yīng)較強(qiáng),反之相同網(wǎng)絡(luò)區(qū)域中的結(jié)點(diǎn)相互較弱[1]。為了幫助各個(gè)行業(yè)領(lǐng)域的人去理解一個(gè)復(fù)雜的網(wǎng)絡(luò)是如何構(gòu)造成的,需要組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū),以便更好地進(jìn)行網(wǎng)絡(luò)行為預(yù)測(cè)或檢測(cè)[2]。但是相對(duì)于大多數(shù)的廣義網(wǎng)絡(luò)社區(qū)挖掘模型廣義網(wǎng)絡(luò)社區(qū)挖掘,均無(wú)法給出網(wǎng)絡(luò)社區(qū)劃分的指標(biāo),致使其對(duì)廣義網(wǎng)絡(luò)社區(qū)挖掘的實(shí)施陷入了瓶頸。在這種情況下,廣義網(wǎng)絡(luò)社區(qū)挖掘問(wèn)題成為了制約互聯(lián)網(wǎng)數(shù)據(jù)挖掘領(lǐng)域發(fā)展的一個(gè)重要因素,引起了很多專(zhuān)家和學(xué)者的重視[3~4]。

2 廣義網(wǎng)絡(luò)社區(qū)挖掘建模原理

網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)中不同類(lèi)型的節(jié)點(diǎn)都有核心的作用,將有著核心作用的和地位的節(jié)點(diǎn)在網(wǎng)絡(luò)中有著非常顯著的影響,也對(duì)其周?chē)従庸?jié)點(diǎn)有著較大的波及強(qiáng)度,依據(jù)這些強(qiáng)度的不同,將網(wǎng)絡(luò)劃分為大小不一的社區(qū),從而挖掘出網(wǎng)絡(luò)社區(qū)抱團(tuán)性。具體的步驟如下詳述:

假設(shè),由[s′wer]代表生長(zhǎng)節(jié)點(diǎn)的類(lèi)型數(shù)量,[d′ery]代表節(jié)點(diǎn)的屬性集合,[e′dkoph]代表節(jié)點(diǎn)的屬性特征類(lèi)型,[s′ert]代表網(wǎng)絡(luò)區(qū)域的劃分范圍,則利用式(1)獲取網(wǎng)絡(luò)重要節(jié)點(diǎn)集合:

[o′jkol=s′ert×d′erye′dkoph±s′ert×d′ef?f′f]

在上式中,[d′ef]代表社區(qū)劃分的子網(wǎng)絡(luò)數(shù)量,[f′f]代表同類(lèi)社區(qū)的區(qū)域?qū)傩浴?/p>

假設(shè),由[ω′wer]代表數(shù)據(jù)場(chǎng)的勢(shì)函數(shù),[ν′aws]代表勢(shì)函數(shù)的重要因素,[υ′sed]代表節(jié)點(diǎn)的質(zhì)量和節(jié)點(diǎn)間的距離,則利用式(2)計(jì)算出數(shù)據(jù)場(chǎng)的勢(shì)函數(shù)[ω′wer]:

[ω′wer=υ′sed×ν′awsA′swed⊕c′swer]

在上式中,[A′swed]代表節(jié)點(diǎn)的特征數(shù)量,[c′swer]代表節(jié)點(diǎn)在網(wǎng)絡(luò)中的最短路徑。

假設(shè),由[ξ′swe]代表根節(jié)點(diǎn)集合,[ggy]代表根節(jié)點(diǎn)集合,[μ′awsd]代表遍歷所有節(jié)點(diǎn)的時(shí)間,利用式(3)挖掘出網(wǎng)絡(luò)社區(qū)抱團(tuán)性:

[m′sded=μ′awsd×ggyξ′swe?s′s]

在上式中,[s′s]代表根節(jié)點(diǎn)的勢(shì)值。

綜上所述可以說(shuō)明,廣義網(wǎng)絡(luò)社區(qū)挖掘建模原理,利用該原理組建了廣義網(wǎng)絡(luò)社區(qū)挖掘模型。

3 基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型

3.1 網(wǎng)絡(luò)社區(qū)劃分的指標(biāo)的設(shè)定

在組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型過(guò)程中,對(duì)廣義網(wǎng)絡(luò)社區(qū)進(jìn)行定義,給出網(wǎng)絡(luò)存在鏈接的概率,提出網(wǎng)絡(luò)中的鏈接獨(dú)立出現(xiàn)的約束條件,得到每個(gè)子網(wǎng)絡(luò)的自耦合情況,給出各個(gè)子網(wǎng)絡(luò)類(lèi)型的判斷閾值。具體的步驟如下詳述:

將隨機(jī)網(wǎng)絡(luò)集成模型定義為從網(wǎng)絡(luò)的角度出發(fā),利用機(jī)器學(xué)習(xí)的模式將其分割為給定數(shù)量的隨機(jī)子網(wǎng)絡(luò),并且隨機(jī)子網(wǎng)絡(luò)的集成可以擬合為被觀測(cè)網(wǎng)絡(luò)的鏈接結(jié)構(gòu)。假設(shè),由[N]代表一個(gè)網(wǎng)絡(luò),[VN]代表網(wǎng)絡(luò)中結(jié)點(diǎn)的集合,[A]代表矩陣,將[A]定義為[N]的銜接矩陣,利用式(4)計(jì)算出網(wǎng)絡(luò)出現(xiàn)鏈接[i,j]的概率:

[asghj=i,j⊕VNA×N⊕C⊕F′cdf]

在上式中,[C]代表網(wǎng)絡(luò)[N]的一個(gè)劃分,[F′cdf]代表網(wǎng)絡(luò)中的結(jié)點(diǎn)個(gè)數(shù)。

假設(shè),由[CK]代表網(wǎng)絡(luò)[N]的[K]個(gè)子網(wǎng)絡(luò),[h′sdef]代表[n]維向量,將[h′sdef]定義為結(jié)點(diǎn)[i]與其他結(jié)點(diǎn) (包括自身) 的拓?fù)滏溄咏Y(jié)構(gòu),[pt]代表拓?fù)浣Y(jié)構(gòu)[ti]在網(wǎng)絡(luò)[N] 中出現(xiàn)的概率,則利用式(5)計(jì)算出網(wǎng)絡(luò)中的鏈接獨(dú)立出現(xiàn)的約束條件:

[x′frjk=ti×CKF′cdf×ptN⊕h′sdef×ti]

由[μ′swde]鏈接獨(dú)立出現(xiàn)的假設(shè),代表網(wǎng)絡(luò)[N]出現(xiàn)的似然函數(shù),[Si]代表在劃分[C]中結(jié)點(diǎn)[i]所在的子圖序號(hào),[μ′sedf]代表在給定參數(shù)[θ]下網(wǎng)絡(luò) [N]出現(xiàn)的似然,利用式(6)提出網(wǎng)絡(luò)中的鏈接獨(dú)立出現(xiàn)的約束條件:

假設(shè),由[χ′swder]代表子網(wǎng)絡(luò)[CP]和[Cq]的耦合度,則利用式(7)得到每個(gè)子網(wǎng)絡(luò)的自耦合情況:

[A′swe=CP,Cqχ′swder⊕k′df]

在上式中,[k′df]代表子網(wǎng)絡(luò)耦合矩。

假設(shè),由[ν′sdef]代表同配社區(qū)的數(shù)量,[?′sdery]代表異配社區(qū)的數(shù)量,則利用式(8)給出各個(gè)子網(wǎng)絡(luò)類(lèi)型的判斷閾值:

[A″xcb=?′sdery×ν′sdefd′sdfg?sdf]

式中,[d′sdfg]代表子網(wǎng)絡(luò)間的耦合度判斷閾值的權(quán)重,[sdf]代表每個(gè)子網(wǎng)絡(luò)的自耦合度。

綜上所述可以說(shuō)明,在組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型過(guò)程中,對(duì)廣義網(wǎng)絡(luò)社區(qū)進(jìn)行定義,給出網(wǎng)絡(luò)存在鏈接的概率,提出網(wǎng)絡(luò)中的鏈接獨(dú)立出現(xiàn)的約束條件,得到每個(gè)子網(wǎng)絡(luò)的自耦合情況,給出各個(gè)子網(wǎng)絡(luò)類(lèi)型的判斷閾值,為組建廣義網(wǎng)絡(luò)社區(qū)挖掘優(yōu)化模型奠定了基礎(chǔ)。

3.2 廣義網(wǎng)絡(luò)社區(qū)挖掘模型的優(yōu)化組建

在組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型過(guò)程中,以3.1節(jié)獲取的子網(wǎng)絡(luò)類(lèi)型的判斷閾值[A″xcb],得到二部圖的關(guān)系矩陣,提取節(jié)點(diǎn)序列,依據(jù)節(jié)點(diǎn)序列得到廣義后綴樹(shù),從中得到初始完全二分團(tuán),依據(jù)二分團(tuán)構(gòu)建初始社區(qū),將孤立節(jié)點(diǎn)融入到社區(qū)中。具體的步驟如下詳述

假設(shè),由[v′df]節(jié)點(diǎn)集,[c′wefg]代表連接[Vm]的邊在總邊數(shù)中所占的比例,[G=Vx,VY,E]代表二部圖 ,其中,[Vx]和[VY]分別代表[G]的兩個(gè)節(jié)點(diǎn)集,[E]是節(jié)點(diǎn)的連邊,如果 [Vx]中有[n]個(gè)節(jié)點(diǎn),[VY]中有[m]個(gè)節(jié)點(diǎn),以3.1節(jié)獲取的子網(wǎng)絡(luò)類(lèi)型的判斷閾值[A″xcb],則利用式(9)得到二部圖的關(guān)系矩陣:

[d′dfd=m×v′dfc′wefg?G?Vx,VY,EA″xcb]

假設(shè),由[γ′sdvb]代表二部圖的節(jié)點(diǎn)序列,代表Murata的二分模塊度,則利用式(10)依據(jù)節(jié)點(diǎn)序列得到廣義后綴樹(shù):

[A′zxcnl=γ′sdvb??i,jμ′dcvgh?g′g]

在上式中,[μ′dcvgh]代表社區(qū)的對(duì)應(yīng)關(guān)系,[g′g]代表二分網(wǎng)絡(luò)劃分方案的優(yōu)劣程度。

假設(shè),由[σ′sdvgh]代表字符集,[κ″xcvb]代表一個(gè)非空子串,[S″swde]代表兩類(lèi)節(jié)點(diǎn)之間的鏈接關(guān)系,則利用式(11)構(gòu)建初始社區(qū):

[P′asedf=S″swde×κ″xcvbσ′sdvgh?f′sdf⊕e′sdcv]

在上式中,[f′sdf]代表二分團(tuán)中存在冗余的團(tuán),[e′sdcv]代表不同類(lèi)型的節(jié)點(diǎn)相互之間連接邊。

假設(shè),由[k′dcf]代表完全二分團(tuán)的密度,[ι′swcd]代表孤立點(diǎn)的緊密度,則利用式(12)將孤立節(jié)點(diǎn)融入到社區(qū)中:

[X′sedf=ι′swcd⊕k′dcfP′asedf?w′df]

在上式中,[w′df]代表后每個(gè)社區(qū)中節(jié)點(diǎn)的類(lèi)型數(shù)量。

假設(shè),由[?′wde]代表二分團(tuán)有大量重疊的節(jié)點(diǎn),[ι′d]代表節(jié)點(diǎn)序列的時(shí)間復(fù)雜度,則利用式(13)組建廣義網(wǎng)絡(luò)社區(qū)挖掘模型:

[Z′as=ι′d×?′wdeg′dfg]

在上式中,[g′dfg]代表每個(gè)社團(tuán)最小的節(jié)點(diǎn)。

4 實(shí)驗(yàn)仿真證明

為了更好地驗(yàn)證基于隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的性能,需要進(jìn)行一次實(shí)驗(yàn)。在Windows環(huán)境下搭建廣義網(wǎng)絡(luò)社區(qū)挖掘平臺(tái)。實(shí)驗(yàn)數(shù)據(jù)集來(lái)源于真實(shí)數(shù)據(jù)集SouthrenWomen上進(jìn)行驗(yàn)證,將實(shí)驗(yàn)環(huán)境設(shè)定為:8GB內(nèi)存,Intelcorei7CPU,Windows7操作系統(tǒng)。實(shí)驗(yàn)選擇了4個(gè)同配網(wǎng)絡(luò)、4個(gè)實(shí)際異配網(wǎng)絡(luò)和4個(gè)實(shí)際混合網(wǎng)絡(luò), 以及由計(jì)算機(jī)生成的隨機(jī)網(wǎng)絡(luò)對(duì)本文所提模型進(jìn)行了測(cè)試。

4.1 評(píng)價(jià)指標(biāo)的設(shè)定

在實(shí)驗(yàn)中,從主觀和客觀的角度上分別來(lái)評(píng)價(jià)在實(shí)驗(yàn)中基于隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的性能。將挖掘信噪比作為主觀評(píng)價(jià)指標(biāo)來(lái)定義基于隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的整體優(yōu)越性,為了彰顯實(shí)驗(yàn)的全面性和公正性,將傳統(tǒng)數(shù)據(jù)挖掘模型作為對(duì)比模型進(jìn)行共同的分析和對(duì)比,將挖掘誤報(bào)率和擬合優(yōu)度作為客觀評(píng)價(jià)指標(biāo)來(lái)驗(yàn)證不同模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的質(zhì)量。

假設(shè),由[γ′dfr]代表社區(qū)的 “邊界”,[d′ds]代表兩個(gè)社區(qū)間的距離,[η′sf]代表社區(qū)的自耦合度,則利用式(14)計(jì)算挖掘信噪比:

[Erm=η′sf⊕d′dsγ′dfr]

從式(14)中可以分析得出,[Erm]值越高,則挖掘的有效性就越好。

假設(shè),由[μ′kju]代表網(wǎng)絡(luò)鏈接的類(lèi)型,[?′zxc]代表社區(qū)內(nèi)的鏈接密度,[ξ′kij] 和[κ″sed]分別代表主角和配角間的同配,則利用式(15)和式(16)得到挖掘誤報(bào)率和擬合優(yōu)度:

[A″SDE=μ′kju×?′zxcξ′kij?κ″sed]

[a′sed=μ′kju×?′zxcξ′kij?κ″sed?A″SDE]

從式(15)和式(16)中可以分析得出,[a′sed]值越高,則挖掘的效果越好,[A″SDE]越小,則挖掘的質(zhì)量相對(duì)的好。

4.2 基于隨機(jī)網(wǎng)絡(luò)集成模型挖掘信噪比測(cè)試

利用隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘?qū)嶒?yàn),在不同的實(shí)驗(yàn)樣本下,測(cè)試隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的信噪比,測(cè)試結(jié)果見(jiàn)圖1。

從圖1的實(shí)驗(yàn)仿真結(jié)果中可以分析說(shuō)明,利用隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘具有較高的信噪比,這是因?yàn)樵诶秒S機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘時(shí),可以計(jì)算出不同類(lèi)型網(wǎng)絡(luò)間的同配社區(qū)會(huì)耦合度閾值,根據(jù)每個(gè)子網(wǎng)絡(luò)的自耦合情況分析子網(wǎng)絡(luò)的類(lèi)型,得到屬性相似的結(jié)點(diǎn)具有的連接概率,從而提升了挖掘的信噪比,保障了挖掘的精度。

4.3 不同模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的擬合優(yōu)度和誤報(bào)率對(duì)比

基于隨機(jī)網(wǎng)絡(luò)集成模型和傳統(tǒng)模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘?qū)嶒?yàn),對(duì)比不同模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的擬合優(yōu)度和誤報(bào)率對(duì)比。對(duì)比不同模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的擬合優(yōu)度和誤報(bào)率,對(duì)比結(jié)果見(jiàn)表1和表2。

從表1和表2的實(shí)驗(yàn)仿真結(jié)果中可以分析出,基于隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘的整體有效性要優(yōu)于傳統(tǒng)模型,這主要是因?yàn)?,在利用基于隨機(jī)網(wǎng)絡(luò)集成模型進(jìn)行廣義網(wǎng)絡(luò)社區(qū)挖掘時(shí),給出網(wǎng)絡(luò)社區(qū)劃分的指標(biāo),對(duì)孤立點(diǎn)進(jìn)行社區(qū)劃分,組建基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型,從而滿(mǎn)足了廣義網(wǎng)絡(luò)社區(qū)挖掘?qū)ζ渫诰蛸|(zhì)量的需求。

5 結(jié)束語(yǔ)

針對(duì)采用當(dāng)前模型進(jìn)行網(wǎng)絡(luò)社區(qū)挖掘時(shí),無(wú)法給出網(wǎng)絡(luò)社區(qū)劃分的指標(biāo),存在挖掘精度低的問(wèn)題。為此,提出一種基于隨機(jī)網(wǎng)絡(luò)集成模型的廣義網(wǎng)絡(luò)社區(qū)挖掘模型。實(shí)驗(yàn)仿真證明,所提模型可以在不知道網(wǎng)絡(luò)類(lèi)型的前提下準(zhǔn)確地挖掘出有內(nèi)涵的社區(qū)結(jié)構(gòu),并可以有效地提取社區(qū)類(lèi)型特征。

參考文獻(xiàn):

[1] 蔣勇,趙作鵬.一種自主免疫學(xué)習(xí)的分布式網(wǎng)絡(luò)攻擊對(duì)抗模型研究[J]. 計(jì)算機(jī)應(yīng)用研究, 2015, 32(4).

[2] 劉愛(ài)江,黃長(zhǎng)慧,胡光俊.基于改進(jìn)神經(jīng)網(wǎng)絡(luò)算法的木馬控制域名檢測(cè)方法[J]. 電信科學(xué), 2014, 30(7).

[3] 韓威,童晶,張培棟,等.網(wǎng)絡(luò)招募的男男性行為者HIV感染狀況及影響因素分析[J]. 中華實(shí)驗(yàn)和臨床病毒學(xué)雜志,2015,29(6).

[4] 徐毅.感染病毒后網(wǎng)絡(luò)自我保護(hù)控制中的最優(yōu)通信節(jié)點(diǎn)選擇[J]. 現(xiàn)代電子技術(shù), 2016, 39(18).

[5] 卓國(guó)鋒.一種基于危險(xiǎn)評(píng)估的光纖傳感網(wǎng)絡(luò)入侵檢測(cè)方法[J]. 激光雜志, 2017, 38(8).

[6] 任午令,趙翠文, 姜國(guó)新,等. 基于攻擊行為預(yù)測(cè)的網(wǎng)絡(luò)防御策略[J]. 浙江大學(xué)學(xué)報(bào)(工學(xué)版), 2014, 48(12).

邮箱| 富宁县| 盖州市| 岢岚县| 乌鲁木齐县| 方山县| 屯昌县| 临泉县| 镇宁| 龙海市| 泾源县| 苏尼特右旗| 彭州市| 阿鲁科尔沁旗| 夹江县| 沧州市| 邵阳县| 田东县| 永善县| 若羌县| 金秀| 呼图壁县| 天祝| 泸定县| 洞口县| 青阳县| 东至县| 鄂托克前旗| 平遥县| 苏州市| 大安市| 稻城县| 固安县| 长丰县| 娱乐| 盘锦市| 德江县| 昌吉市| 民勤县| 泊头市| 云南省|