徐漢青 滕廣青 欒宇 孫健
摘? ?要:知識(shí)網(wǎng)絡(luò)憑借其呈現(xiàn)與揭示知識(shí)關(guān)聯(lián)關(guān)系的優(yōu)勢(shì)已經(jīng)廣泛應(yīng)用于圖書(shū)情報(bào)學(xué)的眾多領(lǐng)域,知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化過(guò)程中的模式與規(guī)律更成為圖書(shū)情報(bào)學(xué)界關(guān)注的重點(diǎn)。文章借助復(fù)雜網(wǎng)絡(luò)理論與方法,構(gòu)建了時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)。從網(wǎng)絡(luò)宏觀結(jié)構(gòu)特征、底層拓?fù)浣Y(jié)構(gòu)和Hub節(jié)點(diǎn)涌現(xiàn)三個(gè)方面,對(duì)知識(shí)網(wǎng)絡(luò)演化過(guò)程中的結(jié)構(gòu)穩(wěn)定性與知識(shí)涌現(xiàn)問(wèn)題進(jìn)行動(dòng)態(tài)分析。研究結(jié)果顯示,知識(shí)網(wǎng)絡(luò)演化進(jìn)入相對(duì)成熟階段后才表現(xiàn)出穩(wěn)定的無(wú)標(biāo)度網(wǎng)絡(luò)特征;底層區(qū)塊與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模在成熟階段擬合效果更好且區(qū)塊子圖濃度穩(wěn)定;Hub節(jié)點(diǎn)成員在網(wǎng)絡(luò)成熟階段更加穩(wěn)定并涌現(xiàn)為領(lǐng)域核心知識(shí)。
關(guān)鍵詞:知識(shí)網(wǎng)絡(luò);動(dòng)態(tài)演化;結(jié)構(gòu)穩(wěn)定性;知識(shí)涌現(xiàn)
中圖分類(lèi)號(hào):G254? ?文獻(xiàn)標(biāo)識(shí)碼:A? ?DOI:10.11968/tsyqb.1003-6938.2019008
Abstract Knowledge network has been widely used in many fields of library and information science because of its advantages of presenting and revealing knowledge correlations. The patterns and laws in the process of dynamic evolution of knowledge networks have become the focus of library and information science academic community. With the theory and method of complex networks, this article constructed time-series domain knowledge networks. From the network macro-structure characteristics, underlying topology and hub nodes, the dynamic analysis of the structural stability and knowledge emergence in the process of knowledge network evolution is carried out. The results show that the knowledge networks exhibit a stable scale-free network feature, when the networks evolve into maturity; Underlying blocks and network node scale have better fitting effect at the maturity stage and the block subgraph concentration is stable; Hub node members are more stable and emerge as domain core knowledge during the mature stage of the network.
Key words knowledge network; dynamic evolution; structural stability; knowledge emergence
1? ?引言
近二十年來(lái),隨著網(wǎng)絡(luò)科學(xué)理論與方法的迅猛發(fā)展,特別是小世界網(wǎng)絡(luò)和無(wú)標(biāo)度網(wǎng)絡(luò)模型的相繼提出,網(wǎng)絡(luò)分析的思想已經(jīng)融入到眾多的科學(xué)研究工作中。隨著理論研究的深入和方法應(yīng)用的創(chuàng)新,從自然科學(xué)到社會(huì)科學(xué)產(chǎn)生了豐富的基于網(wǎng)絡(luò)思維的研究成果。圖書(shū)情報(bào)學(xué)領(lǐng)域中知識(shí)網(wǎng)絡(luò)的相關(guān)研究方興未艾,在知識(shí)熱點(diǎn)、知識(shí)關(guān)聯(lián)、學(xué)術(shù)合作等分析與研判中取得了可喜的成績(jī)。隨著靜態(tài)網(wǎng)絡(luò)分析理論與方法的日漸成熟,學(xué)術(shù)界對(duì)于動(dòng)態(tài)網(wǎng)絡(luò)分析的相關(guān)研究逐漸興起。同時(shí),對(duì)于知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化的研究,也從早期關(guān)注知識(shí)網(wǎng)絡(luò)宏觀結(jié)構(gòu)特征,向網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)深入,并嘗試將網(wǎng)絡(luò)結(jié)構(gòu)特征與知識(shí)節(jié)點(diǎn)內(nèi)容屬性結(jié)合考察。
本文以復(fù)雜網(wǎng)絡(luò)分析方法為主導(dǎo),結(jié)合時(shí)間序列分析,兼顧網(wǎng)絡(luò)宏觀結(jié)構(gòu)特征與底層拓?fù)浣Y(jié)構(gòu),并結(jié)合Hub知識(shí)節(jié)點(diǎn)涌現(xiàn),對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)進(jìn)行動(dòng)態(tài)跟蹤與分析。通過(guò)對(duì)無(wú)標(biāo)度網(wǎng)絡(luò)的冪指數(shù)研判、底層區(qū)塊與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模的擬合效果、區(qū)塊子圖濃度的時(shí)序變化、Hub節(jié)點(diǎn)的波動(dòng)系數(shù)等對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)演化過(guò)程中的穩(wěn)定性與知識(shí)涌現(xiàn)展開(kāi)研究。
2? ?相關(guān)研究綜述
圖書(shū)情報(bào)學(xué)界采用網(wǎng)絡(luò)思維對(duì)知識(shí)及知識(shí)關(guān)聯(lián)進(jìn)行研究并不是近年來(lái)的創(chuàng)舉。早在二十世紀(jì)五六十年代, SCI的創(chuàng)始人E. Garfield[1]以及普賴斯定律的發(fā)現(xiàn)者D. J. S. Price[2]就分別在《Science》上著文,并利用引證網(wǎng)絡(luò)探索知識(shí)之間的傳承與發(fā)展脈絡(luò)。盡管當(dāng)時(shí)社會(huì)網(wǎng)絡(luò)分析(Social Network Analysis)[3]的發(fā)展已經(jīng)比較成熟,但是社會(huì)網(wǎng)絡(luò)專注于“社會(huì)實(shí)體”的理念和分析數(shù)據(jù)規(guī)模的限制,使其沒(méi)能與知識(shí)網(wǎng)絡(luò)結(jié)合發(fā)揮出最大價(jià)值。直到二十世紀(jì)末D. J. Watts與S. H. Strogatz[4]、A-L. Barabasi與R. Albert[5],分別在《Nature》和《Science》雜志上發(fā)表了揭示小世界網(wǎng)絡(luò)和無(wú)標(biāo)度網(wǎng)絡(luò)的兩篇網(wǎng)絡(luò)科學(xué)的經(jīng)典之作,以社會(huì)網(wǎng)絡(luò)分析和復(fù)雜網(wǎng)絡(luò)(Complex Network Analysis)分析[6]為基礎(chǔ)的網(wǎng)絡(luò)思維和分析方法才開(kāi)始大范圍融入到包括圖書(shū)情報(bào)學(xué)在內(nèi)的諸多科研領(lǐng)域。
在圖書(shū)情報(bào)學(xué)領(lǐng)域知識(shí)網(wǎng)絡(luò)的研究中,D. Zhu等[7]以Scopus數(shù)據(jù)庫(kù)為文獻(xiàn)來(lái)源,抽取關(guān)鍵詞構(gòu)建領(lǐng)域知識(shí)網(wǎng)絡(luò),以網(wǎng)絡(luò)科學(xué)的思想為指導(dǎo),通過(guò)與同等規(guī)模的隨機(jī)網(wǎng)絡(luò)相比較,發(fā)現(xiàn)領(lǐng)域知識(shí)網(wǎng)絡(luò)具有較低平均路徑長(zhǎng)度以及較高聚類(lèi)系數(shù)的小世界特征;R. J. Hong與C. Jinho[8]基于4251篇商業(yè)領(lǐng)域文獻(xiàn),采用層級(jí)結(jié)構(gòu)分析、中心性分析、節(jié)點(diǎn)聚類(lèi)分析等方法,對(duì)網(wǎng)絡(luò)當(dāng)中關(guān)鍵詞之間的結(jié)構(gòu)關(guān)系進(jìn)行探索;耿志杰等[9]基于CSSCI數(shù)據(jù)庫(kù)中情報(bào)學(xué)領(lǐng)域的期刊文獻(xiàn)數(shù)據(jù)構(gòu)建知識(shí)網(wǎng)絡(luò),采用復(fù)雜網(wǎng)絡(luò)分析方法發(fā)現(xiàn)關(guān)鍵詞知識(shí)網(wǎng)絡(luò)是典型的無(wú)標(biāo)度網(wǎng)絡(luò),并且具有小世界特性;馬費(fèi)成等[10]則基于CiteULike網(wǎng)站的社會(huì)化標(biāo)注系統(tǒng),發(fā)現(xiàn)了標(biāo)簽知識(shí)網(wǎng)絡(luò)的小世界和無(wú)標(biāo)度特征。
隨著研究工作的深入,學(xué)者們逐漸意識(shí)到靜態(tài)研究方法的不足之處,并開(kāi)始嘗試探索知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化過(guò)程中的結(jié)構(gòu)變化及其演化模式。如M.Sedighi[11]基于時(shí)間序列探索關(guān)鍵詞網(wǎng)絡(luò)的演化變遷,發(fā)現(xiàn)知識(shí)網(wǎng)絡(luò)中心性較高的部分關(guān)鍵詞會(huì)逐漸消失,新的關(guān)鍵詞會(huì)取代消失的關(guān)鍵詞成長(zhǎng)為中心性較高的知識(shí)節(jié)點(diǎn),并且中心性較高的知識(shí)節(jié)點(diǎn)之間的關(guān)聯(lián)關(guān)系也在改變;S.Radhakrishnan等[12]通過(guò)關(guān)鍵詞節(jié)點(diǎn)度值、節(jié)點(diǎn)共現(xiàn)頻次、平均加權(quán)最近鄰居度值、加權(quán)聚類(lèi)系數(shù)等動(dòng)態(tài)分析,發(fā)現(xiàn)關(guān)鍵詞共現(xiàn)頻次分布從正態(tài)分布逐漸變化為冪律分布,度值不同的節(jié)點(diǎn)表現(xiàn)出較高的同配性,度值較小的節(jié)點(diǎn)之間容易形成小程度的聚類(lèi)。而Q.R.Zhang等[13]的研究則表明,同時(shí)具有小世界效應(yīng)和無(wú)標(biāo)度特征的知識(shí)網(wǎng)絡(luò),隨著時(shí)間的推移小世界效應(yīng)會(huì)逐漸減弱,節(jié)點(diǎn)出現(xiàn)頻次與其度值呈線性正相關(guān)。國(guó)內(nèi)圖書(shū)情報(bào)學(xué)界在知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化方面的研究起步較晚,但也有部分學(xué)者做出了探索。如馬費(fèi)成與劉向[14]對(duì)知識(shí)網(wǎng)絡(luò)的演化行為進(jìn)行建模仿真實(shí)驗(yàn),發(fā)現(xiàn)優(yōu)先鏈接機(jī)制的作用是全局性的,時(shí)間優(yōu)先機(jī)制則是作用于局部;滕廣青等[15-16]的研究表明知識(shí)網(wǎng)絡(luò)的小世界效應(yīng)是在演化過(guò)程中逐漸形成的,并且知識(shí)關(guān)聯(lián)涌現(xiàn)遵循針對(duì)關(guān)聯(lián)頻度的擇優(yōu)強(qiáng)化機(jī)制;張斌等[17]的研究進(jìn)一步表明,無(wú)標(biāo)度網(wǎng)絡(luò)背后的BA模型在知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化分析中占有重要地位,而且網(wǎng)絡(luò)結(jié)構(gòu)和節(jié)點(diǎn)外部屬性應(yīng)該被綜合考慮;徐漢青等[18]通過(guò)對(duì)知識(shí)網(wǎng)絡(luò)模體濃度的分析,發(fā)現(xiàn)領(lǐng)域知識(shí)網(wǎng)絡(luò)在網(wǎng)絡(luò)模體層面上具有一定的結(jié)構(gòu)穩(wěn)定性,知識(shí)網(wǎng)絡(luò)發(fā)展過(guò)程中具有相對(duì)穩(wěn)定的小世界效應(yīng)。
綜上所述,學(xué)術(shù)界已經(jīng)接受領(lǐng)域知識(shí)網(wǎng)絡(luò)不斷生長(zhǎng)演化的這一基本事實(shí),研究方法也從早期的靜態(tài)結(jié)構(gòu)分析轉(zhuǎn)變至動(dòng)態(tài)演化分析。但是大多數(shù)研究還停留在知識(shí)網(wǎng)絡(luò)的宏觀結(jié)構(gòu)層面,針對(duì)網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)的動(dòng)態(tài)分析工作則相對(duì)稀缺。
3? ?理論框架
在圖書(shū)情報(bào)學(xué)領(lǐng)域中,早期對(duì)于知識(shí)網(wǎng)絡(luò)的研究通常采用常規(guī)共詞網(wǎng)絡(luò)分析方法[19]。網(wǎng)絡(luò)當(dāng)中一開(kāi)始就固定選取N個(gè)節(jié)點(diǎn),并且節(jié)點(diǎn)的數(shù)量不會(huì)發(fā)生改變。而真實(shí)的領(lǐng)域知識(shí)網(wǎng)絡(luò)是處于開(kāi)放式生長(zhǎng)狀態(tài)的,因此固定節(jié)點(diǎn)數(shù)量的共詞網(wǎng)絡(luò)分析方法無(wú)法對(duì)動(dòng)態(tài)生長(zhǎng)中的領(lǐng)域知識(shí)網(wǎng)絡(luò)的結(jié)構(gòu)演化以及規(guī)律變遷進(jìn)行研究或說(shuō)明。A-L. Barabasi與R. Albert[5]在《Science》雜志上發(fā)表的研究成果首次提出了真實(shí)網(wǎng)絡(luò)的無(wú)標(biāo)度(Scale Free)特征和網(wǎng)絡(luò)涌現(xiàn)中的優(yōu)先連接(Preferential Attachment)機(jī)制。根據(jù)他們的觀點(diǎn),網(wǎng)絡(luò)結(jié)構(gòu)的無(wú)標(biāo)度特性是在網(wǎng)絡(luò)不斷生長(zhǎng)演化的過(guò)程中涌現(xiàn)出的特征。這意味著網(wǎng)絡(luò)總體的拓?fù)浣Y(jié)構(gòu)特征并非是一成不變的,而是在演化增長(zhǎng)的過(guò)程當(dāng)中,由若干細(xì)微變化的反復(fù)疊加完成了由量變到質(zhì)變的過(guò)程。在網(wǎng)絡(luò)增長(zhǎng)性與優(yōu)先連接機(jī)制作用下,網(wǎng)絡(luò)宏觀形態(tài)的度序列分布會(huì)向著特定結(jié)構(gòu)演化,進(jìn)而遵循冪律分布:P(k)∝k-γ。在A-L.Barabasi等人的仿真實(shí)驗(yàn)中,優(yōu)先連接機(jī)制作用于網(wǎng)絡(luò)演化的全過(guò)程,且測(cè)得的不同真實(shí)網(wǎng)絡(luò)的冪指數(shù)γ的值域穩(wěn)定(±0.1)?;谶@一思想,本研究將考察的重點(diǎn)聚焦于真實(shí)知識(shí)網(wǎng)絡(luò)不同發(fā)展階段的結(jié)構(gòu)特征,重點(diǎn)關(guān)注知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化過(guò)程中的結(jié)構(gòu)穩(wěn)定性。
無(wú)標(biāo)度反映的是網(wǎng)絡(luò)宏觀層面上的結(jié)構(gòu)特征,但是僅有宏觀上的無(wú)標(biāo)度特征尚無(wú)法完整地描述和解析真實(shí)領(lǐng)域知識(shí)網(wǎng)絡(luò)演化過(guò)程中結(jié)構(gòu)的生成與變遷。針對(duì)此類(lèi)問(wèn)題,就需要從網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)進(jìn)行更深層次的探究。任何大型網(wǎng)絡(luò)都在底層拓?fù)浣Y(jié)構(gòu)層面具有網(wǎng)絡(luò)的基本構(gòu)造區(qū)塊,正是這些底層區(qū)塊子圖構(gòu)成了高度復(fù)雜的網(wǎng)絡(luò)總體。R. Milo等[19]的研究成果表明,自然界中的復(fù)雜網(wǎng)絡(luò)同時(shí)有著多類(lèi)同形異構(gòu)的基本構(gòu)造區(qū)塊存在,并將高于隨機(jī)化網(wǎng)絡(luò)的基本構(gòu)造區(qū)塊稱為網(wǎng)絡(luò)模體(Network Motif)??紤]到4節(jié)點(diǎn)區(qū)塊子圖在結(jié)構(gòu)上可以視為3節(jié)點(diǎn)區(qū)塊子圖的疊加,在知識(shí)網(wǎng)絡(luò)中具有更好的底層結(jié)構(gòu)代表性,因此本研究重點(diǎn)考察節(jié)點(diǎn)數(shù)量N=4(邊數(shù)量E分別為3、4、5、6)的連通區(qū)塊子圖(見(jiàn)圖1)。
在知識(shí)網(wǎng)絡(luò)的演化生長(zhǎng)過(guò)程中,宏觀的拓?fù)浣Y(jié)構(gòu)可以視為底層區(qū)塊子圖之間的復(fù)制與重組,反復(fù)交叉融合[20]的迭代形成更大規(guī)模的子圖,因此底層拓?fù)浣Y(jié)構(gòu)的區(qū)塊子圖被學(xué)術(shù)界作為大型網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的基本構(gòu)造區(qū)塊。本研究將對(duì)基本區(qū)塊數(shù)量與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模的相關(guān)性和演化過(guò)程中的區(qū)塊子圖濃度進(jìn)行計(jì)算分析,力求全面地的考察領(lǐng)域知識(shí)網(wǎng)絡(luò)演化過(guò)程中拓?fù)浣Y(jié)構(gòu)的穩(wěn)定性。
本研究在關(guān)注知識(shí)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的穩(wěn)定性的同時(shí),還關(guān)注知識(shí)網(wǎng)絡(luò)內(nèi)容層面的核心知識(shí)涌現(xiàn)問(wèn)題。無(wú)標(biāo)度網(wǎng)絡(luò)的異質(zhì)性決定了只有少量的節(jié)點(diǎn)擁有大量的連接,這些節(jié)點(diǎn)被稱為Hub節(jié)點(diǎn),并且在網(wǎng)絡(luò)演化中起主導(dǎo)作用。在知識(shí)網(wǎng)絡(luò)中,Hub節(jié)點(diǎn)意味著與領(lǐng)域內(nèi)更多的節(jié)點(diǎn)具有知識(shí)關(guān)聯(lián)關(guān)系和更廣泛的外延,是該領(lǐng)域的核心知識(shí)。一個(gè)主題領(lǐng)域的核心知識(shí)或者核心知識(shí)團(tuán)體如果頻繁變動(dòng),則意味著該領(lǐng)域并沒(méi)有涌現(xiàn)出穩(wěn)定的核心知識(shí)(團(tuán)體)。因此,對(duì)于知識(shí)網(wǎng)絡(luò)而言,網(wǎng)絡(luò)生長(zhǎng)演化過(guò)程中新知識(shí)節(jié)點(diǎn)、新知識(shí)關(guān)聯(lián)不斷加入后,網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)特征和網(wǎng)絡(luò)Hub節(jié)點(diǎn)如何變化就成為圖書(shū)情報(bào)學(xué)關(guān)注的問(wèn)題。對(duì)此,研究中主要采用Hub節(jié)點(diǎn)波動(dòng)系數(shù)加以考察。
4? ?數(shù)據(jù)處理與分析流程
4.1? ? 研究數(shù)據(jù)與網(wǎng)絡(luò)構(gòu)建
本文以Bibsonomy.org網(wǎng)站為基礎(chǔ)數(shù)據(jù)源,該網(wǎng)站提供社會(huì)化標(biāo)注系統(tǒng)組織與架構(gòu)知識(shí)資源,允許用戶組織、標(biāo)注、分享學(xué)術(shù)文獻(xiàn)資源。首先以“semanticweb”為檢索主題詞,采用自主研發(fā)的爬蟲(chóng)工具,抓取相關(guān)領(lǐng)域的文獻(xiàn)資源及其對(duì)應(yīng)標(biāo)簽作為原始數(shù)據(jù)集。以自然年份為時(shí)間刻度,累計(jì)獲得文獻(xiàn)資源數(shù)量2702篇,相關(guān)標(biāo)簽1994個(gè)、標(biāo)簽同現(xiàn)關(guān)系21791對(duì)(具體抓取的相關(guān)數(shù)據(jù)見(jiàn)表1)。
“semanticweb”主題領(lǐng)域下的相關(guān)原始數(shù)據(jù)從2004-2017年共劃分為14個(gè)時(shí)間窗口??紤]到本研究關(guān)注的重點(diǎn)在于領(lǐng)域知識(shí)網(wǎng)絡(luò)演化生長(zhǎng)過(guò)程中網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)和不同時(shí)期Hub知識(shí)節(jié)點(diǎn)涌現(xiàn)變化的模式與規(guī)律,因此各個(gè)時(shí)間窗口采取累計(jì)值的統(tǒng)計(jì)方式。累計(jì)值相比當(dāng)期發(fā)生值能夠更加凸顯領(lǐng)域知識(shí)生長(zhǎng)中脈絡(luò)傳承的邏輯關(guān)系。統(tǒng)計(jì)數(shù)據(jù)也顯示,隨著時(shí)間序列的演進(jìn),無(wú)論是文獻(xiàn)數(shù)量、標(biāo)簽數(shù)量還是標(biāo)簽同現(xiàn)關(guān)系數(shù)量都在不斷增長(zhǎng),其中標(biāo)簽同現(xiàn)關(guān)系的增量遠(yuǎn)遠(yuǎn)大于文獻(xiàn)和標(biāo)簽的增量。
基于“semanticweb”主題領(lǐng)域中的原始數(shù)據(jù),首先構(gòu)建“文獻(xiàn)-標(biāo)簽”隸屬關(guān)系矩陣,矩陣中的“行”指代文獻(xiàn),“列”指代表征知識(shí)概念的標(biāo)簽。如果某一文獻(xiàn)A被用戶賦以標(biāo)簽a標(biāo)注,則其行列交叉處記為“1”。在此基礎(chǔ)上進(jìn)一步將隸屬關(guān)系矩陣轉(zhuǎn)化為“標(biāo)簽-標(biāo)簽”鄰接矩陣。如果標(biāo)簽a與標(biāo)簽b被用戶標(biāo)注于同一篇文獻(xiàn),則鄰接矩陣中標(biāo)簽a與標(biāo)簽b的交叉處記為“1”。此時(shí)獲得的鄰接矩陣可在網(wǎng)絡(luò)視圖下表達(dá)為基于標(biāo)簽同現(xiàn)關(guān)系的領(lǐng)域知識(shí)網(wǎng)絡(luò)。需要說(shuō)明的是,本研究中以標(biāo)簽表征知識(shí)概念節(jié)點(diǎn),標(biāo)簽同現(xiàn)關(guān)系表征知識(shí)關(guān)聯(lián)。由于本研究關(guān)注知識(shí)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)與Hub節(jié)點(diǎn),只考慮關(guān)系的有無(wú),因此研究中不考慮關(guān)系頻度(邊權(quán)重);加之標(biāo)簽同現(xiàn)關(guān)系(知識(shí)關(guān)聯(lián)關(guān)系)所形成的邊不具有方向性,因此所構(gòu)建的領(lǐng)域知識(shí)網(wǎng)絡(luò)為無(wú)向無(wú)權(quán)網(wǎng)絡(luò)。出于對(duì)知識(shí)網(wǎng)絡(luò)動(dòng)態(tài)演化變遷進(jìn)行跟蹤的目的,研究中按照時(shí)間序列分別構(gòu)建14個(gè)時(shí)間窗口的領(lǐng)域知識(shí)網(wǎng)絡(luò)。
4.2? ? 網(wǎng)絡(luò)基本構(gòu)造區(qū)塊的識(shí)別
本研究對(duì)知識(shí)網(wǎng)絡(luò)中的每一種實(shí)際存在的基本構(gòu)造區(qū)塊的拓?fù)浣Y(jié)構(gòu)進(jìn)行識(shí)別與計(jì)算,檢測(cè)出所有真實(shí)存在的同形異構(gòu)的基本構(gòu)造區(qū)塊子圖類(lèi)型,并且進(jìn)行時(shí)間序列的區(qū)塊數(shù)量以及濃度占比分析,探測(cè)領(lǐng)域知識(shí)網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)中各類(lèi)基本構(gòu)造區(qū)塊數(shù)量變化過(guò)程以及演進(jìn)特征。本研究主要針對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)中的4節(jié)點(diǎn)區(qū)塊進(jìn)行識(shí)別與計(jì)算:
(1)定義:VS為邊所連接的節(jié)點(diǎn)的集合,ES為領(lǐng)域知識(shí)網(wǎng)絡(luò)中邊的集合。
(2)設(shè)置空集U,用于接收滿足條件的4節(jié)點(diǎn)數(shù)組;設(shè)置空集M,用于接收不滿足條件的4節(jié)點(diǎn)數(shù)組。
(3)任意選取節(jié)點(diǎn)(N=4),V=(V1 、V2 、V3 、V4)∈VS。判斷V是否屬于集合U,若屬于則重新選取VS當(dāng)中的4個(gè)節(jié)點(diǎn);反之則存儲(chǔ)于集合U。
(4)計(jì)算V=(V1 、V2 、V3、V4)擁有的邊的數(shù)量,任意節(jié)點(diǎn)至少擁有一條邊并且節(jié)點(diǎn)數(shù)量滿足N-1≤V≤■,若不滿足條件則V存儲(chǔ)于集合M,且返回步驟(3)。
(5)識(shí)別區(qū)塊子圖類(lèi)型,當(dāng)所選出的4節(jié)點(diǎn)構(gòu)造區(qū)塊的邊數(shù)量關(guān)系滿足步驟(4)時(shí),判斷區(qū)塊具體邊數(shù)量,識(shí)別出同形異構(gòu)的區(qū)塊類(lèi)型。
(6)計(jì)算區(qū)塊濃度:
公式(1)中,i為同形異構(gòu)的區(qū)塊類(lèi)型,N個(gè)節(jié)點(diǎn)當(dāng)中i類(lèi)區(qū)塊子圖出現(xiàn)次數(shù)記為Ni,擁有N個(gè)節(jié)點(diǎn)的i類(lèi)區(qū)塊子圖的濃度為實(shí)際出現(xiàn)在網(wǎng)絡(luò)中的i類(lèi)區(qū)塊的個(gè)數(shù)占實(shí)際網(wǎng)絡(luò)當(dāng)中N個(gè)節(jié)點(diǎn)的所有區(qū)塊子圖的比重。
(7)返回步驟(3)。
沿時(shí)間序列對(duì)所有同形異構(gòu)區(qū)塊子圖的數(shù)量以及濃度占比進(jìn)行計(jì)算,最終獲得知識(shí)網(wǎng)絡(luò)時(shí)間序列的基本構(gòu)造區(qū)塊子圖的濃度。
4.3? ? Hub知識(shí)節(jié)點(diǎn)的檢測(cè)
領(lǐng)域知識(shí)網(wǎng)絡(luò)中,不同知識(shí)節(jié)點(diǎn)之間會(huì)存在出現(xiàn)頻次以及連邊數(shù)量等方面的差異性。本研究基于節(jié)點(diǎn)擁有的連邊數(shù)量選取知識(shí)網(wǎng)絡(luò)的Hub節(jié)點(diǎn)作為領(lǐng)域中的核心知識(shí)節(jié)點(diǎn)。其優(yōu)點(diǎn)在于,Hub知識(shí)節(jié)點(diǎn)更能夠彰顯該節(jié)點(diǎn)在眾多領(lǐng)域知識(shí)中的核心地位,該方法目前已經(jīng)被圖書(shū)情報(bào)學(xué)界廣泛接受。在此基礎(chǔ)上引入時(shí)間序列分析思想,采用網(wǎng)絡(luò)涌現(xiàn)理論中的Hub涌現(xiàn)[21]來(lái)對(duì)領(lǐng)域知識(shí)網(wǎng)絡(luò)中Hub知識(shí)節(jié)點(diǎn)的涌現(xiàn)波動(dòng)進(jìn)行探索分析,從而對(duì)基于內(nèi)容層面的知識(shí)節(jié)點(diǎn)的涌現(xiàn)過(guò)程加以揭示,探索領(lǐng)域核心知識(shí)的涌現(xiàn)模式。為了便于比較分析,研究中采取Top-n的方式來(lái)選取每一時(shí)間窗口的Hub節(jié)點(diǎn),來(lái)考察時(shí)間序列下的Hub節(jié)點(diǎn)(Top-n)成員變化。出于考察累積數(shù)據(jù)環(huán)境下年復(fù)一年Hub知識(shí)節(jié)點(diǎn)變化趨勢(shì)的目的,研究工作定義了Hub節(jié)點(diǎn)的波動(dòng)系數(shù):
公式(2)中,t1Hub表示首個(gè)時(shí)間窗口出現(xiàn)的Hub節(jié)點(diǎn),t1+nHub表示t1+n時(shí)間窗口的Hub節(jié)點(diǎn),t1+nHub∩t1Hub表示從第一個(gè)時(shí)間窗口t1至當(dāng)前時(shí)間窗口t1+n相同的Hub節(jié)點(diǎn)。領(lǐng)域知識(shí)網(wǎng)絡(luò)的波動(dòng)系數(shù),由第一時(shí)間窗口(t=1)到當(dāng)前時(shí)間窗口(t=1+n)的Hub節(jié)點(diǎn)變化差異數(shù)與t1時(shí)間節(jié)點(diǎn)的Hub節(jié)點(diǎn)數(shù)的比率確定。由波動(dòng)系數(shù)Hubchange的定義可知。其值域范圍[0-1],波動(dòng)系數(shù)越大,則說(shuō)明高Hub節(jié)點(diǎn)成員的波動(dòng)幅度越大,成員構(gòu)成越不穩(wěn)定。反之,則說(shuō)明該領(lǐng)域Hub節(jié)點(diǎn)的成員構(gòu)成非常穩(wěn)定,原有的Hub節(jié)點(diǎn)在網(wǎng)絡(luò)演化過(guò)程中吸附了更多的連接來(lái)保持Hub地位,遵從了A-L.Barabasi和R.Albert提出的優(yōu)先連接(Preferential Attachment)機(jī)制[5]。通過(guò)分析領(lǐng)域知識(shí)網(wǎng)絡(luò)生長(zhǎng)演化過(guò)程中Hub節(jié)點(diǎn)的波動(dòng)系數(shù),可以從領(lǐng)域知識(shí)內(nèi)容的視角觀測(cè)該領(lǐng)域研究熱點(diǎn)或核心知識(shí)的波動(dòng)變化。
5? ?結(jié)果分析
5.1? ? 知識(shí)網(wǎng)絡(luò)演化的宏觀結(jié)構(gòu)分析
從“semanticweb”主題領(lǐng)域中的數(shù)據(jù)可以發(fā)現(xiàn),時(shí)間序列知識(shí)網(wǎng)絡(luò)的節(jié)點(diǎn)(標(biāo)簽)從初態(tài)(2004)的55個(gè)節(jié)點(diǎn)增長(zhǎng)至終態(tài)(2017)的1 994個(gè)節(jié)點(diǎn),網(wǎng)絡(luò)的邊(關(guān)聯(lián)關(guān)系)從初態(tài)(2004)的289條(對(duì))增長(zhǎng)至終態(tài)(2017)的21 791條(對(duì))。這體現(xiàn)了領(lǐng)域知識(shí)網(wǎng)絡(luò)作為真實(shí)復(fù)雜網(wǎng)絡(luò)的一大特征,即網(wǎng)絡(luò)的增長(zhǎng)性。根據(jù)A-L. Barabasi和R. Albert[5]發(fā)表于《Science》雜志的網(wǎng)絡(luò)科學(xué)研究成果可知,眾多大型復(fù)雜網(wǎng)絡(luò)共有的結(jié)構(gòu)特性是節(jié)點(diǎn)的度值遵循冪律分布,即無(wú)標(biāo)度網(wǎng)絡(luò)(Free Scale Network)。研究工作基于這一思想,對(duì)各個(gè)時(shí)間窗口知識(shí)網(wǎng)絡(luò)的度序列分布的演化進(jìn)行分析研究。以節(jié)點(diǎn)的度值k為橫坐標(biāo)、以度分布概率P(k)為縱坐標(biāo),以10為底建立雙對(duì)數(shù)直角坐標(biāo)系,得到時(shí)間序列領(lǐng)域知識(shí)網(wǎng)絡(luò)度序列分布圖(見(jiàn)圖2)。
在分布圖中,領(lǐng)域知識(shí)網(wǎng)絡(luò)生長(zhǎng)初期(2004)的度序列并沒(méi)有很好地遵循冪律分布,P(k)并沒(méi)有隨著k值的增大表現(xiàn)出衰減趨勢(shì)。此后隨著領(lǐng)域知識(shí)網(wǎng)絡(luò)的不斷演化生長(zhǎng),網(wǎng)絡(luò)節(jié)點(diǎn)度序列的冪律分布特性才逐漸體現(xiàn)出來(lái),基本上遵循P(k)∝k-γ。而且在擬合情況較好的時(shí)間軸后半段,度序列分布也一定程度上保留著E. M. J. Newman[22]曾經(jīng)指出的呈彎曲狀的“頭重分布”(Top-heavy Distribution)。對(duì)2004-2017時(shí)間窗口領(lǐng)域知識(shí)網(wǎng)絡(luò)的度序列分布冪指數(shù)γ的計(jì)算,獲得冪指數(shù)γ的值依次為:γ2004=2.573 867、γ2005=2.553 365、γ2006=2.422 331、γ2007=2.432 352、γ2008=2.703 654、γ2009=2.695 384、γ2010=2.652 611、γ2011=2.644 553、γ2012=2.576 824、γ2013=2.570 994、γ2014=2.569 855、γ2015=2.538 632、γ2016=2.550 464、γ2017=2.563 466。根據(jù)A-L. Barabasi等對(duì)演員合作網(wǎng)絡(luò)、萬(wàn)維網(wǎng)、電力網(wǎng)絡(luò)等真實(shí)復(fù)雜網(wǎng)絡(luò)的測(cè)算,符合無(wú)標(biāo)度網(wǎng)絡(luò)特征的大型復(fù)雜網(wǎng)絡(luò)的度序列分布冪指數(shù)γ的波動(dòng)范圍在±0.1左右。2004-2008時(shí)間窗口度序列分布的冪指數(shù)γ值波動(dòng)較大,之后歷年的相鄰時(shí)間窗口度序列分布的冪指數(shù)γ值差異均沒(méi)有超過(guò)±0.1,并且γ值并沒(méi)有隨著網(wǎng)絡(luò)規(guī)模的增長(zhǎng)而單純?cè)龃蠡蛘邷p小,而是趨近于一個(gè)穩(wěn)定區(qū)間γ=2.6±0.1。至此可以得出,領(lǐng)域知識(shí)網(wǎng)絡(luò)的無(wú)標(biāo)度特征并非是與生俱來(lái)的,而是沿時(shí)間序列隨領(lǐng)域知識(shí)的發(fā)展逐漸涌現(xiàn),在知識(shí)網(wǎng)絡(luò)涌現(xiàn)出無(wú)標(biāo)度特征之后,度序列分布的冪指數(shù)γ值波動(dòng)趨于穩(wěn)定,且這種穩(wěn)定性與網(wǎng)絡(luò)規(guī)模大小無(wú)關(guān)。
5.2? ? 知識(shí)網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)分析
本研究采用窮盡遞歸的思想檢測(cè)到節(jié)點(diǎn)數(shù)量N=4的所有同形異構(gòu)的區(qū)塊子圖及其對(duì)應(yīng)的數(shù)量規(guī)模,共涵蓋了6類(lèi)4節(jié)點(diǎn)的基本構(gòu)造區(qū)塊。在領(lǐng)域知識(shí)網(wǎng)絡(luò)不斷生長(zhǎng)演化的過(guò)程中,網(wǎng)絡(luò)當(dāng)中節(jié)點(diǎn)數(shù)量N=4的所有區(qū)塊子圖的數(shù)量隨著網(wǎng)絡(luò)規(guī)模與容量的增大在不斷變化,并得到相關(guān)數(shù)據(jù)(見(jiàn)表2)。
對(duì)照表1與表2中的數(shù)據(jù)可以發(fā)現(xiàn),盡管研究中生成的14個(gè)時(shí)間窗口的“semanticweb”主題領(lǐng)域知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)最大為1 994(見(jiàn)表1),識(shí)別出的底層構(gòu)造區(qū)塊子圖類(lèi)型僅有6類(lèi),但網(wǎng)絡(luò)終態(tài)(2017)形成的4節(jié)點(diǎn)的區(qū)塊子圖數(shù)量超過(guò)10億級(jí)別。考慮到網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量與區(qū)塊子圖數(shù)量之間的巨大差異,以及前文網(wǎng)絡(luò)宏觀結(jié)構(gòu)分析中已經(jīng)發(fā)現(xiàn)的2008時(shí)間窗口前后冪指數(shù)γ值波動(dòng)的差異性,以該時(shí)間窗口為界,將時(shí)間軸劃分為2004-2008、2008-2017兩個(gè)時(shí)間區(qū)段。分區(qū)段考察領(lǐng)域知識(shí)網(wǎng)絡(luò)演化過(guò)程中的區(qū)塊增長(zhǎng)情況,以期探索冪指數(shù)γ值不同收斂狀態(tài)下網(wǎng)絡(luò)規(guī)模與底層區(qū)塊子圖增長(zhǎng)的相關(guān)性。以網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)量為橫坐標(biāo),以同形異構(gòu)區(qū)塊子圖數(shù)量為縱坐標(biāo),得出2004-2008時(shí)間區(qū)段底層區(qū)塊子圖的指數(shù)擬合情況(見(jiàn)圖3)。
從圖3中不難發(fā)現(xiàn),隨著時(shí)間的推移,縱軸刻度反映出不同區(qū)塊子圖之間數(shù)量差距進(jìn)一步擴(kuò)大,結(jié)合表2中的數(shù)據(jù)可以更好地驗(yàn)證這一點(diǎn)。圖3中知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模與各類(lèi)同形異構(gòu)區(qū)塊子圖數(shù)量上的指數(shù)擬合曲線關(guān)系的R2值及顯著性系數(shù)分別為:R24-1=0.8671(Sig.=0.021)、R24-2=0.8304(Sig.=0.031)、R24-3=0.8624(Sig.=0.023)、R24-4=0.7446(Sig.=0.060)、R24-5=0.8565(Sig.=0.024)、R24-6=0.8283(Sig.=0.032)。盡管除區(qū)塊子圖4-4之外其他區(qū)塊子圖都滿足0.05的顯著性水平,但是R2值最高為0.8671,最低為0.7446,無(wú)一達(dá)到0.9以上,各類(lèi)區(qū)塊子圖數(shù)量與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模的指數(shù)擬合關(guān)系并不十分理想。進(jìn)一步對(duì)2008-2017時(shí)間區(qū)段網(wǎng)絡(luò)規(guī)模與區(qū)塊子圖數(shù)量的相關(guān)關(guān)系進(jìn)行分析,得出該時(shí)間區(qū)段的擬合情況(見(jiàn)圖4)。
在2008-2017時(shí)間區(qū)段底層區(qū)塊子圖的指數(shù)擬合曲線中,6類(lèi)區(qū)塊子圖擬合曲線的R2值及顯著性系數(shù)分別為:R24-1=0.9939(Sig.=0.000)、R24-2=0.9958(Sig.=0.000)、R24-3=0.9967(Sig.=0.000)、R24-4=0.9921(Sig.=0.000)、R24-5=0.9950(Sig.=0.000)、R24-6=0.9836(Sig.=0.000)。顯然,在該時(shí)間區(qū)段內(nèi)擬合效果滿足更好的顯著性水平,即使最小R2值(區(qū)塊子圖4-6)也高達(dá)0.9836,其余皆超過(guò)0.99。由此可以發(fā)現(xiàn),在領(lǐng)域知識(shí)網(wǎng)絡(luò)演化的相對(duì)成熟階段(冪指數(shù)γ值波動(dòng)小),各類(lèi)區(qū)塊子圖與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模之間指數(shù)曲線擬合效果遠(yuǎn)遠(yuǎn)優(yōu)于領(lǐng)域知識(shí)生長(zhǎng)的初期(2004-2008),指數(shù)擬合效果更好。這意味著在領(lǐng)域知識(shí)網(wǎng)絡(luò)演化逐漸步入成熟階段后,底層基本構(gòu)造區(qū)塊的數(shù)量隨著知識(shí)網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模的擴(kuò)大更加符合指數(shù)增長(zhǎng)模式,更加有規(guī)律可循。
出于進(jìn)一步考察知識(shí)網(wǎng)絡(luò)演化中底層拓?fù)浣Y(jié)構(gòu)穩(wěn)定性的目的,研究中分別計(jì)算了各類(lèi)區(qū)塊子圖在整個(gè)時(shí)間序列中的濃度,得出各區(qū)塊子圖濃度的時(shí)序變化(見(jiàn)圖5)。
在區(qū)塊子圖濃度的時(shí)序變化圖中,2008時(shí)間窗口之前,知識(shí)網(wǎng)絡(luò)中各類(lèi)區(qū)塊子圖的濃度漲跌存在較大波動(dòng),甚至出現(xiàn)不同區(qū)塊子圖濃度之間此消彼長(zhǎng)的現(xiàn)象。這在一定程度上說(shuō)明,領(lǐng)域知識(shí)網(wǎng)絡(luò)演化初期各類(lèi)底層基本構(gòu)造區(qū)塊在網(wǎng)絡(luò)中的占比變化較大,知識(shí)網(wǎng)絡(luò)演化并不穩(wěn)定。而2008時(shí)間窗口之后,各類(lèi)區(qū)塊子圖的濃度曲線趨向于相對(duì)平行的發(fā)展,底層基本構(gòu)造區(qū)塊在知識(shí)網(wǎng)絡(luò)中的占比趨于穩(wěn)定,領(lǐng)域知識(shí)網(wǎng)絡(luò)進(jìn)入相對(duì)穩(wěn)定的發(fā)展階段。需要說(shuō)明的是,圖5中區(qū)塊子圖4-4不但數(shù)量最少(見(jiàn)表2)而且濃度始終最低。本文前期的研究已經(jīng)證實(shí)區(qū)塊子圖4-4并非知識(shí)網(wǎng)絡(luò)的模體,由于本研究關(guān)注所有類(lèi)型的結(jié)構(gòu)子圖因此并未將其排除,同時(shí)也說(shuō)明其所代表的底層結(jié)構(gòu)并非知識(shí)網(wǎng)絡(luò)的特有典型結(jié)構(gòu)。結(jié)合圖3、圖4的分析結(jié)果可以發(fā)現(xiàn),隨著領(lǐng)域知識(shí)的發(fā)展以及網(wǎng)絡(luò)規(guī)模的不斷擴(kuò)容,知識(shí)網(wǎng)絡(luò)生長(zhǎng)的相對(duì)成熟期的底層拓?fù)浣Y(jié)構(gòu)不但在增長(zhǎng)模式上逐漸表現(xiàn)出規(guī)律性的一面,而且在各類(lèi)基本構(gòu)造區(qū)塊的濃度上也表現(xiàn)出較強(qiáng)的穩(wěn)定性。這說(shuō)明領(lǐng)域知識(shí)網(wǎng)絡(luò)演化進(jìn)程中,盡管不斷有新的知識(shí)節(jié)點(diǎn)和知識(shí)關(guān)聯(lián)關(guān)系生成或加入,但是網(wǎng)絡(luò)底層的基本構(gòu)造區(qū)塊逐漸穩(wěn)定,并且濃度穩(wěn)定的構(gòu)造區(qū)塊保障了知識(shí)網(wǎng)絡(luò)表現(xiàn)出無(wú)標(biāo)度等相對(duì)穩(wěn)定的宏觀結(jié)構(gòu)特征。
5.3? ? 領(lǐng)域核心知識(shí)涌現(xiàn)分析
將領(lǐng)域知識(shí)網(wǎng)絡(luò)中知識(shí)節(jié)點(diǎn)根據(jù)度值進(jìn)行排序,選取各個(gè)時(shí)間窗口下度值排名前十的知識(shí)節(jié)點(diǎn)作為觀察對(duì)象,由此獲得的Hub知識(shí)節(jié)點(diǎn)(見(jiàn)表3)。
從表3中可以發(fā)現(xiàn),2004-2008時(shí)間區(qū)段內(nèi),幾乎每一年都有Hub知識(shí)節(jié)點(diǎn)的成員變更現(xiàn)象發(fā)生,該時(shí)間區(qū)段Hub節(jié)點(diǎn)的波動(dòng)性很大。其中“newnet”“tools”“opensource”等6個(gè)知識(shí)節(jié)點(diǎn)沒(méi)能憑借自身的高度值吸附足夠多的連接,進(jìn)而先后跌出前十名;而“semantic”“software”“web2.0”等7個(gè)知識(shí)節(jié)點(diǎn)則在這一時(shí)段領(lǐng)域知識(shí)生長(zhǎng)發(fā)展的過(guò)程中吸附了足夠多的連接,陸續(xù)跨入了排名前十的位置。這一現(xiàn)象反映出,在領(lǐng)域知識(shí)網(wǎng)絡(luò)生長(zhǎng)演化的前期,優(yōu)先連接機(jī)制的作用效果并不鮮明。而在2008-2017時(shí)間區(qū)段內(nèi),僅有一個(gè)時(shí)間窗口發(fā)生了Hub節(jié)點(diǎn)成員變更現(xiàn)象,跌出前十位的Hub節(jié)點(diǎn)為“software”“semantics”,新進(jìn)入的Hub節(jié)點(diǎn)為“l(fā)inkeddata”和“data”,Hub知識(shí)節(jié)點(diǎn)的波動(dòng)率大幅降低。顯然,這一時(shí)間區(qū)段內(nèi)優(yōu)先連接機(jī)制的作用效果愈發(fā)明顯,原有的Hub節(jié)點(diǎn)憑借自身的高度值,吸附了更多的足以保持其核心地位的連接。即使在Hub節(jié)點(diǎn)成員內(nèi)部,2004-2008時(shí)間區(qū)段內(nèi)各個(gè)知識(shí)節(jié)點(diǎn)的排名順序也存在較大變化;而2008-2017時(shí)間區(qū)段內(nèi),各個(gè)知識(shí)節(jié)點(diǎn)的排名順序則相對(duì)穩(wěn)定。
為了確保網(wǎng)絡(luò)環(huán)境的變化(生長(zhǎng)與擴(kuò)容)中Hub節(jié)點(diǎn)的變化與所選取的數(shù)量無(wú)關(guān),對(duì)Hub節(jié)點(diǎn)的選取采用閾值控制法。即將Hub節(jié)點(diǎn)選取數(shù)量的閾值分別設(shè)置為n=10、n=20、n=30、n=40、n=50(2004時(shí)間窗口全網(wǎng)節(jié)點(diǎn)數(shù)量只有53個(gè),為了便于比較分析從而閾值n的最大數(shù)量上限設(shè)為50)。采用公式(2)分別計(jì)算2004-2008、2008-2017兩個(gè)時(shí)間區(qū)段的Hub節(jié)點(diǎn)的波動(dòng)系數(shù),得到不同閾值條件下的波動(dòng)系數(shù)(見(jiàn)圖6)。
在圖6中,2004-2008時(shí)間區(qū)段在不同的閾值條件下(n=10、n=20、n=30、n=40、n=50)均呈現(xiàn)出處于高位的波動(dòng)系數(shù)(0.6≤Hubchange≤0.7);2008-2017時(shí)間區(qū)段不同閾值條件下的波動(dòng)系數(shù)則處于很低的水平(0.1≤Hubchange≤0.2)。圖中兩個(gè)時(shí)段不同閾值的數(shù)據(jù)表明,知識(shí)網(wǎng)絡(luò)Hub節(jié)點(diǎn)的波動(dòng)性與Hub節(jié)點(diǎn)選取的數(shù)量無(wú)關(guān),而是與知識(shí)網(wǎng)絡(luò)發(fā)展階段相關(guān)。這一結(jié)果進(jìn)一步證實(shí)了領(lǐng)域知識(shí)網(wǎng)絡(luò)生長(zhǎng)演化初期領(lǐng)域核心知識(shí)(Hub知識(shí)節(jié)點(diǎn))存在較大的波動(dòng),學(xué)術(shù)界公認(rèn)的網(wǎng)絡(luò)涌現(xiàn)背后的優(yōu)先連接機(jī)制的作用效果沒(méi)能充分展現(xiàn);隨著領(lǐng)域知識(shí)網(wǎng)絡(luò)發(fā)展演化進(jìn)入相對(duì)成熟時(shí)期,領(lǐng)域核心知識(shí)的波動(dòng)性減弱,Hub知識(shí)節(jié)點(diǎn)充分展現(xiàn)出優(yōu)先連接機(jī)制的作用效果,少部分知識(shí)節(jié)點(diǎn)涌現(xiàn)為穩(wěn)定的領(lǐng)域核心知識(shí)。需要補(bǔ)充的是,即使在領(lǐng)域知識(shí)網(wǎng)絡(luò)發(fā)展相對(duì)成熟的階段,Hub節(jié)點(diǎn)發(fā)生波動(dòng)的概率大大降低但仍有可能發(fā)生。這種情況往往與學(xué)科領(lǐng)域重大發(fā)現(xiàn)或重要變革相關(guān)。表3中知識(shí)節(jié)點(diǎn)“l(fā)inkeddata”和“data”從2010時(shí)間窗口跨入前十位的現(xiàn)象,揭示了從該時(shí)刻起語(yǔ)義網(wǎng)(semanticweb)主題領(lǐng)域中數(shù)據(jù)科學(xué)的興起。
6? ?結(jié)論與討論
本文對(duì)知識(shí)網(wǎng)絡(luò)演化的結(jié)構(gòu)穩(wěn)定性和知識(shí)涌現(xiàn)進(jìn)行研究,初步可以得出如下結(jié)論:
(1)知識(shí)網(wǎng)絡(luò)宏觀結(jié)構(gòu)的無(wú)標(biāo)度特征并非與生俱來(lái),只有在網(wǎng)絡(luò)演化進(jìn)入相對(duì)成熟的階段后才表現(xiàn)出穩(wěn)定的無(wú)標(biāo)度網(wǎng)絡(luò)特征。研究中發(fā)現(xiàn),在知識(shí)網(wǎng)絡(luò)生長(zhǎng)演化的前期,網(wǎng)絡(luò)度序列分布并非遵循嚴(yán)格的冪律分布,冪指數(shù)波動(dòng)范圍較大(見(jiàn)圖2)。隨著領(lǐng)域知識(shí)的發(fā)展,網(wǎng)絡(luò)生長(zhǎng)進(jìn)入相對(duì)成熟階段后,領(lǐng)域知識(shí)網(wǎng)絡(luò)表現(xiàn)出穩(wěn)定的無(wú)標(biāo)度特征。即使在“頭重分布”的影響下,冪指數(shù)的波動(dòng)穩(wěn)定地保持在±0.1范圍之內(nèi)。對(duì)當(dāng)前學(xué)術(shù)界普遍認(rèn)可和接受的知識(shí)網(wǎng)絡(luò)的無(wú)標(biāo)度特征,從發(fā)展階段的角度給出了更為細(xì)致的闡釋。
(2)知識(shí)網(wǎng)絡(luò)進(jìn)入相對(duì)成熟階段后,底層基本構(gòu)造區(qū)塊與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模的指數(shù)擬合效果更好,區(qū)塊子圖濃度保持相對(duì)穩(wěn)定。知識(shí)網(wǎng)絡(luò)演化進(jìn)程中,網(wǎng)絡(luò)規(guī)模在不斷擴(kuò)容的同時(shí),各類(lèi)基本構(gòu)造區(qū)塊數(shù)量與網(wǎng)絡(luò)節(jié)點(diǎn)規(guī)模之間表現(xiàn)出巨大差異。從指數(shù)擬合分析結(jié)果來(lái)看,網(wǎng)絡(luò)進(jìn)入相對(duì)成熟的階段后,R2值高達(dá)0.99(見(jiàn)圖4),且滿足更好的顯著性水平,擬合效果甚佳;而且成熟期的區(qū)塊子圖濃度保持長(zhǎng)期穩(wěn)定,各個(gè)區(qū)塊的濃度曲線保持平行發(fā)展的態(tài)勢(shì)(見(jiàn)圖5)。正是網(wǎng)絡(luò)底層拓?fù)浣Y(jié)構(gòu)這種“后期穩(wěn)定”的特性,為網(wǎng)絡(luò)宏觀層面結(jié)構(gòu)特征的穩(wěn)定呈現(xiàn)奠定了基礎(chǔ)。
(3)Hub知識(shí)節(jié)點(diǎn)的成員構(gòu)成在網(wǎng)絡(luò)成熟階段更加穩(wěn)定,涌現(xiàn)為穩(wěn)定的領(lǐng)域核心知識(shí)。具有無(wú)標(biāo)度屬性的知識(shí)網(wǎng)絡(luò)中,少量知識(shí)節(jié)點(diǎn)攜帶大量的知識(shí)關(guān)聯(lián),大量的知識(shí)節(jié)點(diǎn)僅擁有少量的知識(shí)關(guān)聯(lián)。研究中發(fā)現(xiàn),知識(shí)網(wǎng)絡(luò)演化的早期,Hub節(jié)點(diǎn)的成員構(gòu)成變化較大且更迭較為頻繁,領(lǐng)域核心知識(shí)群體并不穩(wěn)定。網(wǎng)絡(luò)演化進(jìn)入相對(duì)成熟階段后,波動(dòng)系數(shù)大幅降低(見(jiàn)圖6),領(lǐng)域中形成了穩(wěn)定的核心知識(shí)團(tuán)體。顯然,底層拓?fù)浣Y(jié)構(gòu)層面的“后期穩(wěn)定”性,也為領(lǐng)域知識(shí)發(fā)展成熟階段內(nèi)容層面的核心知識(shí)的穩(wěn)定涌現(xiàn)提供了保障。
基于復(fù)雜網(wǎng)絡(luò)方法與時(shí)間序列相融合的動(dòng)態(tài)化分析,有助于深入了解領(lǐng)域知識(shí)網(wǎng)絡(luò)演化生長(zhǎng)過(guò)程中潛在的模式與規(guī)律。研究中發(fā)現(xiàn)的知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)層面的“后期穩(wěn)定”特性,可以為成長(zhǎng)過(guò)程中的學(xué)科領(lǐng)域知識(shí)的識(shí)別和檢測(cè)提供一種新的思路。本文所強(qiáng)調(diào)的穩(wěn)定性并非意味著領(lǐng)域知識(shí)網(wǎng)絡(luò)停止生長(zhǎng)演化,而是知識(shí)網(wǎng)絡(luò)的某種特征更恒定和顯著地表現(xiàn)出來(lái)。同時(shí),穩(wěn)定狀態(tài)下隱含的低概率波動(dòng)性則往往預(yù)示著學(xué)科領(lǐng)域的重大發(fā)現(xiàn)或重要變革。研究工作也存在一些局限,本研究基于冪指數(shù)的變化對(duì)網(wǎng)絡(luò)演化進(jìn)行區(qū)段劃分,更為科學(xué)完善的劃分方法還有待后續(xù)研究進(jìn)一步深入探索。
參考文獻(xiàn):
[1]? Garfield E.Citation indexes for science:a new dimension in documentation through association of ideas [J].Science,1955,122(3159):108-111.
[2]? Price D J de S.Networks of scientific papers[J].Science,1965,149(3683):510-515.
[3]? Wasserman S,F(xiàn)aust K.陳禹,孫彩虹,譯.社會(huì)網(wǎng)絡(luò)分析:方法與應(yīng)用[M].北京:中國(guó)人民大學(xué)出版社,2012:12-14.
[4]? Watts D J,Strogatz S H.Collective dynamics of ‘small world networks[J].Nature,1998,393(6684):440-442.
[5]? Barabási A-L,Albert R.Emergence of scaling in random networks[J].Science,1999,286(5439):509-512.
[6]? Boccaletti S,Latora V,Moreno Y,et al.Complex networks:structure and dynamics[J].Physics Reports,2006,424(4-5):175-308.
[7]? Zhu D,Wang D,Hassan S U,et al.Small-world phenomenon of keywords network based on complex network[J].Scientometrics,2013,97(2):435-442.
[8]? Hong R J,Jinho C.Knowledge structure by keyword network analysis:focusing on business model research topics[J].Advanced Science Letters,2017,23(10):9407-9411.
[9]? 耿志杰,朱學(xué)芳,王文鼐.情報(bào)學(xué)領(lǐng)域關(guān)鍵詞同現(xiàn)網(wǎng)絡(luò)結(jié)構(gòu)研究[J].情報(bào)科學(xué),2010,28(8):1179-1182,1202.
[10]? Ma F C,Li Y.Utilising social network analysis to study the characteristics and functions of the co-occurrence network of online tags[J].Online Information Review,2014,38(2):232-247.
[11]? Sedighi M.Application of word co-occurrence analysis method in mapping of the scientific fields(case study:the field of informetrics)[J].Library Review,2016,65(1/2):52-64.
[12]? Radhakrishnan S,Erbis S,Isaacs J A,et al.Novel keyword co-occurrence network-based methods to foster systematic reviews of scientific literature[J].PloS One,2017,12(3):e0172778.
[13]? Zhang Q R,Li Y,Liu J S,et al.A dynamic co-word network-related approach on the evolution of Chinas urbanization research[J].Scientometrics,2017,111(3):1623-1642.
[14]? 馬費(fèi)成,劉向.科學(xué)知識(shí)網(wǎng)絡(luò)的演化模型[J].系統(tǒng)工程理論與實(shí)踐,2013,33(2):437-443.
[15]? 滕廣青,常志遠(yuǎn),劉雅姝,等.Folksonomy知識(shí)組織模式中領(lǐng)域知識(shí)動(dòng)態(tài)演化規(guī)律研究[J].圖書(shū)與情報(bào),2016(4):96-101,82.
[16]? 滕廣青.基于頻度演化的領(lǐng)域知識(shí)關(guān)聯(lián)關(guān)系涌現(xiàn)[J].中國(guó)圖書(shū)館學(xué)報(bào),2018,44(3):79-95.
[17]? 張斌,李亞婷.知識(shí)網(wǎng)絡(luò)演化模型研究述評(píng)[J].中國(guó)圖書(shū)館學(xué)報(bào),2016,42(5):85-101.
[18]? 徐漢青,滕廣青,安寧,等.基于模體的知識(shí)網(wǎng)絡(luò)結(jié)構(gòu)演化及其穩(wěn)定性[J].圖書(shū)館學(xué)研究,2018(18):82-90.
[19]? Milo R,Shenorr S,Itzkovitz S,et al.Network motifs:simple building blocks of complex networks[J].Science,2002,298(5594):824-827.
[20]? Barabasi A-L,Oltvai Z N.Network biology:understanding the cell's functional organization[J].Nature Reviews Genetics,2004,5(2):101-113.
[21]? 安寧,滕廣青,白淑春,等.基于網(wǎng)絡(luò)Hub的領(lǐng)域核心知識(shí)涌現(xiàn)研究[J].圖書(shū)情報(bào)工作,2017,61(18):98-106.
[22]? (美)Newman M E J.郭世澤,陳哲,譯.網(wǎng)絡(luò)科學(xué)引論[M].北京:電子工業(yè)出版社,2014:157-170.
作者簡(jiǎn)介:徐漢青(1992-),男,東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院碩士研究生;滕廣青(1970-),男,東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院教授,博士生導(dǎo)師;欒宇(1988-),男,東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院碩士研究生;孫健(1993-),男,東北師范大學(xué)信息科學(xué)與技術(shù)學(xué)院碩士研究生。