趙汝南,常志遠(yuǎn),姜 博,劉雅姝,陳 思,滕廣青(東北師范大學(xué)計算機科學(xué)與信息技術(shù)學(xué)院,長春 130117)
?
基于網(wǎng)絡(luò)演化的領(lǐng)域知識發(fā)展趨勢研究
趙汝南,常志遠(yuǎn),姜博,劉雅姝,陳思,滕廣青
(東北師范大學(xué)計算機科學(xué)與信息技術(shù)學(xué)院,長春 130117)
知識的演進(jìn)與發(fā)展問題是圖書情報學(xué)界的重要課題之一。研究中從時間序列的視角出發(fā),通過對特定領(lǐng)域文獻(xiàn)關(guān)鍵詞的提取,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建領(lǐng)域知識網(wǎng)絡(luò)。采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長度、點度中心勢、中介中心勢等多種分析方法,對領(lǐng)域知識網(wǎng)絡(luò)的發(fā)展態(tài)勢進(jìn)行跟蹤與分析。研究結(jié)果表明,領(lǐng)域知識的發(fā)展趨勢總體上向小世界狀態(tài)邁進(jìn),而且領(lǐng)域知識的中心性會隨著知識發(fā)展逐漸顯現(xiàn),為基于復(fù)雜網(wǎng)絡(luò)的理論與方法對領(lǐng)域知識的發(fā)展趨勢進(jìn)行分析與研判做出了有益的嘗試。
復(fù)雜網(wǎng)絡(luò);領(lǐng)域知識;知識網(wǎng)絡(luò)
對學(xué)科領(lǐng)域知識的發(fā)展進(jìn)程進(jìn)行研究一直以來就是圖書情報學(xué)領(lǐng)域的重要課題。1965年,普賴斯(D J Price)[1]發(fā)表的《科學(xué)論文的網(wǎng)絡(luò)》中提出并界定了學(xué)科領(lǐng)域“研究前沿”的概念,為網(wǎng)絡(luò)思維下領(lǐng)域知識發(fā)展研究奠定了理論基礎(chǔ)。特別是近年來,復(fù)雜網(wǎng)絡(luò)(Complex Network)[2]的理論與方法在眾多科學(xué)領(lǐng)域的研究工作中顯現(xiàn)出得天獨厚的優(yōu)勢,為復(fù)雜網(wǎng)絡(luò)視角下的領(lǐng)域知識發(fā)展研究帶來了新的契機。
有鑒于此,本研究將以特定知識領(lǐng)域作為研究對象,借助復(fù)雜網(wǎng)絡(luò)的思想,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建領(lǐng)域知識網(wǎng)絡(luò)。采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長度、點度中心勢、中介中心勢等分析方法,對領(lǐng)域知識的發(fā)展展開時間序列的跟蹤與分析,以期通過對領(lǐng)域知識網(wǎng)絡(luò)發(fā)展過程中特征與規(guī)律的挖掘與研判,揭示領(lǐng)域知識的發(fā)展趨勢。
英國著名情報學(xué)家布魯克斯(B C Brooks)[3]在《情報學(xué)基礎(chǔ)》(The Foundations of Information Science)中最早提出了“知識地圖”的概念。隨后在布魯克斯“知識地圖”的雛形上,知識的網(wǎng)絡(luò)化描述思想逐漸融入圖書情報學(xué)的研究領(lǐng)域與實踐工作。20世紀(jì)90年代,埃格(L Egghe)[4]在《情報計量學(xué)引論》(Introduction to Informetrics)中對多元統(tǒng)計分析、網(wǎng)絡(luò)分析及其在引文網(wǎng)絡(luò)分析中的應(yīng)用進(jìn)行了闡述,豐富了引文分析方法,促進(jìn)了網(wǎng)絡(luò)思維在知識相關(guān)問題研究中的應(yīng)用。事實上,早在20世紀(jì)60年代開始,國際學(xué)術(shù)界就已經(jīng)掀起了一股網(wǎng)絡(luò)分析的熱潮。先是米爾格蘭姆(S Milgram)[5]“六度分割”的“小世界”理論,接著是弗里曼(L C Freeman)[6]的“網(wǎng)絡(luò)結(jié)構(gòu)決定網(wǎng)絡(luò)功能”的思想,這些都為網(wǎng)絡(luò)思想在多學(xué)科中的應(yīng)用奠定了基礎(chǔ)。特別是20世紀(jì)末,斯托加茨(S H Strogatz)[7]和巴拉巴西(A L Barabasi)[8]等人陸續(xù)在《自然》(Nature)和《科學(xué)》(Science)雜志上發(fā)表文章,在多個學(xué)科領(lǐng)域中將網(wǎng)絡(luò)視域下的結(jié)構(gòu)主義推向了學(xué)術(shù)的巔峰,使得復(fù)雜網(wǎng)絡(luò)分析的思想與方法真正被學(xué)術(shù)界普遍接受,并被應(yīng)用于眾多的學(xué)科領(lǐng)域。
近年來,在知識領(lǐng)域的相關(guān)問題研究中,復(fù)雜網(wǎng)絡(luò)分析的方法也被廣泛引入。IBM研究院的克勞斯(R Cross)[9]認(rèn)為,復(fù)雜網(wǎng)絡(luò)分析有助于可視化理解信息環(huán)境中眾多的關(guān)聯(lián)關(guān)系,并借助網(wǎng)絡(luò)分析提煉了潛在知識構(gòu)建所涉及的主要維度關(guān)系。約翰·霍普金斯大學(xué)的利博維茨(J Liebowitz)[10]則提出復(fù)雜網(wǎng)絡(luò)能夠提供更豐富的知識關(guān)聯(lián)關(guān)系,并能夠為傳統(tǒng)的知識層級結(jié)構(gòu)做出更細(xì)致的解釋。華盛頓州立大學(xué)的薩卡爾(S Sarker)[11]將復(fù)雜網(wǎng)絡(luò)分析應(yīng)用于知識群落中的核心知識的識別研究,并采用網(wǎng)絡(luò)分析中的“結(jié)構(gòu)/關(guān)聯(lián)”方法,通過對網(wǎng)絡(luò)中節(jié)點關(guān)系的分析,揭示處于網(wǎng)絡(luò)中心位置的核心知識。加拿大紐芬蘭紀(jì)念大學(xué)的威爾遜(G Wilson)[12]借助網(wǎng)絡(luò)分析中的節(jié)點度、網(wǎng)絡(luò)密度、鄰近權(quán)威3個指標(biāo),探測機構(gòu)內(nèi)部電子郵件網(wǎng)絡(luò)。他們的研究表明,網(wǎng)絡(luò)密度和鄰近權(quán)威更有利于揭示和發(fā)現(xiàn)知識網(wǎng)絡(luò)的關(guān)鍵核心節(jié)點。胡(C Hu)[13]基于歷時5年的期刊文獻(xiàn)合著數(shù)據(jù),應(yīng)用復(fù)雜網(wǎng)絡(luò)分析探索特定學(xué)科領(lǐng)域的知識網(wǎng)絡(luò)結(jié)構(gòu)和網(wǎng)絡(luò)屬性,通過文獻(xiàn)作者間的合著關(guān)系建立了知識內(nèi)容與作者混合網(wǎng)絡(luò),并重點分析了該網(wǎng)絡(luò)中的“核心-邊緣”結(jié)構(gòu)。研究結(jié)果顯示,在網(wǎng)絡(luò)的中心和外圍區(qū)域,學(xué)術(shù)論文的出版模式都呈現(xiàn)出冪律分布。楊(J Yang)[14]及其合作者運用復(fù)雜網(wǎng)絡(luò)分析的方法對特定領(lǐng)域中的文獻(xiàn)內(nèi)容進(jìn)行分析,直接從文獻(xiàn)中抓取知識概念,并依據(jù)其上下文關(guān)系構(gòu)建知識網(wǎng)絡(luò),進(jìn)而根據(jù)知識網(wǎng)絡(luò)的結(jié)構(gòu)及其動態(tài)演化規(guī)律提取網(wǎng)絡(luò)中知識單元間的關(guān)系。他們認(rèn)為,復(fù)雜網(wǎng)絡(luò)分析避免了二元關(guān)系模型的不足,能夠呈現(xiàn)知識間完整的關(guān)聯(lián)關(guān)系,并有利于更深層次地揭示網(wǎng)絡(luò)背后的屬性結(jié)構(gòu)關(guān)系。意大利學(xué)者考薩(M Coscia)[15]提出,數(shù)字化書目是一種匯集了海量學(xué)術(shù)出版物信息的強大的數(shù)據(jù)資源。他們把網(wǎng)絡(luò)分析應(yīng)用于書目數(shù)據(jù)庫的知識脈絡(luò)研究,基于關(guān)系呈現(xiàn)構(gòu)建了書目關(guān)系網(wǎng)絡(luò),進(jìn)而采用數(shù)據(jù)挖掘技術(shù)與網(wǎng)絡(luò)分析相結(jié)合的方法,對局部和全局書目網(wǎng)絡(luò)進(jìn)行綜合的分析與揭示??死蛱兀↗ Krafft)[16]進(jìn)一步以復(fù)雜網(wǎng)絡(luò)分析為主要研究方法,對特定學(xué)科領(lǐng)域的知識動力學(xué)展開了研究。在這一研究中,研究者將專利文獻(xiàn)中的技術(shù)視為知識流動的最小單位,知識的結(jié)構(gòu)被視為由具有社群屬性的技術(shù)節(jié)點及其相互關(guān)系構(gòu)成的網(wǎng)絡(luò)。進(jìn)而直接通過對基于技術(shù)共現(xiàn)形成的網(wǎng)絡(luò)密度、點度中心度、接近中心度、中介中心度等指標(biāo)的測算,提供關(guān)于知識結(jié)構(gòu)與演進(jìn)的綜合描述。研究表明,知識間關(guān)聯(lián)關(guān)系的演進(jìn)可以反映技術(shù)知識的新陳代謝及其生命周期。德國亞琛大學(xué)的范姆(M C Pham)[17]將期刊論文和會議論文結(jié)合起來,采用復(fù)雜網(wǎng)絡(luò)分析的方法,借助論文中的引用關(guān)系分別構(gòu)建了期刊關(guān)系網(wǎng)絡(luò)、主題關(guān)系網(wǎng)絡(luò)、知識關(guān)系網(wǎng)絡(luò),綜合作者合著關(guān)系與引用關(guān)系調(diào)查知識間的引用行為,計算知識主題的中介中心度,判識子學(xué)科的發(fā)展趨勢。
國內(nèi)學(xué)術(shù)界這方面的研究成果主要集中于文獻(xiàn)計量學(xué)領(lǐng)域的合作關(guān)系分析[18]、科研團隊發(fā)現(xiàn)[19]等問題。其中,朱慶華[20]的研究表明,復(fù)雜網(wǎng)絡(luò)分析作為一種新的科學(xué)研究思想和方法,早已被應(yīng)用于圖書情報領(lǐng)域,學(xué)者們通過復(fù)雜網(wǎng)絡(luò)分析方法,在競爭情報、知識管理、作者合著網(wǎng)絡(luò)及領(lǐng)域熱點分析等方面展開了專門的研究。這其中,劉則淵[21]采用復(fù)雜網(wǎng)絡(luò)分析的方法對共詞網(wǎng)絡(luò)進(jìn)行了聚類分析,挖掘了特定學(xué)科領(lǐng)域的主題,并對領(lǐng)域的熱點和未來發(fā)展方向進(jìn)行了預(yù)判。趙蓉英[22]基于引文數(shù)據(jù)和主題數(shù)據(jù),采用復(fù)雜網(wǎng)絡(luò)分析的方法對特定知識領(lǐng)域的學(xué)科主題和研究熱點進(jìn)行了揭示。
綜上所述,在基于復(fù)雜網(wǎng)絡(luò)的理論與方法對知識相關(guān)問題進(jìn)行研究方面,目前已經(jīng)取得了較為豐富的成果,但其中大多數(shù)研究尚停留在靜態(tài)分析層面。有鑒于此,本研究從時間序列的視角,以領(lǐng)域知識網(wǎng)絡(luò)的時序演化為基礎(chǔ),對領(lǐng)域知識的發(fā)展趨勢從多個方面展開分析研究。
3.1 數(shù)據(jù)采集
本研究以中國國家知識基礎(chǔ)設(shè)施(National Knowledge Infrastructure,CNKI)數(shù)據(jù)庫作為基礎(chǔ)數(shù)據(jù)源,在高級檢索中選擇按主題檢索并將檢索主題設(shè)為“電動汽車”并含“充電樁”,匹配模式為精確,發(fā)表時間為全部年限進(jìn)行檢索。檢索日期為2015年12月25日,共檢索到2009~2015年的相關(guān)期刊文獻(xiàn)共725篇。
以時間序列為線索,以年份為時間刻度,將文獻(xiàn)的累積數(shù)據(jù)按時間窗口分割,并繪制各年文獻(xiàn)累計量曲線。2009~2015年,電動汽車充電樁領(lǐng)域的文獻(xiàn)累計量呈持續(xù)遞增趨勢,具體參見圖1。
圖1 領(lǐng)域文獻(xiàn)累計量曲線
3.2 矩陣構(gòu)建與轉(zhuǎn)換
對檢索出的725篇相關(guān)文獻(xiàn)進(jìn)行關(guān)鍵詞提取,并按年份構(gòu)建領(lǐng)域關(guān)鍵詞的多值共現(xiàn)矩陣,即當(dāng)兩個關(guān)鍵詞出現(xiàn)在同一文獻(xiàn)中時,則其兩者間存在關(guān)聯(lián)關(guān)系,計數(shù)為1。以此累計,當(dāng)數(shù)值越大時,就表明兩個關(guān)鍵詞之間的共現(xiàn)頻次越高,關(guān)系也就越密切。文獻(xiàn)中的關(guān)鍵詞經(jīng)過研究作者和審稿人的多層審核,極少出現(xiàn)歧義、近義等現(xiàn)象,即使個別文獻(xiàn)出現(xiàn)關(guān)鍵詞歧義、近義現(xiàn)象也不做單獨處理,而是通過二值轉(zhuǎn)化時的臨界值統(tǒng)一對不具備普遍意義的關(guān)鍵詞做出篩選。多值共現(xiàn)矩陣中對角線的數(shù)值為關(guān)鍵詞在所有文獻(xiàn)中總共出現(xiàn)的次數(shù)。根據(jù)上述方法對檢索得到的相關(guān)文獻(xiàn)的關(guān)鍵詞提取后,按照時間序列共生成2010~2015年各年的關(guān)鍵詞多值共現(xiàn)矩陣共6個。其中由于2009年文獻(xiàn)僅有兩篇,研究中將其并入2010年關(guān)鍵詞多值共現(xiàn)矩陣,不再單獨討論。以2011年關(guān)鍵詞多值共現(xiàn)矩陣為例,其矩陣結(jié)構(gòu)如表1所示。
表1 2011年關(guān)鍵詞多值共現(xiàn)矩陣(節(jié)選)
以各個時間窗口的共現(xiàn)頻次的均值為臨界值,將上述獲得的6個關(guān)鍵詞多值共現(xiàn)矩陣進(jìn)行二值化處理。即當(dāng)矩陣中兩個關(guān)鍵詞同時出現(xiàn)在一篇文獻(xiàn)中的頻次大于等于均值時,視為具有顯著關(guān)聯(lián)關(guān)系,記為1;如果兩個關(guān)鍵詞同時出現(xiàn)在一篇文獻(xiàn)中的頻次小于均值,則視為不具有顯著的關(guān)聯(lián)關(guān)系,記為0。按此方法對矩陣進(jìn)行轉(zhuǎn)換,可以得到關(guān)鍵詞二值共現(xiàn)矩陣,以便于在后續(xù)研究中對領(lǐng)域知識發(fā)展趨勢進(jìn)行識別與分析。以其中2010年關(guān)鍵詞二值共現(xiàn)矩陣為例,部分?jǐn)?shù)據(jù)如表2所示。
表2 2010年關(guān)鍵詞二值共現(xiàn)矩陣(節(jié)選)
3.3 領(lǐng)域知識網(wǎng)絡(luò)構(gòu)建
以關(guān)鍵詞為節(jié)點,以關(guān)鍵詞之間的顯著關(guān)聯(lián)關(guān)系為連線,基于轉(zhuǎn)換后的6個時間窗口下的關(guān)鍵詞二值共現(xiàn)矩陣,構(gòu)建時間序列領(lǐng)域知識網(wǎng)絡(luò),如圖2所示。
圖2 時間序列領(lǐng)域知識網(wǎng)絡(luò)
在圖2中,各個時間窗口的領(lǐng)域知識網(wǎng)絡(luò)呈現(xiàn)的是領(lǐng)域中較為重要的知識節(jié)點及其關(guān)聯(lián)關(guān)系,由于經(jīng)過臨界值篩選,孤立節(jié)點和低頻次關(guān)聯(lián)關(guān)系已經(jīng)被剔除。因此,基于圖2中的時間序列領(lǐng)域知識網(wǎng)絡(luò)展開分析工作,將能夠較好地把握領(lǐng)域中重要知識的發(fā)展趨勢。
4.1 領(lǐng)域知識網(wǎng)絡(luò)基本屬性分析
在復(fù)雜網(wǎng)絡(luò)中,網(wǎng)絡(luò)密度反映的是節(jié)點間聯(lián)系的密集程度,領(lǐng)域知識網(wǎng)絡(luò)的密度越大,則表明該網(wǎng)絡(luò)的知識節(jié)點間的聯(lián)系就越密集,知識之間產(chǎn)生的相互影響也就越大。表3為該領(lǐng)域6個時間窗口中領(lǐng)域知識網(wǎng)絡(luò)相應(yīng)的密度,由數(shù)據(jù)可以看出領(lǐng)域知識網(wǎng)絡(luò)的密度在時間序列上呈現(xiàn)出下降趨勢。這一現(xiàn)象說明,隨著時間軸的延展,網(wǎng)絡(luò)內(nèi)各知識節(jié)點的整體聯(lián)系程度逐漸松散,大量的知識不斷涌入領(lǐng)域中。這進(jìn)一步表明該領(lǐng)域是一個處于發(fā)展中的學(xué)科領(lǐng)域,正處在不斷成長過程中,相關(guān)的領(lǐng)域知識涉及多個其他學(xué)科領(lǐng)域,是一門與其他學(xué)科交互較多的領(lǐng)域。
表3 時間序列領(lǐng)域知識網(wǎng)絡(luò)整體密度
復(fù)雜網(wǎng)絡(luò)的聚類系數(shù)反映網(wǎng)絡(luò)節(jié)點群落特性的聚集程度,領(lǐng)域知識網(wǎng)絡(luò)的聚類系數(shù)描述出該領(lǐng)域內(nèi)知識之間趨近于團簇或群落的情況。圖2所示的時間序列領(lǐng)域知識網(wǎng)絡(luò)的基于局部密度的聚類系數(shù)計算結(jié)果如表4所示。
表4 時間序列領(lǐng)域知識網(wǎng)絡(luò)聚類系數(shù)
表4中,盡管6個時間窗口的聚類系數(shù)稍有波動,但總體上保持較高的數(shù)值(大于0.88)。這說明在整個時間區(qū)間內(nèi),基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建的領(lǐng)域知識網(wǎng)絡(luò)具有顯著的團簇特征,或者說具有較高程度的模塊結(jié)構(gòu)。即各個時間窗口的領(lǐng)域知識網(wǎng)絡(luò)中,較重要的知識節(jié)點(關(guān)鍵詞)之間具有較高的群落性,并且這種群落性在整個時間區(qū)間內(nèi)一直保持。
對時間序列領(lǐng)域知識網(wǎng)絡(luò)的特征路徑長度進(jìn)行考察,計算獲得6個時間窗口領(lǐng)域知識網(wǎng)絡(luò)的距離分布如表5所示。
表5 時間序列領(lǐng)域知識網(wǎng)絡(luò)距離分布
表5的6個時間窗口中,距離為2的情況一直占有絕對多數(shù),其中最低的比率為占總數(shù)的75%(2013),其他時間窗口都在80%以上。這明確地顯示出,隨著領(lǐng)域知識的發(fā)展,領(lǐng)域中絕大多數(shù)知識之間的距離為2。進(jìn)一步對表5中時間序列領(lǐng)域知識網(wǎng)絡(luò)的平均距離進(jìn)行考察可以發(fā)現(xiàn),雖然隨著時間的推移,網(wǎng)絡(luò)中的知識節(jié)點不斷增加,但網(wǎng)絡(luò)中任何兩個知識節(jié)點之間的平均距離保持在1.803~2.252。這意味著網(wǎng)絡(luò)中2個知識節(jié)點之間僅有一個中間節(jié)點,即領(lǐng)域知識網(wǎng)絡(luò)中知識之間平均通過1個中間知識就可以建立聯(lián)系。
將網(wǎng)絡(luò)密度、聚類系數(shù)和特征路徑長度結(jié)合起來考察可以發(fā)現(xiàn),隨著時間軸的延展,領(lǐng)域知識不斷擴容。在整個時間序列上,該領(lǐng)域的知識網(wǎng)絡(luò)的網(wǎng)絡(luò)密度逐漸下降,網(wǎng)絡(luò)越來越稀疏。而且整個網(wǎng)絡(luò)自始至終保持著高度的聚類性,特征路徑長度總體上為2。結(jié)合圖2的時間序列領(lǐng)域知識網(wǎng)絡(luò)綜合分析,在時間序列的前半階段網(wǎng)絡(luò)是不連通的狀態(tài),時間序列的后半階段網(wǎng)絡(luò)演變?yōu)檫B通網(wǎng)絡(luò)。根據(jù)沃茨(D J Watts)[23]的觀點可知,領(lǐng)域知識網(wǎng)絡(luò)演化的過程中逐漸表現(xiàn)出小世界[5]的特征趨勢。
4.2 領(lǐng)域知識網(wǎng)絡(luò)中心性分析
網(wǎng)絡(luò)的點度中心性反映一個網(wǎng)絡(luò)的核心程度,研究中基于弗里曼(L C Freeman)[24]提出的方法,對基于關(guān)鍵詞二值共現(xiàn)矩陣構(gòu)建的時間序列領(lǐng)域知識網(wǎng)絡(luò)(參見圖2)的點度中心勢進(jìn)行了考察,相關(guān)指標(biāo)數(shù)據(jù)走勢如圖3所示。
圖3 時間序列領(lǐng)域知識網(wǎng)絡(luò)點度中心勢
圖3中領(lǐng)域知識網(wǎng)絡(luò)的點度中心勢并未表現(xiàn)出始終如一的發(fā)展趨勢,而是呈現(xiàn)出一種先抑后揚的態(tài)勢。在時間軸的前半段,領(lǐng)域知識網(wǎng)絡(luò)的點度中心勢逐漸下降,反映出這一時間區(qū)段內(nèi),領(lǐng)域知識不斷擴充,大量的相關(guān)學(xué)科知識參加進(jìn)來,隨著網(wǎng)絡(luò)節(jié)點的增加,領(lǐng)域的核心焦點也趨于淡化。在時間軸的后半段,領(lǐng)域知識網(wǎng)絡(luò)的點度中心勢逐漸上升,反映出這一時間區(qū)段內(nèi),領(lǐng)域知識不斷擴充的同時,領(lǐng)域知識的核心焦點也在重新凝聚。這一現(xiàn)象反映出研究中所選取的知識領(lǐng)域目前正處于發(fā)展時期,一方面發(fā)展過程中不斷加入和涌現(xiàn)的新知識使得核心知識的地位不再顯著;另一方面隨著研究工作的開展,領(lǐng)域核心知識也在重塑甚至新生。領(lǐng)域知識的發(fā)展趨勢最終將走向具有鮮明的領(lǐng)域核心的狀態(tài)。
網(wǎng)絡(luò)的中介中心性反映的是節(jié)點對網(wǎng)絡(luò)資源的控制程度,在領(lǐng)域知識網(wǎng)絡(luò)中,中介中心性能夠描述通過中間知識將不同的知識進(jìn)行橋接的程度。研究中采用弗里曼(L C Freeman)[6]的中介中心性計算方法,對基于關(guān)鍵詞二值共現(xiàn)矩陣構(gòu)建的時間序列領(lǐng)域知識網(wǎng)絡(luò)(參見圖2)的中介中心勢進(jìn)行計算,獲得時間序列領(lǐng)域知識網(wǎng)絡(luò)的中介中心勢走勢如圖4所示。
圖4 時間序列領(lǐng)域知識網(wǎng)絡(luò)中介中心勢
在圖4中,時間序列領(lǐng)域知識網(wǎng)絡(luò)的中介中心勢雖然略有起伏,但整體上呈現(xiàn)出上升趨勢。網(wǎng)絡(luò)中介中心勢由初始時刻的45.69%增長到2015年的60.64%,而且時間軸的后半段比前半段有普遍提高。這一現(xiàn)象說明,在領(lǐng)域知識發(fā)展過程中,盡管網(wǎng)絡(luò)中的知識節(jié)點逐年增加,但是新增的知識節(jié)點并沒有一味地簡單形成小規(guī)模碎片區(qū)域,而是隨著知識節(jié)點數(shù)量的增加,有許多知識節(jié)點通過中間知識建立起連接,并且這種連接呈現(xiàn)出總體上升趨勢。與圖2中領(lǐng)域知識網(wǎng)絡(luò)結(jié)構(gòu)的時間序列發(fā)展過程結(jié)合考察,領(lǐng)域知識網(wǎng)絡(luò)從早期的不連通狀態(tài)到后期的聯(lián)通狀態(tài),反映出該領(lǐng)域知識在發(fā)展過程中也在不斷地成熟。
本研究通過對特定領(lǐng)域文獻(xiàn)關(guān)鍵詞的提取,基于關(guān)鍵詞共現(xiàn)關(guān)系構(gòu)建基于關(guān)鍵詞的領(lǐng)域知識網(wǎng)絡(luò)。從時間序列的視角采用網(wǎng)絡(luò)密度、聚類系數(shù)、特征路徑長度、點度中心勢、中介中心勢等多種分析方法,對領(lǐng)域知識網(wǎng)絡(luò)的發(fā)展態(tài)勢進(jìn)行跟蹤與分析。通過各項指標(biāo)在時間序列上的變化情況,對于領(lǐng)域知識的發(fā)展趨勢初步可以得出如下結(jié)論:
(1)領(lǐng)域知識的發(fā)展趨勢總體上向小世界狀態(tài)邁進(jìn)。研究中發(fā)現(xiàn),一個特定的知識領(lǐng)域在其成長發(fā)展過程中,領(lǐng)域內(nèi)相關(guān)知識文獻(xiàn)必然是不斷地積累和增長,從而促使領(lǐng)域內(nèi)的知識容量與規(guī)模不斷擴大。從時間序列上看,這種領(lǐng)域知識的不斷擴充導(dǎo)致領(lǐng)域知識網(wǎng)絡(luò)內(nèi)部知識節(jié)點數(shù)量的不斷增加,也使得知識網(wǎng)絡(luò)的密度在發(fā)展過程中呈下降趨勢。密度下降的同時,領(lǐng)域知識網(wǎng)絡(luò)卻一直保持著較高的聚類系數(shù),這種高聚類系數(shù)標(biāo)志著領(lǐng)域知識內(nèi)部蘊含著團簇化、群落化的潛在發(fā)展模式。如果說從大的方面看,知識領(lǐng)域內(nèi)部高內(nèi)聚,知識領(lǐng)域之間低耦合,那么這種高內(nèi)聚低耦合的特征也嵌套于知識領(lǐng)域內(nèi)部。由于知識領(lǐng)域自身的主題性,高聚類系數(shù)并沒有在領(lǐng)域內(nèi)部完全徹底地造成割據(jù),反而是較短的特征路徑長度刻畫出領(lǐng)域內(nèi)部知識之間僅需少量知識就能夠聯(lián)系起來。這說明在領(lǐng)域知識的不斷積累增長過程中,其發(fā)展趨勢在總體上向小世界狀態(tài)邁進(jìn)。
(2)領(lǐng)域知識的中心性會隨著知識發(fā)展逐漸顯現(xiàn)。一方面,在復(fù)雜網(wǎng)絡(luò)理論中,小世界狀態(tài)除了較高的聚類系數(shù)和較短的特征路徑長度特征外,往往還伴隨著去中心化。然而在針對時間序列領(lǐng)域知識網(wǎng)絡(luò)的中心性分析中發(fā)現(xiàn),在時間軸的前半段,領(lǐng)域知識網(wǎng)絡(luò)的點度中心勢呈現(xiàn)下降趨勢,領(lǐng)域核心知識的顯著性并沒有趕上領(lǐng)域知識擴充的步伐。然而隨著該知識領(lǐng)域逐漸發(fā)展成熟,網(wǎng)絡(luò)的點度中心勢在時間軸的后半段又逐年遞增,領(lǐng)域的知識核心被重新凝聚。另一方面,網(wǎng)絡(luò)的中介中心勢在整個時間區(qū)間內(nèi)呈現(xiàn)波動性上升趨勢,也就是說盡管新知識的擴充和加入給中介中心勢造成波動,在整體趨勢上領(lǐng)域知識網(wǎng)絡(luò)的中介中心勢卻保持著增長勢頭。這與領(lǐng)域知識的小世界趨勢相契合的同時,也進(jìn)一步說明隨著領(lǐng)域知識的發(fā)展,更多的領(lǐng)域知識通過中間知識彼此建立了關(guān)聯(lián)關(guān)系,彰顯了格雷克(J Gleick)[24]在《信息簡史》中反復(fù)強調(diào)的知識的連通性。
盡管本研究以特定領(lǐng)域知識的發(fā)展過程為對象,采用復(fù)雜網(wǎng)絡(luò)的諸多分析方法,從領(lǐng)域知識網(wǎng)絡(luò)演化的角度,對領(lǐng)域知識的發(fā)展趨勢進(jìn)行了較為細(xì)致的分析,但是研究中也還存在不足之處。所采用研究數(shù)據(jù)并沒有窮盡該領(lǐng)域知識的全部,不同知識領(lǐng)域所處的不同發(fā)展?fàn)顟B(tài)尚不全面,有待于未來工作中進(jìn)一步深入展開研究。
[1] Price D J. Networks of scientific papers [J]. Science, 1965, 149(3683):510-515.
[2] Lewis T G.網(wǎng)絡(luò)科學(xué):原理與應(yīng)用[M].陳向陽,巨修煉,等,譯.北京:機械工業(yè)出版社,2011:87-140.
[3] Brooks B C. The foundations of information science: part IV. Information science: the changing paradigm [J]. Journal of Information Science, 1981, 3(1): 3-12.
[4] Egghe L, Rousseau R. Introduction to informetrics: quantitative methods in library, documentation and information science [M]. Amsterdam:Elsevier, 1990: 112.
[5] Milgram S. The small world problem [J]. Psychology Today, 1967, 1(1):61-67.
[6] Freeman L C. Centrality in social networks conceptual clarification [J]. Social Networks, 1979, 1(3): 215-239.
[7] Strogatz S H, Watts D J. Collective dynamics of "small world" networks [J]. Nature, 1998, 393(6684): 440-442.
[8] Barabasi A L, Albert R. Emergence of scaling in random networks [J]. Science, 1999, 286(5439): 509-512.
[9] Cross R, Parker A, Borgatti S P. A bird's-eye view: using social network analysis to improve knowledge creation and sharing [R]. Somers: IBM Corporation, 2002: 1-17.
[10] Liebowitz J. Linking social network analysis with the analytic hierarchy process for knowledge mapping in organizations [J]. Journal of Knowledge Management, 2005, 9(1): 76-86.
[11] Sarker S, Kirkeby S, et al. Path to "stardom" in globally distributed teams:an examination of a knowledge-centered perspective using social network analysis [J]. Decision Sciences, 2011, 42(2): 339-370.
[12] Wilson G, Banzhaf W. Discovery of email communication networks from the enron corpus with a genetic algorithm using social network analysis [C]// CEC'09 Proceedings of the Eleventh conference on Congress on Evolutionary Computation. Piscataway: IEEE Press, 2009:3256-3263.
[13] Hu C, Racherla P. Visual representation of knowledge networks: A social network analysis of hospitality research domain [J]. International Journal of Hospitality Management, 2008, 27(2): 302-312.
[14] Yang J, Shen Q, Ho M. An overview of previous studies in stakeholder management and its implications for the construction industry [J]. Journal of Facilities Management, 2009, 7(2): 159-175.
[15] Coscia M, Giannotti F, Pensa R. Social network analysis as knowledge discovery process: a case study on digital bibliography [C]// ASONAM '09 Proceedings of the 2009 International Conference on Advances in Social Network Analysis and Mining. Washington DC: IEEE Computer Society, 2009: 279-283.
[16] Krafft J, Quatraro F, Saviotti P P. The knowledge base evolution in biotechnology: A social network analysis [J]. Economics of Innovation and New Technology, 2011, 20(5): 445-475.
[17] Pham M C, Klamma R, Jarke M. Development of computer science disciplines—A social network analysis approach [J]. Social Network Analysis and Mining, 2011, 1(4): 321-340.
[18] 邱均平,王菲菲.基于SNA的國內(nèi)競爭情報領(lǐng)域作者合作關(guān)系研究[J].圖書館論壇,2010,30(6):34-40,134.
[19] 李綱,李春雅,李翔.基于社會網(wǎng)絡(luò)分析的科研團隊發(fā)現(xiàn)研究[J].圖書情報工作,2014,58(7):63-70,82.
[20] 朱慶華,李亮.社會網(wǎng)絡(luò)分析法及其在情報學(xué)中的應(yīng)用[J].情報理論與實踐,2008,31(2):179-183.
[21] 劉則淵,尹麗春.國際科學(xué)學(xué)主題共詞網(wǎng)絡(luò)的可視化研究[J].情報學(xué)報,2006,25(5):634-640.
[22] 趙蓉英,王菊.圖書館學(xué)知識圖譜分析[J].中國圖書館學(xué)報, 2011,37(3):40-50.
[23] Watts D J. Network, dynamics and the small-world phenomenon [J]. American Journal of Sociology, 1999, 105(2): 493-527.
[24] Gleick J.信息簡史[M].高博,譯.北京:人民郵電出版社,2013:409-421.
趙汝南,女,1991年生,碩士研究生。
常志遠(yuǎn),男,1989年生,碩士研究生。
姜博,男,1983年生,碩士研究生。
劉雅姝,女,1993年生,碩士研究生。
陳思,女,1993年生,碩士研究生。
滕廣青,男,1970年生,副教授,研究方向:網(wǎng)絡(luò)信息資源管理,通訊作者,E-mail:tengguangqing@163.com。
Study on Development Tendency of Domain Knowledge Based on Network Evolution
ZHAO RuNan, CHANG ZhiYuan, JIANG Bo, LIU YaShu, CHEN Si, TENG GuangQing
(School of Computer Science and Information Technology NENU, Changchun 130117, China)
Evolution and development of knowledge is an important issue of Library and Information academia. In this study, from the perspective of time series, keywords of literature are extracted in particular domain, and domain knowledge networks are constructed based on keyword co-occurrence relationship. Using a variety of analytical methods network density, clustering coefficient, characteristic path length, degree centralization, betweenness centralization, etc., the development of situation in domain knowledge networks is tracked and analyzed. The results show that the overall trend of domain knowledge development is moving to the status of small world, and centrality of domain knowledge will appear gradually with the development of knowledge. A helpful attempt is made for analyzing and judgment on development tendency of domain knowledge based on complex network theory and methods.
Complex Network; Domain Knowledge; Knowledge Network
G353.1
10.3772/j.issn.1673-2286.2016.3.004
2016-02-01)