高晶利
〔摘 要〕本文首先介紹了社會網(wǎng)絡分析方法,并采用該方法分別從“中心性分析”、“凝聚子群分析”、以及“核心——邊緣結構分析”3個角度,對CNKI上的知識圖譜領域的合著網(wǎng)絡進行了實證研究。通過分析,指出了合著網(wǎng)絡中高產核心作者,發(fā)現(xiàn)了合著網(wǎng)絡中的聯(lián)系凝聚子群,評價了學者在合著網(wǎng)絡中的地位。
〔關鍵詞〕社會網(wǎng)絡分析;知識圖譜;合著網(wǎng)絡;可視化
DOI:10.3969/j.issn.1008-0821.2012.01.024
〔中圖分類號〕G303 〔文獻標識碼〕A 〔文章編號〕1008-0821(2012)01-0102-05
Analysis on Author Cooperation Relationship of Mapping
Knowledge Research in China Based on SNAGao Jingli
(School of Management,Tianjin Normal University,Tianjin 300387,China)
〔Abstract〕This paper firstly introduced the method of Social Network Analysis and investigated coauthorship network in domestic Mapping Knowledge research by selecting coauthors of the Journal of CNKI using Social Network Analysis from the angle of centrality analysis,subgroup analysis and core-periphery analysis.It indicated the researchers in the coauthor network,discovered several subgroups with close links between their members and distinguished key authors in the network.
〔Key words〕social network analysis;mapping knowledge domains;co-authorship network;visualization
隨著科學的發(fā)展,學科專業(yè)化程度的提高,合作將成為科研者交流的主流范式。日趨頻繁的科研合作,反映在學術論文中,則表現(xiàn)為合著現(xiàn)象越來越多,合著規(guī)模亦越來越大。研究者之間通過合作發(fā)表論文,就形成了一個合著網(wǎng)絡,該網(wǎng)絡能夠比較真實地反映科研者之間的合作關系。
社會網(wǎng)絡指的是行動者及他們之間關系的集合,也可以說,一個社會網(wǎng)絡是由多個點(社會行動者)和各點之間的連線(行動者之間的關系)組成的集合[1]。研究合著現(xiàn)象,其本質就是研究作者之間的關系,社會網(wǎng)絡分析方法正是以研究關系見長的方法。社會網(wǎng)絡分析方法(Social Network Analysis,簡稱SNA)可以借助可視化工具Netdraw構建出展現(xiàn)分析主體之間的錯綜復雜關系的網(wǎng)絡結構圖[2]。將SNA應用于文獻計量學研究,可以通過“中心性分析”、“凝聚子群分析”、“核心——邊緣分析”,可以找出核心作者和聯(lián)系緊密的小團體并評價作者在整個網(wǎng)絡中的地位。
本文正是基于以上的研究角度,運用社會網(wǎng)絡分析軟件對國內知識圖譜領域的科研合作關系網(wǎng)絡進行深層次的分析,探析我國知識圖譜研究領域的“核心作者”、聯(lián)系緊密的“凝聚子群”以及合著網(wǎng)絡中的“核心——邊緣人物”。以期為知識圖譜領域的科研交流和學科發(fā)展提供一些啟示。
1 研究方法
1.1 研究對象
本研究以CNKI中國學術期刊網(wǎng)絡出版總庫作為數(shù)據(jù)來源。用軟件NoteExpress2在線檢索CNKI數(shù)據(jù)庫,以“主題”為檢索字段,用“知識圖譜”作為檢索詞,檢索CNKI數(shù)據(jù)庫中從1979-2011年期間的論文。本次最后數(shù)據(jù)更新時間為2011年10月20日。共檢索出相關文獻226個,除去非論文文獻,得到221篇論文。以年為單位統(tǒng)計論文數(shù)量,繪制成發(fā)文量變化趨勢圖,見圖1。
圖1 知識圖譜論文年度發(fā)文量變化趨勢
從圖1中可以看出,從2005年才開始出現(xiàn)有關知識圖譜的論文。2005-2011年(截止2011年10月20日)這6年期間發(fā)文量是呈直線上升的趨勢,發(fā)文量變化趨勢線略呈現(xiàn)“J”型,也就是說,所發(fā)表論文的數(shù)量基本上是符合文獻增長的初始階段的“指數(shù)增長規(guī)律”即“普賴斯曲線”的。對上述收集到的221篇論文的作者進行相關的Excel統(tǒng)計分析、作者編號、發(fā)文量排序最后形成如下表所示的作者發(fā)文量分布表,見
(篇)1劉則淵3115廖勝姣52許振亮1716欒春娟53侯海燕1517沈洪洲44姜春林1218許麗敏45陳 悅1119秦長江46趙蓉英920李江波47宗乾進821杜維濱48葛 莉722侯劍華49湯建民723王賢文410王 琪624陳立新411陳蘭杰625尹麗春412梁永霞6………13袁勤儉5269赫爾頓114趙玉鵬5
2012年1月第32卷第1期基于SNA國內知識圖譜領域科研合作關系研究Jan.,2012Vol.32 No.1在本次研究中,將每篇論文的作者看成是一個數(shù)據(jù)樣本,構建合著網(wǎng)絡時,用“1”表示兩位作者之間存在合著關系,用“0”表示兩位作者之間不存在合著關系[3]。本研究將作者共同署名發(fā)表論文的就視為他們之間存在合作關系,對全部的221個樣本數(shù)據(jù)關系進行累計統(tǒng)計,最后形成了一份總計269位作者的合著關系矩陣,見表2。
表2 合著者關系矩陣
劉則淵許振亮侯海燕姜春林陳 悅趙蓉英宗乾進葛 莉湯建民…劉則淵189295許振亮81334侯海燕933232姜春林2222陳 悅93321趙蓉英宗乾進1葛 莉54212湯建民3
1.2 研究角度
本文主要是從“中心性分析”、“凝聚子群分析”、“核心——邊緣結構分析”這3個角度對構建的合著網(wǎng)絡進行分析。
1.2.1 中心性分析
中心性是測量一個行動者在整個關系網(wǎng)絡中的重要程度的關鍵指標。中心度可以分為3種形式:點度中心度(Degree centrality)、中間中心度(Betweenness centrality)和接近中心度(Closeness centrality)。
(1)點度中心度
點度中心度是用來測量一個點在網(wǎng)絡中的占據(jù)的核心程度的指標。在一個網(wǎng)絡中,如果一個行動者與很多其他行動者之間存在直接聯(lián)系,那么該行動者就居于中心地位,在該網(wǎng)絡中擁有較大的“權力”。網(wǎng)絡中的點度中心度,可以用網(wǎng)絡中與其直接聯(lián)系的點的數(shù)目來測量。點度中心度分為絕對點度中心度和相對點度中心度。絕對點度中心度是與該點直接相連的點的個數(shù),后者是前者的標準化形式。
(2)中間中心度
中間中心度測量的是一個點在多大程度上位于圖中其他點的“中間”。在一個網(wǎng)絡中,如果一個行動者處于許多其他兩點之間的路徑上,可以認為該行動者居于重要地位,因為他具有控制其他兩個行動者之間的交往的能力。
(3)接近中心度
接近中心度研究的是行動者在多大程度上不受其他行動者的控制的能力[4]。在一個網(wǎng)絡中,如果一個點通過比較短的路徑與許多其他點相連,我們就說該點具有較高的接近中心性。因為接近中心性計算的節(jié)點與其他點的距離,距離越短,表明該點越容易到達其他點,因此接近中心性越小的節(jié)點在網(wǎng)絡中越處于核心地位。
本次研究對合著網(wǎng)絡進行中心性分析的目的是分析各個節(jié)點(即各個作者)的中心性,以了解他們在合著網(wǎng)絡中所處的地位。
1.2.2 凝聚子群分析
在社會網(wǎng)絡分析中,進行凝聚子群分析有多種方法,如建立在“互惠性”基礎上的派系分析;建立在“可達性和直徑”基礎上的n-派系分析和n-宗派分析;建立在“點度數(shù)”基礎上的k-從分析和k-核分析;建立在“子群內外關系”基礎上的成分分析、塊模型分析以及Lambda集合分析。
(1)派系分析
所謂派系又叫小團體或凝聚子群,是指在社會網(wǎng)絡中聯(lián)系緊密的成員的集合,凝聚子群內部成員聯(lián)系的緊密程度遠大于成員與其他子群之間的聯(lián)系。在社會網(wǎng)絡分子中,派系分析就是研究一個社會網(wǎng)絡中存在多少個這樣的小團體。
(2)凝聚子群密度
凝聚子群密度用于測量派系林立的程度。凝聚子群的密度是子群密度與整個網(wǎng)絡的密度之比,它的取值范圍為[-1,+1]。該值越接近-1,表明子群體之間的外部關系越少,關系主要發(fā)生在群體之內,意味著派系林立程度越大;該值越接近1,表明關系越趨向于發(fā)生在群體之外,意味著派系林立的程度越??;該值越接近0,表明派系內外關系數(shù)量相差不多,關系越趨向于隨機分布,看不出派系林立的情形[1]。
1.2.3 核心——邊緣結構分析
核心——邊緣結構分析根據(jù)網(wǎng)絡中節(jié)點之間聯(lián)系的緊密程度,將網(wǎng)絡中的節(jié)點分為兩個區(qū)域,核心區(qū)域和邊緣區(qū)域。處于核心區(qū)域的節(jié)點在網(wǎng)絡中占有比較重要的地位。核心——邊緣結構分析(core-periphery)的目的是研究社會網(wǎng)絡中哪些節(jié)點處于核心地位,哪些節(jié)點處于邊緣地位。核心作者分析一直是文獻計量學的重要研究內容,而社會網(wǎng)絡分析方法中的核心——邊緣結構分析可以對網(wǎng)絡的“位置”結構進行量化分析,區(qū)分出網(wǎng)絡的核心與邊緣,因此,可以借助核心——邊緣結構分析方法來分析在合著網(wǎng)絡中哪些作者處于核心地位,哪些作者處于非核心地位。
1.3 研究工具
社會網(wǎng)絡分析軟件有很多,在本次研究中的數(shù)據(jù)分析是通過UCINET6.0軟件來完成的。UCINET是由社會網(wǎng)絡分析領域的知名學者Borgatti、Everett和Freeman合作開發(fā)的。它是一個用來處理社會網(wǎng)絡數(shù)據(jù)的軟件包,是科研者比較常用的一款社會網(wǎng)絡分析軟件,它能讀取多種不同形式的數(shù)據(jù),如文本文件和Excel文件。它能處理的網(wǎng)絡節(jié)點是32 767個[5]。但從實際情況來看,當節(jié)點個數(shù)超過5 000時,一些程序的運行就會變得很慢。UCINET6.0還集成了一個社會網(wǎng)繪圖軟件NetDraw[6]。NetDraw可以用可視化的方式將整個網(wǎng)絡結構形象的用關系圖表示出來。
2 研究結果分析
在UCINET中,可以使用Netdraw實現(xiàn)對整個合作關系網(wǎng)絡結構的可視化,繪制出合作關系網(wǎng)絡的結構圖,見圖2。圖2 知識圖譜作者合作關系網(wǎng)注:本文旨在說明社會網(wǎng)絡分析法在作者合作網(wǎng)絡的應用,故用數(shù)字代替研究人員的姓名
圖2中每一個節(jié)點的大小表示該作者發(fā)文量多少,節(jié)點越大表示該作者發(fā)表論文越多;線條的粗細表示每一個合作對之間的合作次數(shù),線條越粗,表示兩個作者之間合作的次數(shù)越多,其中同屬于大連理工大學21世紀發(fā)展研究中心WISE Lab的1(劉則淵)和3(侯海燕)以及1(劉則淵)和5(陳悅)連線最粗,這兩對作者合作發(fā)表論文均為9篇,合作關系比較緊密。從圖中可以看出,整個關系網(wǎng)絡結構式比較松散的,很少有較大的網(wǎng)絡,經統(tǒng)計發(fā)現(xiàn)有13%的學者在網(wǎng)絡圖是孤立點,即獨著發(fā)表論文,19%的學者是兩兩合著,僅有22%的學者之間是有存在大范圍合作。這樣松散的合作關系網(wǎng)絡,不利于學科之間的知識共享和信息交流。
2.1 中心性分析
2.1.1 點度中心性
在UCINET中,點度中心性分析的菜單路徑為Network>Centrality>Degree。以下是分析的結果,見表3。
在上述結果中,第一列(Degree)是絕對中心度,第二列(NrmDegree)是相對中心度。這個結果是針對合著者之間關系的有向圖來計算的[7]。從結果中可以看出,點度中心度最高的是劉則淵,其絕對點度中心度是26。根據(jù)點度中心度的定義,表明其與網(wǎng)絡中其他26個節(jié)點有直接聯(lián)系,即劉則淵與網(wǎng)絡中的26位作者有過77人次的合作關系。絕對中心度的最低值是0,說明該作者沒有和其他人合著發(fā)表過論文。
2.1.2 中間中心性
在UCINET中,中間中心性分析的菜單路徑是Network>Centrality>Betweenness>Nodes。以分析的結果,見表4。
從分析結果中可以看出,中間中心度最高的是劉則淵,其次是許振亮、姜春林等人。這些作者的中間中心性比較高,說明他們掌握了比較多的研究資源,具有較高的控制資源的能力。同時,有一些作者的接近中心性為0,說明這些作者幾乎不具備控制資源的能力。統(tǒng)計所有 作者的中間中心度,發(fā)現(xiàn)有228位作者的中間中心度為0,占全部作者總數(shù)的84.7%,這個比 例是十分高的。同時,中間中心度比較高的作者較少。這也表明大多數(shù)作者并不具有控制資 源的能力,只有很少的作者具有比較高的控制資源的能力。表4 中間中心性分析結果
nBetweenness劉則淵750.4202.097許振亮443.0381.238姜春林389.1831.088侯海燕371.2551.038陳 悅197.2370.551胡志剛168.0000.470欒春娟131.8130.368趙蓉英125.0000.349………李亞敬0.0000.000
2.1.3 接近中心性
本文構建的合著網(wǎng)絡不是一個完全相連圖形,因此不能直接計算其接近中心性,必須先進行成分分析。通過對本文合著網(wǎng)絡進行成分分析,發(fā)現(xiàn)網(wǎng)絡中最大的成分包含60個行動者,下面是該成分進行接近中心性分析的結果,見表5。表5 接近中心性分析結果
nCloseness劉則淵98.00060.204侯海燕109.00054.128陳 悅118.00050.000許振亮121.00048.760許麗敏124.00047.581袁勤儉125.00047.200欒春娟126.00046.825姜春林128.00046.094………余新麗0.0000.000
前已述及,接近中心性越小的節(jié)點在網(wǎng)絡中處于核心地位。從結果中可以看出,劉則淵的接中心度最小,說明他能以最短的路徑到達其他節(jié)點,在網(wǎng)絡中處于比較核心的地位。由于該接近中性計算是針對網(wǎng)絡中最大的成分進行分析的,因此其結果和前面的中間中心性分析的結果表現(xiàn)出比較大的差異。
接近中心性和中間中心分析指數(shù)都比較高的作者是與他人有多次合作并且發(fā)表論文數(shù)量較多的學者。比如,劉則淵他的中間中心性位于第一位,在接近中心性分析果中位于第一位,其發(fā)表的論文數(shù)量也位于第一位。同時,他的點度中心度也是最高的,說明與他有合著關系的作者也是最多的。
2.2 凝聚子群分析
2.2.1 派系分析
在UCINET中,派系分析的菜單路徑為Network>Subgroups>Cliques。
分析結果顯示,當“最少成員數(shù)”為3時共存在66個派系,派系之間存在大量的共享成員,當“最少成員數(shù)”為4時共存在35個派系。對派系成員進行整個最后共得到13個派系,分析結果見表6。表6 派
2.2.2 凝聚子群密度
在UCINET中,凝聚子群密度分析的菜單路徑為Network>Cohesion>E-I index。通過分析,發(fā)現(xiàn)該網(wǎng)絡的凝聚子群密度非常顯著,達到了-0.818。前已述及,E-I指數(shù)的值越向-1靠近,表明關系越趨向于發(fā)生在群體之內,意味著派系林立的程度越小。研究結果表明,本文合著網(wǎng)絡的中派系林立的程度非常小,小團體內部的學者之間聯(lián)系緊密。在信息分享和科研合作方面交往頻繁,而處于子群外部的成員則不能得到足夠的信息和科研合作機會。從某種程度上來說,這種情況不利于學科總體的發(fā)展。
2.3 核心——邊緣結構分析
在UCINET中,核心——邊緣結構分析的菜單路徑為Network>Core/Periphery>Categorical。
分析結果顯示,劉則淵、許振亮、侯海燕、姜春林、陳悅、葛莉、梁永霞、侯劍華、王賢文、尹麗春、龐杰這11位處于核心位置, 其余258位處于邊緣位置。在文獻計量學中,根據(jù)普賴斯定律,即“高產作者中一位最低產的作者發(fā)表的論文數(shù)量,等于最高產作者所發(fā)表論文數(shù)的平方根的0.749倍”[8]。在本文的合著者群中,最高發(fā)文量為31,計算出“核心作者”的發(fā)文數(shù)量應該在4.17以上,因此,可以定義發(fā)表論文數(shù)量在5篇以上的作者為“核心作者”統(tǒng)計發(fā)現(xiàn),共有16位“核心作者”。核心-邊緣結構分析的結果將11位學者置于核心位置,這就說明剩下5名學者符合“普賴斯定律”下的“高產核心作者”,但是,他們與其他學者之間的聯(lián)系甚少,在核心-邊緣結構分析的結果就沒能置于核心位置。
對這11位核心作者中有8位作者來自大連理工大學21世紀發(fā)展研究中心WISE Lab。說明該團隊在知識圖譜領域的科研能力是比較強的。核心作者在一個單位集中的現(xiàn)象了也體現(xiàn)出了學術界的馬太效應,即“窮則愈窮,富則愈富”。越是高產作者,越是權威作者就有可能獲得比別人更多的機會,在學術上的體現(xiàn)就是,高產權威的作者的論文的被引頻率比較高,而且比較容易在核心期刊上發(fā)表論文,以及比較容易獲得國家項目等等。
3 結 論
合著分析一直是情報學研究的重要課題,本文采用社會網(wǎng)絡分析方法分別從中心性、凝聚子群和核心——邊緣結構3個角度進行合著網(wǎng)絡分析,為合著分析的研究提供了一個全新的視角。
中心性分析結果表明,點度中心性分析區(qū)分出了我國知識圖譜領域的高產核心作者,中間中心性分析發(fā)現(xiàn)在該領域只有很少的作者具有比較高的控制資源的能力。接近中心性分析有密切聯(lián)系的“子群”是比較少的,說明從整體來看,本文合著網(wǎng)絡節(jié)點之間的合作聯(lián)系并不緊密,很多作者都沒有和其他作者建立直接聯(lián)系。凝聚子群分析結果表明,合著網(wǎng)絡的中派系林立的程度非常大,處于子群內部的學者之間聯(lián)系緊密,在信息分享和科研合作方面交往頻繁,而處于子群外部的成員則不能得到足夠的信息和科研合作機會。這種信息交流的模式不利于學科總體發(fā)展。核心——邊緣分析結果表明,高產核心作者分布比較集中于大連理工大學21世紀發(fā)展研究中心WISE Lab,表明該學校在知識圖譜方面的科研是走在學術界的前列。高產核心作者的形成也是馬太效應作用的結果。
通過本文的分析,區(qū)分出了我國知識圖譜領域的權威核心作者,為后續(xù)學者的研究提供了關鍵的切入點,同時,也指出了現(xiàn)在我國知識圖譜領域合著研究存在的一些現(xiàn)象,如合著范圍和強度較少等問題,希望可以為我國知識圖譜領域的學科發(fā)展、知識交流提供一定指引。
參考文獻
[1]劉軍.整體網(wǎng)分析講義——UCINET軟件應用[M].上海人民出版社,2009:105-106,134.
[2]劉則淵,尹麗春.國際科學學主題共詞網(wǎng)絡的可視化研究[J].情報學報,2006,(5):634-640.
[3]邱均平,李佳靚.基于社會網(wǎng)絡分析的作者合作網(wǎng)絡對比研究——以《情報學報》、《JASIST》和《光子學報》為例[J].情報雜志,2010,29(11):1-5.
[4]李亮,朱慶華.社會網(wǎng)絡分析方法在合著分析中的實證研究[J].情報科學,2008,26(4):549-555.
[5]Freeman L C.Centrality in social networks:Conceptual clarification.Social Networks,1979,(6):215-239.
[6]Borgatti S P,Everett M G,and Freeman L C.Ucinet for Windows:Software for Social Network Analysis[M].Harvard,MA:Analytic Technologies,2002:1-25.
[7]張秀梅,吳巍.科研合作網(wǎng)絡的可視化及其在文獻檢索服務中的應用[J].情報學報,2006,25(1):9-15.
[8]馬費成,等.信息資源管理[M].武漢:武漢大學出版社,2006:72,85.