段宇鋒,劉 璇
(華東師范大學(xué)商學(xué)院信息學(xué)系,上海 200241)
社會(huì)網(wǎng)絡(luò)分析運(yùn)用于學(xué)術(shù)人才挖掘的研究
段宇鋒,劉 璇
(華東師范大學(xué)商學(xué)院信息學(xué)系,上海 200241)
以圖書(shū)情報(bào)領(lǐng)域1999-2008年間的發(fā)文作者為主要研究對(duì)象建立起合著網(wǎng)絡(luò),用傳統(tǒng)的專家調(diào)查法確立20位學(xué)術(shù)權(quán)威,發(fā)現(xiàn)這20位學(xué)術(shù)權(quán)威與合著網(wǎng)絡(luò)中隨機(jī)抽取的1 000位作者的四個(gè)指標(biāo)值:頂點(diǎn)值、點(diǎn)度中心度、中間中心度和接近中心度存在顯著差異。以這20位學(xué)術(shù)權(quán)威的指標(biāo)值為基準(zhǔn),挖掘出符合條件的其他17位學(xué)術(shù)人才,對(duì)這17位學(xué)術(shù)人才進(jìn)行問(wèn)卷調(diào)查判斷他們的權(quán)威性。研究證明,社會(huì)網(wǎng)絡(luò)分析法運(yùn)用于發(fā)現(xiàn)學(xué)術(shù)人才是有效而可行的。
社會(huì)網(wǎng)絡(luò)分析法;人才挖掘;學(xué)術(shù)
人才評(píng)價(jià)是科研管理與評(píng)價(jià)的重要理論和實(shí)踐內(nèi)容。目前,人才評(píng)價(jià)主要采用文獻(xiàn)統(tǒng)計(jì)和引文分析方法,依據(jù)發(fā)表的成果數(shù)量、被引量以及H指數(shù)等指標(biāo)。然而,引用性質(zhì)的差異、引文數(shù)據(jù)庫(kù)的缺陷、“馬太”效應(yīng)等對(duì)評(píng)價(jià)結(jié)果的影響也一直為人們所詬病。因?yàn)檠芯亢献魇菍W(xué)者之間關(guān)系的直接反映,也是體現(xiàn)其學(xué)術(shù)地位的重要形式。所以,合作關(guān)系分析可以為人才評(píng)價(jià)提供客觀依據(jù)。為此,筆者的研究以科研合作為依據(jù),探索性地將社會(huì)網(wǎng)絡(luò)分析方法運(yùn)用于人才的評(píng)價(jià)和挖掘。
社會(huì)網(wǎng)絡(luò)分析萌芽于20世紀(jì)30年代,形成于20世紀(jì)60年代。檢索EBSCO數(shù)據(jù)庫(kù),2000年以前,以社會(huì)網(wǎng)絡(luò)分析為主題的文獻(xiàn)僅64篇,2008年增長(zhǎng)到369篇。社會(huì)網(wǎng)絡(luò)分析已被運(yùn)用到合著和引文網(wǎng)絡(luò)研究、競(jìng)爭(zhēng)情報(bào)、知識(shí)管理、網(wǎng)絡(luò)信息資源評(píng)價(jià)以及圖書(shū)館資源配置等眾多領(lǐng)域[1-10]。
社會(huì)網(wǎng)絡(luò)分析主要集中在中心性、凝聚子群和核心-邊緣結(jié)構(gòu)三個(gè)方面,本研究?jī)H涉及中心性分析。Evelien Otte等計(jì)算出信息科學(xué)領(lǐng)域的點(diǎn)度中心度指標(biāo)用以判斷網(wǎng)絡(luò)的中心作者[11];Zhu Weizhon等特別探討了PageRank和中心度指標(biāo)之間的關(guān)系,提出可以利用中間中心度作為參數(shù)對(duì)PageRank進(jìn)行加權(quán)計(jì)算[12];Jordi Palau等介紹了如何利用點(diǎn)入度中心度和點(diǎn)出度中心度衡量人與團(tuán)體的合作程度[13]。國(guó)內(nèi)學(xué)者付允等指出中心性指標(biāo)能夠反映出作者在合作網(wǎng)絡(luò)中的核心性及中心地位,中心性越高的作者具有較高學(xué)術(shù)地位和較大影響力[14];梁瀟研究發(fā)現(xiàn)信息加權(quán)的中心度可以用來(lái)尋找信息流動(dòng)中的活躍分子以及衡量各主體在整個(gè)網(wǎng)絡(luò)中的地位[15];邱均平將中心度指標(biāo)作為判斷圖林博客核心的標(biāo)準(zhǔn),認(rèn)為中心度可以反映博客的重要程度,中心度高的博客可以看做博客圈中的核心且在圈子中有比較高的地位[9];此外,孟微、龐景安將中心性的三個(gè)重要參數(shù):度、介數(shù)和接近度(即點(diǎn)度中心度、中間中心度和接近中心度)應(yīng)用于情報(bào)學(xué)科研合著網(wǎng)絡(luò)的實(shí)證研究,發(fā)現(xiàn)作者三個(gè)指標(biāo)值的排名存在一定的差異,同時(shí)具備三項(xiàng)高指標(biāo)的作者很少[16];蘇娜根據(jù)社會(huì)網(wǎng)絡(luò)分析的中心性指標(biāo)對(duì)數(shù)字圖書(shū)館領(lǐng)域的研究趨勢(shì)進(jìn)行分析和預(yù)測(cè),結(jié)果表明社會(huì)網(wǎng)絡(luò)分析指標(biāo)與其他方法相結(jié)合可以很好地識(shí)別學(xué)科領(lǐng)域的研究趨勢(shì)[17];魏瑞斌利用社會(huì)網(wǎng)絡(luò)分析方法對(duì)關(guān)鍵詞網(wǎng)絡(luò)進(jìn)行分析,發(fā)現(xiàn)領(lǐng)域的研究熱點(diǎn)和研究?jī)?nèi)容的分布結(jié)構(gòu)特征[18];鄭曦、孫建軍構(gòu)建了鏈接分析領(lǐng)域的作者合作網(wǎng)絡(luò),通過(guò)中心性分析可以找到在研究團(tuán)隊(duì)中起著至關(guān)重要信息樞紐作用的關(guān)鍵節(jié)點(diǎn)[19]。
基于已有的研究成果,本研究以中國(guó)圖書(shū)情報(bào)學(xué)合著網(wǎng)絡(luò)為樣本,歸納學(xué)術(shù)人才的網(wǎng)絡(luò)中心性特征,進(jìn)行人才挖掘的探索。
本研究利用維普期刊論文數(shù)據(jù)庫(kù)收集樣本,檢索1999-2008年G25和G35類號(hào)下的所有文獻(xiàn)。在刪除一些非論文文獻(xiàn)和重復(fù)文獻(xiàn)后,得到75 252位作者,161 787篇文獻(xiàn)。發(fā)文數(shù)量大于2且與他人有合作關(guān)系的作者有13 213位。利用這13 213位作者的合著關(guān)系建立起合著網(wǎng)絡(luò),本研究不區(qū)分作者的次序,因而建立的合著網(wǎng)絡(luò)為無(wú)向網(wǎng)絡(luò)。
社會(huì)網(wǎng)絡(luò)分析軟件有多種,常用的有UCINET、Pajek、NetMiner、Multinet、Stocnet、Structure 等。本研究使用 www.analytictech.com網(wǎng)站提供的 UCINET軟件作為分析工具。
樣本發(fā)文量的統(tǒng)計(jì)表明,1999-2008年間,發(fā)文數(shù)量在50篇以上的作者有105位。運(yùn)用專家調(diào)查法,確定了20位圖書(shū)情報(bào)學(xué)領(lǐng)域的學(xué)術(shù)權(quán)威,即馬費(fèi)成、胡昌平、邱均平、吳慰慈、葉繼元、王余光、陳傳夫、張曉林、程煥文、吳建中、李綱、朱慶華、梁戰(zhàn)平、武夷山、靖繼鵬、葉鷹、王知津、范并思、柯平、于良芝。
社會(huì)網(wǎng)絡(luò)分析理論指出,如果一個(gè)行動(dòng)者與很多其他行動(dòng)者有直接的關(guān)聯(lián),該行動(dòng)者就居于中心地位,擁有較大的權(quán)力。衡量指標(biāo)為點(diǎn)度中心度;如果一個(gè)行動(dòng)者處于許多交往網(wǎng)絡(luò)路徑上,可以認(rèn)為此人居于重要位置,因?yàn)樗哂锌刂破渌麅蓚€(gè)個(gè)體之間交往的能力。衡量指標(biāo)為中間中心度;一個(gè)點(diǎn)越是與其他點(diǎn)接近,該點(diǎn)在傳遞信息方面就更加容易,該點(diǎn)也越不依賴他者,因而居于網(wǎng)絡(luò)的中心。衡量指標(biāo)為接近中心度。利用UCINET計(jì)算出上述20位權(quán)威的點(diǎn)度中心度、中間中心度和接近中心度。為了排除奇異值對(duì)整體取值的影響,本研究采用中值。
發(fā)文量是一個(gè)非常重要的判斷學(xué)術(shù)地位的指標(biāo),在合著網(wǎng)絡(luò)中以頂點(diǎn)值(vertex value)表示。20位權(quán)威的頂點(diǎn)值見(jiàn)表1。
表1 20位學(xué)術(shù)權(quán)威的特征值
在整個(gè)合著網(wǎng)絡(luò)中隨機(jī)抽取1 000位作者,統(tǒng)計(jì)其頂點(diǎn)值,并用UCINET軟件進(jìn)行點(diǎn)度中心度、中間中心度、接近中心度分析,結(jié)果如表2所示。
表2 對(duì)照組的特征值
點(diǎn)度中心度即直接與該點(diǎn)相連的點(diǎn)的個(gè)數(shù),也就是與該作者有過(guò)合著關(guān)系的作者的個(gè)數(shù)。一般來(lái)說(shuō),點(diǎn)度中心度都小于頂點(diǎn)值,直觀上理解,就是作者與他人合著發(fā)文的數(shù)量總是小于該作者的總發(fā)文量。點(diǎn)的中間中心度測(cè)量該點(diǎn)在多大程度上控制他人之間的交往。中間點(diǎn)度中心度為該點(diǎn)的所有點(diǎn)的中間度的總和,中間中心度的值越大,說(shuō)明對(duì)資源的控制能力越強(qiáng),觀察有一部分作者的中間中心度為0,表示該作者不能控制其他行動(dòng)者,處于網(wǎng)絡(luò)的邊緣。接近中心度的計(jì)算有幾種方法,我們選擇的方法是 Geodesic paths only(Freeman Closeness),即只計(jì)算測(cè)地線(最短路徑)的距離,得到的值為該點(diǎn)與所有其他點(diǎn)的最短距離之和。離中心點(diǎn)距離越遠(yuǎn)的行動(dòng)者也在信息資源、權(quán)力、聲望以及影響方面越弱。接近中心度的值越大,說(shuō)明該點(diǎn)越不是網(wǎng)絡(luò)的核心點(diǎn)。
運(yùn)用SPSS軟件進(jìn)行差異分析。首先進(jìn)行非參數(shù)假設(shè)檢驗(yàn),將20位學(xué)術(shù)權(quán)威作為樣本組A,對(duì)照組作為樣本組B,進(jìn)行Kolmogorov-Smirnov Test,檢驗(yàn)兩個(gè)樣本所屬總體的分布是否存在顯著差異。結(jié)果表明,兩組樣本存在著顯著差異(表3)。
表3 Kolmogorov-Smirnov Test
前一部分的研究表明,學(xué)術(shù)權(quán)威的頂點(diǎn)值、點(diǎn)度中心度、中間中心度和接近中心度與一般研究者具有顯著差異?;诖耍覀円皂旤c(diǎn)值≥38、點(diǎn)度中心度≥14、中間中心度≥307 853.5、接近中心度≤33 651 914為標(biāo)準(zhǔn),對(duì)整個(gè)合著網(wǎng)絡(luò)進(jìn)行篩選,找到17個(gè)符合條件的學(xué)者,如表4所示。
表4 17位學(xué)者的特征值
為了檢驗(yàn)挖掘結(jié)果的質(zhì)量,本研究進(jìn)行了小規(guī)模問(wèn)卷調(diào)查,調(diào)查對(duì)象為圖書(shū)情報(bào)領(lǐng)域的10位學(xué)者。調(diào)查問(wèn)卷采用雙盲法設(shè)計(jì),將20位學(xué)術(shù)權(quán)威與挖掘結(jié)果的順序打亂,讓參與者分別對(duì)這37位學(xué)者的權(quán)威度打分。分值為1-10之間的整數(shù),對(duì)不熟悉的學(xué)者標(biāo)記“—”。調(diào)查共發(fā)出10份問(wèn)卷,回收問(wèn)卷9份,有效問(wèn)卷8份。
調(diào)查對(duì)象對(duì)挖掘出的17位學(xué)者基本上都比較熟悉,認(rèn)為他們?cè)趫D書(shū)情報(bào)學(xué)領(lǐng)域具有相當(dāng)大的影響力。對(duì)調(diào)查問(wèn)卷進(jìn)行統(tǒng)計(jì),20位權(quán)威的平均分為8.9,挖掘結(jié)果的平均分為7.8。通過(guò)中國(guó)期刊網(wǎng)對(duì)挖掘結(jié)果的H指數(shù)進(jìn)行統(tǒng)計(jì)分析,其平均H指數(shù)為13.8,表明17位學(xué)者的論文數(shù)量和質(zhì)量都比較高。
綜上所述,本研究認(rèn)為將社會(huì)網(wǎng)絡(luò)分析方法運(yùn)用于學(xué)術(shù)人才的評(píng)價(jià)具有一定的可行性。它克服了引文分析存在的問(wèn)題,兩者互為補(bǔ)充,有望顯著提高學(xué)術(shù)評(píng)價(jià)的準(zhǔn)確性。當(dāng)然,本研究還只是社會(huì)網(wǎng)絡(luò)分析在學(xué)術(shù)人才評(píng)價(jià)領(lǐng)域的初步探索,凝聚子群分析、核心-邊緣結(jié)構(gòu)分析、結(jié)構(gòu)對(duì)等性分析等方面的引入將進(jìn)一步推動(dòng)這一領(lǐng)域的發(fā)展和完善。
[1]LIU XIAOMING,BOLLEN J,NELSON M L,et al.Co-authorship networks in the digital library research community[J].Information Processing & Management;2005(41):1 462-1 480.
[2]Newman M E J.Scientific collaboration networks.I.Network construction and fundamental results[J].Physical Review E,2001,64:016131
[3]KREUZMAN H.A co-citation analysis of representative authors in philosophy:Examining the relationship betweene pistemologists and hilosophers of science[J],Scientometrics,2001(5):525 –539.
[4]HOWARD D,WELLMAN W B,NAZER N.Does citation re-flect social structure longitudinal evidence from the“Globenet”interdisciplinary research group[J].Journal of the A-merican Society for Information Science and Technology,2004,55(2):111 –126.
[5]包昌火,謝新洲,申寧.人際網(wǎng)絡(luò)分析[J].情報(bào)學(xué)報(bào),2003,22(3):365 -374.
[6]李亮,朱慶華.社會(huì)網(wǎng)絡(luò)分析方法在合著分析中的實(shí)證研究[J].情報(bào)科學(xué),2008,26(4):549 -555.
[7]徐媛媛,朱慶華.社會(huì)網(wǎng)絡(luò)分析法在引文分析中的實(shí)證研究[J].情報(bào)理論與實(shí)踐.2008,31(2):184 -188.
[8]王曉光,社會(huì)網(wǎng)絡(luò)范式下的知識(shí)管理研究述評(píng)[J].圖書(shū)情報(bào)知識(shí),2008(4):87-91.
[9]邱均平,馬瑞敏.圖林博客的社會(huì)網(wǎng)絡(luò)分析[J].圖書(shū)情報(bào)工作.2008,52(11):6 -9.
[10]高凡,徐引篪.圖書(shū)館聯(lián)盟的社會(huì)網(wǎng)絡(luò)資源配置[J].中國(guó)圖書(shū)館學(xué)報(bào),2006(3):14-16.
[11]OTTE E,ROUSSEAU R,Social network analysis:a powerful strategy,also for the information sciences[J]Journal of Information Science,2002,28:441 -453.
[12]ZHU WEIZHONG,CHEN CHAOMEI,ALLEN R B.Ana
lyzing the propagation of influence and concept evolution in enterprise social networks through centrality and latent semantic analysis[M]Washio T,et al.PAKDD 2008,LNAI 5012,2008:1090-1098.
[13]PALAU J,MONTANER M,BEATRIZ L’OPEZ,JOSEP LlU’S DE LA ROSA.Collaboration analysis in recommender systems using social networks[M].KLUSCH M,et al.CIA 2004,LNCS 3191,2004.
[14]付允,牛文元,汪云林,李丁.科學(xué)學(xué)領(lǐng)域作者合作網(wǎng)絡(luò)分析——以《科研管理》(2004-2008)為例[J].科研管理,2009,30(3):41 -46.
[15]梁瀟.三螺旋創(chuàng)新模式中信息流主體研究——以信息論加權(quán)的社會(huì)網(wǎng)絡(luò)分析法[J].情報(bào)科學(xué),2008,26(1):115-119.
[16]孟微,龐景安.我國(guó)情報(bào)學(xué)科研合著網(wǎng)絡(luò)研究及其特征參數(shù)分析[J].情報(bào)理論與實(shí)踐,2009,32(8):12-15.
[17]蘇娜,張志強(qiáng).社會(huì)網(wǎng)絡(luò)分析在學(xué)科研究趨勢(shì)分析中的實(shí)證研究——以數(shù)字圖書(shū)館領(lǐng)域?yàn)槔跩].情報(bào)理論與實(shí)踐,2009,32(9):79 -83.
[18]魏瑞斌.社會(huì)網(wǎng)絡(luò)分析在關(guān)鍵詞網(wǎng)絡(luò)分析中的實(shí)證研究[J].情報(bào)雜志,2009,28(9):46-49.
[19]鄭曦,孫建軍.鏈接分析領(lǐng)域的作者合作網(wǎng)絡(luò)及其分析[J].圖書(shū)情報(bào)工作.2009,53(4):29 -32,105.
An Exploratory Study of Social Network Analysis Method Applied to Establish the Academic Talents
DUAN Yu-feng,LIU Xuan
(Information Department of Business School,East China Normal University,Shanghai 200241,P.R.China)
This article aims at studying co-author network of library and information science according to all the authors in the field of library and information science during 1999-2008.Using traditional expert survey method to identify 20 authorities,it is found that the 20 authorities have significant difference in the four indices:vertex value, point centrality, betweenness centrality, closeness centrality, compared to the random 1000 authors'.Take the 20 authorities'index value as a benchmark to seek the other 17 eligible authors,we conducted a questionnaire survey to weight their authority.It is concluded that social network analysis method is feasible and effective to determine academic talents.
social network;analysis method;talents mining
C961
A
1008-5831(2011)05-0080-04
2011-07-22
段宇鋒(1972-),男,山東定陶人,華東師范大學(xué)商學(xué)院信息學(xué)系副教授,博士,主要從事網(wǎng)絡(luò)信息資源管理研究;劉璇(1983-),女,湖南邵陽(yáng)人,華東師范大學(xué)商學(xué)院信息學(xué)系碩士研究生,主要從事信息資源管理研究。
(責(zé)任編輯 彭建國(guó))