国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

多指標(biāo)核心作者識別方法研究

2020-07-09 03:40張子婷鄭彥寧袁芳
現(xiàn)代情報 2020年7期
關(guān)鍵詞:熵值法

張子婷 鄭彥寧 袁芳

摘 要:[目的/意義]將無偏指標(biāo)引入評價體系對某一研究領(lǐng)域的核心作者進(jìn)行準(zhǔn)確識別。本文構(gòu)建了一個研究領(lǐng)域規(guī)范化的引文影響力指標(biāo),提出了綜合多指標(biāo)的核心作者識別方法。[方法/過程]本研究基于Web of Science數(shù)據(jù)庫,以某一研究領(lǐng)域的學(xué)術(shù)論文為數(shù)據(jù)基礎(chǔ),利用普賴斯定律確定核心作者候選人,綜合發(fā)文量、被引頻次、h指數(shù)以及研究領(lǐng)域規(guī)范化后的引文影響力4個指標(biāo),利用綜合指數(shù)法和熵值法確定每位學(xué)者的最后得分,將高于100分的學(xué)者確定為該研究領(lǐng)域內(nèi)的核心作者。[結(jié)果/結(jié)論]最后,利用上述方法在DNA計算領(lǐng)域進(jìn)行了應(yīng)用分析,按照綜合得分k>100的標(biāo)準(zhǔn)遴選出DNA計算領(lǐng)域的32位核心作者。

關(guān)鍵詞:核心作者;識別方法;引文影響力;綜合指數(shù)法;熵值法

DOI:10.3969/j.issn.1008-0821.2020.07.015

〔中圖分類號〕G250.252 〔文獻(xiàn)標(biāo)識碼〕A 〔文章編號〕1008-0821(2020)07-0144-08

Research on Multiple-Indicators Method on Identifying the Core Authors

Zhang Ziting Zheng Yanning* Yuan Fang

(Institute of Scientific and Technical Information of China,Beijing 100038,China)

Abstract:[Purpose/Significance]An unbiased index was introduced into the evaluation system to accurately identify the core authors in a research field.This paper constructed a research field normalized citation impact index,and proposed a multiple-indicators method on identifying the core author.[Method/Process]Based on the Web of Science Core database this research,used articles of a research field as data basis.This paper used Price law to determine core author candidates.Based on the statistic data of quantity,cited frequency of papers,h-index and research field normalized citation impact,the core authors were evaluated by comprehensive index method.And scholars whose scores were higher than 100 were determined as the core authors in this field.[Result/Conclusion]Finally,the above method was used to identify the core authors in the field of DNA computing,and 32 core authors in this field were selected according to the criteria of comprehensive score k>100.

Key words:core author;identifying method;citation impact;comprehensive index method;entropy method

作者是科學(xué)研究工作的主體,其科研能力直接決定著科研產(chǎn)出的數(shù)量和質(zhì)量[1]。核心作者是指那些在各學(xué)科領(lǐng)域造詣較高、學(xué)術(shù)活動較頻繁、發(fā)表論文較多且影響較大的作者。他們在學(xué)科中發(fā)揮著導(dǎo)向作用,不斷將學(xué)科研究推向新的縱深[2]。對于領(lǐng)域內(nèi)的研究人員,關(guān)注高水平學(xué)者的科研成果是快速把握前沿研究內(nèi)容的重要方法之一。對于領(lǐng)域內(nèi)的期刊,也可面向核心作者組約優(yōu)秀稿件,提高期刊的學(xué)術(shù)水平。另外,對在某一研究方向上潛心科研多年的學(xué)者們的研究成果進(jìn)行分析,可以發(fā)現(xiàn)該研究領(lǐng)域在某一研究方向上的主題演變過程。在這些過程中,準(zhǔn)確識別研究領(lǐng)域內(nèi)的核心作者顯得尤為重要。需要特別指出的是,本文研究的核心作者是識別某一研究領(lǐng)域內(nèi)有一定學(xué)術(shù)造詣及研究影響力的作者,并非確定某篇文章的多個作者中貢獻(xiàn)較大的作者。

1 相關(guān)研究

目前已有一些利用綜合指標(biāo)確定核心學(xué)者的研究,主要應(yīng)用于期刊層面。陳濤[3]從普賴斯定律、h指數(shù)和總被引頻次3個方面來確定出《檔案學(xué)研究》的核心作者。趙基明等[4]從作者單篇論文被引情況和作者全部論文被引次數(shù)兩個角度測定《中國圖書館學(xué)報》的核心作者。鐘文娟[5]利用普賴斯定律確定核心作者候選人并結(jié)合作者發(fā)文量和被引量兩個指標(biāo)運用綜合指數(shù)法測定出《圖書館建設(shè)》的核心作者。胡臻等[1]運用普賴斯定律、綜合指數(shù)法和期刊h指數(shù)等方法對《四川圖書館學(xué)報》2006-2015年核心與擴(kuò)展核心作者進(jìn)行分析。李智毅等[6]綜合運用發(fā)文量、第一作者發(fā)文量、綜合貢獻(xiàn)度、高引作者、高被引論文等多重方法,系統(tǒng)分析了文獻(xiàn)作者的影響力及其合作關(guān)系,從中識別出一批核心學(xué)者群體。許晶晶[7]利用CNKI 2004-2009年6年間建筑類圖書所涉及的作者及其發(fā)文量、h指數(shù)、主題連續(xù)研究數(shù),根據(jù)指標(biāo)的重要性確定權(quán)重,最終遴選出Top100作為核心作者。此外,還有一部分研究著重對某一學(xué)科領(lǐng)域的核心學(xué)者進(jìn)行挖掘,并基于此識別研究主題。Chien T W等[8]探討作者的研究領(lǐng)域及個人影響因素與作者姓名排序之間的關(guān)系,利用基尼指數(shù)進(jìn)行評價。Wang Q等[9]利用Insight軟件進(jìn)行作者網(wǎng)絡(luò)分析,進(jìn)一步解釋了核心作者的貢獻(xiàn)和趨勢。支鳳穩(wěn)等[10]利用主觀提取法確定國外館藏數(shù)字資源語義化領(lǐng)域的核心作者列表和作者合著網(wǎng)絡(luò)。徐健等[11]、江文華等[12]通過普賴斯定律分別識別情報學(xué)領(lǐng)域和圖書館學(xué)領(lǐng)域的核心作者,在此基礎(chǔ)上進(jìn)行社群劃分并分別識別各社群研究主題。田文燦等[13]遴選出Altmetrics領(lǐng)域的23名核心作者,從微觀層面上對這些核心作者的研究主題和方向進(jìn)行演變分析。

研究指標(biāo)選取方面,主要依賴發(fā)文量、總被引次數(shù)、篇均被引次數(shù)、h指數(shù)等,這些指標(biāo)均未考慮文章發(fā)表年份、文獻(xiàn)類型、學(xué)科領(lǐng)域等影響。例如,在某一研究領(lǐng)域內(nèi)有兩篇分別發(fā)表于2009年與2019年的文章,其被引頻次均為10,但其引文影響力并不能簡單等同。由于受到出版年的影響,出現(xiàn)兩篇文章出現(xiàn)被引頻次相同但引文影響力明顯不相同的情況。目前已有的無偏指標(biāo)主要有基于愛思唯爾Scopus數(shù)據(jù)庫的學(xué)科規(guī)范化的論文影響力(Field-Weighted Citation Inpact,F(xiàn)WCI)和基于湯森路透Web of Science數(shù)據(jù)庫的學(xué)科規(guī)范化的論文影響力(Category Normalized Citation Impact,CNCI)。這兩種指標(biāo)較可以排除出版年、學(xué)科領(lǐng)域與文獻(xiàn)類型的影響[14],常用于考察機(jī)構(gòu)、國家、個人等的論文影響力。在應(yīng)用層面,主要是為期刊刊發(fā)和約稿提供支持。目前極少有研究對某一研究領(lǐng)域的核心作者進(jìn)行識別。

2 研究方法

2.1 研究思路

本文研究思路見圖1。本文依據(jù)Web of Science數(shù)據(jù)庫,以某一研究領(lǐng)域得到的學(xué)術(shù)論文為數(shù)據(jù)基礎(chǔ)。對作者進(jìn)行數(shù)據(jù)清洗后,利用普賴斯公式確定核心作者候選人,然后構(gòu)建評價體系,最后確定權(quán)重、計算得分、遴選出研究領(lǐng)域內(nèi)的核心作者。

在指標(biāo)選取時,我們發(fā)現(xiàn),被引頻次雖可以衡量某篇論文的學(xué)術(shù)影響力,但是對于兩篇被引頻次相同的論文來說,發(fā)表年份、文獻(xiàn)類型以及所處的學(xué)科領(lǐng)域不同都會導(dǎo)致其學(xué)術(shù)影響力并不等同。故本文除使用常用的發(fā)文量、被引頻次、h指數(shù)這3個指標(biāo)外,還構(gòu)建了一個研究領(lǐng)域規(guī)范化后的引文影響力指標(biāo)(Research Field Normalized Citation Impact,RFNCI),一定程度上排除出版年、文獻(xiàn)類型、學(xué)科領(lǐng)域?qū)Ρ灰l次產(chǎn)生的影響,具體指標(biāo)定義見2.3。

在評價方法方面,本文采取綜合指數(shù)法的無量綱化規(guī)則對4個指標(biāo)進(jìn)行無量綱化,利用熵值法確定各指標(biāo)權(quán)重。得到權(quán)重后賦予每位學(xué)者一個綜合評分,所得評分大于100分則表示其水平高于領(lǐng)域內(nèi)的平均水平,確定其為核心作者。

2.2 確定核心作者候選人

為保證分析結(jié)果的準(zhǔn)確性,本文采用DDA(Derwent Data Analyzer)軟件消歧和人工校對相結(jié)合的方式對作者信息進(jìn)行清洗[11]。首先將姓名相

同且作者一級單位相同的作者判定為同一作者,其次人工逐個分析姓名相同而單位不同的情況,查閱補(bǔ)充資料對這些作者進(jìn)行處理。數(shù)據(jù)清洗完畢后,利用普賴斯公式(M=0.749Nmax)計算出核心作者候選人的最少發(fā)文量。其中M為最小論文發(fā)表數(shù),Nmax為所數(shù)據(jù)集中最高產(chǎn)作者的發(fā)文量,發(fā)表論文數(shù)在M篇以上的作者即為核心作者候選人。

2.3 構(gòu)建評價體系

本文選取發(fā)文量、被引頻次、H指數(shù)以及研究領(lǐng)域規(guī)范化后的引文影響力4個指標(biāo)。各指標(biāo)的定義及優(yōu)劣勢如.:

1)發(fā)文量:指在某一特定研究領(lǐng)域中,某一作者的全部發(fā)文數(shù)量,記為Di。其中i為作者編號,.同。發(fā)文量體現(xiàn)學(xué)者在該領(lǐng)域的科研產(chǎn)出數(shù)量,但無法衡量科研成果的質(zhì)量。

2)被引頻次:某作者的全部發(fā)文的被引你頻次總數(shù),記為Ci。被引頻次體現(xiàn)科研成果質(zhì)量,反應(yīng)論文的被使用和受重視的程度[15],但受發(fā)文量及高被引論文影響。

3)h指數(shù):一位作者的h指數(shù)等于當(dāng)且僅當(dāng)其有h篇引文次數(shù)至少為h的論文,同時其余論文的引文數(shù)都小于h時的h值,記為hi[15]。h指數(shù)結(jié)合數(shù)量和質(zhì)量兩個方面綜合分析學(xué)者的個人學(xué)術(shù)成就,用以評價學(xué)者的持續(xù)績效。但是h指數(shù)仍存在以.局限:一是對低被引論文和高被引論文缺乏靈敏度;二是缺乏區(qū)分度;三是h值只升不降,無法反映學(xué)者的持續(xù)表現(xiàn)[3]。

(4)研究領(lǐng)域規(guī)范化的引文影響力(Research Field Normalized Citation Impact,RFNCI):該研究領(lǐng)域中的一篇文獻(xiàn)的研究領(lǐng)域規(guī)范化的引文影響力(RFCNI)是通過其實際被引次數(shù)除以同文獻(xiàn)類型、同出版年、同研究領(lǐng)域文獻(xiàn)的期望被引次數(shù)獲得的。其中,同文獻(xiàn)類型、同出版年、同研究領(lǐng)域文獻(xiàn)的期望被引次數(shù)(記為e)為該研究領(lǐng)域某一年所有的研究論文(Articles)總被引次數(shù)除以論文總數(shù)。

RFNCI是一個相對無偏的影響力指標(biāo),排除了出版年、學(xué)科領(lǐng)域與文獻(xiàn)類型的影響。在某一研究領(lǐng)域中,如果RFNCI的值等于1,說明該(組)論文的被引表現(xiàn)與全球水平相當(dāng),如果RFNCI大于1表明該(組)論文的被引表現(xiàn)高于全球水平,否則低于全球平均水平。

2.4 指標(biāo)無量綱化處理及權(quán)重確定

多指標(biāo)系統(tǒng)的每一種評價方法,都面臨著兩個問題:一是按何種規(guī)則將每個指標(biāo)無量綱化;二是以何種方式區(qū)分各指標(biāo)的相對重要性[16]。本文采取綜合指數(shù)法的無量綱化規(guī)則對4個指標(biāo)進(jìn)行無量綱化,利用熵值法確定各指標(biāo)權(quán)重。

2.4.1 綜合指數(shù)法

綜合指數(shù)評價法是運用數(shù)學(xué)方法處理多重相關(guān)指標(biāo)而得到的一個綜合性指標(biāo)的方法,用以較全面地反映事物總體變動方向和變動程度。綜合指數(shù)法可以將多個不能同度量現(xiàn)象的數(shù)值,分別變換為能同度量數(shù)值。由于各評價指標(biāo)的量綱、數(shù)量級及指標(biāo)優(yōu)劣的取向存在較大差異,在對這些指標(biāo)進(jìn)行合成之前必須進(jìn)行標(biāo)準(zhǔn)化處理。采用統(tǒng)計學(xué)方法對指標(biāo)進(jìn)行處理,以消除多指標(biāo)綜合評價中計量單位差異和指標(biāo)數(shù)量級、相對數(shù)形式差別[17-18]。

2.4.2 熵值法

熵是系統(tǒng)不確定性的度量,可以用于度量已知數(shù)據(jù)所包含的有效信息量和確定權(quán)重[19]。熵值法是一種客觀賦權(quán)法,其根據(jù)各項指標(biāo)觀測值所提供的信息的大小來確定指標(biāo)權(quán)重。在計算指標(biāo)權(quán)重時,若某個指標(biāo)中的各個數(shù)值之間變化不大,則該指標(biāo)在綜合分析中的貢獻(xiàn)小,即權(quán)小,反之則權(quán)大[20]。由于該方法計算結(jié)果可信度較大,自適應(yīng)功能強(qiáng),故本文選取熵值法作為確定權(quán)重的方法。其主要步驟如.:

為了驗證該方法的可行性,筆者利用檢索式在Web of Science核心合集數(shù)據(jù)庫中檢索DNA計算領(lǐng)域的綜述文章,選取了5篇綜述類文章,將本文選取的核心作者名單與這5篇綜述文章的參考文獻(xiàn)作者進(jìn)行匹配。這5篇綜述類文章中,文獻(xiàn)[22](2009,被引頻次363)、文獻(xiàn)[23](2019,被引頻次34)、文獻(xiàn)[24](2019,被引頻次34)為領(lǐng)域內(nèi)的高被引論文,另外選取了分別發(fā)表于2006年的文獻(xiàn)[25](被引頻次109)和2014年的文獻(xiàn)[26](被引頻次101)進(jìn)行補(bǔ)充。經(jīng)過匹配發(fā)現(xiàn),32位核心作者中有26位作者的文獻(xiàn)至少被這5篇文章中的一篇引用,一定程度上證明了本文研究方法的可行性及結(jié)果的準(zhǔn)確性。

4 結(jié) 論

本文首先根據(jù)普賴斯定律確定核心作者候選人集合,然后構(gòu)建基于某一特定研究領(lǐng)域的無偏評價指標(biāo)RFNCI,綜合發(fā)文量、總被引次數(shù)和H指數(shù)等多個指標(biāo),利用綜合指數(shù)法和熵值法對學(xué)者的學(xué)術(shù)貢獻(xiàn)進(jìn)行全方位評價。無偏評價指標(biāo)在一定程度上減少了出版年、文獻(xiàn)類型和研究領(lǐng)域?qū)Ρ灰螖?shù)產(chǎn)生的影響,從更客觀角度評價論文的影響力。本文在指標(biāo)選取、權(quán)重確定均較為客觀、科學(xué)。之后,利用本文提出的方法在DNA計算領(lǐng)域進(jìn)行應(yīng)用分析,從102位核心作者候選人中遴選出32位核心作者,包括7位國內(nèi)學(xué)者。綜合得分位列前3的作者分別是Paun G、Shapiro Ehud和Adar Rivka;樊春海是國內(nèi)學(xué)者中得分最高的學(xué)者;許進(jìn)是發(fā)文最多的學(xué)者。結(jié)合各位作者在領(lǐng)域內(nèi)所獲得的成就,可以從側(cè)面印證本文研究方法的可行性。

當(dāng)然,本文仍存在一定的局限性。第一,對于作者的消歧目前的技術(shù)幾乎無法做到完全精確,本文也不例外;第二,雖引進(jìn)一定程度上消除出版年、文獻(xiàn)類型、研究領(lǐng)域的影響的相對無偏的指標(biāo),但評價指標(biāo)的設(shè)置方面仍未做到面面俱到。另外,檢索式的制定過程雖力求完善但難免會出現(xiàn)部分文章未涵蓋在內(nèi)的情況。未來將朝著以.幾個方向開展研究:1)核心作者對研究主題演化如何產(chǎn)生影響;2)如何在研究主題演化路徑識別中體現(xiàn)核心作者的作用。

參考文獻(xiàn)

[1]胡臻,龍興躍.基于普賴斯定律與綜合指數(shù)法的核心作者和擴(kuò)展核心作者分析——以《四川圖書館學(xué)報》為例[J].四川圖書館學(xué)報,2016,(3):74-76.

[2]蘇志芳,張建中,胡惠芳.基于模糊綜合評判的中文社科圖書“核心作者”決策研究[J].圖書情報工作,2010,54(1):42-45,41.

[3]陳濤.基于CSSCI的《檔案學(xué)研究》h指數(shù)和h衍生指數(shù)研究及核心作者的測定[J].甘肅科技縱橫,2010,39(5):100-102.

[4]趙基明,舒明全.基于CSSCI的《中國圖書館學(xué)報》h指數(shù)及核心作者測定[J].中國圖書館學(xué)報,2008,34(2):98-102.

[5]鐘文娟.基于普賴斯定律與綜合指數(shù)法的核心作者測評——以《圖書館建設(shè)》為例[J].科技管理研究,2012,32(2):57-60.

[6]李智毅,楊曉春,吳廣印,等.基于文獻(xiàn)計量的軍民融合文獻(xiàn)核心作者分析[J].情報工程,2018,4(5):105-115.

[7]許晶晶.基于引文分析的核心作者研究--以建筑類圖書為例[J].圖書館,2015,(5):89-92.

[8]Chien T W,Chow J C,Chang Y,et al.Applying Gini Coefficient to Evaluate the Author Research Domains Associated with the Ordering of Author Names A Bibliometric Study[J].Medicine,2018,97(39):11.

[9]Wang Q,Li R R.Research Status of Shale Gas:A Review[J].Renewable & Sustainable Energy Reviews,2017,(74)715-720.

[10]支鳳穩(wěn),鄭彥寧,杜薇薇.國外館藏數(shù)字資源語義化研究現(xiàn)狀分析[J].現(xiàn)代情報,2018,38(12):126-32.

[11]徐健,毛進(jìn),葉光輝,等.基于核心作者研究興趣相似性網(wǎng)絡(luò)的社群隸屬研究——以國內(nèi)情報學(xué)領(lǐng)域為例[J].圖書情報工作,2018,62(12):57-64.

[12]江文華,徐健,李綱,等.基于研究興趣相似性網(wǎng)絡(luò)的我國圖書館學(xué)研究社群分析[J].現(xiàn)代情報,2019,39(9):21-27.

[13]田文燦,胡志剛,王賢文.科學(xué)計量學(xué)視角.的Altmetrics發(fā)展歷程分析[J].圖書情報知識,2019,(2):4-11.

[14]吳偉,姜天悅,余敏杰.我國高水平大學(xué)基礎(chǔ)研究與世界一流水平的群體性差距——基于學(xué)科規(guī)范化的引文影響力分析[J].現(xiàn)代教育管理,2017,(4):18-23.

[15]崔建強(qiáng),劉文娟.運動人體科學(xué)領(lǐng)域?qū)W者學(xué)術(shù)影響力分析[J].沈陽體育學(xué)院學(xué)報,2011,30(6):27-31.

[16]秦壽康.綜合評價原理與應(yīng)用[M].北京:電子工業(yè)出版社,2003.

[17]韓曉明,王金國,石照耀.基于主成分分析和熵值法的高??萍紕?chuàng)新能力評價[J].河海大學(xué)學(xué)報:哲學(xué)社會科學(xué)版,2015,17(2):

[18]陳輝,林超輝,夏承鵬,等.基于PCA和綜合指數(shù)法的高水平理工科高校科技成果轉(zhuǎn)化績效評價體系構(gòu)建[J].科技管理研究,2019,(22):48-54.

[19]陸添超,康凱.熵值法和層次分析法在權(quán)重確定中的應(yīng)用[J].電腦編程技巧與維護(hù),2009,(22):19-20,53.

[20]戴西超,張慶春.綜合評價中權(quán)重系數(shù)確定方法的比較研究[J].煤炭經(jīng)濟(jì)研究,2003,(11):37.

[21]Adleman L M.Molecular Computation of Solutions to Combinatorial Problems[J].Science,1994,266(5187):1021-1024.

[22]Pepke S,Wold B,Mortazavi A.Computation for ChIP-seq and RNA-seq Studies[J].Nature Methods,2009,6(11):S22-S32.

[23]Mergny J-L,Sen D.DNA Quadruple Helices in Nanotechnology[J].Chemical Reviews,2019,119(10):6290-6325.

[24]Simmel F C,Yurke B,Singh H R.Principles and Applications of Nucleic Acid Strand Displacement Reactions[J].Chemical Reviews,2019,119(10):6326-6369.

[25]Ezziane Z.DNA computing:applications and challenges[J].Nanotechnology,2006,17(2):R27-R39.

[26]Stojanovic M N,Stefanovic D,Rudchenko S.Exercises in Molecular Computing[J].Accounts of Chemical Research,2014,47(6):1845-1852.

(責(zé)任編輯:陳 媛)

猜你喜歡
熵值法
城市綜合承載力研究
基于GRA—TOPSIS的中小物流企業(yè)融資效率評價