段宇寧, 劉羿彤, 李曉萌, 商學(xué)棽, 張 宇, 陽(yáng)彩軍, 王麗麗, 黎 柳
(中國(guó)計(jì)量科學(xué)研究院,北京 100029)
文獻(xiàn)計(jì)量學(xué)是關(guān)于文獻(xiàn)及其引用的學(xué)科。此學(xué)科起源于信息科學(xué),但目前通常指對(duì)文本和信息進(jìn)行研究和檢索的分析方法。文獻(xiàn)之間存在引用,這種引用關(guān)系會(huì)演化成引文網(wǎng)絡(luò)。文獻(xiàn)的被引頻次很大程度上表征了論文的重要性和影響力。文獻(xiàn)的意義通常由關(guān)鍵詞和內(nèi)容決定,因此,引文分析和內(nèi)容分析成為文獻(xiàn)計(jì)量分析的必要組成部分。傳統(tǒng)文獻(xiàn)計(jì)量學(xué)方法用于追蹤學(xué)術(shù)期刊之間的引用關(guān)系,目前,該方法已成為測(cè)量研究表現(xiàn)的重要手段[1]。
引文分析作為分析科研表現(xiàn)的一種手段可以追溯到20世紀(jì)中葉。當(dāng)時(shí),尤金·加菲爾德博士首次提出引文索引的概念,創(chuàng)立了科學(xué)信息研究所(湯森路透的前身),并且陸續(xù)推出了科學(xué)引文索引(science citation index,SCI),社會(huì)科學(xué)引文索引(social science citation index,SSCI)以及人文與藝術(shù)引文索引(arts & humanities citation index,A&HCI)。
論文在被更近發(fā)表的論文引用時(shí)會(huì)累積被引頻次,被引頻次較高的論文通常被認(rèn)為具有較高的影響力。研究表明論文的被引頻次與其他定性評(píng)價(jià)的結(jié)果(如同行評(píng)議)高度相關(guān),該相關(guān)性在大多數(shù)科學(xué)技術(shù)領(lǐng)域,也包括部分社會(huì)科學(xué)領(lǐng)域,甚至一些人文學(xué)科成立。
基于文獻(xiàn)計(jì)量學(xué)和大數(shù)據(jù)文獻(xiàn),目前已經(jīng)有多種學(xué)科進(jìn)行了發(fā)展趨勢(shì)研究[2~5],但是針對(duì)具體的計(jì)量學(xué)科領(lǐng)域的數(shù)據(jù)搜集、挖掘和分析尚未見報(bào)道;文獻(xiàn)計(jì)量分析方法對(duì)于研究對(duì)象的針對(duì)性較高[6],然而,大部分的研究均停留在泛泛的大學(xué)科范圍內(nèi)[7~9],未見針對(duì)具體學(xué)科領(lǐng)域的研究機(jī)構(gòu)進(jìn)行對(duì)標(biāo)分析。
本研究是以四個(gè)國(guó)家計(jì)量機(jī)構(gòu)為單位開展研究也可以以某一學(xué)科領(lǐng)域?yàn)閱挝贿M(jìn)行。
本文對(duì)WOS核心合集索引數(shù)據(jù)庫(kù)收錄的中國(guó)計(jì)量科學(xué)研究院(National Institute of Metrology,NIM)、美國(guó)標(biāo)準(zhǔn)技術(shù)研究院(National Institute of Standards & Technology,NIST)、英國(guó)國(guó)家物理實(shí)驗(yàn)室(National Physical Laboratory,NPL)和德國(guó)物理技術(shù)研究院(Physikalisch-Technische Bundesanstalt,PTB)4個(gè)研究機(jī)構(gòu)的文獻(xiàn)進(jìn)行檢索,文獻(xiàn)類型為:article,review和letters。檢索時(shí)間段為2013-2020年,檢索日期為2021年8月13日。將檢索結(jié)果以Ref Works的格式導(dǎo)出,并轉(zhuǎn)化為Python可識(shí)別的元數(shù)據(jù)格式進(jìn)行分析。
采用文獻(xiàn)計(jì)量學(xué)的方法,以檢索到的文獻(xiàn)為數(shù)據(jù)集,利用WOS的InCite和Python作為主要的分析評(píng)價(jià)工具,以NIM的實(shí)驗(yàn)室分類為基準(zhǔn),對(duì)4個(gè)國(guó)家計(jì)量機(jī)構(gòu)的發(fā)文量、被引情況及學(xué)科影響力等指標(biāo)進(jìn)行分析。
在進(jìn)行實(shí)驗(yàn)室對(duì)標(biāo)時(shí),本文以各個(gè)實(shí)驗(yàn)室發(fā)表過(guò)的文章為基準(zhǔn)數(shù)據(jù),進(jìn)行keywords對(duì)標(biāo)分析,對(duì)其他3個(gè)機(jī)構(gòu)的相關(guān)領(lǐng)域文章進(jìn)行自動(dòng)標(biāo)引,并通過(guò)聚類分析的方法進(jìn)行去噪。
本文中涉及到的主要分析指標(biāo)及具體含義如下:
論文被引頻次:即發(fā)表的論文在一段時(shí)間內(nèi)被引用的總次數(shù),該指標(biāo)是衡量研究成果被同行關(guān)注程度的重要指標(biāo)。
學(xué)科規(guī)范化引文影響力(category normalized citation impact,CNCI):通過(guò)其實(shí)際被引次數(shù)除以同文獻(xiàn)類型、同出版年、同學(xué)科領(lǐng)域文獻(xiàn)的期望被引次數(shù)獲得的。CNCI是一個(gè)十分有價(jià)值且無(wú)偏性的影響力指標(biāo),它排除了出版年、學(xué)科領(lǐng)域與文獻(xiàn)類型的影響。通過(guò)CNCI值,可以快速了解文章在同一學(xué)科領(lǐng)域內(nèi)與世界平均水平的差距和位置。具體的指標(biāo)算法如下:
(1)
式中:C為目標(biāo)論文的被引頻次;E為與該論文發(fā)表同一年、同一學(xué)科、同一文獻(xiàn)類型的全球論文篇均被引頻次。全球平均水平的CNCI值為1,如果CNCI大于1表明論文的影響力高于全球平均水平;反之,亦然。
期刊規(guī)范化引文影響力(journal normalized citation impact,JNCI):期刊規(guī)范化的引文影響力(JNCI)指標(biāo)與學(xué)科規(guī)范化的引文影響力類似。其區(qū)別在于JNCI沒(méi)有對(duì)研究領(lǐng)域進(jìn)行規(guī)范化,卻對(duì)文獻(xiàn)發(fā)表在特定期刊上的被引次數(shù)進(jìn)行了規(guī)范化。每篇出版物JNCI值為該出版物實(shí)際被引頻次與該發(fā)表期刊同出版年、同文獻(xiàn)類型論文的平均被引頻次的比值。如果JNCI的值超過(guò)1,說(shuō)明該科研主體影響力高于平均值;如果JNCI的值低于1,說(shuō)明其影響力低于平均值。
論文篇均被引頻次:指各機(jī)構(gòu)在一段時(shí)間內(nèi)每篇論文的平均被引頻次。
3.1.1 發(fā)文量
圖1為NPL、PTB、NIST發(fā)達(dá)國(guó)家計(jì)量機(jī)構(gòu)2013-2020年統(tǒng)計(jì)的發(fā)文量,由圖可以發(fā)現(xiàn):2015-2017年各個(gè)計(jì)量機(jī)構(gòu)的發(fā)文數(shù)量出現(xiàn)明顯增長(zhǎng),此時(shí)正值國(guó)際單位制SI重新定義之際;之后的發(fā)文趨勢(shì)趨緩。
圖1 發(fā)達(dá)國(guó)家計(jì)量機(jī)構(gòu)發(fā)文量Fig.1 Number of published papers by metrology institutes in developed countries
3.1.2 人均發(fā)文量
根據(jù)中國(guó)計(jì)量科學(xué)研究院國(guó)際合作部提供的NPL、PTB、NIST國(guó)家計(jì)量機(jī)構(gòu)的科研人員數(shù)量,圖2為NPL、PTB、NIST 2013-2020年人均年發(fā)文量。從3家國(guó)家計(jì)量機(jī)構(gòu)的人均年發(fā)文量來(lái)看,NPL的人均發(fā)文量要高于其他2家國(guó)家計(jì)量機(jī)構(gòu)。
圖2 3家國(guó)家計(jì)量機(jī)構(gòu)人均發(fā)文量Fig.2 Publications per capita by three national metrology institutes
3.2.1 論文篇均被引頻次
被引頻次指標(biāo)反映了論文發(fā)表后產(chǎn)生的學(xué)術(shù)影響力,體現(xiàn)了其受到全球同行的關(guān)注程度。圖3為3家國(guó)家計(jì)量機(jī)構(gòu)篇均被引頻次數(shù)據(jù),由圖3可以看出:NIST學(xué)術(shù)影響力最高,NPL次之。
圖3 3家國(guó)家計(jì)量機(jī)構(gòu)篇均被引頻次Fig.3 Citation frequency per publications by three national metrology institutes
3.2.2 學(xué)科影響力
圖4為3家國(guó)家計(jì)量機(jī)構(gòu)2013-2020年學(xué)科規(guī)范化的影響力指標(biāo),由圖4中的CNCI值可以看出:NIST的影響力均值最高,但影響力差距在逐年減小,NPL有超越的趨勢(shì)。
圖4 3家國(guó)家計(jì)量機(jī)構(gòu)學(xué)科規(guī)范化引文影響力指標(biāo)Fig.4 CNCI of three national metrology institutes
3.2.3 Nature、Science發(fā)文量
Nature、Science是國(guó)際公認(rèn)的享有最高學(xué)術(shù)聲譽(yù)的科技期刊。發(fā)表在其上的論文,往往都是經(jīng)過(guò)世界范圍內(nèi)知名專家層層審讀、反復(fù)修改而成的高質(zhì)量、高水平的論文,進(jìn)而形成較高的學(xué)術(shù)影響力,甚至成為一定時(shí)期學(xué)科發(fā)展的風(fēng)向標(biāo)。2013-2020年,NPL在上述兩大期刊共發(fā)表文章9篇,PTB共發(fā)表文章17篇,NIST共發(fā)表文章143篇。
圖5 Nature的發(fā)文量Fig.5 Number of published papers on Nature
圖6 Science的發(fā)文量Fig.6 Number of published papers on Science
總體而言,國(guó)際計(jì)量機(jī)構(gòu)的科研產(chǎn)出以英語(yǔ)為母語(yǔ)的國(guó)家占據(jù)絕對(duì)優(yōu)勢(shì);NIST的科研產(chǎn)出,無(wú)論從總量還是影響力上均處于領(lǐng)先地位。
3.3.1 科研產(chǎn)出學(xué)科領(lǐng)域
從論文產(chǎn)出學(xué)科領(lǐng)域看,國(guó)際計(jì)量機(jī)構(gòu)高度重合學(xué)科有6個(gè):儀器儀表、電子電器工程、應(yīng)用物理、光學(xué)、分析化學(xué)、交叉材料科學(xué)[10~14]。
以NIM的學(xué)科類別為基準(zhǔn)聚類對(duì)比,通過(guò)高頻聚類的方法,可以得出各國(guó)際計(jì)量機(jī)構(gòu)未見重合的學(xué)科領(lǐng)域。
NIST:信息物理融合系統(tǒng)(安全測(cè)定、身份認(rèn)證、數(shù)字身份管理等),物聯(lián)網(wǎng)(性能測(cè)試、時(shí)間校準(zhǔn)),生物識(shí)別(指紋、語(yǔ)音、虹膜、面部、靜脈、行為、多模式),人工智能(多機(jī)器人協(xié)同、語(yǔ)義識(shí)別),智能制造(手持式設(shè)備、自校準(zhǔn)),中子研究(中子衍射、中子散射、中子干涉),量子研究(量子力學(xué)、量子信息、量子加密、量子通信),溫室氣體測(cè)量,海洋光學(xué)浮標(biāo),標(biāo)準(zhǔn)參考數(shù)據(jù)庫(kù),統(tǒng)計(jì)學(xué),相對(duì)論,天體物理。
NPL:農(nóng)林業(yè)、大規(guī)模計(jì)量、生態(tài)環(huán)境、氣象學(xué)、天體物理、免疫學(xué)、顯微鏡、冶金工程、建筑學(xué)、統(tǒng)計(jì)學(xué)。
PTB:人類學(xué)(大腦影像、人類行為學(xué)、神經(jīng)學(xué)、人類遺傳學(xué)),氣象學(xué),統(tǒng)計(jì)學(xué)。
聚類對(duì)比的結(jié)果顯示:NIST的研究領(lǐng)域涉及全面,且聚焦前沿領(lǐng)域和重大需求。
3.3.2 SWOT分析圖
在SWOT分析圖中,通常以分析論文數(shù)量質(zhì)量比,依此發(fā)現(xiàn)其學(xué)科的優(yōu)勢(shì)、劣勢(shì)、潛力或機(jī)會(huì)。第一象限的學(xué)科代表其相對(duì)產(chǎn)出與相對(duì)影響力均超過(guò)平均水平,體現(xiàn)出在學(xué)科領(lǐng)域中的優(yōu)勢(shì)地位;第二象限的學(xué)科代表其相對(duì)產(chǎn)出暫時(shí)低于機(jī)構(gòu)平均水平,但其影響力高于全球均值,可以代表未來(lái)極具發(fā)展?jié)摿Φ膶W(xué)科;第三象限的學(xué)科代表其從相對(duì)產(chǎn)出及相對(duì)影響力角度均低于平均水平,是未來(lái)亟待加強(qiáng)的學(xué)科;第四象限的學(xué)科代表其相對(duì)產(chǎn)出較高,但其影響力尚低于全球平均水平,未來(lái)需要努力提升其影響力。
本文以NIM的實(shí)驗(yàn)室學(xué)科領(lǐng)域?yàn)榛鶞?zhǔn),得到聚類對(duì)比國(guó)際計(jì)量機(jī)構(gòu)的SWOT分析圖,見圖7,可以從產(chǎn)出與影響力兩個(gè)維度揭示各學(xué)科領(lǐng)域的表現(xiàn)。圖中橫坐標(biāo)為各國(guó)際計(jì)量機(jī)構(gòu)發(fā)文量(篇),基線為該機(jī)構(gòu)發(fā)文量均值;縱坐標(biāo)為學(xué)科影響力(CNCI值),基線為全球均值。
從文獻(xiàn)計(jì)量學(xué)角度分析,由圖7(a)NPL的SWOT圖中可以得出:激光輻射度、輻射劑量計(jì)量、食品安全、芯片級(jí)量子計(jì)量、蛋白質(zhì)計(jì)量、細(xì)胞計(jì)量、質(zhì)譜儀與測(cè)量技術(shù)等領(lǐng)域?qū)儆贜PL的優(yōu)勢(shì)學(xué)科。
由圖7(b)PTB的SWOT圖中可以得出:城市綠色和智慧、激光輻射度、芯片級(jí)量子計(jì)量、細(xì)胞計(jì)量、質(zhì)譜儀與測(cè)量技術(shù)等領(lǐng)域?qū)儆赑TB的優(yōu)勢(shì)學(xué)科。
由圖7(c)NIST的SWOT圖中可以得出:NIST是唯一在第四象限沒(méi)有出現(xiàn)學(xué)科的機(jī)構(gòu);芯片級(jí)量子計(jì)量研究領(lǐng)域是屬于NIST的絕對(duì)優(yōu)勢(shì)學(xué)科[15~17]。
圖7 各國(guó)際計(jì)量機(jī)構(gòu)的SWOT分析圖Fig.7 SWOT of national metrology institutes
3.4.1 NIM的科研產(chǎn)出
中國(guó)計(jì)量科學(xué)研究院的科研產(chǎn)出整體呈現(xiàn)持續(xù)增長(zhǎng)態(tài)勢(shì),在論文發(fā)表數(shù)量上已形成一定規(guī)模,國(guó)際合作參與度較高,但學(xué)科影響力有待進(jìn)一步提升[18]。
3.4.2 SWOT分析
在NIM的SWOT分析圖中,從文獻(xiàn)計(jì)量學(xué)角度分析,出現(xiàn)在第一象限的優(yōu)勢(shì)學(xué)科有:熱工所的接觸測(cè)溫實(shí)驗(yàn)室,化學(xué)所的食品安全實(shí)驗(yàn)室,有機(jī)化學(xué)實(shí)驗(yàn)室,環(huán)境中心的物理化學(xué)實(shí)驗(yàn)室,時(shí)頻所的頻率標(biāo)準(zhǔn)及應(yīng)用實(shí)驗(yàn)室等;出現(xiàn)在第二象限的潛力實(shí)驗(yàn)室有:前沿中心的核酸計(jì)量研究室,環(huán)境中心的顆粒物計(jì)量實(shí)驗(yàn)室,熱工所的城市綠色和智慧實(shí)驗(yàn)室。
3.4.3 載文期刊
對(duì)NIM論文進(jìn)行載文期刊分析,刊載論文的期刊一共有394種。在NIM所有發(fā)文中,期刊規(guī)范化引文影響力(JNCI)大于1的期刊一共97種,論文數(shù)占29%。圖8為NIM論文JNCI占比情況分析結(jié)果。
圖8 NIM論文JNCI占比情況Fig.8 Proportion of JNCI in NIM papers
按照發(fā)文量進(jìn)行期刊排序,選取前5種期刊詳見表1。發(fā)表在Metrologia上的文章最多;在前5的期刊中JNCI值大于1的有3種,說(shuō)明NIM在這3種期刊的發(fā)文影響力高于該期刊自身的平均水平;NIM的科研人員投稿時(shí)完全可以投到更高影響力的期刊平臺(tái)上來(lái)展示自己的成果。
表1 NIM論文期刊分析Tab.1 System parameter Journal analysis of NIM papers
本文基于InCites數(shù)據(jù)庫(kù)對(duì)國(guó)際計(jì)量機(jī)構(gòu)的學(xué)科進(jìn)行了分析,從發(fā)文規(guī)模和影響力等指標(biāo)進(jìn)行了對(duì)標(biāo)比對(duì),并對(duì)各個(gè)實(shí)驗(yàn)室的學(xué)科領(lǐng)域進(jìn)行了SWOT分析?;诖?,提出幾點(diǎn)建議:
一是加強(qiáng)學(xué)科布局,保持優(yōu)勢(shì)學(xué)科的發(fā)展態(tài)勢(shì),加強(qiáng)潛力學(xué)科的建設(shè),以達(dá)事半功倍的效果,并以此提高論文的國(guó)際影響力。
二是鼓勵(lì)科研人員向高影響力期刊投稿,在NIM論文排名前5的期刊中,就有3種期刊的規(guī)范化引文影響力是高于平均水平的,說(shuō)明發(fā)表論文的影響力高于期刊自身的影響力,研究人員應(yīng)該投到更高影響力的期刊來(lái)展示自己的成果。
最后需要指出的是,文獻(xiàn)計(jì)量分析僅僅是評(píng)估科研水平的方法之一,用文獻(xiàn)計(jì)量方法解讀科研實(shí)力,容易缺失對(duì)工程方面的能力以及成果轉(zhuǎn)化水平的評(píng)估;從事應(yīng)用技術(shù)開發(fā)科技管理等工作的各類人才中,也并不以論文作為主要產(chǎn)出,其他成果還包括專利申請(qǐng)、國(guó)際比對(duì)、CMC項(xiàng)目、國(guó)際組織任職等。以文獻(xiàn)計(jì)量學(xué)為視角評(píng)價(jià)發(fā)展態(tài)勢(shì)雖然只是研究的一個(gè)角度并不全面,希望本文吸引更多的同事投入到相關(guān)研究和評(píng)估中,以便以更清晰全面的證據(jù)和信息支撐中國(guó)計(jì)量科學(xué)研究院肩負(fù)的光榮使命。
致謝:感謝中國(guó)計(jì)量科學(xué)研究院院辦公室、國(guó)際合作部、時(shí)頻所、幾何量所、熱工所、力聲所、電磁所、信電所、光學(xué)所、電離所、化學(xué)所、前沿中心、測(cè)量中心、標(biāo)物中心、醫(yī)學(xué)中心、環(huán)境中心、數(shù)據(jù)中心的大力支持!