王 麗,張遠明
SCI數(shù)據(jù)庫是國際公認的進行科學(xué)統(tǒng)計與科學(xué)評價的主要檢索工具,其挑選有代表性的權(quán)威的科技期刊作為數(shù)據(jù)源,包括了世界上90%以上的重要的科技文獻,所以被它收錄的論文具有較高的質(zhì)量,代表了當(dāng)時有關(guān)領(lǐng)域的先進水平??茖W(xué)論文產(chǎn)出是國際上公認的衡量國家和地區(qū)總體科技水平的科技產(chǎn)出指標(biāo)之一,SCI論文產(chǎn)出是衡量單位科研國際化水平和實力的重要指標(biāo),直接反映了單位的研究水平、科研實力。近年來,我國科研人員發(fā)表SCI的論文量不斷增加,據(jù)2019年中國科技論文統(tǒng)計結(jié)果顯示,2018年中國科研人員發(fā)表SCI論文數(shù)高達41.82篇排在世界第二位,占世界份額的20.2%[1]。本文將從我國臨床醫(yī)學(xué)科研人員發(fā)表的SCI論文視角進行分析,我國科研人員發(fā)表的SCI論文的特征,進行數(shù)據(jù)挖掘分析。
本研究以Web of Science(WoS)網(wǎng)絡(luò)版數(shù)據(jù)庫論文原始數(shù)據(jù)作為統(tǒng)計源,通過WoS檢索作者地址中包含“the People’s Republic of China”、因論文發(fā)表兩年后,引用達到高峰,故,限定發(fā)表時間為“2018年”、學(xué)科為“MEDICINE,GENERAL &INTERNAL”的論文,共檢索到4 810個機構(gòu)的中國學(xué)者發(fā)表論文5 278篇,檢索日期為2020年6月10日。
數(shù)據(jù)分析使用EXCET軟件和美國湯姆森路透公司開發(fā)的數(shù)據(jù)分析工具TDA(Thomson Data Analyzer)。將檢索到的目標(biāo)數(shù)據(jù)整理歸納,導(dǎo)入Excel程序,清洗去除重復(fù)記錄數(shù)據(jù)內(nèi)容,合并同質(zhì)項。然后采用文獻計量學(xué)、分類統(tǒng)計以及社會網(wǎng)絡(luò)等方法,對論文的作者機構(gòu)、文獻類型、來源期刊、高關(guān)鍵詞及被引頻次進行統(tǒng)計分析。
利用EXCET對計量資料進行統(tǒng)計,用“n(%)”表示,利用TDA對數(shù)據(jù)進行深度挖掘并進行可視化處理。
通過對作者機構(gòu)名稱進行規(guī)范、合并同質(zhì)項得出,5 278篇論文共分布在4 810個機構(gòu),發(fā)文量小于10篇的單位有1 856,約占35.16%。其中,發(fā)表1篇論文的單位有442個;發(fā)文量排名前20的作者機構(gòu)共發(fā)表論文1 191篇,占22.57%。具體分布情況見表1。
科研機構(gòu)發(fā)表SCI論文的數(shù)量一定程度上反映了該單位的科研能力和學(xué)術(shù)水平[3]。從對學(xué)術(shù)機構(gòu)發(fā)文量排名可以看出,發(fā)文量大于50篇的單位有7個,分別為四川大學(xué)華西醫(yī)院、吉林大學(xué)白求恩第一醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬第一醫(yī)院、解放軍總醫(yī)院、北京協(xié)和醫(yī)院、浙江大學(xué)醫(yī)學(xué)院附屬第二醫(yī)院、四川大學(xué)華西第二醫(yī)院。其中,四川大學(xué)華西醫(yī)院的臨床醫(yī)生發(fā)表SCI的論文量占明顯優(yōu)勢,約占4.47%,剩余的論文發(fā)散在4 803個機構(gòu)中。研究結(jié)果表明,臨床醫(yī)生發(fā)表論文的機構(gòu)集中度較高,占比不到0.5%的機構(gòu)發(fā)文量占比高于20%,而90%以上的機構(gòu)則大多發(fā)文較少。
表1 發(fā)文量排名前20的作者機構(gòu)發(fā)文篇數(shù)及占比
2018年,中國臨床醫(yī)生在94種國際期刊上發(fā)表了SCI論文5 278篇。其中,發(fā)文量排名前20的期刊發(fā)表論文共有4 724篇,占88.50%。發(fā)文量排名前20的期刊具體情況見表2。
從表2可以看出,超過一半的論文發(fā)表在MEDICINE上(經(jīng)該期刊官網(wǎng)查證,該刊是美國的威科醫(yī)療公司編輯出版,周刊,其影響因子為1.87);中國醫(yī)學(xué)會主辦的《中華醫(yī)學(xué)雜志》(英文版)發(fā)文量占10.35%;占比大于1%的期刊有10種。
表2 發(fā)稿量排名前20的期刊發(fā)文情況
5 278篇論文中,欄目類型有7個:具體分布情況為論著(Article)3 488篇,占66.09%;綜述(Review)1 145篇,占21.69%;讀者來信(Letter)316篇,5.99%;編輯材料(Editorial Material)189篇,占3.58%;會議摘要(Meeting Abstract)101篇,占1.91%;更正(Correction)37篇;撤回2篇。
利用TDA軟件,對5 278篇論文的關(guān)鍵詞進行統(tǒng)計,共有10 691個關(guān)鍵詞,累計出現(xiàn)17 857次。出現(xiàn)頻次排名前10的關(guān)鍵詞分別為Metaanalysis、prognosis、systematic review、diagnosis、protocol、polymorphism、hepatocellular carcinoma、Case report、Magnetic resonance imaging、Breast cancer,排名前50的高頻關(guān)鍵詞見表3。
從高頻關(guān)鍵詞統(tǒng)計表可以看出,中國臨床醫(yī)生研究的熱點領(lǐng)域為腫瘤(肝細胞癌、乳腺癌、胃癌、大腸癌)、卒中、心臟疾?。ㄐ牧λソ?、高血壓、冠心?。┑嚷约膊〉牧餍胁W(xué)、診斷技術(shù)(磁共振成像、生物標(biāo)記技術(shù))、治療手段及預(yù)后,以及兒童和妊娠婦女疾病的防治。
表3 高頻關(guān)鍵詞分布情況
某一學(xué)科領(lǐng)域的研究水平不但反映在學(xué)術(shù)論文數(shù)量上,還可以從論文影響力上得以判斷。論文被引頻次是評價論文影響力的指標(biāo)之一,它反映了論文被同行的重視程度和利用情況[2]。我們對相關(guān)論文的被引情況進行了統(tǒng)計分析。5 278篇論文被引總頻次為5 907次,單篇最高被引次數(shù)為343次,被引頻次≥10次的論文有81篇,共被引3 167次,約占總被引頻次的53.61%;零被引論文有3 642篇,約占所有論文的69.00%,被引具體情況,見表4。
表4 中國臨床醫(yī)生發(fā)表論文被引頻次及占比情況
科研機構(gòu)發(fā)表SCI論文的數(shù)量一定程度上反映了該單位的科研能力和學(xué)術(shù)水平[3-4]。從對學(xué)術(shù)機構(gòu)發(fā)文量排名可以看出,發(fā)文量大于50篇的單位有7個。其中,四川大學(xué)華西醫(yī)院的臨床醫(yī)生發(fā)表SCI的論文量占明顯優(yōu)勢,約占4.47%,剩余的論文發(fā)散在4 803個機構(gòu)中,中國臨床醫(yī)生發(fā)表論文的機構(gòu)優(yōu)勢集中程度較高,可以說明這些機構(gòu)的科研能力在一定程度引領(lǐng)著中國臨床醫(yī)生的科研進步與發(fā)展。
中國臨床醫(yī)生超過50%的論文發(fā)表在MEDICINE上,這可能與該刊是周刊,發(fā)表周期短,發(fā)文量大有關(guān);同時,有111.5%的論文分散發(fā)表在74種期刊上,呈現(xiàn)兩極化分布,國內(nèi)期刊發(fā)文比例較小(僅占10.65%)。這一方面說明中國學(xué)者更傾向于將稿件投向國際期刊,更愿意參與國際交流;另一方面也說明,中國科技期刊對優(yōu)質(zhì)稿源的吸引力還不夠。因此,一方面,國家層面應(yīng)采取積極措施,扶植中國有潛力的期刊走向國際化,提高期刊質(zhì)量,增加期刊的吸引力和凝聚力。另一方面,給予一些政策激勵,將中國頂級期刊與SCI期刊一視同仁,鼓勵中國臨床醫(yī)生將優(yōu)秀的研究成果發(fā)表在國內(nèi)期刊上。
本研究發(fā)現(xiàn),中國臨床醫(yī)生發(fā)表論文的類型相對集中,主要是總結(jié)科研、臨床、教學(xué)的成果等學(xué)術(shù)性論文(Article)3 488篇(66.09%)和評論性綜述類論文(Review)1 145篇(21.69%),這兩類文章的學(xué)術(shù)性均較強,也有少量的經(jīng)驗交流性讀者來信和會議論文等。這反映了中國的臨床醫(yī)生在學(xué)術(shù)思考和主動交流方面還有欠缺。
高頻關(guān)鍵詞在一定程度上能很好地反映論文研究的主題,掌握論文關(guān)鍵詞分布,有助于學(xué)者了解研究的熱點及冷門領(lǐng)域,有助于選擇研究方向,進而發(fā)表高影響力論文[5]。結(jié)合高頻關(guān)鍵詞共現(xiàn)圖和高頻關(guān)鍵詞統(tǒng)計表可以看出,中國臨床醫(yī)生研究的熱點領(lǐng)域為腫瘤(肝細胞癌、乳腺癌、胃癌、大腸癌)、卒中、心臟疾?。ㄐ牧λソ摺⒏哐獕?、冠心病)等慢性疾病的流行病學(xué)、診斷技術(shù)(磁共振成像、生物標(biāo)記技術(shù))、治療手段及預(yù)后,以及兒童和妊娠婦女疾病的防治。
由于檢索條件和時間限制,本研究只分析了臨床醫(yī)生2018年發(fā)表的SCI論文,缺少歷年動態(tài)數(shù)據(jù)和跨學(xué)科文獻,不能全面體現(xiàn)中國醫(yī)學(xué)發(fā)展的整體水平。在今后研究中,需要將全部醫(yī)學(xué)相關(guān)學(xué)科的論文納入研究范圍,并增加多年的數(shù)據(jù),從更多角度分析,從而進一步全面地為我國醫(yī)學(xué)領(lǐng)域相關(guān)的學(xué)者提供更多信息支撐。