張 爽, 汪芩州, 石 鋒, 朱維鳳
(1.西南交通大學(xué) 圖書館,四川 成都 610031;2.成都市龍泉驛區(qū)衛(wèi)生和健康局, 四川 成都 610010;3.四川大學(xué) 電子信息學(xué)院,四川 成都 610065)
2019年底新型冠狀病毒(2019 novel coronavirus, 2019-nCoV)引發(fā)的危機(jī)已成為全球應(yīng)對(duì)的重大公共衛(wèi)生事件。2020年1月20日,我國(guó)國(guó)家衛(wèi)生健康委員會(huì)發(fā)布1號(hào)公告,將新型冠狀病毒感染的肺炎納入《中華人民共和國(guó)傳染病防治法》規(guī)定的乙類傳染病,并采取甲類傳染病的預(yù)防、控制措施〔1〕。2020年2月11日世界衛(wèi)生組織正式命名新型冠病毒所致疾病為“COVID-19”。截至北京時(shí)間6月11日,全球累計(jì)確診新冠肺炎病例730多萬(wàn)例,累計(jì)死亡40多萬(wàn)例。超過200個(gè)國(guó)家和地區(qū)發(fā)現(xiàn)確診病例,造成了特別重大的人員傷亡、財(cái)產(chǎn)損失和經(jīng)濟(jì)社會(huì)影響〔2〕。
冠狀病毒是一個(gè)大型病毒家族,引發(fā)了2019新型冠狀病毒肺炎(COVID-19)、嚴(yán)重急性呼吸綜合征(SARS)和中東呼吸綜合征(MERS)等嚴(yán)重疾病和公共衛(wèi)生安全事件,而新型冠狀病毒是以前從未在人體中發(fā)現(xiàn)的冠狀病毒新毒株〔3〕。中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)科大學(xué)建立的全球蝙蝠病毒數(shù)據(jù)庫(kù)(DBatVir)顯示,全球200多種蝙蝠身上發(fā)現(xiàn)的冠狀病毒超過500種,冠狀病毒對(duì)人類健康的潛在威脅巨大〔4~5〕。本文基于文獻(xiàn)計(jì)量學(xué)方法,對(duì)冠狀病毒中外研究文獻(xiàn)信息進(jìn)行分析,探究中外研究機(jī)構(gòu)和人員對(duì)冠狀病毒的研究現(xiàn)狀、高發(fā)文作者和機(jī)構(gòu)構(gòu)成、合作網(wǎng)絡(luò)關(guān)系以及熱點(diǎn)前沿和方向,以為后續(xù)開展冠狀病毒的科學(xué)研究提供參考和借鑒。
1.數(shù)據(jù)采集
WOS(Web of Science)涵蓋了較為全面權(quán)威的研究資料,是全球范圍內(nèi)被研究者普遍認(rèn)可的文獻(xiàn)檢索系統(tǒng)。本文以WOS數(shù)據(jù)庫(kù)為數(shù)據(jù)來(lái)源,以“Coronavir*”為檢索詞進(jìn)行主題檢索,數(shù)據(jù)采集時(shí)間為2020年2月6日,即數(shù)據(jù)時(shí)間范圍為數(shù)據(jù)庫(kù)有記錄的年份1986年到2020年2月6日,選擇WOS核心合集數(shù)據(jù)庫(kù)全部數(shù)據(jù)集。檢索得到冠狀病毒主題相關(guān)文獻(xiàn)共12978篇,剔除“correction”“reprint”“abstract”等文獻(xiàn)類型,選取類型為“article”“review”“proceeding paper”“book chapter”的文獻(xiàn)共計(jì)11874篇。
2.分析方法
本文通過編寫信息提取程序?qū)OS核心合集數(shù)據(jù)庫(kù)中導(dǎo)出的原始數(shù)據(jù)進(jìn)行計(jì)算和清洗,將同一字段中關(guān)于作者和機(jī)構(gòu)的信息進(jìn)行拆分并提取,再用Derwent Data Analyzer文本挖掘軟件在原始數(shù)據(jù)中匹配作者與機(jī)構(gòu)之間的對(duì)應(yīng)關(guān)系,對(duì)機(jī)構(gòu)變體進(jìn)行人工合并,并清理由拼寫簡(jiǎn)化和同音字造成的信息混亂,形成一套清晰且完善的作者—機(jī)構(gòu)列表,以實(shí)現(xiàn)對(duì)研究機(jī)構(gòu)、研究人員發(fā)文信息的精確統(tǒng)計(jì)。此外,通過CiteSpace 5.6.R2(64-bit)軟件對(duì)全球冠狀病毒研究論文進(jìn)行共現(xiàn)分析并可視化,挖掘研究機(jī)構(gòu)及研究人員之間的合作關(guān)系網(wǎng)絡(luò),聚類高頻關(guān)鍵詞分析該領(lǐng)域的主要研究方向,研究關(guān)鍵詞的突現(xiàn)和演變規(guī)律。
本研究統(tǒng)計(jì)了各個(gè)國(guó)家、機(jī)構(gòu)和研究人員的發(fā)文情況,分析了在發(fā)文情況中各國(guó)呈現(xiàn)出的差別和變化情況,全球和中國(guó)的高發(fā)文機(jī)構(gòu)和學(xué)者;并用CiteSpace軟件構(gòu)建出研究機(jī)構(gòu)之間的合作網(wǎng)絡(luò)關(guān)系,分析關(guān)鍵詞的頻率和突現(xiàn)情況,深刻揭示全球范圍內(nèi)冠狀病毒主題研究的現(xiàn)狀。
1.中外發(fā)文量及變化趨勢(shì)
1937年全球第一例冠狀病毒從雞身上分離出來(lái),1965年第一例人冠狀病毒由Tyreell和Bynoe從人類鼻腔中分離出來(lái),該病毒在人類中至少存在500~800年〔6~7〕。圖1為1989~2020年2月全球機(jī)構(gòu)和中國(guó)機(jī)構(gòu)冠狀病毒年發(fā)文量統(tǒng)計(jì)結(jié)果,圖1顯示,全球機(jī)構(gòu)和中國(guó)機(jī)構(gòu)的發(fā)文量波動(dòng)趨勢(shì)大體可劃分為2003年SARS爆發(fā)前、2003年SARS爆發(fā)后至2012年MERS爆發(fā)前以及MERS爆發(fā)后三個(gè)階段。在2003年前,全球針對(duì)冠狀病毒的研究相對(duì)較少,每年約100~200篇論文產(chǎn)出。我國(guó)開展冠狀病毒研究相對(duì)較早,WOS核心合集可查詢的第一篇論文題為CoronavirusInfectioninChina,該論文收錄于1989年國(guó)際病毒感染發(fā)病機(jī)制與控制研討會(huì)論文集,作者為我國(guó)軍事醫(yī)學(xué)科學(xué)院微生物流行病學(xué)研究所Zhu, G F。我國(guó)在第一階段期對(duì)冠狀病毒的相關(guān)研究持續(xù)度和關(guān)注度有限,僅有3篇論文。2003年SARS爆發(fā),全球冠狀病毒相關(guān)研究論文急劇增多,我國(guó)相關(guān)論文也爆發(fā)式增長(zhǎng),達(dá)到頂峰,隨著SARS疫情的結(jié)束,全球的發(fā)文量開始下降,我國(guó)也相應(yīng)降低;直至2012年MERS爆發(fā),冠狀病毒研究關(guān)注度又開始提升,并保持年均700篇左右的發(fā)文量,中國(guó)機(jī)構(gòu)對(duì)冠狀病毒的研究論文穩(wěn)步緩慢回升,但增長(zhǎng)并不突出,隨著2019-nCoV疫情的發(fā)生,全球和中國(guó)的研究論文數(shù)量將顯著提升。
圖1 1989~2020年2月全球和中國(guó)冠狀病毒年發(fā)文量
2.高發(fā)文量國(guó)家構(gòu)成
全球有130個(gè)國(guó)家和地區(qū)的機(jī)構(gòu)于1989~2020年2月發(fā)表了冠狀病毒相關(guān)主題的研究成果,其中有22個(gè)國(guó)家和地區(qū)的文獻(xiàn)超過100篇,排在前十位的國(guó)家分別是:美國(guó)、中國(guó)、德國(guó)、英國(guó)、荷蘭、加拿大、日本、法國(guó)、韓國(guó)、沙特阿拉伯,發(fā)文量依次為4204篇、2484篇、839篇、722篇、690篇、645篇、564篇、533篇、465篇和364篇。圖2為這10個(gè)國(guó)家年發(fā)文量的逐年統(tǒng)計(jì)結(jié)果,總體來(lái)說(shuō),美國(guó)和中國(guó)發(fā)文量屬于第一梯隊(duì),遠(yuǎn)遠(yuǎn)高于其他國(guó)家。2003年前中國(guó)發(fā)文量非常低,美國(guó)發(fā)文量相對(duì)平穩(wěn);SARS爆發(fā)后,中國(guó)和美國(guó)的發(fā)文量均極速增加,中美發(fā)文數(shù)量基本一致,而后兩國(guó)發(fā)文量開始下降,中國(guó)下降幅度較大;2012年MERS爆發(fā),中國(guó)和美國(guó)的發(fā)文數(shù)量均再次上升。德國(guó)、英國(guó)、荷蘭、加拿大、日本和韓國(guó)的發(fā)文量趨勢(shì)基本與美國(guó)一致,但總體論文數(shù)量偏低,1990年到2002年期間,發(fā)文量一般在年均10篇到20篇之間,2003年開始增加而后下降,2012開始再次增長(zhǎng)。沙特阿拉伯受MERS的影響比較明顯,2012年前發(fā)文量較少,2012年后開始增加。上述分析表明,針對(duì)冠狀病毒的研究,以疫情爆發(fā)、平穩(wěn)和消退過程,各國(guó)研究都有顯著研究關(guān)注提升到降低的過程。
圖2 1989~2020年2月冠狀病毒全球前十位國(guó)家的年發(fā)文量
1.高發(fā)文量機(jī)構(gòu)
通過對(duì)樣本文獻(xiàn)發(fā)文機(jī)構(gòu)進(jìn)行分析發(fā)現(xiàn),全球有5721個(gè)機(jī)構(gòu)進(jìn)行了冠狀病毒的相關(guān)研究。表1為全球和中國(guó)發(fā)文量排前十位的機(jī)構(gòu),美國(guó)和中國(guó)的研究機(jī)構(gòu)表現(xiàn)突出。全球前十位的機(jī)構(gòu)中有5個(gè)機(jī)構(gòu)屬于美國(guó),3個(gè)機(jī)構(gòu)屬于中國(guó),香港大學(xué)和中國(guó)科學(xué)院在數(shù)量上位于全球機(jī)構(gòu)的第一和第二位。在中國(guó)排名前十位的機(jī)構(gòu)中,除香港大學(xué)和中國(guó)科學(xué)院外,香港中文大學(xué)和中國(guó)農(nóng)業(yè)科學(xué)院也非常突出。
表1 全球和中國(guó)冠狀病毒發(fā)文量前十位的研究機(jī)構(gòu) (單位:篇)
2.機(jī)構(gòu)合作關(guān)系和中介中心性
Citespace軟件中的網(wǎng)絡(luò)密度是用來(lái)衡量網(wǎng)絡(luò)節(jié)點(diǎn)聯(lián)系程度的重要指標(biāo),大于0.5表示網(wǎng)絡(luò)緊密,節(jié)點(diǎn)之間互動(dòng)頻繁〔8〕。對(duì)全球機(jī)構(gòu)的發(fā)文合作網(wǎng)絡(luò)進(jìn)行分析,時(shí)間切片設(shè)置5年,選取標(biāo)準(zhǔn)Top 50, 得到236個(gè)節(jié)點(diǎn),756條連線,網(wǎng)絡(luò)密度為0.0273,可見冠狀病毒研究的全球網(wǎng)絡(luò)比較松散。圖3為全球排名前六位的機(jī)構(gòu)的合作網(wǎng)絡(luò)關(guān)系圖(由于加州大學(xué)系統(tǒng)為多所大學(xué)構(gòu)成,故本次未顯現(xiàn)其總體合作關(guān)系),這些機(jī)構(gòu)都擁有較好的國(guó)際國(guó)內(nèi)合作關(guān)系網(wǎng)絡(luò)。香港大學(xué)國(guó)內(nèi)外合作比較均勻;中國(guó)科學(xué)院國(guó)內(nèi)合作強(qiáng)度非常高,特別是與清華大學(xué)、復(fù)旦大學(xué)等合作非常緊密,國(guó)外與美國(guó)杜克大學(xué)、新加坡國(guó)立大學(xué)醫(yī)學(xué)院合作較頻繁;荷蘭烏德勒支大學(xué)與荷蘭伊拉斯姆醫(yī)學(xué)中心合作明顯,與中國(guó)的華中農(nóng)業(yè)大學(xué)合作也較多;美國(guó)國(guó)家過敏和傳染病研究所與愛荷華大學(xué)、西班牙國(guó)家研究委員會(huì)、美國(guó)衛(wèi)生科學(xué)軍隊(duì)服務(wù)大學(xué)等機(jī)構(gòu)合作緊密;北卡羅萊納大學(xué)也有龐大的合作網(wǎng)絡(luò),其中美國(guó)機(jī)構(gòu)占主體,合作最緊密的有華盛頓大學(xué)、馬里蘭大學(xué)等機(jī)構(gòu)。
圖3 全球高發(fā)文量機(jī)構(gòu)強(qiáng)合作關(guān)系
中介中心性是測(cè)量節(jié)點(diǎn)在網(wǎng)絡(luò)中重要性的一個(gè)指標(biāo)。中介中心性超過0.1的節(jié)點(diǎn)為關(guān)鍵節(jié)點(diǎn),在合作網(wǎng)絡(luò)中具有橋梁的作用,對(duì)整個(gè)網(wǎng)絡(luò)的影響力比較大〔9〕。該研究網(wǎng)絡(luò)中,中介中心性超過0.1的研究機(jī)構(gòu)節(jié)點(diǎn)有16個(gè),前十位依次為美國(guó)國(guó)家過敏和傳染病研究所、美國(guó)衛(wèi)生科學(xué)軍隊(duì)服務(wù)大學(xué)、荷蘭烏德勒支大學(xué)、美國(guó)賓夕法尼亞大學(xué)、英國(guó)農(nóng)業(yè)和食品研究委員會(huì)、美國(guó)俄亥俄州立大學(xué)、荷蘭萊頓大學(xué)、美國(guó)農(nóng)業(yè)部農(nóng)業(yè)工程應(yīng)用技術(shù)研究所、紐約州立大學(xué)奧爾巴尼分校、美國(guó)南加州大學(xué)。
3.高發(fā)文量作者
表2和表3統(tǒng)計(jì)了全球前十位和中國(guó)前二十位冠狀病毒發(fā)文量作者。香港大學(xué)有三位研究人員,荷蘭烏德勒支大學(xué)有兩位研究人員產(chǎn)出位于全球前十位,表現(xiàn)非常突出。以香港大學(xué)的袁國(guó)勇、胡釗逸、陳國(guó)雄為中心已經(jīng)形成了非常穩(wěn)定并且成果豐碩的冠狀病毒研究團(tuán)隊(duì),在全球范圍內(nèi)以這些高產(chǎn)研究人員為中心也形成了龐大的研究網(wǎng)絡(luò),這個(gè)網(wǎng)絡(luò)隨著合作的加強(qiáng)正在不斷的擴(kuò)大。在中國(guó),除香港的研究人員外,復(fù)旦大學(xué)的姜世博、盧露,中國(guó)農(nóng)業(yè)科學(xué)院哈爾濱獸醫(yī)研究所的劉勝旺、馮力、韓宗璽和陳建飛,華中農(nóng)業(yè)大學(xué)的肖少波、方六榮、王蕩等人都形成了各自的研究方向和特色,這三個(gè)單位的研究人員在發(fā)文數(shù)量上較為突出,此外中國(guó)科學(xué)院武漢病毒所的石正麗等近幾年的研究成果也比較豐碩。
表2 全球前十位高發(fā)文作者及所屬機(jī)構(gòu)
表3 中國(guó)前二十位高發(fā)文作者及所屬機(jī)構(gòu)
1.高頻關(guān)鍵詞
關(guān)鍵詞是對(duì)研究?jī)?nèi)容和主題的集中概括,論文利用CiteSpace軟件對(duì)冠狀病毒文獻(xiàn)的關(guān)鍵詞進(jìn)行分析,時(shí)間切片設(shè)置3年,選取標(biāo)準(zhǔn)Top 50, 運(yùn)用pathfinder進(jìn)行裁剪,得到167個(gè)節(jié)點(diǎn),443條連線,網(wǎng)絡(luò)密度為0.0123。Modularity(Q值)和silhouette(S值)參數(shù)值是聚類效果的指標(biāo),本研究中Q值為0.8519(一般認(rèn)為Q>0.4合理,且Q值越大越適合聚類),聚類非常顯著,S值為 0.7727(一般認(rèn)為S>0.4合理,且S值越大,表示每個(gè)聚類中的關(guān)鍵詞同質(zhì)性越強(qiáng)),聚類信度高〔9〕。排名前三十的高頻關(guān)鍵詞是:coronavirus,infection,virus,acute respiratory syndrome,identification,SARS coronavirus,respiratory syndrome coronavirus,mouse hepatitis virus,protein,SAR,spike protein,replication,expression,sequence,disease,infectious bronchitis virus,antibody,outbreak,monoclonal,murine coronavirus,receptor,pathogenesis,Saudi Arabia,cell,diagnosis,strain,polymerase chain reaction,children,Hong Kong,gene。通過關(guān)鍵詞聚類,得到12個(gè)冠狀病毒研究領(lǐng)域的集群,如表4所示,可以看出,研究聚焦的高頻關(guān)鍵詞集群主要在禽類、牛、犬、人等冠狀病毒、致病細(xì)胞因子、病毒的蛋白、嚴(yán)重急呼吸綜合征和流感特性、受體結(jié)合區(qū)、抗SARS藥物等方面。
表4 冠狀病毒研究領(lǐng)域關(guān)鍵詞主要聚類結(jié)果
2.關(guān)鍵詞突現(xiàn)演變
CiteSpace軟件中的Citation Burst指研究對(duì)象的突現(xiàn)強(qiáng)度,這種突現(xiàn)反映了研究領(lǐng)域中的新趨勢(shì)〔10〕。三十年間共出現(xiàn)127個(gè)突現(xiàn)關(guān)鍵詞,對(duì)突現(xiàn)關(guān)鍵詞進(jìn)行分析,如圖4所示。在2003年前,冠狀病毒的突現(xiàn)關(guān)鍵詞主要是核苷酸序列、豬牛鼠等動(dòng)物的病毒蛋白質(zhì)、基因序列、病毒顆粒等;2003~2012年間突現(xiàn)較多的關(guān)鍵詞是免疫反應(yīng)、中樞神經(jīng)系統(tǒng)、SARS、急性呼吸綜合癥、流行性等,2012年后MERS病毒、受體結(jié)合區(qū)、中和抗體、疫苗等關(guān)鍵詞開始爆發(fā)。這表明冠狀病毒的研究與疫情的爆發(fā)密切相關(guān),早期主要關(guān)于動(dòng)物病毒分子結(jié)構(gòu)的研究較多,隨著SARS、MERS的爆發(fā)和傳播,研究開始向人際傳播、流行病學(xué)、免疫系統(tǒng)、抗體和疫苗等方面?zhèn)戎亍?/p>
(a)2003年前典型突現(xiàn)關(guān)鍵詞
(b)2003~2012年間典型突現(xiàn)關(guān)鍵詞
(c)2012年后典型突現(xiàn)關(guān)鍵詞舉例
論文基于WOS核心合集數(shù)據(jù)庫(kù),對(duì)30年來(lái)全球冠狀病毒論文信息進(jìn)行采集和統(tǒng)計(jì),分析了中外國(guó)家冠狀病毒的發(fā)文量、高發(fā)文量國(guó)家、機(jī)構(gòu)、人員構(gòu)成,采用Citespce軟件對(duì)全球研究機(jī)構(gòu)的合作關(guān)系、高頻關(guān)鍵詞及關(guān)鍵詞突現(xiàn)演變進(jìn)行了研究。結(jié)論如下:
(1)冠狀病毒引發(fā)的疾病主要為呼吸類傳染性疾病,其研究受疫情爆發(fā)的影響較大,在2003年SARS爆發(fā)后和2012年MERS爆發(fā)后,冠狀病毒的研究都有顯著的增加,但MERS對(duì)我國(guó)影響較小,我國(guó)的研究關(guān)注度相對(duì)較小。在冠狀病毒發(fā)文量方面,中國(guó)和美國(guó)屬于第一梯隊(duì),遠(yuǎn)超其他國(guó)家。
(2)冠狀病毒高發(fā)文量的機(jī)構(gòu)為香港大學(xué)、中國(guó)科學(xué)院、美國(guó)加州大學(xué)系統(tǒng)、荷蘭烏德勒支大學(xué)、美國(guó)國(guó)立衛(wèi)生研究院等,發(fā)文量高的機(jī)構(gòu)都有較好的研究合作網(wǎng)絡(luò)。我國(guó)香港大學(xué)、復(fù)旦大學(xué)、中國(guó)農(nóng)業(yè)科學(xué)院、廣州醫(yī)科大學(xué)、華中農(nóng)業(yè)大學(xué)、軍事醫(yī)學(xué)院、中國(guó)疾病控制預(yù)防中心、東北農(nóng)業(yè)大學(xué)、中科院等機(jī)構(gòu)的研究人員有較豐富的研究成果和基礎(chǔ)。
(3)冠狀病毒的研究早期主要關(guān)注病毒蛋白質(zhì)、基因序列、聚合酶、病毒顆粒等,隨著SARS,MERS疫情的爆發(fā)和傳播,向人際傳播、流行病學(xué)、免疫系統(tǒng)、抗體和疫苗等方面?zhèn)戎亍?/p>
(4)前期針對(duì)冠狀病毒的研究已經(jīng)形成了一定的國(guó)際合作規(guī)模和網(wǎng)絡(luò),但是全球合作網(wǎng)絡(luò)相對(duì)松散。2019-nCoV已經(jīng)席卷了全球200多個(gè)國(guó)家和地區(qū),應(yīng)加強(qiáng)全球科研合作網(wǎng)絡(luò),形成科研的協(xié)同研究機(jī)制,實(shí)現(xiàn)科研成果共享,為共同抗擊新型冠狀病毒提供技術(shù)支持。