国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

“冠狀病毒”科學(xué)論文主題演變規(guī)律的歷時(shí)性分析

2021-06-07 08:08鄧君孫紹丹常嚴(yán)予宋先智鄧寶成
現(xiàn)代情報(bào) 2021年6期
關(guān)鍵詞:網(wǎng)絡(luò)分析

鄧君 孫紹丹 常嚴(yán)予 宋先智 鄧寶成

關(guān)鍵詞:冠狀病毒;主題建模;網(wǎng)絡(luò)分析:歷時(shí)性分析

2020年,突如其來(lái)的新冠病毒(COVID-19)席卷全球,對(duì)全球經(jīng)濟(jì)和社會(huì)發(fā)展帶來(lái)了巨大挑戰(zhàn)。COVID-19暴發(fā)也引起了學(xué)術(shù)界對(duì)冠狀病毒的研究熱潮。科學(xué)家作為抗擊病毒的一線者,積極投身于科研中,發(fā)表了大量冠狀病毒研究論文。這些研究成果并非一蹴而就,是一個(gè)歷時(shí)性的知識(shí)繼承過(guò)程。COVID-19作為冠狀病毒的一種,備受全世界科研人員矚目,探討冠狀病毒科學(xué)論文主題規(guī)律對(duì)推動(dòng)COVID-19科研進(jìn)步具有重要的意義和價(jià)值。從美國(guó)的白宮科技政策辦公室(Office of Science andTechnology Policy,簡(jiǎn)稱OSTP)推動(dòng)創(chuàng)建的CORD-19數(shù)據(jù)集看,學(xué)術(shù)界大概從20世紀(jì)50年代開(kāi)始進(jìn)行冠狀病毒研究,并以多樣化視角積極探索病毒基本原理及預(yù)測(cè)模型應(yīng)用等相關(guān)主題。新冠疫情下.推動(dòng)冠狀病毒科學(xué)研究發(fā)展成為重要的命題,在此命題下亟待精準(zhǔn)把握冠狀病毒研究的動(dòng)態(tài)趨勢(shì)及關(guān)注焦點(diǎn),探索應(yīng)對(duì)冠狀病毒的科研發(fā)展之路,為該領(lǐng)域科研人員做出創(chuàng)新性成果提供參考思路。

鑒于此,本文以O(shè)STP推動(dòng)創(chuàng)建的CORD-19數(shù)據(jù)集為例,根據(jù)3個(gè)典型冠狀病毒(2003年非典型肺炎(SARS)、2012年中東呼吸綜合征(MERS)、2019年新型冠狀病毒(COVID-19))暴發(fā)時(shí)間將其劃分為4個(gè)時(shí)間段(1955-2002、2003-2011、2012-2018、2019-2020),運(yùn)用LDA主題建模和網(wǎng)絡(luò)分析方法,從語(yǔ)義層面解讀每個(gè)階段冠狀病毒的主題內(nèi)容規(guī)律、主題文檔分布規(guī)律、主題作者網(wǎng)絡(luò)規(guī)律,從歷時(shí)性視角檢視1955-2020年冠狀病毒整體的主題演變態(tài)勢(shì).總結(jié)歸納冠狀病毒科學(xué)論文的主題規(guī)律,把握冠狀病毒的總體研究方向和聚焦點(diǎn),推動(dòng)該領(lǐng)域的科研進(jìn)步及創(chuàng)新。

1相關(guān)研究

新冠疫情下,不同學(xué)科專家從不同視角探討新冠疫情應(yīng)對(duì)之策。其中圖情領(lǐng)域?qū)W者主要從信息情報(bào)、科學(xué)計(jì)量學(xué)視角分析疫情防控路徑,一是探討疫情信息的治理問(wèn)題,如《圖書情報(bào)知識(shí)》和《信息資源管理學(xué)報(bào)》兩刊聯(lián)合策劃推出了專稿“突發(fā)公共衛(wèi)生事件中的科學(xué)應(yīng)對(duì)與思考:圖情專家談新冠疫情”,從社會(huì)風(fēng)險(xiǎn)感知與公共危機(jī)預(yù)警、應(yīng)急輿情分析與應(yīng)急信息綜合治理、疫情虛假信息甄別、疫情數(shù)據(jù)應(yīng)用與治理、對(duì)抗疫情的科技信息共享與支持、疫情相關(guān)科研成果發(fā)表與傳播角度出發(fā),圍繞“疫情信息”展開(kāi),凸顯圖情學(xué)科在疫情防控中的優(yōu)勢(shì)。二是探討情報(bào)理論在疫情防控中的應(yīng)用,如蘇新寧等從情報(bào)體系視角闡明情報(bào)在疫情防控中的作用機(jī)制,分析了3個(gè)應(yīng)急階段情報(bào)流對(duì)疫情防控的精準(zhǔn)刻畫及疫情全局演變規(guī)律的揭示。曹振祥等闡述了新冠肺炎疫情防控中應(yīng)急情報(bào)服務(wù)模式。三是分析圖書館在疫情防控下的應(yīng)對(duì)策略.提出新冠疫情下圖書館如何為用戶提供服務(wù)策略,轉(zhuǎn)變傳統(tǒng)的服務(wù)模式。四是從科學(xué)生產(chǎn)和計(jì)量學(xué)角度探討疫情相關(guān)文獻(xiàn)的科研合作及開(kāi)放原則,如Belli S等借助VOSviewer工具分析了Web of Science上的18875篇冠狀病毒文獻(xiàn).分析在這一主題上的國(guó)際科學(xué)合作機(jī)構(gòu)情況,并討論了冠狀病毒文獻(xiàn)開(kāi)放獲取的比例和類型。ZhangL等通過(guò)對(duì)過(guò)去20年間關(guān)于5種病毒的32000篇文獻(xiàn)進(jìn)行計(jì)量分析,發(fā)現(xiàn)學(xué)術(shù)界對(duì)突發(fā)公共衛(wèi)生事件反應(yīng)迅速,發(fā)表的論文數(shù)量迅速增加。HomolakJ等選擇PubMed數(shù)據(jù)庫(kù)3631篇文獻(xiàn)和Scopus數(shù)據(jù)庫(kù)1528篇文獻(xiàn),探討科研成果的開(kāi)放問(wèn)題,呼吁科學(xué)家采取開(kāi)放透明方式加強(qiáng)文獻(xiàn)的共享和交流。Torres-Salinas D探討了Dimensions、Web ofScience Core Collection、Scopus、PubMed和8個(gè)存儲(chǔ)庫(kù)中關(guān)于COVID-19的出版物刊登文獻(xiàn)數(shù)量,結(jié)果發(fā)現(xiàn)Dimensions出版物總數(shù)為9 435份(69%為同行評(píng)議和2677份預(yù)印本),遠(yuǎn)遠(yuǎn)高于Scopus(1568份)和WoS(718份),且有關(guān)COVID-19的3/4的出版物是開(kāi)放獲取的。

綜上,圖情界學(xué)者從本學(xué)科視角對(duì)COVID-19進(jìn)行了相關(guān)研究,主要以情報(bào)理論助力疫情防控、圖書館等實(shí)體機(jī)構(gòu)應(yīng)對(duì)策略、傳統(tǒng)計(jì)量學(xué)視角分析文獻(xiàn)特征等研究為主。其中,計(jì)量學(xué)研究主要集中于文獻(xiàn)的元數(shù)據(jù)特征,如核心作者識(shí)別、機(jī)構(gòu)合作情況探討、文獻(xiàn)開(kāi)放獲取比例等,尚未深入到文獻(xiàn)內(nèi)容語(yǔ)義層面。因此,本文在此基礎(chǔ)上引入主題、時(shí)間、網(wǎng)絡(luò)元素,通過(guò)主題建模和網(wǎng)絡(luò)分析方法,以O(shè)STP推動(dòng)創(chuàng)建的CORD-19數(shù)據(jù)集為例,挖掘冠狀病毒相關(guān)文獻(xiàn)的階段性主題內(nèi)容特征,探索文獻(xiàn)主題分布規(guī)律以及解構(gòu)核心作者的主題態(tài)勢(shì),從語(yǔ)義層面解讀冠狀病毒的主題規(guī)律,以期推動(dòng)冠狀病毒研究的進(jìn)步。

2研究方法及設(shè)計(jì)

2.1研究方法

2.1.1 LDA主題建模

隱含狄利克雷分布LDA(Latent Dirichlet Allo.cation)是由Blei D M等于2003年提出的一種特殊的主題模型,也稱為三層貝葉斯概率模型,包含詞、主題和文檔3層結(jié)構(gòu),現(xiàn)已成為最流行的主題建模方法。圖1展示了LDA主題建模的基本原理。

2.1.2網(wǎng)絡(luò)分析

網(wǎng)絡(luò)是由節(jié)點(diǎn)和邊構(gòu)成的關(guān)系圖,通過(guò)平均度值、中心性、網(wǎng)絡(luò)規(guī)模、連通性、聚類系數(shù)、平均路徑長(zhǎng)度和網(wǎng)絡(luò)密度等指標(biāo)衡量網(wǎng)絡(luò)結(jié)構(gòu)特征。本文借助網(wǎng)絡(luò)分析方法解讀冠狀病毒科研成果中作者之間的網(wǎng)絡(luò)關(guān)系結(jié)構(gòu)特性,并通過(guò)Gephi揭示作者與研究主題之間的網(wǎng)絡(luò)關(guān)系特征.試圖明晰不同時(shí)間段內(nèi)冠狀病毒不同研究主題下有代表性的作者群體,為該領(lǐng)域?qū)W者提供冠狀病毒研究基礎(chǔ)態(tài)勢(shì)分析,助力科研工作者了解冠狀病毒領(lǐng)域的突出性研究成果,進(jìn)而催生冠狀病毒研究新的生長(zhǎng)點(diǎn)。

2.2研究設(shè)計(jì)

冠狀病毒科學(xué)論文主題演變規(guī)律的歷時(shí)性分析設(shè)計(jì)如圖2所示,共分為5步:

1)數(shù)據(jù)來(lái)源:OSTP推動(dòng)構(gòu)建的COVID-19研究數(shù)據(jù)集。

2)數(shù)據(jù)清洗:采用Pandas和Gensim包對(duì)數(shù)據(jù)進(jìn)行停用詞及詞形還原處理。

3)創(chuàng)建字典及語(yǔ)料庫(kù):利用Gensim包中doc2bow詞袋模型構(gòu)建詞典。

4)冠狀病毒科學(xué)論文主題建模:運(yùn)用LDA主題建模分別對(duì)4個(gè)時(shí)間段內(nèi)主題內(nèi)容和主題文檔分布規(guī)律進(jìn)行分析。

5)冠狀病毒科學(xué)論文主題作者網(wǎng)絡(luò)分析:應(yīng)用Gephi分析4個(gè)時(shí)間段內(nèi)主題作者網(wǎng)絡(luò)關(guān)系。

3冠狀病毒科學(xué)論文主題建模

3.1數(shù)據(jù)來(lái)源

本文以O(shè)STP發(fā)布的CORD-19數(shù)據(jù)集為數(shù)據(jù)源。該數(shù)據(jù)集由艾倫人工智能研究所、陳·扎克伯格倡議、喬治敦大學(xué)安全與新興技術(shù)中心、微軟研究院、美國(guó)國(guó)立衛(wèi)生研究院國(guó)家醫(yī)學(xué)圖書館與美國(guó)白宮辦公室合作創(chuàng)建,包括PubMed的PMC開(kāi)放獲取語(yǔ)料庫(kù)、世衛(wèi)組織(WHO)維護(hù)的語(yǔ)料庫(kù)、bioRxiv和medRxiv預(yù)印本文庫(kù)中47000余篇學(xué)術(shù)論文.涉及COVID-19、SARS-CoV-2和相關(guān)的冠狀病毒研究。在CORD-19發(fā)布后,Kaggle緊隨其后發(fā)起CORD-19數(shù)據(jù)集文本挖掘競(jìng)賽,提出十大難題.召喚AI研究人員開(kāi)發(fā)文本數(shù)據(jù)挖掘工具助力醫(yī)學(xué)界。同時(shí),也有很多科研成果在用CORD-19數(shù)據(jù)集進(jìn)行研究。根據(jù)圖3冠狀病毒論文發(fā)表態(tài)勢(shì),結(jié)合3種典型的冠狀病毒(SARS一2002.12,MERS-2012.9,COVID-19-2019.12)暴發(fā)時(shí)間,將研究數(shù)據(jù)劃分為4個(gè)階段,即1955-2002、2003-2011、2012-2018、2019-2020,分別分析4個(gè)階段冠狀病毒的研究主題。表1是各個(gè)時(shí)間段冠狀病毒發(fā)文量。

3.2數(shù)據(jù)預(yù)處理

使用Pandas包去空值,保留字段[‘title,‘a(chǎn)b.stract,‘a(chǎn)uthors,‘journal,‘publish_year],正則表達(dá)式處理pulish_year列,只保留年份信息,按時(shí)間排序處理,如表2所示。

3.3創(chuàng)建字典和語(yǔ)料庫(kù)

首先,利用Gensim預(yù)處理函數(shù)將所有詞匯處理成小寫,并創(chuàng)建Bigrams模型;其次,采用N1TK中stop words模塊去停用詞,Spacy庫(kù)進(jìn)行詞形還原,只取名詞、形容詞、動(dòng)詞和副詞;接著用cor.pora.Dictionary函數(shù)創(chuàng)建字典;最后,用詞袋模型doc2bow創(chuàng)建語(yǔ)料庫(kù),如圖4所示。

3.4模型訓(xùn)練

本文的實(shí)驗(yàn)環(huán)境是Python3.6,使用工具是Gensim包models.1damodel.LdaModel。由于LDA主題建模是典型的無(wú)監(jiān)督模型,主題個(gè)數(shù)是重要的參數(shù)輸入。為避免模型欠擬合或過(guò)擬合,通過(guò)訓(xùn)練多個(gè)模型,交叉驗(yàn)證選取最優(yōu)主題個(gè)數(shù)。采用主題一致性Coherence Score和困惑度Perplexity雙重評(píng)價(jià)指標(biāo),如圖5、圖6所示,并綜合兩個(gè)指標(biāo)選取主題數(shù)較少、一致性分?jǐn)?shù)較高和困惑度較低的主題數(shù)。

由圖5、圖6可知.1955-2002年Num Topics=10時(shí),模型Coherence Score分?jǐn)?shù)最高,Perplexity較低,因此選擇10作為模型訓(xùn)練的主題數(shù);2003-2011年Num Topics=18時(shí).模型Coherence Score分?jǐn)?shù)最高,Perplexity較低.選擇18作為模型訓(xùn)練的主題數(shù):2012-2018年Num Topics=15~20時(shí),模型Coherence Score分?jǐn)?shù)最高,Perplexity較低,在比較15和20類別的主題聚類圖后選擇20作為模型訓(xùn)練的主題數(shù),相對(duì)較優(yōu)。2019-2020年NumTopics=12時(shí),模型Coherence Score分?jǐn)?shù)最高,Per-plexity較低,在比較12和20類別的主題聚類圖后選擇12作為模型訓(xùn)練的主題數(shù),相對(duì)較優(yōu)。

4冠狀病毒科學(xué)論文主題規(guī)律分析

4.1冠狀病毒主題內(nèi)容規(guī)律

通過(guò)LDA主題建模生成各主題類別主題詞,主題詞代表了該主題下冠狀病毒研究的聚焦點(diǎn),通過(guò)分析各主題類別的主題詞總結(jié)歸納該階段冠狀病毒研究熱點(diǎn)。表3~6中。表示和傳染病醫(yī)學(xué)領(lǐng)域研究者咨詢后保留的主題詞,能代表該領(lǐng)域的研究觸點(diǎn)。部分字母的縮寫形式經(jīng)過(guò)醫(yī)學(xué)專業(yè)者判定,給予了恰當(dāng)?shù)慕忉尅opic表示主題類別,Topic-words表示主題詞.每個(gè)Topic下保留概率排在前10位的主題詞。

4.1.1 1955-2002年主題內(nèi)容分析

主題建模后該時(shí)間段內(nèi)選擇10個(gè)主題。根據(jù)表3,該階段研究主要集中于冠狀病毒核糖核酸、基因序列、蛋白質(zhì)、人類病毒感染一細(xì)胞、抗體疫苗、菌株分離、鼠肝炎冠狀病毒、豬傳染性胃腸炎病毒、雞傳染性支氣管炎病毒、牛病毒性腹瀉病毒、病人呼吸道系統(tǒng)感染等。從這些主題詞可以看出,研究者主要關(guān)注冠狀病毒基本機(jī)理研究、冠狀病毒動(dòng)物模型研究、病毒抗體及疫苗研發(fā)、病毒菌株、臨床試驗(yàn)及流感等。表現(xiàn)載體主要是呼吸道系統(tǒng)和消化道系統(tǒng),且該階段屬于冠狀病毒發(fā)現(xiàn)及確認(rèn)初期,主要存在于動(dòng)物疾病中.如鼠肝炎冠狀病毒。

4.1.2 2003-2011年主題內(nèi)容分析

主題建模后該時(shí)間段內(nèi)選擇18個(gè)主題。根據(jù)表4,該階段有代表性的主題詞有:SARS、抗體疫苗、藥物治療、蛋白質(zhì)、細(xì)胞、蛋白酶活化性、病原體、宿主、研究論證、病人感染、DNA、變異、流行病、急性呼吸道系統(tǒng)感染、控制傳染病暴發(fā)、小世界網(wǎng)絡(luò)模型、病毒感染、核糖核酸、基因序列、菌株分離、樣本實(shí)驗(yàn)等。從這些主題詞可以看出,學(xué)者研究焦點(diǎn)在SARS、病毒基本機(jī)理、抗體疫苗、病原體宿主、病毒變異、大量研究論證、數(shù)學(xué)統(tǒng)計(jì)模型、人類病毒感染等。較1955-2002年,該階段出現(xiàn)了之前尚未研究的觸點(diǎn),如藥物治療、網(wǎng)絡(luò)模型、病原體宿主、基因變異、大量論證等,這是由于SARS暴發(fā),出現(xiàn)典型的人際傳播現(xiàn)象,沖擊了衛(wèi)生保健系統(tǒng)。此階段強(qiáng)化了對(duì)冠狀病毒微觀結(jié)構(gòu)、DNA研究,且對(duì)病原體、宿主、變異、藥物治療研究成為熱門主題,同時(shí)小世界模型給病毒傳播網(wǎng)絡(luò)研究提供了學(xué)術(shù)動(dòng)力。

4.1.3 2012-2018年主題內(nèi)容分析

主題建模后該時(shí)間段內(nèi)選擇20個(gè)主題。根據(jù)表5,該階段的主題詞有血液、治療、病毒傳播監(jiān)測(cè)、蛋白活性、宿主、病毒試驗(yàn)、細(xì)胞、免疫、病毒感染、病原體、病毒基因、抗病毒干擾素、RNA基因、蝙蝠、病毒宿主、數(shù)據(jù)論證、嚴(yán)重急性呼吸道疾病、治療策略、流行性感冒、病毒菌株分離、抗體、疫苗、病毒暴發(fā)危險(xiǎn)、網(wǎng)絡(luò)模型預(yù)測(cè)等。據(jù)此分析,研究者將研究觸點(diǎn)聚焦于病毒基本機(jī)理、抗體疫苗、病毒宿主、干擾素研究、大量研究論證、病毒引發(fā)的衍生災(zāi)害預(yù)防、網(wǎng)絡(luò)傳播模型預(yù)測(cè)等。這一階段除繼承上述兩階段的研究?jī)?nèi)容外,較為突出的是對(duì)SARS蝙蝠宿主的重大發(fā)現(xiàn).抗病毒干擾素研究及暴發(fā)于中東的MERS冠狀病毒。

4.1.4 2019-2020年主題內(nèi)容分析

主題建模后,該階段選取12個(gè)主題。根據(jù)表6,該階段的主題詞有COVID、城市、網(wǎng)絡(luò)、信息、醫(yī)療、秩序、趨勢(shì)、服務(wù)、意大利、死亡、陽(yáng)性、陰性、措施、傳播、模型預(yù)測(cè)等,這些主題詞也同樣有別于前3個(gè)時(shí)間段,COVID病毒引發(fā)全世界關(guān)注,意大利成為關(guān)注焦點(diǎn)。新冠病毒相較于SARS和MERS,具有更強(qiáng)的傳染性,人際傳播周期短,因此,對(duì)于病毒的檢測(cè)和切斷傳染途徑的方法成為重中之重。這時(shí)期除了對(duì)冠狀病毒醫(yī)學(xué)原理方面的研究,更關(guān)注通過(guò)模型預(yù)測(cè)病毒傳播速率,控制病毒傳播,完善衛(wèi)生健康服務(wù)體系,改善醫(yī)療衛(wèi)生服務(wù)系統(tǒng),側(cè)重從防控視角研究冠狀病毒帶來(lái)的衍生危害。

4.2冠狀病毒主題文檔分布規(guī)律

本文隨機(jī)選取4篇文檔,繪制其文檔一主題分布圖,如圖7所示??梢钥闯?,所選文檔的某1個(gè)或2個(gè)主題概率相比其他主題概率高出許多.即文檔均存在焦點(diǎn)主題,說(shuō)明訓(xùn)練出來(lái)的主題模型可以很好地表示文檔主題,具有代表性。

同時(shí),本文根據(jù)文檔一主題分布計(jì)算了不同時(shí)間段內(nèi)同一主題文檔概率的平均值,以及各主題類別的文檔規(guī)模,并繪制折線圖,如圖8所示,橫軸顯示主題類別,縱軸顯示主題強(qiáng)度概率值(左側(cè))和主題規(guī)模概率值(右側(cè)),圓形折線表示主題強(qiáng)度,方形折線表示主題規(guī)模??梢钥闯觯?955-2002年.主題0和主題9強(qiáng)度最大,前者是有關(guān)RNA核糖核酸和基因序列研究,后者是有關(guān)病人呼吸道系統(tǒng)感染研究;主題5文檔規(guī)模最大,即研究者著重于人類病毒感染及細(xì)胞相關(guān)研究。2003-2011年,主題強(qiáng)度總體差別不大,主題3、6、7、9、17相對(duì)較高,即對(duì)冠狀病毒蛋白質(zhì)、人類病毒感染、流行病及病毒樣本檢測(cè)等研究更為突出;主題6文檔規(guī)模最大.說(shuō)明該階段主要以冠狀病毒研究論證的文獻(xiàn)為主。2012-2018年,主題3、6強(qiáng)度最高,即對(duì)蛋白、宿主、細(xì)胞、免疫研究較為突出;主題3文檔規(guī)模最大,說(shuō)明該階段冠狀病毒蛋白研究文獻(xiàn)相對(duì)較多。2019-2020年,主題1作為規(guī)模最大、強(qiáng)度最高的類別,說(shuō)明學(xué)者對(duì)COV.ID流行病暴發(fā)所引發(fā)的一系列衍生問(wèn)題研究眾多,關(guān)注焦點(diǎn)主要以疫情防控舉措為主。

總體來(lái)看,主題強(qiáng)度和主題規(guī)模分布幾乎呈正比關(guān)系,即主題強(qiáng)度越大,主題規(guī)模也相對(duì)較大。另外.從1955-2020年對(duì)冠狀病毒的研究主題規(guī)模和強(qiáng)度曲線可以看出.冠狀病毒研究初期較為關(guān)注病毒機(jī)理及作用機(jī)制研究,2003年SARS暴發(fā)后,對(duì)人類病毒感染及檢測(cè)研究更為關(guān)注.2012年MERS暴發(fā)后,學(xué)者對(duì)病毒宿主和免疫學(xué)研究更為突出,而2019年COVID-19暴發(fā)后,學(xué)者們的關(guān)注焦點(diǎn)是從藥物治療、醫(yī)療保健系統(tǒng)、衛(wèi)生社區(qū)、心理疏導(dǎo)等各方面防控疫情。

4.3冠狀病毒主題作者網(wǎng)絡(luò)規(guī)律

通過(guò)選取1955-2020年發(fā)文量較高的第一作者數(shù)據(jù),分階段對(duì)主題與作者進(jìn)行關(guān)聯(lián)分析,解構(gòu)冠狀病毒領(lǐng)域論文產(chǎn)量較高的作者所研究的主題,進(jìn)而歸納該領(lǐng)域的關(guān)注焦點(diǎn)及動(dòng)態(tài)趨勢(shì)。

4.3.1

1955-2002年核心主題一作者規(guī)律

該階段選取發(fā)文量10篇以上(含10篇)的第一作者,所發(fā)論文主題類別如表7所示??梢钥闯?10篇以上發(fā)文量的作者有6位,每個(gè)作者關(guān)注的冠狀病毒主題有所差異。其中美國(guó)疾病控制中心病毒性和立克次氏體疾病部呼吸道和腸道病毒科Hierholzer JC研究主題類別最多。魁北克大學(xué)醫(yī)學(xué)中心Dea S發(fā)文量最多。南加州大學(xué)醫(yī)學(xué)院霍華德·休斯醫(yī)學(xué)研究所和微生物學(xué)系Makino S研究主題類別最為集中。

通過(guò)Gephi繪制作者、主題網(wǎng)絡(luò)圖,如圖9所示,節(jié)點(diǎn)表示作者和主題,邊表示作者和主題關(guān)系,節(jié)點(diǎn)大小表示作者關(guān)注主題類別多樣化程度.節(jié)點(diǎn)越大說(shuō)明作者關(guān)注冠狀病毒主題類別越多樣化,反之亦然。邊粗細(xì)表示作者所發(fā)論文歸屬主題類別的多少,邊越粗,表明作者越聚焦于該主題研究。

圖9中,Hierholzer J C節(jié)點(diǎn)最大,說(shuō)明該作者關(guān)注冠狀病毒主題類別較多,集中于主題2、3、4、5、7、8、9,其中主題5邊最粗,即對(duì)人類病毒機(jī)理及細(xì)胞研究較多,如分析了NCI-H292人肺粘液表皮樣細(xì)胞對(duì)呼吸道病毒和其他人類病毒的敏感性;探討了兩種最常用的病毒分離方法,即組織培養(yǎng)和胚胎卵子、病毒抗原研究及人類冠狀病毒229E的純化和生物物理性質(zhì)等。同時(shí)也對(duì)鼠肝炎病毒對(duì)幼鼠致死性腸炎的影響做了相關(guān)研究。Makino S邊最粗,其研究集中于主題0,即RNA核糖核酸、基因序列等,主要聚焦于小鼠肝炎冠狀病毒的RNA結(jié)構(gòu)及重組研究。DeaS發(fā)文量最多,研究主題為2、5、6、8、9,對(duì)主題2和6研究較為充分.即蛋白和傳染性胃腸炎病毒研究。作者詳盡分析了冠狀病毒蛋白合成、加工、鑒定、定位研究,又深入探討了牛腹瀉冠狀病毒和豬腹瀉冠狀病毒機(jī)理。主題5探討了動(dòng)物冠狀病毒細(xì)胞結(jié)構(gòu).主題8探討了動(dòng)物冠狀病毒的毒株分離問(wèn)題。Taguchi F主要研究主題是0、5、4、2,即小鼠冠狀病毒的基因結(jié)構(gòu)、細(xì)胞、基因等。Charley B主題類別5邊最粗,即對(duì)冠狀病毒細(xì)胞特征研究較多。StohlmanSA也是主題5邊最粗,即主要研究冠狀病毒細(xì)胞結(jié)構(gòu)特征。

4.3.2 2003-2011年核心主題一作者規(guī)律

該階段選取發(fā)文量高于10篇的第一作者.共8位作者,如表8所示??梢钥闯?,意大利巴里大學(xué)獸醫(yī)學(xué)院公共衛(wèi)生系Decaro N發(fā)文量最多.共26篇。香港大學(xué)新發(fā)傳染病國(guó)家重點(diǎn)實(shí)驗(yàn)室研究院Woo P C Y研究主題類別最多。Lau J T F、Nish.iura H、Cunha B A研究主題較為集中。香港大學(xué)微生物學(xué)系Du L Y關(guān)注主題類別相對(duì)分散。

繪制8位作者主題網(wǎng)絡(luò)圖,如圖10所示,節(jié)點(diǎn)和邊表示內(nèi)容與圖9一致。由圖10可知,WooPCY節(jié)點(diǎn)最大,其關(guān)注主題類別最多,且對(duì)應(yīng)主題6的邊最粗.說(shuō)明作者聚焦于冠狀病毒研究論證等內(nèi)容,具體如冠狀病毒基因組學(xué)和生物信息學(xué)分析。另外對(duì)SARS、樣本檢測(cè)、細(xì)胞、RNA基因序列也有所研究。Decaro N對(duì)應(yīng)主題6、17邊最粗,表明該作者集中于研究論證和樣本實(shí)驗(yàn),主要是對(duì)犬細(xì)小病毒病理、牛冠狀病毒等進(jìn)行論證及樣本分析。Nishiura H對(duì)應(yīng)主題11邊最粗,即更關(guān)注如何控制、評(píng)估、預(yù)測(cè)流行病暴發(fā)。同理,Cunha B A對(duì)主題7研究最多,主要對(duì)社區(qū)獲得性肺炎臨床診斷等有較多研究。Du L Y對(duì)應(yīng)主題6邊最粗,主要研究SARS疫苗、抗體、細(xì)胞、蛋白等。Lau J T F聚焦于主題7和9.主要研究SARS流行病傳播感染情況及其對(duì)香港市民就醫(yī)行為的社會(huì)影響,以調(diào)查研究為主。Lau S K P聚焦于主題6和17,分析蝙蝠基因及作為SARS冠狀病毒宿主的研究論證。RenX F研究主題較為分散,主題6相對(duì)較多,主要以傳染性胃腸炎冠狀病毒作用機(jī)制及RNA研究為主。

4.3.3 2012-2018年核心主題一作者規(guī)律

該階段發(fā)文10篇以上的作者最多,有10位,如表9所示。沙特阿拉伯達(dá)蘭醫(yī)療中心A1-Tawfiq JA發(fā)文量最多,北里大學(xué)獸醫(yī)醫(yī)學(xué)院獸醫(yī)傳染病實(shí)驗(yàn)室Tulchinsky T H.俄亥俄州立大學(xué)獸醫(yī)預(yù)防醫(yī)學(xué)系Theodore H、Jung K和北卡羅來(lái)納大學(xué)流行病學(xué)系Menachery V D研究主題較為集中,香港大學(xué)微生物學(xué)系Lau S K P和北里大學(xué)獸醫(yī)學(xué)院獸醫(yī)傳染病實(shí)驗(yàn)室Takano T關(guān)注主題類別相對(duì)較多。

繪制圖11,可以看出,Lau S K P主要關(guān)注主題15和16,即MERS病毒和SARS病毒基因及宿主研究。Takano T節(jié)點(diǎn)大小僅次于Lau S KP,即關(guān)注主題類別相對(duì)較多,其中主題3和12邊較粗,聚焦于貓冠狀病毒蛋白、抗體、膽固醇研究。A1-Tawfiq J A對(duì)應(yīng)主題7、13、18邊最粗,主要研究MERS流行病學(xué)和控制疾病暴發(fā)措施_。Tulchinsky T H聚焦于主題2,關(guān)注公共衛(wèi)生健康系統(tǒng)的規(guī)劃和管理以控制和檢測(cè)病毒傳播擴(kuò)散。Menachery V D集中于主題3研究,即蛋白和宿主,主要以MERS蛋白、干擾素及宿主研究為核心。Jung K以主題15和6為主,詳細(xì)研究了豬流行性腹瀉冠狀病毒的病因?qū)W、流行病學(xué)、發(fā)病機(jī)制、免疫預(yù)防及細(xì)胞分子。Decaro N主要以犬細(xì)小病毒的流行病學(xué)和診斷方面研究為主。Memish zA以主題15、18為主分析了MERS病毒基因及感染人群。Burrell C J以主題3、7為主對(duì)病毒學(xué)的歷史和影響、流行病學(xué)、發(fā)病機(jī)制及冠狀病毒有較多研究,且側(cè)重于概念追溯及原理結(jié)構(gòu)。Cann A J專注于分子病毒學(xué)原理、病毒基因組結(jié)構(gòu)和核苷酸序列及遺傳機(jī)制研究。

4.3.4 2019-2020年核心主題一作者規(guī)律

該階段雖然時(shí)間間隔短,但COVID-19疫情引發(fā)大量關(guān)注,科研人員對(duì)其研究短時(shí)間內(nèi)激增。據(jù)本文數(shù)據(jù)源,截至2020年3月13日,此階段已有12000篇左右文獻(xiàn)。選取發(fā)文9篇以上的有影響力的核心作者,如表10所示,并繪制核心作者主題網(wǎng)絡(luò)圖,如圖12所示??梢钥闯?,作者普遍對(duì)主題1(COVID流行病暴發(fā)及衍生問(wèn)題)關(guān)注度最高,主題較為集中。其中Nature發(fā)文最多(主要以實(shí)時(shí)動(dòng)態(tài)消息為主),說(shuō)明對(duì)COVID-19時(shí)刻關(guān)注.且發(fā)布多條關(guān)于疫情數(shù)據(jù)信息及最新研究動(dòng)態(tài),如冠狀病毒首次在非洲發(fā)現(xiàn)感染;截至2020年2月10日中國(guó)新冠死亡人數(shù)(900多人)超過(guò)SARS:研究人員應(yīng)對(duì)COVID一19疫情的4種方式等。Knopf A關(guān)注COVID-19衍生的心理健康問(wèn)題、藥物治療對(duì)策。Canadv V A聚焦于解決無(wú)家可歸者的資助問(wèn)題、病患心理健康、敦促政府加大防護(hù)設(shè)備資金投入等研究。Michael L P對(duì)COVID-19藥物治療及抗體測(cè)試等方面進(jìn)行了大量研究。MacKenzie D分析了COVID-19給衛(wèi)生醫(yī)療系統(tǒng)帶來(lái)的壓力及如何控制新冠疫情大規(guī)模暴發(fā)。Vaughan A呼吁采取嚴(yán)格措施阻止新冠疫情擴(kuò)散,分析了疫情引發(fā)的次生災(zāi)害如工廠關(guān)閉、企業(yè)停產(chǎn)等。

5結(jié)論

本文對(duì)1955-2020年冠狀病毒科學(xué)論文主題演變規(guī)律進(jìn)行論述,綜合運(yùn)用主題建模和網(wǎng)絡(luò)分析方法,從語(yǔ)義層面揭示4個(gè)階段內(nèi)冠狀病毒的主題內(nèi)容規(guī)律、主題文檔分布規(guī)律、主題作者網(wǎng)絡(luò)規(guī)律。本文主要研究?jī)r(jià)值和貢獻(xiàn)如下:

1)借由LDA主題建模技術(shù)挖掘冠狀病毒研究領(lǐng)域中的關(guān)鍵主題和熱門主題.以此揭示冠狀病毒學(xué)術(shù)界研究聚焦點(diǎn),解構(gòu)主題內(nèi)容和文檔分布規(guī)律.系統(tǒng)地梳理1955-2020年冠狀病毒相關(guān)研究文獻(xiàn),對(duì)冠狀病毒領(lǐng)域知識(shí)創(chuàng)新服務(wù)起到重要的輔助決策支持作用。

2)融合網(wǎng)絡(luò)和主題兩個(gè)維度,解析冠狀病毒領(lǐng)域高產(chǎn)學(xué)者研究主題內(nèi)容之間的網(wǎng)絡(luò)關(guān)系,拓寬傳統(tǒng)的以引文方式研究領(lǐng)域作者網(wǎng)絡(luò)關(guān)系路徑。通過(guò)構(gòu)建主題一作者關(guān)系模型,多角度挖掘高產(chǎn)學(xué)者核心主題研究?jī)?nèi)容.了解冠狀病毒領(lǐng)域有代表性專家的研究主題動(dòng)態(tài)和方向,為未來(lái)探索冠狀病毒研究提供思路和啟發(fā)。

3)嵌入時(shí)間要素.以歷時(shí)性分析視角切入冠狀病毒研究主題內(nèi)容。按3種典型冠狀病毒暴發(fā)時(shí)間劃分階段,解構(gòu)不同歷史時(shí)期冠狀病毒研究的差異點(diǎn)和著力點(diǎn),分析冠狀病毒主題演變特征。從研究結(jié)果可以看出,冠狀病毒基因、RNA、病原體和宿主等基礎(chǔ)原理研究一直是重中之重。隨時(shí)間推移,研究逐步由淺入深,研究層次逐漸多元化。同時(shí),醫(yī)學(xué)技術(shù)進(jìn)步、數(shù)理統(tǒng)計(jì)模型、復(fù)雜網(wǎng)絡(luò)模型、信息服務(wù)系統(tǒng)、疫情防控服務(wù)體系構(gòu)建、國(guó)際合作等要素是推動(dòng)冠狀病毒研究進(jìn)步的重要?jiǎng)恿?。尤其是COVID-19下,主題聚焦點(diǎn)轉(zhuǎn)向病毒檢測(cè)及防控方面,從完善衛(wèi)生健康服務(wù)體系、改善醫(yī)療衛(wèi)生服務(wù)系統(tǒng)、切斷病毒傳播路徑等層面避免冠狀病毒帶來(lái)的衍生危害。

4)發(fā)揮圖情學(xué)科優(yōu)勢(shì),為冠狀病毒研究貢獻(xiàn)綿薄之力。新冠疫情下,冠狀病毒作為當(dāng)前學(xué)術(shù)界持續(xù)關(guān)注的焦點(diǎn),備受矚目。本文從圖情學(xué)科視角對(duì)冠狀病毒文獻(xiàn)進(jìn)行組織和整合,系統(tǒng)地梳理了1955-2020年冠狀病毒研究文獻(xiàn).以此了解冠狀病毒歷史研究發(fā)展路徑.推動(dòng)該領(lǐng)域研究實(shí)現(xiàn)新的突破。

本文也有局限之處,數(shù)據(jù)源選取的是OSTP發(fā)布的CORD-19數(shù)據(jù)集,該數(shù)據(jù)集實(shí)時(shí)更新。本文選取的是2020年3月13日版本,因此,未來(lái)將會(huì)擴(kuò)充2020年的數(shù)據(jù)集,針對(duì)COVID-19數(shù)據(jù)集做進(jìn)一步詳盡分析。

猜你喜歡
網(wǎng)絡(luò)分析
基于交通運(yùn)輸業(yè)的股票因果網(wǎng)絡(luò)分析
低軌衛(wèi)星互聯(lián)網(wǎng)融合5G信息網(wǎng)絡(luò)分析與應(yīng)用
基于復(fù)雜網(wǎng)絡(luò)分析方法的作戰(zhàn)體系評(píng)估研究綜述
認(rèn)知重評(píng)和表達(dá)抑制情緒調(diào)節(jié)策略的腦網(wǎng)絡(luò)分析:來(lái)自EEG和ERP的證據(jù)*
基于膽汁酸代謝網(wǎng)絡(luò)分析絞股藍(lán)總皂苷降脂作用的機(jī)制
鐵路有線調(diào)度通信的網(wǎng)絡(luò)分析
2016年社交網(wǎng)絡(luò)分析
基于社會(huì)網(wǎng)絡(luò)分析(SNA)的出版企業(yè)經(jīng)營(yíng)管理探討
基于需求拉動(dòng)的戰(zhàn)略性新興產(chǎn)業(yè)創(chuàng)新價(jià)值網(wǎng)絡(luò)分析
大班幼兒同伴交往的社會(huì)網(wǎng)絡(luò)分析
仁布县| 林芝县| 佛学| 漠河县| 台山市| 嫩江县| 墨脱县| 巴林右旗| 延川县| 讷河市| 武鸣县| 霍城县| 阿巴嘎旗| 高青县| 长宁县| 西宁市| 德化县| 仪征市| 缙云县| 黔江区| 南乐县| 平邑县| 随州市| 金坛市| 潞西市| 潜山县| 札达县| 夏津县| 永年县| 桐柏县| 石河子市| 上犹县| 临汾市| 巧家县| 大连市| 宣恩县| 萨迦县| 手游| 乌兰县| 涿州市| 尉犁县|