国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Web of Science的植物數(shù)據(jù)庫(kù)可視化分析

2024-03-04 13:02:00婁岱金趙國(guó)強(qiáng)
江西科學(xué) 2024年1期
關(guān)鍵詞:發(fā)文聚類(lèi)領(lǐng)域

婁岱金,蘇 玥,羅 濤,趙國(guó)強(qiáng),葉 凡

(江西科技師范大學(xué)生命科學(xué)學(xué)院,330013,南昌)

0 引言

隨著植物學(xué)科各方面研究的深入,與植物相關(guān)的數(shù)據(jù)資料越來(lái)越多。同時(shí),計(jì)算機(jī)技術(shù)的發(fā)展和數(shù)據(jù)庫(kù)的出現(xiàn),為植物資料的保存和共享提供了可行性的解決方案[1]。在20世紀(jì)50年代,早期的植物學(xué)家進(jìn)行植物普查和樣本采集,建立了以書(shū)籍、手冊(cè)和索引為形式的紙質(zhì)數(shù)據(jù)庫(kù),僅是包含了簡(jiǎn)單的文本和圖像數(shù)據(jù)[2]。21世紀(jì)初,隨著計(jì)算機(jī)技術(shù)的發(fā)展,研究人員將植物數(shù)據(jù)庫(kù)進(jìn)行了數(shù)字化,使得存儲(chǔ)、管理和共享變得更加高效[3]。再后來(lái),高通量測(cè)序技術(shù)的突破使得植物數(shù)據(jù)庫(kù)更加豐富,數(shù)據(jù)庫(kù)存儲(chǔ)的組學(xué)數(shù)據(jù)為基因功能、遺傳和進(jìn)化等研究提供支持[4]。至今,植物數(shù)據(jù)庫(kù)在不斷迭代并可持續(xù)發(fā)展,在植物學(xué)研究、生態(tài)學(xué)、保護(hù)生物學(xué)、藥物開(kāi)發(fā)等領(lǐng)域都發(fā)揮著重要的作用[5]。

國(guó)內(nèi)一些高校利用植物數(shù)據(jù)庫(kù)整理和存儲(chǔ)校園內(nèi)的植物情況,例如,南京林業(yè)大學(xué)校園植物數(shù)據(jù)庫(kù)工程的構(gòu)建[6]。此外,一些省市利用植物數(shù)據(jù)庫(kù)來(lái)記錄和宣傳當(dāng)?shù)氐拿F藥材和稀有植物,如長(zhǎng)白山顯花植物數(shù)據(jù)庫(kù)[7]和貴州藥用蕨類(lèi)植物數(shù)據(jù)庫(kù)[8]等。歐洲食品安全局(European Food Safety Authority)定期更新木霉菌宿主植物物種數(shù)據(jù)庫(kù)[9],目的是為風(fēng)險(xiǎn)評(píng)估員、風(fēng)險(xiǎn)管理人員及處理木霉菌屬的研究人員提供信息和科學(xué)支持。Xu等[10]設(shè)計(jì)了PlantPhoneDB植物數(shù)據(jù)庫(kù),提供了4種細(xì)胞類(lèi)型之間配體-受體對(duì)的相互作用評(píng)分方法,為研究人員提供了從scRNA-seq數(shù)據(jù)集推斷細(xì)胞之間通信的綜合資源。Hussain等[11]研究并開(kāi)發(fā)了孟加拉國(guó)藥用植物數(shù)據(jù)庫(kù),研究分布在孟加拉國(guó)各地的各種藥用和營(yíng)養(yǎng)植物,并為研究人員、衛(wèi)生從業(yè)者和藥物開(kāi)發(fā)人員提供一個(gè)方便操作的界面。由此可見(jiàn),植物數(shù)據(jù)庫(kù)的研究日益受到廣泛的關(guān)注,并發(fā)表了越來(lái)越多的文獻(xiàn)[12-13],這些零散的論文信息,導(dǎo)致很難從數(shù)量龐大的文獻(xiàn)中掌握研究重點(diǎn)和現(xiàn)狀[14],從而忽略了未來(lái)的發(fā)展趨勢(shì)和熱點(diǎn)[15]。因此,全面了解植物數(shù)據(jù)庫(kù)的研究現(xiàn)狀、熱點(diǎn)和趨勢(shì)是尤為必要的。

可視化分析有助于對(duì)植物數(shù)據(jù)庫(kù)研究領(lǐng)域進(jìn)行定量和客觀(guān)的分析,并為學(xué)術(shù)研究提供知識(shí)交流[15],所帶來(lái)的直觀(guān)感受使得人們獲取更多的信息[16]。為解決這一問(wèn)題,運(yùn)用科學(xué)的可視化軟件對(duì)該領(lǐng)域進(jìn)行統(tǒng)計(jì)分析[17],從而推動(dòng)植物數(shù)據(jù)庫(kù)方面的研究。VOSviewer是荷蘭科技研究中心開(kāi)發(fā)的一款軟件,可提供文獻(xiàn)的聚類(lèi)、疊加、密度視圖等,有助于研究某一領(lǐng)域的科研方向和熱點(diǎn)[18]。CiteSpace是一款基于Java語(yǔ)言的多元、分時(shí)和動(dòng)態(tài)的可視化軟件[19],利用共引分析理論和“尋徑網(wǎng)絡(luò)”算法等[20],通過(guò)數(shù)據(jù)挖掘、信息處理等技術(shù)對(duì)特定領(lǐng)域文獻(xiàn)集合進(jìn)行計(jì)量[21],以揭示科學(xué)演化的關(guān)鍵路徑和知識(shí)拐點(diǎn),實(shí)現(xiàn)對(duì)學(xué)科演化潛在動(dòng)力機(jī)制的分析和學(xué)科發(fā)展前沿的探測(cè)[22]。Scimago Graphica是一款簡(jiǎn)單易上手的輕量級(jí)繪圖分析軟件,不需要復(fù)雜的數(shù)據(jù)處理和建模。

基于此,本文通過(guò)篩選Web of Science(WOS)植物數(shù)據(jù)庫(kù)領(lǐng)域的相關(guān)文獻(xiàn),采用文獻(xiàn)計(jì)量的分析方法,借助可視化分析軟件揭示植物數(shù)據(jù)庫(kù)的發(fā)展現(xiàn)狀和研究熱點(diǎn)。同時(shí),對(duì)植物數(shù)據(jù)庫(kù)研究發(fā)展進(jìn)行動(dòng)態(tài)分析,預(yù)測(cè)植物數(shù)據(jù)庫(kù)的未來(lái)研究趨勢(shì)[23]。最后,對(duì)植物數(shù)據(jù)庫(kù)未來(lái)研究的可行方向進(jìn)行展望,以期為植物數(shù)據(jù)庫(kù)研究領(lǐng)域進(jìn)一步發(fā)展提供科學(xué)參考。

1 數(shù)據(jù)與方法

1.1 數(shù)據(jù)來(lái)源

以Web of Science(WOS)核心數(shù)據(jù)集SCI-EXPANDED為數(shù)據(jù)源,檢索策略為T(mén)S=(plant) AND TI=(database),檢索時(shí)間跨度為2004—2022年,初獲1 544篇文獻(xiàn),精煉檢索結(jié)果,去除會(huì)議錄論文、會(huì)議摘要、社論材料等,得到1 457篇文獻(xiàn)。

1.2 數(shù)據(jù)篩選

為了保證檢索結(jié)果的準(zhǔn)確性和客觀(guān)性,3名篩選人員分工合作,一個(gè)篩選,一人重復(fù)篩選,一人核對(duì),篩選標(biāo)準(zhǔn)為:

1)所保留的論文應(yīng)當(dāng)是有關(guān)植物數(shù)據(jù)庫(kù)構(gòu)建或是介紹植物數(shù)據(jù)庫(kù);

2)文獻(xiàn)的主題涉及到植物,判斷主要研究對(duì)象是否為植物。

從Web of Science中以純文本格式(.txt)導(dǎo)出,記錄為“全記錄與引用的參考文獻(xiàn)”,共導(dǎo)出550條文獻(xiàn)記錄。

1.3 研究方法

使用Origin 2022對(duì)植物數(shù)據(jù)庫(kù)相關(guān)文獻(xiàn)的發(fā)文量進(jìn)行統(tǒng)計(jì)分析;采用VOSviewer的數(shù)據(jù)分析模塊對(duì)發(fā)文作者(Author)、發(fā)文國(guó)家(Country)、發(fā)文機(jī)構(gòu)(Institution)、關(guān)鍵詞(Keyword)進(jìn)行分析;利用CiteSpce 6.1.R2對(duì)突現(xiàn)詞(Bursts)進(jìn)行可視化分析。

2 文獻(xiàn)計(jì)量分析

2.1 發(fā)文量分析

研究領(lǐng)域的總發(fā)文量代表了該領(lǐng)域的發(fā)展水平,年發(fā)文量的變化反應(yīng)了該領(lǐng)域的動(dòng)態(tài)變化趨勢(shì)[24]。篩選出2004—2022年間收錄的關(guān)于植物數(shù)據(jù)庫(kù)的文獻(xiàn)共550篇,發(fā)文量的年度分布特征如圖1所示,2004—2022年發(fā)文量整體呈逐步上升趨勢(shì)。并且在2012年左右增速明顯加快,這可能是因?yàn)楦咄緿NA測(cè)序技術(shù)的進(jìn)步推動(dòng)了組學(xué)技術(shù)的成熟,并引發(fā)了對(duì)數(shù)據(jù)庫(kù)存儲(chǔ)的高需求。總體而言,植物數(shù)據(jù)庫(kù)在以一種良好的態(tài)勢(shì)逐年上升,數(shù)據(jù)庫(kù)的類(lèi)型和內(nèi)容呈現(xiàn)多樣化,包含生態(tài)數(shù)據(jù)庫(kù)、組學(xué)數(shù)據(jù)庫(kù)等,這些數(shù)據(jù)庫(kù)的建設(shè)為植物研究提供了重要基礎(chǔ)和豐富的信息資源,在植物科學(xué)、生態(tài)學(xué)、農(nóng)業(yè)等領(lǐng)域都起著重要作用。

圖1 2004—2022年植物數(shù)據(jù)庫(kù)研究領(lǐng)域發(fā)文數(shù)量

2.2 發(fā)文作者分析

表1總結(jié)了植物數(shù)據(jù)庫(kù)研究領(lǐng)域發(fā)文量前10的學(xué)者,同時(shí)對(duì)其發(fā)文量、總引用數(shù)、平均引用數(shù)、H指數(shù)和所在國(guó)家進(jìn)行統(tǒng)計(jì),以便對(duì)該領(lǐng)域有一個(gè)全面的了解。排名前10的學(xué)者中,中國(guó)占4位,日本和捷克分別占3位。其中,發(fā)文量最多的是來(lái)自中國(guó)的Su Zhen(13篇),其次是日本的Sakurai Tetsuya(10篇)和捷克的Milan Chytr(8篇)??傄脭?shù)排名前3的學(xué)者分別為Jitka Klime?ov(1 623篇)、Su Zhen(737篇)和Luo Jingchu(587篇)。同時(shí),其平均引用數(shù)也位居前列。H指數(shù)是HIRSCH[21]在2005年提出的一個(gè)基于作者的論文數(shù)量及論文被引用次數(shù)來(lái)衡量作者發(fā)文質(zhì)量和產(chǎn)出水平的重要指標(biāo)。H指數(shù)排名前3的作者分別是Su Zhen、 Sakurai Tetsuya和Milan Chytr,實(shí)驗(yàn)數(shù)據(jù)表明,他們發(fā)表的文章具有一定的代表性,且在該領(lǐng)域有著較高的質(zhì)量和水平。

表1 植物數(shù)據(jù)庫(kù)研究領(lǐng)域發(fā)文量前10作者

圖2展示了作者網(wǎng)絡(luò)合作圖譜,每個(gè)節(jié)點(diǎn)代表一個(gè)作者,節(jié)點(diǎn)之間的連線(xiàn)代表了作者之間的合作關(guān)系,不同顏色代表了不同的合作群體。從圖2可知,節(jié)點(diǎn)與節(jié)點(diǎn)之間連線(xiàn)較多,表明作者之間存在一定的交流,不同群體之間存在合作關(guān)系。圖2中顯示出了多個(gè)密切合作的作者群。例如,以Su Zhen和Xu Wenying為首的的合作群體,整合了基因組學(xué)、轉(zhuǎn)錄組學(xué)和代謝組學(xué)等信息,構(gòu)建了動(dòng)植物功能基因組綜合信息平臺(tái);而Luo Jingchu和Liu Xiaochuan的合作群體,則從基因組水平上系統(tǒng)地預(yù)測(cè)轉(zhuǎn)錄因子并構(gòu)建植物轉(zhuǎn)錄因子數(shù)據(jù)庫(kù)。

圖2 植物數(shù)據(jù)庫(kù)研究領(lǐng)域發(fā)文量作者圖譜

2.3 發(fā)文國(guó)家分析

發(fā)文國(guó)家分析可反映出植物數(shù)據(jù)庫(kù)研究領(lǐng)域的分布情況。如圖3(a)所示,在發(fā)文頻次上,中國(guó)位居首位,發(fā)文頻次為161,占總發(fā)文數(shù)量的26.3%;排名第2的是美國(guó),發(fā)文頻次為115,占總發(fā)文數(shù)量的18.8%;排名第3的是德國(guó),發(fā)文頻次是59,占總發(fā)文數(shù)量的9.6%。這3個(gè)國(guó)家發(fā)文總量占總發(fā)文量的54.7%,在植物數(shù)據(jù)庫(kù)研究領(lǐng)域具有重要的影響力,為其他國(guó)家的植物數(shù)據(jù)庫(kù)研究起到了引領(lǐng)作用。排名在4至10的依次是日本、印度、法國(guó)、英國(guó)、西班牙、澳大利亞和捷克。這些國(guó)家植物數(shù)據(jù)庫(kù)研究的高產(chǎn),反映出其生物技術(shù)和信息技術(shù)足以支持植物數(shù)據(jù)庫(kù)領(lǐng)域的研究。一方面,表明這些國(guó)家重視植物領(lǐng)域的發(fā)展;另一方面,也表明這些國(guó)家的信息技術(shù)足以支持?jǐn)?shù)據(jù)庫(kù)的發(fā)展。這也從側(cè)面證實(shí)了這些國(guó)家的生物技術(shù)和信息技術(shù)共同推動(dòng)了植物數(shù)據(jù)庫(kù)的研究,其研究成果具有代表性和較大的影響力,對(duì)植物數(shù)據(jù)庫(kù)領(lǐng)域的發(fā)展起著很大的推動(dòng)作用。由圖3(b)可知,這些國(guó)家除少數(shù)幾個(gè)國(guó)家外,其他國(guó)家形成了較強(qiáng)的合作網(wǎng)絡(luò)體系,特別是美國(guó)、德國(guó)、中國(guó)等,與其他國(guó)家之間的合作更為緊密,國(guó)家之間達(dá)到了資源共享以及互惠互利的局面。圖3(c)表示發(fā)文量靠前的國(guó)家在地理位置上的分布和聚類(lèi),顏色相同的國(guó)家被歸為一個(gè)合作集群。從圖3可以看到,研究植物數(shù)據(jù)庫(kù)的國(guó)家被分為5個(gè)聚類(lèi),為首的3個(gè)集群分別是:美國(guó)、中國(guó)為代表的集群,日本、英國(guó)、加拿大等構(gòu)成一個(gè)集群和以俄羅斯、芬蘭、阿根廷為代表的集群。從圖3中還可以發(fā)現(xiàn),在集群與集群之間沒(méi)有明顯的界限,集群之間相互覆蓋,表明植物數(shù)據(jù)庫(kù)研究在全球范圍內(nèi)存在廣泛的合作。

圖3 發(fā)文國(guó)家 (a)發(fā)文量前10國(guó)家占比圖; (b)發(fā)文國(guó)家網(wǎng)絡(luò)合作圖譜;(c) Scimago graphica和VOSviewer生成的發(fā)文國(guó)家地區(qū)分布圖

2.4 發(fā)文機(jī)構(gòu)分析

由表2的發(fā)文機(jī)構(gòu)可知,植物數(shù)據(jù)庫(kù)研究機(jī)構(gòu)主要集中在中國(guó)、法國(guó)和美國(guó)等國(guó)家。其中,中國(guó)科學(xué)院(Chinses Academy of Sciences)的發(fā)文頻次最高,共發(fā)表31篇文章,為植物數(shù)據(jù)庫(kù)的研究做出了巨大貢獻(xiàn);其次是法國(guó)國(guó)家科學(xué)研究中心(Centre National de la Recherche Scientifique),與大學(xué)和國(guó)際科研機(jī)構(gòu)建立合作關(guān)系,促進(jìn)跨國(guó)科學(xué)研究項(xiàng)目的進(jìn)展;發(fā)文頻次第三的是加利福利亞大學(xué)體系 (University of California System),發(fā)表了25篇文章。為了進(jìn)一步了解主要研究機(jī)構(gòu)間的合作關(guān)系,繪制了主要機(jī)構(gòu)的合作關(guān)系圖(圖4(a)),該圖共有201個(gè)節(jié)點(diǎn),其中,發(fā)文量在3篇以上的機(jī)構(gòu)有116個(gè),發(fā)文量排在前十的機(jī)構(gòu)之間連線(xiàn)較多且聚集在一起,表明前十機(jī)構(gòu)之間存在緊密的合作關(guān)系,相互輸出的成果較多,機(jī)構(gòu)之間的相互交流推動(dòng)了植物數(shù)據(jù)庫(kù)領(lǐng)域的研究發(fā)展。另外,由圖4(b)可知,H指數(shù)最高的是中國(guó)科學(xué)院,總引用數(shù)最高的是法國(guó)國(guó)家科學(xué)研究中心,這些機(jī)構(gòu)的文章具有一定的代表性和可引用性。

表2 2004—2022年植物數(shù)據(jù)庫(kù)研究領(lǐng)域前10機(jī)構(gòu)

表3 植物數(shù)據(jù)庫(kù)研究發(fā)文量前10的期刊

圖4 機(jī)構(gòu)圖譜 (a)機(jī)構(gòu)合作關(guān)系圖譜;(b)前10機(jī)構(gòu)發(fā)文量、總引用量、平均引用量和H指數(shù)

2.5 發(fā)文期刊分析

表3列出了發(fā)文量前10期刊的總引用數(shù)、平均引用數(shù)、H指數(shù)、JCR分區(qū)以及5年影響因子(IF)等信息,排名前10的期刊共發(fā)表285篇文章,占目標(biāo)文章總數(shù)的51.81%。其中,Nucleic Acids Research(核酸研究)雜志為高產(chǎn)期刊,發(fā)文量94篇,占比17.09%。其次是Database The Jourbal of Biological Database And Curation(生物數(shù)據(jù)庫(kù)與策展)和Plant And Cell Physiology(植物和細(xì)胞生理學(xué)),分別占比7.81%和5.81%??傄脭?shù)最高的前3期刊分別為Nucleic Acids Research,Plant Physiology(植物生理學(xué))和Plant And Cell Physiology,同時(shí)這3個(gè)期刊的平均引用數(shù)也位居前列。根據(jù)H指數(shù),排名前3的期刊分別為Nucleic Acids Research(50),Plant And Cell Physiology(21)和Plant Physiology(19)。發(fā)文量前10期刊的IF在1.6到16.4之間,表明有關(guān)植物數(shù)據(jù)庫(kù)研究期刊的權(quán)威性差異較大。IF排名前3的期刊分別為Nucleic Acids Research(16.4),Plant Physiology(8.7)和Frontiers In Plant Science(6.8),其他期刊影響因子均在5分左右。綜合多個(gè)指標(biāo)顯示,Nucleic Acids Research,Plant And Cell Physiology和Plant Physiology是植物數(shù)據(jù)庫(kù)研究領(lǐng)域的活躍和代表性期刊。

2.6 經(jīng)典文獻(xiàn)分析

550篇論文的總被引數(shù)共30 053次,篇均被引頻次為54.64次。表4介紹了被引頻次前10文獻(xiàn)的研究?jī)?nèi)容、期刊、被引頻次等。據(jù)表4可知,在2004—2022年間,被引次數(shù)最高的論文是Zimmermann, P等在2004年發(fā)表在Plant Physiology雜志上的論文,被引頻次為1 980次,此篇文獻(xiàn)構(gòu)建了 GENEVESTIGATOR在線(xiàn)基因表達(dá)數(shù)據(jù)庫(kù)平臺(tái)以及具有查詢(xún)和分析功能的在線(xiàn)工具,提供了超過(guò)22 000條擬南芥的基因表達(dá)信息。被引頻次排在第2的是一篇名為T(mén)RY - a global database of plant traits的文章,詳細(xì)地介紹了TRY植物功能性狀數(shù)據(jù)庫(kù)。發(fā)表在Journal of Ecology雜志上的The LEDA Traitbase: a database of life-history traits of the Northwest European flora文章被引次數(shù)為1 171次,這是一篇關(guān)于歐洲西北地區(qū)植物群落生態(tài)數(shù)據(jù)庫(kù)的文章??傊?通過(guò)被引前10的文章可發(fā)現(xiàn)植物數(shù)據(jù)庫(kù)存儲(chǔ)的數(shù)據(jù)呈現(xiàn)多樣化,主要以組學(xué)數(shù)據(jù)、生態(tài)數(shù)據(jù)為主。

2.7 關(guān)鍵詞分析

2.7.1 關(guān)鍵詞頻次分析 關(guān)鍵詞是文章的提煉與濃縮,高頻關(guān)鍵詞能夠反映出某一領(lǐng)域的研究熱點(diǎn)、研究方向和未來(lái)發(fā)展趨勢(shì)[24]。WOS文獻(xiàn)經(jīng)過(guò)篩選共有2 429個(gè)關(guān)鍵詞,刊載頻次居前10位的關(guān)鍵詞依次是:database(130次),identification(80次),evolution(57次),resource(53次),genome(50次),Arabidopsis(48次),sequence(40次),annotation(39次),expression(36次),genes(36次)。

2.7.2 研究熱點(diǎn) 使用VOSviewer軟件生成該領(lǐng)域的關(guān)鍵詞共現(xiàn)圖(圖5),在圖譜中節(jié)點(diǎn)大小表示關(guān)鍵詞出現(xiàn)的頻次,相同顏色的節(jié)點(diǎn)代表相同的聚類(lèi)[25]。關(guān)鍵詞聚類(lèi)分析能夠揭示植物數(shù)據(jù)庫(kù)研究領(lǐng)域的熱點(diǎn)主題。對(duì)關(guān)鍵詞聚類(lèi)進(jìn)行分析,可將植物數(shù)據(jù)庫(kù)研究的熱點(diǎn)主題分為6個(gè)聚類(lèi),聚類(lèi)1(紅色區(qū)域)占關(guān)鍵詞頻次的17.19%,是與植物功能性狀、植物多樣性、維管植物、氣候、群落、分類(lèi)等密切相關(guān)的關(guān)鍵詞,這表明生態(tài)方面的研究是植物數(shù)據(jù)庫(kù)研究?jī)?nèi)容的一大主要部分,此外,維管植物也是植物數(shù)據(jù)庫(kù)研究領(lǐng)域的新熱點(diǎn)內(nèi)容。聚類(lèi)2(綠色區(qū)域)占關(guān)鍵詞頻次的12.63%,是與質(zhì)譜法、天然產(chǎn)物、通路、藥物發(fā)現(xiàn)等密切相關(guān)的關(guān)鍵詞,表明藥用植物的研究也是植物數(shù)據(jù)庫(kù)的重點(diǎn)關(guān)注對(duì)象。聚類(lèi)3(深藍(lán)色區(qū)域)占關(guān)鍵詞頻次的10.52%,代表關(guān)鍵詞是預(yù)測(cè)、蛋白質(zhì)、RNA、生物起源、基因、全基因組、非生物脅迫等。聚類(lèi)4(黃色區(qū)域)占關(guān)鍵詞頻次的10.52%,是與擬南芥、表達(dá)、算法、比較轉(zhuǎn)錄組、基因網(wǎng)絡(luò)等密切相關(guān)的關(guān)鍵詞。聚類(lèi)5(紫色區(qū)域)占關(guān)鍵詞頻次的10.17%,是與DNA、預(yù)測(cè)、基因組測(cè)序、進(jìn)化等密切相關(guān)的關(guān)鍵詞。聚類(lèi)3、4、5占關(guān)鍵詞頻次的31.21%,表明了組學(xué)研究一直以來(lái)是生物信息學(xué)研究的熱點(diǎn)問(wèn)題,同時(shí)也是植物數(shù)據(jù)庫(kù)研究領(lǐng)域的主要存儲(chǔ)內(nèi)容。聚類(lèi)6(淺藍(lán)色)占關(guān)鍵詞頻次的10.52%,是與結(jié)構(gòu)、種質(zhì)資源、分子標(biāo)記、遺傳學(xué)等密切相關(guān)的關(guān)鍵詞,揭示了這類(lèi)數(shù)據(jù)庫(kù)在植物育種、作物改良等領(lǐng)域發(fā)揮著重要作用。根據(jù)聚類(lèi)主題的不同,對(duì)植物數(shù)據(jù)庫(kù)進(jìn)行劃分:生態(tài)數(shù)據(jù)庫(kù)、藥用植物數(shù)據(jù)庫(kù)、組學(xué)數(shù)據(jù)庫(kù)和遺傳資源數(shù)據(jù)庫(kù)。

圖5 2004—2022年植物數(shù)據(jù)庫(kù)研究領(lǐng)域關(guān)鍵詞圖譜

2.7.3 研究趨勢(shì) 關(guān)鍵詞突現(xiàn)性是指在一定時(shí)期某個(gè)關(guān)鍵詞出現(xiàn)頻次快速上升,突現(xiàn)強(qiáng)度越高表明在該段時(shí)間內(nèi)研究人員關(guān)注度越高[26],表6中紅色部分表明該關(guān)鍵詞為熱點(diǎn)關(guān)鍵詞的時(shí)段,突現(xiàn)歷史距離越近越可被視為該領(lǐng)域的研究趨勢(shì)[27]。為了更好地研究植物數(shù)據(jù)庫(kù)的最新動(dòng)態(tài)變化和預(yù)測(cè)該領(lǐng)域的未來(lái)發(fā)展趨勢(shì),利用 Citespace中的突現(xiàn)檢測(cè)算法(Burst Detection)對(duì)關(guān)鍵詞進(jìn)行突現(xiàn)分析。如表6所示,列舉了植物數(shù)據(jù)庫(kù)研究領(lǐng)域的突現(xiàn)關(guān)鍵詞。據(jù)表6可知,序列(draft sequenc)、生物學(xué)(biology)、工具(tool)和資源(resource)等關(guān)鍵詞出現(xiàn)時(shí)間較早且跨度在4年以上,表明植物數(shù)據(jù)庫(kù)的研究最開(kāi)始是建立在生物學(xué)基礎(chǔ)之上且作為一種生物學(xué)研究工具;信息(information)、數(shù)據(jù)庫(kù)(database)、擬南芥(Arabidopsis thaliana)、水稻(rice)、蛋白質(zhì)(protein)、基因(gene)為2008到2019年間出現(xiàn)的突現(xiàn)關(guān)鍵詞,這表明研究專(zhuān)家逐漸意識(shí)到數(shù)據(jù)庫(kù)在植物研究領(lǐng)域的重要性,植物數(shù)據(jù)庫(kù)的研究主題由此發(fā)生轉(zhuǎn)變,趨向于構(gòu)建不同形式和不同內(nèi)容的專(zhuān)門(mén)化植物數(shù)據(jù)庫(kù)。例如,水稻數(shù)據(jù)庫(kù)、植物蛋白數(shù)據(jù)庫(kù)等。預(yù)測(cè)(prediction)、表達(dá)(expression)和多樣性(diversity)是近3年出現(xiàn)的突現(xiàn)關(guān)鍵詞,可被看作植物數(shù)據(jù)庫(kù)研究領(lǐng)域的研究趨勢(shì),這表明植物功能預(yù)測(cè)、基因表達(dá)分析和植物多樣性研究受到越來(lái)越廣泛的關(guān)注,可能成為未來(lái)植物數(shù)據(jù)庫(kù)的熱點(diǎn)研究?jī)?nèi)容。

表6 植物數(shù)據(jù)庫(kù)研究突現(xiàn)詞

3 結(jié)論與展望

3.1 結(jié)論

隨著科技的發(fā)展,植物數(shù)據(jù)庫(kù)研究越來(lái)越受到研究人員的重視,本文在梳理前人研究的基礎(chǔ)上,以Web of Science(WOS)核心合集為數(shù)據(jù)源,分別從發(fā)文量、發(fā)文作者、發(fā)文國(guó)家、發(fā)文機(jī)構(gòu)、經(jīng)典文獻(xiàn)和關(guān)鍵詞方面對(duì)植物數(shù)據(jù)庫(kù)的發(fā)展?fàn)顩r進(jìn)行了系統(tǒng)分析,結(jié)果表明。

1)隨著科技的發(fā)展,植物數(shù)據(jù)庫(kù)研究越來(lái)越受到研究人員的重視,發(fā)文數(shù)量在逐步上升,主要產(chǎn)出國(guó)為中國(guó)、美國(guó)、德國(guó)等。我國(guó)在該研究領(lǐng)域中涌現(xiàn)出了像中國(guó)農(nóng)業(yè)大學(xué)生物科學(xué)學(xué)院的Su Zhen和北京大學(xué)生物信息中心Luo Jingchu一批優(yōu)秀學(xué)者。

2)關(guān)鍵詞聚類(lèi)圖譜,列舉了植物數(shù)據(jù)庫(kù)研究領(lǐng)域的六大熱點(diǎn)主題,根據(jù)聚類(lèi)主題的不同,對(duì)植物數(shù)據(jù)庫(kù)按照研究?jī)?nèi)容進(jìn)行劃分:生態(tài)數(shù)據(jù)庫(kù)、藥用植物數(shù)據(jù)、組學(xué)數(shù)據(jù)庫(kù)和遺傳資源數(shù)據(jù)庫(kù)。

3)在植物數(shù)據(jù)庫(kù)的研究中,關(guān)鍵詞出現(xiàn)頻次最多的是database(130次),identification(80次),evolution(57次),resource(53次),genome(50次),arabidopsis(48次),sequence(40次),annotation(39次),expression(36次),genes(36次),表明這些研究?jī)?nèi)容是植物數(shù)據(jù)庫(kù)的研究熱點(diǎn)。

4)根據(jù)突現(xiàn)詞時(shí)間變化規(guī)律可知序列草案(draft sequence)、生物學(xué)(biology)、工具(tool)和資源(resource)等出現(xiàn)時(shí)間較早,表明植物數(shù)據(jù)庫(kù)的早期研究工作主要集中在原始數(shù)據(jù)的分析和處理,同時(shí)強(qiáng)調(diào)將植物數(shù)據(jù)庫(kù)作為生物學(xué)研究工具的重要性,而后水稻(rice)、蛋白質(zhì)(protein)、基因(gene)、預(yù)測(cè)(prediction)等突現(xiàn)詞的出現(xiàn)象征著植物數(shù)據(jù)庫(kù)的研究在逐漸地細(xì)化,很多科學(xué)機(jī)構(gòu)根據(jù)自己的研究?jī)?nèi)容建立了專(zhuān)門(mén)的植物數(shù)據(jù)庫(kù)。

3.2 展望

植物是地球上重要且具有豐富價(jià)值的資源,植物數(shù)據(jù)庫(kù)為植物領(lǐng)域的發(fā)展提供了無(wú)限的可能[28]。根據(jù)可視化研究的結(jié)論,對(duì)未來(lái)植物數(shù)據(jù)庫(kù)的研究和發(fā)展提出了個(gè)人的見(jiàn)解。目前,植物數(shù)據(jù)庫(kù)的研究?jī)?nèi)容是基于生物信息學(xué)研究,而關(guān)于食品供應(yīng)、農(nóng)業(yè)生產(chǎn)、環(huán)境保護(hù)等植物相關(guān)產(chǎn)業(yè)的研究比較少,今后的研究應(yīng)當(dāng)結(jié)合食品科學(xué)、農(nóng)業(yè)科學(xué)、生態(tài)保護(hù)等學(xué)科來(lái)推動(dòng)植物數(shù)據(jù)庫(kù)領(lǐng)域的多方面發(fā)展。此外,有關(guān)植物數(shù)據(jù)庫(kù)的研究主要是針對(duì)植物數(shù)據(jù)庫(kù)存儲(chǔ)內(nèi)容的,而關(guān)于植物數(shù)據(jù)庫(kù)構(gòu)建技術(shù)上的研究卻寥寥無(wú)幾,今后的研究應(yīng)當(dāng)利用現(xiàn)代生物技術(shù)和計(jì)算機(jī)技術(shù)等運(yùn)用到植物研究的各個(gè)環(huán)節(jié),集成跨學(xué)科知識(shí)、打破學(xué)科分割、實(shí)現(xiàn)植物和數(shù)據(jù)庫(kù)技術(shù)的共同發(fā)展。國(guó)內(nèi)外對(duì)植物數(shù)據(jù)庫(kù)的研究開(kāi)展了大量的工作,并取得了許多重要的研究成果,植物數(shù)據(jù)庫(kù)研究?jī)?nèi)容也在逐漸細(xì)化。然而,一些小型化和私人化的植物數(shù)據(jù)庫(kù),由于缺少平臺(tái)或資金投入難以實(shí)現(xiàn)成果的最大轉(zhuǎn)化。這在一定程度上造成了信息的流失和資源的浪費(fèi),不利于小型植物數(shù)據(jù)庫(kù)網(wǎng)站的發(fā)展。一些政府部門(mén)及相關(guān)機(jī)構(gòu)應(yīng)當(dāng)建立政策和采取保護(hù)措施,以避免植物數(shù)據(jù)庫(kù)資源的流失和浪費(fèi)。

猜你喜歡
發(fā)文聚類(lèi)領(lǐng)域
10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
領(lǐng)域·對(duì)峙
青年生活(2019年23期)2019-09-10 12:55:43
校園拾趣
爺孫趣事
以牙還牙
基于DBSACN聚類(lèi)算法的XML文檔聚類(lèi)
基于改進(jìn)的遺傳算法的模糊聚類(lèi)算法
新常態(tài)下推動(dòng)多層次多領(lǐng)域依法治理初探
一種層次初始的聚類(lèi)個(gè)數(shù)自適應(yīng)的聚類(lèi)方法研究
自適應(yīng)確定K-means算法的聚類(lèi)數(shù):以遙感圖像聚類(lèi)為例
思茅市| 金平| 友谊县| 阿拉善盟| 丹寨县| 罗山县| 科技| 什邡市| 太湖县| 泸水县| 徐水县| 桐庐县| 东方市| 时尚| 左贡县| 隆化县| 甘孜| 昌吉市| 伽师县| 香格里拉县| 南涧| 天水市| 邻水| 霍邱县| 华池县| 石狮市| 五峰| 五指山市| 塔河县| 哈密市| 石棉县| 安国市| 吴江市| 电白县| 和政县| 论坛| 启东市| 土默特左旗| 奈曼旗| 保亭| 南澳县|