胡春芳,李 敏,馬曉萍,閔文江,呂軍海,馮改靜,楊蘭偉
(河北省農(nóng)林科學(xué)院農(nóng)業(yè)信息與經(jīng)濟(jì)研究所,河北 石家莊 050051)
國際標(biāo)準(zhǔn)化組織(ISO)關(guān)于信息技術(shù)的定義為:針對(duì)信息的采集、描述、處理、保護(hù)、傳輸、交流、表示、管理、組織、儲(chǔ)存和補(bǔ)救而采用的系統(tǒng)和工具的規(guī)范、設(shè)計(jì)及其開發(fā)[1]。隨著計(jì)算機(jī)技術(shù)和通訊技術(shù)突飛猛進(jìn)的發(fā)展,信息技術(shù)對(duì)社會(huì)活動(dòng)各領(lǐng)域影響越來越大。在20世紀(jì)70年代已經(jīng)開始應(yīng)用計(jì)算機(jī)技術(shù)開展農(nóng)作物育種工作,如種質(zhì)資源管理等,并且在育種領(lǐng)域應(yīng)用得越來越廣泛和深入,如分子標(biāo)記、基因芯片、遙感監(jiān)測、紅外光譜測定、模型診斷、自動(dòng)化考種機(jī)械設(shè)備普遍應(yīng)用于農(nóng)作物育種程序各環(huán)節(jié),極大地推動(dòng)了育種工作的進(jìn)程。
在大數(shù)據(jù)時(shí)代,應(yīng)用文獻(xiàn)計(jì)量學(xué)方法進(jìn)行海量信息的提取挖掘,已經(jīng)被越來越多的學(xué)者關(guān)注和采用。顏志輝等[2]對(duì)基于SCI數(shù)據(jù)庫2009~2013年全球關(guān)于作物轉(zhuǎn)基因育種領(lǐng)域的文獻(xiàn)發(fā)表數(shù)量、被引頻次、地域分布和研究機(jī)構(gòu)分布進(jìn)行了分析,揭示了轉(zhuǎn)基因研究的前3種作物及重點(diǎn)研究領(lǐng)域。許麗等[3]論述了2006~2015年國內(nèi)關(guān)于基因編輯育種技術(shù)的論文和專利發(fā)文量變化趨勢、地域分布、研究進(jìn)展及各國監(jiān)管政策。王慧媛等[4]利用文獻(xiàn)計(jì)量學(xué)和可視化圖譜軟件,對(duì)2003~2013年國內(nèi)外關(guān)于作物分子設(shè)計(jì)育種專利和論文文獻(xiàn)從“分子設(shè)計(jì)育種”概念提出,領(lǐng)域發(fā)展的知識(shí)和技術(shù)演化,以及當(dāng)前的研究熱點(diǎn)與發(fā)展趨勢進(jìn)行了全面分析。靳軍寶等[5]利用國際專利數(shù)據(jù)庫對(duì)生物育種專利技術(shù)進(jìn)行了發(fā)展態(tài)勢分析,結(jié)果顯示,我國在生物育種領(lǐng)域?qū)@暾埩颗琶?位,但專利總體質(zhì)量不高,排名前10位的專利權(quán)人中沒有中國企業(yè)。但是,截至目前,通過文獻(xiàn)計(jì)量學(xué)對(duì)信息技術(shù)應(yīng)用于作物育種發(fā)展態(tài)勢的相關(guān)研究尚未見報(bào)道。從國內(nèi)外發(fā)表文獻(xiàn)的視角,分析了信息技術(shù)在小麥抗病育種領(lǐng)域的發(fā)展概況和研究進(jìn)展,旨為科研人員提供參考的同時(shí),也為科研管理工作者確定發(fā)展學(xué)科方向提供情報(bào)依據(jù)。
文獻(xiàn)資料來源于科學(xué)引文索引數(shù)據(jù)庫(SCI),檢索時(shí)間為2017年4月,檢索范圍為2000~2016年,檢索的主題詞為信息技術(shù)應(yīng)用于小麥作物抗病育種領(lǐng)域主要技術(shù)詞匯。結(jié)合SCI的學(xué)科分類,通過人工清洗與判讀等,終選出文獻(xiàn)數(shù)量2 580篇。由于關(guān)鍵詞是反映文章主旨和涉及領(lǐng)域最有效的標(biāo)志,運(yùn)用TDA(Thomson Data Analyzer)軟件(湯森路透公司)對(duì)關(guān)鍵詞進(jìn)行合并與歸類統(tǒng)計(jì),探究信息技術(shù)在小麥抗病育種應(yīng)用領(lǐng)域研究的主要內(nèi)容;并從發(fā)文量、地域分布等方面對(duì)文獻(xiàn)進(jìn)行計(jì)量分析與可視化研究。
通過對(duì)2000~2016年SCI數(shù)據(jù)庫關(guān)于信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用的相關(guān)文獻(xiàn)進(jìn)行統(tǒng)計(jì)發(fā)現(xiàn),2016年發(fā)文量是2000年的3.6倍,平均年增長率為8.74%,總體呈平穩(wěn)增長趨勢(圖1)。表明信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用處于穩(wěn)步成長階段,有較大的發(fā)展空間。
圖1 2000耀2016年SCI數(shù)據(jù)庫關(guān)于信息技術(shù)在小麥抗病育種應(yīng)用的發(fā)文量Fig.1 The papers number of information technology applied to wheat disease resistance breeding research based on SCI database from 2000 to 2016
通過對(duì)2 580篇文獻(xiàn)進(jìn)行國別統(tǒng)計(jì)發(fā)現(xiàn),發(fā)文量>200篇的國家分別為美國(694篇)、中國(599篇)、澳大利亞(302篇)和加拿大(208篇),其余國家發(fā)文量為100~200篇。對(duì)排名前3位國家的2000~2016年發(fā)文數(shù)量變化趨勢分析發(fā)現(xiàn),2000~2012年美國的發(fā)文量一直保持最高,中國次之;2013~2016年中國的發(fā)文量躍居第1位,平均年增長為17.4%,增長速率最高(圖2)。表明近幾年信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域仍然是研究的熱點(diǎn),且中國在該領(lǐng)域的研究處于迅速發(fā)展時(shí)期。
圖2 2000耀2016年SIC數(shù)據(jù)庫有關(guān)信息技術(shù)在小麥抗病育種應(yīng)用領(lǐng)域研究排名前3位國家的發(fā)文量Fig.2 The papers number of the top three countries in information technology applied to wheat disease resistance breeding research based on SCI database from 2000 to 2016
信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域發(fā)文量排名前20位的機(jī)構(gòu)共發(fā)表文獻(xiàn)1 878篇,其中,美國農(nóng)業(yè)部農(nóng)業(yè)研究局、國際玉米小麥改良中心、中國農(nóng)業(yè)科學(xué)院、堪薩斯州立大學(xué)、加拿大農(nóng)業(yè)與農(nóng)業(yè)食品部和澳大利亞聯(lián)邦科學(xué)與工業(yè)研究組織植物工業(yè)部6個(gè)機(jī)構(gòu)的發(fā)文量>100篇(表1)。這20個(gè)研究機(jī)構(gòu)中,美國有9個(gè),發(fā)文量占到總數(shù)的46.2%;中國有5個(gè),發(fā)文量占到總數(shù)的20.6%。可以看出,美國在信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域占有絕對(duì)優(yōu)勢。
表1 2000耀2016年信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域發(fā)文量排名前20位的研究機(jī)構(gòu)Table 1 The top 20 research institutions in the paper quantity in information technology applied to wheat disease resistance breeding research from 2000 to 2016
2.4.1 基于SCI學(xué)科分類的分析 根據(jù)Web of Science類別對(duì)2 580篇關(guān)于信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用的文獻(xiàn)進(jìn)行分類,結(jié)果(圖3)顯示,前5位研究領(lǐng)域主要分布在Plant Science(植物科學(xué))、Agronomy(農(nóng)學(xué))、Genetics&Heredity(基因遺傳)、Horticulture(園藝)和Biochemistry&Molecular Biology(生物化學(xué)、分子生物學(xué))領(lǐng)域,其中,Plant Science(植物科學(xué))和Agronomy(農(nóng)學(xué))的發(fā)文量均>1 200篇,Genetics&Heredity(基因遺傳)、Horticulture(園藝)、Biochemistry&Molecular Biology(生物化學(xué)、分子生物學(xué))和Food Science&Technology(食品科學(xué)與技術(shù))的發(fā)文量在689~224篇之間;其他學(xué)科還涉及到Multidisciplinary Sciences(交叉學(xué)科)和En tomology(昆蟲學(xué))等。
圖3 2000耀2016年信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用的SCI學(xué)科分類Fig.3 The subject classification of information technology applied to wheat disease resistance breeding research from 2000 to 2016
2.4.2 基于關(guān)鍵詞的研究主題分析 通過TDA軟件對(duì)2 580篇關(guān)于信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用文獻(xiàn)的關(guān)鍵詞進(jìn)行分析,結(jié)果(表2)顯示,研究方向主要集中分子標(biāo)記和遺傳標(biāo)記,病害,病菌毒素,抗病性,以及抗冷和耐熱生理5個(gè)方面。采用的研究技術(shù)主要包括各種軟件應(yīng)用、SNP芯片技術(shù)、SSR、AFLP、RAPD等分子標(biāo)記技術(shù);分析方法主要包括模型分析和Meta-analysis分析等。其中,QTL(quantitative trait loci)詞頻最高。
表2 基于關(guān)鍵詞的研究主題分析Table 2 The analysis on the research topics based on key words
研究性論文的被引頻次能夠反映出該研究領(lǐng)域的技術(shù)熱點(diǎn)及技術(shù)演進(jìn)情況。通過對(duì)2 580篇關(guān)于信息技術(shù)在小麥抗病育種領(lǐng)域應(yīng)用文獻(xiàn)的被引頻次進(jìn)行統(tǒng)計(jì)分析,結(jié)果(表3)顯示,被引頻次排在前10位的文獻(xiàn)有4篇來自美國,加拿大、中國、以色列、澳大利亞、法國和墨西哥各1篇。Somers D J等[6](加拿大)2004年在《Theoretical and Applied Genetics》 上發(fā)表的論文“A high-density microsatellite consensus map for bread wheat(Triticum aestivum L.)”被引頻次最高(1 040次),作者提出了應(yīng)用MapMaker V3.0和joinMapV3.0軟件對(duì)不同面包小麥雜交后代群體的特異位點(diǎn)GWM、GDM、CFA、CFD和BARC等開發(fā)了高密度微衛(wèi)星基因定位遺傳圖譜。O'Donnell K等[7](美國) 2000年在 《Proceedings oftheNational Academy of Sciences of the United States of America》上發(fā)表的論文“Genegenealogiesrevealglobal phylogeographic struct ure and reproductive isolation among lineages of Fusarium graminearum,the fungus causing wheat scab”被引頻次居第2位,作者分析了鐮刀菌屬包含的7 120個(gè)核苷酸序列組合數(shù)據(jù)集的差異,通過基因重組揭示了自然界中7個(gè)譜系的菌種在自然界進(jìn)化分支和地理變化及全球多樣性關(guān)系。Kashkush K等[8](以色列)2002年在《Genetics》上發(fā)表的論文“Gene loss,silencing and activation in a newly synthesized wheat allotetraploid”被引頻次居第3位,主要介紹了小麥異源四倍體包括抗病基因的DNA序列在遠(yuǎn)緣雜交過程中引起基因沉默和激活的機(jī)理。Jia J(中國)等[9]2013年在《Nature》上發(fā)表的論文“Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation”被引頻次居第4位,作者應(yīng)用生成的全面的六倍體小麥RNA-Seq數(shù)據(jù)鑒定了43 150個(gè)蛋白質(zhì)編碼基因,并對(duì)其中的30 697個(gè)基因定位到高密度基因圖譜染色體上。分析了面包小麥中抗病性基因家族、小麥品質(zhì)性狀基因家族以及生物脅迫耐受性基因家族的表達(dá)關(guān)系。Cavanagh C R等[10](澳大利亞) 2013年在 《Proceedings ofthe National Academy of Sciences of the United States of America》上發(fā)表的論文“Genome-wide comparative diversity uncovers multiple targets ofselection for improvement in hexaploid wheat landraces and cultivars”被引頻次居第5位,作者介紹開發(fā)了1種高通量陣列,對(duì)全球范圍內(nèi)的2 994個(gè)份小麥品種基因相關(guān)單核苷酸多態(tài)性(SNP)進(jìn)行了檢測,使用基于SNP的多樣性圖譜描述了作物改良對(duì)遺傳多樣性的基因組和地理模式的影響。
表3 小麥抗病育種單篇論文被引頻次排名前10位的論文Table 3 The top 10 cited papers of information technology applied to wheat disease resistance breeding research
通過對(duì)SCI數(shù)據(jù)庫2000~2016年關(guān)于信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域的發(fā)文量進(jìn)行分析,得出以下結(jié)論:
(1)2000~2016年該領(lǐng)域論文數(shù)量平均年增長率為8.74%,其中,2016年我國總發(fā)文量居第1位,平均年增長速率達(dá)17.4%,增長速率最高。前20位研究機(jī)構(gòu)中,我國有5個(gè)機(jī)構(gòu),且僅中國農(nóng)業(yè)科學(xué)院排名第3位,其他國內(nèi)機(jī)構(gòu)排名均在11~19位。
(2)通過對(duì)主題分析和高被引文獻(xiàn)分析,信息技術(shù)應(yīng)用于小麥抗病育種領(lǐng)域研究,采用的信息技術(shù)及分析方法主要為應(yīng)用軟件、SNP芯片技術(shù)及SSR、AFLP、RAPD等基因分析方法,進(jìn)行小麥條銹病、白粉病、葉銹病和赤霉病等病害的QTL(quantitative trait loci)分析及基因型分析,包括基因定位、基因功能分析、遺傳圖譜分析等。
綜上所述,近年來信息技術(shù)在小麥抗病育種領(lǐng)域的研究活躍度較高。我國各機(jī)構(gòu)發(fā)文量較為分散,除中國農(nóng)業(yè)科學(xué)院擁有較強(qiáng)優(yōu)勢外,其他機(jī)構(gòu)研究力量比較薄弱。應(yīng)重點(diǎn)支持應(yīng)用軟件技術(shù)、SNP芯片技術(shù)開展的小麥抗病高密度遺傳圖譜基因定位研究,以及功能基因調(diào)控機(jī)理挖掘的深度研究。
[1]張才明.信息技術(shù)的概念和分類問題研究[J].北京交通大學(xué)學(xué)報(bào):社會(huì)科學(xué)版,2008,7(3):89-92.
[2]顏志輝,鄭懷國,趙靜娟,串麗敏,張曉靜,譚翠萍,孫素芬.基于SCI論文的作物轉(zhuǎn)基因育種領(lǐng)域發(fā)展態(tài)勢分析[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2016,18(2):208-215.
[3]許 麗,王 玥,李禎祺,蘇 燕.基因組編輯育種技術(shù)及國內(nèi)外發(fā)展態(tài)勢分析[J].農(nóng)業(yè)生物技術(shù),2016,(4):46-51.
[4]王慧媛,阮梅花,王 方,劉 曉.作物分子設(shè)計(jì)育種的發(fā)展態(tài)勢分析[J].農(nóng)業(yè)生物技術(shù),2013,(6):42-50.
[5]靳軍寶,高 峰,古志文,鄭玉榮,田曉陽.基于DII的生物育種專利技術(shù)國際態(tài)勢分析[J].中國農(nóng)業(yè)科技導(dǎo)報(bào),2015,17(4):176-180.
[6] Somers D J,Lsaac P,Edwards K.A high-density microsatellite consensus map for bread wheat(Triticum aestivum L.)[J].Theoretical and Applied Genetics,2004, 109 (6):1105-1114.
[7] O'Donnell K,Kistler H C,Tacke B K,Casper H H.Gene genealogies reveal global phylogeographic structure and reproductive isolation among lineagesofFusarium graminearum, the fungus causing wheat scab[J].Proceedings of the National Academy of Sciences of the U-nited States of America,2000,97 (14):7905-7910.
[8] Kashkush K,F(xiàn)eldman M,Levy A A.Gene loss,silencing and activation in a newly synthesized wheat allotetraploid [J].Genetics,2002,160 (4):1651-1659.
[9] Jia J Z,Zhao S C,Kong X Y,Li Y R,Zhao G Y,He W M,Appels R,Pfeifer M,Tao Y,Zhang X Y.Aegilops tauschii draft genome sequence reveals a gene repertoire for wheat adaptation[J].Nature,2013,496(7443):91-95.
[10] Cavanagh C R,Chao S M,Wang S C.Genome-wide comparative diversity uncovers multiple targets of selection for improvement in hexaploid wheat landraces and cultivars[J].Proceedings of the National Academy of Sciences of the United States of America,2013,110(20):8057-8062.