国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

基于Hadoop_8的新疆棉田土壤微生物資源大數(shù)據(jù)平臺(tái)建設(shè)與可視化分析

2021-05-24 08:52:44劉海燕侯彤瑜姚兆群王海江
關(guān)鍵詞:棉田測(cè)序新疆

劉海燕 楊 榕 侯彤瑜 趙 維 姚兆群 王海江 張 澤 高 攀 呂 新*

(1.新疆兵團(tuán)農(nóng)業(yè)大數(shù)據(jù)國(guó)家地方聯(lián)合工程研究中心,石河子 832000;2.石河子大學(xué)信息科學(xué)與技術(shù)學(xué)院,石河子 832000;3.石河子大學(xué)農(nóng)學(xué)院/新疆綠洲農(nóng)業(yè)病蟲害治理與植保資源利用重點(diǎn)實(shí)驗(yàn)室,石河子 832000;4.中國(guó)科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 300308)

1 引言

根據(jù)我國(guó)農(nóng)業(yè)大數(shù)據(jù)發(fā)展現(xiàn)狀,農(nóng)業(yè)大數(shù)據(jù)未來發(fā)展需要特別關(guān)注的是平臺(tái)與數(shù)據(jù)、需求與應(yīng)用、交易與共享[1]。在農(nóng)業(yè)科技活動(dòng)中,長(zhǎng)期積累和整編的海量科學(xué)數(shù)據(jù),具有重要的保存和開發(fā)利用價(jià)值,隨著微生物組學(xué)數(shù)據(jù)的日益劇增,微生物大數(shù)據(jù)的高效管理與分析越來越受到研究者的關(guān)注[2]大量的數(shù)據(jù)本身是沒有價(jià)值的,需要新的方法和方法來處理、構(gòu)造、分析、可視化并將數(shù)據(jù)集成到模型中,通過生物大數(shù)據(jù)平臺(tái)推動(dòng)生物大數(shù)據(jù)產(chǎn)業(yè)發(fā)展[3]。目前,農(nóng)業(yè)生物多樣性大數(shù)據(jù)平臺(tái)框架建設(shè)取得了一定的成績(jī)[4],土壤科學(xué)中的大數(shù)據(jù)往往是高度異構(gòu)的[5],土壤微生物群落的主要驅(qū)動(dòng)因素非生物土壤參數(shù)包括精確的GPS地理坐標(biāo)和氣候條件、土壤類型、土壤質(zhì)地、土壤pH 值等穩(wěn)定的土壤物理化學(xué)性質(zhì),農(nóng)業(yè)有關(guān)的研究,還包括施肥制度、耕作、植物保護(hù)措施、和植物生物量等屬性[6]。國(guó)際上跨國(guó)公司,歐盟和美國(guó)都紛紛啟動(dòng)了作物微生物組的重大項(xiàng)目,并已經(jīng)進(jìn)入到了功能性研究的階段,如孟山都及諾維信對(duì)解淀粉芽孢桿菌(Bacillus amyloliquefaciens)和綠木霉菌(Trichoder‐ma virens)開展科學(xué)配比與成分優(yōu)化研究,成功研制種子包衣劑,能夠改善作物在苗期的營(yíng)養(yǎng)元素供給[7]。

我國(guó)農(nóng)用微生物菌劑在蔬菜及糧食作物,如小麥水稻上研究較多[8-9],而在經(jīng)濟(jì)作物如棉花上的研究相對(duì)滯后,棉花作為世界性的重要經(jīng)濟(jì)作物,新疆生產(chǎn)建設(shè)兵團(tuán)以下簡(jiǎn)稱“新疆兵團(tuán)”建立了具有地域特色的現(xiàn)代植棉體系,由于耕種條件限制嚴(yán)重,長(zhǎng)年連作等問題突出,農(nóng)藥肥料濫用、環(huán)境污染、病害威脅嚴(yán)重及地力下降,連作病害發(fā)生的主要原因就是土壤生態(tài)環(huán)境中微生物組的失衡。農(nóng)用塑料在新疆棉花生產(chǎn)上有著重要作用,農(nóng)業(yè)可持續(xù)性發(fā)展方面存在白色地膜污染嚴(yán)重,新疆土壤環(huán)境脆弱易污染不易恢復(fù),高通量測(cè)序技術(shù)和生物信息學(xué)方法的快速發(fā)展為解決這些問題提供強(qiáng)有力的技術(shù)支撐。生物藥劑滴施對(duì)棉花黃萎病及根際土壤微生物數(shù)量和多樣性的影響[10],溶磷真菌的篩選及耐鹽特性分析,為今后新疆鹽堿土壤改良和棉田生物肥料中菌種的選擇提供理論依據(jù)和試驗(yàn)基礎(chǔ)[11]。新疆棉田蘊(yùn)含豐富的放線菌資源[12],陸生藍(lán)藻資源[13],益生菌及其功能基因改善農(nóng)作物氮、磷、鐵等元素高效吸收[14],克服連作土壤中微生物群落失衡引起的連作障礙非常重要。最新的研究表明,土壤微生物可以通過活性酶高效降解農(nóng)業(yè)殘存塑料,通過對(duì)廢物回收過程中的微生物組協(xié)同作用的研究,可實(shí)現(xiàn)對(duì)農(nóng)業(yè)廢棄物的高效處理[15-16]。中國(guó)土壤微生物組數(shù)據(jù)平臺(tái)的構(gòu)建與實(shí)現(xiàn)建成[17-18],新疆棉田土壤微生物大數(shù)據(jù)平臺(tái)是新疆兵團(tuán)棉花生產(chǎn)大數(shù)據(jù)平臺(tái)的重要組成部分。利用獲得的棉田土壤微生物多樣性測(cè)序數(shù)據(jù)以及文獻(xiàn)發(fā)表的數(shù)據(jù),對(duì)現(xiàn)有數(shù)據(jù)進(jìn)行整合,建設(shè)土壤生物大數(shù)據(jù)平臺(tái),以實(shí)現(xiàn)體系的業(yè)務(wù)標(biāo)準(zhǔn)規(guī)范、安全得到保障[19]。

本研究開展大面積的棉田土壤微生物調(diào)查,建立高質(zhì)量的微生物組參考數(shù)據(jù)庫(kù),開發(fā)高效的微生物數(shù)據(jù)分析流程,最終創(chuàng)建高效分析及整合利用的大數(shù)據(jù)平臺(tái)。根據(jù)大數(shù)據(jù)采集決策支持管理平臺(tái)的設(shè)計(jì)思想[19-20],收集整合的數(shù)據(jù)資源主要包括土壤微生物組數(shù)據(jù)及環(huán)境因子數(shù)據(jù)兩部分,為日后搭建更為完善以及有針對(duì)性的可視化系統(tǒng)提出了經(jīng)驗(yàn)和技術(shù)積累。實(shí)例分析,通過2017—2019 年三年的棉田土壤微生物多樣性分析,闡明博樂,奎屯,石河子,阜康及哈密地區(qū)棉田細(xì)菌群落結(jié)構(gòu)差異及與環(huán)境因子的相關(guān)性,利用已獲得的數(shù)據(jù)構(gòu)建模型,最終為土壤微生物多樣性資源的保護(hù)和利用提供科學(xué)基礎(chǔ)。

2 系統(tǒng)平臺(tái)構(gòu)架設(shè)計(jì)

新疆棉田土壤微生物多樣性大數(shù)據(jù)平臺(tái)管理與分析功能依托星環(huán)科技(中國(guó),上海,http://www.tran‐swarp.cn/)開發(fā)的企業(yè)級(jí)容器大數(shù)據(jù)平臺(tái),在數(shù)據(jù)資源整合及數(shù)據(jù)庫(kù)建設(shè)完成的基礎(chǔ)TDH6.2 大數(shù)據(jù)平臺(tái),其中Hadoop 版本為hadoop version_8。采用Xshall 及R 作為空間數(shù)據(jù)管理及相關(guān)分析功能的開發(fā)引擎,建成了新疆棉田土壤微生物大數(shù)據(jù)平臺(tái)。新疆棉田土壤微生物大數(shù)據(jù)平臺(tái)系統(tǒng)架構(gòu)如圖1 所示,該系統(tǒng)在標(biāo)準(zhǔn)規(guī)范體系及運(yùn)維體系前提下,自下而上可分為基礎(chǔ)存儲(chǔ)層、數(shù)據(jù)層、算法模型層、使用層。

2.1 使用層

圖1 新疆棉田土壤微生物大數(shù)據(jù)平臺(tái)總體架構(gòu)Fig.1 Framework of the soil microorganism big data platform in Xinjiang cotton field

新疆棉田土壤微生物大數(shù)據(jù)平臺(tái)使用前需要安裝運(yùn)維助手,安裝WinSCP-5.13.8-Setup,XShall,登錄堡壘機(jī)。石河子大學(xué)校園網(wǎng),經(jīng)過管理員授權(quán),直接用IE 瀏覽器登錄網(wǎng)頁(yè)(https://10.255.1.4/index.php/In‐dex/index)。非石河子大學(xué)校園網(wǎng),外網(wǎng)需要在石河子大學(xué)計(jì)算機(jī)信息管理中心備案,開通賬號(hào),安裝Easy Connect方可使用。

2.2 數(shù)據(jù)層

數(shù)據(jù)層是平臺(tái)數(shù)據(jù)資源管理的基礎(chǔ),數(shù)據(jù)層主要是系統(tǒng)建立的數(shù)據(jù)總庫(kù),分為生產(chǎn)數(shù)據(jù)庫(kù)和共享數(shù)據(jù)庫(kù):土壤微生物數(shù)據(jù)庫(kù),土壤養(yǎng)分?jǐn)?shù)據(jù)庫(kù),氣象數(shù)據(jù)庫(kù),植被類型數(shù)據(jù)庫(kù),元數(shù)據(jù)庫(kù)。數(shù)據(jù)目錄由元數(shù)據(jù)庫(kù)提取數(shù)據(jù)庫(kù)關(guān)鍵描述信息生成,數(shù)據(jù)交互接口則負(fù)責(zé)數(shù)據(jù)層與其他層次的數(shù)據(jù)交互,包括數(shù)據(jù)資源的檢索、集成、修改等。數(shù)據(jù)由用戶通過數(shù)據(jù)交互接口集成至平臺(tái)。

2.3 算法模型層

土壤微生物定制化分許與數(shù)據(jù)挖掘,Mapreduce分布式深度學(xué)習(xí),R語(yǔ)言動(dòng)態(tài)運(yùn)行,Discover支持R語(yǔ)言引擎,用戶可以通過R 訪問HDFS 中的數(shù)據(jù),還支持訪問存儲(chǔ)在Inceptor分布式內(nèi)存中的數(shù)據(jù)。在Dis‐cover中,用戶既可以通過R 命令行,也可以使用圖形化的軟件執(zhí)行R 語(yǔ)言程序來訪問https://10.255.1.4 中的數(shù)據(jù),易用性極高。Discover 內(nèi)置了大量常用機(jī)器學(xué)習(xí)算法的分布式實(shí)現(xiàn),可以與R語(yǔ)言中的數(shù)千個(gè)算法混合使用,配合TDH 內(nèi)置的高度優(yōu)化的專有算法,可高速分析現(xiàn)有平臺(tái)中的海量數(shù)據(jù)。此外,Discover還集成了多個(gè)機(jī)器學(xué)習(xí)算法庫(kù),包含了統(tǒng)計(jì)算法、分類算法、聚類分析、回歸分析、頻度關(guān)聯(lián)分析和神經(jīng)網(wǎng)絡(luò)在內(nèi)的常用算法,方便用戶快速構(gòu)建大規(guī)模數(shù)據(jù)挖掘系統(tǒng)和方案。

2.4 基礎(chǔ)設(shè)施層

基礎(chǔ)設(shè)施層包括網(wǎng)絡(luò)、服務(wù)器、防火墻等硬件設(shè)施,需要為平臺(tái)提供足夠的數(shù)據(jù)存儲(chǔ)能力、計(jì)算能力、網(wǎng)絡(luò)帶寬及信息安全保障?;A(chǔ)層主要分為物理層和虛擬層。物理層包括存儲(chǔ)主機(jī)、計(jì)算機(jī)等硬件設(shè)備,虛擬層包括計(jì)算機(jī)網(wǎng)絡(luò)平臺(tái)、服務(wù)器和數(shù)據(jù)存儲(chǔ)虛擬化?;ヂ?lián)網(wǎng):專網(wǎng)接入;存儲(chǔ)設(shè)備:本地儲(chǔ)存;信息安全設(shè)施:下一代防火墻,安全運(yùn)維管理系統(tǒng),入侵防御系統(tǒng);標(biāo)準(zhǔn)規(guī)范運(yùn)維體系:石河子大學(xué)信息網(wǎng)絡(luò)中心,安全運(yùn)維管理系統(tǒng)(堡壘機(jī)V0.8);計(jì)算設(shè)施:可支持大數(shù)據(jù)平臺(tái),采用橫向擴(kuò)展的架構(gòu),可隨著節(jié)點(diǎn)的增加而使得CPU、內(nèi)存、存儲(chǔ)、網(wǎng)絡(luò)等均在一種平衡模式上增加,確保擴(kuò)展沒有瓶頸。平臺(tái)由多個(gè)單機(jī)組成的大數(shù)據(jù)集群架構(gòu),所有組件可選配萬兆以太網(wǎng)或者Infiniband網(wǎng)絡(luò)或者千兆以太網(wǎng)互聯(lián)。本平臺(tái)通過虛擬化等技術(shù)將12 臺(tái)服務(wù)器集群的硬件資源池化,以作為土壤微生物組數(shù)據(jù)存儲(chǔ)及計(jì)算分析的基礎(chǔ)。支持在線升級(jí),保證隨數(shù)據(jù)存儲(chǔ)和計(jì)算需求的增長(zhǎng)而平滑升級(jí)。

3 平臺(tái)數(shù)據(jù)庫(kù)建設(shè)與分析流程

3.1 外部數(shù)據(jù)資源整合數(shù)據(jù)庫(kù)建設(shè)

首先利用獲得的土壤微生物擴(kuò)增子數(shù)據(jù)進(jìn)行本地錄入,整合更多的國(guó)際與國(guó)內(nèi)的有NCBI 序列號(hào)擴(kuò)增子數(shù)據(jù),對(duì)土壤微生物擴(kuò)增子定制化分析,與土壤養(yǎng)分、氣象,植被等跨領(lǐng)域數(shù)據(jù)整合,形成完整數(shù)據(jù)集。R 語(yǔ)言動(dòng)態(tài)運(yùn)行可視化技術(shù)實(shí)現(xiàn)對(duì)土壤微生物多樣性數(shù)據(jù)集的挖掘和利用,MapReduce分布式深度學(xué)習(xí),構(gòu)建開放開源的土壤微生物大數(shù)據(jù)處理利用的通用接口,建立一個(gè)以土壤微生物大數(shù)據(jù)為核心的包括對(duì)海量數(shù)據(jù)進(jìn)行有效管理、高效分析和可用易用的綜合大數(shù)據(jù)系統(tǒng),促進(jìn)新疆棉田土壤微生物多樣性資源保護(hù)和土壤微生物分布格局構(gòu)建。

(1)土壤微生物數(shù)據(jù)庫(kù):本地測(cè)序數(shù)據(jù)擴(kuò)增子序列/NCBI 已發(fā)表的擴(kuò)增子序列。微生物多樣性數(shù)據(jù)和測(cè)序序列數(shù)據(jù),采用了統(tǒng)一規(guī)范的采樣及分析方法,所集成的微生物數(shù)據(jù)質(zhì)量較好。

(2)土壤養(yǎng)分?jǐn)?shù)據(jù)庫(kù):環(huán)境因子數(shù)據(jù)主要是新疆綠洲生態(tài)實(shí)驗(yàn)室成立以來積累的實(shí)際測(cè)定的數(shù)據(jù)。同時(shí),通過賬號(hào)申請(qǐng)獲得中國(guó)土壤數(shù)據(jù)庫(kù)(http//vdb3.soil.csdb.cn/)及土壤科學(xué)數(shù)據(jù)中心(http//soil.geodata.cn/)部分?jǐn)?shù)據(jù)。

(3)氣象數(shù)據(jù)庫(kù):通過賬號(hào)申請(qǐng)獲得中國(guó)氣象數(shù)據(jù)網(wǎng)氣象數(shù)據(jù)。中國(guó)氣象數(shù)據(jù)網(wǎng)(http://www.nmic.cn/site/index/.html)。

(4)植被類型數(shù)據(jù)庫(kù):實(shí)際調(diào)查及年統(tǒng)計(jì)數(shù)據(jù)。

(5)元數(shù)據(jù)庫(kù):依據(jù)“土壤科學(xué)數(shù)據(jù)元數(shù)據(jù)”(GB/T 32739-2016)國(guó)標(biāo),確保平臺(tái)數(shù)據(jù)具有良好的完整性與可用性。

3.2 基于GIS 的棉田土壤微生物及環(huán)境因子數(shù)據(jù)庫(kù)建設(shè)

取樣點(diǎn)在新疆博樂,奎屯,石河子,阜康及哈密地區(qū)綠洲棉田中(40.50-40.83N,81.15-81.48E),選取58塊條田作為樣地,其中2hm2≤y≤5hm2地塊31 個(gè),5hm2≤y≤10hm2地塊17 個(gè),10hm2≤y≤30hm2地塊10 個(gè)。GPS 定位取樣的中心位點(diǎn)采用五點(diǎn)采樣法采集土壤樣品,利用直徑5 cm的不銹鋼土鉆取0~20 cm的土壤樣品,均勻混合,四分法取樣,每個(gè)樣品分別裝到兩個(gè)滅菌塑料袋中,一袋用半導(dǎo)體車載冰箱冷藏保存運(yùn)回實(shí)驗(yàn)室,儲(chǔ)存在4℃冰箱中用于提取土壤總DNA;另一袋常溫運(yùn)回土樣去除雜質(zhì),經(jīng)自然風(fēng)干、研磨過篩后儲(chǔ)以供土壤理化性質(zhì)測(cè)定[21]。

3.3 土壤細(xì)菌16S rRNA 擴(kuò)增子動(dòng)態(tài)運(yùn)行可視化分析流程

通過設(shè)計(jì)16S rRNA 基因引物,擴(kuò)增和測(cè)序來鑒定樣本中的微生物種類[22]。本次16S rRNA 基因測(cè)序及分析平臺(tái),采用高通量測(cè)序技術(shù)(Illumina),具有所需樣本量少、高通量和高精確性等特點(diǎn),一次性獲得幾百萬條的16S rRNA 基因序列,并利用生物信息學(xué)分析方法進(jìn)行快速的物種鑒定。對(duì)于測(cè)序所得到的序列,通過去除低質(zhì)量堿基、Ns、接頭污染序列等過程完成數(shù)據(jù)過濾,得到可信的目標(biāo)序列,用于后續(xù)分析。過濾后的序列,稱之為Clean Reads。首先,將雙端測(cè)序的相應(yīng)的Read1與Read2(Read1與Read2是指分別從5’和3’端兩個(gè)方向測(cè)序所得到的序列片段)利用序列拼接方法PEAR[23]進(jìn)行拼接;然后,對(duì)拼接后的序列我們利用軟件QIIME1.8.0 版本進(jìn)行分析[24-26],包括OTUs 的提取、OTUs 的交疊分析、聚類分析、LEfse分析、系統(tǒng)發(fā)生樹的構(gòu)建、α-多樣性分析、β-多樣性分析等[27]。

3.4 細(xì)菌群落結(jié)構(gòu)差異分析

基于高通量測(cè)序,共獲得7 313 614 條高質(zhì)量的土壤細(xì)菌16S rRNA 基因序列,平均每個(gè)樣本檢測(cè)到73 136 條細(xì)菌序列。在97%的相似度水平下對(duì)序列進(jìn)行聚類后,分別獲得了20 078 個(gè)細(xì)菌OTU。將所有樣品在相同深度下進(jìn)行分析后,平均每個(gè)樣品檢測(cè)到1434±177 個(gè)細(xì)菌OTU。在門水平上,變形菌(Pro‐teobacteria),酸桿菌(Acidobacteria),疣微菌(Verruco‐microbia),以及綠彎菌(Chloroflexi)在棉田土壤中為優(yōu)勢(shì)物種。但不同地區(qū)物種差異較大,變形菌占20.9~29.8%,酸桿菌占16.1~30.6%,疣微菌占8.7~28.9%,綠彎菌占6.6~21.2%,結(jié)果如圖2所示。

圖2 新疆棉田土壤微生物在門水平的物種組成Fig.2 Bacterial community composition on phylum level in Xinjiang cotton area

選取LDA score 大于3.3 的為顯著差異物種,具有統(tǒng)計(jì)學(xué)差異的Biomarker 共計(jì)255 種,選擇LDA score 大于4.5 的差異物種進(jìn)行LDA 分布柱狀圖展示(圖3B),其中柱狀圖的顏色代表各自的組別,長(zhǎng)短代表的是LDA score,即不同組間顯著差異物種的影響程度,例如放線菌門(Actinobacteria),酸桿菌門(Ac‐idobacteria),疣微菌門(Verrucomicrobia),綠彎菌門(Chloroflexi),浮霉菌門(Planctomycetes)、擬桿菌門(Bacteroidetes)、芽單胞菌門(Gemmatimonadetes)。γ-變形菌綱(Gammaproteobacteria),β-變形桿菌(Beta‐proteobacteriales),α-變形菌(Alphaproteobacteria)。鞘脂單胞菌目(Sphingomonadales),脫硫桿菌目(De‐sulfobacterales),地桿菌屬(Geobacter)是北疆棉區(qū)微生物群落結(jié)構(gòu)的主要差異物種。

從不同的取樣地區(qū)分析可見,博樂主要微生物為:放線菌門(Actinobacteria),酸桿菌門(Acidobacte‐ria),疣微菌門(Verrucomicrobia),綠彎菌門(Chloro‐flexi),γ-變形菌綱Gammaproteobacteria 中的Pseudo‐monadaceae,放線菌門中的類諾卡氏菌科(Nocardioi‐daceae)??椭饕ǎ悍啪€菌門(Actinobacteria),酸桿菌門(Acidobacteria),綠菌門(Chloroflexi),浮霉菌門(Planctomycetes),綠菌門(Chloroflexi)中的An‐aerolineae 綱Anaerolineales 目Anaerolineaceae科UTCFX1屬,浮霉菌門(Planctomycetes)中的Phyci‐sphaerae 目Tepidisphaerales科。石河子主要包括:放線菌門(Actinobacteria),綠彎菌門(Chloroflexi);放線菌門(Actinobacteria)中的Propionibacteriales 目,No‐cardioidaceae、Pseudonocardiaceae科,Aeromicrobi‐um、Amycolatopsis屬;Alphaproteobacteria 綱Azospi‐rillales 目Azospirillaceae科Skermanella屬。阜康主要包括:放線菌門(Actinobacteria),疣微菌門(Verru‐comicrobia),綠菌門(Chloroflexi),擬桿菌門(Bacte‐roidetes)。γ-變形菌綱,β-變形桿菌,Pseudomonadales目,Moraxellaceae、Gallionellaceae、Burkholderiaceae科,Cavicella、Sideroxydans。哈密主要包括:放線菌門(Actinobacteria),酸桿菌門(Acidobacteria),綠彎菌門(Chloroflexi)、芽單胞菌門(Gemmatimonade‐tes)。γ-變形菌綱Gammaproteobacteria,β-變形桿菌Betaproteobacteriales,Pseudomonadales 目,Moraxella‐ceae、Gallionellaceae、Burkholderiaceae科,Cavicella、Sideroxydans。放線菌門中的類諾卡氏菌科(Nocardi‐oidaceae)。

進(jìn)一步從不同熟性的適宜棉區(qū)來看,早中熟棉區(qū),早熟棉區(qū),特早熟棉區(qū)及非棉區(qū)存在顯著差異:特早熟棉區(qū)石河子主要差異微生物為放線菌、疣微菌、浮霉菌、Tepidisphaerales 目,Planctomycetes、Mar‐moricola屬,非棉區(qū)(阜康)主要差異微生物為p_Ver‐rucomicrobia,早中熟棉區(qū)的哈密主要差異微生物為浮霉菌科Planctomycetes浮霉菌科Phycisphaerae,Tepidisphaerales目。

3.5 棉田土壤細(xì)菌群落結(jié)構(gòu)與環(huán)境因子的相關(guān)性分析

土壤理化因子:速效鉀、有機(jī)質(zhì)、速效磷、全氮、電導(dǎo)率、pH;采樣季節(jié)的氣候因子:平均地表氣溫、平均氣溫、平均風(fēng)速、日照時(shí)數(shù)、平均相對(duì)濕度、平均本站氣壓;適宜棉區(qū)分區(qū)因子:全年有效積溫(≥10℃)及7月平均溫度;地理因子:經(jīng)度及緯度共計(jì)18 項(xiàng)環(huán)境因子與門水平所作冗余分析結(jié)果表明:RDA1 解釋度為40.18%,RDA2 解釋度為6.27%。土壤理化因子速效鉀對(duì)優(yōu)勢(shì)菌門的指示作用成顯著正相關(guān)(p<0.05),電導(dǎo)率對(duì)優(yōu)勢(shì)菌門的指示作用成顯著負(fù)相關(guān)(p<0.05);理化因子對(duì)優(yōu)勢(shì)菌門的指示作用均達(dá)到顯著顯著水品。適宜棉區(qū)分區(qū)因子中七月份的平均氣溫對(duì)優(yōu)勢(shì)菌門的指示作用達(dá)到極顯著正相關(guān)(p<0.001)。采樣季節(jié)氣候因子中平均風(fēng)速度對(duì)優(yōu)勢(shì)菌門的指示作用達(dá)到極顯著正相關(guān)(p<0.001)。地理因子經(jīng)度對(duì)優(yōu)勢(shì)菌門的指示作用達(dá)到極顯著負(fù)相關(guān)(p<0.001),緯度對(duì)優(yōu)勢(shì)菌門的指示作用成顯著正相關(guān)(p<0.05)。

4 討論

新疆土壤微生物大數(shù)據(jù)分析平臺(tái),平臺(tái)目前支持的生物信息分析流程共2 個(gè),基于QIIME 和Mothur算法搭建的用于16S rRNA 基因測(cè)序數(shù)據(jù)分析流程,基于QIIME 和Mothur 算法搭建的用于ITS 測(cè)序數(shù)據(jù)分析流程。基于16S rRNA基因序列的數(shù)據(jù)分析一般包括序列提取、質(zhì)量控制、序列OTU 聚類、種屬分類鑒定、alpha與beta多樣性分析、以及其他特異性統(tǒng)計(jì)分析[2]。構(gòu)建經(jīng)典的二代測(cè)序數(shù)據(jù)分析流程,由數(shù)據(jù)的獲取和分析流程的構(gòu)建和自動(dòng)化實(shí)現(xiàn)兩部分組成[28]。美吉生物(www.majorbio.com)諾和諾禾致源一站式大數(shù)據(jù)分析平臺(tái)16S rRNA擴(kuò)增子分析流程便捷,為有償分析的云平臺(tái),適合初學(xué)者及經(jīng)費(fèi)充足的研究人員。本研究致力于并實(shí)現(xiàn)各個(gè)環(huán)節(jié)的高效自動(dòng)化管理和分析,為所有注冊(cè)用戶提供土壤微細(xì)菌16S rRNA 擴(kuò)增子分析流程“數(shù)據(jù)存儲(chǔ)—生物信息學(xué)分析—統(tǒng)計(jì)分析和可視化”一站式服務(wù),讓用戶能夠進(jìn)行生物信息分析、統(tǒng)計(jì)分析和可視化:支持的實(shí)時(shí)統(tǒng)計(jì)分析模塊共4 個(gè):變化趨勢(shì)分析、基因/物種組成分析,差異豐度分析、相關(guān)/回歸分析;支持的生物信息分析模塊共3 個(gè):Tax4Fun 功能預(yù)測(cè),Picrust2 KEGG 功能預(yù)測(cè)及FAPROTAX 微生物生物地球化學(xué)循環(huán)功能預(yù)測(cè)。減輕研究者前期的工作負(fù)擔(dān)及經(jīng)費(fèi)壓力,促進(jìn)相關(guān)領(lǐng)域進(jìn)一步對(duì)基因組測(cè)序研究項(xiàng)目的順利開展。

圖3 土壤微生物L(fēng)EfSe分析的進(jìn)化分支圖(A)和LDA值(B)(LDA值>4.5)Fig.3 Least discriminant analysis(LDA)effect size taxonomic cladogram(A)and LDA score of the discriminants com?paring soil bacteria(B)

圖4 RDA冗余分析Fig.4 RDA redundancy analysis

使用層,用戶管理模塊負(fù)責(zé)平臺(tái)賬戶管理與用戶權(quán)限控制,新疆土壤微生物大數(shù)據(jù)分析平臺(tái)在專項(xiàng)團(tuán)隊(duì)內(nèi)部開放試運(yùn)行。與中國(guó)生物多樣性大數(shù)據(jù)平臺(tái)不同,為平臺(tái)訪問安全和信息共享安全提供保障,是一個(gè)由總平臺(tái)、子平臺(tái)和合作共享的數(shù)據(jù)源組成的生物多樣性數(shù)據(jù)共享網(wǎng)絡(luò)體系。數(shù)據(jù)錄入層面,目前數(shù)據(jù)大部分只是本地?cái)?shù)據(jù)錄入,未來數(shù)據(jù)資源持續(xù)豐富以及相關(guān)計(jì)算制圖模型持續(xù)完善上仍有一些問題。在算法模型層,土壤微生物組成、多樣性、功能基因的時(shí)空變化特征和驅(qū)動(dòng)機(jī)制,建立土壤微生物多樣性變化與環(huán)境因子相關(guān)的模型,土壤微生物資源與多元異構(gòu)農(nóng)業(yè)資源數(shù)據(jù)間的信息有效整合。

李濤等基于Hadoop 的氣象大數(shù)據(jù)分析使用分布式多節(jié)點(diǎn)集群可以有效提高海量氣象數(shù)據(jù)的存儲(chǔ)和計(jì)算效率,解決了傳統(tǒng)網(wǎng)絡(luò)地理信息系統(tǒng)(Web‐GIS)平臺(tái)數(shù)據(jù)存儲(chǔ)與計(jì)算的局限性問題[29]。潘愷等利用WebGIS 技術(shù),構(gòu)建包含土壤及微生物數(shù)據(jù)集成、數(shù)據(jù)可視化、知識(shí)發(fā)現(xiàn)和區(qū)域空間制圖等功能的中國(guó)土壤微生物組數(shù)據(jù)平臺(tái),在未來數(shù)據(jù)資源持續(xù)豐富以及相關(guān)計(jì)算制圖模型持續(xù)完善上仍有一些問題[18]。利用新疆及其鄰近國(guó)內(nèi)外173 個(gè)觀測(cè)站點(diǎn)的氣候資料,分析氣候變暖下新疆不同熟性棉花種植區(qū)劃變化特征[30],安徽省植保大數(shù)據(jù)平臺(tái)建設(shè)與應(yīng)用展望,未來要進(jìn)一步補(bǔ)充平臺(tái)所缺乏的遙感、氣象、土壤等方面的信息化數(shù)據(jù),黃萎病不同發(fā)生程度棉田中土壤微生物多樣性[31],呂新等棉花生產(chǎn)農(nóng)業(yè)大數(shù)據(jù)平臺(tái)有效整合農(nóng)業(yè)資源環(huán)境、種質(zhì)資源、氣象資源、水資源等分散異構(gòu)系統(tǒng)的農(nóng)業(yè)信息資源[19-20],面對(duì)兵團(tuán)棉花生產(chǎn)領(lǐng)域多年來積累的海量數(shù)據(jù),以農(nóng)田土地為管理主線,構(gòu)建新疆棉田土壤微生物資源大數(shù)據(jù)平臺(tái),實(shí)現(xiàn)各類農(nóng)業(yè)微生物資源數(shù)據(jù)的管理、融合、共享、分析挖掘和應(yīng)用發(fā)布,結(jié)合農(nóng)業(yè)大數(shù)據(jù)的地域特征(空間性)與物候特征(時(shí)間性),破除數(shù)據(jù)孤島,研究建立結(jié)合農(nóng)業(yè)地域性與物候性的時(shí)空一體化土壤微生物資源大數(shù)據(jù)模型,實(shí)現(xiàn)適合農(nóng)業(yè)領(lǐng)域的點(diǎn)源大數(shù)據(jù)采集的尺度提升,為農(nóng)業(yè)政策制定、農(nóng)業(yè)精準(zhǔn)管理提供依據(jù)。在數(shù)據(jù)整合方面,農(nóng)業(yè)大數(shù)據(jù)影響因素多,缺乏有效的數(shù)據(jù)共享機(jī)制,不同來源的數(shù)據(jù)格式規(guī)范有較大的差異,限制了土壤微生物的大數(shù)據(jù)的分析和挖掘。本研究開展,大面積的棉田土壤微生物調(diào)查,建立高質(zhì)量的微生物組參考數(shù)據(jù)庫(kù),實(shí)現(xiàn)高效的數(shù)據(jù)可視化分析;開發(fā)高效的微生物組數(shù)據(jù)分析流程,最終創(chuàng)建對(duì)微生物組數(shù)據(jù)的系統(tǒng)管理、高效分析及整合利用的大數(shù)據(jù)平臺(tái)是微生物組數(shù)據(jù)研究的迫切需求。

國(guó)際相關(guān)研究全球表層土微生物組群落結(jié)構(gòu)和功能,這說明了這些微生物對(duì)全球養(yǎng)分循環(huán)的相對(duì)貢獻(xiàn)存在地理分布差異[32-33]。Ruth E 通過研究5000 多個(gè)樣玉米根際微生物,發(fā)現(xiàn)其特殊的功能,可作為育種的候選性狀[34]。國(guó)內(nèi),褚海燕等研究空間尺度對(duì)華北平原麥田土壤細(xì)菌群落的影響,對(duì)整個(gè)NCP 的243個(gè)小麥-玉米輪作土壤進(jìn)行了調(diào)查,選擇青藏高原土壤進(jìn)行比較研究,從而了解耕地和自然系統(tǒng)間隨機(jī)性與決定性的相互作用差異[35]。楊云峰等對(duì)華東地區(qū),以秦嶺淮河為界,大規(guī)模調(diào)查不同緯度農(nóng)業(yè)土壤微生物群落結(jié)構(gòu)及多樣性,結(jié)果表明低緯度地區(qū)玉米和水稻土壤微生物群落差異較大[36]。王光華等利用分子生態(tài)網(wǎng)絡(luò)研究東北黑土區(qū)不同緯度農(nóng)田土壤真菌,認(rèn)為土壤的pH 值和土壤全氮含量是同時(shí)影響真菌分布的主要理化因子[37]。西北地區(qū),鹽度是自東向西的沙漠生態(tài)系統(tǒng)中土壤微生物群落的關(guān)鍵決定因素[38],許多研究表明,非生物土壤參數(shù)是全球和局部尺度上土壤微生物群落的主要控制因子[5]。劉海洋等研究,阿克蘇,庫(kù)爾勒及石河子地區(qū)黃萎病不同發(fā)生程度重病田,輕病田,無病田土壤微生物多樣性,發(fā)現(xiàn)作物根際的微生物群落對(duì)土壤生態(tài)環(huán)境及作物健康有至關(guān)重要的作用[39]?;谌蚨ㄎ幌到y(tǒng)(GPS),本文研究了新疆博樂,奎屯,石河子,阜康及哈密地區(qū)棉田土壤細(xì)菌群落的空間分布,通過分析區(qū)內(nèi)土壤優(yōu)勢(shì)菌種,可以幫助我們積極管理土壤,促進(jìn)土壤中益生菌定殖生長(zhǎng),這對(duì)于發(fā)展大空間尺度的農(nóng)業(yè)栽培生態(tài)系統(tǒng)具有重要意義。

5 結(jié)論

基于Hadoop的新疆棉田土壤微生物資源大數(shù)據(jù)庫(kù)平臺(tái)已集成約1.7 GB 的土壤微生物數(shù)據(jù)和5-6 GB各環(huán)境因子數(shù)據(jù),實(shí)現(xiàn)了數(shù)據(jù)集成和可視化分析,并在專項(xiàng)團(tuán)隊(duì)內(nèi)部開放試運(yùn)行,新疆生物物種、生物資源和生物技術(shù)數(shù)據(jù)極其豐富,構(gòu)建服務(wù)于新疆農(nóng)田土壤微生物組研究的專業(yè)數(shù)據(jù)集成和分析平臺(tái),為新疆農(nóng)田土壤微生物資源的系統(tǒng)化、集約化管理、研究和功能評(píng)價(jià),提供全方位的信息支撐,破除數(shù)據(jù)孤島,為區(qū)域尺度土壤環(huán)境管理、多主體跨介質(zhì)協(xié)同治理提供數(shù)據(jù)與決策支撐。隨著平臺(tái)數(shù)據(jù)資源及功能的不斷豐富和完善,期望將其建設(shè)成為涵蓋不同作物土壤微生物組研究領(lǐng)域的重要公共支撐平臺(tái),為新疆易污染、不易恢復(fù)的脆弱綠洲生態(tài)環(huán)境、綠洲農(nóng)業(yè)可持續(xù)生產(chǎn)發(fā)展及極端耐鹽堿微生物資源保護(hù)與開發(fā)等問題起到應(yīng)有的貢獻(xiàn)。

猜你喜歡
棉田測(cè)序新疆
杰 Sir 帶你認(rèn)識(shí)宏基因二代測(cè)序(mNGS)
新民周刊(2022年27期)2022-08-01 07:04:49
二代測(cè)序協(xié)助診斷AIDS合并馬爾尼菲籃狀菌腦膜炎1例
傳染病信息(2021年6期)2021-02-12 01:52:58
長(zhǎng)期膜下滴灌棉田根系層鹽分累積效應(yīng)模擬
基因捕獲測(cè)序診斷血癌
單細(xì)胞測(cè)序技術(shù)研究進(jìn)展
新疆多怪
絲綢之路(2014年9期)2015-01-22 04:24:46
一〇一團(tuán)棉田主要蟲害調(diào)查分析
棉田磁化水灌溉脫抑鹽作用及促生效果示范
兩種除草劑對(duì)棉田三棱草的防除效果
新疆對(duì)外開放山峰
凤台县| 丹江口市| 阿克| 文化| 方正县| 青河县| 平舆县| 北京市| 广德县| 墨竹工卡县| 吴川市| 门源| 扎兰屯市| 平邑县| 剑川县| 黄龙县| 墨脱县| 宾川县| 贵阳市| 上思县| 浦县| 长岛县| 长岭县| 江华| 广丰县| 张家港市| 宁蒗| 五大连池市| 五台县| 宜君县| 宁晋县| 电白县| 陕西省| 中超| 庆安县| 鄂州市| 贞丰县| 曲松县| 襄垣县| 吉林省| 嫩江县|