靳一丹,陸雅海
北京大學(xué),城市與環(huán)境學(xué)院,北京 100871
生物地理學(xué)是一門旨在記錄和理解生物多樣性空間格局的科學(xué),其目的是揭示生物的豐度和組成的產(chǎn)生和維持機(jī)制[1—3]。幾個(gè)世紀(jì)以來,生物學(xué)家一直在探索大型生物的生物地理分布格局[4—5];直到1934年,荷蘭學(xué)者Baas-Becking提出了著名觀點(diǎn)“萬物無所不在,但由環(huán)境選擇”(Everything is everywhere: but the environment selects),首次將微生物與自然環(huán)境聯(lián)系起來,推動(dòng)了微生物生物地理學(xué)的發(fā)展[6]?!拔⑸铩蓖ǔV讣?xì)菌域、古菌域的成員和真核生物域的微小成員,它們在地球上數(shù)量極多、分布廣泛,是地球生物多樣性的重要組成部分[1,7]。土壤含有地球上最多樣的微生物組,它們在物質(zhì)分解、元素生物地球化學(xué)循環(huán)、植物生產(chǎn)力和生物健康中扮演著重要角色[8—11]。理解形成土壤微生物生物地理分布格局的原因及其可能產(chǎn)生的結(jié)果,不僅有助于理解物種進(jìn)化過程(如物種形成)和生態(tài)過程(如物種演替、群落發(fā)展、物種的傳播和維持),還可以為調(diào)節(jié)生物多樣性和生態(tài)系統(tǒng)復(fù)雜性的機(jī)制提供重要信息[12—14]。
受到傳統(tǒng)觀察手段的技術(shù)限制,許多早期研究認(rèn)為土壤微生物多樣性分布的空間變化是“背景噪音”[4]。隨后出現(xiàn)的分子生物學(xué)技術(shù)提高了環(huán)境微生物識別的速度和準(zhǔn)確性,這類技術(shù)與大數(shù)據(jù)分析的耦合大大推動(dòng)了土壤微生物生物地理學(xué)的發(fā)展[15—16]。國際上,中國和美國對近代土壤微生物生物地理學(xué)研究的貢獻(xiàn)度最大,其中土壤細(xì)菌最受關(guān)注;我國的相關(guān)研究正在逐年增加,其研究方向主要為農(nóng)業(yè)、生態(tài)與環(huán)境科學(xué)(圖1)。由此可見,土壤微生物生物地理學(xué)在國際上和我國國內(nèi)都處于廣受關(guān)注且快速發(fā)展的階段。本文首先闡述土壤微生物生物地理學(xué)的研究進(jìn)展,接下來重點(diǎn)介紹分子生物學(xué)技術(shù)和大數(shù)據(jù)分析的應(yīng)用,并對土壤微生物生物地理學(xué)未來的發(fā)展方向進(jìn)行展望。
圖1 國際期刊和我國出版期刊的發(fā)文數(shù)量隨時(shí)間的變化Fig.1 The number of published articles across time in international journals and in Chinese journals
土壤微生物地理分布格局的探索經(jīng)歷了“從否定到肯定”的過程。在21世紀(jì)前,依賴于顯微鏡和富集培養(yǎng)技術(shù),科學(xué)家們發(fā)現(xiàn)一些原生生物具有世界性分布的特點(diǎn)[5,17]。21世紀(jì)后,在純培養(yǎng)和分子生物學(xué)技術(shù)的幫助下,人們發(fā)現(xiàn)土壤微生物也具有地方性特點(diǎn)并呈現(xiàn)出地理分布格局[10,18]。分子生物學(xué)技術(shù)提高了環(huán)境微生物的識別分辨率,這些微生物表現(xiàn)出的生物地理格局否定了以往認(rèn)為土壤微生物群落是一個(gè)沒有空間結(jié)構(gòu)的“黑匣子”觀點(diǎn)。微生物的生物地理學(xué)概念晚于動(dòng)植物兩個(gè)世紀(jì),判斷兩者是否存在共通模式和原理將有助于在現(xiàn)有的宏觀生物地理學(xué)體系下發(fā)展適用于土壤微生物的理論框架,且微生物地理研究也可對現(xiàn)有的生物地理學(xué)理論進(jìn)行補(bǔ)充和驗(yàn)證[2,6]。土壤微生物和大型生物(特別是植物)常常密切相關(guān),我們可以合理推測微生物與大型生物的生物地理存在一定關(guān)聯(lián)[1,19]。相關(guān)研究進(jìn)展包括以下三方面。①從生物的分布格局來看:土壤古菌和真菌的多樣性與許多大型生物表現(xiàn)出一致的趨勢,且真菌的全球分布格局還符合動(dòng)植物的Rapoport法則[10—11]。這可能是由于土壤真菌與植物之間具有更密切的聯(lián)系(如共生關(guān)系),導(dǎo)致其地理分布受到植物分布的制約[10]。②從生物的生態(tài)模式來看:常被用于大型生物生態(tài)學(xué)研究的“種-面積關(guān)系”和“共現(xiàn)模式”其實(shí)也適用于微生物[9,20]。③從造成生物分布格局的原因來看:研究發(fā)現(xiàn),一些驅(qū)動(dòng)微生物多樣性模式的因素可能與解釋大型生物多樣性模式的一些基本過程類似[21—22]。由此可見,土壤微生物與大型生物在生物地理分布上有一些共同點(diǎn)。
然而,仍有一些研究展示了土壤微生物(主要是細(xì)菌)與大型生物在地理分布上的不同。Bahram等人通過全球表土微生物組調(diào)查發(fā)現(xiàn),土壤細(xì)菌的分類多樣性和基因功能多樣性都不符合大型生物普遍的生物多樣性緯度梯度格局[11]。除了緯度梯度,一些土壤微生物的多樣性在海拔、降水梯度和不同土地利用類型上的分布特點(diǎn)也與大型生物不同[23—25]。微生物的微小體型、單細(xì)胞特點(diǎn)、繁殖方式和生理特征都與大型生物有明顯的不同;且由于生存環(huán)境的差異,某些土壤微生物的生物地理分布主要由土壤特性控制[26]。這些都可能導(dǎo)致土壤微生物生物地理分布不同于大型生物。
由此可見,土壤微生物與大型生物的生物地理格局不完全一致,需要發(fā)展出更具包容性的生物地理學(xué)概念和理論來解釋這些差異。為了完成這個(gè)目標(biāo),不僅需要考察土壤微生物的分布和多樣性,更重要的是將微生物信息與環(huán)境信息聯(lián)系起來,從而探索產(chǎn)生土壤微生物地理分布格局的內(nèi)在機(jī)制。
傳統(tǒng)生物地理學(xué)和微生物生物地理學(xué)都認(rèn)為當(dāng)代環(huán)境因素(包括生物和非生物因素)和歷史事件(包括擴(kuò)散限制和過去的環(huán)境條件)是研究生物分布格局的兩大主題[1,27]?;谝陨蟽蓚€(gè)主題,Martiny等人構(gòu)建了一個(gè)微生物生物地理學(xué)框架,其中包括四個(gè)假說:①微生物在空間中隨機(jī)分布;②微生物的生物地理學(xué)反映了當(dāng)代環(huán)境變化的影響;③所有的空間變化都來自于歷史事件的持續(xù)影響;④微生物的分布是歷史事件和當(dāng)代環(huán)境共同影響的結(jié)果[1]?;谝陨峡蚣?研究者們就導(dǎo)致土壤微生物分布格局的兩大主題進(jìn)行了探索。
1.2.1當(dāng)代環(huán)境因素
非生物因素包括氣候和土壤特性,其中土壤特性對土壤微生物的組成和分布起著至關(guān)重要的作用[28—29]。土壤pH是一個(gè)有效的生境“篩選器”:研究發(fā)現(xiàn)土壤pH與某些微生物類群的豐度密切相關(guān),且被認(rèn)為是土壤細(xì)菌群落的最佳預(yù)測因子[25,30—31]。除了pH,土壤養(yǎng)分變化也會(huì)在不同程度上影響土壤微生物的群落組成和多樣性[28]。除了土壤特性,氣候(如氣溫和降水)則可能是通過改變土壤分解速率,從而間接地影響土壤微生物的地理分布[32]。
生物因素包括微生物本身的特征和環(huán)境中其他生物的影響。微生物的定殖、物種形成和滅絕都直接受到其生活史特征的影響,它們龐大的種群規(guī)模和快速增長的特點(diǎn)為遺傳多樣性提供了巨大的潛力[7]。土壤中不同生物群落(包括微生物和較大體積的生物)間存在相互作用,例如:真菌緊密聯(lián)系的群落特點(diǎn)可能導(dǎo)致它們具有更強(qiáng)的環(huán)境變化抵抗能力[33];植物根系分泌物和凋落物不僅改變土壤養(yǎng)分條件,而且深刻影響土壤微生物與植物之間的共生關(guān)系。這些都是影響土壤微生物分布格局的生物因素[34]。
1.2.2歷史事件
擴(kuò)散為生物個(gè)體(及其所代表的類群)被動(dòng)或主動(dòng)地從一個(gè)地點(diǎn)移動(dòng)到另一個(gè)地點(diǎn)并成功定居的過程[3]。長遠(yuǎn)的擴(kuò)散距離、不利環(huán)境條件以及地理屏障等都會(huì)導(dǎo)致不同地理位置微生物組成和多樣性的差異[35,36]。歷史事件和當(dāng)代環(huán)境因素并不相互排斥,它們共同驅(qū)動(dòng)形成土壤微生物群落的空間格局,但它們的相對重要性仍存爭議,需要進(jìn)行更系統(tǒng)化的比較[18,27,37]。
基于當(dāng)代環(huán)境因素和歷史事件的微生物生物地理學(xué)框架有助于解釋土壤微生物的地理分布格局,而探索微生物群落的構(gòu)建規(guī)則有助于深入理解土壤微生物群落結(jié)構(gòu)的形成和演替。目前認(rèn)為微生物群落的構(gòu)建受到確定性過程和隨機(jī)性過程這兩種基本生態(tài)過程的影響[38]:在確定性過程中,物種受到非生物和生物因素的選擇作用,將具有其獨(dú)特的生態(tài)位,能通過競爭生存下來;而在隨機(jī)性過程中,則涉及物種隨機(jī)的出生、死亡、擴(kuò)散和遺傳漂變事件,許多物種存在于相同或重疊的生態(tài)位中,但由于它們的競爭能力處于緊密平衡狀態(tài)而不會(huì)相互淘汰。
實(shí)際上,確定性過程和隨機(jī)性過程同時(shí)影響土壤微生物群落的構(gòu)建,它們的相對重要性則會(huì)因觀察角度的不同而產(chǎn)生差異[39—40]。從空間尺度上看,隨機(jī)性過程可能對較小范圍內(nèi)土壤細(xì)菌群落的構(gòu)建起主導(dǎo)作用;但在較大范圍內(nèi),起主導(dǎo)作用的則是確定性過程[38]。從時(shí)間尺度上看,細(xì)菌群落的構(gòu)建在土壤演替早期受隨機(jī)性過程的控制;隨著演替的進(jìn)行,確定性過程的相對重要性逐漸增加[40—41]。除了觀察的時(shí)空差異,微生物個(gè)體大小也會(huì)使觀察結(jié)果發(fā)生變化[14]?;谝陨喜町?研究者們構(gòu)建了各種概念模型[14,40,42],用于系統(tǒng)地了解生態(tài)系統(tǒng)中微生物群落的形成和演替特征(圖2)。
圖2 微生物群落構(gòu)建概念模型Fig.2 Conceptual model of microbial community assembly圖片根據(jù)Dini-Andreote等人[40]、Wang等人 [42]和Luan等人 [14]的研究
分子生物學(xué)技術(shù)以具有特異性的DNA片段為研究對象,可以檢測環(huán)境微生物的豐度和多樣性[43—44]。自1998年宏基因組學(xué)概念的提出,以核酸為研究對象的分子生物學(xué)技術(shù)被廣泛應(yīng)用于環(huán)境微生物研究中[45]。與傳統(tǒng)微生物研究方法相比,結(jié)合生物信息學(xué)的現(xiàn)代分子生物學(xué)技術(shù)分辨率更高,能不依賴培養(yǎng)技術(shù)而直接獲得自然環(huán)境中的微生物信息,既可以為純培養(yǎng)條件(如培養(yǎng)基成分、培養(yǎng)溫度等)的優(yōu)化提供幫助,也可以從分子水平上判斷環(huán)境微生物的豐度和多樣性。
圖3 基于已有數(shù)據(jù)庫(綠色流程)和采樣(棕色流程)的土壤微生物生物地理學(xué)研究示意圖Fig.3 Diagram of the researches in soil microbial biogeography based on existing databases (green pipelines) or on new studies (brown pipelines)其中一些圖片根據(jù)Thompson等人[46]、Mardis等人[47]、van den Hoogen等人[48]、Ma等人[15]和Garcia-Pichel等人[49]的研究
在分子生物學(xué)技術(shù)研究初期,主要用于土壤微生物生地理研究的是基因克隆文庫和基因指紋圖譜技術(shù),然而這些技術(shù)具有成本較高、工作量大、耗時(shí)長的缺陷,且不能提供微生物數(shù)量和基因表達(dá)水平方面的信息,因此不適合用于觀察和監(jiān)測復(fù)雜環(huán)境中微生物多樣性的時(shí)空動(dòng)態(tài)變化[30,45]。與之相比,隨后出現(xiàn)的高通量測序技術(shù),一次能對幾十萬至幾百萬條DNA分子進(jìn)行序列測定,具有速度快、成本低的優(yōu)點(diǎn)[50]。基于這些優(yōu)點(diǎn),高通量測序目前已成為研究各種尺度下土壤微生物生物多樣性、地理分布格局和群落構(gòu)建演化機(jī)制的首選技術(shù)(圖3)。
高通量測序平臺的代表是Roche公司的454測序儀、Illumina公司的Solexa測序儀和Applied Biosystem公司的SOLiD測序儀[51]。以下簡要介紹目前應(yīng)用最廣的Roche 454測序平臺和Illumina測序平臺。
2.2.1Roche 454測序平臺
Roche 454平臺利用微乳液PCR和焦磷酸測序技術(shù)確定核酸的堿基序列,具有測序讀長較長(最長1000 bp)、耗時(shí)短的優(yōu)點(diǎn)[52]。通過識別小亞基rRNA基因序列的差異,454焦磷酸測序技術(shù)被廣泛應(yīng)用于土壤微生物生物地理研究中,包括微生物多樣性分析、探索微生物地理格局、構(gòu)建微生物預(yù)測模型等[30,53]。然而,Roche 454測序平臺存在通量相對較低、試劑成本高、重復(fù)堿基聚合區(qū)域測序錯(cuò)誤率高的問題,這些缺陷限制了焦磷酸測序被應(yīng)用于大樣本量的研究中[52]。
2.2.2Illumina測序平臺
Illumina平臺利用橋式擴(kuò)增和合成測序技術(shù)確定核酸的堿基序列,是目前高通量測序應(yīng)用最廣泛的平臺,具有通量高、低成本的優(yōu)點(diǎn)[52]。Illumina公司包括HiSeq、MiSeq、NextSeq、NovaSeq等平臺,前兩個(gè)平臺的使用較多。這些平臺的主要區(qū)別在于總輸出和最大讀取長度,如較新的HiSeq 4000系統(tǒng)一次運(yùn)行的通量可達(dá)1.5 Tb,但讀取長度僅限于150 bp;而MiSeq系統(tǒng)的最大讀取長度為500—550 bp,但輸出量受限(15Gb)[54—55]??删C合考慮研究目的、通量要求、測序成本后再選擇合適的Illumina平臺。得益于Illumina測序平臺通量高、成本較低的特點(diǎn),全球尺度的土壤細(xì)菌(16S rRNA基因測序)、古菌(16S rRNA基因測序)、真菌(ITS基因測序)多樣性調(diào)查得以實(shí)現(xiàn)[19,49]。
隨著基因測序領(lǐng)域的快速發(fā)展,人類對微生物多樣性及其功能有了新的認(rèn)知。然而,由于不同微生物組的研究之間缺乏合作,“碎片化”的測序數(shù)據(jù)和背景數(shù)據(jù)缺乏標(biāo)準(zhǔn)分析方法,使大規(guī)模微生物組的研究受到限制。為了解決這一問題,各種國際微生物計(jì)劃自21世紀(jì)以來被相繼提出,如海洋微生物普查計(jì)劃(International Census of Marine Microbes, ICoMM)、人類微生物組計(jì)劃(Human Microbiome Project, HMP)[56]、地球微生物組計(jì)劃(Earth Microbiome Project, EMP)[57]、全球土壤生物多樣性倡議(Global Soil Biodiversity Initiative, GSBI)等,其中EMP和GSBI大大推動(dòng)了土壤微生物多樣性研究領(lǐng)域的發(fā)展。
3.1.1地球微生物組計(jì)劃(EMP)
EMP(http://www.earthmicrobiome.org)成立于2010年,其目的是通過對地球微生物群落的大規(guī)模取樣,得到全球未培養(yǎng)微生物多樣性目錄(包括樣本信息及其元數(shù)據(jù)),并使用標(biāo)準(zhǔn)化流程來探索影響微生物群落結(jié)構(gòu)的生物地理學(xué)原理[57]。在全球五百多名科學(xué)家的共同努力下, EMP在2017年發(fā)表了他們的第一個(gè)薈萃分析成果,包括新建立的環(huán)境微生物基因序列參考數(shù)據(jù)庫,并提出了整合不同研究數(shù)據(jù)的新思路,將微生物多樣性的探索推向前所未有的規(guī)模[46]。該成果已被廣泛應(yīng)用于各類環(huán)境微生物研究中:如Zhang等人通過比較EMP發(fā)布的序列和來自公共數(shù)據(jù)庫的基因組數(shù)據(jù),揭示了地球生物群落原核基因組測序的現(xiàn)狀[16];Ma等人則通過提取EMP數(shù)據(jù)庫中14種環(huán)境的大量測序信息,繪制了地球微生物的共存網(wǎng)絡(luò)[15];而Luan等人則利用EMP的測序數(shù)據(jù)和分析平臺,揭示了微生物群落構(gòu)建與生物有機(jī)體大小之間的關(guān)系[14]。除了以上研究,EMP的數(shù)據(jù)也大大推動(dòng)了測序數(shù)據(jù)分析工具、分析平臺的開發(fā)和測試以及模型構(gòu)建的進(jìn)程[58—59]。
3.1.2全球土壤生物多樣性倡議(GSBI)
GSBI(www.globalsoilbiodiversity.org)發(fā)起于2011年,其目標(biāo)是通過全球科學(xué)家的合作,整合跨學(xué)科成果,向公眾提供信息并推廣到環(huán)境政策中,為當(dāng)前和未來土壤可持續(xù)性研究創(chuàng)建平臺。與EMP不同的是,GSBI旨在更好地利用已有的土壤生物多樣性和生態(tài)系統(tǒng)服務(wù)方面的知識,而不是開始新的研究。至今,全球性的土壤微生物研究的對象包括細(xì)菌[60]、真菌[10]和原生生物[48],這些研究成果對繪制全球土壤微生物地圖集、探尋驅(qū)動(dòng)多樣性和地理分布格局因素、研究群落構(gòu)建機(jī)制和構(gòu)建預(yù)測模型具有重大貢獻(xiàn)。
不斷推進(jìn)的大型國際微生物計(jì)劃使全球環(huán)境微生物數(shù)據(jù)量呈爆炸式增長,隨之產(chǎn)生了各種微生物序列數(shù)據(jù)庫,其中信息的挖掘離不開生物信息學(xué)和計(jì)算機(jī)科學(xué)的支持[61—62]。為了滿足生命科學(xué)日益增長的計(jì)算需求,各類微生物測序數(shù)據(jù)分析平臺快速興起,成為了不具備專業(yè)生物信息學(xué)和編程技能的研究人員深入分析大型數(shù)據(jù)集的有力工具,大大節(jié)約了數(shù)據(jù)分析和結(jié)果可視化的時(shí)間(圖3)。以下是一些近期興起的環(huán)境微生物序列數(shù)據(jù)庫和測序數(shù)據(jù)分析平臺以及它們在微生物研究中的應(yīng)用。
3.2.1全球真菌數(shù)據(jù)庫(GlobalFungi)
GlobalFungi數(shù)據(jù)庫(https://globalfungi.com/)是目前最全面的全球真菌數(shù)據(jù)平臺,包含所有陸地生境中的真菌群落信息,且具有網(wǎng)頁交互界面實(shí)現(xiàn)查詢結(jié)果的可視化[63]。GlobalFungi數(shù)據(jù)庫于2021年5月1日發(fā)布了最新版本3(Release 3),包括超過十一億的真菌內(nèi)轉(zhuǎn)錄間隔區(qū)(ITS)序列和兩億多個(gè)ITS序列變體,這些序列來自于367個(gè)研究的三萬多個(gè)具有地理信息和元數(shù)據(jù)的樣品。GlobalFungi數(shù)據(jù)庫既可以被用于全球真菌的生態(tài)與地理研究,也可以作為特定真菌類群的輔助研究工具[64—65]。該數(shù)據(jù)庫還允許作者提交尚未涵蓋的研究數(shù)據(jù),并以這種方式為真菌系統(tǒng)學(xué)、生物地理學(xué)和生態(tài)學(xué)提供資源。
3.2.2陸地宏基因組數(shù)據(jù)庫(TerrestrialMetagenomeDB)
TerrestrialMetagenomeDB數(shù)據(jù)庫(https://webapp.ufz.de/tmdb/)建立于2020年,是第一個(gè)專門的陸地宏基因組數(shù)據(jù)庫,不僅包含全球范圍各種生物群落和材料的宏基因組測序數(shù)據(jù),還包含生物樣品的元數(shù)據(jù)和測序技術(shù)的元數(shù)據(jù)[66]。TerrestrialMetagenomeDB數(shù)據(jù)庫目前已更新到2.0版本,包括來自SRA(Sequence Read Archive)和MG-RAST(Metagenome Rapid Annotation using Subsystem Technology)的兩萬多個(gè)陸地宏基因組,并對它們的數(shù)據(jù)集進(jìn)行了內(nèi)容補(bǔ)充和格式統(tǒng)一。該數(shù)據(jù)庫的特點(diǎn)是具有用戶友好型界面,既可以使用關(guān)鍵詞搜索,也可以直接從地圖上按照地點(diǎn)快速選取感興趣的宏基因信息,用于后續(xù)新舊數(shù)據(jù)的融合分析或薈萃分析。
3.2.3原核生物信息數(shù)據(jù)庫及生境預(yù)測平臺(ProkAtlas)
雖然原核生物在全球各種生境中廣泛分布,但它們有各自的環(huán)境偏好,從而形成全球微生物的多樣性格局。在這個(gè)背景下,2020年出現(xiàn)了一款名為ProkAtlas(https://msk33.github.io/prokatlas.html)的原核生物信息數(shù)據(jù)庫,可以通過網(wǎng)頁交互作業(yè)對給定原核生物群落的生境進(jìn)行預(yù)測[67]。為了避免擴(kuò)增子測序引物引起的偏差,ProkAtlas數(shù)據(jù)庫使用的是從五千多個(gè)宏基因組項(xiàng)目中提取的三十多萬個(gè)16S rRNA基因序列,其主要來源為根際、土壤和海洋等環(huán)境樣品。利用這些宏基因組項(xiàng)目的元數(shù)據(jù),可以將基因與生境進(jìn)行關(guān)聯(lián),從而對“微生物群落適應(yīng)的環(huán)境類型”、“微生物的生境廣譜性”以及“該微生物祖先或后代的居住生境范圍”等問題進(jìn)行解答。
3.2.4微生物組學(xué)分析和可視化平臺(Anvi′o)
Anvi′o(Analysis and visualisation platform for ‘omics data)是一個(gè)開源的、先進(jìn)的微生物組學(xué)分析和可視化平臺,主要用于泛基因組分析,也適用于宏基因組學(xué)、宏轉(zhuǎn)錄組學(xué)和系統(tǒng)基因組學(xué)及其綜合分析。該平臺包含一百多個(gè)可單獨(dú)執(zhí)行任務(wù)的程序,具有靈活性、交互性和模塊化的特點(diǎn),滿足用戶構(gòu)建分析工作流程的需求[68]。在基因組和泛基因組分析流程中,Anvi′o可以識別并區(qū)分密切相關(guān)的微生物基因組中的核心基因和附屬基因;而在宏基因組分析流程中,Anvi′o可以獲得微生物的群落組成并完成可視化[69—70]。除了‘以上完整的工作流程,Anvi′o的各個(gè)模塊還可以被單獨(dú)使用:如進(jìn)行宏基因組分箱、基因組精煉、基因組完整性考察等。得益于30多位開發(fā)者的貢獻(xiàn),Anvi′o平臺目前擁有超過八萬行Python和JavaScript代碼,用于滿足微生物學(xué)家復(fù)雜的需求。
3.2.5微生物組學(xué)數(shù)據(jù)平臺(MicrobiomeAnalyst)
MicrobiomeAnalyst(https://www.microbiomeanalyst.ca/)是一個(gè)微生物組學(xué)數(shù)據(jù)的分析網(wǎng)站,目前具有標(biāo)記基因數(shù)據(jù)分析、鳥槍數(shù)據(jù)分析、公共數(shù)據(jù)投影和分類集群富集分析四個(gè)模塊,即使不具備專業(yè)編程技能的人員也可以利用該平臺對微生物組學(xué)數(shù)據(jù)進(jìn)行預(yù)處理、統(tǒng)計(jì)分析、功能分析、薈萃分析和可視化[71]。目前,MicrobiomeAnalyst平臺已被廣泛運(yùn)用于自然環(huán)境(如土壤、沉積物、海洋)微生物和腸道微生物的研究中[72—75]。
3.2.6在線微生物分析平臺(Qiita)
Qiita(https://qiita.ucsd.edu/)是一款開源、簡便、快速的在線微生物分析平臺,既包括QIIME等測序數(shù)據(jù)的分析流程,也具有面向全球的公開數(shù)據(jù)庫,可以幫助用戶對多個(gè)具有多組學(xué)數(shù)據(jù)的研究進(jìn)行跟蹤,適合初學(xué)者使用[76]。Qiita不僅擁有超過十萬個(gè)擴(kuò)增子數(shù)據(jù)集和超過五百個(gè)配對的宏基因組和代謝組學(xué)數(shù)據(jù)集,還具有標(biāo)準(zhǔn)化的技術(shù)、數(shù)據(jù)和分析工具,提供了一個(gè)大規(guī)模數(shù)據(jù)整合研究的框架,減輕了微生物生態(tài)研究者的技術(shù)負(fù)擔(dān)[77]。Qiita平臺允許使用最新的分析技術(shù)快速重新分析已存儲的數(shù)據(jù)集,即使是非生物信息學(xué)家也能夠使用標(biāo)準(zhǔn)化流程輕松地進(jìn)行數(shù)據(jù)分析和薈萃分析。除了土壤微生物生物地理學(xué)研究[78],Qiita在環(huán)境污染、人類疾病與健康、分子生物學(xué)方法探索中也起到重要作用[79—81]。
3.2.7宏基因組全球目錄平臺(gcMeta)
宏基因組全球目錄(Global Catalogue of Metagenomics, gcMeta)平臺是中國科學(xué)院微生物組學(xué)研究計(jì)劃(CAS-CMI)的一部分,也是世界微生物數(shù)據(jù)中心(WDCM)的合作數(shù)據(jù)庫[82]。gcMeta(https://gcmeta.wdcm.org/)平臺具有自己的數(shù)據(jù)庫,包括四萬多個(gè)宏基因組數(shù)據(jù)、九萬多個(gè)擴(kuò)增子數(shù)據(jù)、一千多個(gè)宏轉(zhuǎn)錄組數(shù)據(jù)和三千多個(gè)基因組數(shù)據(jù),涵蓋人類腸道、宿主微生物、土壤等諸多研究領(lǐng)域;除此之外,gcMeta也提供網(wǎng)頁版的數(shù)據(jù)分析工具(如組裝、注釋、可視化等)和工作流程(如基因組注釋、宏基因組分類等)。未來,gcMeta平臺有望對與人類疾病與健康有關(guān)的微生物的研究起到重要貢獻(xiàn)[83—84]。
在大多數(shù)微生物測序數(shù)據(jù)的分析中,微生物類群的劃分依賴于一個(gè)或多個(gè)基因組區(qū)段的核苷酸序列的相似性(即聚類法),這種人為設(shè)置相似度閾值的聚類方法會(huì)使微生物類群因分類分辨率的高低而變化,這種靈活性使得解釋生物地理格局的過程更加復(fù)雜[3]。針對這類問題,有研究者在土壤微生物生物地理研究中選擇使用擴(kuò)增子序列變體(Amplicon Sequence Variants, ASVs)——而不是使用傳統(tǒng)的聚類結(jié)果(Operational Taxonomic Units, OTUs)——對微生物進(jìn)行分類[15,46]。ASVs是基于測序區(qū)段序列差異的分類結(jié)果,可以作為一種穩(wěn)定的分類標(biāo)識符,與OTUs相比具有可重復(fù)使用的優(yōu)勢,即使在未來也可以與16S rRNA基因或基因組數(shù)據(jù)庫進(jìn)行比較[46,85]。因此,未來建議使用ASVs代替?zhèn)鹘y(tǒng)的OTUs聚類方式來對微生物進(jìn)行分類,或是針對研究目的對微生物聚類分類系統(tǒng)的分辨率進(jìn)行統(tǒng)一與優(yōu)化,一方面有利于來源于不同數(shù)據(jù)庫信息的整合,另一方面可以避免由于分類分辨率過低而低估了微生物的地理分布特點(diǎn)。
隨著大型國際微生物計(jì)劃的不斷推進(jìn),全球土壤微生物數(shù)據(jù)量呈爆炸式增長,各種新興數(shù)據(jù)庫和數(shù)據(jù)分析平臺的推廣有助于各類微生物系統(tǒng)模型的構(gòu)建,這些模型將對驗(yàn)證生態(tài)學(xué)猜想和預(yù)測土壤生態(tài)變化起到重要作用。
與大型生物相比,以微生物作為觀察對象的優(yōu)點(diǎn)之一是其可以被用于進(jìn)行可控且可重復(fù)的試驗(yàn)。首先,微生物培養(yǎng)試驗(yàn)和生理生化試驗(yàn)為直接檢驗(yàn)?zāi)承┥鷳B(tài)學(xué)猜想(特別是那些野外無法檢驗(yàn)的大型生物的猜想)提供了可能性,從而幫助人們更深入地理解生物多樣性的形成過程[49,86]。其次,通過微生物生物地理研究和試驗(yàn)驗(yàn)證而構(gòu)建的微生物系統(tǒng)模型可以成為研究生態(tài)學(xué)的有用工具[59]。至今,全球尺度下的土壤微生物研究不僅包括繪制各類土壤微生物的全球分布圖譜[60,87],還包括微生物組內(nèi)的營養(yǎng)結(jié)構(gòu)調(diào)查[88],這些研究將對全球環(huán)境變化導(dǎo)致的土壤生態(tài)變化的預(yù)測起到重要作用[89]。在未來有關(guān)土壤微生物模型構(gòu)建的研究中,一方面可以結(jié)合來自EMP、GSBI等計(jì)劃發(fā)布的測序數(shù)據(jù),綜合考慮各種環(huán)境背景;另一方面還需關(guān)注土壤、氣候以及其他生物與微生物之間的相互關(guān)系,構(gòu)建更精確的土壤微生物預(yù)測模型。需要注意的是,數(shù)據(jù)量增大的同時(shí)構(gòu)建模型的噪聲也會(huì)增加,結(jié)果可能導(dǎo)致模型準(zhǔn)確性不增反減[90]。對于目前指數(shù)增長且來源多樣的各類環(huán)境微生物測序數(shù)據(jù),需要選擇合適的去噪手段(如平滑處理、分類處理等)對它們進(jìn)行前處理后再增大模型輸入的數(shù)據(jù)量,這樣不僅可以提高模型的準(zhǔn)確性,未來在其他研究中還可以重復(fù)利用這些測序數(shù)據(jù)[91—92]。
在至今絕大多數(shù)的土壤微生物生物地理學(xué)研究中,分子生物學(xué)技術(shù)多被用于揭示復(fù)雜環(huán)境中微生物的系統(tǒng)發(fā)育多樣性,而忽略了其功能多樣性。實(shí)際上,真正驅(qū)動(dòng)相關(guān)生態(tài)過程的是這些微生物所表現(xiàn)出來的功能。因此,了解自然環(huán)境中微生物功能特性的梯度(即基因地理學(xué))將有助于從功能機(jī)理上理解微生物群落和自然地理之間的關(guān)系[93—94]。
實(shí)際上,Weiher和Keddy早在1995年就提出了基于特征的群落構(gòu)建的模型,強(qiáng)調(diào)了物種具有的特征(而不是物種在分類學(xué)上的差異)對于群落構(gòu)建的重要性[95]。這種基于功能特征的微生物生物地理學(xué)方法的潛力逐漸受到重視,因?yàn)檠芯抗δ芴匦耘c環(huán)境梯度的關(guān)系將有助于從機(jī)理上理解微生物群落和自然環(huán)境之間的關(guān)系[2,96]。隨著分子生物學(xué)技術(shù)的不斷發(fā)展,功能基因定量PCR技術(shù)和微陣列基因芯片技術(shù)被用于識別土壤中的功能基因,從而探索功能基因與環(huán)境梯度之間的聯(lián)系[97—98]。然而,這類技術(shù)受限于已有的基因序列的知識,但自然環(huán)境中大量微生物基因的功能是未知的。宏組學(xué)(包括宏基因組、宏轉(zhuǎn)錄組)測序技術(shù)是實(shí)現(xiàn)該目標(biāo)的有利工具,因?yàn)檫@類技術(shù)可以獲得環(huán)境微生物全基因組的序列,從而實(shí)現(xiàn)對微生物群落的分類組成和功能特征的描述[55]?,F(xiàn)如今,為了探索環(huán)境微生物組的功能多樣性,越來越多研究者選擇將宏基因組測序的手段應(yīng)用于微生物生物地理研究中[99—100]。與擴(kuò)增子測序相比,宏基因組測序不僅可以獲得更多基因的功能信息,還能提高稀有類群的識別率[101]。需要注意的是,功能基因發(fā)生作用的前提是它們的表達(dá),這需要結(jié)合宏轉(zhuǎn)錄組測序等加以研究。由此可見,結(jié)合應(yīng)用各類宏組學(xué)測序方法(如Qiita平臺),進(jìn)行大尺度的、系統(tǒng)性的基因地理學(xué)分析,將是未來土壤微生物生物地理學(xué)研究的一大發(fā)展方向(圖3)。更重要的是,土壤微生物生物地理學(xué)在未來還有望形成一個(gè)“基因地理學(xué)”的分支,基因地理學(xué)研究將結(jié)合宏觀生態(tài)學(xué)研究方法與分子生物學(xué)手段,不僅有助于更好地理解微生物分布格局下的機(jī)制,在將來還有望對地球系統(tǒng)模型的構(gòu)建做出重要貢獻(xiàn)。