韓霞,方佳麗,孟沈坤兒,朱曉堯,李楠,溫海虹
(溫州大學(xué) 生命與環(huán)境科學(xué)學(xué)院,城市水污染生態(tài)治理技術(shù)國(guó)家地方聯(lián)合工程研究中心,浙江省水環(huán)境與海洋生物資源保護(hù)重點(diǎn)實(shí)驗(yàn)室,浙江 溫州 325035)
藥用植物是一類具有預(yù)防和治療疾病效果的植物,具有極高的藥用價(jià)值和經(jīng)濟(jì)效益[1]。在人類抗?fàn)幖膊〉拈L(zhǎng)期歷史進(jìn)程中,藥用植物發(fā)揮著至關(guān)重要的作用。中草藥在我國(guó)有著悠久的發(fā)展歷史,《神農(nóng)本草經(jīng)》、張仲景《傷寒雜病論》、李時(shí)珍《本草綱目》等都是我國(guó)歷史文化的瑰寶。藥用植物作為我國(guó)中藥的重要來源,約占總量的90%,而80%藥用植物為野生資源[2]。但由于目前野生藥用植物被無序開發(fā)和生境變化,導(dǎo)致野生藥材嚴(yán)重稀缺,再加上人工培育存在諸多問題,從而導(dǎo)致藥用植物遠(yuǎn)不能滿足市場(chǎng)的需求。
植物與微生物是一個(gè)息息相關(guān)的共生功能體。對(duì)于藥用植物來說,與其相關(guān)的有益微生物可以促進(jìn)藥用植物的生長(zhǎng)發(fā)育;抵抗高低溫、干旱、鹽漬等非生物脅迫;蟲害、病害、雜草等生物脅迫以及影響次級(jí)代謝產(chǎn)物的生成和積累。因此,藥用植物微生物很可能是植物健康和生產(chǎn)力的重要驅(qū)動(dòng)因素。
隨著生物技術(shù)的不斷進(jìn)步,尤其是高通量測(cè)序技術(shù)的迅猛發(fā)展,對(duì)藥用植物微生物多樣性的研究從微觀形態(tài)學(xué)水平進(jìn)入到了DNA測(cè)序水平。利用高通量測(cè)序研究藥用植物微生物多樣性對(duì)于提升藥物產(chǎn)量和品質(zhì)具有重大意義。
1990年,2個(gè)科研團(tuán)隊(duì)首次報(bào)道了從復(fù)雜環(huán)境樣品中獲得的一些16S rRNA序列,這是第一次打開地球上神秘的、未知的微生物世界的大門[3-4]。經(jīng)過多年的探索,科學(xué)家又于1998年提出宏基因組(metagenome)的概念[5],使微生物群落研究由特定基因克隆(16S rRNA、18S rRNA和ITS)向群體中全部微生物基因信息作為研究對(duì)象的轉(zhuǎn)變。從2000年開始二代測(cè)序方法不斷發(fā)展起來,將微生物群落高通量測(cè)序分析帶入全新的階段。2005年,454焦磷酸測(cè)序[6],使微生物群落的分析由基于DNA的組學(xué)技術(shù)向高通量測(cè)序技術(shù)進(jìn)階;隨著Illumina測(cè)序平臺(tái)的問世,之后高達(dá)10余種序列組裝算法以及各種軟件的不斷成熟,至此微生物群落研究飛速發(fā)展[7]。第三代測(cè)序平臺(tái)是基于單分子水平的檢測(cè),具有長(zhǎng)讀長(zhǎng)優(yōu)勢(shì)[8]。隨著DNA測(cè)序技術(shù)的發(fā)展,研究人員發(fā)現(xiàn),那些未獲培養(yǎng)微生物的數(shù)量和種類遠(yuǎn)遠(yuǎn)超過了已獲培養(yǎng)的,這展現(xiàn)了微生物的巨大多樣性[9]。
藥用植物具有豐富多樣的微生物菌群,這些微生物在其生長(zhǎng)發(fā)育、遺傳、代謝功能中發(fā)揮著不可忽視的作用。因此,通過對(duì)藥用植物微生物進(jìn)行深入系統(tǒng)地研究可以加快對(duì)未培養(yǎng)微生物的開發(fā)和利用,提供關(guān)于其生理穩(wěn)定性和功能的關(guān)鍵信息。目前,對(duì)藥用植物微生物的高通量測(cè)序分析研究中大多采用二代和三代高通量測(cè)序技術(shù)。本文將簡(jiǎn)述高通量測(cè)序技術(shù)并介紹該技術(shù)近年來在藥用植物微生物研究中的應(yīng)用進(jìn)展以及其使用高通量測(cè)序技術(shù)將要應(yīng)對(duì)的挑戰(zhàn)。
高通量測(cè)序(high-throughput sequencing,HTS),又稱為“下一代測(cè)序”(next-generation sequencing,NGS)或“深度測(cè)序”(deep sequencing,DS),其特點(diǎn)為能一次性對(duì)幾十萬到幾百萬條DNA分子進(jìn)行序列測(cè)定和一般讀長(zhǎng)較短等[10-11]。它是相對(duì)于一代Sanger測(cè)序技術(shù)和焦磷酸測(cè)序技術(shù)革命性的轉(zhuǎn)變,是一種新型技術(shù),主要包括Roche 454焦磷酸測(cè)序平臺(tái)、Illumina Solexa合成測(cè)序平臺(tái)以及ABI SOLiD連接法測(cè)序平臺(tái),這些也被稱為第二代測(cè)序技術(shù)[12]。它在保持高靈敏度和高精準(zhǔn)度的同時(shí),提高了測(cè)序速度并大大降低了測(cè)序成本。基于NGS的擴(kuò)增子測(cè)序技術(shù)是目前在研究中最常用,也是文獻(xiàn)報(bào)道最多的微生物高通量測(cè)序手段。它的原理是基于微生物基因組的特征性序列(如細(xì)菌的16S rDNA,真菌的18S rDNA和ITS等)進(jìn)行分析微生物群落組成和多樣性。但二代測(cè)序平臺(tái)有讀長(zhǎng)的限制,在實(shí)際檢測(cè)中無法使用高通量測(cè)序技術(shù)對(duì)擴(kuò)增子整個(gè)基因全長(zhǎng)進(jìn)行測(cè)序。伴隨著三代測(cè)序技術(shù)的進(jìn)步,克服了二代測(cè)序讀長(zhǎng)短的劣勢(shì)。因此,利用三代測(cè)序技術(shù)平臺(tái),以Pacific Bio[13]為主進(jìn)行長(zhǎng)片段的擴(kuò)增和序列讀取成為擴(kuò)增子測(cè)序發(fā)展的活躍領(lǐng)域。由于三代測(cè)序具有成本低、周期短、通量高、精度準(zhǔn),讀長(zhǎng)長(zhǎng)等優(yōu)勢(shì),使得微生物基因序列全長(zhǎng)測(cè)序成為可能,從而顯著提高了基于Sanger測(cè)序和NGS測(cè)序技術(shù)所達(dá)不到的高水平物種鑒定的準(zhǔn)確性、清晰度,以及對(duì)樣品中微生物群落的高還原度。目前,高通量測(cè)序研究已檢測(cè)到數(shù)萬個(gè)分類操作單元(OTU)。大部分OTU在不同的分類水平上,甚至在門水平上都無法確定其分類地位,這也凸顯了基于微生物擴(kuò)增子的高通量測(cè)序方法在量化并評(píng)估微生物多樣性方面的重要意義。微生物群落在驅(qū)動(dòng)多種生態(tài)系統(tǒng)功能和生態(tài)過程方面發(fā)揮著核心作用,目前有越來越多的研究?jī)A向于高通量測(cè)序技術(shù)分析微生物多樣性。轉(zhuǎn)錄組測(cè)序[14](transcriptome sequencing,RNA-Seq)是指利用高通量測(cè)序技術(shù)進(jìn)行cDNA測(cè)序,能夠全面快速地獲取某一物種某一狀態(tài)下的幾乎所有轉(zhuǎn)錄本。它具有無需參考物種基因組信息,仍可以進(jìn)行轉(zhuǎn)錄組測(cè)序的優(yōu)勢(shì)。其測(cè)序結(jié)果可以反映特定條件和特定時(shí)間點(diǎn)的基因表達(dá)情況,對(duì)于挖掘其功能基因具有重要意義。另外,宏基因組測(cè)序[15]是利用二代測(cè)序技術(shù)或三代PacBio高通量測(cè)序平臺(tái)對(duì)特定環(huán)境下微生物群體基因組進(jìn)行高通量測(cè)序,在分析微生物遺傳多樣性、種群結(jié)構(gòu)、進(jìn)化關(guān)系的基礎(chǔ)上,可進(jìn)一步探究微生物群體功能活性、相互協(xié)作關(guān)系及與環(huán)境之間的關(guān)系,發(fā)掘潛在的生物學(xué)意義。與傳統(tǒng)微生物研究方法相比,宏基因組測(cè)序技術(shù)規(guī)避了絕大部分微生物不能培養(yǎng)、痕量菌無法檢測(cè)的缺點(diǎn),因此,近年來在微生物學(xué)研究中得到了廣泛應(yīng)用。與二代測(cè)序方法相比,三代宏基因組采用PacBio SMRT測(cè)序的長(zhǎng)讀長(zhǎng)可以輕松覆蓋基因區(qū)間或基因特異性區(qū)域,減少部分拼接錯(cuò)誤,更真實(shí)反映菌群的復(fù)雜組成,有效提高微生物群落鑒定的分辨率,為深入功能研究奠定基礎(chǔ)。
綜上,隨著NGS技術(shù)不斷發(fā)展和成熟,尤其到了第三代測(cè)序技術(shù),憑借其低成本、高通量、簡(jiǎn)流程和高靈敏性等特點(diǎn),在微生物研究領(lǐng)域快速?gòu)V泛地應(yīng)用,成為當(dāng)前探究微生物群落中的成員鑒定和理解微生物功能作用機(jī)制的有效手段,為微生物多領(lǐng)域的研究提供新的想法和途徑。
16S rDNA/18S rDNA/ITS/是微生物系統(tǒng)分類學(xué)研究中最適用和最常用的標(biāo)志[16]。運(yùn)用高通量測(cè)序技術(shù)檢測(cè)藥用植物中微生物(原核生物16S rDNA,真核生物18S rDNA和ITS)功能基因等特定區(qū)段,可以獲得藥用植物微生物物種豐度、物種分類、群落組成和進(jìn)化關(guān)系。這些基因序列均包括可變區(qū)和保守區(qū),保守區(qū)序列可以反映物種間的親緣關(guān)系,而可變區(qū)序列則能體現(xiàn)物種間的差異。通過對(duì)這些序列可變區(qū)域的測(cè)定和比對(duì)可以探究并揭示藥用中的優(yōu)勢(shì)物種、稀有物種及一些未知的物種,能真實(shí)地反映藥用植物的微生物群落的組成情況。藥用植物是已被用作治療各種疾病的傳統(tǒng)草藥。然而,對(duì)這些植物的需求增加凸顯了保護(hù)瀕危物種的重要性。下一代測(cè)序(NGS)技術(shù)的重大進(jìn)步加快了藥用植物的研究。
劉蓬蓬等[17]首次通過基于Illumina MiSeq 平臺(tái)的第二代高通量測(cè)序技術(shù)對(duì)中藥黃芪中傳統(tǒng)培養(yǎng)法和非培養(yǎng)法未檢測(cè)到的及痕量?jī)?nèi)生細(xì)菌的種類進(jìn)行宏基因組測(cè)序分析,準(zhǔn)確、科學(xué)地探析了黃芪中內(nèi)生細(xì)菌的多樣性,為篩選目的功能菌種并進(jìn)行微生物純種或混合菌種發(fā)酵提供科學(xué)依據(jù)。另外,李瑩等[18]基于Illumina MiSeq第二代高通量測(cè)序技術(shù)對(duì)野生甘松和人工栽培甘松的藥用部位(干燥根及根莖,為漢藏藥材)的內(nèi)生細(xì)菌的16S rDNA V4~V5區(qū)進(jìn)行序列測(cè)定,分析了甘松根際細(xì)菌和根及根莖內(nèi)生細(xì)菌群落分布和多樣性,篩選出核心功能微生物混合菌群,該研究對(duì)改良仿野生培育甘松土壤的微生物環(huán)境具有理論指導(dǎo)意義。劉麗等[19]運(yùn)用高通量測(cè)序技術(shù)研究了3種類型一年生霍山石斛菌根真菌,深入了解其群落多樣性、差異性及結(jié)構(gòu)組成,為指導(dǎo)霍山石斛合理采收及應(yīng)用提供依據(jù)。Wang等[20]提出用高通量測(cè)序技術(shù)指導(dǎo)傳統(tǒng)培養(yǎng)分離藥用植物內(nèi)生菌的策略。利用高通量測(cè)序技術(shù)對(duì)藥用植物內(nèi)生菌結(jié)構(gòu)組成和多樣性進(jìn)行整體了解,確定宿主的優(yōu)勢(shì)內(nèi)生菌。然后根據(jù)各優(yōu)勢(shì)內(nèi)生菌的特性模擬微生物原有生境然后設(shè)計(jì)合適的培養(yǎng)基進(jìn)行分離培養(yǎng),最后對(duì)分離菌株進(jìn)行功能研究。2022年,Zuo等[21]利用高通量測(cè)序法分析了3種石斛品種(霍山石斛、鐵皮石斛、串珠石斛)成熟期根際土壤中的微生物群落。在該研究中,研究人員從3種石斛屬植物中總共獲得了240 320個(gè)序列和11 179個(gè)OTU。該研究填補(bǔ)了石斛根際微生物群落的知識(shí)空白,為后續(xù)微生物功能挖掘和生物肥料研究提供了理論依據(jù)。高通量測(cè)序技術(shù)還應(yīng)用在其他藥用植物,如三七[22-23]、人參[24]、丹參[25]、北沙參[26]等微生物群落的多樣性研究中。這些將為研究者全面認(rèn)識(shí)藥用植物微生物物種和結(jié)構(gòu)多樣性提供參考。
藥用植物具有豐富多樣和良好生物活性的次級(jí)代謝產(chǎn)物,如人參當(dāng)中的人參皂苷、石斛中的多糖和生物堿、靈芝當(dāng)中的三萜和多糖以及丹參當(dāng)中的丹參酮等都被用作藥用成分。研究發(fā)現(xiàn),這些有活性的次級(jí)代謝產(chǎn)物的合成與藥用植物微生物息息相關(guān)[27-29]。但這些次生代謝產(chǎn)物在植物體內(nèi)含量較低,且絕大多數(shù)的生物合成途徑并不完全清晰。再加上藥用植物并不像模式植物那樣具有完整的基因組信息和清楚的遺傳背景。所以需要通過基于藥用植物微生物轉(zhuǎn)錄組進(jìn)行高通量測(cè)序,挖掘其內(nèi)在活性成分生物合成相關(guān)的功能基因并分析其基因表達(dá)規(guī)律和功能調(diào)控機(jī)制。Wang等[30]對(duì)鐵皮石斛根際和內(nèi)球體樣本進(jìn)行16S rRNA擴(kuò)增子測(cè)序和宏轉(zhuǎn)錄組測(cè)序,解析了鐵皮石斛微生物群落多樣性和代謝功能多樣性。并通過多種數(shù)據(jù)庫(kù)分析表明,碳水化合物代謝、氨基酸代謝、能量代謝、遺傳信息處理和環(huán)境信息處理等代謝途徑顯著富集,猜測(cè)這些可能與鐵皮石斛在逆境中的生存有關(guān)。Zhong等[31]利用高通量轉(zhuǎn)錄組測(cè)序技術(shù)揭示了藥用植物甘草微生物-代謝產(chǎn)物的綜合調(diào)節(jié)模式。解析了野生型和栽培型烏拉爾甘草主要藥性物質(zhì)甘草苷和甘草酸的影響因素,分析了甘草根部代謝產(chǎn)物、基因表達(dá)與微生物群落之間的相關(guān)性。發(fā)現(xiàn)野生甘草的差異表達(dá)基因數(shù)量(DEG)高于栽培甘草的DEGs數(shù)量。而且功能富集分析表明,這些DEGs在與次級(jí)代謝產(chǎn)物(如類黃酮、苯丙烷和二萜)合成相關(guān)的功能方面顯著富集,可能積極促進(jìn)萜類和黃酮類化合物的合成和積累。Jo等[32]利用三代全長(zhǎng)轉(zhuǎn)錄組測(cè)序技術(shù)對(duì)人參的根、莖、花和葉4種組織進(jìn)行研究,產(chǎn)生了超過135 000個(gè)轉(zhuǎn)錄本,平均長(zhǎng)度3.2 kb。該團(tuán)隊(duì)成功鑒定了與三萜皂苷合成,植物激素信號(hào)通路(包括生長(zhǎng)素和細(xì)胞分裂素)等有關(guān)的特定全長(zhǎng)基因,同時(shí)也鑒定了轉(zhuǎn)座子為人參轉(zhuǎn)錄活性研究提供了依據(jù)。Li等[33]團(tuán)隊(duì)利用三代PacBio RS Ⅱ平臺(tái)Iso-Seq方法對(duì)黃芪葉和根組織進(jìn)行轉(zhuǎn)錄本測(cè)序,在葉中共得到27 975個(gè)轉(zhuǎn)錄本,在根中共得到22 343個(gè)轉(zhuǎn)錄本。除了得到更長(zhǎng)的轉(zhuǎn)錄本、鑒定了新的同源異構(gòu)體(isoform)以外,還鑒定了參與黃芪苷、膽鈣素和毛蕊異黃酮苷生物合成的基因潛在的轉(zhuǎn)錄本。目前為止已經(jīng)對(duì)很多藥用植物進(jìn)行了轉(zhuǎn)錄組測(cè)序研究,高通量測(cè)序技術(shù)憑借在沒有獲得物種的基因組信息的情況下仍可以進(jìn)行轉(zhuǎn)錄組測(cè)序這個(gè)優(yōu)勢(shì),被廣泛應(yīng)用在直接研究藥用植物微生物功能多樣性中。
藥用植物在基因水平上攜帶的各類遺傳物質(zhì)和遺傳信息的總和是藥用植物微生物多樣性的本質(zhì)和最終反映。傳統(tǒng)微生物全基因組測(cè)序首先需要經(jīng)純培養(yǎng),獲得分離單一物種的DNA后才能進(jìn)行全基因組測(cè)序。但是環(huán)境中存在著大量的不可培養(yǎng)微生物,而宏基因組可以對(duì)生境中所有DNA直接測(cè)序,通過生物信息學(xué)分析處理能夠大大減少分離及純化菌株的工作。藥用植物微生物宏基因組高通量測(cè)序數(shù)據(jù)表明,不同藥用植物種群間以及同一植物不同部位的遺傳物質(zhì)和基因表達(dá)具有巨大的差異[34-35]。這些差異對(duì)于藥用植物未知和抗性基因篩選、藥用活性成分代謝通路的解析、遺傳多樣性的研究和種質(zhì)資源保護(hù)等方面具有重要意義。目前在二代和三代測(cè)序技術(shù)的結(jié)合下,研究者對(duì)藥用植物微生物基因組研究有了新思路。Kui等[22]基于高通量宏基因組測(cè)序首次開展了三七在不同種植模式下的微生物結(jié)構(gòu)和功能的研究,測(cè)序產(chǎn)生103.6 Gb的數(shù)據(jù),得到1.64億個(gè)單基因。該研究進(jìn)一步對(duì)不同種植模式的三七根際微生物的核心功能進(jìn)行分析,超過35%的單基因通過比對(duì)KEGG數(shù)據(jù)庫(kù),共注釋了16 396個(gè)功能通路,這些通路主要與41個(gè)KEGG(2級(jí))通路有關(guān)。該項(xiàng)工作為研究三七等人參屬植物與根際微生物互作,栽培和育種提供了新的思路。Dong等[36]采用宏基因組高通量測(cè)序技術(shù),分析了人參根際土壤真菌群落多樣性及組成的變化,闡述了人參栽培模式對(duì)根際微生態(tài)的影響,為克服連作障礙提供策略。Wei等[37]應(yīng)用宏基因組測(cè)序技術(shù)對(duì)不同區(qū)域的澤瀉屬中草藥的根際微生物組的結(jié)構(gòu)和功能進(jìn)行了比較分析。重點(diǎn)關(guān)注了其結(jié)構(gòu)和功能以及參與原甾烷三萜(protostane triterpenes)生物合成的基因。并且了解了主要的門是變形菌門、擬桿菌門、綠彎菌門、酸桿菌門和芽單胞菌門。芽單胞菌屬(Gemmatimonas)、厭氧黏細(xì)菌(Anaeromyxobacter)和假雙頭斧形菌屬(Pseudolabrys)是不同地區(qū)潛在功能差異的主要因素。這項(xiàng)工作填補(bǔ)了澤瀉根際微生物組的知識(shí)空白,為研究其有益微生物提供了寶貴的參考。Guo等[38]利用宏基因組測(cè)序技術(shù)對(duì)低中高3個(gè)水分處理(Group1、Group5和Group9)下的三七根際土壤微生物進(jìn)行功能比較?;贙EGG、CAZy、CARD、ARDB、VFDB、NR、QS、PHI、P450等數(shù)據(jù)庫(kù)注釋結(jié)果證明,土壤水分變化會(huì)引起三七根際土壤微生物功能基因發(fā)生顯著改變。該研究在大量田間和溫室試驗(yàn)的基礎(chǔ)上,綜合利用三七根際土壤微生物高通量測(cè)序、宏基因組學(xué)和微生物培養(yǎng)組學(xué)等方法揭示了土壤水分通過調(diào)節(jié)土壤中有益和有害微生物菌群的平衡來影響三七根腐病發(fā)生的機(jī)制。因此,該研究為通過土壤水分管理來控制土傳病害提供了新的策略。
由此可見,宏基因組高通量測(cè)序技術(shù)能夠使我們更大程度地了解和掌握藥用植物微生物的基因多樣性和遺傳背景信息,這對(duì)于藥用植物活性成分生物合成途徑的解析都具有極大的價(jià)值。
隨著現(xiàn)代分子技術(shù)的發(fā)展,高通量測(cè)序技術(shù)能夠以一種綜合的方式研究微生物群落,能更具體地研究微生物群落的組成和分類特征及其功能特性??紤]到二代測(cè)序和三代測(cè)序結(jié)合使用在解析藥用植物活性成分的生物合成途徑和功能基因調(diào)控機(jī)制,以及藥用植物的多樣化分析和系統(tǒng)進(jìn)化探究等重要方面上發(fā)揮的潛力,該技術(shù)有望成為探究藥用植物與微生物之間關(guān)系的重要技術(shù)手段。這將把藥物植物微生物基因組水平的研究帶入新的高度,展現(xiàn)出不可替代的作用。然而,高通量測(cè)序技術(shù)的應(yīng)用仍面臨以下方面的挑戰(zhàn):一是微生物的高通量測(cè)序會(huì)伴隨海量數(shù)據(jù)的產(chǎn)生[39],處理這些海量數(shù)據(jù)需要與更多學(xué)科交叉研究,如數(shù)學(xué)、計(jì)算機(jī)學(xué)和信息學(xué)等;二是目前各種高通量測(cè)序技術(shù)在實(shí)驗(yàn)流程及分析過程中會(huì)出現(xiàn)方法間的偏差和未標(biāo)準(zhǔn)化等問題[40],還需要進(jìn)一步探討和改進(jìn)。因此,在選擇使用高通量測(cè)序時(shí),也要注意其局限性。
綜上所述,雖然高通量測(cè)序存在數(shù)據(jù)分析難,技術(shù)方法偏差等問題,但因其有低成本、超高通量、簡(jiǎn)流程、高靈敏度和精度等特點(diǎn),使其在藥用植物微生物多樣性研究中的應(yīng)用具有優(yōu)越性。因此,高通量測(cè)序是一個(gè)認(rèn)知藥用植物微生物多樣性預(yù)測(cè)的有效技術(shù)手段。