姜 威, 張淑梅, 閆更軒, 田 緣, 胡基華, 潘 鈺, 夏海華, 吳皓瓊, 于 沖*
(1.黑龍江省科學(xué)院 微生物研究所, 黑龍江 哈爾濱 150010;2.黑龍江省科學(xué)院 高技術(shù)研究院, 黑龍江 哈爾濱 150020)
長(zhǎng)期施用化肥農(nóng)藥所導(dǎo)致的環(huán)境污染是我國(guó)綠色農(nóng)業(yè)發(fā)展面臨的挑戰(zhàn)和急需解決的重要問(wèn)題,研發(fā)新型微生物農(nóng)藥,是實(shí)現(xiàn)化肥農(nóng)藥雙減、土壤修復(fù)、生態(tài)和食品安全以及農(nóng)業(yè)可持續(xù)性發(fā)展的一個(gè)重要途徑[1]。目前,活體微生物農(nóng)藥存在見(jiàn)效慢、應(yīng)用效果不穩(wěn)定和菌株退化等瓶頸問(wèn)題,微生物代謝產(chǎn)物-抗生素農(nóng)藥存在抗藥性問(wèn)題[2]。因此,尋找新資源和新結(jié)構(gòu)微生物代謝產(chǎn)物是微生物農(nóng)藥研發(fā)新方向。芽胞桿菌能夠產(chǎn)生小肽、蛋白、脂肽、細(xì)菌素、酚類(lèi)及多烯類(lèi)等多種抗菌物質(zhì)[3-4],是微生物代謝產(chǎn)物農(nóng)藥研發(fā)的重要資源菌,充分挖掘抗菌物質(zhì)基因可以為植物抗病育種和菌株定向遺傳改造提供基因資源。挖掘功能基因常規(guī)方法是由物質(zhì)到基因,即先對(duì)功能物質(zhì)進(jìn)行分離純化、鑒定,再克隆全基因進(jìn)行測(cè)序。組學(xué)技術(shù)的發(fā)展為尋找活性代謝產(chǎn)物基因提供了新方法。呂偉強(qiáng)等[5]通過(guò)對(duì)銀杏葉內(nèi)生菌KW-1-2的全基因組序列ORFs信號(hào)肽和分泌蛋白組合法預(yù)測(cè)分析,發(fā)現(xiàn)271個(gè)具有典型信號(hào)肽的分泌蛋白;楊曉玫等[6]通過(guò)對(duì)B.mycoidesGnyt1進(jìn)行全基因組測(cè)序,挖掘到促生功能相關(guān)的基因——鐵載體分泌相關(guān)功能基因;戚家明等[7]通過(guò)對(duì)生防菌株P(guān)F-1基因組測(cè)序,發(fā)現(xiàn)15種具有抗菌活性次級(jí)代謝產(chǎn)物基因簇;廖開(kāi)吉等[8]利用amtiSMASH對(duì)菌株FP1761次生代謝基因簇進(jìn)行預(yù)測(cè),發(fā)現(xiàn)兩個(gè)與嗜鐵素pyoverdine合成相關(guān)的基因簇。貝萊斯芽胞桿菌(Bacillusvelezensis)是近年來(lái)發(fā)現(xiàn)的一類(lèi)新型生防微生物,具有防病促生作用,受到國(guó)內(nèi)外研究者的廣泛關(guān)注[9-10]。貝萊斯芽胞桿菌HG18是1株低溫生防菌,抑菌譜廣,能夠分泌抗菌蛋白、脂肽、IAA等多種抗病促生物質(zhì),具有很好的開(kāi)發(fā)應(yīng)用潛力。本研究采用二、三代結(jié)合測(cè)序技術(shù)對(duì)其進(jìn)行基因組測(cè)序,挖掘抗菌相關(guān)功能基因,解析基因系統(tǒng)進(jìn)化性,為后續(xù)基因的克隆表達(dá)及功能驗(yàn)證、植物抗病育種以及提高原始菌株抗菌物質(zhì)產(chǎn)量的定向改造提供參考。
1.1.1 菌株 菌株BacillusvelezensisHG18是一株具有防病促生功能的生防菌,保存于黑龍江省科學(xué)院微生物研究所菌保中心。
1.1.2 培養(yǎng)基 LB培養(yǎng)基(g/L):胰蛋白胨10,酵母提取物5,NaCl 10,pH 7.2,蒸餾水1 000 mL。
1.1.3 主要試劑與儀器 基因組提取試劑盒(N2703,天根生化科技公司);DNA回收純化試劑盒(M2230,天根生化科技公司);瓊脂糖。超凈工作臺(tái)(ZHJH-C1115C,上海智城公司);恒溫振蕩培養(yǎng)器(ZHWY-211B,上海智城公司);臺(tái)式離心機(jī)(3K15,上海智城公司);恒溫培養(yǎng)箱(BPH-9082,上海一恒公司)。
1.2.1 基因組測(cè)序 由深圳華大基因公司完成測(cè)序,采用基于DNBSEQ二代測(cè)序平臺(tái)和Nanopore三代測(cè)序平臺(tái)相結(jié)合方法,分別構(gòu)建測(cè)序文庫(kù),進(jìn)行denovo測(cè)序。二代測(cè)序插入庫(kù)大小為270~300 bp,三代測(cè)序插入庫(kù)大小為20 kb。
1.2.2 序列數(shù)據(jù)處理 分別采用SOAPnuke 1.5.6和Porechop 0.2.4軟件對(duì)二代和三代測(cè)序數(shù)據(jù)進(jìn)行質(zhì)量控制,Kmer軟件校正,校正后的序列使用Unicycler v 0.4.7軟件拼裝。
1.2.3 基因組信息注釋 采用Glimmer 3.02軟件進(jìn)行組裝結(jié)果的基因預(yù)測(cè),RNAmmer 1.2、tRNAscan 1.3.1和Infernal軟件進(jìn)行非編碼RNA分析,通過(guò)Tandem Repeats Finder 4.04軟件預(yù)測(cè)串聯(lián)重復(fù)序列,并根據(jù)重復(fù)單元長(zhǎng)度及數(shù)目篩選出其中的微衛(wèi)星以及小衛(wèi)星序列?;贕O、KEGG、Swiss-Prot、COG、NR、CAZY等數(shù)據(jù)庫(kù)進(jìn)行基因功能注釋。
二代測(cè)序獲得高質(zhì)量Reads 6 952 326條,高質(zhì)量Reads堿基數(shù)為1 042 Mb,占比97.08%。三代測(cè)序序列長(zhǎng),過(guò)濾后的Reads 數(shù)為3 640 380條,堿基數(shù)為1 600 003 363 bp,最長(zhǎng)Reads 91 343 bp,最短Reads 2 000 bp,平均Reads長(zhǎng)度4 395 bp。二、三代測(cè)序數(shù)據(jù)質(zhì)量高,保證了后續(xù)分析的準(zhǔn)確性。
組裝測(cè)序數(shù)據(jù),進(jìn)行單堿基糾正、序列環(huán)狀、質(zhì)粒庫(kù)比對(duì)等分析,組裝成一個(gè)環(huán)狀染色體和一個(gè)環(huán)狀質(zhì)粒。染色體堿基數(shù)4 239 316 bp,GC含量43.58%;質(zhì)粒堿基數(shù)222 528 bp,GC含量37.25%。基因組大小4 461 844 bp,編碼4 643個(gè)基因,含有87個(gè)串聯(lián)重復(fù)序列,57個(gè)小衛(wèi)星DNA,6個(gè)微衛(wèi)星DNA,86個(gè)tRNA,25個(gè)sRNA,10個(gè)5S rRNA、16S rRNA和23S rRNA,2個(gè)CRISPR和9個(gè)Prophage,23個(gè)基因島。編碼基因總長(zhǎng)度3 893 994 bp,占基因組87.27%,GC含量44.06%,結(jié)果見(jiàn)表1。
表1 基因組信息
將基因在VFDB、ARDB、TREMBL、CAZY、IPR、SWISSPROT、COG、GO、KEGG、NR和T3SS數(shù)據(jù)庫(kù)中進(jìn)行比對(duì)和注釋?zhuān)Y(jié)果見(jiàn)表2。VFDB數(shù)據(jù)庫(kù)預(yù)測(cè)了204個(gè)致病菌毒力因子,其中22個(gè)與蛋白水解和轉(zhuǎn)錄調(diào)控相關(guān);ARDB數(shù)據(jù)庫(kù)預(yù)測(cè)了31個(gè)與氯霉素、萬(wàn)古霉素、鏈霉素、桿菌肽相關(guān)的抗性基因;CAZY注釋顯示有63個(gè)糖苷水解酶GHs,15個(gè)糖類(lèi)酯解酶CEs,36個(gè)糖基轉(zhuǎn)移酶GTs,7個(gè)多糖裂解酶PLs,2個(gè)輔助功能AAs,40個(gè)碳水化合物相關(guān)酶CBMs;TREMBL數(shù)據(jù)庫(kù)中注釋的4 401個(gè)基因中有980個(gè)功能未知;COG功能注釋中有228個(gè)基因功能未知(圖1A);GO功能注釋了2 588個(gè)基因,歸屬于細(xì)胞組分(cellular component)、分子功能(molecular function)和生物過(guò)程(biological process)3個(gè)部分(圖1B);KEGG分析顯示,62.70%基因參與碳水化合物、氨基酸、次級(jí)代謝產(chǎn)物、脂、糖原、能量、萜類(lèi)、聚酮類(lèi)、核苷酸和外源物質(zhì)降解代謝(圖1C)。
表2 基因注釋結(jié)果
圖1 菌株HG18基因組COG(A)、GO(B)和KEGG(C)分類(lèi)
基因功能分析發(fā)現(xiàn)6個(gè)與幾丁質(zhì)降解的相關(guān)基因,其中GL000617、GL001507和GL003599編碼糖苷水解酶18家族蛋白,能夠水解幾丁質(zhì)中的β-1,4糖苷鍵;GL000017和GL002074編碼幾丁質(zhì)裂解酶;GL003784編碼β-N-乙酰氨基葡萄糖苷酶,可協(xié)同幾丁質(zhì)內(nèi)切酶或幾丁二糖外切酶水解幾丁質(zhì)。KEGG分析沒(méi)有發(fā)現(xiàn)這些基因參與的具體代謝途徑,GO功能分析顯示這些基因參與碳水化合物代謝過(guò)程,發(fā)揮幾丁質(zhì)結(jié)合功能。系統(tǒng)進(jìn)化分析顯示這些基因與Bacillushalotolerans和Bacillussubtilis同源性較高,GL000017與B.halotoleransF41-3和B.halotoleransXH-1的肽聚糖結(jié)合蛋白基因同源性為100%,與B.halotoleransZB201702和B.subtilisKKD1同源性為99%。GL002074與B.halotoleransF41-3和B.halotoleransZB201702的幾丁質(zhì)結(jié)合蛋白基因同源性為100%,與B.halotoleransXH-1幾丁質(zhì)結(jié)合蛋白基因及B.subtilisKKD1裂解多糖單加氧酶基因同源性為99%。GL000617、GL001507和GL003599與上述4株菌的糖苷水解酶18家族基因同源性高,為99%~100%;GL003784與上述4株菌的β-N-乙酰氨基葡萄糖苷酶基因同源性較高,為99%。2個(gè)葡聚糖酶基因(GL001922和GL001988)和1個(gè)殼聚糖酶GL001299也與上述4株菌株的同源性較高。另外,發(fā)現(xiàn)1個(gè)編碼抗菌物質(zhì)subtilisin的基因GL001102,系統(tǒng)進(jìn)化分析其與B.subtilisKKD1和B.halotoleransF41-3同源性較高,為99%;1個(gè)編碼抗菌物質(zhì)bacillolysin基因GL001608,系統(tǒng)進(jìn)化分析與B.halotoleransZB201702和B.halotoleransP1同源性較高,為99%。還發(fā)現(xiàn)脂肽類(lèi)抗菌物質(zhì)芬芥素與表面活性素合成基因簇,芬芥素合成基因簇含有5個(gè)基因(FenB、FenA、FenE、FenD、FenC),全長(zhǎng)37 518 bp,表面活性素合成基因簇含有4個(gè)基因(srfAA、srfAB、srfAC、srfATE),全長(zhǎng)26 076 bp。結(jié)果見(jiàn)表3、圖2。
表3 抗菌功能基因注釋
圖2 部分抗菌功能基因系統(tǒng)進(jìn)化樹(shù)
貝萊斯芽胞桿菌HG18是一株能產(chǎn)生多種抗菌促生物質(zhì)的生防菌株,本研究對(duì)該菌株進(jìn)行全基因組測(cè)序,從分子水平挖掘抗菌功能基因,為后續(xù)基因的克隆表達(dá)及功能驗(yàn)證、植物抗病育種以及提高菌株抗菌物質(zhì)產(chǎn)量的定向改造提供參考。
幾丁質(zhì)、葡聚糖、殼聚糖是植物病原真菌細(xì)胞壁的主要成分,生防菌株能夠產(chǎn)生幾丁質(zhì)、葡聚糖與殼聚糖降解酶,降解真菌細(xì)胞壁使其失去生長(zhǎng)繁殖能力。幾丁質(zhì)酶是降解幾丁質(zhì)的主要酶,具有多樣性,不同微生物可以產(chǎn)生不同種類(lèi)的幾丁質(zhì)酶[11]。幾丁質(zhì)酶能夠破壞真菌菌絲生長(zhǎng),抑制真菌孢子萌發(fā)、芽管伸長(zhǎng),使芽管和附著胞解體,在真菌的生防過(guò)程中具有重要作用[12]。菌株HG18基因組中發(fā)現(xiàn)6個(gè)與幾丁質(zhì)降解相關(guān)基因(GL000617、GL001507、GL003599、GL000017、GL002074和 GL003784),GO和KEGG分析顯示具有降解幾丁質(zhì)功能,但基因序列與幾丁質(zhì)酶基因差異較大,推測(cè)這些基因可能編碼一些具有幾丁質(zhì)酶功能的未知蛋白,后續(xù)將對(duì)這些基因進(jìn)行功能驗(yàn)證。殼聚糖酶和葡聚糖酶具有抑制病原真菌生長(zhǎng)作用,Tomita[13]和Gao等[14]研究表明B.circulasmh-k1和B.cereusD-11產(chǎn)生的殼聚糖酶能夠抑制病原真菌生長(zhǎng),將mh-k1中的殼聚糖酶基因轉(zhuǎn)到水稻中,增強(qiáng)了水稻對(duì)稻瘟病的抵抗能力[15]。國(guó)惠[16]研究發(fā)現(xiàn)生防萎縮芽胞桿菌β-1,3-葡聚糖酶具有抑菌功能;李文鵬[17]從芽胞桿菌Bacillussp.HT-7中分離出葡聚糖酶,能夠防治棉花黃萎病。孫平平等[18]通過(guò)對(duì)貝萊斯芽胞桿菌L-1全基因組分析發(fā)現(xiàn),菌株L-1中含有合成fengycin、surfactin、bacillaene、bacillibactin等多種聚酮糖類(lèi)和肽聚糖抗性化合物的基因簇,以及能夠降解病原菌細(xì)胞壁的幾丁質(zhì)酶和β-1,3-葡聚糖酶相關(guān)的基因。本研究基于菌株HG18全基因組數(shù)據(jù),挖掘到6個(gè)幾丁質(zhì)降解相關(guān)基因,2個(gè)葡聚糖酶基因和1個(gè)殼聚糖酶基因,這些基因均與B.halotoleransXH-1、B.halotoleransZB201702、B.halotoleransF41-3和B.subtilisKKD1 同源性較高,這些基因的挖掘?yàn)榍捌谘芯堪l(fā)現(xiàn)的菌株抑制多種病原真菌的菌絲生長(zhǎng)和孢子萌發(fā)提供了參考。
芽胞桿菌能夠分泌細(xì)菌素和脂肽類(lèi)抗生素,細(xì)菌素subtilin和bacillolysin可以抑制病原細(xì)菌生長(zhǎng),脂肽類(lèi)抗生素表面活性素(Surfactin)、伊枯草菌素(Iturin)和芬芥素(Fengycin)能夠抑制植物病原真菌。菌株HG18基因組中含有細(xì)菌素subtilin和bacillolysin編碼基因,推測(cè)菌株具有抵抗病原細(xì)菌能力。另外,發(fā)現(xiàn)Surfactin和Fengycin合成基因簇,Surfactin基因簇大小與B.amylo-liquefaciensTF28相當(dāng),比B.amyloliquefaciensFZB42T小,F(xiàn)engycin基因簇小于B.amyloliquefaciensTF28,沒(méi)有發(fā)現(xiàn)Iturin合成基因簇,推測(cè)菌株具有分泌Surfactin和Fengycin的基因基礎(chǔ)。本研究基于基因組數(shù)據(jù)有限信息預(yù)測(cè)抗菌功能相關(guān)基因,對(duì)于這些基因的功能還需進(jìn)行下一步的驗(yàn)證。