和夢(mèng)穎 劉文彬 林震鳴 黎爾彤 汪潔 金小寶
(廣東藥科大學(xué)生命科學(xué)與生物制藥學(xué)院 廣東省生物活性藥物研究重點(diǎn)實(shí)驗(yàn)室,廣州 510006)
目前使用的大多數(shù)抗生素均來(lái)源于鏈霉菌,但是鏈霉菌分離得到的次級(jí)代謝產(chǎn)物大多是已知重復(fù)的[1]。目前關(guān)于稀有放線菌產(chǎn)生生物活性物質(zhì)的相關(guān)研究較少[2]。但已有研究從Mycobacteriumspecies分 離 獲 得asukamycin 和 apramycin[3], 從Amycolatopsis species分離獲得rifamorpholines 等抗生素[4]。因此,稀有放線菌的抗生素生產(chǎn)潛力未得到充分利用,值得進(jìn)一步深入研究[5]。
戈登氏菌是一種稀有放線菌。戈登氏菌常見(jiàn)應(yīng)用于產(chǎn)生類(lèi)胡蘿卜素[6],降解含油廢水[7],以及吸附重金屬等[8],而有關(guān)戈登氏菌抗菌活性和物質(zhì)的研究較少。課題組前期從蜚蠊腸道中分離得到15 株戈登氏放線菌,并從WA8-44 菌株中分離出Actinomycin D、Actinomycin X2、Collismycin A 等 對(duì)真菌和細(xì)菌都有活性的化合物[9];從菌株WA4-31中分離出Actinomycin X2、Mojavensin A 等有一定抗真菌、抗腫瘤活性的化合物等[10]。
自天藍(lán)色鏈霉菌完成全基因組測(cè)序以來(lái)[11],基因組測(cè)序技術(shù)與生物學(xué)信息分析技術(shù)越來(lái)越成熟,利用基因組挖掘可以幫助我們更好地預(yù)測(cè)編碼基因和基因功能,預(yù)測(cè)出次級(jí)生物合成基因簇?cái)?shù)量,具體基因功能以及與已知化合物同源性等。由于大多數(shù)基因在實(shí)驗(yàn)室常規(guī)條件下處于沉默狀態(tài),不表達(dá)或表達(dá)量低。除了常規(guī)的改變培養(yǎng)基參數(shù),如添加化學(xué)誘導(dǎo)劑,共培養(yǎng)等方法可以激活沉默基因簇外[12],在全基因組測(cè)序的基礎(chǔ)上,以基因組為導(dǎo)向的天然產(chǎn)物挖掘技術(shù),基因組挖掘技術(shù)避免了傳統(tǒng)挖掘方法的繁瑣和隨機(jī),大大增加了新型天然產(chǎn)物的發(fā)現(xiàn)概率。采用基因組挖掘分析其生物合成基因簇,添加啟動(dòng)子、異源表達(dá)等方法能更好地發(fā)現(xiàn)新天然產(chǎn)物,避免不必要的浪費(fèi)[13]。
本文在前期研究基礎(chǔ)上,選取一株具抗革蘭陽(yáng)性菌的菌株WA4-43 進(jìn)行全基因組測(cè)序,并分析其基因組數(shù)據(jù)和生物合成基因簇,為后續(xù)研究提供基礎(chǔ)。
1.1.1 實(shí)驗(yàn)菌株 菌株WA4-43 為本課題組前期從蜚蠊腸道中分離獲得并保存于本室。白色念珠菌(ATCC 10231)、耐甲氧西林金黃色葡萄球菌(ATCC 43300)、金黃色葡萄球菌(ATCC 25923)、枯草芽孢桿菌(ATCC 6633)、表皮葡萄球菌(ATCC 25989)、大腸埃希氏菌(ATCC 25922)、肺炎克雷伯氏菌(ATCC 13883)和銅綠假單胞菌(ATCC 25924)均購(gòu)置至于廣東省微生物研究所。
1.1.2 主要試劑及儀器 2×Taq PCR Master Mix,TaKaRa 公司;瓊脂糖凝膠,biowest 公司;EZUP 柱式細(xì)菌基因組DNA 抽提試劑盒,上海生工生物工程股份有限公司;T100TM PCR 儀,Bio-Rad 公司; LB培養(yǎng)基、PDA 培養(yǎng)基、PDB 培養(yǎng)基、高氏一號(hào)瓊脂培養(yǎng)基、ISP-1 和ISP-2 培養(yǎng)基均購(gòu)于廣東環(huán)凱微生物科技有限公司。
1.2.1 菌株WA4-43 培養(yǎng)及培養(yǎng)特征 將菌株WA4-43 接種于高氏一號(hào)固體平板上,28℃恒溫培養(yǎng)箱培養(yǎng) 5-8 d,觀察菌落形態(tài)、色素和產(chǎn)孢情況等特征,接種ISP-1,于28℃、180 r/min 搖菌 2 d。
1.2.2 16S rRNA 基因序列測(cè)定及系統(tǒng)發(fā)育分析 根據(jù)EZUP 柱式細(xì)菌基因組DNA 抽提試劑盒步驟提取菌株基因組DNA,使用16S rRNA 基因的通用引物27F(5′-AGAGTTTGATCMTGGCTCAG-3′)和1492R(5′-TACGGYTACCTTGTTAGGACTT-3′)[14]PCR 擴(kuò)增16S rRNA。PCR 反 應(yīng) 體 系(50 μL): DNA 模 板2 μL,2×Taq PCR Master Mix 25 μL, 引 物27F(10 μmol/L)和引物1492R(10 μmol/L)各 1 μL,ddH2O 21 μL。PCR 產(chǎn)物用1.0%瓊脂糖凝膠電泳檢測(cè)是否有相應(yīng)大小條帶,送至北京六合華大基因科技有限公司廣州分公司測(cè)序。測(cè)序結(jié)果進(jìn)行Blast 同源序列比對(duì),下載NCBI 數(shù)據(jù)庫(kù)中親緣較近的40 株不同種類(lèi)的戈登氏菌16S rRNA 基因核心序列,利用MEGA5.0[15]中的最大似然值法構(gòu)建系統(tǒng)發(fā)育樹(shù)。
1.2.3 菌株WA4-43 粗提物抗菌活性測(cè)定 接種ISP-1,于 28℃、180 r/min 搖菌 2 d,以5%的接種量接種ISP-2 發(fā)酵液,于28℃、180 r/min 發(fā)酵14 d。發(fā)酵液離心得到上清液,上清液分別使用乙酸乙酯和正丁醇萃取3 次,減壓濃縮。粗提物用甲醇配置成10 mg/mL 樣品備用。采用管碟法[16]測(cè)定樣品對(duì)耐甲氧西林金黃色葡萄球菌、金黃色葡萄球菌、枯草芽孢桿菌、表皮葡萄球菌、大腸埃希氏菌、肺炎克雷伯氏菌、銅綠假單胞菌和白色念珠菌的抑菌活性。
1.2.4 菌株WA4-43 全基因組測(cè)序與組裝 全基因組測(cè)序由北京百邁客生物科技有限公司完成。首先使用Canu v1.5[17]軟件組合裝配過(guò)濾后的subreads,再通過(guò)Racon v3.4.3 軟件對(duì)組裝的結(jié)果進(jìn)行矯正,后通過(guò)Circlator v1.5.5 軟件進(jìn)行環(huán)化和調(diào)整起始位點(diǎn),最后用Pilon v1.22 軟件進(jìn)一步進(jìn)行糾錯(cuò),以此來(lái)得到準(zhǔn)確度更高的基因組序列。
1.2.5 菌株WA4-43 的基因組組分分析與基因組功能注釋 使用Rfam[18]數(shù)據(jù)庫(kù)、tRNAscan-SE v2.0[19]軟 件、Nr[20]數(shù) 據(jù) 庫(kù)、GO[21]數(shù) 據(jù) 庫(kù)、eggNOG[22]數(shù)據(jù)庫(kù)、Pfam[23]數(shù)據(jù)庫(kù)、COG 數(shù)據(jù)庫(kù)[24]和KEGG[25]等數(shù)據(jù)庫(kù)對(duì)基因組序列進(jìn)行比對(duì)分析,獲得注釋信息以及功能;通過(guò)軟件Prodigal v2.6.3[26]動(dòng)態(tài)編程算法較準(zhǔn)確預(yù)測(cè)基因組中的編碼基因;使用antiSMASH v6.0.1[27]進(jìn)行菌株WA4-43 生物合成基因簇(biosynthetic gene clusters, BGCs)分析;利用PRISM 4[28]完成生物合成基因簇化合物的預(yù)測(cè)。
1.2.6 菌株WA4-43 的比較基因組分析 GenBank中下載2022年3月之前所有Gorclonia terrae菌屬全基因組數(shù)據(jù),進(jìn)行生物信息學(xué)分析。
菌株WA4-43 在高氏一號(hào)固體培養(yǎng)基上生長(zhǎng)良好,生長(zhǎng)周期7 d 左右。菌落呈粉橘色,表面干燥不透明,呈不規(guī)則小圓型。經(jīng)革蘭染色可見(jiàn),菌株WA4-43 為短小棒狀革蘭陽(yáng)性菌,掃描電鏡顯示菌絲呈短桿狀,無(wú)縱膈,如圖1 所示。
圖1 菌株WA4-43 菌株特征Fig. 1 Characteristics of strain WA4-43
2.2.1 菌株WA4-43 歸屬及系統(tǒng)發(fā)育樹(shù)的構(gòu)建 通過(guò)PCR 擴(kuò)增16S rRNA 基因并測(cè)序用于菌株WA4-43鑒定,PCR 擴(kuò)增產(chǎn)物經(jīng)測(cè)序?yàn)? 372 bp 的16S rRNA序列。將序列上傳至GenBank 數(shù)據(jù)庫(kù)中進(jìn)行Blast同源性比對(duì),選取較相似的40 個(gè)戈登氏菌代表性菌株多序列比對(duì),利用MEGA 5.0 中的最大似然值法構(gòu)建系統(tǒng)發(fā)育樹(shù)結(jié)果,如圖2 所示。結(jié)果表示該菌株與G. terraestrain DSM 43249 處于同一分支,其16S rRNA 基因相似度為100%,與G. lacunaestrain BS2 基因相似度為98.91%,結(jié)合菌株生理生化特征[29-30](表1)和16S rRNA 基因分析,初步鑒定菌株WA4-43 為Gordonia terrae。
表1 菌株WA4-43 生理生化特征Table 1 Physiological and biochemical characteristics of strain WA4-43
圖2 菌株WA4-43 系統(tǒng)發(fā)育樹(shù)Fig. 2 Phylogenetic tree of strain WA4-43
2.2.2 菌株WA4-43 次級(jí)代謝產(chǎn)物抗菌活性初步測(cè)定 菌株WA4-43 乙酸乙酯部位對(duì)4 種革蘭陽(yáng)性菌:耐甲氧西林金黃色葡萄球菌、金黃色葡萄球菌、枯草芽孢桿菌和表皮葡萄球菌均有抑制作用(圖3),抑菌圈分別為(19.0±0.47)cm、(19.7±1.25)cm、(21.0±0.82)cm、(15.0±0.47)cm。菌株乙酸乙酯粗提物對(duì)大腸埃希氏菌、肺炎克雷伯氏菌、銅綠假單胞菌和白色念珠菌無(wú)活性。此外菌株正丁醇部位對(duì)上述菌株均無(wú)活性。
2.2.3 菌株WA4-43 全基因組測(cè)序與分析 將菌株WA4-43 全基因序列上傳至GenBank 獲得登錄號(hào):CP084736.1。菌株WA4-43 基因全長(zhǎng)5 438 735 bp,含有Contig 數(shù)量1 個(gè),Contig N50 為5 438 735 bp,Contig N90 為5 438 735 bp,GC 含量為67.76%,基因組中包含4 963 個(gè)蛋白編碼基因,其余數(shù)據(jù)庫(kù)注釋基因如表2 所示。非編碼RNA 常具有特殊的二級(jí)結(jié)構(gòu),其中rRNA 9 個(gè),包括23S rRNA 3 個(gè),5S rRNA 3 個(gè),16S rRNA 3 個(gè);tRNA49 個(gè);other ncRNA 40 個(gè)。
表2 菌株WA4-43 功能注釋的基因數(shù)量和大小Table 2 Number and size of functionally annotated genes in strain WA4-43
利用菌株WA4-43 全基因序列預(yù)測(cè)得到的tRNA、rRNA、重復(fù)序列、GC 含量等信息,制作基因組圈圖如圖4 所示,可視化地看出基因組各組分在全基因組上的各種位置關(guān)系。
圖4 菌株WA4-43 基因組圈圖Fig. 4 Genome circle map of strain WA4-43
2.3.1 GO 功能注釋 在菌株WA4-43 中,有3 563個(gè)基因在GO數(shù)據(jù)庫(kù)得到注釋?zhuān)⑨尳Y(jié)果包含三大類(lèi),細(xì)胞組分(cellular component)、分子功能(molecular function)、生物過(guò)程(biological process),分析基因組各種功能注釋信息,如圖5 所示。藍(lán)色: 細(xì)胞組分;紅色: 分子功能;綠色: 生物過(guò)程。在細(xì)胞組分分類(lèi)中共有9 類(lèi)功能基因得到注釋?zhuān)渲谢虮壤^大的為membrane 和membrane part。在分子功能
圖5 菌株WA4-43 基因組GO 功能注釋Fig. 5 GO functional annotation on the genome of strain WA4-43
分類(lèi)類(lèi)別中共有11 類(lèi)基因得到注釋?zhuān)瑓⑴ccatalytic activity 和binding 的獨(dú)立基因比較多。在生物過(guò)程這個(gè)分子功能中,有10 類(lèi)基因得到注釋?zhuān)渲袇⑴cmetabolic process、cellular process 和single-organism process 過(guò)程的獨(dú)立基因較多。
2.3.2 KEGG 功能注釋 菌株WA4-43 共有1 870 個(gè)基因在KEGG 數(shù)據(jù)庫(kù)中得到注釋?zhuān)鐖D6 所示,紅色,生物遺傳信息;紫色,環(huán)境因素;綠色,新陳代謝。共有3 大類(lèi)代謝通路分別為genetic information processing、environmental information processing 和metabolism,分別有5、2、41 個(gè)小類(lèi)。主要參與ribosme(59 kos),abc transporters(106 kos),biosynthesis of amino acids(129 kos)等代謝過(guò)程。
圖6 菌株WA4-43 基因組KEGG 的功能注釋Fig. 6 KEGG functional annotation of strain WA4-43 genome
2.3.3 COG 功能注釋 通過(guò)將菌株WA4-43 基因信息于COG 數(shù)據(jù)庫(kù)進(jìn)行比對(duì),共有4 178 個(gè)基因獲得注釋?zhuān)灿?2 類(lèi),如圖7 所示,其中function unknown 和general function prediction only 類(lèi) 別 基 因數(shù)量最多分別為1 069 個(gè)和417 個(gè),占注釋基因的25.22%和9.84%。其余功能基因占比較高的、大于5% 的 分 類(lèi) 有energy production and conversion(253個(gè),占比5.97%)、amino acid transport and metabolism(271 個(gè),占比6.39%)、lipid transport and metabolism(224 個(gè),占比5.29%)、transcription(321 個(gè),占比7.57%)、replication,recombination and repair(283 個(gè),占 比6.68%)、inorganic ion transport and metabolism(232 個(gè),占比5.47%)。占比較少的類(lèi)別為RNA processing and modification(1 個(gè),占比0.02%)、cytoskeleton(1 個(gè),占比0.02%)。
圖7 菌株WA4-43 基因組COG 功能注釋Fig. 7 Functional annotation of COG in the genome of strain WA4-43
2.3.4 次級(jí)代謝基因簇預(yù)測(cè) 使用軟件AntiSMASH對(duì)菌株WA4-43 全基因組數(shù)據(jù)進(jìn)行分析,如表3 所示,菌株WA4-43 有13 個(gè)次級(jí)代謝生物合成基因簇,包括四氫嘧啶類(lèi)(ectoine)、萜烯類(lèi)(terpene)、非核糖體多肽類(lèi)(NRPS)、鐵載體(siderophore)、核糖體合成和翻譯后修飾肽(RiPPs)等,共預(yù)測(cè)到6 種可能的次級(jí)代謝產(chǎn)物,其中,同源性大于等于75%的次級(jí)代謝基因簇預(yù)測(cè)產(chǎn)物的有ectoine;同源性低于75%的預(yù)測(cè)產(chǎn)物有SF2575、ishigamide、oxalomycin B、kanglemycin A / kanglemycin V1/kanglemycin V2 和desferrioxamine。
表3 菌株WA4-43 基因組中次級(jí)代謝基因簇的預(yù)測(cè)Table 3 Prediction of secondary metabolic gene clusters in the genome of strain WA4-43
基因簇使用軟件PRISM 4 可以預(yù)測(cè)出BGC4、5、6、7、11、12 化合物分子式,如圖8 所示。
圖8 菌株WA4-43 生物合成基因簇化合物預(yù)測(cè)Fig. 8 Prediction of biosynthetic gene cluster compounds of strain WA4-43
BGC10 中包含核心生物合成基因1 個(gè),轉(zhuǎn)運(yùn)基因2 個(gè),額外生物合成基因1 個(gè),其他基因3 個(gè),如表4 所示,其中核心生物合成基因GE002626 全長(zhǎng)810 bp,通過(guò)Blast 對(duì)菌株WA4-43 蛋白序列與Nr數(shù)據(jù)庫(kù)進(jìn)行比對(duì),該基因與Nocardia farcinica中對(duì)應(yīng)基因相似,GO 數(shù)據(jù)庫(kù)分析顯示其生物過(guò)程與蛋白質(zhì)水解有關(guān),也與細(xì)菌的防御反應(yīng)有關(guān);分子功能與肽酶活性有關(guān)。
表4 BGC10 基因預(yù)測(cè)及數(shù)據(jù)庫(kù)分析Table 4 BGC10 gene prediction and database analysis
2.3.5 比較基因組分析 將菌株WA4-43 與9 株G.terrae全基因序列進(jìn)行比對(duì)分析,它們基因組大小范圍為:5.17-5.71 Mb,其中基因組最大的為土壤來(lái)源的G. terraeNCTC10669 和G. terraeNRRL B-16283,最小的為G. terraeC-6;編碼蛋白范圍為:4 480-5 007 個(gè),GC 含量范圍為:67.7%-68%,均低于70%,其中GC 含量最高的為G. terraeK,最低的為G.terraeUMB0777。多數(shù)G. terrae為環(huán)狀染色體,包括G.terraeWA4-43、G. terraeNCTC10669、G. terraeNRRL B-16283 等,如表5 所示。
經(jīng)antiSMASH 預(yù) 測(cè) 和 分 析,10 株G. terrae次級(jí)代謝基因簇類(lèi)型較少,但同源性均非常低。有154 個(gè)次級(jí)代謝基因簇,83 個(gè)次級(jí)代謝基因簇預(yù)測(cè)有已知化合物,如表5 所示,每個(gè)菌株都有RiPPlike 類(lèi)化合物分別為pimaricin 和kanglemycin A /kanglemycin V1 / kanglemycin V2,都 有NRPS 類(lèi) 的ishigamide 和ectoine 類(lèi)的ectoine。
表5 10 種Gordonia terrae 基因組特征比對(duì)Table 5 Comparison of genomic characteristics of 10 Gordonia terrae species
比較G. terrae與6 種其他類(lèi)型的戈登氏菌,可以看出,所有戈登氏菌均有ectoine 類(lèi)的ectoine 同源性為75%,其他專(zhuān)有的預(yù)測(cè)化合物有,G. namibiensis有NRPS 類(lèi)的atratumycin 同源性為7%,有PKS 類(lèi)的GE81112 同 源 性 為7%;G. lacunae有NRPS 類(lèi)的mycobactin 和glycinocin 同 源 性 分 別 為30% 和4%;G. ankookensis有NRPS 類(lèi) 的pepticinnamin E 和pyxidicycline A、pyxidicycline B 同源性分別為10%和6%等,如圖9 所示。
圖9 AntiSMASH 預(yù)測(cè)Gordonia 生物合成基因簇Fig. 9 Predicting the Gordonia biosynthetic gene cluster by AntiSMASH
戈登氏菌次級(jí)代謝產(chǎn)物首次發(fā)現(xiàn)僅抗革蘭陽(yáng)性菌。通過(guò)菌株WA4-43 全基因測(cè)序分析及antiSMASH次級(jí)代謝產(chǎn)物合成基因簇預(yù)測(cè),可以知道菌株WA4-43 較鏈霉菌基因組較小,次級(jí)代謝產(chǎn)物基因簇種類(lèi)數(shù)量較少[31],有7 個(gè)假定基因簇,預(yù)測(cè)基因簇與已知分離出化合物合成基因簇相似度均小于等于75%,表明菌株WA4-43 有研究意義,具有合成新穎化合物的潛力。
BGC1 與四氫嘧啶類(lèi)型的ectoine 的相似性為75%,ectoine 是重要的應(yīng)對(duì)外界環(huán)境變化的相容性 溶 質(zhì)[32];BGC2 與萜烯類(lèi)型 的SF2575相似性為6%,SF2575 對(duì)多種癌細(xì)胞系具有抗癌活性,可以抑制DNA 拓?fù)洚悩?gòu)酶[33]; BGC9 與萜烯類(lèi)型的oxalomycin B 相似性為6%,oxalomycin B 具有抗腫瘤,抗病毒的作用,以及關(guān)于HIV 抑制劑方面的研究[34];BGC12 與非核糖體多肽類(lèi)、鐵載體類(lèi)型的desferrioxamine 相似性33%等[35];BGC10 核糖體合成和翻譯后修飾肽類(lèi)型的Kanglemycin A/kanglemycin V1 /kanglemycin V2[36],相似性為5%,預(yù)測(cè)化合物最早由Amycolatopsis vancoresmycinaDSM 44592 菌株產(chǎn)生,是利福平同系物,對(duì)金黃色葡萄球菌、表皮葡萄球菌、單核細(xì)胞增生李斯特菌等革蘭氏陽(yáng)性菌有抑制活性,與菌株WA4-43 乙酸乙酯粗提物活性相似,但是同源性低,提示菌株有發(fā)現(xiàn)新抗革蘭陽(yáng)性菌藥物的潛能。這些基因簇同源性均很低,預(yù)測(cè)到至少有3 種抗生素。
10 株G. terrae共有48 473 個(gè)蛋白編碼基因,其核心基因可能涉及菌體的基礎(chǔ)代謝以及適應(yīng)環(huán)境等來(lái)維持其基本生命特征。如菌株WA4-43 COG 數(shù)據(jù)庫(kù)分析所示,多為未知功能,提示菌種具有新穎性,多參與轉(zhuǎn)錄、DNA 復(fù)制、結(jié)合和修復(fù)、氨基酸轉(zhuǎn)運(yùn)與代謝、能源的產(chǎn)生交換、無(wú)機(jī)離子運(yùn)輸與代謝等使菌株具有基礎(chǔ)的代謝和轉(zhuǎn)運(yùn)功能,使細(xì)菌適應(yīng)環(huán)境來(lái)維持最基本的生命特征。G. terrae菌株之間次級(jí)代謝基因簇的差異可能與它們生活環(huán)境不同有關(guān),是它們適應(yīng)不同生長(zhǎng)環(huán)境的表現(xiàn)。
比較不用類(lèi)型的戈登氏菌,其中RiPP-like 類(lèi)型 的pimaricin、kanglemycin A /kanglemycin V1/kanglemycin V2 至少有一個(gè),pimaricin 對(duì)霉菌、酵母菌和真菌都有極強(qiáng)的抑制能力,但對(duì)細(xì)菌、病毒等其他微生物沒(méi)有抑制作用[37],因?yàn)镻iPP 類(lèi)型天然產(chǎn)物是由遺傳編碼的前體肽及其同源修飾酶組成的[38],可能說(shuō)明RiPP-like 類(lèi)型的化合物可能決定戈登氏菌的抗菌專(zhuān)一性;特殊預(yù)測(cè)化合物一般是NRPS 類(lèi)型,如NRPS 類(lèi) ishigamideG. terrae中均有且同源性為11%、5 株有NRPS 類(lèi)oxalomycin B 而其他幾類(lèi)戈登氏菌沒(méi)有,說(shuō)明這兩個(gè)基因簇有區(qū)別于其他菌株的特性,有研究意義。
菌株WA4-43 是首次發(fā)現(xiàn)的具有抗革蘭陽(yáng)性菌戈登氏菌。該菌株生物合成基因簇新穎,具有合成獨(dú)特結(jié)構(gòu)化合物的潛能。前期研究發(fā)現(xiàn)菌株次級(jí)代謝產(chǎn)物產(chǎn)量較低,提示我們后續(xù)可通過(guò)異源表達(dá)等手段進(jìn)行天然產(chǎn)物的研究。