徐瑞波,劉 旭,李偉程,沈 馨,張和平*
(1 內(nèi)蒙古農(nóng)業(yè)大學(xué) 乳品生物技術(shù)與工程教育部重點(diǎn)實驗室 呼和浩特 010018 2 內(nèi)蒙古農(nóng)業(yè)大學(xué) 農(nóng)業(yè)農(nóng)村部奶制品加工重點(diǎn)實驗室 呼和浩特 010018 3 內(nèi)蒙古農(nóng)業(yè)大學(xué) 內(nèi)蒙古乳業(yè)生物技術(shù)與工程重點(diǎn)實驗室 呼和浩特 010018)
鼠李糖乳桿菌(Lactobacillus rhamnosus)是厚壁菌門乳桿菌科的一種革蘭氏陽性桿狀細(xì)菌。鼠李糖乳桿菌廣泛存在于嬰兒糞便樣本以及人類母乳中[1],這些細(xì)菌通常對消化道中的條件具有耐受性(即低pH 值、膽鹽、厭氧條件)[2]。國內(nèi)外大量研究發(fā)現(xiàn),鼠李糖乳桿菌具有調(diào)節(jié)腸道菌群[3],調(diào)節(jié)腸道免疫[4-7],抗氧化[8]、抑制生物毒素[9],抑制致病菌[10-11]和調(diào)控脂肪細(xì)胞分化[12]等功能。據(jù)報道,在新生兒中使用某些鼠李糖乳桿菌菌株,特別是鼠李糖乳桿菌GG,可促進(jìn)早產(chǎn)和低出生體重新生兒的生長[13-14]。
前期研究[15]從40 份人初乳樣品中分離出有活性的益生菌菌株——鼠李糖乳桿菌Probio-M9,該菌株在人工胃腸液中消化11 h 后的存活率為78.33%,在中國具有自主知識產(chǎn)權(quán),推測更適合中國人和其他亞洲人,因此本文對該菌株做后續(xù)安全性評估、動物實驗和全基因組測序等研究具有參考價值。
比較基因組學(xué)是從基因水平比較不同物種的基因組序列,從而了解其基因的功能、表達(dá)機(jī)制及物種進(jìn)化的學(xué)科[16]。Sun 等[17]通過比較基因組學(xué)對213 株乳桿菌屬進(jìn)行分析,系統(tǒng)解析了乳桿菌屬不同譜系的遺傳進(jìn)化歷程,發(fā)現(xiàn)所有的乳桿菌都是由一個共同的祖先進(jìn)化而來的。Yu 等[18]通過核心基因比對分析乳酸乳球菌、植物乳球菌等若干乳球菌屬的核心基因,解析乳球菌屬內(nèi)的遺傳進(jìn)化關(guān)系,發(fā)現(xiàn)乳球菌屬在基因組大小,基因含量和碳水化合物代謝方面具有高度多樣性。孫靚[19]通過比較基因組學(xué)分析兩株鼠李糖乳桿菌,結(jié)果發(fā)現(xiàn)鼠李糖乳桿菌基因組層面的斷裂基因和轉(zhuǎn)錄組層面的丙酮酸代謝途徑上表達(dá)的差異,可能是鼠李糖乳桿菌高產(chǎn)L-乳酸的原因。比較基因組學(xué)能有效分析、挖掘和利用微生物基因組各個層面信息,能夠準(zhǔn)確且快速地研究菌種的同源基因以及特有功能。
目前對來源于母乳的菌株研究較少。特別是在中國,關(guān)于從人乳中分離得到的鼠李糖乳桿菌的研究報道更少,而關(guān)于母乳分離株鼠李糖乳桿菌的比較基因組研究更是少之又少。本研究將以母乳分離株鼠李糖乳桿菌Probio-M9 結(jié)合NCBI Refseq 數(shù)據(jù)庫下載的214 株鼠李糖乳桿菌基因組序列為研究對象,通過比較基因組學(xué)解析不同菌株基因特征及種內(nèi)基因差異,了解其遺傳進(jìn)化機(jī)制,為鼠李糖乳桿菌Probio-M9 開發(fā)利用提供參考。
鼠李糖乳桿菌Probio-M9 由內(nèi)蒙古農(nóng)業(yè)大學(xué)乳酸菌菌種資源庫(Lactic acid bacteria collection center,LABCC)提供。
截止2021年4月17日,已將NCBI(National Coalition Building Institute,https://www.ncbi.nlm.nih.gov/)Refseq 數(shù)據(jù)庫中214 株鼠李糖乳桿菌基因序列以及一株暫未公開的鼠李糖乳桿菌Probio-M9 全部下載完成。
菌株鼠李糖乳桿菌Probio-M9 的培養(yǎng)具體操作步驟如下:將該菌接種到37 ℃的MRS 液體培養(yǎng)基中,無氧條件培養(yǎng)24 h 后進(jìn)行傳代,最后使用PBS 緩沖液將3 代菌泥中廢棄培養(yǎng)基去除,然后進(jìn)行全基因組DNA 的提取。全基因組DNA 提取方法參考鐘智等[20]的方法。將提取的DNA 通過1%瓊脂糖凝膠電泳進(jìn)行完整度和純度檢測,將符合要求的高質(zhì)量DNA 按照PacBio SMRT 全基因組DNA 建庫流程建立10 kb 文庫,建庫后根據(jù)PacBio SMRT RS II 測序平臺上機(jī)流程進(jìn)行全基因組測序。
將測序所得原始數(shù)據(jù)進(jìn)行質(zhì)量評估[21],去掉低質(zhì)量測序序列和接頭,使用RS_HGAP_Assembly.3 軟件對鼠李糖乳桿菌Probio-M9 序列進(jìn)行質(zhì)控和基因組組裝,并使用Circlator(V1.5.5)[22]軟件對3 代數(shù)據(jù)進(jìn)行環(huán)化,最后獲得Probio-M9 的全基因序列。
1.5.1 泛-核心基因集構(gòu)建 利用Prokka[23]軟件對菌株基因組進(jìn)行基因預(yù)測后,采用Roary[24]軟件對核心基因集、泛基因集進(jìn)行識別。
1.5.2 系統(tǒng)發(fā)育樹構(gòu)建 使用經(jīng)Roary 軟件分析得到的核心基因序列,通過TreeBest 軟件(http://www.mybiosoftware.com/treebest)構(gòu)建鄰接系統(tǒng)發(fā)育樹(Neighbor-Joining,NJ)。使用iTol 在線軟件對系統(tǒng)發(fā)育樹進(jìn)行可視化(http:// https://itol.embl.de/)[25]。
1.5.3 平均核苷酸一致性(Average nucleotide identity,ANI)計算 本研究參考Jain 等[26]報道的fastANI(https://github.com/ParBLiSS/FastANI)計算215 株鼠李糖乳桿菌的菌株間ANI 值。利用TBtools[7]軟件繪制ANI 聚類熱圖。
1.5.4 全基因組圈圖和功能基因組分析 將215株鼠李糖乳桿菌核酸序列文件分別上傳至RAST(Repaid Annotion using Subsystem Technology,http://rast.nmpdr.org/rast.cgi)進(jìn)行注釋,并下載對應(yīng)的基因功能注釋文件。將鼠李糖乳桿菌Probio-M9 的功能基因注釋文件上傳至CGView Server(http://stothard.afns.ualberta.ca/cgview_server/)進(jìn)行圈圖繪制。
1.5.5 碳水化合物活性酶 將組裝完成的鼠李糖乳桿菌Probio-M9 全基因組序列上傳至在線注釋dbCAN 平臺中(http://bcb.unl.edu/dbCAN2/)進(jìn)行注釋,下載其注釋文件。統(tǒng)計鼠李糖乳桿菌Probio-M9 基因組信息。
對樣品鼠李糖乳桿菌Probio-M9 測序數(shù)據(jù)進(jìn)行評估組裝后,拼接成完整的基因組圈圖(圖1),并統(tǒng)計鼠李糖乳桿菌所有菌株的基因組信息。鼠李糖乳桿菌Probio-M9 組裝后,基因組大小為2 987 632 bp,GC 含量為46.76%,包含2 934 個蛋白質(zhì)編碼區(qū)(Coding sequence,CDS)、60 個tRNA、75 個RNA。215 株鼠李糖乳桿菌基因組大?。?.97±0.11)Mbp,GC 含量為(46.68±0.016)%,CDS為(2 671±130)個。
圖1 鼠李糖乳桿菌Probio-M9 全基因組圈圖Fig.1 The whole genome circle-map of L.rhamnosus Probio-M9
一個物種泛基因組主要由核心基因組、非必須基因組以及特有基因組3 部分組成[28]。215 株鼠李糖乳桿菌共識別到16 915 個泛基因,247 個核心基因,并且215 株鼠李糖乳桿菌核心基因占平均CDS 為9.2%,揭示鼠李糖乳桿菌存在一個較大的泛基因組,但是擁有一個較小的核心基因組。鼠李糖乳桿菌的泛-核心基因統(tǒng)計結(jié)果如圖2所示,核心基因隨著基因組的增加整體呈現(xiàn)一個先下降后趨于穩(wěn)定的狀態(tài)而泛基因組大小整體呈現(xiàn)上升趨勢,表明鼠李糖乳桿菌的泛基因組尚且處于一個相對開放的狀態(tài),與Kant 等[29]的研究結(jié)果基本一致。
圖2 泛-核心基因集變化(a)和新基因集變化(b)趨勢圖Fig.2 The trend chart of the size of pan-core genes(a)and new genes(b)
系統(tǒng)發(fā)育樹可直觀反映菌株間群體結(jié)構(gòu)和遺傳進(jìn)化關(guān)系。為了研究鼠李糖乳桿菌種內(nèi)遺傳進(jìn)化關(guān)系,本研究基于215 株鼠李糖乳桿菌(包含模式菌株鼠李糖乳桿菌DSM20021T=鼠李糖乳桿菌NBRC3425T=鼠李糖乳桿菌JCM1136T、鼠李糖乳桿菌NRRL B-442T),采用鄰接法,基于247 個核心基因通過1 000 次的引導(dǎo)迭代,構(gòu)建系統(tǒng)發(fā)育樹。
由圖3 可知,215 株乳酸菌主要分為7 大分支,分別命名為分支Ⅰ、分支Ⅱ、分支Ⅲ、分支Ⅳ、分支Ⅴ、分支Ⅵ和分支Ⅶ。由圖可知,分支Ⅱ是該樹最大的分支且鼠李糖乳桿菌Probio-M9 和模式菌株均在該分支中,并且該分支各菌株之間的遺傳關(guān)系近、差異很小、區(qū)分難度大。同時根據(jù)系統(tǒng)發(fā)育樹外圈注釋發(fā)現(xiàn),鼠李糖乳桿菌的遺傳關(guān)系與分離源和分離地相關(guān)性不明顯。
圖3 基于核心基因的系統(tǒng)發(fā)育樹Fig.3 Phylogenetic tree based on core genes
ANI 是通過比對基因組的同源序列以鑒定菌株親緣關(guān)系[30]。在比較基因組學(xué)分析過程中,ANI可用于評估基因組間多態(tài)性的程度,也可基于基因組序列進(jìn)行物種鑒別,一般認(rèn)為ANI 值大于95%即為同一物種[31]。2018年Ciufo 等[32]將95%的閾值改為96%,并以此作為物種邊界。
為解析鼠李糖乳桿菌遺傳多樣性,本研究對215 株鼠李糖乳桿菌進(jìn)行兩兩之間ANI 計算,并構(gòu)建聚類熱圖,結(jié)果如圖4所示,全部菌株之間ANI 值均大于96.38%,鼠李糖乳桿菌菌株之間具有較高的總體序列同一性(>96%),這與Nissila等[33]和Arnold 等[34]的研究結(jié)果一致,提示鼠李糖乳桿菌種內(nèi)的相似度較高。
圖4 平均核酸一致性Fig.4 Average nucleotide identity
由于分支Ⅱ是系統(tǒng)發(fā)育樹最大分支且鼠李糖乳桿菌Probio-M9 和模式菌株均在該分支中,因此利用RAST 在線工具對分支Ⅱ中98 株鼠李糖乳桿菌菌株進(jìn)行RAST 注釋,結(jié)果如圖5所示。在鼠李糖乳桿菌基因組中注釋到碳水化合物代謝(Carbohydrates)、蛋 白 質(zhì) 代 謝(Protein metabolism)、氨基酸及其衍生物(Amino acids and derivatives)、細(xì)胞壁和被膜(Cell wall and capsule)、DNA 代謝(DNA metabolism)、RNA 代謝(RNA metabolism)和應(yīng)激反應(yīng)(Stress response)等,共計26 個功能類別。其中占比最大的是“碳水化合物代謝”,其次是“蛋白質(zhì)代謝”和“氨基酸及其衍生物”。根據(jù)RAST 注釋發(fā)現(xiàn)菌株Lrh44、CRL1505、Lactobacillus rhamnosus、KF7、BIOML -A4、Lrh26、Lrh25、AMC010、1019 在硫代謝方面要顯著高于鼠李糖乳桿菌Probio-M9,而其它菌株與鼠李糖乳桿菌Probio-M9 呈現(xiàn)一種高度相似,從RAST 注釋無法找到差異。
圖5 RAST 注釋Fig.5 RAST annotation
本文以RAST 注釋中與鼠李糖乳桿菌Probio-M9 差異明顯的3 株菌和一株模式菌株鼠李糖乳桿菌DSM20021T為研究對象,通過BRIG 軟件進(jìn)行分析,結(jié)果如圖6所示,參考菌株鼠李糖乳桿菌Probio-M9 與模式菌株鼠李糖乳桿菌DSM20021T 匹配度最高為100%,最低為63.31%。約有344 bp 和293 bp 基因組片段匹配度大于等于90%,占總片段長度的22.21%;分析發(fā)現(xiàn)477 bp 和613 bp 基因片段匹配度小于70%,約占總片段的3.08%。鼠李糖乳桿菌Probio-M9 注釋到12個特有基因(見表1),主要負(fù)責(zé)自身代謝、轉(zhuǎn)錄、運(yùn)輸?shù)确矫娴恼{(diào)控。圖中白色部分是核苷酸同一性小于50%的區(qū)域,主要包括編碼應(yīng)激蛋白、生物合成相關(guān)蛋白、假定蛋白和噬菌體相關(guān)蛋白等多種蛋白質(zhì)的基因,而這些蛋白質(zhì)小范圍的插入與缺失可以使菌株基因組結(jié)構(gòu)多樣化[35-37]。
圖6 以鼠李糖乳桿菌Probio-M9 為參考基因組的Brig 分析Fig.6 Brig analysis based on L.rhamnosus Probio-M9 as reference genome
表1 鼠李糖乳桿菌Probio-M9 特有基因Table 1 L.rhamnosus Probio-M9 specific gene
同時又選取了2 株益生菌明星菌株鼠李糖乳桿菌GG、鼠李糖乳桿菌HN001 和一株模式菌株鼠李糖乳桿菌 DSM20021 與鼠李糖乳桿菌Probio-M9 進(jìn)行BRIG 分析(如圖7),結(jié)果如表2所示,鼠李糖乳桿菌Probio-M9 相較于市面上的益生菌明星菌株編碼更多的關(guān)于水解、還原相關(guān)酶類,同時還發(fā)現(xiàn)鼠李糖乳桿菌Probio-M9 編碼一個特別的基因(xly),與黃原膠裂解酶相關(guān)[38],黃原膠裂解酶是一種黃原膠修飾酶,對黃原膠的改性及新型黃原膠寡糖的制備具有十分重要的意義。
表2 以鼠李糖乳桿菌Probio-M9 為參考基因組的功能基因組分析Table 2 Functional genome analysis using L.rhamnosus Probio-M9 as a reference genome
圖7 以鼠李糖乳桿菌Probio-M9 為參考基因組的全基因組圈圖Fig.7 Genome-wide cycle map with the reference genome of L.rhamnosus Probio-M9
本研究基于Roary 軟件注釋到鼠李糖乳桿菌Probio-M9 含有與益生特性相關(guān)的基因,具體信息見表3。鼠李糖乳桿菌Probio-M9 含有谷胱甘肽合成(gshAB)、分泌胞外多糖(rmlA~rmlD、epsH)及核黃素合成(ribF)相關(guān)基因,同時含有耐酸基因(clpP)。研究表明[39],谷胱甘肽是細(xì)胞內(nèi)調(diào)節(jié)代謝的重要物質(zhì),并且常參與腸黏膜的抗氧化機(jī)制,保護(hù)腸道免受組織損傷,提高有益菌株在胃腸道中的存活率。鼠李糖乳桿菌EPS 具有益生元、調(diào)節(jié)機(jī)體免疫功能、抗氧化效應(yīng)、抑制動物脂肪生成和吸收重金屬等生理功能[40-43]。本研究還發(fā)現(xiàn),鼠李糖乳桿菌Probio-M9 存在提高宿主代謝能力(tagE)和產(chǎn)乳酸(ldh)相關(guān)的基因,可提高菌株益生特性。本研究利用比較基因組學(xué)從基因水平揭示了鼠李糖乳桿菌Probio-M9 具有多個益生特性相關(guān)基因,認(rèn)為其是一株具有潛在益生功能的菌株。
表3 鼠李糖乳桿菌Probio-M9 具有的益生特性相關(guān)基因Table 3 Genes related to probiotic properties of L.rhamnosus Probio-M9
本研究以鼠李糖乳桿菌Probio-M9 為例,結(jié)合NCBI 數(shù)據(jù)庫214 株鼠李糖乳桿菌基因組序列進(jìn)行比較基因組學(xué)研究。215 株鼠李糖乳桿菌通過247 個核心基因構(gòu)建系統(tǒng)發(fā)育樹發(fā)現(xiàn)分離源和分離地不存在明顯聚類趨勢。鼠李糖乳桿菌Probio-M9 處在分支最大的分支Ⅱ中,該分支各菌株之間的遺傳關(guān)系近、差異很小、區(qū)分難度大。然后對分支Ⅱ中98 株鼠李糖乳桿菌進(jìn)行RAST 注釋分析發(fā)現(xiàn),鼠李糖乳桿菌雖在功能方面整體存在高度的相似性,但其中部分菌株與鼠李糖乳桿菌Probio-M9 依然存在著一定差異,鼠李糖乳桿菌Probio-M9 相較于其它鼠李糖乳桿菌有著關(guān)于自身代謝、轉(zhuǎn)錄、運(yùn)輸?shù)确矫娓鼜?qiáng)的調(diào)控能力并且含有與益生功能相關(guān)的基因,如谷胱甘肽(gshAB)、胞外多糖(rmlA~rmlD、epsH)及提高宿主代謝能力(tagE)相關(guān)基因。本文通過比較基因組學(xué)分析發(fā)現(xiàn)鼠李糖乳桿菌的序列與功能有著高度的相似性,并且鼠李糖乳桿菌Probio-M9 存在益生功能相關(guān)的基因,為后續(xù)鼠李糖乳桿菌Probio-M9 基因組研究及其益生功能開發(fā)奠定遺傳學(xué)基礎(chǔ)。