花梅芳,李東迅,鄧旗*,孫力軍*,鐘賽意,廖建萌
1(廣東海洋大學(xué) 食品科技學(xué)院,廣東省水產(chǎn)品加工與安全重點(diǎn)實(shí)驗(yàn)室,廣東省海洋食品工程技術(shù)研究中心,廣東省海洋生物制品工程實(shí)驗(yàn)室,水產(chǎn)品深加工廣東普通高等學(xué)校重點(diǎn)實(shí)驗(yàn)室,廣東 湛江,524088) 2(海洋食品精深加工關(guān)鍵技術(shù)省部共建協(xié)同創(chuàng)新中心(大連工業(yè)大學(xué)),遼寧 大連,116034) 3(湛江市食品藥品檢驗(yàn)所,廣東 湛江,524022)
抗菌脂肽是芽孢桿菌中的非核糖體多肽合成酶催化合成的小分子脂肽,主要包括表面活性素(surfactin)、伊枯草菌素(iturin)和芬薺素(fengycin)3大家族化合物[1-2]??咕目咕V廣,對(duì)大多數(shù)細(xì)菌和真菌都有抑制作用,且具有綠色、高效、低毒、無(wú)污染等優(yōu)點(diǎn)[3-5]。因此,在食品、醫(yī)藥、農(nóng)業(yè)等領(lǐng)域具有廣泛的發(fā)展前景[6-9]。
芽孢桿菌種類繁多,枯草芽孢桿菌、解淀粉芽孢桿菌和貝萊斯芽孢桿菌等均能產(chǎn)生抗菌脂肽[10-12]。不同芽孢桿菌的脂肽譜有所差異,主要與其合成酶及關(guān)鍵基因的數(shù)量和結(jié)構(gòu)相關(guān)[13-14]。DENG等[15]對(duì)B.velezensisCMT-6進(jìn)行高通量測(cè)序發(fā)現(xiàn),合成酶基因srfA、ituA、fenA的完整性分別是菌株合成脂肽(surfactin、iturin和fengycin)的前提條件,而核心基因發(fā)生的InDels和SNP情況是造成脂肽種類和產(chǎn)量差異的主要原因。此外,脂肽是由前體物質(zhì)氨基酸殘基和脂肪酸鏈組成的大環(huán)內(nèi)酯類物質(zhì)[16-17],但目前關(guān)于前體物質(zhì)合成途徑中功能基因和代謝通路中關(guān)鍵基因的表達(dá)情況及其對(duì)脂肽譜的影響鮮有報(bào)道。
本課題組從海洋紅樹林生境中篩選到一株芽孢桿菌B.amyloliquefaciensCMT-9,該菌株具有生長(zhǎng)速度快、營(yíng)養(yǎng)需求簡(jiǎn)單且抗逆性強(qiáng)、抗菌譜廣泛等特點(diǎn),展現(xiàn)出良好的應(yīng)用潛力。為探明海洋源CMT-9產(chǎn)脂肽的組分及其分子機(jī)理,本研究擬以高效液相色譜串聯(lián)質(zhì)譜(liquid chromatography tandem mass spectrometry,LC-MS/MS)技術(shù)鑒定CMT-9的發(fā)酵液組分,采用全基因組測(cè)序技術(shù)探明CMT-9基因組中合成脂肽的代謝通路和關(guān)鍵基因,同時(shí)通過比較基因組學(xué)分析其與不同種屬的陸地源芽孢桿菌B.velezensisCMT-6(可合成surfactin、iturin和fengycin)、B.velezensisFZB42(可合成surfactin、fengycin)、B.amyloliquefaciensDSM7T(可合成surfactin、iturin)和B.subtilis168(無(wú)脂肽合成能力)之間的脂肽譜差異性,為解析CMT-9產(chǎn)脂肽的調(diào)控機(jī)制和指導(dǎo)其實(shí)際生產(chǎn)提供理論參考。
1.1.1 實(shí)驗(yàn)菌株
BacillusamyloliquefaciensCMT-9,廣東海洋大學(xué)食品科技學(xué)院水產(chǎn)品綠色控制實(shí)驗(yàn)室保藏。
1.1.2 培養(yǎng)基
改良Landy培養(yǎng)基(g/L):葡萄糖20.0,L-谷氨酸氫鈉5.0,MgSO4·7H2O 0.5,KCl 0.5,KH2PO4·3H2O 1.0,F(xiàn)eSO4·7H2O 0.001 5,MnSO·5H2O 0.05,CuSO4·5H2O 0.001 6,pH 7.0。
LB培養(yǎng)基(g/L):蛋白胨10.0,酵母粉5.0,NaCl 5.0,pH 7.0。
HHS恒溫水浴鍋、SPX-250B-Z生化培養(yǎng)箱,上海博迅實(shí)業(yè)有限公司;PHS-3E型pH計(jì),上海雷磁儀器有限公司;DC-12H氮吹儀,上海安譜科學(xué)儀器有限公司;Invitrogen Qubit 4熒光定量?jī)x,美國(guó)賽默飛世爾公司。
1.3.1 脂肽發(fā)酵條件
挑取菌株CMT-9在50 mL LB培養(yǎng)基中37 ℃、150 r/min培養(yǎng)14 h進(jìn)行活化復(fù)壯。按體積分?jǐn)?shù)為5%的接種量加入100 mL改良Landy培養(yǎng)基中,30 ℃、160 r/min發(fā)酵培養(yǎng)36 h。
1.3.2 脂肽組分檢測(cè)
將發(fā)酵液置于4 ℃,8 000 r/min離心30 min,獲得上清液。加入甲酸調(diào)節(jié)pH至2.0,靜置沉淀8 h。8 000 r/min、4 ℃離心20 min,向沉淀物加入少量的無(wú)菌水,用氨水調(diào)pH至7.0,甲醇萃取2~6 h,然后10 000 r/min、4 ℃離心20 min,取上清液。同樣步驟萃取2次,合并上清液并經(jīng)旋轉(zhuǎn)蒸發(fā)儀濃縮至近干,加入無(wú)菌水稀釋,用無(wú)菌0.22 μm濾膜過濾。采用LC-MS/MS技術(shù)測(cè)定發(fā)酵液主要成分,參照DENG等[18]進(jìn)行參數(shù)設(shè)置。
1.3.3 RNA提取和檢測(cè)
采用DNeasy plantMini kit試劑盒提取CMT-9的基因組RNA,通過1%瓊脂糖凝膠電泳檢測(cè)技術(shù)和熒光定量?jī)x檢測(cè)樣品基因組RNA的完整性、總量和濃度。
1.3.4 基因組測(cè)序與基因功能注釋
將合格的RNA樣品送到深圳華大基因研究院進(jìn)行富集純化、反轉(zhuǎn)錄文庫(kù)的構(gòu)建及測(cè)序。將通過高通量測(cè)序獲得的每個(gè)樣品的轉(zhuǎn)錄組文庫(kù)轉(zhuǎn)化為原始測(cè)序序列數(shù)據(jù),對(duì)其進(jìn)行CASAVA堿基序列鑒定分析。通過軟件HTseq(版本:0.12.4)來(lái)處理高通量測(cè)序所產(chǎn)生的數(shù)據(jù),將這些reads高效、準(zhǔn)確地比對(duì)到基因上去,使不同基因、不同實(shí)驗(yàn)間估計(jì)的基因表達(dá)水平具有可比性。用DESeq 2R軟件分析和比較差異表達(dá)基因。采用Benjamini & Hochberg方法調(diào)整P值,將P<0.05和∣log2fold change∣≥2設(shè)置為差異表達(dá)基因。利用GO數(shù)據(jù)庫(kù)(http://geneontology.org/)和KEGG數(shù)據(jù)庫(kù)(https://www.kegg.jp/kegg/pathway.html)分別對(duì)差異表達(dá)基因進(jìn)行分析;利用COG數(shù)據(jù)庫(kù)(https://www.ncbi.nlm.nih.gov/research/cog-project/)、CAZy數(shù)據(jù)庫(kù)(http://www.cazy.org/)分別對(duì)差異表達(dá)基因的代謝途徑、碳水化合物酶類進(jìn)行注釋。
1.3.5 比較基因組學(xué)分析
將B.amyloliquefaciensCMT-9與B.velezensisCMT-6、B.amyloliquefaciensDSM7T、B.velezensisFZB42和B.subtilis168進(jìn)行比較基因組學(xué)分析。
CMT-9發(fā)酵產(chǎn)物的LC-MS/MS離子流圖如圖1所示。
圖1 CMT-9發(fā)酵產(chǎn)物的總離子流色譜圖Fig.1 Total ion chromatogram of CMT-9 fermentation products
CMT-9菌株發(fā)酵產(chǎn)物的主要質(zhì)荷比為995、1 008、1 022、1 058、1 044、1 057、1 071、1 036、1 432,共9種組分。這些組分的質(zhì)荷比與文獻(xiàn)報(bào)道的在相同發(fā)酵工藝和純化條件下檢測(cè)到的surfactin(m/z為995、1 008、1 022、1 036、1 058、1 044)和iturin(m/z為1 057、1 071)的分子質(zhì)量相一致[18]。由此初步判定CMT-9菌株所產(chǎn)生的抗菌物質(zhì)為surfactin和iturin[18]。此外,鄧旗等[19]研究發(fā)現(xiàn)fengycin A的質(zhì)荷比在1 431~1 492,由此推測(cè)質(zhì)荷比為1 432的組分可能是fengycin A的一種。
由圖2可得,將菌株CMT-9的基因序列與GO數(shù)據(jù)庫(kù)進(jìn)行比對(duì)共注釋到9 763個(gè)基因,其中與分子功能相關(guān)的基因數(shù)量為4 617個(gè),主要富集在催化活性(catalytical activity),轉(zhuǎn)運(yùn)能力(transport activity);與細(xì)胞組成相關(guān)的基因數(shù)量為2 189個(gè),主要富集在高分子聚乳酸(macromolecular complex);與生物過程相關(guān)的基因數(shù)量為2 957個(gè),主要富集在代謝過程(metabolic process),細(xì)胞過程(cellular process),生物調(diào)節(jié)(biological regulation)。
圖2 CMT-9差異基因的GO功能分類與富集Fig.2 GO functional classification and enrichment of CMT-9 differential genes
由圖3可得,KEGG分析表明CMT-9發(fā)酵培養(yǎng)后的差異基因在代謝(metabolism)、環(huán)境信息過程(environmental information processing)和基因信息過程(genetic information processing)通路顯著富集,其中最豐富的路徑為代謝過程中的碳水化合物代謝(carbohydrate metabolism)和氨基酸代謝(amino acid metabolism),它們的差異基因個(gè)數(shù)分別為506和411。
圖3 CMT-9差異基因的KEGG通路分類與富集Fig.3 KEGG pathway classification and enrichment of CMT-9 differential genes
由圖4可得,通過COG功能分析發(fā)現(xiàn)差異基因主要富集在一般功能預(yù)測(cè)(general function prediction only)、氨基酸運(yùn)輸與代謝(amino acid transport and metabolism)、碳水化合物運(yùn)輸與代謝(carbohydrate transport and metabolism)。其中,參與氨基酸運(yùn)輸與代謝(amino acid transport and metabolism)的基因個(gè)數(shù)為333個(gè);參與碳水化合物運(yùn)輸與代謝(carbohydrate transport and metabolism)的基因個(gè)數(shù)為230個(gè);參與次級(jí)代謝物的生物合成、轉(zhuǎn)運(yùn)和分解代謝(secondary metabolites biosynthesis, transport and catabolism)的基因個(gè)數(shù)為97個(gè)。
圖4 CMT-9差異基因的COG功能分類與富集Fig.4 COG functional classification and enrichment of CMT-9 differential genes
碳水化合物活性酶主要由5類催化酶和一類非催化模塊組成,催化酶包括糖苷水解酶(glycoside hydrolases, GHs)、多糖裂解酶(polysaccharidelyases, PLs)、碳水化合物酯酶(carbohydrate esterases, CEs)、糖基轉(zhuǎn)移酶(glycosyltransferases, GTs)以及輔助氧化還原酶(auxiliary activities, AAs),非催化模塊即碳水化合物結(jié)合模塊(carbohydrate-binding modules, CBMs)[20]。由圖5可得,菌株CMT-9中含有138個(gè)碳水化合物活性酶,其中尤以GH最多,數(shù)量為46個(gè),所占比例為33.33%;其次是GT,數(shù)量為36,所占比例為26.09%,CBM、CE、AA、PL的數(shù)量分別為31、17、5、3,所占比例分別為22.46%、12.32%、3.62%、2.17%。
圖5 CMT-9碳水化合物活性酶(CAZymes)的分布情況Fig.5 Distribution of CMT-9 CAZymes
由表1可知,CMT-9的基因組大小為3 928 149 bp,G+C含量為46.39%,蛋白質(zhì)編碼序列長(zhǎng)度為4 080,tRNA的數(shù)量為83,rRNA的數(shù)量為9。CMT-9的基因組大小、G+C含量與CMT-6、FZB42和DSM7T的相似度較高;蛋白質(zhì)編碼序列長(zhǎng)度與CMT-6相似度較高;tRNA的數(shù)量與CMT-6、FZB42和168的相似度較高。因此,CMT-9與4株菌株的基因組組分的相似度從高到低依次為CMT-6、FZB42、DSM7T、168。
表1 基因組組分比較Table 1 Genome component comparison
2個(gè)物種之間的共線性關(guān)系可以作為衡量物種之間進(jìn)化距離的尺度,進(jìn)而判斷其親緣關(guān)系[21]。由圖6可知,CMT-9與CMT-6、FZB42均表現(xiàn)出高度的共線性;與DSM7T的共線性較差,在1~1.75 Mb片段出現(xiàn)較明顯的缺失和易位;與168的共線性最差,存在顯著的插入、易位、倒位和等基因重排現(xiàn)象,在1.3~1.4、1.85~1.95和2.65~2.8 Mb片段最為明顯。
a-CMT-6;b-FZB42;c-DSM7T;d-168圖6 全基因組二維共線性比較Fig.6 Two-dimensional collinearity comparison of genomes
將CMT-9的Reads比對(duì)到4株芽孢桿菌的基因組序列上,其中與CMT-6的覆蓋率最高,覆蓋區(qū)域總長(zhǎng)度為3 724 736 bp,占CMT-6基因組的94.81%;其次是FZB42,覆蓋區(qū)域總長(zhǎng)度為3 918 589 bp,占FZB42基因組的90.68%;而CMT-9與DSM7T、168的覆蓋率較低,覆蓋區(qū)域總長(zhǎng)度分別為2 036 571、104 859 bp,各占其基因組的51.17%和2.49%(表2)。
表2 測(cè)序長(zhǎng)度和覆蓋度比較Table 2 Comparison of sequencing length and coincidence
同時(shí),將菌株CMT-9與CMT-6、168、DSM7T、FZB42基因組的蛋白序列進(jìn)行比較,構(gòu)建基因組間的Core-Pan基因集。將5株菌株的基因進(jìn)行同源性分析,5株菌株的共有基因?yàn)? 675個(gè),CMT-9與CMT-6的共有基因數(shù)量最多(3 545個(gè)),與FZB42、DSM7T、168的共有基因數(shù)量分別為3 166、3 090、2 882(圖7)。
圖7 基因組的Core-Pan基因數(shù)目維恩圖Fig.7 Venn diagram of the number of Core-Pan genes in the genome
本研究采用LC-MS/MS方法檢測(cè)菌株CMT-9的發(fā)酵產(chǎn)物組分,發(fā)現(xiàn)其質(zhì)荷比與張寧等[22]的研究中的surfactin和iturin相一致,說(shuō)明CMT-9可以發(fā)酵產(chǎn)生抗菌脂肽。同時(shí)還檢測(cè)到一個(gè)質(zhì)荷比為1 432的組分,該值在fengycin質(zhì)荷比(1 431~1 492)范圍內(nèi),因此推測(cè)其可能為fengycin[23],但具體結(jié)構(gòu)仍需進(jìn)一步的探索和驗(yàn)證。
全基因組測(cè)序技術(shù)可從基因?qū)用嫱诰蚧钚跃甏渭?jí)代謝產(chǎn)物的合成潛力。本研究對(duì)菌株CMT-9進(jìn)行全基因組測(cè)序和通路分析,發(fā)現(xiàn)其差異表達(dá)基因主要富集在碳水化合物代謝、氨基酸代謝通路。碳水化合物代謝過程中產(chǎn)生的丙酮酸會(huì)影響乙酰CoA的合成,乙酰CoA可進(jìn)一步合成脂肪酸[24-25]。因此,這2條通路可為脂肽的合成提供脂肪酸和氨基酸等重要前體物質(zhì),前體物質(zhì)的含量是菌株高效合成脂肽的關(guān)鍵。WU等[26]研究發(fā)現(xiàn)添加復(fù)合氨基酸可顯著提高解淀粉芽胞桿菌Ba-BPD1的iturin產(chǎn)量。LU等[27]研究碳水化合物對(duì)解淀粉芽胞桿菌合成抗菌脂肽的影響,發(fā)現(xiàn)果糖通過提升氨基酸的濃度,進(jìn)而增加抗菌脂肽相關(guān)合成酶基因的表達(dá),最終提高抗菌脂肽的產(chǎn)量。因此,脂肽前體物質(zhì)合成通路中基因的數(shù)量和表達(dá)水平與脂肽產(chǎn)量呈正相關(guān)性。
前期研究發(fā)現(xiàn),菌株CMT-6具備合成surfactin、iturin和fengycin 3大類脂肽的合成酶基因,且數(shù)量較多,可合成高水平的抗菌脂肽[15]。根據(jù)已公布的CMT-6菌株的全基因組序列,通過比較基因組學(xué)發(fā)現(xiàn)CMT-9與CMT-6菌株的基因組大小、G+C含量、蛋白質(zhì)編碼序列和tRNA數(shù)量均表現(xiàn)高度的一致性。此外,在共線性分析中,發(fā)現(xiàn)菌株CMT-9與CMT-6具有高度共線性,與FZB42、DSM7T和168相比存在不同程度的差異,甚至出現(xiàn)線性缺失現(xiàn)象。同源性分析中CMT-9與CMT-6菌株的同源性較FZB42、DSM7T、168最高,達(dá)到94.81%。因此,芽孢桿菌基因組組分、共線性和同源性決定了其脂肽譜的相似度。
本研究采用LC-MS/MS技術(shù)發(fā)現(xiàn)CMT-9的發(fā)酵液中含有surfactin、iturin和fengycin 3種脂肽組分,進(jìn)一步的全基因組測(cè)序和比較基因組學(xué)分析發(fā)現(xiàn),前體物質(zhì)合成基因數(shù)量與脂肽產(chǎn)量密切相關(guān),基因組組分、共線性和同源性的差異是脂肽譜多樣化的重要原因。研究結(jié)果為脂肽產(chǎn)生菌的篩選及脂肽定向合成工程菌株的改造提供理論依據(jù)。