張棲,王晨,任璐,王洪偉,索化夷*
1(西南大學 食品科學學院,重慶,400715)2(川渝共建特色食品重慶市重點實驗室,重慶,400715)
腐乳是一種源于中國的傳統(tǒng)發(fā)酵食物,由豆腐經(jīng)特定的微生物如放線菌、毛霉和根霉固態(tài)發(fā)酵制成[1],不僅具有獨特的風味,而且含有多種營養(yǎng)成分和功能性成分[2]。腐乳中的風味物質(zhì)與脂肪酸和蛋白質(zhì)的降解密切相關(guān),微生物產(chǎn)生的脂肪酶和蛋白酶將脂肪酸和蛋白質(zhì)分解成肽、氨基酸和游離脂肪酸等小分子物質(zhì),大大提高了腐乳的營養(yǎng)[3]。根據(jù)腐乳發(fā)酵劑種類可以將腐乳分為細菌發(fā)酵(微球菌、芽孢桿菌和乳酸菌)腐乳、霉菌發(fā)酵(放線毛霉、毛霉和根霉)腐乳及其他發(fā)酵(自然接種)腐乳[4],其中霉菌發(fā)酵腐乳是最普遍的類型。在發(fā)酵過程中,發(fā)酵菌株和其他微生物可以分泌多種酶,在它們的共同作用下將大豆蛋白和碳水化合物水解成氨基酸和小分子糖[5],這些小分子物質(zhì)是腐乳風味形成的關(guān)鍵。由于霉菌發(fā)酵可以產(chǎn)生生物活性物質(zhì)、有機酸、營養(yǎng)物質(zhì)、風味物質(zhì)和色素,因此它在食品發(fā)酵工業(yè)中越來越重要。如MARTNEZ等[6]發(fā)現(xiàn)固態(tài)發(fā)酵中根霉產(chǎn)生的小孢子生物催化劑能持續(xù)生產(chǎn)油酸乙酯;MEINI等[7]報道了黑曲霉和米曲霉固態(tài)發(fā)酵的葡萄渣提取物具有抗氧化和益生特性;此外,HE等[8]將腐乳中9種細菌和6種真菌鑒定為核心功能微生物群,顯著影響風味化合物的產(chǎn)生,尤其是游離氨基酸的產(chǎn)生。然而,真菌除了產(chǎn)生一些有益的生物分子外,也會產(chǎn)生危害人類健康的真菌毒素。真菌毒素是由真菌產(chǎn)生的極其穩(wěn)定的有毒天然代謝產(chǎn)物,在加工和熱處理過程中不會分解。因此,食物和動物飼料易受到污染,給人類和動物帶來廣泛的不利影響[9]。毛霉菌病由毛霉目中普遍存在的絲狀真菌引起,是一種死亡率較高的侵襲性真菌[10]。隨著免疫抑制、糖尿病、鈍性創(chuàng)傷和血液惡性腫瘤等風險因素在人群中越來越常見,感染毛霉菌病的人也逐漸增加[11]。有關(guān)于全球毛霉菌病的研究調(diào)查顯示根霉、毛霉和橫梗霉占報告病例的80%,但仍然有不少病例與不太常見的毛霉有關(guān),如雅致放射毛霉[12]。放射毛霉是一種自然界中普遍存在的兼性厭氧真菌,以前未被認定為侵襲性毛霉菌病的病原體,直到2001年DAVEL等[13]報道了第一例由雅致放射毛霉引起的上頜竇炎的病例,人們才意識到雅致放射毛霉也具有致病性。雖然我們未在發(fā)酵腐乳中檢測到有毒物質(zhì)的產(chǎn)生,但從消費者的心理出發(fā),作為中國商業(yè)腐乳最常用的霉菌之一,雅致放射毛霉的安全性及其產(chǎn)生生物活性物質(zhì)的能力仍然值得我們深入研究。目前已有許多研究將高通量測序技術(shù)應(yīng)用于腐乳發(fā)酵工業(yè),以研究不同微生物的功能特性與其基因組成的關(guān)系。然而,這些研究主要集中在腐乳發(fā)酵過程中的微生物多樣性[14-16]。盡管有相關(guān)文獻報道了雅致放射毛霉的生物活性、致病性和改善發(fā)酵豆制品風味的能力,但仍然迫切需要完整的雅致放射毛霉的全基因組和基因功能注釋相關(guān)信息。
本文揭示了雅致放射毛霉CJ-6的全基因組從頭測序和基因功能注釋信息,并將其基因注釋信息與米曲霉RIB40和總狀毛霉B9645進行了比較分析。米曲霉RIB40是在日本傳統(tǒng)發(fā)酵工業(yè)中廣泛使用的真菌菌株,由于米曲霉在食品發(fā)酵工業(yè)中廣泛使用的歷史悠久,美國食品藥品管理局(Food And Drug Administration,FDA)將其工業(yè)應(yīng)用認證為公認安全(generally recognized as safe,GRAS)[17]。日本學者于2005年發(fā)表了米曲霉的全基因組的草圖[18],標志著米曲霉基因組學全面發(fā)展時代的到來。總狀毛霉是純菌種發(fā)酵腐乳中最常用的發(fā)酵微生物之一,但總狀毛霉也會引起人類和動物疾病[19]。因此,將從NCBI獲得的米曲霉RIB40和總狀毛霉B8645全基因組數(shù)據(jù)與雅致放射毛霉CJ-6基因注釋結(jié)果進行比較分析,使我們能夠深入了解雅致放射毛霉CJ-6在腐乳發(fā)酵過程中各種活性物質(zhì)及毒素的合成和代謝情況,為后續(xù)的深入研究奠定理論基礎(chǔ),以更好地開發(fā)其作用并徹底地利用在食品發(fā)酵工業(yè)中。
腐乳毛坯,重慶市蔡家的市集,用無菌鑷子將腐乳毛坯裝入50 mL無菌離心管中,放入冷藏箱。
用接種環(huán)挑取樣本的菌絲置于5 mL無菌超純水中,搖勻后進行梯度稀釋至10-6,在孟加拉紅平板培養(yǎng)基上涂布,倒置于30 ℃恒溫培養(yǎng)箱內(nèi)培養(yǎng),按照菌落形態(tài)和孢子顏色進行分離純化,重復幾次后得到純化的菌株CJ-6(圖1)。
圖1 CJ-6菌落形態(tài)Fig.1 Colony morphology of CJ-6
參考CHEN等[20]所述的方法,使用OMEGA Fungal DNA Kit試劑盒(北京索萊寶科技有限公司)提取基因組DNA。
使用真菌通用引物ITS1和ITS4進行PCR擴增。取1 μL模板DNA、1 μL引物ITSl(5′-TCCGTAGGTGAACCTGCGG-3′)、1 μL引物ITS4(5′-TCCTCCGCTTATTGA ATGC-3′)、12.5 μL 2×TaqPCR Master Mix和9.5 μL滅菌超純水混合得到25 μL PCR體系。擴增產(chǎn)物使用1.4%瓊脂糖進行凝膠電泳檢測,然后送華大基因測序。測序結(jié)果通過NCBI數(shù)據(jù)庫中的BLAST程序進行同源性比對分析。
應(yīng)用Illumina PE150測序平臺及PacBio測序平臺(北京諾禾致源科技股份有限公司)對未知物種基因組從頭測序的測序技術(shù)對雅致放射毛霉進行基因組測序。對于Illumina測序,用Covaris超聲波破碎儀將電泳檢測合格的DNA樣品打斷成長度約350 bp的片段,DNA片段純化后與末端修復混合物結(jié)合,將修復后的DNA與A-Tailing混合物結(jié)合。然后將Illumina接頭連接到DNA的3′端,再進行純化、PCR擴增等步驟,完成整個文庫的制備。文庫構(gòu)建后,使用Agilent 2100生物分析儀檢測插入片段的大小,并通過實時PCR系統(tǒng)對文庫的濃度進行定量,以確保文庫的質(zhì)量。合格的文庫用Illumina平臺測序。Pacbio測序通過構(gòu)建具有20 kbp插入片段大小的SMRT Bell文庫,使用Qubit確定濃度、Agilent 2100確定插入片段的大小,然后在Pacbio平臺上測序來進行。得到的三代測序數(shù)據(jù)先使用SMRT Link v5.0.1過濾低質(zhì)量reads,將剩下的reads初步組裝成無空缺序列(Gap)的重疊群(contigs)。為降低三代測序的錯誤率,首先對三代數(shù)據(jù)進行三輪糾錯:利用minimap2對初步組裝的基因組進行mapping,然后使用racon(v1.4.13)和比對結(jié)果對初步組裝的基因組進行位點校正;其次利用二代數(shù)據(jù)對其進行兩輪糾錯:利用bwa(0.7.8-r455)對初步組裝的基因組進行mapping,然后使用samtools(v1.3.1)和比對結(jié)果對初步組裝的基因組進行位點校正,最后得到糾錯后的高精度Contigs。
基因組預測和編碼區(qū)分析由AUGUSTUS和GeneMark完成。使用基因組和RNA-Seq數(shù)據(jù)進行基因組的結(jié)構(gòu)注釋,分別使用RepeatMasker(Version open-4.0.5)和Tandem Repeats Finder(TRF, Version 4.07b)預測散在重復序列及串聯(lián)重復序列。
預測的基因蛋白序列通過Diamond與每個功能數(shù)據(jù)庫中已知注釋基因的同源性注釋進行比對。首先在NR(Non-Redundant Protein Database)、Pfam和SwissProtS數(shù)據(jù)庫(BLASTP,e值≤1e-5)中比較預測的基因,然后基于KOG(EuKaryotic Orthologous Groups)數(shù)據(jù)庫、GO(Gene Ontology)數(shù)據(jù)庫和KEGG(Kyoto Encyclopedia of Genes and Genomes)進行分類。
使用Diamond對基因組進行碳水化合物活性酶(carbohydrate-active enZYmes,CAZy)注釋。使用BLAST注釋細胞色素P450(cytochromeP450,CYP450),CYP450是一類以血紅素為輔基的超基因家族蛋白,參與機體的一系列生理生化反應(yīng)[21]。SignalP和TMHMM用于預測蛋白質(zhì)序列和綜合篩選分泌蛋白。此外,為了鑒定雅致放射毛霉的毒力或致病性,使用Diamond軟件注釋PHI(Pathogen Host Interactions)數(shù)據(jù)庫和DFVF(Database of Fungal Virulence Factors)數(shù)據(jù)庫。
使用AntiSMASH-4.0.2來預測雅致放射毛霉CJ-6基因組的次級代謝基因簇以了解其代謝真菌毒素的能力。
經(jīng)過Genebank中的18S rDNA同源序列比較分析,根據(jù)Blast結(jié)果顯示該菌株與雅致放射毛霉(ActinomucorelegansUAMH 10931)同源性達到100%(附圖1,https://doi.org/10.13995/j.cnki.11-1802/ts.034416),確定該菌株為雅致放射毛霉,將其命名為雅致放射毛霉CJ-6。
應(yīng)用從頭測序技術(shù)對雅致放射毛霉CJ-6進行基因組測序,得到2 460 521 894 bp測序數(shù)據(jù)量,使用SMRT Link v5.1.0軟件進行初步組裝后將組裝結(jié)果進行比對評估,組裝總共得到27個contigs,總長度為36 533 736 bp,其中最大的contig長度為4 995 973 bp,整個基因組組裝大小約為36.53 Mbp,總GC含量為36.36%,N50長度為3 043 051 bp。上述結(jié)果表明雅致放射毛霉CJ-6基因組的組裝質(zhì)量較好。
雅致放射毛霉的全基因組包含多個功能區(qū),使用AUGUSTUS等多種基因預測軟件對編碼基因進行預測以識別其基因功能。從頭基因預測結(jié)果顯示雅致放射毛霉CJ-6基因組有8 035個編碼基因。推定的編碼基因占雅致放射毛霉CJ-6基因組的31.35%,主要分布在200~1 700 bp。應(yīng)用RepeatMasker軟件預測到6 933個散在重復序列,總長1 234 984 bp,占基因組全長的3.380 4%;其中長末端重復序列和DNA轉(zhuǎn)座子分別占基因全長的2.783 2%和0.653 2%。在DNA序列中,TRF預測到的串聯(lián)重復序列為7 725個,占基因全長的1.232 7%,其中包括3 856個小衛(wèi)星DNA和1 187個微衛(wèi)星DNA。最后,基因測序顯示,非編碼RNA(ncRNA)包含264個tRNA,長度為19 642 bp。
雅致放射毛霉CJ-6基因功能分析包括功能注釋、效應(yīng)子和致病性分析。使用不同的數(shù)據(jù)庫對雅致放射毛霉CJ-6進行功能注釋,編碼基因在各個數(shù)據(jù)庫中都有注釋到,在NR數(shù)據(jù)庫中注釋到的基因最多。總共有7 217個,其次是GO數(shù)據(jù)庫(5 843個)、KEGG數(shù)據(jù)庫(3 856個)、KOG數(shù)據(jù)庫(2 697個)和CAZy數(shù)據(jù)庫(174個)。
2.3.1 GO數(shù)據(jù)庫注釋分析
GO數(shù)據(jù)庫是基因功能描述的分類系統(tǒng)。在這個數(shù)據(jù)庫中共注釋到5 843個基因,注釋結(jié)果由細胞定位(cellular component)、分子功能(molecular function)和生物過程(biological process)組成(圖2-a)。GO注釋蛋白質(zhì)分類顯示,這些蛋白質(zhì)主要富集在“生物過程”類別的“代謝過程(metabolic process)”和“細胞進程(cellular process)”,以及“分子功能(molecular function)”類別中的“催化活性(catalytic activity)”和“綁定(binding)”。結(jié)果表明雅致放射毛霉CJ-6擁有較為旺盛的初級和次級代謝過程,同時具有對外界環(huán)境或本身的酶催化活性。
2.3.2 KOG數(shù)據(jù)庫注釋分析
KOG數(shù)據(jù)庫是COG(Clusters of Orthologous Groups)數(shù)據(jù)庫中真核生物的直系同源數(shù)據(jù)庫,可以預測蛋白質(zhì)序列的功能,包括25個功能類別。雅致放射毛霉CJ-6基因組在這個數(shù)據(jù)庫中共注釋到2 697個基因,可分為25個功能。最豐富的類別是“轉(zhuǎn)化、核糖體結(jié)構(gòu)和生物合成”、“翻譯后修飾、蛋白質(zhì)周轉(zhuǎn)、伴侶蛋白”、“僅通用功能預測”和“信號轉(zhuǎn)導機制”,平均注釋到300個基因。這說明雅致放射毛霉可能存在較復雜的生理生化代謝機制。同時,涉及“碳水化合物運輸和新陳代謝”、“氨基酸運輸和代謝”及“脂質(zhì)運輸和代謝”的基因相對豐富。上述結(jié)果表明,雅致放射毛霉CJ-6可能具有較好的碳水化合物、氨基酸和脂質(zhì)代謝能力,這可能有助于在腐乳發(fā)酵期間產(chǎn)生各種風味物質(zhì)(圖2-b)。
2.3.3 KEGG代謝途徑注釋的比較分析
通過KEGG數(shù)據(jù)庫注釋能夠幫助我們進一步掌握雅致放射毛霉CJ-6具有的代謝途徑。功能注釋結(jié)果包括新陳代謝(metabolism)、遺傳信息處理(genetic information processing)、環(huán)境信息處理(environmental information processing)、細胞過程(cellular processes)、生物系統(tǒng)(organismal systems)、人類疾病(human diseases)。
在KEGG中共注釋到3 856個基因,被分為40個功能類別。從主要代謝途徑分析來看,大多數(shù)注釋的基因?qū)儆谔妓衔锎x(carbohydrate metabolism)和氨基酸代謝(amino acid metabolism)類別,此外脂類代謝(lipid metabolism)類別也注釋到較多基因(圖3-a)。腐乳中風味物質(zhì)的形成與氨基酸和油脂的降解密切相關(guān),這也在一定程度上說明,雅致放射毛霉CJ-6在傳統(tǒng)腐乳生產(chǎn)過程中對腐乳風味品質(zhì)的形成具有重要作用。
基于雅致放射毛霉CJ-6的氨基酸代謝對KEGG途徑進行了深入的比較分析。與總狀毛霉B9645(全基因組大小:65.53 Mbp)和米曲霉RIB40(全基因組大小:37.91 Mbp)相比,雅致放射毛霉CJ-6(全基因組大小:36.53 Mbp)與氨基酸代謝相關(guān)的基因較少(圖3-b)。雅致放射毛霉CJ-6的氨基酸代謝KEGG注釋結(jié)果顯示,與支鏈氨基酸中的“異亮氨酸、亮氨酸和纈氨酸降解(Val、Leu and Ile degradation)”相關(guān)的基因最多,共注釋到42個相關(guān)基因,其次是含硫氨酸中的“半胱氨酸和蛋氨酸代謝(Cys and Met metabolism)”,注釋到39個基因。從圖3-c可以看出,雅致放射毛霉CJ-6和總狀毛霉B9645基因組中氨基酸代謝相關(guān)的基因分布結(jié)構(gòu)較為相似,支鏈氨基酸“Val、Leu and Ile degradation”和含硫氨酸“Cys and Met metabolism”所占比例均較高。而米曲霉RIB40注釋到較多與芳香族氨基酸“酪氨酸代謝(Tyr metabolism)”相關(guān)的基因。
基于脂質(zhì)代謝(lipid metabolism)的KEGG途徑注釋結(jié)果顯示,與脂質(zhì)代謝相關(guān)的KEGG通路共分為8個類別,分別為脂肪酸降解(fatty acid degradation)、甘油酯代謝(glycerolipid metabolism)、甘油磷脂代謝(glycerophospholipid metabolism)、脂肪酸生物合成(fatty acid biosynthesis)、α-亞麻酸代謝(alpha-linolenic acid metabolism)、不飽和脂肪酸的生物合成(biosynthesis of unsaturated fatty acids)、醚酯代謝(ether lipid metabolism)及花生四烯酸代謝(arachidonic acid metabolism),相關(guān)基因的通路ID(pathway ID)及功能描述詳見附表1(https://doi.org/10.13995/j.cnki.11-1802/ts.034416)。3株霉菌中注釋到的與脂質(zhì)代謝相關(guān)的基因數(shù)量位于前3的代謝途徑均為甘油磷脂代謝(glycerophospholipid metabolism)、脂肪酸降解(fatty acid degradation)和甘油酯代謝(glycerolipid metabolism),其中甘油磷脂代謝途徑注釋到的基因數(shù)量最多,雅致放射毛霉CJ-6基因組中注釋到43個甘油磷脂代謝基因,米曲霉RIB40和總狀毛霉B9645分別注釋到40和79個基因(圖4-a)。此外,由圖4-b可以看出雅致放射毛霉CJ-6和總狀毛霉B9645基因組中與脂肪代謝相關(guān)的基因結(jié)構(gòu)分布較為相似,這一點與上述氨基酸代謝相關(guān)的基因分布結(jié)果類似,這也在一定程度上說明,雅致放射毛霉和總狀毛霉在氨基酸和脂質(zhì)代謝方面可能具有相似性。
附表1 雅致放射毛霉CJ-6基因組脂質(zhì)代謝KEGG通路及相關(guān)基因Table S1 Fat metabolism and degradation pathways and related genes in the genome of A. elegans CJ-6
表1 三株霉菌基因組中效應(yīng)子和致病性基因預測Table 1 Prediction of effector and pathogenic genes in the genome of three fungi
a-3株霉菌的脂質(zhì)代謝KEGG通路基因數(shù)量;b-3株霉菌的脂質(zhì)代謝KEGG通路基因占比圖4 脂質(zhì)代謝KEGG通路注釋比較分析Fig.4 Comparative analysis of KEGG pathway annotation of lipid metabolism注:圖4-b:縱坐標為各脂質(zhì)代謝通路中所注釋到的基因數(shù)量占各菌株中脂質(zhì)代謝通路總基因數(shù)量的比例,橫坐標為脂質(zhì)代謝類別。
2.3.4 CAZymes
CAZymes數(shù)據(jù)庫是一個酶數(shù)據(jù)庫資源,根據(jù)其功能將CAZymes分為糖苷水解酶(glycoside hydrolases, GHs)、糖基轉(zhuǎn)移酶(glycosyl transferases, GTs)、多糖裂解酶(polysaccharide lyases, PLs)、糖酯酶(carbohydrate esterases, CEs)和氧化還原酶(auxiliary activities, AAs)五大類及一個碳水化合物結(jié)合結(jié)構(gòu)域(carbohydrate binding domain,CBMs)[22]。
在雅致放射毛霉CJ-6基因組中共預測到159個潛在的碳水化合物活性酶及酶編碼基因,分布在61個CAZy蛋白家族中,包含69個GHs、65個GTs、8個AAs、15個CEs和2個PLs。同時,還預測到了11個蛋白家族中24個推定的CBM酶編碼基因(圖5-a)??梢钥闯?3株霉菌均在GHs和GTs類別注釋到的基因數(shù)量最多(圖5-a),其中米曲霉RIB40的GHs基因占比達到54.26%。GH是一種水解糖苷鍵的酶,在生物體內(nèi)糖和糖綴合物的水解和合成中起著不可替代的作用;GT負責磷酸激活的糖供體中糖苷鍵的生物合成。從圖5-a還可以看出,雅致放射毛霉CJ-6和總狀毛霉B9645基因組中碳水化合物活性酶的基因結(jié)構(gòu)在整體上較為相似,這可能是雅致放射毛霉和總狀毛霉成為腐乳發(fā)酵常用菌種的原因之一。
a-5種碳水化合物活性酶家族基因總體分布;b-碳水化合物活性酶亞家族基因分布圖5 三株霉菌中碳水化合物活性酶基因注釋分析Fig.5 Annotation analysis of CAZymes genes in three fungi
由圖6可知,雅致放射毛霉注釋到的碳水化合物活性酶基因總數(shù)最少,其中最高有12個基因?qū)儆贕H18家族,包括幾丁質(zhì)酶(EC3.2.1.14)、溶菌酶(EC3.2.1.17)、內(nèi)-β-N-乙酰氨基葡萄糖酶(EC3.2.1.96)、內(nèi)β肽聚糖水解酶-N-乙酰氨基葡萄糖酶特異性(EC3.2.1.-)、Nod因子水解酶(EC3.2.1.-)等。在GT家族中,GT15和GT49家族均注釋到8個基因,包含糖脂2-α-甘露糖基轉(zhuǎn)移酶(EC2.4.1.131)、GDP-Man:α-1,2-甘露糖基轉(zhuǎn)移酶(EC2.4.1.-)、β-1,3-N-乙酰氨基葡萄糖基轉(zhuǎn)移酶(EC2.4.1.-)。米曲霉RIB40的CAZymes家族中GH3亞家族基因數(shù)量最高,而總狀毛霉B9645則是GT2亞家族基因數(shù)量最多。3株霉菌具有不同的CAZymes家族基因,雅致放射毛霉CJ-6特有的CAZYmes家族基因包括AA2、AA5、CBM18、CBM19、CBM20、CBM43、CE2、CE6、GH5、GH8、GH13、PL14亞家族(圖5-b)。上述結(jié)果說明,雅致放射毛霉、米曲霉和總狀毛霉主要是依賴GH和GT家族基因來利用碳源,且3種霉菌利用碳源的能力存在一定差異,這可能與菌株的特性有關(guān)。
a-雅致放射毛霉CJ-6次級代謝基因簇及基因數(shù)量;b-3株霉菌次級代謝產(chǎn)物合成基因簇的比較分析圖6 真菌次級代謝基因簇分析Fig.6 Analysis of secondary metabolic gene clusters in fungi
2.3.5 分泌蛋白和毒力相關(guān)蛋白
使用生物信息學分析方法,從雅致放射毛霉CJ-6的8 035個編碼基因中預測到276個分泌蛋白。PHI數(shù)據(jù)庫是一個病原體-宿主相互作用的基因數(shù)據(jù)庫,涵蓋許多致病基因。使用Blast序列相似性搜索功能將雅致放射毛霉CJ-6基因組中的全部序列和PHI數(shù)據(jù)庫進行比對,全基因組的8 035個編碼基因中注釋到與病原體PHI表型突變類型相關(guān)的基因數(shù)目有831個(10.34%),在總狀毛霉B9645和米曲霉RIB40中各預測到1 555(12.22%)和1 258個(15.48%)。細胞色素P450酶參與各種內(nèi)源性或外源性化合物的代謝,并且通常參與絲狀真菌的各種次級代謝產(chǎn)物的合成,與真菌的致病性也密切相關(guān)。在細胞色素P450酶數(shù)據(jù)庫上進行Blast同源性搜索,注釋到雅致放射毛霉CJ-6基因組中與細胞色素P450酶相關(guān)的45個基因。DFVF數(shù)據(jù)庫是一個已知真菌毒力因子的綜合數(shù)據(jù)庫,收集了來自85個屬的228種真菌攜帶的2 058個致病因子基因。在DFVF數(shù)據(jù)庫中注釋到411個雅致放射毛霉CJ-6的編碼基因,其中245個編碼基因的氨基酸序列能在DFVF數(shù)據(jù)庫中得到具體的基因和其相對應(yīng)的功能注釋信息,而在米曲霉RIB40和總狀毛霉B9645中注釋到相對較多的致病因子基因,分別有459和646個(表1)。
2.3.6 次級代謝產(chǎn)物合成基因簇分析
雅致放射毛霉是食品工業(yè)應(yīng)用中的重要微生物,針對雅致放射毛霉在發(fā)酵過程中可能存在的安全性隱患,主要分析了雅致放射毛霉真菌毒素相關(guān)的代謝產(chǎn)物合成情況。
在雅致放射毛霉基因組中預測到11個次級代謝產(chǎn)物合成基因簇(圖6-a)。與米曲霉RIB40相比,雅致放射毛霉CJ-6基因組中僅預測到了4種類型的次級代謝基因簇,即Terpene(萜烯類)、非核糖體肽合成酶(non-ribosomal peptide synthetase, NRPS)、Siderophore(鐵載體)及other,沒有預測到聚酮合成酶(polyketide synthase, PKS)途徑和PKS-NRPS混合代謝途徑,這2種途徑是大部分真菌毒素合成的關(guān)鍵代謝途徑(圖6-b)。雅致放射毛霉CJ-6基因組中預測到的次級代謝產(chǎn)物合成基因簇大多屬于Terpene基因簇(cluster3、cluster4、cluster6、cluster7、cluster8、cluster9、cluster11),其中比對到41個基因,也有部分屬于NRPS、Siderophore 和other類基因簇,分別為 cluster10、cluster1、cluster2 和 cluster5,在三類基因簇中比對到的基因數(shù)分別為10個、3個和19個(圖6-b)。
功能注釋分析表明,雅致放射毛霉CJ-6具有復雜的代謝特性,尤其氨基酸和脂肪代謝途徑在腐乳風味的形成過程中不可或缺。有研究表明,作為氨基酸代謝途徑之一的轉(zhuǎn)氨反應(yīng)是微生物將氨基酸轉(zhuǎn)化為風味物質(zhì)的關(guān)鍵步驟[23],且支鏈氨基酸(leucine, isoleucine and valine)、含硫氨酸(cysteine and methionine)和芳香族氨基酸(phenylalanine, tyrosine tryptophan)是香氣化合物的主要前體?;诎被岽x的雅致放射毛霉CJ-6 KEGG代謝途徑分析結(jié)果表明,與支鏈氨基酸中的“(Val、Leu and Ile degradation)”相關(guān)的基因最多,其次是含硫氨酸中的“(Cys and Met metabolism)”。支鏈氨基酸可降解生成3-甲基丁醛、2-甲基丁醛、2-甲基乙醛及相應(yīng)的醇,含硫氨酸降解可產(chǎn)生揮發(fā)性物質(zhì)如吲哚、氨、硫化氫等,對構(gòu)成腐乳的特征風味有著重要作用。這可能是總狀毛霉和雅致放射毛霉常用于腐乳發(fā)酵工業(yè)的原因。
脂類是腐乳中僅次于蛋白質(zhì)的第二大類化合物,同時脂類的分解也在腐乳風味形成方面發(fā)揮著重要的作用。其中甘油三酯和磷脂能分解成游離脂肪酸、甘油二酯、甘油一酯及甘油,游離脂肪酸是甲基酮、直鏈醛、內(nèi)酯、酯和S-硫酯的前體,這些風味芳香化合物是腐乳風味形成的關(guān)鍵物質(zhì)[24]?;谥敬x降解的KEGG途徑分析結(jié)果表明,雅致放射毛霉CJ-6中有較多甘油磷脂和甘油酯代謝基因,這在一定程度上說明雅致放射毛霉CJ-6在將脂肪轉(zhuǎn)化為風味化合物方面有較高潛力。
次級代謝產(chǎn)物合成基因簇分析表明,雅致放射毛霉CJ-6基本不具有合成真菌毒素的能力。目前的真菌毒素有400多種,有的毒素擁有同樣或類似的合成途徑和關(guān)鍵基因。合成途徑主要包括PKS、NRPS、PKS-NRPS混合代謝、萜類化合物代謝、氨基酸相關(guān)代謝等,分析這些代謝途徑及其關(guān)鍵基因,就有可能在基因水平上了解微生物是否具有合成真菌毒素的潛力。一些目前已知的真菌毒素是由萜烯類代謝產(chǎn)生的,如單端孢霉烯族毒素(trichothecenes)。在雅致放射毛霉基因組中注釋到41個萜烯類基因簇的基因,在KEGG代謝途徑中,與萜類化合物代謝相關(guān)的基因僅注釋到3個,且分布在不同的代謝途徑中,在萜類化合物代謝途徑中并沒有注釋到相對完整的代謝途徑基因,可認為不具有合成該物質(zhì)的能力。我們在雅致放射毛霉CJ-6的基因組中沒有比對到細菌、真菌中已報道的真菌毒素關(guān)鍵合成酶,說明在雅致放射毛霉中基本不存在PKS及PKS-NRPS混合代謝合成的相關(guān)基因及代謝途徑,僅注釋到少量NRPS相關(guān)基因。結(jié)果表明,雅致放射毛霉不具有合成這些真菌毒素的能力,這可能也解釋了為什么在許多雅致放射毛霉發(fā)酵的腐乳中沒有檢測到真菌毒素。微生物基因組不僅包含與物種穩(wěn)定遺傳和進化多樣性相關(guān)的編碼基因這種功能區(qū)域,同時也有許多重要的非編碼區(qū)也參與調(diào)控生物體的各個方面。基于基因序列的分析為我們探索微生物的多樣性、生存環(huán)境的適應(yīng)性及其復制、轉(zhuǎn)錄和翻譯提供了詳細的遺傳信息[25]。
本文利用從頭測序技術(shù)對雅致放射毛霉CJ-6進行了全基因組測序、組裝及基因功能注釋,并結(jié)合其他2種已公開霉菌(米曲霉RIB40和總狀毛霉B9645)的全基因組數(shù)據(jù)進行比較基因組學分析,以了解該菌株產(chǎn)生毒素的潛在能力,并驗證其在腐乳生產(chǎn)工業(yè)中的安全性。我們從基因水平初步分析了雅致放射毛霉CJ-6的代謝途徑和安全性,為進一步分析其次級代謝產(chǎn)物和調(diào)控其在腐乳發(fā)酵中的風味形成奠定了理論基礎(chǔ)。然而,僅通過比較基因組學分析還不能徹底發(fā)掘雅致放射毛霉在腐乳發(fā)酵中的作用,需要進一步的分析如轉(zhuǎn)錄組學、基因敲除等研究方法來確定雅致放射毛霉的關(guān)鍵基因,從而明確其代謝機制,以便我們能將其更徹底地運用到腐乳發(fā)酵工業(yè)中。