張雨薇 ,劉煜峰 ,陳義華 *
(1. 中國(guó)科學(xué)院微生物研究所微生物資源前期開(kāi)發(fā)國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100101;2. 中國(guó)科學(xué)院大學(xué)生命科學(xué)學(xué)院,北京 100049;3. 中國(guó)科學(xué)院大學(xué)存濟(jì)醫(yī)學(xué)院,北京 100049)
上世紀(jì)40 年代以來(lái),土壤、海洋等環(huán)境中的微生物所產(chǎn)生的活性天然產(chǎn)物成為藥物的重要來(lái)源之一[1]。在2 代測(cè)序技術(shù)發(fā)展起來(lái)以前,人們已經(jīng)認(rèn)識(shí)到人體中存在著大量的微生物,并通過(guò)傳統(tǒng)手段分離獲得一些它們所產(chǎn)生的活性化合物,從而拉開(kāi)了人體微生物天然產(chǎn)物研究的序幕。近年來(lái),人類(lèi)微生物組計(jì)劃(Human Microbiome Project,HMP)[2]、人類(lèi)腸道宏基因組計(jì)劃(Metagenomics of the Human Intestinal Tract,MetaHIT)[3]等組學(xué)研究的開(kāi)展,更新了研究人員對(duì)人體內(nèi)微生物數(shù)量和多樣性的了解,也拓展了其對(duì)人體微生物天然產(chǎn)物的結(jié)構(gòu)類(lèi)型和豐富程度的認(rèn)識(shí)。人體微生物作為活性天然產(chǎn)物的潛在重要來(lái)源的概念正逐漸被更多的研究者認(rèn)可[4-8]。
與環(huán)境來(lái)源的微生物相比,人體微生物經(jīng)歷了與人體環(huán)境的長(zhǎng)期共同進(jìn)化過(guò)程[9],適應(yīng)了人體和人體微生物群落構(gòu)成的復(fù)雜而獨(dú)特的內(nèi)部生態(tài)系統(tǒng)。這決定了人體微生物產(chǎn)生的小分子化合物天然靶向人體或人體微生物組來(lái)行使信號(hào)傳遞、免疫調(diào)節(jié)、種間競(jìng)爭(zhēng)等功能的活性特征[5]。與人體健康之間的天然聯(lián)系暗示著人體微生物天然產(chǎn)物具有良好的成藥性。另外,有些病原菌所產(chǎn)生的天然產(chǎn)物與其致病性密切相關(guān),對(duì)這類(lèi)天然產(chǎn)物的研究將有助于發(fā)展預(yù)防和治療相關(guān)疾病的新型診療手段[4,10]?;谙嚓P(guān)認(rèn)知,近年來(lái)人體微生物天然產(chǎn)物研究備受重視,得到了快速發(fā)展。本文將以發(fā)現(xiàn)人體微生物活性天然產(chǎn)物的策略為脈絡(luò),介紹近年來(lái)報(bào)道的代表性天然產(chǎn)物的發(fā)現(xiàn)方法、結(jié)構(gòu)特點(diǎn)及其活性特征,以期為進(jìn)一步優(yōu)化人體微生物活性天然產(chǎn)物的挖掘方法、促進(jìn)相關(guān)領(lǐng)域的研究提供思路。
如前所述,在2 代基因測(cè)序技術(shù)發(fā)展起來(lái)以前,研究者們利用傳統(tǒng)的天然產(chǎn)物發(fā)現(xiàn)策略已獲得了一些人體微生物產(chǎn)生的活性化合物。這一策略的實(shí)現(xiàn)依賴(lài)于對(duì)菌株的分離和培養(yǎng),之后在活性指導(dǎo)下借助高效液相色譜法(high performance liquid chromatography,HPLC)、 質(zhì)譜(mass spectrum,MS)等手段對(duì)菌株代謝物進(jìn)行分析,并利用液相色譜-質(zhì)譜法(liquid chromatography/mass spectrometry,LC/MS)、串聯(lián)質(zhì)譜法(tandem mass spectrometry,MS/MS)、核磁共振(nuclear magnetic resonance,NMR)等經(jīng)典的化學(xué)手段對(duì)目標(biāo)化合物進(jìn)行結(jié)構(gòu)表征(見(jiàn)圖1)。利用傳統(tǒng)的天然產(chǎn)物發(fā)現(xiàn)策略在人體微生物中獲得的活性天然產(chǎn)物大多為核糖體合成和翻譯后修飾多肽類(lèi)(ribosomally synthesized and post-translationally modified peptides,RiPPs) 化合物。它們通常抑制親緣關(guān)系較近的物種,具有較窄的抗菌譜,在協(xié)助產(chǎn)生菌占據(jù)和維持生態(tài)位方面發(fā)揮作用。在以往的很多研究中對(duì)這類(lèi)化合物都進(jìn)行了詳細(xì)的介紹[5,7],圖1 簡(jiǎn)單列舉了幾種代表性化合物。從表皮葡萄球菌(Staphylococcus epidermidis)中分離的表皮抗菌肽(epidermin)能夠有效抑制與表皮葡萄球菌競(jìng)爭(zhēng)皮膚生態(tài)位的痤瘡丙酸桿菌(Propionibacterium acnes)[11];由唾液鏈球菌(Streptococcus salivarius)產(chǎn)生的salivaricin B 對(duì)唾液鏈球菌、化膿鏈球菌(Streptococcus pyogenes)、輕型鏈球菌(Streptococcus mitis)、藤黃微球菌(Micrococcus luteus)等常見(jiàn)人體微生物具有抑制活性[12];大腸埃希菌(Escherichia coli)能夠產(chǎn)生多種相對(duì)分子質(zhì)量較小的小菌素(microcins),其中MccC7 具有腺苷酸化修飾的C 端,對(duì)肺炎克雷伯菌(Klebsiella pneumoniae)、沙門(mén)菌屬(Salmonella)、耶爾森菌屬(Yersinia)等微生物都具有抑制活性[13]。
圖1 基于傳統(tǒng)策略獲得人體微生物活性天然產(chǎn)物Figure 1 Obtaining bioactive natural products from human microbiota based on traditional strategies
除此之外,利用傳統(tǒng)的天然產(chǎn)物發(fā)現(xiàn)策略也從人體微生物中發(fā)現(xiàn)了少數(shù)其他類(lèi)型的化合物。與其他生境中的生物一樣,人體微生物之間也存在著激烈的營(yíng)養(yǎng)和生態(tài)位競(jìng)爭(zhēng),它們?cè)陂L(zhǎng)期的共存中發(fā)展出了能夠相互抑制的“分子武器”。在人體的皮膚或上呼吸道這類(lèi)營(yíng)養(yǎng)物質(zhì)貧乏的環(huán)境中,人體微生物之間的競(jìng)爭(zhēng)可能尤為激烈[14-15]?;谶@一生態(tài)學(xué)假設(shè),Zipperer 等[16]從一系列鼻腔共生菌中篩選到了可以抑制同一生態(tài)位的條件致病菌——金黃色葡萄球菌(Staphylococcus aureus)生長(zhǎng)的路鄧葡萄球菌(Staphylococcus lugdunensis)IVK28。隨后,通過(guò)非靶向轉(zhuǎn)座子誘變,作者以抑制金黃色葡萄球菌活性為指示,對(duì)突變株與野生型菌株的代謝譜進(jìn)行比對(duì)分析后,分離得到了具有良好抗菌活性的非核糖體多肽(non-ribosomal peptides,NRPs)類(lèi)化合物lugdunin(見(jiàn)圖1)。此外,lugdunin 還顯示出對(duì)耐甲氧西林金黃色葡萄球菌 (methicillin-resistantS.aureus,MRSA)、耐萬(wàn)古霉素腸球菌(vancomycinresistantEnterococcus,VRE)和單核細(xì)胞增生李斯特菌(Listeria monocytogenes)的良好抑制活性,并在小鼠金黃色葡萄球菌皮膚感染模型中起到了抑制感染的作用。后續(xù)研究中,Bitschar 等[17]還發(fā)現(xiàn)lugdunin 能夠與人體產(chǎn)生的抗菌肽DCD-1L 以及LL-37 協(xié)同作用,發(fā)揮對(duì)MRSA 的殺菌作用,并能夠增強(qiáng)人原代角質(zhì)形成細(xì)胞的先天免疫反應(yīng)。這些結(jié)果顯示出lugdunin 潛在的應(yīng)用價(jià)值,也展現(xiàn)了生態(tài)學(xué)觀念的引入在人體微生物活性天然產(chǎn)物挖掘過(guò)程中的重要性。
類(lèi)似地,研究者們利用活性導(dǎo)向的天然產(chǎn)物發(fā)現(xiàn)方法對(duì)一些人體益生菌的產(chǎn)物進(jìn)行了表征。多項(xiàng)研究表明,益生菌植物乳桿菌(Lactobacillus plantarum)能夠減少體內(nèi)炎癥[18],其發(fā)酵液在體外試驗(yàn)中也顯示出對(duì)核因子κB(nuclear factorkappa B,NF-κB)信號(hào)通路相應(yīng)的調(diào)節(jié)功能[19]。通過(guò)主成分分析(principal component analysis,PCA)探究植物乳桿菌不同生長(zhǎng)階段代謝產(chǎn)物的差異,Zvanych 等[20]從中鑒定出了4 個(gè)具有獨(dú)特焦谷氨酸環(huán)結(jié)構(gòu)的pyro-dipeptides 類(lèi)化合物。其中,pyro-phenylalanine 和pyro-tryptophan(見(jiàn)圖1)在小鼠腹腔注射實(shí)驗(yàn)中能夠顯著減少脾臟產(chǎn)生的γ 干擾素(interferon-gamma,IFN-γ),顯示出這類(lèi)化合物潛在的抗炎能力。
除了挖掘?qū)θ祟?lèi)健康有益的人體微生物天然產(chǎn)物,研究者們還利用傳統(tǒng)的天然產(chǎn)物發(fā)現(xiàn)策略研究了人體病原菌的毒力因子,其中最典型的例子就是tilivalline(見(jiàn)圖1)的發(fā)現(xiàn)。2014 年,Schneditz 等[21]以對(duì)人上皮細(xì)胞的細(xì)胞毒作用為指示,利用轉(zhuǎn)座子誘變,從引發(fā)抗生素相關(guān)出血性結(jié)腸炎(antibioticassociated hemorrhagic colitis,AAHC)的病原菌產(chǎn)酸克雷伯菌(Klebsiella oxytoca)中鑒定出該菌產(chǎn)生的細(xì)胞毒分子tilivalline,通過(guò)體外試驗(yàn)和動(dòng)物模型驗(yàn)證了tilivalline 對(duì)腸道黏膜和屏障功能的破壞,揭示了產(chǎn)酸克雷伯菌引發(fā)結(jié)腸炎的可能機(jī)制之一,并提供了潛在的診斷標(biāo)志物和治療策略??梢?jiàn),研究人體病原菌產(chǎn)生的天然產(chǎn)物也能夠促進(jìn)病原菌相關(guān)疾病預(yù)防和治療手段的發(fā)展。
利用傳統(tǒng)策略挖掘人體微生物產(chǎn)生的活性天然產(chǎn)物具有不依賴(lài)于序列預(yù)測(cè)、能夠以目標(biāo)活性或結(jié)構(gòu)特征為導(dǎo)向等優(yōu)勢(shì)。然而,該方法在應(yīng)用過(guò)程中也存在不少限制因素,例如:對(duì)可培養(yǎng)菌株的依賴(lài)性,以及難以避免對(duì)已知化合物的重復(fù)發(fā)現(xiàn)。令人鼓舞的是,培養(yǎng)組學(xué)(culturomics)的應(yīng)用和發(fā)展使得越來(lái)越多的人體微生物能夠被培養(yǎng)[22-23],該方法首次在多種人體糞便樣品中應(yīng)用就將可培養(yǎng)的人體腸道細(xì)菌數(shù)量從原先的688 種增加到了1 057種[24];此外,基于LC/MS,MS/MS 和NMR 數(shù)據(jù)的去重復(fù)方法的進(jìn)步也賦予了傳統(tǒng)天然產(chǎn)物發(fā)現(xiàn)方法新的活力[25],這一策略依然能夠在未來(lái)人體微生物活性天然產(chǎn)物發(fā)現(xiàn)中提供有力的幫助。
自HMP 等計(jì)劃開(kāi)展以來(lái),對(duì)于人體微生物領(lǐng)域的持續(xù)研究積累了大量的組學(xué)數(shù)據(jù),這讓研究人員越來(lái)越清晰地認(rèn)識(shí)到人體中蘊(yùn)藏有豐富的微生物和微生物代謝產(chǎn)物資源[26-29]。另外,基因組文庫(kù)高通量篩選方法的優(yōu)化、(宏)基因組數(shù)據(jù)中生物合成基因簇(biosynthetic gene clusters,BGCs)識(shí)別算法和分析工具的不斷更新,以及針對(duì)不同種類(lèi)微生物遺傳操作方法和異源表達(dá)系統(tǒng)的建立,有力地推動(dòng)了通過(guò)基因組挖掘來(lái)獲取人體微生物天然產(chǎn)物的方法進(jìn)步。相關(guān)研究根據(jù)出發(fā)點(diǎn)不同可以分為功能導(dǎo)向和序列導(dǎo)向2 種策略(見(jiàn)圖2)。
圖2 基于基因組挖掘方法獲得人體微生物活性天然產(chǎn)物Figure 2 Obtaining bioactive natural products from human microbiota by genome mining
功能導(dǎo)向的人體微生物基因組挖掘以功能宏基因組學(xué)相關(guān)的工作為代表,該方法首先提取特定環(huán)境微生物組的脫氧核糖核酸(deoxyribonucleic acid,DNA)來(lái)構(gòu)建宏基因組文庫(kù),隨后針對(duì)該文庫(kù)產(chǎn)生的特定活性的化合物進(jìn)行高通量篩選,獲得具有目標(biāo)活性的化合物后,再?gòu)膶?duì)應(yīng)的克隆中鑒定出負(fù)責(zé)產(chǎn)生活性天然產(chǎn)物的基因序列。Cohen等[30]利用人體糞便樣本提取的DNA 構(gòu)建了約含有75 000 個(gè)克隆的宏基因組文庫(kù),隨后利用細(xì)胞報(bào)告系統(tǒng)來(lái)篩選具有調(diào)節(jié)NF-κB 活性的克隆,再通過(guò)轉(zhuǎn)座子誘變確認(rèn)產(chǎn)生相關(guān)化合物的基因。這一過(guò)程鑒定出26個(gè)獨(dú)特的人體共生細(xì)菌效應(yīng)基因(commensal bacteria effector genes)。其中的1 個(gè)效應(yīng)基因家族Cbeg12被注釋為N-?;D(zhuǎn)移酶,能夠催化產(chǎn)生新穎的N-?;0奉?lèi)天然產(chǎn)物commendamide(見(jiàn)圖2)。在隨后針對(duì)242 種G 蛋白偶聯(lián)受體(G proteincoupled receptors,GPCRs)的活性篩選中,發(fā)現(xiàn)commendamide 可以特異性地激活調(diào)節(jié)細(xì)胞增殖和免疫的關(guān)鍵受體GPCR132/G2A。此外,與Cbeg12高度同源的基因存在于一些人體共生擬桿菌中,在普通擬桿菌(Bacteroides vulgatus)的發(fā)酵液中也能夠直接檢測(cè)到commendamide,提示人體共生擬桿菌可能會(huì)產(chǎn)生commendamide,并通過(guò)GPCR132/G2A 參與對(duì)宿主免疫的影響。Commendamide 的結(jié)構(gòu)與一些人體內(nèi)源性代謝物類(lèi)似,它的發(fā)現(xiàn)和功能鑒定顯示出人體微生物具有通過(guò)模擬宿主內(nèi)源性信號(hào)分子來(lái)實(shí)現(xiàn)與宿主相互作用的能力。在此基礎(chǔ)上,Cohen 等[31]在后續(xù)工作中系統(tǒng)地分析和研究了HMP 數(shù)據(jù)中的N-?;D(zhuǎn)移酶,并發(fā)現(xiàn)了人體微生物產(chǎn)生的更多類(lèi)型的N-酰基酰胺以及它們對(duì)其他GPCRs 的影響。近年來(lái),Piscotta 等[32]利用功能宏基因組學(xué)對(duì)14 個(gè)健康嬰兒的糞便樣本進(jìn)行研究,不僅在針對(duì)NF-κB 調(diào)節(jié)活性的篩選中再次驗(yàn)證了commendamide 的產(chǎn)生及其功能,還鑒定出一些具有誘導(dǎo)細(xì)胞自噬或調(diào)節(jié)氧化還原電位功能的效應(yīng)基因??梢?jiàn),功能宏基因組學(xué)在建立人體微生物組序列和功能的關(guān)聯(lián)方面具有突出優(yōu)勢(shì)。
(宏)基因組研究伴隨著DNA 測(cè)序技術(shù)的快速進(jìn)步,為人體微生物天然產(chǎn)物挖掘提供了大量可用的序列信息,同時(shí)也對(duì)序列和數(shù)據(jù)的分析提出了更高的要求。負(fù)責(zé)天然產(chǎn)物產(chǎn)生的基因通常共定位于基因組鄰近區(qū)域形成BGC,而且一般來(lái)說(shuō)具有某些特征序列?;谶@一特性,研究者們開(kāi)發(fā)了多種預(yù)測(cè)和評(píng)估BGC 的方法。表1 展示了目前常用的部分BGC 預(yù)測(cè)工具。序列導(dǎo)向的人體微生物基因組挖掘研究基于對(duì)(宏)基因組序列的深入分析,通過(guò)針對(duì)性地選取目標(biāo)BGC 來(lái)進(jìn)行研究。已開(kāi)展的工作中研究的BGCs 有的具有高度的新穎性或突出的代表性;有的來(lái)源于高豐度物種或與人體健康、疾病有密切關(guān)聯(lián)的物種;有的則能夠被其他組學(xué)數(shù)據(jù)映射,具有潛在的生理學(xué)意義。對(duì)已經(jīng)開(kāi)展的研究進(jìn)行歸納,根據(jù)所采取研究策略的不同可以分為以下3 類(lèi)。
表 1 常用的生物合成基因簇預(yù)測(cè)工具Table 1 Commonly used biosynthetic gene cluster prediction tools
2.2.1 在原始菌株中進(jìn)行原位挖掘人體腸道和口腔是微生物豐度最高的2 個(gè)部位。與腸道微生物天然產(chǎn)物一樣,口腔微生物所蘊(yùn)含的活性天然產(chǎn)物資源也引發(fā)了研究人員廣泛的興趣。在已經(jīng)開(kāi)展的口腔微生物天然產(chǎn)物研究中,針對(duì)變形鏈球菌(Streptococcus mutans)的研究具有一定的代表性。變形鏈球菌在人類(lèi)口腔中普遍存在且長(zhǎng)期被認(rèn)為與齲齒相關(guān)[52]。Ajdi? 等[53]在詳細(xì)分析S. mutansUA159 的基因組后,從中鑒定出了TnSmu2 基因組島。隨后對(duì)這一區(qū)域進(jìn)行比較分析,發(fā)現(xiàn)不同變形鏈球菌中該基因組島可能包含了不同類(lèi)型的BGCs[54]。通過(guò)敲除S. mutansUA159 該區(qū)域中編碼聚酮合酶-非核糖體肽合成酶(polyketide synthasenonribosomal peptide synthetase,PKS-NRPS)雜合酶的mub基因,研究者們鑒定出了具有特殊的C—C成鍵大環(huán)和含氮、硫七元雜環(huán)結(jié)構(gòu)的mutanobactin A[55],并在隨后的幾項(xiàng)研究中發(fā)現(xiàn)了一系列類(lèi)似物mutanobactin B-J[56-57]。筆者課題組通過(guò)研究發(fā)現(xiàn)mutanobactins 類(lèi)化合物在生物合成過(guò)程中通過(guò)還原酶結(jié)構(gòu)域釋放帶有醛基末端的線(xiàn)性脂肽,再歷經(jīng)3 步非酶催化反應(yīng)產(chǎn)生mutanobactins,而這一過(guò)程中自發(fā)的C—S 鍵形成和C—C 鍵斷裂極大豐富了mutanobactins 的結(jié)構(gòu)多樣性[58]。此外,在mutanobactins 的研究過(guò)程中,還利用基于MS/MS的算法iSNAP(informatic search algorithm for natural products)鑒定了該基因簇的中間產(chǎn)物mutanamide[57]。與口腔中變形鏈球菌需要應(yīng)對(duì)氧脅迫以及該菌與白念珠菌(Candida albicans)密切關(guān)聯(lián)等事實(shí)相符,mub的存在有利于變形鏈球菌的抗氧化能力,部分mutanobactins 類(lèi)化合物也表現(xiàn)出對(duì)白念珠菌菌絲形成和生物膜形成的有效抑制。此外,在利用脂多糖刺激的RAW264.7 巨噬細(xì)胞中,mutanobactin B(見(jiàn)圖2)能夠顯著上調(diào)促炎細(xì)胞因子白細(xì)胞介素-6(interleukin-6,IL-6)和IL-12 的表達(dá),并下調(diào)單核細(xì)胞趨化蛋白-1(monocyte chemotactic protein-1,MCP-1)、粒細(xì)胞集落刺激因子(granulocyte colony-stimulating factor,G-CSF)和腫瘤壞死因子-α(tumor necrosis factor-α,TNF-α)的表達(dá)。
最近,Li 等[59]通過(guò)對(duì)S. mutansNMT4863 中編碼PKS-NRPS 雜合酶的muf進(jìn)行敲除,發(fā)現(xiàn)了一系列mutanofactins 類(lèi)化合物(見(jiàn)圖2)。Mutanofactins能夠非特異性結(jié)合變形鏈球菌細(xì)胞并改變細(xì)菌表面的物理化學(xué)性質(zhì)(增加細(xì)菌疏水性),還能直接與胞外DNA 結(jié)合并促進(jìn)胞外DNA 介導(dǎo)的細(xì)胞聚集作用,從而以劑量依賴(lài)的方式促進(jìn)細(xì)菌細(xì)胞的自聚集、細(xì)菌間的粘附,以及隨后的生物膜形成。這一特征可能有助于mutanofactins 產(chǎn)生菌在牙菌斑生物膜形成過(guò)程中與周?chē)淖冃捂溓蚓蚱渌⑸锝Y(jié)合,促進(jìn)其在口腔中的定植,并影響生物膜的組成和結(jié)構(gòu)。
此外,人體其他部位的微生物同樣具有產(chǎn)生活性天然產(chǎn)物的巨大潛能。2014 年,Cimermancic等[39]開(kāi)發(fā)了基于隱馬爾可夫模型(Hidden Markov Model,HMM)的概率算法ClusterFinder,擴(kuò)大了所能預(yù)測(cè)的BGC 類(lèi)型和范圍。Donia 等[60]利用ClusterFinder,從2 430 個(gè)HMP 參考基因組中預(yù)測(cè)出14 000 余個(gè)BGCs,其中,3 118 個(gè)出現(xiàn)在健康人體微生物組中,且超過(guò)一半BGCs 分布于腸道和口腔中;基于編碼硫肽類(lèi)核糖體肽BGC 在HMP 數(shù)據(jù)中體現(xiàn)出的廣泛性,以及已報(bào)道硫肽類(lèi)化合物的良好活性,作者選取了其中1 個(gè)與抗生素高硫青霉素(thiocillin)的BGC 相似的bgc66進(jìn)行了研究。通過(guò)比較1 株分離自陰道的含有bgc66的格氏乳桿菌(Lactobacillus gasseri)JV-V03 的野生型與基因簇插入突變株的代謝譜,獲得了新穎的天然產(chǎn)物lactocillin(見(jiàn)圖2)?;钚詼y(cè)試發(fā)現(xiàn)lactocillin 可以抑制革蘭陽(yáng)性菌生長(zhǎng),對(duì)病原菌金黃色葡萄球菌和糞腸球菌(Enterococcus faecalis)都表現(xiàn)出了納摩爾水平的抗菌活性。
若含有目標(biāo)BGC 的菌株易于培養(yǎng)且能夠進(jìn)行遺傳操作,可以針對(duì)BGC 中的關(guān)鍵基因,構(gòu)建突變株,并通過(guò)代謝譜比對(duì),直接建立BGC 與化合物的關(guān)聯(lián)。這種原位挖掘的方式會(huì)較大程度地反映出天然產(chǎn)物產(chǎn)生的真實(shí)狀態(tài)。然而,在實(shí)際研究中,很多人體微生物難以分離和培養(yǎng),有些雖然可以培養(yǎng)但無(wú)法遺傳操作,往往需要通過(guò)原位挖掘以外的策略來(lái)獲取它們產(chǎn)生的天然產(chǎn)物。
2.2.2 通過(guò)異源表達(dá)進(jìn)行挖掘得益于培養(yǎng)組學(xué)等方法在人體微生物研究中的應(yīng)用,實(shí)驗(yàn)室條件下可培養(yǎng)的人體微生物數(shù)量持續(xù)增加。然而,一些低豐度物種的分離依然很困難,針對(duì)不同微生物建立穩(wěn)定的培養(yǎng)和遺傳操作方法也需要投入大量時(shí)間和精力。即便是在可培養(yǎng),并已成功實(shí)現(xiàn)遺傳操作的種屬內(nèi),不同菌株之間的可操作性差異也阻礙了相關(guān)方法的廣泛應(yīng)用。因此,利用異源表達(dá)宿主來(lái)進(jìn)行人體微生物天然產(chǎn)物研究得到了廣泛的重視。
Guo 等[61]結(jié)合以往研究以及HMP 公布的最新數(shù)據(jù)鑒定了47 個(gè)未知功能的NRPS 類(lèi)BGCs,這些BGCs 存在于超過(guò)90%的HMP 糞便樣品中,且?guī)缀跬耆珌?lái)源于腸道微生物中的厚壁菌門(mén)(Firmicutes)梭菌綱(Clostridia)。由于梭菌的遺傳操作較為困難,作者利用2 種常用的異源表達(dá)宿主大腸埃希菌和枯草芽孢桿菌(Bacillus subtilis)選取了14 個(gè)序列和結(jié)構(gòu)域排布具有代表性的BGCs進(jìn)行異源表達(dá)。通過(guò)直接克隆或經(jīng)密碼子優(yōu)化后合成相關(guān)BGCs,將其轉(zhuǎn)入大腸埃希菌或枯草芽孢桿菌中,分別置于強(qiáng)啟動(dòng)子T7 或hyper-Pspac下進(jìn)行表達(dá),成功獲得了32 個(gè)pyrazinones 和dihydropyrazinones 類(lèi)化合物。作者根據(jù)這些化合物的結(jié)構(gòu)推測(cè)其環(huán)化由非酶促機(jī)制產(chǎn)生,而未發(fā)生環(huán)化的二肽醛(dipeptide aldehydes)形式前體可能是細(xì)菌的真正產(chǎn)物。結(jié)合肽醛類(lèi)化合物在以往研究中表現(xiàn)出的蛋白酶抑制活性,作者通過(guò)體外研究發(fā)現(xiàn)其中一些二肽醛確實(shí)具有類(lèi)似的活性,如:Phe-Phe-H 對(duì)于組織蛋白酶表現(xiàn)出顯著的選擇性(見(jiàn)圖2)??紤]到組織蛋白酶在免疫監(jiān)視中的作用,以及編碼產(chǎn)生二肽醛的BGCs在腸道中廣泛存在,這一研究結(jié)果提示人體微生物可能通過(guò)產(chǎn)生具有組織蛋白酶抑制活性的天然產(chǎn)物來(lái)影響宿主免疫,從而促進(jìn)自身定植。
大腸埃希菌和枯草芽孢桿菌等常用異源表達(dá)宿主在表達(dá)部分厭氧微生物的BGCs 時(shí)表現(xiàn)出一定的局限性?;诖?,筆者課題組以兼性厭氧菌S.mutansUA159 作為異源表達(dá)宿主,利用其天然感受態(tài)建立了適用于低G+C 含量的厭氧菌的大片段克隆技術(shù)——基于自然感受態(tài)的大片段克隆技術(shù)(natural competence based large DNA fragment cloning,NabLC)[62]。NabLC克隆過(guò)程中不需要引入中間載體,能夠避免由于載體不穩(wěn)定或不兼容引起的克隆失敗問(wèn)題。利用該技術(shù),課題組對(duì)不同來(lái)源的低G+C 含量的厭氧菌BGCs 成功實(shí)現(xiàn)了克隆和表達(dá),包括來(lái)源于表皮葡萄球菌的pyrazinones 類(lèi)化合物的BGC和S. mutans35 中編碼PKS-NRPS 雜合酶的BGC,后者能夠產(chǎn)生tetramic acids 類(lèi)化合物mutanocyclin(見(jiàn)圖2)?;钚詼y(cè)試發(fā)現(xiàn)mutanocyclin 具有抑制免疫細(xì)胞浸潤(rùn)的活性,并表現(xiàn)出抑制白念珠菌菌絲形成的能力[63]。隨后,Tang 等[64]通過(guò)對(duì)S. mutansB04Sm5 直接進(jìn)行遺傳操作也檢測(cè)到了mutanocyclin 的產(chǎn)生,還發(fā)現(xiàn)了muc基因簇可以產(chǎn)生reutericyclins 類(lèi)化合物。其中,reutericyclin A 也曾經(jīng)從羅伊乳桿菌(Limosilactobacillus reuteri)中分離得到[65]。Reutericyclins 具有廣譜抗革蘭陽(yáng)性菌活性,不僅對(duì)乳桿菌、枯草芽孢桿菌、金黃色葡萄球菌等菌種具有抗菌作用,還能夠抑制血鏈球菌(Streptococcus sanguinis)、戈登鏈球菌(Streptococcus gordonii)、輕型鏈球菌等與變形鏈球菌競(jìng)爭(zhēng)同一生態(tài)位的口腔微生物。據(jù)推測(cè),reutericyclins 是mutanocyclin 生物合成過(guò)程中的中間代謝產(chǎn)物,能夠被mucF編碼的脫?;皋D(zhuǎn)化為mutanocyclin,從而在不同情況下為變形鏈球菌提供更多生存優(yōu)勢(shì)。
已開(kāi)發(fā)的大部分BGC 預(yù)測(cè)工具一般適用于基因組信息較為完整的物種,而在分析一些從臨床人體微生物樣本獲得的微量、碎片化測(cè)序結(jié)果時(shí)可能會(huì)遺失很多新穎BGC 的信息;此外,最近的幾項(xiàng)宏基因組研究揭示了人體微生物組中還有很多尚未被測(cè)序的罕見(jiàn)微生物,它們的BGCs 依然有待挖掘。為了突破這一限制,Sugimoto 等[45]開(kāi)發(fā)了MetaBGC 算法,該算法包含Build,Identify,Quantify 和Cluster 4 個(gè)模塊。 其中,Build 模塊基于輪廓隱馬爾可夫模型(profile Hidden Markov Models,pHMMs)開(kāi)發(fā)了分段pHMMs(segmented pHMMs,spHMMs)算法,能夠直接從讀段(read)水平(約100 bp)的人體微生物宏基因組數(shù)據(jù)中識(shí)別BGCs,在一定程度上避免了對(duì)低豐度序列的遺漏。此外,MetaBGC 還具有較高的運(yùn)算效率,便于同時(shí)分析大量宏基因組樣本。利用該方法,研究者針對(duì)HMP 以及MetaHIT 的2 544 個(gè)宏基因組樣本進(jìn)行了分析,從中鑒定出13 個(gè)完整的Ⅱ型PKS BGCs,并通過(guò)將公開(kāi)的轉(zhuǎn)錄組數(shù)據(jù)映射到已鑒定的BGCs 中,證明其中至少6 個(gè)BGCs 能夠在人體內(nèi)表達(dá)。隨后,作者利用異源表達(dá)的方法對(duì)1 個(gè)口腔來(lái)源的BGC(bgc3)和1 個(gè)腸道來(lái)源的BGC(bgc6)進(jìn)行了研究。他們依據(jù)鏈霉菌屬的密碼子偏好性?xún)?yōu)化后合成了bgc3,并整合至白色鏈霉菌(Streptomyces albus)J1074 中進(jìn)行表達(dá),最終鑒定得到了metamycins A-D;另外,還從Blautia wexleraeDSM 19850 中克隆了bgc6,將其置于大腸埃希菌-枯草芽孢桿菌穿梭載體中的強(qiáng)啟動(dòng)子下游,整合至基因組平均G+C 含量與Blautia wexlerae(41.5%)接近的枯草芽孢桿菌(Bacillus subtilis)168sfp+(43.5%)中進(jìn)行表達(dá),成功獲得了蒽環(huán)類(lèi)聚酮化合物wexrubicin。活性測(cè)試發(fā)現(xiàn)wexrubicin,metamycin A 和metamycin B 對(duì)測(cè)試細(xì)胞和菌株無(wú)明顯毒性,metamycin C 和metamycin D(見(jiàn)圖2)對(duì)一些革蘭陽(yáng)性菌,尤其是鏈球菌屬、奇異菌屬(Atopobium)、放線(xiàn)菌屬(Actinomyces)、羅斯菌屬(Rothia)以及棒狀桿菌屬(Corynebacterium)的口腔分離株具有良好的抑制活性,提示bgc3有利于宿主菌競(jìng)爭(zhēng)口腔生態(tài)位,這一結(jié)果也和轉(zhuǎn)錄組分析顯示的bgc3在人齦上菌斑樣本中早期生物膜形成期間表達(dá)的現(xiàn)象一致。
目前,利用已有的序列分析程序預(yù)測(cè)BGCs,再根據(jù)目標(biāo)BGCs 特性選擇合適的異源宿主進(jìn)行表達(dá),已經(jīng)成功實(shí)現(xiàn)了對(duì)多種不同來(lái)源、不同類(lèi)型的BGCs 的表征。隨著更多BGC 克隆方法的建立和完善、DNA 合成成本的下降以及可作為異源表達(dá)宿主的菌株列表的擴(kuò)充,異源表達(dá)策略有望在人體微生物活性天然產(chǎn)物的挖掘中發(fā)揮更重要的作用。
2.2.3 化學(xué)合成手段助力挖掘不管是通過(guò)原位激活,還是通過(guò)異源表達(dá)來(lái)獲取目標(biāo)天然產(chǎn)物,都需要較長(zhǎng)的研究周期,可否獲得目標(biāo)化合物具有不確定性。隨著基于序列信息預(yù)測(cè)天然產(chǎn)物結(jié)構(gòu)的準(zhǔn)確性越來(lái)越高,在結(jié)構(gòu)預(yù)測(cè)基礎(chǔ)上直接通過(guò)有機(jī)合成來(lái)制備目標(biāo)化合物,減少了微生物培養(yǎng)、BGC 表達(dá)、產(chǎn)物分離純化等過(guò)程中可能存在的限制和不確定性。這一方法在挖掘不含修飾或具有簡(jiǎn)單修飾的RiPPs 類(lèi)以及NRPs 類(lèi)化合物時(shí)得到了成功應(yīng)用。
例如,Chu 等[66]發(fā)展了將BGC 預(yù)測(cè)與化學(xué)合成相結(jié)合的方法來(lái)研究人體微生物中的天然產(chǎn)物,利用該方法獲得的分子稱(chēng)為合成-生物信息學(xué)天然產(chǎn)物(synthetic-bioinformatic natural products,syn-BNPs)[47]。作者利用抗生素和次級(jí)代謝產(chǎn)物分析工具(antibiotics and secondary metabolite analysis shell,antiSMASH)對(duì)HMP 和人類(lèi)口腔微生物組數(shù)據(jù)庫(kù)(human oral microbiome database,HOMD)中的基因組進(jìn)行預(yù)測(cè),并選取其中的NRPS 類(lèi)BGCs 進(jìn)行后續(xù)研究??紤]到產(chǎn)物少于5 個(gè)氨基酸的非核糖體肽通常被高度修飾,經(jīng)過(guò)長(zhǎng)度篩選后鑒定出57 個(gè)預(yù)測(cè)產(chǎn)物多于或等于5 個(gè)氨基酸的NRPS 類(lèi)BGCs,排除其中不完整、包含PKS 模塊或雜環(huán)化結(jié)構(gòu)域的BGCs 后,利用NRPSPredictor2 等3 種NRPS 預(yù)測(cè)算法對(duì)25 個(gè)BGCs 的產(chǎn)物進(jìn)行了預(yù)測(cè)。根據(jù)預(yù)測(cè)結(jié)果,作者設(shè)計(jì)了30 個(gè)潛在的syn-BNPs。對(duì)于可能發(fā)生N-?;膕yn-BNPs,在合成時(shí)利用非核糖體肽中常見(jiàn)的β-羥基肉豆蔻酸進(jìn)行修飾,經(jīng)過(guò)2 輪固相多肽合成后成功獲得了其中25 個(gè)syn-BNPs。隨后,作者利用1 組常見(jiàn)人體共生菌和致病菌對(duì)syn-BNPs 進(jìn)行了抗菌活性篩選,發(fā)現(xiàn)來(lái)源于馬紅球菌(Rhodococcus equi)的humimycin A 和紅串紅球菌(Rhodococcus erythropolis)的humimycin B(見(jiàn)圖2)對(duì)于厚壁菌門(mén)、放線(xiàn)菌門(mén)(Actinomycetes)的測(cè)試菌株具有抗菌活性,尤其對(duì)金黃色葡萄球菌(包括一些耐甲氧西林金黃色葡萄球菌的臨床分離株)和肺炎鏈球菌(Streptococcus pneumoniae)表現(xiàn)出突出的抗菌活性。此外,作者還嘗試通過(guò)LC-MS檢測(cè)探究了紅球菌屬菌株的發(fā)酵液中是否能夠產(chǎn)生humimycins,但未觀察到此類(lèi)化合物的產(chǎn)生,暗示著在實(shí)驗(yàn)室條件下該BGC 可能不表達(dá),也印證了syn-BNPs 方法具有的潛在優(yōu)勢(shì)。
近年來(lái),人體微生物相關(guān)的組學(xué)數(shù)據(jù)增長(zhǎng)迅速,對(duì)研究者們的挖掘效率和準(zhǔn)確性提出了更為嚴(yán)格的要求。引入人工智能算法極大地提升了研究人員對(duì)海量數(shù)據(jù)進(jìn)行分析的能力,不僅在BGCs 預(yù)測(cè)方面突破了以往生物信息學(xué)分析工具在預(yù)測(cè)新穎BGCs,尤其是RiPPs 合成酶類(lèi)BGCs 時(shí)的局限,在化合物的活性和作用靶點(diǎn)預(yù)測(cè)、減少重復(fù)發(fā)現(xiàn)等方面也表現(xiàn)出了巨大的應(yīng)用潛力[67]。
BGCs 預(yù)測(cè)方面,表1 中所列的antiSMASH和RODEO 等工具包及時(shí)更新,在以往主要基于BLAST 和HMM 進(jìn)行BGCs 預(yù)測(cè)的基礎(chǔ)上,引入了二元分類(lèi)器支持向量機(jī)(support vector machine,SVM)等人工智能算法?;贖MM的ClusterFinder 在以往工作中已經(jīng)體現(xiàn)出識(shí)別新型BGCs 的強(qiáng)大功能,但該方法在準(zhǔn)確性上存在一定不足。基于自然語(yǔ)言處理(natural language processing,NLP)和深度學(xué)習(xí)(deep learning)策略的DeepBGC[47]在一定程度上彌補(bǔ)了ClusterFinder在準(zhǔn)確性方面的缺陷,在針對(duì)同一驗(yàn)證集的分析結(jié)果中,該方法相較于ClusterFinder 顯示出更高的識(shí)別精度和準(zhǔn)確率。最近,Liu 等[48]又發(fā)布了在此基礎(chǔ)上改進(jìn)的e-DeepBGC(extension of DeepBGC),在原有深度學(xué)習(xí)的基礎(chǔ)上引入了新的數(shù)據(jù)增強(qiáng)(data augmentation)步驟,以識(shí)別更多類(lèi)型的BGCs。RiPPs 合成酶類(lèi)BGCs 序列的高度多樣性,以及相關(guān)BGCs 基因的分散分布性,很長(zhǎng)時(shí)間以來(lái)都限制了該類(lèi)BGCs 的準(zhǔn)確預(yù)測(cè)和新型基因簇的發(fā)現(xiàn)。近幾年來(lái),一些針對(duì)RiPPs 合成酶類(lèi)BGCs 特點(diǎn)開(kāi)發(fā)的工具,如:NeuRiPP[46]和DeepRiPP[25],通過(guò)在預(yù)測(cè)過(guò)程中使用神經(jīng)網(wǎng)絡(luò)和自然語(yǔ)言處理在很大程度上突破了傳統(tǒng)預(yù)測(cè)方法的局限。
最近,筆者課題組與合作者基于attention、長(zhǎng)短期記憶(long short-term memory,LSTM)以及基于transformer 的雙向編碼器表征(bidirectional encoder representations from transformers,BERT)3 種自然語(yǔ)言處理神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了用于抗菌肽(antimicrobial peptides,AMPs)挖掘的方法[68](見(jiàn)圖3),預(yù)測(cè)精確度相比以往的預(yù)測(cè)工具大幅提高,達(dá)到91.31%。通過(guò)對(duì)4 409 個(gè)人體微生物代表性基因組進(jìn)行挖掘,筆者課題組與合作者鑒定了2×107余個(gè)候選AMPs。隨后,經(jīng)過(guò)與宏蛋白組學(xué)數(shù)據(jù)的交叉驗(yàn)證將候選AMPs 數(shù)量精簡(jiǎn)至2 349 個(gè)??紤]到具有抗菌活性的AMPs 和其能夠抑制的細(xì)菌之間存在潛在的負(fù)相關(guān)性,進(jìn)一步使用15 個(gè)獨(dú)立隊(duì)列的宏基因組數(shù)據(jù)構(gòu)建了AMP-微生物相關(guān)網(wǎng)絡(luò),將候選AMPs 的列表優(yōu)化到241 個(gè)。最后,通過(guò)多肽合成的方法成功獲得了216 個(gè)AMPs,并進(jìn)行了抗菌活性測(cè)試,陽(yáng)性率達(dá)到83.8%(181/216)。這些AMPs 與以往報(bào)道的AMPs 序列一致性均低于40%,說(shuō)明基于自然語(yǔ)言學(xué)習(xí)的方法可以有效發(fā)現(xiàn)新型AMPs。對(duì)活性突出的11 種AMPs 進(jìn)一步測(cè)試后顯示10 種AMPs 對(duì)多株臨床分離的多重耐藥細(xì)菌表現(xiàn)出良好抗菌活性。筆者課題組與合作者選擇了3 種在溶血性測(cè)試和細(xì)胞毒性測(cè)試中表現(xiàn)良好的AMPs 用于治療感染肺炎克雷伯菌的小鼠模型,觀察到了顯著的療效。進(jìn)一步對(duì)綜合活性最好的抗菌肽c_AMP1043 的細(xì)菌耐藥性進(jìn)行了測(cè)試,結(jié)果在30 天針對(duì)大腸埃希菌的抗性誘導(dǎo)實(shí)驗(yàn)后,未觀察到明顯耐藥性的產(chǎn)生。
圖3 人工智能輔助的人體微生物活性天然產(chǎn)物挖掘和分析Figure 3 AI-assisted mining and analysis of bioactive natural products from human microbiota
這一工作更新了從序列信息中挖掘活性天然產(chǎn)物發(fā)現(xiàn)的邏輯,證明在AMPs 等類(lèi)型的化合物發(fā)現(xiàn)過(guò)程中,人工智能方法的引入可以避開(kāi)BGCs 預(yù)測(cè)等步驟,直接發(fā)現(xiàn)具有特定生物活性的分子,大大簡(jiǎn)化了活性化合物的獲取過(guò)程。
人體內(nèi)蘊(yùn)藏著數(shù)量龐大的微生物群體,它們之間的相互作用及其對(duì)人體產(chǎn)生的影響與人類(lèi)的健康息息相關(guān)。人體微生物所產(chǎn)生的活性天然產(chǎn)物是人體環(huán)境長(zhǎng)期篩選的結(jié)果,對(duì)相關(guān)微生物適應(yīng)人體環(huán)境發(fā)揮著重要的作用。相應(yīng)地,這就決定了活性天然產(chǎn)物靶向人體或人體微生物組來(lái)行使生理功能的活性特征。目前,人們已經(jīng)發(fā)展了多種獲取人體微生物天然產(chǎn)物的研究策略,成功地獲得了一些化合物。對(duì)這些化合物的活性研究發(fā)現(xiàn)其往往具有免疫調(diào)節(jié)和抑制其他人體微生物的作用,但由于人體環(huán)境的復(fù)雜性和缺乏研究模型的限制,對(duì)其真實(shí)生理功能的理解進(jìn)展緩慢。
除了產(chǎn)生次級(jí)代謝產(chǎn)物之外,人體微生物通過(guò)代謝食物或人體分泌物產(chǎn)生的活性分子也能夠從多方面影響人體健康。例如:1)腸道微生物以膳食纖維或宿主分泌的黏蛋白為底物進(jìn)行發(fā)酵產(chǎn)生的短鏈脂肪酸(short-chain fatty acids,SCFAs)能夠激活GPCRs 或游離脂肪酸受體(free fatty acid receptors,F(xiàn)FARs),從而對(duì)維持腸道屏障、腸道運(yùn)動(dòng)、激素分泌等過(guò)程產(chǎn)生影響,并與非酒精性脂肪肝等多種代謝疾病相關(guān);2)腸道微生物代謝氨基酸產(chǎn)生5-羥色胺、吲哚等衍生物,能夠調(diào)節(jié)宿主情緒、睡眠以及免疫反應(yīng),并與神經(jīng)系統(tǒng)炎癥和疾病的發(fā)展相關(guān);3)人體微生物代謝膳食膽堿可產(chǎn)生三甲胺,其轉(zhuǎn)化生成的三甲胺N-氧化物(trimethylamineN-oxide,TMAO)是心血管疾病和其他慢性疾病的潛在風(fēng)險(xiǎn)因子等[69]。最近,Tintelnot 等[70]發(fā)現(xiàn)腸道微生物產(chǎn)生的色氨酸代謝物吲哚-3-乙酸(indole-3-acetic acid,3-IAA)水平與胰腺導(dǎo)管腺癌(pancreatic ductal adenocarcinoma,PDAC)的化療療效相關(guān),這一活性源于中性粒細(xì)胞衍生的髓過(guò)氧化物酶能夠氧化3-IAA,與化療聯(lián)用時(shí)會(huì)引起癌細(xì)胞中活性氧的積累和自噬下調(diào),從而損害癌細(xì)胞的代謝適應(yīng)性。相比次級(jí)代謝產(chǎn)物,目前針對(duì)人體微生物產(chǎn)生的初級(jí)代謝產(chǎn)物所使用的檢測(cè)、分析方法和研究流程都更為成熟和完備,因此,進(jìn)一步解析這些活性分子在錯(cuò)綜復(fù)雜的人體環(huán)境中具體的作用靶點(diǎn)和通路無(wú)疑將極大推動(dòng)對(duì)人體微生物活性化合物的理解和應(yīng)用。
從改善健康的視角來(lái)看,人體微生物天然產(chǎn)物的研究蘊(yùn)藏了巨大的潛力。一方面,很多來(lái)源于人體微生物的天然產(chǎn)物有望成為新型的抗菌化合物或免疫調(diào)節(jié)分子;另一方面,對(duì)相關(guān)天然產(chǎn)物進(jìn)行研究能深入地了解它們的作用機(jī)制及在人體中產(chǎn)生的影響,從而在健康促進(jìn)和疾病預(yù)防中采取更有效、更有針對(duì)性的預(yù)防或治療措施。近些年來(lái),人體微生物研究領(lǐng)域的技術(shù)手段和計(jì)算工具得到了飛速發(fā)展。然而,在高效整合已有的組學(xué)數(shù)據(jù)、尋找適用于更多微生物及不同類(lèi)型BGCs 的宿主菌或遺傳操作工具、探究微生物天然產(chǎn)物在宿主中發(fā)揮的真實(shí)作用等方面還有巨大的進(jìn)步空間。相信隨著這些問(wèn)題的改善和解決,人體微生物活性天然產(chǎn)物的發(fā)現(xiàn)和利用將會(huì)更為高效和精準(zhǔn)。