戴 巖,吳旭日,陳依軍
(中國(guó)藥科大學(xué)生命科學(xué)與技術(shù)學(xué)院化學(xué)生物學(xué)研究室,南京211198)
鏈霉菌的次級(jí)代謝產(chǎn)物或其衍生物一直都是藥物發(fā)現(xiàn)和開發(fā)的重要來源,特別是抗感染藥物和抗腫瘤藥物[1-3]。然而,自20世紀(jì)50年代至60年代次級(jí)代謝產(chǎn)物發(fā)現(xiàn)的熱潮后,基于菌株發(fā)酵和產(chǎn)物分離鑒定的傳統(tǒng)方法難以再挖掘出具有新骨架或新活性單元的次級(jí)代謝產(chǎn)物。近年來。隨著DNA測(cè)序技術(shù)和生物信息學(xué)的蓬勃發(fā)展,研究人員意識(shí)到鏈霉菌等微生物中存在大量的新型生物合成基因,次級(jí)代謝產(chǎn)物藥物的發(fā)現(xiàn)也隨之進(jìn)入了第二個(gè)黃金時(shí)代[4]。
鏈霉菌次級(jí)代謝產(chǎn)物是由成簇存在的基因,即所謂的生物合成基因簇(biosynthetic gene cluster,BGC)編碼一系列功能相關(guān)性酶或肽鏈依照一定次序發(fā)揮作用后產(chǎn)生的天然化合物。大量已發(fā)表的鏈霉菌基因組信息表明,次級(jí)代謝產(chǎn)物BGCs的數(shù)量遠(yuǎn)超已發(fā)現(xiàn)的次級(jí)代謝物總量,意味著鏈霉菌存在巨大的生物合成潛力。以antiSMASH為代表的生物信息學(xué)軟件可以批量預(yù)測(cè)鏈霉菌基因組中的BGCs[5],但迄今依然只有極少數(shù)的 BGCs及其相應(yīng)的代謝產(chǎn)物被識(shí)別鑒定,這是因?yàn)榇渭?jí)代謝產(chǎn)物的合成受到嚴(yán)格調(diào)控,通常需要在特定的環(huán)境下才能激活相關(guān)的BGCs。由于常規(guī)實(shí)驗(yàn)條件的限制,這些表達(dá)量極低甚至完全不表達(dá)的BGCs被定義為沉默BGCs。因此通過激活鏈霉菌沉默BGCs發(fā)掘新次級(jí)代謝物對(duì)突破新藥研發(fā)的瓶頸具有重要意義。
如圖1所示,目前鏈霉菌沉默生物合成基因簇的研究流程為:(1)鏈霉菌基因組的提取及測(cè)序;(2)生物信息學(xué)工具預(yù)測(cè)和分析BGCs;(3)利用合成生物學(xué)等手段激活沉默BGCs;(4)新次級(jí)代謝產(chǎn)物的檢測(cè);(5)新產(chǎn)物的分離鑒定。本文首先概述了最新的生物信息學(xué)工具,根據(jù)預(yù)測(cè)原理分為規(guī)則依賴性和規(guī)則無關(guān)性兩類[6];之后重點(diǎn)討論了在天然宿主和異源宿主中激活鏈霉菌沉默BGCs的有效策略,為基于鏈霉菌次級(jí)代謝產(chǎn)物的藥物開發(fā)提供有效的方法學(xué)參考。
Figure 1 Workflow for a secondarymetabolite discovery strategyBGC:Biosynthetic gene cluster
挖掘鏈霉菌基因組的生物信息學(xué)工具根據(jù)運(yùn)行原則分為兩類:規(guī)則依賴性工具和規(guī)則無關(guān)性工具(表1)。前者利用預(yù)定義的規(guī)則集通過已知BGCs特征基因的識(shí)別精確預(yù)測(cè)BGCs的類型,規(guī)則無關(guān)性工具則是運(yùn)用機(jī)器學(xué)習(xí)或系統(tǒng)進(jìn)化樹分析等實(shí)現(xiàn)BGCs的預(yù)測(cè)。
根據(jù)BGCs編碼的蛋白種類以及合成的終產(chǎn)物類型,用于挖掘鏈霉菌基因組的生物信息學(xué)工具主要分為兩組。第1組是針對(duì)非核糖體肽合酶/聚酮合酶(NRPS/PKS)的工具,作為非核糖體肽和聚酮的合成機(jī)器,多模塊酶復(fù)合體NRPS/PKS利用不同模塊激活不同的氨基酸或丙二酰,順序縮合后進(jìn)一步修飾實(shí)現(xiàn)終產(chǎn)物的結(jié)構(gòu)多樣性(圖2)。這些工具使用預(yù)定義的規(guī)則集建立算法識(shí)別與生物合成途徑相關(guān)的特征基因,例如SBSPKS,PKS/NRPS利用腺苷化結(jié)構(gòu)域的保守性比較分析預(yù)測(cè)新的NRPS基因簇[7],NRPSpredictor[8]進(jìn)一步列出了該結(jié)構(gòu)域所有活性位點(diǎn)可能結(jié)合的底物。SBSPKS第2版[9]還添加了NRPS的縮合,差向異構(gòu)化,環(huán)化結(jié)構(gòu)域預(yù)測(cè);在線工具 NaPDoS[10]通過識(shí)別NRPS的縮合域,PKS的聚酮結(jié)構(gòu)域及其亞型來預(yù)測(cè)NRPS/PKS基因簇。antiSMASH是目前鏈霉菌基因組挖掘中使用率最高的工具,不僅包括了不同特征基因的比較算法,更是建立了基于同源性的代謝模型管路以及綜合的次級(jí)代謝基因簇?cái)?shù)據(jù)庫[11-12]。但是,基于預(yù)測(cè)的 BGCs推測(cè)天然產(chǎn)物的結(jié)構(gòu)仍然是一大難點(diǎn),PRISM[13]利用生物合成邏輯編寫算法實(shí)現(xiàn)了PKS結(jié)構(gòu)的初步預(yù)測(cè)。
Table 1 Bioinformatic tools for BGCs prediction
Figure 2 Schematic diagrams for NRPS/PKS(above)and RiPP(below)pathways
第2組是挖掘核糖體合成翻譯后修飾肽(RiPP)(圖 2)的工具,antiSMASH 4.0[11]利用啟發(fā)式算法計(jì)算得分,聯(lián)合SVM以及基序分析可以預(yù)測(cè)15種不同的RiPP BGCs,相比于剖面隱馬爾科夫模型,這些從 RODEO[14]借鑒的算法更適用于RiPPs挖掘。RODEO根據(jù)現(xiàn)已公開的基因組信息先后預(yù)測(cè)了1 300多種環(huán)肽類,508種硫肽類BGCs[14-15];RiPPquest[16]將 RiPP BGCs的基因型與代謝組學(xué)數(shù)據(jù)集對(duì)應(yīng)的化學(xué)表型聯(lián)系起來,成功地在Streptomyces viridochromogenes中發(fā)現(xiàn)了新的羊毛硫肽類化合物。作為首個(gè)挖掘RiPPs的網(wǎng)頁工具,BAGEL第4版[17]還整合了 RNA表達(dá)數(shù)據(jù)以及啟動(dòng)子和終止子的預(yù)測(cè);RiPPMiner[18]也因?yàn)榍皩?dǎo)肽分割位點(diǎn)及翻譯后修飾交聯(lián)的預(yù)測(cè)功能廣受關(guān)注。
大多數(shù)基因挖掘平臺(tái)都根據(jù)已知BGCs中參與關(guān)鍵生物合成步驟的酶的基因作為錨或探針來篩選預(yù)測(cè)出已知類型的BGCs,雖然這種規(guī)則依賴性工具預(yù)測(cè)敏感度,陽性率和置信度高,但難以識(shí)別使用不同酶機(jī)制的BGCs。
為了擴(kuò)大基因挖掘的范圍,ClusterFinder[19]使用隱馬爾科夫模型在全基因組范圍內(nèi)計(jì)算已知BGCs中出現(xiàn)的PFAM結(jié)構(gòu)域的頻率來預(yù)測(cè)BGCs,即使在完全沒有特征基因的情況下富含這些PFAM結(jié)構(gòu)域的基因組區(qū)域極有可能是新的BGCs。但根源上PFAM結(jié)構(gòu)域頻率的計(jì)算依然基于已知的 BGCs,而 EvoMining[20]的開發(fā)給非典型BGCs的預(yù)測(cè)提供了全新的視角,它以基礎(chǔ)代謝酶為起點(diǎn)通過建立系統(tǒng)發(fā)育樹檢測(cè)已知BGCs中關(guān)鍵酶的旁系同源,假想它們有潛力作用于次級(jí)代謝物合成,基于這一理論Cruz-Morales等[20]發(fā)現(xiàn)了兩種以前從未報(bào)道過的酶,其中一個(gè)參與一種新的砷有機(jī)化合物的代謝合成。此外,基于抗性基因開發(fā)的ARTS[21]也是挖掘新型BGCs的有效工具。但這些規(guī)則無關(guān)性的生物信息學(xué)手段通常假陽性率高,最好能與規(guī)則依賴性的工具聯(lián)合使用,從而實(shí)現(xiàn)高質(zhì)量的基因組挖掘。次級(jí)代謝產(chǎn)物生物信息門戶(SMBP)的網(wǎng)站[6]為目前流行的大多數(shù)生物信息學(xué)工具提供了一站式目錄和鏈接,可以快速訪問這些挖掘工具和數(shù)據(jù)庫。
沉默BGCs激活的策略主要分為兩種:其一,在天然宿主菌中解除沉默BGCs的抑制因素;其二,避開現(xiàn)有調(diào)控體系,直接將BGCs異源表達(dá)或重構(gòu)BGCs的控制元件后轉(zhuǎn)移到異源宿主中。
通過調(diào)整鏈霉菌的培養(yǎng)參數(shù),譬如培養(yǎng)基組成、溫度、pH、通氣甚至容器類型等,誘導(dǎo)沉默BGCs的表達(dá)是在單菌株水平下改變整個(gè)次級(jí)代謝產(chǎn)物譜最常見的策略,Bode等[22]將其定義為OSMAC(one strain many compounds)。這種方法相對(duì)經(jīng)濟(jì)簡(jiǎn)單但結(jié)果多樣性,特別適用于基因組信息不全面或存在遺傳隔離的鏈霉菌菌種。Rateb等[23]從干旱沙漠土壤中分離一株鏈霉菌后利用OSMAC摸索出8種培養(yǎng)基得到了一系列多樣的次級(jí)代謝產(chǎn)物。
低濃度抗生素、信號(hào)分子和組蛋白去乙?;敢种苿┑日T導(dǎo)子的添加[24]和共培養(yǎng)策略也是從OSMAC衍生出來的,后者利用鏈霉菌與其他一種或多種微生物共同培養(yǎng),基于競(jìng)爭(zhēng)原則模擬動(dòng)態(tài)自然環(huán)境來誘導(dǎo)新活性物質(zhì)的產(chǎn)生,Streptomyces endus與Tsukamurella pulmoni共培養(yǎng)后產(chǎn)生了新的次級(jí)代謝物 alchivemycin A[25]。
上述方法引起的代謝特征變化是全局性的,因此后續(xù)比較分析代謝譜時(shí)難度大大增加,而且該策略相較于基因工程手段盲目性強(qiáng),目的性差?;蚪M指導(dǎo)OSMAC能適當(dāng)縮減培養(yǎng)參數(shù)范圍,通過基因組分析能初步解讀出典型的生物合成組裝線及它們的產(chǎn)物類型,根據(jù)產(chǎn)物類型提供足夠的前體,關(guān)鍵元素等可大大提高沉默基因簇表達(dá)概率。
2.2.1 過表達(dá)正調(diào)控因子 鏈霉菌中有35~40個(gè)調(diào)控蛋白家族,按功能劃分為正調(diào)控因子和負(fù)調(diào)控因子兩類。其中,過表達(dá)正調(diào)控基因如AraC,LuxR,SARP等是激活沉默基因簇的有效方法,例如Du等[26]構(gòu)建了7株重組鏈霉菌菌株,重組載體上分別含有一種SARP基因及組成型啟動(dòng)子,成功挖掘出一種新的Ⅱ型聚酮ishigamide;屬于LuxR家族的轉(zhuǎn)錄激活基因vemR組成型表達(dá)時(shí),Streptomyces venezuelae產(chǎn)生了一個(gè)新的二芳基聚酮化合物venemycin[27];連續(xù)過表達(dá)AraC家族的3個(gè)調(diào)控基因sgcR1,sgcR2和sgcR3產(chǎn)生了 enediyne C-1027[28]。由于過表達(dá)質(zhì)粒構(gòu)建簡(jiǎn)單,轉(zhuǎn)入目的鏈霉菌的效率較高,這種方法可能會(huì)進(jìn)一步發(fā)展用于單菌株水平高通量激活沉默基因簇。
2.2.2 解除或下調(diào)負(fù)調(diào)控因素 敲除負(fù)調(diào)控基因是挖掘新次級(jí)代謝產(chǎn)物的經(jīng)典手段之一,在模式鏈霉菌中,傳統(tǒng)的基因敲除策略是自殺型或溫敏型質(zhì)粒介導(dǎo)的同源雙交換重組,但往往耗時(shí)耗力。為了改善基因編輯可行性,CRISPR-Cas9技術(shù)被高效精確地運(yùn)用于鏈霉菌靶基因的敲除,當(dāng)沒有同源臂指導(dǎo)同源定向修復(fù)(HDR)(圖 3-A)時(shí),Cas9通過sgRNA介導(dǎo)的DNA雙鏈斷裂(DSB)可以進(jìn)行非同源末端連接(NHEJ)修復(fù),這會(huì)導(dǎo)致靶序列出現(xiàn)不同大小的片段敲除。通過共表達(dá)LigD連接酶優(yōu)化鏈霉菌NHEJ途徑(圖3-B),靶基因的缺失,替換或插入降至3個(gè)堿基以內(nèi),因此靶基因發(fā)生功能變化或喪失[29]。雖然此法基因編輯位點(diǎn)比較準(zhǔn)確,也無需構(gòu)建同源臂,但結(jié)果序列過于隨機(jī),無法保證靶基因功能的完全喪失。而同時(shí)提供用于HDR的同源臂時(shí),則能實(shí)現(xiàn)靶基因的精準(zhǔn)敲除[30],基于這一原理Tong等[31]還開發(fā)了一個(gè)高效編輯放線菌基因組的CRISPR-Cas9工具盒。
Figure3 Approaches to activate silent BGCs in native hostsA:CRISPR-Cas9-HDR;B:Reconstituted CRISPR-Cas9-NHEJ;C:CRISPRi;D:TFD;E:CRIPR-Cas9-guided knock in
此外,Cas9催化活性失活的突變體(dCas9)介導(dǎo)的序列特異性干擾基因表達(dá)(CRISPRi)很有希望用于高通量抑制鏈霉菌中的負(fù)調(diào)控基因表達(dá)從而激活一系列沉默BGCs[32](圖3-C)。針對(duì)負(fù)調(diào)控因子基因的啟動(dòng)子區(qū)域設(shè)計(jì)sgRNAs,CRISPR-dCas9復(fù)合體因此能與轉(zhuǎn)錄機(jī)器競(jìng)爭(zhēng)性結(jié)合這段非編碼區(qū),使負(fù)調(diào)控因子的轉(zhuǎn)錄大大降低甚至無法轉(zhuǎn)錄。但這種方法是可逆的,當(dāng)撤去溫度壓力時(shí),CRISPR-dCas9會(huì)漸漸丟失,改造菌株回復(fù)到野生型。
轉(zhuǎn)錄因子誘捕(transcription factor decoy,TFD)這一概念最初由Mcarthur等[33]提出,他們構(gòu)建了一系列啞鈴狀寡核苷酸模擬基因組調(diào)控元件,競(jìng)爭(zhēng)性結(jié)合抑制型轉(zhuǎn)錄因子從而實(shí)現(xiàn)基因簇的正常轉(zhuǎn)錄并產(chǎn)生相應(yīng)的代謝物。Wang等[34]開發(fā)的TFD則是將基因組調(diào)控元件序列與報(bào)告基因一同構(gòu)建在高拷貝載體pKC1139上,接合轉(zhuǎn)移后提供溫度和抗性雙重壓力使得重組pKC1139穩(wěn)定游離在鏈霉菌體內(nèi)(圖3-D)。該方法利用TFD序列競(jìng)爭(zhēng)性結(jié)合抑制型轉(zhuǎn)錄因子成功激活了8個(gè)沉默的NRPS/PKS基因簇并挖掘出一個(gè)新的■唑類化合物。
除了編輯調(diào)控體系,另一種激活沉默BGCs的方法是在靶BGC上游敲入強(qiáng)啟動(dòng)子,從而起始生物合成基因的轉(zhuǎn)錄并合成相應(yīng)的代謝產(chǎn)物。相比于傳統(tǒng)的基因同源重組雙交換,CRISPR-Cas9的介入顯著提高了啟動(dòng)子的敲入效率。基于HDR原理,Zhang等[35]利用 CRISPR-Cas9成功在5種鏈霉菌中引入kasO*p替換天然啟動(dòng)子,成功激活了多個(gè)沉默的BGCs,并誘導(dǎo)了相應(yīng)次級(jí)代謝物的產(chǎn)生,包括在Streptomyces viridochromogene中產(chǎn)生的一個(gè)新型Ⅱ型聚酮。
BGCs中常見多操縱子結(jié)構(gòu),因此激活完整長(zhǎng)度的BGC并產(chǎn)生相應(yīng)次級(jí)代謝產(chǎn)物物需構(gòu)建一系列敲入質(zhì)粒替換靶BGC每個(gè)操縱子上游的天然啟動(dòng)子(圖3-E)。不同的操縱子組合產(chǎn)生不同的中間產(chǎn)物,還可以為生物合成機(jī)制的研究提供參考[36]。但如果一個(gè)新次級(jí)代謝物的合成涉及全局性的轉(zhuǎn)錄變化,這種途徑特異性敲入啟動(dòng)子的策略則無法適用。
上述TFD策略中利用報(bào)告子大大簡(jiǎn)化了后續(xù)篩選[34],同樣高通量誘導(dǎo)子篩選(high-throughput elicitor screening,HiTES)[37](圖 4-A)利用報(bào)告子的特性表征靶BGC的表達(dá),可以快速鑒定沉默BGCs是否被激活。針對(duì)白色鏈霉菌中NRPS沉默基因簇sur構(gòu)建2種報(bào)告子質(zhì)粒,一種使3個(gè)串聯(lián)的eGFP(eGFP×3)定點(diǎn)插入到sur的天然啟動(dòng)子(Psur)下游,另一種將Psur與eGFP×3融合后異位整合到基因組上,利用HiTES發(fā)現(xiàn) ivermectin和etoposide是激活sur基因簇的強(qiáng)誘導(dǎo)子,并成功分離鑒定了14種新次級(jí)代謝物。
Figure 4 Approaches to activate silent BGCs in native hostsA:HiTES(high-throughput elicitor screening);B:RGMS(reporterguided mutant selection)
報(bào)告子導(dǎo)向的突變體篩選(reporter-guided mutant selection,RGMS)(圖 4-B)也是一個(gè)有效且適用范圍廣的新策略,采用基因組規(guī)模的隨機(jī)突變建立遺傳多樣性,然后通過雙報(bào)告子篩選直接識(shí)別靶激活的突變體。Guo等[38]將沉默pga基因簇啟動(dòng)子融合報(bào)告基因后異位整合到基因組中,利用RGMS成功在Streptomyces sp.PGA64中激活了pga基因簇并挖掘了兩個(gè)新蒽醌氨基糖苷類代謝物。此方法中雙報(bào)告子的特征需區(qū)別于鏈霉菌本身的性質(zhì),xylE-neo報(bào)告子只適用于原菌株卡那霉素敏感,單克隆顯示為非黃色[38]。
異源宿主相比于天然宿主存在眾多優(yōu)勢(shì):培養(yǎng)條件簡(jiǎn)單,調(diào)控體系研究透徹,轉(zhuǎn)錄元件容易控制等,直接克隆或者重構(gòu)BGCs后再異源表達(dá)可以避開原宿主中的調(diào)控體系,實(shí)現(xiàn)沉默BGCs的激活并產(chǎn)生相應(yīng)的次級(jí)代謝產(chǎn)物。
異源表達(dá)最直接的方法是直接克隆靶BGC轉(zhuǎn)入異源宿主中。傳統(tǒng)克隆技術(shù)依賴文庫的構(gòu)建和篩選不僅耗時(shí)耗力,而且單個(gè)cosmid或細(xì)菌人工染色體無法完整地克隆鏈霉菌中長(zhǎng)達(dá)幾十甚至幾百kb的BGCs。基于DNA重組開發(fā)了一些直接克隆大片段BGCs的策略,例如酵母轉(zhuǎn)化偶聯(lián)重組(transformation-associated recombination,TAR)系統(tǒng),Red/ET介導(dǎo)的同源重組,Cas9相關(guān)染色體片段的捕獲(Cas9-assisted targeting of chromosome segments,CATCH),點(diǎn)特異性重組 (site-specific recombination,SSR)等。
釀酒酵母中發(fā)現(xiàn)的TAR系統(tǒng)被Kim等[39]用于特異性捕捉微生物的BGC后,漸漸發(fā)展成鏈霉菌大片段BGCs的克隆工具?;蚪MDNA與過量TAR克隆載體共轉(zhuǎn)化到酵母細(xì)胞中,由于克隆載體上提前構(gòu)建了靶BGC序列兩端的同源臂,重組會(huì)高頻發(fā)生,從而形成環(huán)狀酵母人工染色體分子。這種方法可以成功地從復(fù)雜基因組中克隆出長(zhǎng)達(dá)250 kb的DNA片段,但在酵母轉(zhuǎn)化子中靶BGC的捕捉效率只有0.5%~2%[40],因此陽性克隆極少,篩選過程繁瑣耗時(shí)。
在不斷改造噬菌體重組體系Red和RecET的過程中,F(xiàn)u等[41]發(fā)現(xiàn)全長(zhǎng)的 RecE聯(lián)合 RecT和Redγ能在大腸埃希菌中實(shí)現(xiàn)高效的線線同源重組(linear-linear homologous recombination,LLHR)。此法與TAR克隆類似,效率略高于TAR,但克隆的BGC長(zhǎng)度一般不超過50 kb。
TAR和Red/ET介導(dǎo)的同源重組因?yàn)榛蚪M片段存在非特異性結(jié)合,陽性克隆產(chǎn)率極低。而sgRNA指導(dǎo)的Cas9能精確切割靶BGC邊界處的DNA序列,對(duì)基因組DNA用CRISPR-Cas9預(yù)處理可大幅提高同源重組效率(圖 5),TAR聯(lián)合CRISPR-Cas9后陽性克隆產(chǎn)率甚至提高到32%[40];Red/ET介導(dǎo)的同源重組也利用 CRISPRCas9極大改善了靶BGC的捕獲效率[42]。相比于TAR和Red/ET介導(dǎo)的體內(nèi)直接克隆,CATCH[43]結(jié)合CRISPR-Cas9和Gibson組裝,可在體外捕捉長(zhǎng)達(dá)100 kb的基因組片段,耗時(shí)短且陽性克隆率高,靶BGC長(zhǎng)50 kb時(shí)陽性克隆率為60%。但CATCH對(duì)基因組DNA的純度和完整性要求較高,需要十分精細(xì)的體外操作。
Figure 5 CRISPR-Cas9 assisted direct cloning
基于點(diǎn)特異性重組的直接克隆法也不斷被開發(fā)(圖6),例如絲氨酸整合酶介導(dǎo)的 SSR[44],鏈霉菌噬菌體φBT1成對(duì)的整合位點(diǎn)attB/attP分別通過同源重組單交換到靶BGC邊界,然后表達(dá)φBT1重組酶切割成對(duì)的整合位點(diǎn)導(dǎo)致靶BGC環(huán)化至pKC1139上,利用此方法從Streptomyces roseosporus基因組中直接克隆了長(zhǎng)分別為45 kb,157 kb的napsamycin和 daptomycin基因簇,克隆效率達(dá)80%[44]。Cre/loxP[45]是 酪 氨 酸 整 合 酶 介 導(dǎo) 的SSR,與φBT1相似,loxP位點(diǎn)首先被整合到靶BGC邊界,Cre重組酶表達(dá)識(shí)別 loxP位點(diǎn)進(jìn)而環(huán)化靶BGC。
Figure 6 Site-specific recombination for direct cloning
沉默BGCs直接克隆后接合轉(zhuǎn)移到異源宿主中依然不能激活時(shí),往往通過改變?cè)械恼{(diào)控元件重構(gòu)BGCs后實(shí)現(xiàn)異源表達(dá)。例如,taromycin基因簇直接克隆到異源菌中不表達(dá),但敲除負(fù)調(diào)控基因后可被激活[46]。最常見的重構(gòu)策略是將天然啟動(dòng)子替換成組成型啟動(dòng)子,mCRISTAR(multiplexed-CRISPR-TAR)[47]是目前最有效的手段(圖 7),CRISPR-Cas9在BGC各啟動(dòng)子處介導(dǎo)雙鏈斷裂形成線狀DNA片段,而組成型啟動(dòng)子含有BGC特異性的同源臂,在酵母細(xì)胞中利用TAR與這些片段重組。這套多啟動(dòng)子插入體系為避免啟動(dòng)子間的同源重組,需對(duì)啟動(dòng)子進(jìn)行正交設(shè)計(jì)。基于這一方法,tetarimycin和lazarimide和芳香聚酮AB1210基因簇重構(gòu)后在異源宿主白色鏈霉菌中被激活[47]。另一個(gè)重構(gòu)BGCs的方法是通過DNA組裝完成BGC的全部構(gòu)建[48],包括生物合成基因,組成型啟動(dòng)子等各種元素都從線性DNA片段出發(fā)。
Figure 7 Multiplexed-CRISPR-TAR for BGCs refactoring
本文闡述的鏈霉菌沉默BGCs的激活策略雖已成功應(yīng)用于多種次級(jí)代謝產(chǎn)物的發(fā)掘,但仍存在較大的完善空間:(1)現(xiàn)有的生物信息學(xué)工具對(duì)全新模式的生物合成途徑以及次級(jí)代謝產(chǎn)物結(jié)構(gòu)的預(yù)測(cè)置信度低,有待算法的進(jìn)一步突破;(2)在天然宿主中利用基因操作激活沉默BGCs的策略不適用于培養(yǎng)困難或遺傳隔離的菌種,所以傳統(tǒng)OSMAC策略仍需進(jìn)一步創(chuàng)新發(fā)展;(3)基于異源表達(dá)的沉默BGCs激活策略雖避開了天然宿主的限制因素,給基因編輯提供了較高的自由度,但簡(jiǎn)單的異源宿主環(huán)境通常無法提供次級(jí)代謝產(chǎn)物生物合成的調(diào)控網(wǎng)絡(luò)和代謝需求,因此改造調(diào)控系統(tǒng)和代謝途徑構(gòu)建兼容性好的通用底盤菌株迫在眉睫;(4)TFD,HiETS及RGSGs策略實(shí)現(xiàn)了單菌株水平批量挖掘新次級(jí)代謝產(chǎn)物的目的,但鏈霉菌的種間差異性與基因編輯的可行性限制了通量的進(jìn)一步提高。然而,隨著合成生物學(xué)技術(shù)和生物信息學(xué)算法的不斷升級(jí)改進(jìn),鏈霉菌沉默BGCs的激活將逐漸實(shí)現(xiàn)高通量挖掘次級(jí)代謝產(chǎn)物的目標(biāo),從而為藥物先導(dǎo)化合物的開發(fā)提供豐富的結(jié)構(gòu)基礎(chǔ)。