劉偉豐,陶勇
中國(guó)科學(xué)院微生物研究所,北京 100101
“蛋白質(zhì)預(yù)算”是指細(xì)胞為了維持正常的生理狀態(tài)對(duì)各種蛋白質(zhì)的“投入”,也即表達(dá)量上的分配。這既包括細(xì)胞表達(dá)的全部蛋白質(zhì)的總體水平,也包括不同蛋白質(zhì)表達(dá)量之間的相互比例。
正常細(xì)胞需要維持“蛋白質(zhì)預(yù)算”的平衡。通過(guò)對(duì)天然細(xì)胞蛋白質(zhì)組的二維電泳等分析可以看出,在特定生理?xiàng)l件下,無(wú)論是某種特定蛋白還是細(xì)胞的總蛋白,表達(dá)量都是處在一個(gè)相對(duì)恒定的水平。其中對(duì)維持生理狀態(tài)具有重要作用的蛋白質(zhì)往往具有更高的表達(dá)量。當(dāng)細(xì)胞受到外界脅迫時(shí),各種蛋白的表達(dá)量會(huì)迅速變化并建立新的平衡。部分蛋白表達(dá)量的增加會(huì)伴隨另一些蛋白表達(dá)量的減少。
在合成生物學(xué)中,功能模塊加載后往往會(huì)引起人工細(xì)胞發(fā)生一系列生理變化,造成模塊無(wú)法正常運(yùn)行。一個(gè)重要原因就是在設(shè)計(jì)模塊時(shí)其中的部分酶、蛋白質(zhì)為了實(shí)現(xiàn)功能要求較高的表達(dá)量,從而使細(xì)胞的“蛋白質(zhì)預(yù)算”失衡。
天然生物體在長(zhǎng)期的進(jìn)化過(guò)程中,獲得了穩(wěn)定的生理遺傳狀態(tài)和極強(qiáng)的適應(yīng)環(huán)境的能力。當(dāng)周圍環(huán)境及自身生理情況發(fā)生變化時(shí),天然生物體會(huì)迅速開(kāi)啟應(yīng)答機(jī)制,如對(duì)基因表達(dá)進(jìn)行快速的開(kāi)啟或關(guān)閉,從而有針對(duì)性地產(chǎn)生特定功能蛋白,并關(guān)閉不必要蛋白的表達(dá)。這種機(jī)制體現(xiàn)出了一種“最經(jīng)濟(jì)原則”,可以減少細(xì)胞不必要的生理負(fù)擔(dān),是對(duì)自然界長(zhǎng)期適應(yīng)的結(jié)果。
在人們對(duì)生命現(xiàn)象有了深入的探索和認(rèn)識(shí)后,創(chuàng)建自然界不存在的人工生命體系成為人們對(duì)自然改造的目標(biāo)。在這一目標(biāo)的驅(qū)動(dòng)下,合成生物學(xué)已經(jīng)成為生命科學(xué)中最為活躍、發(fā)展最為迅速的研究領(lǐng)域之一[1-3]。2010年,美國(guó)科學(xué)家J.Craig Venter及其合作者研究將完全由人工設(shè)計(jì)、改造、組裝的一種蕈狀支原體Mycoplasma mycoides基因組轉(zhuǎn)入到另一種生物山羊支原體Mycoplasma capricolum的細(xì)胞中,最后獲得的合成細(xì)胞完全在人工基因組的控制下正常生長(zhǎng)[4]。這標(biāo)志著人工創(chuàng)建生命體獲得了巨大突破。然而合成生物學(xué)的最終目標(biāo)是使人工生命體系比天然生物體具有明顯的優(yōu)越性,例如具有更強(qiáng)的目標(biāo)產(chǎn)物的生產(chǎn)能力、轉(zhuǎn)化能力、環(huán)境適應(yīng)與監(jiān)測(cè)能力等,從而使人類獲得更優(yōu)質(zhì)的生產(chǎn)方式。雖然以合成生物學(xué)手段設(shè)計(jì)、合成的人工元件、模塊可以賦予人工生命體系某種特定優(yōu)勢(shì)的生物學(xué)功能,但如何使人工生命體系在各種生理能力上達(dá)到乃至超過(guò)經(jīng)過(guò)長(zhǎng)期自然進(jìn)化形成的天然生物,仍然是亟待解決的科學(xué)問(wèn)題。
蛋白質(zhì)是生物體執(zhí)行生理功能的核心分子。酶、信號(hào)分子、細(xì)胞通道以及各種水平的調(diào)控因子等絕大部分是由蛋白質(zhì)組成的。生物體之所以能夠有效地對(duì)各種環(huán)境變化進(jìn)行精準(zhǔn)的應(yīng)答,根本上還是對(duì)細(xì)胞中各種功能蛋白質(zhì)的含量、定位、活性的控制。蛋白質(zhì)能夠在時(shí)間上和空間上進(jìn)行準(zhǔn)確地表達(dá),有賴于轉(zhuǎn)錄、翻譯、折疊、修飾及細(xì)胞定位等多層次的精確調(diào)控。
蛋白質(zhì)同樣是合成生物學(xué)創(chuàng)建的人工生命體系的基礎(chǔ)。人工生命體系或稱人工細(xì)胞,是建立在一系列特定功能生物元件和生物模塊的基礎(chǔ)上的。相關(guān)功能元件、模塊包括了各種酶催化反應(yīng)、調(diào)控通路。在這些反應(yīng)和通路中,執(zhí)行具體功能的絕大多數(shù)是酶、調(diào)控蛋白等蛋白質(zhì)分子。因此,元件、模塊功能的實(shí)現(xiàn)仍然依賴于蛋白質(zhì)的精確表達(dá)。使元件、模塊中功能蛋白質(zhì)的表達(dá)能夠在時(shí)間上和空間上得到精確控制,不僅是合成生物學(xué)研究和核心內(nèi)容,而且對(duì)實(shí)現(xiàn)人工生命體系的優(yōu)越性具有重要意義。
生物元件、模塊中包括大量的異源基因表達(dá),采用了各種非天然啟動(dòng)子。因此生物元件和模塊本質(zhì)上仍然是建立在各種蛋白質(zhì)重組表達(dá)單元的基礎(chǔ)上。但與基因工程中蛋白質(zhì)重組表達(dá)系統(tǒng)相比,合成生物學(xué)中的蛋白質(zhì)重組表達(dá)的調(diào)控更為復(fù)雜,模塊中蛋白質(zhì)重組表達(dá)遵循著特殊的規(guī)律,并且需要采用不同的研究、優(yōu)化策略。
合成生物學(xué)的研究方式是以工程學(xué)理論為依據(jù),把生命系統(tǒng)作為工程系統(tǒng)來(lái)處理。與傳統(tǒng)生物學(xué)從“整體-細(xì)胞-分子”的自上而下“分解式”的研究方式不同,合成生物學(xué)按“元件 (Part)-模塊 (Module)-系統(tǒng) (System)”的“自下而上”的方式對(duì)生命系統(tǒng)進(jìn)行設(shè)計(jì)。合成生物學(xué)將具有特定功能的調(diào)控、代謝途徑抽提、模塊化,設(shè)計(jì)標(biāo)準(zhǔn)化和具有通用性特征的基本生物元件,進(jìn)而組裝成大的整合系統(tǒng)。
根據(jù)合成生物學(xué)的研究過(guò)程可以看出,生物元件是合成生物學(xué)的基石。合成生物學(xué)的首要工作就是對(duì)生物元件的挖掘、改造和標(biāo)準(zhǔn)化。生物元件按功能包括啟動(dòng)子、質(zhì)粒骨架、調(diào)控序列、酶等功能蛋白基因編碼區(qū)等。這些元件本質(zhì)上都是蛋白質(zhì)重組表達(dá)系統(tǒng)的基本單元。
模塊是通過(guò)元件有序組裝獲得的具有特定功能的更高層次的單元,包括合成模塊、催化模塊、調(diào)控模塊等。模塊的功能最終也是通過(guò)對(duì)酶、調(diào)控蛋白等蛋白質(zhì)的有序表達(dá)實(shí)現(xiàn)。為了使模塊的功能實(shí)現(xiàn)最優(yōu)化,人們常常需要引入異源基因,例如在合成模塊中利用異源基因去獲得新的合成途徑。在滿足通量需求等前提下,這些基因的功能通常需要通過(guò)過(guò)量表達(dá)實(shí)現(xiàn)。
蛋白重組表達(dá)是合成生物學(xué)的重要環(huán)節(jié),但元件、模塊中的蛋白質(zhì)表達(dá)同以蛋白質(zhì)獲得為目的的重組表達(dá)系統(tǒng)還是具有明顯的區(qū)別。蛋白質(zhì)重組表達(dá)系統(tǒng)以獲得高水平蛋白為目的。通過(guò)重組表達(dá)系統(tǒng)表達(dá)目的蛋白,既是科學(xué)研究中獲得蛋白質(zhì)的主要手段,也是實(shí)現(xiàn)功能性蛋白質(zhì)產(chǎn)品規(guī)模化生產(chǎn)的重要途徑。蛋白質(zhì)重組表達(dá)系統(tǒng)通常以目的蛋白表達(dá)水平最大化為目標(biāo),以適應(yīng)科學(xué)研究及工農(nóng)業(yè)生產(chǎn)中獲得足夠功能蛋白的要求。重組蛋白在細(xì)胞總蛋白的比例往往很高,例如大腸桿菌重組表達(dá)系統(tǒng)中的外源蛋白可以超過(guò)總蛋白的50%[5]。
蛋白重組表達(dá)系統(tǒng)包括載體骨架、啟動(dòng)子、終止子等基本組件。為了提高外源蛋白質(zhì)的表達(dá)水平,通常會(huì)強(qiáng)化這些組件的功能以有利于增加細(xì)胞中目標(biāo)蛋白的表達(dá)滴度。例如在大腸桿菌表達(dá)系統(tǒng)中,商業(yè)化的載體質(zhì)粒絕大多數(shù)采用松弛型高拷貝復(fù)制起始位點(diǎn)ColE,高拷貝質(zhì)粒可以通過(guò)增加模板的相對(duì)數(shù)量提高目的蛋白的表達(dá)水平[6]。轉(zhuǎn)錄方面則通過(guò)采用T7等強(qiáng)啟動(dòng)子來(lái)增加目標(biāo)蛋白的模板mRNA水平。針對(duì)結(jié)構(gòu)基因編碼區(qū),通常是通過(guò)對(duì)外源蛋白編碼序列密碼子的優(yōu)化,將稀有密碼子替換為富有密碼子以提高翻譯效率[7]。
但在合成生物學(xué)中,雖然元件設(shè)計(jì)和模塊組裝仍然包括大量的重組蛋白表達(dá)單元,但其最終的功能并非以獲得較高蛋白表達(dá)水平為目標(biāo)。合成生物學(xué)中的表達(dá)單元需要有精確的調(diào)控能力,其最終目標(biāo)是實(shí)現(xiàn)一個(gè)或多個(gè)生物學(xué)功能,這需要保證底盤(pán)細(xì)胞中多個(gè)模塊間蛋白表達(dá)水平的平衡,而非重組蛋白本身的最大化。
大量的研究表明,在合成生物學(xué)中模塊組裝時(shí),采用強(qiáng)啟動(dòng)子、高拷貝復(fù)制起始位點(diǎn)等蛋白質(zhì)重組表達(dá)常用的元件往往不能實(shí)現(xiàn)模塊功能的最優(yōu)狀態(tài)[8-9]。例如,我們?cè)诖竽c桿菌底盤(pán)細(xì)胞中加載了類胡蘿卜素合成的功能模塊。我們研究了模塊中蛋白質(zhì)表達(dá)水平對(duì)最終產(chǎn)物的影響。結(jié)果表明,當(dāng)功能模塊中多個(gè)酶通過(guò)強(qiáng)化蛋白表達(dá)的調(diào)控元件獲得較高可溶性表達(dá)水平時(shí),類胡蘿卜素的合成水平反而明顯低于低水平表達(dá)相關(guān)酶的情況,后者是通過(guò)弱化表達(dá)的調(diào)控元件實(shí)現(xiàn)的。
因此,在合成生物學(xué)研究中,模塊間的不同蛋白質(zhì)重組表達(dá)水平需要處于相對(duì)平衡的狀態(tài),才能使模塊功能以及模塊間或模塊與底盤(pán)細(xì)胞間的適配性達(dá)到最優(yōu)的狀態(tài)。這種情況可以類比于工廠中,一個(gè)整體生產(chǎn)計(jì)劃內(nèi)部需要對(duì)不同環(huán)節(jié)的投入進(jìn)行總體預(yù)算。良好的預(yù)算可以最大限度地降低計(jì)劃的成本。當(dāng)計(jì)劃中某一環(huán)節(jié)的預(yù)算過(guò)高時(shí),就會(huì)影響計(jì)劃中其他環(huán)節(jié)的投入和實(shí)施,造成成本過(guò)高、工廠負(fù)擔(dān)過(guò)重。只有整體計(jì)劃中的各環(huán)節(jié)間實(shí)現(xiàn)預(yù)算的平衡,才有利于計(jì)劃的實(shí)施?!暗鞍踪|(zhì)預(yù)算”則是細(xì)胞工廠發(fā)揮功能的“成本標(biāo)尺”。在細(xì)胞表達(dá)各模塊的蛋白時(shí),只有模塊中異源蛋白之間,以及模塊蛋白與底盤(pán)細(xì)胞自身蛋白之間的蛋白質(zhì)預(yù)算分配實(shí)現(xiàn)最優(yōu)時(shí),合成生物學(xué)構(gòu)建的人工生命體系 (人造細(xì)胞工廠)才能良好地運(yùn)行。
合成生物學(xué)中的模塊的簡(jiǎn)單與復(fù)雜常常取決于其功能的復(fù)雜程度。在合成模塊中,通常需要引入多個(gè)乃至十余個(gè)異源基因去獲得新的合成途徑,這些基因編碼的酶在原來(lái)的系統(tǒng)能夠滿足細(xì)胞的代謝需要,但為了滿足合成模塊的適配性及最大通量,這些基因必須過(guò)量表達(dá)。
酶的催化活性與其催化的反應(yīng)及酶的來(lái)源緊密相關(guān),比活的相差倍數(shù)可能達(dá)到百倍至百萬(wàn)倍,為了保證代謝通量平衡并且最大化,有些代謝合成的酶可能需要表達(dá)至細(xì)胞總量的20%以上,如果合成途徑中存在兩個(gè)以上的限速酶,如何合理地預(yù)算這些蛋白質(zhì)表達(dá),不影響其他合成模塊中基因的表達(dá),以及人工合成細(xì)胞的正常生長(zhǎng)和維持是蛋白質(zhì)預(yù)算的核心問(wèn)題。
蛋白質(zhì)的表達(dá)水平會(huì)對(duì)模塊的功能,以及模塊之間、模塊與底盤(pán)細(xì)胞的適配性產(chǎn)生重要影響。蛋白質(zhì)重組表達(dá)系統(tǒng)中的過(guò)表達(dá)(Overexpression)往往不適用于合成生物學(xué)中元件、模塊中的蛋白質(zhì)重組表達(dá)。蛋白質(zhì)表達(dá)水平過(guò)高對(duì)細(xì)胞造成的副作用有多種原因,主要會(huì)從如下幾個(gè)方面對(duì)細(xì)胞產(chǎn)生干擾。
2.3.1 蛋白質(zhì)過(guò)表達(dá)增加細(xì)胞的負(fù)擔(dān)
碳源、氮源等營(yíng)養(yǎng)物質(zhì)進(jìn)入細(xì)胞后,一方面需要維持細(xì)胞自身的生長(zhǎng)和繁殖,為細(xì)胞壁、細(xì)胞膜等結(jié)構(gòu)的合成提供前體,另一方面要為細(xì)胞的正常代謝提供輔酶、能量等。在這種情況下,蛋白質(zhì)的過(guò)量重組表達(dá)會(huì)分流原來(lái)處于平衡狀態(tài)的碳代謝、氮代謝以及能量代謝流,從而增加細(xì)胞的生理負(fù)擔(dān)。蛋白質(zhì)高水平表達(dá)本身要求有大量的氨基酸前體供應(yīng),當(dāng)培養(yǎng)基沒(méi)有足夠的氨基酸補(bǔ)充時(shí)會(huì)造成代謝流的比例大量進(jìn)入到氨基酸前體合成途徑。另一方面,正常生長(zhǎng)狀態(tài)下細(xì)胞內(nèi)總蛋白的水平會(huì)在一定范圍內(nèi)處于穩(wěn)定的水平,從而使細(xì)胞在最為有利的狀態(tài)下生長(zhǎng)。過(guò)量的蛋白質(zhì)重組表達(dá)會(huì)打破了胞內(nèi)蛋白質(zhì)的平衡,從而影響了其他正常蛋白質(zhì)的表達(dá),使代謝失衡[10-11]。
2.3.2 多種蛋白表達(dá)間的相互干擾
為了實(shí)現(xiàn)特定生物學(xué)功能,合成生物學(xué)構(gòu)建的人工生命體系通常含有多個(gè)模塊,而一個(gè)功能模塊往往涉及多于一個(gè)蛋白的表達(dá)。如一個(gè)代謝物的合成模塊往往涉及幾種乃至十幾種酶。為了模塊穩(wěn)定性以及有利于遺傳操作和調(diào)控,這些酶往往分布在多個(gè)質(zhì)粒中,并且處于多個(gè)啟動(dòng)子控制下。當(dāng)多個(gè)酶蛋白分子同時(shí)表達(dá)時(shí),會(huì)引起多質(zhì)粒系統(tǒng)的穩(wěn)定性失衡,以及啟動(dòng)子在多種個(gè)誘導(dǎo)物條件下出現(xiàn)相互干擾。例如JD Keasling的研究表明,在多質(zhì)粒、多啟動(dòng)子系統(tǒng)中,蛋白質(zhì)表達(dá)滴度會(huì)受到明顯的影響[8]。
2.3.3 異源蛋白質(zhì)表達(dá)的毒性
在合成生物學(xué)研究中,元件、模塊中往往包含了大量的具有優(yōu)良性狀的異源基因。而異源基因在非天然宿主中進(jìn)行蛋白表達(dá)本身就會(huì)對(duì)宿主細(xì)胞產(chǎn)生影響。因?yàn)樗拗骷?xì)胞中分子伴侶體系、密碼子偏好性等通常與基因的原始生物具有很大差異,從而造成部分包涵體積累等情況,從而對(duì)宿主細(xì)胞產(chǎn)生毒性[12-13]。
2.3.4 蛋白質(zhì)表達(dá)代謝網(wǎng)絡(luò)的影響
在過(guò)表達(dá)酶等蛋白質(zhì)時(shí),蛋白質(zhì)自身的功能往往會(huì)對(duì)細(xì)胞的代謝網(wǎng)絡(luò)產(chǎn)生影響。蛋白質(zhì)表達(dá)水平過(guò)高會(huì)造成代謝中間產(chǎn)物積累、影響輔酶循環(huán)等,從而使細(xì)胞的代謝網(wǎng)絡(luò)失衡[10-11,14]。
把人工設(shè)計(jì)的模塊加載到底盤(pán)細(xì)胞后,雖然賦予了細(xì)胞新的功能,但所獲得的新生命體系往往并非是最優(yōu)的。人工生命體系的優(yōu)化和調(diào)試(Debugging)是合成生物學(xué)研究的關(guān)鍵問(wèn)題。這涉及到各模塊之間以及模塊與底盤(pán)細(xì)胞之間的適配性優(yōu)化。以蛋白質(zhì)預(yù)算為依據(jù),衡量并指導(dǎo)對(duì)人工生命體系的優(yōu)化,是合成生物學(xué)研究的一個(gè)有效手段。通過(guò)控制模塊中各種酶、功能蛋白質(zhì)的表達(dá)水平,可以減少細(xì)胞不必要的生理負(fù)擔(dān),使各種蛋白質(zhì)功能以及細(xì)胞的整體代謝網(wǎng)絡(luò)處于一個(gè)相對(duì)平衡的狀態(tài),從而為創(chuàng)建具有優(yōu)勢(shì)的人工生命體系打下基礎(chǔ)。目前已經(jīng)有各種手段和工具對(duì)蛋白質(zhì)的表達(dá)水平進(jìn)行控制,實(shí)現(xiàn)對(duì)蛋白質(zhì)預(yù)算進(jìn)行有效干預(yù)。
合成生物學(xué)的理想情況是能夠?qū)崿F(xiàn)對(duì)蛋白質(zhì)的表達(dá)水平的定量控制。但由于蛋白質(zhì)表達(dá)過(guò)程涉及轉(zhuǎn)錄、翻譯、翻譯后折疊等多個(gè)環(huán)節(jié),蛋白質(zhì)表達(dá)水平受到多種因素的影響,因此完全實(shí)現(xiàn)蛋白質(zhì)表達(dá)水平的人為精確控制還很困難。一個(gè)常用的辦法是采用一系列調(diào)控元件庫(kù),對(duì)蛋白質(zhì)表達(dá)水平進(jìn)行控制。目前已經(jīng)報(bào)道了多種研究手段,實(shí)現(xiàn)對(duì)蛋白質(zhì)表達(dá)水平的微調(diào)控。
3.1.1 啟動(dòng)子工程
啟動(dòng)子是影響蛋白質(zhì)表達(dá)水平最主要的因素之一。通過(guò)人為改變啟動(dòng)子強(qiáng)度,也是對(duì)蛋白質(zhì)表達(dá)水平進(jìn)行微調(diào)控的有效方法。目前已經(jīng)有大量的研究集中在對(duì)啟動(dòng)子的改造、優(yōu)化上,包括獲得不同強(qiáng)度的啟動(dòng)子,構(gòu)建啟動(dòng)子突變庫(kù),以及通過(guò)高通量手段獲得最佳蛋白質(zhì)表達(dá)水平。理論上,保持調(diào)控蛋白結(jié)合位點(diǎn)序列不變,通過(guò)改造啟動(dòng)子?10區(qū)和?35區(qū)的序列,以及其間的16個(gè)堿基即可構(gòu)建一系列具有不同啟動(dòng)強(qiáng)度的啟動(dòng)子,形成滿足不同表達(dá)強(qiáng)度需求的啟動(dòng)子庫(kù)。2005年,Stephanopoulos等通過(guò)易錯(cuò)突變獲得了具有不同強(qiáng)度的啟動(dòng)子文庫(kù)。篩選得到近200個(gè)不同強(qiáng)度的啟動(dòng)子,mRNA水平啟動(dòng)強(qiáng)度范圍相差325倍[15]。利用這一文庫(kù)研究者對(duì)ppc以及dxs兩種番茄紅素合成途徑中關(guān)鍵酶的表達(dá)水平進(jìn)行了優(yōu)化。結(jié)果顯示采用適當(dāng)?shù)膯?dòng)子強(qiáng)度能夠顯著提高目標(biāo)產(chǎn)物的合成水平。張學(xué)禮等構(gòu)建了以啟動(dòng)子為核心的人工調(diào)控元件文庫(kù),并成功地應(yīng)用于大腸桿菌葡萄糖轉(zhuǎn)運(yùn)及胡蘿卜素的生產(chǎn)中[16-17]。
3.1.2 mRNA的穩(wěn)定性的調(diào)節(jié)
mRNA是影響蛋白質(zhì)表達(dá)水平的另一個(gè)關(guān)鍵因素。任何mRNA都有一定的半衰期,延長(zhǎng)mRNA半衰期能夠增強(qiáng)目的基因的翻譯從而提高蛋白質(zhì)的表達(dá)水平。mRNA的半衰期與mRNA的UTR序列、二級(jí)結(jié)構(gòu)等因素有關(guān)。例如,UTR中的頸環(huán)結(jié)構(gòu)可以避免mRNA被細(xì)胞中的各種RNA酶 (RNase)降解,從而能夠提高mRNA穩(wěn)定性,加強(qiáng)蛋白質(zhì)的翻譯。JD Keasling利用mRNA中非編碼位置的頸環(huán)結(jié)構(gòu)設(shè)計(jì)了具有不同mRNA穩(wěn)定性的調(diào)控元件,即tunable intergenic regions(TIRS)[18-19]。TIRS利用 mRNA穩(wěn)定性的差異,使功能模塊中各酶蛋白的表達(dá)得到微調(diào)控。JD Keasling成功地將mRNA頸環(huán)結(jié)構(gòu)控制蛋白表達(dá)的策略應(yīng)用在青蒿素的人工合成中[19]。
3.1.3 通過(guò)RBS人工設(shè)計(jì)進(jìn)行調(diào)節(jié)
核糖體結(jié)合位點(diǎn) (RBS)是原核細(xì)胞中翻譯起始的控制位點(diǎn)。RBS序列對(duì)翻譯的起始效率具有重要影響,而翻譯起始效率的改變能夠進(jìn)而改變蛋白質(zhì)的翻譯及表達(dá)水平。因此,可以通過(guò)對(duì)RBS的序列進(jìn)行人為的改造,從而實(shí)現(xiàn)進(jìn)行蛋白質(zhì)表達(dá)水平的控制。目前已經(jīng)報(bào)道的RBS人工設(shè)計(jì)包括兩個(gè)方面:一是通過(guò)建立突變文庫(kù)獲得不同功能的RBS序列;另一種是通過(guò)理性設(shè)計(jì)獲得具有不同翻譯起始強(qiáng)度的RBS[20-21]。Salis等以理論預(yù)測(cè)為基礎(chǔ),成功獲得了一系列具有不同翻譯起始強(qiáng)度的RBS,并能夠?qū)Φ鞍踪|(zhì)表達(dá)水平進(jìn)行精確的控制[21]。
3.1.4 密碼子偏好性的作用
遺傳信息在由mRNA到蛋白質(zhì)的傳遞過(guò)程中是以三聯(lián)體密碼子的形式傳遞的。每種氨基酸至少對(duì)應(yīng)一個(gè)密碼子,編碼同一種氨基酸的密碼子稱為同義密碼子。在蛋白質(zhì)的合成過(guò)程中,同義密碼子的使用概率并不相同,這與細(xì)胞中tRNA的豐度有關(guān)。相應(yīng)tRNA豐富的密碼子,正確的氨基酸會(huì)很快連接上,而相應(yīng)tRNA稀少的密碼子,要經(jīng)過(guò)多次相互辨認(rèn)才能找到正確的tRNA,進(jìn)而外源蛋白的合成將停頓。如果相同的稀有密碼子連續(xù)出現(xiàn),就會(huì)抑制蛋白質(zhì)合成。有報(bào)道發(fā)現(xiàn)外源蛋白中含有較多的精氨酸密碼子AGA/AGG會(huì)限制降低蛋白質(zhì)的表達(dá)水平[22]。本研究組從加入稀有密碼子降低翻譯速度來(lái)降低蛋白表達(dá)量的角度入手,對(duì)稀有密碼子在翻譯水平的影響進(jìn)行分析,篩選得到一套可按不同梯度下調(diào)蛋白表達(dá)量的密碼子調(diào)控元件。利用密碼子調(diào)控元件,我們成功地實(shí)現(xiàn)了對(duì)大腸桿菌中類胡蘿卜素合成模塊關(guān)鍵酶蛋白表達(dá)的微調(diào)控,進(jìn)而顯著提高了目標(biāo)產(chǎn)物的合成水平。
模塊中某一個(gè)蛋白質(zhì)過(guò)量表達(dá),常常是設(shè)計(jì)和載體選擇不當(dāng),可以通過(guò)系統(tǒng)優(yōu)化和選擇去解決。而為達(dá)到代謝通量平衡并且最大化而人為過(guò)量表達(dá)某一個(gè)或兩個(gè)基因引起的蛋白質(zhì)預(yù)算問(wèn)題,則需要酶工程或篩選大量的異源基因。通過(guò)酶工程、蛋白質(zhì)工程等手段獲得更優(yōu)的蛋白質(zhì)分子,可以在蛋白質(zhì)表達(dá)水平較低的情況下實(shí)現(xiàn)功能,從而減少蛋白質(zhì)預(yù)算的投入。因此通過(guò)酶基因的替換、酶工程以及蛋白質(zhì)工程的改造實(shí)現(xiàn)蛋白質(zhì)預(yù)算優(yōu)化,是合成生物學(xué)優(yōu)化中的重要手段。
3.2.1 蛋白質(zhì)工程
蛋白質(zhì)分子不僅要能實(shí)現(xiàn)生物元件和生物模塊的基本催化、調(diào)控功能, 而且要使生物元件和模塊之間、生物模塊與底盤(pán)細(xì)胞之間具有完善的適配能力,在復(fù)雜的代謝和調(diào)控網(wǎng)絡(luò)中充分發(fā)揮功能,才能使新生命體系比天然生物體具有更大的功能優(yōu)勢(shì)。蛋白質(zhì)工程以蛋白質(zhì)的結(jié)構(gòu)為依據(jù),結(jié)合生物信息學(xué)、生物化學(xué)等手段進(jìn)行設(shè)計(jì)、改造,從基因水平上改變蛋白質(zhì)的序列和結(jié)構(gòu),獲得具有新功能的蛋白質(zhì)分子[23]。
蛋白質(zhì)工程通常采用理性設(shè)計(jì)與高通量人工進(jìn)化與篩選這兩種方式獲得新功能的蛋白質(zhì)[24]。這要求在晶體結(jié)構(gòu)、生物信息學(xué)等方面要對(duì)靶蛋白具有充分的認(rèn)識(shí),或是需要針對(duì)靶蛋白建立高效的進(jìn)化與篩選平臺(tái)。蛋白質(zhì)工程在合成生物學(xué)中的應(yīng)用包括多個(gè)方面:如設(shè)計(jì)改造高效的催化元件;根據(jù)代謝網(wǎng)絡(luò)需求建立具有邏輯門(mén)功能的分子開(kāi)關(guān)或新的調(diào)控元件;幫助提高元件、模塊對(duì)極端pH、極端溫度、高鹽等環(huán)境的適應(yīng)能力等 (抗逆元件)。
3.2.2 人工分子機(jī)器
在蛋白質(zhì)改造過(guò)程中,將不同功能的蛋白質(zhì)或蛋白質(zhì)的某一部分在空間上組合在一起,可以增強(qiáng)酶催化過(guò)程中底物有效濃度,減少蛋白質(zhì)的用量。天然細(xì)胞中最高效的酶催化方式是蛋白質(zhì)復(fù)合體,例如脂肪酸合成過(guò)程的復(fù)合體可以使脂肪酸的合成代謝以最有序高效的方式進(jìn)行。人工分子機(jī)器模仿了天然蛋白質(zhì)復(fù)合體的組合方式。通過(guò)將酶基因與能夠介導(dǎo)蛋白質(zhì)相互作用的結(jié)構(gòu)域進(jìn)行融合表達(dá)。所獲得的融合蛋白既具有酶的催化功能,又可以通過(guò)融合結(jié)構(gòu)域的介導(dǎo)定位到一起,進(jìn)而組成大分子量的人工蛋白復(fù)合體。
人工分子機(jī)器在代謝工程等領(lǐng)域具有特殊的應(yīng)用價(jià)值。將一條代謝途徑中相關(guān)聯(lián)的若干酶分子組裝到人工蛋白復(fù)合體中,可以加快酶分子對(duì)代謝中間物的捕捉和識(shí)別過(guò)程,從而使酶催化反應(yīng)更為高效。人口分子機(jī)器包括兩部分,一是分子骨架,作為人工蛋白復(fù)合體的核。二是模塊中的各個(gè)酶,酶蛋白通過(guò)融合結(jié)構(gòu)域以不同比例結(jié)合到分子骨架上,從而實(shí)現(xiàn)模塊的最優(yōu)化。JD Keasling在研究青蒿素前體的人工合成中,成功將人工分子機(jī)器用于模塊的優(yōu)化。Kealing分別將青蒿素合成上游模塊中的3個(gè)酶蛋白AtoB、HMGS、HMGR同GBD、S3H、PDZ三個(gè)結(jié)構(gòu)域融合表達(dá),并結(jié)合在分子骨架上。通過(guò)分子機(jī)器的優(yōu)化,使下游產(chǎn)物的合成水平提高了70倍[25]。
人工纖維小體是一種模仿天然大分子機(jī)器-纖維小體 (Cellulosome)的高效降解木質(zhì)纖維素的人工復(fù)合體。人工纖維小體以腳手架蛋白為基礎(chǔ),通過(guò)蛋白質(zhì)相互作用聚集了纖維素底物結(jié)合模塊以及催化模塊,能夠顯著提高纖維素的降解效率。在人工合成細(xì)胞中加載纖維素水解的人工纖維小體已經(jīng)獲得成功[26-27]。但由于CBH催化活力的限制,要真正構(gòu)建有實(shí)用價(jià)值的直接利用纖維素的人工合成細(xì)胞將是蛋白質(zhì)預(yù)算給合成生物學(xué)帶來(lái)的挑戰(zhàn)。
3.2.3 天然基因的篩選和替換
經(jīng)過(guò)酶工程、蛋白質(zhì)工程改造的酶分子等可以在一定程度上解決因需要過(guò)量表達(dá)導(dǎo)致的蛋白質(zhì)預(yù)算失衡。但當(dāng)?shù)鞍追肿釉诮Y(jié)構(gòu)、功能等方面研究不足,或沒(méi)有理想的篩選文庫(kù)時(shí),通過(guò)改造蛋白質(zhì)分子則很難獲得理想的優(yōu)化結(jié)果。幸運(yùn)的是自然界中動(dòng)物、植物、微生物中蘊(yùn)含了大量的基因資源。可以從天然生物中獲得各種性狀優(yōu)良的蛋白質(zhì)基因,用于人工生命體系的組建中。這些基因由于具有更高催化活力而降低了蛋白量的需求,在合適的表達(dá)調(diào)控下就可以解決蛋白質(zhì)預(yù)算失衡的問(wèn)題。海洋、熱泉、鹽湖中的微生物往往具有耐熱、耐鹽等特性,是良好的基因資源庫(kù)。近年來(lái),人們已經(jīng)從海洋微生物等資源中獲得大量新功能的基因。
以上各種對(duì)蛋白質(zhì)預(yù)算進(jìn)行控制的常用手段總結(jié)在表1中。
創(chuàng)建具有優(yōu)勢(shì)的人工生命體系,是合成生物學(xué)研究的最終目標(biāo)。蛋白質(zhì)是生物體中起核心作用的分子。如何在蛋白質(zhì)表達(dá)水平上實(shí)現(xiàn)生命體系的最優(yōu)化,對(duì)合成生物學(xué)的研究具有重要的指導(dǎo)意義。蛋白質(zhì)預(yù)算的概念,將對(duì)分析影響人工生命體系功能的關(guān)鍵因素,指導(dǎo)元件設(shè)計(jì)、模塊組裝以及適配性優(yōu)化具有積極作用。
表1 蛋白質(zhì)預(yù)算的控制手段Table 1 Methods for the control of protein budget
致謝:本文內(nèi)容是作者的個(gè)人看法及觀點(diǎn),在國(guó)際上尚未有類似的具體描述,作者要感謝過(guò)去杜邦公司的同事在工作中的討論,也感謝金城教授和林章凜教授在酶工程年會(huì)中的討論,并感謝陶勇實(shí)驗(yàn)室多位工作人員和學(xué)生提供的未發(fā)表數(shù)據(jù)。
[1]Ham TS,Dmytriv Z,Plahar H,et al.Design,implementation and practice of JBEI-ICE:an open source biological part registry platform and tools.Nucleic Acids Res,2012,40:e141.
[2]Mackenzie A.Synthetic biology and the technicity of biofuels.Stud Hist Philos Biol Biomed Sci,2013,44(2):190?198.
[3]Folcher M,Fussenegger M.Synthetic biology advancing clinical applications.Curr Opin Chem Biol,2012,16:345?354.
[4]Gibson DG,Glass JI,Lartigue C,et al.Creation of a bacterial cell controlled by a chemically synthesized genome.Science,2010,329:52?56.
[5]Baneyx F.Recombinantprotein expression inEscherichia coli.Curr Opin Biotechnol,1999,10:411?421.
[6]CampsM.Modulation ofColE1-likeplasmid replication for recombinant gene expression.Recent Pat DNA Gene Seq,2010,4:58?73.
[7]Forster AC.Synthetic biology challenges long-held hypotheses in translation, codon bias and transcription.Biotechnol J,2012,7:835?845.
[8]JonesKL,Kim SW,KeaslingJD.Low-copy plasmids can perform as well as or better than high-copy plasmids for metabolic engineering of bacteria.Metab Eng,2000,2:328?338.
[9]Anthony JR,Anthony LC,Nowroozi F,et al.Optimization of the mevalonate-based isoprenoid biosynthetic pathway in Escherichia colifor production of the anti-malarial drug precursor amorpha-4,11-diene.Metab Eng,2009,11:13?19.
[10]Malakar P,Venkatesh KV.Effect of substrate and IPTG concentrations on the burden to growth ofEscherichia colion glycerol due to the expression of Lac proteins.Appl Microbiol Biotechnol,2012,93:2543?2549.
[11]Glick BR.Metabolic load and heterologous gene expression.Biotechnol Adv,1995,13:247?261.
[12]Wagner S,Klepsch MM,Schlegel S,et al.TuningEscherichiacolifor membrane protein overexpression.Proc Natl Acad Sci USA,2008,105:14371?14376.
[13]Dumon-Seignovert L,Cariot G,Vuillard L.The toxicity of recombinant proteins inEscherichia coli: a comparison of overexpression in BL21(DE3),C41(DE3),and C43(DE3).Protein Expr Purif,2004,37:203?206.
[14]Flores S,de Anda-Herrera R,Gosset G,et al.Growth-rate recovery ofEscherichia colicultures carrying a multicopy plasmid,by engineering of the pentose-phosphate pathway.BiotechnolBioeng,2004,87:485?494.
[15]Alper H,Fischer C,Nevoigt E,Stephanopoulos G.Tuning genetic control through promoter engineering.Proc Natl Acad Sci USA,2005,102:12678?12683.
[16]Lu J,Tang J,Liu Y,et al.Combinatorial modulation of galP and glk gene expression for improved alternative glucose utilization.ApplMicrobiol Biotechnol,2012,93:2455?2462.
[17]Zhao J,Liu Y,Li QY,et al.Modulation of isoprenoid gene expression with multiple regulatory parts for improved β-carotene production.Chin J Biotech,2013,29(1):41–45(in Chinese).
趙婧,劉怡,李清艷,等.多個(gè)調(diào)控元件調(diào)控萜類合成途徑基因表達(dá)提高 β-胡蘿卜素的生產(chǎn).生物工程學(xué)報(bào),2013,29(1):41?45.
[18]Carrier TA,Keasling JD.Controlling messenger RNA stability in bacteria:strategies for engineering gene expression.BiotechnolProg,1997,13:699?708.
[19]Pfleger BF,Pitera DJ,Smolke CD,etal.Combinatorial engineering of intergenic regions in operons tunes expression of multiple genes.Nat Biotechnol,2006,24:1027?1032.
[20]Anderson JC,Voigt CA,Arkin AP.Environmental signal integration by a modular AND gate.Mol Syst Biol,2007,3:133.
[21]Salis HM,Mirsky EA,Voigt CA.Automated design of synthetic ribosome binding sites to control protein expression.NatBiotechnol,2009,27:946?950.
[22]Gurvich OL,Baranov PV,Gesteland RF,et al.Expression levels influence ribosomal frameshifting at the tandem rare arginine codons AGG_AGG and AGA_AGA inEscherichia coli.J Bacteriol,2005,187:4023?4032.
[23]Yoshikuni Y,Dietrich JA,Nowroozi FF,et al.Redesigning enzymes based on adaptive evolution for optimal function in synthetic metabolic pathways.Chem Biol,2008,15:607?618.
[24]Zawaira A,Pooran A,Barichievy S,et al.A discussion of molecular biology methods for protein engineering.Mol Biotechnol,2012,51:67?102.
[25]Dueber JE,Wu GC,Malmirchegini GR,et al.Synthetic protein scaffolds provide modular control over metabolic flux.Nat Biotechnol,2009,27:753?759.
[26]Tsai SL,Goyal G,Chen W.Surface display of a functional minicellulosome by intracellular complementation using a synthetic yeast consortium and its application to cellulose hydrolysis and ethanol production.Appl Environ Microbiol,2010,76:7514?7520.
[27]Wen F,Sun J,Zhao H.Yeast surface display of trifunctionalminicellulosomesforsimultaneous saccharification and fermentation of cellulose to ethanol.Appl Environ Microbiol, 2010, 76:1251?1260.
[28]Sharma V, Yamamura A, Yokobayashi Y.Engineering artificial small RNAs for conditional gene silencing inEscherichia coli.ACS Synth Biol,2012,1:6?13.
[29]Wu YI,Frey D,Lungu OI,et al.A genetically encoded photoactivatable Rac controls the motility of living cells.Nature,2009,461:104?108.
[30]Tsuruta H,Paddon CJ,Eng D,et al.High-level production of amorpha-4,11-diene,a precursor of the antimalarial agent artemisinin,inEscherichia coli.PLoS ONE,2009,4:e4489.
[31]Ma SM,Garcia DE,Redding-Johanson AM et al.Optimization of a heterologous mevalonate pathway through the use of variant HMG-CoA reductases.Metab Eng,2011,13:588?597.