付憲,林濤,張帆,張惠銘,章文蔚,楊煥明,4,朱師達(dá),5,徐訊,沈玥,5,6
(1 深圳華大生命科學(xué)研究院,廣東 深圳 518083; 2 廣東省高通量基因組測(cè)序與合成編輯應(yīng)用重點(diǎn)實(shí)驗(yàn)室,深圳華大生命科學(xué)研究院,廣東 深圳 518120; 3 中國(guó)科學(xué)院大學(xué)華大教育中心,廣東 深圳 518083; 4 (廣東?。┤A大基因合成基因組學(xué)院士工作站, 深圳華大基因科技有限公司,廣東 深圳 518120; 5 深圳創(chuàng)新分子診斷技術(shù)工程實(shí)驗(yàn)室,深圳華大生命科學(xué)研究院,廣東 深圳 518120; 6 深圳國(guó)家基因庫(kù),廣東 深圳 518120)
遺傳密碼(決定DNA 中三個(gè)核苷酸為一組的密碼子轉(zhuǎn)譯為蛋白質(zhì)中氨基酸序列的規(guī)則)曾被認(rèn)為是不可改變的,且可被基因編碼的氨基酸種類(lèi)局限于20 種。隨后的研究打破了這一結(jié)論,表明生物的遺傳密碼在不同物種間也存在一定的差異性。例如,在釀酒酵母的線(xiàn)粒體中,終止密碼子UGA 也能編碼色氨酸[1]。在包括人類(lèi)在內(nèi)的許多物種中,UGA 亦可被用于編碼常規(guī)氨基酸之外的第21 種氨基酸,即硒代半胱氨酸[2]。這些發(fā)現(xiàn)均暗示著遺傳密碼在生物體內(nèi)具有可拓展和被重編的潛力。
受到自然界中密碼子重編案例的啟示,在過(guò)去的20 多年中,研究人員基于對(duì)中心法則的理解運(yùn)用,成功開(kāi)發(fā)出在生物體內(nèi)進(jìn)行密碼子拓展的方法,實(shí)現(xiàn)了常規(guī)20 種氨基酸以外的非天然氨基酸的編碼。除β-氨基酸和D-α-氨基酸外,非天然氨基酸還包括針對(duì)特殊氨基酸側(cè)鏈基團(tuán)(R)設(shè)計(jì)改造的氨基酸。這樣的設(shè)計(jì)改造能極大地拓展天然編碼系統(tǒng)中有限的蛋白質(zhì)構(gòu)筑基元種類(lèi),對(duì)精細(xì)改造或調(diào)控蛋白質(zhì)的結(jié)構(gòu)功能將起到重要的作用。
基因密碼子拓展技術(shù)的開(kāi)發(fā)優(yōu)化主要圍繞翻譯工具和適配底盤(pán)細(xì)胞兩部分。開(kāi)發(fā)高效且正交的翻譯工具,使其既能特異性識(shí)別非天然氨基酸又能與生物內(nèi)源的翻譯系統(tǒng)兼容,從而保證目標(biāo)蛋白質(zhì)合成過(guò)程的正交性。構(gòu)建適配的底盤(pán)細(xì)胞,需要改造細(xì)胞基因組使其具有被翻譯工具識(shí)別的空白密碼子,并對(duì)翻譯系統(tǒng)等諸多細(xì)胞途徑進(jìn)行后續(xù)改造,從而保證遺傳信息傳遞和解讀過(guò)程的正交性。借助正交的翻譯工具和適配底盤(pán)細(xì)胞,基因密碼子拓展技術(shù)可實(shí)現(xiàn)將特殊用途的非天然氨基酸定點(diǎn)引入到目標(biāo)蛋白的指定位點(diǎn),為人類(lèi)在醫(yī)藥、健康、能源、材料等多個(gè)重要領(lǐng)域的發(fā)展注入新的活力。本文作者將從翻譯工具和適配底盤(pán)的開(kāi)發(fā)兩方面展開(kāi),系統(tǒng)討論基因密碼子拓展技術(shù)的發(fā)展,并介紹其在科研與產(chǎn)業(yè)中的相關(guān)應(yīng)用。
自然界生物按照其對(duì)應(yīng)的密碼子表來(lái)基因編碼蛋白質(zhì)合成所需的20 種天然氨基酸(不包括硒代半胱氨酸和吡咯賴(lài)氨酸)。在生物體內(nèi),如磷酸化、乙?;⒎核鼗确g后修飾是豐富天然氨基酸結(jié)構(gòu)進(jìn)而拓展蛋白質(zhì)功能的主要途徑,在許多生命過(guò)程的調(diào)控中發(fā)揮著關(guān)鍵的作用。蛋白質(zhì)氨基酸種類(lèi)的拓展亦可以通過(guò)向目標(biāo)蛋白中引入非天然氨基酸的方式來(lái)實(shí)現(xiàn)。技術(shù)手段包括往細(xì)胞中注射化學(xué)合成的氨?;痶RNA[3],或改造營(yíng)養(yǎng)缺陷型菌株使其可利用氨基酸類(lèi)似物[4]。此外,以Peter G.Schultz等為代表的研究人員開(kāi)發(fā)了一種基因密碼子拓展方法,通過(guò)往細(xì)胞內(nèi)引入改造后的翻譯工具來(lái)實(shí)現(xiàn)基因編碼非天然氨基酸,為拓展蛋白質(zhì)的結(jié)構(gòu)和功能開(kāi)辟了新的路徑[5]。密碼子拓展技術(shù)的核心是需要引入一套正交的外源翻譯工具,即能特異性識(shí)別非天然氨基酸的氨酰-tRNA 合成酶以及能識(shí)別空白密碼子的配對(duì)tRNA[圖1(a)]。同時(shí),該工具配對(duì)不能與宿主細(xì)胞中的內(nèi)源性氨酰-tRNA 合成酶或tRNA 發(fā)生交叉反應(yīng)[圖1(b)]。此外,通過(guò)對(duì)其他核心翻譯元件(如延伸因子和核糖體)進(jìn)行設(shè)計(jì)和改造,可進(jìn)一步實(shí)現(xiàn)對(duì)密碼子拓展系統(tǒng)的優(yōu)化,從而提高非天然氨基酸被特異性地引入到目標(biāo)蛋白中的效率[6-8]。本節(jié)將重點(diǎn)圍繞以氨酰-tRNA 合成酶/tRNA 配對(duì)為代表的翻譯元件正交性以及多種其他翻譯元件的改造方法進(jìn)行介紹討論。
氨酰-tRNA 合成酶/tRNA 配對(duì)是翻譯過(guò)程中的核心工具,保證其正交性是進(jìn)行技術(shù)開(kāi)發(fā)和相應(yīng)下游應(yīng)用挖掘的關(guān)鍵。氨酰-tRNA 合成酶/tRNA 配對(duì)的正交性包含兩個(gè)層面:第一,tRNA 的正交性,即外源引入的工具tRNA(用于匹配空白密碼子的tRNA)只能被對(duì)應(yīng)的工具酶特異性地識(shí)別,而不能與內(nèi)源的其他氨酰-tRNA合成酶發(fā)生交叉反應(yīng);第二,氨酰-tRNA合成酶的正交性,即外源的氨酰-tRNA合成酶工具能特異性地識(shí)別外源添加的非天然氨基酸[圖1(b)][6-8]。
1.1.1 tRNA的正交性
tRNA 是翻譯過(guò)程中氨基酸的運(yùn)輸工具,每種tRNA 上帶有的被對(duì)應(yīng)氨酰-tRNA 合成酶所識(shí)別的特征元素決定了tRNA 水平的正交性[9]。理想的正交氨酰-tRNA 合成酶/tRNA 配對(duì)不會(huì)與宿主細(xì)胞中的天然氨基酸、內(nèi)源性氨酰-tRNA 合成酶或tRNA發(fā)生交叉反應(yīng)。早期研究通過(guò)對(duì)內(nèi)源的氨酰-tRNA合成酶和配對(duì)tRNA 進(jìn)行設(shè)計(jì)改造,成功開(kāi)發(fā)出在tRNA 水平正交的氨酰-tRNA 合成酶/tRNA 配對(duì),使其能獨(dú)立于內(nèi)源的工具配對(duì)行使特定的功能[10]。另一種思路則是從進(jìn)化關(guān)系較遠(yuǎn)的生物體中選擇氨酰-tRNA 合成酶/tRNA 配對(duì)進(jìn)行改造,以降低交叉反應(yīng)的發(fā)生概率。例如,古菌Methanococcus janaschii的酪氨酰-tRNA 合成酶/酪氨酸t(yī)RNA 配對(duì)(MjTyrRS/tRNATyr)于2001 年被引入到大腸桿菌中,用于編碼合成含有O-甲基-L-酪氨酸的蛋白質(zhì)[11]。在大腸桿菌中選擇上述工具配對(duì)的原因包括:①M(fèi)jtRNATyr的氨基酸接納莖上第一個(gè)堿基對(duì)為C-G(大腸桿菌是G-C),可有效地防止被內(nèi)源TyrRS 酶識(shí)別[12];②TyrRS 不具有對(duì)于底物氨基酸的編輯校對(duì)機(jī)制[13],有益于非天然氨基酸的引入。這些特征極大地降低了正交工具改造的難度,且改造后的MjTyrRS/tRNACUA配對(duì)因在大腸桿菌中具有良好的正交性和較高的活性,得到了廣泛的應(yīng)用[14]。然而,該工具配對(duì)在酵母和哺乳細(xì)胞等真核系統(tǒng)中不正交,該配對(duì)在真核系統(tǒng)中的應(yīng)用則受到了限制?;谙嗨圃?,可用于真核系統(tǒng)的多個(gè)氨酰-tRNA 合成酶/tRNA 配對(duì)被相繼開(kāi)發(fā)出來(lái)。例如,源自大腸桿菌的酪氨酰-tRNA 合成酶/酪氨酸t(yī)RNA 配對(duì)(EcTyrRS/tRNACUA)和亮氨酰-tRNA 合 成 酶/亮 氨 酸t(yī)RNA 配 對(duì)(EcLeuRS/tRNACUA)被改造為真核生物中的密碼子拓展工具[15-19],但由于這些配對(duì)工具在大腸桿菌中和一些其他細(xì)菌中不正交,故又不適用于原核系統(tǒng)。
吡咯賴(lài)氨酰-tRNA 合成酶/吡咯賴(lài)氨酸t(yī)RNA 配對(duì)(PylRS/tRNAPyl)存在于一些產(chǎn)甲烷的古菌和細(xì)菌中,是編碼吡咯賴(lài)氨酸(第22 種氨基酸)的工具。因其在多種生物系統(tǒng)中(包括細(xì)菌和真核生物)都具有高正交性,適合作為在原核系統(tǒng)和真核系統(tǒng)中的通用性密碼子拓展工具進(jìn)行改造。針對(duì)tRNAPyl的正交性維持機(jī)制已積累了較為全面的研究基礎(chǔ):通過(guò)體內(nèi)活性和氨酰動(dòng)力學(xué)測(cè)試,tRNAPyl的氨基酸接納莖中G73 位點(diǎn)和第一個(gè)堿基對(duì)以及T 環(huán)堿基對(duì)G51:C63 是重要的識(shí)別特征元素[20]。PylRS 酶氮末端結(jié)構(gòu)域緊密地貼合在由tRNAPyl的T 環(huán)和極小可變環(huán)組成的凹面上,這一結(jié)構(gòu)特征使得PylRS/tRNAPyl配對(duì)自身能夠特異性結(jié)合,且能避免其他內(nèi)源tRNA 中較長(zhǎng)可變環(huán)與PylRS酶的非特異性結(jié)合[21]。此外,PylRS酶具有氨基酸底物識(shí)別可塑性高和不識(shí)別tRNA 反密碼子環(huán)等優(yōu)良特性,進(jìn)一步促使PylRS/tRNACUA配對(duì)成為目前應(yīng)用范圍最廣泛的編碼工具[20]。
圖1 密碼子拓展系統(tǒng)的翻譯工具示意圖Fig.1 Orthogonal translational tools for genetic code expansion
開(kāi)發(fā)在tRNA 水平相互正交的編碼工具是同時(shí)基因編碼多種非標(biāo)準(zhǔn)氨基酸的關(guān)鍵性環(huán)節(jié),也是該領(lǐng)域備受關(guān)注的研究方向。早期研究的關(guān)注點(diǎn)在于將一種非天然氨基酸引入到蛋白質(zhì)合成中,隨著近年來(lái)新型工具配對(duì)的開(kāi)發(fā)和的優(yōu)化方法的改進(jìn),在目標(biāo)蛋白質(zhì)中同時(shí)基因編碼2~3 種非天然氨基酸已成為可能[22-23]。在細(xì)胞中編碼多種非天然氨基酸合成的蛋白質(zhì),需要借助相互正交的氨酰-tRNA 合成酶/tRNA 配對(duì)實(shí)現(xiàn)。即在不與內(nèi)源的翻譯系統(tǒng)發(fā)生交叉反應(yīng)的前提下,引入的多對(duì)外源氨酰-tRNA 合成酶/tRNA 配對(duì)之間亦不能發(fā)生相互作用[圖1(b)][8]。一些已開(kāi)發(fā)的用于編碼非天然氨基酸的氨酰-tRNA 合成酶/tRNA 工具配對(duì)自身已經(jīng)具備相互正交性。例如,古菌來(lái)源的MjTyrRS/tRNACUA和PylRS/tRNAPyl配對(duì)(tRNAPyl被改造用于抑制終止密碼子UAA)可分別將2 種非天然氨基酸同時(shí)引入大腸桿菌氯霉素乙酰轉(zhuǎn)移酶中[24]。進(jìn)一步配合大腸桿菌衍生工具配對(duì)EcTrpRS/tRNA,則可實(shí)現(xiàn)同時(shí)基因編碼3 種不同的非天然氨基酸[22]。近年來(lái),海量的基因組與宏基因組數(shù)據(jù)成為開(kāi)發(fā)新型氨酰-tRNA 合成酶/tRNA的重要資源,通過(guò)生物信息學(xué)的深度分析挖掘,一些新型的PylRS/tRNAPyl配對(duì)被挖掘和發(fā)現(xiàn),可用于開(kāi)發(fā)同類(lèi)型相互正交的非天然氨基酸編碼工具[25-27]。
1.1.2 氨酰-tRNA合成酶的正交性
作為細(xì)胞中最古老的酶之一,氨酰-tRNA合成酶是保證翻譯過(guò)程嚴(yán)格按照遺傳密碼子表執(zhí)行的核心元件。通過(guò)長(zhǎng)期的進(jìn)化,氨酰-tRNA合成酶中氨基酸結(jié)合口袋這一特定結(jié)構(gòu)能特異性地識(shí)別對(duì)應(yīng)的氨基酸,從而保證氨酰-tRNA合成酶對(duì)底物的正交性。因此,開(kāi)發(fā)能特異性識(shí)別非天然氨基酸的工具酶需要對(duì)氨酰-tRNA合成酶中氨基酸結(jié)合口袋及其他關(guān)鍵結(jié)合區(qū)域進(jìn)行設(shè)計(jì)改造和定向進(jìn)化。基于上述思路和策略,不同類(lèi)型的氨酰-tRNA合成酶被用于改造,多種用于基因密碼子拓展的工具酶被成功地開(kāi)發(fā)出來(lái),實(shí)現(xiàn)了把超過(guò)200種的非天然氨基酸特異性地引入到生物體蛋白中[28-29]。例如,包含β-芳香族側(cè)鏈或γ-芳香族側(cè)鏈的非天然氨基酸可通過(guò)改造MjTyrRS 酶引入[30];特異性改造EcLeuRS 酶可實(shí)現(xiàn)O-甲基-L-酪氨酸、α-氨基辛酸以及光敏感的鄰硝基芐基半胱氨酸等的引入[19]。
當(dāng)討論氨酰-tRNA合成酶工具用于密碼子拓展的有效性和可行性時(shí),其底物水平的正交性是相對(duì)而非絕對(duì)的。即相比上文提到的“一對(duì)一”識(shí)別特異性的案例,還存在“一對(duì)多”識(shí)別的情況。一些氨酰-tRNA 合成酶存在底物多特異性(polyspecific),能夠同時(shí)識(shí)別多種天然或者非天然氨基酸[31]。例如,野生型的PylRS 可識(shí)別超過(guò)20種賴(lài)氨酸衍生物[32],改造后可實(shí)現(xiàn)特異性地識(shí)別N-乙酰化賴(lài)氨酸及其衍生物或者帶有脂肪族側(cè)鏈的非天然氨基酸[29,31]。多特異性現(xiàn)象的存在可能是氨酰-tRNA合成酶在進(jìn)化過(guò)程中缺乏同類(lèi)型氨基酸底物的競(jìng)爭(zhēng)所致,該現(xiàn)象的發(fā)現(xiàn)對(duì)應(yīng)用某些廉價(jià)氨基酸衍生底物進(jìn)行酶活性測(cè)試和定向進(jìn)化相關(guān)研究有著重要的意義。
開(kāi)發(fā)高效且正交的氨酰-tRNA 合成酶/tRNA 配對(duì)是密碼子拓展技術(shù)的重點(diǎn)研究?jī)?nèi)容,旨在解決工具翻譯效率低、正交性和兼容性差等核心瓶頸。一方面,已被揭示的氨?;磻?yīng)原理和已知的晶體結(jié)構(gòu)為工具配對(duì)的理性改造奠定了理論基礎(chǔ);另一方面,定向進(jìn)化技術(shù)的快速發(fā)展以及海量基因組數(shù)據(jù)的深度挖掘加速了新型氨酰-tRNA 合成酶/tRNA 配對(duì)的開(kāi)發(fā)。下文將重點(diǎn)討論氨酰-tRNA合成酶和tRNA 改造過(guò)程中所涉及的方法和相關(guān)的研究進(jìn)展。
在獲得了tRNA 水平正交的氨酰-tRNA 合成酶/tRNA 配對(duì)基礎(chǔ)之上,針對(duì)氨酰-tRNA 合成酶的后續(xù)改造主要集中在氨基酸底物識(shí)別口袋或編輯結(jié)構(gòu)域的活性位點(diǎn)。傳統(tǒng)的定向進(jìn)化方法通常利用連續(xù)正反向迭代篩選原理,在建立氨基酸識(shí)別口袋突變體文庫(kù)之后,通過(guò)連續(xù)正選擇(抗生素抗性)和反選擇(毒性蛋白產(chǎn)生)來(lái)分離可特異性引入非天然氨基酸的氨酰-tRNA 合成酶變體[33]。氨酰-tRNA合成酶的編輯活性位點(diǎn)決定自身的矯正活性,用于水解錯(cuò)配的氨基酸,對(duì)其進(jìn)行改造亦可有效提高非天然氨基酸的引入效率。例如,對(duì)EcLeuRS 酶編輯活性位點(diǎn)的失活突變可降低其識(shí)別天然底物亮氨酸的能力,從而提高翻譯過(guò)程中非天然氨基酸的引入效率[34]。除了傳統(tǒng)方法,新一代蛋白質(zhì)定向進(jìn)化方法加速了氨酰-tRNA合成酶的開(kāi)發(fā)。建立包含更多活性位點(diǎn)的突變體文庫(kù)或者通過(guò)易錯(cuò)PCR 獲得隨機(jī)突變等方法,為獲得更優(yōu)質(zhì)的正交配對(duì)提供了可能性[35]。此外,多元自動(dòng)化基因組工程(multiplex automated genome engineering, MAGE)和噬菌體輔助持續(xù)進(jìn)化(phage-assisted continuous evolution, PACE)技術(shù)也在密碼子擴(kuò)展工具開(kāi)發(fā)過(guò)程中起到了重要作用[36-37]。MAGE 技術(shù)可在細(xì)胞群內(nèi)創(chuàng)建組合遺傳多樣性的大型突變體文庫(kù)[38]。 PACE 技術(shù)的優(yōu)勢(shì)則在于不依賴(lài)已知的蛋白質(zhì)結(jié)構(gòu),通過(guò)體內(nèi)隨機(jī)誘變,實(shí)施工具效率和細(xì)胞生長(zhǎng)相耦聯(lián)的篩選方法,不僅可以在短時(shí)間內(nèi)獲得目標(biāo)突變體,還有助于揭示工具酶關(guān)鍵殘基的未知功能[28,39]。
理性設(shè)計(jì)和定向進(jìn)化策略亦可有效地用于tRNA 的改造和優(yōu)化。例如,tRNA 的受體莖是被延伸因子(elongation factor, EF-Tu)識(shí)別的特征元素,將大腸桿菌tRNASec的受體莖移植到tRNASer上,建立雜交tRNAUTu成功解決了EF-Tu 無(wú)法識(shí)別tRNASec的問(wèn)題[40]。通過(guò)后續(xù)的定點(diǎn)誘變,獲得了比野生型活性更高的突變體tRNAUTuX,從而推動(dòng)了硒蛋白的高效合成[41]。此外,通過(guò)對(duì)構(gòu)建MjtRNATyr的突變體庫(kù)和正反向篩選,獲得了更容易被延伸因子EF-Tu 識(shí)別的突變體tRNA,有助于提高目標(biāo)蛋白的產(chǎn)量[42]?;赑ylRS 酶不識(shí)別tRNAPyl的反義密碼子環(huán)特性,tRNAPyl反義密碼子環(huán)可被任意改造,用于讀取不同的密碼子[43]。通過(guò)對(duì)tRNAPyl反義密碼莖的定向進(jìn)化,可進(jìn)一步篩選出翻譯效率更高的tRNAPyl突變體(tRNAPly-Opt)[44]。未來(lái),隨著生化原理解析的深入和相關(guān)技術(shù)的快速發(fā)展,tRNA 這一核心翻譯元件的開(kāi)發(fā)優(yōu)化有望進(jìn)一步突破,實(shí)現(xiàn)從源頭上推動(dòng)密碼子拓展技術(shù)的升級(jí)和應(yīng)用。
除了氨酰-tRNA 合成酶/tRNA 配對(duì)之外,核糖體、延伸因子、釋放因子等翻譯元件也在翻譯過(guò)程中扮演著非常重要的功能,影響翻譯效率及編碼氨基酸的特異性。其中,核糖體是蛋白質(zhì)合成的分子機(jī)器;延伸因子識(shí)別氨酰-tRNA,并攜帶其進(jìn)入核糖體的A 位點(diǎn);多肽鏈合成完成后通過(guò)釋放因子(release factor,RF)識(shí)別終止密碼子實(shí)現(xiàn)完整肽鏈和核糖體從mRNA 上的釋放[45]。有研究通過(guò)對(duì)大腸桿菌核糖體中16S rRNA 的改造來(lái)構(gòu)建正交的核糖體系統(tǒng)[46]。也有研究通過(guò)對(duì)16S rRNA 和23S rRNA 之間加以物理束縛以避免工程亞基與天然亞基發(fā)生交叉裝配,保障了工程核糖體和天然核糖體之間的平行功能[47-48]。此外,研究發(fā)現(xiàn)工程化的核糖體也可以起到阻礙釋放因子的作用,促進(jìn)非天然氨基酸的引入[45]。部分非天然氨基酸由于其龐大側(cè)鏈結(jié)構(gòu)或攜帶某種電荷,其氨酰-tRNA無(wú)法被延伸因子識(shí)別或者受到核糖體阻礙導(dǎo)致該非天然氨基酸的編碼效率低下。有相關(guān)研究則通過(guò)改造延伸因子實(shí)現(xiàn)了在大腸桿菌中基因編碼帶負(fù)電荷的磷酸化絲氨酸[49]。另外,當(dāng)終止密碼子被選擇用于編碼非天然氨基酸,釋放因子的識(shí)別也會(huì)引起翻譯終止的競(jìng)爭(zhēng),從而降低目標(biāo)蛋白的產(chǎn)量[圖1(a)]。研究人員則通過(guò)敲除UAG 重編大腸桿菌中的RF1 來(lái)提高非天然氨基酸的引入效率[50]。相比原核生物,真核釋放因子eRF1 可識(shí)別三種終止密碼子,研究人員則采取了eRF1 改造而非刪除的策略,在哺乳動(dòng)物細(xì)胞中開(kāi)發(fā)出針對(duì)UAG 識(shí)別特異性減弱的eRF1 突變體,并證實(shí)了該策略的可行性[51]。
綜上所述,構(gòu)建正交的翻譯體系,需要綜合考慮氨基酸的活化與轉(zhuǎn)運(yùn)、多肽鏈合成的起始、延長(zhǎng)、終止和釋放等多個(gè)過(guò)程,從而能精確地操縱和調(diào)控參與上述過(guò)程的各種翻譯元件。未來(lái)的研究需要考慮不同翻譯元件之間的相互影響,系統(tǒng)地對(duì)多個(gè)元件進(jìn)行迭代升級(jí),并使其協(xié)同合作,才有望進(jìn)一步發(fā)展更高效的新一代遺傳密碼子拓展技術(shù)所需的翻譯系統(tǒng)。
用于密碼子拓展應(yīng)用的翻譯工具需要配套以相應(yīng)的底盤(pán)細(xì)胞來(lái)承載其功能的實(shí)現(xiàn)。原理上,在未改造的底盤(pán)細(xì)胞中過(guò)量表達(dá)密碼子拓展翻譯工具會(huì)導(dǎo)致翻譯錯(cuò)誤率的提高,從而造成細(xì)胞毒性,并產(chǎn)生細(xì)胞資源的浪費(fèi),不利于后續(xù)應(yīng)用[52]。以琥珀終止密碼子介導(dǎo)的密碼子拓展系統(tǒng)為例,該過(guò)程一方面受到翻譯終止的競(jìng)爭(zhēng),導(dǎo)致目標(biāo)蛋白得率較低;另一方面造成其他蛋白翻譯終止延伸,引起細(xì)胞毒性。開(kāi)發(fā)高適配性底盤(pán)細(xì)胞,避免密碼子拓展翻譯工具引起的細(xì)胞功能紊亂,是建立基于細(xì)胞體系的高效密碼子拓展系統(tǒng)中必不可少的關(guān)鍵一環(huán)。此外,也可以通過(guò)利用無(wú)細(xì)胞體系的方式避免脅迫問(wèn)題。基于無(wú)細(xì)胞體系的密碼子拓展系統(tǒng)由于擺脫了對(duì)適配底盤(pán)的依賴(lài),可避免細(xì)胞生理脅迫或細(xì)胞膜屏障等限制,在如合成毒性蛋白和提高非天然氨基酸利用率方面有其獨(dú)特優(yōu)勢(shì)[53-54]。本節(jié)將主要圍繞基于細(xì)胞體系的適配性改造方式展開(kāi)介紹。
目前,針對(duì)體內(nèi)密碼子拓展系統(tǒng)的適配底盤(pán)構(gòu)建主要通過(guò)兩種思路實(shí)現(xiàn):一是通過(guò)對(duì)底盤(pán)細(xì)胞的基因組進(jìn)行目標(biāo)密碼子的全基因組精簡(jiǎn),以釋放出空白密碼子來(lái)編碼新的氨基酸,從而實(shí)現(xiàn)密碼子拓展;二是通過(guò)加入非天然堿基對(duì),使得基因組對(duì)應(yīng)的密碼子組合數(shù)增加,利用新密碼子來(lái)編碼非天然氨基酸,從而實(shí)現(xiàn)對(duì)密碼子內(nèi)涵的拓展。此外,亦有研究人員通過(guò)改造tRNA 和核糖體來(lái)實(shí)現(xiàn)四聯(lián)密碼子介導(dǎo)基因編碼非天然氨基酸過(guò)程,達(dá)到密碼子拓展的目的[55]。然而,由于引入的四聯(lián)密碼子會(huì)存在于其他mRNA 中,從而導(dǎo)致目標(biāo)氨基酸被非特異性引入其他蛋白質(zhì)中,并引起該密碼子后序列的移碼錯(cuò)譯。為了解決該問(wèn)題,四聯(lián)密碼子引入的同時(shí)也需要將基因組上其他可形成該密碼子組合的序列進(jìn)行整體替換,本質(zhì)上屬于上文提出的第一種思路。另一種解決方案可通過(guò)設(shè)計(jì)和構(gòu)建正交的核糖體,保證該核糖體只特異性地識(shí)別含有四聯(lián)密碼子的mRNA[55-57]。此外,最近研究人員也成功利用相分離的策略在空間上對(duì)非天然氨基酸引入系統(tǒng)與細(xì)胞內(nèi)源翻譯系統(tǒng)進(jìn)行分離,實(shí)現(xiàn)在目標(biāo)mRNA 中的指定位點(diǎn)引入非天然氨基酸,能有效地降低非天然氨基酸引入所帶來(lái)的細(xì)胞功能紊亂程度[58]。本節(jié)將重點(diǎn)討論基于全基因組精簡(jiǎn)和引入非天然核酸這兩種策略的適配底盤(pán)構(gòu)建的研究進(jìn)展。
使用全基因組密碼子精簡(jiǎn)思路構(gòu)建用于密碼子拓展的適配性底盤(pán)需要實(shí)現(xiàn)兩點(diǎn):①?gòu)挠辛x密碼子或終止密碼子中選取特定目標(biāo)密碼子,在適配底盤(pán)的基因組中進(jìn)行全局替換,將其替換為其他同義密碼子,并引入可特異性識(shí)別該密碼子的外源翻譯工具,用于重新編碼的非天然氨基酸;②刪除目標(biāo)密碼子原來(lái)對(duì)應(yīng)的內(nèi)源tRNA(若是終止密碼子,則是刪除或改造對(duì)應(yīng)的釋放因子),防止原有tRNA 或釋放因子與工具tRNA 競(jìng)爭(zhēng)解碼目標(biāo)基因上的目標(biāo)密碼子。
實(shí)現(xiàn)全基因組精簡(jiǎn)的手段主要是通過(guò)基因組編輯和基因組合成?;蚪M編輯的策略適用于基因組較小的底盤(pán)細(xì)胞,但針對(duì)基因組較大的底盤(pán)細(xì)胞,工作量及技術(shù)難度則使得該策略不再適用。而隨著DNA 合成技術(shù)與基因組構(gòu)建技術(shù)的快速發(fā)展,采用從頭合成構(gòu)建基因組的策略則更為合適。基因組合成技術(shù)通過(guò)在計(jì)算機(jī)設(shè)計(jì)時(shí)引入密碼子精簡(jiǎn)設(shè)計(jì),通過(guò)合成組裝設(shè)計(jì)的基因組實(shí)現(xiàn)目標(biāo)密碼子的系統(tǒng)性刪除。
目前大部分密碼子拓展翻譯工具使用UAG 琥珀終止密碼子作為目標(biāo),因此,適配底盤(pán)的研究主要圍繞UAG 密碼子及其對(duì)應(yīng)的釋放因子。這種適配底盤(pán)的構(gòu)建,主要解決兩方面的問(wèn)題:一是釋放因子RF1 與翻譯工具競(jìng)爭(zhēng)識(shí)別UAG,使得目標(biāo)蛋白翻譯提前終止,降低蛋白得率;二是翻譯工具識(shí)別其他基因的琥珀密碼子,使得其他蛋白質(zhì)翻譯錯(cuò)誤延長(zhǎng)。針對(duì)問(wèn)題一,可以通過(guò)刪除釋放因子1 的基因prfA來(lái)解決。prfA基因之前被認(rèn)為是必需的基因,無(wú)法直接被刪除。后續(xù)有研究表明,刪除prfA基因只需將大腸桿菌中7個(gè)必需基因中的UAG 進(jìn)行重編[50],或需修復(fù)大腸桿菌的釋放因子RF2 基因prfB中的突變[59]。針對(duì)問(wèn)題二,目前大部分非天然氨基酸翻譯工具的效率相對(duì)較低,過(guò)表達(dá)外源的翻譯工具未見(jiàn)引起嚴(yán)重的細(xì)胞脅迫表型。此外,也有研究表明大腸桿菌細(xì)胞能在一定程度上耐受翻譯錯(cuò)誤導(dǎo)致的影響[60]。在目前已有的研究基礎(chǔ)上來(lái)看,針對(duì)基因組進(jìn)行全局系統(tǒng)性精簡(jiǎn)似乎并非必需,或者只需精簡(jiǎn)必需基因中的UAG[50]。然而,翻譯工具的效率隨著研究持續(xù)開(kāi)展逐步在提高,配合底盤(pán)細(xì)胞面向?qū)嶋H應(yīng)用時(shí),必然要解決細(xì)胞內(nèi)資源利用最優(yōu)化的問(wèn)題。因此,UAG 的系統(tǒng)性精簡(jiǎn)對(duì)構(gòu)建高效正交的適配底盤(pán)在實(shí)際應(yīng)用場(chǎng)景中則尤其必要[圖2(a)]。原核與真核系統(tǒng)在系統(tǒng)性精簡(jiǎn)目標(biāo)密碼子方面均有一定的進(jìn)展,如Lajoie等利用基因組編輯技術(shù)MAGE和接合組裝基因組改造技術(shù)(conjugative assembly genome engineering,CAGE)將大腸桿菌基因組中所有終止密碼子UAG 替換為UAA,并刪除了RF1[61],使UAG 密碼子能夠特異性地僅用于編碼非天然氨基酸[61]。在真核系統(tǒng)中,合成基因組里程碑項(xiàng)目人工酵母基因組合成Sc2.0 中則設(shè)計(jì)將全基因組中所有UAG 密碼子精簡(jiǎn)為UAA[62],最終構(gòu)建的合成型酵母則可通過(guò)UAG 實(shí)現(xiàn)密碼子功能拓展。
圖2 密碼子拓展系統(tǒng)的適配底盤(pán)示意圖Fig.2 The chassis for genetic code expansion
雖然,UAG 精簡(jiǎn)的底盤(pán)能適配于目前大部分的翻譯工具,但若需要同時(shí)編碼多個(gè)非標(biāo)準(zhǔn)氨基酸,則需要在一個(gè)底盤(pán)細(xì)胞中具有多個(gè)空白密碼子,實(shí)現(xiàn)的方式可通過(guò)對(duì)編碼同一個(gè)或多個(gè)氨基酸的同義密碼子進(jìn)行系統(tǒng)性的精簡(jiǎn)[圖2(a)]。同義密碼子的選擇有幾點(diǎn)因素需要考慮:首先,原有氨酰tRNA 合酶不能以目標(biāo)反密碼子為識(shí)別因子,以保證其翻譯工具tRNA的正交性;其次,在選擇目標(biāo)密碼子時(shí)也需要考慮有義密碼子的擺動(dòng)性對(duì)翻譯工具tRNA 識(shí)別準(zhǔn)確性的影響;最后,同義密碼子的精簡(jiǎn)過(guò)程中,還需要綜合考慮同義密碼子在基因組的特定位置可能存在的特定功能[63-64],如對(duì)基因內(nèi)/基因間相互作用[65]、作為轉(zhuǎn)錄和翻譯調(diào)控元件[66-67]、影響核糖體結(jié)合能力[68]、調(diào)節(jié)mRNA水平與結(jié)構(gòu)穩(wěn)定性[69-75]、控制翻譯速度[76-77],影響蛋白質(zhì)折疊與分泌[68,78-82]等與基因轉(zhuǎn)錄和翻譯相關(guān)的功能。其中,與第三點(diǎn)相關(guān)的研究目前還存在較大的空白,因此實(shí)現(xiàn)上仍缺乏足夠的理論基礎(chǔ)支持。有研究證明,即便是UAG 密碼子全基因組去除菌株,在某些條件下仍有生長(zhǎng)缺陷,而通過(guò)適應(yīng)性進(jìn)化的方式研究發(fā)現(xiàn),生長(zhǎng)缺陷可能與翻譯因素相關(guān),間接說(shuō)明了密碼子可能同時(shí)帶有其他調(diào)控功能以影響翻譯過(guò)程[83]。目前,針對(duì)原核系統(tǒng)大腸桿菌中對(duì)同義密碼子精簡(jiǎn)的影響因素已有了一定的探索[72,84-85],研究表明某些位點(diǎn)的同義密碼子的精簡(jiǎn)會(huì)對(duì)細(xì)胞的活性產(chǎn)生嚴(yán)重的影響?;谶@些發(fā)現(xiàn),兩組研究人員進(jìn)一步分別通過(guò)基因組合成技術(shù)構(gòu)建只含有57 個(gè)密碼子(進(jìn)行中)[86]和61 個(gè)密碼子[87]的大腸桿菌。其中后者獲得的菌株syn61 在倍增時(shí)間上比野生菌株慢1.6 倍,可以作為一種潛在的多密碼子拓展適配底盤(pán)。此外,在近期完成的新月柄桿菌基因組合成中[88],也將UUA 和UUG 密碼子在基因組中進(jìn)行系統(tǒng)性精簡(jiǎn)作為設(shè)計(jì)原則之一,結(jié)果并未發(fā)現(xiàn)對(duì)菌株活性有顯著影響,亦有潛力作為一種新的適配底盤(pán)菌。
隨著基因編輯技術(shù)和合成基因組學(xué)技術(shù)的不斷發(fā)展,通過(guò)全基因組密碼子精簡(jiǎn)實(shí)現(xiàn)密碼子拓展適配底盤(pán)的構(gòu)建取得了不錯(cuò)的進(jìn)展,并隨之建立了具備一定通用性的系列技術(shù)流程。但是,值得指出的是,由于目前基因組編輯和基因組合成技術(shù)仍存在一定的局限性,且針對(duì)同義密碼子的研究基礎(chǔ)尚不夠深入完善,當(dāng)目標(biāo)底盤(pán)基因組較大較復(fù)雜時(shí),相應(yīng)的理性設(shè)計(jì)可能會(huì)存在諸多不可預(yù)測(cè)的缺陷,故使用全基因組密碼子精簡(jiǎn)的投入之大使得該策略仍難以被廣泛接受。因此,針對(duì)這一策略的上游基礎(chǔ)性研究還需要進(jìn)一步投入與積累,以期能為下游的系統(tǒng)性設(shè)計(jì)改造與應(yīng)用提供更多技術(shù)與規(guī)律的支撐。
自然生物中存在的三聯(lián)密碼子實(shí)際上是4種堿基(胸腺嘧啶與尿嘧啶并不同時(shí)存在于同一類(lèi)核酸分子中)排列組合的呈現(xiàn)(即43= 64 個(gè)密碼子)。由此可知,理論上,若使堿基對(duì)的數(shù)量增加1 對(duì),則會(huì)使得潛在的密碼子數(shù)量理論上可增加至152 個(gè)(含有非天然核酸的密碼子可能具有位置效應(yīng),則可用的“空白密碼子”將少于理論數(shù)量)。目前,研究團(tuán)隊(duì)已開(kāi)發(fā)出多對(duì)能被生物體利用的非天然堿基對(duì)[89-90],并證明非天然堿基對(duì)可用于構(gòu)建密碼子拓展系統(tǒng)來(lái)對(duì)非天然氨基酸進(jìn)行基因編碼[91-93],第一次以非天然的形式重現(xiàn)了中心法則,為密碼子拓展研究和應(yīng)用提供了一種非常有潛力的新選擇[圖2(b)]。
基于現(xiàn)有非天然堿基對(duì)的密碼子拓展適配底盤(pán)菌實(shí)際上是一種半合成生物(semisynthetic organism,SSO)[94],構(gòu)建這種生物除了考慮非天然堿基對(duì)本身的性質(zhì)外,還需要對(duì)底盤(pán)菌進(jìn)行針對(duì)涉及非天然堿基/核苷酸的轉(zhuǎn)運(yùn)合成、DNA 復(fù)制酶、RNA 聚合酶、核糖體和與DNA 修復(fù)(特別是堿基錯(cuò)配修復(fù)) 相關(guān)功能蛋白的改造[95]。Romesberg 課題組在以大腸桿菌為基礎(chǔ)構(gòu)建半合成生物時(shí),利用Phaeodactylum tricornutum三角褐指藻的三磷酸核苷轉(zhuǎn)運(yùn)蛋白將含有相應(yīng)非天然堿基的三磷酸核苷轉(zhuǎn)運(yùn)至細(xì)胞內(nèi)[94]。研究組通過(guò)對(duì)引入的非天然堿基對(duì)進(jìn)行優(yōu)化,能夠達(dá)到在一定程度上不被堿基錯(cuò)配修復(fù)機(jī)制識(shí)別,同時(shí)能使用胞內(nèi)的DNA 復(fù)制酶、T7 RNA 聚合酶以及核糖體,以質(zhì)粒的形式完成DNA 復(fù)制、轉(zhuǎn)錄和翻譯[91,94],最終實(shí)現(xiàn)非天然氨基酸的編碼。
采用非天然堿基對(duì)的優(yōu)勢(shì)在于可避免對(duì)基因組進(jìn)行大規(guī)模的改造,并能實(shí)現(xiàn)多密碼子拓展,靈活性更強(qiáng)。然而,該策略目前只在原核生物中以質(zhì)粒DNA的形式實(shí)現(xiàn)[94],且其在體內(nèi)DNA中長(zhǎng)時(shí)間穩(wěn)定存在,仍需要依賴(lài)一套維持機(jī)制(使用CRISPR/Cas系統(tǒng)去除突變的非天然堿基對(duì))[94],整合至基因組后是否能在體內(nèi)穩(wěn)定維持非天然堿基對(duì)并穩(wěn)定行使功能仍未見(jiàn)報(bào)道。而該策略若應(yīng)用于真核系統(tǒng),目前亦只能通過(guò)瞬時(shí)轉(zhuǎn)化的方法實(shí)現(xiàn)非天然氨基酸的編碼[93]。該策略最終仍依賴(lài)于設(shè)計(jì)開(kāi)發(fā)一套正交的適應(yīng)于非天然堿基對(duì)的DNA 復(fù)制酶、RNA 聚合酶、核糖體及非天然堿基對(duì)/核苷酸的合成或轉(zhuǎn)運(yùn)機(jī)器,以保證底盤(pán)的復(fù)制、轉(zhuǎn)錄和翻譯活動(dòng)高效進(jìn)行。因此,基于非天然核酸的密碼子拓展系統(tǒng)仍需要后續(xù)系統(tǒng)的優(yōu)化和完善。
隨著高效正交的翻譯工具及適配性底盤(pán)被不斷地開(kāi)發(fā)出來(lái),基因密碼子拓展技術(shù)得到了逐步發(fā)展和完善,可將種類(lèi)繁多的非天然氨基酸引入到目標(biāo)蛋白中的指定位點(diǎn)。這些非天然氨基酸可擁有各種類(lèi)型的特殊基團(tuán)(例如人工設(shè)計(jì)的新型氨基酸側(cè)鏈基團(tuán)),從而賦予目標(biāo)蛋白新的物理化學(xué)性質(zhì),實(shí)現(xiàn)對(duì)蛋白質(zhì)結(jié)構(gòu)和功能的拓展,展現(xiàn)出巨大的應(yīng)用潛能。本節(jié)將重點(diǎn)介紹和討論基因密碼子拓展技術(shù)在一些重點(diǎn)的應(yīng)用領(lǐng)域取得的現(xiàn)階段進(jìn)展,如蛋白質(zhì)功能控制、翻譯后修飾等蛋白質(zhì)調(diào)控的上游使能技術(shù),以及如熒光顯影探針、新型治療和生物防控等可直接用于科研和生產(chǎn)的新型生物技術(shù)。
精準(zhǔn)操縱蛋白質(zhì)功能為細(xì)胞生命活動(dòng)的調(diào)控開(kāi)辟了新的路徑,人工控制蛋白質(zhì)功能的方法包括表達(dá)控制與活性控制。傳統(tǒng)的方法通常是利用操縱子等啟動(dòng)元件來(lái)實(shí)現(xiàn)在轉(zhuǎn)錄水平上對(duì)蛋白質(zhì)的表達(dá)調(diào)控[96],而密碼子拓展技術(shù)可用于開(kāi)發(fā)出在翻譯水平上精確控制蛋白質(zhì)表達(dá)的方法。通過(guò)在目標(biāo)蛋白的基因內(nèi)部引入終止密碼子,借助基因密碼子拓展工具,即可通過(guò)非天然氨基酸的添加或刪減來(lái)控制全長(zhǎng)蛋白的表達(dá)與否。例如,通過(guò)引入正交的非天然氨基酸編碼工具,可實(shí)現(xiàn)對(duì)基因編輯系統(tǒng)CRISPR-Cas9 中關(guān)鍵酶Cas9 的表達(dá)調(diào)控,使得有功能的全長(zhǎng)Cas9 的表達(dá)受外源添加的非天然氨基酸底物控制,從而實(shí)現(xiàn)細(xì)胞內(nèi)對(duì)于基因編輯過(guò)程的開(kāi)關(guān)調(diào)控[97]。
此外,利用基因密碼子拓展技術(shù)亦可以開(kāi)發(fā)出具有時(shí)間和空間分辨率的蛋白質(zhì)功能調(diào)控方法。通過(guò)把酶活性位點(diǎn)的關(guān)鍵氨基酸替換成攜帶光保護(hù)基團(tuán)的衍生氨基酸,可實(shí)現(xiàn)酶的“光開(kāi)關(guān)”調(diào)控。具體而言,氨基酸側(cè)鏈上的保護(hù)基團(tuán)起到封閉作用,經(jīng)過(guò)固定波長(zhǎng)的光線(xiàn)照射后,非天然氨基酸側(cè)鏈的保護(hù)基團(tuán)被移除,功能基團(tuán)得到釋放,從而恢復(fù)蛋白質(zhì)活性。利用半胱氨酸和賴(lài)氨酸作為目標(biāo)位點(diǎn),研究證明“光開(kāi)關(guān)”調(diào)控策略可以用于調(diào)控細(xì)胞中煙草蝕刻病毒蛋白酶和Cas9 的活性[98]。該調(diào)控策略同樣適用于DNA 重組酶活性的精確調(diào)控,并被后續(xù)應(yīng)用于斑馬魚(yú)胚胎發(fā)育過(guò)程中細(xì)胞譜系的追蹤研究[99-100]。上述方法需要選擇目標(biāo)蛋白中的特定活性殘基,對(duì)各種類(lèi)型的蛋白質(zhì)均需要進(jìn)行定制化的策略設(shè)計(jì),具有一定的局限性。最近,研究人員發(fā)展了更具普適性的蛋白質(zhì)功能調(diào)控技術(shù)。具體而言,該新型技術(shù)基于可遺傳編碼非天然氨基酸的“鄰近脫籠”策略,結(jié)合計(jì)算機(jī)輔助設(shè)計(jì)與篩選,可在活體細(xì)胞或動(dòng)物內(nèi)瞬時(shí)激活各類(lèi)型蛋白質(zhì),為許多重要細(xì)胞生理過(guò)程的研究提供了新的化學(xué)生物學(xué)工具[101]。
翻譯后修飾參與調(diào)控細(xì)胞內(nèi)眾多關(guān)鍵的生命活動(dòng)調(diào)控過(guò)程,這些修飾使蛋白質(zhì)的結(jié)構(gòu)和功能更為豐富,調(diào)節(jié)更精細(xì),作用更專(zhuān)一。因此,基于翻譯后修飾的蛋白質(zhì)結(jié)構(gòu)和功能研究是該領(lǐng)域的一個(gè)重點(diǎn)方向。得益于質(zhì)譜技術(shù)的發(fā)展,許多翻譯后修飾的種類(lèi)和位點(diǎn)被不斷發(fā)掘,但是,在體內(nèi)和體外精確地合成帶有修飾的功能蛋白仍然挑戰(zhàn)巨大,嚴(yán)重制約了對(duì)其進(jìn)行分子和生化原理的深度研究。以體內(nèi)合成磷酸化蛋白為例,傳統(tǒng)的方法是將絲氨酸/蘇氨酸突變?yōu)楣劝彼醽?lái)模擬其磷酸化的作用,但具有作用效果不真實(shí)的劣勢(shì)。此外,磷酸化是一個(gè)體內(nèi)高度動(dòng)態(tài)變化的瞬時(shí)過(guò)程,單個(gè)蛋白中存在眾多潛在的修飾位點(diǎn),且作用相關(guān)的激酶和磷酸酶常常未知,也加大了體內(nèi)和體外合成磷酸化蛋白的難度[102]。利用基因密碼子拓展技術(shù)可實(shí)現(xiàn)對(duì)目標(biāo)蛋白中指定位點(diǎn)進(jìn)行真實(shí)的翻譯后修飾,已經(jīng)成功實(shí)現(xiàn)絲氨酸、色氨酸及絡(luò)氨酸的磷酸化修飾。通過(guò)利用古菌中磷酸化絲氨酸合成酶SepRS 和改造的tRNASep,并對(duì)延伸因子EF-Tu進(jìn)行定向進(jìn)化,科學(xué)家在大腸桿菌中實(shí)現(xiàn)了由終止密碼子UAG 介導(dǎo)的磷酸化絲氨酸合成[103]。后續(xù)實(shí)驗(yàn)表明,通過(guò)對(duì)上述翻譯元件的進(jìn)一步改造和定向進(jìn)化,以及利用UAG 密碼子被系統(tǒng)重編的底盤(pán)細(xì)胞,密碼子拓展技術(shù)可以更為高效地基因編碼攜帶磷酸化絲氨酸的蛋白質(zhì)[104-105]。此外,磷酸化的絲氨酸可以轉(zhuǎn)化為脫氫丙氨酸,因其具有不飽和鍵,可與帶有各種翻譯后修飾的側(cè)鏈基團(tuán)連接,用于體外合成具有真實(shí)修飾的蛋白質(zhì),應(yīng)用前景廣闊[106]。通過(guò)構(gòu)建磷酸化蘇氨酸生物合成通路,并對(duì)SepRS/tRNASep工具配對(duì)開(kāi)展連續(xù)的定向進(jìn)化,輔助以深度測(cè)序分析介導(dǎo)的并行正向篩選策略,高效基因編碼磷酸化蘇氨酸的方法亦被開(kāi)發(fā)出來(lái)[107]。此外,利用基于非天然氨基酸的脫保護(hù)和前肽策略,不同的團(tuán)隊(duì)成功地開(kāi)發(fā)了提高大腸桿菌體內(nèi)磷酸化酪氨酸和類(lèi)似物的濃度的方法,并實(shí)現(xiàn)了合成指定位點(diǎn)上攜帶磷酸化酪氨酸及其類(lèi)似物的蛋白質(zhì)[108]。除了用于合成磷酸化蛋白,基因密碼子拓展技術(shù)亦可合成乙?;?、泛素化和甲基化修飾的賴(lài)氨酸[7]。上述翻譯后修飾的氨基酸既可以被直接引入到蛋白質(zhì)中的指定位點(diǎn),也可以通過(guò)后續(xù)的選擇性化學(xué)反應(yīng)來(lái)實(shí)現(xiàn)[109]。綜上,基因密碼子拓展技術(shù)已經(jīng)成功地應(yīng)用于各類(lèi)型的翻譯后修飾研究,為進(jìn)一步理解其作用機(jī)制和生理功能的科研或者臨床研究奠定了基礎(chǔ)。
熒光顯影在蛋白質(zhì)追蹤和定位研究中有著非常廣泛的應(yīng)用,通過(guò)熒光顯影可以在細(xì)胞甚至細(xì)胞器層面上對(duì)目標(biāo)蛋白進(jìn)行準(zhǔn)確的定位。常規(guī)的熒光顯影方法主要使用熒光蛋白與小分子化合物探針。雖然借助各種類(lèi)型的熒光蛋白可有效地用于熒光成像和追蹤[110-111],但與熒光蛋白的融合可能會(huì)改變目標(biāo)蛋白的構(gòu)象或結(jié)構(gòu),影響后續(xù)的結(jié)果分析。雖然小分子化合物探針靈敏且穩(wěn)定性高,但是通常無(wú)法特異性地結(jié)合在目標(biāo)蛋白上。通過(guò)基因密碼子拓展技術(shù)可以實(shí)現(xiàn)對(duì)目標(biāo)蛋白的顯影示蹤。具體而言,在不影響目標(biāo)蛋白功能的情況下,可將攜帶高化學(xué)反應(yīng)性基團(tuán)的非天然氨基酸引入到目標(biāo)蛋白的指定位點(diǎn),通過(guò)特定的化學(xué)反應(yīng)(如點(diǎn)擊化學(xué))可實(shí)現(xiàn)蛋白質(zhì)與熒光探針的生物正交結(jié)合,用于后續(xù)熒光成像。例如,含降冰片烯的賴(lài)氨酸衍生物可以與四嗪類(lèi)熒光探針快速結(jié)合[112],反式環(huán)辛烯賴(lài)氨酸則可以與類(lèi)羅丹明的熒光探針產(chǎn)生正交反應(yīng)[113],用于蛋白質(zhì)顯影追蹤。密碼子拓展技術(shù)在蛋白質(zhì)顯影追蹤方面有兩點(diǎn)顯著的優(yōu)勢(shì):經(jīng)過(guò)設(shè)計(jì)與篩選后的非天然氨基酸側(cè)鏈基團(tuán)與熒光探針具有高選擇性,保證兩者可以進(jìn)行高效準(zhǔn)確的生物正交反應(yīng);密碼子拓展技術(shù)可以將非天然氨基酸引入到目標(biāo)蛋白的非關(guān)鍵位點(diǎn),從而盡量避免對(duì)蛋白質(zhì)的結(jié)構(gòu)和功能產(chǎn)生潛在影響。
通過(guò)基因密碼子拓展技術(shù)向細(xì)胞因子、抗體、受體蛋白等免疫相關(guān)蛋白中引入各類(lèi)型的非天然氨基酸為新型治療策略開(kāi)辟了新的領(lǐng)域??贵w作為一種具有高特異性識(shí)別能力的蛋白質(zhì),可以將藥物分子靶向性地帶到靶向作用細(xì)胞,以減少對(duì)正常細(xì)胞的傷害。早期抗體耦聯(lián)藥物通過(guò)化學(xué)修飾后與抗體的賴(lài)氨酸或半胱氨酸進(jìn)行反應(yīng)耦聯(lián),實(shí)現(xiàn)藥物分子的靶向傳輸[114-115]。但非特異性耦聯(lián)方式會(huì)導(dǎo)致抗體上攜帶的藥物分子數(shù)量不均勻,進(jìn)而影響藥效和導(dǎo)致細(xì)胞毒性。在新一代抗體耦聯(lián)藥物研發(fā)過(guò)程中,非天然氨基酸(例如對(duì)乙酰苯丙氨酸和疊氮苯丙氨酸)可作為正交的耦聯(lián)反應(yīng)位點(diǎn),與藥物發(fā)生特異性的結(jié)合,從而精確控制藥物抗體比例。使用肟連接與無(wú)銅點(diǎn)擊化學(xué)可以將藥物準(zhǔn)確地耦聯(lián)在抗體中非天然氨基酸的指定位點(diǎn)[116-117]。此外,一些條件更為溫和的耦聯(lián)反應(yīng)被相繼開(kāi)發(fā)出來(lái)。例如,增加皮克特-斯賓格勒(Pictet-Spengler,P-S)反應(yīng)使肟連接反應(yīng)可以在中性pH 條件下完成,或是使用呋喃基的非天然氨基酸進(jìn)行光交聯(lián)反應(yīng)實(shí)現(xiàn)小分子化合物的耦聯(lián)[118-119]。嵌合抗原受體T 細(xì)胞(chimeric antigen receptor-T,CAR-T)免疫療法是一種治療腫瘤的新型精準(zhǔn)靶向療法,避免細(xì)胞因子釋放綜合征是目前開(kāi)發(fā)高安全性CAR-T 免疫療法的研究重點(diǎn)[120]?;蛎艽a子拓展技術(shù)可用于控制工程化T細(xì)胞的特異性和活性,通過(guò)利用開(kāi)關(guān)分子來(lái)連接T細(xì)胞和腫瘤細(xì)胞,為開(kāi)發(fā)新一代CAR-T 免疫療法奠定基礎(chǔ)[121]。此外,基因密碼子拓展技術(shù)還可以用于新一代疫苗的研發(fā)。傳統(tǒng)的疫苗制作需要對(duì)活病毒進(jìn)行減活或者滅活處理,病毒蛋白結(jié)構(gòu)在滅活過(guò)程中一旦被破壞,則可能難以達(dá)到理想的接種效果[122]??茖W(xué)家把病毒基因中不易返祖的位點(diǎn)突變成UAG 終止密碼子,利用密碼子拓展技術(shù)實(shí)現(xiàn)病毒在特殊細(xì)胞系的增殖,從而制備與正常病毒相似免疫原性的非天然病毒[123]。這些病毒不能在正常細(xì)胞中擴(kuò)增,可顯著提升疫苗的安全性,具有巨大的應(yīng)用潛力。
近些年來(lái),合成生物學(xué)突取得了突飛猛進(jìn)的發(fā)展,基因改造生物在生物技術(shù)領(lǐng)域發(fā)揮著越來(lái)越舉足輕重的作用,科學(xué)家與大眾對(duì)生物安全的關(guān)注也被提升至新的高度?;诜翘烊话被岬牡鞍踪|(zhì)表達(dá)調(diào)控和蛋白質(zhì)從頭設(shè)計(jì)策略為生物防逃逸技術(shù)打開(kāi)了一個(gè)嶄新的研發(fā)視角。生物防控手段可依賴(lài)于遺傳隔離、營(yíng)養(yǎng)缺陷型調(diào)控、基因回路設(shè)計(jì)等思路[124-126],但上述方法的有效性易被自然突變、環(huán)境補(bǔ)充和水平基因轉(zhuǎn)移等因素打破[127]?;蛎艽a子拓展技術(shù)可用于控制細(xì)胞中必需蛋白的表達(dá)或者功能,進(jìn)而構(gòu)建出依賴(lài)于非天然氨基酸的生命體。例如,通過(guò)把甘露糖-6-磷酸異構(gòu)酶這一必需蛋白中關(guān)鍵的組氨酸替換成為組氨酸類(lèi)似物,科學(xué)家成功地構(gòu)建出生長(zhǎng)依賴(lài)于外源氨基酸的大腸桿菌[128]。上述策略雖然有效,但是只適用于特定類(lèi)型的蛋白質(zhì)(如前文提到的金屬結(jié)合蛋白)。通過(guò)對(duì)目標(biāo)蛋白的關(guān)鍵區(qū)域進(jìn)行重新設(shè)計(jì)或者定向進(jìn)化,研究人員利用密碼子拓展技術(shù)成功獲得了功能依賴(lài)于某種非天然氨基酸的新型蛋白,該策略具有更高的普適性,并可有效地避免基因改造生物逃逸到自然環(huán)境中[129-130]。值得指出的是,上述策略將必需基因中特定氨基酸對(duì)應(yīng)的密碼子突變成為終止密碼子,若對(duì)應(yīng)的mRNA 發(fā)生回復(fù)突變等情況會(huì)使得防逃逸策略的有效性喪失。利用基因組重編的大腸桿菌作為基因密碼子拓展技術(shù)的底盤(pán),研究團(tuán)隊(duì)系統(tǒng)地測(cè)試了大腸桿菌眾多必需基因中不同位點(diǎn)引入非天然氨基酸后對(duì)于生物防控策略的有效性,并發(fā)現(xiàn)多個(gè)位點(diǎn)和基因的組合可有效地降低非天然氨基酸依賴(lài)型生長(zhǎng)的逃逸概率[131]。此外,通過(guò)往細(xì)胞中引入毒素-抗毒素表達(dá)系統(tǒng),并利用非天然氨基酸的加減作為抗毒素蛋白表達(dá)的開(kāi)關(guān),亦可構(gòu)建出有效的生物防控方法[132]。綜上所述,利用基因密碼子拓展技術(shù),通過(guò)巧妙地選擇目標(biāo)蛋白的種類(lèi)并對(duì)其進(jìn)行設(shè)計(jì)或改造,基于非天然氨基酸的新型生物防控策略為本領(lǐng)域的發(fā)展帶來(lái)了新的動(dòng)能。
蛋白質(zhì)是生命的物質(zhì)基礎(chǔ),也是生命活動(dòng)的主要承擔(dān)者。蛋白質(zhì)功能化策略創(chuàng)新被認(rèn)為是推動(dòng)生命科學(xué)研究與產(chǎn)業(yè)應(yīng)用轉(zhuǎn)化的重要引擎之一。通過(guò)基因密碼子拓展技術(shù)進(jìn)行蛋白質(zhì)功能創(chuàng)新在過(guò)去20 多年中發(fā)展迅速,在翻譯工具改造及底盤(pán)細(xì)胞開(kāi)發(fā)方面均取得了可喜的進(jìn)展。然而,目前已開(kāi)發(fā)的基因密碼子拓展系統(tǒng)(尤其是基于真核生物的系統(tǒng))普遍存在翻譯效率低、正交性和兼容性差等核心瓶頸。針對(duì)翻譯系統(tǒng)中多種翻譯元件的系統(tǒng)性?xún)?yōu)化改造乃至從頭設(shè)計(jì),構(gòu)建具有多個(gè)空白密碼子的底盤(pán)細(xì)胞,針對(duì)翻譯工具和底盤(pán)細(xì)胞的相互適配原則的探索與優(yōu)化改造,以及結(jié)合這些研究?jī)?nèi)容實(shí)現(xiàn)同時(shí)基因編碼多種非天然氨基酸,將是該領(lǐng)域未來(lái)研究的重點(diǎn)和難點(diǎn)。
隨著對(duì)于蛋白質(zhì)合成機(jī)制理解的不斷深入、合成生物學(xué)技術(shù)及定向進(jìn)化技術(shù)的應(yīng)用、基因組與宏基因組數(shù)據(jù)的持續(xù)積累及解讀工具的迭代,更多高效、正交的翻譯工具及適配底盤(pán)有望被開(kāi)發(fā),促進(jìn)基因密碼子拓展技術(shù)的快速發(fā)展。利用基因密碼子拓展技術(shù)實(shí)現(xiàn)基因編碼非天然氨基酸,將成為繼無(wú)細(xì)胞體系、化學(xué)合成等體外合成方法之后實(shí)現(xiàn)蛋白質(zhì)和多肽功能創(chuàng)新的一種新策略,為相關(guān)的下游應(yīng)用的發(fā)展提供了新契機(jī),推動(dòng)人類(lèi)在醫(yī)藥健康、能源、材料等關(guān)鍵領(lǐng)域發(fā)展。