■文/馬曉顰
在自然界中,大部分生命都使用64個密碼子進(jìn)行編碼。這64個密碼子中,61個密碼子編碼天然的20種氨基酸。這些氨基酸通過首尾相連、脫水縮合而形成不同長度的共價多肽鏈——不同分子量大小的蛋白質(zhì)。剩下的3個密碼子則起到終止翻譯蛋白質(zhì)的作用。
研究人員發(fā)現(xiàn),這20種天然氨基酸中的18種存在同義密碼子(1種氨基酸有1個或多個密碼子)編碼。但實際上,這些同義密碼子有著相似的功能,其原因尚不明確。2013年,美國哈佛大學(xué)學(xué)者大膽地做了改造嘗試。他認(rèn)為,TAA、TAG、TGA都是執(zhí)行終止蛋白翻譯的命令,沒有必要用3個終止密碼子。于是,他將大腸桿菌基因組上的終止密碼子TAG替換成TAA,成功實現(xiàn)了同義密碼子的替換。
不僅終止密碼子存在冗余性,編碼20種天然氨基酸的61個密碼子也存在同樣的重復(fù)問題。2016年,研究人員將大腸桿菌中含有靶標(biāo)密碼子的20千堿基對(Kbp)基因組進(jìn)行替換,實現(xiàn)了重新編寫密碼子的人工改造。然而,這一技術(shù)僅限于基因組小范圍內(nèi)的同義密碼子替換。那么,我們是否可以將這項技術(shù)應(yīng)用于整個基因組內(nèi)的同義密碼子替換之中呢?
不難想象,實現(xiàn)整個基因組內(nèi)的同義密碼子替換,其難度相當(dāng)大。正如DNA化學(xué)結(jié)構(gòu)的共同發(fā)現(xiàn)者弗朗西斯·克里克(Francis Crick)提出的“冰凍事故”理論:一旦基本生活形式發(fā)生變化,三重密碼就會被鎖定,因為任何偏離通用程序的做法都將是一個巨大的劣勢。
最近,英國劍橋大學(xué)醫(yī)學(xué)研究委員會分子生物學(xué)實驗室的研究團(tuán)隊成功地為大腸桿菌完整基因組重新編寫了一套遺傳密碼子,實現(xiàn)了合成生物學(xué)家合成全基因的夢想。
研究人員首先設(shè)計了開放閱讀框(Open Reading Frame,ORF)內(nèi)基因序列TCG、TCA、TAG替換為AGC、AGT、TAA的基因組序列??紤]到這些被替換的密碼子會出現(xiàn)在兩個相同或者相反方向的ORF重疊區(qū)域,研究人員對其進(jìn)行了相應(yīng)處理。當(dāng)重疊區(qū)域所屬的ORF方向相反時,研究人員將重疊區(qū)復(fù)制成兩份,分別連接到兩個ORF的3’端;當(dāng)所屬ORF的方向相同時,將重疊區(qū)域復(fù)制并在之間插入重疊區(qū)域上游20個堿基對(bp)的序列。最終,研究人員設(shè)計了3 978 937bp的大腸桿菌基因組序列。
為把大腸桿菌基因組替換為設(shè)計的基因組序列,研究人員將設(shè)計的基因組分成8個部分,每個部分約0.5兆堿基對(Mbp)。然后,他們再將每個部分劃分為4~5個片段(Fragment),劃分過程中盡量避開必需基因,最后得到37個片段。每個片段再被進(jìn)一步分成9~14個小片段(Stretch),每個小片段長度在10 Kbp左右。為了將這些合成的片段拼接起來,研究人員在酵母中利用同源重組的方法將其分步組裝至細(xì)菌人工染色體中,然后重組替換至大腸桿菌基因組中對應(yīng)的部分。這個過程迭代使用5次,就能讓大腸桿菌基因組多個DNA節(jié)段被合成DNA取代。
接下來,研究人員對構(gòu)建的部分基因組進(jìn)行測序,發(fā)現(xiàn)仍有部分同義密碼子未被替換。針對這一問題,研究人員及時進(jìn)行優(yōu)化并將全部的TCG、TCA、TAG替換為人工設(shè)計的同義密碼子AGC、AGT、TAA。最后,研究人員使用細(xì)菌接合的方法,獲得新型的大腸桿菌,其被命名為Syn61。該菌株可存活,但生長速度比天然大腸桿菌較慢,形狀有些稍長。
遺傳密碼的改寫正是解凍代碼、開啟生命基本公式改寫的新篇章,是迄今為止全球最龐大的DNA編碼替換研究。
這一研究正是解凍代碼、開啟生命基本公式改寫的新篇章,是迄今為止全球最龐大的DNA編碼替換研究,實現(xiàn)了合成生物學(xué)家合成完整人類基因組的初步夢想。
研究人員表示,他們試圖在今后的研究中將轉(zhuǎn)運(yùn)氨基酸的tRNA改去接附其他的非天然氨基酸,進(jìn)而在細(xì)胞或生物體內(nèi)合成新的多肽或蛋白質(zhì)。當(dāng)然,在未來的研究中,他們還想嘗試合成更多種的非天然氨基酸及氨基酸聚合物。通過非標(biāo)準(zhǔn)氨基酸的摻入,蛋白質(zhì)能夠被多種標(biāo)記探針修飾。例如,用于研究電子傳遞的氧化還原探針,適用于核磁共振分析的同位素探針和適用于X射線衍射的重原子標(biāo)記探針等。此外,非標(biāo)準(zhǔn)氨基酸側(cè)鏈標(biāo)記芳基疊氮、苯甲酮或雙吖丙啶可在光誘導(dǎo)下發(fā)生交聯(lián)反應(yīng),從而檢測到免疫沉淀可能檢測不到的體內(nèi)蛋白相互作用。交聯(lián)氨基酸還能被特異地化學(xué)斷裂,從而簡化質(zhì)譜分析過程。此外,非標(biāo)準(zhǔn)氨基酸修飾的細(xì)胞因子、生長因子和抗體能延長半衰期并增強(qiáng)治療效果。例如,將CD3抗體標(biāo)記上能特異結(jié)合腫瘤表面抗原的小分子,從而可以幫助細(xì)胞毒性T細(xì)胞識別癌細(xì)胞,這會在前列腺癌移植性小鼠模型及其他疾病模型中發(fā)揮良好的治療作用。此外,將琥珀密碼子TAG摻入丁型肝炎病毒、艾滋病病毒或甲型流感病毒的基因組中,使病毒只能在琥珀抑制的宿主中進(jìn)行復(fù)制,從而使得改造后的病毒復(fù)制受限,進(jìn)而降低病毒感染的風(fēng)險。
研究人員還指出,大腸桿菌在癌癥、多發(fā)性硬化癥、心臟病和糖尿病的藥劑生產(chǎn)和治療中得以廣泛應(yīng)用。但是,當(dāng)遭到病毒或其他微生物入侵時,整個生產(chǎn)過程都會被破壞。此研究的主要負(fù)責(zé)人認(rèn)為,此次重新編碼的密碼子與通用的密碼子不同,對應(yīng)合成的大腸桿菌比天然的大腸桿菌具有一定的防御性,使得入侵的病毒在體內(nèi)很難傳播,這樣可以保護(hù)整個生產(chǎn)過程免受病毒的攻擊。
從低等到高等的生命世界,基本采用一套固有的遺傳密碼,也就是說該套遺傳密碼在很長的進(jìn)化過程中是保持不變的。因此,這套遺傳密碼在生物界是普遍通用的。目前,研究發(fā)現(xiàn),人線粒體中的密碼子與通用密碼子有些不同。例如,人線粒體中共有4個終止密碼子(AGA、AGG、TAA和TAG),與通用的3個(TAA、TAG和TGA)終止密碼子不同。但是,從整體密碼子的使用來看,類別差異不是很大,說明生物界中密碼子較為保守。
在通常情況下,1個密碼子的第3個堿基是沒有特異性的,當(dāng)密碼子的第3個堿基改變時,也會合成原來的氨基酸——密碼子的簡并性。密碼子簡并性的出現(xiàn)對于降低細(xì)胞內(nèi)有害突變有著重要意義。即使當(dāng)DNA堿基出現(xiàn)突變時,對應(yīng)的密碼子還是可以編譯成原有的氨基酸的,不會影響相應(yīng)蛋白質(zhì)的翻譯。因此,密碼子的簡并性可以抵御有害突變。此外,編譯同一種氨基酸的多個密碼子能夠大大提高肽鏈合成的速率和延長效率。在某種程度上,密碼子簡并性的存在可阻止因單一密碼子劑量不足或者突變引發(fā)的肽鏈合成提前終止的現(xiàn)象發(fā)生。倘若我們?nèi)斯ぬ鎿Q靶標(biāo)密碼子,那么天然存在的64個密碼子中僅有部分密碼子發(fā)揮作用。這在一定程度上不僅減少編譯氨基酸所需的密碼子,還會增加肽鏈合成提前終止的概率。
此外,在這項研究中,我們發(fā)現(xiàn)Syn61菌株生長速度和形態(tài)發(fā)生了改變。那么,密碼子的刪減或替換會不會對整個基因網(wǎng)絡(luò)結(jié)構(gòu)和生物本身產(chǎn)生影響呢?已有的研究結(jié)果表明,編碼1種氨基酸的多個密碼子的存在有一定的必要性。例如,轉(zhuǎn)運(yùn)氨基酸的tRNA不同,與之對應(yīng)的編譯密碼子也會不同。倘若實行不同密碼子的替換,那么tRNA轉(zhuǎn)運(yùn)和蛋白翻譯的效率也許會受到影響,最終影響肽鏈的合成和蛋白質(zhì)的表達(dá)。mRNA的穩(wěn)定性又是分子作用力的體現(xiàn)之一。同義密碼子間進(jìn)行互換,原有密碼子的分子量發(fā)生變化,分子作用力也會變化。隨之,mRNA的穩(wěn)定性可能會受到影響,最終影響蛋白質(zhì)的表達(dá)或后續(xù)的功能。密碼子除了參與翻譯氨基酸外,還會充當(dāng)一些轉(zhuǎn)錄識別因子,拼接調(diào)控因子的識別對象。密碼子間進(jìn)行互換,也許會影響細(xì)胞內(nèi)的轉(zhuǎn)錄水平。
從生物進(jìn)化的角度而言,密碼子的簡并性在物種的穩(wěn)定上起著重要的作用。對同一種氨基酸而言,每個物種的基因組里使用的編譯密碼子有時是不同的。進(jìn)化上越接近的物種,這種密碼子的偏好性就會越接近。倘若實行人工替換密碼子,是否會影響物種間的進(jìn)化研究,我們未能知曉。
總之,在這一研究中,人工替換的編譯密碼子僅有3處。是否會出現(xiàn)上述的擔(dān)憂?也許會有,也許根本沒有,我們無從談起。如果針對基因組內(nèi)多處的密碼子進(jìn)行同義替換和刪減,大大顛覆原有生物基因編碼的固有模式,是否會有不可預(yù)測的變化?我們也未知。我們只希望這一技術(shù)能夠不斷地被挖掘并優(yōu)化,為合成生物學(xué)家在人類基因組的改造上提供更有利的幫助。