[摘要]編碼氨基酸的密碼子具有簡并性,而每種生物對同義密碼子的選擇都有自己偏好性。大腸桿菌作為一個原核表達系統(tǒng),經(jīng)常被用來表達外源蛋白,從大腸桿菌密碼子的使用,經(jīng)典蛋白的氨基酸組成,鄰近序列效應(yīng),相似終止密碼子等方面闡述大腸桿菌密碼子偏好情況,為實現(xiàn)外源蛋白在大腸桿菌中的高效表達提供參考數(shù)據(jù)。
[關(guān)鍵詞]大腸桿菌 密碼子偏好性 鄰近序列效應(yīng) 相似終止密碼子
中圖分類號:Q50 文獻標識碼:A 文章編號:1671-7597(2009)0110003-01
目前生物醫(yī)藥研究和生物技術(shù)生產(chǎn)的主要方法是利用外源表達系統(tǒng)來表達目的蛋白,常用的外源表達系統(tǒng)有大腸桿菌表達系統(tǒng),酵母表達系統(tǒng),哺乳動物表達系統(tǒng)等。要實現(xiàn)目的基因在外源表達系統(tǒng)中的成功表達和盡可能地提高其表達量,可以通過增加目的基因劑量,目的基因密碼子優(yōu)化,改善培養(yǎng)條件等方法實現(xiàn),其中目的基因密碼子優(yōu)化起到關(guān)鍵的作用。如果目的基因的密碼子與表達宿主不匹配,則會降低mRNA的翻譯效率和穩(wěn)定性,甚至會造成mRNA翻譯的提前終止。[1]目前可以通過兩個途徑來解決這個問題:①提高宿主表達系統(tǒng)中底豐度的tRNA;②對目的基因進行密碼子改造,使它的密碼子是宿主表達系統(tǒng)的高頻密碼子,也就是通常所說的密碼子優(yōu)化。[2]
編碼氨基酸的密碼子一共有64個,其中一個是起始密碼,兩個終止密碼,而氨基酸的種類有20種,所以說氨基酸的密碼子存在簡并性。真核生物和原核生物所偏好的密碼子不一樣,高效表達和低效表達在同義密碼的選擇上也有所不同,[3][4]甚至同一個基因的不同區(qū)域也存在這種現(xiàn)象[5],也就是說不同生物根據(jù)情況對同義密碼的選擇有偏好性。高效表達的基因具有密碼子偏好性是因為對翻譯效率和準確性的要求更高,[6]同一個基因中保守序列比非保守序列對密碼子更具偏好性,分析其原因也是為了提高翻譯的準確性。
在自然選擇過程中,對翻譯效率最大化的需要引起對同義密碼不同程度的選擇。蛋白的翻譯包括起始,延伸和終止三個過程,有證據(jù)證明蛋白合成過程中起始階段是蛋白質(zhì)合成效率的限制因素,[7]而蛋白合成的起始速率取決于核糖體和mRNA二者結(jié)合的速率,隨著mRNA濃度的提高可以有效地提高蛋白的合成速率,同時mRAN中含有高頻密碼子的翻譯效率高于低頻密碼子。最優(yōu)密碼子與高豐度的同功tRNA呈正相關(guān)的關(guān)系。
一、密碼子優(yōu)化的網(wǎng)站、軟件
密碼子優(yōu)化可以通過一些網(wǎng)站在線軟件來實現(xiàn),例如Gene Design[8]、Optimizer[9]、Synthetic Gene Designer [10]、Gene Dsigner[11]。
二、大腸桿菌密碼子使用和經(jīng)典蛋白的氨基酸組成
大腸桿菌表達系統(tǒng)被廣泛地應(yīng)用于外源蛋白的表達,通過誘導,目的蛋白的表達量可以達到總蛋白的60%-70%。[12]近年來有很多文章報道通過改造目的基因中稀有密碼子而變成大腸桿菌中高頻密碼子。從而大大地提高其表達量,如David.LAKEY等人通過改造85B抗原的5個稀有密碼子使表達量提高到原來的54倍。他們用Northen blotting分析發(fā)現(xiàn)目的基因的mRNA的量只增加1.7-2.5倍,所以說表達量的提高是由于翻譯效率的提高。[13]因此如果需要在大腸桿菌中表達外源蛋白是需要考慮大腸桿菌中稀有密碼子和高頻密碼子使用情況。[14][15]另外,有文獻報道如果需要表達的目的蛋白的氨基酸組成不是大腸桿菌“典型”蛋白氨基酸組成,[16]那目的蛋白的表達量也會受到影響。
三、低頻密碼子子簇的影響
同義密碼子中的一些稀有密碼子簇會抑制目的蛋白的表達量或引起移碼突變。如AGG/AGA,AUA,CUA,CUA和CCC,[16][17]出現(xiàn)這種現(xiàn)象的原因是當mRNA在翻譯的時候遇到稀有密碼子時,翻譯復(fù)合物就會暫停下來等待Lys-tRANAuuu,于是在這個停頓的位點就會發(fā)生+1或是-1移碼突變。[19]當通過共表達arg U(dnaY)基因時,可以實現(xiàn)稀有密碼子簇的高效表達。[17]Rosenber[19]等構(gòu)建了一個稀有密碼子簇作用檢驗系統(tǒng)。這個系統(tǒng)的基本原理是把目的基因和對照基因置于同一個啟動子即T7啟動子下,對照基因來自T7噬菌體的基因9。作者用這個系統(tǒng)檢測了一個具有312個氨基酸的蛋白。他們發(fā)現(xiàn)當AGG在N端時對目的蛋白表達量的影響比在C端大,而且稀有密碼子簇的數(shù)量于對照基因的表達量呈負相關(guān)。即使目的蛋白中只含有單個的AGG/AGA稀有密碼子,也會引起翻譯問題,如在E.coli K-12中表達bovine placental lactogen(BPL),含有9個單個的AGG,BPL的蛋白表達量底于總蛋白的10%,[20]而且出現(xiàn)目的蛋白分子量不均一意想不到的結(jié)果。[21]進一步研究發(fā)現(xiàn)是由于翻譯過程多肽鏈中6位的精氨酸和87位的leu異亮氨酸的錯失。
四、鄰近序列效應(yīng),相似終止密碼子和錯義翻譯
為了盡最大可能提高目的蛋白在大腸桿菌中的表達量,不僅要考慮將目的蛋白的稀有密碼子改造成大腸桿菌中的高頻密碼子,而且還要考慮同義密碼子的鄰近序列效應(yīng)(context effect),[22]OttoG.Bery和PedroJ.N. Silva [23]研究了大腸桿菌中具有2個簡并密碼子的氨基酸鄰近6個堿基的影響,如谷氨酸的臨近序列是CCAGG,因為在這個序列中如果發(fā)生突變更容易被修復(fù)系統(tǒng)所修復(fù)。[24]所以大腸桿菌內(nèi)密碼子如果以C/T為結(jié)尾,那它所偏好的臨近序列是密碼子后的第二位是G,而其中對NACNG的選擇大于NATNG。一些密碼子如果在特定的臨近序列內(nèi),這個序列會較為容易發(fā)生移碼突變,如編碼Phe的TTT在C或是T之前,編碼Lys的AAA在A或是G之前,所以對Phe的偏好密碼子是TTC而不是TTT,是為了盡可能地減少移碼突變。TTTN和AAAA/AAN應(yīng)該避免,尤其是高效表達的基因。而TTTR(Leu)和AAAY(Asn)會同時引起移碼突變和錯誤翻譯,而且這個序列對合成持續(xù)性錯誤敏感。 [23]
有些密碼子如(TAT)和大腸桿菌中終止密碼子(TAA)很相似,翻譯時特別是當TAT在序列的+4位置時能夠被強烈地錯認為終止密碼子而使翻譯提前終止。[25]Precup等發(fā)現(xiàn)在大腸桿菌中TTC和TTT錯誤翻譯概率很高,例如在argⅠ基因編碼區(qū)中,第3個和第8個密碼子分別是TTT和TTC,所編碼的氨基酸是Phe,而它們的鄰近序列分別是GTTTT和TTTCC,即使把第8個密碼子換成大腸桿菌中的同義高頻密碼子也不能降低其錯誤翻譯的幾率。[26]在富含T的序列里(TTGT/TGTT),TGT(Cys)會被錯誤地翻譯成Trp。[27]
在大腸桿菌表達系統(tǒng)中,無論是高、中、低偏好性的基因在前20個密碼子中都偏好以密碼子第三位是A而G是盡量避免的。[28]而高效表達的基因在前100150個密碼子中以G和C為密碼子的第三個堿基的比例逐漸上升。[29]
參考文獻:
[1]Gustafsson,C.,et al.(2004) Trends Biotechnol.,22,346-353.
[2]Hernan,R.A., et al.(1992) Biochemistry, 31, 8619-8628.
[3]Coghlan, A., and K. H. Wolfe, 2000 16: 1131-1145.
[4]Akashi, H., 2003 164: 1291-1303.
[5]AKASHI, H., 1994. Genetics 136:927-935.
[6]Carlini, D. B.,2003. Genetics 163: 239-243.
[7]BUI.MERM, ., 1991 Genetics 129: 897-907.
[8]Richardson,S.M., (2006) Genome Res., 16,550-556.
[9]Pere Puigbo` 1, Eduard Guzma′ n1,2, et al,(2007) Nucleic Acids Research,Vol. 35, W126-W131.
[10]Wu,G., et al. (2006) Protein Expr. Purif., 47, 441-445.
[11]Villalobos,A., et al. (2006) BMC Bioinformatics, 7, 285.
[12]S. Jana . J. K. Deb,2005 Appl Microbiol Biotechnol67: 289-298.
[13]DAVID L. LAKEY, et al, 2000 INFECTION AND IMMUNITY, 0019-9567/00/$04.0010 Jan.p. 233-238.
[14]Saier MH Jr (1995) FEBS Lett 362:14.
[15]孫乃恩,et al.1990 《分子遺傳學》 南京大學出版社. 255.
[16]Wada K, et al.T: Nucleic Acid Res 1992, 20:2111-2118.
[17]Chen GFT, Inouye M (1994) Genes Dev 8:2641-2652.
[18]Lindsley D, Gallant J (1993)Proc Natl Acad Sci USA 90:5469-5473.
[19]Rosenberg AH, et al.1993 G: J Bacteriol, 175:716-722.
[20]Brinkmann U, et al. P: Gene 1989, 85:109-114.
[21]Kane JF, Violand BN, Curran DF, Staten NR, Duffin KL, Bogosian G: Nucleic Acids Res 1993, 20:6707-6712.
[22]Bulmer, M. (1990) Nucleic Acids Res., 18, 2869-2873.
[23]Otto G. Berg* et al.1997 Nucleic Acids Research, Vol. 25, No. 7 1397-1404.
[24]Lieb, M. and Bhagwat, A.S. (1996) Mol. Microbiol., 20,467-473.
[25]Pavlov,M.Y.,et al,1998 J.Mol.Biol.,284,579-590.
[26]Precup,J.Ulrich,et al 1989 Mol Gen. Gener.,218,397-401.
[27]Carrier,M.Jand Buckingham,R.H1984 J.Mol.Biol.,175,29-38.
[28]Andersson,S.G.E and Sharp,P.M 1996L.Mol.Evol.,42,525-536.
[29]Sean D.Hooper,Otto G.Berg 2000 Nucleic Acids Reseadrch,VOL.28,No.18 3517-3527.
作者簡介:
鄭彬瓊,女,福建莆田,福建師范大學生命科學學院,研究方向:發(fā)育生物學。