彭 凱, 逯曉云, 盧麗娜, 張娟琨, 江會鋒
(1. 天津科技大學(xué) 生物工程學(xué)院, 天津 300457; 2. 中國科學(xué)院天津工業(yè)生物技術(shù)研究所系統(tǒng)微生物工程重點(diǎn)實(shí)驗(yàn)室, 天津 300308)
蛋白質(zhì)是生命體關(guān)鍵的功能大分子,在生長快速、基因工程技術(shù)成熟的大腸桿菌中表達(dá)異源基因,已成為獲取或研究異源蛋白最簡單的方式。但異源表達(dá)中常見的低表達(dá)和可溶性的問題限制了基因異源宿主中的再利用,也阻礙了生物蛋白在生物催化、生物制藥和臨床檢測方面的推廣和應(yīng)用[1]。
從DNA水平到轉(zhuǎn)錄調(diào)控,從翻譯過程到外界環(huán)境,分子伴侶或助溶性標(biāo)簽都會影響大腸桿菌表達(dá)系統(tǒng)高效表達(dá)異源蛋白[2-3]。常用的對復(fù)制起始位點(diǎn)(origin of replication,ori)、啟動子、核糖體結(jié)合位點(diǎn)(ribosome binding site,RBS)、蛋白融合標(biāo)簽、分子伴侶和基因的組成及結(jié)構(gòu)等因素的調(diào)控策略也有助于異源基因的正常表達(dá)(圖1)。其中針對翻譯過程中mRNA組成與結(jié)構(gòu)的研究最為深入[4-6]。mRNA遺傳密碼子在定義蛋白質(zhì)氨基酸序列的同時,還包含著影響翻譯速率和效率的信息[7]。密碼子作為mRNA的基本功能結(jié)構(gòu),其生物性約束將影響翻譯的全過程。但現(xiàn)有的密碼子介導(dǎo)的蛋白表達(dá)調(diào)控機(jī)制并未得到明析的理解[8-10]。mRNA的二級結(jié)構(gòu)作為另一種基本結(jié)構(gòu),其空間物理約束強(qiáng)烈影響翻譯過程速率。研究表明mRNA的+1~+100 nt區(qū)域的結(jié)構(gòu)對細(xì)菌翻譯起始的影響很大,改變這一段序列的結(jié)構(gòu)會對蛋白表達(dá)水平產(chǎn)生顯著影響[11-13]。
圖1 基因表達(dá)調(diào)控策略Figure 1 Gene expression regulation strategy
重疊基因(overlapping genes,OG)是指兩個或兩個以上的基因共用一段完全相同的DNA序列[14]?;蚩啥喾N方式重疊,形成的共用序列通過不同的讀取方式對多個基因產(chǎn)物作出貢獻(xiàn),可有效提高遺傳物質(zhì)的編碼能力,也會對發(fā)生偶聯(lián)的基因的轉(zhuǎn)錄和翻譯過程產(chǎn)生重要影響[15]。
共用DNA序列長的重疊基因,特異性強(qiáng),難以再利用。但當(dāng)兩個基因以單堿基對重疊時,即前一個基因的終止密碼子(TGA)和后一個基因的起始密碼子(ATG)僅共用一對堿基,形成TGATG重疊形式,則可被再利用于蛋白表達(dá)調(diào)控。這種形式轉(zhuǎn)錄出的mRNA上,包含了兩個重疊的閱讀框。核糖體在前一個終止密碼子處完成閱讀框的翻譯后,不會立即完全解開游離,而是經(jīng)過終止-重新初始化過程,重新開始讀取下一個起始密碼子[16]。使這兩個僅共用一個堿基對的基因產(chǎn)物將被分開翻譯出來(圖2)。
圖2 TGATG重疊類型Figure 2 TGATG overlap type
基于原核生物邊轉(zhuǎn)錄-邊翻譯-邊折疊的多聚核糖體表達(dá)模式[17-18],我們將這種終止-重起始過程引入到大腸桿菌異源蛋白表達(dá)質(zhì)粒中,融合mRNA的5′-端序列變化(密碼子簡并性允許在氨基酸不變的情況下,通過對mRNA的5′-端區(qū)域進(jìn)行同義密碼子替換,來改變mRNA的二級結(jié)構(gòu)),探索重疊基因強(qiáng)度變化對異源蛋白表達(dá)量和可溶性的影響。
1.1.1 菌株、質(zhì)粒和基因
大腸桿菌BL21(DE3)感受態(tài)細(xì)胞購自TransGen Biotech公司;pET-28a (+)質(zhì)粒和候選基因FLS(Formolase)、GAOA[Galactose oxidase(Gibberellazeae)]、PPK[Polyphosphate kinase (Klebsiellapneumoniae)]和HACL[2-hydroxyacyl-CoA lyase (Homosapiens)]均來自本實(shí)驗(yàn)室基因庫。
1.1.2 主要工具酶和試劑盒
高保真DNA聚合酶PrimerSTAR Max DNA Polymerase購自TaKaRa公司;無縫克隆試劑盒Minerva Super Fusion Cloning Kit購自天津百倍生物科技有限公司。
1.1.3 培養(yǎng)基與緩沖液試劑
LB液體培養(yǎng)基,LB固體培養(yǎng)基, 2×YT培養(yǎng)基;1×TAE電泳緩沖液,1×Tris-Glycine蛋白電泳緩沖液,SDS-PAGE染色液。
1.2.1 試驗(yàn)設(shè)計
選取實(shí)驗(yàn)室基因庫中存在表達(dá)問題的候選基因。2個低表達(dá)的基因FLS(59 ku)、GAOA(68.5 ku),3個不可溶表達(dá)的基因FLS(wild type,wt低表達(dá))、PPK(80.4 ku)、HACL(61 ku)。根據(jù)試驗(yàn)設(shè)計,在各基因起始密碼子之后的連續(xù)13個密碼子上設(shè)計簡并引物。利用簡并引物向基因上引入同義突變,基因與載體片段的融合基于Minerva Super Fusion Cloning Kit的方法。將構(gòu)建好的表達(dá)載體pET-28a-Gene轉(zhuǎn)入BL21(DE3)感受態(tài)細(xì)胞內(nèi),建立篩選庫。
1.2.2 mRNA的5′-端序列優(yōu)化設(shè)計
驗(yàn)證基因mRNA的5′-端約100 nt區(qū)域?qū)Φ鞍妆磉_(dá)的影響。選取已知的低表達(dá)基因FLS、GAOA,設(shè)計簡并引物,如圖3,構(gòu)建5′-端序列優(yōu)化篩選庫。
圖3 同義突變設(shè)計Figure 3 Synonymous mutation design
FLS、GAOA的5′-端簡并引物設(shè)計:FLS上游引物:5′-CGCGCGGCAGCCATATGGCNATGATHACNGGNGG-NGARCTNGTNGTNCGNACNCTNATT-AAAGCTGGCGTAGAAC-3′。
GAOA上游引物:5′-AGAAGGAGATATACCATGGCNTCNGCNCCNATHGGNAGYGCNATHAGYCGNAAY-AAYTGGGCAGTTACCTGTGAT-3′。
1.2.3 重疊基因結(jié)構(gòu)設(shè)計
驗(yàn)證重疊基因結(jié)構(gòu)對蛋白表達(dá)的影響。不可溶表達(dá)基因FLS(wt低表達(dá))、PPK、HACL,保留pET-28a載體上表達(dá)框5′-端His-Tag和thrombin site的DNA序列,在基因起始密碼子前引入兩個堿基TG,形成TGATG共用堿基A的重疊基因形式,設(shè)計簡并引物,如圖4,構(gòu)建表達(dá)載體pET-28a-Gene(OG),建立mRNA的5′-端重疊基因結(jié)構(gòu)篩選庫。
圖4 重疊基因結(jié)構(gòu)設(shè)計Figure 4 Overlapping gene structure design
FLS(OG)、PPK(OG)、HACL(OG)的5′-端重疊基因結(jié)構(gòu)篩選引物設(shè)計。FLS(OG)上游引物:5′-CGCGCG-GCAGCCATTGATGGCNATGATHACNGGNGGNGARCT-NGTNGTNCGNACNCTNATTAAAGCTGGCGTAGAAC-3′。
PPK(OG)上游引物:5′-CGCGCGGCAGCCATTGATGGGNCARGARAARCTNTAYATHGARAARGARCT-NTCNTGGCTGTCTTTCAACGAACG-3′。
HACL(OG)上游引物:5′-GCGCGGCAGCCATTGATGCCNGAYTCNAAYTTYGCNGARCGNTCYGARGA-RCARGTNTCTGGTGCTAAAGTTATCGCTC-3′。
1.2.4 表達(dá)量差異分析
(1) 單克隆挑取及誘導(dǎo)表達(dá)。挑取單克隆(10~20個單克隆),轉(zhuǎn)至有2×YT培養(yǎng)基(Kan+,100 μg/mL)的24孔板或無菌EP管內(nèi),37 ℃搖床培養(yǎng),作為種子液。再轉(zhuǎn)接到試管,37 ℃,220 r/min,培養(yǎng)至OD600為0.8左右,加入終濃度為0.5 mmol/L IPTG誘導(dǎo)蛋白表達(dá),17 ℃,220 r/min,誘導(dǎo)14~16 h。測量各菌株收集時的OD600,離心收菌,PBS重懸,控制各樣品的終OD600一致(OD600=15~20)。
(2) SDS-PAGE膠檢測。制全細(xì)胞的SDS-PAGE樣品,保持上樣量相同,通過SDS-PAGE膠檢測目的蛋白表達(dá)量。將電泳完成的膠,經(jīng)染色和脫色處理后,使用凝膠成像儀拍攝保存膠圖。
(3) 通過Image J 軟件分析SDS-PAGE膠中目標(biāo)蛋白灰度,并使用內(nèi)參蛋白GAPDH(Glyceraldehyde-3-phosphate dehydrogenase,35 ku)做歸一化處理,計算相對表達(dá)量。
2.1.1 mRNA的5′-端序列變化對表達(dá)量的影響
原核生物的邊轉(zhuǎn)錄-邊翻譯表達(dá)模式表明,mRNA的5′-端起始密碼子附近區(qū)域的結(jié)構(gòu)會影響翻譯起始過程。若這段區(qū)域內(nèi)同義突變點(diǎn)越多,其變化多樣性幅度就越高。針對DNA序列,通過引物設(shè)計,在低表達(dá)基因FLS和GAOA上各自突變部分區(qū)域,覆蓋約100 nt區(qū)域,驗(yàn)證mRNA的5′-端區(qū)域?qū)Φ鞍妆磉_(dá)的影響。隨機(jī)挑選少量克隆,培養(yǎng),誘導(dǎo)表達(dá),全細(xì)胞制樣,SDS-PAGE檢測其表達(dá)變化,如圖5。突變體測序,F(xiàn)LS突變體序列見表1,GAOA突變體序列見表2。
(a)FLS突變庫的SDS-PAGE分析(1~12:FLS突變菌株的全細(xì)胞樣);(b)GAOA突變庫的SDS-PAGE分析(1~12:GAOA突變菌株的全細(xì)胞樣)。M: Protein Marker;C0:相應(yīng)含pET-28a-Gene (wt)未經(jīng)IPTG誘導(dǎo)的全細(xì)胞樣;C1:相應(yīng)含pET-28a-Gene (wt)的全細(xì)胞樣。圖5 突變體文庫的SDS-PAGE分析Figure 5 SDS-PAGE analysis of mutant library
表1 FLS前14個氨基酸的密碼子優(yōu)化
表2 GAOA前14個氨基酸的密碼子優(yōu)化
分析膠圖,對低表達(dá)基因FLS和GAOA,大部分同義突變體相較于野生型(wt),表達(dá)量均有明顯提高,且呈現(xiàn)出一定的波動。表明mRNA的5′-端100 nt區(qū)域范圍內(nèi)的序列變化,都會強(qiáng)烈影響基因的表達(dá)水平。分析測序結(jié)果,表達(dá)量的變化與密碼子的使用并無明顯相關(guān)性,更可能與mRNA的5′-端的二級結(jié)構(gòu)、GC含量相關(guān)。
2.1.2 mRNA的5′-端序列變化對可溶性的影響
挑選FLS、GAOA中表達(dá)量較高的菌株進(jìn)行簡單的可溶性驗(yàn)證,200 mL體系誘導(dǎo)表達(dá)后,經(jīng)高壓勻漿機(jī)破碎細(xì)胞后,離心,取上清液制樣,SDS-PAGE膠檢測其表達(dá)變化。簡單觀察發(fā)現(xiàn)FLS上清樣中幾乎沒有可溶性蛋白,而GAOA的上清樣中有可溶性蛋白,如圖6。
(a)FLS突變體可溶性表達(dá)分析 [M: Protein Marker;C1:FLS (wt)的全細(xì)胞樣;C2:FLS (wt)細(xì)胞破碎上清樣;1:FLS (7)的全細(xì)胞樣;2:FLS (7)細(xì)胞破碎上清樣]。(b)GAOA突變體可溶性表達(dá)分析[M: Protein Marker;1:GAOA(11)的全細(xì)胞樣;2:GAOA(11)細(xì)胞破碎上清樣;3、4:經(jīng)Ni-NTA純化后的GAOA 蛋白樣]。圖6 FLS和GAOA突變體的可溶性表達(dá)分析Figure 6 Soluble expression analysis of FLS and GAOA mutants
蛋白質(zhì)可溶性表達(dá)形成空間結(jié)構(gòu)的過程主要由細(xì)胞質(zhì)的環(huán)境條件(折疊環(huán)境)和翻譯速率兩個因素控制[19]。如大腸桿菌的細(xì)胞質(zhì)環(huán)境呈現(xiàn)還原性,不利于蛋白二硫鍵的形成和穩(wěn)定,產(chǎn)生包涵體。此外,大腸桿菌中可溶性蛋白的產(chǎn)率主要取決于蛋白的合成速率和蛋白的折疊速率。FLS不可溶表達(dá)的原因可能與表達(dá)速率過快有關(guān),減慢翻譯速率將有助于蛋白的可溶性表達(dá)。
2.2.1 重疊基因結(jié)構(gòu)對蛋白表達(dá)量的影響
經(jīng)初步的試驗(yàn)驗(yàn)證,發(fā)現(xiàn)單堿基重疊的兩個基因并不是以等量偶聯(lián)翻譯的。一些序列形成的單堿基重疊,后一個基因可能無法表達(dá),說明重疊區(qū)域的結(jié)構(gòu)會影響核糖體終止-重新初始化過程,調(diào)控基因的翻譯過程。融合重疊基因結(jié)構(gòu)和mRNA的5′-端序列優(yōu)化,形成基于重疊基因結(jié)構(gòu)強(qiáng)度的翻譯調(diào)控方法,可能有助于蛋白的可溶性表達(dá)。將pET-28a的5′-端標(biāo)簽序列作為重疊基因的一部分片段,在基因FLS、PPK、HACL的起始密碼子前引入兩個堿基TG形成重疊基因結(jié)構(gòu),通過引物設(shè)計,構(gòu)建FLS(OG)、PPK(OG)、HACL(OG) 重疊基因結(jié)構(gòu)強(qiáng)度篩選庫。隨機(jī)挑選少量克隆,培養(yǎng),誘導(dǎo)表達(dá),全細(xì)胞制樣,SDS-PAGE檢測其蛋白量變化,如圖7。突變體測序,F(xiàn)LS(OG)突變體序列見表3,PPK(OG)突變體序列見表4、HACL(OG)突變體序列見表5。
表3 FLS(OG)重疊基因結(jié)構(gòu)篩選
2.2.2 重疊基因結(jié)構(gòu)對蛋白可溶性的影響
重疊基因結(jié)構(gòu)篩選結(jié)果表明,發(fā)生重疊的基因,其表達(dá)量與重疊基因結(jié)構(gòu)強(qiáng)度有關(guān)。挑選FLS(OG)、PPK(OG)、HACL(OG)中表達(dá)量較高的菌株進(jìn)行可溶性驗(yàn)證,200 mL體系誘導(dǎo)表達(dá)后,經(jīng)高壓勻漿機(jī)破碎細(xì)胞后,離心,制樣,經(jīng)SDS-PAGE膠檢測,如圖8,發(fā)現(xiàn)其中FLS(OG)、PPK(OG)可溶性表達(dá)有顯著提高,而HACL(OG)上清樣中無明顯可溶性蛋白。
(a)FLS(OG)突變體可溶性表達(dá)分析[M: Protein Marker;C1:FLS(OG-wt)細(xì)胞破碎上清樣;1:FLS(OG-1)全細(xì)胞樣;2:FLS(OG-2)細(xì)胞破碎上清樣;3:FLS(OG-9)細(xì)胞破碎上清樣]。(b)PPK(OG)突變體可溶性表達(dá)分析 [M: Protein Marker;C0:PPK(OG-wt)未經(jīng)IPTG誘導(dǎo)的全細(xì)胞樣;C1:PPK(OG-1)的全細(xì)胞樣;1: PPK(OG-2)細(xì)胞破碎上清樣;2:PPK(OG-2)細(xì)胞破碎沉淀樣;3:PPK(OG-13)細(xì)胞破碎上清樣;4:PPK(OG-13)細(xì)胞破碎沉淀樣]。(c)HACL(OG)突變體可溶性表達(dá)分析 [M: Protein Marker;C0:HACL(OG-wt)未經(jīng)IPTG誘導(dǎo)的全細(xì)胞樣;C1:HACL(OG-1)的全細(xì)胞樣;1:HACL(OG-9)細(xì)胞破碎上清樣;2:HACL(OG-9)細(xì)胞破碎沉淀樣;3:HACL(OG-12)細(xì)胞破碎上清樣;4:HACL(OG-12)細(xì)胞破碎沉淀樣]。圖8 重疊基因?qū)Φ鞍卓扇苄员磉_(dá)的影響Figure 8 The effect of overlapping genes on the soluble expressionof protein
利用重疊基因結(jié)構(gòu)強(qiáng)度篩選的策略,篩選FLS高表達(dá)可溶性突變體,將在大腸桿菌中FLS的可溶性表達(dá)量提高了近6倍,如圖9,突變體序列見表6。利用FLS通過全細(xì)胞催化將乙醛縮合成乙偶姻,再通過化學(xué)法將乙偶姻轉(zhuǎn)化為川芎嗪(2,3,5,6-四甲基吡嗪,TMP)。優(yōu)化反應(yīng)條件后,乙偶姻和川芎嗪的滴度分別達(dá)到222 g/L和94 g/L,乙醛的轉(zhuǎn)化率分別為86.5%和48%,這是已知TMP報道的最高產(chǎn)量[20]。
利用mRNA的5′-端序列優(yōu)化的方法成功提高了低表達(dá)基因的蛋白表達(dá)量。在低表達(dá)基因FLS和GAOA的+1~+100 nt序列內(nèi)的兩個不同區(qū)域引入同義突變,對其突變體的蛋白表達(dá)結(jié)果分析發(fā)現(xiàn)其表達(dá)量均發(fā)生了大幅度變化,證明了mRNA的5′-端約100 nt序列的不同區(qū)域的變化均能強(qiáng)烈影響蛋白的表達(dá)水平。
(a)FLS突變體可溶性表達(dá)分析[M: Protein Marker; C1:FLS(wt)細(xì)胞破碎上清樣;C2:FLS(OG-wt) 細(xì)胞破碎上清樣;1:FLS(a)細(xì)胞破碎上清樣;2:FLS(OG-a)細(xì)胞破碎上清樣;3:FLS(b)細(xì)胞破碎上清樣;4:FLS(OG-b)細(xì)胞破碎上清樣]。(b)使用Image J分析的相對表達(dá)量。圖9 FLS可溶性表達(dá)量差異分析Figure 9 Analysis of the difference in the soluble expression of FLS
表6 FLS重疊基因結(jié)構(gòu)篩選
試驗(yàn)設(shè)計在優(yōu)化基因的5′-端序列使mRNA的二級結(jié)構(gòu)和密碼子適應(yīng)性同時發(fā)生了改變,從組成與結(jié)構(gòu)的關(guān)系來看,這兩個因素既有聯(lián)系又有區(qū)別。在分析突變體序列與表達(dá)量變化的關(guān)系時,采用RNAfold web Server計算GAOA突變體mRNA的最小自由能[分析序列為5′-UTR(untranslated region) + AUG +同義突變部分,其中5′-UTR序列是AGAAGGAGAUAUCAU],并對照標(biāo)準(zhǔn)E.coli密碼子使用表統(tǒng)計GAOA同義突變部分使用頻率低于10%密碼子的個數(shù)。分析發(fā)現(xiàn),低表達(dá)的GAOA-C1 (-67.36 kJ/mol,0)和GAOA-8 (-35.15 kJ/mol,5),高表達(dá)的GAOA-2 (-40.58 kJ/mol,3)、 GAOA-11 (-32.22 kJ/mol,5)和GAOA-12 (-60.67 kJ/mol,3),如果分析這5個突變體的密碼子使用或mRNA的5′-端自由能來確定決定性表達(dá)量的影響因素,無論是改變最小自由能還是密碼子使用頻率,其與表達(dá)量關(guān)系的結(jié)論都是矛盾和混亂的。對這樣相互影響的變量的分析,更為深入的結(jié)論則需要從大樣本的統(tǒng)計學(xué)上進(jìn)一步研究。
通過在翻譯過程中引入重疊基因結(jié)構(gòu),成功提高了FLS和PPK基因的可溶性表達(dá)量,證明重疊基因在調(diào)控蛋白可溶性表達(dá)中的作用。其中對FLS的表達(dá)優(yōu)化結(jié)果也應(yīng)用到了川芎嗪的合成中。我們也觀察到,HACL基因在重疊基因結(jié)構(gòu)調(diào)控下,可溶性并未增加。
針對異源基因表達(dá),重疊結(jié)構(gòu)在調(diào)控可溶性上并未顯示出高通用性。對重疊基因結(jié)構(gòu)的設(shè)計,我們利用pET-28a表達(dá)載體自身含有的標(biāo)簽序列片段,僅在基因起始密碼子前增加兩個堿基TG,形成TGATG重疊。重疊基因的前一個基因片段并不是固定的,它的長度或序列是可變和可設(shè)計的。這一片段的變化會影響SD(Shine-Dalgarno)序列與后一閱讀框的間隔長度和重疊區(qū)域的mRNA二級結(jié)構(gòu),而這兩個因素會直接影響核糖體終止-重起始過程的效率,導(dǎo)致核糖體在后一個閱讀框內(nèi)的數(shù)量和密度分布發(fā)生改變,這也可能是其調(diào)節(jié)翻譯速率來改善蛋白的可溶性的機(jī)制[14,16]。使用不同的重疊片段,對后一蛋白翻譯起始和翻譯速率的影響也會有所差異。
蛋白表達(dá)是一個涉及諸多因素協(xié)調(diào)工作的過程,其中翻譯過程中mRNA的密碼子使用和空間結(jié)構(gòu)是影響蛋白質(zhì)翻譯-折疊過程速率的重要因素,也包含著維持細(xì)胞生命有序性活動的重要信息。在進(jìn)行異源基因表達(dá)時,細(xì)胞“黑箱”能在一定范圍內(nèi)平衡各因素波動的影響,但當(dāng)失衡影響超過限度時,僅通過單因素調(diào)控,難以找到一種普遍適用的優(yōu)化方法。本研究證明重疊基因結(jié)構(gòu)在調(diào)節(jié)異源蛋白的表達(dá)量和改善可溶性方面的作用,提出一種基于重疊基因結(jié)構(gòu)篩選的異源蛋白表達(dá)優(yōu)化方法,這種新方法是對現(xiàn)有蛋白表達(dá)調(diào)控策略的有效補(bǔ)充。