劉振權(quán), 董會(huì)娜, 叢麗娜, 張大偉*
1.大連工業(yè)大學(xué) 生物工程學(xué)院,遼寧 大連 116034; 2.中國科學(xué)院天津工業(yè)生物技術(shù)研究所,天津 300308
CRISPR系統(tǒng)作為一種自身免疫系統(tǒng)在古細(xì)菌和細(xì)菌等原核生物中普遍被報(bào)道,該系統(tǒng)可對(duì)外源入侵的核酸序列靶向切割使其斷裂,從而起到保護(hù)機(jī)體免受入侵核酸序列干擾的作用[1]。Ⅱ型系統(tǒng)僅需一種Cas9效應(yīng)蛋白即可發(fā)揮切割功能且具有較高活性。因此,CRISPR/Cas9作為基因編輯工具被廣泛研究與利用[2, 3],作為編輯工具的II型CRISPR/Cas9主要由以下兩個(gè)功能性原件組成,包括具有核酸酶活性的Cas9蛋白[4],具有靶向作用的sgRNA[5]。目前應(yīng)用的CRISPR/Cas9系統(tǒng)主要來源于化膿鏈球菌[6]。Cas9的原間隔物相鄰基序(PAM)區(qū)一般位于目標(biāo)位點(diǎn)的3'末端,序列是5′-NGG-3′[6, 7]。
CRISPR/Cas9工具具有高效性、簡便性、使用廣泛性等特點(diǎn)[8]。通過改變sgRNA的序列,實(shí)現(xiàn)對(duì)不同位點(diǎn)的切割[9, 10]。在進(jìn)行基因編輯工作中,CRISPR/Cas9會(huì)導(dǎo)致雙鏈斷裂(DSB)的產(chǎn)生,因此需要修復(fù)系統(tǒng)進(jìn)行修復(fù)[11, 12]。目前常用的修復(fù)系統(tǒng)有兩種,一種是容易出錯(cuò)的不精確修復(fù)系統(tǒng)即非同源性末端連接(non-homologous end joining, NHEJ)[13],另一種是不易引起錯(cuò)誤的精確修復(fù)系統(tǒng)即同源性末端連接(homology-directed repair, HDR)[14, 15]。利用NHEJ修復(fù)系統(tǒng)對(duì)CRISPR/Cas9系統(tǒng)產(chǎn)生的DSB進(jìn)行修復(fù)時(shí),會(huì)在DSB附近的基因序列中隨機(jī)引入非特異性的堿基缺失或者插入,從而導(dǎo)致非理性的編輯。利用CRISPR/Cas9與HDR系統(tǒng)構(gòu)建的基因編輯工具,已經(jīng)被成功地應(yīng)用于眾多菌株中,實(shí)現(xiàn)了基因的精確編輯,包括堿基序列的插入、刪除以及單堿基的突變工作[16, 17]。但是該系統(tǒng)需要外源提供模板并且在一些編輯過程中可能留下篩選標(biāo)記,同時(shí)由于HDR在一些生物中具有較低的效率,導(dǎo)致在一些生物中并不能發(fā)揮功能。在修復(fù)系統(tǒng)的效率不足以對(duì)CRISPR/Cas9引入的DSB進(jìn)行修復(fù)時(shí),CRISPR/Cas9的引入會(huì)導(dǎo)致生物死亡,導(dǎo)致無法現(xiàn)實(shí)編輯[18]。這也促進(jìn)了CRISPR/dCas9系統(tǒng)的發(fā)展。
在CRISPR/Cas9系統(tǒng)中,通過突變切割結(jié)構(gòu)域HNH(H840A)與RuvC(D10A),分別失活了對(duì)互補(bǔ)鏈與非互補(bǔ)鏈的切割功能,獲得不具有切割功能,僅具有靶向作用的CRISPR/dCas9系統(tǒng)[19]。利用CRISPR/dCas9介導(dǎo)的堿基編輯器獨(dú)立于宿主細(xì)胞自身的NHEJ和HDR系統(tǒng),利用脫氨酶的催化活性實(shí)現(xiàn)堿基轉(zhuǎn)化[20-22]?;贑RISPR/dCas9系統(tǒng)與胞嘧啶脫氨酶(PmCDA1)融合的胞嘧啶脫氨酶系統(tǒng)(CBE),已在大腸桿菌中被成功建立,實(shí)現(xiàn)了由胞嘧啶核苷酸(C)到胸腺嘧啶核苷酸(T)的突變,突變率高達(dá)61.7%~95.1%,并且引入該系統(tǒng)不會(huì)導(dǎo)致細(xì)菌的死亡[14]。研究者通過單獨(dú)失活CRISPR/Cas9系統(tǒng)中一個(gè)切割結(jié)構(gòu)域的功能,獲得CRISPR/nCas9系統(tǒng)。利用該系統(tǒng)融合脫氨酶構(gòu)建堿基編輯器,在一定程度上提高了編輯效率[3]。關(guān)于腺嘌呤堿基編輯器的報(bào)道較少,GAUDELLI N M等人最先在大腸桿菌中對(duì)腺嘌呤脫氨酶進(jìn)行定向進(jìn)化,與CRISPR/dCas9融合表達(dá)構(gòu)建了能夠?qū)崿F(xiàn)腺嘌呤核苷酸(A)到鳥嘌呤核苷酸(G)突變的ABE編輯工具[23]。本文針將從原理、發(fā)展史、應(yīng)用以及未來的優(yōu)化方案對(duì)上述DNA堿基編輯器進(jìn)行綜述。
目前ABE和CBE是已經(jīng)被開發(fā)的兩種DNA堿基編輯器。堿基編輯器由CRISPR/dCas9系統(tǒng)和脫氨酶系統(tǒng)組成。通過對(duì)Cas9基因突變(H840A、D10A),得到不具有切割功能,但仍然保留靶向作用的CRISPR/dCas9系統(tǒng)[24]。構(gòu)成堿基編輯器的脫氨酶主要有兩種,一種是胞嘧啶脫氨酶,用于構(gòu)建CBE工具,利用胞嘧啶脫氨酶的作用將胞嘧啶結(jié)構(gòu)中的氨基轉(zhuǎn)化為氧原子,同時(shí)失去臨近氮原子上的氫原子,進(jìn)而實(shí)現(xiàn)由C到尿嘧啶核苷酸(U)的變化。在DNA復(fù)制和修復(fù)過程中又將U轉(zhuǎn)化為T,進(jìn)而完成C到T的轉(zhuǎn)換[24],另一種是腺嘌呤脫氨酶,用于構(gòu)建ABE工具,利用腺嘌呤脫氨酶的作用將腺嘌呤核苷結(jié)構(gòu)中的氨基轉(zhuǎn)化為氧原子,同時(shí)失去臨近氮原子上的氫原子,其將A轉(zhuǎn)換為次黃嘌呤核苷酸(I),在DNA復(fù)制和修復(fù)過程中又將I轉(zhuǎn)換為G,進(jìn)而完成A到G的轉(zhuǎn)換。在上述兩種DNA堿基編輯器共同作用下可以實(shí)現(xiàn)四種堿基的轉(zhuǎn)換,即C到T;A到G;T到C以及G到A[23]。圖1 為DNA堿基編輯器的原理圖。
圖1 CBE和ABE原理圖
胞嘧啶堿基編輯器最早被應(yīng)用在真核生物中,在原核生物中的開發(fā)利用報(bào)道較少。經(jīng)過對(duì)dCas9與脫氨酶以及相關(guān)功能原件不斷的更新,目前已經(jīng)開發(fā)到第四代堿基編輯器。其中第一代堿基編輯器由KOMOR A C等人[24]開發(fā),研究者分別利用dCas9與小鼠來源的APOBEC1脫氨酶融合表達(dá),實(shí)現(xiàn)了目標(biāo)位點(diǎn)C到T的轉(zhuǎn)換。CBE1的可編輯框范圍是5 bp,編輯位點(diǎn)主要位于距離PAM遠(yuǎn)端的13~17 bp處(距離PAM近端定義為第一位)。在生物體內(nèi)其效率為0.8%~7.7%,顯然如此低的編輯效率,并不能滿足實(shí)驗(yàn)需求。
為了提高編輯效率KOMOR A C等人繼續(xù)深入研究,開發(fā)了第二代堿基編輯器CBE2[24]。CBE2是在CBE1的基礎(chǔ)上融合表達(dá)了具有抑制DNA羰基化酶(Uracil N-glycosylase,UNG)活性的DNA羰基化酶抑制劑(Uracil Glycosylase Inhibitor,UGI),抑制了體內(nèi)的修復(fù)系統(tǒng)提高了編輯效率。實(shí)驗(yàn)結(jié)果顯示,CBE2在真核生物細(xì)胞中編輯效率仍然很低,但其在細(xì)菌中能夠有好的效果。
接下來,研究人員利用nCas9(D10A)代替了CBE1中的dCas9構(gòu)建了第三代胞嘧啶堿基編輯器CBE3。nCas9可以形成一條鏈的斷裂,當(dāng)靶向未被編輯的DNA單鏈時(shí),nCas9復(fù)合物會(huì)造成未被編輯單鏈的斷裂,此時(shí)有機(jī)體必需利用另一條被編輯的鏈作為模板進(jìn)行DNA修復(fù)。這個(gè)過程使得兩條鏈相應(yīng)位置的堿基均發(fā)生了突變,以這兩條發(fā)生編輯的單鏈為模板進(jìn)行DNA復(fù)制,則子代DNA均是發(fā)生編輯的。理論上會(huì)很大程度提高編輯效率。但是必需考慮到當(dāng)引入nCas9后,有可能引起一部分細(xì)胞的死亡。實(shí)驗(yàn)結(jié)果顯示,CBE3編輯器提高了真核生物的編輯效率,效率可達(dá)37%,但是同時(shí)發(fā)現(xiàn)該工具的引入會(huì)引起一些不想要的插入突變(Indel)[24]。
NISHIDA K等人,利用nCas9與七鰓鰻來源的胞嘧啶脫氨酶PmCDA1融合表達(dá),構(gòu)建了類似于CBE3的另一種堿基編輯器并命名為Target-AID[25]。由于不同來源的脫氨酶,導(dǎo)致該工具在一些特點(diǎn)上與CBE3具有一定區(qū)別。首先,Target-AID的可編輯范圍與CBE3有所不同,一般在PAM序列的遠(yuǎn)端15-19 bp處。其編輯效率幾乎不受編輯位點(diǎn)臨近堿基種類的影響。Target-AID與CBE3都有C轉(zhuǎn)換為G的情況出現(xiàn),但是與CBE3不同的是Target-AID工具將C突變?yōu)镚是隨機(jī)的,并不像CBE3那樣與被編輯的C位置有關(guān)。
C突變?yōu)镚并不是規(guī)律出現(xiàn)的,這種突變嚴(yán)重地影響堿基編輯工具的精準(zhǔn)性。為了進(jìn)一步提高堿基編輯器的精準(zhǔn)性,KOMOR等人,通過對(duì)nCas9與脫氨酶之間linker以及nCas9與UGI之間linker長度的優(yōu)化,同時(shí)過表達(dá)UGI,開發(fā)了第四代堿基編輯器CBE4。其與CBE3相比具有更高的編輯效率(是CBE3的編輯效率的1.5倍),以及更低的C到G的突變與Indel出現(xiàn)的頻率(與CBE3相比降低23倍)[26]。為了降低Indel的出現(xiàn)對(duì)基因表達(dá)造成的影響,KOMOR等人,在CBE4的基礎(chǔ)上,進(jìn)一步表達(dá)了Gam蛋白,利用Gam蛋白對(duì)DNA缺口的保護(hù)作用進(jìn)一步減少了Indel的出現(xiàn)頻率。
KIM Y B等人,在CBE3的基礎(chǔ)上對(duì)APOBEC1進(jìn)行點(diǎn)突變,得到的突變體有效地縮小了編輯框的范圍,由原來的5 bp減少到現(xiàn)在的1 bp~2 bp。在一定程度上提高了堿基編輯器的精準(zhǔn)性,尤其是當(dāng)編輯位置存在多個(gè)胞嘧啶的時(shí)候,會(huì)顯著地提高編輯的精準(zhǔn)性。PAM的種類很大程度地限制了堿基編輯器的使用范圍。對(duì)于一些不具有合適PAM序列的位點(diǎn),CBE3是無法發(fā)揮作用的。因此KIM Y B等人,對(duì)nCas9(D10A)進(jìn)行突變,得到了可以識(shí)別不同PAM序列的突變體。對(duì)之前一些無法作用的位點(diǎn)實(shí)現(xiàn)了編輯,一定程度上提高了CBE工具應(yīng)用的廣泛性[27]。后續(xù)相關(guān)研究者針對(duì)于PAM進(jìn)行了改進(jìn),用以增加CBE工具的可識(shí)別范圍,通過突變等手段一定程度上拓寬了CBE的編輯范圍[28-32]。
ABE編輯工具由GAUDELLI等開發(fā),他們認(rèn)為如果腺嘌呤核苷脫氨酶代替CBE中的胞嘧啶脫氨酶,極大可能開發(fā)出ABE編輯工具。因此YANG L等人,嘗試目前已有的脫氨酶,但是均不能發(fā)揮作用[33]。對(duì)大腸桿菌來源的腺嘌呤脫氨酶TadA進(jìn)行人工改造,獲得可以發(fā)揮功能的腺嘌呤脫氨酶TadA*,利用nCas9的靶向作用,首次成功地構(gòu)建了ABE編輯工具。逐步地對(duì)ABE編輯工具中的脫氨酶進(jìn)行突變,提高了ABE編輯工具的編輯效率。研究者在此基礎(chǔ)上對(duì)ABE進(jìn)行了改進(jìn)提高了編輯效率并增加了PAM可識(shí)別區(qū)域[34]。
GAUDELLI N M等人對(duì)ABE7.10進(jìn)一步優(yōu)化獲得了ABE8,與ABE7.10相比具有更高的編輯效率,更低的脫靶率[35]。最近RALLAPALLI K L等人利用計(jì)算機(jī)分子動(dòng)力學(xué)模擬實(shí)驗(yàn)揭示了在DNA編輯中TadA*的結(jié)構(gòu)和功能。分析證實(shí)了該單一突變在賦予TadA*功能方面的重要性,并證明TadA*作為單體而非二聚體進(jìn)行DNA堿基編輯[36]。ABE編輯工具與CBE編輯工具有所不同,CBE編輯工具中,脫氨酶在dCas9的下游融合表達(dá)。但ABE編輯工具脫氨酶位于dCas9下游表達(dá)時(shí),ABE編輯工具無法發(fā)揮功能。當(dāng)將dCas9基因在脫氨酶基因下游融合表達(dá)時(shí),可以發(fā)揮A到G的編輯功能[23]。
CRISPR/Cas9系統(tǒng)具有高效性,簡便性等特點(diǎn),在真核生物與原核生物中得到廣泛應(yīng)用。但是該系統(tǒng)在一些微生物中會(huì)導(dǎo)致生物體死亡,無法發(fā)揮編輯作用[18]。利用不具有切割作用的CRISPR/dCas9與胞嘧啶脫氨酶共同作用,在不影響微生物生長的情況下,現(xiàn)實(shí)了基因的編輯工作[37]。BANNO S等人利用脫氨酶融合核酸酶缺陷的CRISPR/Cas9系統(tǒng)的CBE編輯工具首次在大腸桿菌中靶向地實(shí)現(xiàn)了C突變T的研究。并證明了該工具的可編輯范圍是距離PAM序列遠(yuǎn)端的15 bp~19 bp,并且編輯范圍受sgRNA長度的影響。通過添加尿嘧啶DNA糖基化酶抑制劑與降解標(biāo)簽(LVA標(biāo)簽)提高了該工具的編輯效率。并證明了該工具可以實(shí)現(xiàn)基因組的多位點(diǎn)編輯,同時(shí)實(shí)現(xiàn)了對(duì)大腸桿菌中六個(gè)不同的結(jié)構(gòu)基因進(jìn)行編輯[14]。
同年,WANG Y等人利用CRISPR/dCas9和胞嘧啶脫氨酶融合表達(dá),在谷氨酸棒狀桿菌中利用尿嘧啶磷酸核糖轉(zhuǎn)移酶upp基因作為編輯靶點(diǎn),證明了CBE編輯工具可以發(fā)揮編輯作用。在此基礎(chǔ)上深入研究實(shí)現(xiàn)了多位點(diǎn)的編輯工作,并證明了單位點(diǎn)、雙位點(diǎn)和三位點(diǎn)編輯效率分別高達(dá)100%、87.2%和23.3%[38]。同年,研究者證明了CBE編輯系統(tǒng)可實(shí)現(xiàn)銅綠假單胞菌,銅綠假單胞菌,惡臭假單胞菌和熒光假單胞菌等高效假單胞菌物種的基因失活和點(diǎn)突變[39]。
研究者選擇大腸桿菌菌株XL1-Blue作為模型,通過將CAG/CAA(Gln)或CGA(Arg)密碼子將轉(zhuǎn)換為各自的TAG/TAA/TGA終止密碼子,提前終止了翻譯過程,實(shí)現(xiàn)了對(duì)四環(huán)素抗性基因tetA的失活。通過流式細(xì)胞儀和X-gal細(xì)胞化學(xué)分析,顯示了99.93%被編輯過的大腸桿菌細(xì)胞失去熒光,表明BE3介導(dǎo)的大腸桿菌基因編輯效率幾乎為100%。與Cas9相比BE3蛋白在靶向和切割基因組時(shí)具有非致命性。同時(shí)證明了CBE編輯工具在苜蓿芽孢桿菌中,可靶向?qū)崿F(xiàn)編碼氨基酸的密碼子突變?yōu)榻K止密碼子,從而廢除了蛋白質(zhì)功能[37]。使用設(shè)計(jì)的sgRNA將谷氨酸棒狀桿菌的尿嘧啶磷酸核糖轉(zhuǎn)移酶upp基因第484位的C轉(zhuǎn)換為T生成終止密碼子,并利用其突變體證明了失活該基因的編輯效率高達(dá)11.2%[38]。
肺炎克雷伯菌是一種有潛力的工業(yè)微生物,也是人類的主要病原體。研究者在肺炎克雷伯菌中利用CBE編輯工具,在不產(chǎn)生DSB,不需要修復(fù)模板的情況下,通過將四個(gè)密碼子(CAA,CAG,CGA和TGG)轉(zhuǎn)化為終止密碼子而實(shí)現(xiàn)了基因失活。并證明了基因距離PAM的位置對(duì)于編輯效率的影響,距離PAM序列遠(yuǎn)端的12 bp~17 bp的TC基序的C轉(zhuǎn)化為T的效率幾乎為100%,而其他位置C的編輯效率則低。同時(shí)最靠近胞嘧啶上游的堿基種類對(duì)編輯效率也有影響。胞嘧啶上游是胸腺嘧啶T時(shí)編輯效率最高C而A次之,上游是G時(shí)編輯效率最低。TC的編輯效率高于CC和AC的編輯效率。GC的編輯效率最低[40]。
由于耐藥性金黃色葡萄球菌的出現(xiàn),迫切需要開發(fā)針對(duì)金黃色葡萄球菌感染的新型治療手段。研究者設(shè)計(jì)了一個(gè)Cas9切口酶(Cas9D10A)和一個(gè)APOBEC1的融合體,利用CBE編輯工具實(shí)現(xiàn)高效的基因失活和金黃色葡萄球菌的點(diǎn)突變。利用該工具將agrA基因第7位的C,cntA基因第5位的C和esaD基因第6位的C成功以100%的效率突變?yōu)門,產(chǎn)生終止密碼子從而提前終止了翻譯過程。并證明該工具可編輯的范圍是距離PAM序列遠(yuǎn)端的12 bp~16 bp。相鄰堿基對(duì)編輯器的編輯效率有一定影響,體外活性實(shí)驗(yàn)效率由高至低遵循TC、CC、AC和GC的規(guī)律[41]。
ABE工具已經(jīng)在人類和動(dòng)植物中發(fā)揮作用,實(shí)現(xiàn)了由A/T到G/C的突變,但是相關(guān)研究較少,且效率沒有CBE編輯工具高[42-44]。在微生物中報(bào)道的極少,目前僅GAUDELLI N M等人在大腸桿菌中對(duì)腺嘌呤脫氨酶進(jìn)行定向進(jìn)化和蛋白質(zhì)工程產(chǎn)生了第七代ABE,首次證明了腺嘌呤堿基編輯器可以在微生物中發(fā)揮功能,將目標(biāo)A/T堿基對(duì)有效地轉(zhuǎn)化為G/C[23]。研究者在小鼠中建立ABE編輯工具時(shí),為優(yōu)化ABE編輯工具的編輯效率與可作用范圍,分別利用金黃色葡萄球菌 (Staphylococcusaureus)、釀膿鏈球菌(Streptococcuspyogenes)來源的腺嘌呤脫氨酶進(jìn)行實(shí)驗(yàn)比傳統(tǒng)的ABE編輯工具效率更高,可作用范圍更廣,這也為在細(xì)菌中建立ABE編輯工具提供了希望[45]。
由于堿基編輯器的簡便性,高效性,不需要額外的修復(fù)系統(tǒng)且不導(dǎo)致菌體死亡等特點(diǎn)已被廣泛應(yīng)用與真核與原核生物中,但是該工具仍有一些不足之處。譬如,在編輯過程中的脫靶率較高;可以編輯的范圍會(huì)受到一定限制例如PAM的限制;在靶向位點(diǎn)臨近處有相同堿基時(shí),很難實(shí)現(xiàn)某一個(gè)堿基的突變。這些問題的解決仍然是堿基編輯器進(jìn)一步優(yōu)化的方向。在堿基編輯器中主要是CRISPR系統(tǒng)發(fā)揮靶向作用,所以在解決堿基編輯器脫靶率的問題上,可以參考CRISPR系統(tǒng)脫靶率問題的解決方法??梢岳蒙镄畔W(xué)的方法,對(duì)sgRNA進(jìn)行設(shè)計(jì)與篩選[46]。通過改變sgRNA的長度在一定程度上降低了脫靶率[47]。通過對(duì)dCas9蛋白的結(jié)構(gòu)域進(jìn)行突變獲得具有識(shí)別不同PAM的dCas9蛋白[27, 47],可以在一些特異位點(diǎn)利用ABE工具實(shí)現(xiàn)C到A/T的轉(zhuǎn)換[48]。同時(shí),可以利用CRISPR/Cas12a與脫氨酶融合構(gòu)建堿基編輯器[49,50]。從目前的報(bào)道中看,可編輯的范圍只在靶向序列范圍內(nèi),可以適當(dāng)縮短靶向序列的長度,一定程度上縮小了可編輯的范圍,進(jìn)而實(shí)現(xiàn)了單個(gè)堿基的突變[47]。