鄭基壇(綜述), 閆娜娜, 左二偉(審校)
CRISPR(clustered regularly interspaced short palindromic repeats)系統(tǒng),即成簇的、間隔規(guī)律的短回文重復(fù)序列。該系統(tǒng)廣泛存在于40%的細(xì)菌及90%的古細(xì)菌中,主要用于應(yīng)對(duì)外源DNA或者病毒入侵的免疫防御[1]。根據(jù)該特性,Jinek等[2]將tracrRNA及crRNA整合形成單鏈引導(dǎo)RNA(small guide RNA,sgRNA),該sgRNA由5′端負(fù)責(zé)與靶序列互補(bǔ)配對(duì)的20個(gè)核苷酸及3′端參與Cas9蛋白識(shí)別的發(fā)卡結(jié)構(gòu)組成,首次在體外實(shí)現(xiàn)對(duì)靶標(biāo)序列的切割,為CRISPR/Cas基因編輯技術(shù)的廣泛應(yīng)用奠定了重要基礎(chǔ)。隨后,Cong等[3]和Mali等[4]同時(shí)發(fā)表CRISPR/Cas9系統(tǒng)應(yīng)用于哺乳動(dòng)物細(xì)胞基因組編輯的研究,極大地推動(dòng)了基因編輯技術(shù)的發(fā)展與應(yīng)用。2016年以來(lái),Gaudelli等[5]和Komor等[6]基于脫氨酶與CRISPR/Cas9系統(tǒng)相繼開(kāi)發(fā)了胞嘧啶堿基編輯器(cytosine base editor, CBE)和腺嘌呤堿基編輯器(adenine base editor, ABE),Kurt等[7]和Zhao等[8]開(kāi)發(fā)了C到G堿基編輯器(C-to-G base editor, CGBE),為基礎(chǔ)醫(yī)學(xué)和精準(zhǔn)基因治療提供了重要技術(shù)手段。2019年,Anzalone等[9]又開(kāi)發(fā)了精準(zhǔn)基因編輯工具引導(dǎo)編輯器(prime editor, PE),為單堿基編輯技術(shù)無(wú)法進(jìn)行的編輯領(lǐng)域提供了另一重要選擇。
1.1 CRISPR/Cas核酸酶介導(dǎo)的基因編輯技術(shù) 目前已經(jīng)發(fā)現(xiàn)3種不同類型的CRISPR/Cas系統(tǒng),其中第2類最為簡(jiǎn)單,只需要1種Cas蛋白參與即可完成對(duì)靶序列的識(shí)別與切割,更適合用于基因編輯,目前廣泛應(yīng)用的Cas9蛋白就屬于第2類[1]。CRISPR/Cas在sgRNA的指導(dǎo)下,可對(duì)基因組靶序列進(jìn)行切割,造成DNA雙鏈斷裂(double strands break,DSB)。DSB主要通過(guò)2種方式進(jìn)行修復(fù),即非同源末端連接(non-homologous end joining,NHEJ)與同源重組(homology-directed repair,HDR)。CRISPR/Cas造成的DSB通常在NHEJ修復(fù)方式下,造成特定位置的堿基插入或缺失,從而通過(guò)移碼突變使基因喪失功能。因此CRISPR/Cas常被用于基因敲除的研究。這種修復(fù)方式經(jīng)常會(huì)造成DNA的插入缺失、倒位和易位等問(wèn)題,使得基因治療存在嚴(yán)重的安全風(fēng)險(xiǎn)。另外,在含有雙鏈DNA或者單鏈DNA同源重組模板供體的情況下,DSB可以通過(guò)HDR修復(fù)方式對(duì)基因組進(jìn)行精準(zhǔn)編輯,包括堿基替換、精準(zhǔn)插入和精準(zhǔn)刪除等。但是,HDR一般發(fā)生于分裂細(xì)胞周期的G2和S期,細(xì)胞內(nèi)主要以NHEJ修復(fù)方式為主,導(dǎo)致HDR介導(dǎo)的精準(zhǔn)編輯效率很低。
但是,研究表明,CRISPR/Cas和sgRNA誘導(dǎo)的DSB可以導(dǎo)致基因組較大片段的改變,如易位或者大片段刪除[10-11],或是激活細(xì)胞內(nèi)p53通路[12-13]。而近期研究報(bào)道,Cas9蛋白即使在沒(méi)有外源sgRNA的條件下,過(guò)表達(dá)也可激活多種細(xì)胞系中的p53通路,并促進(jìn)p53失活型突變的選擇性富集[14]。
1.2 擴(kuò)展CRISPR/Cas基因編輯范圍 Cas蛋白結(jié)合DNA靶序列需要有特定的前間隔序列鄰近基序(protospacer adjacent motif,PAM)存在,極大限制了合適sgRNA的選擇。最早開(kāi)發(fā)并廣泛應(yīng)用的來(lái)源于化膿性鏈球菌(Streptococcuspyogenes)的Cas9蛋白所識(shí)別的PAM為NGG[15]??蒲腥藛T一直致力于開(kāi)發(fā)識(shí)別不同PAM的Cas蛋白以擴(kuò)展其應(yīng)用范圍,主要從以下2個(gè)方面進(jìn)行研究:一是通過(guò)尋找不同來(lái)源的Cas蛋白,例如金黃色葡萄球菌(Staphylococcusaerou)來(lái)源的SaCas9識(shí)別“NNGRRT”P(pán)AM,具有的蛋白更小,更適合病毒包裝遞送到體內(nèi)[16];二是通過(guò)構(gòu)建Cas蛋白的不同突變體,例如SpCas9-EQR、SpCas9-VQR和SpCas9-VRER可以分別識(shí)別“NGAG”“NGA”和“NGCG” PAM。盡管這些不同來(lái)源或不同突變體蛋白可以識(shí)別不同PAM,但還是有很多位點(diǎn)難以編輯。2020年,Walton等[17]通過(guò)生物工程技術(shù)開(kāi)發(fā)了一種SpCas9的突變體SpRY,該突變體幾乎不需要PAM,可以靶向絕大部分基因組位置,并且具有較高的基因編輯效率。該進(jìn)展突破了CRISPR/Cas系統(tǒng)因需要特定的PAM而產(chǎn)生的限制,為很多之前不可用的位點(diǎn)提供了被編輯的可能,極大擴(kuò)展了其編輯范圍。
1.3 提高CRISPR/Cas基因編輯特異性 Cas9蛋白的精確靶向編輯主要取決于它能夠從基因組序列中識(shí)別能與sgRNA互補(bǔ)的靶向DNA,但也存在無(wú)法區(qū)別相似序列的情況,造成sgRNA依賴性脫靶。通過(guò)生物工程技術(shù),工程化改變Cas9蛋白的氨基酸序列,能夠降低脫靶編輯。Slaymaker等[18]通過(guò)篩選突變體發(fā)現(xiàn)了一種含有K848A、K1003A和R1060A突變組合的SpCas9變體eSpCas9(1.1),既可以有效編輯靶位置,又可以減少在非靶位置的編輯。Kleinstiver等[19]也開(kāi)發(fā)了N497A、R661A、Q695A和Q926A突變組合的SpCas9-HF1突變體,該突變體具有更好的保真性。Chen等[20]研究了高保真性的Cas9蛋白減少脫靶的生化機(jī)制,研發(fā)了包含N692A、M694A、Q695A和H698A突變的高保真HypaCas9。eSpCas9(1.1)、SpCas9-HF1和HypaCas9是在一定理論基礎(chǔ)上設(shè)計(jì)得到的,Casini等[21]在酵母系統(tǒng)里通過(guò)文庫(kù)篩選的方法開(kāi)發(fā)了新的高保真的SpCas9突變體,即evoCas9。Lee等[22]在大腸桿菌中應(yīng)用文庫(kù)篩選方案研發(fā)了名為Sniper-Cas9的高保真SpCas9突變體??偠灾?,通過(guò)各種生物工程技術(shù)優(yōu)化CRISPR/Cas系統(tǒng),降低無(wú)法區(qū)別相似DNA序列的可能性,提高基因編輯的特異性,為應(yīng)用于臨床奠定基礎(chǔ)。
單堿基編輯技術(shù)是基于CRISPR/Cas系統(tǒng)改造的新型基因編輯技術(shù),可精確、高效地將DNA或者RNA中的一個(gè)堿基替換為另一個(gè)堿基。該技術(shù)因具有不產(chǎn)生雙鏈斷裂、無(wú)需供體、效率高、普適性等特點(diǎn),成為基因編輯領(lǐng)域的新寵。目前,已開(kāi)發(fā)的單堿基編輯器包括可將胞嘧啶(C)替換為胸腺嘧啶(T)的CBE[23]、將腺嘌呤(A)替換為鳥(niǎo)嘌呤(G)的ABE[5],以及最近新開(kāi)發(fā)的可進(jìn)行C到G堿基顛換的CGBE[7-8]。
2.1 CBE堿基編輯器 常用的CBE主要由大鼠的胞嘧啶脫氨酶(rApobec)、切口酶活性的nCas9(D10A)以及尿嘧啶DNA糖基化酶抑制劑(uracil glycosylase inhibitor, UGI)組成。胞嘧啶脫氨酶將編輯窗口的胞嘧啶(C)脫氨形成尿嘧啶(U),由CG配對(duì)變成UG配對(duì)的中間體,在DNA錯(cuò)配修復(fù)的修復(fù)機(jī)制下,U會(huì)被識(shí)別為T(mén),實(shí)現(xiàn)CG配對(duì)向TA配對(duì)的轉(zhuǎn)變,利用nCas9切口酶在非編碼鏈上產(chǎn)生缺口,則會(huì)極大提高轉(zhuǎn)變的效率,UGI的作用則是抑制細(xì)胞內(nèi)堿基錯(cuò)配切除修復(fù)。
為了優(yōu)化CBE編輯器,科研人員從許多方面進(jìn)行改造,開(kāi)發(fā)了許多改良版的CBE。例如通過(guò)增加核定位信號(hào)(nuclear localization signal, NLS)個(gè)數(shù)優(yōu)化等構(gòu)建的BE4max、AncBE4max或FNLS-BE3等,均可通過(guò)提高堿基編輯器的表達(dá)水平,提高編輯效率。CBE的編輯產(chǎn)物純度不是很高,其中非特異性的產(chǎn)物包括靶位點(diǎn)處的C到A或G編輯、indels以及旁觀者編輯(bystander editing)??蒲腥藛T通過(guò)融合多個(gè)UGI可以提高C-T編輯產(chǎn)物的純度[6,24];還可以通過(guò)突變r(jià)APOBEC1上與DNA的作用位點(diǎn)(例如YE1、YE2、YEE和EE等)將編輯窗口變窄,從而減少旁觀者編輯[25]。Doman等[26]和Zuo等[27]報(bào)道了YE1突變體(YE1-BE4或YE1-BE3-FNLS)能夠在保證編輯效率不下降的同時(shí)顯著減少脫靶效率。另外,為了進(jìn)一步擴(kuò)大CBE的可編輯范圍,可以將CBE中的SpCas9換成其他Cas蛋白或其突變體,如SaCas9、SpCas9-EQR、SpCas9-VQR、SpRY等,在不同PAM位點(diǎn)進(jìn)行編輯[16-17]。
2.2 ABE堿基編輯器 ABE堿基編輯器由人工定向進(jìn)化的腺嘌呤脫氨酶TadA和nCas9組成。TadA將靶序列的A脫氨變?yōu)榧≤誌,隨后在DNA復(fù)制過(guò)程中,I被當(dāng)作G進(jìn)行讀碼,最終實(shí)現(xiàn)A到G的替換[5]。
為了提高ABE堿基編輯效率,Koblan等[28]通過(guò)增加NLS個(gè)數(shù)及密碼子優(yōu)化構(gòu)建的ABEmax顯著提高了A到G的編輯效率。最近,該實(shí)驗(yàn)室又通過(guò)噬菌體輔助的非連續(xù)和連續(xù)進(jìn)化(PANCE和PACE)技術(shù)手段,通過(guò)引入8個(gè)突變位點(diǎn)構(gòu)建了ABE8e版本,其效率比ABE7.10提高了590倍[29]。雖然ABE相對(duì)CBE的保真性更高,但也存在大量RNA脫靶,Zhou等[30]構(gòu)建的ABE7.10-F148A以及Grünewald等[31]構(gòu)建的miniABEmax-V82G等均可顯著降低RNA脫靶。
2.3 CGBE堿基編輯器 Kurt等[7]和Zhao等[8]研究報(bào)道,使用尿嘧啶-N-糖基化酶(uracil-N glycosylase, UNG)替換掉CBE系統(tǒng)中的UGI,構(gòu)建了能夠在哺乳動(dòng)物細(xì)胞上介導(dǎo)C到G堿基顛換的新工具CGBE編輯器。前者還開(kāi)發(fā)出可在原核生物中使用的C-A堿基編輯系統(tǒng)UNG-nCas9-AID,不過(guò)目前在真核生物細(xì)胞中還不能實(shí)現(xiàn)C>A的堿基改變。該編輯器的作用原理是在胞嘧啶脫氨酶的作用下,使靶序列的C變?yōu)閁,然后在UNG的作用下去除U,形成一個(gè)無(wú)堿基無(wú)嘧啶位置(AP site),同時(shí)在nCas9的作用下切割互補(bǔ)鏈,造成該鏈斷裂,隨后進(jìn)行DNA修復(fù),遇到AP site時(shí)大概率以C填上去,隨后復(fù)制形成C∶G互補(bǔ)配對(duì),最后達(dá)到C到G的顛換。
2.4 單堿基編輯系統(tǒng)的脫靶檢測(cè) 雖然堿基編輯系統(tǒng)簡(jiǎn)易高效,但也存在大量DNA和RNA脫靶效應(yīng)。堿基編輯系統(tǒng)的脫靶主要分為sgRNA依賴性脫靶以及非sgRNA依賴性脫靶。sgRNA依賴性脫靶是指sgRNA錯(cuò)誤識(shí)別基因組上與靶位點(diǎn)序列相似性很高的位點(diǎn),引導(dǎo)Cas9發(fā)揮功能造成的脫靶。這類脫靶位點(diǎn)可以通過(guò)一些在線工具(例如Cas-OFFinder)根據(jù)DNA序列的相似程度預(yù)測(cè),然后通過(guò)T7EI、Sanger測(cè)序或者高通量測(cè)序檢測(cè)。非sgRNA依賴性脫靶指與sgRNA無(wú)關(guān)、無(wú)法通過(guò)軟件預(yù)測(cè)、隨機(jī)分布在基因組的脫靶位點(diǎn)。對(duì)于基因組水平的隨機(jī)脫靶,研究人員建立了多種實(shí)驗(yàn)方法,例如SITE-Seq[32]、LAM-HTGTS[33]、GUIDE-seq[34]、CIRCLE-seq[35]等進(jìn)行檢測(cè),但這些研究手段都存在一定局限性,不能高靈敏地檢測(cè)脫靶突變。2019年,Zuo等[36]開(kāi)發(fā)了新一代基因編輯工具脫靶檢測(cè)技術(shù)——GOTI(genome-wide off-target analysis by two-cell embryo injection),該技術(shù)可在不借助任何脫靶位點(diǎn)預(yù)測(cè)技術(shù)的情況下發(fā)現(xiàn)之前脫靶檢測(cè)手段無(wú)法發(fā)現(xiàn)的脫靶位點(diǎn),顯著提高了脫靶檢測(cè)的靈敏性,為基因編輯工具的安全性評(píng)估帶來(lái)突破性。對(duì)于轉(zhuǎn)錄組水平的隨機(jī)脫靶,可通過(guò)轉(zhuǎn)錄組深度測(cè)序來(lái)檢測(cè)[30-31]。
為實(shí)現(xiàn)任意堿基的插入、缺失或者替換,最近Anzalone等[9]報(bào)道了一種被稱為Prime Editor的引導(dǎo)編輯器PE,不需要產(chǎn)生DSB及外源模板DNA存在的情況下,PE不僅能夠?qū)崿F(xiàn)12種不同方式的堿基替換,而且能完成任意堿基的插入、缺失。研究人員將逆轉(zhuǎn)錄酶與與催化能力部分缺失的Cas9蛋白(H840A)融合表達(dá),并利用與之相應(yīng)的pegRNA(prime editing guide RNA)最終實(shí)現(xiàn)靶位點(diǎn)的基因編輯。pegRNA主要包括3部分,主要在sgRNA的表達(dá)載體進(jìn)行改造,5′端的sgRNA部分、sgRNA 3′端發(fā)卡結(jié)構(gòu)后加入逆轉(zhuǎn)錄的模板(RT template)、與sgRNA反向互補(bǔ)的PBS(primer binding site)序列。模板DNA中包含需編輯的堿基序列,PBS序列作為逆轉(zhuǎn)錄引物結(jié)合位點(diǎn),一般為13個(gè)堿基左右,成功將sgRNA、逆轉(zhuǎn)錄的模板、引物結(jié)合位點(diǎn)表達(dá)在同一條RNA上,在此基礎(chǔ)上形成第一代PE1,堿基替換效率達(dá)0.7%~5.5%,插入和缺失效率達(dá)4%~17%。PE1雖然可以實(shí)現(xiàn)基因組的精確編輯,但效率相對(duì)較低。為進(jìn)一步提高基因編輯的效率,將PE1融合蛋白5個(gè)位點(diǎn)進(jìn)行突變,以提高逆轉(zhuǎn)錄酶熱穩(wěn)定性、合成能力、與DNA及RNA底物的結(jié)合、RNA酶H活性等,形成PE2,靶位點(diǎn)突變的效率提升了1.5~5.1倍。研究表明,在非編碼鏈上產(chǎn)生切口,DNA在修復(fù)的過(guò)程中以編碼鏈為模板修復(fù),能極大提高修復(fù)的效率。因此,在pegRNA靶序列的下游設(shè)計(jì)一個(gè)sgRNA,利用PE2中Cas9 H840A在非編碼鏈上產(chǎn)生切口,進(jìn)一步提升編輯效率,建立PE3。相對(duì)于CRISPR/Cas9、CBE及ABE系統(tǒng),PE有著不可比擬的優(yōu)勢(shì)。首先,PE利用切口酶nCas9(H840A),在編輯的過(guò)程中不會(huì)產(chǎn)生DSB,相對(duì)于CRISPR/Cas9介導(dǎo)的HDR或者NHEJ的修復(fù)方式,產(chǎn)生的插入或缺失突變更少。其次,PE以pegRNA為模板進(jìn)行逆轉(zhuǎn)錄修復(fù),不僅能夠?qū)崿F(xiàn)12種不同的堿基替換方式,還可以實(shí)現(xiàn)單個(gè)或多個(gè)堿基的插入或缺失,最長(zhǎng)可達(dá)80個(gè)堿基。因此PE不僅可以修復(fù)因各種點(diǎn)突變?cè)斐傻倪z傳疾病,還可以修復(fù)因堿基插入或缺失造成的遺傳疾病,應(yīng)用范圍更廣。再者,受到PAM及編輯窗口的限制,BE系統(tǒng)只能在有限的窗口實(shí)現(xiàn)基因編輯,考慮到NGG序列在基因組中出現(xiàn)的頻率,PE則可以在任何位置實(shí)現(xiàn)編輯,不會(huì)受相應(yīng)的限制。PE系統(tǒng)無(wú)論在生物學(xué)研究,還是在未來(lái)的臨床治療中都表現(xiàn)出廣闊的前景,數(shù)據(jù)表明,89%的遺傳疾病可以通過(guò)PE修復(fù)治療。
CRISPR/Cas基因編輯技術(shù)快速發(fā)展與優(yōu)化的終極目標(biāo)是使其應(yīng)用于疾病治療。目前,CRISPR/Cas相關(guān)技術(shù)已經(jīng)成功應(yīng)用于各種遺傳性疾病的治療。2020年,有1篇發(fā)表于《NEJM》的文章首次在臨床中證實(shí)CRISPR/Cas9技術(shù)可有效治療鐮刀型紅細(xì)胞貧血(sickle cell disease, SCD)和β-地中海貧血(β-thalassemia, TDT)。研究人員利用CRISPR/Cas9技術(shù)編輯1例SCD患者和1例TDT患者自體CD34+細(xì)胞的BCL11A基因,回輸編輯后的細(xì)胞,12個(gè)月內(nèi)2例患者在骨髓和血液中都有高水平的等位基因編輯,目前已不需要接受輸血治療[37];2018年,有2篇文章同時(shí)報(bào)道利用CBE對(duì)小鼠遺傳性肝臟疾病進(jìn)行了成體治療[38-39];2020年,研究人員利用ABE實(shí)現(xiàn)了對(duì)先天性黑蒙癥小鼠模型突變基因的高效修復(fù),有效恢復(fù)了小鼠模型的視覺(jué)能力[40]。由此可見(jiàn),基于CRISPR/Cas系統(tǒng)的基因編輯工具是可應(yīng)用于基因治療的。但CRISPR/Cas系統(tǒng)仍存在一些問(wèn)題,其一就是編輯效率問(wèn)題,影響成體治療編輯率的可能因素有很多,首當(dāng)其沖的就是遞送系統(tǒng),目前常用的遞送系統(tǒng)主要為腺相關(guān)病毒(adeno-associated virus,AAV),但其載量有限,需將Cas9蛋白拆成兩部分,共同遞送到細(xì)胞內(nèi)再結(jié)合發(fā)揮其作用,這在一定程度上影響了其編輯效率,因此,研發(fā)出更高效、安全的遞送系統(tǒng)是推進(jìn)CRISPR/Cas系統(tǒng)在基因治療領(lǐng)域發(fā)展的一個(gè)重要方向。另一個(gè)問(wèn)題就是安全性問(wèn)題,到目前為止,尚未系統(tǒng)地分析CRISPR/Cas系統(tǒng)在體內(nèi)發(fā)揮靶位置編輯的同時(shí)是否會(huì)產(chǎn)生一些不良影響,這也是亟待解決的問(wèn)題。
CRISPR/Cas系統(tǒng)的發(fā)展速度驚人,這些工具已經(jīng)改變了生命科學(xué),使基礎(chǔ)研究取得了許多進(jìn)步,并為開(kāi)發(fā)新一代基因療法帶來(lái)曙光,可以治療甚至可能治愈人類許多具有遺傳成分的疾病。之后的研究不僅要致力于進(jìn)一步開(kāi)發(fā)編輯效率更好、安全性更高的基因編輯工具,更需要開(kāi)發(fā)高效且安全的遞送系統(tǒng),確保將基因編輯工具準(zhǔn)確送到靶位置。此外,科研人員也需合乎倫理地規(guī)范應(yīng)用基因編輯工具,造福人類。