剌浩亮,符兆英,2*
(1.延安大學(xué)醫(yī)學(xué)院;2.延安大學(xué)分子生物學(xué)與免疫學(xué)研究所,陜西 延安 716000)
CRISPR(clustered regularly interspaced short palindromic repeat)是原核生物染色體DNA中的一種片段,由具有回文結(jié)構(gòu)的重復(fù)序列(repeats)和間隔序列(spacers)組成,Cas(CRISPR associated)基因與CRISPR片段緊密相鄰,CRISPR-Cas系統(tǒng)可見于約40%的細(xì)菌和約90%的古生菌,是原核生物的免疫系統(tǒng),可抵抗噬菌體和質(zhì)粒等外來基因的入侵[1-2]。2012年,CRISPR-Cas系統(tǒng)被研究人員用于進(jìn)行真核基因編輯(genome editing)[3]。CRISPR-Cas9基因編輯技術(shù)是一種強(qiáng)有力的基因編輯工具,并有快速、簡便易行、節(jié)省經(jīng)費(fèi)、可操作對象廣等優(yōu)點(diǎn);這一技術(shù)創(chuàng)立后,迅即被世界各國相關(guān)實(shí)驗(yàn)室紛紛采用,Science雜志于2015年初稱CRISPR-Cas9基因編輯技術(shù)為繼PCR以來生物醫(yī)學(xué)技術(shù)上一次新的突破或革命[4]。在CRISPR-Cas9基因編輯的基礎(chǔ)上,近幾年衍生出了幾種新技術(shù)。
1987年,Yoshizumi Ishino首次描述了大腸桿菌染色體DNA中成簇的重復(fù)序列,但完全不知道它們的功能[5]。2000年,通過計(jì)算機(jī)DNA序列分析,在其他細(xì)菌和古生菌中發(fā)現(xiàn)了類似的重復(fù)序列,被稱為SRSR(Short Regularly Spaced Repeats)。2002年,其他研究人員用基因序列分析軟件在更多的其他細(xì)菌和古生菌中發(fā)現(xiàn)了類似的重復(fù)序列,SRSR被更名為CRISPR;此外,與CRISPR相關(guān)的一組基因也被他們發(fā)現(xiàn),這組基因被命名為Cas基因[6]。Cas基因編碼的蛋白質(zhì)為核酸酶或解旋酶,可以切割DNA,但是,CRISPR-Cas系統(tǒng)的功能仍然不明確。
2005年,三個研究小組各自獨(dú)立報道,一些CRISPR間隔序列與噬菌體DNA和細(xì)菌染色體外DNA(質(zhì)粒)具有同源性[7-8]。這些間隔序列片段可能是細(xì)菌在先前被病毒感染時獲得的。這一重要發(fā)現(xiàn)導(dǎo)致了一個假說的提出:CRISPR-Cas系統(tǒng)可能在細(xì)菌體內(nèi)發(fā)揮適應(yīng)性免疫的作用[9]。當(dāng)時認(rèn)為,CRISPR間隔序列可以作為合成RNA的模板,細(xì)菌的CRISPR-Cas系統(tǒng)可能與真核生物的RNAi系統(tǒng)具有類似的作用。
2007年,加拿大拉瓦爾大學(xué)的Moineau研究小組和丹麥Danisco公司的研究人員發(fā)現(xiàn),改變CRISPR間隔序列DNA可以改變嗜熱鏈球菌(Streptococcus thermophilus,屬乳酸菌)對噬菌體攻擊的抵抗力[10],證實(shí)了CRISPR-Cas系統(tǒng)在細(xì)菌體內(nèi)發(fā)揮適應(yīng)性免疫作用的假說。這些研究人員發(fā)現(xiàn),細(xì)菌被噬菌體感染后,噬菌體來源的間隔序列可整合入受體菌CRISPR區(qū)域內(nèi),這些細(xì)菌即具有了對同一種系的噬菌體感染的抵抗力;如果把間隔序列從CRISPR區(qū)域去掉,這種抵抗力就會喪失。他們的研究還顯示,Cas基因編碼切割RNA的核酸酶,細(xì)菌抗噬菌體免疫的發(fā)揮,至少需要有一個Cas基因的參與。
2012年,美國加利福尼亞大學(xué)伯克利分校的Jinek和Doudna等設(shè)計(jì)用一個(操作起來)比較簡單的CRISPR-Cas系統(tǒng),即II型CRISPR-Cas系統(tǒng),編輯基因(這個系統(tǒng)使用Cas9蛋白質(zhì)),創(chuàng)立了CRISPR-Cas9基因組編輯技術(shù)[11]。2013年以來,CRISPR-Cas9基因組編輯技術(shù)很快被其他實(shí)驗(yàn)室采用,用于編輯多種生物的基因組,在世界范圍內(nèi)掀起了一個用CRISPR-Cas9技術(shù)編輯基因的熱潮。
CRISPR-Cas系統(tǒng)有3種主要的型別,I型、II型和III型;3種型別的區(qū)分,主要在于Cas基因的不同。CRISPR-Cas系統(tǒng)的序列,從5′末端到3′末端,依次是Cas基因、前導(dǎo)序列和重復(fù)序列與間隔序列交替的CRISPR陣列。Cas基因編碼Cas蛋白質(zhì),不同型別的CRISPR-Cas系統(tǒng)可有不同數(shù)量和不同種類的Cas基因,但所有型別的CRISPR-Cas系統(tǒng)均含有Cas1基因和Cas2基因;前導(dǎo)序列含有轉(zhuǎn)錄CRISPR片段的啟動子;重復(fù)序列含有回文(palindromic)序列,可以形成發(fā)夾式結(jié)構(gòu);間隔序列是從入侵的噬菌體或質(zhì)粒DNA獲取的,所以各不相同,可以用于區(qū)分不同種屬的細(xì)菌。CRISPR座位或陣列的大小不等,重復(fù)序列可以是23-55bp,一般是28-37bp;間隔序列可以是21-72bp,一般是32-38bp。一個細(xì)菌細(xì)胞一般含1~2個CRISPR-Cas座位,但亦有19個座位和25個座位的報道[12]。
原核生物不斷遇到各種外源性基因比如噬菌體和質(zhì)粒DNA的侵襲,所以它們必須有一定的防御機(jī)制,必須能區(qū)分外源DNA與自身DNA,以保護(hù)他們免受噬菌體和質(zhì)粒的入侵,使它們能在相應(yīng)的環(huán)境中生存。和真核生物類似,原核生物也有固有性和獲得性/適應(yīng)性免疫或防御機(jī)制。固有性防御包括防止吸附、阻止DNA注入、使感染流產(chǎn)等,這些機(jī)制對防御噬菌體入侵有效;固有性防御還包括限制性核酸內(nèi)切酶系統(tǒng),對抵御質(zhì)粒入侵有效。新近發(fā)現(xiàn)的CRISPR-Cas系統(tǒng)能夠提供一種有效的和特異性的適應(yīng)性或獲得性免疫機(jī)制,對抵御噬菌體入侵和質(zhì)粒入侵均有效[1]。
CRISPR-Cas系統(tǒng)的免疫防御機(jī)制分為兩個階段:間隔序列獲得階段(免疫力獲得階段)和干擾階段(免疫力執(zhí)行階段)。噬菌體首次入侵細(xì)菌后,細(xì)菌中的Cas核酸酶將噬菌體DNA的特定部位切割形成短的片段(原間隔序列),原間隔序列整合入已有的CRISPR座位的5′末端(前導(dǎo)序列的3′末端側(cè)),形成一個新的間隔序列及相應(yīng)的重復(fù)序列,即原來的CRISPR座位增加了一個間隔序列和相應(yīng)的一個重復(fù)序列片段;以上為免疫力獲得階段。細(xì)菌遇到同一種系的噬菌體的再次入侵后,CRISPR重復(fù)序列和間隔序列轉(zhuǎn)錄出一條長的RNA分子,這條長的RNA鏈然后被切割為短的crRNAs(CRISPR RNAs),特異性的crRNA間隔序列與入侵的噬菌體或質(zhì)粒DNA通過堿基互補(bǔ)特異性結(jié)合,然后通過Cas核酸酶切割破壞目標(biāo)DNA;這一階段為免疫力實(shí)現(xiàn)階段[2]。
不同型別的CRISPR-Cas系統(tǒng)的作用機(jī)制不完全相同,其區(qū)別主要在免疫力執(zhí)行階段。以下比較詳細(xì)地并分型別描述CRISPR-Cas系統(tǒng)的免疫防御作用機(jī)制。
噬菌體或質(zhì)粒侵入細(xì)菌細(xì)胞后,細(xì)菌細(xì)胞中的Cas1蛋白和Cas2蛋白在特定部位識別并切割外源性DNA并將其整合入已有的CRISPR序列。三個主要型別的CRISPR系統(tǒng)均有Cas1和Cas2,為細(xì)菌獲得間隔序列所必須;Cas1和Cas2變異后,細(xì)菌喪失獲得間隔序列的能力,但仍保留免疫應(yīng)答能力。Cas1和Cas2的作用機(jī)制尚不完全明了,但已知Cas1是金屬依賴酶,能識別DNA的特定序列并與之結(jié)合。Cas2具有ssRNA或dsDNA核酸內(nèi)切酶活性。Cas1和Cas2均能將外源性DNA剪切出一個片段并將其插入CRISPR陣列[6]。外源性DNA中被Cas1和Cas2識別和切割的序列稱原間隔序列(protospacer),Cas1和Cas2能通過原間隔序列相鄰模體(protospacer adjacent motif,PAM)進(jìn)行特異性識別。分析發(fā)現(xiàn),基于PAM的識別只對I型和II型CRISPR-Cas系統(tǒng)重要而對III型不重要。PAM是3~5個堿基對的DNA序列,位于CRISPR的3′末端并與其相鄰。Cas1和Cas2識別PAM后,在其5′末端附件剪切出原間隔序列,用的是Cas1蛋白所固有的“量尺(ruler)”機(jī)制,從而保證切割出的序列長度的規(guī)則性。不同型別的CRISPR系統(tǒng)的PAM序列的保守性不同,主要與Cas1和前導(dǎo)序列相關(guān)[7]。新的間隔序列一般在CRISPR陣列的5′末端(前導(dǎo)序列和已有的第一個重復(fù)序列/間隔序列之間)插入。在大腸桿菌的I-E型CRISPR-Cas系統(tǒng),第一個直接重復(fù)序列被復(fù)制出一個拷貝,新的間隔序列在第一個直接重復(fù)序列和第二個直接重復(fù)序列之間插入。
免疫力的執(zhí)行可分為兩個階段:CRISPR-RNA(crRNA)的生物合成階段和外源性DNA降解破壞階段(免疫階段)。
3.2.1 crRNA的生物合成 CRISPR序列首先轉(zhuǎn)錄出一條長的RNA鏈,這條鏈經(jīng)切割加工后形成多個短的crRNA,每個crRNA片段含有一個完整的或不完整的間隔序列。3種類型的CRISPR序列切割加工形成crRNA的機(jī)制不同。在I-E型和I-F型CRISPR系統(tǒng),Cas6e和Cas6f分別識別重復(fù)序列形成的發(fā)夾式結(jié)構(gòu),并在雙鏈和單鏈RNA的交界處進(jìn)行切割,形成的crRNA從5′端至3′端依次是8 nt的重復(fù)序列、完整的間隔序列和重復(fù)序列的發(fā)夾式結(jié)構(gòu)。II型CRISPR系統(tǒng)首先合成與重復(fù)序列互補(bǔ)的一個RNA片段,叫做tracrRNA(trans-activating RNA);tracrRNA與CRISPR轉(zhuǎn)錄物的重復(fù)序列以堿基互補(bǔ)結(jié)合形成雙鏈RNA,然后在RNase III的作用下形成前crRNA或不成熟crRNA,所形成的前crRNA從5′端至3′端依次是不完整的重復(fù)序列片段-完整的間隔序列-不完整的重復(fù)序列片段,前crRNA在3′端被進(jìn)一步切割,失去10 nt的間隔序列和不完整的重復(fù)序列片段,形成成熟的crRNA。在III型CRISPR系統(tǒng),重復(fù)序列不形成發(fā)夾式結(jié)構(gòu),而是包繞Cas6,Cas6在間隔序列和重復(fù)序列交界處上游8 nt的地方進(jìn)行切割形成前crRNA或不成熟crRNA,前crRNA從5′端至3′端依次是8 nt的重復(fù)序列-完整的間隔序列-比較長但不完整的重復(fù)序列,前crRNA在3′端被進(jìn)一步切割,形成成熟的crRNA[1-2]。
3.2.2 crRNA引導(dǎo)的Cas介導(dǎo)的外源性DNA降解破壞 在免疫階段(immunity stage),crRNA與Cas形成復(fù)合體、crRNA識別靶分子上的互補(bǔ)序列并與之結(jié)合、Cas介導(dǎo)外源性DNA的降解破壞。3種類型的CRISPR序列切割加工形成crRNA的機(jī)制不同。在I型CRISPR系統(tǒng),crRNA與5種Cas蛋白形成復(fù)合體,識別與crRNA互補(bǔ)的靶分子鏈上的PAM序列,crRNA序列與靶分子上的互補(bǔ)序列結(jié)合,引起crRNA-Cas復(fù)合體構(gòu)象改變,招募Cas3,導(dǎo)致DNA降解。II型CRISPR系統(tǒng)依賴多功能的Cas9發(fā)揮作用,其crRNA與單一的Cas9蛋白形成復(fù)合體,識別與crRNA同意義(same sense)的靶分子鏈上的PAM序列,然后由Cas9蛋白的核酸內(nèi)切酶活性切割降解靶分子DNA[1-2]。與I型CRISPR系統(tǒng)類似,III型CRISPR系統(tǒng)的crRNA亦與多種Cas蛋白(6種或7種)形成復(fù)合體,但與另外兩個型別的CRISPR系統(tǒng)不同,III型CRISPR系統(tǒng)的crRNA-Cas復(fù)合體可以靶向和降解RNA類的靶分子,如RNA噬菌體。
CRISPR-Cas基因組編輯技術(shù)用的是II型CRISPR系統(tǒng),這個系統(tǒng)使用單一但多功能的Cas9蛋白質(zhì),所以操作起來比使用蛋白復(fù)合體的I型CRISPR系統(tǒng)和III型CRISPR系統(tǒng)都簡單,而且高保真[13]。
CRISPR-Cas9基因組編輯技術(shù)通常利用質(zhì)粒轉(zhuǎn)染靶細(xì)胞,故該技術(shù)首先要構(gòu)建CRISPR-Cas9質(zhì)粒,CRISPR-Cas9質(zhì)粒必須含有crRNA、tracrRNA和Cas9基因,根據(jù)需要亦可含有DNA修復(fù)模板。一般用轉(zhuǎn)染方式將CRISPR-Cas9質(zhì)粒導(dǎo)入細(xì)胞,質(zhì)粒進(jìn)入細(xì)胞后表達(dá)產(chǎn)生crRNA-tracrRNA和Cas9蛋白。一個或多個crRNA片段與一個tracrRNA片段一起構(gòu)成的一條鏈叫做sgRNA或gRNA(single guide RNA or guide RNA),其中的tracrRNA一般呈發(fā)夾-環(huán)式結(jié)構(gòu)。gRNA和Cas9蛋白結(jié)合形成有活性的復(fù)合體,復(fù)合體中的crRNA可靶向引導(dǎo)該復(fù)合體到特異的宿主DNA序列(包括與crRNA互補(bǔ)的序列及其3′鄰近部位的PAM),有活性的Cas9蛋白切割目標(biāo)DNA,形成單鏈缺口(single strand nicking)或雙鏈斷裂(double strand break,DSB)。DSB激活細(xì)胞的DSB修復(fù)功能,從而實(shí)現(xiàn)對基因的編輯[14]。
細(xì)胞主要有兩種修復(fù)DSB的機(jī)制:同源定向修復(fù)(homology directed repair,HDR)和非同源末端連接(non-homologous end joining,NHEJ)修復(fù)。在有同源DNA序列,如DNA修復(fù)模板存在時,可用HDR、否則用NHEJ修復(fù)。對基因編輯而言,NHEJ導(dǎo)致靶基因功能的喪失/敲除;而(在有DNA修復(fù)模板存在的情況下)HDR機(jī)制可將所需基因片段插入基因組DNA[15]。
CRISPR-Cas9基因組編輯技術(shù)精確有效、成本低、易于操作,讓許多科學(xué)家實(shí)現(xiàn)了基因操作的夢想,無論是在生物醫(yī)學(xué)領(lǐng)域還是農(nóng)業(yè)領(lǐng)域,成千上萬個實(shí)驗(yàn)室開始使用并應(yīng)用這一技術(shù)。雖然人們對這種技術(shù)亦有一些擔(dān)憂,特別是對人類生殖細(xì)胞和胚胎的基因編輯存在著爭議,但CRISPR-Cas9基因組編輯技術(shù)已經(jīng)在生物技術(shù)領(lǐng)域引起了暴風(fēng)驟雨般改變的事實(shí)是無人否認(rèn)的,這一技術(shù)的進(jìn)一步發(fā)展應(yīng)用,必將會在生命科學(xué)領(lǐng)域帶來更加令人矚目的成就。
近年,在CRISPR-Cas9基因編輯技術(shù)的基礎(chǔ)上衍生出了幾項(xiàng)新的技術(shù),這些技術(shù)可以從轉(zhuǎn)錄水平沉默基因,可以編輯RNA或從轉(zhuǎn)錄后水平沉默mRNA,亦可以優(yōu)化對DNA基因的編輯。
在CRISPR-Cas9基因編輯技術(shù)的基礎(chǔ)上首先衍生出來的一項(xiàng)技術(shù),叫做CRISPR干擾(CRISPR interference,CRISPRi),該項(xiàng)技術(shù)屬于一種轉(zhuǎn)錄水平上的基因沉默技術(shù)[16]。CRISPRi技術(shù)用的仍然是CRISPR-Cas9系統(tǒng),其基本原理與CRISPR-Cas9基因編輯類似,但是利用了沒有酶活性的Cas9(dCas9)蛋白(通過在Cas9基因的D10A和H840A兩處引入點(diǎn)突變),所以當(dāng)gRNA將dCas9引導(dǎo)到目標(biāo)基因的特定序列時,其結(jié)果不是切割或破壞DNA序列,而是阻遏目標(biāo)基因的轉(zhuǎn)錄,即沉默目標(biāo)基因[16]。CRISPRi主要是通過阻遏轉(zhuǎn)錄啟動或阻遏轉(zhuǎn)錄延伸而沉默基因。阻遏轉(zhuǎn)錄啟動可通過設(shè)計(jì)與啟動子區(qū)域互補(bǔ)的gRNA而實(shí)現(xiàn);阻遏轉(zhuǎn)錄延伸可通過設(shè)計(jì)與外顯子區(qū)域互補(bǔ)的gRNA而實(shí)現(xiàn)(模板鏈和非模板鏈均可利用,但與非模板鏈互補(bǔ)的gRNA的阻遏效率更高)。CRISPRi的基因沉默效率在原核生物一般可以達(dá)到99%,在人類細(xì)胞可以達(dá)到90%[17]。有報道稱,若將Kruppel相關(guān)盒(KRAB)與dCas9進(jìn)行融合,則在人類細(xì)胞也能夠得到99%的基因沉默效率[18]。
2017年,麻省理工學(xué)院張鋒實(shí)驗(yàn)室利用2類VI型CRISPR-Cas系統(tǒng)的Cas13a(亦稱C2c2)具有核糖核酸酶活性、能夠切割RNA的特性,創(chuàng)立了CRISPR-Cas13技術(shù)[19]。該技術(shù)仍然利用gRNA,將Cas13a蛋白導(dǎo)向于目標(biāo),但利用的是后者的RNA酶活性切割RNA或者用沒有酶活性的Cas13a蛋白抑制或干擾mRNA的翻譯,所以可以用于編輯或抑制RNA;如果將gRNA設(shè)計(jì)為靶向mRNA的,即可從轉(zhuǎn)錄后水平沉默基因[20]。CRISPR-Cas13技術(shù)與RNAi技術(shù)都可從轉(zhuǎn)錄后水平沉默基因,二者沉默基因的效率基本接近,但CRISPR-Cas13技術(shù)比RNAi技術(shù)具有特異性高的優(yōu)點(diǎn)[21]。
由Doudna等于2012年創(chuàng)立的CRISPR-Cas9基因編輯技術(shù)可被稱為第一代CRISPR基因編輯技術(shù)。2015年,張鋒小組[22]利用Prevotella and Francisella菌的Cas蛋白Cpf1(CRISPR-associated endonuclease in Prevotella and Francisella 1),屬2類CRISPR系統(tǒng)的V型,創(chuàng)立了CRISPR-Cpf1基因編輯技術(shù),該技術(shù)被認(rèn)為是第二代的基于CRISPR的基因編輯技術(shù),近兩年在國際上得到了廣泛的應(yīng)用[23]。和CRISPR-Cas9基因編輯技術(shù)相比,CRISPR-Cpf1基因編輯技術(shù)具有以下優(yōu)點(diǎn)[24]:(1)Cpf1只需一個RNA分子(crRNA)協(xié)助所以操作更簡單,而Cas9需要2個RNA分子協(xié)助,crRNA和tracrRNA;(2)Cpf1的分子量比Cas9小,其基因更容易被導(dǎo)入細(xì)胞故編輯成功率高;(3)Cpf1系統(tǒng)的PAM序列距離crRNA識別位點(diǎn)遠(yuǎn),使編輯位置的選擇有更多的可選項(xiàng);(4)Cpf1切割產(chǎn)生黏性末端,便于新的DNA序列插入(Cas9切割產(chǎn)生平端)。
CRISPR相關(guān)基因編輯技術(shù)的創(chuàng)立,使人們能夠相對比較容易地修復(fù)基因錯誤或使某些基因失去功能即敲除這些基因,從而可以治療或預(yù)防疾病、改變或優(yōu)化生物性狀,在醫(yī)療、制藥、生命科學(xué)和農(nóng)林畜牧業(yè)等方面有著廣闊的應(yīng)用前景,但是基因編輯技術(shù)本身卻是一把“雙刃劍”,如果應(yīng)用不當(dāng),可能會給人類社會和生態(tài)環(huán)境造成破壞或帶來災(zāi)難。應(yīng)進(jìn)一步加深對CRISPR基因編輯技術(shù)的認(rèn)識,對CRISPR基因編輯技術(shù)的應(yīng)用應(yīng)謹(jǐn)慎而合法。