羅 旻, 顧 華
(1. 上海市控江中學(xué), 上海 200093; 2. 同濟(jì)大學(xué) 生命科學(xué)與技術(shù)學(xué)院, 上海 200092)
?
CRISPR-dCas9系統(tǒng)在基因表達(dá)調(diào)控中的最新研究進(jìn)展
羅 旻1, 顧 華2
(1. 上海市控江中學(xué), 上海 200093; 2. 同濟(jì)大學(xué) 生命科學(xué)與技術(shù)學(xué)院, 上海 200092)
CRISPR-Cas9系統(tǒng)自問世以來(lái)一直被廣泛地應(yīng)用于基因組編輯技術(shù)中,直到人們通過點(diǎn)突變的方式將Cas9的RuvC和HNH剪切結(jié)構(gòu)域失活得到dCas9后,這個(gè)系統(tǒng)又有了新的功能——調(diào)節(jié)基因的表達(dá)水平。研究者通過改變gRNA的結(jié)構(gòu),并與RNA結(jié)合蛋白配對(duì),從而招募轉(zhuǎn)錄因子以調(diào)節(jié)基因的轉(zhuǎn)錄水平,達(dá)到影響基因表達(dá)的目的。本文主要討論了CRISPR-dCas9系統(tǒng)的結(jié)構(gòu)特點(diǎn)、作用原理和目前對(duì)調(diào)節(jié)基因表達(dá)的最新研究進(jìn)展,以期為此領(lǐng)域的研究者提供參考。
CRISPR; dCas9; 引導(dǎo)RNA; 協(xié)同激活因子
E-mail:gu_hua@#edu.cn
微生物體持續(xù)不斷地受到外源DNA的侵染,使得它們不得不建立起一套防御系統(tǒng)來(lái)識(shí)別外源DNA和“自己”的DNA,并且將外源DNA“驅(qū)逐”出基因組,當(dāng)然這套系統(tǒng)也允許某些對(duì)遺傳物質(zhì)守恒有利的外源DNA整合到自己的基因組里,增強(qiáng)自身對(duì)外界環(huán)境的適應(yīng)性。之前的研究中,CRISPR(clustered regularly interspaced short palindromic repeats)-Cas(CRISPR-associated)系統(tǒng)已經(jīng)被證實(shí)能夠幫助微生物抵抗病毒與質(zhì)粒的干擾。
CRISPR序列是一個(gè)高度多變的DNA序列,常包含一個(gè)550bp的leader 序列和一系列重復(fù)-間隙單位(repeat-spacer units)。重復(fù)序列長(zhǎng)度在24-48bp,他們通常會(huì)形成二重對(duì)稱,因此會(huì)形成如發(fā)夾結(jié)構(gòu)的二級(jí)結(jié)構(gòu),但不是回文結(jié)構(gòu),重復(fù)次數(shù)最高可達(dá)250 次。重復(fù)序列之間被26~72 bp 間隔序列(spacer)隔開, 間隔序列長(zhǎng)度與細(xì)菌種類和CRISPR 位點(diǎn)有關(guān),間隔序列能夠通過堿基互補(bǔ)配對(duì)的方式使外源DNA被降解。在CRISPR 位點(diǎn)附近, 存在一系列CRISPR相關(guān)基因(CRISPR-associated, Cas),在CRISPR 位點(diǎn)的第一個(gè)重復(fù)序列的上游定位有CRISPR 前導(dǎo)序列(leader sequence)作為啟動(dòng)子啟動(dòng)下游序列表達(dá)(見圖1)。當(dāng)CRISPR序列轉(zhuǎn)錄時(shí),Cas 蛋白加工CRISPR RNA成一個(gè)沉默RNA,這個(gè)沉默RNA就會(huì)對(duì)外來(lái)同源的DNA起到作用。Cas基因能夠編碼一個(gè)大的且多樣化的蛋白家族,這些蛋白攜帶核酸酶、解旋酶、聚合酶和多核酸結(jié)合蛋白的功能[1]。如今,隨著研究的深入進(jìn)行,CRISPR系統(tǒng)已經(jīng)成為了目前不可或缺的、精確性高的基因編輯工具。
圖1 CRISPR基本結(jié)構(gòu)示意圖(“n”表示不同來(lái)源的間隔序列)[2]
CRISPR-Cas9系統(tǒng)主要有三類,其中CRISPR II類系統(tǒng)是目前最為廣泛使用的RNA指導(dǎo)核酸內(nèi)切酶技術(shù),此系統(tǒng)有兩個(gè)主要的成分:引導(dǎo)RNA(guide RNA,gRNA)和核酸內(nèi)切酶(Cas9)。其中,gRNA是由細(xì)菌的內(nèi)源性crRNA和tracrRNA嵌合而成的人工合成RNA。在CRISPR基因序列中,重復(fù)-間隙單元能夠轉(zhuǎn)錄出crRNA的前體,在Cas9核酸內(nèi)切酶或內(nèi)源性RNA酶III的作用下形成crRNA。crRNA能夠與CRISPR基因座上編碼的tracrRNA結(jié)合形成RNA二聚體,引導(dǎo)Cas9識(shí)別并降解特異性的外源DNA序列[3]。因此gRNA既有crRNA的靶向特異性又有tracrRNA的輔助功能。當(dāng)細(xì)胞內(nèi)同時(shí)表達(dá)Cas9和gRNA時(shí),兩者形成的復(fù)合物能夠?qū)蚪MDNA進(jìn)行修飾編輯或造成永久性改變。
為了實(shí)現(xiàn)Cas9對(duì)靶向序列的切割,不僅需要gRNA與靶向序列的堿基互補(bǔ)配對(duì),還要求靶向序列的下游存在原型間隔序列毗鄰區(qū)(Protospacer Adjacent Motif,PAM),兩個(gè)條件缺一不可。PAM序列與Cas9一樣,在不同的細(xì)菌物種中存在序列的多樣性。目前,最常見的CRISPR II類系統(tǒng)是在化膿性鏈球菌中發(fā)現(xiàn),其中PAM序列為NGG[3]。有趣的是,只有來(lái)自于同一物種的Cas9、gRNA和PAM才能相互發(fā)揮作用。在gRNA的引導(dǎo)下,Cas9識(shí)別并在靶向基因的PAM上游剪切3-4個(gè)堿基,產(chǎn)生雙鏈缺口(Double Strand Break,DSB)[4],從而實(shí)現(xiàn)對(duì)基因組DNA編輯。
CRISPR-Cas9是基因組調(diào)控技術(shù)中靈活性最強(qiáng)的系統(tǒng)之一。Cas9的核酸酶剪切活性取決于兩個(gè)結(jié)構(gòu)域:RuvC和HNH。這兩個(gè)結(jié)構(gòu)域分別負(fù)責(zé)切割DNA鏈的兩條鏈,并且這兩個(gè)結(jié)構(gòu)域能夠單獨(dú)地被人工點(diǎn)突變失活?;撔枣溓蚓写嬖谝环NCas9 D10A突變體,這種鏈球菌的Cas9的RuvC失活(RuvC-),HNH仍有活性(HNH+);另一種Cas9 H840A的突變體的Cas9蛋白則呈現(xiàn)RuvC激活(RuvC+)和HNH失活(HNH-)的狀態(tài),但這兩種突變體的Cas9仍然具有核酸酶活性,可對(duì)靶向序列進(jìn)行剪切作用。當(dāng)RuvC和HNH同時(shí)處于失活狀態(tài)時(shí)(D10A&H840A;RuvC-&HNH-),Cas9將不具有核酸酶活性,成為dCas9(dead Cas9)[5]。dCas9雖然沒有剪切DNA的能力,但仍然可以在gRNA的引導(dǎo)下與特定的DNA序列結(jié)合。由此,研究者們?cè)噲D利用dCas9能與DNA序列結(jié)合的能力將dCas9轉(zhuǎn)化為能激活基因表達(dá)的轉(zhuǎn)錄因子。
研究發(fā)現(xiàn),dCas9只有通過與其他蛋白融合后,才能夠發(fā)揮轉(zhuǎn)錄因子的作用,促進(jìn)或抑制基因的表達(dá),并且不失去與gRNA結(jié)合的能力(見圖2)。例如:當(dāng)轉(zhuǎn)錄激活子VP64與dCas9融合后,能夠促進(jìn)靶向基因的表達(dá)[6]。但后續(xù)實(shí)驗(yàn)證實(shí),若直接將dCas9與VP64融合,只能較小程度地提高轉(zhuǎn)錄水平。人們?cè)囍鴮P64與dCas9的氨基端和羧基端融合[3]或?qū)Cas9與10拷貝數(shù)的VP64融合[14],均能提高CRISPR-dCas9對(duì)基因表達(dá)的促進(jìn)作用。Chavez[16]等人構(gòu)建出一種稱為VP64-p65-Rta 三次方激活子的蛋白與dCas9融合,改造后的VP64蛋白與dCas9融合能夠顯著地促進(jìn)內(nèi)源基因的轉(zhuǎn)錄水平。
當(dāng)轉(zhuǎn)錄抑制子KRAB的Kox1結(jié)構(gòu)域與dCas9融合后,能夠改善CRISPR系統(tǒng)的剪切作用[7]。若沒有蛋白與dCas9融合,dCas9則會(huì)干擾靶向序列的轉(zhuǎn)錄過程[4]。因此,若gRNA識(shí)別的基因位點(diǎn)在靶向基因的啟動(dòng)子附近,研究者將可以通過人工合成的方式改變dCas9的結(jié)構(gòu),以實(shí)現(xiàn)對(duì)靶向基因表達(dá)的調(diào)控[3]。
除了對(duì)蛋白編碼區(qū)域的調(diào)節(jié),CRISPR-dCas9系統(tǒng)同樣能夠作用于非編碼RNA(lncRNAs)。例如,在人白血病細(xì)胞K562中,5種lncRNAs(H19,MALAT1,NEAT1,TERC,XIST)都能夠在CRISPR-dCas9系統(tǒng)的介導(dǎo)下,顯著下調(diào)80%以上[16]。
圖2 CRISPR-dCas9系統(tǒng)招募不同的轉(zhuǎn)錄因子促進(jìn)或抑制基因的表達(dá)水平[11]
Perez-Pinera等人設(shè)計(jì)了4種特異性的gRNA,能夠與8個(gè)藥物治療有關(guān)的基因(ASCL1, NANOG, HBG1/2, MYOD1, VEGFA, TERT, IL1B, IL1R2)的啟動(dòng)子結(jié)合。與表達(dá)dCas9-VP64和這4種gRNA的質(zhì)粒共轉(zhuǎn)染到HEK293T細(xì)胞后,以上8種靶向基因的表達(dá)水平均上升,并且這4種gRNA在細(xì)胞中發(fā)揮協(xié)同效應(yīng)。相比于蛋白質(zhì),這種通過RNA來(lái)識(shí)別目的基因序列的方式,能夠避免表觀遺傳對(duì)DNA序列修飾后帶來(lái)的局限性,例如甲基化的DNA序列仍然能夠被RNA識(shí)別。但是相比于TALEN技術(shù),與相同的啟動(dòng)子結(jié)合作用后,dCas9-VP64對(duì)于IL1 RN等幾個(gè)基因的激活水平較低[8]。因此,dCas9與轉(zhuǎn)錄因子形成的復(fù)合物對(duì)靶向基因表達(dá)的調(diào)節(jié)能力并不突出。
為了提高CRISPR-dCas9系統(tǒng)調(diào)節(jié)基因表達(dá)水平的能力,Konermann等人將單鏈引導(dǎo)RNA(single-guide RNA,sgRNA)的結(jié)構(gòu)改變,使其成為多種轉(zhuǎn)錄因子的組裝場(chǎng)所,這種方法通過引入轉(zhuǎn)錄激活子以提高CRISPR-dCas9系統(tǒng)對(duì)基因表達(dá)的促進(jìn)作用。他們找到了sgRNA的兩個(gè)可結(jié)合RNA結(jié)合蛋白的區(qū)域。sgRNA在添加了兩個(gè)適配體后,能夠通過適配體招募RNA結(jié)合蛋白(如VP60),RNA結(jié)合蛋白又能與轉(zhuǎn)錄因子的轉(zhuǎn)錄活化結(jié)構(gòu)域結(jié)合,從而提高基因表達(dá)的水平。他們將這個(gè)系統(tǒng)命名為協(xié)同激活因子(synergistic activation mediator,SAM),通過實(shí)驗(yàn)證明,相比于dCas9與轉(zhuǎn)錄激活子直接融合的方法,這個(gè)系統(tǒng)能夠?qū)⒅半y以激活的12個(gè)基因的轉(zhuǎn)錄水平提高約100倍[9]。
為了證明這個(gè)系統(tǒng)的廣泛性,他們創(chuàng)建了人工sgRNA數(shù)據(jù)庫(kù),這些sgRNA經(jīng)過人為改造后能夠使超過23000個(gè)人類基因獨(dú)立地表達(dá)。通過這個(gè)系統(tǒng),找到了黑色素瘤對(duì)PLX-4720的耐藥性的問題所在。之前的研究認(rèn)為,PLX-4720之所以對(duì)黑色素瘤的治療失效,是由于黑色素瘤細(xì)胞的某些基因表達(dá)所致。通過人為設(shè)計(jì)特異性的sgRNA,研究者能夠單獨(dú)的控制基因的表達(dá),由此也能找到致使黑色素瘤細(xì)胞耐藥的關(guān)鍵基因所在。可以預(yù)期,SAM將成為疾病治療的研究方法之一,引導(dǎo)人們將問題轉(zhuǎn)移到基因的表達(dá)上[9]。這種SAM系統(tǒng)也是根據(jù)天然的基因調(diào)節(jié)機(jī)制改良而來(lái)。增強(qiáng)子(enhancer),本質(zhì)上是一段基因序列,通過與多種轉(zhuǎn)錄因子的結(jié)合能夠啟動(dòng)基因的表達(dá)。另外,增強(qiáng)子和其他轉(zhuǎn)錄元件能夠產(chǎn)生一段長(zhǎng)鏈非編碼RNA(long non-coding RNA,lncRNA),這種lncRNA能夠招募各種細(xì)胞調(diào)節(jié)因子,進(jìn)而作用于組蛋白與DNA組成的染色質(zhì),調(diào)節(jié)基因的表達(dá)水平(見圖3)[10]。
后續(xù)的研究表明,通過改變dCas9或CRISPR RNA的結(jié)構(gòu)能夠提高CRISPR靶向基因的轉(zhuǎn)錄效率。在同一細(xì)胞里可以同時(shí)使用多種改良的CRISPR RNA對(duì)基因的轉(zhuǎn)錄進(jìn)行調(diào)節(jié),從而控制細(xì)胞的代謝水平[11]。綜上所述,當(dāng)CRISPR-dCas9系統(tǒng)中的sgRNA結(jié)構(gòu)與lncRNA相似時(shí),能使特定的多種效應(yīng)分子蛋白組裝成一個(gè)大分子蛋白,并作用于基因組。
圖3 lncRNA招募各種細(xì)胞調(diào)節(jié)因子調(diào)節(jié)基因的表達(dá)[11]
盡管CRISPR-Cas9系統(tǒng)已經(jīng)被廣泛地應(yīng)用于基因組編輯技術(shù)中,但這項(xiàng)技術(shù)也存在著一定的缺陷:脫靶效應(yīng)。在人類細(xì)胞中,當(dāng)存在著5個(gè)堿基錯(cuò)配的情況下,Cas9仍能實(shí)行切割功能[17]。在這個(gè)系統(tǒng)中,sgRNA是決定特異性的重要因素。Hsu[18]等人認(rèn)為,在設(shè)計(jì)sgRNA時(shí),在位點(diǎn)決定性的8-12bp內(nèi),至少有兩個(gè)堿基發(fā)生錯(cuò)配。
近年來(lái),RNAi技術(shù)被廣泛使用于基因敲除技術(shù),但RNAi只能作用于mRNA,編碼mRNA的DNA只占總DNA的小部分,因此RNAi的適用范圍不大。另外,從細(xì)菌中發(fā)現(xiàn)的天然DNA結(jié)合域(DNA-binding domain,DBDs)也常被用于招募轉(zhuǎn)錄因子。人工合成的DBDs(如ZFs和TALENs)能夠精確地控制靶向基因的轉(zhuǎn)錄水平,但此技術(shù)耗時(shí)較長(zhǎng),脫靶現(xiàn)象以及載體的未知毒性嚴(yán)重阻礙了這種技術(shù)的發(fā)展[12]。因此,龐大的sgRNA數(shù)據(jù)庫(kù)及其可靠的、天然的調(diào)控機(jī)制使得CRISPR-dCas9技術(shù)更具有競(jìng)爭(zhēng)力,CRISPR-Cas9系統(tǒng)不論在功能缺失還是功能獲得篩選中,都表現(xiàn)出更高水平的有效性和可靠性。與RNAi和DBDs技術(shù)相比,CRISPR-dCas9系統(tǒng)可以靶向編碼序列和調(diào)控元件,包括啟動(dòng)子、增強(qiáng)子和轉(zhuǎn)錄microRNAs和長(zhǎng)非編碼RNAs的元件。這一強(qiáng)大的遺傳工具的應(yīng)用,無(wú)疑將大大加速生命領(lǐng)域的各項(xiàng)機(jī)理發(fā)現(xiàn)。南京大學(xué)的杜憶南等人在人源的tet-on MAVS轉(zhuǎn)基因293T細(xì)胞系中,利用dCas9/sgRNA靶向結(jié)合NF-κB、IRF3/7和cJun/ATF2轉(zhuǎn)錄因子在IFNB1啟動(dòng)子區(qū)的順式作用元件,競(jìng)爭(zhēng)性的阻止了轉(zhuǎn)錄因子對(duì)其的結(jié)合,達(dá)到阻斷信號(hào)通路的目的,首次證明了CRISPR-dCas9技術(shù)可用于內(nèi)源順式作用元件的功能注釋[19]。
另外,CRISPR-dCas9系統(tǒng)的應(yīng)用對(duì)于人類疾病的研究也有至關(guān)重要的作用。研究證實(shí),93%的與性狀變異相關(guān)的疾病都存在蛋白編碼區(qū)域以外的基因表達(dá)異常[20]。因此,利用CRISPR-dCas9系統(tǒng)對(duì)基因的異常表達(dá)和非編碼RNA進(jìn)行改造有利于后續(xù)的疾病研究工作。
[1] Philippe H, Rodolphe B. CRISPR/Cas, the Immune System of Bacteria and Archaea[J]. Science, 2010, 327(5962): 167-170.
[2] 吳彩云, 羅秉輪, 孫玉強(qiáng). 基因組編輯新技術(shù):CRISPR/Cas系統(tǒng)在生物基因組學(xué)中的研究進(jìn)展[J]. 植物生理學(xué)報(bào), 2015, 51 (12): 2063-2069.
[3] Sander J D, Joung J K. CRISPR-Cas systems for editing, regulating and targeting genomes[J]. Nature Biotechnology, 2014, 32(4): 347-355.
[4] Hsu P D, Lander E S, Zhang F.etal. Development and Applications of CRISPR-Cas9 for Genome Engineering[J]. Cell, 2014, 157: 1262-1278.
[5] Cheng A W, Wang H, Yang H.etal. Multiplexed activation of endogenous genes by CRISPR-on, an RNA-guided transcriptional activator system[J]. Cell research, 2013, 23(10): 1163-1171.
[6] Maeder M L, Linder S J, Cascio V M.etal. CRISPR RNA-guided activation of endogenous human genes[J]. Nature Methods, 2013, 10(10): 977-979.
[7] Gilbert L A, Larson M H, Morsut L.etal. CRISPR-Mediated Modular RNA-Guided Regulation of Transcription in Eukaryotes[J]. Cell, 2013, 154(2): 442-451.
[8] Pablo P P, Christopher M V.etal. RNA-guided gene activation by CRISPR-Cas9-based transcription factors[J]. Nature Methods, 2013, 10(10): 973-976.
[9] Konermann S, Brigham M D, Trevino A E.etal. Genome-scale transcriptional activation by an engineered CRISPR-Cas9 complex[J]. Nature, 2015, 517(7536): 583-588.
[10] Tsai M C, Manor O, Wan Y,etal. Long Noncoding RNA as Modular Scaffold of Histone Modification Complexes[J]. Science, 2010, 329(5992): 689-693.
[11] Zalatan J G, Lee M E, Almeida R,etal. Engineering Complex Synthetic Transcriptional Programs with CRISPR RNA Scaffolds[J]. Cell, 2015, 160(1-2): 339-350.
[12] Morbitzer R, Romer P, Boch J,etal. Regulation of selected genome loci using de novo engineered transcription activator-like effector (TALE)-type transcription factors[J]. Proc Natl Acad Sci U S A., 2010, 107(50): 21617-21622.
[13] Khalil A S, Lu T K, Bashor C J,etal. A synthetic biology framework for programming eukaryotic transcription functions[J]. Cell, 2012, 150(3): 647-658.
[14] Chakraborty S, Ji H, Kabadi A M,etal. A CRISPR/Cas9-based system for reprogramming cell lineage speci fication[J]. Stem Cell Reports, 2014, 3(6): 940- 947.
[15] Chavez A, Scheiman J, Vora S,etal. Highly efficient Cas9-mediated transcriptional programming[J]. Nat Methods, 2015, 12(4): 326-328.
[16] Gilbert L A, Larson M H, Morsut L,etal. CRISPR-mediated modular RNA-guided regulation of transcription in eukaryotes[J]. Cell, 2013, 154(2): 442-451.
[17] Fu Y F, Foden J A, Khayter C,etal. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells[J]. Nat Biotechnol, 2013, 31(9): 822-826.
[18] Hsu P D, Scott D A, Weinstein J A,etal. DNA targeting specificity of RNA-guided Cas9 nucleases[J]. Nat Biotechnol, 2013, 31(9): 827-832.
[19] 杜憶南. 利用CRISPR/Cas9系統(tǒng)建立基因修飾豬以及在人細(xì)胞中對(duì)順式作用元件做注釋[D]. 南京: 南京大學(xué), 2015: 1-133.
[20] Maurano M T, Humbert R, Rynes E,etal. Systematic localization of common disease-associated variation in regulatory DNA[J]. Science, 2012, 337(6099): 1190-1195.
·名人名言·
大學(xué)的榮譽(yù),不在它的校舍與人數(shù);而在于它一代一代人的質(zhì)量。
——柯南特
The State of the Art of CRISPR-dCas9 System on Regulating Level of Gene Expression
LUOMin1,GUHua2
(1. Shanghai Kongjiang High School, Shanghai 200093, China;2. School of Life Science and Technology, Tongji University, Shanghai 200092, China)
CRISPR-Cas9 system has been widely considered as a promising genome editing technology in molecular biology research. The engineered dCas9 protein by inactivating RuvC and HNH nuclease domains of Cas9 protein plays a role in gene expression regulation. Researchers manipulated the structures of gRNA that can attract RNA binding proteins which fuse to different transcription factors for the purpose of activating or inhibiting gene transcription. This paper reviewed the structure, function, mechanism and current progress of CRISPR-dCas9 system in gene expression regulation.
CRISPR; dCas9; gRNA; SAM
2015-12-05
國(guó)家自然科學(xué)青年基金(81402399)項(xiàng)目資助
羅 旻(1998-),女,湖北宜昌人,高中學(xué)生,研究興趣:生物信息技術(shù)。E-mail:luomin_kj@sina.com
顧 華(1974-),女,江蘇吳縣人,博士,講師,研究方向:抗腫瘤和自身免疫疾病的生物醫(yī)藥開發(fā)。
Q-7
A
1006-7167(2016)03-0020-04