張晨 雷展 李凱 商穎 許文濤
(1. 昆明理工大學(xué)農(nóng)業(yè)與食品學(xué)院,昆明 650504;2. 中國農(nóng)業(yè)大學(xué)食品科學(xué)與營(yíng)養(yǎng)工程學(xué)院 北京食品營(yíng)養(yǎng)與人類健康高精尖創(chuàng)新中心,北京 100083;3. 農(nóng)業(yè)部農(nóng)業(yè)轉(zhuǎn)基因生物安全評(píng)價(jià)(食用)重點(diǎn)實(shí)驗(yàn)室,北京 100083)
CRISPR/Cas9系統(tǒng)是細(xì)菌和古生菌免疫病毒或噬菌體侵害的一種獲得性免疫機(jī)制,其中sgRNA可特異性識(shí)別外源遺傳物質(zhì),Cas9蛋白可靶向切割雙鏈DNA。因?yàn)榻M成簡(jiǎn)單、特異性好、切割效率高,CRISPR/Cas9系統(tǒng)經(jīng)改造后成為新一代基因編輯工具并迅速被廣泛應(yīng)用。在實(shí)際應(yīng)用過程中,CRISPR/Cas9系統(tǒng)優(yōu)勢(shì)凸顯,其快速、準(zhǔn)確的基因編輯能力,使通過基因定點(diǎn)突變治療人類遺傳疾病成為可能。然而在基因編輯過程中存在的脫靶效應(yīng),嚴(yán)重阻礙了CRISPR/Cas9系統(tǒng)的發(fā)展。因此,為明確CRISPR/Cas9系統(tǒng)產(chǎn)生的脫靶效應(yīng)及提高基因編輯效率,本文綜述了CRISPR/Cas9系統(tǒng)的脫靶類型、影響因素、降低策略以及脫靶檢測(cè)技術(shù)的最新研究進(jìn)展。
1987年,在研究大腸桿菌堿性磷酸酶(iap)基因功能時(shí),首次發(fā)現(xiàn)了串聯(lián)間隔重復(fù)序列[1]。2002年,這種結(jié)構(gòu)被命名為聚類規(guī)則間隔的短回文重復(fù)序列,臨近的一組基因被命名為Cas[2]。2007年,證實(shí)CRISPR及Cas編碼的蛋白與細(xì)菌的獲得性免疫機(jī)制有關(guān)[3]。2013年,首次利用CRISPR/Cas9系統(tǒng)實(shí)現(xiàn)對(duì)人和小鼠內(nèi)源基因的高效編輯[4-5]。
在自然界中,約90%古生菌和40%細(xì)菌通過基因組或質(zhì)粒上存在的CRISPR/Cas系統(tǒng)對(duì)外來病毒或噬菌體的侵害進(jìn)行免疫。當(dāng)病毒或噬菌體首次將遺傳物質(zhì)注入細(xì)菌內(nèi)部時(shí),Cas蛋白會(huì)將外源遺傳物質(zhì)上的一小段序列整合到CRISPR序列的5'端,形成對(duì)外源遺傳物質(zhì)的“免疫記憶”。當(dāng)細(xì)菌再次遭遇侵害時(shí),含有外源遺傳物質(zhì)信息的CRISPR序列轉(zhuǎn)錄形成sgRNA。sgRNA與Cas蛋白結(jié)合,從而特異性切割外源DNA。外源DNA被切斷后沉默,細(xì)菌對(duì)外來病毒或噬菌體“免疫成功”[6]。
CRISPR/Cas系統(tǒng)存在多種類型,依據(jù)其編碼的效應(yīng)蛋白可以將其分為兩大類(圖1)。第1大類CRISPR/Cas系統(tǒng)的效應(yīng)蛋白是由含有4-7個(gè)Cas蛋白組成的多亞基效應(yīng)復(fù)合物組成。第2大類CRISPR/Cas系統(tǒng)中僅包含單一的多結(jié)構(gòu)域效應(yīng)蛋白。兩大類系統(tǒng)又被細(xì)分為6種類型,其中第1大類包含類型I,III和IV,第2大類包含類型II,V和VI。根據(jù)特征蛋白的不同,可區(qū)分類型I、II、III。其中Cas3蛋白代表類型I,Cas9蛋白代表類型II,Cas10蛋白代表類型III。類型IV缺乏由Cas1和Cas2蛋白組成的適應(yīng)模塊;類型V具有預(yù)測(cè)效應(yīng)蛋白Cas12a;類型VI是唯一具有毒素特性的靶向RNA的CRISPR/Cas系統(tǒng)[7]。因?yàn)樾?yīng)復(fù)合物結(jié)構(gòu)簡(jiǎn)單,第2大類CRISPR/Cas系統(tǒng)被改造成為基因編輯工具。其中類型II的CRISPR/Cas9系統(tǒng)是最常見且廣泛應(yīng)用于各個(gè)領(lǐng)域的基因編輯工具[8]。
圖1 CRISPR/Cas系統(tǒng)分類圖[8]
CRISPR/Cas9系統(tǒng)由Cas9蛋白和sgRNA兩部分組成。Cas9含有HNH和RuvC核酸酶結(jié)構(gòu)域,其中HNH結(jié)構(gòu)域切割互補(bǔ)DNA鏈,RuvC結(jié)構(gòu)域負(fù)責(zé)切割非互補(bǔ)鏈。sgRNA由CRISPR RNA(crRNA)和反式激活RNA(tracrRNA)組成,可識(shí)別約20 nt的靶序列。在基因編輯時(shí),Cas9首先與sgRNA形成復(fù)合體;然后由Cas9識(shí)別特定的前間隔序列鄰近基 序(Protospacer adjacent motif,PAM);sgRNA與靶序列特異性結(jié)合,Cas9切割雙鏈DNA,產(chǎn)生雙鏈DNA斷裂(Double-strand DNA breaks,DSB)。最后,通過細(xì)胞內(nèi)部的非同源末端連接(Non-homologous end joining,NHEJ)或同源重組機(jī)制(Homologous recombination,HR)對(duì)斷裂的DNA引入插入缺失、修復(fù)或替換(圖 2)[9]。
圖2 CRISPR/Cas9作用機(jī)制及DNA自我修復(fù)過程圖[10]
第一代基因編輯技術(shù)因?yàn)樯婕暗紿R,效率低下且耗時(shí)費(fèi)力。第二代基因編輯技術(shù)ZFN和TALEN的出現(xiàn),基因編輯效率大幅提高。ZFN和TALEN均是合成蛋白,對(duì)靶序列切割后可產(chǎn)生黏性突出端DSB。ZFN和TALEN大大加快了基因編輯技術(shù)的發(fā)展,但在應(yīng)用過程中,其復(fù)雜的蛋白設(shè)計(jì)、昂貴的成本和較高的難度,仍使基因編輯技術(shù)的廣泛應(yīng)用受限[11]。
在此背景下,第三代基因編輯技術(shù)CRISPR/Cas9系統(tǒng)應(yīng)運(yùn)而生。同ZFN和TALEN相比,CRISPR/Cas9系統(tǒng)不需要設(shè)計(jì)復(fù)雜的DNA結(jié)合蛋白以及DNA結(jié)合蛋白與Fok I核酸酶的融合過程。通過軟件就可快速設(shè)計(jì)sgRNA,并對(duì)其進(jìn)行初步篩選。同時(shí),通過改變sgRNA中的一小段序列,CRISPR/Cas9系統(tǒng)可快速實(shí)現(xiàn)對(duì)其他基因位點(diǎn)的編輯。由于過程簡(jiǎn)單,成本低廉,規(guī)?;?,高通量,編輯效率高,實(shí)驗(yàn)要求低等特點(diǎn),CRISPR/Cas9系統(tǒng)迅速被應(yīng)用到廣泛的研究領(lǐng)域當(dāng)中[11]。例如醫(yī)學(xué)領(lǐng)域,CRISPR/Cas9系統(tǒng)已經(jīng)建立了多種細(xì)胞系及動(dòng)物模型[12];動(dòng)物科學(xué)領(lǐng)域,利用CRISPR/Cas9系統(tǒng)生產(chǎn)更廣泛的基因修改動(dòng)物[13];植物科學(xué)領(lǐng)域,CRISPR/Cas9系統(tǒng)促進(jìn)作物育種,加速作物改良,增強(qiáng)全球糧食安全等[14]。
CRISPR/Cas9系統(tǒng)中的脫靶突變主要是由于在復(fù)雜的基因組中sgRNA存在數(shù)量龐大的脫靶位點(diǎn)所造成的。此外,Cas9識(shí)別低頻率的“NAG”模式的PAM序列也會(huì)導(dǎo)致脫靶,但PAM序列對(duì)錯(cuò)配容忍度較低[15]?,F(xiàn)階段,根據(jù)連續(xù)堿基不同錯(cuò)配、間隔堿基不同錯(cuò)配以及PAM近端遠(yuǎn)端不同錯(cuò)配可以將CRISPR/Cas9系統(tǒng)的脫靶類型簡(jiǎn)單分成3類。
對(duì)于連續(xù)堿基不同錯(cuò)配,F(xiàn)u等[16]基于定量人類細(xì)胞的增強(qiáng)型綠色熒光蛋白(Enhanced green fluorescent protein,EGFP) 破 壞 試 驗(yàn), 評(píng) 估 了CRISPR/Cas9系統(tǒng)中sgRNA與DNA界面內(nèi)連續(xù)不同錯(cuò)配對(duì)Cas9活性的影響。結(jié)果表明,對(duì)于單堿基錯(cuò)配,sgRNA的5'末端錯(cuò)配率大于3'末端。但是在sgRNA的3'末端,也會(huì)存在一些位置對(duì)錯(cuò)配具有良好的耐受性,并且不同靶序列對(duì)sgRNA錯(cuò)配敏感的特定位置是不同的。雙重錯(cuò)配實(shí)驗(yàn)顯示出類似于單堿基錯(cuò)配的實(shí)驗(yàn)結(jié)果,而引入3個(gè)或更多個(gè)錯(cuò)配則會(huì)導(dǎo)致Cas9核酸酶活性顯著喪失。
對(duì)于間隔堿基不同錯(cuò)配,同樣基于定量人類細(xì)胞的EGFP破壞試驗(yàn),F(xiàn)u等[16]對(duì)不同位置間隔的雙重錯(cuò)配進(jìn)行了表征。不同位置間隔的雙重錯(cuò)配實(shí)驗(yàn)顯示出類似于單堿基錯(cuò)配的實(shí)驗(yàn)結(jié)果,即sgRNA的5'末端錯(cuò)配率大于3'末端。
對(duì)于PAM近端遠(yuǎn)端不同錯(cuò)配,之前的研究表明,靶序列上與PAM序列緊鄰的8-12個(gè)堿基決定CRISPR/Cas9系統(tǒng)的切割準(zhǔn)確性。這一區(qū)域也被形象的稱之為種子區(qū)域。單堿基錯(cuò)配敏感的特定位置集中在靠近PAM序列的5-6堿基,且不同靶標(biāo)對(duì)錯(cuò)配敏感的位置不同。雙重或多個(gè)核苷酸錯(cuò)配,在靠近PAM序列的5-6堿基區(qū)域同樣表現(xiàn)出了對(duì)錯(cuò)配更高的敏感性,且連續(xù)錯(cuò)配比間隔錯(cuò)配更敏感。這表明靶序列中更靠近PAM序列的5-6個(gè)堿基才是決定特異性結(jié)合的關(guān)鍵因素。此外,對(duì)于單一或雙重錯(cuò)配,即使在靠近PAM序列的5-6堿基區(qū)域,有時(shí)也會(huì)表現(xiàn)出對(duì)錯(cuò)配的良好耐受性[17]。
總之,靶序列對(duì)sgRNA的3'末端錯(cuò)配更敏感,且其特異性是復(fù)雜的和靶標(biāo)依賴性的,同時(shí)在sgRNA的3'端發(fā)生單一或雙重錯(cuò)配時(shí),通常是良好耐受的。此外,并非所有5'端的sgRNA/DNA界面錯(cuò)配都具有良好的耐受性。最近,針對(duì)CRISPR/Cas9系統(tǒng)的脫靶,Lin等[18]提出了一種新型脫靶類型“DNA凸起”和“RNA凸起”,如圖3。當(dāng)脫靶位點(diǎn)較靶序列存在一個(gè)或多個(gè)額外的堿基(插入),sgRNA與該脫靶位點(diǎn)結(jié)合時(shí),脫靶位點(diǎn)上多余的堿基就會(huì)形成“DNA凸起”。當(dāng)脫靶位點(diǎn)較靶序列缺少一個(gè)或多個(gè)堿基(缺失),sgRNA與該脫靶位點(diǎn)結(jié)合時(shí),sgRNA上多余的堿基就會(huì)形成“RNA凸起”。通過去除或添加sgRNA上所有可能位置上的單堿基,Lin等[18]模擬了潛在脫靶的單堿基插入或缺失的位點(diǎn)。結(jié)果顯示,Cas9在3個(gè)區(qū)域的靶位點(diǎn)耐受DNA凸起:距離PAM的第7個(gè)堿基,sgRNA的5'末端和3'末端;鄰近PAM序列的sgRNA凸起禁止切割。2-5 bp的DNA凸起實(shí)驗(yàn)結(jié)果與單堿基DNA凸起的結(jié)果類似;大于2 bp的sgRNA凸起比同等大小的DNA凸起耐受性更好,長(zhǎng)于5 bp的sgRNA凸起未發(fā)現(xiàn)切割活性。
雖然CRISPR/Cas9系統(tǒng)已經(jīng)在多個(gè)研究領(lǐng)域中取得了優(yōu)異成果,但是在實(shí)際應(yīng)用過程中依然存在潛在的脫靶風(fēng)險(xiǎn)。Fu等[16]基于人類細(xì)胞實(shí)驗(yàn)表征了CRISPR/Cas9系統(tǒng)的脫靶效應(yīng),結(jié)果顯示CRISPR/Cas9系統(tǒng)的脫靶率高達(dá)66%。為降低CRISPR/Cas9系統(tǒng)的脫靶效應(yīng)實(shí)現(xiàn)其更廣泛的應(yīng)用,研究人員探究了影響脫靶效應(yīng)的相關(guān)因素。
PAM序列是區(qū)分靶序列與其他DNA序列、位于靶序列3'端、高度保守的一小段序列,其長(zhǎng)度一般為2-5 nt。PAM序列存在多種模式,如“NAG”、“NGA”等。不同模式PAM序列的CRISPR/Cas9系統(tǒng)切割效率不同。在CRISPR/Cas9系統(tǒng)中,源自化膿性鏈球菌的SpCas9蛋白PAM序列為典型的“NGG”模式。其基因切割效率最高,N代表任意一種核苷酸,如“AGG”、“CGG”等。在基因編輯過程中,Cas9首先識(shí)別PAM序列,待sgRNA與靶序列特異性結(jié)合時(shí),才能完成對(duì)目的基因的切割。PAM序列是CRISPR/Cas9系統(tǒng)發(fā)揮作用的先決條件。Cas9識(shí)別錯(cuò)誤或其他模式低頻PAM序列是產(chǎn)生脫靶的部分原因[19]。
圖3 (A)1 bp插入(DNA凸起)(B)1 bp缺失(RNA凸起)示意圖[18]
sgRNA由crRNA和tracrRNA組成,其中crRNA負(fù)責(zé)識(shí)別約20 bp的靶序列,tracrRNA能夠指導(dǎo)crRNA與靶序列特異性結(jié)合。sgRNA的結(jié)構(gòu)和長(zhǎng)度會(huì)對(duì)脫靶效應(yīng)或切割效率產(chǎn)生一定影響。在Cas9與PAM序列結(jié)合完成后,sgRNA與靶序列特異性結(jié)合,Cas9對(duì)靶序列進(jìn)行切割。sgRNA是CRISPR/Cas9系統(tǒng)發(fā)揮作用的重要條件。由于CRISPR/Cas9系統(tǒng)是源于細(xì)菌等對(duì)噬菌體侵害的免疫機(jī)制,為保證將外源DNA全部清除,sgRNA本身便具有一定容錯(cuò)能力。研究表明,sgRNA自身可耐受1-5個(gè)堿基錯(cuò)配[20]。sgRNA與靶序列的錯(cuò)配是產(chǎn)生脫靶現(xiàn)象的最主要原因,前文所述的“DNA凸起”和“RNA凸起”一定程度上也可以認(rèn)為是sgRNA與靶序列的錯(cuò)配。
除以上所列舉的影響脫靶效應(yīng)的因素外,還存在一些其他干擾因素,如轉(zhuǎn)染的細(xì)胞類型、染色質(zhì)的結(jié)構(gòu)、基因組背景影響等。研究發(fā)現(xiàn),CRISPR/Cas9系統(tǒng)在斑馬魚胚胎細(xì)胞中的突變是高效的,通過質(zhì)粒轉(zhuǎn)染進(jìn)行基因編輯,其靶向突變率可達(dá)86%[21]。但是在人K562細(xì)胞中,同樣通過質(zhì)粒轉(zhuǎn)染,即使是在sgRNA出現(xiàn)錯(cuò)配的情況下,CRISPR/Cas9系統(tǒng)仍具有較高活性[16]。這表明CRISPR/Cas9系統(tǒng)存在著一定的細(xì)胞特異性。由于DNA在細(xì)胞中是以染色體的狀態(tài)存在,靶序列以及PAM序列均被包埋在染色體內(nèi)部,Cas9與染色體親和特性也在一定程度上影響CRISPR/Cas9系統(tǒng)特異性[19]。同時(shí),不同的基因組背景也會(huì)對(duì)系統(tǒng)的特異性產(chǎn)生一定影響,但具體機(jī)制還未被揭示。
影響脫靶效應(yīng)的相關(guān)因素被成功揭示之后,一系列減少脫靶效應(yīng)的新技術(shù)被成功創(chuàng)立。目前,減少脫靶效應(yīng)的方法主要是優(yōu)化或改進(jìn)sgRNA、改造Cas9蛋白以及應(yīng)用SpCas9蛋白類似物等。
sgRNA與靶序列的特異性結(jié)合是CRISPR/Cas9系統(tǒng)基因編輯的最關(guān)鍵因素。不合理的sgRNA設(shè)計(jì)會(huì)造成特異性降低、脫靶率升高。sgRNA設(shè)計(jì)應(yīng)遵從以下原則:(1)最小化sgRNA與其他序列的相似性,且sgRNA與非靶序列存在超過3個(gè)錯(cuò)配;(2)至少2個(gè)錯(cuò)配位于非靶序列的種子區(qū)域內(nèi);(3)錯(cuò)配應(yīng)是連續(xù)的或者間隔小于4 nt[22]。同時(shí),實(shí)驗(yàn)表明sgRNA中GC含量≤35%時(shí),sgRNA具有良好的特異性[23]。
在合理設(shè)計(jì)sgRNA的基礎(chǔ)上,通過對(duì)sgRNA的修飾可進(jìn)一步提高CRISPR/Cas9系統(tǒng)的特異性。Cho等[24]在sgRNA的5'端攜帶了兩個(gè)額外的G,結(jié)果意外發(fā)現(xiàn)系統(tǒng)的特異性大幅提高。Hsu等[25]在靶向人EMX1和PVALB基因時(shí),對(duì)tracrRNA尾部進(jìn)行不同程度的延長(zhǎng),發(fā)現(xiàn)sgRNA延長(zhǎng)后的基因插入水平比未修飾的sgRNA高5倍。這表明tracrRNA尾部的延長(zhǎng),在一定程度上增強(qiáng)了CRISPR/Cas9系統(tǒng)穩(wěn)定性。此外,5'端截短1-3 bp的sgRNA仍然顯示類似于全長(zhǎng)sgRNA的切割活性[18]。同時(shí),通過對(duì)sgRNA進(jìn)行不同的化學(xué)修飾,例如嵌合sgRNA法,也能夠達(dá)到降低脫靶效應(yīng)的效果[26]。
Cas9是CRISPR/Cas9系統(tǒng)中的重要組成部分,最廣泛使用的Cas9是源自化膿性鏈球菌的SpCas9。Cas9含有HNH及RuvC核酸酶結(jié)構(gòu)域,使其中一個(gè)或?qū)⑵淙渴Щ?,可分別獲得D10A Cas9(Cas9 D10A mutation,Cas9n)[27]以及喪失核酸酶活性的Cas9(Deactivated Cas9,dCas9)[28]。成對(duì)的 Cas9n及dCas9可以代替Cas9,且成倍的提高系統(tǒng)特異性。Cas9蛋白剪切DNA過程,如圖4。
Cas9與DNA的接觸影響Cas9/sgRNA與DNA結(jié)合的穩(wěn)定性以及對(duì)錯(cuò)配的耐受性。對(duì)SpCas9中負(fù)責(zé)與靶序列接觸的關(guān)鍵氨基酸殘基的改變,獲得了高保真變體“SpCas9-HF1”[30]。改變 SpCas9與非靶鏈結(jié)合的氨基酸獲得了增強(qiáng)型特異性SpCas9變體“eSpCas9”[31]。SpCas9-HF1、eSpCas9 均顯著降低了脫靶效應(yīng),且保留了穩(wěn)健的靶向切割。通過對(duì)REC3結(jié)構(gòu)域的突變,Chen等[32]設(shè)計(jì)了一種新型超精確SpCas9變體“HypaCas9”。HypaCas9具有更優(yōu)異的特異性,同時(shí)具有更高的靶向活性。此外,最近還獲得了高保真度的“evoCas9”[33],擴(kuò)展PAM兼容性的“xCas9”[34],可以同截短或延長(zhǎng)的sgRNA組合使用的“Sniper-Cas9”[35]以及高特異的“Hifi Cas9”[36]。
圖4 Cas9蛋白剪切DNA全過程的結(jié)構(gòu)變化[29]
除了Cas9突變體,SpCas9類似物也提供了一種降低脫靶效應(yīng)的新途徑。通過識(shí)別不同的、更復(fù)雜的PAM,SpCas9類似物獲得了更高的特異性。SpCas9類似物來源廣泛包括:金黃色葡萄球菌SaCas9[37]、 嗜 熱 鏈 球 菌 St1Cas9[38]、St3Cas9[39]、腦膜炎奈瑟菌 NmCas9[40]、弗朗西斯菌 FnCas9[41]、空腸彎曲桿菌CjCas9[42]以及Cas12a家族中的毛螺旋菌 LbCas12a[43]和氨基酸球菌 AsCas12a[44]。此外,最近還發(fā)現(xiàn)BhCas12b能夠表現(xiàn)出比SpCas9更高的特異性[45]。
雖然SpCas9類似物具有較高的特異性,但其較低的靶向性阻礙了其廣泛應(yīng)用。在眾多類似物中,僅SaCas9、CjCas9存在與SpCas9相當(dāng)?shù)陌邢蛐?。SaCas9識(shí)別“NNGRRT”,可與20-24 nt sgRNA組合作用[46]。CjCas9識(shí)別“NNNNACAC”和“NNNNRYAC”,與GX22sgRNA共同作用時(shí),顯示了最佳靶向活性[42]。通過設(shè)計(jì)突變體可以改善SpCas9類似物較低的靶向性。目前,通過對(duì)SaCas9進(jìn)行突變,獲得的“SaCas9-KKH”可以提升靶向性2-4倍[47]。此外,還可以通過多種方法擴(kuò)展SpCas9類似物的應(yīng)用,如通過抗CRISPR蛋白與NmCas9的結(jié)合,可實(shí)現(xiàn)對(duì)NmCas9活性的調(diào)節(jié)[48];通過dCas9與FnCas9共同作用,可提升FnCas9的靶向活性等[49]。
酶的特異性和活性強(qiáng)度通常高度依賴于反應(yīng)條件,高酶濃度下會(huì)弱化酶的特異性。Hsu等[25]在靶向人EMX1基因的實(shí)驗(yàn)中,減少轉(zhuǎn)染細(xì)胞的質(zhì)粒數(shù)(編碼Cas9蛋白和sgRNA),結(jié)果發(fā)現(xiàn)系統(tǒng)的特異性大大增強(qiáng)。這表明通過改變Cas9/sgRNA復(fù)合物的濃度實(shí)現(xiàn)最佳特異性的可行性。然而Cas9/sgRNA濃度的降低會(huì)導(dǎo)致CRISPR/Cas9系統(tǒng)切割效率的降低,所以需要通過實(shí)驗(yàn)確定最佳Cas9/sgRNA濃度。在使用質(zhì)粒轉(zhuǎn)染細(xì)胞時(shí),通過減少細(xì)胞中sgRNA的數(shù)量,可直接限制細(xì)胞內(nèi)Cas9/sgRNA復(fù)合物濃度。此外,在使用質(zhì)粒轉(zhuǎn)染細(xì)胞時(shí),采用不同啟動(dòng)子影響sgRNA轉(zhuǎn)錄,也能夠降低細(xì)胞內(nèi)Cas9/sgRNA濃度,減少脫靶[50]。
脫靶檢測(cè)技術(shù)是一系列針對(duì)CRISPR/Cas9系統(tǒng)作用機(jī)制研發(fā)的用于確定CRISPR/Cas9系統(tǒng)基因編輯準(zhǔn)確性的檢測(cè)工具。脫靶檢測(cè)在揭示CRISPR/Cas9系統(tǒng)的脫靶機(jī)制以及進(jìn)一步提高系統(tǒng)靶向性的研究中具有重要作用。
早期的脫靶檢測(cè)技術(shù)是由軟件預(yù)測(cè)和測(cè)序組成,如Sanger測(cè)序、NGS測(cè)序、全外顯子組測(cè)序等[51-52]。該類技術(shù)的原理是針對(duì)預(yù)測(cè)獲知的脫靶位點(diǎn)進(jìn)行測(cè)序,以確定是否在這些位點(diǎn)發(fā)生了非特異性結(jié)合。Sanger測(cè)序法是檢測(cè)CRISPR/Cas9系統(tǒng)脫靶的常用方法之一。首先,通過Cas-OFFinder等[53]脫靶預(yù)測(cè)軟件進(jìn)行預(yù)測(cè),獲得可能的脫靶位點(diǎn)。然后,對(duì)預(yù)測(cè)的脫靶位點(diǎn)進(jìn)行PCR擴(kuò)增、測(cè)序,從而確定該位點(diǎn)是否發(fā)生脫靶突變。該類技術(shù)存在明顯的偏向性,其主要針對(duì)的是軟件預(yù)測(cè)的脫靶位點(diǎn),而軟件預(yù)測(cè)往往容易造成部分脫靶位點(diǎn)的遺漏。
由易錯(cuò)的NHEJ修復(fù)Cas9誘導(dǎo)的DSB時(shí),往往會(huì)發(fā)生脫靶突變。檢測(cè)Cas9脫靶的最直接方法是跟蹤基因組中的DSB。通過對(duì)DSB的標(biāo)記實(shí)現(xiàn)了全基因組無偏脫靶檢測(cè),如IDLVs、BLESS、GUIDE-seq技術(shù)等[54-56]。這類技術(shù)的原理是通過將特定的雙鏈DNA或生物素接頭整合到DSB中,從而達(dá)到檢測(cè)目的。GUIDE-seq是無偏檢測(cè)脫靶效應(yīng)的方法之一。首先,需要將特定的雙鏈寡核苷酸(Double stranded oligodeoxynucleotides,dsODN)整合到斷裂位點(diǎn)。然后提取基因組DNA,隨機(jī)打斷;對(duì)含有dsODN片段的序列進(jìn)行擴(kuò)增、富集。最后,測(cè)序后分析切割位點(diǎn),評(píng)估脫靶效應(yīng)[57]。該類技術(shù)雖然實(shí)現(xiàn)了全基因組無偏檢測(cè),但是其只能檢測(cè)斷裂時(shí)期的DSB,對(duì)于已經(jīng)修復(fù)或者未發(fā)生的DSB則不能檢測(cè)。
近年來,利用Cas9蛋白能夠在體外消化DNA的特性,使用發(fā)夾接頭或生物素等標(biāo)記DNA片段,開 發(fā) 了 Digenome-seq、Circle-seq、SITE-seq等 技術(shù)[58-60]。該類技術(shù)的原理是利用Cas9體外核酸酶特性,在體外對(duì)基因組DNA進(jìn)行切割,產(chǎn)物經(jīng)處理后,通過測(cè)序或其他手段,實(shí)現(xiàn)對(duì)脫靶位點(diǎn)的篩選。Digenome-seq是利用Cas9體外消化DNA特性檢測(cè)脫靶效應(yīng)的技術(shù)之一。Cas9體外消化基因組DNA、測(cè)序;比對(duì)具有相同末端的序列,通過軟件分析即可評(píng)估脫靶效率[61]。該類技術(shù)同樣從全基因組角度實(shí)現(xiàn)了無偏檢測(cè),且精度較前兩類技術(shù)更高,唯一存在的問題是Cas9在體內(nèi)和體外發(fā)揮作用時(shí)可能會(huì)存在一定的差異。
此外,脫靶檢測(cè)方法還有利用T7EⅠ酶、Surveyor酶等對(duì)錯(cuò)配堿基切割的酶切法;利用dCas9與靶序列和非靶序列結(jié)合,結(jié)合測(cè)序手段的Chipseq技術(shù)以及基于染色體易位原理的HTGTS檢測(cè)法等。最近,針對(duì)各類脫靶檢測(cè)方法存在的問題,開發(fā)了一種普遍適用的無偏脫靶識(shí)別方法DISCOVERSeq。DISCOVER-Seq的優(yōu)勢(shì)在于利用了DNA修復(fù)蛋白MRN復(fù)合物的亞基MRE11,MRE11與DNA的結(jié)合在插入缺失之前就可達(dá)到了峰值,結(jié)合Chipseq與定制軟件BLENDER,通過軟件得分便可實(shí)現(xiàn)對(duì)脫靶事件的高度特異性鑒定[62]。DISCOVER-Seq提供了一種定義和量化整個(gè)生物體中基因編輯脫靶效應(yīng)的一般策略,從而為促進(jìn)體內(nèi)基因編輯療法的開發(fā)提供了藍(lán)圖。
作為主流基因編輯工具,CRISPR/Cas9的應(yīng)用大大加快了分子生物學(xué)、植物學(xué)、生命科學(xué)等研究工作。在生物學(xué)中,CRISPR/Cas9用于轉(zhuǎn)錄調(diào)節(jié)、基因成像以及表觀遺傳學(xué)研究,這有助于進(jìn)一步理解真核基因表達(dá);在植物學(xué)中,CRISPR/Cas9加速了作物品種改良工作,縮短了作物育種年限,極大緩解了全球糧食危機(jī);在醫(yī)學(xué)中,CRISPR/Cas9顯示出治愈困擾人類許久的疑難雜癥的極大潛力,已被廣泛用于細(xì)胞及動(dòng)物模型的創(chuàng)建、藥物設(shè)計(jì)篩選等,這是CRISPR/Cas9邁向醫(yī)學(xué)領(lǐng)域的第一步。目前影響脫靶效應(yīng)因素的研究集中在sgRNA與靶序列的結(jié)合以及Cas9對(duì)PAM序列的識(shí)別,其他諸如鹽離子濃度等對(duì)脫靶結(jié)合的影響還未被揭示。通過優(yōu)化/改進(jìn)sgRNA、突變Cas9和采用Cas9類似物,已成功減少非特異性結(jié)合的發(fā)生,但脫靶率的降低有時(shí)也會(huì)導(dǎo)致靶向切割效率的降低。如何在進(jìn)一步降低脫靶效應(yīng)的同時(shí)保持原有切割效率將成為新的研究重心。此外,伴隨精準(zhǔn)測(cè)序技術(shù)的實(shí)現(xiàn),更為精準(zhǔn)的檢測(cè)技術(shù)也必將不斷推陳出新。隨著脫靶影響因素、降低策略及脫靶檢測(cè)技術(shù)研究的不斷深入,未來CRISPR/Cas9系統(tǒng)必將會(huì)應(yīng)用在更廣泛的領(lǐng)域造福人類。