肖安,張博
遺傳學(xué)的核心任務(wù)之一是闡釋基因及其產(chǎn)物的功能,其發(fā)展經(jīng)歷了經(jīng)典遺傳學(xué)、現(xiàn)代遺傳學(xué)和功能基因組學(xué)等三大重要階段。遺傳學(xué)最重要的研究策略之一為獲取突變體以及對(duì)突變體進(jìn)行基因型、表型分析,除此之外,轉(zhuǎn)基因、RNAi以及其他特異性激活或抑制基因表達(dá)的方法也是遺傳學(xué)研究中的常用技術(shù)。獲取突變體的途徑主要包括篩選天然突變體、人工隨機(jī)誘變 (正向遺傳學(xué)手段),以及針對(duì)基因組上特異位點(diǎn)進(jìn)行靶向修飾 (反向遺傳學(xué)手段) 等[1-2]。其中,能夠?qū)崿F(xiàn)對(duì)基因組進(jìn)行定點(diǎn)誘變的反向遺傳學(xué)方法是解讀基因功能最直接、也是最具有挑戰(zhàn)性的手段之一。這一研究思路一方面基于基因組、轉(zhuǎn)錄組高通量測(cè)序所提供的信息,另一方面則嚴(yán)重依賴于基因組編輯技術(shù)的發(fā)展。
在相當(dāng)長(zhǎng)的時(shí)期內(nèi),絕大多數(shù)生物體或體外培養(yǎng)細(xì)胞中缺乏有效的基因組靶向編輯技術(shù)手段,僅有的基于胚胎干細(xì)胞和同源重組等少數(shù)可行方案存在效率非常低、具有嚴(yán)格的物種局限性等缺點(diǎn),這也在很大程度上制約了功能基因組研究的進(jìn)程。隨著DNA測(cè)序技術(shù)的飛速發(fā)展,完成全基因組序列測(cè)定的物種數(shù)量呈現(xiàn)爆發(fā)式增長(zhǎng),而基因組定點(diǎn)突變技術(shù)的瓶頸所帶來的功能基因組研究的滯后效應(yīng)也越發(fā)明顯??蒲泄ぷ髡咂惹行枰环N簡(jiǎn)單、有效的基因打靶技術(shù)來解讀記載在每一個(gè)基因組中的生命的奧秘。近幾年,人們巧妙地利用細(xì)菌的一些特殊的基因表達(dá)調(diào)控機(jī)制,以及多年來對(duì)轉(zhuǎn)錄因子作用機(jī)制的研究成果,逐步創(chuàng)建出能夠根據(jù)人們的意愿特異切割DNA靶序列的人工核酸內(nèi)切酶 (Engineered endonuclease,簡(jiǎn)稱EEN),并籍此在理論上實(shí)現(xiàn)了對(duì)任意物種/基因組的任意位點(diǎn)進(jìn)行靶向修飾的夢(mèng)想。該項(xiàng)技術(shù)的核心思路是針對(duì)目標(biāo)位點(diǎn) (基因組上特定的DNA序列) 設(shè)計(jì)并通過基因工程的方法構(gòu)建特定的核酸內(nèi)切酶,使其能夠特異識(shí)別、結(jié)合并切割該靶序列,從而在基因組的特定位點(diǎn)造成DNA雙鏈斷裂 (Double strand break,簡(jiǎn)稱DSB),最終利用細(xì)胞自身的DNA損傷修復(fù)的容錯(cuò)性造成靶位點(diǎn)序列產(chǎn)生突變[3]。目前EEN主要包括鋅指核酸酶 (Zinc finger nuclease,ZFN)、轉(zhuǎn)錄激活因子樣效應(yīng)物核酸酶 (Transcription activator-like effector nuclease,TALEN)、規(guī)律性成簇間隔的短回文重復(fù)序列 (Clustered regularly interspaced short palindromic repeats,CRISPR)及相關(guān)蛋白 (CRISPR-associated,Cas) 系統(tǒng)(CRISPR/Cas系統(tǒng)) 等3種類型。這種基于人工核酸酶的新型基因組編輯技術(shù)原理簡(jiǎn)單、操作簡(jiǎn)便,在應(yīng)用上對(duì)物種或細(xì)胞沒有選擇性,因此迅速成為擁有極其廣泛發(fā)展前景和應(yīng)用價(jià)值的熱門研究領(lǐng)域之一。由于該項(xiàng)技術(shù)在思路上不同于傳統(tǒng)的以胚胎干細(xì)胞為基礎(chǔ)的基因打靶策略,并且在實(shí)用性和適用性上均產(chǎn)生了質(zhì)的飛躍,因此筆者認(rèn)為不妨借用對(duì)新型DNA測(cè)序技術(shù)的命名,將基于EEN的基因組靶向突變技術(shù)稱為“新一代”基因組編輯技術(shù)。下面簡(jiǎn)單總結(jié)、比較EEN以及EEN介導(dǎo)的基因組靶向修飾的類型,并簡(jiǎn)單展望該項(xiàng)技術(shù)的發(fā)展前景。
ZFN是3種人工核酸內(nèi)切酶中最早被開發(fā)并投入應(yīng)用的。人們很早就了解到,生物體中存在多種鋅指蛋白 (Zinc finger protein,ZFP),它們的共同特點(diǎn)是包含數(shù)量不等 (通常為 3–7個(gè)) 的鋅指基序 (Zinc finger motif),這些鋅指能夠介導(dǎo)蛋白質(zhì)與核酸、小分子或其他蛋白質(zhì)的特異相互作用。相當(dāng)一部分ZFP能夠特異識(shí)別并結(jié)合基因組 DNA上特定長(zhǎng)度序列的靶位點(diǎn),從而作為轉(zhuǎn)錄因子對(duì)基因表達(dá)進(jìn)行調(diào)控。ZFN技術(shù)即利用了這一特性。通過人工改造鋅指序列 (常用的是 C2H2類型的鋅指) 中對(duì)識(shí)別并結(jié)合DNA靶位點(diǎn)產(chǎn)生重要作用的幾個(gè)關(guān)鍵位置的氨基酸殘基,通過基因工程的方法組裝出識(shí)別特定靶位點(diǎn)的ZFP結(jié)構(gòu)域,并和一個(gè)能夠非特異切割 DNA的核酸酶結(jié)構(gòu)域 (造成 DNA單鏈或雙鏈斷裂) 融合,便可得到有可能特異切割靶位點(diǎn)的 ZFN。通常選擇的切割結(jié)構(gòu)域來自細(xì)菌的FokⅠ核酸內(nèi)切酶,它需要在靶序列的下游以二聚化的形式行使切割DNA的功能。因此,在具體應(yīng)用中,通常需要構(gòu)建一對(duì)ZFN單體,聯(lián)合使用。通常每個(gè)ZFN含有3個(gè)鋅指單元,可識(shí)別9 bp的靶序列 (每個(gè)鋅指單元大致識(shí)別3個(gè)堿基)。兩個(gè)靶序列分別位于DNA上相反的兩條鏈上,并相距特定的間隔 (圖 1A)。1996年,首個(gè)人工合成的ZFN被成功報(bào)道可在體外實(shí)現(xiàn)對(duì)靶序列的切割[4]。2002年,ZFN首次成功應(yīng)用于個(gè)體水平,在果蠅中實(shí)現(xiàn)了基因的定點(diǎn)突變[5]。隨后數(shù)年,這一技術(shù)的應(yīng)用范圍被擴(kuò)充到多種生物體和培養(yǎng)細(xì)胞中,從而為很多模式生物開創(chuàng)了反向遺傳學(xué)研究的新天地[6]。
圖1 三種人工核酸內(nèi)切酶的基本結(jié)構(gòu)與組成Fig. 1 The structure and components of the three types of EENs.
遺憾的是,ZFN技術(shù)在實(shí)際應(yīng)用中存在很多問題。首先,對(duì)于ZFP與DNA的識(shí)別與結(jié)合規(guī)律人們了解得并不透徹。人工構(gòu)建的ZFN和ZFP通常由多個(gè)鋅指組裝而成,但是每個(gè)鋅指對(duì)其靶序列的識(shí)別與結(jié)合的能力和特異性受上下文 (周邊的鋅指單元) 的影響非常大,并且相鄰的鋅指之間存在著交錯(cuò)影響。經(jīng)過多年研究,人們對(duì)于ZFN與其DNA靶序列的相互作用僅了解到非常有限的一些關(guān)聯(lián)性,例如富含G的靶序列更容易獲得有效的ZFN等,因而無法直接根據(jù)所需要識(shí)別的靶序列構(gòu)建相應(yīng)的ZFN[7]。為了獲取一對(duì)能夠有效工作的ZFN,往往需要測(cè)試或篩選數(shù)量非常可觀的鋅指序列組合庫(kù),不但需要消耗相當(dāng)大的人力物力,而且最終的成功率也不高。同時(shí),ZFN的誘變效率整體而言比較低 (在生物體中很多時(shí)候不超過10%)[8]。此外,ZFN還存在較高的脫靶效應(yīng)(Off-targeting effect),即除了切割指定的靶位點(diǎn),往往還會(huì)切割基因組上其他具有相似序列的位點(diǎn)[9-10]。人們嘗試過多種方法改進(jìn) ZFN的特異性,例如,通過突變FokⅠ上特定的氨基酸殘基得到多種FokⅠ變體,其中有些FokⅠ變體只有形成異源二聚體時(shí)才能組成有活性的內(nèi)切酶復(fù)合體,這樣就可以部分減少脫靶效應(yīng)。但是,總體而言ZFN的特異性仍然不高。上述這些局限性無疑大大增加了ZFN使用的難度。不少研究組開發(fā)了各種ZFP/ZFN的構(gòu)建與篩選方案,以期能夠解決這些問題,但是這一技術(shù)的應(yīng)用門檻始終相當(dāng)高,一般只有少數(shù)商業(yè)公司才有一定的把握篩選出具有一定靶點(diǎn)識(shí)別與切割效率的鋅指組合及其 ZFN。正在大家一籌莫展之際,TALEN和CRISPR/Cas系統(tǒng)相繼“從天而降”,這才真正掀起了基因組編輯技術(shù)的一場(chǎng)革命。
TALEN的基本原理和ZFN類似,也是由特異識(shí)別靶序列的DNA結(jié)合結(jié)構(gòu)域和FokⅠ切割結(jié)構(gòu)域融合而成,只是由特異性較強(qiáng)的 TALE結(jié)構(gòu)域替代了ZFP。TALEN的DNA結(jié)合結(jié)構(gòu)域來自于黃單胞菌屬 (Xanthomonas) 植物病原菌表達(dá)的一種類轉(zhuǎn)錄激活因子 (Transcription activator-like effector, TALE)。TALE包含多個(gè)(通常為 12.5–35.5個(gè)) 串聯(lián)的重復(fù)單元 (稱為TALE repeat),各個(gè)單元的長(zhǎng)度 (通常為33–35個(gè)氨基酸殘基) 和序列骨架非常相似,僅第 12位和第13位的兩個(gè)氨基酸殘基存在著高度可變性,稱為重復(fù)可變雙殘基 (Repeat variable di-residue,簡(jiǎn)稱 RVD)。2009年,通過統(tǒng)計(jì)分析和實(shí)驗(yàn)測(cè)試,兩個(gè)研究組同時(shí)揭示了 TALE重復(fù)單元的生物學(xué)功能——每個(gè)單元對(duì)應(yīng)識(shí)別靶基因上的一個(gè)DNA堿基,是一種全新的DNA結(jié)合結(jié)構(gòu)域[11-13]。此外,在識(shí)別并結(jié)合靶位點(diǎn)方面,TALE重復(fù)單元相互之間基本沒有影響,而且所有能夠識(shí)別 4種堿基的單元都已發(fā)現(xiàn)。僅僅1年后,人們就證明由TALE和FokⅠ融合得到的 TALEN能夠?qū)Π形稽c(diǎn)進(jìn)行特異切割與高效突變[14](圖1B)。TALE 重復(fù)單元與靶位點(diǎn)這種精確的一一對(duì)應(yīng)關(guān)系極大方便了研究者的使用,從而免除了ZFN應(yīng)用中大規(guī)模的篩選工作。TALEN對(duì)靶位點(diǎn)序列的要求也非常寬松,僅需要在靶序列5?端上游的第一個(gè)堿基為T即可。同時(shí),TALEN的切割與誘變效率雖然也存在難以預(yù)測(cè)并且有時(shí)變動(dòng)較大等問題,但平均而言相對(duì)于 ZFN要高很多。針對(duì)不同的位點(diǎn),TALEN的活性/突變效率差異可以很大,在生物體中從無活性到突變效率接近100%都有可能[15]。例如,在斑馬魚中,有將近3/4的位點(diǎn)TALEN的突變效率可達(dá)1%以上,有1/4的位點(diǎn)的效率可高于 50% (本實(shí)驗(yàn)室未發(fā)表數(shù)據(jù))。此外,目前的研究結(jié)果顯示,TALEN的特異性非常好,脫靶效應(yīng)要比ZFN低得多 (有可能與其識(shí)別區(qū)域長(zhǎng)度很長(zhǎng)有關(guān))[16]。這些特性使得TALEN技術(shù)迅速發(fā)展起來,在很多領(lǐng)域取代了ZFN的應(yīng)用。
TALEN技術(shù)應(yīng)用的難點(diǎn)是TALEN表達(dá)載體的構(gòu)建。TALE結(jié)構(gòu)域比較大,可達(dá) 600–800個(gè)氨基酸殘基 (1 800–2 400 bp編碼序列),并且序列高度重復(fù),難以使用常規(guī)的 PCR、酶切連接等分子克隆技術(shù)實(shí)現(xiàn)。多個(gè)研究組運(yùn)用不同的思路和工具,開發(fā)了各種構(gòu)建TALE和TALEN蛋白表達(dá)載體的方法,從而使得這一技術(shù)能夠?yàn)楦嗟娜耸褂肹8]。
與ZFN和TALEN不同,CRISPR/Cas并非基于與DNA結(jié)合的轉(zhuǎn)錄因子改造而成,而是借鑒了多種原核生物和古核生物中天然存在的一套獲得性免疫系統(tǒng)[17]。細(xì)菌能夠捕獲入侵的病毒、質(zhì)粒等外來核酸序列片段,并將其嵌入到其基因組中一段高度串聯(lián)重復(fù)并帶有特定回文結(jié)構(gòu)的區(qū)域 (CRISPR)。這一區(qū)域能夠被轉(zhuǎn)錄、切割形成具有特定二級(jí)結(jié)構(gòu)的小片段 RNA (稱為CRISPR RNA,crRNA)。若細(xì)菌被帶有同一序列的外來核酸感染,這些crRNA可在CRISPR相關(guān)蛋白 (Cas) 和其他 RNA (tracrRNA) 的輔助下,以堿基配對(duì)的方式特異性識(shí)別外源入侵序列,并通過各種不同的作用機(jī)制組裝形成核酸酶切割復(fù)合物,降解入侵的核酸[2]。利用這一特性,2012年,通過改造研究得最為清楚、組成最為簡(jiǎn)單的Ⅱ型CRISPR/Cas系統(tǒng) (僅由一個(gè)Cas9蛋白、一段帶有20 nt識(shí)別序列的crRNA和一個(gè)通用的tracrRNA組成),人們?cè)隗w外成功實(shí)現(xiàn)了對(duì)攜帶有同樣的 20 bp序列稱為Protospacer的DNA雙鏈靶位點(diǎn)的特異切割[18]。同時(shí),研究人員還進(jìn)一步簡(jiǎn)化了這個(gè)系統(tǒng),將上述兩個(gè) RNA分子通過一段連接序列合二為一,并且去除了不必要的區(qū)域,設(shè)計(jì)出一個(gè)長(zhǎng)度為102 nt的RNA分子,稱為向?qū)NA (Guide RNA, gRNA;也有文獻(xiàn)稱為單一向?qū)?RNA,single guide RNA,sgRNA),并證明Cas9-gRNA的組合同樣也能夠?qū)崿F(xiàn)對(duì)DNA的靶向切割 (圖1C)。因此,CRISPR/Cas系統(tǒng)又稱 Cas9/gRNA系統(tǒng)。半年后,兩個(gè)研究小組使用人工構(gòu)建的CRISPR/Cas系統(tǒng)成功地在包括iPS細(xì)胞在內(nèi)的多種體外培養(yǎng)的人類細(xì)胞中實(shí)現(xiàn)了對(duì)基因組特定位點(diǎn)的切割與誘變[19-20],從而開創(chuàng)了這一新技術(shù)在活體中的應(yīng)用。
與ZFN和TALEN相比較,CRISPR/Cas系統(tǒng)不是通過蛋白與核酸的相互作用,而是通過核酸與核酸之間的堿基互補(bǔ)配對(duì)作用來識(shí)別并結(jié)合靶序列,這使其原理和操作更為簡(jiǎn)單。CRISPR/Cas系統(tǒng)要求的靶位點(diǎn)序列規(guī)則也僅需要在識(shí)別區(qū)域的 3?端下游的 3個(gè)堿基為 NGG(稱為 Protospacer adjacent motif,簡(jiǎn)稱 PAM)[18]。在實(shí)際應(yīng)用中,對(duì)于不同的靶位點(diǎn),只需改變gRNA,Cas9蛋白則都是相同的,無需重新設(shè)計(jì)與構(gòu)建;負(fù)責(zé)識(shí)別不同靶序列的 gRNA的長(zhǎng)度非常短,可以通過多種方式在體外快速合成或快速構(gòu)建體內(nèi)表達(dá)系統(tǒng)。由此可見,CRISPR/Cas系統(tǒng)在應(yīng)用的簡(jiǎn)便性上具有巨大的優(yōu)勢(shì)。此外,還可以構(gòu)建多個(gè)gRNA,與Cas9共同導(dǎo)入生物體或細(xì)胞內(nèi),這樣就有可能實(shí)現(xiàn)對(duì)多個(gè)靶位點(diǎn)的同時(shí)切割與突變。目前來看,CRISPR/Cas系統(tǒng)對(duì)靶位點(diǎn)的切割及誘變效率與 TALEN大致相當(dāng),不過,該系統(tǒng)對(duì)靶位點(diǎn)的選擇性仍有待深入研究。
作為一種最新的基因組靶向誘變技術(shù),CRISPR/Cas系統(tǒng)目前存在的一個(gè)最值得關(guān)注的問題應(yīng)該是其潛在的脫靶效應(yīng)。目前至少有兩方面的因素會(huì)影響到該系統(tǒng)的特異性。一方面涉及到靶序列的長(zhǎng)度。CRISPR/Cas系統(tǒng)以單一復(fù)合體的形式起作用,其識(shí)別的靶位點(diǎn)的長(zhǎng)度固定為20 bp,短于一對(duì)TALEN通常所聯(lián)合識(shí)別的 30–40 bp。更重要的影響因素涉及到其識(shí)別靶序列的機(jī)制——堿基互補(bǔ)配對(duì)往往會(huì)表現(xiàn)出一定的容錯(cuò)性。有報(bào)道表明,在人類細(xì)胞系中某些 CRISPR/Cas存在著相當(dāng)可觀的脫靶切割效率,這些脫靶效應(yīng)很可能是由于堿基錯(cuò)配所導(dǎo)致的[21-24]。有研究組設(shè)法突變Cas9蛋白,將其改造為只能切割一條DNA單鏈的核酸缺刻酶 (Nickase) Cas9n,從而可以像ZFN和TALEN一樣使用一對(duì)識(shí)別相反鏈的Cas9n/gRNA組合實(shí)現(xiàn)雙鏈切割,以增加靶位點(diǎn)的序列長(zhǎng)度,降低脫靶效應(yīng)[19,23,25]。為了避免或盡量減少堿基錯(cuò)配造成的脫靶效應(yīng),部分提供靶位點(diǎn)設(shè)計(jì)的網(wǎng)絡(luò)在線工具也增加了預(yù)測(cè)潛在脫靶位點(diǎn)、以供用戶選擇特異性較高的gRNA的輔助功能[25]??傮w而言,關(guān)于CRISPR/Cas系統(tǒng)潛在脫靶效應(yīng)的問題尚需進(jìn)一步的研究和探索。
ZFN、TALEN、CRISPR/Cas系統(tǒng)的簡(jiǎn)要發(fā)展歷程和比較如圖2和表1所示。
圖2 基于人工核酸內(nèi)切酶的新一代基因組編輯技術(shù)的簡(jiǎn)要發(fā)展歷程Fig. 2 A brief summary of the developmental progress of the EEN-mediated new-generation genome editing technology.
表1 三種人工核酸內(nèi)切酶的特征比較Table 1 Comparison of the three types of EEN (engineered endonuclease)
各種人工核酸內(nèi)切酶所主要解決的問題都是針對(duì)染色體/基因組上所設(shè)計(jì)的靶位點(diǎn)實(shí)現(xiàn)特異切割、造成DSB。而借助于DSB對(duì)基因組進(jìn)行靶向編輯主要包括以下3種策略。
非同源末端連接 (Non-homologous endjoining,NHEJ) 是細(xì)胞自發(fā)修復(fù) DSB造成的DNA損傷的一種主要方式。細(xì)胞內(nèi)的DNA發(fā)生DSB后,各種修復(fù)因子可將斷裂產(chǎn)生的兩個(gè)DNA末端直接連接起來。這一連接過程常常不夠精確,往往可能發(fā)生小片段的插入和/或缺失(Small insertion/deletion,indel)。如果indel破壞了基因的讀碼框或提前引入翻譯終止位點(diǎn),那么就有可能破壞基因的功能和/或表達(dá),造成該基因產(chǎn)生突變。在實(shí)際應(yīng)用過程中,這一策略只需將人工核酸內(nèi)切酶引入到生物體或培養(yǎng)細(xì)胞后,不需要進(jìn)行其他操作,等待適當(dāng)?shù)臅r(shí)間后對(duì)indel誘變效率進(jìn)行檢測(cè)即可[6]。
大部分已報(bào)道的人工核酸內(nèi)切酶的應(yīng)用均使用的是NHEJ-indel誘變策略。這一方法所得到的突變等位基因的類型不可控制,因此絕大多數(shù)情況下只能對(duì)基因進(jìn)行功能破壞性突變操作。在應(yīng)用這一策略的時(shí)候,需要注意所選擇的靶位點(diǎn)應(yīng)該位于基因編碼區(qū)比較靠前的外顯子中 (但是要在翻譯起始密碼子ATG之后),并且最好在編碼某個(gè)重要功能結(jié)構(gòu)域的序列之前,這樣突變后才能使整個(gè)蛋白失去正常作用。同時(shí)需要注意可變剪接、多重轉(zhuǎn)錄本,以及潛在的下游可選翻譯起始位點(diǎn)等問題,盡量選在確定能夠完全破壞整個(gè)基因功能的區(qū)域。
NHEJ-indel策略只能應(yīng)用于單個(gè)蛋白編碼基因,對(duì)于希望破壞非編碼RNA基因、基因組順式作用元件 (調(diào)控序列)、多個(gè)基因、多個(gè)轉(zhuǎn)錄本、多個(gè)剪接變體,或基因簇等情況,或是針對(duì)較大的或情況比較復(fù)雜的蛋白編碼基因,包括希望去除某些特定的功能結(jié)構(gòu)域等,indel往往難以達(dá)到預(yù)期目的。這時(shí)可以同時(shí)使用兩組/兩對(duì)人工核酸內(nèi)切酶,使其分別識(shí)別基因組上兩個(gè)不同的位點(diǎn),在間隔一定距離的DNA雙鏈上造成兩個(gè)DSB,這樣就有可能在 NHEJ介導(dǎo)的修復(fù)連接時(shí),將兩個(gè)位點(diǎn)兩側(cè)的序列直接連接起來,而丟掉兩個(gè)DSB之間的區(qū)段。這樣獲得的突變類型屬于大片段的缺失突變 (Large fragment deletion)。刪除片段的長(zhǎng)度可長(zhǎng)可短,有的甚至可長(zhǎng)達(dá)百萬(wàn)堿基對(duì) (Mbp)。
這一策略最初在人類細(xì)胞中報(bào)道[26],隨后在其他物種中也得到了應(yīng)用,可順利實(shí)現(xiàn)對(duì)miRNA簇的刪除等[27]。不過,大片段刪除的效率顯著低于單點(diǎn)indel的突變效率,而且還會(huì)隨著兩個(gè)位點(diǎn)之間的距離增大而進(jìn)一步下降。
同源重組 (Homologous recombination,HR)或同源介導(dǎo)的修復(fù) (Homology directed repair,HDR) 是傳統(tǒng)上在小鼠中應(yīng)用的基因組定點(diǎn)修飾方法。通過引入兩側(cè)各帶有一段和靶位點(diǎn)序列一致的同源臂 (Homologous arm) 的外源供體 (Donor) DNA,細(xì)胞染色體能夠以很低的效率 (約10–6量級(jí)) 與供體DNA發(fā)生同源同組,從而將外源序列精確地置換到基因組中。由于天然發(fā)生的同源重組的效率太低,因此往往需要通過在供體DNA上添加正、負(fù)篩選標(biāo)記并優(yōu)化條件,并且篩選足夠多的細(xì)胞,才有可能在眾多細(xì)胞株中找到成功發(fā)生同源重組的細(xì)胞。因此,這一方法很難在缺乏有效篩選策略的生物體中實(shí)現(xiàn)。
曾有報(bào)道,在靶位點(diǎn)附近造成雙鏈斷裂或單鏈缺刻可極大地提高重組效率。因此,人工核酸內(nèi)切酶技術(shù)出現(xiàn)后,人們便開始嘗試用它提高HR的效率,以便在整體動(dòng)物水平實(shí)現(xiàn)對(duì)基因組的精確修飾。結(jié)果表明,在同源重組的目標(biāo)序列附近設(shè)計(jì)人工核酸內(nèi)切酶造成DSB后,能將細(xì)胞中的重組效率提高 3–4個(gè)數(shù)量級(jí),極大地方便了篩選工作[28]。同時(shí),在很多傳統(tǒng)上無法實(shí)現(xiàn)同源重組的物種中 (如斑馬魚),使用人工核酸內(nèi)切酶定點(diǎn)切割也順利實(shí)現(xiàn)了外源序列的精確整合[29]。
同源介導(dǎo)修復(fù)的最大特點(diǎn)是可以精確地操控和編輯基因組,借此可以實(shí)現(xiàn)精確的點(diǎn)突變(Point mutation)、基因修復(fù) (Gene correction)、基因敲入 (Gene addition)、基因替換 (Gene replacement) 等,從而在疾病治療、基因標(biāo)記、特殊突變體構(gòu)建等領(lǐng)域發(fā)揮重要作用。需要注意的是,人工核酸內(nèi)切酶介導(dǎo)的同源重組效率仍然大大低于單點(diǎn)indel效率,同時(shí)兩者之間還存在競(jìng)爭(zhēng)關(guān)系,需要在重組供體上設(shè)計(jì)一些可供篩選的序列或其他分子標(biāo)記。
目前,對(duì)于這3種EEN,ZFN基本上已經(jīng)完全被TALEN代替,TALEN則跟CRISPR/Cas系統(tǒng)并存,兩者各有千秋。TALEN的優(yōu)勢(shì)是特異性高、脫靶效應(yīng)較低;CRISPR/Cas系統(tǒng)的優(yōu)勢(shì)則是使用簡(jiǎn)便、成本低。不過,由于兩者真正應(yīng)用的時(shí)間都很短,TALEN技術(shù)建立迄今不足5年,CRISPR/Cas系統(tǒng)體系則僅兩年多,因此都存在一些問題有待深入研究。例如,兩種基因打靶體系都依然需要優(yōu)化,應(yīng)用范圍與方式需要進(jìn)一步拓展,作用機(jī)制仍有待深入研究;TALEN的成功率與靶點(diǎn)效率預(yù)測(cè)、CRISPR/Cas系統(tǒng)的成功率與特異性/脫靶效應(yīng)、毒性與安全性等都有待進(jìn)一步評(píng)估與優(yōu)化。什么樣的位點(diǎn)能夠獲得較高的突變效率?CRISPR/Cas系統(tǒng)的特異性/脫靶效應(yīng)究竟如何?這些問題仍有待謹(jǐn)慎探索。
展望未來,這一技術(shù)至少會(huì)在以下幾個(gè)領(lǐng)域中發(fā)揮越來越廣泛而重要的作用:
1) 對(duì)模式生物基因組的操控。借助于EEN,對(duì)任意模式生物的基因組進(jìn)行定點(diǎn)編輯已經(jīng)由夢(mèng)想逐漸變成了現(xiàn)實(shí),反向遺傳學(xué)研究方法也得到了飛躍式的發(fā)展。這一方法使得不少傳統(tǒng)上缺乏反向遺傳學(xué)工具的模式物種 (例如斑馬魚、大鼠) 的基因功能研究工作的難度大大降低,也節(jié)省了已有其他基因定點(diǎn)突變工具的模式物種的突變體構(gòu)建時(shí)間 (例如小鼠、果蠅),同時(shí)還為很多以前研究不夠充分的物種提供了幾乎是唯一的可用工具 (包括很多靈長(zhǎng)類和眾多非傳統(tǒng)模式物種在內(nèi))。
2) 在體外培養(yǎng)細(xì)胞中的應(yīng)用。利用人工核酸內(nèi)切酶,可同樣有針對(duì)性地操作、編輯體外培養(yǎng)細(xì)胞的基因組。由于CRISPR/Cas工具極其容易應(yīng)用的特性,特別是其 gRNA可以高通量構(gòu)建,有研究人員已經(jīng)開始著手構(gòu)建人類細(xì)胞全基因組的靶向 gRNA庫(kù),相信在不久的將來就可以實(shí)現(xiàn)大規(guī)模的、全基因組范圍的正向或負(fù)向選擇性功能篩選。
實(shí)際上,這場(chǎng)革命不僅使模式生物和體外培養(yǎng)細(xì)胞的研究受益,而且必將產(chǎn)生更深遠(yuǎn)的影響。我們有理由樂觀地憧憬,大眾化的 EEN技術(shù)很有可能會(huì)像當(dāng)年的分子克隆、PCR技術(shù)一樣進(jìn)入最普通的實(shí)驗(yàn)室,成為任何一個(gè)涉及到核酸研究的實(shí)驗(yàn)室必備的常規(guī)工具。
3) 在疾病基因治療方面的應(yīng)用。通過特異性修飾基因組的特定序列,人工核酸內(nèi)切酶技術(shù)為基因治療帶來了新的希望。將這項(xiàng)技術(shù)跟iPS等干細(xì)胞技術(shù)相結(jié)合,其應(yīng)用前景更是不可限量。這方面的工作目前主要集中在體外培養(yǎng)的人類細(xì)胞中,相關(guān)的嘗試包括使用ZFN破壞T細(xì)胞內(nèi) HIV入侵至關(guān)重要的受體蛋白CCR5[30]、使用TALEN介導(dǎo)的HDR原位修復(fù)鐮刀形紅細(xì)胞貧血癥、地中海貧血癥、隱性營(yíng)養(yǎng)不良性大皰性表皮松解 (Recessive dystrophic epidermolysis bullosa,RDEB) 等相關(guān)致病基因等[31-33]。這方面由于ZFN發(fā)展歷史較長(zhǎng),對(duì)其細(xì)胞毒性、脫靶活性等方面的研究也較為充分,因此目前在這個(gè)領(lǐng)域暫時(shí)走在前面。筆者相信,在不久的將來,TALEN和CRISPR/Cas系統(tǒng)會(huì)奮起直追,在這一領(lǐng)域大顯身手。同時(shí),由于這一領(lǐng)域?qū)τ诿摪行?yīng)的要求會(huì)格外嚴(yán)格,因此,CRISPR/Cas系統(tǒng)更需要在這方面充分研究和分析論證。
4) 在經(jīng)濟(jì)物種中的應(yīng)用。將人工核酸內(nèi)切酶應(yīng)用于經(jīng)濟(jì)動(dòng)物 (家禽家畜) 或經(jīng)濟(jì)植物(農(nóng)作物) 無疑也是一個(gè)非常令人期待的方向。通過特異性編輯和調(diào)控與家畜、作物相關(guān)性狀有關(guān)聯(lián)的基因,可實(shí)現(xiàn)對(duì)抗病、抗逆、產(chǎn)量、品質(zhì)、生長(zhǎng)條件等方面的性狀改良,有可能大大縮短育種周期,并且實(shí)現(xiàn)精準(zhǔn)育種。目前,在豬、牛等大型家畜[34-36]和家蠶、煙草、玉米等多種培養(yǎng)動(dòng)植物中均已有相關(guān)的嘗試和報(bào)道[37-38]。跟疾病治療方面的應(yīng)用類似,這方面的應(yīng)用也要特別注意安全性、脫靶活性等問題。此外,由于涉及到基因操作,EEN技術(shù)為傳統(tǒng)的轉(zhuǎn)基因作物的安全性評(píng)估與管理帶來了新的挑戰(zhàn),同時(shí),也為此帶來了新的思路和出路。
EEN的應(yīng)用絕不僅限于上述4個(gè)領(lǐng)域。例如,EEN技術(shù)還可以用于改造寵物的形態(tài)、行為等特征,使其更加多樣化、更貼近人類的需求等??傊珽EN技術(shù)既為生命科學(xué)基礎(chǔ)理論研究,又為跟人類健康與生活密切相關(guān)的經(jīng)濟(jì)物種改良和人類疾病治療帶來了全新的方法和希望。正是由于預(yù)見到其強(qiáng)勁的發(fā)展勢(shì)頭,TALEN和CRISPR/Cas系統(tǒng)分別被美國(guó)《科學(xué)》雜志評(píng)為2012和 2013年度的十大科學(xué)進(jìn)展之一,TALEN被譽(yù)為“基因組巡航導(dǎo)彈” (Genomic cruise missiles),CRISPR/Cas系統(tǒng)則被譽(yù)為“大眾化的基因組微型手術(shù)刀” (Genetic microsurgery for the masses)。一個(gè)全新的技術(shù)出現(xiàn)僅僅兩年之后,馬上又被另一個(gè)更新的技術(shù)所超越,回首各種生命科學(xué)研究技術(shù)的發(fā)展,這樣的例子可以說在歷史上絕無僅有。最后,一個(gè)令人感興趣的懸念是:CRISPR/Cas系統(tǒng)是反向遺傳學(xué)技術(shù)的終極版本嗎?還會(huì)有更簡(jiǎn)便的工具和/或方法出現(xiàn)嗎?讓我們拭目以待。
[1] Huang P, Xu LJ, Liang W, et al. Genomic deletion induced by Tol2 transposon excision in zebrafish.Nucleic Acids Res, 2012, 41(2): e36.
[2] Huang P, Zhu Z, Lin S, et al. Reverse genetic approaches in zebrafish. J Genet Genomics, 2012,39(9): 421–433.
[3] Nemudryi AA, Valetdinova KR, Medvedev SP, et al. TALEN and CRISPR/Cas genome editing systems: tools of discovery. Acta Naturae, 2014,6(3): 19–40.
[4] Kim YG, Cha J. Chandrasegaran S. Hybrid restriction enzymes: zinc finger fusions to Fok I cleavage domain. Proc Natl Acad Sci USA, 1996,93(3): 1156–1160.
[5] Bibikova M, Golic M, Golic KG, et al. Targeted chromosomal cleavage and mutagenesis in Drosophila using zinc-finger nucleases. Genetics,2002, 161(3): 1169–1175.
[6] Xiao A, Hu YY, Wang WY, et al. Progress in zinc finger nuclease engineering for targeted genome modification. Hereditas (Beijing), 2011, 33(7):665–683 (in Chinese).
肖安, 胡瑩瑩, 王唯曄, 等. 人工鋅指核酸酶介導(dǎo)的基因組定點(diǎn)修飾技術(shù). 遺傳, 2011, 33(7):665–683.
[7] Ramirez CL, Foley JE, Wright DA, et al.Unexpected failure rates for modular assembly of engineered zinc fingers. Nat Methods, 2008, 5(5):374–375.
[8] Xiao A, Wu YD, Yang ZP, et al. EENdb: a database and knowledge base of ZFNs and TALENs for endonuclease engineering. Nucleic Acids Res, 2013, 41(D1): D415–D422.
[9] Gabriel R, Lombardo A, Arens A, et al. An unbiased genome-wide analysis of zinc-finger nuclease specificity. Nat Biotechnol, 2011, 29(9):816–823.
[10] Pattanayak V, Ramirez CL, Joung JK, et al.Revealing off-target cleavage specificities of zinc-finger nucleases by in vitro selection. Nat Methods, 2011, 8(9): 765–770.
[11] Shen Y, Xiao A, Huang P, et al. TALE nuclease engineering and targeted genome modification.Hereditas (Beijing), 2013, 35(4): 395–409 (in Chinese).
沈延, 肖安, 黃鵬, 等. 類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶 (TALEN) 介導(dǎo)的基因組定點(diǎn)修飾技術(shù).遺傳, 2013, 35(4): 395–409.
[12] Boch J, Scholze H, Schornack S, et al. Breaking the code of DNA binding specificity of TAL-type III effectors. Science, 2009, 326(5959): 1509–1512.
[13] Moscou MJ, Bogdanove AJ. A simple cipher governs DNA recognition by TAL effectors.Science, 2009, 326(5959): 1501.
[14] Miller JC, Tan SY, Qiao GJ, et al. A TALE nuclease architecture for efficient genome editing.Nat Biotechnol, 2011, 29(2): 143–148.
[15] Moore FE, Reyon D, Sander JD, et al. Improved somatic mutagenesis in zebrafish using transcription activator-like effector nucleases(TALENs). PLoS ONE, 2012, 7(5): e37877.
[16] Mussolino C, Morbitzer R, Lütge F, et al. A novel TALE nuclease scaffold enables high genome editing activity in combination with low toxicity.Nucleic Acids Res, 2011, 39(21): 9283–9293.
[17] Li J, Zhang Y, Chen KL, et al. CRISPR/Cas: a novel way of RNA-guided genome editing.Hereditas (Beijing), 2013, 35(11): 1265–1273 (in Chinese).
李君, 張毅, 陳坤玲, 等. CRISPR/Cas系統(tǒng): RNA靶向的基因組定向編輯新技術(shù). 遺傳, 2013,35(11): 1265–1273.
[18] Jinek M, Chylinski K, Fonfara I, et al. A programmable dual-RNA-guided DNA endonuclease in adaptive bacterial immunity.Science, 2012, 337(6096): 816–821.
[19] Cong L, Ran FA, Cox D, et al. Multiplex genome engineering using CRISPR/Cas systems. Science,2013, 339(6121): 819–823.
[20] Mali P, Yang LH, Esvelt KM, et al. RNA-guided human genome engineering via Cas9. Science,2013, 339(6121): 823–826.
[21] Fu YF, Foden JA, Khayter C, et al. High-frequency off-target mutagenesis induced by CRISPR-Cas nucleases in human cells. Nat Biotechnol, 2013,31(9): 822–826.
[22] Hsu PD, Scott DA, Weinstein JA, et al. DNA targeting specificity of RNA-guided Cas9 nucleases. Nat Biotechnol, 2013, 31(9): 827–832.
[23] Mali P, Aach J, Stranges PB, et al. CAS9 transcriptional activators for target specificity screening and paired nickases for cooperative genome engineering. Nat Biotechnol, 2013, 31(9):833–838.
[24] Pattanayak V, Lin S, Guilinger JP, et al.High-throughput profiling of off-target DNA cleavage reveals RNA-programmed Cas9 nuclease specificity. Nat Bitechnol, 2013, 31(9): 839–843.
[25] Ran FA, Hsu PD, Lin CY, et al. Double nicking by RNA-guided CRISPR Cas9 for enhanced genome editing specificity. Cell, 2013, 154(6): 1380–1389.
[26] Lee HJ, Kim E, Kim JS. Targeted chromosomal deletions in human cells using zinc finger nucleases. Genome Res, 2010, 20(1): 81–89.
[27] Xiao A, Wang ZX, Hu YY, et al. Chromosomal deletions and inversions mediated by TALENs and CRISPR/Cas in zebrafish. Nucleic Acids Res,2013, 41(14): e141.
[28] Urnov FD, Miller JC, Lee YL, et al. Highly efficient endogenous human gene correction using designed zinc-finger nucleases. Nature, 2005,435(7042): 646–651.
[29] Zu Y, Tong XJ, Wang ZX, et al. TALEN-mediated precise genome modification by homologous recombination in zebrafish. Nat Methods, 2013,10(4): 329–331.
[30] Perez EE, Wang JB, Miller JC, et al. Establishment of HIV-1 resistance in CD4+T cells by genome editing using zinc-finger nucleases. Nat Biotechnol,2008, 26(7): 808–816.
[31] Ma N, Liao BJ, Zhang H, et al. Transcription activator-like effector nuclease (TALEN)-mediated gene correction in integration-free β-thalassemia induced pluripotent stem cells. J Biol Chem, 2013,288(48): 34671–34679.
[32] Osborn MJ, Starker CG, McElroy AN, et al.TALEN-based gene correction for epidermolysis bullosa. Mol Ther, 2013, 21(6): 1151–1159.
[33] Sun N, Zhao HM. Seamless correction of the sickle cell disease mutation of the HBB gene in human induced pluripotent stem cells using TALENs.Biotechnol Bioeng, 2014, 111(5): 1048–1053.
[34] Lillico SG, Proudfoot C, Carlson DF, et al. Live pigs produced from genome edited zygotes. Sci Rep, 2013, 3: 2847.
[35] Proudfoot C, Carlson DF, Huddart R, et al. Genome edited sheep and cattle. Transgenic Res, 2015,24(1): 147–153.
[36] Tan WF, Carlson DF, Lancto CA, et al. Efficient nonmeiotic allele introgression in livestock using custom endonucleases. Proc Natl Acad Sci USA,2013, 110(41): 16526–16531.
[37] Belhaj K, Chaparro-Garcia A, Kamoun S, et al.Editing plant genomes with CRISPR/Cas9. Curr Opin Biotechnol, 2015, 32: 76–84.
[38] Daimon T, Kiuchi T, Takasu Y. Recent progress in genome engineering techniques in the silkworm,Bombyx mori. Dev Growth Differ, 2014, 56(1):14–25.