李文,曹俊國,曹滿園,李丹麗,許保增
(中國農(nóng)業(yè)科學(xué)院特產(chǎn)研究所特種經(jīng)濟(jì)動物分子生物學(xué)重點(diǎn)實(shí)驗室,長春 130112)
基因編輯是一種對生物體基因組特定位點(diǎn)進(jìn)行精確修飾的技術(shù),通過對基因片段的敲除、敲入及替換,實(shí)現(xiàn)對生物體某一特性或性狀的改變。最早的基因編輯技術(shù)出現(xiàn)在1986年,Thomas 等[1]通過基因打靶成功將抗藥基因?qū)胄旅顾乜顾幦毕菁?xì)胞,使細(xì)胞重新恢復(fù)抗藥性,其主要是利用了基因的同源重組原理。隨后,基因編輯技術(shù)不斷發(fā)展完善,先后出現(xiàn)了人工鋅指核酸酶(Zinc finger nucleases,ZFN)技術(shù)、類轉(zhuǎn)錄激活因子效應(yīng)物核酸酶(Transcription activator-like effector nucleases,TALENs)技術(shù),與傳統(tǒng)基因編輯技術(shù)相比,新型技術(shù)具有更高的效率和打靶準(zhǔn)確率,在生物基礎(chǔ)研究、基因治療、遺傳改造等領(lǐng)域展現(xiàn)了巨大的潛力。2013年,Zhang 等[2]開發(fā)了利用規(guī)律性重復(fù)短回文序列簇(Clustered regularly interspaced short palindromic repeats/Cas endonuclease,CRISPR/Cas)系統(tǒng)對基因靶向編輯的新技術(shù),大幅度提高了基因編輯的效率和可靠性,且相比前兩種技術(shù),其操作更加簡便、成本較低。CRISPR/Cas 成為第3 代新型基因編輯技術(shù),適用于包括生物技術(shù)、醫(yī)藥及臨床在內(nèi)的多種生物領(lǐng)域,掀起了國內(nèi)、外基因編輯的熱潮。
ZFN、TALEN 及CRISPR 技術(shù)都可以認(rèn)為是一種用來糾正和編輯遺傳缺陷的基因剪刀,三者在工具或方法上有差異,但原理基本是相同的。通過誘導(dǎo)雙鏈DNA 斷裂(DNA double strand breaks,DSBs),激活DNA 的自我修復(fù)機(jī)制,包括非同源末端連接修復(fù)(Non-homologous end-joining ,NHEJ)或同源重組修復(fù)(Homology-directed repair,HDR)兩條途徑。NHEJ是一種低保真度的修復(fù)過程,在DSBs 修復(fù)重連的過程中易發(fā)生堿基的隨機(jī)插入或丟失,導(dǎo)致移碼突變使基因失活, 實(shí)現(xiàn)目的基因敲除。若存在一個外源性供體基因序列,NHEJ 也會將其連入DSBs 位點(diǎn),從而實(shí)現(xiàn)定點(diǎn)的基因敲入。而HDR 過程相對具有較高的保真度,在一個帶有同源臂的重組供體存在的情況下,供體中的外源目的基因會通過同源重組過程完整的整合到靶位點(diǎn),不會出現(xiàn)隨機(jī)的堿基插入或丟失。如果在一個基因兩側(cè)同時產(chǎn)生DSB,在一個同源供體存在的情況下,可以進(jìn)行原基因的替換。
鋅指核酸酶由特異識別DNA 的鋅指蛋白(Zinc finger protein,ZFP)和FokⅠ核酸內(nèi)切酶的剪切結(jié)構(gòu)域兩部分構(gòu)成,是一種人工合成的融合蛋白。鋅指結(jié)構(gòu)(ZF)是ZFP的基本結(jié)構(gòu)單位,存在于大多數(shù)蛋白質(zhì)中的一種蛋白基序,1983年首次在非洲爪蟾的轉(zhuǎn)錄因子TFⅢA 中被發(fā)現(xiàn)[3]。ZF 在不同的物種間具有差異性,至今已發(fā)現(xiàn)了十幾種不同結(jié)構(gòu),主要表現(xiàn)在鋅指數(shù)目和相鄰鋅指間連接長度的不同。鋅指核酸酶的N 端是多個Cys2-His2 鋅指蛋白組成,每個蛋白可以識別DNA 雙螺旋大溝的3bp 片段,同時早期有研究發(fā)現(xiàn),帶有3 個ZFP 的結(jié)構(gòu)域能識別出9-18bp 的DNA 序列[3]。因此,可以構(gòu)造不同的ZFP 結(jié)構(gòu)域來特異識別DNA片段,目前,構(gòu)造方法主要有直接構(gòu)造法、模塊組裝法、文庫篩選Wolfe 庫、CoDA 法等。其中,應(yīng)用較多的一種是模塊組裝法,即通過鋅指模塊(能識別連續(xù)3 個堿基的鋅指作為1 個“模塊”)預(yù)選庫進(jìn)行大量組合,能夠識別多達(dá)64 種核苷酸三聯(lián)體[4]。另一種寡聚體庫工程法產(chǎn)生的ZFNs 對靶基因有更高的親和性和特異性,但此方法目前未能設(shè)計出針對任意序列的核酸酶。將人工設(shè)計產(chǎn)生的ZFP 與非特異性FokⅠ剪切結(jié)構(gòu)域結(jié)合形成具有活性的二聚體,即可對目標(biāo)基因進(jìn)行特異剪切。
ZFN 作為第一項被廣泛使用的基因剪切工具,在小鼠、大鼠、玉米、斑馬魚及人類細(xì)胞中的技術(shù)建立已經(jīng)較為成熟。2002年,Bibikova 等[5]利用ZFN 成功敲除果蠅X染色體上的Yellow基因,并且此變異能夠穩(wěn)定遺傳到下一代,證明了ZFN可應(yīng)用于動物的轉(zhuǎn)基因研究。2010年,Watanabe 等[6]用ZFN 將豬原代成纖維細(xì)胞中穩(wěn)定表達(dá)的增強(qiáng)型綠色熒光蛋白成功敲除,經(jīng)檢測分析,ZFN 誘導(dǎo)的突變包括在其切割位點(diǎn)的堿基插入或敲除、替換,為轉(zhuǎn)基因豬的模型建立提供了一個方向。盡管ZFN 已在各領(lǐng)域廣泛應(yīng)用,但仍存在一些問題:1)ZFN 設(shè)計成本大、耗時長,并且目前不能設(shè)計針對任意靶基因序列相應(yīng)的ZFN;2)ZFN 切割后的細(xì)胞易產(chǎn)生毒性,且脫靶效應(yīng)較高;3)目前尚無法實(shí)現(xiàn)人工鋅指核酸酶的大規(guī)模生產(chǎn)和高效篩選。
與ZFN 類似,TALEN 是由特異識別結(jié)合DNA 的Tale 蛋白和FokI 核酸內(nèi)切酶融合組成。Tale 蛋白是一類從植物病原菌黃單胞菌屬分離出的效應(yīng)蛋白。2009年,Moscou[7]發(fā)現(xiàn)了Tale 蛋白特異識別并結(jié)合DNA 的作用機(jī)制。2011年,Cermak[8]首次將改造的Tale蛋白與FokI核酸內(nèi)切酶構(gòu)建了TALEN技術(shù),并證實(shí)其能定向修飾基因組,此后有大量實(shí)驗證明,此技術(shù)在人類細(xì)胞、小鼠、大鼠、斑馬魚等不同物種均適用[9-11]。Tale 蛋白結(jié)構(gòu)包括N 端轉(zhuǎn)運(yùn)信號、C 端核定位信號和轉(zhuǎn)錄激活結(jié)構(gòu)域,中間是一段高度保守的串聯(lián)重復(fù)區(qū)。串聯(lián)重復(fù)區(qū)一般由1.5~33.5 個基本單元組成,每個基本單元包含33~35 個氨基酸殘基,其中第12 位和第13 位殘基存在差異,其他位氨基酸殘基相同。因此,第12 位和第13 位殘基又稱為重復(fù)可變雙殘基(Repeat variable di-residue,RVD),決定了Tale 蛋白與DNA 堿基的特異識別。另外,有研究認(rèn)為,第12 位殘基主要起穩(wěn)定RVD 環(huán)的作用,而第13 位氨基酸殘基才真正具有特異識別堿基的功能[12]。RVD 與堿基的識別具有穩(wěn)定的一一對應(yīng)關(guān)系:NI(Asn 和Ile)識別A 堿基、HD(His 和Asp)識別C 堿基、NG(Asn 和Gly)識別T堿基、NN(Asn)識別G/A 堿基及NS(Asn 和Ser)可任意識別4 種堿基[13]。每個基本單元可識別一個核苷酸,并可以任意順序組合。因此,在識別靶序列的特異性上,TALEN 比ZFN 更具有明顯優(yōu)勢。
隨著對TALEN 的深入探索,對靶位點(diǎn)的選擇變得更加靈活,使其在基因修飾中應(yīng)用日益廣泛。尋找一種便捷、成本低且效果好的TALE 蛋白合成方式成為TALEN 建立的一個關(guān)鍵點(diǎn)。目前,人工構(gòu)建TALE方法主要有:1)Gateway 組裝法,最早的構(gòu)建方法[14],缺點(diǎn)是成本高且成功率低;2)Golden Gate 組裝法,其主要特點(diǎn)是利用BsaI、BsmBI 等限制性核酸內(nèi)切酶產(chǎn)生多個不同的黏性末端,再用連接酶拼接成所預(yù)想的Tale 重復(fù)單元,實(shí)現(xiàn)多個模塊的高效連接[15]。此外,還有限制性酶切連接法、單元組裝法等。
CRISPR 普遍存在于90%古細(xì)菌和40%細(xì)菌中,最早是1987年日本學(xué)者在Escherichia coli 染色體上發(fā)現(xiàn)的[16],但在當(dāng)時其蘊(yùn)含的生物學(xué)意義并沒有被人所察覺。直到2005年,有報道稱CRISPR 能夠通過入侵的噬菌體DNA獲得一段新的DNA序列,且與細(xì)菌的天然免疫防御有關(guān)[17]。2012年,研究發(fā)現(xiàn),CRISPR/Cas9 實(shí)際上是一種由RNA 引導(dǎo)的核酸內(nèi)切酶[18],能夠靶向切割再次入侵的外來基因組,用來引導(dǎo)的RNA 被稱為向?qū)NA(guideRNA,gRNA,又被稱為crRNA)。2013年,CRISPR/Cas9 技術(shù)正式用于DNA 編輯修飾中,與前兩種技術(shù)相比,該技術(shù)的構(gòu)建成本大大降低、操作更加便捷、編輯效率也更高效,其不斷地研究發(fā)現(xiàn)及應(yīng)用為生物學(xué)領(lǐng)域的發(fā)展帶來巨大變革。
CRISPR 系統(tǒng)根據(jù)CAS 蛋白的不同分為3 種,其中Ⅰ型和Ⅲ型依靠多個效應(yīng)蛋白共同發(fā)揮作用;Ⅱ型僅需單一效應(yīng)蛋白,如Cas9、Cpf1、C2c1、C2c2 蛋白等。因此,建立以單個效應(yīng)蛋白為基礎(chǔ)的CRISPR 平臺成為首選。不局限于基因組編輯,近年來,一種新型核酸C2c2(現(xiàn)被稱為Cas13a)被發(fā)現(xiàn)[19],DNA和RNA都可編輯,現(xiàn)已應(yīng)用于病毒細(xì)菌檢測、癌癥早期診斷及遺傳疾病治療等多方面,其應(yīng)用價值非常具有潛力。
CRISPR基因座主要由一段前導(dǎo)區(qū)(Leader)、多個高度保守的重復(fù)序列(Repeats)和高度可變的間隔序列(Spacers)交叉排列組成[20]。crRNA 便是由Spacer轉(zhuǎn)錄得來。CRISPR 基因座前是一段Cas 基因,用來合成相關(guān)蛋白。Cas 基因前有一段被稱為促crRNAs成熟的轉(zhuǎn)錄活化RNA(Trans-activating crRNA,tracrRNA)的區(qū)域,作用是與crRNA 結(jié)合構(gòu)成RNA 雙鏈體tracerRNA:crRNA,引導(dǎo)Cas9 蛋白對靶序列進(jìn)行切割。
天然Ⅱ型CRISPR/CAS 防御機(jī)理主要分為3 個階段。第1 階段,整合外來噬菌體或質(zhì)粒的一小段基因片段構(gòu)成新的間隔序列;第2 階段,由spacer區(qū)域轉(zhuǎn)錄的前體crRNA,在Cas 蛋白和核酸酶的作用下形成成熟的crRNA,成熟的crRNA 與tracerRNA 和Cas9合成復(fù)合體;第3 階段,單鏈引導(dǎo)RNA(sgRNA)識別入侵的DNA 片段與之結(jié)合,指導(dǎo)核糖核蛋白復(fù)合體對其進(jìn)行切割。其中在第3 階段,Cas9 蛋白通過與原間隔區(qū)序列鄰近基序(Protospacer adjacent motif,PAM)和sgRNA 共同作用,識別PAM 位點(diǎn),對PAM臨近序列進(jìn)行解旋,緊接著Cas9 蛋白發(fā)生構(gòu)象重排具有切割活性,對2 條單鏈DNA 切割。
CRISPR/Cas9 系統(tǒng)主要由特異引導(dǎo)gRNA 和內(nèi)切酶Cas9 2 部分構(gòu)成。其基本工作原理是根據(jù)目標(biāo)序列設(shè)計出gRNA,5'端序列與靶基因互補(bǔ)以及3'端序列能與Cas9 結(jié)合,從而定位PAM 前3~5 個堿基距離的任一序列進(jìn)行敲除、插入及突變等修飾。對于gRNA的設(shè)計可以通過在線網(wǎng)站(Optimized CRISPR Design.com 等)進(jìn)行。該系統(tǒng)能否順利發(fā)揮作用的關(guān)鍵之一就是避免脫靶問題,這是gRNA 設(shè)計中的重要一點(diǎn),目前脫靶效應(yīng)的解決仍處在初期階段,但一些準(zhǔn)則及設(shè)計算法已被提出,利用生物學(xué)信息工具盡可能選擇出特異性最強(qiáng)的目的序列,如一些脫靶效應(yīng)評估軟件等。
對于轉(zhuǎn)運(yùn)CRISPR/Cas9 進(jìn)入細(xì)胞,目前主要有3種方式:1)利用質(zhì)粒載體,將帶有Cas9 基因片段和gRNA 基因片段的質(zhì)粒轉(zhuǎn)入細(xì)胞體內(nèi),在細(xì)胞內(nèi)通過轉(zhuǎn)錄翻譯表達(dá)Cas9 蛋白,其不足之處在于其過程可能需要較長的時間,且存在脫靶問題,易引起機(jī)體自身免疫反應(yīng)[21,22];2)轉(zhuǎn)運(yùn)Cas9mRNA 和人工合成的gRNA,此方法相較于質(zhì)粒轉(zhuǎn)染脫靶率低、生物毒性低[23],但此方法的穩(wěn)定性最差;3)將帶有定位信號(NLS)的純化Cas9 蛋白以活性形式導(dǎo)入細(xì)胞,例如,使用iTOP(Induced transduction by osmocytosis and pro-panebetaine)運(yùn)載系統(tǒng)可有效的將蛋白質(zhì)與其他化合物導(dǎo)入細(xì)胞內(nèi),有研究表明iTOP 運(yùn)載Cas9/gRNA復(fù)合體進(jìn)入人體胚胎干細(xì)胞,其基因編輯效率達(dá)到26%[24]。目前,質(zhì)粒轉(zhuǎn)運(yùn)是最常使用也較為穩(wěn)定的一種方式,但隨著蛋白質(zhì)和核酸運(yùn)載體的發(fā)展,或許能為CRISPR/Cas9 的轉(zhuǎn)載提供更為安全有效的思路。
基因編輯的目的之一是為了實(shí)現(xiàn)基因治療,嘗試從基因水平上對遺傳疾病的發(fā)生進(jìn)行調(diào)控,因此,基礎(chǔ)動物模型的構(gòu)建是關(guān)鍵的一步。自CRISPR/Cas9 技術(shù)應(yīng)用以來,被廣泛用于生物模型的建立。2013年,3個實(shí)驗室成功實(shí)現(xiàn)了對小鼠細(xì)胞的單基因、雙基因及多基因的敲除[25-27]。同年,Hwang 等[28]利用CRISPR系統(tǒng)成功在斑馬魚胚胎中進(jìn)行基因的定點(diǎn)修飾,為脊索動物的研究提供了合適的模式生物。Friedland 等[29]用顯微注射將攜帶gRNA/cas9 的質(zhì)粒轉(zhuǎn)入秀麗線蟲胚胎中,實(shí)現(xiàn)了個體水平的基因敲除。2014年,中國科研人員首次利用CRISPR/Cas9 對食蟹猴進(jìn)行精確基因編輯,獲得了一批定向突變的基因工程猴[30],由于靈長類動物與人類同源性較高,這一研究為之后人類疾病的研究提供了很好的研究模型。
培育攜帶遺傳缺陷的小鼠品系是研究癌癥相關(guān)突變作用的一種方法,然而常規(guī)培育癌突變小鼠耗時耗力。2014年,Zhang等[31]找到了一種替代方法,用CRISPR 系統(tǒng)將致癌突變基因?qū)氤赡晷∈蟾闻K中,建立攜帶癌基因的小鼠模型,大大降低了研究成本,為癌癥的多方面研究提供了便利。在癌癥小鼠模型中,對體內(nèi)功能性變異進(jìn)行高通量檢測,用sgRNA 進(jìn)行標(biāo)記,繪制小鼠體內(nèi)腫瘤抑制因子的臨時功能癌癥基因組圖譜[32],揭示了在免疫功能小鼠中多種突變導(dǎo)致的肝癌發(fā)生,而以往的研究只針對一些經(jīng)典的致癌基因,缺乏對癌癥發(fā)生過程中其他基因作用的全面評估。
此外,Pcsk9 基因的缺失能夠降低心臟病的發(fā)病率[33],因此,有學(xué)者用眼球注射的方法將靶向作用Pcsk9 基因的gRNA/Cas9 載體轉(zhuǎn)入小鼠體內(nèi),結(jié)果表明,小鼠肝臟細(xì)胞中50%的Pcsk9 產(chǎn)生突變,其表達(dá)量也下降了90%[34]。盡管尚未驗證在人體內(nèi)敲除Pcsk9是否會出現(xiàn)副作用,但是這是科學(xué)家首次嘗試用CRISPR/Cas9 系統(tǒng)敲除基因進(jìn)行基因治療,證明了其可行性。此外,酪氨酸血癥、高血氨癥、杜氏肌營養(yǎng)不良(DMD)、視網(wǎng)膜營養(yǎng)不良等疾病的治療研究中,都嘗試了在小鼠模型中進(jìn)行基因敲除治療。
目前,大量關(guān)于CRISPR/Cas9 的基因治療試驗已有報道,揭示了技術(shù)上存在的問題:DNA傳遞效率不理想、HDR 效率較低、脫靶效應(yīng)等。但盡管如此,CRISPR/Cas9系統(tǒng)的高效性仍使其在基因治療中展現(xiàn)了巨大潛力,理論上基因組中每8 個堿基就能找到一個編輯位點(diǎn)(PAM 序列),基本可以實(shí)現(xiàn)任意序列位置的修飾,且操作簡單。
隨著基因編輯技術(shù)的不斷發(fā)展進(jìn)步,各領(lǐng)域的應(yīng)用也有了更大的空間。除了在基因組編輯方面的應(yīng)用外,Mazhar Adli[35]教授利用CRISPR/Cas9 技術(shù)首次實(shí)現(xiàn)了實(shí)時觀測活細(xì)胞內(nèi)基因運(yùn)動,讓人們能夠以三維的視角觀測基因在細(xì)胞內(nèi)的運(yùn)動路徑及位置。這種全新的視角指明了一種從未有過的方式,通過觀察基因的三維定位來探究基因是如何工作及基因之間的相互作用。
目睹眾多生物的基因組的快速發(fā)展是令人興奮的,在這個過程中,CRISPR/Cas9 系統(tǒng)已經(jīng)成為許多實(shí)驗室的首選工具,成為一種多用途的基因組編輯工具。自從報道利用CRISPR-Cas 進(jìn)行基因組編輯以來,基因組學(xué)及生物醫(yī)學(xué)等在過去5年中取得了相當(dāng)大的進(jìn)展和突破。這些技術(shù)為建立研究、診斷和治療工具提供了一個基礎(chǔ),具有前所未有的簡單性、精確性和多功能性。這些工具將加深我們對疾病機(jī)制的理解,并擴(kuò)大我們對生物基因網(wǎng)絡(luò)的認(rèn)識。消除許多無法治愈的疾病,如癌癥、先天性遺傳疾病等,在可預(yù)見的未來都是有希望實(shí)現(xiàn)的。盡管目前這些技術(shù)尚處在初級階段,但隨著科研人員的不斷探索發(fā)現(xiàn),這些新技術(shù)將帶來真正的價值和效益。