謝曉蕾,李求春(揚州大學(xué)生物科學(xué)與技術(shù)學(xué)院,江蘇揚州225009)
在生物進化歷史中,細菌一直受到諸多外源因素的侵擾,噬菌體是其中具有極大威脅的一種,因而細菌在生存壓力下進化出了多種抵抗噬菌體干擾的機制,如DNA注入抑制、吸附抑制、無效感染等[1]。在細菌體內(nèi),基因干擾途徑可以通過基因序列保證自身基因的正常表達,同時維持基因組的完整性。該途徑的重要性表現(xiàn)在真核生物中即為RNA干擾,另外在很多細菌和古生菌中也存在類似的干擾途徑[2]。短回文重復(fù)序列CRISPR及其相關(guān)Cas(CRISPR associated)基因為大多數(shù)細菌以及古細菌提供了一套新的免疫防御系統(tǒng),以抵御外界遺傳物質(zhì)的入侵,從而維持自身遺傳信息的完整性。任何免疫系統(tǒng)的基本要求之一就是能夠產(chǎn)生免疫記憶,從而能有效地應(yīng)對再次感染。CRISPR-Cas免疫系統(tǒng)的特征在于它能記錄入侵的外源DNA序列,并以間隔序列的形式將其整合到自身的DNA序列中,從而產(chǎn)生免疫記憶。間隔序列經(jīng)轉(zhuǎn)錄后形成一段短的反義RNA,可與再次入侵的外源DNA序列互補配對,并在Cas蛋白的作用下,使其降解[3],從而抑制外源DNA的轉(zhuǎn)錄和翻譯,使噬菌體無法在細菌體內(nèi)生存和繁殖。
1987年,日本大阪大學(xué)課題組在研究E.coli K12的堿性磷酸酶時,在該酶的編碼基因附近觀察到一段串聯(lián)間隔重復(fù)序列,隨后研究中發(fā)現(xiàn)這種間隔重復(fù)序列廣泛存在于細菌和古生菌的基因組中[1,4]。MOJICA 等[5]于 2000年提出把CRISPR作為重復(fù)序列家族的一類成員,并將其命名為Short Regularly Spaced Repeats(SRSRs)。直到2002年,JANSEN等[6]才將其正式命名為 clustered regularly interspaced short palindromic repects(CRISPR),以更準確的描述這一重復(fù)序列的獨特結(jié)構(gòu)特征。隨著CRISPR的發(fā)現(xiàn),CRISPR的功能逐漸被揭示。2005年,3個研究小組均發(fā)現(xiàn)CRISPR的間隔序列與宿主菌染色體外的遺傳物質(zhì)高度同源,推測其可能作為細菌的免疫系統(tǒng)以抵抗外源遺傳物質(zhì)的入侵[7-11]。BARRANGOU等[12]首次在嗜熱鏈球菌(Streptococcus thermophilus)中發(fā)現(xiàn)并通過試驗證實,細菌能通過CRISPR系統(tǒng)抵抗噬菌體的入侵。隨后MARRAFFINI等[13]也發(fā)現(xiàn)在葡萄球菌中CRISPR系統(tǒng)能夠阻止外源基因的水平轉(zhuǎn)移,同時防止耐藥性的產(chǎn)生,從此揭開了CRISPR系統(tǒng)作用機制研究的序幕。2013年,CRISPR介導(dǎo)的基因定位編輯技術(shù)出現(xiàn),研究人員利用這一系統(tǒng)對人類細胞、小鼠、大鼠、斑馬魚、細菌、果蠅、農(nóng)作物等多種生物的基因進行定向缺失、插入、激活或抑制等遺傳改造操作,從而證明了CRISPR技術(shù)的廣泛應(yīng)用價值。
最近更新的CRISPR數(shù)據(jù)庫顯示,在已完成全基因組測序的90%古生菌和約40%細菌中均可鑒定出至少一個CRISPR位點。不同菌株中的CRISPR位點數(shù)量不同,一個原核細胞基因組中通常存在1至幾個CRISPR位點[7]。其中詹氏甲烷球菌(Methanocaldococcus jannaschii)的染色體上存在18個CRISPR位點,在目前已研究的原核生物中排第一位[14]。CRISPR位點大多定位在染色體上,只有個別出現(xiàn)在質(zhì)粒中[15]。
根據(jù)Cas基因核心原件序列的不同,CRISPR/Cas免疫系統(tǒng)可分為3種類型,每一種類型具有很多亞型。目前應(yīng)用最廣泛的是II型,也是3種類型中最為簡單的一類。I型系統(tǒng)最為復(fù)雜,需要6個Cas蛋白參與,其中Cas3蛋白對CRISPR功能的發(fā)揮至關(guān)重要,該蛋白具有解旋酶活性及DNA酶活性,是干擾階段的主要作用酶[16]。Ⅱ型系統(tǒng)的組成相對較簡單,以Cas9蛋白為核心。干擾階段,RNAseⅢ在Cas9蛋白存在的情況下發(fā)揮作用,Cas9蛋白協(xié)助crRNA(CRISPR RNA)的成熟,并參與外源DNA的剪切[17]。在Ⅲ型系統(tǒng)中,Cas6主要參與crRNA的成熟,加工過后的crRNA被運送至特殊的Cas剪切復(fù)合體中發(fā)揮導(dǎo)向作用[18]。
CRISPR主體為CRISPR基因座(CRISPR locus),基因座上游含有一段前導(dǎo)序列(leader sequence,LS)以及與CRISPR功能相關(guān)的基因(CRISPR-associated genes,Cas genes),三者共同構(gòu)成了CRISPR系統(tǒng)。
3.1 CRISPR基因座 CRISPR基因座由簡短穩(wěn)定的同向重復(fù)序列(direct repect,DR)和長度相近的非重復(fù)的間隔序列(spacer)間隔排列而成,稱為R-S結(jié)構(gòu)。其中重復(fù)序列的片段長度在21~48 bp[19],且含有5~7 bp的回文序列,通常能形成穩(wěn)定的莖環(huán)結(jié)構(gòu),間隔序列的長度在26~72 bp,可能來源于噬菌體、質(zhì)粒等外源DNA序列。
3.2 cas基因 cas基因是存在于CRISPR位點附近的一系列基因,cas基因簇通常由4~10個保守基因組成[20],它表達出的cas蛋白對CRISPR防御機制的實現(xiàn)不可或缺。cas基因根據(jù)其保守程度可分為核心cas基因、亞型特異性cas基因和重復(fù)序列相關(guān)未知蛋白(repeat-associatedmysteriousproteins,RAMP)組件基因[21]。cas1~6基因廣泛存在于各種CRISPR亞型中,故被稱為核心cas基因,其編碼蛋白的功能現(xiàn)已初步得到證實,例如,Cas1和Cas2蛋白在所有CRISPR類型中均存在,主要在獲取新的重復(fù)序列過程中發(fā)揮作用[22],Cas3則具有核酸酶和解旋酶的功能,主要作用是剪切目標基因[23]。
3.3 Leader序列 前導(dǎo)序列由300~500 bp堿基組成,位于CRISPR的5'端,與第一個重復(fù)序列直接相連,是一段在物種內(nèi)相對保守的AT富集的區(qū)域[24]。研究發(fā)現(xiàn),新的R-S總是插入前導(dǎo)序列和第一個重復(fù)序列之間,表明前導(dǎo)序列是新插入序列的識別位點,也有研究指出,它能夠作為啟動子,啟動CRISPR基因座的轉(zhuǎn)錄[7]。
CRISPR/Cas是一種防御系統(tǒng),用以保護細菌和古細菌不受外來物質(zhì)的侵害。這些生物基因組中的CRISPR位點能表達出與入侵病毒基因組序列匹配的crRNA,當微生物再次感染這種病毒時,crRNA能通過互補配對與病毒基因組結(jié)合,并表達出相關(guān)的Cas酶,這些酶能夠切割病毒DNA,從而阻止病毒的基因表達。研究證明,CRISPR作用機制可大致分為3個階段:適應(yīng)階段、表達階段和干擾階段[25]。
適應(yīng)階段:在外源物質(zhì)入侵宿主菌后,外來噬菌體或質(zhì)粒上的一小段DNA序列(前間區(qū)序列,protospacers)會以非同源重組的方式被整合到宿主菌的基因組中,整合的位置位于前導(dǎo)序列與第一個重復(fù)序列之間[12],且每插入一段外源序列都會伴隨著一次重復(fù)序列的復(fù)制,從而形成新的R-S結(jié)構(gòu)。這一過程使得宿主CRISPR含有外源序列信息,為干擾階段發(fā)揮作用提供基礎(chǔ)。宿主對外源DNA序列的選擇也并非隨機的,研究發(fā)現(xiàn),在前間區(qū)序列附近含有一些特定序列稱為前間區(qū)序列鄰近序列(protospacer adjacent motifs,PAMs),如嗜熱鏈球菌的 NNAGAAW 序列[26],不同 CRISPR亞型對于PAM的識別具有特異性。目前,對于CRISPR攝取外源基因的作用機制尚不清楚,有待進一步研究。
表達階段:CRISPR基因座首先被轉(zhuǎn)錄成一段長鏈的RNA,稱為CRISPR RNA前體(Pre-crRNA),同時,Cas蛋白將形成一個具有內(nèi)切酶功能的復(fù)合物,特異性地將crRNA切割加工成小的成熟crRNA。成熟的crRNA會與Cas蛋白復(fù)合物結(jié)合形成具有特殊功能的Cas/crRNA作用復(fù)合體,在干擾階段發(fā)揮作用。
干擾階段:當宿主再次接觸到外界噬菌體或質(zhì)粒時,crRNA便會與其同源的外源核酸特異性結(jié)合,而后通過Cas/crRNA作用復(fù)合體將外源核酸切割成碎片,使其無法行使功能,從而達到保護宿主基因組的目的。
5.1 基因定點改造 近年來,RNA干擾(RNAi)、鋅指核酸酶(ZFNs)、轉(zhuǎn)錄激活因子樣效應(yīng)因子核酸酶(TALENs)已應(yīng)用于多種類型的細胞和生物模型的基因改造,而CRISPR/Cas作為一種全新的基因定點改造技術(shù)引起了國內(nèi)外學(xué)者的廣泛關(guān)注。
RNAi是一種相對快速、廉價、高通量的基于全基因組的基因定向敲除技術(shù)。然而,該技術(shù)的敲除效果仍不夠理想,不同批次試驗以及不同實驗室的試驗結(jié)果都會有所差異,同時也存在不可預(yù)知的脫靶情況,所以該方法目前僅用于需要暫時抑制基因發(fā)揮功能的試驗中,因此局限性大,實用性不強。
ZFNs,又名鋅指蛋白核酸酶,是一種人工改造的核酸內(nèi)切酶,由一個DNA識別域和一個非特異性核酸內(nèi)切酶構(gòu)成。該技術(shù)能夠?qū)Π谢蜻M行定點切割和基因敲除,可顯著提高同源重組率,是一種高效成熟的基因改造技術(shù)。然而ZNFs雖然具有較高的特異性和精確性,但也會發(fā)生極低概率的脫靶事件[27]。
TALENs是一種嶄新的分子生物學(xué)工具。研究發(fā)現(xiàn),來自植物細菌黃單孢桿菌(Xanthomonas sp.)TAL蛋白的核酸結(jié)合域的氨基酸序列與其靶位點的核酸序列有恒定的對應(yīng)關(guān)系,因而利用TAL的序列模塊,即可組裝成特異的蛋白結(jié)構(gòu)域以結(jié)合任意DNA序列,從而達到定向改造內(nèi)源基因的目的。目前,TALEN的研究尚處于起步階段,其優(yōu)點很明顯,但在識別的特異性方面和免疫性方面也存在一定的局限性。
ZFNs和TALENs都是利用蛋白質(zhì)來定位靶序列,這些蛋白質(zhì)通常很難生成而且成本昂貴。而CRISPRs利用的是RNA,使得設(shè)計它們變得較為容易,因而具有很好的應(yīng)用前景。
2013年1月份美國2家實驗室在《Science》雜志發(fā)表了基于CRISPR-Cas技術(shù)在細胞系中進行基因敲除的新方法,該技術(shù)與以往的技術(shù)不同,是利用位點特異性的crRNA將Cas9核酸酶帶到基因組上的具體靶位點,從而對特定基因位點進行切割。該技術(shù)又迅速被運用到基因敲除小鼠和大鼠動物模型的構(gòu)建中,這意味著一種全新的基因定點改造系統(tǒng)(CRISPR/Cas9)已經(jīng)出現(xiàn),其特點是制作簡單,成本低,作用高效。
5.2 分子分型 對于同一個物種,CRISPR位點的重復(fù)序列絕大多數(shù)非常保守[28-29];而間隔序列則具有很強的多態(tài)性,即使在同一物種的不同菌株間,間隔序列也往往不同,該性質(zhì)使得CRISPR位點可以作為細菌分子分型的一個高分辨率的標準[8-9]。SCHOULS 等[30]采用 CRISPR 分型方法對184株空腸彎曲菌進行了分型,分型結(jié)果與AFLP、MLST一致性較高。此外,法國研究者對來源于130個血清型的783株沙門菌的CRISPR進行了研究,結(jié)果表明,CRISPR序列的多態(tài)性與血清型和多位點序列型有著密切的聯(lián)系,說明CRISPR對于沙門菌具有較高的分辨率,可用于分型研究。同時還建立了間隔序列數(shù)據(jù)庫,為沙門菌分型和基因分型提供數(shù)據(jù)支持,也為菌株溯源追蹤提供信息[31]。CRISPR分型方法與傳統(tǒng)的分型方法相比,操作簡便,對于基因多態(tài)性較低的細菌分辨率較高,而對于基因多態(tài)性較高的細菌可將CRISPR與其他分型方法相結(jié)合。Liu等將MLST與CRISPR 2種方法相結(jié)合建立了一種新的CRISPR-MVLST分型方法,通過對沙門菌的2個毒力基因SseL、FimH和CRISPR序列的研究,對來源于9個血清型的171株沙門菌進行了分型,CRISPR序列的加入顯著提高了個別疾病爆發(fā)菌株的區(qū)分能力,另外,該分型方法對腸炎沙門菌的區(qū)分能力要高于PFGE[32]。這表明CRISPR可以作為一種新的分型方法,并具有廣闊的運用前景,另外CRISPR中的間隔序列提供了細菌所處的外界環(huán)境信息,也可以為細菌的溯源追蹤提供信息。
CRISPR/Cas系統(tǒng)作為原核細胞的適應(yīng)性免疫系統(tǒng),不僅具有特異性和記憶性,還具有可遺傳性。CRISPR的間隔序列高度可變、迅速進化[32-33],新間隔序列的獲得需要很多因素的作用及相關(guān)蛋白的輔助。間隔序列的獲得使得細菌能夠很快適應(yīng)外界環(huán)境,也有研究指出,在宿主CRISPR位點中重復(fù)序列與間隔序列構(gòu)成的結(jié)構(gòu)有時也會被刪除[9,20,26,33],被刪除的部分大多是位于 CRISPR 3'端較為保守的間隔序列。這些間隔序列的刪除可能是因為CRISPR的重復(fù)序列間發(fā)生了同源重組所導(dǎo)致的[34],對CRISPR位點的大小和轉(zhuǎn)錄長度的控制具有重要的作用。CRISPR在參與原核細胞的獲得性免疫的同時,在細菌和噬菌體兩者的共同進化過程中發(fā)揮著重要作用。事實上,在前間區(qū)序列中或前間區(qū)序列鄰近序列中,單一核苷酸的改變能使噬菌體逃避CRISPR免疫機制[33]。盡管目前對CRISPR作用機制具有大致的了解,但現(xiàn)階段還存在許多問題有待更深入的研究和探索。
[1]STURINO J M,K LAENHAMMER T R.Engineered bacteriophage-defence systems in bioprocessing[J].Nat Rev Microbiol,2006,4(5):395 -404.
[2]LIU L,F(xiàn)AN X D.CRISPR-Cas system:a powerful tool for genome engineering[J].Plant Mol Biol,2014,85:209 -218.
[3]HELER R,LUCIANO A,MARRAFFINI LA,et al.Adapting to new threats:the generation of memory by CRISPR-Cas immune systems[J].Molecular Microbiology,2014,93(1):1 -9.
[4]ISHINO Y,SHINAGAWA H,MAKINO K,et al.Nucleotide sequence of the iap gene,responsible for alkaline phosphatase isozyme conversion in Escherichia coli,and identification of the gene product[J].Bacteriol,1987,169(12):5429 -5433.
[5]MOJICA FJ,DIEZ-VILLASENOR C,SORIA E,et al.Biological significance of a family of regularly spaced repeats in the genomes of Archaea,Bacteria and mitochondria[J].Mol Microbiol,2000,36(1):244 -246.
[6]JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565-1575.
[7]LILLEST-L R,REDDER P,GARRETT RA,et al.A putative viral defence mechanism in archaeal cells[J].Archaea,2006,2(1):59 -72.
[8]MOJICA F J,DIEZ-VILLASENOR C,GARCIA-MARTINEZ J,et al.Intervening sequences of regularly spaced prokaryotic repeats derive from foreign genetic elements[J].J Mol Evol,2005,60(2):174 -182.
[9] POURCEL C,SALVIGNOL G,VERGNAUD G.CRISPR elements in Yersinia pestisacquire new repeats by preferential uptake of bacteriophage DNA,and provide additional tools for evolutionary studies[J].Microbiology,2005,151(Pt 3):653 -663.
[10]BOLOTIN A,QUINQUIS B,SOROKIN A,et al.Clustered regularly interspaced short palindrome repeats(CRISPRs)have spacers of extrachromosomal origin[J].Microbiology,2005,151(Pt 8):2551 -2561.
[11]PRANGISHVILI D,F(xiàn)ORTERRE P,GARRETT R A.Viruses of the Archaea:a unifying view[J].Nat Rev Microbiol,2006,4(11):837 -848.
[12]BARRANGOU R,F(xiàn)REMAUX C,DEVEAU H,et al.CRISPR provides acquired resistance against viruses in prokaryotes[J].Science,2007,315(5819):1709-1712.
[13]MARRAFFINI L A,SONTHEIMER E J.CRISPR Interference Limits Horizontal Gene Transfer in Staphylococci by Targeting DNA[J].Science,2008,322(5909):1843 -1845.
[14]BULT C J,WHITE O,OLSEN G J,et al.Complete genome sequence of the methanogenic archaeon,Methanococcus jannaschii[J].Science,1996,273(5278):1058 -1073.
[15]SOREK R,KUNIN V,HUGENHOLTZ P.CRISPR-a widespread system that provides acquired resistance against phages in bacteria and archaea[J].Nat Rev Microbiol,2008,6(3):181 -186.
[16]SINKUNAS G,GASIUNAS G,F(xiàn)REMAUX C,et al.Cas 3 is a single-stranded DNA nucleaseand ATP-dependent helicaseinthe CRISPR/Cas immunesystem[J].EMBOJ,2011,30(7):1335 -1342.
[17]DELTCHEVA E,CHYLINSKI K,SHARMA C M,et al.CRISPR RNA maturation by trans-encoded small RNA and host factor RNase[J].Nature,2011,471(7340):602 -607.
[18]WANG R,PREAMPLUME G,TERNS M P,et al.Interactionof the Cas6 riboendonuclease with CRISPR RNAs:recognition and cleavage[J].Structure,2011,19(2):257 -264.
[19]GRISSA I,VERGNAUD G,POURCEL C.The CRISPRdb database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8:172.
[20]GRISSA I,VERGNAUD G ,POURCEL C,et al.The CRISPR database and tools to display CRISPRs and to generate dictionaries of spacers and repeats[J].BMC Bioinformatics,2007,8:172.
[21]HAFT D H,SELENGUT J,MONGODIN E F,et al.A guild of 45 CRISPR-associated(Cas)protein families and multiple CRISPR/Cas subtypes exist in prokaryotic genomes[J].PLoS Comput Biol,2005,1(6):60.
[22]WIEDENHEFT B,ZHOU K,JINEK M,et al.Structural basisfor DNase activityof a conserved protein implicated in CRISPR-mediated genomedefense[J].Structure,2009,17(6):904 -912.
[23]HAN D,KRAUSS G.Characterization of the endonuclease SSO2001 from Sulfolobus solfataricus P2[J].FEBS Lett,2009,583(4):771 -776.
[24]JANSEN R,VAN EMBDEN J D,GAASTRA W,et al.Identificationof a novel family of sequence repeats among prokaryotes[J].OMICS,2002,6(1):23-33.
[25]MARRAFFINI LA,SONTHEIMER EJ.CRISPR interference:RNA-directed adaptive immunity in bacteria and archaea[J].Nat Rev Genet,2010,11(3):181-190.
[26]DEVEAU H,BARRANGOU R,GARNEAU J E,et al.Phage response to CRISPR-encoded resistance in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1390 -1400.
[27]DAVIS D,STOKOE D.Zinc finger nucleases as tools to understand and treat human diseases[J].BMC Med,2010,8:42.
[28]JANSEN R,EMBDEN J D,GAASTRA W,et al.Identification of genes that are associated with DNA repeats in prokaryotes[J].Mol Microbiol,2002,43(6):1565 -1575.
[29]KUNIN V,SOREK R,HUGENHOLTZ P.Evolutionary conservation of sequence and secondary structures in CRISPR repeats[J].Genome Biol,2007,8(4):61.
[30]SCHOULS LM,REULEN S,DUIM B,et al.Comparative genotyping of Campylobacter jejuni by amplified fragment length poly-morphism,multilocus sequence typing,and short repeat sequencing:strain diversity,host range,and recombination[J].J Clin Microbiol,2003,41(1):15 -26.
[31]FABRE L,ZHANG J,GUIGON G,et al.CRISPR typing and subtyping for improved laboratory surveillance of Salmonella infections[J].PloS One,2012,7(5):36995.
[32]HEIDELBERG J F,NELSON W C,SCHOENFELD T,et al.Germ warfare in a microbial mat community:CRISPRs provide insights into the co-evolution of host and viral genomes[J].PLoS One,2009,4(1):4169.
[33]HORVATH P,ROMERO D A,COUTE-MONVOISIN A,et al.Diversity,activity,and evolution of CRISPR loci in Streptococcus thermophilus[J].Bacteriology,2008,190(4):1401 -412.
[34]WILMES P,SIMMONS S L,DENEF V J,et al.The dynamic genetic repertoire of microbial communities[J].FEMS Microbiol Rev,2009,33(1):109-132.