陳小玲 廖東慶 黃尚飛 陳英 蘆志龍 陳東
(1. 廣西科學院非糧生物質能源技術全國重點實驗室 非糧生物質酶解國家重點實驗室,南寧 530007;2. 廣西輕工業(yè)科學技術研究院有限公司,南寧 530031)
釀酒酵母(Saccharomyces cerevisiae)生長周期短、發(fā)酵能力強,是生產(chǎn)乙醇的重要菌株。選育生長速度快、乙醇產(chǎn)量高、耐受高溫和高滲透壓的工業(yè)釀酒酵母,能降低生產(chǎn)成本、提高經(jīng)濟效益,對乙醇生產(chǎn)企業(yè)具有重要意義。改造釀酒酵母以提高其生產(chǎn)性能已經(jīng)成為全世界的研究熱點之一。Caspeta等[1]通過適應性進化篩選到耐高溫的釀酒酵母,然而適應性進化育種存在進化速度慢的問題。我們通過對高產(chǎn)乙醇的野生型工業(yè)釀酒酵母進行紫外線誘變[2-4]、基因敲除[5]或基因同源重組[6-7],構建了幾株乙醇生產(chǎn)性能提高的釀酒酵母[4,6-8]。然而,傳統(tǒng)的誘變方法存在突變頻率低、遺傳穩(wěn)定性差、對人體和環(huán)境有危害等問題。用等離子體誘變技術改造釀酒酵母[9],能解決上述問題。但是,等離子體誘變技術與其他誘變方法一樣,都屬于非定點突變,通常有多個突變位點、難以識別導致表型變化的突變位點?;蚯贸ǔS眠x擇性標記基因替換靶基因,如果敲除多個基因,需要循環(huán)使用有限的標記基因。而且,敲除靶基因后還要去除標記基因,因為用于工業(yè)生產(chǎn)的釀酒酵母不能攜帶標記基因?;谕粗亟M,用能產(chǎn)生目標性狀的基因替換靶基因,通常一次只能改造一個基因。在實際研究中,經(jīng)常需要改造釀酒酵母的多個基因,例如改造代謝途徑,構建能利用木糖的釀酒酵母,用傳統(tǒng)的改造方法短期內(nèi)難以實現(xiàn)。
利用近年來發(fā)現(xiàn)的CRISPR/Cas系統(tǒng)可以同時編輯多個基因。CRISPR / Cas系統(tǒng)由CRISPR陣列和Cas基因組成,是在細菌和古細菌發(fā)現(xiàn)的自適應防御系統(tǒng),可以保護宿主免受病毒和質粒侵襲。CRISPR的全稱是成簇規(guī)則間隔的短回文重復序列(clustered regularly interspaced short palindromic repeats),Cas的全稱是CRISPR相關蛋白(CRISPR-associated)。CRISPR / Cas系統(tǒng)對入侵核酸的沉默(切割)需要crRNA(CRISPR-derived RNA)引導,分為3個步驟:(1)含有CRISPR基因座的宿主將入侵核酸的短序列(也稱原間隔子)整合到宿主CRISPR陣列近端的染色體,被整合的短序列(也稱間隔子)被相同的重復序列分隔開[10-12];(2)間隔子被轉錄成crRNA前體(pre-crRNA),pre-crRNA被酶切后形成含有間隔子的crRNA[13-14];(3)crRNA與Cas形成復合物,引導Cas沉默入侵核酸[15-16]。
根據(jù)Makarova等[17-18]的分類方法,CRISPR/Cas系統(tǒng)分為3種類型。CRISPR 1和CRISPR 3屬于II型[17],CRISPR 2和CRISPR 4分別屬于III型和I型[17,19]。不同類型的系統(tǒng)加工pre-crRNA的方式和依賴的Cas不同。(1)I型和III型系統(tǒng)通過專門的Cas(如Csy4[14])將pre-crRNA加工成crRNA,每個crRNA與Cas組裝成大型的多Cas復合物,該復合物識別和切割與crRNA互補的核苷酸。II型系統(tǒng)通過另一種機制加工pre-crRNA:當存在Cas9時,反式激活crRNA(tracrRNA)觸發(fā)RNase III加工pre-crRNA[20]。(2)I型和III型系統(tǒng)需要多種Cas協(xié)同作用才能沉默入侵核酸,而 II型系統(tǒng)只需要 Cas9。因此, II型系統(tǒng)被稱為CRISPR/Cas9系統(tǒng)。由于CRISPR/Cas9系統(tǒng)比較簡單,它已經(jīng)被廣泛應用于改造釀酒酵母[21-24]或其他酵母[25]。利用它能引入多種遺傳修飾[26],改造工業(yè)釀酒酵母的代謝途徑[27-28],使甲羥戊酸產(chǎn)量提高41倍[28]。本文在介紹CRISPR/Cas9系統(tǒng)各組分作用的基礎上,闡明在釀酒酵母中構建CRISPR/Cas9系統(tǒng)和進行基因編輯的研究進展,針對CRISPR/Cas9系統(tǒng)存在的脫靶問題,結合筆者自身的研究,提出解決方案。
1.1.1 Cas9蛋白 Cas9是CRISPR/Cas9系統(tǒng)特有的蛋白質,它特異性切割靶DNA。切割位點由crRNA與原間隔子(靶DNA)的互補區(qū)和原間隔區(qū)相鄰基序(PAM)決定。Cas9可以切割線性化的DNA和超螺旋DNA[20]。來源不同的Cas9識別不同的PAM,因此Cas9的來源影響sgRNA靶序列的設計。在釀酒酵母最常用的是化膿鏈球菌(Streptococcus pyogenes)的Cas9(SpCas9))[29]。SpCas9對靶DNA的切割不受DNA甲基化影響,并允許sgRNA和靶DNA之間有錯配,但對錯配的數(shù)量、位置和分布很敏感[30]。
1.1.2 crRNA和tracrRNA tracrRNA指導內(nèi)源性RNase III和Cas9將pre-crRNA加工成成熟的crRNA[13]。crRNA與tracrRNA配對形成被稱為引導RNA的雙RNA結構(tracrRNA:crRNA),引導Cas9切割與crRNA互補的靶DNA雙鏈。雙RNA結構使crRNA 5'端的20個核苷酸可以結合靶DNA[20](圖1)。改變crRNA 5'端的20個核苷酸可以改變Cas9的切割位置[31],可以用多條crRNA引導Cas9切割釀酒酵母的多個位點。
圖1 CRISPR/Cas9系統(tǒng)對靶DNA的特異性切割Fig. 1 Site-specific DNA cleavage by CRISPR/Cas9 system
僅保留天然tracrRNA第23-48位的核苷酸或刪除crRNA 3'端10個核苷酸后,tracrRNA:crRNA還能夠正常引導Cas9切割靶DNA。但是刪除crRNA 5'端10個核苷酸后,Cas9不能切割靶DNA[20]。這表明tracrRNA和crRNA某些區(qū)域的核苷酸起關鍵作用。將tracrRNA∶crRNA設計為單個RNA嵌合體(single guide RNA,sgRNA)時,它也能指導Cas9特異性切割靶DNA雙鏈,并且切割位置不變[20]。sgRNA的5'端要包含一段識別靶DNA的序列,其后要保留tracrRNA 5'端和crRNA 3'端之間的堿基配對結構。sgRNA使CRISPR/Cas9系統(tǒng)的構建更簡便。因此,改造釀酒酵母時最常用的策略是將tracrRNA∶crRNA設計為sgRNA[31]。
1.2.1 Cas9的表達 在酵母表達的Cas9基因可以是天然的,也可以是針對酵母甚至人類進行密碼子優(yōu)化的[29]??梢詫as9整合到酵母基因組[26]或用質粒表達。對于多基因編輯,整合到基因組的方式可以更穩(wěn)定地表達Cas9[31];對于單基因編輯,優(yōu)先選擇質粒表達,完成編輯后消除質粒。在釀酒酵母,表達Cas9的質??梢允褂谜T導型啟動子(如Gal-L)或組成型啟動子(如Tefl)。用誘導型啟動子或較弱的啟動子可以限制Cas9的毒性[29]。
1.2.2 sgRNA的設計和表達 構建CRISPR/Cas9系統(tǒng)的關鍵步驟是sgRNA的設計和表達。為了保證sgRNA有正常功能,需要合理選擇啟動子和終止子。釀酒酵母常用的終止子是SUP4[29]。RNA聚合酶(Pol)III啟動子[32-36]、U6啟動子[35,37]及tRNA啟動子[38]被廣泛應用于酵母和其他物種。其中,Pol III啟動子(SNR52)是在釀酒酵母中常用的啟動子[29,31]。與SNR52相比,用改進的Pol II-核酶系統(tǒng)可以用單個轉錄本表達更多sgRNA,從而獲得更強的CRISPRi活性[39]。與SNR52和核酶-sgRNA-核酶(ribozyme-sgRNA-ribozyme,RGR)系統(tǒng)相比,用TEF1p-tGCC雜合啟動子表達的sgRNA可以提高TPI1活力[40]??梢?,選擇合適的啟動子能使CRISPR/Cas9系統(tǒng)發(fā)揮更大作用。
通常有兩種表達sgRNA的方法:(1)用一個啟動子表達一條sgRNA;(2)用一個啟動子表達多條sgRNA,然后通過不同策略釋放sgRNA。表達sgRNA的質??梢栽隗w內(nèi)組裝,也可以在體外組裝。在工業(yè)釀酒酵母體內(nèi)組裝可以獲得較高編輯效率[41],但是在體內(nèi)錯誤組裝可能導致產(chǎn)生假陽性菌落。體外組裝質粒有助于減少假陽性菌落,也能提高編輯效率。例如體外組裝攜帶2條sgRNA的質粒,通過一次轉化能同時編輯6個基因[26]。因此,最好在體外組裝質粒,用經(jīng)過驗證的質粒進行基因編輯。值得注意的是,一次轉化的質粒越多,突變菌株包含所有突變的概率越低。
1.2.3 sgRNA靶序列的設計 設計靶序列的關鍵限制是PAM[29]。設計靶序列還應該考慮堿基組成,因為富含鳥嘌呤和缺乏腺嘌呤可以提高sgRNA的穩(wěn)定性和活性。而sgRNA的活性與CRISPR/Cas9系統(tǒng)的突變效率直接相關。另外,靶序列存在唯一的限制性酶切位點有利于后期驗證[26]。截短1-2個核苷酸[42-43]或5'端有錯配的靶序列[42]有正常功能。截短靶序列可以減少脫靶、將某些脫靶位點的突變減少5000倍[43]。因此,靶序列的長度不必局限于20個核苷酸。設計靶序列需要有合適的設計工具來綜合考慮多個設計原則。
1.2.3.1 設計原則 CRISPR/Cas9系統(tǒng)通過外源基因組中的PAM識別自我與非自我[44]。PAM位于靶序列的3'端[20,29],標準PAM是NGG,常見的非標準PAM是NAG。3'端連接非標準PAM的靶序列也能被CRISPR/Cas9系統(tǒng)識別和切割[45],因此設計靶序列時也要考慮非標準PAM,否則可能引起脫靶。PAM的精確序列和位置因CRISPR/Cas系統(tǒng)類型而異,大多數(shù)PAM都保守[46]?;撴溓蚓鶬I型系統(tǒng)的PAM為NGG[20,29],其中GG是Cas9切割靶DNA所必需的,任何一個G突變都導致Cas9 tracrRNA∶crRNA復合物對靶DNA的親和力顯著降低。PAM突變顯著影響Cas9切割雙鏈靶DNA,但是不影響Cas9切割單鏈靶DNA。這可能是因為雙鏈解旋、鏈侵入和形成R-環(huán)結構需要PAM[20]。最近開發(fā)了不需要PAM的SpCas9突變體——SpRY,它幾乎可以在基因組任何位置切割DNA[47-48]。SpRY使靶序列的設計不受PAM限制,對釀酒酵母的改造更容易。
靶序列3'端存在一個“種子”序列(與PAM近端的靶DNA匹配)?!胺N子”序列的任意核苷酸與靶DNA錯配,都抑制Cas9的活性。Jinek等[20]認為“種子”序列至少有13個核苷酸,與靶序列5'端(非“種子”序列,與PAM遠端的靶DNA匹配)有連續(xù)6個核苷酸錯配的靶DNA也能被Cas9切割。DiCarlo等[29]則認為:“種子”序列只有12個核苷酸[簡稱S(12)],靶序列5'端8個核苷酸[簡稱N(8)]與靶DNA錯配幾乎不影響Cas9的活性。因此,只有S(12)NGG在基因組唯一,N(8)S(12)NGG形式的序列才可能是Cas9的唯一靶標。另外,因為Cas9對非標準PAM(例如NAG)也有活性[49],所以當基因組中有唯一的S(12)NGG、且不存在S(12)NAG時,N(8)S(12)NGG形式的序列才可能是Cas9的唯一靶標。Hsu等[30]還認為:除靶DNA外,如果基因組還存在與靶序列有17個以上相同核苷酸且3'端緊接PAM(NGG或NAG)的序列,會導致脫靶。Lin等[50]認為基因組DNA和靶序列凸起也造成脫靶。上述設計原則,為更好地設計靶序列提供了參考。然而,即使嚴格遵守上述設計原則也難以避免脫靶。隨著對CRISPR/Cas9系統(tǒng)研究的不斷深入,CRISPR/Cas9系統(tǒng)的打靶特異性也會越來越高。
1.2.3.2 設計工具 面對紛繁的設計原則和龐大的基因組,需要有設計靶序列和預測脫靶位點的工具。第三方比對工具只能識別基因組的部分潛在脫靶位點[45]。隨著研究的深入,研究人員開發(fā)了既能設計靶序列,又能全面預測脫靶位點的工具。雖然不同工具的序列輸入方式、主要特點及適用的酵母菌株有差異[27],但是通常它們都能預測脫靶位點,而且設計原理大同小異。以下介紹幾種有代表性的工具,旨在使科研人員更好地為釀酒酵母設計靶序列。
Rule Set 2是基于Rule Set 1開發(fā)的sgRNA靶序列設計算法,它設計的靶序列比Rule Set 1有更好的活性和特異性。Rule Set 2主要考慮以下因素或特征。(1)核苷酸序列的獨熱編碼,它是依賴位置的特征。獨熱編碼,又稱一位有效編碼,是用N個狀態(tài)變量對N個狀態(tài)進行編碼,每個狀態(tài)變量只能取有效或無效,并且在任意時候,有且只有一個狀態(tài)變量有效。核苷酸序列的獨熱編碼,是指把A/T/G/C中某一個核苷酸轉換成4個狀態(tài)變量,每個狀態(tài)變量的值是0或1,有且僅有一個值是1。例如,可以用0001表示A,0010表示T,0100表示C,1000表示G。因此,對靶DNA及其前后共30個核苷酸,由于任何一個位置都可以是A/T/G/C中的任何一個,它被轉換成4個二進制變量狀態(tài),每個對應一種可能的核苷酸,這是一階特征;二階特征把所有相鄰的兩個核苷酸作為特征,有4×4=16種組合,如AA/AT/AG/等等。對于與PAM相關的“NGGN”,NN位置的兩個核苷酸也是一個獨熱編碼,有16個狀態(tài)變量,每個狀態(tài)變量是NN的可能性(如AT)。(2)不依賴位置的特征。例如靶序列中有多少個A/T/G/C,這是一階特征,二階特征與一階特征類似。(3)GC含量特征。靶序列20個核苷酸中G和C的個數(shù)是一個特征,個數(shù)>10是另一個特征。(4)熱力學特征。它考慮靶DNA及其前后共30個核苷酸的解鏈溫度,還分別考慮靶序列 3個不同部位的解鏈溫度。(5)氨基酸切割位置和肽百分比。除了設計靶序列,Rule Set 2還能對CRISPRa和CRISPRi篩選進行預測。對于篩選預測,Rule Set 2計算以2為底候選靶序列豐度變化倍數(shù)的對數(shù)(LFC)。對于有多條靶序列的基因,由于LFC的最大值不相同,不同基因之間的LFC不具有可比性。因此,通過對靶序列進行排序,并重新縮放使靶序列的最終得分在0-1之間(1表示敲除成功),獲得靶序列的歸一化得分。如果存在多種類型的細胞,計算各類型細胞的平均歸一化得分[51]。Rule Set 2的算法能明顯提高靶序列的打靶特異性,更好地預測脫靶效應,有助于大規(guī)模篩選和小規(guī)?;蚓庉媽嶒?。
GuideScan可以設計單個靶序列或成對靶序列。GuideScan還可以注釋靶DNA的特征和打靶效率得分,預測被編輯后的靶DNA序列。設計靶序列時,用戶需提供FASTA格式的基因組,并設定PAM類型、PAM相對于靶序列的位置和靶序列長度等參數(shù)。GuideScan設計靶序列的算法與其他工具相似。首先,GuideScan掃描基因組,尋找標準PAM和非標準PAM,識別攜帶PAM的所有k-mer并將其寫入一個臨時文件。GuideScan構建所有k-mer的檢索樹,查找候選靶序列。攜帶標準PAM的k-mer在基因組唯一時,它才能作為候選靶序列;如果它在基因組出現(xiàn)2次以上,或者基因組還存在攜帶非標準PAM的k-mer,該k-mer被標記為非候選靶序列,并被列入“黑名單”。然后,GuideScan利用檢索樹評估與候選靶序列有錯配的相似序列,確保在基因組有唯一的錯配數(shù)不超過M的靶DNA。如果在M個錯配內(nèi),候選靶序列在基因組不唯一,它被重新標記為非候選靶序列,并被列入“黑名單”。因為M個錯配內(nèi)在基因組唯一的靶序列,當完全枚舉到Q(Q>M)個錯配時可能含有脫靶位點,所以對于給定靶序列,GuideScan通過檢索樹遍歷,計算錯配鄰域,再次確定脫靶信息。如果發(fā)現(xiàn)基因組存在與靶序列有P(M<P≤Q)個錯配的脫靶序列,記錄該脫靶序列出現(xiàn)的次數(shù)、漢明距離P以及用戶指定的脫靶次數(shù)的位置。最后,GuideScan將候選靶序列寫入一個序列比對圖(SAM)格式的文件。該文件以十六進制字節(jié)的形式存儲靶序列,包含作為唯一標識的序列和脫靶信息。將SAM文件轉換為BAM文件并編制索引后,可以用Samtools快速訪問它[45]。
網(wǎng)頁版的GuideScan被稱為Yeastriction,它專門為釀酒酵母設計靶序列。Yeastriction基于MEAN.io??蚣埽⑹褂胘avascript實現(xiàn)。Yeastriction的設計步驟[26]如下:(1)從指定區(qū)域查找所有可能的靶序列;(2)去除有連續(xù)6個以上T的序列,因為這些序列能使Pol III終止轉錄[52];(3)用Bowtie[53]將靶序列與參考基因組進行比對,檢查是否存在脫靶位點,如果存在脫靶位點,則丟棄該靶序列;(4)根據(jù)以下參數(shù)計算靶序列的得分:AT含量(1表示含量最高,0表示含量最低)、某些限制性內(nèi)切酶酶切位點數(shù)(1表示有,0表示無)及二級結構中配對的核苷酸數(shù)量(1表示數(shù)量最低,0表示數(shù)量最高),根據(jù)指定參數(shù)的總分對靶序列進行排序。只能對單個基因的不同靶序列進行排序,不能對不同基因的靶序列進行排序。
最早開發(fā)的CRISPy(http://staff.biosustain.dtu.dk/laeb/crispy/)專門為中國倉鼠卵巢(CHO)-K1設計靶序列。CRISPy使用BioPython創(chuàng)建的Python腳本搜索基因組,把生成的數(shù)據(jù)庫上傳并存儲到MySQL數(shù)據(jù)庫系統(tǒng),使用HTML、PHP、Javascript作為訪問界面,以供外界訪問數(shù)據(jù)庫系統(tǒng)。CRISPy在指定外顯子搜索G(N)19NGG格式的潛在靶序列,并在基因組其他位置搜索潛在的脫靶位點,即與潛在靶序列NGG端的13 個核苷酸(N7-N19)相匹配(允許1-2個錯配)的序列[54]?;谏鲜霭姹镜腃RISPy,開發(fā)了專門為釀酒酵母設計靶序列的CRISPy(http://staff.biosustain.dtu.dk/laeb/crispy_yeast/)[28]和能為任何微生物設計靶序列的CRISPyweb。CRISPy-web需要指定設計靶序列的基因組區(qū)域,它以圖形或文本文件的形式輸出靶序列[55]。表1匯總了上述工具的優(yōu)點和缺點。
表1 適用于釀酒酵母的靶序列設計工具Table 1 SgRNA design tools available for S. cerevisiae
靶DNA被Cas9切割后,斷裂的DNA雙鏈會被細胞的非同源末端連接(NHEJ)機制或同源重組(HR)機制修復。NHEJ機制容易在斷裂位點引入插入/缺失突變,造成閱讀框移碼。如果用NHEJ機制修復,難以預料靶DNA的突變情況。如果用HR機制修復,靶DNA可以產(chǎn)生預期的突變(如引入單核苷酸或多核苷酸突變[49]),但是需要提供供體DNA作為修復模板。將單個線性化、攜帶多條sgRNA的質粒與供體DNA共轉化,有利于點突變和大片段整合[58]。供體DNA的長度影響基因編輯效率。以20 為間隔,對于20-120 bp的供體DNA,100 bp的編輯效率最高[59]。100 bp的供體DNA很容易獲得,可以從具有目標性狀的基因擴增或者人工合成。除了作為修復模板外,利用供體DNA還能避免靶DNA被反復切割[29,49]。實現(xiàn)方法是設計合適的供體DNA,使其與被切割的靶DNA重組后去除靶DNA的PAM序列或使對打靶至關重要的“種子”序列突變,該方法的本質是使重組的靶DNA不被CRISPR/Cas9系統(tǒng)識別。
Cas9可以在多條sgRNA的引導下同時編輯多個位點,這是CRISPR/Cas9系統(tǒng)最大的優(yōu)勢。然而,多條sgRNA的表達和釋放是對釀酒酵母進行多基因編輯的挑戰(zhàn)。這是因為在真核生物,表達多條sgRNA的遺傳元件通常需要滿足以下條件:在細胞核中高效、穩(wěn)定地加工,單順反子高效拼接以及序列短[40]。目前已經(jīng)有幾種表達和釋放多條sgRNA的策略。
2.2.1 利用CRISPR/Cas系統(tǒng)加工pre-crRNA的能力生成多條sgRNA或crRNA的策略 Ferreira等[60]利用III型CRISPR/Cas系統(tǒng)的Csy4對precrRNA的加工能力[14],從釀酒酵母的單個轉錄本獲得多條sgRNA。Bao等[59]利用CRISPR/Cas9系統(tǒng)對pre-crRNA的加工能力,從釀酒酵母的單個轉錄本獲得多條crRNA并釋放供體DNA。具體方法是:將tracrRNA和crRNA組成類似天然多順反子的CRISPR陣列,在CRISPR陣列中用一個啟動子表達多個被定向重復區(qū)隔開的間隔子(在引導序列前插入供體DNA),轉錄本被加工后釋放多條crRNA;在加工過程,pre-crRNA的5'端被RNase III和其他內(nèi)源核酸酶切割,從而釋放DNA供體。利用這種策略能高效地編輯釀酒酵母多個基因[59-60]。
2.2.2 利用tRNA加工系統(tǒng)生成多條sgRNA的策略 能用tRNA加工系統(tǒng)釋放sgRNA[38,40]的原因是:tRNA前體(pre-tRNA)在細胞核[61-62]被內(nèi)源性tRNA加工系統(tǒng)精確切割[32],其5'端和3'端分別被核糖核酸酶(RNase)P[63]和Z切割。因為甘氨酸t(yī)RNA(tRNAGly)基因只有71個核苷酸[64],比其他內(nèi)源性tRNA短,利于高效轉錄多條sgRNA,所以tRNAGly是常用的tRNA。由于5'端前導序列顯著影響RNAse P的切割活性[65],Deaner等[40]對甘氨酸t(yī)RNA前體的前導序列進行比對,用各位置出現(xiàn)頻率最高的核苷酸組成新的前導序列,獲得比原前導序列或無前導序列更高的酶活力。目前已經(jīng)有很多研究從單個表達盒表達多個tRNA-sgRNA單元[32-33,35,37-38,40]。例如,Qi等[37]基于tRNAGly表達4個tRNA-sgRNA單元。因為所有生物都有tRNA前體,并且tRNA及其加工系統(tǒng)在所有生物都保守,所以利用tRNA加工系統(tǒng)釋放sgRNA的策略被廣泛使用。
2.2.3 基于tRNA加工系統(tǒng)衍生的其他策略 基于tRNA加工系統(tǒng)衍生出利用Cas9的內(nèi)含子同時表達多條sgRNA的策略。具體方法是將攜帶tRNAsgRNA的內(nèi)含子與Cas9融合為一個基因,利用內(nèi)源tRNA加工系統(tǒng)切割帶有tRNA-sgRNA多順反子的內(nèi)含子[36]?;趖RNA加工系統(tǒng)還衍生出模塊化構建tRNA-sgRNA的策略。例如Deaner等[40]利用迭代IIs型消化/連接延伸方法,模塊化構建tRNAsgRNA操縱子(被稱為sgRNA操縱子的CRISPR連接延伸,CRISPR-LEGO),并成功地用于改造釀酒酵母生產(chǎn)2,3-丁二醇的代謝途徑。CRISPR-LEGO比Gibson或USER Cloning[28]更有優(yōu)勢:首先,通過迭代消化/連接,它有效地將操縱子拼接在一起,減少合成大型操縱子所需的DNA量和PCR反應的循環(huán)次數(shù);其次,它可以將sgRNA簡單地添加到通過模塊化合成的操縱子。將CRISPR-LEGO與Pol II-tRNA相結合,可以快速為釀酒酵母生成多條sgRNA,比用Pol III表達盒或RGR操縱子有優(yōu)勢。
上述表達多條sgRNA的策略使CRISPR/Cas9系統(tǒng)成為同時編輯釀酒酵母多個基因的有力工具。在這些策略中,為了釋放表達的sgRNA,sgRNA兩側需要連接可以被切割的RNA序列,這些序列可以是自切割的核酶序列(如錘頭狀核酶和丁型肝炎病毒核酶[66-67])、外源切割因子識別序列(如Cys4[60])或內(nèi)源RNA加工序列(如tRNA序列[32-33,37,40]或內(nèi)含子[36])。
CRISPR/Cas9系統(tǒng)各組分的親緣關系影響編輯效率。例如,化膿鏈球菌的tracrRNA∶crRNA不能正常引導與其親緣關系較遠的Cas9切割靶DNA。反之,與化膿鏈球菌親緣關系較遠的tracrRNA∶crRNA不能正常引導SpCas9切割靶DNA[20]。可以通過PCR擴增包含靶DNA的片段來檢測編輯效率。利用兩條sgRNA刪除基因片段時,雖然這兩條sgRNA的編輯效率可能不相同,但是刪除效率通常與切割位點之間的距離呈負相關。在tRNA-sgRNA串聯(lián)排列的單個多順反子中,sgRNA的數(shù)量影響刪除效率,但對不同靶點的影響程度不同[32]。
CRISPR/Cas9系統(tǒng)使釀酒酵母的同源重組頻率接近100%,與不用CRISPR/Cas9系統(tǒng)相比,分別使單鏈DNA供體或雙鏈DNA供體的同源重組頻率提高5倍或130倍[29]。Ferreira等[60]利用Csy4的加工能力釋放多條sgRNA,同時編輯釀酒酵母4個基因的效率達到96%。Zhang等[64]研究表達sgRNA的3種模式對釀酒酵母編輯效率的影響。其中,模式A由SNR52啟動子、sgRNA-tRNAGly陣列和終止子組成單個表達盒,簡稱 GTR-CRISPR;模式B和C包含多個表達盒,模式B的所有表達盒均由SNR52啟動子、sgRNA和終止子組成;模式C的第一個表達盒與模式B相同,其他表達盒由SNR52和tRNAGly序列組成的融合啟動子、sgRNA和終止子組成(圖2)。發(fā)現(xiàn)模式A的編輯效率最高:同時編輯3個、4個和5個基因的效率分別為93.0%、100%和88.9%;模式C的效率顯著高于模式B,說明tRNAGly與SNR52融合可以提高編輯效率。模式A同時編輯6-8個基因的效率很低,可能是因為轉錄的sgRNA太多,SNR52的轉錄效率不足。基于模式A,在sgRNA-tRNAGly陣列中間引入第二個啟動子后,同時編輯8個基因的效率從36.5% 提高到87%[64],這是已知能高效率編輯的最大基因數(shù)。
圖2 表達sgRNA的3種模式Fig. 2 Three different sgRNA expression modes
CRISPR/Cas9系統(tǒng)是改造釀酒酵母的強大工具,但是如果攜帶CRISPR/Cas9系統(tǒng)的釀酒酵母逃逸,在偶然的情況下Cas9和sgRNA可能被傳播,并意外改變野生種群的基因[68],造成無法預料的影響。因此,應該降低這些釀酒酵母逃逸并改變野生種群的風險。有3種限制措施可以預防這種風險。(1)分子限制:不在一個基因表達盒表達Cas9和sgRNA,使它們分開表達。例如,用附加型質粒表達Cas9、用其他遺傳元件表達sgRNA。這種方式簡單、有效,即使這些釀酒酵母逃逸,較不穩(wěn)定的附加型質粒也會迅速與表達sgRNA的元件分離。另外,用誘導型啟動子調(diào)控Cas9或sgRNA的表達也有助于預防風險。(2)生態(tài)限制:在這些釀酒酵母無法存活的區(qū)域進行實驗。(3)生殖限制:利用完全不能與野生型釀酒酵母繁殖的遺傳背景,可以防止Cas9和sgRNA傳播到野生型釀酒酵母[68]。在設計實驗時,可以使用上述1-2種措施;在實驗結束后,滅菌處理污染了釀酒酵母的物品或耗材。
雖然CRISPR/Cas9系統(tǒng)是基因編輯的強大工具,但是它的脫靶問題[45]不容忽視。脫靶能導致對釀酒酵母的改造失敗,甚至導致科研人員得出錯誤的結論。脫靶的主要原因是Cas9對sgRNA與DNA的錯配有一定的容忍度[29]和設計靶序列所用的參考基因組與目標釀酒酵母的基因組有差異。減少靶DNA之間的核苷酸相互作用[69],調(diào)整Cas9和sgRNA的劑量[30]或者對目標釀酒酵母進行深度測序并組裝高質量的基因組、根據(jù)精確的基因組序列設計靶序列都可以減少脫靶。如果參考基因組與目標釀酒酵母真實的基因組有較大差異,除了造成脫靶外,還影響靶序列設計和打靶效率。因為靶序列設計工具基于PAM查找潛在的靶序列,而靶序列的單個核苷酸與靶DNA錯配就可能導致Cas9無法切割靶DNA[30]。針對某些靶序列設計工具只能選擇指定的基因組[26,56,70](不能用目標釀酒酵母的基因組)作為參考基因組的問題,可以開發(fā)計算機軟件工具或算法,檢測靶序列在目標基因組的打靶特異性;也可以下載并修改靶序列設計工具的源代碼,然后基于目標釀酒酵母的基因組在本地計算機設計靶序列。我們開發(fā)了能為任何釀酒酵母檢測靶序列特異性的算法和軟件工具[71-72],為已投入工業(yè)生產(chǎn)的野生型工業(yè)釀酒酵母[5]設計靶序列。利用我們的算法或軟件工具,只需提供參考基因組和靶序列,就可以快速地檢測一條或多條靶序列的特異性,有效減少脫靶。
CRISPR/Cas9系統(tǒng)對不同基因的編輯效率不一樣,例如對釀酒酵母ATF2、GCY1和YPR1的編輯效率為100%,而對CAN1、ADE2和LYP1的編輯效率只有27%-87%[59],說明CRISPR/Cas9系統(tǒng)對多基因的高效編輯存在位點依賴性或者還需要更好的靶序列設計規(guī)則來選擇高效的靶序列。另外,在釀酒酵母用一個表達盒表達多條sgRNA的能力較低。例如,表達的sgRNA超過4條時,sgRNA的轉錄可能不完全或(和)不穩(wěn)定。解決該問題需要開發(fā)調(diào)控元件[59]或類似于tRNAGly加工系統(tǒng)[64]的編輯工具。
CRISPR/Cas9系統(tǒng)是高效、精準的基因組編輯工具。雖然當前存在一些問題,但是與傳統(tǒng)的基因改造技術相比,CRISPR/Cas9系統(tǒng)仍具有顯著優(yōu)勢,是改造釀酒酵母的強大工具。隨著研究的不斷深入,靶序列設計規(guī)則將不斷得到完善。另外,隨著計算機技術與生物學的交叉融合,靶序列設計工具將越來越多、越來越完善。因此,隨著CRISPR/Cas9系統(tǒng)存在的問題逐步得到解決,利用CRISPR/Cas9系統(tǒng)改造釀酒酵母也會越來越得心應手。