朱琳 鮮鳳君 張倩楠 胡駿
(武漢大學生命科學學院雜交水稻國家重點實驗室,武漢 430072)
RNA編輯(RNA editing)是指在RNA水平上發(fā)生的堿基增加、刪除和替換,使核苷酸序列與基因組DNA序列不同從而引起遺傳信息的改變,是一種遺傳物質(zhì)的間接性、高特異性的修復機制,這一轉(zhuǎn)錄后調(diào)控過程廣泛存在于生物有機體中[1]。1986年,RNA編輯一詞首次被提出,用來描述錐蟲(Try panosoma)線粒體中尿苷酸的添加和刪除[2]。植物界首次確定的RNA編輯為1989年在月見草(Oenothera biennis L.)線粒體轉(zhuǎn)錄本中發(fā)現(xiàn)的C-to-U替換[3],1991年也在玉米(Zea mays L.)葉綠體中被確認[4],與細胞器基因的表達調(diào)控以及轉(zhuǎn)錄組和蛋白質(zhì)組的復雜性密切相關。1993年,由載脂蛋白B mRNA編輯酶1(apolipoprotein B mRNA-editing enayme catalytic polypeptide-like1,APOBEC1) 介 導的胃腸組織中ApoB mRNA第6 666位胞苷脫氨為尿苷而產(chǎn)生不成熟的終止密碼子的過程是哺乳動物中發(fā)現(xiàn)的首個C-to-U類型編輯[5],另外由腺苷酸脫氨酶(adenosine deaminase acting on RNA,ADAR)催化A-to-I的編輯[6]也在動物體內(nèi)廣泛存在,在組織器官發(fā)育與功能發(fā)揮中具有重要的調(diào)控作用。因此,研究RNA編輯的作用機制,有助于我們進一步了解RNA編輯的本質(zhì)及其發(fā)生的生物學意義。
RNA編輯的作用機制主要有兩種形式,分別為由引導RNA(guide RNA,gRNA)介導的核苷插入或刪除編輯,和由脫氨酶介導的堿基特異替換編輯。在堿基插入或刪除的編輯形式中,插入位點的精確定位和核苷數(shù)目的準確數(shù)目通常需要依賴gRNA的介導,gRNA分子是一種小型非編碼RNA,可以與mRNA下游編輯位點結合形成10-15 bp大小的錨定雙螺旋,依賴位點特異性內(nèi)切酶識別并切開雙螺旋序列,隨后由尿嘧啶轉(zhuǎn)移酶或3′尿嘧啶特異性外切酶介導完成尿嘧啶的插入或刪除,最終依賴RNA連接酶將mRNA連接起來,這一系列酶促反應完成編輯過程。這種編輯形式首先在錐蟲線粒體中發(fā)現(xiàn)[2],其細胞色素C氧化酶亞基Ⅱ(CoxⅡ)轉(zhuǎn)錄本與基因序列不匹配,存在4個非DNA編碼的尿嘧啶,后來在變形菌(Proteusbacillus vulgaris)和副粘病毒(Paramyxoviridae)基因中也分別發(fā)現(xiàn)了C插入和G插入的現(xiàn)象[7]。
在高等植物中,RNA編輯主要為細胞器內(nèi)由脫氨酶介導的堿基替換類型,存在胞嘧啶到尿嘧啶(C-to-U)、尿嘧啶到胞嘧啶(U-to-C)以及腺嘌呤到次黃嘌呤(A-to-I)3種形式的轉(zhuǎn)換,而且編輯事件發(fā)生的頻率相當高,其中大部分以C-to-U的編輯形式發(fā)生,脫氨酶將胞嘧啶核苷C6位氨基水解脫氨形成尿嘧啶核苷。RNA編輯事件在mRNA的編碼區(qū)域較為普遍[8],通常會使密碼子的第一或第二位置發(fā)生改變,如通過將ACG改變?yōu)锳UG生成起始密碼子,將CGA改變?yōu)閁GA或?qū)AA改變?yōu)閁AA引入翻譯終止信號,這種方式為存在缺陷的細胞器轉(zhuǎn)錄本提供了一個可能的校對修復機制,使其產(chǎn)生功能完全的蛋白質(zhì)[9]。有時,C-to-U編輯形式也會發(fā)生在非翻譯區(qū)域和結構RNA中影響剪接和翻譯效率,例如植物II型內(nèi)含子V域的RNA編輯變化就是剪接過程發(fā)生的必要性因素[10]。U-to-C編輯形式也可以改變終止密碼子,如將終止信號UAA轉(zhuǎn)換為甘氨酸的CAA三聯(lián)體編碼等,這種編輯形式在除蕨類、苔蘚和石松科以外的其余陸生植物中很少見,但Ruchika等[11]在擬南芥幼苗中觀察到了罕見的U-to-C編輯形式發(fā)生在成熟mRNA的3′UTR區(qū),影響核基因mRNA的穩(wěn)定性。A-to-I的編輯通常發(fā)生在細胞質(zhì)中的tRNA上[12]。
植物細胞器中的RNA編輯是相對復雜的過程,越來越多的研究發(fā)現(xiàn)植物細胞器中的RNA編輯并不僅僅是由核編碼的RNA編輯因子介導,而是通過與其他不同類型的蛋白質(zhì)共同組裝成編輯復合體來行使編輯功能的。研究表明,擬南芥線粒體中的編輯位點多達619個[13],水稻線粒體中有491個[14],還有一些未知位點尚未報道。但是參與RNA編輯的復合體數(shù)量遠遠少于細胞器內(nèi)編輯位點的數(shù)量,由此可見RNA編輯復合體在行使編輯功能時具有復雜、靈活、多變等特點。到目前為止發(fā)現(xiàn)的編輯因子有三角狀五肽重復序列(pentatricopeptide repeat,PPR)蛋白、多細胞器RNA編輯因子(multiple organellar RNA editing factors,MORF)蛋白家族,也被稱為RNA編輯因子互作蛋白(RNA editing factor interacting proteins,RIP)、細胞器RNA識別基序(organelle RNA recognition motif,ORRM)蛋白、細胞器鋅指(organelle zinc-finger,OZ)蛋白和原卟啉原IX氧化酶1(protoporphyrinogen IX oxidase 1,PPO1)等,此外,可能還存在其他的未知因子參與RNA編輯。Planchard等[14]對RNA編輯的程度是否影響后續(xù)的翻譯過程進行了研究,結果表明,經(jīng)過部分編輯的RNA可以進行翻譯,且植物線粒體產(chǎn)生的蛋白質(zhì)中有不可忽視的比例可能來自部分編輯的轉(zhuǎn)錄本。通過在擬南芥線粒體的全基因組規(guī)模上對總mRNA及核糖體相關mRNA中所有位點的編輯水平進行檢測,發(fā)現(xiàn)許多編輯位點都是部分編輯的,這表明線粒體mRNA的完全編輯并不是其翻譯的先決條件[12]。同時,核糖體也會對RNA編輯產(chǎn)生一定程度的影響,Rugen等[15]的研究表明,當RNA與核糖體結合時,編輯位點會更容易接近編輯復合體或者優(yōu)先翻譯編輯程度更高的RNA,而且編輯因子與核糖體也存在著某種關聯(lián)。
在動物體內(nèi)也存在RNA編輯現(xiàn)象,主要存在兩種形式,一種是載脂蛋白B mRNA編輯酶(APOBEC)催化的C-to-U的編輯,另一種是腺苷酸脫氨酶(ADAR)催化A-to-I的編輯[5-6]。此外,CRISPR/Cas是微生物體內(nèi)抵御外源核酸物質(zhì)入侵的一種防御機制[16],具有強大、精準、廉價、易于操作等特點,是基因工程領域廣泛應用的關鍵編輯技術,尤其是靶向DNA的CRISPR/Cas9技術,然而靶向RNA 的技術雖然進步迅速但仍處于研究應用的開始階段,目前已經(jīng)證實VI型CRISPR/Cas系統(tǒng)和相關的Cas13效應器以及III-E型CRISPR/Cas系統(tǒng)和相關的Cas7-11效應器是具有潛力的RNA靶向候選工具[17-18]。與靶向DNA技術所具有的可遺傳性和不可恢復性相比,干預RNA所引起的改變是暫時性的,并不會造成永久性的遺傳,通過調(diào)控還能更好地滿足不同的需要,因此可以作為更安全、更通用的技術方法[19]。
細胞器中RNA結合蛋白對其基因的表達調(diào)控起著舉足輕重的作用[20]。大量研究表明,三角狀五肽重復序列(PPR)蛋白家族是參與細胞器轉(zhuǎn)錄后調(diào)控的主要因子之一,可以作為位點特異性的RNA結合蛋白參與植物細胞器中RNA切割、剪接、穩(wěn)定、降解、編輯和翻譯等RNA加工過程[21]。
2.1.1 PPR蛋白的結構特征 PPR基序通常由35個氨基酸組成的簡并序列串聯(lián)重復[22],每個基序會形成兩個反向平行的α螺旋A和B,它們相互作用會產(chǎn)生螺旋-折疊-螺旋基序,螺旋A的第3、6、7、10位和螺旋B的第19、22、23、26位的氨基酸在此過程中發(fā)揮重要作用[23],且其突變可能會導致PPR蛋白螺旋重復結構的丟失。典型的PPR蛋白一般是由2-27個數(shù)量不等的PPR基序組成[24],一系列PPR基序在整個蛋白質(zhì)中形成的螺旋-折疊-螺旋基序會產(chǎn)生一個具有中央凹槽的超螺旋,為蛋白質(zhì)提供RNA的結合位點[25]。當結合位點發(fā)生突變時,結合RNA的能力會顯著受到影響,比如螺旋A中第2位和第14位的殘基的取代會導致體外RNA結合能力的改變。
PPR蛋白具有3種長度不同的PPR基序:P、L和S基序。P基序即代表含有35個氨基酸的標準PPR基序,而L和S基序與PPR基序相關,分別含有35或36個氨基酸和31個氨基酸,依據(jù)這些氨基酸基序的區(qū)別,PPR蛋白可以細致區(qū)分為只包含P基序的P亞類和包含P、L、S三種基序的PLS亞類。除PPR基序外,其N端通常還包含不保守的細胞器定位序列肽段,其C端序列相對保守,可以分為E、E+及DYW三種結構域。P亞類蛋白通常缺乏C端額外的結構域,能與靶標RNA發(fā)生特異性結合進而保護其免受核酸內(nèi)切酶的消化[26],還可以特異性抑制或激活某些RNA的翻譯來調(diào)控其表達,在細胞器RNA穩(wěn)定、切割、剪接以及翻譯等細胞器基因表達的大多數(shù)方面具有功能[27]。而PLS亞類具有特定的氨基酸保守模式,主要作為編輯因子參與RNA編輯[25],但是并非所有的PPR-RNA編輯因子都是PLS亞類,P亞類PPR蛋白PPME被證實可以參與RNA編輯[28]。根據(jù)不同的C端結構域,PLS亞類可以進一步細分為3類:E類成員還包含C端延伸的E結構域,該結構域并不是催化結構,預測是招募編輯酶的蛋白質(zhì)相互作用基元[29-30];E+亞類額外包含E和E+結構域;另一個PLS亞類不僅包含PPR基序和E、E+結構域,還包含DYW結構域,因其位于C端高度保守的天冬氨酸(D)、酪氨酸(Y)和色氨酸(W)三肽得名[31],后來也發(fā)現(xiàn)極少數(shù)的PPR蛋白末端的3個保守氨基酸為天冬氨酸(D)、苯丙氨酸(F)和色氨酸(W)。
DYW結構域中包含與介導C-to-U轉(zhuǎn)化的胞苷脫氨酶活性位點相匹配的保守催化殘基HxE(x)nPCxxC[32],同時其保守的脫氨酶殘基還具有與胞苷脫氨酶類似的鋅結合能力[33],在鋅結合基序的位置具有組氨酸和半胱氨酸特征,保守的組氨酸和半胱氨酸在胞苷脫氨酶活性位點與鋅原子結合,而保守的谷氨酸則是催化脫氨反應所必需的,DYW域也因此被認為是編輯結構域。Hayes等[34]的研究已經(jīng)證實了DYW結構域具有脫氨酶活性,并且結構域中的PG-box部分可能對功能性DYW蛋白或酶的募集起著至關重要的作用。而且,DYW結構域的脫氨功能在體外也已經(jīng)得到證實[35],來自小立碗蘚(Physcomitrella patens)的PPR65和PPR56蛋白可以在體外被純化,并對同源的外源靶標RNA進行C-to-U的編輯,在大腸桿菌(Escherichia coli)中表達分別實現(xiàn)了ccmFC和nad3/nad4轉(zhuǎn)錄本中共表達蛋白的編輯[36],其編輯活性還受鋅離子的含量影響。Hayes也證實了PPR65重組蛋白在體外具有足夠的C-to-U活性[37]。而缺少完整的DYW結構域的E類編輯因子和E+類編輯因子可能需要由含有DYW結構域的反式因子補充后才能行使編輯功能。比如,DYW1可以為CRR4提供缺失的C端序列;DYW2截斷的C端結構域與E+類PPR蛋白缺失的C端結構域相匹配,可以填補E+亞類PPR蛋白缺失的DYW結構域。
2.1.2 PPR蛋白的識別特征 研究發(fā)現(xiàn),參與RNA編輯的PPR蛋白是通過一個基序?qū)粋€核苷酸的組合形式,序列特異性地與RNA相互作用,其PPR基序特異識別編輯位點上游的核苷酸序列并與之結合,隨后進行脫氨反應完成C-to-U的編輯[38]。當編輯位點的順式元件沒有明顯的保守性時,一些PPR蛋白也可以參與多個位點的編輯事件。Barkan等[39]研究發(fā)現(xiàn)兩個相鄰PPR 基序上的3個位置的氨基酸對RNA的識別起著至關重要的作用,核苷酸特異性主要依賴于每個基序中第3、第6位和下一個基序的第1位(定義為1’)的氨基酸特征,(6,1’)位點上的(Thr,Asp)和(Thr,Asn)分別與G和A結合 ;(6,1’)位點的(Asn,Asp/Asn/Ser)組合與嘧啶的識別相關,(Asn,Asp)對U的顯著偏好高于C,第3位氨基酸起到輔助蛋白質(zhì)-RNA結合的作用;Yagi等[40]的研究也驗證了Barkan的結論,表明PPR蛋白識別可編輯C殘基的上游序列,且PPR-RNA序列與可編輯C之間的距離被證明是保守的,其第1、4和“ii”位置的3個氨基酸組成PPR基序的NSRs(nucleotide-specifyingresidues),第4位氨基酸(同第6位)是識別嘌呤或嘧啶基團的關鍵殘基,其次,識別氨基或酮基的第“ii”位殘基(同第1’位)決定了對靶標RNA序列的序列特異性識別,第1位則提供了附加的限制結合核苷酸。此外,Yin等[41]觀察蛋白晶體結構發(fā)現(xiàn),P亞類PPR10蛋白中串聯(lián)排列的19個PPR重復單元連在一起,組成兩圈右手超螺旋,RNA結合殘基位于其內(nèi)側(cè)表面,第2、5、35位的氨基酸特異性識別RNA堿基。第2位的疏水氨基酸殘基與RNA堿基相互作用;第5位起到最關鍵的RNA堿基識別作用,天冬氨酸與識別靶標RNA的嘧啶堿基相關,絲氨酸或蘇氨酸與嘌呤堿基識別相關;第35位穩(wěn)定第5位的構象,為PPR蛋白特異識別單鏈RNA的分子機制提供了進一步的理論依據(jù)。
2.1.3 PPR蛋白與植物生長發(fā)育的關系 RNA編輯在植物的生長發(fā)育過程中發(fā)揮著不可或缺的作用,調(diào)控細胞器形成、植物開花、胚及胚乳的發(fā)育、植物信號轉(zhuǎn)導、對特定環(huán)境條件的響應和雄性不育等一系列生物過程。如果RNA編輯事件不能正常進行,會引發(fā)一系列的植物生長缺陷,比如線粒體和葉綠體的形成受損、幼苗生長緩慢、胚及胚乳發(fā)育緩慢、開花延遲、對逆境敏感等現(xiàn)象。表1總結了已發(fā)表的PPR蛋白參與RNA編輯事件從而調(diào)控植物生長發(fā)育過程的相關報道,可見RNA編輯對植物正常生長發(fā)育是必要的。
表1 參與RNA編輯的PPR蛋白及其對模式植物生長發(fā)育的調(diào)控Table 1 PPR protein involved in RNA editing and its regulation on model plant growth and development
續(xù)表 Continued
植物線粒體RNA編輯是由多個編輯因子直接或間接參與的復雜生物學過程,PPR蛋白特異性地識別靶標位點附近的順式作用元件并與其結合,并且為其他編輯體成員的附著提供了一個場所。除PPR蛋白家族外,RIP/MORF 蛋白[76]、ORRM 蛋白[77]、OZ 蛋白[78]、NUWA 蛋白[79]、CP31 蛋白[80]、PPO1蛋白[81]以及OCP3蛋白[82]等都已經(jīng)被鑒定為植物RNA編輯體的組成部分。
第一類被發(fā)現(xiàn)的非PPR蛋白的RNA編輯因子是RIP/MORF家族蛋白,在水稻中有5個含有保守RIP/MORF基序的蛋白質(zhì),擬南芥中已發(fā)現(xiàn)10個,其中MORF2和MORF9定位于葉綠體中,MORF8雙定位于兩個細胞器[60],其余蛋白定位于線粒體。在擬南芥rip1突變體中,400多個線粒體編輯位點活性顯著降低,從而造成線粒體功能性障礙[83];MORF1和MORF3的突變會對線粒體中的50多個編輯位點造成影響[84];MORF8控制70%以上位點的編輯[85]。有研究表明,RIP/MORF蛋白之間也可以形成異源二聚體,在某些位點的功能也可以被同源二聚體取代。
此外,擬南芥中已有6種ORRM蛋白被報道為RNA編輯因子[86]。ORRM1和ORRM6定位在葉綠體中,其余4個蛋白為線粒體編輯因子[87],并且由于其位點的特異性影響了大量編輯事件。ORRM2和ORRM3的瞬時沉默會分別導致35個和32個線粒體位點的編輯效率降低[88]。ORRMs也可與RIP/MORF因子相互作用,形成同源或異源二聚體[86]。
與RIP1的發(fā)現(xiàn)類似,OZ1也在orrm1共純化蛋白復合物中發(fā)現(xiàn)[78],在擬南芥中OZ家族包括4個成員,其中OZ3定位于線粒體,另外3個定位于葉
綠體。在擬南芥中,OZ1的缺失導致30個質(zhì)體位點的編輯缺陷。該家族蛋白中唯一有注釋的結構域是RanBP2型鋅指結構,但是否通過這種結構與鋅離子結合進而在RNA編輯復合體中起作用還需要進一步研究。
Andrés-Colás等[89-90]的研究表明,P 類 PPR 蛋白NUWA的突變體中許多RNA編輯位點可以被E+亞類PPR編輯因子所靶向,增強了E+亞類PPR 蛋白SLO2與線粒體DYW2的相互作用,且NUWA蛋白在體內(nèi)還與MORF蛋白相關聯(lián),與 MORF1或MORF2蛋白共沉淀,有關NUWA的研究表明其他P類PPR蛋白可能也參與形成植物細胞器中的RNA編輯復合物。另外3種蛋白質(zhì)CP31、PPO1和OCP3被發(fā)現(xiàn)影響質(zhì)體中的RNA編輯效率。CP31缺失會導致多個質(zhì)體位點的編輯水平降低[80],且突變體中轉(zhuǎn)錄本的豐度大大降低,這表明CP31可能影響RNA的穩(wěn)定性[91]。PPO1是四吡啶代謝的關鍵酶,突變會造成18個質(zhì)體位點的編輯減弱,但不會完全失去編輯功能,可以直接與質(zhì)體RIP /MORFs相互作用,但不與PPR因子相互作用[81]。OCP3編碼一種陽離子過氧化物酶,突變后質(zhì)體ndhB轉(zhuǎn)錄本中多個位點的編輯程度輕微降低,削弱NADPH脫氫酶(NDH)復合體的活性從而增強植物對真菌感染的抗性[92]。
多種RNA編輯因子協(xié)調(diào)配合,共同組成編輯復合體,靈活多變地在細胞器RNA編輯過程中發(fā)揮作用。PLS型PPR蛋白識別并特異性結合編輯位點,PPR-RNA復合物與其他一些非PPR蛋白因子組成編輯體,非PPR蛋白可能作為編輯效率的調(diào)節(jié)器或者利用額外的輔助因子招募位點特異性的PPR蛋白進入活性編輯機制[93]。
動物體內(nèi)主要存在兩種形式的RNA編輯現(xiàn)象,一種是載脂蛋白B mRNA編輯酶(APOBEC)催化的C-to-U的編輯,哺乳動物中主要存在11種APOBEC蛋 白, 其 中 APOBEC1、APOBEC3F和APOBEC3G具有催化活性[94];另一種是腺苷酸脫氨酶(ADAR)催化A-to-I的編輯,哺乳動物中主要存在3種ADAR蛋白,其中ADAR1和ADAR2具有催化活性[95]。除脫氨酶介導的編輯形式外,CRISPR/Cas編輯復合體是近年來RNA編輯領域的研究熱點。
RNA靶向VI型CRISPR/Cas系統(tǒng)于2016年被首次發(fā)現(xiàn),East-Seletsky等[96]在微生物基因組和宏基因組數(shù)據(jù)中搜索候選CRISPR/Cas位點時發(fā)現(xiàn),Cas13具 有 Cas13a、Cas13b、Cas13c和 Cas13d四種亞型。Abudayye等[97]首次證實了Cas13是一種RNA靶向的新型CRISPR酶,可以進行精確的RNA堿基編輯,Jing等[98]發(fā)現(xiàn)VI型CRISPR-Cas系統(tǒng)可以介導裂殖酵母(Schizosaccharomyces pombe)的RNA敲除和單堿基RNA編輯;Cox等[99]研究發(fā)現(xiàn),將失活的Cas13b融合到ADAR2腺嘌呤脫氨酶結構域可以實現(xiàn)A-to-I的單堿基替換,命名為REPAIR(RNA editing for programmable A to I replacement),可以特異性地識別A/C錯配,實現(xiàn)特定位點核苷酸的高效精確編輯,隨后Abudayyeh等[100]用胞苷脫氨酶替換腺嘌呤脫氨酶,實現(xiàn)了從C-to-U的單堿基編輯,并命名為RESCUE(RNA editing for specific C to U exchange),填補了RNA編輯工具中的關鍵空白。
Liu 等[101]與 Knott等[102]解析 Cas13a單蛋白、Cas13a-crRNA二元復合物、Cas13a-crRNA及靶RNA三元復合物晶體結構后,指出Cas13a是一種RNA介導的具有RNase活性的Cas效應蛋白,可自我加工pre-crRNA形成成熟crRNA,通過其2個HEPN(higher eukaryotic and prokaryotic nucleasedomains)結構域內(nèi)的保守氨基酸可以有效地降解ssRNA(singlestranded RNA)。此外,Cas13a與組織特異性啟動子聯(lián)合可以敲除特定組織中的目標RNA,與核定位信號融合可以靶向非編碼細胞核轉(zhuǎn)錄產(chǎn)物,擴大了作用范圍[103],有助于進一步研究RNA結合蛋白的功能。
但是Cas13a酶本質(zhì)上是一種相對較大的蛋白質(zhì),很難被包裝到靶組織中,這也是臨床應用的一大障礙。2018年,Konermann等[17]發(fā)現(xiàn)了靶向RNA的Cas13d家族,是目前發(fā)現(xiàn)的哺乳動物細胞中相對較小的Ⅱ類CRISPR效應因子,關鍵特征在于依賴一種比以前研究中物理尺寸更小的酶,且對RNA靶點的切割不依賴于PFS序列(protospacer flanking sequence),可以靈活設計sgRNA。Cas13d家族成員CasRx來自腸道黃化瘤胃球 菌(Ruminococcus flavefaciens)XPD3002[104], 是已發(fā)現(xiàn)的最小的效應蛋白,比Cas13a-c小20%左右,更易包裝到AAV(adeno-associated virus)等容量有限的載體中實現(xiàn)體內(nèi)運輸,在編輯效率高達96%的同時沒有明顯脫靶效應,已經(jīng)成為動物RNA編輯系統(tǒng)中的首選工具。Wang等[105]利用CasRx系統(tǒng)靶向石斑魚神經(jīng)壞死病毒以干擾其感染,為病毒免疫提供了潛在機制;Huynh等[106]依賴CasRx開發(fā)了在RNA水平操縱基因表達的工具,靶向果蠅體內(nèi)的內(nèi)源性轉(zhuǎn)錄本;Brogan等[107]利用CasRx系統(tǒng)構建 SENSR(sensitive enzymatic nucleic acid sequence reporter)檢測SARS-CoV-2,開發(fā)了迅速適應新病原體的即時診斷工具。
脫靶效應始終是評價編輯體系可靠性的重要指標,是RNA編輯應用中尤為關鍵的安全性問題,與靶標RNA非常接近的片段有可能在編輯過程中被同時沉默,進而導致基因組的變異和染色體重排。Manghwar等[108]總結了當前的ZFN技術、TALEN技術和CRISPR/Cas系統(tǒng)等基因編輯工具產(chǎn)生的脫靶效應,并提出開發(fā)利用預測工具、設計高質(zhì)量靶標等有效減少或避免脫靶的策略。Grünewald等[109]的研究結果表明,單堿基編輯同樣面臨著造成大量突變的脫靶風險,使用兩個帶有rAPOBEC1突變的優(yōu)化編輯器(cytosine base editor,CBE)會使變異率分別減少390倍和3 800倍,可以減少RNA脫靶效應的發(fā)生。
若要從技術源頭去規(guī)避脫靶效應,開發(fā)精準性更高的新基因編輯系統(tǒng)是首選方案[107]。與RNAi相比,Cas13a系統(tǒng)脫靶率顯著降低[110],Konermann等[17]也證實了Cas13d介導的基因沉默在數(shù)百個shRNA脫靶的情況下沒有脫靶,可見Cas13系統(tǒng)在精度、效率和實用性等方面有突出的優(yōu)勢,但Cas13并非完美的臨床應用工具,由于其本身具有旁切活性,當其識別到靶標時,不僅能切割底物RNA,還會切割游離的任意單鏈RNA,對細胞造成一定程度的損傷。
2021年,Jonathan和Omar團隊篩選出獨特的III-E型CRISPR-Cas系統(tǒng)攻克了這一難題[18],該系統(tǒng)借助單一的效應蛋白Cas7-11(包含4個Cas7的亞基和一個Cas11的亞基的融合蛋白),精準靶向RNA且沒有表現(xiàn)出傷害細胞的旁切活性,來自石本氏脫硫絲菌(Desulfonema ishimotonii)的DiCas7-11將pre-crRNA加工為成熟的crRNA,并在靶標位點精確切割RNA,保持其他RNA不受干擾,這意味著Cas7-11可以在不傷害細胞的情況下改變RNA中的特定堿基,從而校正基因突變帶來的錯誤。此外,Cas7-11還可以穩(wěn)定或破壞特定RNA分子來調(diào)節(jié)其編碼蛋白質(zhì)的水平。Cas7-11是一種高特異性且低細胞毒性的新型RNA編輯工具[18],豐富了CRISPR/Cas系統(tǒng)多樣性,進一步推動了RNA編輯技術的發(fā)展。
目前,特異靶向RNA的VI型CRISPR/Cas系統(tǒng)已經(jīng)成為動物RNA編輯系統(tǒng)中的熱門工具,由于該系統(tǒng)優(yōu)勢突出,也在植物中開展了研究,主要在抑制植物病毒方面發(fā)揮作用。在感染植物的病毒屬中,約70%是在其生命周期中不使用DNA中間產(chǎn)物的ssRNA病毒[111],因此特異靶向ssRNA的CRISPR/Cas系統(tǒng)更適合用來抑制ssRNA病毒。在擬南芥中轉(zhuǎn)基因表達的LshCas13a首次證明了Cas13系統(tǒng)在植物中可以保持其pre-crRNA加工活性,干擾蕪菁花葉病毒的復制且不會引起細胞毒性作用[112];RfxCas13d也對植物RNA病毒如蕪菁花葉病毒、煙草花葉病毒和黃瓜花葉病毒表現(xiàn)出強大特異的抗病毒活性,為抗病毒分子育種檢測提供了新的策略[113]。
隨著RNA編輯研究的不斷擴展,關于RNA編輯事件的數(shù)據(jù)庫資源也逐漸豐富完備(表2)。RNA編輯數(shù)據(jù)庫不僅全面完整地記錄了編輯事件、編輯位點等信息,還會將其編輯類型、編輯因子與編輯時之間的交互作用等詳細記錄,如REDIdb數(shù)據(jù)庫記錄了486個線粒體序列和220個葉綠體序列的編輯類型,其中67%是堿基替換,堿基的插入與刪除分別占比30%和3%[114];PED不僅記錄了編輯類型,還包括8個模式物種中編輯因子在調(diào)控植物表型中的功能作用以及詳細的研究結論[115]。數(shù)據(jù)庫的建立與改進,有利于充分有效地管理和利用信息資源,為后續(xù)的科學研究提供了準確的數(shù)據(jù)支撐和強有力的理論支持。
表2 部分RNA編輯數(shù)據(jù)庫Table 2 Partial RNA editing database
RNA編輯使轉(zhuǎn)錄產(chǎn)物不能準確反映DNA的一級序列,由此改變了遺傳信息,拓寬了中心法則的范圍,這一現(xiàn)象既豐富了基因表達產(chǎn)物的多樣性,也使得依賴于DNA序列而推測蛋白質(zhì)序列的傳統(tǒng)方法具有一定的不可靠性。
目前關于植物體內(nèi)RNA編輯的研究多集中在細胞器內(nèi)依賴于RNA編輯復合體的C-to-U的形式。在眾多的RNA編輯因子中,PPR蛋白是目前被發(fā)現(xiàn)的能夠和靶標編輯位點所在的順式作用元件直接結合的因子,隨著研究的深入,通過PPR基序預測識別RNA序列的機制也逐漸變得清晰,但是并非所有的PPR蛋白都能按照這一預測模型完全準確地識別其靶標位點,PPR蛋白中不同結構域的功能以及發(fā)揮編輯功能的過程仍沒有被完全揭示。此外,編輯復合體中已知的非PPR蛋白的具體功能以及究竟還有多少種未知的編輯因子在發(fā)揮功能不得而知,其作用機制仍然需要大量的研究去闡述。
此外,基于CRISPR/Cas系統(tǒng)以及相應效應器的RNA編輯技術的開發(fā)與應用是生命科學領域的一大突破性進展,作為基因編輯工具發(fā)揮了相當重要的功能,但它仍需要進一步提高性能及其安全性。例如,提高對靶標RNA的編輯能力、Cas酶活性的調(diào)控、不同類別蛋白組分間融合進化的機制以及新型蛋白如何在體內(nèi)更好地遞送等都需要后續(xù)的深入研究,尤其是如何正確評估、檢測脫靶效應并發(fā)展更高效精準的編輯系統(tǒng),是當前基因編輯器和編輯工具安全應用于臨床的重要研究方向。
目前,RNA編輯技術已經(jīng)在基礎研究、動植物性狀的定向改良、抗病毒分子育種、癌癥及神經(jīng)性疾病臨床治療、藥物及疫苗的研發(fā)等基因工程領域中發(fā)揮了不可替代的作用,是生命科學微觀領域的一大里程碑式探索,事實上,RNA編輯看似僅是一個簡單的生物學過程,仍有許多未知的科學問題需要進一步探索。如RNA編輯與細胞器進化、內(nèi)共生學說等存在何種聯(lián)系?為什么RNA編輯在不同組織間差異如此顯著?部分編輯與完全編輯這兩種編輯形式在體內(nèi)如何配合?對RNA編輯的本質(zhì)及作用機制的進一步研究,開拓新的發(fā)展方向,可以使人們對于生命科學的認識上升到新的高度,使RNA編輯成為基因工程以及基因治療中強有力的新型工具。