蘇 越,梁琳慧*,何祥火*
1.復旦大學 生物醫(yī)學研究院,上海 200032;2.復旦大學附屬腫瘤醫(yī)院 腫瘤研究所,上海 200032
長鏈非編碼RNA(long non-coding RNA,lncRNA)是指長度200堿基對以上、不具備編碼蛋白質(zhì)能力的RNA。目前共有15 878個lncRNA[1]被鑒定出來。lncRNA調(diào)控許多重要的生理活動,如細胞分裂、細胞分化、細胞自噬、細胞凋亡等。大多數(shù)lncRNA分布在胞核和胞質(zhì),也有少數(shù)會分布于細胞器,如線粒體、內(nèi)質(zhì)網(wǎng)等。這些亞細胞定位的差異賦予lncRNA不同的功能。
近年來,許多新技術(shù)被用于研究lncRNA的定位。例如, 利用鏈霉素親和素特異性結(jié)合開發(fā)的抗壞血酸過氧化物酶(ascorbate peroxidase 2,APEX2)技術(shù)[2]和免疫沉淀作用的細胞器分離技術(shù)[3]等, 這些技術(shù)使得研究lncRNA的亞細胞定位更加便捷。此外,根據(jù)lncRNA定位機制,研究人員開發(fā)了強制改變lncRNA定位的載體,比如通過兩個小核仁RNA(small nucleolar RNA,snoRNA)的作用,使lncRNA留在胞核[4];通過病毒來源的出核元件[5]或來自lncRNA本身的出核響應序列[6]達到將lncRNA輸出胞核的目的。
因此,通過研究lncRNA的亞細胞定位及其功能之間的聯(lián)系,有助于理解lncRNA所發(fā)揮的功能及其具體分子機制,從而豐富lncRNA的基因調(diào)控網(wǎng)絡,為lncRNA的靶向治療提供堅實的理論基礎(chǔ)。
lncRNA是非編碼RNA(non-coding RNA, ncRNA)中最普遍,功能最多樣化的一個類別。有研究者將其定義為作為初級或剪接轉(zhuǎn)錄本發(fā)揮作用的ncRNA,它們存在于多個物種中,不過lncRNA因受到的加工不同,致使其在不同物種間的定位和功能有所差別。如FAST在人類胚胎干細胞中定位于細胞質(zhì),與E40泛素連接酶β-TrCP的WD3結(jié)構(gòu)域結(jié)合,并阻斷其與磷酸化β-catenin的相互作用以防止降解,導致多能性所需的WNT信號激活。而FAST在小鼠胚胎干細胞中定位于細胞核,剪接因子PPIE抑制其加工,使其不能出核,不具備促進干細胞多能性的功能[7]。
通過APEX-seq技術(shù)對RNA的亞細胞定位進行分析,發(fā)現(xiàn)大部分lncRNA主要位于細胞核中[2],且最初的研究表明,這些核定位lncRNA為染色質(zhì)調(diào)節(jié)因子,對染色體結(jié)構(gòu)的維持具有重要作用。如包含端粒重復序列RNA(telomeric-repeat-containing RNA,TERRA),功能性基因間重復RNA元件(functional intergenic repeating RNA element,FIRRE)等。TERRA 是一種由亞端粒和端粒序列轉(zhuǎn)錄,在穩(wěn)定端粒中發(fā)揮重要作用的lncRNA。TERRA通過RAD51重組酶和自身的5′-UUAGGG-3′重復序列形成R環(huán)并靶向染色體末端[8]。RAD51相關(guān)蛋白1(RAD51-associated protein 1,RAD51AP1)結(jié)合并穩(wěn)定R環(huán)結(jié)構(gòu),并催化DNA鏈侵入端粒序列,促進端粒的選擇性延伸(alternative lengthening of telomeres,ALT)相關(guān)的同源修復[9]。除了與染色質(zhì)相互作用之外,細胞核中的lncRNA還能參與調(diào)控基因轉(zhuǎn)錄,例如巨噬細胞特異性的lncRNA MAARS通過與HuR結(jié)合,阻止HuR從細胞核轉(zhuǎn)移至細胞質(zhì),調(diào)節(jié)HuR靶標如p53、p27、caspase-9和BCL2的表達,從而引起動脈粥樣硬化[10];特異性生長抑制基因5(growth arrest-specific 5,GAS5)在存在絲氨酸/精氨酸剪接因子4(serine and arginine rich splicing factor 4,SRSF4)時,與糖皮質(zhì)激素受體結(jié)合并抑制其與靶基因中GRE區(qū)域的結(jié)合,抑制心肌肥大的發(fā)生[11]。此外,核中的lncRNA還可以參與調(diào)控mRNA的可變剪接,例如在低氧刺激下腸癌細胞中的Lucat1可以結(jié)合多聚嘧啶區(qū)結(jié)合蛋白1(polypyrimidine tract binding protein 1,PTBP1),增強PTBP1下游轉(zhuǎn)錄本如CD44、CLSTN1等與PTBP1的結(jié)合,進而調(diào)節(jié)這些分子的可變剪接,促進腸癌的發(fā)生發(fā)展[12]。
定位于胞質(zhì)的lncRNA發(fā)揮與胞核lncRNA不同的功能。目前研究表明,它們可參與以下細胞活動:1)信號傳導。如RP11-295G20.2與磷酸酶和張力蛋白同源物(phosphatase and tensin homolog,PTEN)的N端結(jié)合,促進p62與PTEN的相互作用。因此,PTEN易位到溶酶體中并被降解。RP11-295G20.2通過影響PTEN穩(wěn)定進而調(diào)控AKT磷酸化,抑制叉頭盒轉(zhuǎn)錄因子3a(forkhead box transcrip-tion factor 3a,FOXO3a)轉(zhuǎn)運進入細胞核,抑制調(diào)節(jié)自噬相關(guān)基因的轉(zhuǎn)錄[13]。2)轉(zhuǎn)錄后調(diào)控。NORAD在食管鱗狀細胞癌(esophageal squamous cell carcinoma,ESCC)細胞中充當miR-224-3p的分子海綿,調(diào)節(jié)ESCC細胞中間黏蛋白(MTDH)的表達,進而促進β-連環(huán)蛋白在體外和體內(nèi)的核積累,促進了ESCC細胞的順鉑抗性和進展[14]。3)翻譯及翻譯后修飾。Caren會阻礙組氨酸三聯(lián)體核苷酸結(jié)合蛋白1(histidine triad nucleotide binding protein 1,Hint1) mRNA的翻譯,進而抑制共濟失調(diào)毛細血管擴張癥突變-DNA損傷反應(ataxia telangiectasia mutated-DNA damage response,ATM-DDR)途徑,并穩(wěn)定心肌細胞中的線粒體呼吸能力,發(fā)揮心臟保護作用[15]。
有些lncRNA的核質(zhì)分布在不同疾病中不同,這種定位的差異導致了同一個lncRNA在不同疾病中功能的差異。如小核仁RNA宿主基因11(small nucleolar RNA host gene 11,SNHG11)位于胞質(zhì)時,通過SNHG11/miR-7-5p/磷脂酶C-β1(phospholipase C Beta 1,PLCB1)軸參與p38MAPK信號通路,抑制急性胰腺炎進展,從而為急性胰腺炎治療提供潛在的靶點和方向[16]。位于胞核時SNHG11則與低氧誘導因子1α(hypoxia inducible factor 1 subunit alpha,HIF-1α)上的pVHL識別位點結(jié)合,阻斷pVHL與HIF-1α的相互作用并阻止其泛素化和降解,促進腸癌的侵襲和轉(zhuǎn)移[17]。
少部分lncRNA會被運輸至細胞器中,發(fā)揮相應的功能。在核糖體中l(wèi)ncRNA ZNFX1反義RNA1(ZNFX1 antisense RNA 1,ZFAS1)可以與核糖體的40s亞基結(jié)合發(fā)揮調(diào)控作用[18];利用APEX-seq檢測到28條lncRNA定位在內(nèi)質(zhì)網(wǎng)。其中DNA損傷激活的非編碼RNA(NORAD)、TUG1是研究較多的lncRNA,但這些lncRNA與內(nèi)質(zhì)網(wǎng)的功能有無關(guān)系尚未確定[2]。非編碼RNA在線粒體的正常運轉(zhuǎn)中發(fā)揮著重要作用。例如GAS5可以轉(zhuǎn)位至線粒體中維持細胞能量穩(wěn)態(tài)[3]。此外,一些溶酶體定位的lncRNA被篩選出來[3],但這些lncRNA的功能尚不清楚??偟膩碚f,細胞器中包含了哪些lncRNA,這些lncRNA發(fā)揮什么樣的功能還有待進一步探究。
盡管lncRNA的亞細胞定位和其功能之間存在聯(lián)系,但是lncRNA是如何實現(xiàn)其亞細胞分布的分子機制尚不清楚,目前有少部分研究對lncRNA定位機制進行了初步探索。
通常lncRNA的剪接效率低于mRNA,有些lncRNA是通過異常的RNA聚合酶Ⅱ轉(zhuǎn)錄產(chǎn)生的低聚腺苷化和不穩(wěn)定的轉(zhuǎn)錄本,而轉(zhuǎn)錄和加工是高效的mRNA輸出的前提,因此這種lncRNA轉(zhuǎn)錄和加工的改變可能會導致lncRNA的低效核輸出。其次,lncRNA內(nèi)部的一些順式元件也會促進自身的核滯留,如形成R環(huán)結(jié)構(gòu)、Malat1的區(qū)域E(nt:1 961~3 040)和M(nt:6 387~7 011)、SLERT含H/ACA框的snoRNA兩端(SNORA5A和SNORA5C)、骨形蛋白2(bone morphogenetic protein 2,BMP2)/OP1響應基因(BMP2/OP1-responsive gene,BORG)的五聚體序列AGCCC、Alu重復序列等都會促進lncRNA的核滯留。此外,反式因子也可以調(diào)控lncRNA促進其核滯留,如異質(zhì)核糖核蛋白K(heterogeneous nuclear ribonucleoprotein K,hnRNPK)與Malat1中的短的分散的核元件B1相互作用以確保Malat1核斑定位[19]等等。
細胞內(nèi)RNA的核輸出機制大體分為3類,雖然對lncRNA的相關(guān)核輸出機制沒有特別充分的研究,但總體上和其他RNA一樣:1)利用TREX-TAP途徑進行核輸出。TREX由保守的核心亞基如ALY、UAP56和THO亞復合物組成,TREX主要通過剪接復合物招募,以ATP依賴的方式組裝,并與mRNA的5′端結(jié)合將其轉(zhuǎn)運給NXF1-p15二聚體等轉(zhuǎn)運因子,SRSF家族參與此過程,通過與核孔蛋白相互作用,完成出核。這個過程中NXF1優(yōu)先輸出具有長外顯子或高A/U含量的單外顯子或少數(shù)外顯子轉(zhuǎn)錄本[20]。例如SRSF1和SRSF7識別與NF-κB作用的lncRNA(NF-κB interacting lncRNA,NKILA)的胞質(zhì)積聚區(qū)域元件(cytoplasmic accumulation region in NIKLA,CARN)(251~450 nt),通過與UAP56和Aly/Ref輸出因子(Aly/REF export factor,ALYREF)的相互作用促進TREX的募集,并通過TREX-TAP通路介導NKILA的輸出[6]。2)通過染色體維持蛋白1(chromosome region maintenance 1,CRM1)途徑輸出。含有NES的適配器蛋白直接與RNA或其他RNA結(jié)合蛋白結(jié)合,招募CRM1通過核孔輸出到核。lncRNA線粒體加工RNA的內(nèi)切酶復合物中RNA組分(RNA component of mitochon-drial RNA processing endoribonuc-lease,RMRP)與人抗原R(HUR)相互作用,通過CRM1促進其核輸出[21]。3)與核輸出蛋白結(jié)合共同出核。如在葡萄糖刺激下,蛋白Pinin介導核旁斑點組裝轉(zhuǎn)錄本1(nuclear paraspeckle assembly transcript 1,NEAT1)的核輸出[22]。
目前關(guān)于lncRNA亞細胞器定位的研究較少,主要聚焦于線粒體。lncRNA精確定位于線粒體的機制主要有兩種:1)與定位在線粒體的蛋白形成復合物,進而共同定位線粒體。lncRNA RMRP經(jīng)CRM1介導出核后,結(jié)合富集G基序結(jié)合因子1(G-rich RNA sequence binding factor 1,GRSF1),在線粒體基質(zhì)中表達增加[21]。2)借由細胞通訊定位在線粒體發(fā)揮功能。Linc00473與脂滴包被蛋白(perilipin 1,PLIN1)交聯(lián)實現(xiàn)脂滴和線粒體的共定位,激活脂解與線粒體呼吸作用[23]。
在細胞受到外界刺激時,lncRNA的胞內(nèi)分布發(fā)生改變。比如在糖刺激下,NEAT1和Pinin蛋白結(jié)合從胞核轉(zhuǎn)移到胞質(zhì)后,作為支架組裝形成磷酸甘油酸激酶1(PGK1) /磷酸甘油酸突變酶1(PGAM1)/烯醇化酶1復合物(ENO1),促進糖酵解的高效發(fā)生,進而促進乳腺癌的發(fā)生發(fā)展[22]。此外,借由真核表達載體進行l(wèi)ncRNA的功能研究時,常受到載體本身含有的轉(zhuǎn)錄元件、翻譯元件以及核輸出元件的影響,使得外源表達的lncRNA的核質(zhì)分布與期望產(chǎn)生差異[4]。因此研究者嘗試對外源表達的lncRNA進行強制定位,以精確地揭示定位和功能之間的關(guān)系。
有研究者利用SLERT的核滯留機制開發(fā)了相應的Snovector,幫助lncRNA強制定位胞核[4]。而lncRNA的出核可以通過增加一段病毒出核序列元件比如胞質(zhì)積聚元件(cytoplasmic accumulation element,CAE)、持續(xù)性輸出元件(constitutive transport element,CTE)、胞質(zhì)積聚區(qū)域元件(cytoplasmic accumulation region element,CARE)以及NKILA的出核序列CARN實現(xiàn)強制出核。目前本實驗室正在尋找其他的胞質(zhì)定位序列,并嘗試將已發(fā)現(xiàn)的胞質(zhì)定位元件與不同亞細胞定位的lncRNA進行組合,尋找核輸出組合的最佳方式。
為了研究細胞內(nèi)各結(jié)構(gòu)中是否存在及存在哪些lncRNA,研究者開發(fā)應用了一些新技術(shù)。1)APEX-seq: APEX2是大豆抗壞血酸過氧化物酶的進化突變體,苯酚是一種膜透性小分子,APEX2可催化生物素-苯酚的單電子氧化,產(chǎn)生半衰期<1ms 生物素-苯酚自由基,共價偶聯(lián)到蛋白質(zhì)側(cè)鏈上,使得以該蛋白為中心,周圍幾納米范圍內(nèi)的物質(zhì)都被生物素標記,通過鏈霉親和素-生物素結(jié)合富集生物素標記的RNA進行測序[2]。2)通過細胞器標志蛋白免疫共沉淀,得到特異的細胞器組分從而測序。譬如通過線粒體、溶酶體、內(nèi)質(zhì)網(wǎng)的代表蛋白Tom20、 LAMP2、 Calnexin篩選出線粒體定位的GAS5并研究其在能量代謝中作用[3]。
lncRNA是目前的研究熱點之一,越來越多有功能的lncRNA被發(fā)現(xiàn),但也存在許多尚未解決的問題,尤其是其定位與功能的關(guān)系,亟需更多研究來探索。lncRNA在不同癌種之間的亞細胞定位是否固定?同一種細胞中,lncRNA是否出現(xiàn)不同的定位?這些不同的定位是否有功能差異?什么分子機制造成了這樣的定位分布?定位在線粒體的GAS5是如何準確定位到線粒體?這些問題正逐漸成為下一階段lncRNA研究的熱點。鑒于lncRNA在細胞中發(fā)揮著重要作用,通過靶向lncRNA來治療疾病被認為是一種非常有前景的方法。有研究發(fā)現(xiàn)針對NATs的反義寡核苷酸(anti-sense oligonucleotide,ASOs)在中樞神經(jīng)系統(tǒng)的基因再活化方面顯示出了非常有希望的臨床前結(jié)果[24]。