王國強,衛(wèi) 寧,王 禹,龐衛(wèi)軍
(西北農林科技大學動物科技學院,陜西楊凌712100)
近年來,高通量轉錄組測序分析發(fā)現哺乳動物基因組中存在一系列不編碼蛋白質的正義、反義、內含子和基因間的轉錄本[1-4],統(tǒng)稱為非編碼RNA(non-coding RNA,ncRNA),其中轉錄本長度大于200nt的稱為長鏈非編碼RNA(long non-coding RNA,lncRNA)。lncRNA最初被認為是RNA聚合酶II轉錄的副產物,不具有生物學功能。然而,近年來研究表明,lncRNA參與了X染色體沉默、染色體修飾和基因組修飾、轉錄激活、轉錄干擾、核內運輸等重要的生物學過程,且具有促進細胞凋亡、病毒入侵、多能干細胞去分化、細胞命運標記和遺傳印記等多種功能[5-10]。據統(tǒng)計,哺乳動物蛋白編碼RNA僅占總RNA的1%,而長鏈非編碼RNA占總RNA的比例可達4%~9%[11]。lncRNA還與多種疾病的發(fā)生、發(fā)展、診斷和治療有密切關系,特別是在多種癌癥的表觀遺傳調控方面起著重要作用。本文綜述了lncRNA與DNA、mRNA、miRNA和蛋白的互作關系,旨在為進一步研究lncRNA調控網絡及其在相關代謝途徑中的功能提供參考。
由于lncRNA數目眾多,功能各異所以對其還沒有統(tǒng)一的定義。目前,普遍認為lncRNA是大于200nt的、沒有編碼蛋白功能的RNA,但以RNA形式在表觀遺傳調控、轉錄調控以及轉錄后調控等多種層面上調節(jié)基因的表達水平。lncRNA可由DNA的正義鏈(sense strand of DNA)或反義鏈(antisense strand of DNA)轉錄產生,位于細胞核內或者胞漿中。大多數lncRNA與mRNA具有相同的轉錄機制,即需要RNA聚合酶II的參與以及與轉錄起始和延伸相關的組蛋白的修飾。這些lncRNA具有5'端的甲基鳥苷帽子,相當一部分lncRNA的3'端具有多聚腺苷尾[12-14]。
對lncRNA進行科學的分類是有效地研究lncRNA的前提,目前比較公認的是根據其來源于基因組的不同位置分為五類[11]:①正義的(sense),蛋白編碼基因轉錄產物經過剪接產生的無編碼功能的轉錄本;②反義的(antisense,AS),由與蛋白編碼基因互補的DNA鏈轉錄產生,且和該基因有一個或數個外顯子的重疊;③雙向的(bidirectional),基因組鄰近區(qū)域互補的兩條鏈上的基因同時表達的轉錄本;④內含子的(intronic),即完全來源于基因的內含子;⑤基因間的(intergenic),位于兩個基因間的區(qū)域。
2.1.1 等位基因特異性 遺傳印記是等位基因特異性的一個后生調控機制。多數情況下,哺乳動物來自親本的兩個等位基因表達是對等的,然而其中一小部分帶有印記的基因的表達被表觀遺傳機制限制在母本或父本等位基因。一些lncRNA通過與染色質相互作用和招募染色質修飾結構來調節(jié)多種基因的轉錄沉默,如被定位于KCNQ1r印跡基因簇的Kcnq1ot1AS lncRNA與組蛋白甲基轉移酶G9a和PRC2(Polycomb repressive complex2,PRC2)相互作用,有效地通過招募多梳復合物在順式位置形成其轉錄位點的抑制結構域[15]。
2.1.2 甲基化與泛素化修飾 lncRNA TUG1可與抑制性復合物CoR結合作用于甲基化酶Suv39h1對多梳蛋白Pc2進行甲基化修飾,進而結合E2F1因子(能夠抑制促進生長的一系列基因的表達,使細胞處于休眠狀態(tài)),形成抑制性復合體,該復合體結合于DNA鏈上可抑制一系列基因的表達;而lncRNA NEAT2則與其作用相反,它能結合激活性復合物CoA,作用于Pc2進而使E2F1因子泛素化,從而解除抑制作用,促進一系列促生長基因(MCM3、CDC25A、PCNA、MSH2、RBL1等)的表達,如圖1所示[16]。
圖1 lncRNA TUG1和NEAT2的表觀遺傳調控功能[16]Fig.1 Epigenetic regulatory function of lncRNA TUG1and NEAT2
2.2.1 直接順式調控轉錄 lncRNA可以結合轉錄因子,直接順式調節(jié)基因的轉錄,而不是通過與DNA結合而發(fā)揮轉錄調控作用。如電離輻射誘導的細胞周期蛋白D1(Cyclin D1,CCND1)啟動子上游轉錄出的lncRNA與脂肪肉瘤易位蛋白(Translocation liposarcoma protein,TLS)結合,從而產生變構效果,結合并抑制組蛋白乙酰轉移酶,導致CCND1轉錄下調[17]。
2.2.2 與DNA形成異源多聚體 lncRNA與不同功能的幾類效應分子--激活性復合體如三胸苷蛋白(Three thymidine protein,TXG)、抑制性復合物蛋白質如多梳蛋白基團(Polycomb group protein,PCG)等構成大分子復合體,然后與靶基因結合,形成蛋白質-RNA-DNA異源多聚體調節(jié)基因的轉錄。位于CDKN1A基因上游的lincRNA-p21,在DNA損傷的情況下被誘導轉錄,作為經典p53通路的轉錄抑制因子,通過結合和修飾核內非均一核糖核蛋白hnRNP-K,從而作用并抑制p53基因,引發(fā)細胞凋亡[18]。再如上文提到的TUG1和NEAT2,它們激活或抑制基因的表達也是通過與DNA形成異源多聚體實現的。
2.2.3 轉錄干擾 一些基因的mRNA的內源性互補轉錄本--天然反義轉錄本(Natural antisense transcripts,或AS lncRNA)在轉錄時,與正義轉錄本(mRNA)的重疊區(qū)較大,兩個RNA聚合酶相互碰撞導致轉錄起始受阻,產生一條鏈轉錄而另一條鏈轉錄受抑制的轉錄干擾現象[19],尤其見于“尾對尾”轉錄的反義轉錄本中[20]。
lncRNA在轉錄后水平可通過和互補的mRNA形成雙鏈RNA,影響mRNA加工、剪接、轉運、翻譯和降解等過程,從而調節(jié)基因的表達。人急性粒細胞白血病細胞HL-60細胞系中PU.1的mRNA的水平很高,而蛋白質水平不高,是由于PU.1的AS RNA與其mRNA結合導致翻譯受抑制[21]。
lncRNA還可以互補結合mRNA,掩蔽其3'-UTR部位的靶miRNA結合位點,從而有助于該mRNA的穩(wěn)定并促進其翻譯,interferon-α1的AS RNA即通過掩蔽其mRNA的miR-1270的結合位點增強其mRNA的穩(wěn)定性[22]。
與多能性相關的長鏈基因間的非編碼RNA(long intergenetic noncoding RNA,lincRNA)最早發(fā)現于鼠胚胎干細胞。Loewer等[23]研究發(fā)現與胚胎干細胞(ESCs)相比較,在誘導多能干細胞(iPSCs)中檢測到10個的表達上調lincRNAs,推測iPSCs的形成是通過這些lincRNAs與多能性因子相互作用實現的。如lincRNA-RoR(Receptor superfamily related to the retinoic acid receptors,RoR)在體細胞去分化并誘導iPSCs的過程高表達,能靶定結合關鍵的多能性因子Oct4、Sox2和Nanog的啟動子鄰近區(qū)域(PrPr區(qū)域),從而促進其表達而誘導細胞去分化和多能性的產生。因此,RoR在體外可以促進多種細胞系去分化產生iPSCs[23]。
3.1.1 肝癌 Yang等[24]證實lncRNA-HEIH(High expression in hepatocellular carcinoma,HEIH)有助于肝癌的發(fā)生,它與EZH2結合,下調p21等細胞周期調控因子的表達,促進細胞周期由G0進入S期,誘發(fā)肝細胞癌變。且lncRNA-HEIH表達的下調顯著的抑制了肝癌細胞的生長,因此,lncRNA-HEIH將成為肝細胞癌治療的潛在靶點。
lncRNA-HULC(Highly up-regulated in liver cancer,HULC)是轉錄自6p24.3的大約500nt的轉錄本。在肝癌細胞中,啟動子結合蛋白CREB(cAMP-response element binding protein,CREB)可以通過與miR-372相互作用上調lncRNAHULC的表達,而HULC已經被鑒定在肝癌及腸癌轉移的組織中特異性高表達[25]。
3.1.2 乳腺癌 lncRNA-GAS5(Growth arrestspecific transcript 5,GAS5)具有抑制腫瘤的作用,它起初是在小鼠胚胎成纖維細胞中發(fā)現的,通過選擇性剪切可產生不同的結構,它的開放式閱讀框很小且保守性很差。相對于正常乳腺細胞,lncRNAGAS5在乳腺癌組織中表達量顯著降低。GAS5轉錄加工過程中產生的小核仁RNA具有誘導細胞生長抑制和凋亡的功能[26]。
3.1.3 前列腺癌 lncRNA-PCGEM1(Prostate cancer gene expression marker 1,PCGEM1)的過量表達導致了癌細胞的增殖和克隆形成,其轉錄水平的上調與美洲黑人的惡性前列腺癌的發(fā)生有關聯(lián),PCGEM1調控著前列腺癌的發(fā)生進程,是潛在的前列腺癌標記。Schilling[27-28]等通過PSA(Prostate-specific antigen,亦稱Differential display code 3,DD3)表達水平和活體組織檢測的5個案例,認為DD3分析可幫助決定立即治療或留待觀察,并提出DD3分析將是診斷前列腺癌的新標記。
lncRNA-PCATs(Prostate cancer-associated ncRNA transcripts,PCATs)靶定結合并抑制多梳抑制性復合物2(Polycomb Repressive Complex 2,PRC2)的轉錄抑制作用,顯著地促進細胞增殖,因而被認定為惡性前列腺癌的標記[29]。
3.1.4 肺 癌 lncRNA-MALAT-1(Metastasis-associated lung adenocarcinoma transcript 1,MALAT-1)既是肺癌組織的生物標記也是治療肺癌的靶點。MALAT-1可以正調控與癌癥遷移相關的基因的表達。因此,抑制MALAT-1的表達可以阻止肺癌細胞的遷移和腫瘤組織的增大[30]。Tripathi等[31]通過基因過表達載體和siRNA處理,發(fā)現MALAT1可以通過調節(jié)SR蛋白(絲氨酸/精氨酸豐富蛋白家族)的磷酸化來影響許多mRNA前體的剪切。
目前l(fā)ncRNA在人類肥胖及相關疾病中的作用還未見報道。轉錄因子PU.1是調控生命過程的關鍵因子,最近發(fā)現,PU.1(Spleen focus forming virus(SFFV)proviral integration oncogene,spi-1或PU.1)在脂肪代謝過程中發(fā)揮調控作用。PU.1在前體脂肪細胞中mRNA表達較高,而蛋白表達較低,在成熟脂肪細胞中則相反:過表達PU.1顯著抑制脂肪細胞中脂肪的生成[32]。本研究團隊推測PU.1AS lncRNA在該過程中發(fā)揮著關鍵作用,通過與mRNA結合進行轉錄后調控[33]。而且有報道,PU.1與生脂關鍵基因C/EBPα(CCAAT enhancer binding proteinα,C/EBPα)發(fā)揮協(xié)同作用[34]。因此,AS lncRNA很可能在肥胖以及二型糖尿病等相關疾病的治療中發(fā)揮關鍵作用。
最近研究發(fā)現,β分泌酶的一段保守的反義lncRNA(noncoding AS transcript forβ-secretase-1,BACE1)能夠加速阿爾茨海默病(AD)的發(fā)生[35]。分析其在人腦和AD小鼠模型中的表達和影響結果表明,在各種細胞應激的誘導下其表達上調。而以往研究表明其正義轉錄本的缺失會造成記憶缺失和外周神經鞘缺損等生理缺陷。因此,lncRNA也能在精細范圍內發(fā)揮調節(jié)作用。
最近的研究表明lncRNA之間可以競爭結合共同的miRNAs從而影響miRNAs的靶向干擾作用[36]。這種競爭性的內源RNA(Competing endogenous RNAs,ceRNAs)調控miRNA分子在它們靶序列上的分布,發(fā)揮轉錄后水平調控作用。人類和小鼠成肌細胞中的一個新的長非編碼RNA-linc-MD1[37],作為ceRNA調控肌肉分化時序,其被下調或者過表達分別導致肌肉分化的滯后和提前。linc-MD1吸附結合miR-133和miR-135分別解除它們對其靶基因MAML1(Mastermind-like protein1,MAML1)和MEF2C(Muscle-specific enhancing factor 2C,MEF2C)的干擾作用,激活這兩種肌肉特異性因子的表達,從而促進肌細胞的生存和分化,對杜氏肌營養(yǎng)不良病起到緩解作用。因而lncRNA在肌肉分化過程中發(fā)揮著重要作用。
LncRNA已被公認為是基因調控大家族的新成員。目前,相對于miRNA和siRNA等小非編碼RNA,研究人員對lncRNA的認識還相當有限。lncRNA數量繁多且功能復雜,而且各種功能的lncRNA仍不斷地被發(fā)現,揭示其在生命過程的調控,疾病的發(fā)生、發(fā)展和遺傳學方面有重要作用。因此,對lncRNA的研究將成為生命科學領域的新熱點。
綜上所述,lncRNA的識別、鑒定和其與microRNA、蛋白質等相互作用在系統(tǒng)生物學中的研究,以及其在重大疾病發(fā)生、發(fā)展中的基因調控作用將是今后相當長的一段時間內有待探索的問題。
[1] Clark M B,Johnston R L,Inostroza-Ponta M,et al.Genomewide analysis of long noncoding RNA stability[J].Genome Res,2012,22:885-898.
[2] Sun L,Goff L A,Trapnell C,et al.Long noncoding RNAs regulate adipogenesis[J].Proc Natl Acad Sci USA,2013,110(9):3 387-3 392.
[3] Chen G,Qiu C,Zhang Q,et al.Genome-wide analysis of human SNPs at long intergenic noncoding RNAs[J].Hum Mutat,2013,34(2):338-344.
[4] Yi F,Yang F,Liu X.RNA-seq identified a super-long intergenic transcript functioning in adipogenesis[J].RNA Biol,2013,10(6):990-1 001.
[5] Mattick J S.The central role of RNA in human development and cognition[J].FEBS Lett,2011,585(11):1 600-1 616.
[6] Nagano T,Fraser P.No-nonsense functions for long noncoding RNAs[J].Cell,2011,145(2):178-181.
[7] Khaitan D,Dinger M E,Mazar J,et al.The melanoma-upregulated long noncoding RNA SPRY4-IN1modulates apoptosis and invasion[J].Cancer Res,2011,71(11):3 852-3 862.
[8] Loewer S,Cabili M N,Guttman M,et al.Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells[J].Nat Genet,2010,42(12):1 113-1 117.
[9] Ginger M R,Shore A N,Contreras A,et al.A noncoding RNA is a potential marker of cell fate during mammary gland development[J].Proc Natl Acad Sci USA,2006,103(15):5 781-5 786.
[10] Sleutels F,Zwart R,Barlow D P.The non-coding Air RNA is required for silencing autosomal imprinted genes[J].Nature,2002,415(6873):810-813.
[11] Ponting C P,Oliver P L,Reik W.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(6):629-641.
[12] Navikova I V,Hennelly S P,Sanbonmatsu K Y.Tackling structures of long noncoding RNAs[J].Int J Mol Sci,2013,14(12):23 672-23 684.
[13] Mitchell G,John L R.Modular regulatory principles of large non-coding RNAs[J].Nature,2012,482(7385):339-346.
[14] Birney E,Stamatoyannopoulos J A,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447(7146):799-816.
[15] Zhang H,Zeitz M J,Wang H,et al.Long noncoding RNA-mediated intrachromosomal interactions promote imprinting at the Kcnq1locus[J].J Cell Biol,2014,204(1):61-75.
[16] Yang L Q,Lin C R,Liu W,et al.ncRNA-and Pc2methylation-dependent gene relocation between nuclear structures mediates gene activation programs[J].Cell,2011,147(4):773-788.
[17] Wang X,Arai S,Song X,et al.Induced ncRNAs allosterically modify RNA-binding proteins in cis to inhibit transcription[J].Nature,2008,454(7200):126-130.
[18] Huarte M,Guttman M,Feldser D,et al.A large intergenic noncoding RNA induced by p53mediates global gene repression in the p53response[J].Cell,2010,142(3):409-419.
[19] Crampton N.Collision events between RNA polymerases in convergent transcription studied by atomic force microscopy[J].Nucleic Acids Res,2006,34(19):5 416-5 425.
[20] Michal L,Yitzhak P.Genome-wide natural antisense transcription:coupling its regulation to its different regulatory mechanisms[J].EMBO Reports,2006,7(12):1 216-1 222.
[21] Ebralidze A K,Guibal F C,Steid U,et al.PU.1expression is modulated by the balance of functional sense and antisense RNAs regulated by a shared cis-regulatory element[J].Genes Dev,2008,22(9):2 085-2 092.
[22] Kimura T,Jiang S W,Nishizawa M,et al.Stabilization of human interferon-a1mRNA by its antisense RNA[J].Cell Mol Life Sci,2013,70(8):1 451-1 467.
[23] Loewer S,Cabili M N,Guttman M,et al.Large intergenic non-coding RNA-RoR modulates reprogramming of human induced pluripotent stem cells[J].Nat Genet,2010,42(12):1 113-1 117.
[24] Yang F,Zhang L,Huo X S,et al.Long noncoding RNA high expression in hepatocellular carcinoma facilitates tumor growth through enhancer of zeste homolog 2in humans[J].Hepatology,2011,54(5):1 679-1 689.
[25] Matouk I J,Abbasi I,Hochberg A,et al.Highly upregulated in liver cancer noncoding RNA is overexpressed in hepatic colorectal metastasis[J].Eur J Gastroen Hepat,2009,21(6):688-692.
[26] Mourtada-Maarabouni M,Pickard M R,Hedge V L,et al.GAS5,a non-protein-coding RNA,controls apoptosis and is downregulated in breast cancer[J].Oncogene,2009,28(2):195-208.
[27] Schilling D,de Reijke T,Tombal B,et al.The prostate cancer gene 3assay:indications for use in clinical practice[J].BJU Int,2010,105(4):452-455.
[28] Maciej S,Jack A S.PCA3and TMPRSS2-ERG:Promising biomarkers in prostate cancer diagnosis[J].Cancers,2010,2(3):1 432-1 440.
[29] Prensner J R,Iyer M K,Balbin O A.Transcriptome sequencing across a prostate cancer cohort identifies PCAT-1,an unannotated lincRNA implicated in disease progression[J].Nat Biotechnol,2011,29(8):742-750.
[30] Gutschner T,Hammerle M,Eissmann M,et al.The noncoding RNA MALAT1is a critical regulator of the metastasis phenotype of lung cancer cells[J].Cancer Res,2013,73(3):1 180-1 189.
[31] Tripathi V,Ellis J D,Shen Z,et al.The nuclear-retained noncoding RNA MALAT1regulates alternative splicing by modulating SR splicing factor phosphorylation[J].Mol Cell,2010,39(6):925-938.
[32] Wang F,Tong Q.Transcription factor PU.1is expressed in white adipose and inhibits adipocyte differentiation[J].Am J Physiol Cell Physiol,2008,295(1):C213-220.
[33] 龐衛(wèi)軍,衛(wèi)寧,熊燕等.PU.1轉錄因子調控前體脂肪細胞生脂的分子機制研究進展[J].中國細胞生物學學報,2011,33(12):1 394-1 400.
[34] Jin F,Li Y,Ren B,et al.PU.1and C/EBPαsynergistically program distinct response to NF-kappaB activation through establishing monocyte specific enhancers[J].Proc Natl Acad Sci USA,2011,108(13):5 290-5 295.
[35] Xu B,Gerin I,Miao H Z,et al.Multiple Roles for the Non-Coding RNA SRA in Regulation of Adipogenesis and Insulin Sensitivity[J].PLoS ONE,2010,5(12):e14199.
[36] Faghihi M A,Modarresi F,Khalil A M,et al.Expression of a noncoding RNA is elevated in Alzheimer's disease and drives rapid feed-forward regulation of beta-secretase[J].Nat Med,2008,14(7):723-730.
[37] Salmena L,Poliseno L,Tay Y,et al.A ceRNA Hypothesis:The Rosetta Stone of a Hidden RNA Language[J].Cell,2011,146(3):353-358.
[38] Cesana M,Cacchiarelli D,Legnini I,et al.A long noncoding RNA controls muscle differentiation by functioning as a competing endogenous RNA[J].Cell,2011,147(2):358-369.