季少平
(河南大學(xué) 醫(yī)學(xué)院,河南 開封 475004)
非編碼RNA 是指那些不被翻譯成蛋白質(zhì)的RNA 分子,除去那些看家RNA(如rRNA和tRNA)以及siRNA和microRNA,其調(diào)控基因表達(dá)的機(jī)制不同于長非編碼RNA(lncRNA),因此不在此討論之列。lncRNA 通常被認(rèn)為是那些大于200核苷酸長度,幾乎沒有可編碼大于100 氨基酸開放讀框的RNA 分子。和編碼RNA 相比,lncRNA 也經(jīng)過拼接,也有帽子結(jié)構(gòu)和多聚A 尾巴,但缺乏開放讀框,有些lncRNA 一度被稱為假基因(pseudogene)。對(duì)lncRNA的研究,使人們認(rèn)識(shí)了基因表達(dá)調(diào)控的一個(gè)新層面。
lncRNA 對(duì)生命過程的調(diào)節(jié)可能解釋了人類具有相似數(shù)量的蛋白質(zhì)編碼基因(與其他物種相比),卻具有更為復(fù)雜的生物學(xué)表型[1-2]。研究[2]顯 示,在人類轉(zhuǎn)錄的RNA中98%為lncRNA,而lncRNA的數(shù)量與物種的復(fù)雜性成正比關(guān)系。和編碼基因的轉(zhuǎn)錄相比,lncRNA的啟動(dòng)子區(qū)具有更為保守的序列[3-4]。lncRNA 主要通過表觀遺傳學(xué)調(diào)節(jié)基因轉(zhuǎn)錄,決定基因表達(dá)與否。由于RNA 具有較弱的催化活性,它們往往需要通過募集蛋白質(zhì)復(fù)合物(具有酶活性)對(duì)特定區(qū)域進(jìn)行修飾。lncRNA 可作為一個(gè)平臺(tái),把兩種染色質(zhì)修飾復(fù)合物連接在一起,協(xié)同作用于目標(biāo)基因進(jìn)行表觀遺傳學(xué)修飾。以往,除了參與氨基酸轉(zhuǎn)運(yùn)、RNA 拼接和蛋白質(zhì)合成的RNA(如rRNA和tRNA)外,其他lncRNA的轉(zhuǎn)錄都被認(rèn)為是基因表達(dá)的副產(chǎn)品,但近年的研究改變了人們對(duì)lncRNA的認(rèn)識(shí),它們?cè)谏亩鄠€(gè)過程中起著重要作用。lncRNA 呈現(xiàn)序列多樣性,具有亞細(xì)胞分布特色,表現(xiàn)出組織和細(xì)胞特異性,并具有調(diào)節(jié)的時(shí)空特性。lncRNA 主要涉及轉(zhuǎn)錄和轉(zhuǎn)錄后調(diào)節(jié)、基因組修飾、X-染色體失活以及mRNA 降解。此外,lncRNA 還具有協(xié)助蛋白質(zhì)的亞細(xì)胞定位、誘導(dǎo)蛋白質(zhì)構(gòu)象改變、以及細(xì)胞形態(tài)維持等作用。在生命過程中的不同階段以及不同的組織器官,共有基因組的95%得到轉(zhuǎn)錄。因此,lncRNA的數(shù)量要遠(yuǎn)大于編碼RNA的數(shù)量[5]。從堿基序列上看,lncRNA 在進(jìn)化上缺乏保守,呈多樣性,在功能上其三維結(jié)構(gòu)的構(gòu)象可能更為重要。相對(duì)于小的非編碼RNA 如siRNA和microRNA,我們對(duì)lncRNA的認(rèn)識(shí)遠(yuǎn)遠(yuǎn)落后。
在高等生物,染色質(zhì)修飾(如組蛋白的甲基化、乙?;?、磷酸化和DNA 甲基化等)在時(shí)空上對(duì)于基因表達(dá)特異性非常重要,尤其在發(fā)育的不同階段,它們決定了一些基因在何時(shí)與何地表達(dá)與否。這些修飾決定了轉(zhuǎn)錄過程中蛋白質(zhì)因子(如轉(zhuǎn)錄因子、轉(zhuǎn)錄激活子和轉(zhuǎn)錄抑制子等)能否接近目標(biāo)DNA(如啟動(dòng)子和增強(qiáng)子等),從而決定了目標(biāo)基因的開放與關(guān)閉。而修飾染色質(zhì)的酶復(fù)合物是廣泛表達(dá)的,但是如何特異地修飾特定的DNA 位點(diǎn)是分子生物學(xué)家所關(guān)心的,也是目前最難搞清楚的領(lǐng)域。
在研究X- 染色體劑量補(bǔ)償效應(yīng)、等位基因失活以及同源基因表達(dá)不平等時(shí),發(fā)現(xiàn)lncRNA 對(duì)這些復(fù)雜現(xiàn)象的調(diào)節(jié),主要通過參與對(duì)基因組的表觀遺傳學(xué)調(diào)節(jié)。而阻斷這些lncRNA 參與的表觀遺傳學(xué)調(diào)節(jié),可導(dǎo)致一系列發(fā)育障礙或疾病,可見lncRNA 在生命過程中的重要性。研究比較清楚的兩個(gè)lncRNA Air和Kcnqlot1參與了等位基因的表達(dá)失活調(diào)節(jié),在基因組印記(genomic imprinting)中起著重要作用。它們通過與染色質(zhì)修飾復(fù)合物結(jié)合,對(duì)特定基因座位的組蛋白修飾,進(jìn)而抑制母系或父系等位基因的表達(dá)。Air首先聚集于Slc22a3基因的啟動(dòng)子區(qū),募集甲基化轉(zhuǎn)移酶G9a,介導(dǎo)組蛋白H3K9的甲基化。在小鼠,Air利用位于Igf2r基因第二個(gè)內(nèi)含子內(nèi)部的啟動(dòng)子得以轉(zhuǎn)錄,參與對(duì)來自父系Igf2r、Slc22a2和Slc22a3基因的表達(dá)抑制。而Air的截?cái)嗤蛔?,?dǎo)致G9a不能有效地聚集于Slc22a3基因的啟動(dòng)子區(qū),進(jìn)而導(dǎo)致等位基因的同時(shí)轉(zhuǎn)錄,丟失了對(duì)父系等位基因的特異抑制[5]。
lncRNA與染色質(zhì)修飾復(fù)合物間的作用也是導(dǎo)致X- 染色體失活的原因。目前已知,至少有7個(gè)lncRNA 參與了這一過程,其中包括Xist。在雌性動(dòng)物X 染色體的一條上,所有基因的表達(dá)都被關(guān)閉,而只有一條X 染色體的基因得以表達(dá),這樣使得雌性動(dòng)物具有與雄性動(dòng)物一樣的X- 連鎖的基因表達(dá)。Xist從將要失活的X 染色體上轉(zhuǎn)錄,然后與PRC2(polycomb represive complex 2)結(jié)合,使得PRC2沿X 染色體擴(kuò)散,并在PRC2的H3K27三甲基酶活性的作用下最終沉默整條染色體。Xist的轉(zhuǎn)錄也是受到另一個(gè)lncRNA rep A的誘導(dǎo),rep A與PRC2結(jié)合并導(dǎo)致Xist啟動(dòng)子區(qū)H3K27的三甲基化而激活Xist的轉(zhuǎn)錄。rep A 轉(zhuǎn)錄于Xist的5'端保守區(qū)且與Xist的轉(zhuǎn)錄方向一致,rep A 含有7.5個(gè)由28nt構(gòu)成的串聯(lián)重復(fù)序列,折疊成兩個(gè)保守的柄環(huán)結(jié)構(gòu)。在對(duì)基因組DNA 進(jìn)行的廣泛表觀遺傳學(xué)修飾分析中發(fā)現(xiàn),組蛋白不同位點(diǎn)的甲基化對(duì)編碼和非編碼RNA的轉(zhuǎn)錄具有類似的作用,但是DNA 甲基化對(duì)二者的影響不同[6]。
在介導(dǎo)染色質(zhì)重塑時(shí),除蛋白質(zhì)可結(jié)合多種lncRNA 外,一種lncRNA 也好像可與多種蛋白質(zhì)結(jié)合。許多參與染色質(zhì)重塑、抑制基因表達(dá)的酶并沒有DNA 結(jié)合結(jié)構(gòu)域,卻有RNA 結(jié)合結(jié)構(gòu)域,可能暗示著lncRNA 在染色質(zhì)重塑中的重要性。如Kcnqlot1、Airn、Xist、HOTAIR與PRC1 或PRC2 結(jié)合,介導(dǎo)組蛋白2(H2)的第119位賴氨酸的單泛素化、組蛋白3(H3)的第27位賴氨酸的二甲基化或三甲基化。這些蛋白分子與不同lncRNA的結(jié)合,可能通過構(gòu)象的改變決定了它們對(duì)目標(biāo)基因的選擇特異性,而lncRNA 可能起著變構(gòu)誘導(dǎo)樣的作用。lncRNA與DNA 形成3 股核酸鏈雜交,利于DNA 甲基轉(zhuǎn)移酶3b對(duì)DNA的甲基化修飾[7],但這種作用方式是否為普遍現(xiàn)象尚有待研究。
已發(fā)現(xiàn)的lncRNA 大多涉及基因的轉(zhuǎn)錄,它們通過對(duì)轉(zhuǎn)錄因子的募集與活性調(diào)節(jié),最終實(shí)現(xiàn)對(duì)基因表達(dá)的精細(xì)調(diào)控。lncRNA 除了通過順式作用直接調(diào)節(jié)目標(biāo)基因的表達(dá)外,還可通過反式作用經(jīng)調(diào)節(jié)轉(zhuǎn)錄因子的表達(dá)進(jìn)而影響目標(biāo)基因的表達(dá)。例如,來自HOXC的lncRNA HOTAIR 通過反式作用影響其他HOX 座位的轉(zhuǎn)錄因子基因表達(dá)。lncRNA 可通過與RNA 聚合酶Ⅱ結(jié)合,影響整個(gè)轉(zhuǎn)錄“機(jī)器”而對(duì)大多數(shù)基因的轉(zhuǎn)錄產(chǎn)生影響。如人類的Alu RNA和B2RNA,受到熱休克誘導(dǎo),可與RNA 聚合酶Ⅱ結(jié)合而廣泛抑制基因的轉(zhuǎn)錄。
此外,lncRNA 本身的轉(zhuǎn)錄,也可引起相鄰基因的轉(zhuǎn)錄抑制。已知SRG1的轉(zhuǎn)錄可干擾臨近基因的轉(zhuǎn)錄元件與其啟動(dòng)子的結(jié)合,導(dǎo)致其他基因無法轉(zhuǎn)錄而受到抑制[8-9]。除了抑制基因表達(dá)外,lncRNA 也可介導(dǎo)激活基因的表達(dá)。Evf-2 能與Dlx-2協(xié)同特異地增強(qiáng)Dlx-5/6 增強(qiáng)子的活性,促進(jìn)相關(guān)基因的轉(zhuǎn)錄[10]。
RNA 聚合酶Ⅱ與增強(qiáng)子結(jié)合并對(duì)該區(qū)域進(jìn)行雙向轉(zhuǎn)錄,可轉(zhuǎn)錄出一種新的lncRNA 稱為eRNA,這種eRNA 在遠(yuǎn)端增強(qiáng)子的幫助下將沉默區(qū)段內(nèi)的某個(gè)特定基因“解救”出來,增加目標(biāo)基因的轉(zhuǎn)錄水平[11-12]。因此,eRNA 更具有特異性,更具有用于基因治療的潛力。廣泛的研究表明,被沉默的基因啟動(dòng)子區(qū),有大量的lncRNA-蛋白復(fù)合物覆蓋,在DNA序列上形成很大的區(qū)段。而且隨著生命過程的變化,這種覆蓋是處于一種動(dòng)態(tài)的過程。處于關(guān)閉狀態(tài)的基因可能在增強(qiáng)子的幫助下,重新被激活。增強(qiáng)子通過順式和反式作用,激活轉(zhuǎn)錄,而染色質(zhì)回折形成環(huán)形,使得距離較遠(yuǎn)的大跨度的DNA 靠近,方便增強(qiáng)子與目標(biāo)區(qū)域的直接接觸也是必要的。
lncRNA 在植物中的表達(dá)更為廣泛,其主要原因是應(yīng)對(duì)隨時(shí)的環(huán)境變化。在哺乳動(dòng)物,lncRNA 廣泛參與了細(xì)胞對(duì)外部刺激的應(yīng)激調(diào)節(jié)。在DNA 損傷時(shí),一個(gè)位于基因間的受p53 誘導(dǎo)表達(dá)的lncRNA licnRNA-p21,與核蛋白K 一起介導(dǎo)廣泛的基因表達(dá)抑制[13]。其意義在于DNA 損傷后的修復(fù)最為重要,其他基因的表達(dá)多被暫停,如果DNA 能得以修復(fù),那么細(xì)胞就得以生存。另一個(gè)DNA 損傷誘導(dǎo)表達(dá)的lncRNA gadd7可直接與TDP-43(TAR DNA 結(jié)合蛋白)結(jié)合,而阻止TDP-43與Cdk6的mRNA 結(jié)合,從而導(dǎo)致該mRNA的降解[14]。另外發(fā)現(xiàn),一種饑餓誘導(dǎo)的lncRNA,Rncs-1 可抑制Dicer的活性,阻斷Dicer對(duì)雙鏈RNA的加工,抑制micro-RNA 對(duì)其他基因表達(dá)的調(diào)控[15],但其意義仍不清楚。
翻譯后修飾可通過改變蛋白質(zhì)的構(gòu)象而影響蛋白質(zhì)的活性。lncRNA 也可作為分子伴侶幫助蛋白質(zhì)改變構(gòu)象,而影響其活性。在DNA 損傷信號(hào)調(diào)節(jié)下轉(zhuǎn)錄的一種非編碼RNA 可通過調(diào)節(jié)一種RNA 結(jié)合蛋白TLS(Translocated in Lipo Sarcoma),使其構(gòu)象改變,從無活性變?yōu)橛谢钚裕?6]。此外,另一個(gè)lncRNA,是一個(gè)激素受體的RNA 激活子(SRA)可促進(jìn)核蛋白復(fù)合物SRC-1及相關(guān)核受體的激活,而調(diào)節(jié)激素相關(guān)基因的表達(dá)[17]。
另外,特定基因的反義轉(zhuǎn)錄形成的lncRNA,也能與正義鏈形成雙鏈RNA,經(jīng)Dicer加工后產(chǎn)生siRNA,經(jīng)RNAi降解mRNA 或抑制目標(biāo)基因的翻譯[18-19]。小核RNA 通過與RNA 聚合酶Ⅱ起作用,或調(diào)節(jié)轉(zhuǎn)錄后加工對(duì)目標(biāo)基因的表達(dá)水平進(jìn)行調(diào)節(jié)。在轉(zhuǎn)錄時(shí),一些位于被抑制座位的基因雖然沒有mRNA 轉(zhuǎn)錄,但卻可轉(zhuǎn)錄出小的非編碼RNA,并形成柄環(huán)結(jié)構(gòu)與PRC2復(fù)合物結(jié)合,參與介導(dǎo)目標(biāo)基因的抑制[20]。
lncRNA 幫助目標(biāo)蛋白的亞細(xì)胞定位。例如,一種酵母蛋白Mei2p需要與MeiRNA(一種lncRNA)結(jié)合后從胞質(zhì)轉(zhuǎn)運(yùn)到核內(nèi)[21];而5S核糖體RNA 通過遮蔽轉(zhuǎn)錄因子TFIIA的核定位信號(hào)而使TFIIA留在胞質(zhì)[22]。有兩種lncRNA,MEN epsilon和MEN beta,他們與Paraspeckle(一種核內(nèi)蛋白核酸結(jié)構(gòu))中的蛋白組分結(jié)合,對(duì)維持Paraspeckle結(jié)構(gòu)完整與數(shù)量十分重要。而Paraspeckle可能是核內(nèi)儲(chǔ)存RNA的一個(gè)重要場(chǎng)所[23-24]。lncRNA與疾病特別是腫瘤發(fā)生、發(fā)展間關(guān)系的研究已有許多報(bào)道。最近的研究顯示,HOTAIR的表達(dá)水平升高與乳腺癌的生長與轉(zhuǎn)移能力密切相關(guān)。在上皮癌細(xì)胞中過表達(dá)HOTAIR,導(dǎo)致PCR2 在基因組內(nèi)廣范圍地重新分布、并改變組蛋白的甲基化模式,使細(xì)胞更像胚胎成纖維細(xì)胞,同時(shí)增加細(xì)胞的浸潤和轉(zhuǎn)移能力[25]。
由于lncRNA 種類繁多、結(jié)構(gòu)多樣、序列缺乏保守性,因而給lncRNA的研究帶來很大困難。相信隨著新的技術(shù)進(jìn)步,例如一些類似ChIP(染色質(zhì)免疫沉淀)技術(shù)的引入,通過不同方式鑒定出更多l(xiāng)ncRNA及其介導(dǎo)的生物學(xué)功能,將為我們認(rèn)識(shí)生命過程中,基因表達(dá)在不同層面的調(diào)控大有幫助,隨著作用機(jī)制的闡明,并將產(chǎn)生巨大的應(yīng)用潛力。lncRNA 一級(jí)序列缺乏保守性,我們不能從lncRNA的序列同源性上預(yù)測(cè)其生物學(xué)活性,也不能從其結(jié)合的靶點(diǎn)上推測(cè)其生物學(xué)活性的相似性,其可能的機(jī)制是由于lncRNA的結(jié)合導(dǎo)致蛋白靶分子構(gòu)象改變而影響了功能。未來的研究分析lncRNA 活性仍離不開蛋白質(zhì)分子,尤其是一些與轉(zhuǎn)錄相關(guān)的轉(zhuǎn)錄因子、增強(qiáng)子、轉(zhuǎn)錄激活子或轉(zhuǎn)錄抑制子等。
在生長發(fā)育的不同階段、不同時(shí)期以及其他條件下,確定更多的遠(yuǎn)端增強(qiáng)子在lncRNA 介導(dǎo)下的作用,對(duì)于我們認(rèn)識(shí)經(jīng)lncRNA 介導(dǎo)的復(fù)雜的表觀遺傳學(xué)修飾很有幫助。通過調(diào)節(jié)lncRNA的表達(dá),或人工設(shè)計(jì)的lncRNA 調(diào)控分子可望用于腫瘤或其他疾病的基因治療。相信隨著研究的深入,一個(gè)新的領(lǐng)域正在對(duì)我們敞開,為分子生物學(xué)家提供了新的機(jī)遇與挑戰(zhàn)。
[1]Mattick J S.RNA regulation:a new genetics?[J].Nat Rev Genet,2004,5(4):316-323.
[2]Taft R J,Pheasant M,Mattick J S.The relationship between non-protein-coding DNA and eukaryotic complexity[J].Bioessays,2007,29(3):288-299.
[3]Carninci P,Kasukawa T,Katayama S,et al.The transcriptional landscape of the mammalian genome[J].Science,2005,309(5740):1559-1563.
[4]Ponjavic J,Ponting C P,Lunter G.Functionality or transcriptional noise?Evidence for selection within long noncoding RNAs[J].Genome Res,2007,17(3):556-565.
[5]Birney E,Stamatoyannopoulos J A,Dutta A,et al.Identification and analysis of functional elements in 1%of the human genome by the ENCODE pilot project[J].Nature,2007,447(7146):799-816.
[6]Sati S,Ghosh S,Jain V,et al.Genome-wide analysis reveals distinct patterns of epigenetic features in long noncoding RNA loci[J].Nucleic Acids Res,2012,40(20):10018-10031.
[7]Schmitz K M,Mayer C,Postepska A,et al.Interaction of noncoding RNA with the rDNA promoter mediates recruitment of DNMT3band silencing of rRNA genes[J].Genes Dev,2010,24(20):2264-2269.
[8]Hirota K,Miyoshi T,Kugou K,et al.Stepwise chromatin remodelling by a cascade of transcription initiation of non-coding RNAs[J].Nature,2008,456(7218):130-134.
[9]Ponting C P,Oliver P L,Reik W.Evolution and functions of long noncoding RNAs[J].Cell,2009,136(4):629-641.
[10]Feng J,Bi C,Clark B S,et al.The Evf-2noncoding RNA is transcribed from the Dlx-5/6ultraconserved region and functions as a Dlx-2transcriptional coactivator[J].Genes Dev,2006,20(11):1470-1484.
[11]Kim T K,Hemberg M,Gray J M,et al.Widespread transcription at neuronal activity-regulated enhancers[J].Nature,2010,465(7295):182-187.
[12]Wang D,Garcia-Bassets I,Benner C,et al.Reprogramming transcription by distinct classes of enhancers functionally defined by eRNA [J]. Nature,2011,474(7351):390-394.
[13]Huarte M,Guttman M,F(xiàn)eldser D,et al.A large intergenic noncoding RNA induced by p53 mediates global gene repression in the p53response[J].Cell,2010,142(3):409-419.
[14]Liu X,Li D,Zhang W,et al.Long non-coding RNA gadd7 interacts with TDP-43and regulates Cdk6mRNA decay[J].EMBO J,2012,31(23):4415-4427.
[15]Hellwig S,Bass B L.A starvation-induced noncoding RNA modulates expression of Dicer-regulated genes[J].Proc Natl Acad Sci USA,2008,105(35):12897-12902.
[16]Wang X,Arai S,Song X,et al.Induced ncRNAs allosterically modify RNA binding proteins in cis to inhibit transcription[J].Nature,2008,454(7200):126-130.
[17]Lanz R B,McKenna N J,Onate S A,et al.A steroid receptor coactivator,SRA,functions as an RNA and is present in an SRC-1complex[J].Cell,1999,97(1):17-27.
[18]Watanabe T,Totoki Y,Toyoda A,et al.Endogenous siRNAs from naturally formed dsRNAs regulate transcripts in mouse oocytes[J].Nature,2008,453(7194):539-543.
[19]Beltran M,Puig I,Pena C,et al.A natural antisense transcript regulates Zeb2/Sip1 gene expression during Snail1-induced epithelial-mesenchymal transition [J].Genes Dev,2008,22(6):756-769.
[20]Kanhere A,Viiri K,Araujo C C,et al.Short RNAs are transcribed from repressed polycomb target genes and interact with polycomb repressive complex-2[J].Mol Cell,2010,38(5):675-688.
[21]Yamashita A,Watanabe Y,Nukina N,et al.RNA-assisted nuclear transport of the meiotic regulator Mei2p in fission yeast[J].Cell,1998,95(1):115-123.
[22]Rudt F,Pieler T.Cytoplasmic retention and nuclear import of 5Sribosomal RNA containing RNPs[J].EMBO J,1996,15(6):1383-1391.
[23]Clemson C M,Hutchinson J N,Sara S A,et al.An architectural role for a nuclear noncoding RNA:NEAT1 RNA is essential for the structure of paraspeckles[J].Mol Cell,2009,33(6):717-726.
[24]Sasaki Y T,Ideue T,Sano M,et al.MEN epsilon/beta noncoding RNAs are essential for structural integrity of nuclear paraspeckles [J].Proc Natl Acad Sci USA,2009,106(8):2525-2530.
[25]Gupta R A,Shah N,Wang K C,et al.Long non-coding RNA HOTAIR reprograms chromatin state to promote cancer metastasis[J].Nature,2010,464(7291):1071-1076.