李法君
(山東省濰坊科技學(xué)院 262700)
真核生物基因組由數(shù)量眾多的DNA序列組成,DNA轉(zhuǎn)錄成RNA并翻譯成蛋白質(zhì),以此進(jìn)行生物信息的傳遞。研究表明,人類基因組中僅有1.5%的DNA序列用于蛋白質(zhì)的編碼。然而,有趣的是研究人員發(fā)現(xiàn)至少有90%的基因組DNA被轉(zhuǎn)錄成RNA。進(jìn)一步的研究確認(rèn),這些序列被轉(zhuǎn)錄成非編碼RNA(non-coding RNA, ncRNA),其中tRNA和rRNA已為人熟知,其余的ncRNA則被視為轉(zhuǎn)錄過程中的“暗物質(zhì)”未被重視。依據(jù)片段大小,ncRNA又分為短鏈非編碼RNA和長鏈非編碼RNA(long non-coding RNA, lncRNA)。人們最初認(rèn)為lncRNA是轉(zhuǎn)錄過程中產(chǎn)生的“噪音”[1],是基因組在進(jìn)化過程中產(chǎn)生的“垃圾序列”。但是近來的研究證實,lncRNA參與了染色質(zhì)重塑、組蛋白修飾和RNA代謝等多個重要的生物學(xué)過程,已成為基因組功能研究的熱點領(lǐng)域。
lncRNA最早于2002年發(fā)現(xiàn)于小鼠的全長cDNA文庫中[2],其后科研人員將轉(zhuǎn)錄本長度超過 200 個核苷酸的非編碼 RNA命名為lncRNA[3]。目前發(fā)現(xiàn)的多數(shù)lncRNA由RNA聚合酶II轉(zhuǎn)錄生成,雖然lncRNA缺乏開放閱讀框,沒有編碼蛋白質(zhì)的能力,但部分lncRNA具有與mRNA相似的序列特征:5′端帽子、 3′端多聚腺苷酸尾、外顯子、內(nèi)含子和剪接位點等序列特征[4]。
根據(jù) lncRNA 編碼序列與蛋白質(zhì)編碼基因的相對位置,可將lncRNA分為5類[5]:①正義lncRNA 轉(zhuǎn)錄于編碼蛋白質(zhì)基因的正義鏈;②反義lncRNA 轉(zhuǎn)錄于編碼蛋白質(zhì)基因的反義鏈;③雙向lncRNA 轉(zhuǎn)錄于編碼蛋白質(zhì)基因的兩條反向互補鏈;④內(nèi)含子lncRNA 轉(zhuǎn)錄于編碼蛋白質(zhì)基因的內(nèi)含子序列;⑤基因間lncRNA 轉(zhuǎn)錄于兩條編碼蛋白質(zhì)基因的間隔區(qū)域。
現(xiàn)有的研究表明,lncRNA主要有5種來源[6]:①編碼蛋白質(zhì)的基因由于某種原因發(fā)生斷裂而產(chǎn)生lncRNA;②染色質(zhì)重組的結(jié)果,即兩個未被轉(zhuǎn)錄的基因與另一獨立基因重組而產(chǎn)生具有多個外顯子的lncRNA;③非編碼蛋白質(zhì)基因復(fù)制過程中發(fā)生反移位而產(chǎn)生lncRNA;④由鄰近的復(fù)制子串聯(lián)而產(chǎn)生lncRNA;⑤基因中插入一個全新的轉(zhuǎn)座因子而產(chǎn)生有功能的lncRNA。
2.1 生物學(xué)功能 研究表明,lncRNA以順式或反式作用的方式與核酸分子(DNA或RNA)和蛋白分子相互作用,參與細(xì)胞內(nèi)的多種生物學(xué)過程。具體而言,lncRNA通過染色質(zhì)重塑、組蛋白修飾和RNA代謝等多種生化途徑在表觀遺傳水平、轉(zhuǎn)錄水平和轉(zhuǎn)錄后水平對基因的表達(dá)進(jìn)行調(diào)控。
2.1.1 表觀遺傳水平的調(diào)控 表觀遺傳學(xué)是指在不改變生物體DNA序列的前提下,通過對基因的修飾(如甲基化)來調(diào)控基因的表達(dá)。這些修飾包括染色體重塑、基因組印記和X染色體失活等。lncRNA一方面可以直接與染色質(zhì)結(jié)合并與其相互作用,從而沉默或激活目標(biāo)基因;另一方面也可以通過修飾組蛋白來沉默目標(biāo)基因,同時還可以募集染色質(zhì)修飾抑制因子來參與等位基因的特異性沉默[7]。動物體肝臟中的輔酶II依賴性視黃醇脫氫/還原酶(DHRS4)基因可以編碼重要的代謝酶,DHRS4基因的反義轉(zhuǎn)錄lncRNA(AS1DHRS4)可以募集DNA 甲基化轉(zhuǎn)移酶(DNMT3a),使DHRS4基因的第二個拷貝(DHRS4L2)基因啟動子序列中的 CpG 島甲基化,令DHRS4L2基因的轉(zhuǎn)錄失活[8]。研究表明,失活X染色體特定轉(zhuǎn)錄(Xist)基因和Xist的反義序列(Tsix)在X染色體失活過程中發(fā)揮重要作用,被活化的X染色體生成Tsix,它可以募集DNMT3a到Xist基因的啟動子區(qū)域,并使其發(fā)生甲基化,從而使染色體完成活化[9]。
2.1.2 轉(zhuǎn)錄水平的調(diào)控 RNA的轉(zhuǎn)錄是一個嚴(yán)謹(jǐn)而復(fù)雜的過程,具有嚴(yán)格的時序性和空間特異性,受多種轉(zhuǎn)錄因子的調(diào)控。lncRNA也在其中發(fā)揮重要的作用?,F(xiàn)在公認(rèn)的觀點為,lncRNA的轉(zhuǎn)錄可以干擾相關(guān)基因的表達(dá)。原因在于,lncRNA可以與跟啟動子相結(jié)合的抑制性復(fù)合物結(jié)合,“占領(lǐng)”啟動子區(qū)域,使得RNA聚合酶II無法正常與啟動子序列結(jié)合,從而干擾基因表達(dá)。例如,人類二氫葉酸還原酶(DHFR)基因的上游次級啟動子可轉(zhuǎn)錄產(chǎn)生lncRNA,該 lncRNA可以與DHFR 基因的主要啟動子結(jié)合形成 RNA-DNA 復(fù)合物,進(jìn)而使轉(zhuǎn)錄輔助因子TFIID無法與啟動子結(jié)合,從而阻斷DHFR基因的表達(dá)[10]。此外,轉(zhuǎn)錄水平的調(diào)控的還體現(xiàn)在轉(zhuǎn)錄干擾方面[11]。
2.1.3 轉(zhuǎn)錄后水平的調(diào)控 轉(zhuǎn)錄后水平的調(diào)控主要是通過lncRNA與靶mRNA序列的互補配對來實現(xiàn)的。具體而言,lncRNA可以與靶mRNA形成RNA-RNA二聚體,掩蔽mRNA序列中的相關(guān)順式作用元件,從而調(diào)控轉(zhuǎn)錄后水平的剪切、拼接、翻譯等過程。如人急性粒細(xì)胞白血病細(xì)胞HL-60細(xì)胞系中PU.1的mRNA水平很高,但是蛋白質(zhì)水平卻不高。主要是由于PU.1轉(zhuǎn)錄的反義lncRNA(ASRNA)與其mRNA序列結(jié)合導(dǎo)致翻譯受到抑制所致[12]。
2.2 作用機制 lncRNA在生物體內(nèi)的作用機制非常復(fù)雜,具體的作用機制至今尚不完全清晰。已經(jīng)確認(rèn)的lncRNA作用機制主要有8種[6]:①在編碼蛋白質(zhì)基因上游啟動子區(qū)域轉(zhuǎn)錄,從而影響下游基因的表達(dá);②通過抑制RNA聚合酶II的活性或參與染色質(zhì)重組和組蛋白修飾,影響下游基因的表達(dá);③與編碼蛋白質(zhì)的mRNA形成雙鏈雜交體,干預(yù)mRNA的剪切,從而形成不同的剪切體;④與編碼蛋白質(zhì)的mRNA形成雙鏈雜交體,通過Dicer酶剪切產(chǎn)生內(nèi)源性的小干擾RNA(small interfering RNA, siRNA);⑤與特定蛋白質(zhì)結(jié)合,調(diào)節(jié)相應(yīng)蛋白的活性;⑥作為結(jié)構(gòu)組分,與蛋白質(zhì)形成核酸蛋白質(zhì)復(fù)合體;⑦與目標(biāo)蛋白質(zhì)結(jié)合,改變其細(xì)胞定位;⑧作為某些小分子RNA的前體分子。
現(xiàn)在最新的觀點認(rèn)為,癌癥所涉及的特征包括:不可控的生長信號、抵抗細(xì)胞死亡、細(xì)胞無限生長、逃避生長抑制、激活侵染與轉(zhuǎn)移及免疫逃避等[13]。上述過程包括了最基本的幾個生物學(xué)過程:細(xì)胞周期、細(xì)胞凋亡與壞死、免疫反應(yīng)及腫瘤代謝等。無一例外,lncRNA均參與了上述過程。因此,與癌癥相關(guān)的lncRNA研究也成為進(jìn)展最快、獲得成果最多的新興領(lǐng)域。
業(yè)已證明與癌癥相關(guān)的lncRNA包括:基因組印記基因H19、 HOX 基因的反義基因間的RNA(HOTAIR)、母系表達(dá)基因3(MEG3)、肺腺癌轉(zhuǎn)移相關(guān)轉(zhuǎn)錄因子1(MALAT1)以及細(xì)胞周期激酶抑制因子4b(INK4b) 位點的反義非編碼RNA(ANRIL)等。
現(xiàn)有的研究結(jié)果表明,如果細(xì)胞中具有非常顯著的癌癥類型特異性的lncRNA出現(xiàn)異常過表達(dá)就會促進(jìn)細(xì)胞周期進(jìn)展,導(dǎo)致癌癥發(fā)生。例如,最新的前列腺癌研究發(fā)現(xiàn),兩種lncRNAs在許多侵襲性前列腺癌中高水平表達(dá),增強了雄激素受體相關(guān)轉(zhuǎn)錄程序,促進(jìn)了癌細(xì)胞生長[14]。但是,lncRNA在癌癥發(fā)生、發(fā)展過程中的具體作用機制尚需進(jìn)一步探索。
lncRNA的出現(xiàn)給“中心法則”帶來了極大的補充,使人們重新認(rèn)識了RNA?,F(xiàn)階段人們對lncRNA的認(rèn)識還只是冰山一角,但是其功能涉及范圍之廣已遠(yuǎn)遠(yuǎn)超出人們最初的設(shè)想,尚有許多問題亟待解決:
①最基本的lncRNA分類。目前針對lncRNA的定義也僅僅是根據(jù)其核酸序列的長度,但是這種分類明顯具有程序化。隨著測序技術(shù)的發(fā)展,必將會有多個物種的lncRNA被陸續(xù)發(fā)現(xiàn)。如何準(zhǔn)確地對數(shù)量龐大的lncRNA進(jìn)行分類,從而更好地研究其功能,顯得越來越重要。②lncRNA的數(shù)量尚未明了。以人類為例,人類的基因組中有多少lncRNA?其序列又是怎樣的?這些問題的解決是深入研究lncRNA的基礎(chǔ)。③研究lncRNA最重要的是闡明其功能。因此,揭示lncRNA與其它生物分子(如DNA、RNA、microRNA和蛋白質(zhì))相互作用機制就成為研究lncRNA生物學(xué)功能的關(guān)鍵所在。癌癥至今仍被視為“不可治愈”的頑疾,多年來人們雖然苦苦探索,但迄今還沒有從根本上找到有效的治療方法,癌癥的發(fā)病機理尚不明確是造成這種狀況的主要因素。因此,從新的視角探索癌癥的分子機制勢在必行。lncRNA的發(fā)現(xiàn)為我們帶來了新的希望,可以極大推進(jìn)癌癥的發(fā)病機理研究,進(jìn)而為以lncRNA為靶點進(jìn)行新的抗腫瘤藥物的開發(fā)提供理論依據(jù)。
(基金項目:國家自然科學(xué)基金,No. 31572617)