劉 濤,王樹森,3,4,楊 磊,時 喬,沈中陽,3,4
天津市第一中心醫(yī)院 1中國醫(yī)學科學院移植醫(yī)學重點實驗室 2國家衛(wèi)生健康委員會危重病急救醫(yī)學重點實驗室3天津市器官移植臨床醫(yī)學研究中心 4器官移植中心 5檢驗科,天津 300192 6天津中醫(yī)藥大學研究生院,天津 301617
在生物體中,將遺傳密碼體現為生物的性狀及各種生理活動過程,都離不開基因的表達,即基因組DNA轉錄生成信使RNA(messenger RNA,mRNA)等,并參與翻譯生成蛋白質。在基因表達過程中,早期的觀點主要集中在“中心法則”,即遺傳信息按照“DNA-RNA-蛋白”的方向進行表達。然而,在龐大的基因組中,編碼蛋白的序列所占的比例不足全部序列的2%[1],這一現象曾令科學家感到困惑。近年來,發(fā)現基因組的轉錄產物中不僅有可編碼蛋白的RNA,還有很多非編碼RNA,主要包括微RNA(microRNA,miRNA)、環(huán)狀RNA(circular RNA,circRNA)、長鏈非編碼RNA(long non-coding RNA,lncRNA)等。據估計,人類細胞中約有60%的序列能夠被轉錄[2]。這些非編碼RNA的功能雖已有一定的研究,但相對于編碼RNA來說,非編碼RNA的轉錄模式和功能還遠未完全闡明。
非編碼RNA的轉錄模式較為復雜。有些非編碼RNA可能依靠其獨立的啟動子起始轉錄,但更多的非編碼RNA轉錄元件與編碼RNA具有一定的聯系。一些非編碼RNA可與鄰近的編碼RNA共同轉錄[3- 4],或轉錄自蛋白編碼基因的啟動子區(qū)域[5- 6]或增強子區(qū)域[7- 8]。另一些非編碼RNA可能由編碼RNA前體的可變剪接生成[9]。此外,非編碼RNA的轉錄還存在細胞和組織特異性[10]。如果一個轉錄位點在特定的條件下,可轉錄生成一個以上的RNA產物(包括編碼RNA和非編碼RNA),則該基因位點被稱為“超基因”。超基因共分為3種類型,分別為Ⅰ型、Ⅱ型和Ⅲ型,本文分別介紹各型超基因的轉錄特征,并以實例的方式闡述其在細胞中的調控作用,特別是在腫瘤細胞中的生物學活性。
Ⅰ型超基因是指同一個基因位點在不同的條件下,能夠生成不同起止位點的RNA轉錄本,且這些不同的RNA可能分別作為編碼RNA或非編碼RNA。這類超基因的數量較少,常見的發(fā)生條件是細胞遭受紫外線照射等應激過程。例如,活化信號合成物復合體亞單位3(activating signal cointegrator 1 complex subunit 3,ASCC3)是一個較為典型的Ⅰ型超基因,該基因在細胞遭受紫外線照射損傷后的不同階段,能夠生成不同的轉錄產物。具體來說,當細胞被紫外線照射后,細胞將啟動損傷修復過程,同時細胞中大多數基因的轉錄過程被抑制,避免生成錯誤的轉錄產物。在這一過程中,ASCC3主要生成編碼mRNA,其蛋白產物是維持細胞轉錄抑制狀態(tài)的關鍵因子。而在DNA損傷修復的后期,ASCC3改為轉錄生成一段較短的非編碼RNA,該RNA能夠對抗ASCC3蛋白的轉錄抑制作用,從而使細胞內的RNA轉錄過程逐漸恢復正常[11]。類似地,整合因子復合體亞單位(identified integrator complex subunit,INTS)6也具有Ⅰ型超基因的調控特點。在正常情況下,INTS6轉錄并編碼生成由887個氨基酸構成的蛋白產物。而在細胞遭受紫外線照射后,INTS6轉錄生成一段較短的RNA,編碼僅115個氨基酸的蛋白片段。INTS6與INTS3等因子相互作用,構成單鏈DNA結合蛋白1復合物,參與DNA同源重組形式的損傷修復過程[12]。通過 Ⅰ 型超基因這種精巧的調節(jié)機制,ASCC3、INTS6等基因位點在DNA受到紫外線損傷的不同階段生成具有不同長度和功能的轉錄產物,在DNA損傷修復過程中發(fā)揮重要的調節(jié)作用。
與Ⅰ型超基因不同,Ⅱ型超基因轉錄生成單一的RNA產物,但通過轉錄后剪接和加工等過程,可生成不同序列和不同功能的兩種或多種RNA。可變剪接在真核細胞的轉錄后加工過程中較為普遍,因此這類超基因的種類較多。根據生成RNA的種類不同,Ⅱ型超基因可分為以下幾種類型。
源于編碼基因內含子的小片段非編碼RNA一些miRNA的轉錄生成過程,是隨其“宿主”基因一同轉錄后,通過轉錄后的剪接過程,產生miRNA的前體,進而生成成熟的miRNA。那些隨著真核細胞mRNA的加工成熟過程,由內含子生成的miRNA前體,被稱為“mitron”[13]。例如,心臟特異性的miR- 208源于編碼α肌球蛋白重鏈(α-myosin heavy chain,αMHC)基因的內含子,該基因除了編碼αMHC蛋白,參與心肌收縮功能之外,還由其內含子生成miR- 208,該miRNA能夠調控應激和激素反應時的心肌收縮性[14],從而使這兩種轉錄產物實現協同作用。類似地,miR- 483- 3p源于胰島素樣生長因子2(insulin-like growth factor 2,IGF2)的內含子,其在多種腫瘤中發(fā)揮抗凋亡的活性。然而,miR- 483- 3p和其宿主基因IGF2的表達水平并無明顯的一致性,該miRNA與IGF2編碼產物是否存在協同作用有待進一步研究[15]。此外,一些環(huán)狀RNA也來源于編碼基因的內含子,這類環(huán)狀RNA伴隨內含子的剪接過程而生成,并能夠促進相應宿主基因的表達[16]。
由編碼基因位點生成的內源性小干擾RNA小干擾RNA(small interfering RNA,siRNA)是一種外源合成后導入細胞,對目的基因的表達進行抑制的短片段雙鏈RNA,常作為基因功能研究的工具。然而,細胞也會產生內源性的siRNA(endo-siRNA,esiRNA)。Mg2+/Mn2+依賴性蛋白磷酸酶1K(protein phosphatase,Mg2+/Mn2+dependent 1K,PPM1K)基因的逆向轉錄產物,即假基因ψPPM1K中包含反向重復序列,能夠產生發(fā)夾結構,并加工生成esiRNA,該esiRNA可靶定并抑制非有絲分裂基因A相關激酶8(never in mitosis gene A related expressed kinase 8,NEK8)的表達。在人肝癌細胞中,PPM1K蛋白及ψPPM1K生成的esiRNA表達減低,導致esiRNA對NEK8的抑制作用減弱,引起NEK8的表達升高。NEK8能夠對抗ψPPM1K對細胞生長的抑制作用,這一過程是肝癌細胞增殖加速的機制之一[17]。
由長鏈非編碼RNA加工生成的小片段非編碼RNA短片段的非編碼RNA除了可以在編碼基因的mRNA加工成熟過程中產生,有時也能由lncRNA的轉錄后加工過程產生。例如,lncRNA轉移相關肺腺癌轉錄本1(metastasis associated lung adenocarcinoma transcript 1,MALAT1)在轉錄后,即被RNA酶P切割成兩條非編碼RNA,其中位于5’端較長的RNA鏈為MALAT1的成熟序列,位于3’端較短的RNA鏈具有和轉運RNA(transfer RNA,tRNA)相似的“三葉草”樣二級結構,最終生成一段61 nt的非編碼RNA。和MALAT1主要定位于細胞核不同,這段短鏈的RNA主要定位于細胞漿,因此被命名為MALAT1相關小胞漿RNA(MALAT1-associated small cytoplasmic RNA,mascRNA)。mascRNA作為tRNA的類似物,可能參與翻譯過程[18],并影響單核-巨噬細胞系統(tǒng),參與心血管系統(tǒng)的免疫調節(jié)過程[19]。
源于tRNA的小片段非編碼RNAtRNA的前體或成熟體也能夠在5’端或3’端進行剪切,生成與miRNA長度類似的小片段非編碼RNA,這類RNA被稱為tRNA來源的RNA片段(tRNA-derived RNA fragments,tRF)[20]。這些小片段RNA并非tRNA加工過程產生的“廢物”,而是在細胞功能調控中發(fā)揮作用。例如,tRF- 1001即為一條來源于絲氨酸t(yī)RNA前體的tRF,由核酸內切酶elaC Z2切割tRNA前體生成。功能研究表明,tRF- 1001能夠促進多種腫瘤細胞的增殖[20]。
值得注意的是,tRF分子無論是加工成熟過程還是作用機制,都和miRNA存在相似之處。有些在前期被確認為miRNA的分子,在后續(xù)研究中發(fā)現其來源于tRNA,被稱為tRNA來源的小RNA(tRNA-derived small RNA,tsRNA),其本質仍為tRF。在慢性淋巴細胞白血病、肺癌、前列腺癌等腫瘤中,tsRNA發(fā)生特征性的表達譜改變,提示tRF在功能上也和miRNA類似,具有癌基因或抑癌基因的活性[21- 22]。例如,CU1276是一條從人類成熟B細胞中克隆到的tRF分子,長度為22 nt,其被證實來源于多個tRNA的3’端序列。CU1276不僅長度和miRNA相似,其加工成熟過程也和miRNA類似,需要依賴Argonaute蛋白和DICER1蛋白。CU1276的作用機制也與miRNA相似,其通過序列特異性結合于mRNA 3’非翻譯區(qū)的方式,抑制復制蛋白A1的表達。在功能調控方面,CU1276抑制細胞的增殖,參與DNA復制和損傷修復過程。在生發(fā)中心淋巴瘤細胞中發(fā)現CU1276表達缺失,造成細胞增殖加速及DNA代謝動力學的紊亂[23]。作為tRF的另一個實例是miR- 3676和miR- 4521,這兩條miRNA來源于蘇氨酸t(yī)RNA的前體,屬于3’tRF,其序列在慢性淋巴細胞白血病和肺癌中發(fā)生突變[21]。tRF在mRNA上的結合位點序列與一種RNA結合蛋白,即YBX1的結合位點序列相同。在乳腺癌細胞遭受缺氧等應激條件下,細胞內tRF被誘導而大量生成,并與YBX1競爭性結合癌基因mRNA的3’非翻譯區(qū)位點,導致mRNA上的YBX1被tRF取代,其結果是癌基因mRNA加速降解。如果這類抑癌性的tRF生成減少,會導致該抑癌通路效應減低,乳腺癌細胞的轉移活性增強[24]。
有些tRF也可能在非惡性腫瘤的病理情況下大量生成,如呼吸道合胞病毒感染后的人肺癌細胞系中,產生大量長度約30 nt的tRF分子,其中一條來源于tRNA-Glu-CTC的tRF能夠促進呼吸道合胞病毒的復制[25]。此外,tRF也能干擾真核細胞的翻譯起始因子,從而抑制蛋白的翻譯[26]。
一些基因位點既能直接生成不同的轉錄產物,其部分轉錄產物也能加工生成不同的RNA分子,即同時具備Ⅰ型和Ⅱ型超基因的特點,這類基因稱為Ⅲ型超基因。該類型超基因的典型實例是H19基因位點,該位點的兩個方向均可被轉錄,生成4種不同的RNA分子。其正向轉錄產物除lncRNA H19外,在人和小鼠細胞中,H19可作為miR- 675的前體,進一步加工生成成熟的miR- 675[27]。此外,H19基因反向轉錄亦可生成兩條RNA,其中一條為lncRNA,作為H19的反向互補序列,該lncRNA被形象地命名為91H,即H19的反向拼寫。另一條RNA可編碼蛋白,被命名為H19反向腫瘤抑制基因(H19 opposite tumor suppressor,HOTS)。
H19基因位點的正向轉錄產物—H19/miR- 675H19基因啟動子序列存在單核苷酸多態(tài)性(single-nucleotide polymorphism,SNP)位點,其中3個SNP位點與結直腸癌的風險和預后相關[28]。但這一調控機制對基因位點自身轉錄過程的影響還不明確。
該基因位點的轉錄產物lncRNA H19可在轉錄水平上對其他基因進行調控。H19與S腺苷蛋氨酸水解酶結合并抑制其功能,H19基因表達被抑制后,可使S腺苷蛋氨酸的水解加速,導致DNA甲基轉移酶3β介導的多個基因的甲基化作用增強,從而影響細胞的功能[29]。
H19/miR- 675對細胞功能的調控更多發(fā)生在轉錄后水平。在不同的組織和細胞中,H19/miR- 675發(fā)揮的作用不同甚至可能相反[30- 31]。一方面,H19/miR- 675在畸胎瘤、結腸癌和肝癌等多種腫瘤細胞中具有抑癌基因的活性[32]。在前列腺癌細胞系中過表達H19可使miR- 675水平升高,導致miR- 675的直接靶基因TGFBI的表達被抑制,從而抑制前列腺癌的轉移[33]。在非小細胞肺癌中,miR- 675的抑癌活性則是通過調控其靶基因GPR55實現的[34]。此外,在胚胎發(fā)育過程中,H19能夠減緩細胞增殖,這一效應與伴隨生成的miR- 675相關。在胚胎細胞中過表達miR- 675能夠使增殖減慢,相關靶基因是胰島素樣生長因子1受體[35]。
另一方面,在乳腺癌等腫瘤中,H19/miR- 675具有癌基因活性。過表達H19/miR- 675能夠促進乳腺癌細胞的增殖和轉移,miR- 675靶定并調控c-Cbl和Cbl-b的表達,導致Akt和Erk通路持續(xù)活化,細胞的惡性程度增加[36]。在非小細胞肺癌中,H19誘導miR- 675表達升高,使miR- 675的靶基因p53過度抑制,導致腫瘤進程加速[37]。H19也可作為miRNA的吸附物,以競爭性內源RNA[38- 39]的方式調控其他基因的表達。例如,H19作為let- 7家族的生理性吸附物,能夠調控肌組織的分化[40]。在乳腺癌細胞中,H19能夠競爭性吸附miR- 200b/c和let- 7b,并促進這些miRNA的靶基因如Git2和Cyth3的表達,引起下游一系列細胞信號途徑的改變,最終導致癌細胞的轉移加速[41]。H19在食管癌細胞中也作為miR- 22- 3p的吸附物,抑制H19可使miR- 22- 3p的靶基因WNT1表達降低,從而抑制食管癌細胞的增殖和遷移,并增強癌細胞對放療的敏感性[42]。
H19基因位點的反向轉錄產物—91H和HOTS蛋白根據目前的研究結果,作為H19的反向互補序列,lncRNA 91H在腫瘤中主要表現出癌基因的活性。例如在結腸癌細胞中,91H的表達水平上調,其通過調控靶基因HNRNPK促進癌細胞的轉移,且91H在血清中的表達水平能夠作為結腸癌預后的預測指標[43- 44]。在乳腺癌細胞中,91H促進細胞增殖、遷移和侵襲,其作用機制是抑制H19基因位點的甲基化,從而上調lncRNA H19的表達水平[45]。這一過程提示,該基因位點不同轉錄產物之間可能存在協同作用。H19基因位點的另一個反向轉錄產物HOTS是蛋白編碼基因,值得注意的是,其編碼產物具有抑癌活性,能夠抑制橫紋肌肉瘤、絨毛膜癌、腎母細胞瘤(Wilms瘤)等腫瘤細胞的生長[46]。
綜上,H19基因位點的各轉錄產物在腫瘤細胞中的作用并不一致,各產物之間可能存在協同作用或拮抗作用,但其相互作用的具體機制目前還不十分清楚,有待進一步研究。
傳統(tǒng)觀點認為,原核生物的基因為多順反子,即多數基因根據功能的相關性,成簇串聯形成操縱子,受到統(tǒng)一的調控。與之對應,真核生物的基因為單順反子,即一個基因通過轉錄僅生成一條RNA分子,并編碼一條多肽鏈。但近年來的研究表明,真核生物的一個基因也可能通過不同的轉錄起止位點,或經過轉錄后剪切過程,生成不止一個RNA轉錄本,即所謂的超基因。這一觀點的提出對真核生物單順反子的理論進行了挑戰(zhàn),這是因為早期對非編碼RNA的研究很少,主要關注編碼基因,而編碼基因大多數符合單順反子的特征。近年隨著非編碼RNA的逐漸深入,越來越多的非編碼RNA的轉錄特征被明確,發(fā)現很多非編碼RNA是伴隨編碼基因的轉錄而生成的,甚至有些超基因位點并不包含編碼基因,僅由長鏈非編碼RNA(如lncRNA)和短鏈非編碼RNA(如miRNA)構成。盡管如此,目前對于超基因的研究還處于初級階段,在未來的研究中需要關注的不僅是超基因各RNA是如何轉錄的,而應該探索各轉錄本的表達如何進行協同調控,以及RNA轉錄本通過何種調控機制剪接生成多個RNA產物。超基因這種轉錄模式在細胞功能學調控方面的意義,也需要進一步闡明。隨著研究的深入,超基因這種基因表達的“多面手”將更多地被闡釋,隱藏在生物遺傳密碼當中的奧秘也將越來越多地被揭示。