趙婷婷 綜述 劉志紅 審校
[作者單位]東部戰(zhàn)區(qū)總醫(yī)院 國家腎臟疾病臨床醫(yī)學(xué)研究中心(南京,210016)
選擇性多聚腺苷酸化(alternative polyadenylation,APA)是真核細(xì)胞 mRNA 成熟過程中針對pre-mRNA的一種加工修飾方式,主要發(fā)生在3′UTR區(qū),其通過選擇不同的多聚腺苷酸化信號位點(polyadenylation signal site,PAS),產(chǎn)生編碼序列相同但 3′UTR 序列長度不同的 mRNA 亞型。APA主要通過改變 3′UTR序列長度影響對應(yīng)的反式作用因子(miRNA 或RNA結(jié)合蛋白等)的調(diào)控作用,進(jìn)而調(diào)節(jié) mRNA定位、穩(wěn)定性、翻譯效率及蛋白定位。本文將從APA的概況、檢測方法、生物學(xué)功能、基因遺傳和單細(xì)胞層面的最新研究進(jìn)展、以及糖尿病腎病APA的研究現(xiàn)狀和前景等方面進(jìn)行闡述。
APA作為重要的轉(zhuǎn)錄后調(diào)控機(jī)制,是在pre-mRNA 3′端序列中的順式調(diào)控元件、反式作用因子,例如多種酶和蛋白因子等共同作用下完成,同時受多種細(xì)胞微環(huán)境因素的影響[1-2]。APA形成過程包括PAS下游切割位點的選擇和多聚腺苷酸化兩個重要環(huán)節(jié),其中PAS 定位是APA形成的關(guān)鍵。人類約70%的基因含有多個PAS基序,分別稱為近端PAS(或稱為非經(jīng)典的PAS)和遠(yuǎn)端PAS(或稱為經(jīng)典的PAS),經(jīng)典的PAS基序是AAUAAA,非經(jīng)典的PAS基序變體有AUUAAA、AGUAAA 和 UAUAAA 等,切割位點位于PAS下游10~30個核苷酸區(qū)域。此外,APA 的形成還需要其他高度保守的順式元件參與,如 PAS 上游的 UGUA 序列和下游的 U-/GU-rich 序列,以上保守序列通過募集特定蛋白復(fù)合物共同調(diào)控APA的形成,包含CPSF、CSTF、CFI 和 CFII 等[3]。總之,在APA形成的過程中,CPSF復(fù)合物能準(zhǔn)確識別PAS基序,同時CSTF和CFI復(fù)合物分別與PAS下游U-/GU-富集序列和上游UGUA模體等保守基序特異性結(jié)合,最終CPSF、CFI 和 CSTF 等復(fù)合物形成一個整體,協(xié)同完成pre-mRNA的PAS下游位點精確切割[2]。最后,在多聚腺苷酸聚合酶的催化作用下,在切割位點處添加多聚腺苷酸尾(圖1)[1]。不同PAS位點的選擇導(dǎo)致3′UTR序列長度不同,近端PAS上游的3′UTR序列稱為基本UTR序列,而將其下游對應(yīng)的序列稱為選擇性UTR序列。PAS不同位點的選擇接受APA調(diào)節(jié)因子的調(diào)控,其中NUDT21,CPSF6,CFI59,U1 snRNP,PABPC1,HuR等調(diào)節(jié)因子通過與近端PAS附近的順式作用原件結(jié)合而競爭性抑制APA調(diào)節(jié)復(fù)合物與之結(jié)合,進(jìn)而促進(jìn)遠(yuǎn)端PAS位點的選擇,最終導(dǎo)致基因3′UTR序列整體延長,而CstF64的高表達(dá)會促進(jìn)近端PAS位點的選擇,進(jìn)而引起基因3′UTR序列的整體縮短[1-2]。
圖1 APA調(diào)控的順式作用原件和對應(yīng)的反式作用因子[2]
目前已有一些專門針對APA研究的檢測方法,主要包括PAS-seq,3′RNA-seq和3′RACE等,其中PAS-seq和3′RNA-seq是直接進(jìn)行多聚腺苷酸位點的高通量測序的方法,通過對轉(zhuǎn)錄本中基因組編碼序列和多聚腺苷酸尾的連接序列進(jìn)行測序,最終確定PAS切割位點[4-5]。而3′RACE實驗則是基于逆轉(zhuǎn)錄PCR技術(shù)從樣本中快速擴(kuò)增目的基因3′端序列的方法,該方法提高了檢測PAS位點精確位置的靈敏度[6]。除了以上APA直接高通量測序的方法,我們還可通過常規(guī)的 RNA-seq 數(shù)據(jù)借助生信算法定量分析APA的動態(tài)變化。目前常用的推算方法包括DaPars、QAPA、GETUTR和Roar等11種算法[2]。Chen等[7]研究者將以上算法進(jìn)行比較發(fā)現(xiàn)DaPars和QAPA兩種算法的假陽性率較低,得到的結(jié)果準(zhǔn)確性較高。其中DaPars是一種denovo的算法,是在不考慮之前的任何關(guān)于 APA 注釋數(shù)據(jù)庫情況下,基于自己的數(shù)據(jù)從頭推算APA的方法[8];而QAPA 算法是整合已經(jīng)構(gòu)建的關(guān)于PAS的數(shù)據(jù)庫來分析APA的動態(tài)變化[9]。
APA通過選擇不同的PAS位點導(dǎo)致3′UTR的序列長度不同,在近端PAS和遠(yuǎn)端PAS間的UTR區(qū)域常含有與miRNA或RNA結(jié)合蛋白(RNA binding proteins,RBPs)等相結(jié)合的特定序列。因此,APA主要是通過改變3′UTR 序列長度影響對應(yīng)的反式作用因子的調(diào)控作用,進(jìn)而調(diào)節(jié)mRNA定位、穩(wěn)定性、翻譯效率以及蛋白定位(圖2)。目前研究報道選擇性多聚腺苷酸化與多種生理、病理過程密切相關(guān),但其調(diào)節(jié)方向和調(diào)控機(jī)制存在差異[10]。3′UTR變短的基因主要參與細(xì)胞周期調(diào)控、RNA剪切加工、DNA擴(kuò)增、蛋白磷酸化等生物學(xué)功能,而3′UTR變長的基因主要富集在細(xì)胞外基質(zhì)沉積、細(xì)胞黏附、補(bǔ)體激活等進(jìn)程[11]。例如在以腫瘤為主的增殖性疾病中,Xia 等[8]研究發(fā)現(xiàn)在肺癌、子宮癌、乳腺癌和膀胱癌中存在APA的調(diào)節(jié),其中91%基因3′UTR顯著變短,導(dǎo)致3′UTR 序列上miRNA結(jié)合密度降低,從而減弱miRNA的抑制作用,提高翻譯水平,最終促進(jìn)腫瘤細(xì)胞的增殖和惡化。為了探究腫瘤細(xì)胞3′UTR變短的機(jī)制,Yang等[12]進(jìn)行深入研究,他們首次發(fā)現(xiàn)了一類腫瘤特異性泛素連接酶MAGE-A11,MAGE-A11通過催化3′mRNA加工復(fù)合體的重要成員PCF11的泛素化和降解,驅(qū)使不同腫瘤類型的APA調(diào)控和3′UTR整體縮短,進(jìn)而動態(tài)調(diào)節(jié)致癌基因和抑癌基因的表達(dá)。此外,PolH作為DNA聚合酶的Y家族成員,介導(dǎo)DNA轉(zhuǎn)運合成,是DNA損傷耐受的主要調(diào)節(jié)蛋白[13]。Zhang等[14]發(fā)現(xiàn)用順鉑處理腫瘤細(xì)胞時,PoIH基因的3′UTR顯著縮短,miRNA的抑制作用減弱,PoIH蛋白表達(dá)水平升高,說明在治療過程中,腫瘤細(xì)胞可能通過APA機(jī)制促進(jìn)PoIH蛋白表達(dá),進(jìn)而產(chǎn)生耐藥,促進(jìn)腫瘤進(jìn)展。除腫瘤外,研究報道在心肌肥厚、肌營養(yǎng)不良、慢性淋巴細(xì)胞白血病患者基因的3′UTR序列同樣存在普遍變短的現(xiàn)象[2]。
圖2 APA調(diào)節(jié)生物學(xué)功能的作用模式[1]
而在細(xì)胞分化和發(fā)育的進(jìn)程中,主要包括成肌細(xì)胞、胚胎干細(xì)胞和神經(jīng)元的分化和發(fā)育,APA調(diào)控的基因傾向于選擇遠(yuǎn)端PAS,導(dǎo)致APA調(diào)控基因的3′UTR序列整體延長,RBPs通過結(jié)合位于延長的3′UTR內(nèi)的特殊線性序列基序或二級結(jié)構(gòu)來調(diào)節(jié)mRNA亞細(xì)胞定位和蛋白翻譯[15-16]。例如,An等[15]在小鼠海馬神經(jīng)元中發(fā)現(xiàn)兩種3′UTR長度不同的BDNF亞型,短3′UTR BDNF亞型主要定位于胞體,而長3′UTR亞型在RNA結(jié)合蛋白的協(xié)助作用下靶向轉(zhuǎn)運至樹突而發(fā)揮特殊的生物學(xué)功能。同樣,Berkovits等[17]研究表明CD47 mRNA存在兩種長度不同的3′UTR APA亞型,短3′UTR CD47亞型定位于內(nèi)質(zhì)網(wǎng),而長3′UTR亞型募集RNA結(jié)合蛋白HuR和SET4復(fù)合物至3′UTR區(qū)域,通過進(jìn)一步激活RAC1促進(jìn)CD47轉(zhuǎn)位到細(xì)胞質(zhì)膜行使功能。Cau教授團(tuán)隊進(jìn)行了關(guān)于APA介導(dǎo)3′UTR的延長調(diào)節(jié)蛋白翻譯的研究,他們發(fā)現(xiàn)在FGF9 mRNA 長3′UTR區(qū)包含調(diào)節(jié)翻譯的UG-repeat序列,RNA結(jié)合蛋白FUBP3與該重復(fù)序列結(jié)合后在不影響mRNA半衰期的情況下增強(qiáng)FGF9蛋白的翻譯[18]。
雖然APA發(fā)生在約70%的人類基因中,但目前缺乏APA與疾病風(fēng)險和人類性狀表型之間的廣泛關(guān)聯(lián)分析,此外,有關(guān)非編碼SNP在不同人體組織中與APA及其表型特征和疾病的關(guān)系的研究也相對匱乏。因此,Li教授[19]團(tuán)隊開發(fā)了DaParsV2.0算法,此方法基于來自467個個體,46種組織的8 722套RNA-seq與匹配的全基因測序數(shù)據(jù),共鑒定到大約40萬個與APA相關(guān)的遺傳變異位點并命名為APA數(shù)量性狀位點(3′aQTL),這些3′aQTL關(guān)聯(lián)的基因共有11 613個,占已注釋基因的51%。通過遺傳力估計分析作者發(fā)現(xiàn)3′aQTL能解釋大約25.2%的APA變異和16.2%的基因表達(dá)變異。同時,作者首次構(gòu)建了人類多組織APA遺傳圖譜并分析了3′aQTL在各個組織的分布特異性。研究者還進(jìn)一步系統(tǒng)分析了3′aQTL與poly(A) 基序,RNA二級結(jié)構(gòu)和 RBP結(jié)合位點的關(guān)聯(lián),發(fā)現(xiàn)3′aQTL可通過改變這些元件進(jìn)而影響APA。最有意義的是,作者通過CLIP-seq發(fā)現(xiàn)了一個APA全新的調(diào)控因子LARP4,約30%的3′aQTL可以通過改變LARP4的結(jié)合位點來調(diào)節(jié)對應(yīng)基因的APA。這為APA關(guān)聯(lián)的遺傳位點提供了一種全新分子調(diào)控機(jī)制,同時也為之后發(fā)現(xiàn)APA調(diào)控因子提供了一個新的角度。最后,Li等[19]還分析了3′aQTL與疾病的關(guān)系。通過關(guān)聯(lián)分析23種常見人類疾病與表型相關(guān)SNP和3′aQTLs,鑒定到11.5%的組織特異的性狀中富含3′aQTL變異。作者同時發(fā)現(xiàn)3′aQTLs與潰瘍性結(jié)腸炎、原發(fā)性膽管炎和阿爾茨海默病等多種遺傳相關(guān)的自身免疫性疾病存在關(guān)聯(lián)。該項工作對解釋人類復(fù)雜疾病風(fēng)險易感位點有著重要的推動作用,為揭示人類復(fù)雜性狀和疾病病因?qū)W提供了新的方向。
此外,Cui等[20]還構(gòu)建了APA關(guān)聯(lián)分析方法(3′aTWAS),用于鑒定APA關(guān)聯(lián)的大腦疾病風(fēng)險基因。作者基于17 300個RNA-seq數(shù)據(jù)及其匹配的基因組數(shù)據(jù)訓(xùn)練了包含人體49種組織的3′aTWAS預(yù)測模型,并應(yīng)用此模型對11種大腦遺傳疾病(包括帕金森綜合征、阿爾茨海默癥和漸凍癥等)進(jìn)行分析,最終鑒定出354個APA關(guān)聯(lián)的大腦疾病風(fēng)險基因,其中超過50%的基因不能被以前的TWAS方法找到。當(dāng)然3′aTWAS預(yù)測模型也可被廣泛的應(yīng)用到其他人類復(fù)雜表型和疾病的研究中,從而鑒定APA關(guān)聯(lián)的遺傳疾病風(fēng)險基因。
同時,隨著單細(xì)胞測序技術(shù)的飛速發(fā)展,研究者同時將APA的研究方向聚焦在單細(xì)胞水平,從單細(xì)胞層面揭示APA的細(xì)胞間異質(zhì)性及不同組織、生物過程和疾病中不同細(xì)胞類型的APA的差異。其中Wang等[21]開發(fā)了單細(xì)胞多腺苷酸化測序方法,這是一種直接對轉(zhuǎn)錄物3′端進(jìn)行測序的鏈特異性方法。他們通過這種測序方法分析了多種細(xì)胞系發(fā)現(xiàn),在bulk數(shù)據(jù)中使用多個PAS位點的基因在每個細(xì)胞中只傾向于選擇一個PAS位點。同時發(fā)現(xiàn),在細(xì)胞同步化后,PAS位點變化的基因富集在細(xì)胞周期相關(guān)通路中,而差異表達(dá)的基因卻沒有富集到細(xì)胞周期的調(diào)控,進(jìn)而從單細(xì)胞層面說明APA在細(xì)胞周期的調(diào)控中發(fā)揮重要作用。除了對3′端直接測序外,也可以通過算法從常規(guī)的單細(xì)胞測序數(shù)據(jù)中推算出每種細(xì)胞的PAS切割位點,目前常用的算法包括scSAAP,scDAPA,scAPAmod,scDaPars,scMAPA 和scAPAtrap 等[22]。借助以上算法研究者已成功構(gòu)建了急性髓細(xì)胞白血病、非小細(xì)胞肺癌、分泌細(xì)胞分化和發(fā)育小鼠胚胎的單細(xì)胞APA全景圖[23-26],揭示了細(xì)胞類型特異性的APA調(diào)節(jié),進(jìn)而在轉(zhuǎn)錄后APA水平上揭示了細(xì)胞的異質(zhì)性,擴(kuò)大了人們對細(xì)胞異質(zhì)性的認(rèn)知范圍。因此,單細(xì)胞APA的發(fā)展不僅為我們研究不同或者罕見細(xì)胞類型的生物學(xué)調(diào)控提供了新思路,更有助于從單細(xì)胞層面理解基因表達(dá)調(diào)控的新機(jī)制。
目前關(guān)于APA在腎臟領(lǐng)域的研究相對比較局限,有少量研究報道在缺血再灌注損傷或單側(cè)輸尿管梗阻方法構(gòu)建的急性腎損傷的小鼠模型中,APA介導(dǎo)近端小管NLRP3和FGF2基因的3′UTR序列變短,進(jìn)而促進(jìn)腎小管的炎癥、凋亡和纖維化[27-28]。但關(guān)于APA是否在糖尿病腎病腎小球損傷中發(fā)揮作用及其調(diào)節(jié)方向的研究相對比較匱乏。我們中心前期首次通過借助DaPars和QAPA算法從50例糖尿病腎病和25例對照患者的整個腎小球RNA-seq測序數(shù)據(jù)中進(jìn)行APA的分析[29],結(jié)果表明,95% APA 調(diào)節(jié)基因的3′UTR在糖尿病腎病患者腎小球中普遍延長,qRT-PCR實驗證實糖尿病腎病患者以選擇遠(yuǎn)端PAS切割位點為主。同時,促進(jìn)遠(yuǎn)端 PAS 選擇的 APA 調(diào)節(jié)因子 NUDT21、CPSF6、SNRNP70 和 PABPC1 的蛋白水平在糖尿病腎病患者組表達(dá)顯著增強(qiáng)而在對照組表達(dá)較低。整合APA 推算結(jié)果和轉(zhuǎn)錄組-蛋白質(zhì)組學(xué)數(shù)據(jù)發(fā)現(xiàn),在所有 3′UTR 變長基因中,約31%基因在蛋白水平高表達(dá),但僅有約 5%基因在 mRNA 水平高表達(dá),說明 APA 介導(dǎo)的 3′UTR序列延長具有提高 mRNA 翻譯效率的作用。隨后,我們篩選3′UTR長度變化比較顯著且在糖尿病腎病中發(fā)揮重要作用的CYB5R1基因進(jìn)行驗證。在高糖刺激的足細(xì)胞中分別過表達(dá) CYB5R1 長、短 3′UTR 亞型,發(fā)現(xiàn)長 3′UTR 亞型的蛋白表達(dá)水平明顯高于短 3′UTR 亞型。最后,結(jié)合 POSTAR2 數(shù)據(jù)庫進(jìn)一步分析發(fā)現(xiàn),約80%基因通過 3′UTR 的延長至少增加一個RBPs結(jié)合位點,且蛋白翻譯效率在 RBPs結(jié)合基因與非結(jié)合的基因間存在顯著差異。因此,本課題組首次提出APA 作為糖尿病腎病新發(fā)現(xiàn)轉(zhuǎn)錄后調(diào)控機(jī)制,其主要通過延長mRNA 3′UTR 序列長度來增強(qiáng)對應(yīng) RBPs 的調(diào)控作用,進(jìn)而提高蛋白翻譯效率、促進(jìn)糖尿病腎病的發(fā)生發(fā)展(圖3)。此研究是關(guān)于APA在整個腎小球中的調(diào)節(jié)作用,但腎臟是一個多細(xì)胞器官,分為腎小球和腎小管間質(zhì),其中腎小球又包含足細(xì)胞、系膜細(xì)胞和內(nèi)皮細(xì)胞等,腎小管間質(zhì)包含近端小管、遠(yuǎn)端小管和集合管等細(xì)胞。但迄今為止,關(guān)于糖尿病腎病細(xì)胞類型特異性的APA調(diào)節(jié)尚無研究報道。
圖3 糖尿病腎病腎小球APA調(diào)控的模式圖[29]
與此同時,越來越多的研究者發(fā)現(xiàn)糖尿病患者個體間存在巨大差異,部分糖尿病患者在血糖控制良好的情況下發(fā)展為糖尿病腎病,而另一些患者在血糖控制欠佳的情況下仍保持正常的腎功能[30]。此外,糖尿病患者發(fā)生糖尿病腎病以及進(jìn)展為終末期腎病具有家族聚集傾向,不同種族之間糖尿病患者發(fā)生糖尿病腎病的概率也不同[31],這些證據(jù)都提示遺傳因素在糖尿病腎病發(fā)病中占有重要地位。目前,APA是否在糖尿病腎病的基因遺傳層面發(fā)揮作用尚不清楚,以及與APA關(guān)聯(lián)的遺傳風(fēng)險基因和易感位點仍是未知。
小結(jié):隨著高通量測序的飛速發(fā)展,不斷涌現(xiàn)的糖尿病腎病全基因測序和單細(xì)胞測序數(shù)據(jù)為從基因遺傳和單細(xì)胞層面研究糖尿病腎病APA的調(diào)控奠定了堅實的數(shù)據(jù)基礎(chǔ)。因此,APA相關(guān)的遺傳變異位點的篩選以及細(xì)胞特異的APA調(diào)節(jié)作用的研究將是今后糖尿病腎病APA研究的重點和方向。