崔建偉 崔 瀟 劉雪艷 李成萍 郭 彥 周?chē)?guó)利
(聊城大學(xué) 生命科學(xué)學(xué)院,山東 聊城 252059)
在1970s早期,首次在RNA上發(fā)現(xiàn)重復(fù)的poly(A)尾.當(dāng)時(shí)對(duì)RNA是如何或?yàn)槭裁磿?huì)有poly(A)尾知之甚少,但已經(jīng)推測(cè)它是一種可能與翻譯或mRNA的形成和運(yùn)輸有關(guān)的信號(hào)序列[1].在接下來(lái)的幾年里,這些預(yù)測(cè)得到了驗(yàn)證,并且poly(A)尾的動(dòng)態(tài)調(diào)節(jié)過(guò)程變得更加清晰,大量調(diào)節(jié)poly(A)尾長(zhǎng)度的聚合酶和脫腺苷酸化酶已經(jīng)被鑒定[2-4].Poly(A)尾在真核生物mRNA轉(zhuǎn)錄后調(diào)控中具有關(guān)鍵的功能,是mRNA穩(wěn)定性和翻譯的重要決定元件.盡管poly(A)尾如此重要,但被發(fā)現(xiàn)后的幾十年里,其序列竟然極少被精確解讀過(guò).主要原因在于,擴(kuò)增簡(jiǎn)單串聯(lián)的單核苷酸序列會(huì)導(dǎo)致聚合酶滑動(dòng),從而造成測(cè)序結(jié)果的移碼和亂碼.近幾年,針對(duì)poly(A)尾的高通量測(cè)序技術(shù)的建立和快速發(fā)展,使poly(A)尾的精確測(cè)序得以實(shí)現(xiàn),poly(A)尾在mRNA轉(zhuǎn)錄后調(diào)控中關(guān)鍵作用正的逐漸被揭示.
幾乎所有真核生物的mRNA都包含一個(gè)多聚腺苷酸信號(hào)(polyadenylation signal,PAS)序列.PAS和其下游富含GU或U的堿基序列通過(guò)招募多個(gè)參與3′ 端加工的蛋白復(fù)合物來(lái)指導(dǎo)poly(A)尾的形成[5].多聚腺苷酸化發(fā)生的位置不是由RNA聚合酶終止pre-mRNA的合成決定的;相反,RNA的剪切是在PAS下游10-30 nt范圍內(nèi)發(fā)生的,poly(A)聚合酶(poly(A) polymerase,PAP)隨后在其3′末端加入poly(A)尾.一旦11-14個(gè)腺苷酸被加入,細(xì)胞核poly(A)結(jié)合蛋白(nuclear poly(A) binding protein,PABPN)能夠結(jié)合正在延伸的poly(A)尾[6].然后PAP能夠快速合成一個(gè)全長(zhǎng)poly(A)尾,poly(A)長(zhǎng)度一般認(rèn)為是200-250 nt[7],但是否所有轉(zhuǎn)錄本在所有組織中都“完全”加250個(gè)左右的腺苷酸并不完全清楚.例如,一些基因被發(fā)現(xiàn)含有一個(gè)poly(A)限制元件(a poly(A) limiting element,PLE),它的作用是將pre-mRNA上poly(A)尾的初始長(zhǎng)度限制在20 nt以下[8].在一些長(zhǎng)鏈非編碼RNA(long non-coding RNAs,lncRNAs)和一些小非編碼RNA也被發(fā)現(xiàn)含有poly(A)尾[9].
剪切和多聚腺苷酸化的過(guò)程被認(rèn)為是mRNA從細(xì)胞核正確地輸出到細(xì)胞質(zhì)中所必要的.一旦進(jìn)入細(xì)胞質(zhì),poly(A)尾主要被胞質(zhì)poly(A)結(jié)合蛋白(cytoplasmic poly(A)-binding protein,PABPC)結(jié)合,但關(guān)于PABPN和PABPC在poly(A)尾上的轉(zhuǎn)換知之甚少.雖然兩者可以在細(xì)胞質(zhì)和細(xì)胞核之間穿梭的蛋白質(zhì),但它們之間是如何及何時(shí)完成的交換還不清楚.新合成轉(zhuǎn)錄本上所需要的蛋白質(zhì)與細(xì)胞質(zhì)中正在轉(zhuǎn)譯的mRNA上所需的蛋白質(zhì)種類(lèi)有很大的不同,其中許多蛋白質(zhì)必須發(fā)生重構(gòu)才能使各自過(guò)程順利進(jìn)行[10].研究發(fā)現(xiàn),PABPN缺乏任何重復(fù)的足跡圖譜,但PABPC可重復(fù)地結(jié)合到poly(A)尾20-30個(gè)腺苷核苷酸序列上[11].PABPC通過(guò)與其它反式作用因子的相互作用,進(jìn)而在mRNA的穩(wěn)定性和翻譯中發(fā)揮重要的作用.它通過(guò)與5' 帽子結(jié)合復(fù)合物中的真核翻譯起始因子4F(eukaryotic translation initiation factor 4F,eIF4F)和真核翻譯釋放因子3(eukaryotic translation release factor,eRF3)的結(jié)合[12],通過(guò)這些相互作用,PABPC和poly(A)尾協(xié)同促進(jìn)翻譯.盡管PABPC與mRNA的保護(hù)和穩(wěn)定性有關(guān),但它還能招募脫腺苷酸化酶,PABPC這個(gè)看似矛盾的角色說(shuō)明它在poly(A)尾轉(zhuǎn)錄后調(diào)控中具有雙重作用,具體的作用機(jī)制還需要進(jìn)一步的闡明.由于還存在其他因子與poly(A)尾結(jié)合,如La蛋白可以與poly(A)尾結(jié)合,并同時(shí)與PABPC結(jié)合可能對(duì)翻譯具有調(diào)節(jié)作用,這此因子的結(jié)合使poly(A)尾所結(jié)合的相互作用因子更加復(fù)雜[13].從poly(A)尾合成到降解的過(guò)程中,poly(A)尾和各種蛋白質(zhì)因子之間存在著多方面的關(guān)系,從而在轉(zhuǎn)錄后調(diào)控中發(fā)揮著不同的作用.
Poly(A)尾是保護(hù)mRNA的“看門(mén)人”,因?yàn)榻到鈓RNA的酶必須從3' 端開(kāi)始降解整個(gè)poly(A)尾,才能影響到蛋白質(zhì)編碼區(qū),這將使poly(A)尾的長(zhǎng)度必須處在一個(gè)關(guān)鍵閾值范圍內(nèi)才能保護(hù)mRNA不被降解.幾十年來(lái)的傳統(tǒng)觀點(diǎn)認(rèn)為,較長(zhǎng)的poly(A)尾對(duì)其mRNA穩(wěn)定性和翻譯具有積極的影響[2,14].但是與大多數(shù)poly(A)尾很長(zhǎng)的想法相反,發(fā)現(xiàn)一些轉(zhuǎn)錄本poly(A)尾的長(zhǎng)度比預(yù)期的短很多,一些非常穩(wěn)定的轉(zhuǎn)錄本(如編碼β-actin的轉(zhuǎn)錄本)具有短的poly(A)尾,長(zhǎng)度小于30 nt[15,16].總之,發(fā)現(xiàn)短poly(A)尾的轉(zhuǎn)錄本比之前預(yù)期的要多,那么,Poly(A)尾長(zhǎng)度與轉(zhuǎn)錄本穩(wěn)定性和翻譯的關(guān)系及其生物學(xué)意義是什么?
隨著針對(duì)poly(A)尾的新測(cè)序方法的出現(xiàn),poly(A)尾長(zhǎng)度的轉(zhuǎn)錄組動(dòng)態(tài)變化圖譜變得逐漸清晰.研究發(fā)現(xiàn)不僅有許多短poly(A)尾的物種存在,而且所研究物種(人、果蠅、小鼠和線蟲(chóng)等)的mRNA poly(A)尾長(zhǎng)度的中值都在50-100 nt的長(zhǎng)度范圍內(nèi)[17-19].唯一的例外是酵母,其poly(A)尾長(zhǎng)度的中值約為33 nt,但酵母poly(A)尾的初始長(zhǎng)度約為90 nt左右[20],這實(shí)際上與前面的物種相比并沒(méi)有什么不同.研究發(fā)現(xiàn)短poly(A)尾與表達(dá)水平和翻譯效率高的基因相關(guān),更長(zhǎng)的poly(A)尾與表達(dá)水平和翻譯效率低的轉(zhuǎn)錄本有關(guān),還發(fā)現(xiàn)poly(A)尾的長(zhǎng)度與轉(zhuǎn)錄本的半衰期呈負(fù)相關(guān).而且這些縮短的poly(A)尾看起來(lái)并沒(méi)有降解的趨勢(shì),因?yàn)樗鼈冊(cè)诜€(wěn)定狀態(tài)下以離散長(zhǎng)度積累,而不是以連續(xù)長(zhǎng)度方式積累[19],這個(gè)重大發(fā)現(xiàn)反駁了長(zhǎng)poly(A)尾更有利于保護(hù)mRNA和翻譯的觀點(diǎn).這與早期的報(bào)道一致,發(fā)現(xiàn)短poly(A)尾與正在生長(zhǎng)的盤(pán)基網(wǎng)柄菌(Dictyosteliumdiscoideum)細(xì)胞中的mRNA穩(wěn)定性相關(guān)[21].發(fā)現(xiàn)的另一個(gè)有趣的特征是poly(A)尾的長(zhǎng)度存在一個(gè)相位模式,其中預(yù)期與PABPC(cytoplasmic poly(A)-binding protein)串行結(jié)合的poly(A)尾會(huì)得到更大富集[19, 22].這些與PABPC串行結(jié)合的poly(A)尾的富集表明,不受保護(hù)的腺苷酸可能很快被移除.有趣的是,這種相位模式的分布只在mRNA的poly(A)尾上發(fā)現(xiàn),而在其他含有poly(A)尾但不能翻譯的RNA上沒(méi)有發(fā)現(xiàn),如lncRNAs(long noncoding RNAs),而且發(fā)現(xiàn)表達(dá)水平和翻譯效率高的轉(zhuǎn)錄本相位模式最為明顯,表明poly(A)尾縮短到離散長(zhǎng)度(稱(chēng)為修剪)是一個(gè)與翻譯活動(dòng)相關(guān)的過(guò)程[19].
而在卵母細(xì)胞成熟和早期胚胎發(fā)育期間,胞質(zhì)內(nèi)選擇性地多聚腺苷酸化延長(zhǎng)了特定mRNA的poly(A)尾,而且這個(gè)延長(zhǎng)的結(jié)果確實(shí)增加了翻譯,從而重新激活沉默的轉(zhuǎn)錄本[18, 23-25].胞質(zhì)內(nèi)多聚腺苷酸化也被發(fā)現(xiàn)可以激活一些神經(jīng)元轉(zhuǎn)錄本[26].最近研究也發(fā)現(xiàn)poly(A)尾長(zhǎng)度與GV(germinal vesicle)期卵母細(xì)胞內(nèi)的蛋白表達(dá)水平呈正相關(guān),表明較長(zhǎng)的poly(A)尾會(huì)促進(jìn)卵母細(xì)胞中的翻譯過(guò)程[27].另外,利用TED-Seq(tail-end displacement sequencing)技術(shù)對(duì)人類(lèi)細(xì)胞內(nèi)質(zhì)網(wǎng)應(yīng)激的研究結(jié)果顯示,內(nèi)質(zhì)網(wǎng)應(yīng)激導(dǎo)致某些mRNA poly(A)尾的長(zhǎng)度增加,包括內(nèi)質(zhì)網(wǎng)應(yīng)激調(diào)節(jié)因子X(jué)BP1(X-box binding protein 1)、DDIT3(DNA-damage inducible transcript 3)和HSPA5(heat shock protein 5).重要的是,poly(A)尾長(zhǎng)度增加的mRNA在翻譯上是去抑制和穩(wěn)定的[28].總之,TED-Seq揭示了poly(A)長(zhǎng)度是隨著內(nèi)質(zhì)網(wǎng)應(yīng)激變化而發(fā)生動(dòng)態(tài)變化的,這對(duì)翻譯和mRNA轉(zhuǎn)換都有潛在的影響.研究也發(fā)現(xiàn)3'UTR(3' untranslated region)長(zhǎng)度與poly(A)尾長(zhǎng)度相關(guān),相同基因的選擇性多聚腺苷酸化(alternative polyadenylation,APA)位點(diǎn)及選擇性啟動(dòng)子與不同的poly(A)尾長(zhǎng)度相關(guān)[29].這些研究結(jié)果提示,poly(A)尾的長(zhǎng)度變化在轉(zhuǎn)錄后調(diào)控中具有重要作用,而且在不同的生物學(xué)過(guò)程中的作用方式和結(jié)果也是多樣的、復(fù)雜的.
mRNA的poly(A)尾曾被認(rèn)為是純A的,且除了長(zhǎng)度變化外幾乎沒(méi)有什么其他信息內(nèi)容.但近幾年的研究表明,poly(A)尾的堿基組成也是可變的.對(duì)HeLa和NIH3T3細(xì)胞系進(jìn)行TAIL-Seq,發(fā)現(xiàn)poly(A)尾內(nèi)存在非A堿基的異質(zhì)性,G主要在大于40 nt的poly(A) 尾中發(fā)現(xiàn),而U通常發(fā)現(xiàn), 在小于25 nt的poly(A)尾上[17].而且在人、小鼠、青蛙和魚(yú)類(lèi)等物種中,發(fā)現(xiàn)它們都有一定比例的異質(zhì)性poly(A)尾存在[17-19, 34].通過(guò)PAIso-Seq(poly(A) inclusive RNA isoform sequencing)也揭示了在小鼠GV期卵母細(xì)胞中有超過(guò)17%的mRNA poly(A)尾中廣泛存在U、G和C堿基的摻入,除單個(gè)出現(xiàn)外,非A堿基也會(huì)呈2-4個(gè)連續(xù)出現(xiàn)的情況.與Chang等(2014)[17]的發(fā)現(xiàn)一致,U堿基更多出現(xiàn)在poly(A)尾較短的轉(zhuǎn)錄本中,G和C堿基較多出現(xiàn)在poly(A)尾較長(zhǎng)的轉(zhuǎn)錄本中[27].這些發(fā)現(xiàn)提示,poly(A)尾內(nèi)非A堿基的異質(zhì)性可能對(duì)mRNAs穩(wěn)定性和翻譯具有不同的功能及調(diào)控機(jī)制.
在mRNA加尾時(shí),TENT4A/B(terminal nucleotidyltransferase 4A/B)核苷酸轉(zhuǎn)移酶能間歇性地添加G.有趣的是,G主要位于poly(A)尾部末端,或者與末端相鄰的位置.通過(guò)對(duì)非A堿基功能的研究發(fā)現(xiàn),一個(gè)G就足以阻止脫腺苷酸化酶CCR4-NOT(carbon catabolite repression 4-negative on TATA-less)復(fù)合體對(duì)poly(A)尾部的修剪,因?yàn)樾藜舻?'端暴露G時(shí)會(huì)阻止該酶復(fù)合體的繼續(xù)修剪.TENT4A和TENT4B的缺失會(huì)導(dǎo)致細(xì)胞中mRNA半衰期和豐度降低[30].因此,TENT4A和TENT4B產(chǎn)生一個(gè)異質(zhì)性的poly(A)尾,保護(hù)相應(yīng)mRNA的poly(A)免受快速的脫腺苷酸化,揭示了一種全新的mRNA保護(hù)作用和機(jī)制,擴(kuò)大了轉(zhuǎn)錄后調(diào)控的復(fù)雜性.在擬南芥的poly(A)尾中也存在非A堿基,而且也是G的比例最高,10%的poly(A)尾內(nèi)含有至少一個(gè)G,其G含量分布范圍為0.8-28%.通過(guò)進(jìn)一步聯(lián)合CLIP-Seq、Ribo-Seq和mRNA穩(wěn)定性實(shí)驗(yàn)等進(jìn)行研究,發(fā)現(xiàn)在poly(A)尾中G含量的差別可導(dǎo)致AtPAB(Arabidopsis thaliana poly(A)-binding proteins)對(duì)不同mRNA結(jié)合的差異,且G可通過(guò)對(duì)AtPAB結(jié)合的抑制效應(yīng)下調(diào)mRNA翻譯效率,而與mRNA穩(wěn)定性無(wú)關(guān).當(dāng)特定AtPAB缺失時(shí),具有更強(qiáng)AtPAB結(jié)合的基因表現(xiàn)出更低的翻譯效率.該研究提供了一種新的機(jī)制,即基因的翻譯效率可以通過(guò)G含量依賴的PAB結(jié)合來(lái)調(diào)節(jié)[31].其他的研究發(fā)現(xiàn)與poly(A)尾結(jié)合的PABPC抑制尿苷酸化,而miRNA靶向誘導(dǎo)尿苷化的發(fā)生[32-34].在poly(A)尾上雖然也發(fā)現(xiàn)了C的加入,但其生物學(xué)功能尚未明確[17,30].
Poly(A)尾促進(jìn)了mRNA和許多蛋白質(zhì)之間的相互作用,多種蛋白的相互作用是通過(guò)與高親和力的poly(A)尾結(jié)合的PABPs發(fā)生的[35].由于PABPC在基因表達(dá)中所起的作用似乎是相互矛盾的,因此其確切作用至今仍不清楚.一方面,它可以通過(guò)直接與脫腺苷酸化酶復(fù)合物PAN2-PAN3(poly(A) specific ribonuclease subunit2、3)和CCR4-NOT結(jié)合來(lái)促進(jìn)脫腺苷酸化[36, 37].但它也是公認(rèn)的一種直接與poly(A)尾結(jié)合并保護(hù)其不降解的蛋白質(zhì)[38].另外,PABPC通過(guò)與5' 帽子結(jié)合因子和eRF3相互作用,被認(rèn)為可以促進(jìn)翻譯.作為一種可以招募脫腺苷酸化酶的蛋白質(zhì),它也參與了基因轉(zhuǎn)錄本的降解和下調(diào),PABPC的這種雙重效應(yīng)的作用機(jī)制需要在不同的生理過(guò)程中進(jìn)一步的研究.
一個(gè)重大的突破是確定了在PABPC存在下CCR4(CCR4-NOT transcription complex subunit 6)和CAF1(CCR4-NOT transcription complex subunit 7)酶的脫腺苷酸化酶活性,這兩種酶是CCR4-NOT復(fù)合物的組成部分.研究酵母菌和人的脫腺苷酸化酶的兩個(gè)不同小組同時(shí)發(fā)現(xiàn),結(jié)合在poly(A)尾上的PABPC(酵母中為Pab1)不阻礙CCR4的活性,因?yàn)镃CR4可以把PABPC從poly(A)尾上釋放后繼續(xù)進(jìn)行脫腺苷酸化,而CAF1(CCR4-NOT transcription complex, subunit 7)只能去除PABPC保護(hù)范圍外的腺苷酸[22,37].PAN2/3只是選擇性修剪大于150 nt的poly(A)尾,對(duì)轉(zhuǎn)錄組的影響很??;而PARN(poly(A) specific ribonuclease)不影響poly(A)尾的脫腺苷酸化[22].但PABPC仍在招募中起著中心作用,因?yàn)镻ab1的消耗導(dǎo)致CCR4-NOT復(fù)合體的脫腺苷酸化速率大大降低[37].這些不同的功能角色暗示了poly(A)尾部的PABPC可能導(dǎo)致尾部長(zhǎng)度的動(dòng)態(tài)變化.
研究發(fā)現(xiàn)CCR4和CAF1脫腺苷酸化也受密碼子優(yōu)化的影響,而密碼子優(yōu)化是與翻譯狀態(tài)緊密相關(guān)的.使用報(bào)告基因系統(tǒng),密碼子優(yōu)化程度較低的轉(zhuǎn)錄本比優(yōu)化較高的轉(zhuǎn)錄本脫腺苷酸化速度更快.此外,抑制CAF1的表達(dá),優(yōu)先影響密碼子優(yōu)化程度較低的報(bào)告基因的脫腺苷酸化速率,可能表明其poly(A)尾部的PABPC結(jié)合可能更少,這表明相對(duì)于高水平翻譯的轉(zhuǎn)錄本,CAF1在低水平翻譯時(shí)顯得更活躍[37, 39].這些研究再次將翻譯和poly(A)尾長(zhǎng)度緊密聯(lián)系在一起,而PABPC是調(diào)節(jié)這種關(guān)系的主要參與者.關(guān)于一些翻譯效率高的轉(zhuǎn)錄本是如何比其他轉(zhuǎn)錄本在其尾部結(jié)合更多的PABPC,目前還不清楚.對(duì)PABPC作用機(jī)制的研究表明,它的四個(gè)RNA結(jié)合域的作用不完全相同,并提示PABPC在poly(A)尾上的排列可能會(huì)為了響應(yīng)脫腺苷酸化而改變[37].目前尚不清楚PABPC在poly(A)尾上排列的變化是否影響翻譯或降解,進(jìn)一步研究PABPC在基因表達(dá)中的多重作用將為這一領(lǐng)域提供答案.
考慮到基因表達(dá)在生物學(xué)各個(gè)領(lǐng)域的重要性,poly(A)尾在基因的轉(zhuǎn)錄后調(diào)控中也不是一個(gè)被動(dòng)的旁觀者,從mRNAs最初的生物發(fā)生到細(xì)胞質(zhì)中的動(dòng)態(tài)控制,直至最終的降解,poly(A)尾的長(zhǎng)度在mRNA穩(wěn)定性和翻譯等過(guò)程中扮演著重要的角色.隨著新技術(shù)的建立和快速的發(fā)展,可以更準(zhǔn)確地對(duì)poly(A)尾的長(zhǎng)度和異質(zhì)性進(jìn)行讀取,對(duì)poly(A)尾的功能和作用機(jī)制的探索已經(jīng)逐漸成為基因轉(zhuǎn)錄后調(diào)控研究的一個(gè)熱點(diǎn)領(lǐng)域,將來(lái)會(huì)逐漸揭示在絕大多數(shù)真核生物mRNA上的這個(gè)附加成分poly(A)尾是如何被動(dòng)態(tài)調(diào)控,進(jìn)而對(duì)基因表達(dá)產(chǎn)生影響的.Poly(A)尾長(zhǎng)度及異質(zhì)性的變化在許多生理和病理過(guò)程中的作用也將會(huì)逐漸被闡明.