邱 穎 王紅艷
(中國科學院上海生物化學與細胞生物學研究所,上海200031)
DNA甲基化是發(fā)生在DNA上的共價修飾,作為一種重要的表觀遺傳修飾,在基因表達調(diào)控方面起重要作用[1]。DNA的甲基化修飾廣泛存在于古細菌、細菌和真核生物等物種中,而在酵母等生物中缺失。在哺乳動物中,DNA甲基化主要發(fā)生在胞嘧啶-鳥嘌呤二核苷酸(CpG) 位點上。此外,少量非CpG位點的甲基化修飾也存在于胚胎干細胞(Embryonic stem cells,ESCs)中。據(jù)統(tǒng)計,在人類基因組中,有70%~80%的CpG位點發(fā)生了甲基化修飾。未甲基化的CpG二核苷酸主要富集于基因啟動子區(qū)域,通常成簇存在,被稱為CpG島(CpG islands,CGIs)。
在哺乳動物中負責DNA甲基化建立與維持的是DNA甲基轉(zhuǎn)移酶(DNA methyltransferases,DNMTs)。哺乳動物 DNMT3 家族的成員,包括DNMT3A、DNMT3B和DNMT3L。其中,DNMT3A/3B 具有高度同源性,在體內(nèi)和體外均能催化DNA的甲基化[2];而DNMT3L 不僅同源性相對較低,而且由于催化區(qū)域內(nèi)重要結(jié)構(gòu)域的缺失,不具備轉(zhuǎn)移甲基基團的活性,但它能夠直接結(jié)合 DNMT3A/3B 并提高兩者的酶活,對配子早期發(fā)育過程中的甲基化模式的建立有著重要作用[3]。它們與DNA結(jié)合,以S-腺苷甲硫氨酸為甲基供體,催化生成5位胞嘧啶的甲基化(5-methylcytosine,5mC),在哺乳動物中,DNA甲基化修飾的生物學功能體現(xiàn)在如下幾個方面:抑制基因組中轉(zhuǎn)座子的活性[4];穩(wěn)定X染色體的失活;維持親代基因印記以及調(diào)控基因的表達[5]。 這一方面有利于保持整個基因組的穩(wěn)定性,另一方面建立細胞記憶從而將細胞命運傳遞給子代細胞[6]。
盡管5-甲基胞嘧啶(5mC)是一種穩(wěn)定的共價修飾,但它在生物體內(nèi)仍處于一個動態(tài)變化過程,它可以通過兩種方式去甲基化:主動去甲基化和 DNA復制依賴的被動去甲基化。典型的DNA復制依賴的被動去甲基化發(fā)生在受精卵雌原核基因組的去甲基化過程中。隨著DNA復制,DNA雙鏈數(shù)目劇增,原有的DNA甲基化修飾被逐漸稀釋,呈現(xiàn)為被動的去甲基化過程。此外,由酶類催化5mC脫甲基的過程稱為主動去甲基化;目前研究比較清楚的是TET去甲基化酶家族介導的DNA主動去甲基化過程。
2009年,人們在胚胎干細胞基因組中發(fā)現(xiàn)了一種新的堿基,即5-羥甲基胞嘧啶(5hmC),并且發(fā)現(xiàn)在小鼠的腦部組織,尤其是Purkinje神經(jīng)元內(nèi)也存在胞嘧啶的羥甲基化修飾[7]。 5hmC在細胞類型間有差異,例如,5hmC在免疫細胞中占5mC總量的1%,在胚胎干細胞中占5mC總數(shù)的5%~10%,在神經(jīng)細胞中占總數(shù)5mC的40%[8]。然而,5-醛基胞嘧啶(5fC)和5-羧基胞嘧啶(5caC)的含量要少得多,僅占胚胎干細胞中5mC總量的0.03%和0.01%[9]。而后Anjana Rao 實驗室發(fā)現(xiàn)人源雙加氧酶TET1在 Fe2+和α-酮戊二酸存在的情況下可以將5mC氧化形成5hmC[10]。 TET蛋白功能的揭示為DNA主動去甲基化提供了一條途徑:TET可以將5mC迭代氧化成5hmC、5fC和5caC,再通過DNA糖苷酶TDG介導的堿基切除修復(Base excision repairing,BER)途徑將5mC重新變?yōu)槲葱揎椀陌奏11]。
TET家族蛋白共有3個成員,分別為TET1、TET2 和 TET3。 這是一類依賴于 Fe2+和α-酮戊二酸的雙加氧酶,其C端催化中心由雙鏈β折疊結(jié)構(gòu)域(Double-stranded β-folded domain,DSBH) 和半胱氨酸富集區(qū)(Cysteine-rich region,Cys-rich)組成。DSBH 結(jié)構(gòu)域可以結(jié)合Fe2+和α-酮戊二酸,對5mC底物進行氧化,而Cys-rich結(jié)構(gòu)域可以幫助穩(wěn)定DSBH與 5mC的相互作用。全長的TET1和TET3的N端有一個CXXC結(jié)構(gòu)域,CXXC 結(jié)構(gòu)域存在于許多與染色質(zhì)相關(guān)的蛋白中,在區(qū)分甲基化和未甲基化DNA 的過程中起到重要作用。TET2此部分結(jié)構(gòu)丟失,推測在進化過程中5′端形成一個獨立的基因-IDAX,也被稱為CXXC4,可以介導TET2與DNA的相互作用[10]。如圖1所示。
TET家族蛋白的3個成員都具有氧化5mC的活性,但其在細胞和各組織中的表達譜有很大差別,表明這3個蛋白在小鼠的發(fā)育中可能既有重疊、又有時空特異的生物學功能[12]。利用經(jīng)典打靶技術(shù)得到 TET1 敲除(Kill out,KO)小鼠可以存活且可育,沒有明顯的形態(tài)缺陷和生長異常。但這種成年小鼠海馬神經(jīng)前體細胞增殖能力降低,成體神經(jīng)發(fā)生過程受損,導致空間學習和短期記憶能力下降[13]。同時,TET1 KO使得參與神經(jīng)前體細胞增殖及成體神經(jīng)發(fā)生相關(guān)的基因的啟動子區(qū)域發(fā)生異常高甲基化,從而使其表達水平降低。然而,利用基因捕獲技術(shù)得到的TET1突變小鼠的表型與經(jīng)典的TET1 KO小鼠表型還是有些差異,其中雌性TET1突變體表現(xiàn)為減數(shù)分裂過程中染色體聯(lián)會存在缺陷,導致生殖細胞大量減少,生育力減弱,而雄性TET1突變體的表型與TET1 KO小鼠的類似[14,15]。
3.1CD4+T輔助細胞亞群(Th細胞) 靜息期(Na?ve)CD4+T細胞受到TCR信號和共刺激信號激活后,產(chǎn)生不同的效應(yīng)T細胞,其輔助和調(diào)節(jié)功能取決于譜系特異性轉(zhuǎn)錄因子的表達和細胞因子的產(chǎn)生。比如Th1 (IFN-γ和T-bet),Th2 (IL-4和GATA3),Th17 (IL-17和RORγt),濾泡輔助T 細胞(Tfh) (IL-21和Bcl-6),還有調(diào)節(jié)性T 細胞(Treg) (IL-10和Foxp3)[16]。 在Na?ve CD4+T細胞中,這些轉(zhuǎn)錄因子和細胞因子的基因不活躍或低水平表達。分化后,染色質(zhì)的抑制單價結(jié)構(gòu)被抹去或獲得活性單價結(jié)構(gòu),從而起始轉(zhuǎn)錄[17]。 全基因組圖譜揭示了在Th細胞中表觀遺傳修飾的特征,包括DNA甲基化、組蛋白修飾、DNase 1 超敏位點(DNase 1 Hypersensitive sites,DHS)和非編碼RNA(non-coding RNAs,ncRNAs)的表達,通過表觀遺傳機制和多個轉(zhuǎn)錄因子(TFs)的組合作用,來驅(qū)動譜系特異性的基因表達程序,從而實現(xiàn)CD4+T細胞的譜系分化[18]。
圖1 哺乳動物TET家族蛋白TET1、TET2、TET3結(jié)構(gòu)示意圖Fig.1 Schematic representation of domain structure of three mammalian ten-eleven translocation(TET)proteins TET1,TET2 and TET3
3.2DNA去甲基化對不同Th細胞分化的影響
3.2.1Th1和Th17細胞 DNA免疫沉淀結(jié)合高通量測序(DNA immunoprecipitation coupled with high-throughput sequencing,DIP-seq)分析CD4+T細胞全基因組5hmC的分布,發(fā)現(xiàn)5mC和5hmC在Th細胞亞群中的表達與其特異性基因的表達密切相關(guān)[19]。 Na?ve CD4 T細胞中,5mC占據(jù)細胞因子基因位點的轉(zhuǎn)錄調(diào)控區(qū)(特別是在增強子區(qū)),這些區(qū)域經(jīng)常與保守的非編碼序列(Conserved non-coding sequence,CNS)重疊。這些細胞因子基因在Na?ve CD4 T細胞中被沉默。5hmC與Ifng、Il4和Il17基因表達密切相關(guān),特別是在某些CNS和某些啟動子區(qū)域。在Na?ve CD4 T細胞分化為效應(yīng)T輔助細胞時,這些調(diào)控區(qū)的5mC被TET蛋白以譜系特異性的方式氧化為5hmC。 Ifng上CNS(6)是增強子,在Th1細胞中高度羥甲基化,而在其他Th細胞高度甲基化。TET2招募到Th1細胞Ifng位點CNS(6)依賴于關(guān)鍵轉(zhuǎn)錄因子T-bet。在Tbx 21缺失的Th1細胞中,被招募到Ifng上的5hmC和TET2量減少,由于TET2缺少CXXC區(qū)域,要在T-bet的幫助下才能結(jié)合到Ifng基因上[20]。TET2缺失的Th1細胞中,招募到Ifng上的T-bet減少,說明 TET2和T-bet可能協(xié)同調(diào)節(jié)Ifng表達。TET2對Ifng位點CNS(6)上的5 hmC修飾,對于該位點結(jié)合T-bet和p300、組蛋白修飾的改變、Ifng的轉(zhuǎn)錄都具有重要意義[19]。
Th17細胞特異性產(chǎn)生IL17A和IL17F細胞因子。編碼Il17和Il17f的基因位于同一染色體上,中間相隔43.9 kb,向相反方向轉(zhuǎn)錄。順式作用的調(diào)節(jié)元件保守性很高,并在T細胞分化調(diào)節(jié)中起到重要作用[21]。 通過序列對比發(fā)現(xiàn):Il17-Il17f基因座中有8個CNS;而且Th17細胞的H3組蛋白呈高度乙?;?,是基因活化的標志[22]。CNS2 與Il17和Il17f基因啟動子相互作用,調(diào)節(jié)其在Th17細胞中的選擇性轉(zhuǎn)錄。CNS2缺陷的T細胞中IL17F細胞因子表達受損,可能是基因位點染色質(zhì)重構(gòu)缺陷有關(guān),與CNS2介導的組蛋白乙?;竝300和JmjC結(jié)構(gòu)域蛋白3(JMJD 3)的合成有關(guān)[23]。 CNS2在Th17細胞中高度羥甲基化,而在其他Th細胞中高度甲基化。TET2缺陷導致Th17細胞中Il17的CNS2和啟動子區(qū)5hmC含量和RORγT結(jié)合的減少。除了Il17,對TET2+/+和TET2-/-Th17細胞進行微陣列分析,在197個Th17細胞特異表達基因中,還有5個基因(Ccl20、Il10、Gpr83、Emp1、Rbl2)受到TET2調(diào)控。
3.2.2Th2 細胞 Il4基因在T輔助細胞分化過程中經(jīng)歷甲基化和去甲基化的步驟。Il4基因的5′端在Na?ve T細胞中高度甲基化,在Th2細胞中特異性去甲基化。Il4基因的5′端甲基化對于染色質(zhì)重塑或轉(zhuǎn)錄不是必需的,但能促進分化的Th2細胞更高效、高水平地誘導Il4轉(zhuǎn)錄本的產(chǎn)生[24]。Il4基因的3′端在Na?ve T細胞中低甲基化,在向Th1分化過程中被甲基化。
3.2.3Treg 細胞 調(diào)節(jié)性T細胞(Treg)是CD4+T細胞的一個獨特的譜系,可以阻止自身免疫和維持免疫穩(wěn)態(tài)[25,26]。 X染色體編碼的轉(zhuǎn)錄因子Foxp3對調(diào)節(jié)性T細胞的發(fā)育和功能是必不可少的。在胸腺前體階段, 表達Foxp3的Treg細胞稱為胸腺源性Treg細胞(nTreg),而在體內(nèi)發(fā)育出胸腺外的Treg細胞稱為外周來源Treg細胞(iTreg)?;蛘?,在體外經(jīng)轉(zhuǎn)化生長因子β(TGF-β)聯(lián)合T細胞受體刺激Na?ve T細胞,產(chǎn)生Foxp3,也稱為誘導性Treg(iTreg)[27]。在Treg細胞分化過程中,F(xiàn)oxp3的表達受Foxp3基因外顯子上游第一個內(nèi)含子中三個CNS調(diào)控[28,29]。CNS2 缺失小鼠的Treg細胞在過繼轉(zhuǎn)移后,F(xiàn)oxp3表達不穩(wěn)定,小鼠顯示增加自身免疫性疾病的發(fā)生[28,29]。 在Treg細胞中,F(xiàn)oxp3 CNS2元件的CpG位點主要是非甲基化的(C/5fC/5caC),而在Na?ve T細胞和iTreg中則是完全甲基化(5mC/5hmC)。 TET2和TET3功能冗余地在Treg細胞中維持多個調(diào)控區(qū)的去甲基狀態(tài),包括Foxp3基因中的CNS1和CNS2。與CNS2缺陷小鼠的T細胞相似,TET2/TET3雙缺陷小鼠的Treg細胞中,F(xiàn)oxp3的穩(wěn)定性明顯受損[30]。H2S是Treg細胞分化和功能所必需的,H2S缺乏導致小鼠全身自身免疫性疾病。H2S通過巰基化核轉(zhuǎn)錄因子Y亞基β (NFYB)維持甲基胞嘧啶雙加氧酶TET1和TET2的表達, TGF-β激活的SMAD3和白細胞介素2 (IL-2)激活的STAT5促進其與Foxp3結(jié)合,從而促進Treg細胞分化[31]。 TET1/2 DKO Treg細胞中5mC 和5hmC占總胞嘧啶的百分比增加,表明TET1/2活性有助于Treg細胞功能。事實上,在沒有TET2和TET3的情況下,TET3 mRNA的表達水平略高一些,提示這三種TET蛋白都有助于CNS2去甲基化和Foxp3的穩(wěn)定表達[30,31]。
3.2.4iNKT細胞 傳統(tǒng)的T細胞是由MHCⅠ和MHCⅡ類分子呈遞的多肽抗原經(jīng)陽性和陰性選擇產(chǎn)生的。iNKT細胞是通過識別非經(jīng)典的MHCⅠ類蛋白CD1d遞呈的脂類抗原,在胸腺中經(jīng)陽性選擇產(chǎn)生的[32],而iNKT細胞的分化是由強TCR信號通過激動劑誘導形成的[33]。 根據(jù)其識別抗原的不同以及TCR限制性的不同, NKT細胞被分為不同的亞群,其中經(jīng)典的 NKT 細胞是Ⅰ型NKT細胞,可以識別 CD1d遞呈的糖脂抗原α-GalCer,TCR重排具有高度的限制性,在小鼠中只表達Vα14-Jα18的TCR產(chǎn)物,由于其TCR的高度限制性,它也被稱為iNKT細胞[34,35]。以特異性轉(zhuǎn)錄因子和細胞因子分類,iNKT可以分為以下幾類:表達T-bet,并分泌干擾素-γ的iNKT細胞為NKT1細胞;表達GATA-3,并主要分泌IL-4的細胞為NKT2細胞;表達RORγt,并產(chǎn)生IL-17的細胞為NKT17細胞[36]。 T細胞中Tet2和Tet3的缺失導致了小鼠早期發(fā)生致命的淋巴增殖性疾病;其原因包括抗原刺激的T細胞不受控制的增殖,這類增殖的細胞主要是iNKT細胞,并且向iNKT17亞群偏移。在幼齡(3~4周齡)小鼠中,與野生型iNKT細胞相比,Tet2-Tet3 DKO的iNKT細胞表現(xiàn)出較高的Il17f、Rorc (編碼Rorγt)和Eomes的表達,而Ifng、IL4、Tbx21(編碼T-bet)和Zbtb7b(編碼ThPOK)的表達較低。甲基化測序檢測到編碼T-bet和ThPOK的基因5hmC含量下降,甲基化程度高于野生型對照細胞。T-bet和ThPOK均抑制RORγt表達,T-bet缺陷使iNKT細胞向NKT2和NKT17細胞方向發(fā)展[36],而ThPOK表達降低與NKT17分化增強有關(guān)[37]。Tet2-Tet3 DKO iNKT細胞向iNKT17方向偏移,原因可能是關(guān)鍵轉(zhuǎn)錄因子RORγt編碼基因Rorc的啟動子和基因體(gene body)上染色質(zhì)呈開放狀態(tài),更利于Rorc基因的轉(zhuǎn)錄和翻譯[38]。TET蛋白參與CD4+T細胞基因調(diào)控如表1所示。
近年來DNA氧化去甲基化分子機制、生化原理以及生物學意義方面取得了很大的進展,TET去甲基化酶在T細胞分化過程中的功能研究也取得了一定成果。然而還有更多的問題亟待解決:①TET蛋白是否以及如何調(diào)控CD8+T細胞的功能,例如CD8+T細胞在向效應(yīng)性T細胞和記憶性細胞轉(zhuǎn)變過程中是否發(fā)揮關(guān)鍵作用;②CD4+T或CD8+T細胞中各譜系細胞中,TET家族成員的表達是如何被調(diào)控的;③α-酮戊二酸是TET去甲基化酶的底物之一,也是三羧酸循環(huán)的重要中間產(chǎn)物,CD4+或CD8+T細胞活化增殖或大量產(chǎn)生效應(yīng)細胞因子時,代謝通路的改變與TET酶活改變是否有聯(lián)系。
表1 TET蛋白在CD4+T細胞中發(fā)揮的功能
Tab.1 Summary of function of TET proteins in CD4+T cells
CD4+ T helpercells subsetInvolved TETproteinInfluencedgenesTh1TET2Ifng,Il2Th2UnknownunknownTh17TET2Il10,Il17,Il17f,RorcTregTET1,TET2,TET3FoxpiNKTTET2,TET3Il17,Il17f,Rorc