王 粟 柴小翠, 張 晶 楊文濤, 袁冬霞 熊 杰
(1. 大連海洋大學, 大連 116023; 2. 中國科學院水生生物研究所, 武漢 430072; 3. 中國科學院大學, 北京 100049)
DNA甲基化(DNA methylation)是一類表觀遺傳修飾, 發(fā)生的常見位點為腺嘌呤外環(huán)氨基(N6)、胞嘧啶環(huán)5-碳(C5)和胞嘧啶外環(huán)氨基(N4)。DNA甲基化作用主要是DNA甲基轉(zhuǎn)移酶以S-腺苷甲硫氨酸(SAM)為甲基供體, 將甲基共價結(jié)合到堿基特定位點上的過程[1], 而根據(jù)共價結(jié)合位點的不同被區(qū)分為N6-甲基腺嘌呤(6mA)、C5-甲基胞嘧啶(5mC)和N4-甲基胞嘧啶(4mC)[2—4]?;诙鷾y序技術(shù)建立的重亞硫酸鹽測序技術(shù)極大促進了DNA甲基化的研究, 但僅局限于檢測分析5mC[5]。近年來, 隨著三代測序技術(shù)的發(fā)展, 另一種DNA甲基化修飾6mA的研究也取得了一系列重要的進展[6]。
對6mA的認識最早來源于原核生物的限制修飾(R-M)系統(tǒng)[7]。原核生物依靠自身基因組上的6mA修飾, 使自身基因組DNA具有抗限制性內(nèi)切酶消化的能力, 同時消化未被6mA修飾的外源DNA,從而保護宿主基因組[8]。在真核生物中, 6mA廣泛分布。對于真核生物6mA的認識近年來取得了一系列發(fā)現(xiàn)。研究認為, 6mA在轉(zhuǎn)錄調(diào)控、控制轉(zhuǎn)座子表達、控制核小體定位和作為表觀遺傳標記方面均有作用。例如, 在秀麗隱桿線蟲(Caenorhabditis elegans)中, H3K4me2去甲基化酶的缺失會導(dǎo)致H3K4me2累積從而喪失受精能力[9], 而6mA DNA去甲基化酶缺失會加速H3K4me2的積累, 加強線蟲的生育缺陷, 而潛在的6mA DNA甲基轉(zhuǎn)移酶缺失會降低線蟲的6mA水平, 并抑制線蟲的生育缺陷[10]。在萊茵衣藻(Chlamydomonas reinhardtii)中發(fā)現(xiàn)6mA在轉(zhuǎn)錄起始位點附近富集于核小體連接DNA上[11]。在黑腹果蠅(Drosophila melanogaster)中6mA被證明在胚胎時期是高度動態(tài)的, 并且可以被特異性轉(zhuǎn)錄因子識別, 并通過調(diào)節(jié)叉頭框(forkhead box FOX)基因來影響胚胎發(fā)育的作用[12]。在陰道毛滴蟲(Trichomonas vaginalis)中作為全基因組主要甲基化修飾標記, 富集于某些轉(zhuǎn)座子元件超家族, 并在基因上起沉默作用[13]。
然而6mA相關(guān)的研究主要針對單個真核模式生物, 考察其分布特征、動態(tài)變化及相關(guān)甲基化酶的功能。通過對分屬于不同進化類群的物種進行6mA研究, 已揭示一些遠緣物種中6mA的分布特征和功能異同。盡管如此, 已研究的物種分化時間久遠, 進化關(guān)系遠, 難以在進化尺度上精細比較物種間的6mA分布和功能變化, 提示6mA這種分布和功能的變化發(fā)生在更小的進化尺度上。因此, 開展近緣物種間6mA的比較對理解其在進化上的動態(tài)變化具有重要意義。到目前為止, 僅Mondo等[14]在16種真菌的6mA單堿基分辨率比較研究中, 發(fā)現(xiàn)了早期分化真菌中高達2.8%的腺嘌呤被甲基化, 并且顯著富集于轉(zhuǎn)錄起始位點附近且與5mC分布呈負相關(guān)。在其他類群近緣種中比較6mA甲基化組學研究尚未開展。
本研究利用PacBio單分子實時測序技術(shù), 繪制了2種四膜蟲Tetrahymena malaccensis和Tetrahymena pyriformis的全基因組單堿基分辨率6mA圖譜, 結(jié)合Wang等[15]發(fā)表的Tetrahymena thermophila全基因組單堿基分辨率6mA數(shù)據(jù), 在此基礎(chǔ)上開展了四膜蟲比較甲基化組分析, 揭示了6mA在四膜蟲基因組中的分布特征、進化保守性和差異,幫助理解四膜蟲中6mA修飾在進化上的變化及其功能。
T. thermophila、T. malaccensis和T. pyriformis的基因組之前已經(jīng)被測序, 可以在Tetrahymenacomparative genome database(http://ciliate.ihb.ac.cn/tcgd/)上獲得。三偽尖毛蟲(Oxytricha trifallax)的基因組數(shù)據(jù)來自O(shè)xyDB(https://oxy.ciliate.org/)。實驗中用到的T. malaccensis和T. pryformis細胞株系與之前的研究相同[16]。
在無菌條件下, 將實驗細胞株接種至新鮮Super Proteose Peptone(SPP)培養(yǎng)基[17]中, 置于溫度為28℃, 轉(zhuǎn)速為135 r/min的搖床內(nèi)培養(yǎng)。待細胞生長至對數(shù)期, 細胞密度約為(3.2—3.8)×108cells/mL(采用Beckman Coulter Counter Z1進行細胞計數(shù))用于分離大核。
將準備好的實驗材料用差速離心法分離四膜蟲的大核: 試劑配方參考差速離心法[18]。離心收集(3.2—3.8)×108cells/L的對數(shù)期細胞, 在冰上用200 μL MediumA懸浮細胞, 倒入攪拌器(攪拌器采用8011s/1 L Waring勻漿儀), 加入2 mL PMSF(0.1 mol/L)和1 mL正辛醇, 18000 r/min破碎10s, 加入9 mL EDTA(0.5 mol/L), 22000 r/min破碎30s, 在冰上冷卻1min, 再22000 r/min破碎20s。鏡檢確定細胞大小核分開后, 使用平轉(zhuǎn)離心機(Allegra 25R Centrifuge Beckman離心機)600×g, 4℃, 10min, 樣品沉淀為大核。若大核樣品仍有較多小核污染, 則加入50 μL正辛醇, 充分顛倒混勻后1500×g, 4℃, 2min, 去上清。鏡檢確定樣品合格, 然后將大核樣品1500×g離心, 4℃, 3min, 棄上清, 再加入1 mL Nuclear Wash Buffer吹打混勻, 再次1500×g離心, 4℃, 3min, 棄上清, 重復(fù)2次, 最后一次將大核沉淀搖勻后, 使用QIAGEN?Genomic試劑盒進行DNA提取。
根據(jù)建庫的片段大小用g-TUBEs(Covaris,USA)對基因組DNA進行目的打斷; 利用AMPure PB磁珠富集、純化目的片段DNA并利用0.7%瓊脂糖凝膠電泳對片段化DNA進行質(zhì)檢; 使用SMRT-bellTMExpress Template Prep Kit 2.0試劑盒對合格DNA樣本進行文庫構(gòu)建。采用外切酶去除DNA單鏈末端, 隨后對片段化的DNA進行損傷修復(fù)、末端修復(fù)并添加Poly-A尾, 進而進行莖環(huán)狀測序接頭連接。使用SMRTbell Enzyme Cleanup Kit, 對SMRT-bell文庫進行核酸酶消化處理并純化回收后, 再利用切膠儀BluePippin(Sage Science, USA)篩選目的片段, 純化后得到文庫。使用Agilent 2100 Bioanalyzer(Agilent technologies, USA)檢測文庫片段大小。
建庫完成后利用Sequel Ⅱ Binding Kit 2.0上機試劑盒對DNA文庫、測序引物Sequel Sequencing Primer v2及聚合酶進行一定比例混合, 并將文庫轉(zhuǎn)移到Sequel Ⅱ系列測序儀納米孔內(nèi), 進行實時單分子測序。
本文用到的T. thermophila三代測序數(shù)據(jù)從網(wǎng)上直接下載, 來自于Wang等[15]2017年公開發(fā)表的三代測序數(shù)據(jù),O. trifallax的6mA位點注釋數(shù)據(jù)來自于Beh等[19]2019年公開發(fā)表的數(shù)據(jù)。而T. malaccensis和T. pryformis為本研究新測三代數(shù)據(jù)。這3種四膜蟲的基因組數(shù)據(jù)均來自于Tetrahymenacomparative genome database(http://ciliate.ihb.ac.cn/tcgd/)。O. trifallax的基因組數(shù)據(jù)來自O(shè)xyDB(https://oxy.ciliate.org/)。使用SMRTLINK v6 對PacBio三代數(shù)據(jù)進行6mA位點的鑒定, 并對每個位點的甲基化水平進行計算。同時, 利用SMRTLINK v6對6mA位點區(qū)域的保守基序(motif)進行分析。并通過Gbrowse對6mA位點注釋到基因組的結(jié)果進行可視化。通過自寫的Perl腳本對單堿基分辨率甲基化組上的所有6mA位點上下游序列的其他6mA位點進行分析, 統(tǒng)計出6mA的周期性分布規(guī)律。
同時, 利用自寫的Perl腳本對AT基序中A和T(反義鏈的A)的甲基化水平進行比較。為了研究6mA位點在小核染色體水平上是否有分布差異, 參考我們之前的研究, 將嗜熱四膜蟲每條小核染色體平均分為長度相等的25個片段[20], 用自寫的Perl腳本統(tǒng)計每個片段上的6mA甲基化水平, 計算出6mA位點在小核染色體上的6mA甲基化水平差異。3種四膜蟲種間直系同源基因和種內(nèi)并系同源基因基于OrthoMCL軟件進行鑒定[20]。使用MUSCLE v3.8.31對直系同源基因和并系同源基因進行序列比對。根據(jù)單堿基分辨率6mA甲基化圖譜, 對上述兩類基因的甲基化數(shù)目進行統(tǒng)計, 并用R進行散點圖繪制, 線性回歸分析及相關(guān)性分析。對O. trifallax大核基因組的比較分析采用相同的分析方法。
基于PacBio三代測序數(shù)據(jù), 繪制了3種四膜蟲全基因組單堿基分辨率6mA圖譜(表 1)。T. thermophila原始數(shù)據(jù)約為8.8G, 測序深度85X;T. malaccensis原始數(shù)據(jù)約為11.2G, 測序深度105X;T. pyriformis原始數(shù)據(jù)14.8G, 測序深度127X。T. malaccensis中含有約61 萬個6mA位點, 占大核基因組位點數(shù)的0.56%;T. pyriformis中含有約64萬個6mA位點, 占大核基因組位點數(shù)的0.56%。T. thermophila大核基因組103M, 有約46萬個6mA 位點, 占大核基因組位點數(shù)的0.44%, 相對比T. malaccensis和T. pyriformis中6mA少, 可能是由于測序深度相對較低導(dǎo)致一些低豐度的6mA位點沒有被鑒定出來。整體上看, 6mA位點在全基因組中所占比例在3種四膜蟲中類似。
表1 三種四膜蟲大核全基因組6mA圖譜Tab. 1 The genome wide 6mA map of the macronuclei in three Tetrahymena species
以鑒定到的每一個單堿基6mA位點為原點, 在上、下游各1000 bp長度范圍內(nèi)統(tǒng)計6mA位點的出現(xiàn)頻次, 發(fā)現(xiàn)6mA在四膜蟲大核基因組上分布具有200 bp周期性(圖 1A)。這種200 bp的周期性分布在3種不同的四膜蟲中類似。而核小體的單元長度加上linker DNA的長度約為200 bp。這種周期性可以從6mA對組蛋白的排斥作用來理解, 核小體的內(nèi)部并不能支持穩(wěn)定的6mA存在[21]。
對鑒定到的6mA位點進行基序特征分析, 發(fā)現(xiàn)3種四膜蟲的6mA位點顯著富集于AT基序(圖 1B),AT基序占到了整個基因組中6mA總數(shù)的86.42%—97.58%, 說明AT序列甲基化是四膜蟲中的保守進化特征。對AT序列A和T(反義鏈A)的甲基化水平進行比較發(fā)現(xiàn), A和T的甲基化水平的比值的分布峰為1(圖 1C), 說明在大部分位點中, 同一個AT序列中A和T(反義鏈A)的甲基化水平相當。這一結(jié)果提示DNA在半保留復(fù)制時或者復(fù)制后, AT基序中反義鏈6mA的建立可能是以正義鏈6mA位點為“模板”, 最終形成對稱的甲基化ApT二核苷酸。
圖1 三種四膜蟲中6mA的保守分布特征Fig. 1 Conserved 6mA distribution patterns in three Tetrahymena species
為了考察6mA的分布與基因保守性之間的關(guān)系, 對3種四膜蟲中都存在的基因(保守基因)和僅在1種四膜蟲中存在的基因(種特異基因)中6mA位點的數(shù)目進行了分析和比較, 發(fā)現(xiàn)保守基因中6mA位點數(shù)目顯著高于種特異基因(圖 2A), 且在3種四膜蟲中均具有類似的結(jié)果。另外, 四膜蟲中有一類特殊的基因—富亮氨酸重復(fù)基因(LRR基因), 我們之前的研究表明, 四膜蟲中LRR基因從保守性上可以根據(jù)是否含有90 bp外顯子, 按照是否含有輸出一致性序列(Consensus repeat sequence, CRS)可分為3類。其中第I類不含有90 bp外顯子的LRR最為保守; 第Ⅱ類含有至少一個90 bp外顯子但不含有CRS, 保守性次之; 第Ⅲ類含有至少一個90 bp外顯子和至少一個CRS, 為種特異基因[20]。對這三類基因中6mA位點數(shù)目的分析發(fā)現(xiàn), 第Ⅰ類保守LRR基因中6mA位點數(shù)遠遠高于第Ⅱ類, 且均顯著高于第Ⅲ類(圖 2B)。更進一步, 我們將大核中6mA位點比對回小核染色體, 發(fā)現(xiàn)大核基因組的6mA在小核染色體上呈差異性分布, 即6mA在小核顯著富集于染色體臂, 而在近著絲粒和亞端粒附近區(qū)域則分布較少(圖 2C)。我們前期研究顯示, 四膜蟲中保守基因顯著富集于小核染色體臂, 而種特異基因顯著富集于近著絲粒和亞端粒區(qū)域, 這一分布與6mA的分布很類似。因此, 以上結(jié)果說明, 6mA更偏向于分布于保守性高的基因中。
圖2 三種四膜蟲中6mA分布偏好Fig. 2 6mA distribution preferences in three species Tetrahymena
對四膜蟲中的6mA位點分布特征分析結(jié)果表明, 四膜蟲保守基因中具有更高的6mA位點數(shù)目。那么, 值得注意的是6mA的分布在不同物種間或者同一物種內(nèi)的同源基因中具有什么特征? 為了回答這一問題, 我們首先對3種四膜蟲種間一對一直系同源基因中6mA位點進行了分析和比較, 整體上看,物種間保守的直系同源基因中6mA位點數(shù)目具有顯著正相關(guān)性(圖 3A), 說明直系同源基因6mA的分布模式可能類似。因此, 我們進一步對6mA在基因上的分布進行了比較, 發(fā)現(xiàn)6mA主要分布于基因的5′區(qū)域, 且成簇分布(圖 3B)。在不同物種間的直系同源基因中, 6mA的成簇分布模式類似, 主要表現(xiàn)為成簇的數(shù)目相同或類似, 如圖 3B中基因?qū)τ忻黠@的3個甲基化簇且分布類似。為了進一步考察6mA在直系同源基因分布特征, 在單堿基水平比較了一對一直系同源基因中6mA分布的異同, 發(fā)現(xiàn)6mA分布的在單堿基水平并不完全保守(圖 3B)。以上結(jié)果表明6mA分布的在直系同源基因中具有區(qū)域的近似性, 但在單堿基水平存在可變性。
圖3 三種四膜蟲直系同源基因中6mA分布模式比較Fig. 3 Comparison of 6mA distribution patterns among orthologs in three Tetrahymena species
為了探究這種分布模式保守性在較遠親緣關(guān)系的纖毛蟲中是否存在, 我們對已報道的O. trifallax大核基因組中的6mA位點進行分析[19], 發(fā)現(xiàn)O.trifallax具有與3種四膜蟲類似的200 bp周期性分布(圖 4A)。但在與T. thermophila的直系同源基因6mA甲基化水平比較中, 相關(guān)系數(shù)和顯著性水平均低于3種四膜蟲內(nèi)部比較結(jié)果(圖 4B)。在單堿基水平比較通過OrthoMCL鑒定出的直系同源基因?qū)?發(fā)現(xiàn)兩者間也存在區(qū)域近似性, 但相對于分歧時間較近3種四膜蟲之間則較弱, 而單堿基水平的保守性則更弱(圖 4C)。
圖4 在O. trifallax大核基因組中6mA的分布模式Fig. 4 6mA distribution patterns on macronuclear genome in O. trifallax
除了直系同源基因外, 我們也對3種四膜蟲中,發(fā)生近期復(fù)制的(氨基酸序列一致性90%以上)的并系同源基因中的6mA分布進行了分析。我們發(fā)現(xiàn)兩個近期復(fù)制的基因, 其所具有的6mA位點數(shù)目呈顯著正相關(guān)(圖 5A), 進一步對6mA位點在并系同源基因間的分布進行了比較, 發(fā)現(xiàn)其分布模式與直系同源基因類似, 也具有區(qū)域近似性, 如圖 5B中基因?qū)τ忻黠@的3個甲基化簇且分布類似。并且在較高同源性的并系同源基因中, 6mA位點在單堿基水平也具有較高的保守性(圖 5B)。
圖5 三種四膜蟲并系同源基因中6mA分布模式比較Fig. 5 Comparison of 6mA distributions in inparalogs genes of three Tetrahymena species
由于在物種分化和進化過程中, 基因組會不斷累積DNA突變, A突變成其他任意3種堿基(T、G和C)都將會導(dǎo)致6mA修飾的消失, 甚至AT基序中任意一個突變都可能導(dǎo)致另一個位點上6mA修飾的消失。而上述我們發(fā)現(xiàn)的6mA分布的在直系同源基因中具有區(qū)域的近似性, 但在單堿基水平存在可變性這一結(jié)果提示進化上基因組中一個位點6mA消失后, 細胞可能在其附近區(qū)域重新建立6mA位點, 以維持相應(yīng)的功能。
為了理解四膜蟲分化過程中6mA的產(chǎn)生, 我們對四膜蟲直系同源基因中的6mA進行了比較(圖 6A),使用的同源基因序列總長度均為10 Mb左右。3種四膜蟲的系統(tǒng)發(fā)育關(guān)系如圖 6B所示,T. thermophila和T. malaccensis親緣關(guān)系較近, 聚在一起, 分化時間約為22個百萬年, 而T. pyriformis的分化時間更為久遠, 約116個百萬年。比較發(fā)現(xiàn)三種四膜蟲共有的6mA位點有28769個;T. thermophila和T.malaccensis共有的44276個6mA位點被認為是和T.pyriformis分化后到T. thermophila和T. malaccensis分化前產(chǎn)生的新位點;T. pyriformis特異的6mA位點81083個,T. thermophila特異的6mA位點31121個,T. malaccensis特異的6mA位點49732個。
圖6 6mA位點數(shù)目在3種四膜蟲物種分化過程中的動態(tài)變化Fig. 6 Dynamic changes of 6mA sites during the evolution of three Tetrahymena species
因此, 計算出T. pyriformis的特異6mA位點產(chǎn)生速率為69.9個位點每Mb每百萬年; 而T. thermophila和T. malaccensis在和T. pyriformis分化后且互相分化之前的94個百萬年中6mA位點產(chǎn)生速率為47個位點每Mb每百萬年;T. thermophila和T. malaccensis相互分化后,T. thermophila的特異6mA產(chǎn)生速率為141.5個位點每Mb每百萬年,T. malaccensis的特異6mA產(chǎn)生速率為226個位點每Mb每百萬年。從以上結(jié)果中可以估算出四膜蟲進化過程中新6mA位點產(chǎn)生的速率大約為69.9—226個位點每Mb每百萬年。
隨著三代測序技術(shù)普及, 報道全基因組6mA甲基化的物種數(shù)目越來越多, 包括黑腹果蠅、秀麗隱桿線蟲、萊茵衣藻、嗜熱四膜蟲和三偽尖毛蟲等[10,15,19,22,23]。在纖毛蟲的不同類群中, DNA甲基化類型為5mC和6mA, 有的只存在一種, 有的兩種都存在[24]。在O. fallax、T. thermophila、T. pyriformis和Stylonychia mytilus中只檢測到6mA[25—27],而在Blepharisma japonicum的營養(yǎng)細胞大核中,5mC和6mA都能被觀察到[28,29]。在T. thermophila的營養(yǎng)細胞中, 大約0.8%的大核基因組腺嘌呤被甲基化, 而在小核基因組中檢測不到6mA[25,30]。而在接合生殖14—16h時可以在新大核中檢測到新生6mA[31]。Paramecium大核和小核DNA中6mA的含量約為2.5摩爾百分比[32]。Kwok等[33]提出,6mA可能參與了Paramecium大核中一些序列的轉(zhuǎn)錄失活。
近些年, 通過單分子實時測序技術(shù), 直接從O.trifallax和T. thermophila大核中獲得了全基因組堿基對分辨率的6mA位點圖譜[15,19]。Wang等[15]在T.thermophila中發(fā)現(xiàn)6mA修飾富集于一致序列5′-AT-3′中, 也定位于轉(zhuǎn)錄起始位點下游的DNA連接區(qū)(Polymerase Ⅱ轉(zhuǎn)錄基因的轉(zhuǎn)錄起始位點), 并直接影響核小體的定位。四膜蟲的MT-A70同源物ATM1 (6mA DNA甲基轉(zhuǎn)移酶)是結(jié)合生殖后細胞正常生長發(fā)育所必需的[34]。Beh等[19]認為O. trifallax中負責6mA修飾的酶MTA1c (DNA甲基轉(zhuǎn)移酶)不利于核小體占據(jù)。6mA使AT堿基對失穩(wěn), 降低了DNA的熔化溫度導(dǎo)致核小體占用率降低。
將已發(fā)表的黑腹果蠅、萊茵衣藻、秀麗隱桿線蟲和3種四膜蟲的6mA各方面數(shù)據(jù)進行比較, 從基因組中6mA位點含量上看, 果蠅6mA含量約占基因組中所有A的0.001%—0.07%, 線蟲為0.01%—0.4%, 衣藻約為0.4%—0.8%, 四膜蟲約為0.56%—0.77%。物種間6mA含量差異很大, 以單細胞衣藻的含量最高, 果蠅和線蟲的含量較低, 四膜蟲的含量更接近衣藻。
從6mA分布規(guī)律上看, 果蠅中6mA富集于轉(zhuǎn)座子區(qū)域, 線蟲中6mA無明顯分布特征, 僅在傳代過程中不同階段表現(xiàn)出與H3K4me2組蛋白甲基化修飾的增加具有一定相關(guān)性[9,35], 衣藻中6mA則傾向于分布在核小體之間的linker DNA區(qū)域, 具有一定周期性, 并顯著富集于轉(zhuǎn)錄起始位點附近[23]。四膜蟲中6mA的分布規(guī)律和衣藻相似, 6mA分布傾向于核小體間linker DNA區(qū)域, 在編碼基因上顯著富集于5′端轉(zhuǎn)錄起始位點附近[15], 并且我們發(fā)現(xiàn)6mA在基因組上的分布具有200 bp周期性, 與四膜蟲核小體長度與linker DNA長度之和相等, 也側(cè)面支持了Wang等[15]發(fā)現(xiàn)嗜熱四膜蟲6mA位點富集于核小體Linker DNA的結(jié)果。并且有研究表明, 四膜蟲中6mA對核小體的定位具有指導(dǎo)作用[36]。本研究發(fā)現(xiàn)在3種親緣關(guān)系相近的四膜蟲中均有此規(guī)律, 說明在四膜蟲屬中這種現(xiàn)象可能比較常見。
其中, 6mA對linker DNA的偏好性可以解釋為對組蛋白的排斥作用, 這得到了體外重構(gòu)實驗和遺傳學實驗的支持, 當6mA水平改變時, 核小體的位置受到了可能產(chǎn)生排斥的空間位阻干擾, 因為包裹DNA的核小體周期性地位于組蛋白表面的主要溝槽一側(cè)[36], 而有模型顯示大多數(shù)6mA二核苷酸在兩條鏈上的甲基之間存在空間位阻沖突[21]。
從6mA區(qū)域的基序特征上看, 物種間差異明顯,線蟲的6mA基序主要為AGAA/GAGG, 衣藻為NATN, 而果蠅中未見報道保守基序。在3種四膜蟲中得到的保守基序均為AT, 占到四膜蟲基因組中總6mA位點數(shù)的86.42%— 97.58%。并且3種四膜蟲的基因組6mA甲基化水平也相當, 結(jié)合四膜蟲屬內(nèi)普遍基因組高AT含量, 推測在四膜蟲屬內(nèi)6mA甲基化基序也可能是保守的。并且, 對同一個AT序列A和T(反義鏈A)的甲基化水平進行比較發(fā)現(xiàn), 3種四膜蟲中大部分AT基序均形成對稱的ApT甲基化二核苷酸, 意味著DNA半保留復(fù)制時或者復(fù)制后, 新生鏈上的6mA修飾可能通過其所處的AT基序中模板鏈的6mA得以重新建立。
在比較3種四膜蟲的直系同源基因的6mA甲基化水平、位點簇分布和位點詳細分布后發(fā)現(xiàn), 直系同源基因間甲基化水平類似, 位點簇分布保守而位點卻不那么保守。因此我們推測四膜蟲6mA甲基化位點序列發(fā)生突變時, 具體的6mA甲基化位點發(fā)生了某種代償機制, 在突變位點附近建立了新的6mA甲基化位點, 使得基因上的6mA甲基化水平得以保持, 從而維持其相關(guān)功能。通過分析6mA在小核染色體上的分布, 發(fā)現(xiàn)基因上6mA甲基化水平與基因在小核染色體上的定位有關(guān)。為尋找這種甲基化水平差異的原因, 我們之前的研究[20]對于四膜蟲不同保守程度的LRR基因和10個四膜蟲種間的保守基因和種特異基因劃分, 通過6mA位點圖譜比較, 發(fā)現(xiàn)其分布偏好于保守基因和年齡更大的LRR基因。
在和嗜熱四膜蟲較遠親緣關(guān)系的纖毛蟲O. trifallax中, 比較其6mA的分布模式, 發(fā)現(xiàn)O. trifallax大核基因組中6mA分布也具有200 bp周期性, 根據(jù)6mA與核小體的互斥關(guān)系, 推測這可能是具有6mA的真核細胞的共有特征。在直系同源基因的甲基化水平上,O. trifallax與T. thermophila的相關(guān)性要弱于3個四膜蟲種內(nèi)部的相關(guān)性, 說明6mA的分布在纖毛蟲中存在一定保守性的同時, 隨著同源基因序列的分歧度增加, 保守性減弱。
基因復(fù)制可以產(chǎn)生新的基因, 主要是通過產(chǎn)生與原基因拷貝的功能分化從而增加生物復(fù)雜性[37,38]。而在3種四膜蟲的并系同源基因中, 在近期發(fā)生基因復(fù)制事件的基因, 表現(xiàn)出6mA位點具有高保守性,意味著在這類事件中, 6mA位點可一起復(fù)制, 保持其基因調(diào)控或者表觀遺傳標記作用。
本研究的結(jié)果表明6mA位點的數(shù)目與基因的保守性呈正相關(guān)。盡管如此, 由于基因的保守性和基因的表達也呈正相關(guān), 在多個物種中報道了6mA位點富集于轉(zhuǎn)錄起始位點附近[14,15,23]。因此,難以確定的是, 6mA位點數(shù)目與基因保守性是直接相關(guān)還是間接相關(guān)。
在已報道6mA位點的3種具有代表性的真核生物中, 線蟲屬于線蟲動物門, 果蠅屬于節(jié)肢動物門,衣藻屬于綠藻門, 其中線蟲和果蠅進化關(guān)系較近,均屬于后生動物, 但分化時間也較為久遠(約為744百萬年)。而基于T. thermophila、T. malaccensis和T. pyriformis這3個四膜蟲種, 能在更小的進化尺度上探究更精確的6mA位點動態(tài)變化。其中, 這3種四膜蟲同屬“Borealis”類群,T. thermophila和T.malaccensis分化時間約為22個百萬年,T. thermophila和T. pyriformis分化時間約為161個百萬年[20]。通過比較3者的基因組6mA圖譜, 得出四膜蟲中6mA甲基化修飾位點建立的速度約69.9—226個位點每Mb每百萬年。在直系同源基因和旁系同源基因都呈現(xiàn)甲基化水平保守的基礎(chǔ)上, 意味著基因拷貝數(shù)變化和基因功能變化會導(dǎo)致6mA甲基化修飾位點數(shù)目變化。當然, 這種數(shù)目變化也受到基因上的甲基化水平變化, 即具體的甲基化位點的消失和產(chǎn)生的影響。物種分化過程中6mA甲基化修飾變化應(yīng)該是一個動態(tài)平衡的過程, 具體的機制還有待研究。