胡競文 邵 峰 趙連鵬 韓民錦 彭作剛
(1. 西南大學(xué)生命科學(xué)學(xué)院, 淡水魚類資源與生殖發(fā)育教育部重點實驗室, 重慶 400715;2. 西南大學(xué)家蠶基因組生物學(xué)國家重點實驗室, 重慶 400715)
轉(zhuǎn)座元件(Transposable elements, TEs)是廣泛存在于基因組中的重復(fù)序列, 也稱為轉(zhuǎn)座子(Transposons), 它可以在基因組中移動并插入到新的位點[1]。轉(zhuǎn)座子由美國遺傳學(xué)家Barbara McClintock在玉米中發(fā)現(xiàn)[2,3], 根據(jù)轉(zhuǎn)座子不同的轉(zhuǎn)座機制, 將轉(zhuǎn)座子分為兩大類[4]。第一類是RNA類轉(zhuǎn)座子, 也被稱為逆轉(zhuǎn)錄轉(zhuǎn)座子(Retrotransposons), 這類轉(zhuǎn)座子通過“復(fù)制-粘貼”機制, 以RNA為媒介進(jìn)行轉(zhuǎn)座; 第二類是DNA類轉(zhuǎn)座子(DNA transposons), 這類轉(zhuǎn)座子通過“剪切-粘貼”機制, 以DNA為媒介進(jìn)行轉(zhuǎn)座。
根據(jù)能否實現(xiàn)自主轉(zhuǎn)座, 轉(zhuǎn)座子可以分為自主型轉(zhuǎn)座子和非自主型轉(zhuǎn)座子。非自主型轉(zhuǎn)座子最早在玉米(Zea mays)中被發(fā)現(xiàn)[5], 如今較受關(guān)注的非自主型轉(zhuǎn)座子是微型反向重復(fù)轉(zhuǎn)座元件(Miniature inverted-repeat transposable elements, MITEs), 它們由于缺少編碼轉(zhuǎn)座酶的序列而不能進(jìn)行自主轉(zhuǎn)座。這類轉(zhuǎn)座子有一個明顯的結(jié)構(gòu)特征, 序列的兩端存在反向重復(fù)序列(Terminal inverted repeat, TIR)和靶位點重復(fù)序列(Target site duplication, TSD)[5]。MITEs的序列長度通常小于800 bp, 序列中AT含量較高, 在基因組有較多的拷貝數(shù), 可以形成穩(wěn)定的二級結(jié)構(gòu), 并且能夠插入到基因內(nèi)部或附近的位置[6],對基因的結(jié)構(gòu)[7]、基因組的大小[8,9]和基因的表達(dá)調(diào)控[10]都有影響。目前, 植物[8,9,11]、昆蟲[12]、病毒[13,14]等基因組的MITEs預(yù)測和數(shù)據(jù)庫構(gòu)建已有相關(guān)文章發(fā)表, 例如在41種植物中鑒定出3527個MITEs家族, 大多數(shù)高等植物比低等植物含有更多的MITEs,植物基因組中MITEs序列的數(shù)量與基因組大小呈正相關(guān)[10]。在98種昆蟲基因組中鑒定出6012個MITEs家族, 其中有601個新MITEs, TSD為TA的MITEs序列在昆蟲基因組中大量存在, 并且昆蟲基因組大小也與MITEs含量呈正相關(guān)[12]。
魚類是最古老的脊椎動物, 在脊椎動物進(jìn)化過程中具有獨特的地位。魚類的物種數(shù)量占脊椎動物物種總量的一半以上, FishBase數(shù)據(jù)庫中記錄的魚類已達(dá)到34200種(2019年3月), 并且數(shù)量還在不斷增加。根據(jù)形態(tài)特征和棲息環(huán)境等差異, 魚類被分成多個類群[15—18], 如無頜類、軟骨魚綱、肉鰭魚綱和輻鰭魚綱。對于魚類轉(zhuǎn)座子的研究工作也在開展, 例如發(fā)現(xiàn)古代魚類中的DNA轉(zhuǎn)座子含量低于逆轉(zhuǎn)錄轉(zhuǎn)座子含量[19], 較大基因組魚類的轉(zhuǎn)座子多樣性更高[20], 魚類基因組中轉(zhuǎn)座子含量可能與物種棲息地等因素有關(guān)[21]等。目前, 更多研究關(guān)注轉(zhuǎn)座子對“宿主”的作用, 比如轉(zhuǎn)座子對魚類性別分化有一定影響[22], 魚類基因組加倍與轉(zhuǎn)座子擴增有關(guān)[23]。雖然魚類轉(zhuǎn)座子的研究工作不斷完善, 但是, 魚類基因組中MITEs的系統(tǒng)研究尚未開展。
目前, 很多魚類物種的基因組測序工作已經(jīng)完成, 魚類的基因組數(shù)據(jù)、蛋白質(zhì)序列可以從NCBI(National Center of Biotechnology Information)中下載, 這為魚類基因組中的MITEs鑒定提供了良好的契機, 使我們能夠運用生物信息學(xué)方法對MITEs進(jìn)行鑒定, 豐富脊椎動物的轉(zhuǎn)座子數(shù)據(jù)。本研究從NCBI數(shù)據(jù)庫搜集了具有代表性的33種魚類基因組數(shù)據(jù)(包括無頜類3種、軟骨魚綱2種、肉鰭魚綱1種、輻鰭魚綱27種)并對它們進(jìn)行鑒定和比較學(xué)分析以揭示MITEs在魚類基因組中的分布規(guī)律、擴增模式以及對基因組進(jìn)化的影響。
如表1所示, 從NCBI數(shù)據(jù)庫中下載33種魚類的基因組相關(guān)數(shù)據(jù)信息, 涵蓋無頜類、軟骨魚綱、肉鰭魚綱和輻鰭魚綱, 包括小丑魚(Amphiprion ocellaris)、歐洲鰻鱺(Anguilla anguilla)、日本鰻鱺(Anguilla japonica)、美洲鰻鱺(Anguilla rostrate)、墨西哥麗脂鯉(Astyanax mexicanus)、象鯊(Callorhinchus milii)、大西洋鯡(Clupea harengus)、半滑舌鰨(Cynoglossus semilaevis)、斑馬魚(Danio rerio)、蒲氏盲鰻(Eptatretus burger)、伯氏樸麗魚(Haplochromis burtoni)、貝氏隆頭魚(Labrus bergylta)、大黃魚(Larimichthys crocea)、矛尾魚(Latimeria chalumnae)、猬鰩(Leucoraja erinacea)、斑點雀鱔(Lepisosteus oculatus)、日本七鰓鰻(Lethenteron camtschaticum)、斑點叉尾鮰(Ictalurus punctatus)、斑馬宮麗魚(Maylandia zebra)、黃鱔(Monopterus albus)、布氏新亮麗鯛(Neolamprologus brichardi)、弗氏假鰓鳉(Nothobranchius furzeri)、羅非魚(Oreochromis niloticus)、日本青鳉(Oryzias latipes)、象鼻魚(Paramormyrops kingsleyae)、海七鰓鰻(Petromyzon marinus)、紅麗魚(Pundamilia nyererei)、大西洋鮭魚(Salmo salar)、亞洲龍魚(Scleropages formosus)、紅縛平鲉(Sebastes rubrivinctus)、犀角金線鲃(Sinocyclocheilus rhinocerous)、紅鰭東方鲀(Takifugu rubripes)以及花斑劍尾魚(Xiphophorus maculatus)。
使用MITE-Hunter[24](設(shè)定默認(rèn)參數(shù))對33種魚類基因組的MITEs進(jìn)行預(yù)測, 將得到的MITEs作為問詢序列與基因組數(shù)據(jù)進(jìn)行blastn比對(identity>80%、coverage>80%、e值<1e-5、長度<800 bp),保留在基因組中拷貝數(shù)多于3條的MITEs一致序列。然后提取MITEs在基因組的拷貝, 使用MUSCLE進(jìn)行序列比對[25], Bioedit確定MITEs拷貝序列的TSD和TIR[26], 并在DAMBE中生成校正邊界后的MITEs一致序列[27]。在同一個基因組中的MITEs遵從“80-80-80”規(guī)則去冗余[4], 記錄每條MITEs的序列長度。再次使用blastn將得到的一致序列結(jié)果作為問詢序列與基因組進(jìn)行比對, 利用perl腳本統(tǒng)計MITEs在基因組中的拷貝數(shù)和序列長度等信息。若與MITEs一致序列有相同TIR和TSD, 稱之為全長拷貝(Full-length copies); 若沒有完整TIR的拷貝序列, 稱為片段拷貝(Fragment copies)。得到MITEs在各個基因組中的含量信息后, 在SPSS中進(jìn)行MITEs含量和基因組大小的Pearson相關(guān)性分析。
MITEs可以在基因組中通過轉(zhuǎn)座進(jìn)行擴增, 因此我們分析了MITEs的插入時間和分布情況。通過K2P模型(Kimura 2 parameter distances)[28]計算全長拷貝序列在基因組中的插入時間, 首先使用DAMBE得到全長拷貝和MITEs一致序列之間的分化度, 進(jìn)而利用公式T=K/2r[29]計算插入時間(取核苷酸位點替換速率r= 2.5×10-8[30,31],K值為分化度)。為了解MITEs在基因組中的分布, 下載所選魚類物種的基因組注釋文件, 其中的8個物種(蒲氏盲鰻、日本七鰓鰻、海七鰓鰻、亞洲龍魚、日本鰻鱺、美洲鰻鱺、歐洲鰻鱺和紅縛平鲉)沒有內(nèi)含子、外顯子信息注釋文件, 不能計算插入位置, 猬鰩的注釋文件信息很少, 不能得到有效位置信息。對剩余的24種魚類, 根據(jù)MITEs全長拷貝在基因組上的位置, 使用perl腳本統(tǒng)計全長拷貝插入到基因內(nèi)、基因外顯子和內(nèi)含子中的數(shù)量。
通過MITE-Hunter對33個魚類基因組MITEs進(jìn)行初步預(yù)測, 后續(xù)校準(zhǔn)、去冗余后確定了所選物種基因組中MITEs一致序列和拷貝數(shù), 共得到2433個MITEs一致序列, 487594個全長拷貝。不同魚類基因組的MITEs拷貝數(shù)和含量差異較大(表1)。MITEs(全長拷貝和片段拷貝)含量最高的5個物種分別是
斑馬魚(237.76 Mb, 16.66%)、海七鰓鰻(213.53 Mb,21.18%)、大西洋鮭魚(189.29 Mb, 6.38%)、墨西哥麗脂鯉(99.05 Mb, 7.42%)和日本七鰓鰻(83.17 Mb,8.07%)。也有部分物種的MITEs含量較低, 例如大西洋鯡MITEs含量為3.94 Mb(0.49%), 象鯊為3.83 Mb(0.39%), 歐洲鰻鱺為2.70 Mb(0.27%), 猬鰩的含量為1.73 Mb(0.11%), 紅鰭東方鲀基因組中MITEs含量最低, 僅為0.61 Mb(0.16%)。從分類階元來看, 無頜類的MITEs含量較高, 如海七鰓鰻; 軟骨魚綱和肉鰭魚綱魚類的MITEs含量較低, 如猬鰩和矛尾魚; 輻鰭魚綱的魚類MITEs含量最為豐富,如斑馬魚。
表1 33種魚類基因組MITEs存在情況Tab. 1 The presence of MITEs in 33 fish genomes
相關(guān)性分析發(fā)現(xiàn)基因組大小和MITEs含量之間呈正相關(guān)(r=0.124,P=0.045, 圖1), 比如海七鰓鰻的基因組為1007.98 Mb, 含有213.53 Mb的MITEs序列; 斑馬魚的基因組為1427.29 Mb, 含有237.76 Mb的MITEs序列。同時, MITEs序列的AT含量較高,魚類基因組中的MITEs轉(zhuǎn)座子也是如此, 它們的AT含量在51.75%(猬鰩)到61.68%(斑馬魚)之間, 均多于GC核苷酸在基因組的占比。而MITEs在魚類基因組中存在豐富的拷貝[32,33], 其中MITEs拷貝數(shù)最多的是斑馬魚(88337個全長拷貝), 最少的是紅鰭東方鲀(500個全長拷貝)。
圖1 33種魚類基因組大小和MITEs含量的關(guān)系Fig. 1 The relationship between genome size and MITEs content of the 33 fish species
將得到的MITEs一致序列根據(jù)各自的TSD和TIR序列特征進(jìn)行分類[12], 進(jìn)一步計算各個超家族在基因組的占比。分析結(jié)果表明, 魚類基因組中MITEs超家族有: TC1-Mariner、PHIS、P、Kobolok、PiggyBac、hAT、Ginger、CMC、Merlin、Sola2, 不同魚類基因組中的MITEs超家族的分布存在較大差異(圖2)。TC1-Mariner超家族(TSD:TA)存在于本研究所有的魚類基因組中, 其中斑馬魚的TC1-Mariner全長拷貝數(shù)最多, 有42501個(占基因組中MITEs序列的48.11%), 紅鰭東方鲀的TC1-Mariner全長拷貝序列最少, 只有19條(3.8%)。PHIS超家族(TSD: TWA, CTWAG, CWG)存在29個物種中, 海七鰓鰻的PHIS全長拷貝數(shù)最多, 為12868個(20.44%)。P超家族(TSD: 7—8 bp, TIR:CANRG)存在于30個魚類物種中, 斑馬魚P超家族的全長拷貝最多, 為22414個(25.37%)。Kobolok超家族(TSD: TTAA, TIR: RG)存在于23個魚類物種中, 墨西哥麗脂鯉的Kobolok超家族全長拷貝最多,為4647個(8.69%)。PiggyBac超家族(TSD: TTAA,TIR: CMY)存在于27個物種基因組, 日本青鳉全長拷貝最多, 有16951個(70.74%)。hAT超家族(TSD:5—8 bp, TIR: YARNG)除了象鯊和斑點叉尾鮰以外, 存在于31個物種基因組中, 全長拷貝數(shù)最多的是斑馬魚, 有6586個(7.46%)。Ginger超家族(TSD:4—5 bp, TIR: TGT)存在于除了半滑舌鰨以外的32個物種基因組中, 大西洋鮭的Ginger拷貝數(shù)最多,為4320個(6.39%)。其他的MITEs超家族, 比如Merlin, 只存在于犀角金線鲃的基因組, 拷貝數(shù)為547個(7.51%)。Sola2超家族只存在于海七鰓鰻、蒲氏盲鰻、猬鰩三個物種基因組中, 拷貝數(shù)最多的是海七鰓鰻, 有3084個(4.90%)。除了上述的MITEs超家族, 還有部分MITEs拷貝由于TSD和TIR無任何規(guī)律, 無法鑒定出家族, 全部歸為unknown??偠灾? 魚類基因組中TC1-Mariner超家族占比最大, 與之前的研究結(jié)果相符合[16]。
圖2 33種魚類基因組中MITEs超家族分布情況Fig. 2 Distributions of MITEs superfamily in the genome of the 33 fish species
根據(jù)K2P模型[26]和公式T=K/2r[27], 使用軟件DAMBE計算不同全長拷貝與一致序列之間的分化度(K), 并用perl腳本統(tǒng)計各物種中MITEs的插入時間。結(jié)果表明, 大多數(shù)魚類的MITEs全長拷貝(79.58%)插入基因組的時間約為4百萬年前, 也有少數(shù)的MITEs全長拷貝插入時間更為古老(20.42%,圖3)。
在魚類進(jìn)化過程中, 基因組的轉(zhuǎn)座子數(shù)量也在發(fā)現(xiàn)改變, 從得到的MITEs插入時間結(jié)果分析,7.5百萬年前大部分魚類基因組中的MITEs拷貝較少, 隨著時間的推移, 部分物種出現(xiàn)了MITEs數(shù)量激增的現(xiàn)象, 魚類基因組的MITEs插入時間相對更集中在2百萬—0.5百萬年前, 如日本七鰓鰻、海七鰓鰻、猬鰩、矛尾魚、斑點雀鱔、斑馬魚、小丑魚、貝氏隆頭魚在此期間都有一個MITEs集中擴增的表現(xiàn)。其中斑馬魚的MITE拷貝數(shù)就曾在7.5百萬—6.5百萬年前有短暫的數(shù)量上升, 到6.5百萬—6百萬年前出現(xiàn)MITEs數(shù)量減少(僅有1889個全長拷貝), 而后的4百萬年間, 斑馬魚的MITEs數(shù)量又緩慢的開始增加, 直到2百萬—1.5百萬年前達(dá)到一個擴增的峰值(11596個全長拷貝), 到近期MITEs數(shù)量又逐步降低。同樣, 大西洋鮭魚的MITEs數(shù)量也是緩慢的上升, 從7.5百萬—7百萬年前的435個MITEs全長拷貝, 經(jīng)過5百萬年, 到2.5百萬—2百萬年前時達(dá)到數(shù)量峰值(10841個全長拷貝), 然后MITEs序列又逐漸減少。不同的是, 有些物種在進(jìn)化過程中,MITEs會經(jīng)歷兩次擴增“爆發(fā)”期(拷貝數(shù)量達(dá)到峰值, 而后下降), 比如墨西哥麗脂鯉、斑馬魚、羅非魚、象鼻魚和犀角金線鲃。除此之外的其他物種都僅有一次MITEs擴增“爆發(fā)”。
魚類基因組中的MITEs轉(zhuǎn)座子具有較高的豐度, 為了保證結(jié)果的準(zhǔn)確性, 僅選取有完整TIR的MITEs全長拷貝進(jìn)行插入位置分析。結(jié)果顯示(表2),魚類基因組的MITEs全長拷貝插入到基因內(nèi)部的數(shù)量十分豐富(計算插入時, 以轉(zhuǎn)座子所處位置為準(zhǔn), 較長的轉(zhuǎn)座子可能出現(xiàn)重復(fù)計數(shù)的現(xiàn)象, 對結(jié)果無影響), 例如斑馬魚插入到基因的有12885個。其中矛尾魚、斑點雀鱔、象鼻魚、大西洋鯡、斑馬魚、犀角金線鲃、墨西哥麗脂鯉、斑點叉尾鮰、大西洋鮭魚、紅鰭東方鲀、黃鱔、半滑舌鰨、貝氏隆頭魚、大黃魚、羅非魚、布氏新亮麗鯛、斑馬宮麗魚、紅麗魚、伯氏樸麗魚、小丑魚、花斑劍尾魚、弗氏假鰓鳉和日本青鳉基因組中的MITEs都有插入到外顯子的情況。對這部分基因進(jìn)行注釋, 發(fā)現(xiàn)象鼻魚、斑馬魚、墨西哥麗脂鯉、弗氏假鰓鳉、黃鱔、大黃魚、小丑魚、羅非魚的MITEs都插入到能夠編碼具有鋅指結(jié)構(gòu)的蛋白(Zinc finger)的序列中, 這些序列編碼的蛋白大多與基因表達(dá)相關(guān); 墨西哥麗脂鯉有一條MITEs插入到能編碼視蛋白對應(yīng)的序列中; 斑點雀鱔的有一條MITEs插入到編碼脂肪包被蛋白(與肥胖相關(guān))的序列中等等。但后續(xù)還需要更詳細(xì)的分析和實驗驗證, 才能明確MITEs是否對基因表達(dá)有影響。
魚類占現(xiàn)有脊椎動物總數(shù)的50%以上, 它豐富的物種多樣性, 廣闊的物種分布以及古老的進(jìn)化地位都使它成為生物進(jìn)化歷史上不可或缺的一部分。隨著測序技術(shù)的發(fā)展, 越來越多的魚類基因組數(shù)據(jù)被公布, 基因組中的轉(zhuǎn)座子序列也得到了生物學(xué)家的關(guān)注, 目前已完成52種魚類的轉(zhuǎn)座子鑒定工作[21], 魚類特有的轉(zhuǎn)座子數(shù)據(jù)庫也已經(jīng)發(fā)布[34]。MITEs屬于非自主型的DNA轉(zhuǎn)座子, 已有研究表明MITEs起源于自主DNA轉(zhuǎn)座子, 并且其在基因組中存在豐富的拷貝[35], MITEs的插入對“宿主”的基因功能也會造成影響[36—38]。我們使用de novo預(yù)測和結(jié)構(gòu)預(yù)測相結(jié)合的方法對33種魚類基因組進(jìn)行MITEs轉(zhuǎn)座子預(yù)測, 然后用Bioedit手工鑒定, 有效降低了預(yù)測結(jié)果的假陽性, 為后續(xù)插入時間和插入位置分析提供保障。
魚類基因組中MITEs含量差異較大(0.11%—21.18%), 比植物基因組(0.01%—9.98%)[10]和昆蟲基因組(0.00%—6.24%)[12]中的MITEs含量更高。MITEs在基因組中的拷貝數(shù)較多, 斑馬魚中全長拷貝可達(dá)88337個, 其原因可能有兩個, 一方面, 輻鰭魚綱的魚類比軟骨魚綱的含有更多DNA轉(zhuǎn)座子; 另一方面, 斑馬魚是模式物種, 基因組質(zhì)量高(基因組組裝到染色體, Contig N50為854399 bp), 預(yù)測結(jié)果也更好。在本研究中, 猬鰩基因組鑒定的MITEs含量很低(0.11%), 這可能與軟骨魚基因組中DNA類轉(zhuǎn)座子總體含量偏低及基因組組裝質(zhì)量不高(基因組Contig N50為665 bp)有關(guān)。同時, 發(fā)現(xiàn)魚類基因組大小和基因組中MITEs含量呈正相關(guān)(r=0.124,P<0.05), 與植物和昆蟲的情況類似[10,12], 因此可知MITEs的高拷貝數(shù)、高含量對基因組大小的進(jìn)化有一定貢獻(xiàn)。而魚類基因組中的MITEs超家族主要是TC1-Mariner (TSD: TA), 它在植物[10,30]、昆蟲[12]、病毒[14]等基因組中都含有, 也是最初發(fā)現(xiàn)的MITEs之一[30], 在MITEs含量中占主導(dǎo)地位。
圖3 33種魚類基因組中MITEs插入時間估計Fig. 3 MITEs insertion time estimation in the 33 fish genomes
MITEs與其他轉(zhuǎn)座子不同, 它在基因組中傾向插入到基因內(nèi)部或附近(基因側(cè)翼5 kb區(qū)域內(nèi))[39],本研究結(jié)果顯示, 大部分MITEs全長拷貝都插入到“宿主”的基因內(nèi)部, 符合MITEs的插入特征。但MITEs的插入可能會使基因表達(dá)發(fā)生變化, 例如水稻的mPing轉(zhuǎn)座子插入Rurm1基因的內(nèi)含子中, 使水稻穎葉更加細(xì)長[40]。在魚類基因組中, 很多MITEs序列插入到基因的內(nèi)含子, 甚至有23種魚類的MITEs序列插入到基因的外顯子, 這在昆蟲和植物中很少見。所以, 還需要對插入到基因的MITEs序列進(jìn)行深入研究, 確定它們對“宿主”的基因表達(dá)和功能是否有影響。
MITEs能夠以“剪切-粘貼”模式高效率轉(zhuǎn)座[35],依靠對應(yīng)的自主轉(zhuǎn)座子編碼的轉(zhuǎn)座酶, 在短時間內(nèi)增加拷貝數(shù)。MITEs插入時間分析結(jié)果顯示, 魚類基因組的MITEs大多在2百萬—0.5百萬年前出現(xiàn)了一次擴增“爆發(fā)”期, 這期間MITEs的數(shù)量快速增加并達(dá)到峰值, 之后數(shù)量又逐漸減少。轉(zhuǎn)座子“生命周期(Lifecycle)”假說[41]認(rèn)為, 轉(zhuǎn)座子進(jìn)入“宿主”后有一個快速擴增時期, 這期間轉(zhuǎn)座子拷貝數(shù)急劇增加, 同時產(chǎn)生突變導(dǎo)致部分轉(zhuǎn)座子失活。接著進(jìn)入成熟期, 轉(zhuǎn)座子拷貝數(shù)增加和丟失的速率達(dá)到平衡。最后進(jìn)入衰老期, 自主型和非自主型轉(zhuǎn)座子丟失, 不再擴增, 衰老期持續(xù)的時間最長可達(dá)幾百萬年。我們得到的MITEs擴增結(jié)果與這個假說相符合, 這種情況也說明MITEs雖然能通過轉(zhuǎn)座增加拷貝, 但并不能一直擴增下去, 若這種擴張給“宿主”帶來負(fù)面影響, “宿主”會有一些沉默機制阻止MITEs擴增, 如piRNA(非編碼小RNA)通過誘導(dǎo)特殊位點的組蛋白修飾能對轉(zhuǎn)座子轉(zhuǎn)座進(jìn)行有效抑制[42]。若這類MITEs對轉(zhuǎn)座子有利, 則會繼續(xù)留存在基因組中, 例如斑馬魚基因組中MITEs序列有兩次擴增的跡象。因此在魚類基因組中, MITEs的擴增會影響基因組大小, 同時“宿主”也有相應(yīng)的機制控制MITEs的數(shù)量, 而MITEs在基因組中的插入會對物種的進(jìn)化、基因的結(jié)構(gòu)和功能產(chǎn)生影響, 因此鑒定魚類的MITEs是研究魚類基因組中轉(zhuǎn)座子功能的基礎(chǔ)。
表2 MITEs在魚類基因組中的分布Tab. 2 Distributions of MITEs in the fish genomes
對33種魚類基因組的MITEs進(jìn)行預(yù)測、鑒定和分類, 發(fā)現(xiàn)魚類的MITEs含量差異顯著, MITEs含量與魚類基因組大小呈正相關(guān)。在33種魚類中, 均含有大量TSD為TA的MITEs序列, 與昆蟲、植物類似。魚類基因組中的MITEs插入時間大多在4百萬年前, 更傾向于插入在基因內(nèi)部, 這可能會對基因表達(dá)調(diào)控產(chǎn)生影響。我們闡述了魚類基因組中MITEs的分布情況, 為后續(xù)魚類基因組中MITEs功能的研究奠定了基礎(chǔ)。