国产日韩欧美一区二区三区三州_亚洲少妇熟女av_久久久久亚洲av国产精品_波多野结衣网站一区二区_亚洲欧美色片在线91_国产亚洲精品精品国产优播av_日本一区二区三区波多野结衣 _久久国产av不卡

?

紅毛丹基因組中MITEs轉(zhuǎn)座子的鑒定與演化分析

2022-11-02 09:31馬譽(yù)生張文萍明瑞光
關(guān)鍵詞:轉(zhuǎn)座子基因組基因

馬譽(yù)生,張文萍,明瑞光

(1.福建農(nóng)林大學(xué)生命科學(xué)學(xué)院,福州 350002;2.福建農(nóng)林大學(xué)海峽聯(lián)合研究院基因組與生物技術(shù)中心,福州 350002;3.伊利諾伊大學(xué)厄巴納香檳分校植物生物學(xué)系,美國 伊利諾伊州厄巴納 61801)

轉(zhuǎn)座子(transposon)是動植物基因組的重要組成成分[1],是基因組演化過程中不可忽視的一部分[2],它們可以通過復(fù)制或移位從基因組的一個位點(diǎn)轉(zhuǎn)移至另一個位點(diǎn)[3],從而造成基因組重排,并對基因組大小、染色體結(jié)構(gòu)和附近基因的表達(dá)水平等有著不同程度的影響[4]。轉(zhuǎn)座子的含量和種類在不同的生物基因組中存在較大的差異,根據(jù)其轉(zhuǎn)座的不同機(jī)制,大致可分為ClassⅠ和ClassⅡ兩大類[5]。ClassⅠ型轉(zhuǎn)座子以RNA為中間媒介進(jìn)行轉(zhuǎn)座,可以自身合成逆轉(zhuǎn)錄酶然后將其本身反轉(zhuǎn)錄為cDNA,以“復(fù)制-粘貼”的形式整合到另一個位點(diǎn),由于其逆轉(zhuǎn)錄的特性又被稱為逆轉(zhuǎn)座子(retrotransposon)[6]。ClassⅡ型轉(zhuǎn)座子以DNA為中間媒介進(jìn)行轉(zhuǎn)座,與ClassⅠ型不同的是此類轉(zhuǎn)座子在轉(zhuǎn)座酶的作用下從原位點(diǎn)直接切除并重新整合至新位點(diǎn),以“剪切-粘貼”的形式進(jìn)行轉(zhuǎn)座,因此也被稱為DNA轉(zhuǎn)座子(DNA transposon)[7]。

微型反向重復(fù)轉(zhuǎn)座元件MITEs屬于ClassⅡ型DNA轉(zhuǎn)座子中的TIR類轉(zhuǎn)座子,不具備編碼轉(zhuǎn)座酶的能力,屬于非自主型轉(zhuǎn)座元件(non-autonomous transposable elements)[5]。此類基因組元件首先在植物中發(fā)現(xiàn)[8],并在后續(xù)的研究中發(fā)現(xiàn)廣泛存在于各種生物體基因組中,包括脊椎動物[9],無脊椎動物[10],真菌[11]以及病毒[12]。通常MITEs轉(zhuǎn)座子具有以下典型特征:①轉(zhuǎn)座子兩端為末端反向互補(bǔ)的重復(fù)序列(terminal inverted repeat,TIR);②在轉(zhuǎn)座子TIR外兩側(cè)為具有正向重復(fù)的靶位點(diǎn)重復(fù)序列(target site duplication,TSD);③中間為無編碼能力的序列,該序列中AT含量較高,有形成二級結(jié)構(gòu)的趨勢;④完整片段長度較短,一般在50~800 bp之間[13]。MITEs轉(zhuǎn)座子通過借助與其TIR序列高度相似的對應(yīng)自主轉(zhuǎn)座子編碼的轉(zhuǎn)座酶進(jìn)行轉(zhuǎn)座,但其拷貝數(shù)通常高于其對應(yīng)的自主轉(zhuǎn)座子[5]。

MITEs轉(zhuǎn)座子在植物基因組中的頻繁轉(zhuǎn)座以及高拷貝數(shù)等特性對其宿主基因組結(jié)構(gòu)多樣性(如等位基因多態(tài)性)有著至關(guān)重要的影響,甚至影響宿主相關(guān)基因的表達(dá)從而影響表型[14]。這種現(xiàn)象在桑葚(Morus notabilis)[15]、葡萄(Vitis viniferaL.)[16]、胡蘿卜(Daucus carota)[17]和小麥(Triticum-Aegilopsgroup)[18]等多種植物基因組中都有報道,說明了MITEs的存在及轉(zhuǎn)座活動對宿主影響的普遍性。植物MITEs轉(zhuǎn)座子數(shù)據(jù)庫P-MITE于2014年建立并投入使用[19],該數(shù)據(jù)庫整理了一些植物基因組中MITEs轉(zhuǎn)座子的初步鑒定和分類結(jié)果,是植物基因組MITEs研究過程中一個良好的參考平臺,由該數(shù)據(jù)庫統(tǒng)計結(jié)果(表1)可知,總體上MITEs轉(zhuǎn)座子在各植物基因組中具有較高的拷貝數(shù)和含量。

表1 MITEs轉(zhuǎn)座子在植物基因組中的含量[19]Table 1 MITEs content in plant genomes[19]

紅毛丹(Nephelium lappaceumLinn)屬于無患子科熱帶水果,其果肉、種子和樹干等都具有很高的應(yīng)用價值,如果肉可做成果醬,樹干可用于建筑材料,種仁油可制成肥皂和蠟燭,因此具有極大的商業(yè)價值[20]。紅毛丹高質(zhì)量基因組的公布,為紅毛丹功能基因組學(xué)及基因組演化方面的研究提供了良好的數(shù)據(jù)基礎(chǔ)[21],而轉(zhuǎn)座子存在于幾乎所有的真核生物基因組中,并對其宿主基因組演化、基因表達(dá)調(diào)控及表型可塑性有著不可忽視的影響[13,22-23],在紅毛丹中還沒有對MITEs轉(zhuǎn)座子進(jìn)行過系統(tǒng)的鑒定和分析,由此本研究利用紅毛丹全基因組數(shù)據(jù)來鑒定、分類并注釋紅毛丹基因組中的MITEs轉(zhuǎn)座子,以期完善紅毛丹基因組的注釋并促進(jìn)其轉(zhuǎn)座子的研究,為紅毛丹基因組演化和相關(guān)基因功能方面的分析提供關(guān)鍵的數(shù)據(jù)依據(jù)。

1 材料和方法

1.1 紅毛丹基因組中MITEs轉(zhuǎn)座子的鑒定與注釋

本實(shí)驗(yàn)室前期已經(jīng)完成紅毛丹基因組組裝及相關(guān)基因注釋[21],選用MITE-Tracker軟件[24]對紅毛丹基因組中的MITEs轉(zhuǎn)座子進(jìn)行搜尋,設(shè)置參數(shù)為‘-tsd_min_len 2-tsd_max_len 10-mite_min_len 50-mite_max_len 650’,MITE-Tracker對基因組中具有MITEs轉(zhuǎn)座子結(jié)構(gòu)且滿足參數(shù)條件的序列提取出來并聚類為不同的家族,由于目前沒有軟件可以精確辨認(rèn)所有MITEs轉(zhuǎn)座子的邊界,因此后續(xù)需要提取出每個家族成員的序列,對每個家族運(yùn)用MUSCLE-3.7[25]軟件進(jìn)行多序列比對,對邊界有缺失的序列擴(kuò)展前后50 bp,再提取出對應(yīng)的序列重新進(jìn)行多序列比對,運(yùn)用BioEdit-7.0.9.0[26]軟件對所得的各家族序列TIR末端進(jìn)行人工矯正,并按照所總結(jié)的MITEs轉(zhuǎn)座子結(jié)構(gòu)匯總表對各個家族進(jìn)行超家族分類注釋(表2),最后運(yùn)用卷積神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)軟件DeepTE[27]對注釋結(jié)果及MITEs序列進(jìn)行修改驗(yàn)證。運(yùn)用DAMBE-7軟件[28]計算每個MITEs超家族的一致序列(consensus sequence)。完成轉(zhuǎn)座子注釋后,計算鑒定出的MITEs序列中腺嘌呤脫氧核糖核酸和胸腺嘧啶脫氧核糖核酸(A和T)的比例,并統(tǒng)計每個超家族在紅毛丹基因組中所占的比例。

表2 MITEs轉(zhuǎn)座子超家族分類標(biāo)準(zhǔn)Table 2 Classification criteria for MITEs superfamilies

1.2 MITEs轉(zhuǎn)座子各家族進(jìn)化樹的構(gòu)建

對各家族的一致序列進(jìn)行多序列比對后,利用MEGA-X[29]軟件構(gòu)建各個家族代表序列的neighbor-joining進(jìn)化樹,校驗(yàn)Bootstrap參數(shù)設(shè)置為1 000次,用iTOL(https://itol.embl.de/)在線軟件對進(jìn)化樹運(yùn)行結(jié)果進(jìn)行注釋及可視化。

1.3 MITEs轉(zhuǎn)座子插入時間的估算

選取K2P模型(Kimura 2 parameter distances)計算每個MITEs拷貝的插入時間[30],從而了解MITEs轉(zhuǎn)座子在紅毛丹基因組中的擴(kuò)增情況。首先使用R語言程序包ape(http://ape-package.ird.fr/),結(jié)合公式K=-1/2ln(1-2p-q)-1/4ln(1-2q)(q代表顛換位點(diǎn)所占比例,p代表轉(zhuǎn)換位點(diǎn)所占比例)計算每個MITEs完整拷貝與相應(yīng)超家族一致序列(假定祖先序列)之間的遺傳距離,然后運(yùn)用公式T=K/2r(K為完整拷貝MITEs序列與一致序列之間的遺傳距離,r為核苷酸位點(diǎn)替換速率)[31]計算每個轉(zhuǎn)座子的插入時間,在本研究中采用1.38×10-8作為核苷酸位點(diǎn)替換速率。

1.4 MITEs轉(zhuǎn)座子插入位置及密度分布分析

利用軟件MITE-Tracker所產(chǎn)生的MITEs轉(zhuǎn)座子注釋文件,結(jié)合紅毛丹基因組注釋文件中各元素的長度、位置和正反鏈等信息,統(tǒng)計每個轉(zhuǎn)座子在基因組中的位置,主要對以下位置的插入進(jìn)行統(tǒng)計:基因5′端(5 kb以內(nèi))、基因3′端(5 kb以內(nèi))和基因(內(nèi)含子和外顯子),若MITEs序列任意位點(diǎn)的坐標(biāo)在上述區(qū)域坐標(biāo)之內(nèi),則統(tǒng)計一次插入,最后將所有轉(zhuǎn)座子的插入位置信息及插入次數(shù)進(jìn)行整合。獲得紅毛丹基因和MITEs轉(zhuǎn)座子在基因組中的坐標(biāo)信息后,利用R語言程序包gtrellis(https://www.statmethods.net/advgraphs/trellis.html)繪制基因和轉(zhuǎn)座子在紅毛丹各染色體上的密度分布圖,通過比較分析MITEs轉(zhuǎn)座子在紅毛丹染色體上的插入分布模式。

1.5 MITEs轉(zhuǎn)座子在基因附近的插入偏好性分析

提取紅毛丹基因組注釋文件中每個基因的坐標(biāo)和距離紅毛丹基因5′端和3′端5 kb以內(nèi)的MITEs的相關(guān)注釋信息,分別劃分為10個區(qū)段(每個區(qū)段長500 bp),共計20個區(qū)段,按照與基因末端坐標(biāo)由遠(yuǎn)到近的距離依次統(tǒng)計各區(qū)段中MITEs轉(zhuǎn)座子的插入次數(shù),對數(shù)據(jù)進(jìn)行可視化從而分析轉(zhuǎn)座子的分布情況與基因距離之間的關(guān)系。

1.6 MITEs轉(zhuǎn)座子插入的基因功能富集分析

使用R語言程序包ClusterProfile V3.8(https://bioconductor.org/packages/release/bioc/html/clusterProfiler.html)對MITEs轉(zhuǎn)座子鄰近的基因進(jìn)行GO富集分析,將得到的結(jié)果按分子功能(MF)、生物過程(BP)和細(xì)胞組成(CC)3部分分類,取最顯著的前20個term進(jìn)行展示比較,然后對MITEs轉(zhuǎn)座子鄰近的基因進(jìn)KEGG富集分析,取最顯著的前20個term進(jìn)行展示比較。

2 結(jié)果與分析

2.1 紅毛丹基因組中MITEs轉(zhuǎn)座子的鑒定及分類

本研究共鑒定出MITEs轉(zhuǎn)座子完整拷貝588條,全長325 kb,大約占紅毛丹全基因組總長(328 Mb)的0.10%,占紅毛丹轉(zhuǎn)座子總長度(131.95 Mb)的0.25%,與其他植物基因組中MITEs的占比相比,其含量相對較低。對邊界不完整的MITEs拷貝進(jìn)行人工矯正(圖1),根據(jù)MITEs轉(zhuǎn)座子結(jié)構(gòu)匯總表的分類標(biāo)準(zhǔn)對軟件MITE-Traker所生成的所有家族進(jìn)行分類。經(jīng)反復(fù)比對及RepeatMasker中重復(fù)序列數(shù)據(jù)庫和DeepTE軟件訓(xùn)練模型進(jìn)行深度學(xué)習(xí)驗(yàn)證,得到紅毛丹基因組中MITEs轉(zhuǎn)座子的超家族:PIF/Harbinger、Mutator、Ac-mMITE、hAT和Ginger,其余無法分類的轉(zhuǎn)座子歸為Unknown(UN)。各個超家族在紅毛丹基因組MITEs轉(zhuǎn)座子總量中所占的比例差異較大(表3),這可能與不同MITEs轉(zhuǎn)座子所對應(yīng)的自主轉(zhuǎn)座子的拷貝量和活性相關(guān),其中最大的兩個超家族為PIF/Harbinger和Mutator,分別有362條和108條完整拷貝,在紅毛丹基因組MITEs中的占比分別為64.87%和19.35%,最小的超家族為Ac-mMITE,只有10條完整拷貝,占比為1.80%。

表3 紅毛丹基因組中MITEs超家族統(tǒng)計Table 3 Statistics of superfamilies of MITEs in rambutan genome

圖1 MITEs轉(zhuǎn)座子手工矯正TIR序列對比圖Figure 1 Comparison plots for correction of MITEs TIR sequence

2.2 紅毛丹基因組中MITEs轉(zhuǎn)座子的AT含量

紅毛丹基因組中MITEs在總體上AT堿基含量的占比為70.63%,其中AT堿基含量比例最高的超家族為Ac-mMITE(78.22%),其次為PIF/Harbinger超家族(76.00%),因此這兩種超家族結(jié)構(gòu)穩(wěn)定性較低,形成二級結(jié)構(gòu)的趨勢較高(表4),有利于轉(zhuǎn)座活動。AT堿基數(shù)含量較低的超家族為Ginger(37.98%),遠(yuǎn)遠(yuǎn)低于總體水平,因此這類超家族形成二級結(jié)構(gòu)的趨勢較低。

表4 紅毛丹基因組中MITEs轉(zhuǎn)座子AT堿基含量統(tǒng)計Table 4 Statistics on AT bases content of MITEs in rambutan genome

2.3 紅毛丹基因組中MITEs的插入時間

紅毛丹基因組中MITEs轉(zhuǎn)座子共經(jīng)歷了5次轉(zhuǎn)座“爆發(fā)”(圖2),其中最早的一次“爆發(fā)”大約發(fā)生于17~18百萬年之前,規(guī)模最小,參與的超家族僅有hAT和PIF/Harbinger兩種;最近一次的轉(zhuǎn)座“爆發(fā)”則發(fā)生于1~2百萬年之前,MITEs插入數(shù)量僅次于規(guī)模最大的一次,有將近80個MITEs轉(zhuǎn)座子參與其中,包括Ginger、hAT、Mutator和PIF/Harbinger超家族;規(guī)模最大的一次轉(zhuǎn)座“爆發(fā)”發(fā)生于4~5百萬年之前,超過80個MITEs轉(zhuǎn)座子參與,雖然此次轉(zhuǎn)座“爆發(fā)”事件規(guī)模最大,但參與其中的超家族組成卻較為簡單,只有Mutator和PIF/Harbinger兩種超家族。值得注意的是,在轉(zhuǎn)座子的各個插入時期中幾乎每個時期都有超家族PIF/Harbinger的參與,并且在各個時期MITEs的含量上幾乎占據(jù)主導(dǎo)地位,而Ac-mMITE只參與到少數(shù)幾個時期的轉(zhuǎn)座事件中且所占比例極小,這與前文中對各個轉(zhuǎn)座子含量分析的結(jié)果相一致。

圖2 紅毛丹基因組中MITEs轉(zhuǎn)座子插入時間Figure 2 The insertion time of MITEs in rambutan genome

2.4 紅毛丹基因組MITEs各家族演化樹分析

在系統(tǒng)發(fā)育演化樹中(圖3),隸屬于同一個超家族的各個亞家族一般具有很近的演化關(guān)系,總體上各家族具有較好的聚類效果,這從側(cè)面反映了本研究中所應(yīng)用的MITEs轉(zhuǎn)座子分類方法的準(zhǔn)確率較高。從演化樹的分支數(shù)來看,PIF/Harbinger超家族的亞家族數(shù)最多,主要分為4個類群,這與該超家族作為轉(zhuǎn)座“爆發(fā)”事件的主要參與者經(jīng)歷了多輪擴(kuò)增有關(guān),其次為Mutator,主要分為2個類群,亞家族最少的超家族為Ac-mMITE和Ginger,這些結(jié)果也與它們在紅毛丹基因組中含量的高低順序及轉(zhuǎn)座“爆發(fā)”事件參與度相一致。未被鑒定出的4個超家族(unknown)中F20、F24、F28和F29分別與PIF/Harbinger、Mutaor、Ginger和hAT超家族具有較近的演化關(guān)系,但由于在基因組演化過程中這幾個超家族典型的結(jié)構(gòu)完整性已經(jīng)缺失,無法根據(jù)其TIR和TSD序列判斷其超家族的類型。

圖3 MITEs轉(zhuǎn)座子各家族進(jìn)化樹Figure 3 Phylogenetic tree of MITEs families

2.5 MITEs轉(zhuǎn)座子插入位置及插入密度分布分析

MITEs轉(zhuǎn)座子在紅毛丹基因組各個位置上的分布顯示出了較大的差異,在基因5′端(5′-flank)和基因3′端(3′-flank)的插入數(shù)量最多,分別為136個和137個,說明MITEs轉(zhuǎn)座子的插入主要分布在紅毛丹基因兩端的位置,且兩端插入數(shù)量基本持平(表5)。紅毛丹基因(gene)內(nèi)部插入的MITEs總數(shù)為35個,其中插入內(nèi)含子(intron)的MITEs數(shù)為35個,插入外顯子(exon)的MITEs數(shù)為2個,其中有2個MITEs轉(zhuǎn)座子插入?yún)^(qū)域橫跨相鄰的外顯子和內(nèi)含子區(qū)段。分析紅毛丹基因組中MITEs轉(zhuǎn)座子和基因的分布密度(圖4),發(fā)現(xiàn)MITEs轉(zhuǎn)座子在紅毛丹各條染色體上的總體插入比較分散,每條染色體上都有一定數(shù)量的插入,但是密度相對較低。MITEs轉(zhuǎn)座子在基因分布較多的區(qū)域密度相對較高,說明在紅毛丹基因組中該類轉(zhuǎn)座子具有插入到基因密度較高區(qū)域的趨勢。

表5 紅毛丹基因組中MITEs轉(zhuǎn)座子插入分布Table 5 Insertion distribution of MITEs in rambutan genome

圖4 基因和MITEs轉(zhuǎn)座子插入密度分布的比較Figure 4 Comparison of density distribution between genes and MITEs

2.6 MITEs轉(zhuǎn)座子在基因附近插入偏好性分析

由紅毛丹基因組中MITEs轉(zhuǎn)座子在基因附近插入位置的分布(圖5)可知,MITEs轉(zhuǎn)座子在基因兩端分布較多。在距離紅毛丹基因5′端5 kb范圍內(nèi),-500~0區(qū)段MITEs轉(zhuǎn)座子插入次數(shù)只有12次,隨著與基因的距離越來越遠(yuǎn),在-2 000~-1 501區(qū)段插入次數(shù)達(dá)到峰值,有34次轉(zhuǎn)座子的插入,隨后隨著距離增加插入次數(shù)逐漸減少。在距離紅毛丹基因3′端5 kb范圍內(nèi),0~500區(qū)段MITEs轉(zhuǎn)座子插入次數(shù)為0,隨著與基因距離越來越遠(yuǎn)次數(shù)逐漸增加,在3 501~4 000區(qū)段MITEs插入次數(shù)達(dá)到峰值,有27次轉(zhuǎn)座子的插入,隨后插入數(shù)逐漸減少。綜上,在基因兩側(cè)5 kb范圍以內(nèi),MITEs轉(zhuǎn)座子插入偏好的情況為,距離基因兩側(cè)最近的區(qū)段,MITEs轉(zhuǎn)座子的插入數(shù)最少,隨著距離增加在某一區(qū)段MITEs轉(zhuǎn)座子的插入偏好會達(dá)到峰值,然后又繼續(xù)減少,在總體趨勢上呈現(xiàn)出5 kb以內(nèi)從離基因較遠(yuǎn)的某一點(diǎn)開始,距離基因越近,MITEs插入偏好性越低的分布模式,說明距離基因較近的區(qū)域,MITEs的轉(zhuǎn)座活動受到了明顯的抑制。

圖5 MITEs轉(zhuǎn)座子在基因附近的分布情況Figure 5 Distribution of MITEs near the genes

2.7 MITEs轉(zhuǎn)座子關(guān)聯(lián)基因的功能富集分析

在MITEs插入到內(nèi)部的基因中,有4個含有GO編號(圖6),基因編號(表6)分別為:Nl01g01800、Nl01g10720、Nl01g15070和Nl10g00860,這些基因主要參與硫代葡萄糖苷的代謝及生物合成過程(GO:0019757和GO:0019758)、葡糖異硫氰酸鹽的代謝及生物合成過程(GO:0019760和GO:0019761)和S-糖苷的代謝及生物合成過程(GO:0016143和GO:0016144)。分子功能方面,這些基因與各種蛋白復(fù)合物的結(jié)合相關(guān)(GO:0005488、GO:0005515、GO:0008017、GO:0008092、GO:0015631、GO:0032403、GO:0044877和GO:0051011),其次為酶活性功能相關(guān)基因(GO:0003824、GO:0016853、GO:0016866和GO:0050486),而這些功能對于相關(guān)活性物質(zhì)的代謝及生物合成過程至關(guān)重要。在KEGG富集結(jié)果中(圖6),這些基因(表6)主要富集在次級代謝物生物合成、角質(zhì)、軟木脂蠟質(zhì)的生物合成、N端多糖的生物合成和硫代葡萄糖苷的生物合成等方面,這些代謝相關(guān)通路與上述GO生物過程和分子功能富集結(jié)果基本一致。

圖6 MITEs轉(zhuǎn)座子插入內(nèi)部基因功能富集分析結(jié)果Figure 6 Gene functional enrichment of inside inserted gene

在MITEs插入到5′端5kb范圍內(nèi)的基因中,有2個含有GO編號(圖7),基因編號(表6)分別為:N101g14070和N101g01800,這些基因主要參與生物 體 生 殖(GO:0000003、GO:0022414和 GO:0044702)及發(fā)育(GO:0032502、GO:0044767、GO:0009790和GO:0010154等)的相關(guān)過程。分子功能方面,這些基因與各種復(fù)合物的結(jié)合相關(guān)(GO:0000166、GO:0005515、GO:0005524和 GO:0008092等),這些功能是生物體生殖發(fā)育過程中必不可少的關(guān)鍵要素。在KEGG富集結(jié)果中(圖7),這些基因(表6)主要富集在次級代謝物的生物合成、類苯基丙烷的生物合成、氮代謝和氨基酸的生物合成等方面,是生物生殖和發(fā)育過程中必不可少的環(huán)節(jié)。

表6 MITEs關(guān)聯(lián)基因NR注釋結(jié)果Table 6 NR annotation of MITEs inserted genes

圖7 MITEs轉(zhuǎn)座子插入5'端側(cè)翼區(qū)的基因功能富集分析結(jié)果Figure 7 Gene functional enrichment of 5'-flank inserted gene

3 討論

轉(zhuǎn)座子最初由巴巴拉·邁克林托克于20世紀(jì)40年代在玉米(Zea mays)的第9條染色體中發(fā)現(xiàn)[32],然而在很長一段時間里轉(zhuǎn)座子這類重復(fù)序列被認(rèn)為是“垃圾基因”,直到近二十年來隨著全基因組測序技術(shù)的蓬勃發(fā)展為各個物種中轉(zhuǎn)座子的全面鑒定、分類及注釋帶來了先決條件,越來越多的轉(zhuǎn)座子結(jié)構(gòu)、功能和應(yīng)用方面的謎題被逐漸揭開[33-34],這時人們才發(fā)現(xiàn)轉(zhuǎn)座子對染色體結(jié)構(gòu)[35]、基因組重排[36]、基因組大小[37]、新基因的形成[38]以及基因表達(dá)調(diào)控[39]等方面都有著較為顯著的影響。

本研究中,MITEs屬于非自主型轉(zhuǎn)座子,必須依賴與其同源的自主轉(zhuǎn)座子編碼的轉(zhuǎn)座酶進(jìn)行移位,再插入到基因組的其他位點(diǎn),因此自主轉(zhuǎn)座子的活性及編碼序列完整性決定了其同源MITEs轉(zhuǎn)座子的轉(zhuǎn)座效率及拷貝量。由于轉(zhuǎn)座子受到選擇壓力,根據(jù)轉(zhuǎn)座子的發(fā)展史,自主轉(zhuǎn)座元件的活性及結(jié)構(gòu)完整性在基因組演化過程中可能會隨著時間發(fā)生消退,隨后其對應(yīng)的非自主轉(zhuǎn)座元件拷貝數(shù)也開始逐漸減少[40],紅毛丹中MITEs的含量相對較低,這可能與其基因組中自主DNA轉(zhuǎn)座子的活性[5]和其在雙子葉基因組三倍化事件之后沒有再發(fā)生過另外的全基因組復(fù)制事件有關(guān)[21]。在所有MITEs超家族中,PIF/Harbinger的相對含量占據(jù)主導(dǎo)地位且在各個MITEs的轉(zhuǎn)座“爆發(fā)”時期貢獻(xiàn)度最高,而AcmMITE相對含量最低且在MITEs的轉(zhuǎn)座“爆發(fā)”的各個時期貢獻(xiàn)度最低,因此可以推測PIF/Harbinger的自主轉(zhuǎn)座子在近期轉(zhuǎn)座子擴(kuò)增的過程中仍具有較高的活性和結(jié)構(gòu)完整性,而超家族Ac-mMITE的擴(kuò)增活性最低,其大部分同源的自主轉(zhuǎn)座子可能已經(jīng)失去活性及結(jié)構(gòu)完整性。另外,MITEs轉(zhuǎn)座“爆發(fā)”事件在一定程度上可以反映植物基因組演化歷史中的重要事件,并且在宿主基因組可塑性和轉(zhuǎn)錄應(yīng)答的改變上可能有一定的貢獻(xiàn)[41],比如Chen J.等在水稻的重組近交系中研究由轉(zhuǎn)座元件爆發(fā)所產(chǎn)生的基因組多樣性現(xiàn)象時發(fā)現(xiàn)Ping/mPing轉(zhuǎn)座子會影響其宿主基因組的多態(tài)性[35],說明轉(zhuǎn)座子對基因組的演化具有重要意義。由此可見,MITEs轉(zhuǎn)座子在紅毛丹基因組中的轉(zhuǎn)座活動必然會對基因組結(jié)構(gòu)和演化活動造成一定的影響。

在MITEs插入內(nèi)部的基因功能富集分析中,MITEs插入到某些通路相關(guān)基因的內(nèi)部會改變該基因的結(jié)構(gòu),從而最終影響到通路本身,甚至改變宿主的某些性狀,Wei L.等在水稻的赤霉素及油菜素甾醇合成途徑中發(fā)現(xiàn),如果該通路的關(guān)鍵基因有MITEs的插入會影響其旗葉夾角和水稻株高等相關(guān)性狀[42]。在蔬菜和水果中有大量以葡萄糖苷形式存在的非揮發(fā)性風(fēng)味前體物質(zhì),是蔬菜水果增香的重要大分子[43],而MITEs轉(zhuǎn)座子在這些化合物通路相關(guān)基因的插入可能會改變葡萄糖苷、葡糖異硫氰酸鹽和S-糖苷的代謝及生物合成相關(guān)基因的編碼序列,最終對紅毛丹相關(guān)風(fēng)味等重要農(nóng)藝性狀造成影響。在MITEs插入到5′端基因的功能富集分析中,有兩個基因主要與生物體的生殖發(fā)育等過程相關(guān),而基因5′端是基因順式調(diào)控元件所在的區(qū)域,MITEs轉(zhuǎn)座子在這些區(qū)域的插入可能會對紅毛丹生殖發(fā)育相關(guān)的表型造成影響,如Y.Lee等在玉米中研究一種轉(zhuǎn)座子監(jiān)督機(jī)制保護(hù)雄性玉米植株生育能力的過程中發(fā)現(xiàn),轉(zhuǎn)座子的轉(zhuǎn)座活動會增加基因組的不穩(wěn)定性,從而可能產(chǎn)生雄性不育的表型[44]。在MITEs插入位置分析中,插入到基因內(nèi)部的MITEs比例很低,其中大多數(shù)MITEs插入到了內(nèi)含子當(dāng)中,會在被插入基因的結(jié)構(gòu)上產(chǎn)生一定程度的改變,甚至影響可變剪切,少數(shù)MITEs插入到了外顯子中,在這些基因的功能方面可能會造成直接影響。

MITEs在紅毛丹基因組中插入密度與基因分布密度具有較高的相關(guān)性,而且大量MITEs插入到了紅毛丹基因的5′端和3′端附近,這種大量在基因附近的轉(zhuǎn)座活動可能會在基因表達(dá)調(diào)控網(wǎng)絡(luò)的水平上對基因功能產(chǎn)生影響,最終可能改變宿主表型,產(chǎn)生表型可塑性的改變,如E.Butelli等在血橙的表型研究中發(fā)現(xiàn)當(dāng)Copia-like反轉(zhuǎn)座子插入Ruby基因編碼區(qū)上游并受到一定寒冷誘導(dǎo)時,會使其產(chǎn)生紅色果肉的表型[45]。同樣,紅毛丹中MITEs轉(zhuǎn)座子在這些區(qū)域的轉(zhuǎn)座事件可能在轉(zhuǎn)錄和后轉(zhuǎn)錄水平上對其基因的表達(dá)調(diào)控有一定的影響,至于影響水平的高低,是否會改變相關(guān)的性狀,需要后續(xù)對其進(jìn)行更加詳細(xì)的分析和實(shí)驗(yàn)驗(yàn)證,Chen L.等學(xué)者在菠蘿基因組及其馴化過程的研究中發(fā)現(xiàn),MITEs轉(zhuǎn)座子在菠蘿基因附近的插入位置具有高度多樣性,推測這一現(xiàn)象在菠蘿馴化過程中可能會通過體細(xì)胞突變作為菠蘿新性狀形成的主要來源之一[46]。隨著越來越多MITEs轉(zhuǎn)座子的鑒定及相關(guān)分析的細(xì)化,MITEs在其宿主基因組的演化及相關(guān)性狀的多樣性上所扮演的角色會逐漸明朗,對這些信息及相關(guān)效應(yīng)的充分利用可以為其宿主基因組演化及性狀改良等方面的研究帶來更多的途徑。

猜你喜歡
轉(zhuǎn)座子基因組基因
毛竹Mariner-like element自主轉(zhuǎn)座子的鑒定與生物信息學(xué)分析*
Frog whisperer
牛參考基因組中發(fā)現(xiàn)被忽視基因
血清HBV前基因組RNA的研究進(jìn)展
淅川烏骨雞全基因組轉(zhuǎn)座子的鑒定與分析
修改基因吉兇未卜
紫花白及基因組DNA提取方法的比較
創(chuàng)新基因讓招行贏在未來
花葉矢竹轉(zhuǎn)錄組中的轉(zhuǎn)座子表達(dá)分析
基因
呼玛县| 郧西县| 大姚县| 靖边县| 宜宾县| 陵川县| 江北区| 长岭县| 张家界市| 阿克苏市| 东海县| 沅陵县| 玉溪市| 芷江| 鄂托克前旗| 牟定县| 乌苏市| 汉中市| 康乐县| 凯里市| 资源县| 邵武市| 古田县| 稷山县| 安顺市| 丰顺县| 岫岩| 荣成市| 西宁市| 洮南市| 彭州市| 于都县| 于田县| 临沭县| 托克逊县| 威海市| 同仁县| 布尔津县| 尚义县| 专栏| 云南省|