郭 憲,包鵬甲,胡顯忠,丁學(xué)智,吳曉云,閻 萍,裴 杰
(1.中國(guó)農(nóng)業(yè)科學(xué)院蘭州畜牧與獸藥研究所,蘭州 730050;2.甘肅省科學(xué)院,蘭州 730000)
遺傳育種與繁殖
西藏亞?wèn)|牦牛線(xiàn)粒體DNA分析及系統(tǒng)進(jìn)化研究
郭 憲1,包鵬甲1,胡顯忠2,丁學(xué)智1,吳曉云1,閻 萍1,裴 杰1
(1.中國(guó)農(nóng)業(yè)科學(xué)院蘭州畜牧與獸藥研究所,蘭州 730050;2.甘肅省科學(xué)院,蘭州 730000)
應(yīng)用基因測(cè)序技術(shù)對(duì)西藏亞?wèn)|牦牛線(xiàn)粒體基因組進(jìn)行測(cè)序,并對(duì)測(cè)序數(shù)據(jù)質(zhì)控與修剪及基因組組裝、精細(xì)注釋、功能注釋與分析。結(jié)果表明:亞?wèn)|牦牛線(xiàn)粒體基因組大小約為15 389 bp,包含13個(gè)PCGs、21個(gè)tRNAs、2個(gè)rRNAs及1個(gè)D-loop,其A+T堿基含量為60.86%,G+C堿基含量為39.14%;編碼基因(PCGs、tRNAs&rRNAs)片段總長(zhǎng)度為14 495 bp,占基因組總長(zhǎng)度的94.19%;同時(shí),分析了亞?wèn)|牦牛與其他11個(gè)物種間的進(jìn)化關(guān)系,發(fā)現(xiàn)亞?wèn)|牦牛與甘南牦牛歸為一類(lèi),親緣關(guān)系最近。西藏亞?wèn)|牦牛線(xiàn)粒體DNA分析為研究牦牛群體遺傳、起源與分子進(jìn)化提供了技術(shù)參考。
牦牛;線(xiàn)粒體DNA;系統(tǒng)進(jìn)化
牦牛是分布于青藏高原及其毗鄰地區(qū)的特有牛種資源,可提供肉、乳、毛絨等,是高寒牧區(qū)的基本生產(chǎn)生活資料。牦牛對(duì)高寒、缺氧等生態(tài)環(huán)境具有極強(qiáng)的適應(yīng)能力,在低氧適應(yīng)遺傳上是一個(gè)極為寶貴的基因庫(kù),研究牦?;蚪M和親緣關(guān)系對(duì)牦牛遺傳資源的保護(hù)與合理開(kāi)發(fā)利用具有重要的意義。線(xiàn)粒體DNA是分子生物學(xué)研究中的重要分子標(biāo)志之一。亞?wèn)|牦牛線(xiàn)粒體基因組測(cè)序分析及系統(tǒng)進(jìn)化研究有助于更好地了解牦牛特別是西藏牦牛群體遺傳進(jìn)展與進(jìn)化歷史。
1.1 樣品采集與基因組DNA提取
從西藏自治區(qū)日喀則地區(qū)亞?wèn)|縣放牧牦牛群中,隨機(jī)選擇成年健康的母牦牛6頭,采集血液樣品,冷凍保存帶回實(shí)驗(yàn)室。采用動(dòng)物血液基因組DNA提取試劑盒(Tiangen)提取樣品基因組DNA,用1%的瓊脂糖凝膠電泳檢測(cè)DNA純度,-20℃保存?zhèn)溆谩?/p>
1.2 PCR擴(kuò)增和目的基因測(cè)序
根據(jù)GenBank公布的普通牛線(xiàn)粒體DNA全序列(登錄號(hào)NC_006853)設(shè)計(jì)6對(duì)引物,引物序列及擴(kuò)增片段大小見(jiàn)表1[生工生物工程(上海)股份有限公司合成]。PCR擴(kuò)增反應(yīng)條件:94℃預(yù)變性4 min,然后94℃變性30 s、55℃退火40 s、72℃延伸4 min,循環(huán)30次,最后72℃延伸10 min。PCR反應(yīng)總體積為50μL,其中LA Taq預(yù)混合酶25μL,DNA模板2μL(100 ng/μL),上下游引物各1μL(10 pmol/μL),滅菌ddH2O 21μL。PCR擴(kuò)增后,其產(chǎn)物在1%的瓊脂糖凝膠電泳分離,用膠回收試劑盒回收、純化PCR產(chǎn)物后,送往百邁客生物科技有限公司,按照Illumina公司提供的標(biāo)準(zhǔn)protocol執(zhí)行,利用樣品的基因組 DNA構(gòu)建 500 bp文庫(kù),在 Hiseq 2500測(cè)序平臺(tái)雙向測(cè)序。
表1 牦牛mtDNA擴(kuò)增引物
1.3 數(shù)據(jù)處理與分析
對(duì)測(cè)序產(chǎn)生的原始reads進(jìn)行評(píng)估,再通過(guò)過(guò)濾低質(zhì)量、糾錯(cuò)等方法得到高質(zhì)量的reads,scaffold補(bǔ)gap引物序列見(jiàn)表2,反應(yīng)條件和程序同1.2。然后使用Velvet軟件[1]進(jìn)行基因組的組裝,使用Repeat Masker軟件[2]對(duì)細(xì)菌基因組進(jìn)行重復(fù)序列的屏蔽,使用軟件DOGMA(http://dogma.ccbb.utexas.edu/)對(duì)組裝后的基因組進(jìn)行基因預(yù)測(cè),使用GENEIOUS R8(Biomatters Ltd.,Auckland,New Zealand)軟件對(duì)線(xiàn)粒體基因組進(jìn)行注釋?zhuān)⑼ㄟ^(guò)MEGA軟件[3]構(gòu)建進(jìn)化樹(shù),研究物種間的進(jìn)化關(guān)系。
表2 scaffold補(bǔ)gap引物序列
1.4 基因功能注釋
利用預(yù)測(cè)得到的基因序列與COG[4]、KEGG[5]、GO[6]等功能數(shù)據(jù)庫(kù)做BLAST比對(duì),進(jìn)行基因的COG功能富集分析、GO功能富集分析等基因功能注釋分析。
2.1 基因組組裝結(jié)果
利用得到的高質(zhì)量Pair-end數(shù)據(jù)基于Kmer分布圖進(jìn)行基因組大小的評(píng)估,17-mer總數(shù)為5 272 946 280,平均kmer深度為329 100,估計(jì)基因組大小約16 022 bp。使用Velvet軟件對(duì)高質(zhì)量數(shù)據(jù)進(jìn)行組裝,共得到5條1 kb以上的基因組序列,將5條contig根據(jù)與近緣物種比對(duì)后的位置信息,拼裝成一條基因組序列,總長(zhǎng)15 389 bp,具體見(jiàn)表3。A+T堿基含量為60.86%,G+C堿基含量為39.14%。編碼基因(PCGs、tRNAs& rRNAs)片段總長(zhǎng)度為15 389 bp,占基因組總長(zhǎng)度的94.19%。
表3 牦牛線(xiàn)粒體基因組注釋
2.2 基因組注釋
使用RepeatMasker軟件對(duì)細(xì)菌基因組進(jìn)行重復(fù)序列屏蔽,預(yù)測(cè)到亞?wèn)|牦牛簡(jiǎn)單重復(fù)序列占30.1%,小重復(fù)序列占69.9%。通過(guò)DOGMA軟件分析,亞?wèn)|牦牛含13個(gè)編碼基因序列,23個(gè)非編碼基因序列(2個(gè)rRNA和21個(gè)tRNA),具體基因組注釋結(jié)果見(jiàn)圖1。
2.3 基因功能注釋
利用預(yù)測(cè)得到的基因序列與COG、GO等功能數(shù)據(jù)庫(kù)做BLAST比對(duì),進(jìn)行基因的COG功能富集分析、GO功能富集分析等基因功能注釋分析,結(jié)果分別見(jiàn)圖2、圖3。
圖1 亞?wèn)|牦牛線(xiàn)粒體基因組注釋結(jié)果示意圖
圖2 COG分類(lèi)統(tǒng)計(jì)結(jié)果
圖3 GO注釋聚類(lèi)統(tǒng)計(jì)結(jié)果
2.4 物種間進(jìn)化關(guān)系分析
使用亞?wèn)|牦牛線(xiàn)粒體和其他11個(gè)物種線(xiàn)粒體的核酸序列,通過(guò)MEGA軟件構(gòu)建進(jìn)化樹(shù),研究物種間的進(jìn)化關(guān)系,12個(gè)線(xiàn)粒體之間的進(jìn)化關(guān)系見(jiàn)圖4。結(jié)果顯示,亞?wèn)|牦牛(156)與甘南牦牛(登錄號(hào)KJ704989)歸為一類(lèi),親緣關(guān)系最近。與大通牦牛(GenBank登錄號(hào)KJ463418)、無(wú)角牦牛(GenBank登錄號(hào)KM658599)親緣關(guān)系較近,與野牦牛(GenBank登錄號(hào)KM233417)次之,與其他牛屬物種間均較遠(yuǎn)。
圖4 基于亞?wèn)|牦牛線(xiàn)粒體序列(156)的系統(tǒng)發(fā)育樹(shù)
線(xiàn)粒體是一種存在于所有真核動(dòng)物細(xì)胞中的半自主性細(xì)胞器,由內(nèi)膜、外模、基質(zhì)和突出的嵴構(gòu)成。在線(xiàn)粒體內(nèi)部存在著線(xiàn)粒體自身的遺傳物質(zhì)——線(xiàn)粒體DNA(mitochondrial DNA,mtDNA)和一些與有氧呼吸有關(guān)的酶[7]。動(dòng)物線(xiàn)粒體DNA的特點(diǎn)是:①分子量小、結(jié)構(gòu)簡(jiǎn)單、編碼效率高。線(xiàn)粒體DNA一般為長(zhǎng)度約5μm的共價(jià)雙鏈環(huán)狀分子,結(jié)構(gòu)緊湊。②母系遺傳,基因間重組小。線(xiàn)粒體DNA遵循母性遺傳,即子代的線(xiàn)粒體DNA完全是來(lái)自于母本。③變異率高,進(jìn)化速度快。線(xiàn)粒體DNA是直接裸露的環(huán)狀DNA分子。D-Loop區(qū)位于tRNApro和tRNAphe之間,因不編碼基因,其產(chǎn)生的突變可以不斷地得到積累而對(duì)線(xiàn)粒體的功能不產(chǎn)生影響,因此具有更大的進(jìn)化速率。④遺傳密碼特殊。⑤無(wú)組織特異性。本研究中,測(cè)得西藏亞?wèn)|牦牛線(xiàn)粒體長(zhǎng)度為15 389 bp,包含13個(gè)PCGs、21個(gè)tRNAs、2個(gè)rRNAs及1個(gè)D-loop,其A+T堿基含量為60.86%,G+C堿基含量為39.14%。編碼基因(PCGs、tRNAs&rRNAs)片段總長(zhǎng)度為14 495 bp,占基因組總長(zhǎng)度的94.19%。本研究獲得的結(jié)果,與其他大多數(shù)哺乳動(dòng)物的線(xiàn)粒體DNA結(jié)構(gòu)基本一致,為研究西藏亞?wèn)|牦牛的群體遺傳和進(jìn)化歷史提供了基礎(chǔ)數(shù)據(jù)。
線(xiàn)粒體DNA在牛上的研究與應(yīng)用非常廣泛,主要是通過(guò)對(duì)線(xiàn)粒體DNA遺傳變異產(chǎn)生的多態(tài)性的研究,以了解牛品種的進(jìn)化歷史、分類(lèi)地位和相互關(guān)系,并應(yīng)用于品種種質(zhì)鑒定、系統(tǒng)進(jìn)化、物種起源與分化等方面,為資源保護(hù)和品種改良及利用提供技術(shù)參考。本研究通過(guò)對(duì)亞?wèn)|牦牛線(xiàn)粒體DNA的COG、GO分析,證實(shí)了線(xiàn)粒體在體內(nèi)處于新陳代謝和能量轉(zhuǎn)換的中心地位,可產(chǎn)生體內(nèi)約90%的ATP。GO總共有3個(gè)本體(ontology),分別描述基因的分子功能(molecular function)、所處的細(xì)胞位置(cellular component)、參與的生物過(guò)程(biologicalprocess)。本研究同時(shí)分析了亞?wèn)|牦牛與其他11個(gè)物種之間的進(jìn)化樹(shù)關(guān)系,結(jié)果表明亞?wèn)|牦牛與甘南牦牛歸為一類(lèi),說(shuō)明其親緣關(guān)系最近;與大通牦、無(wú)角牦牛親緣關(guān)系較近,與野牦牛次之,與其他牛屬物種間均較遠(yuǎn)。
線(xiàn)粒體DNA是一種核外遺傳物質(zhì),與核DNA相比,具有分子量小、結(jié)構(gòu)簡(jiǎn)單、進(jìn)化速度快、母性遺傳、無(wú)組織特異性及提取方便等特點(diǎn),使得其成為研究動(dòng)物起源進(jìn)化及群體遺傳分化的理想對(duì)象。隨著現(xiàn)代分子生物學(xué)技術(shù)的發(fā)展,人們對(duì)線(xiàn)粒體和線(xiàn)粒體DNA的研究將更加深入,從而使研究牦牛的起源進(jìn)化、系統(tǒng)發(fā)育和種質(zhì)資源保護(hù)更有利于人類(lèi)需要的方向發(fā)展。
[1] Zerbino D R,Birney E.Velvet:algorithms for the de novo short read assembly using de Bruijn graphs[J].Genome Research,2008,18:821-829.
[2] Chen N.Using repeat masker to identify repetitive elements in genomic sequences[M].Curr Protoc Bioinformatics,USA:John Wiley&Songs,Inc.2004.
[3] Koichiro Tamura,Joel Dudley,Masatoshi Nei,et al.MEGA4:Molecular Evolutionary Genetics Analysis(MEGA)software version 4.0[J].Molecular Biology and Evolution,2007,24:1596-1599.
[4] Tatusov R L,Galperin MY,Natale D A,et al.The COG database:a tool for genome-scale analysis of protein functions and evolution[J]. Nucleic Acids Research,2000,28(1):33-36.
[5] Kanehisa M,Goto S,Kawashima S,etal.The KEGG resource for deciphering the genome[J].Nucleic Acids Research,2004,32(Sl):277-280.
[6] Ashburner M,Ball C A,Blake J A,et al.Gene Ontology:tool for the unification ofbiology[J].Nature Genetics,2000,25(1):25-29.
[7] 孟彥,許尚忠,昝林森.線(xiàn)粒體DNA在牛遺傳育種的應(yīng)用[J].家畜生態(tài)學(xué)報(bào),2006,27(1):92-95.
Analysis on Phyletic Evolution and MitochondrialDNA of Yadong Yak(Bosgrunniens)in Tibet
Guo Xian,Yan Ping,PeiJie,etal
(Lanzhou Institute ofHusbandry and PharmaceuticalSciences,Chinese Academy ofAgriculturalSciences,Lanzhou 730050,China)
The complete mitochondrialgenome sequence of Yadong yak(Bos grunniens)in Tibethas been sequenced by gene sequencing technique,the sequencing data were analyzed by quality control and pruning,genome assembly,fine annotation,functionalannotation and analysis.The resultsshowed thatthe complete mitochondrialgenome ofYadongyak in Tibetwas15 389 bp,which contained 13 protein-coding genes,21 tRNA genes,2 rRNA genes and a non-coding controlregion(D-loop region).The overallbase paircomposition were 60.86%A+T and 39.14%G+C,the totallength ofcoding genes(PCGs,tRNAs&rRNAs)were 14 495 bp,accounting for 94.19%ofthe totallength ofgenome.Atthe same time,the mtDNA of Yadong yak were analyzed with otherevolutionary relationships between 11 species,the resultshowed that Yadong yak and Gannan yak were classified as a class. The mitogenome sequence of Yadong yak would contribute to better population genetics protection and evolution understanding of Bos grunniens.
yak;mitochondrialDNA;phyletic evolution
S823.2
A
2095-3887(2017)05-0001-06
10.3969/j.issn.2095-3887.2017.05.001
2017-07-17
現(xiàn)代農(nóng)業(yè)(肉牛牦牛)產(chǎn)業(yè)技術(shù)體系建設(shè)專(zhuān)項(xiàng)(CARS-37);甘肅省科技支撐計(jì)劃項(xiàng)目(1504NKCA052);中國(guó)農(nóng)業(yè)科學(xué)院創(chuàng)新工程(CAAS-ASTIP-2014-LIHPS-01)
郭憲(1978-),男,副研究員,博士。研究方向:動(dòng)物遺傳資源與繁育。
閻萍,研究員,博士;裴杰,副研究員,博士。