熊和麗,和曉明,李 靜,3,彭超超,劉興能,岳 丹,朱俊紅,鄧衛(wèi)東*
(1.云南農(nóng)業(yè)大學(xué) 動(dòng)物科技學(xué)院,云南 昆明 650201;2.云南省畜牧獸醫(yī)科學(xué)院,云南 昆明 650224;3.公安部昆明警犬基地,云南 昆明 650201)
2001年,由美國(guó)國(guó)家人類基因組研究中心聯(lián)合國(guó)際合作機(jī)構(gòu)發(fā)起的人類基因組計(jì)劃發(fā)表人類基因組草圖[1], 并于2003年完成了人類基因組計(jì)劃的測(cè)序工作,這個(gè)計(jì)劃繪制出人類基因組30億對(duì)堿基,受此計(jì)劃的引領(lǐng)和啟示,各國(guó)先后啟動(dòng)了動(dòng)物基因組計(jì)劃。隨著測(cè)序技術(shù)的發(fā)展及測(cè)序成本的降低,目前已有數(shù)百種動(dòng)植物完成了參考基因組序列測(cè)定。綿羊作為人類重要的經(jīng)濟(jì)動(dòng)物,其基因組序列的破譯使得在基因組水平進(jìn)行重要性狀功能基因的鑒定成為可能,這不僅有益于深入認(rèn)識(shí)復(fù)雜性狀的遺傳學(xué)機(jī)制,更有助于后期的分子育種實(shí)踐。
基因組denovo測(cè)序指在不依賴參考基因組的情況下對(duì)某物種進(jìn)行基因組測(cè)序,利用生物信息學(xué)方法進(jìn)行拼接、組裝,繪制出該物種的全基因組序列圖譜[2],為該物種提供參考基因組,將大大推進(jìn)這個(gè)物種后續(xù)的研究。
2010年,國(guó)際綿羊基因組協(xié)會(huì)利用Roche 454 FLX對(duì)6只不同品種的雌性綿羊進(jìn)行全基因組測(cè)序并參考牛基因組進(jìn)行組裝,組裝版本為Ovis_aries_1.0,測(cè)序深度3×, Scaffold N50 為34 Mb,Contig N50 685 bp,Gap數(shù)為1.66 Gb,基因組覆蓋度42%。研究人員在此基因組的基礎(chǔ)上開發(fā)出DNA芯片,并為來(lái)自全世界的74個(gè)品種近3 000只綿羊進(jìn)行SNP 分型,并成功鑒定造成特賽爾綿羊小眼畸形、軟骨發(fā)育不全、派倫代爾綿羊黃脂以及造成無(wú)角的基因[3]。
2014年,由歐盟第七框架計(jì)劃( the EU 7th Framework programme)組織的NextGen project提交了對(duì)一只雌性摩弗倫綿羊進(jìn)行全基因組測(cè)序及組裝的序列,版本號(hào)為Oori1,基因組組裝到Scaffold水平,測(cè)序深度達(dá)95×,Scaffold N50 為2 Mb,Contig N50 為39 kb,Gap數(shù)為159 Mb,基因組覆蓋度94%,相較于Ovis_aries_1.0,基因組覆蓋度大大提高,但是Scaffold N50很低。
2014年,由中國(guó)科學(xué)院昆明動(dòng)物所領(lǐng)銜的綿羊基因組計(jì)劃公布了組裝到染色體水平的綿羊全基因組序列,此計(jì)劃于2009年啟動(dòng),其中中國(guó)科學(xué)院昆明動(dòng)物研究所與深圳華大基因聯(lián)合測(cè)序1頭雌性特克塞爾綿羊,而英國(guó)羅斯林研究所測(cè)序1頭雄性特克塞爾綿羊,以及其他單位合作組裝分析,歷時(shí)5年完成了綿羊基因組的測(cè)序、組裝及分析工作[4],版本號(hào)為Oar_v4.0,這一版本為Oar v3.1的升級(jí)版,此次測(cè)序在原二代的基礎(chǔ)上增加三代測(cè)序方法(Illumina GAII; 454; PacBio RSII)進(jìn)行測(cè)序和組裝,測(cè)序深度達(dá)166×, Scaffold N50 為100 Mb,Contig N50為150 kb,組裝后形成2.61 Gb基因組,注釋到25 197個(gè)基因,其中20 921個(gè)是蛋白編碼基因。組裝后經(jīng)質(zhì)量驗(yàn)證,超過(guò)99.3%的測(cè)序個(gè)體的mRNA可以映射到Oar v3.1 上(平均水平為98.4%),說(shuō)明組裝質(zhì)量達(dá)到較理想的水平。綿羊高質(zhì)量全基因組的問(wèn)世,通過(guò)將綿羊和山羊與哺乳動(dòng)物保守的4 850個(gè)單拷貝同源基因序列聚類分析并推斷出山羊和綿羊的分化時(shí)間約在430萬(wàn)年前,正是新第三紀(jì)后期C4草增多的時(shí)期;研究人員在綿羊的EDC區(qū)域中首次鑒別到兩種在反芻動(dòng)物中發(fā)生特異蛋白結(jié)構(gòu)改變,且僅在瘤胃中特異高表達(dá)的結(jié)構(gòu)蛋白,這兩個(gè)結(jié)構(gòu)蛋白發(fā)揮瘤胃表面基板的作用,通過(guò)轉(zhuǎn)谷氨酰胺酶介導(dǎo)交聯(lián)瘤胃表達(dá)的角蛋白,從而構(gòu)成瘤胃壁黏膜層堅(jiān)韌的角質(zhì)化表面,參與瘤胃表層角蛋白角質(zhì)化形成;研究人員還發(fā)現(xiàn),除了肝臟,反芻動(dòng)物的皮膚也是重要的脂類代謝器官。綿羊皮膚的轉(zhuǎn)錄組數(shù)據(jù)表明,MOGAT2和MOGAT3發(fā)生了高表達(dá),綿羊皮膚中MOGAT代謝通路降低了甘油三酯合成和磷脂酸合成、皮膚屏障脂質(zhì)合成和囊泡發(fā)育調(diào)控的耦合,有利于羊毛的生長(zhǎng)。高質(zhì)量的綿羊基因組和轉(zhuǎn)錄組序列圖譜的繪制揭示了反芻動(dòng)物瘤胃進(jìn)化以及羊絨脂類代謝相關(guān)遺傳學(xué)機(jī)制,為推動(dòng)綿羊重要經(jīng)濟(jì)性狀關(guān)聯(lián)基因的鑒定研究奠定遺傳基礎(chǔ)[5]。
隨著測(cè)序技術(shù)和組裝技術(shù)的不斷發(fā)展和成熟,2017年貝勒醫(yī)學(xué)院人類基因組測(cè)序中心完成對(duì)1只雌性Rambouillet綿羊從頭測(cè)序,獲得僅有約380 kb 空白序列的高質(zhì)量綿羊基因組精細(xì)圖譜(Oar_rambouillet_v1.0),Scaffold N50達(dá)到109 Mb,Contig N50達(dá)到2.5 Mb,基因組大小為2.87 Gb,包括線粒體基因組。注釋到33 125個(gè)基因,42 391個(gè)蛋白。高質(zhì)量的綿羊基因組序列圖譜和功能注釋的完成,為綿羊基因組學(xué)研究提供了高質(zhì)量的參考標(biāo)準(zhǔn),為解析綿羊復(fù)雜性狀的遺傳機(jī)制奠定了基礎(chǔ)[6],將進(jìn)一步推進(jìn)綿羊分子育種的研究及應(yīng)用。
全基因組重測(cè)序是對(duì)已有參考基因組的物種進(jìn)行不同個(gè)體的全基因組測(cè)序,通過(guò)將測(cè)序個(gè)體的序列與參考基因組進(jìn)行比對(duì),獲得測(cè)序個(gè)體的單核苷酸多態(tài)性位點(diǎn)(SNP)、插入缺失位點(diǎn)(InDel)、結(jié)構(gòu)變異位點(diǎn)(SV)和拷貝數(shù)變異位點(diǎn)(CNV)[7-9],獲得個(gè)體或群體分子遺傳特征,進(jìn)行動(dòng)物重要經(jīng)濟(jì)性狀候選基因預(yù)測(cè)及遺傳進(jìn)化分析[10]。
近年來(lái),全基因組重測(cè)序在檢測(cè)遺傳變異、群體進(jìn)化與適應(yīng)性研究、功能基因定位及遺傳圖譜構(gòu)建等方面的研究在動(dòng)植物上得到廣泛應(yīng)用并取得了重要成果。Lan等[11]通過(guò)對(duì)6頭金川牦牛進(jìn)行重測(cè)序鑒定出7 693 689個(gè)SNP,結(jié)合考古數(shù)據(jù)推測(cè)金川牛的馴化起源于6 000年前,通過(guò)選擇清除分析發(fā)現(xiàn)金川牦牛有339個(gè)顯著受到正向選擇的基因,其中一些與生理適應(yīng),組蛋白和與品種優(yōu)良生產(chǎn)特性有關(guān),研究為金川牛的進(jìn)化、分子起源和獨(dú)特性狀提供了基礎(chǔ)。Gou等[12]通過(guò)對(duì)6個(gè)品種的60只犬進(jìn)行全基因組重測(cè)序,平均每個(gè)樣品15×測(cè)序深度,運(yùn)用選擇分析的方法在不同海拔犬類的基因組中鑒定到了EPAS1基因與藏獒的高原低氧適應(yīng)性有關(guān)。Benjelloun等[13]對(duì)摩洛哥本地山羊多樣性及選擇信號(hào)的研究,研究通過(guò)對(duì)摩洛哥本地表型及地理分布上具有代表性的3個(gè)品種44只山羊進(jìn)行全基因組重測(cè)序,進(jìn)行選擇分析發(fā)現(xiàn)與適應(yīng)當(dāng)?shù)貧夂驐l件相關(guān)的選擇基因,3個(gè)山羊品種具有豐富的遺傳資源,為當(dāng)?shù)仄贩N保護(hù)提供遺傳基礎(chǔ)。Li等[14]對(duì)來(lái)自內(nèi)蒙古及遼寧的兩個(gè)優(yōu)秀絨用山羊品種的70只山羊進(jìn)行全基因組重測(cè)序,通過(guò)選擇分析鑒定到與羊毛纖維相關(guān)的基因如FGF5,SGK3,IGFBP7,OXTR及ROCK1,研究結(jié)果為絨用山羊及其他山羊品種的育種提供了分子基礎(chǔ)。
目前,將全基因組重測(cè)序應(yīng)用于綿羊群體進(jìn)化及適應(yīng)性的研究取得了重要成果。Yang等[15]對(duì)綿羊處于極端環(huán)境的適應(yīng)性進(jìn)行研究,通過(guò)對(duì)來(lái)自中國(guó)的21個(gè)品種的77只綿羊進(jìn)行全基因組重測(cè)序,對(duì)中國(guó)地方品種綿羊的群體結(jié)構(gòu)和種群歷史動(dòng)態(tài)進(jìn)行了研究,群體遺傳結(jié)構(gòu)分析表明中國(guó)綿羊起源于北方,可分為3個(gè)遺傳群體:青海西藏群,云貴高原群,東北群;同時(shí)將這些綿羊分為來(lái)自高原和平原、干旱沙漠和濕潤(rùn)、高海拔和低海拔的3個(gè)比較群體,通過(guò)選擇清除分析,篩選到了112個(gè)和75個(gè)分別與高原和沙漠極端環(huán)境適應(yīng)性相關(guān)的基因,并對(duì)這些基因進(jìn)行了GO功能類別和信號(hào)通路分析,結(jié)果表明在高原環(huán)境下受選擇基因與高原低氧環(huán)境的耐受反應(yīng)有關(guān);在沙漠環(huán)境下受選擇基因則與水分的重吸收有關(guān),同時(shí)能量代謝和體型大小的變異也與綿羊適應(yīng)高原、沙漠等極端環(huán)境有關(guān)。這項(xiàng)研究發(fā)現(xiàn)了綿羊?yàn)榭焖龠m應(yīng)極端環(huán)境而引起的基因變化,為今后應(yīng)對(duì)氣候變化的育種研究提供了分子基礎(chǔ)。Naval-Sanchez等[16]運(yùn)用全基因組重測(cè)序分析綿羊馴化過(guò)程中受到選擇的基因,通過(guò)選用來(lái)自世界6個(gè)地理分布,具有不同表型的43個(gè)綿羊品種的67只家養(yǎng)綿羊及其野生祖先摩弗倫羊17只進(jìn)行全基因組重測(cè)序,測(cè)序深度達(dá)11.82×,通過(guò)選擇清除分析發(fā)現(xiàn)與野生綿羊相比,家養(yǎng)綿羊具有較低的核酸多樣性及各品種間存在較大差異,同時(shí)篩選到眾多綿羊馴化過(guò)程中受到選擇的基因,如與體重和奶產(chǎn)量相關(guān)的SOCS2,與毛色相關(guān)的ITCH-ASIP,與繁殖相關(guān)的VEGFA基因;通過(guò)GO功能富集分析發(fā)現(xiàn)因馴化及人工選擇而形成的生物學(xué)變化表現(xiàn)在體型大小的改變,脂肪代謝的變化,以及性成熟時(shí)間等。同樣也是馴化研究, Alberto等[17]對(duì)馴化中心的亞洲摩弗倫野綿羊、Bezoar ibex野山羊以及家養(yǎng)綿羊和山羊進(jìn)行全基因組重測(cè)序,通過(guò)選擇分析發(fā)現(xiàn)綿羊和山羊在馴化以及人工選擇的過(guò)程中受到選擇的基因區(qū)域分別為46個(gè)和44個(gè),其中20個(gè)區(qū)域在綿羊和山羊是相同的,而且山羊和綿羊呈現(xiàn)不同的選擇模式,提示在馴化的過(guò)程中具有共同的馴化以及人工選擇目的,不同的選擇方法在相近的物種中產(chǎn)生相似的表型特征。王維民[18]通過(guò)全基因組重測(cè)序比較分析亞洲摩弗倫野羊與5個(gè)具有代表性的中國(guó)地方綿羊品種(阿勒泰羊、多浪羊、湖羊、蒙古羊和藏羊)在全基因組水平的差異,由此構(gòu)建了5個(gè)地方綿羊品種的高分辨率遺傳變異圖譜,并鑒定了在馴化過(guò)程中共享的和品種特異的選擇區(qū)域及相應(yīng)基因,發(fā)現(xiàn)了與視力、神經(jīng)發(fā)育、繁殖和適應(yīng)性等重要生理表型和經(jīng)濟(jì)性狀相關(guān)的基因。
隨著測(cè)序成本的降低,越來(lái)越多的研究人員開始利用全基因組重測(cè)序進(jìn)行綿羊重要性狀相關(guān)功能基因的鑒定。智達(dá)夫[19]通過(guò)對(duì)呼倫貝爾短尾羊及與其外形相近,但尾型不同的巴爾虎羊作為對(duì)照進(jìn)行全基因組重測(cè)序,利用群體雜合度(Hp)和遺傳分化系數(shù)(Fst)分析法進(jìn)行選擇分析,發(fā)現(xiàn)與脊椎發(fā)育相關(guān)的T基因,且后續(xù)分析證明其存在新型的 c.G334T 突變,而且該突變?cè)诙涛脖硇偷男纬蛇^(guò)程中起到關(guān)鍵作用?;魩浀萚20]利用混池重測(cè)序鑒定薩??司d羊超數(shù)排卵關(guān)鍵調(diào)控基因,結(jié)果篩選到11個(gè)關(guān)鍵調(diào)控基因。達(dá)賴等[21]基于全基因組重測(cè)序研究蒙古羊尾長(zhǎng)性狀的相關(guān)基因及可能的突變位點(diǎn),研究確定了與尾椎數(shù)相關(guān)的受選擇區(qū)域,并推測(cè)蒙古綿羊不同尾椎數(shù)的形成可能由基因非編碼區(qū)域的1個(gè)或者多個(gè)突變?cè)斐伞?/p>
簡(jiǎn)化基因組測(cè)序(Reduced Representation Genome Sequencing)是指利用限制性內(nèi)切酶對(duì)基因組DNA進(jìn)行酶切,并對(duì)酶切片段進(jìn)行高通量測(cè)序的技術(shù)。簡(jiǎn)化基因組測(cè)序只對(duì)酶切片段測(cè)序,測(cè)序成本低,而且可極大降低基因組的復(fù)雜度,并且不受參考基因組的限制,無(wú)參考基因組的物種也可以進(jìn)行分子標(biāo)記鑒定與開發(fā)[22],因此廣泛應(yīng)用于分子標(biāo)記開發(fā)、群體遺傳分析等。曹愉夏等[23]通過(guò)RAD-seq簡(jiǎn)化基因組測(cè)序獲得高密度SNP信息,以準(zhǔn)確度量狼山雞保種群體的近交統(tǒng)計(jì)量,并比較不同算法在近交統(tǒng)計(jì)量度量中的可靠性。劉宏祥等[24-25]利用簡(jiǎn)化基因組測(cè)序方法ddRAD鑒定高郵鴨、太湖鵝的SNP標(biāo)記,比較分析遺傳多樣性差異,以評(píng)價(jià)高郵鴨、太湖鵝原種場(chǎng)的保種效果。馬麗娜等[26]運(yùn)用基于酶切的簡(jiǎn)化基因組測(cè)序技術(shù)對(duì)灘羊、蒙古羊、湖羊3個(gè)綿羊品種進(jìn)行進(jìn)化關(guān)系的研究,結(jié)果表明灘羊、湖羊、蒙古羊的SNP位點(diǎn)平均數(shù)分別為24 008個(gè)、23906個(gè)、23 306個(gè),利用PCA主成分分析表明,蒙古羊和湖羊聚成一支,灘羊單獨(dú)為一分支,通過(guò)群體結(jié)構(gòu)聚類分析表明,3個(gè)綿羊品種互有基因交流,說(shuō)明3個(gè)綿羊品種差異不大,符合3 個(gè)綿羊品種外貌體型相似的特點(diǎn)。簡(jiǎn)化基因組測(cè)序的優(yōu)點(diǎn)在于測(cè)序成本低,測(cè)序周期短,還可以用于無(wú)參考基因組物種,但因其僅對(duì)酶切片段進(jìn)行測(cè)序,相對(duì)于全基因組重測(cè)序,獲得的SNP相對(duì)較少,在進(jìn)行GWAS分析或解析復(fù)雜性狀的遺傳機(jī)制時(shí)可能達(dá)不到理想效果。
目前綿羊高質(zhì)量的參考基因組來(lái)自兩個(gè)品種,世界上綿羊品種超過(guò)1400種,雖來(lái)自于相同的馴化中心[27],但在自然及人工選擇的作用下形成適應(yīng)各種不同環(huán)境以及為人類所需的品種,如絨用、肉用、奶用,因此各個(gè)品種都具有獨(dú)特的基因組成部分。全基因組重測(cè)序分析都是通過(guò)與參考基因組進(jìn)行比對(duì),只有比對(duì)上的基因才能得以分析,比對(duì)不上的部分很可能是各品種特有的基因[28],這部分基因?qū)ζ贩N的研究非常重要,因此更多綿羊品種的全基因組denovo測(cè)序成為必要。隨著第三代測(cè)序技術(shù)的發(fā)展以及成本的降低,未來(lái)更多更高質(zhì)量的綿羊品種的全基因組denovo測(cè)序?qū)⒊蔀榭赡堋?/p>
全基因組測(cè)序通過(guò)各種分析方法篩選出大量的候選基因,如何找到主效基因,并明確其功能是難點(diǎn)。隨著后基因組時(shí)代的發(fā)展,各種組學(xué)應(yīng)運(yùn)而生,如轉(zhuǎn)錄組學(xué)、蛋白質(zhì)組學(xué)以及代謝組學(xué),這些組學(xué)的發(fā)展為深入挖掘主效基因、認(rèn)識(shí)復(fù)雜性狀的分子機(jī)理和遺傳基礎(chǔ)提供了更多的切入點(diǎn)。目前各種組學(xué)聯(lián)合應(yīng)用較多的是基因組學(xué)與轉(zhuǎn)錄組學(xué),如宋伸[29]利用全基因組測(cè)序、外顯子測(cè)序及轉(zhuǎn)錄組測(cè)序研究揭示山羊高海拔適應(yīng)性及產(chǎn)絨性狀分子機(jī)制。其他組學(xué)的聯(lián)合應(yīng)用,如湯繼順利用單細(xì)胞轉(zhuǎn)錄組測(cè)序,RNA-Seq 以及蛋白質(zhì)組學(xué)分析策略篩選與綿羊多羔性狀相關(guān)的差異基因和差異蛋白[30]。隨著各種組學(xué)的發(fā)展,多組學(xué)的聯(lián)合應(yīng)用在解析動(dòng)植物復(fù)雜性狀遺傳機(jī)制方面將成為主要趨勢(shì)。