張鵬飛,史良玉,劉家鑫,李洋,吳成斌,王立賢,趙福平
畜禽全基因組長純合片段檢測的研究進展
張鵬飛1,史良玉1,劉家鑫1,李洋1,吳成斌2,王立賢1,趙福平1
1中國農(nóng)業(yè)科學院北京畜牧獸醫(yī)研究所/農(nóng)業(yè)部動物遺傳育種與繁殖(家禽)重點實驗室,北京 100193;2北京市昌平區(qū)動物衛(wèi)生監(jiān)督管理局馬池口防疫站,北京 102202
長純合片段(runs of homozygosity, ROH)是在個體和群體中常見的連續(xù)性純合片段,是親代將同源相同的單倍型遺傳給同一個后代而形成的。ROH蘊藏著種群豐富的遺傳信息,這使ROH成為一種有用的工具,可以提供關(guān)于種群是如何隨著時間的演變而變化的信息。ROH也可以用于估計個體間遺傳關(guān)系,有助于將近親交配率降至最低,還可以暴露基因組中有害的變異。ROH在基因組中的大小、分布和頻率受到自然選擇和人工選擇、重組、連鎖不平衡、群體歷史、突變率和近交水平等諸多因素的影響。近年來,隨著高通量基因分型技術(shù)的使用以及二代測序成本的降低,畜禽育種已經(jīng)進入基因組時代。對優(yōu)秀種畜禽的選擇強度大大提高,這在改善畜禽生產(chǎn)性能的同時不可避免地會造成動物的近交,從而導致近交衰退。根據(jù)ROH的分子信息能更準確地估計純合性并可以檢測過去和最近的近親交配情況?;赗OH計算近交系數(shù)(F)反映的是個體的真實近交系數(shù),即為實現(xiàn)的近交系數(shù),而系譜近交系數(shù)PED得到的是期望值。F在缺乏系譜信息的情況下,也可以用來推斷一個群體的歷史和近親交配水平的信息。選擇會改變優(yōu)良畜禽的表型,并重塑了基因組不同區(qū)域的ROH模式。此外,選擇增加了目標位點周圍的純合性,有害的變異被認為更頻繁地出現(xiàn)在ROH區(qū)域,可以通過ROH檢測,降低復雜疾病發(fā)生的風險。經(jīng)過長期選擇,品種內(nèi)同群個體相同ROH在基因組中高頻出現(xiàn),產(chǎn)生ROH島。研究證實了ROH和正在選擇的基因組區(qū)域之間具有相關(guān)性。在實際應(yīng)用中,可以通過生物信息的方法在ROH島注釋到ROH區(qū)域與經(jīng)濟性狀相關(guān)的基因。此外,ROH也為評估畜禽遺傳多樣性提供了新的視角,對群體進行全基因組ROH檢測,剖析每個群體的遺傳結(jié)構(gòu),并利用ROH對當前育種計劃中近交的影響進行評估,來調(diào)整育種方案,保護品種的遺傳多樣性。ROH已逐漸成為探究群體歷史結(jié)構(gòu)、評估近交水平、鑒定候選基因方面的重要指標。識別ROH主要有觀察基因型計數(shù)法和基于模型分析兩種方法。常用的檢測軟件有PLINK、GERMLINE、BEAGLE、GARLIC等。在實際應(yīng)用中,PLINK是最常用的ROH檢測工具。在畜禽中,由于牛的SNP芯片推出最早,因此最先開展ROH研究的是牛的群體,牛的ROH研究數(shù)量最多、最深入。目前,在豬、羊、雞等畜禽中關(guān)于ROH的研究也逐漸增多。文章主要綜述了ROH形成的原理和檢測方法,以及在畜禽中的研究進展,以期為畜禽的遺傳育種提供參考。
長純合片段;畜禽育種;單核苷酸多態(tài)性;近交評估;候選基因鑒定
長純合片段(runs of homozygosity, ROH)是二倍體生物中親代將同源相同(identical by decent, IBD)的單倍型遺傳給同一個后代,在該個體的基因組上形成的連續(xù)的純合基因型區(qū)域[1],又稱為染色體區(qū)段純合子(chromosome segment homozygosity, CSH)[2]。1999年,Broman & Weber[3]首先在人類染色體上發(fā)現(xiàn)了ROH,并推斷其可能影響人類健康。Gibson等[4]首次利用高密度SNP芯片在人類基因組中鑒定ROH,并研究了ROH在基因組中的分布情況等。此后,ROH才受到重視,激發(fā)了許多關(guān)于群體遺傳學中ROH分析的研究。
因為ROH的長度、數(shù)量以及分布頻率在不同個體基因組中并不相同,對這些獨特的ROH進行分析,可以推斷群體歷史、評估遺傳多樣性、評估近交程度、促進畜禽遺傳資源保護、鑒定候選基因和有害突變等。ROH已經(jīng)逐漸成為量化和分析畜禽基因組近交水平、探究群體歷史等方面重要指標。因此,本研究針對ROH形成的原理、影響因素、檢測方法和在各畜禽品種中的研究進展進行綜述[5]。
在二倍體生物中,如果父母雙方具有共同的祖先,并將從共同祖先中繼承的相同染色體片段傳遞給同一后代,那么該個體在該片段內(nèi)的所有基因型都是純合的,從而產(chǎn)生ROH[6]。因此,ROH一般都是IBD基因組區(qū)段。ROH形成的過程如圖1所示。從圖1中可以看出,隨著世代的增加,同源染色體之間不斷發(fā)生重組,標記間的連鎖不平衡(linkage disequilibrium, LD)不斷被打斷,造成ROH的長度也不斷縮減。通過這個原理可以得知長ROH來源于親緣關(guān)系較近的共同祖先,短ROH來源于較遠的共同祖先,由此,以ROH長短來推斷出個體之間的親緣關(guān)系的遠近。
圖1 ROH產(chǎn)生的原理
從ROH形成的原理可知,影響ROH形成的因素很多,主要包括近交、選擇、群體歷史、漂變等。
近交是ROH產(chǎn)生的最主要因素[7]。著名的進化論學家達爾文與表姐婚配之后,出生的子女早期的成活率明顯低于正常人群,主要原因就是近親導致子女繼承了外祖父和外祖母長的IBD染色體片段,即ROH片段[8, 9]。意大利褐牛和荷斯坦牛比肉牛和兼用牛有更多和更長的ROH片段,表明其在更近世代發(fā)生過近交[10]。1974年,由新疆塔城地區(qū)的一頭母牛和其子女,經(jīng)過45年近交繁育,形成的新疆近交牛,其SNP位點純合率高,導致ROH檢出率提高,ROH 數(shù)量雖然較少,但是長ROH數(shù)量較多,ROH覆蓋率(ROH%)也顯著高于哈薩克等非近交牛群體[11]。
選擇會改變?nèi)后w內(nèi)等位基因的頻率,包括基因組中ROH 的分布模式。在經(jīng)過選擇和未經(jīng)過選擇的北美荷斯坦奶牛中,通過ROH檢測發(fā)現(xiàn),經(jīng)過選擇的群體不僅ROH數(shù)目增加,而且ROH在基因組上的分布也不均勻,但是在非選擇群體中,ROH在染色體上的分布變化不大[12]。
基因組選擇技術(shù)加快了ROH的進行和群體的近交水平。北美荷斯坦奶牛在開展基因組選擇后,F(xiàn)orutan等[13]比較了經(jīng)過基因組選擇和BLUP選擇的動物個體內(nèi)ROH的分布。與BLUP相比,基因組選擇導致短ROH和中長ROH頻率更高?;蚪M選擇后ROH年增長率為2.1±0.05,而基因組選擇前僅為0.57±0.01。這反映了與常規(guī)選擇相比,基因組選擇更能影響ROH的數(shù)量和分布。這也進一步說明在有限時間內(nèi)基因組選擇比常規(guī)BLUP選擇更容易造成近交和產(chǎn)生ROH。
漂變會導致群體等位基因頻率產(chǎn)生變化。在經(jīng)歷群體瓶頸后的種群,種群中存在的祖先譜系的數(shù)量會減少,ROH的數(shù)量會增加,但是ROH長度通常相對較短。相反,沒有經(jīng)歷種群瓶頸的種群包含更多的祖先譜系,其ROH數(shù)量相對較少。
波蘭長白豬和當?shù)匚催x擇的白豬和斑點豬在其歷史上經(jīng)歷了嚴重的種群瓶頸,尤其是斑點豬。與波蘭長白豬相比,白豬和斑點豬基因組中有著數(shù)量更多、更長的ROH,這一結(jié)果在所有ROH類別中都是一致的。而白豬和斑點豬的ROH近交系數(shù)也較高,在斑點豬中尤其高[14]。
在品種形成過程中,受到群體結(jié)構(gòu)、有效群體大小、交配方式等不同會導致動物體內(nèi)形成不同的ROH分布模式。群體瓶頸增加了ROH數(shù)量,但這些ROH通常較短。一些種群既有瓶頸,又實行近交,因此有許多短ROH和長ROH,導致ROH分布最多[15]。奇靈厄姆牛就是極端純合群體的一個例子。奇靈厄姆牛在過去的350年里沒有經(jīng)過選擇,也沒有經(jīng)歷過遷徙一直處于封閉狀態(tài)。在其基因組中97.4%的SNP是純合的,ROH基因組覆蓋率為95%,14個ROH大于30Mb。表明該群體的遺傳變異減少并具有極端純合性[16]。
2008年,McQuillan等[17]提出將個體基因組所有ROH總長度占常染色體總長度的比值作為個體近交系數(shù)(F)。其計算公式為:,其中,
L是每條ROH的長度,L是常染色體總長度。
除此之外,還有三種方法計算近交系數(shù)。
第一種基于系譜的近交系數(shù),該方法由Wright[18](1922)提出。計算公式為:
其中,F是個體的近交系數(shù),N是個體的兩親本到共同祖先相關(guān)通徑鏈的個數(shù),F是共同祖先A的近交系數(shù)。
第二種,基于單個SNP計算的近交系數(shù)有兩種計算方法。其一為檢測基因型中純合SNP所占比例(F1),其公式為[19]:
其中,N1為純合SNP的個數(shù),為檢測SNP的總個數(shù)。其二計算方法為F2=(O(HOM)-E(HOM))/(1- E(HOM))[20],其中,為觀測純合子數(shù)目,為期望純合子的數(shù)目,為SNP數(shù)目。
第三種,基于基因組關(guān)系矩陣計算近交系數(shù)[21]
其中,是SNP的數(shù)量,p是等位基因頻率,x是第個SNP的拷貝數(shù)。
以上4種近交系數(shù)的計算方法,只有基于系譜的近交系數(shù)是依賴于系譜記錄準確性,但是在實際中,系譜記錄往往存在錯誤或缺失,而且在基礎(chǔ)群中假設(shè)每個個體相互之間不存在親緣關(guān)系。另外3種都是基于基因組的信息,其中F和F兩種方法能得到-1—0的值,甚至會出現(xiàn)小于-1的值,F雖然控制在0—1之間,但是不能區(qū)分純合等位基因是同源相同(identical by blood, IBD)還是同態(tài)相同(identical by state, IBS),得到的值會比真實值偏大。只有F是利用IBD來計算個體的真實近交系數(shù),避免以上的問題,是目前研究中最有效的方法[22]。F和F之間存在強正相關(guān),相關(guān)系數(shù)可達0.75[23],而且F還可以對特定染色體區(qū)段或者特定基因組區(qū)段進行近交系數(shù)估計[24]。F可能是評估動物親緣關(guān)系和近交水平的一種有效且準確的替代方法[23]。
為了更好地理解F和F之間的區(qū)別,以自交的情況進行說明(圖2),一個個體具有兩條同源染色體,配子結(jié)合后產(chǎn)生2種類型的合子,其中F分別為1和0。按照系譜計算,自交群內(nèi)所有個體的近交系數(shù)都為0.5,也可以通過群體每個個體的F值求期望而得到,即:1×1/2+0×1/2=0.5。從計算過程可以看出,F可以計算個體的真實近交系數(shù),即為實現(xiàn)的近交系數(shù),而系譜得到的是期望值。
圖2 自交情況下兩種近交系數(shù)估計值
ROH在不同種群中會有不同分布。遠交種群的ROH分布模式與其有效種群大小有關(guān),小種群有著較多的ROH,較大的種群有著較少的ROH。而混合種群由于在兩個或更多的祖先種群中有更遠的共同祖先,所以比各自親本種群具有更少的ROH。經(jīng)歷了種群瓶頸的群體具有更多的較短的ROH,反映了更深層次的親緣關(guān)系[1]。通過ROH檢測,可以從動物個體的基因組中ROH分布模式獲得遺傳背景信息,推測其種群形成歷史,對研究其種群進化、品種形成具有重要意義[25]。
畜禽品種經(jīng)過長期的選擇而形成,使得品種內(nèi)同群個體間繼承了一個共同祖先相同的染色體片段增加,使得相同ROH在多個個體基因組中出現(xiàn)高頻的ROH,其在所選擇的區(qū)域周圍具有高水平的純合性,稱為ROH島(圖3)。ROH島就是群體內(nèi)ROH富集的區(qū)段,ROH島不是隨機分布在整個基因組上,而是在一個品種內(nèi)的個體之間共享,研究證實了ROH和正在選擇的基因組區(qū)域之間具有相關(guān)性[26]。高頻率ROH的基因組區(qū)域可以通過生物信息的方法注釋到與經(jīng)濟性狀相關(guān)的基因[27]。因此,可以通過ROH島進行定位候選基因。
ROH區(qū)段也會增加隱性純合子量,使得隱性疾病的發(fā)生。Garrod等[28]觀察到近交個體中隱性疾病的高發(fā)病率是由于它們對于有害的隱性等位基因遺傳的IBD是純合子的可能性很高。有害的隱性變異可以通過研究ROH在近交系個體中識別出來。有害純合子變異的頻率與基因組ROH之間存在很強的線性關(guān)系(0.93—0.98)。ROH覆蓋率高的個體在長ROH中出現(xiàn)有害變異的比例更高[29-30]。因此,可以通過鑒定ROH,減少復雜疾病發(fā)生的風險。
圖3 ROH島
高通量基因分型陣列的出現(xiàn)極大地促進了遺傳多樣性研究[31-32],基因組ROH為評估畜禽遺傳多樣性提供新的思路方法。ROH區(qū)段使得群體純合子增加,降低了遺傳多樣性,通過對畜禽進行全基因組ROH檢測,剖析每個群體的遺傳結(jié)構(gòu),并針對當前育種計劃對近交的影響進行評估,來調(diào)整育種方案[33]。
基因組選擇的基礎(chǔ)是準確估計訓練群和候選群之間的基因組關(guān)系,以獲得準確的基因組估計育種值(GEBV)。Luan等[34]提出了利用ROH構(gòu)建基因組關(guān)系矩陣(GROH)預測GEBV,并通過模擬比較了利用GROH、基于全群體連鎖不平衡關(guān)系(GIBS)和基于連鎖分析關(guān)系(GLA)預測的GEBV的準確性和偏差。結(jié)果表明,GROH估計GEBV始終比GIBS和GLA高0—40%。在真實數(shù)據(jù)中,GROH和GLA具有類似的準確性。
目前,識別ROH有兩種主要方法:觀察基因型計數(shù)法和基于模型分析。實際應(yīng)用中,需要根據(jù)不同數(shù)據(jù)的特點,采用不同的算法。
觀察基因型計數(shù)法是指定每個窗口可變數(shù)量的雜合或缺失SNP,沿染色體長度方向移動固定大小的窗口來掃描每條染色體,以尋找在特定長度上顯示純合子的連續(xù)SNP。常用的檢測軟件有PLINK[35-36]、GERMLINE[37]。
基于模型分析的方法主要利用隱馬可夫模型來鑒定基因組中純合子和雜合子區(qū)域,并獲得重組率等基因組參數(shù)。常用的軟件主要有BEAGLE[38]、GARLIC[39]。
在實際應(yīng)用中,觀察基因型計數(shù)法應(yīng)用較為廣泛,相關(guān)研究也較多。PLINK是最常用的軟件。Howrigan[40]等使用PLINK、GERMLINE和BEAGLE進行了ROH分析。結(jié)果發(fā)現(xiàn)PLINK的滑動窗口算法在使用針對連鎖不平衡(LD)進行修剪的SNP數(shù)據(jù)時效果最好。但是觀察基因型計數(shù)僅使用基因型數(shù)據(jù),如果不進一步對樣本中的缺失和重復進行分析,則不能區(qū)分由單拷貝缺失引起的真實純合性和虛假純合性[41]。
基于模型分析方法更適合序列數(shù)據(jù),可以從群體測序數(shù)據(jù)獲得關(guān)于等位基因頻率和重組率的更全面的信息,具有更高的靈敏度[42]。隨著測序技術(shù)的廣泛應(yīng)用和成本下降,基于模型分析方法會提高ROH識別準確性,降低錯誤率。
ROH已經(jīng)廣泛應(yīng)用于畜禽品種的種群研究中。由于牛的SNP芯片推出最早,因此最先開展ROH研究的是牛的群體。目前,在豬、羊、雞等畜禽中關(guān)于ROH的研究也逐漸增多,以下將分別詳細介紹。
5.1.1 評估近交 Ferencakovic等[43]首先在牛上進行了關(guān)于ROH的研究,分析了554頭奧地利弗萊克維公牛精液中近交抑制的遺傳特征與活精子百分率和精子總數(shù)的可能關(guān)系。分別計算了系譜近交系數(shù)和4種不同片段大小的ROH近交系數(shù),其中F檢測到精子總數(shù)存在顯著的近交抑制(<0.05)。在之前研究中,基于ΔAIC,F是最好的評估精子總數(shù)的近交衰退的指標[44],而F的ΔAIC值為3.9,表明F可用于近交衰退的檢測。楊湛澄等[19]利用牛54 K SNP 芯片數(shù)據(jù)計算了2 107頭荷斯坦牛的F、F和F。F與F、F之間的相關(guān)系數(shù)分別為0.46和0.38。F與F秩相關(guān)和Pearson相關(guān)分別為0.97、0.95,表明F與F之間高度相關(guān)。F與F、F所有秩相關(guān)均較高(0.72— 0.97),且>0.01。研究表明在缺失系譜數(shù)據(jù)的情況下,基因組近交系數(shù)是評估個體近交水平更為準確的工具,也為以后研究奶牛近交衰退和與疾病關(guān)聯(lián)ROH區(qū)域奠定基礎(chǔ)。Forutan等[13]計算了北美荷斯坦牛的ROH近交系數(shù),并比較了不同選擇方法對ROH模式的影響。當SNP窗口設(shè)置為20—50個SNP時,在所有情況和所有選擇標準下,F比F和F更接近真實近交系數(shù)。師睿等[11]對新疆近交牛群計算了F和F兩種基因組近交系數(shù)來驗證新疆近交牛在基因組上高度純合,基于ROH覆蓋率計算的近交系數(shù)為0.136,明顯高于其他種群(0.021—0.102)。Xu等[45]用F、F和F3種方法估計了不同中國地方黃牛品種的每個群體內(nèi)的近交系數(shù)。個體F在0.01—0.34之間變化,F、F和F之間存在較高的相關(guān)性(0.78—0.85),F與F的相關(guān)性最高(= 0.85,<2.2×10?16),F與F(=0.78,<2.2×10?16)呈顯著正相關(guān)。F與F和F之間的高度相關(guān)性可以被認為是IBD基因組比例的準確估計值。
5.1.2 推斷群體歷史 Purfield等[23]分析了891頭多個品種牛的ROH模式,觀察到ROH在不同品種之間存在顯著差異。荷斯坦、荷斯坦-弗里西亞和弗里西亞品種在較長的ROH中顯示出最大的覆蓋率,平均為700.3Mb。這反映了最近世代的近交。研究表明ROH分析量化了基因組變異特征,可用于推斷種群歷史。Ferencakovic等[46]研究了幾個不同品種牛的純合性,發(fā)現(xiàn)ROH的分布和頻率在不同品種之間存在差異。瑞士棕色牛的ROH平均數(shù)最高(98.9),ROH的基因組覆蓋率最高。弗萊克維公牛的平均ROH長度最短,主要由許多短ROH組成。瑞士棕色牛長ROH較少。挪威紅牛與弗萊克維公牛有著相似的分布模式。通過ROH的不同分布,推斷出瑞士棕色牛中觀察到的大量長ROH與從少量公牛進口精液有關(guān)。弗萊克維公牛顯示出很小的純合子比例的基因組,這與較大的有效種群規(guī)模一致。在挪威紅牛中發(fā)現(xiàn)的ROH分布模式被歸因于該品種歷史上的混合所導致的高度異質(zhì)性。中國地方牛的ROH模式及其分布在很大程度上仍未被探索。Xu等[45]在南大牛和文山牛中發(fā)現(xiàn)了數(shù)量較多的長ROH(100—250 Mb),這種ROH模式可能是由于南大牛和文山牛的種群相對較小,經(jīng)歷了瓶頸。延黃牛有著較少的ROH和短ROH,這與最近在延黃牛的個體中混雜的情況是一致的。柴達木牛和平武牛的ROH的總長度和數(shù)目都處于中等水平。這可能反映了這些品種中沒有混雜。研究利用ROH推斷群體歷史有助于揭示黃牛品種間的遺傳多樣性[45]。
5.1.3 鑒定重要基因 Ferencakovic等[43]分析了奧地利弗萊維赫公牛導致近交衰退的基因組區(qū)域,發(fā)現(xiàn)精子總數(shù)和活精子百分比分別與4個ROH區(qū)域和5個區(qū)域顯著相關(guān)。除一個區(qū)域外,所有區(qū)域都鑒定到與精子發(fā)生和精子形態(tài)相關(guān)的基因。如與嚴重的生精衰竭有關(guān)的、影響精子活力的和在精子滲透調(diào)節(jié)中發(fā)揮重要作用的。Mastrangelo等[47]對4個奶牛品種的ROH島進行候選基因鑒定。共鑒定出126—347個基因,如與生殖性狀有關(guān)的和與乳腺功能有關(guān)的,以及與免疫系統(tǒng)有關(guān)的。其中,在一個ROH島上定位到一個QTL,包含6個基因(),并注釋到與產(chǎn)奶性狀相關(guān)的、。Xu等[45]在中國地方黃牛品種中的ROH島中鑒定到了一些與免疫相關(guān)的。在柴達木牛中的ROH島中鑒定到了與脂肪酸有關(guān)——可能調(diào)節(jié)肉類嫩度的。在延黃牛中檢測到與能量肉質(zhì)、動態(tài)平衡和多糖有關(guān)的和等。在涼山牛品種中檢測到與肉牛的肌脂組成和大理石紋有關(guān)的和。此外,在平武牛、文山牛和昭通牛中分別鑒定了與生長性狀和免疫過程相關(guān)的品種特異性基因和。
5.2.1 評估近交 Gomez-Raya等[48]首次提出了將ROH長度作為隨機變量的新型近交系數(shù)。使用伊比利亞豬品系的217頭母豬比較了新型近交系數(shù)和系譜近交系數(shù)。兩種近交系數(shù)的相關(guān)系數(shù)在0.60—0.70,此外,研究發(fā)現(xiàn)近交系數(shù)受染色體長度的影響很大,二者存在顯著相關(guān)。利用ROH長度分布來測量近親交配,不僅可以識別染色體近交,而且還可以提供有關(guān)最近世代近交的信息,為更準確地評估近交對伊比利亞豬封閉品系的影響奠定了基礎(chǔ)。Shi等[49]研究了3 692頭大白豬ROH的發(fā)生和分布,計算并比較了系譜近交系數(shù)F、基因型中純合SNP所占比例F、基因組近交系數(shù)F和4種類型的F(1—5Mb、5—10Mb、大于10Mb、總ROH)。F與F的相關(guān)系數(shù)最高(0.95),而F與F的相關(guān)系數(shù)最低(0.083)。F與F的相關(guān)系數(shù)在0.18—0.37之間,除>10Mb的ROH外,F與F的相關(guān)性隨ROH長度的增加而增大。與其他近交系數(shù)相比,F可準確評估個體近交水平。在沒有系譜的情況下,F是近交估計的另一種選擇。
5.2.2 推斷群體歷史 Bosse等[50]對歐亞大陸野豬和商品豬的全基因組的ROH進行檢測。發(fā)現(xiàn)來自不同群體的個體基因組中ROH長度、數(shù)量和分布模式上存在明顯差異。但同一種群的動物基因組中有著相似的ROH模式。在馴化的亞洲豬中,長ROH數(shù)量最多,這可能表明最近種群數(shù)量減少。歐洲野豬基因組中ROH數(shù)目最多,全基因組純合子比例最高,這與歐洲冰川造成的群體瓶頸比亞洲更嚴重的證據(jù)是一致的[51]。Herrero-Medrano等[52]對伊比利亞半島的野豬和馴養(yǎng)豬進行了全基因組ROH檢測。野生種群和馴化種群在ROH分布模式有著顯著差異。家豬Chato Murciano具有最多的長ROH數(shù)量,表明該品種最近的近交和低遺傳多樣性。野豬有非常多的短ROH、沒有長ROH,這可能與過去種群規(guī)模的減少和最近的近交很少有關(guān)。這種ROH模式可能源于上個世紀歐洲的人口瓶頸,導致有效群體數(shù)量急劇減少。其他可能性包括亞種群的形成和動物的遷徙,與家豬的隨機雜交,以及伊比利亞半島沒有地理障礙,阻止了野豬的高度近交[53]。
5.2.3 鑒定重要基因 Zhang等[54]對中國和西方豬的ROH島進行檢測和注釋。在中國豬的ROH島上鑒定到了與繁殖、免疫、肉質(zhì)和適應(yīng)性有關(guān)的基因,以及與西方豬的生長速度和免疫力有關(guān)的相關(guān)基因。如:與仔豬出生和死亡總數(shù)的和鑒定到與生長和脊椎數(shù)相關(guān)的。Xie等[55]對長白豬、松遼黑豬和約克夏豬3個群體ROH出現(xiàn)頻率較高的基因組區(qū)域進行基因注釋。鑒定出與繁殖性狀()、肉質(zhì)性狀()和能量轉(zhuǎn)換()相關(guān)的基因位于ROH高發(fā)區(qū)。Shi等[49]在大白豬的基因組中鑒定出了12個ROH島,鑒定出許多控制大白豬重要經(jīng)濟性狀的候選基因,其中一些已被證明是肌肉發(fā)育和脂肪沉積的重要候選基因,包括抑制精子與卵母細胞的結(jié)合的、參與調(diào)節(jié)豬的生殖行為的等。Szmato?a等[14]對波蘭長白豬和未選擇的白豬和斑點豬ROH島進行基因鑒定。在波蘭長白豬中,檢測到與細胞葡萄糖穩(wěn)態(tài)相關(guān)的生物學過程()和染色質(zhì)沉默的調(diào)節(jié)()相關(guān)的基因顯著豐富。在白豬中檢測到168與細胞對生長因子刺激的反應(yīng)的負面調(diào)控有關(guān)的基因()。
5.3.1 評估近交 Purfield等[56]計算了6個商品綿羊的系譜近交系數(shù)、ROH近交系數(shù)、標記基因型中純合子所占比例、基因組近交系數(shù)。Vendeen種群的F和F的相關(guān)性最低(0.12—0.15),Belclare種群的相關(guān)性最強(0.71—0.76)。F與F、F與F之間的相關(guān)性高于F與F之間的相關(guān)性,所有ROH近交指標對F的回歸截距均大于零,表明與F相比,用F估計基因組純合性更準確。劉家鑫等[57]利用50K芯片對10個綿羊群體的440個個體進行全基因組ROH檢測,通過計算ROH基因組近交系數(shù)F探究其近交水平。結(jié)果發(fā)現(xiàn)不同品種基因組中ROH的分布明顯不同,其中,國外種群(杜泊羊和德美羊)的平均F顯著高于地方品種。地方品種中,藏羊平均F最高(0.085),蘇尼特羊平均F最低(0.010)。
5.3.2 推斷群體歷史 Mastrangelo等[58]首次研究了ROH在多個具有不同的近交背景、選擇歷史和育種目標的綿羊品種中的發(fā)生和分布,結(jié)果發(fā)現(xiàn),不同種群基因組內(nèi)ROH分布明顯不同。在科米薩納和貝爾加莫品種中發(fā)現(xiàn)長ROH數(shù)量較少,這與之前研究結(jié)果一致,這反映了這兩個品種最近世代的近交以及有著較大的有效群體規(guī)模。與其他品種相比,這兩個品種的有效群體規(guī)模更大(571、557)。另一方面,巴雷斯卡、萊切塞和伯利茲谷品種的ROH分布模式表明有效種群規(guī)模較?。?83、512、340),這在先前的研究中證實??泼姿_納和巴雷斯卡是親緣關(guān)系較差的品種,其中,巴雷斯卡、萊切塞和伯利茲谷綿羊長ROH片段較多,反映了萊切塞和伯利茲谷綿羊最近世代的近交。
5.3.3 鑒定重要基因 Mastrangelo等[59]鑒定了516只貝利斯谷綿羊ROH頻率較高的基因組區(qū)域,篩選出107個與產(chǎn)奶量和免疫反應(yīng)有關(guān)潛在候選基因。包括與綿羊朊病毒蛋白沉積相關(guān)的,調(diào)節(jié)新陳代謝、體溫、血壓、內(nèi)分泌和免疫功能等功能的,在血管收縮和血壓調(diào)節(jié)中發(fā)揮重要作用的。Mastrangelo等[58]在意大利綿羊品種的ROH島鑒定到在骨骼肌和豬肉品質(zhì)中發(fā)揮關(guān)鍵作用的,影響飼料轉(zhuǎn)化、肌肉生長和肥胖性狀的,與牛的生長、脂肪沉積和肉類生產(chǎn)相關(guān)的,參與控制脂肪代謝和胰島素敏感性的。劉家鑫等[57]在德美羊、杜泊羊、大尾寒羊等國內(nèi)外不同綿羊品種的基因組中高頻ROH區(qū)域鑒定到了26個與動物經(jīng)濟性狀相關(guān)的基因,包括與綿羊生長發(fā)育相關(guān)的,與綿羊斷奶重相關(guān)的,與肉品質(zhì)、繁殖性狀相關(guān)的。
5.3.4 評估遺傳多樣性 在家畜物種中,人們致力于揭示主要商業(yè)品種之間的遺傳差異、關(guān)系和種群結(jié)構(gòu),但對不太廣泛使用的地方品種的研究通常還不夠深入。Beynon等[60]使用單倍型純合性(HHN)方法對18個威爾士地方綿羊品種的遺傳結(jié)構(gòu)進行了特征分析,推斷威爾士綿羊品種的群體歷史和結(jié)構(gòu)。這種方法依賴于ROH的全基因組分布。使用HHN的推斷確定了低有效種群規(guī)模和高水平近交的品種,通過有計劃的育種策略,間接的為遺傳多樣性的監(jiān)測和恢復提供了信息。
Fleming等[61]使用600K SNP芯片對非洲的3個雞群體進行了全基因組ROH檢測。ROH數(shù)量和大小在個體中差異很大。黑雞ROH最少,而烏干達土雞有著較長的ROH。對3個群體中150個相同的ROH區(qū)域用GO富集進行分析,鑒定到與內(nèi)源性和外源性應(yīng)激源相關(guān)的通路。ROH分析的結(jié)果表明,這些種群的基因組受到了來自環(huán)境的選擇壓力。Zhang等[62]對白耳黃雞、北京油雞和狼山雞3個保種群體進行了全基因組ROH檢測。計算了傳統(tǒng)近交系數(shù)和ROH近交系數(shù)。ROH與ES呈顯著正相關(guān)(2=0.76)。北京油雞ROH最高,表明該品種最近發(fā)生了近交。這反映了該品種較小的有效種群數(shù)量。白耳黃雞、狼山雞近交水平相近且較低(—0.05)。研究利用ROH來識別近代或古代近交留下的痕跡,避免了近交,這為保護種群的遺傳多樣性動態(tài)提供了新的思路,并為改進保護方案奠定了基礎(chǔ)。
基于ROH計算個體近交系數(shù),不僅擺脫了對系譜的依賴,還能計算出特定染色體區(qū)域的近交情況,為評估群體和特定染色體區(qū)段的近交衰退程度[62-65],以及鑒定與ROH相關(guān)聯(lián)的重要經(jīng)濟性狀[66]提供了可行性。ROH已被證明在分析和量化基因組近交水平方面非常重要。此外,ROH研究在定位與疾病發(fā)生相關(guān)的隱性等位基因、探究種群歷史及其結(jié)構(gòu)、鑒定與重要性狀相關(guān)的候選基因、減少有害變異的發(fā)生等方面發(fā)揮重要作用。這不僅為實際的育種和保種設(shè)置合理的交配方案提供參考依據(jù),也為揭示重要經(jīng)濟性狀的遺傳機制提供了新的研究思路。
然而,現(xiàn)在利用ROH構(gòu)建的個體間親緣關(guān)系矩陣開展基因組選擇還未見有實際數(shù)據(jù)報道。下一代測序平臺的出現(xiàn),使全基因組測序得以更低的成本和更短的時間實現(xiàn)。相比于SNP芯片,高通量技術(shù)和全基因組測序技術(shù)相結(jié)合,鑒定ROH的參數(shù)設(shè)置會發(fā)生明顯變化,這對利用高通量的測序數(shù)據(jù)進行精確和快速的畜禽ROH檢測提出了新的挑戰(zhàn)。
[1] FRANCISCO C. CEBALLOS P K J, JAMES F. WILSON, DAVID W. CLARK, MICHèLE RAMSAY. Runs of homozygosity: windows into population history and trait architecture. Nature Reviews Genetics, 2018, 19(4): 220-234.
[2] HAYES M G, KELLY A L. High pressure homogenisation of milk (b) effects on indigenous enzymatic activity. Journal of Dairy Research, 2003, 70(3): 307-313.
[3] BROMAN K W, WEBER J L. Long homozygous chromosomal segments in reference families from the centre d'Etude du polymorphisme humain. American Journal of Human Gentics, 1999, 65(6): 1493-1500.
[4] GIBSON J, MORTON N E, COLLINS A. Extended tracts of homozygosity in outbred human populations. Human Molecular Genetics, 2006, 15(5): 789-795.
[5] 劉剛, 孫飛舟, 朱芳賢, 馮海永, 韓旭. 連續(xù)性純合片段在畜禽基因組研究中的應(yīng)用. 遺傳, 2019, 41(4): 304-317.
LIU G, SUN F Z, ZHU F X, FENG H Y, HAN X. Runs of homozygosity and its application on livestock genome study. Hereditas(Beijing), 2019, 41(4): 304-317. (in Chinese)
[6] KIRIN M, MCQUILLAN R, FRANKLIN C S, CAMPBELL H, MCKEIGUE P M, WILSON J F. Genomic runs of homozygosity record population history and consanguinity. PLoS One, 2010, 5(11): e13996.
[7] CHARLESWORTH D, WILLIS J H. The genetics of inbreeding depression. Nature Reviews Genetics, 2009, 10(11): 783-796.
[8] áLVAREZ G, CEBALLOS F, BERRA FLS T. Darwin was right: inbreeding depression on malefertility in the Darwin family. Biological Journal of the Linnean Society, 2015, 114(2): 474-483.
[9] BERRA T M, ALVAREZ G, CEBALLOS F C. Was the Darwin/ Wedgwood Dynasty Adversely Affected by Consanguinity? BioScience, 2010, 60(5): 376-383.
[10] MARRAS G, GASPA G, SORBOLINI S, DIMAURO C, AJMONE- MARSAN P, VALENTINI A, WILLIAMS J L, MACCIOTTA N P. Analysis of runs of homozygosity and their relationship with inbreeding in five cattle breeds farmed in Italy. Animal Genetics, 2015, 46(2): 110-121.
[11] 師睿, 張毅, 王雅春, 黃濤, 盧國昌, 岳濤, 盧振西, 黃錫霞, 衛(wèi)新璞, 馮書堂, 陳軍, 烏蘭·卡格德爾, 茹先古麗·阿不力孜, 努爾胡馬爾·木合塔爾. 利用SNP 芯片信息評估新疆近交?;蚪M純合度. 遺傳, 2020, 42(5): 493-505.
SHI R, ZHANG Y, WANG Y C, HUANG T, LU G C, YUE T, LU Z X, HUANG X X, WEI X P, FENG S T, CHEN J, Wulan Kagedeer, Ruxianguli Abulizi, Nuerhumaer Muhetaer. The evaluation of genomic homozygosity for Xinjiang inbred population by SNP panels. Hereditas(Beijing), 2020, 42(5): 493-505. (in Chinese)
[12] KIM E S, COLE J B, HUSON H, WIGGANS G R, VAN TASSELL C P, CROOKER B A, LIU G, DA Y, SONSTEGARD T S. Effect of artificial selection on runs of homozygosity in u. s. Holstein cattle. PLoS One, 2013, 8(11): e80813.
[13] FORUTAN M, ANSARI MAHYARI S, BAES C, MELZER N, SCHENKEL F S, SARGOLZAEI M. Inbreeding and runs of homozygosity before and after genomic selection in North American Holstein Cattle. BMC Genomics, 2018, 19(1): 98.
[14] SZMATOLA T, JASIELCZUK I, SEMIK-GURGUL E, SZYNDLER- NEDZA M, BLICHARSKI T, SZULC K, SKRZYPCZAK E, GURGUL A. Detection of runs of homozygosity in conserved and commercial pig breeds in Poland. Journal of Animal Breeding and Genetics, 2020, 137(6): 571-580.
[15] CURIK I F, MAJA S?LKNER, JOHANN. Inbreeding and runs of homozygosity: A possible solution to an old problem. Livestock Science, 2014, 166(9): 26-34.
[16] WILLIAMS J L, HALL S J, DEL CORVO M, BALLINGALL K T, COLLI L, AJMONE MARSAN P, BISCARINI F. Inbreeding and purging at the genomic Level: the Chillingham cattle reveal extensive, non-random SNP heterozygosity. Animal Genetics, 2016, 47(1): 19-27.
[17] MCQUILLAN R, LEUTENEGGER A L, ABDEL-RAHMAN R, FRANKLIN C S, PERICIC M, BARAC-LAUC L, SMOLEJ- NARANCIC N, JANICIJEVIC B, POLASEK O, TENESA A, MACLEOD A K, FARRINGTON S M, RUDAN P, HAYWARD C, VITART V, RUDAN I, WILD S H, DUNLOP M G, WRIGHT A F, CAMPBELL H, WILSON J F. Runs of homozygosity in European populations. American Journal of Human Genetics, 2008, 83(3): 359-372.
[18] WRIGHT S. Coefficients of inbreeding and relationship. Amerlcan Naturalist, 1922, 56: 330-338.
[19] 楊湛澄, 黃河天, 閆青霞, 王雅春, 俞英, 陳紹祜, 孫東曉, 張勝利, 張毅. 利用高密度SNP標記分析中國荷斯坦?;蚪M近交. 遺傳, 2017, 39(1): 41-47.
YANG Z C, HUANG H T, YAN Q X, WANG Y C, YU Y, CHEN S H, SUN D X, ZHANG S L, ZHANG Y. Estimation of genomic inbreeding coefficients based on high-density snp markers in chinese holstein cattle. Hereditas(Beijing), 2017, 39(1): 41-47. (in chinese)
[20] YANG J, LEE S H, GODDARD M E, VISSCHER P M. GCTA: a tool for genome-wide complex trait analysis. American Journal of Human Genetics, 2011, 88(1): 76-82.
[21] VANRADEN P M. Efficient methods to compute genomic predictions. Journal of Dairy Science, 2008, 91(11): 4414-4423.
[22] BJELLAND D W, WEIGEL K A, VUKASINOVIC N, NKRUMAH J D. Evaluation of inbreeding depression in Holstein cattle using whole-genome SNP markers and alternative measures of genomic inbreeding. Journal of Dairy Science, 2013, 96(7): 4697-4706.
[23] PURFIELD D C, BERRY D P, MCPARLAND S, BRADLEY D G. Runs of homozygosity and population history in cattle. BMC Genetics, 2012, 14(13): 70.
[24] KELLER M C, VISSCHER P M, GODDARD M E. Quantification of inbreeding due to distant ancestors and its detection using dense single nucleotide polymorphism data. Genetics, 2011, 189(1): 237-249.
[25] PERIPOLLI E, MUNARI D P, SILVA M, LIMA A L F, IRGANG R, BALDI F. Runs of homozygosity: current knowledge and applications in livestock. Animal Genetics, 2017, 48(3): 255-271.
[26] PERIPOLLI E, STAFUZZA N B, MUNARI D P, LIMA A L F, IRGANG R, MACHADO M A, PANETTO J, VENTURA R V, BALDI F, DA SILVA M. Assessment of runs of homozygosity islands and estimates of genomic inbreeding in Gyr (Bos indicus) dairy cattle. BMC Genomics, 2018, 19(1): 34.
[27] LIU J X, SHI L Y, LI Y, CHEN L, DORIAN G, ZHAO F D. Estimates of genomic inbreeding and identification of candidate regions that differ between Chinese indigenous sheep breeds . Journal of Animal Science and Biotechnology, 2021, 12(1): 95.
[28] GARROD A E O M D L F R C P. The incidence of alkaptonuria: a study of chemical individuality . Molecular Medicine 1996, 2(3): 274-282.
[29] ZHANG Q, GULDBRANDTSEN B, BOSSE M, LUND M S, SAHANA G. Runs of homozygosity and distribution of functional variants in the cattle genome . BMC Genomics, 2015, 16(1): 542.
[30] SZPIECH Z A, XU J, PEMBERTON T J, PENG W, ZOLLNER S, ROSENBERG N A, LI J Z. Long runs of homozygosity are enriched for deleterious variation. American Journal of Human Genetics, 2013, 93(1): 90-102.
[31] KIM Y, RYU J, WOO J, KIM J B, KIM C Y, LEE C. Genome-wide association study reveals five nucleotide sequence variants for carcass traits in beef cattle . Animal Genetics, 2011, 42(4): 361-365.
[32] SNELLING W M, ALLAN M F, KEELE J W, KUEHN L A, MCDANELD T, SMITH T P, SONSTEGARD T S, THALLMAN R M, BENNETT G L. Genome-wide association study of growth in crossbred beef cattle . American Journal of Human Genetics, 2010, 88(3): 837-848.
[33] ISLAM R, LI Y, LIU X, BERIHULAY H, ABIED A, GEBRESELASSIE G, MA Q, MA Y. Genome-Wide Runs of Homozygosity, Effective Population Size, and Detection of Positive Selection Signatures in Six Chinese Goat Breeds . Genes, 2019, 10(11): 938.
[34] LUAN T, YU X, DOLEZAL M, BAGNATO A, MEUWISSEN T H. Genomic prediction based on runs of homozygosity . Genetics Selection Evolution, 2014, 46(1): 64.
[35] PURCELL S, NEALE B, TODD-BROWN K, THOMAS L, FERREIRA M A, BENDER D, MALLER J, SKLAR P, DE BAKKER P I, DALY M J, SHAM P C. PLINK: a tool set for whole-genome association and population-based linkage analyses. American Journal of Human Genetics, 2007, 81(3): 559-575.
[36] MEYERMANS R, GORSSEN W, BUYS N, JANSSENS S. How to study runs of homozygosity using PLINK? A guide for analyzing medium density SNP data in livestock and pet species . BMC Genomics, 2020, 21(1): 94.
[37] GUSEV A, LOWE J K, STOFFEL M, DALY M J, ALTSHULER D, BRESLOW J L, FRIEDMAN J M, PE'ER I. Whole population, genome-wide mapping of hidden relatedness . Genome Research, 2009, 19(2): 318-326.
[38] BROWNING B L, BROWNING S R. Detecting identity by descent and estimating genotype error rates in sequence data . American Journal of Human Genetics, 2013, 93(5): 840-851.
[39] SZPIECH Z A, BLANT A, PEMBERTON T J. GARLIC: Genomic Autozygosity Regions Likelihood-based Inference and Classification . Bioinformatics, 2017, 33(13): 2059-2062.
[40] HOWRIGAN D P, SIMONSON M A, KELLER M C. Detecting autozygosity through runs of homozygosity: a comparison of three autozygosity detection algorithms . BMC Genomics, 2011, 23(12): 460.
[41] KUNINGAS M, MCQUILLAN R, WILSON J F, HOFMAN A, VAN DUIJN C M, UITTERLINDEN A G, TIEMEIER H. Runs of homozygosity do not influence survival to old age . PLoS One, 2011, 6(7): e22580.
[42] NARASIMHAN V, DANECEK P, SCALLY A, XUE Y, TYLER-SMITH C, DURBIN R. BCFtools/RoH: a hidden Markov model approach for detecting autozygosity from next-generation sequencing data . Bioinformatics, 2016, 32(11): 1749-1751.
[43] FERENCAKOVIC M, SOLKNER J, KAPS M, CURIK I. Genome-wide mapping and estimation of inbreeding depression of semen quality traits in a cattle population . Journal of Dairy Science, 2017, 100(6): 4721-4730.
[44] MAXIMINI L, FUERST-WALTL B, GREDLER B, BAUMUNG R. Inbreeding depression on semen quality in Austrian dual-purpose simmental bulls . Reproduction in Domestic Animals, 2011, 46(1): e102-104.
[45] XU L, ZHAO G, YANG L, ZHU B, CHEN Y, ZHANG L, GAO X, GAO H, LIU G E, LI J. Genomic Patterns of Homozygosity in Chinese Local Cattle . Scientific reports, 2019, 9(1): 16977.
[46] FERENCAKOVIC M, HAMZIC E, GREDLER B, SOLBERG T R, KLEMETSDAL G, CURIK I, SOLKNER J. Estimates of autozygosity derived from runs of homozygosity: empirical evidence from selected cattle populations . Journal of Animal Breeding and Genetics, 2013, 130(4): 286-293.
[47] MASTRANGELO S, SARDINA M T, TOLONE M, DI GERLANDO R, SUTERA A M, FONTANESI L, PORTOLANO B. Genome-wide identification of runs of homozygosity islands and associated genes in local dairy cattle breeds . Animal, 2018, 12(12): 2480-2488.
[48] GOMEZ-RAYA L, RODRIGUEZ C, BARRAGAN C, SILIO L. Genomic inbreeding coefficients based on the distribution of the length of runs of homozygosity in a closed line of Iberian pigs. Genetics Selection Evolution, 2015, 16(47): 81.
[49] SHI L Y, WANG L G, LIU J X, DENG T Y, YAN H, ZHANG L C, LIU X, GAO H M, HOU X H, WANG L X, ZHAO F P. Estimation of inbreeding and identification of regions under heavy selection based on runs of homozygosity in a Large White pig population . Journal of Animal Science and Biotechnology, 2020, 28(11): 46.
[50] BOSSE M, MEGENS H J, MADSEN O, PAUDEL Y, FRANTZ L A, SCHOOK L B, CROOIJMANS R P, GROENEN M A. Regions of homozygosity in the porcine genome: consequence of demography and the recombination landscape . PLoS Genetics, 2012, 8(11): e1003100.
[51] GROENEN M A, ARCHIBALD A L, UENISHI H, TUGGLE C K, TAKEUCHI Y, ROTHSCHILD M F, ROGEL-GAILLARD C, PARK C, MILAN D, MEGENS H J,. Analyses of pig genomes provide insight into porcine demography and evolution. Nature, 2012, 491(7424): 393-398.
[52] HERRERO-MEDRANO J M, MEGENS H J, GROENEN M A, RAMIS G, BOSSE M, PEREZ-ENCISO M, CROOIJMANS R P. Conservation genomic analysis of domestic and wild pig populations from the Iberian Peninsula . BMC Genetics, 2013, 30(14): 106.
[53] FERREIRA E, SOUTO L, SOARES A M V M, FONSECA C. Genetic structure of the wild boar population in Portugal: Evidence of a recent bottleneck . Mammalian Biology, 2009, 74(4): 274-285.
[54] ZHANG Z, ZHANG Q, XIAO Q, SUN H, GAO H, YANG Y, CHEN J, LI Z, XUE M, MA P, YANG H, XU N, WANG Q, PAN Y. Distribution of runs of homozygosity in Chinese and Western pig breeds evaluated by reduced-representation sequencing data . Animal Genetics, 2018, 49(6): 579-591.
[55] XIE R, SHI L Y, LIU J X, DENG T Y, WANG L G, LIU Y, ZHAO F P. Genome-Wide Scan for Runs of Homozygosity Identifies Candidate Genes in Three Pig Breeds . Animals (Basel), 2019, 9(8): 518.
[56] PURFIELD D C, MCPARLAND S, WALL E, BERRY D P. The distribution of runs of homozygosity and selection signatures in six commercial meat sheep breeds. PLoS One, 2017, 12(5): e0176780.
[57] 劉家鑫, 魏霞, 鄧天宇, 謝銳, 韓建林, 杜立新, 趙福平, 王立賢. 綿羊全基因組ROH檢測及候選基因鑒定 . 畜牧獸醫(yī)學報, 2019, 50(8): 1554-1566.
LIU J X, WEI X, DENG T Y, RUI R, HAN J L, DU L X, ZHAO F P, WANG L X. Genome-wide scan for run of homozygosity and identification of corresponding candidate genes in sheep populations. Acta Veterinaria et Zootechnica Sinica, 2019, 50(8): 1554-1566. (in Chinese)
[58] MASTRANGELO S, CIANI E, SARDINA M T, SOTTILE G, PILLA F, PORTOLANO B, BI.OV. ITA C. Runs of homozygosity reveal genome-wide autozygosity in Italian sheep breeds . Animal Genetics, 2018, 49(1): 71-81.
[59] MASTRANGELO S, TOLONE M, SARDINA M T, SOTTILE G, SUTERA A M, DI GERLANDO R, PORTOLANO B. Genome-wide scan for runs of homozygosity identifies potential candidate genes associated with local adaptation in Valle del Belice sheep . Genetics Selection Evolution, 2017, 49(1): 84.
[60] BEYNON S E, SLAVOV G T, FARRE M, SUNDUIMIJID B, WADDAMS K, DAVIES B, HARESIGN W, KIJAS J, MACLEOD I M, NEWBOLD C J, DAVIES L, LARKIN D M. Population structure and history of the Welsh sheep breeds determined by whole genome genotyping . BMC Genetics, 2015, 20(16): 65.
[61] FLEMING D S, KOLTES J E, MARKEY A D, SCHMIDT C J, ASHWELL C M, ROTHSCHILD M F, PERSIA M E, REECY J M, LAMONT S J. Genomic analysis of Ugandan and Rwandan chicken ecotypes using a 600 k genotyping array . BMC Genomics, 2016, 26(17): 407.
[62] ZHANG M, HAN W, TANG H, LI G, ZHANG M, XU R, LIU Y, YANG T, LI W, ZOU J, WU K. Genomic diversity dynamics in conserved chicken populations are revealed by genome-wide SNPs . BMC Genomics, 2018, 19(1): 598.
[63] PRYCE J E, HAILE-MARIAM M, GODDARD M E, HAYES B J. Identification of genomic regions associated with inbreeding depression in Holstein and Jersey dairy cattle . Genetics Selection Evolution, 2014, 46(1): 71-84.
[64] SAURA M, FERNANDEZ A, VARONA L, FERNANDEZ A I, DE CARA M A, BARRAGAN C, VILLANUEVA B. Detecting inbreeding depression for reproductive traits in Iberian pigs using genome-wide data . Genetics Selection Evolution, 2015, 47(1): 1.
[65] 史良玉, 王立剛, 張鵬飛, 莫家遠, 李洋, 王立賢, 趙福平. 不同來源大白豬總產(chǎn)仔數(shù)近交衰退評估 . 畜牧獸醫(yī)學報, 2021, 52(10): 2772-2782.
SHI L Y, WANG L G, ZHANG P F, MO J Y, LI Y, WANG L X, ZHAO F P. Evaluation of Inbreeding Depression on the Total Numbers of Piglets Born in Different Groups of Large White Pigs. Acta Veterinaria et Zootechnica Sinica, 2021, 52(10): 2772-2782. (in Chinese)
[66] NANI J P, PENAGARICANO F. Whole-genome homozygosity mapping reveals candidate regions affecting bull fertility in US Holstein cattle . BMC Genomics, 2020, 21(1): 338.
Advance in Genome-Wide Scan of Runs of Homozygosity in Domestic Animals
ZHANG PengFei1, SHI LiangYu1, LIU JiaXin1, LI Yang1, WU ChengBin2, WANG LiXian1, ZHAO FuPing1
1Key laborary of Animal Genetics Breeding and Reproduction (poultry), Ministry of Agriculture, Institute of Animal Science, Chinese Academy of Agricultural Sciences, Beijing 100193;2Quarantine Station of Animal Health Supervision and Administration Bureau in Maochikou Town, Changping District, Beijing 102202
Runs of homozygosity (ROH) is a long tract of homozygous genotypes commonly found in individuals and populations, which generates on the offspring’s genome inherited identical haplotypes from each parent. ROH contains a wealth of genetic information about populations, which makes it a useful tool for providing information to study how populations change over time. Moreover, ROH can estimate the genetic relationships between individuals to minimize the inbreeding mating rates. In addition, ROH can expose harmful mutations in the genome. The frequencies, sizes and distributions of ROHs in the genome are influenced by natural and artificial selection, recombination, linkage disequilibrium, population history, mutation rate and inbreeding level. Recently, with the use of high-throughput genotype technology and the reduction of second-generation sequencing costs, livestock and poultry breeding have entered into the genomic era. The selection intensity of the elites in livestock and poultry significantly increase to improve their performances, but it will increase inbreeding and cause inbreeding depression as well. Based on ROH molecular information, it is more accurately to detect past and nearest in close relative mating. The ROH-based inbreeding coefficient (F) can obtain an individual's true inbreeding coefficient,the realized inbreeding coefficient, and the pedigree-basedFis the expectation value of inbreeding coefficient. In the absence of genealogical information,Fcan be used to infer information about a group's history and the inbreeding levels. Meanwhile, the selection reshapes ROH patterns in different regions of the genome. In addition, the selection can increase the homozygosities around the target point, and harmful mutations are thought to occur more frequently in the ROH region, which can be detected by ROH to reduce the risk of complex diseases. After long-term selection, one ROH appeared in multiple individuals’ genomes in the same population, resulting in ROH islands. It has confirmed the correlation between ROH and the selected genomic region. The candidate genes related to economic traits can be annotated on the ROH islands by means of biological information. In addition, ROH also provides a new perspective for assessing the genetic diversity in domestic animals. Genome-wide ROH detection on the population can used to investigate the genetic structure of this population, andFcan evaluate the impact of inbreeding in the current breeding program, which can adjust breeding plans to protect the genetic diversity of varieties. Therefore, ROH has gradually become an important index to explore the historical population structure, the level of inbreeding, candidate gene identification. There are mainly two kinds of methods to identify ROH: observation genotype counting method and model-based analysis. Commonly used softwares include PLINK, GERMLINE, BEAGLE, GARLIC, etc. In practical applications, PLINK is the most common ROH detection tool. Since the SNP chip for cattle was firstly used in domestic animals, the cattle population was firstly conduct genome-wide ROH detection. Now, studies on ROH are becoming more popular in pigs, sheep and other domestic animals. This review mainly described the principle of ROH formation and its detection methods, as well as progress of its application in livestock and poultry, so as to provide reference for the genetic breeding of livestock and poultry.
runs of homozygosity; livestock and poultry breeding; single nucleotide polymorphism; inbreeding evaluation; candidate genes identification
2020-11-13;
2021-01-06
國家自然科學基金(31572357)、國家生豬產(chǎn)業(yè)技術(shù)體系(CARS-35)、中國農(nóng)業(yè)科學院創(chuàng)新工程(ASTIP-IAS02)
張鵬飛,Tel:17806243706;E-mail:zhangpengfei3236@163.com。通信作者王立賢,E-mail:iaswlx@263.net。通信作者趙福平,E-mail:zhaofuping@caas.cn
(責任編輯 林鑒非)