楊雨婷,張 興,牛安然,閆之春,龔華忠,丁偌楠,4,馬 黎,4
(1.新希望六和養(yǎng)豬研究院數(shù)據(jù)與算法實驗室,成都 610095;2.新希望六和養(yǎng)豬研究院,青島 266100;3.新希望六和育種事業(yè)部,成都 610095; 4.德州市現(xiàn)代生豬養(yǎng)殖技術(shù)創(chuàng)新中心,德州 263000)
系譜是豬育種的重要信息來源之一,建立完整、準(zhǔn)確的系譜對確定種豬真實身份、提高育種值估計的準(zhǔn)確性、實現(xiàn)科學(xué)引種選育和選配有重要價值。種豬錯誤的系譜會通過“金字塔”式的豬只繁育體系在群體中大量積累、快速放大,導(dǎo)致后代近交快速上升、選育進(jìn)展緩慢,對育種帶來巨大的負(fù)面影響[1-3]。真實、完整、準(zhǔn)確的系譜是實現(xiàn)種豬自繁育、自更新,擺脫外國種豬公司對國內(nèi)生豬發(fā)展的制約、培育出中國自有種豬的基礎(chǔ)之一[4-5]。
生產(chǎn)中誤配精液、仔豬未記錄調(diào)欄、耳牌脫落、耳號識讀錄入錯誤等都會造成豬只個體信息及父母信息記錄錯誤,從而導(dǎo)致記錄的系譜錯誤或缺失[6],目前我國畜群中系譜錯誤率一般在5%~30%之間[7-9]。新投產(chǎn)豬場引種建群時需引入大批同代次豬只,種豬培育及場間聯(lián)合育種也需要從外部群體引種以避免因閉群繁育、豬群高度近交帶來的后代性能退化和畸形頻發(fā),這些引種都需要真實準(zhǔn)確的系譜來保證育種效果[10]。引種豬只通常由供種場提供系譜,引種豬只常見的上溯三代的系譜無法完全體現(xiàn)引種豬群的潛在近交。近年來,隨場間聯(lián)合育種和外引種豬逐漸增多,加之豬場現(xiàn)場生產(chǎn)管理難度大,豬群系譜缺失或錯漏的情況頻發(fā),對育種工作造成一定影響,對核心豬群進(jìn)行系譜校正已成為選育自有純種豬的基礎(chǔ)。
目前,用于親子鑒定的方法根據(jù)原理可分為排除法、似然法和基因重構(gòu)法3類[7],家畜中多使用PCR法對待鑒定個體的數(shù)個位點進(jìn)行基因分型,再使用排除法或似然法對成對的親子關(guān)系進(jìn)行判斷[8,11-12]。這種方法的成本較低,但需提前篩選數(shù)個高多態(tài)性位點[13],且僅能對親子關(guān)系的個體對進(jìn)行分析,實際生產(chǎn)中通常需要對父母未知的同代次群體重構(gòu)系譜,少數(shù)位點進(jìn)行親子鑒定的方法難以滿足這種需求?,F(xiàn)有研究多是使用模擬數(shù)據(jù)或是對數(shù)十至數(shù)百個樣本的小群體進(jìn)行鑒定[7,13],對大規(guī)模真實生產(chǎn)群體的研究較少。
本研究使用高密度SNP芯片獲得的大量標(biāo)記推測共祖片段,對缺乏父母基因型的同代次長白豬和杜洛克豬群體重構(gòu)系譜,并與記錄的真實系譜相比較,填補使用基因組信息重構(gòu)多品種、大規(guī)模真實生產(chǎn)豬群的空白。
本研究選取四川某豬場2017—2021年出生的1 471頭曾祖代純種豬,其中986頭為杜洛克豬,485頭為長白豬,所有個體均為從國外某種豬公司單一來源引種后本場純繁后代。兩品種記錄系譜共包含2 342頭純種豬,其中包括1 493頭杜洛克豬和849頭長白豬,系譜記錄時間為2015—2021年,系譜記錄最大世代數(shù)為8代,芯片分型個體平均記錄系譜代數(shù)約為5代。
采集1 471頭純種豬的耳組織樣本,乙醇固定后寄送至紐勤生物科技(上海)有限公司,使用Illumina GeneSeek GGP Porcine 50K 芯片進(jìn)行分型,每一個體基因組數(shù)據(jù)包括50 697個SNPs位點。該芯片基于Sscrofa 10.2全基因組信息進(jìn)行設(shè)計,根據(jù)Sscrofa11.1全基因組信息將其SNPs位點所對應(yīng)的MAP文件進(jìn)行更新,更新后的MAP文件用于后續(xù)分析。使用PLINK v1.90b6.21對SNPs分型數(shù)據(jù)文件進(jìn)行質(zhì)量控制,剔除SNPs位點檢出率<0.9、次等位基因頻率<0.05、位于性染色體上或染色體位置未知的SNPs位點,剔除SNPs檢出率<0.9的個體。
種豬生產(chǎn)中一般采用“一公多母”的生產(chǎn)方式,通常種公豬的后代數(shù)遠(yuǎn)遠(yuǎn)多于種母豬,因此以公豬作為劃分家系的主要依據(jù)。使用系譜計算親緣關(guān)系時,將有同一曾祖父的個體視為一個家系。使用基因組信息計算親緣關(guān)系時,將可推斷為同一曾祖父的或有四級以內(nèi)親屬關(guān)系且有可追溯共同祖先的個體劃分為一個家系;當(dāng)父母來自不同家系或近交等原因?qū)е履骋粋€體可被劃入多個家系時,將個體歸為其父系所在家系。
1.4.1 同源片段推斷 兩個體組成的一組個體對上的每個SNP位點對應(yīng)的等位基因有兩種同源類型,一種為狀態(tài)同源,另一種為血緣同源。狀態(tài)同源(identical by state, IBS)片段,即狀態(tài)相同片段,指兩個體間基因片段的核苷酸序列相同。狀態(tài)同源片段僅考慮等位基因本身的相似性,這種相似性是遺傳過程中累積起來的突變導(dǎo)致的,可能是源于某個共同的祖先,也有可能僅來自于隨機突變。血緣同源(identity by descent, IBD)片段,即血緣相同片段,又稱共祖片段(common ancestor fragment),指兩個體間核苷酸序列相同的基因片段來自某一個共同祖先。在不發(fā)生重組的遺傳過程中,子代通過配子從父本和母本處分別繼承一組同源染色體,實際遺傳過程中由于同源染色體非姐妹染色單體重組等原因,子代的單條染色體與父母不完全一致,根據(jù)連鎖不平衡將多個連續(xù)相同且來自同一祖先的等位基因序列連接為一個共祖片段。根據(jù)個體對間染色體片段共享等位基因情況將染色體劃分為IBD0、IBD1和IBD2片段,分別代表該段染色體上兩個體間每個SNP位點的2個等位基因中有0個、1個或2個血緣相同。使用PLINK v1.90b6.21構(gòu)建IBS遺傳距離矩陣,用于衡量個體間相似性、評價親緣關(guān)系。使用KING 2.2.7 估計群體內(nèi)每一組個體對間IBD0、IBD1和IBD2片段位置及比例,用于推斷個體間親緣關(guān)系。
1.4.2 SNPs親緣相關(guān)系數(shù)計算 根據(jù)Chen等[14]提出的公式,在剔除檢出率低、缺失及無法確定染色體位置的SNPs位點后,對剩余常染色體上的SNPs位點,根據(jù)位點間相似性估計個體間基因組親緣相關(guān)系數(shù),計算公式如下所示:
(1)
(2)
1.4.3 系譜親緣相關(guān)系數(shù)計算 將個體間的親緣相關(guān)系數(shù)定義為兩個個體因具有共同祖先而造成的加性基因效應(yīng)間的相關(guān),個體x從其父親s和母親d處分別獲得的配子中隨機抽取一對等位基因,這對等位基因在兩配子中是同源的概率即為個體x自身近交系數(shù),用F表示,即:
式中,axsxd代表個體x父母s、d間親緣相關(guān)系數(shù),由公式可知后代的近交系數(shù)為其父母間親緣相關(guān)系數(shù)的一半,個體與自身的加性遺傳相關(guān)為1加個體本身的近交系數(shù)。因此可以通過假設(shè)后代的方式計算任意兩個體間的親緣相關(guān)系數(shù)。使用加性遺傳效應(yīng)計算個體間親緣相關(guān)系數(shù)的公式如下所示:
式中,a代表個體間親緣相關(guān)系數(shù),F(xiàn)代表個體自身近交,x、y分別代表待計算親緣相關(guān)系數(shù)的兩個個體,xs、xd分別代表個體x的父親和母親,ys、yd分別代表個體y的父親和母親,rsd代表個體s、d間親緣相關(guān)系數(shù)。
根據(jù)配種及分娩記錄確定系譜,系譜中包括個體號、父親個體號及母親個體號三列,使用python 3.8編寫腳本計算系譜中所有個體的加性遺傳相關(guān)矩陣及個體系譜代次。矩陣每一行或每一列均代表一個個體,矩陣中每一元素代表對應(yīng)行和列的兩個個體間加性遺傳相關(guān),即兩個個體間的親緣相關(guān)系數(shù);個體系譜代次定義為從該個體向祖先可追溯到的最遠(yuǎn)通徑上的個體數(shù)量,亦即該個體可追溯系譜的深度。
2.1.1 系譜描述性統(tǒng)計 全部1 471頭個體均有記錄系譜,以芯片分型個體為起點向上追溯系譜獲得群體系譜記錄,系譜記錄中共包含2 342頭豬,出生年份在2015—2021年,平均系譜深度為5.47代。其中杜洛克豬群體共986頭,平均系譜深度5.53代;長白豬群體共485頭,平均系譜深度5.36代。兩品種群體性別、出生年份、性別及相應(yīng)系譜代次見表1。
表1 兩品種群體系譜描述性統(tǒng)計
2.1.2 基因組信息描述性統(tǒng)計 對SNP芯片獲得基因組分型數(shù)據(jù)進(jìn)行質(zhì)控后,全部1 471頭芯片分型個體均通過質(zhì)控,45 784個SNPs通過質(zhì)控,通過質(zhì)控的位點在各常染色體上的分布情況見圖1,圖中橫坐標(biāo)代表染色體編號,縱坐標(biāo)代表染色體位置,灰度表示SNPs在每條染色體上分布疏密程度。由圖1可見,通過質(zhì)控的SNPs位點覆蓋全部常染色體,但在常染色體兩端分布相對密集,這一結(jié)果與染色體重組熱點區(qū)域分布及芯片設(shè)計位點分布相符。
利用記錄系譜計算加性遺傳相關(guān)矩陣得到群體內(nèi)個體間親緣相關(guān)系數(shù),根據(jù)個體間親緣相關(guān)系數(shù)進(jìn)行聚類,構(gòu)建系譜親緣關(guān)系聚類圖。由圖2可知,長白群體共存在39個家系,大部分家系留種數(shù)量較為均衡,少數(shù)家系個體較多,個別家系在選育過程中留種較少,因此消失。由圖3可知,杜洛克群體共存在41個家系,相較長白群體家系間留種更均衡,但家系間親緣關(guān)系更近。
圖1 質(zhì)控后常染色體SNPs分布Fig.1 Distribution of SNPs on autosomes after quality control
進(jìn)化樹中豎線代表個體,以灰度區(qū)分相鄰家系,下圖同The vertical lines in the evolutionary tree represent individuals, and neighboring lineages are distinguished by grayscale, the same as below圖2 長白系譜親緣系數(shù)聚類圖Fig.2 Landrace genealogical kinship coefficient clustering map
根據(jù)群體中每組個體對間IBD1片段和IBD2片段占比做散點圖,根據(jù)Chen等[14]提出的方法,用IBD1片段和IBD2片段比例判斷個體對間親緣關(guān)系,以不同顏色標(biāo)記不同親緣關(guān)系的個體對,如圖4所示。
1 471頭芯片分型種豬共推斷出29 476對親緣關(guān)系,親緣關(guān)系按個體間聯(lián)系緊密程度不同,從近到遠(yuǎn)依次劃分為重復(fù)分型個體或同卵雙胞胎、親子關(guān)系、全同胞關(guān)系、半同胞關(guān)系、三級親屬關(guān)系、四級親屬關(guān)系和無關(guān)個體,圖4中僅展示了三級及以上親緣關(guān)系個體對。親子及三級親屬關(guān)系個體對間幾乎不存在IBD2片段,即幾乎不存在同一對等位基因的兩個位點均為同源的情況;重復(fù)分型個體或同卵雙胞胎幾乎全部位點均為同源,即幾乎全部位點均相同,因此IBD2接近1而IBD1接近0;全同胞或父母間存在親緣關(guān)系的半同胞個體對介于兩者之間,既存在IBD2片段也存在IBD1片段,這一結(jié)果與預(yù)期和IBD片段估計原理一致,證明推斷IBD片段在該群體中可有效劃分個體對間親緣關(guān)系。
圖3 杜洛克系譜親緣系數(shù)聚類圖Fig.3 Duroc genealogical kinship coefficient clustering map
圖4 IBD1-IBD2比例分布圖Fig.4 IBD1-IBD2 scale distribution
圖5為某個體A與其全同胞個體間IBD片段在常染色體上的分布情況,圖6為同一個體A與其父親間IBD片段在常染色體上的分布情況??梢奍BD1和IBD2片段在常染色體上分布并不均勻,在各常染色體兩端分布較密集,靠近中段著絲粒處分布則較為稀疏,這一現(xiàn)象在親子關(guān)系對間更為明顯。IBD片段的分布情況除受群體遺傳結(jié)構(gòu)影響外,主要與染色體重組區(qū)域有關(guān),Dimitromanolakis等[15]認(rèn)為這種不均勻分布與染色體上存在重組冷熱區(qū)有關(guān),某一區(qū)域遺傳結(jié)構(gòu)相對穩(wěn)定則較少發(fā)生重組,因此IBD片段在該段染色體上分布也會較為稀疏。其次,IBD片段的分布也與芯片設(shè)計位點有關(guān),SNP芯片結(jié)果在質(zhì)控后分布不均勻,位點分布較密集區(qū)域更易出現(xiàn)IBD片段。
根據(jù)推斷的親屬關(guān)系重構(gòu)系譜,按個體間親屬關(guān)系進(jìn)行聚類,由于本研究所用群體內(nèi)杜洛克豬和長白豬均為純種且不存在雜交,因此混合群體在計算個體間親緣關(guān)系及構(gòu)建家系圖時自然分成兩組,對比個體毛色可輕易推斷每組家系所屬品種,故對兩品種分別構(gòu)建系譜。
使用個體間親子關(guān)系及二級親屬關(guān)系繪制群體內(nèi)親緣關(guān)系圖,使用基因組信息構(gòu)建的杜洛克豬和長白豬系譜圖如圖7和圖8所示,可見杜洛克群體間關(guān)系更為緊密,長白群體存在較多小家系?;蚪M信息共將杜洛克豬分為32個家系,平均代次為4.1代,將長白豬分為38個家系,平均代次為3.6代,與系譜記錄基本一致。
圖5 全同胞個體對間IBD片段分布Fig.5 Distribution of IBD sharing between full-sibling pairs
圖6 親子對間IBD片段分布Fig.6 Distribution of IBD sharing between parent-offspring pairs
圖中圓點代表個體,黑線相連兩個體為親子關(guān)系,灰線相連兩個體為二級親屬關(guān)系,下圖同The dots in the figure represent individuals, the two dots connected by black line is parent-offspring, and the two dots connected by gray line is 2nd-degree, the same as below圖7 基因組構(gòu)建杜洛克豬家系圖Fig.7 Genomically constructed Duroc pig lineage map
圖8 基因組構(gòu)建長白豬家系圖Fig.8 Genomically constructed Landrace pig lineage map
為確定基因組信息重構(gòu)系譜準(zhǔn)確性,通過嚴(yán)格控制選取群體的配種、分娩、調(diào)欄及采樣過程,保證所記錄的系譜及采樣分型結(jié)果準(zhǔn)確無誤,獲得115頭有芯片分型信息且有準(zhǔn)確記錄系譜的個體作為驗證群體,以芯片分型豬只為起點向上追溯三代系譜,得到包含360頭豬的系譜記錄。進(jìn)行芯片分型的115頭豬個體間IBS遺傳距離在0.132~0.475之間。根據(jù)個體間共享IBS和IBD片段比例矩陣?yán)L制的熱力圖如圖9所示,可見IBD矩陣較IBS矩陣顏色區(qū)分度更大,即對有親緣關(guān)系的個體和無關(guān)個體的區(qū)分度更好。同時,從IBD片段矩陣構(gòu)建的熱力圖中可以顯著觀察到由同父異母的半同胞關(guān)系形成的橙紅色區(qū)域。
使用IBD片段法推斷所選群體內(nèi)個體間基因組親緣關(guān)系,并與記錄系譜相比較,不同親緣關(guān)系的推斷數(shù)量及推斷比例見表2。由表2可見,基于共祖片段法利用基因組信息共推斷出選取群體702對親緣關(guān)系,全部親子關(guān)系和全同胞關(guān)系均可被準(zhǔn)確推斷,同時共祖法能額外推斷出個體間系譜未記錄的三級和四級親緣關(guān)系。
對角線:個體自身IBD與IBS片段相似程度;對角線上方:個體間共享IBD片段比例;對角線下方:個體間共享IBS片段比例。兩個體間親緣關(guān)系越近則共享比例越大,越接近紅色,反之則接近藍(lán)色。圖中數(shù)字代表個體號Diagonal: The degree of similarity between individual IBD and IBS; Above the diagonal: Proportion of IBD shared between individuals; Below the diagonal: Proportion of IBS shared between individuals. The closer the kinship between two individuals the greater the shared ratio, the closer to red, and vice versa, the closer to blue. The numbers in the figure represent individual numbers圖9 共享IBD-IBS片段比例熱力圖Fig.9 Sharing IBD-IBS segment scale heat map
以其中一長白家系為例,該家系共包括三代21頭純種長白豬,其中19頭有芯片分型信息,各世代間無交叉且均有系譜記錄。使用IBD片段法推斷該家系個體間基因組親緣關(guān)系,各親緣關(guān)系IBD1、IBD2及基因組共享IBD比例見表3。基于基因組親緣關(guān)系重構(gòu)系譜圖和基于配種及分娩等生產(chǎn)記錄構(gòu)建系譜圖如圖10所示。
表2 基因組推斷親緣關(guān)系
表3 長白家系內(nèi)不同親緣關(guān)系IBD占比
A.長白家系基因組重構(gòu)系譜;B.長白家系記錄系譜。圖中數(shù)字代表個體號A. Genomic information-based pedigree of the Landrace lineage; B. Recorded pedigree of the Landrace lineage. The numbers in the figure represent individual numbers圖10 長白家系系譜Fig.10 Pedigree of the Landrace lineage
可見基因組信息可推斷出全部親子、全同胞及二級親屬關(guān)系,且推斷結(jié)果與記錄系譜一致,證明其準(zhǔn)確性。除此之外,基因組信息還可額外推斷出常見三代系譜未記錄的親緣關(guān)系,如基因組推測個體3與個體4有三級親屬關(guān)系,但其在以個體10~21為起點向上追溯三代的系譜內(nèi)沒有可見親緣關(guān)系,繼續(xù)向上追溯系譜后發(fā)現(xiàn)個體3與個體4有共同祖父,亦可體現(xiàn)基因組重構(gòu)系譜的準(zhǔn)確性。
根據(jù)個體間基因組親緣關(guān)系矩陣和系譜親緣關(guān)系矩陣?yán)L制上述115頭個體組成的驗證群體熱力圖如圖11所示,可見基因組親緣關(guān)系矩陣較系譜親緣關(guān)系矩陣顏色區(qū)分度更大,即對有親緣關(guān)系的個體和無關(guān)個體的區(qū)分度更好。從親緣關(guān)系矩陣熱力圖中可以顯著觀察到?jīng)]有系譜記錄關(guān)聯(lián)的個體間也存在基因組關(guān)聯(lián),即圖11對角線下方中個體1~14與個體15~66間出現(xiàn)的淺藍(lán)色方格。同時,基因組親緣關(guān)系矩陣也可以體現(xiàn)出全同胞個體間真實的遺傳相關(guān),而不是系譜親緣關(guān)系矩陣中平均的遺傳相關(guān),如圖11中個體20~24對角線下方矩陣深淺不一的方格。
對角線:個體與自身親緣關(guān)系;對角線上方:個體間系譜親緣關(guān)系矩陣;對角線下方:個體間基因組親緣關(guān)系矩陣。兩個體間親緣關(guān)系越近越接近紅色,反之則接近藍(lán)色。圖中數(shù)字代表個體號Diagonal: The kinship of an individual to itself; Above the diagonal: Pedigree kinship matrix between individuals; Below the diagonal: Genomic kinship matrix between individuals. The closer the kinship between two individuals the closer to red, and vice versa, the closer to blue. The numbers in the figure represent individual numbers圖11 親緣關(guān)系矩陣熱力圖Fig.11 Relationships matrix heat map
系譜是種豬育種的重要信息來源之一,建立完整、準(zhǔn)確的系譜對確定種豬真實身份、提高育種值估計準(zhǔn)確性、實現(xiàn)科學(xué)引種選育和選配有重要價值,可以進(jìn)一步加快豬的遺傳進(jìn)展。然而系譜錯誤在遺傳研究和育種生產(chǎn)中普遍存在,畜群中系譜錯誤率一般在5%~30%之間[7-9],對育種工作造成巨大影響。
畜禽中通常根據(jù)數(shù)個至數(shù)百個SNPs位點或微衛(wèi)星標(biāo)記使用似然法確定親子關(guān)系,如余國春[13]利用120個SNPs位點確定24頭藏豬及二元豬群體間親子關(guān)系,Van Ba等[11]利用19個STR標(biāo)記確定9個品種639頭豬親子關(guān)系。但基于親子間相似性的似然法僅能確定親本與后代間的親緣關(guān)系[16],因生產(chǎn)群體常是多代次混雜的復(fù)雜群體遺傳結(jié)構(gòu),且似然法判斷親子間關(guān)系時計算方法較為復(fù)雜[17],因此限制了其在大規(guī)模真實生產(chǎn)群體中的使用。
使用高密度SNP標(biāo)記重構(gòu)系譜的方法已經(jīng)廣泛應(yīng)用于法醫(yī)[18-19]和人類群體遺傳結(jié)構(gòu)[20-22]分析,但其在畜禽中的應(yīng)用尚在探索階段,通常使用模擬數(shù)據(jù)探究方法可行性,如周子文等[23]利用模擬的高密度SNP標(biāo)記建立個體親緣關(guān)系矩陣用于分析個體間遺傳關(guān)聯(lián);使用真實數(shù)據(jù)的研究主要集中在地方品種保種群體[24-25]和奶牛[26-27]中,這些群體育種歷史較長,記錄詳細(xì)、群體小、世代間隔大,遺傳背景相對清晰,而對大規(guī)模多代次的商業(yè)化生產(chǎn)群體進(jìn)行系譜重構(gòu)的相關(guān)研究較少,特別是對外三元豬的研究少之又少。
本研究通過推斷共祖(IBD)片段的方法分析真實多品種生產(chǎn)群體間親緣關(guān)系,IBD片段分布情況與前人研究相近[28],但從圖5和圖6的結(jié)果中可以看到,使用KING推斷出的IBD片段存在片段破裂的情況,與前人研究結(jié)果類似[29]。這種IBD片段特別是IBD1片段破裂的情況可能與個別位點發(fā)生突變、缺失或分型錯誤有關(guān)[15],同時也與芯片密度和芯片上位點分布情況有關(guān)[30],Bjelland等[28]認(rèn)為連接相鄰IBD片段有助于提高親緣關(guān)系推斷準(zhǔn)確性,Zhou等[31]認(rèn)為使用摩爾根距離或堿基個數(shù)確定IBD片段也會影響推斷效果。
同時,群體平均近交水平也對IBD片段推斷效果有一定影響,近交會增加群體內(nèi)IBD片段比例,如個體67~115所組成的群體由于多代閉鎖繁育,較個體15~66組成的群體近交水平更高,因此個體間推測親緣關(guān)系系統(tǒng)性偏高,在圖9的IBS-IBD熱力圖中可見高近交群體顏色相較于低近交群體更紅,即平均親緣關(guān)系更近,這一現(xiàn)象與前人研究結(jié)果一致[32-34]。
基因組親緣關(guān)系矩陣計算需要使用個體SNP信息,需要對參與計算的個體進(jìn)行SNP分型,相較于僅使用系譜計算的系譜親緣關(guān)系矩陣成本較高;且由于SNP信息遠(yuǎn)遠(yuǎn)多于系譜信息,基因組親緣關(guān)系矩陣計算時算力消耗大、計算時間長。但基因組親緣關(guān)系矩陣除可體現(xiàn)系譜記錄無關(guān)聯(lián)個體間遺傳相關(guān)、全同胞及半同胞個體間遺傳相關(guān)差異外,還能在一定程度上反映群體整體近交情況。對生產(chǎn)核心群及外引種豬親本進(jìn)行SNP分型并構(gòu)建基因組親緣關(guān)系矩陣,與后代仔豬重構(gòu)親本系譜后的系譜親緣關(guān)系矩陣進(jìn)行合并,有利于以較低成本在普遍存在近交及系譜記錄不全的生產(chǎn)豬群中計算育種值并開展選育選配工作。
本研究使用基因組推斷親緣關(guān)系重構(gòu)的基因組系譜與記錄系譜結(jié)果基本相符,但存在少量差異。系譜重構(gòu)的準(zhǔn)確率受多種因素影響,配種及分娩等生產(chǎn)記錄、生產(chǎn)操作和管理水平、重構(gòu)系譜所用位點類型和數(shù)量、使用的系譜重構(gòu)方法等都對系譜重構(gòu)準(zhǔn)確性有影響。
重構(gòu)系譜需要根據(jù)生產(chǎn)記錄的配種、分娩記錄和性別棟舍等信息輔助判斷親子對是否準(zhǔn)確,通過每對親子對的驗證確定整個重構(gòu)系譜的準(zhǔn)確性。沒有出生記錄的豬由于難以確定可能的父母信息,在父母雙方都沒有基因分型數(shù)據(jù)的情況下只能通過全同胞、半同胞等親緣關(guān)系推斷可能的父母,且由于缺少出生時間、棟舍等信息,僅依據(jù)遠(yuǎn)緣親屬關(guān)系很難匹配出正確的父母關(guān)系。例如某一個體僅有其本身及其父親基因分型數(shù)據(jù),由于生產(chǎn)上同一公豬會同時與配多頭母豬,因此這種情況下也很難確定待構(gòu)建系譜的仔豬母親,繼而難以構(gòu)建完整系譜。
計算親子間關(guān)系的方法也是影響系譜校正的準(zhǔn)確性的重要因素。例如似然法通過計算非父排除概率判斷親子關(guān)系,將非父排除概率低于某一閾值的親子對判定為真實親子對[35-36]。由于不同群體平均的次等位基因頻率不同,計算得到的平均錯誤率也不同[6],因而這一閾值通常根據(jù)錯誤率的群體經(jīng)驗分布確定,真實親子對與隨機個體對間錯誤率的分布是連續(xù)的[26],極少數(shù)個體對會被錯誤判定關(guān)系,因此這一閾值的確定會影響系譜校正的準(zhǔn)確性。以嚴(yán)格規(guī)范的生產(chǎn)操作為主,輔以對少部分丟失記錄或記錄不清晰的豬重構(gòu)系譜將是保證系譜真實準(zhǔn)確的有效途徑。
本試驗使用Illumina Porcine 50K 芯片質(zhì)控后的45 784個SNPs位點,應(yīng)用IBD片段法分析四川地區(qū)1 471頭杜洛克豬和長白豬群體混合群體的群體內(nèi)個體對間親緣關(guān)系并重構(gòu)系譜,推測的親緣關(guān)系及重構(gòu)系譜與生產(chǎn)記錄相符。應(yīng)用IBD片段法分析中高密度SNP標(biāo)記數(shù)據(jù)推測親緣關(guān)系并重構(gòu)系譜的方法可應(yīng)用于杜洛克豬和長白豬實際生產(chǎn)育種中,為其選種選配、計算育種值及GWAS挖掘等工作提供基礎(chǔ),進(jìn)一步加快種豬改良進(jìn)程。